KR20140058611A

KR20140058611A - 섬유증 감수성 il22ra2 유전자 및 이의 용도

Info

Publication number: KR20140058611A
Application number: KR1020147006064A
Authority: KR
Inventors: 알랭 드쎄잉; 마띠유 쎄르또리오; 로랭 아르지호
Original assignee: 엑스-마르세이유 위니베르시테; 인쎄름 (엥스띠뛰 나씨오날 드 라 쌍떼 에 드 라 흐쉐르슈 메디깔)
Priority date: 2011-08-05
Filing date: 2012-08-03
Publication date: 2014-05-14
Also published as: US20140295427A1; CA2843949C; EP2739748B1; JP6141275B2; CN104302780B; BR112014002347A2; CA2843949A1; WO2013020904A1; US10150989B2; KR102003835B1; JP2017176186A; JP2014524236A; US20190323060A1; EP2739748A1; CN104302780A; DK2739748T3; BR112014002347B1; CN107217092A

Abstract

본 발명은 섬유증 감수성 유전자 자리인 IL22RA2 유전자 자리의 동정을 개시하고, 이는 섬유증에 대한 소인을 검출하거나, 섬유증의 진단 및 예후를 위해 사용될 수 있을 뿐만 아니라, 약학적으로 활성인 약물의 스크리닝을 위해 사용될 수 있다. 본 발명은 또한 바이러스 감염에 의해 영향을 받은 환자가 항바이러스제 및/또는 인터페론에 의한 치료에 반응할 가능성을 측정하는 방법으로서, 환자의 생물학적 샘플에서 L22RA2 유전자 자리 또는 IL22RA2 발현 또는 IL22RA2 단백질 활성의 변경을 측정하는 단계를 포함하는 방법을 제공한다.

Description

섬유증 감수성 IL22RA2 유전자 및 이의 용도{FIBROSIS SUSCEPTIBILITY IL22RA2 GENE AND USES THEREOF}

본 발명은 일반적으로 유전학 분야 및 의약 분야에 관한 것이다. 특히, 본 발명은 간 질환, 간경변(cirrhosis), 피부 켈로이드(cutaneous keloid), 비만증(obesity) 및 임의의 섬유증 질환, 및 심장, 혈관 또는 뇌와 같은 다른 조직의 질환에서 발생하는, 잠재적으로 섬유증(fibrosis)을 일으킬 수 있는 조직 내 세포외 기질 단백질(extra cellular matrix protein: ECMP)의 비정상적인 침착의 진단 또는 예후에 사용되거나, 비정상적인 ECMP 침착 또는 섬유증에 대한 소인(predisposition)의 검출에 사용될 수 있는, 인간 감수성 유전자의 동정을 개시한다. 더욱 특히, 본 발명은 치료적으로 활성인 약물의 스크리닝을 위한 새로운 표적을 나타내고 섬유증에 대한 감수성과 관련된 6번 염색체에서 IL22RA2 유전자의 특정 대립유전자(allele)를 개시한다. 더욱 구체적으로, 본 발명은 IL22RA2 유전자 및 발현 산물의 특정 돌연변이에 관한 것일 뿐만 아니라, 이러한 돌연변이에 기초한 진단 도구 및 키트에 관한 것이다.

조직 내 세포외 기질 단백질의 축적은 유해한 영향을 가질 수 있다. 조직 내 ECMP의 비정상적인 침착은 조직 섬유증을 일으킬 수 있다.

섬유증은 기관, 이의 임의의 부분 또는 조직에서, 예를 들어 간, 이의 임의의 부분 또는 조직에서, 특히 손상에 반응하여 나타나는, 섬유성 결합조직의 과다한 성장이다.

이형 섬유증은 간염 바이러스 및 주혈흡충 감염에서와 같이 다양한 병인학의 만성적인 간 염증에서 발생한다. 주혈흡충에 의해 감염된 특정 대상체는 느린 피브로저(slow fibroser)인 반면, 다른 대상체는 빠른 피브로저(rapid fibroser)라는 점, 및 이는 Chr 6q22-q23에 위치한 주요 유전자에 부분적으로 의존한다는 점은 이미 밝혀졌다(Dessein et al., 1999; Mohamed-Ali et al., 1999). 국제특허출원 WO2010/094740는 이와 같은 영역에서 섬유증 감수성 유전자로서 CTGF(CCN2)를 동정한다.

시스토조미아시스(schistosomiasis)는, 숙주의 혈관계에서 성장하여 알을 낳고 이들 중 일부는 간으로 운반되어 문맥주위 공간에서 염증을 촉발시키는 연충류에 의해 야기된다. 기생충은 그의 인간 숙주에서 수년 동안 생존하기 때문에, 다수의 조직 파괴와 연관되는 만성적인 간 염증이 감염된 대상체에서 흔하게 나타난다. 조직 치유는 손상된 조직에서 ECMP의 침착을 필요로 하며, 이는 나중에 전환되어 정상적인 간세포에 의해 대체된다. 일부 환자에게서, ECMP는 정맥류성 정맥, 복수를 야기하는 혈류를 감소시키는 섬유증 침착을 형성하면서 문맥주위 공간에 축적된다. 수개월 또는 수년간의 만성적 또는 반복적 손상 이후에, 섬유증은 영구적이고 비가역적이 된다. 대상체는 섬유증의 결과로 사망한다.

남쪽 국가들에서, 3억 5천만명의 감염된 대상체의 5 내지 10%가 중증의 간섬유증으로 발전할 수 있는 것으로 추정된다. 주혈흡충 감염 대상체에서 간섬유증 진행을 예측하고 뒤를 따르도록 할 수 있는 양호한 마커가 존재하지 않는다.

간섬유증의 진단은 주로 간생검법, 탄력측정(elastometry) 및 초음파 분석에 기초한다.

생검법은 경피, 경정맥, 방사선사진-유도 미세바늘 또는 복강경 검사 경로를 통해 얻어지며, 이는 임상적 설정에 의존한다. 병리조직학적 시험은 임상의가 괴사염증의 중증도를 나누고 섬유증의 정도를 단계로 나눌 수 있도록 한다. Metavir 스코어링 시스템은 하기와 같이 1-4 등급에 대해 섬유증의 단계에 스코어를 부여한다: FO = 섬유증이 없음, F1 = 격막(septa)이 없는 문맥 섬유증, F2 = 문맥 섬유증 및 소수의 격막, F3 = 간경변이 없는 다수의 격막, F4 = 간경변(Bedossa et al., 1996). 간생검법은 침습적이고 값비싼 과정이며, 이는 간의 작은 부분만을 샘플로 한다. 따라서, 이는 간섬유증의 전반적인 평가를 할 수 없으며, 샘플링 변이와 관찰자간 및 관찰자내 에러(inter- and intra-observer error)가 생긴다. 또한, 간생검법은 3%의 유의적인 이환율 및 0.03%의 사망률과 연관된다. 잠재적인 복합증에는 생검과 관련된 국부 혈종, 감염 및 통증이 포함된다.

비침습적 테스트(즉, 혈청학적 마커, 탄력측정, 초음파 분석)가 사용되지만, 정기적인 임상 사용을 위한 준비가 아직 되어 있지 않다.

혈액 마커의 패널(panel)은 주로 만성 C형 간염 또는 C형 바이러스 간염에 기인한 간경변을 앓는 환자에게서 테스트되었다. 이러한 시험은 혈청 마커가 환자의 약 35%에서 섬유증을 판단하거나 또는 배제할 수 있다는 점을 밝혔다(Sebastiani et al., 2006). 그러나, 개별적으로 환자를 관찰할 때, 상기 마커는 섬유증의 다양한 단계들 사이를 신뢰성있게 구별할 수 없었다. 보다 최근의 연구는 진단의 정확성을 개선시킨 알고리즘 접근법을 고안하기 위해 혈청 마커의 3개의 패널을 포함시켰다(Parkes et al., 2006). 상기 평가된 3개의 패널은 APRI(아스파르테이트 트랜스아미나아제 대 혈소판 비 지수), Forns 지수(혈소판, 감마글루타밀트랜스펩티다제, 콜레스테롤) 및 Fibrotest(GGT, 합토글로빈, 빌리루빈, 아포리포단백질 A, 알파-2-마크로글로불린)였다. APRI 이후에 Fibrotest로 이루어지는 알고리즘은 섬유증의 진단 정확도를 90% 이상까지 신장시켰다. 이러한 그룹은 이러한 알고리즘의 사용이 간생검의 50%까지에 대한 필요성을 배제할 수 있다는 점을 추정하였다. 그러나, 이러한 알고리즘을 사용하여, 섬유증의 개별 단계들이 구별될 수 없다. 상기 혈청 마커의 한계점은 매우 활성인 간 염증이 존재할 때 위양성의 가능성이다.

피브로스캔(fibroscan)은 간섬유증을 단계로 나누는 다른 접근법이며, 이는 탄성영상(elastography)에 기초하며, 평균 간 조직 강도의 신속한 측정을 제공한다(Ziol et al, 2005). 프로브는 간으로 저 주파 및 진폭의 진동을 전달하기 위해 이용된다. 이러한 진동파는 탄성 전단 파를 유발하며, 이의 간을 통한 속도는 킬로파스칼(kPa)로 측정되는 조직강도에 직접적으로 비례한다. 피브로스캔 기법의 감수성은 79 내지 95%이며, 간생검에 비해 78 내지 95%의 특이성을 갖는다. 그러나, 이러한 기법의 한계점은 유동 또는 지방 조직에서 탄성파의 감쇠와 관련되며, 이는 환자에게서 섬유증의 평가를 손상시키게 된다. 또한, 피브로스캔은 극히 값비싼 장치이다.

간으로부터 HCV의 박멸을 위한 오늘날의 치료기준(standard-of-care: SOC)은 PEG화 I형 인터페론(PegIFN) 및 합성 뉴클레오시드 리바비린(synthetic nucleoside ribavirin: RBV) 요법으로 구성된다(Fried MW et al; N Engl J Med. 2002; 347(13):975-82; EASL Clinical Practice Guideline: Management of hepatitis C virus infection, J Hepatol. 2011; 55:245-264). 그러나, 이와 같은 기준요법은 제한되고 예측할 수 없는 효과를 갖고, 자주 치료 중단을 야기하는 대규모 유독성 프로파일(extensive toxicity profile)은 매우 비싸다. 유전자형 1 및 4의 만성 HCV-감염 개인 중 절반 미만만이 기준요법(PegIFN/RBV)의 장기 치료(48주)에 반응한다(Testino G et al; Hepatogastroenterology 2011; 58(106):536-8).

따라서, 치료를 최적화하고, 비반응자에 대한 부작용을 피하고, 치료비용을 감소시키기 위해 치료에 반응할 가능성이 더 높은 환자를 선택하는 방법에 대한 요구가 있다.

전체적으로, 섬유증의 진행 및 치료의 효율성을 예후할 수 있는 효과적인 방법에 대한 요구가 여전히 존재한다.

본 발명의 목적은 섬유증의 예후 및 치료에 대해 새로운 유전적 접근을 제공하는 것이다. 본 발명은 인간의 섬유증 감수성 유전자자리(human fibrosis susceptibility gene locus), 즉 IL22RA2 유전자자리의 동정에 대해 개시하며, 이는 비정상적인 ECMP 침착, 특히 섬유증, 특히 간섬유증에 대한 소인의 검출, 진단 및 예후를 위해 사용될 수 있을 뿐만 아니라, 치료적으로 활성인 약물을 스크리닝하기 위해 사용될 수도 있다. 특히, 본 발명은 대상체로부터의 샘플에서 IL22RA2 유전자자리의 변경의 존재를 검출하는 단계를 포함하는 방법에 관한 것이며, 상기 변경의 존재는 비정상적인 ECMP 침착 또는 섬유증에 대한 소인 또는 존재를 나타낸다.

본 발명의 특정 목적은 대상체 내에서 발생한 ECMP의 비정상적인 침착 또는 섬유증에 대한 소인을 검출하거나, ECMP의 비정상적인 침착 또는 섬유증을 진단 및/또는 예후하기 위한 시험관내(in vitro ) 방법에 관한 것으로서, 상기 대상체로부터의 생물학적 샘플에서 IL22RA2 유전자 또는 폴리펩티드의 변경(alteration)의 존재를 검출하는 단계를 포함하고, 상기 변경의 존재는 ECMP의 비정상적인 침착 또는 섬유증의 존재 또는 ECMP의 비정상적인 침착 또는 섬유증에 대한 소인을 나타내는 것이다. 본 발명의 특정 목적은 ECMP의 비정상적인 침착 또는 섬유증의 진행을 분석(예측)하는 방법에 관한 것이다.

바람직한 구현예에서, 상기 변경은 IL22RA2 유전자의 개시코돈의 업스트림에서 500 kb 이내, 바람직하게는 100kb 이내, 바람직하게는 20kb 이내에 위치하고, IL22RA2 유전자의 3'UTR의 다운스트림에서 500 kb 이내, 바람직하게는 100kb 이내, 바람직하게는 20kb 이내에 위치한다.

바람직하게는, 상기 변경은 IL22RA2 유전자의 개시코돈의 업스트림에서 10kb 영역 및 미번역 영역(3'UTR)의 다운스트림에서 10kb 영역의 주변서열에 위치한다.

다른 바람직한 구현예에서, 상기 변경은 하나 이상의 염기의 돌연변이, 삽입 또는 결실이다. 더욱 바람직한 구현예에서, 상기 변경은 섬유증에 관련된 하나 이상의 단일 뉴클레오티드 다형(single nucleotide polymorphism: SNP) 또는 SNP의 단상형(haplotype)이다. 바람직하게는, 상기 단일 뉴클레오티드 다형은 IL22RA2 유전자 가까이에 위치하는 대립유전자 변종인, IL22RA2 유전자 옆에 위치하는 SNP이다.

본 발명의 방법은 간섬유증(hepatic fibrosis), 간경변(cirrhosis), 피부 켈로이드(cutaneous keloid), 비후성 반흔(hypertrophic scar), 경피증(sclerodermia), 비만증(obesity), 알코올중독 및 약물 간-독성(drug hepato-toxicity) 중에서 선택되는 인간 섬유증 질환에서 일어나는 섬유증을 검출 및 예후할 수 있게 한다. 특히, 감섬유증은 A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스(HCV), 시스토조마 자포니쿰(Schistosoma japonicum : S. japonicum) 또는 시스토조마 만소니(Schistosoma mansoni : S. mansoni) 감염에 의해 일어날 수 있다.

특정 구현예에서, 본 발명은 대상체, 바람직하게는 감염 바이러스 또는 기생충에 의해 감염된 대상체의 생물학적 샘플의 IL22RA2 유전자 자리에서 SNP를 유전자형 분석하는 단계를 포함하고, 여기서 SNP rs6570136에서 유전자형 GG의 존재, SNP rs7774663에서 유전자형 TT의 존재, SNP rs11154915에서 유전자형 TT, CT의 존재 및/또는 SNP rs2064501에서 유전자형 CC의 존재는 상기 대상체에서 섬유증과 같은 ECMP의 비정상적인 침착이 발생하거나, 섬유증과 같은 ECMP의 비정상적인 침착이 진행될 위험, 또는 섬유증의 나쁜 예후를 나타낸다. 상기 섬유증은 특히 간섬유증이다.

선택적으로, 본 발명은 본 명세서에 기재된 것들과의 연관불균형(Linkage Disequilibrium: LD)에서 SNP를 유전자형 분석하는 단계를 포함할 수 있다.

바람직하게는, 상기 IL22RA2 유전자 자리의 변경은 선택적 하이브리드화 분석, 시퀀싱 분석, 마이크로시퀀싱 분석 및/또는 대립유전자-특이적 증폭 분석을 수행함으로써 측정된다.

본 발명의 다른 측면에서, 상기 IL22RA2 유전자의 변경은 제한효소 소화에 의해 측정되고, 상기 하나 이상의 SNP의 검출은 섬유증의 징표이다.

또한, 본 발명은 섬유증과 같이 ECMP의 비정상적인 침착을 앓거나, 또는 섬유증과 같이 ECMP의 비정상적인 침착이 발생할 소인이 있는 대상체를 위한 치료적 화합물을 선택하는 방법으로서, 시험 화합물을 IL22RA2 폴리펩티드 또는 유전자 또는 이의 단편과 접촉시키는 단계, 및 IL22RA2 유전자 자리와 관련된 경로의 생물학적 활성 또는 기능을 증대 또는 감소시키는 상기 시험 화합물의 능력을 측정하는 단계를 포함하는 방법에 관한 것이다.

본 발명의 다른 목적은 바이러스에 감염된 환자가 항바이러스제 및/또는 인터페론에 의한 치료에 반응할 가능성을 측정하는 시험관내 방법으로서, 상기 환자의 생물학적 샘플의 IL22RA2 유전자 자리 또는 IL22RA2 단백질 발현 또는 활성의 변경을 측정하는 단계를 포함하는 방법이다.

특정 구현예에서, 본 방법은 대상체의 생물학적 샘플의 IL22RA2 유전자 자리에서 SNP를 유전자형 분석하는 단계를 포함하고, SNP rs11154915에 대해 유전자형 TT의 존재, SNP rs6570136에 대해 유전자형 AG 또는 GG의 존재, SNP rs2064501에 대해 유전자형 CT의 존재 및/또는 SNP rs1543509에 대해 유전자형 AA의 존재는 상기 치료에 대한 환자의 양성반응을 지지한다. 선택적으로, 본 방법은 본 명세서에 기재된 것들과의 연관불균형(LD)에서 임의의 SNP를 유전자형 분석하는 단계를 포함할 수 있다.

특정 구현예에서, 상기 치료는 선택적으로 인터페론과 함께하는 항바이러스제를 포함한다.

바람직하게는, 상기 항바이러스제는 리바비린(ribavirin)과 같은 바이러스 복제 억제제이다.

본 발명은 인간의 섬유증, 특히 간섬유증 질병 진행을 예측하기 위한 유용한 유전자 마커를 제공한다.

ECMP의 비정상적인 축적 또는 섬유증의 초기 검출, 및 ECMP의 비정상적인 축적 또는 섬유증의 정기적 모니터링은, 섬유증의 과정을 중지시키거나 심지어 역전시킬 수 있는 항-섬유증 요법의 개시를 고려할 것이다. 결과적으로, 이는 인간 섬유증 질환, 예를 들어 간섬유증 또는 간 간경변에 대한 진행, 및 이러한 상태가 수반하는 이환율과 사망률을 방지할 것이다. 이와 같이 다양한 초기 섬유증 검출법의 개발은 간 질환을 앓는 환자의 향후 치료를 위해 좋은 징조이다.

본 발명자는 인간 섬유증과 연관된 유전자를 동정하였다. 이들은 각각 시스토조마 자포니쿰 및 시스토조마 만소니에 의해 감염된 중국, 수단 및 브라질 코호트(cohort)의 섬유증은 IL22RA2에 유지하는 대립유전자 변종에 분명하게 의존한다는 것을 나타내었다. IL22RA2("인터류킨-22 수용체 알파-2(Interleukin-22 receptor 알파-2)" 유전자의 약칭) 유전자는 IL22R-BP라고도 불리며, IL-22의 이의 수용체로의 결합을 위해 경쟁하는 가용성 형태의 IL-22 수용체를 인코딩한다.

특히, 본 발명은 모두 풍토지역에 사는 중국인(S.japonicum에 노출됨), 수단인 및 브라질인(S.mansoni에 노출됨)의 개별적인 샘플에 대해 사례조절연구를 수행하였다. 간섬유증(HF)은 각 샘플에 대해 2 이상의 관찰자에 의한 초음파검사(echography)를 사용함으로써 분석되었다. IL22RA2의 모든 태그 SNP(마이너 대립유전자 빈도(Minor Allele Frequency) > 10%)가 실험되었다. 연관된 SNP와 연관불균형의 SNP가 관찰된 연관관계를 설명할 수 있는지 여부를 배제하기 위해, 본 발명자는 IL22RA2의 3' 및 5'의 500 Kb 영역에서 SNP를 평가하였다.

따라서, 본 발명은 대상체에서 간섬유증이 발생하거나, 간섬유증이 진행될 위험, 또는 간섬유증의 나쁜 예후를 나타내는 방법으로서, 상기 대상체로부터의 샘플의 IL22RA2 유전자 자리에서 위험에 연관된 단일 뉴클레오티드 다형(SNP) 대립유전자의 존재를 검출하는 단계를 포함하는 방법을 제공한다.

특히, 본 발명은 간섬유증이 발생하거나, 간섬유증이 진행될 위험, 또는 간섬유증의 나쁜 예후를 나타내는 방법으로서, 상기 대상체로부터의 샘플의 IL22RA2 유전자 자리의 SNP를 유전자형 분석하는 단계를 포함하는 방법을 제공한다.

본 발명의 다른 목적은 바이러스 감염 치료에 대한 반응을 예측하는 유전학적 접근법을 제공하는 것이다. 본 발명은 바이러스 감염, 특히 HCV를 앓는 환자의 항바이러스 치료에 대한 반응을 예측하는데 사용될 수 있는, 항바이러스 치료 반응 유전자 자리인 IL22RA2 유전자 자리의 동정을 개시한다. 특히, 본 발명은 대상체로부터의 샘플에서 IL22RA2 유전자 자리의 변경의 존재를 검출하는 단계를 포함하는 방법에 관한 것으로, 상기 변경의 존재는 치료에 대한 반응, 즉 치료에 대해 환자가 반응하지 않을 위험의 수준을 나타낸다.

본 발명의 방법은 바이러스 감염, 특히 C형 간염 바이러스 감염을 앓는 환자에 투여된 리바비린과 같은 항바이러스제 및 인터페론에 의해 치료에 대한 반응을 예측할 수 있게 한다.

본 발명은 특히 C형 간염에 있어서 항바이러스 치료에 대한 반응을 예측하기 위한 유용한 마커를 제공한다.

항바이러스 치료에 대한 반응자 및 비반응자 대상체의 초기 동정은 환자의 유전자형에 따라 개별화(개인화)된 치료를 시작할 수 있게 할 것이다. 결과적으로, 이는 의사가 더 많은 정보에 의해 측정을 할 수 있게 하고, 불필요한 경비지출 및 비필수적인 부작용을 방지할 있게한다. 이와 같은 다양한 초기 예측 기법의 개발은 바이러스, 특히 C형 간염 바이러스에 감염된 환자의 사후 치료에 좋은 징조이다.

본 발명자는 항바이러스 치료에 대한 반응에 연관된 유전자를 동정하였다. 이들은 HCV에 의해 감염된 다양한 코호트에서 항바이러스 치료 리바비린-IFN에 대한 반응이 IL22RA 유전자에 위치하는 대립유전자 변종에 의존한다는 것을 나타내었다.

본 발명자에 의해 수집된 실험 데이터가 비록 테스트된 개체군에 의존하여 특정 대립유전자들의 연관성을 확인할 수 없었더라도, 본 발명은 테스트된 모든 개체군에서 섬유증과 유의적으로 상관관계가 있는 것으로 발견된 특정 SNP에 한정되지 않는다. 실제로, 불충분한 집단, 교락(confounding) 변수들의 불완전한 평가, 상기 개체군에서 SNP의 더 낮은 빈도 등을 포함하는 여러 개의 이유들이 일부 개체군에서 유의적인 상관관계의 확인에 대한 실패를 설명할 수 있다.

정의

본 발명에서, "세포외 기질 단백질(ECMP)의 비정상적인 침착"은 모든 종류의 인간조직에서 축적될 수 있는 세포외 기질 구성성분(라미닌, 피브로넥틴, 콜라겐 I 및 IV, 프로콜라겐 III, 엘라스틴, 테나신)을 나타낸다. 이와 같은 축적은 예를 들어 동맥, 심장 또는 뇌에서 일어나는 경우에 유해할 수 있다. 침착이 매우 큰 경우, 축적은 조직의 섬유증을 일으킨다.

본 발명에서, "섬유증"은 모든 섬유증 인간 질환, 예를 들어 간 질환, 간경변, 피부 켈로이드, 비후성반흔, 강피증, 비만증 및 임의의 섬유증 질환에서 발생하는 모든 유형의 인간 섬유증을 나타낸다.

본 발명에서, "간섬유증" 또는 "HF"는 간, 간의 조직 또는 간 조직의 임의의 부분에서 발생하는 모든 유형의 섬유증을 나타낸다. 간섬유증은 특히 손상에 응하여 발생한다. 간섬유증은 만성적인 간 손상에 대한 흔한 반응일 수 있으며, 이는 결국 간경변 및 이의 복합증, 간문맥항진증, 간부전 및 간세포암종을 야기한다. 간섬유증은 간에서 과다한 결합조직이 증대된 과도한 상처치유이다. 세포외 기질은 과잉생산되거나, 분해가 결핍되거나, 또는 이 둘 모두에 해당한다. 특히 염증 성분이 존재한다면, 만성적인 손상이 계기가 된다. 다양한 유형의 만성적인 간 손상은 섬유증, 예컨대 화학적 섬유증(CCl₄), 박테리아 섬유증(즉, 브루셀라병), 기생충 섬유증(즉, 주혈흡충 종에 의해 야기되는 빌하르지오시스/시스토조미아시스; 또는 에키노코코시스 감염) 또는 바이러스 섬유증(즉, A형 간염 바이러스(HAV), B형 간염 바이러스(HBV) 또는 C형 간염 바이러스(HCV) 감염에 의해 야기되는 간염)을 야기할 수 있다.

본 발명에서, "피부 켈로이드(cutaneous keloid)"는 피부상에서 반흔조직의 과다한 성장이다. 특히, 켈로이드 및 비후성반흔(HSc)은 인간 특유의 피부 섬유증식 장애이며, 이는 외상, 염증, 수술, 화상 이후에, 때로는 자발적으로 발생한다. 이는 진피와 피하 조직에서 콜라겐의 과다한 퇴적을 특징으로 한다. 정상적인 상처 치유의 세선(fine line) 반흔 특징과 대조적으로, HSc 및 켈로이드의 풍부한 반흔형성은 통상적으로 외모손상, 경축, 소양증 및 통증을 야기한다. 켈로이드는 흑인, 히스패닉 및 동양인 중에서 가족성 기질을 갖는 개개인에게서 발생한다. HSc와 달리, 켈로이드 반흔은 원래 상처의 주변부를 넘어서 확대되고 길어지며, 거의 퇴보되지 않는다. 이러한 장애는 상처 치유의 기본 과정의 일탈을 나타내며, 여기에는 세포 이동 및 증식, 염증, 세포외 기질(ECM) 단백질 및 시토킨의 합성 및 분비의 증가, 및 새롭게 합성된 기질의 개조가 포함된다. 생물학적으로, 켈로이드는 세포외 기질 성분, 특히 콜라겐, 피브로넥틴, 엘라스틴 및 프로테오글리칸의 과도한 퇴적을 나타내는 이형 섬유아세포의 집단을 특징으로 하는 섬유증 조직이다. 일반적으로, 켈로이드는 비교적 무세포 중심과 두껍고 풍부한 콜라겐 다발을 포함하며, 이는 병변의 진피 심층 부분에서 결절을 형성한다. 치유의 염증 시기 동안 성장인자의 방출 및 활성화는, 혈관형성, 재-상피화, 섬유아세포의 보충 및 증식, 기질 퇴적을 포함하는 반흔 과정의 전제조건이다. 이어서, IL22RA2를 포함하는 조절 시토킨의 활성의 비정상적인 생성은 켈로이드의 발생에 기여할 수 있다.

본 발명에서, "IL22RA2 유전자자리(gene locus)"는 세포 또는 유기체의 모든 서열 또는 산물을 나타내며, 여기에는 IL22RA2 코딩 서열, IL22RA2 비-코딩 서열(예컨대, 인트론), 전사 및/또는 번역을 제어하는 IL22RA2 조절 서열(예컨대, 프로모터, 인핸서, 터미네이터 등), 모든 대응하는 발현 산물, 예컨대 IL22RA2 RNA(예컨대, mRNA) 및 IL22RA2 폴리펩티드(예컨대, 전-단백질 및 성숙 단백질); 뿐만 아니라 IL22RA2 유전자의 개시 코돈의 업스트림에서 500 kb 영역, 바람직하게는 100 kb 영역, 바람직하게는 20kb의 주변 서열, 및 미번역 영역(3'UTR)의 다운스트림에서 500 kb 영역, 바람직하게는 100 kb 영역, 바람직하게는 20kb 영역의 주변 서열이 포함된다. 예를 들어, IL22RA2 유전자자리는 표 1의 SNP를 포함하는 주변 서열을 포함한다.

본 발명에서, "예후"라는 용어에는 성인, 아동 및 태아에게서, 초기, 증상 이전 단계 및 말기 단계를 포함하는 다양한 단계에서, 검출, 모니터링, 투여, 비교 등이 포함된다. 예후에는 통상적으로 섬유증의 진행, 및 가장 적합한 치료(약물유전학)를 규정하는 대상체의 특징 등의 평가(예측)이 포함된다. 본 발명은 IL22RA2 유전자자리에서 돌연변이 또는 다형으로부터 야기된 섬유증 또는 관련 장애의 진행 속도를 측정하기 위한 예후 방법을 제공한다.

"샘플"은 핵산 또는 폴리펩티드를 포함하는, 환자 또는 대상체로부터 유래된 임의의 생물학적 샘플일 수 있다. 이와 같은 샘플의 예는 유체, 조직, 세포 샘플, 기관, 생검 등을 포함한다. 가장 바람직한 샘플은 혈액, 혈청, 침, 소변, 정액 등이다. 샘플은 종래의 기법에 따라 수집될 수 있고, 진단을 위해 직접 사용되거나 저장될 수 있다.

"환자"는 이의 나이 또는 성별과 관계없이 어떠한 포유류도 될 수 있으며, 바람직하게는 인간이다. 환자는 라사(Lassa) 바이러스와 같은 아레나비리다에(Arenaviridae); 중증급성호흡기증후군(Sever Acute Respiratory Syndrome virus) 바이러스와 같은 코로나비리다에(Coronaviridae); C형 또는 B형 간염 바이러스, 뎅기(Dengue) 바이러스, 웨스트 나일(West Nile) 바이러스, 황열(Yellow Fever) 바이러스, 진드기매개뇌염(Tick-Borne Encephalitis) 바이러스와 같은 플라비비리다에(Flaviviridae); 에볼라(Ebola), 마부르크(Marburg)와 같은 필로비리다에(Filoviridae); 헤르페스 심플렉스(Herpes Simplex) 바이러스, 거대세포바이러스(Cytomegalovirus), 엡스타인-바르(Epstein-Barr) 바이러스, 바리셀라 조스터(Varicella Zoster) 바이러스와 같은 헤르페스비리다에(Herpesviridae); A형 및 B형 독감과 같은 오르토믹소비리다에(Orthomyxoviridae); 호흡기 세포융합(Respiratory Syncytial) 바이러스, 파라인플루엔자(ParaInfluenza) 바이러스, PMV, 홍역(Measles)과 같은 파라믹소비리다에(Paramyxoviridae); 백시니아(Vaccinia), 바리올라(Variola)와 같은 폭스비리다에(Poxviridae); 수포성 구내염(Vesicular Stomatitis) 바이러스, 바이러스성 출혈성 패혈증(Viral Hemorrhagic Septicemia) 바이러스, 광견병(Rabies)과 같은 랍도비리다에(Rhabdoviridae); HIV 및 다른 레트로바이러스와 같은 레트로비리다에(Retroviridae); 치쿤구니야(Chikungunya), 신드비스(Sindbis), 셀미키 삼림(Semliki Forest) 바이러스, 로스강(Ross River) 바이러스, 동부형 마뇌막염(Eastern Equine Encephalitis) 바이러스와 같은 토가비리다에(Togaviridae)의 과(family)의 바이러스로 이루어진 군에서 선택된 바이러스를 포함한 바이러스에 의해 감염될 수 있다. 특정 구현예에서, 환자는 C형 간염 바이러스, 예를 들어 제1유전자형 C형 간염 바이러스에 의해 감염된다.

항바이러스제 및/또는 인터페론에 의한 치료에 바이러스 감염에 의해 영향을 받은 환자가 반응할 가능성을 측정하는 방법에 있어서, "바이러스 감염"이라는 용어는 리바비린 및/또는 IFN에 의해 치료될 수 있는 모둔 종류의 인간 바이러스 감염, 예를 들어, C형 간염, B형 간염, 호흡기세포융합바이러스(Respiratory Syncytial Virus: RSV) 모세기관지염, 아네도바이러스 질환, 독감, 및 리바비린 및/또는 IFN에 의해 치료될 수 있는 인간 바이러스 감염을 지칭한다.

본 발명에서, "반응자"는 항바이러스제, 특히 리바비린, 및/또는 IFN에 의한 치료에 반응하는, 즉 바이러스양이 감소하거나, 또는 하나 이상의 증상이 완화되거나, 질병의 진행이 중단되거나 늦어지는, 환자의 표현형(phenotype)을 나타낸다.

본 발명에서, "비반응자"는 항바이러스제, 특히 리바비린 및/또는 IFN에 의한 치료에 반응하지 않거나, 반응하지만 1 또는 2년 내에 재발하는 환자의 표현형을 나타낸다. 치료에 대한 비반응은 바이러스양이 감소하지 않거나, 환자의 증상이 완화되지 않거나, 질병이 진행하는 것을 나타낸다. 재발한 환자는 짧은 기간 동안 치료에 반응하지만, 이들의 바이러스양 및 증상은 치료 후 1 또는 2년 내에 다시 증가한다.

"치료" 또는 "항바이러스 치료"는 항바이러스제 및/또는 인터페론(IFN)의 투여를 나타낸다.

바람직하게는, 상기 인터페론은 인터페론 감마이다. 그러나, 인터페론 알파 2B, PEG화 인터페론 알파, 컨센서스 인터페론, 인터페론 알파 2A, 및 림프아구형(lymphoblastoid) 인터페론 타우(tau)를 포함하여 다른 인터페론도 포함된다. 바람직한 구현예에서, 인터페론은 PEG화 인터페론 감마와 같은 PEG화 인터페론이다.

"항바이러스제"는 바이러가스 세포로 진입하는 것, 또는 이의 복제를 방해하거나, 바이러스 단백질의 활성을 억제하는 임의의 화합물일 수 있다. 예를 들어, 이는 간섭 RNA, 안티센스 RNA, 이미퀴모드(Imiquimod), 리바비린, 이노신 5'-모노포스페이트 탈수소효소 억제제, 아만타딘(amantadine) 또는 리만타딘(rimantadine)일 수 있다. 더욱 일반적으로, 이는 바이러스 단백질분해효소 억제제일 수 있다.

바이러스가 HCV 바이러스인 경우, 바이러스 억제제는 HCV 금속단백질분해효소, HCV 세린 단백질분해효소, HCV 중합효소, HCV 헬리카제, HCV NS4B 단백질, HCV 집입, HCV 조립assembly, HCV 배출(egress) 또는 HCV NS5A 단백질의 억제제일 수 있다.

바람직한 측면에서, 인터페론은 PEG화 인터페론 감마와 같은 인터페론 감마이다. 다른 바람직한 측면에서, 인터페론은 PEG화 인터페론 알파와 같은 인터페론 알파이다. 구체적인 구현예에서, 치료는 리바비린 및 인터페론 감마 또는 알파, 바람직하게는 PEG화 인터페론 감마 또는 알파를 포함한다.

변경( alteration )

변경은 IL22RA2 DNA, RNA 또는 폴리펩티드의 수준에서 측정될 수 있다. 선택적으로, 검출은 IL22RA2 유전자자리의 전부 또는 일부의 시퀀싱에 의해 수행되거나, 또는 IL22RA2 유전자자리의 전부 또는 일부의 선택적 하이브리드화 또는 증폭에 의해 수행된다. 더 바람직하게는, IL22RA2 유전자자리 특이적 증폭이 변경을 동정하는 단계 이전에 수행된다. IL22RA2 유전자자리에서의 변경은 유전자자리의 코딩 및/또는 비-코딩 영역에서 돌연변이(들), 결실(들), 재배열(들) 및/또는 삽입(들)의 임의의 형태 단독, 또는 다양한 조합(들)일 수 있다. 특히, 돌연변이에는 점 돌연변이가 포함된다. 결실은, 예를 들어 2개의 잔기부터 전체 유전자 또는 유전자자리에 이르기까지, 유전자자리의 코딩 또는 비-코딩 부분에서 임의의 둘 이상의 잔기 영역을 포함할 수 있다. 비록 더 큰 결실이 물론 발생할 수 있을지라도, 통상적인 결실은 더 작은 영역, 예컨대 도메인(인트론) 또는 반복된 서열 또는 약 50개 미만의 연속적 염기쌍의 단편에 대해 발생한다. 삽입은 유전자자리의 코딩 또는 비-코딩 부분에서 하나 이상의 잔기의 부가를 포함할 수 있다. 삽입은 통상적으로 유전자자리에서 1 내지 50개의 염기쌍의 부가를 포함할 수 있다. 재배열에는 서열의 역위가 포함된다. IL22RA2 유전자자리 변경은 종결 코돈의 생성, 프레임시프트 돌연변이, 아미노산 치환, 특정 RNA 스플라이싱 또는 가공, 산물 불안정, 절단된 폴리펩티드 생성 등을 야기할 수 있다. 상기 변경은 기능, 안정성, 표적화 또는 구조가 변형된 IL22RA2 폴리펩티드의 생성을 야기할 수 있다. 또한, 상기 변경은 단백질 발현의 감소, 또는 다르게는 상기 생성의 증가를 야기할 수 있다.

바람직한 구현예에서, 상기 변경은 하나 이상의 염기의 돌연변이, 삽입 또는 결실이다. 본 발명에 따른 방법의 특정 구현예에서, IL22RA2 유전자자리의 변경은 IL22RA2 유전자 또는 이에 대응하는 발현 산물에서 점 돌연변이, 결실 및 삽입, 더 바람직하게는 점 돌연변이 및 결실로부터 선택된다. 상기 변경은 IL22RA2 DNA, RNA 또는 폴리펩티드의 수준에서 측정될 수 있다.

가장 바람직한 구현예에서, 본 방법은 표 1에 나타난 위치 중 하나에 SNP의 존재를 측정하기 위해, IL22RA2 유전자를 유전자형 분석하는 단계를 포함한다.

HapMap: CEU 유럽 코호트, YOR 아프리카 코호트(요루바족), CHB 아시아 코호트(중국인)

바람직하게는, 본 방법은 rs6570136, rs7774663, rs11154915 및 rs2064501로 이루어진 군에서 선택된 SNP를 유전자형 분석하는 단계를 포함한다.

SNP rs6570136, 특히 GG 유전자형의 SNP rs6570136에 있어서, G 대립유전자는 환자에 유해하고, 즉 ECMP의 비정상적인 침착, 또는 섬유증, 특히 간섬유증을 일으킬 가능성이 높은 환자를 나타낸다.

SNP rs7774663, 특히 TT 유전자형의 SNP rs7774663에 있어서, T 대립유전자는 환자에 유해하고, 즉 ECMP의 비정상적인 침착, 또는 섬유증, 특히 간섬유증을 일으킬 가능성이 높은 환자를 나타낸다.

SNP rs11154915, 특히 TT 또는 CT 유전자형의 SNP rs11154915에 있어서, T 대립유전자는 환자에 유해하고, 즉 ECMP의 비정상적인 침착, 또는 섬유증, 특히 간섬유증을 일으킬 가능성이 높은 환자를 나타낸다.

SNP rs2064501, 특히 CC 유전자형의 SNP rs2064501에 있어서, C 대립유전자는 환자에 유해하고, 즉 ECMP의 비정상적인 침착, 또는 섬유증, 특히 간섬유증을 일으킬 가능성이 높은 환자를 나타낸다.

동일한 빈(bin)의 SNP는 매우 긴밀하게 연관되고(r2>0.8), 본 발명의 방법에 있어서 유사한 유용성을 갖는다. 강한 연관불균형(r2>0.6을 나타냄)의 SNP도 포함된다.

본 발명의 다른 방법은 표 2에 정의된 것과 같은 비반응의 유전자형을 포함하는지 여부를 측정하는 단계를 포함할 수 있다.

분석은 모두 HCV에 의해 감염된 123명의 대상체(69명의 반응자 대상체 및 54명의 비반응자 대상체)에 대해 수행되었다.

IL22RA2 유전자 자리의 항바이러스 치료 반응-관련 변경

빈	SNP	SEQ ID NO:	반응자 유전자형 ( RG )	반응자에서 RG 를 갖는 %	비반응자에서 RG를 갖는 %	p	OR	CI
일변량 분석
I	rs7774663	10	CT, TT	89	79.3	0.13	2.1	0.8-5.6
I	rs6570136	2	AG, GG	78.6	66.1	0.12	1.9	0.85-4.2
II	rs7749054	15	TT	71.6	58.6	0.1	1.8	0.9-3.7
III	rs202563	16	AG, GG	87.7	75.4	0.07	2.3	0.9-5.8
IV	rs28366	21	CC, TC	44.6	32.1	0.15	1.7	0.8-3.5
IV	rs276466	20				0.3
V	rs11154915	25	TT	6.8	1.7	0.2	4.2	0.5-37
VI	rs2064501	37	CT	54.8	32.8	0.013	2.5	1.2-5.1
VII	rs1543509	38	AA	90.5	73.2	0.012	3.5	1.3-9.3
다변량 분석
I	rs6570136	2	GG			0.16	1.9	0.8-4.7
V	rs11154915	25	TT			0.03	13.7	1.3-146
VI	rs2064501	37	CT			0.004	3.6	1.5-8.5
VII	rs1543509	38	AA			0.014	3.9	1.3-11.5

바람직하게는, 본 방법은 rs11154915, rs6570136, rs2064501 및 rs1543509로 이루어진 군에서 선택된 SNP를 유전자형 분석하는 단계를 포함한다.

SNP rs11154915에 있어서, TT 유전자형의 존재는 항바이러스 치료에 대한 양성반응을 지지한다.

SNP rs6570136에 있어서, AG 또는 GG 유전자형의 존재는 항바이러스 치료에 대한 양성반응을 지지한다.

SNP rs2064501에 있어서, CT 유전자형의 존재는 항바이러스 치료에 대한 양성반응을 지지한다.

SNP rs1543509에 있어서, AA 유전자형의 존재는 항바이러스 치료에 대한 양성반응을 지지한다.

동일한 빈(bin)의 SNP는 매우 긴밀하게 연관되고(r2>0.8), 본 발명의 방법에 있어서 유사한 유용성을 갖는다. 강한 연관불균형의 SNP도 포함된다.

각 유전자형에 관련된 Odd 비는 표 2에 나타난다. 이들은 각 SNP가 단독으로 평가되는 경우에 1.9 내지 4이고; 동일한 다변수 모델에서 모든 SNP가 함께 평가되는 경우(SNP 사이의 교락 효과(confounding effect)를 고려함)에 OR는 1.9 내지 13이며, 4개의 다형(polymorphism) 모두에 대한 반응자 유전자형을 가지는 대상체는 모든 다형에 대해 비반응자 유전자형을 가지는 대상체에 비해 치료에 반응할 가능성이 약 50 내지 300배 높다.

연관불균형(LD)은 게놈 전반에 걸친 다른 유전자 자리에서 대립유전자의 비무작위적인 연관관계로서 정의된다. 2 이상의 유전자 자리의 대립유전자는, 이들의 조합이 우연히 인구 중에서 더 자주 또는 더 드물게 일어나는 경우에, LD에 있다.

LD에 때문에 DNA 영역에 인과적 유전자 자리가 존재하는 경우에, 주변의 하나 이상의 SNP도 또한 그 특성(trait)에 연관될 가능성이 크다. 따라서, 비정상적인 ECMP 침착에 연관된 제1 SNP를 갖는 강한 LD(r2>0.6을 나타냄)의 임의의 SNP는 상기 특성에 연관될 것이다.

따라서, 특정 SNP와 섬유증 사이에 연관이 입증된다면, 이러한 특성과 연관된 부가적 SNP의 발견은 상기 특정 영역에서 SNP의 밀도를 증가시키기 위해 매우 흥미로울 수 있다. 특정 SNP와 연관불균형에 있는 부가적 SNP의 동정은 하기를 포함한다: (a) 다수의 개개인들의 첫번째 SNP를 포함하거나 첫번째 SNP를 둘러싼 게놈 영역의 단편을 증폭시키는 단계; (b) 상기 첫번째 SNP를 포함하거나 둘러싼 게놈 영역에서 두번째 SNP를 동정하는 단계; (c) 상기 첫번째 SNP와 두번째 SNP 사이에서 연관불균형 분석을 수행하는 단계; 및 (d) 상기 첫번째 마커와 연관불균형에 있는 상기 두번째 SNP를 선택하는 단계. 또한, (b) 단계 및 (c) 단계를 포함하는 서브-컴비네이션(sub-combination)이 고려된다.

SNP를 동정하고, 연관불균형 분석을 수행하기 위한 방법은 과도한 시행착오 없이 잘 알려진 방법을 사용함으로써 통상의 기술자에 의해 수행될 수 있다.

많은 SNP들이 근처의 다른 SNP 대립유전자와 강한 LD를 나타내는 대립유전자를 갖고, 강한 LD를 갖는 게놈 영역에서 균일한 간격을 갖는 SNP의 선택 또는 다른 SNP(프록시 SNP 또는 Tag SNP)와의 LD에 기반하여 선택된 것들은 약간의 통계적 검증력의 손실만으로 유전자형 분석되지 않은 SNP의 유전자 정보 대부분을 캡쳐할 수 있다는 것이 잘 알려져 있다. 연관관계 연구에서, 이와 같은 LD의 영역은 소수의 SNP(Tag SNP)를 사용함으로써 적절하게 다뤄지고, 연구에서 SNP와 표현형 사이의 통계적 연관관계는 SNP가 인과적 변이체이거나, 인과적 변이체와 LD인 것을 의미한다. LD를 측정하기 위해 가장 흔히 사용되는 2개의 측정기준은 D' 및 r²이고, 이들은 서로에 대해 그리고 대립유전자 빈도의 측면에서 쓰일 수 있다. 프록시 SNP(또는 Tag SNP)는 하나 이상의 다른 SNP와의 LD(r² ≥ 0.8)에 있는 SNP로 정의되는 것이 일반적인 의견이다. 프록시 SNP의 유전자형은 LD를 통해 다른 SNP의 유전자형을 예측할 수 있으며, 그 반대도 가능하다. 특히, 여기서 사용된 SNP 중 하나와 LD에 있는 임의의 SNP는 r² ≥ 0.8인 이들의 LD에 따라 정의된 하나 이상의 프록시 SNP에 의해 대체될 수 있다.

또한, 이와 같은 연관불균형의 SNP는 본 발명에 따른 방법, 특히 본 발명에 따른 진단방법에 사용될 수 있다

IL22RA2 유전자의 변경은 변경된 IL22RA2 RNA 발현의 존재를 결정함으로써 검출될 수 있다. 변경된 RNA 발현에는 변경된 RNA 서열의 존재, 변경된 RNA 스플라이싱 또는 가공의 존재, RNA의 변경된 양의 존재 등이 포함된다. 이는 당업계에 알려진 다양한 기법들에 의해 검출될 수 있으며, 여기에는 예를 들어 IL22RA2 RNA의 전부 또는 일부의 시퀀싱, 또는 IL22RA2 RNA의 전부 또는 일부의 선택적 하이브리드화 또는 선택적 증폭이 포함된다.

추가 변형예에서, 상기 방법은 변경된 IL22RA2 폴리펩티드 발현의 존재를 검출하는 단계를 포함한다. 변경된 IL22RA2 폴리펩티드 발현에는 변경된 폴리펩티드 서열의 존재, IL22RA2 폴리펩티드의 변경된 양의 존재, 변경된 조직 분포의 존재 등이 포함된다. 이는 당업계에 알려진 다양한 기법들에 의해 검출될 수 있으며, 여기에는 예를 들어 시퀀싱 및/또는 특이적 리간드(예컨대 항체)에 대한 결합이 포함된다.

전술한 바와 같이, 시퀀싱, 하이브리드화, 증폭 및/또는 특이적 리간드(예컨대 항체)에 대한 결합을 포함하여 당업계에 알려진 다양한 기법들은, 변경된 IL22RA2 유전자 또는 RNA 발현 또는 서열을 검출하거나 정량화하기 위해 사용될 수 있다. 또다른 적합한 방법에는 대립유전자-특이적 올리고뉴클레오티드(ASO), 대립유전자-특이적 증폭, (DNA에 대한) 서던 블롯, (RNA에 대한) 노던 블롯, 단일 가닥 구조 분석(SSCA), PFGE, 형광 제자리 하이브리드화(FISH), 겔 이동, 클램프 변성 겔 전기영동, 이형2중가닥 분석, RN아제 보호법, 화학적 미스매치 절단, ELISA, 방사면역측정법(RIA) 및 면역효소측정법(IEMA)이 포함된다. 상기 접근법 중 일부(예컨대, SSCA 및 CGGE)는 변경된 서열이 존재한 결과로서 핵산의 전기영동 이동도의 변화에 기초한다. 이러한 기법들에 따르면, 변경된 서열이 겔상에서 이동도의 변화에 의해 가시화된다. 그 후, 단편들은 서열화되어, 변경을 확인할 수 있다. 다른 일부 접근법은 대상체의 핵산과 야생형 또는 변경된 IL22RA2 유전자 또는 RNA에 대해 특이적인 프로브 사이의 특이적 하이브리드화에 기초한다. 상기 프로브는 기질에 고정될 수 있거나 또는 현탁될 수 있다. 상기 프로브는 통상적으로 하이브리드의 검출을 촉진하기 위하여 표지된다. 상기 접근법 중 일부는 특히 폴리펩티드 서열 또는 발현 수준을 평가하는데 적합하며, 예를 들어 노던 블롯, ELISA 및 RIA가 있다. 상기 후자는 폴리펩티드에 특이적인 리간드, 더 바람직하게는 특이적 항체의 사용을 필요로 한다.

바람직한 구현예에서, 본 방법은 대상체의 샘플에서 변경된 IL22RA2 유전자 발현 프로파일의 존재를 검출하는 단계를 포함한다. 전술한 바와 같이, 이는 더 바람직하게는 상기 샘플에 존재하는 핵산의 시퀀싱, 선택적 하이브리드화 및/또는 선택적 증폭에 의해 달성될 수 있다.

시퀀싱

시퀀싱은 자동화 서열분석기를 사용하여, 당업계에 잘 알려진 기법들을 사용하여 수행될 수 있다. 시퀀싱은 온전한 IL22RA2 유전자자리에 대해, 또는 더 바람직하게는 이의 특이적 도메인, 통상적으로 유해한 돌연변이 또는 다른 변경을 수반하는 것으로 알려지거나 의심되는 것에 대해 수행될 수 있다.

증폭

증폭은 핵산 복제를 개시하는데 사용되는 상보적 핵산 서열 사이의 특이적 하이브리드의 형성에 기초한다. 증폭은 당업계에 알려진 다양한 기법들, 예컨대 폴리머라제 연쇄반응(PCR), 리가제 연쇄반응(LCR), 가닥 치환 증폭(SDA) 및 핵산 서열 기재 증폭(NASBA)에 의해 수행될 수 있다. 이러한 기법들은 시판되는 시약과 프로토콜을 사용하여 수행될 수 있다. 바람직한 기법은 대립유전자-특이적 PCR 또는 PCR-SSCP를 사용한다. 증폭에는 일반적으로 반응을 개시하기 위한 특이적 핵산 프라이머의 사용이 필요하다. IL22RA2 유전자자리의 서열을 증폭하는데 유용한 핵산 프라이머는 상기 유전자자리의 표적 영역의 옆에 배치된 IL22RA2 유전자자리의 부분과 특이적으로 하이브리드화될 수 있으며, 상기 표적 영역은 섬유증 또는 관련 장애를 갖는 특정 대상체에서 변경된다.

본 발명은 주변 영역을 포함하여 IL22RA2 유전자 또는 유전자 자리로부터의 서열을 증폭하는데 유용한 핵산 프라이머를 이용한다. 상기 프라이머는 바람직하게는 IL22RA2 유전자 자리의 핵산 서열에 상보적이고, 이에 특이적으로 하이브리드화 된다. 특정 프라이머는 상기 유전자 자리의 표적 영역의 옆에 위치하는 IL22RA2 유전자 자리의 부분과 함께 하이브리드화 할 수 있고, 상기 표적 영역은 섬유증 또는 이와 관련된 장애를 갖는 특정 대상체에서 변경된다.

선택적 하이브리드화

하이브리드화 검출 방법은 핵산 서열 변경(들)을 검출할 수 있게 하는 상보적 핵산 서열 사이의 특이적 하이브리드의 형성에 기초한다. 특정 검출 기법에는, 야생형 또는 변경된 IL22RA2 유전자 또는 RNA에 대해 특이적인 핵산 프로브를 사용하고, 그 후 하이브리드의 존재를 검출하는 것이 포함된다. 상기 프로브는 (핵산 어레이 또는 칩 기법에서와 같이) 기질 또는 지지체에 고정되거나 또는 현탁될 수 있다. 상기 프로브는 통상적으로 하이브리드의 검출을 촉진하기 위하여 표지된다. 이와 관련하여, 본 발명의 특정 구현예는 변경된 IL22RA2 유전자자리에 대해 특이적인 핵산 프로브와 대상체의 샘플을 접촉시키는 단계, 및 하이브리드의 형성을 평가하는 단계를 포함한다. 바람직한 특정 구현예에서, 본 방법은 야생형의 IL22RA2 유전자자리와 이의 변경된 다양한 형태들에 대해 각각 특이적인 프로브 세트와 샘플을 동시에 접촉시키는 단계를 포함한다. 이러한 구현예에서, 샘플의 IL22RA2 유전자자리에서 다양한 형태의 변경의 존재를 직접적으로 검출하는 것이 가능하다. 또한, 다양한 대상체의 다양한 샘플들이 동시에 처리될 수 있다.

본 발명에서, 프로브는, IL22RA2 유전자 또는 RNA(의 표적 부분)에 상보적이고 이에 대해 특이적 하이브리드화될 수 있으며, 섬유증에 대한 소인이 있거나 섬유증과 연관된 IL22RA2 대립유전자 연관 폴리뉴클레오티드 다형을 검출하는데 적합한, 폴리뉴클레오티드 서열을 나타낸다. 프로브는 바람직하게는 IL22RA2 유전자, RNA, 또는 이의 표적 부분에 완전히 상보적이다. 프로브는 통상적으로 길이가 8 내지 1000인 뉴클레오티드의 단일 가닥 핵산을 포함하며, 예를 들어 상기 길이는 10 내지 800, 더 바람직하게는 15 내지 700, 일반적으로 20 내지 500이다. 또한, 더 긴 프로브도 사용될 수 있다. 본 발명의 바람직한 프로브는, 변경을 수반하는 IL22RA2 유전자자리 또는 RNA의 영역에 특이적으로 하이브리드화할 수 있는, 길이가 8 내지 500인 뉴클레오티드의 단일 가닥 핵산 분자이다.

본 발명의 방법은, 변경된(예컨대, 돌연변이된) IL22RA2 유전자 또는 RNA에 대해 특이적인 핵산 프로브, 즉 상기 변경된 IL22RA2 유전자 또는 RNA에 대해 특이적으로 하이브리드화하고, 상기 변경이 없는 IL22RA2 유전자 또는 RNA에 대해서는 본질적으로 하이브리드화하지 않는 핵산 프로브를 이용한다. 특이성은, 표적 서열에 대한 하이브리드화가 특이적인 신호를 생성하고, 이는 비-특이적 하이브리드화를 통해 생성된 신호와 구별될 수 있다는 것을 나타낸다. 본 발명에 따른 프로브를 설계하기 위해, 완전하게 상보적인 서열이 바람직하다. 그러나, 특이적인 신호가 비-특이적 하이브리드화와 구별될 수 있는 한, 특정 미스매치는 용인될 수 있는 것으로 여겨져야 할 것이다.

상기 프로브의 특정 예는, 상기 표 1에 기재되어 있는 점 돌연변이를 수반하는 IL22RA2 유전자자리 또는 RNA를 포함하는 게놈 영역의 표적 부분에 대해 상보적인 핵산 서열이다.

프로브의 서열은 본 출원에서 제공된 IL22RA2 유전자 및 RNA의 서열로부터 유래될 수 있다. 프로브의 화학적 변형 뿐만 아니라 뉴클레오티드 치환이 수행될 수 있다. 상기 화학적 변형은 하이브리드의 안정성을 증가시키기 위해 사용될 수 있거나(예컨대, 인터컬레이팅 기), 또는 프로브를 표지하기 위해 사용될 수 있다. 표지의 일반적인 예에는 방사능, 형광, 발광, 효소 표지 등이 포함되지만, 이에 한정되는 것은 아니다. 또한, 본 발명은 대상체에서 섬유증 또는 관련 장애의 존재 또는 이에 대한 소인을 검출하는 방법, 또는 섬유증 또는 관련 장애의 치료에 대한 대상체의 반응을 평가하는 방법에서, 전술한 핵산 프로브의 용도에 관한 것이다.

특이적 리간드 결합

전술한 바와 같이, IL22RA2 유전자자리의 변경은 또한 IL22RA2 폴리펩티드 서열 또는 발현 수준의 변경(들)을 스크리닝함으로써 검출될 수 있다. 이와 관련하여, IL22RA2 폴리펩티드에 대해 특이적인 리간드와 샘플을 접촉시키는 것과, 복합체의 형성을 결정하는 것이 또한 개시되어 있다. 특이적 항체와 같은 다양한 유형의 리간드가 사용될 수 있다. 특정 구현예에서, 상기 샘플은 IL22RA2 폴리펩티드에 대해 특이적인 항체와 접촉되고, 면역 복합체의 형성이 결정된다. 면역 복합체를 검출하기 위한 다양한 방법들, 예를 들어 ELISA, 방사면역측정법(RIA) 및 면역효소측정법(IEMA)이 사용될 수 있다. 본 발명에서, 항체는 폴리클로날 항체, 모노클로날 항체, 및 실질적으로 동일한 항원 특이성을 갖는 항체의 단편 또는 유도체를 나타낸다. 단편에는 Fab, Fab'2, CDR 영역 등이 포함된다. 유도체에는 단일 사슬 항체, 인간화된 항체, 다관능 항체 등이 포함된다. IL22RA2 폴리펩티드에 대해 특이적인 항체는 IL22RA2 폴리펩티드에 선택적으로 결합하는 항체, 즉 IL22RA2 폴리펩티드 또는 이의 에피토프-함유 단편에 대한 항체를 나타낸다. 비록 다른 항원에 대한 비-특이적 결합이 발생할 수 있더라도, 표적 IL22RA2 폴리펩티드에 대한 결합은 더 높은 친화력으로 발생하며, 이는 비-특이적 결합과 신뢰성있게 구별될 수 있다.

또한, IL22RA2 유전자자리 또는 폴리펩티드의 변경, IL22RA2 유전자 또는 폴리펩티드 발현의 변경, 및/또는 IL22RA2 활성의 변경의 존재를 대상체의 샘플에서 검출하기 위한 시약 및 생성물을 포함하는 진단 키트가 개시되어 있다. 상기 진단 키트에는 본 발명에 개시된 임의의 프라이머, 임의의 프라이머 쌍, 임의의 핵산 프로브 및/또는 임의의 리간드, 바람직하게는 항체가 포함된다. 또한, 상기 진단 키트에는 하이브리드화, 증폭 또는 항원-항체 면역 반응을 수행하기 위한 시약 및/또는 프로토콜이 포함될 수 있다.

약물 스크리닝

약물 후보 또는 예를 스크리닝하기 위한 새로운 방법이 또한 개시된다. 이러한 방법에는 결합 분석 및/또는 기능 분석이 포함되며, 이는 시험관내, 세포계, 동물 등에서 수행될 수 있다. 본 발명의 특정 목적은 생물학적으로 활성인 화합물을 선택하는 방법에 관한 것이며, 상기 방법은 본 발명에 따른 IL22RA2 유전자 또는 폴리펩티드와 시험 화합물을 시험관내에서 접촉시키는 단계, 및 상기 IL22RA2 유전자 또는 폴리펩티드에 결합하는 상기 시험 화합물의 능력을 결정하는 단계를 포함한다. 상기 유전자 또는 폴리펩티드에 대한 결합은, 상기 표적의 활성을 조절하고 이에 따라 대상체에서 ECMP의 비정상적인 침착 또는 섬유증을 유발하는 경로에 영향을 미치는 화합물의 능력에 관한 지표를 제공한다. 바람직한 구현예에서, 본 방법은 본 발명에 따른 IL22RA2 폴리펩티드 또는 이의 단편과 시험 화합물을 시험관내에서 접촉시키는 단계, 및 상기 IL22RA2 폴리펩티드 또는 단편에 결합하는 상기 시험 화합물의 능력을 결정하는 단계를 포함한다. 상기 단편은 바람직하게는 IL22RA2 폴리펩티드의 결합 부위를 포함한다. 바람직하게는, 상기 IL22RA2 유전자 또는 폴리펩티드 또는 이의 단편은, 변경 또는 돌연변이를 포함하는 변경되거나 돌연변이된 IL22RA2 유전자 또는 폴리펩티드 또는 이의 단편이다. 본 발명의 특정 목적은 ECMP의 비정상적인 침착 또는 섬유증에 대해 활성인 화합물을 선택하는 방법에 관한 것이며, 상기 방법은 본 발명에 따른 IL22RA2 폴리펩티드 또는 이의 결합부위-함유 단편과 시험 화합물을 시험관내에서 접촉시키는 단계, 및 상기 IL22RA2 폴리펩티드 또는 이의 단편에 결합하는 상기 시험 화합물의 능력을 결정하는 단계를 포함한다. 바람직하게는, 상기 IL22RA2 폴리펩티드 또는 이의 단편은, 변경 또는 돌연변이를 포함하는 변경되거나 돌연변이된 IL22RA2 폴리펩티드 또는 이의 단편이다. 약물 후보를 스크리닝하기 위한 방법은 본 발명에 따른 IL22RA2 폴리펩티드를 발현하는 재조합 숙주 세포를 시험 화합물과 접촉시키는 단계, 및 상기 IL22RA2에 결합하고 IL22RA2 폴리펩티드의 활성을 조절하는 상기 시험 화합물의 능력을 결정하는 단계를 포함한다. 바람직하게는, 상기 IL22RA2 폴리펩티드 또는 이의 단편은, 변경 또는 돌연변이를 포함하는 변경되거나 돌연변이된 IL22RA2 폴리펩티드 또는 이의 단편이다. 결합을 결정하는 것은 다양한 기법들, 예컨대 시험 화합물의 표지화, 표지된 참조 리간드와의 경쟁 등에 의해 수행될 수 있다.

또한, 임의의 ECMP의 비정상적인 침착 또는 섬유증을 갖거나, 임의의 ECMP의 비정상적인 침착 또는 섬유증을 발달시킬 소인이 있는 대상체를 위해 생물학적으로 활성인 화합물을 선택하는 방법은 본 발명에 따른 IL22RA2 유전자와 시험 화합물을 시험관내에서 접촉시키는 단계, 및 상기 IL22RA2 유전자의 발현을 조절하는 상기 시험 화합물의 능력을 결정하는 단계를 포함한다. 바람직하게는, 상기 IL22RA2 유전자 또는 이의 단편은, 변경 또는 돌연변이를 포함하는 변경되거나 돌연변이된 IL22RA2 유전자 또는 이의 단편이다.

또한, 활성 화합물, 특히 임의의 ECMP의 비정상적인 침착 또는 섬유증에 대해 활성인 화합물의 스크리닝, 선택 또는 동정 방법은 리포터 구조물(construct)을 포함하는 재조합 숙주 세포와 시험 화합물을 접촉시키는 단계, 및 리포터 유전자의 발현을 조절(예컨대, 활성화 또는 억제)하는 시험 화합물을 선택하는 단계를 포함하며, 여기서 상기 리포터 구조물은 IL22RA2 유전자 프로모터의 조절하에서 리포터 유전자를 포함한다. 바람직하게는, 상기 IL22RA2 유전자 프로모터 또는 이의 단편은, 변경 또는 돌연변이를 포함하는 변경되거나 돌연변이된 IL22RA2 유전자 프로모터 또는 이의 단편이다.

상기 스크리닝 분석은 임의의 적합한 장치, 예컨대 플레이트, 튜브, 접시, 플라스크 등에서 수행될 수 있다. 통상적으로, 상기 분석은 멀티웰 플레이트에서 수행된다. 수개의 시험 화합물들이 동시에 분석될 수 있다. 또한, 상기 시험 화합물은 다양한 기원, 성질 및 조성을 가질 수 있다. 이는 임의의 유기 또는 무기 물질, 예컨대 지질, 펩티드, 폴리펩티드, 핵산, 소분자 등일 수 있으며, 독립적으로 또는 다른 물질들과 혼합하여 사용될 수 있다. 상기 화합물은 예를 들어 생성물의 조합 라이브러리의 전부 또는 일부일 수 있다.

도 1a 및 도 1b는 S. japonicum 풍토 대상체로부터의 PBMC의 배양체 내의 IL-22 및 IL-17 수준을 나타낸다. 데이터는 19명의 대조군 및 70명의 풍토적 대상체로부터의 144h 휴지 및 알-자극된 배양체에서 획득된다. 도 1c는 풍토 대상체의 혈액으로부터의 IL22+ 세포의 FACS 분석결과를 나타낸다. 데이터는 20개 중 하나의 대표 실험으로부터 획득된다.
도 2a는 PBMC 배양체의 IL-22 수준이 지난 10년에 걸친 항-주혈흡충 치료의 횟수에 따라 달라지는 것을 나타낸다. 연구 대상체는 30세 초과 및 65세 미만이었고, 활성 HBV 감염이 없었다(HBS Ag-).
항-주혈흡충 치료: 대상체는 지난 10년에 걸쳐 하기의 투여방식에 따라 프라지콴텔을 투여받았다: 전혀 투여받지 않음, 1 내지 4번, 5 내지 10번, 10 번 초과.
대조군은 S.japonicum에 노출된 적도 없고, 프라지콴텔에 의해 치료받은 적도 없는 대상체이다. 별표: S.japonicum 알에 의해 자극된 배양체; 빈 원: 휴지 배양체. 각 군당 대상체의 수: 대조군(19), 치료: 비치료(9), 1 내지 4번(30), 5 내지 10번(23), 10번 초과(8).
도 2b는 간섬유증의 등급에 따라 PBMC 배양체의 IL-22 수준이 달라지는 것을 나타낸다.
연구 대상체는 30세 초과 및 65세 미만이었고, 활성 HBV 감염이 없었다(HBS Ag-). 대조군은 S.japonicum에 노출된 적이 없는 대상체이다. 별표: S.japonicum 알에 의해 자극된 배양체; 빈 원: 휴지 배양체. 섬유증 등급은 방법 항목에 기재된 바에 따라 평가되었으며, 대부분 중심 섬유증 등급이고, 주변 섬유증은 경증 중심 섬유증을 갖는 대상체를 주변 섬유증이 없거나 경증 주변 섬유증을 갖는 군(CLL), 및 경증 중심 섬유증 및 후기 내지 중증(GNM, GNH) 주변 섬유증을 갖는 군(CLL, GNM)으로 나누기 위해 고려되었다. 각 군당 대상체의 수: 대조군(19), CLL(23), CLL GNM(27), CLM(10), CLH(7), D,E,F(3).
도 2c는 다른 간섬유증 등급 및 다른 치료 횟수를 갖는 대상체의 IL-22 수준을 나타낸다. 연구 대상체는 30세 초과 및 65세 미만이었고, 활성 HBV 감염이 없었다(HBS Ag-). 대조군은 S.japonicum에 노출된 적이 없는 대상체이다. 대상체는 0 내지 4번(빈 원) 또는 5 내지 20번 이상(꽉찬 원) 치료되었다. 각 군당 대상체의 수: 치료군은 하기와 같이 집합됨: 각 지점당 대상체의 수를 증가시키기 위해 0 내지 4번의 치료 및 5번 이상의 치료.
대조군: 19; 0 내지 4번의 치료: 39; 5번 이상의 치료: 대조군: 31.
도 3a는 알-자극된 배양체의 IL-22, IL-6, IL-1β 또는 IL-23 수준에 대한 항-주혈흡충 치료의 효과를 나타낸다. 연구 대상체는 30세 초과 및 65세 미만이었고, 활성 HBV 감염이 없었다(HBS Ag-). 대조군은 S.japonicum에 노출된 적는 대상체이다. 연구 대상체로부터의 PBMC는 알에 의해 자극되었고, 시토킨은 24h(IL-1b, IL-23, IL-6) 및 144h(Il-22)에 상청액에서 평가되었다. IL-6 수준에는 0.1이 곱해졌다.
도 3b는 대조군 및 다양한 간섬유증 등급을 갖는 대상체로부터의 알-자극된 PBMC의 IL-22, IL-6, IL-1β 또는 IL-23 수준을 나타낸다. 연구 및 각 군의 대상체의 수는 도 2a와 같다.
도 4는 IL22RA2의 SNP 및 상관관계 빈(correlation bin)의 위치를 나타내는 지도이다.

본 발명의 추가적인 측면 및 이점들은 하기의 실시예에 기재될 것이며, 이는 예시적으로서 고려되어야 하고 본 발명의 범위가 이에 한정되어서는 안 된다.

실시예

실시예 1: 인간 주혈흡충 감염에서 IL -22의 제조 및 조절

인간 주혈흡충 감염에서 IL-22의 제조

본 발명자는 S.japonicum 감염에 노출된 140명의 대상체로부터의 PBMC의 배양체의 IL-22 수준을 앞서 주혈흡충 감염에 노출되지 않았지만 동일한 지역에서 유사한 생활조건에서 생활한 20명의 대조군의 배양체와 비교하였다(도 1a). IL-22는 72 및 144 시간에 노출된 대상체의 휴지(resting) 배양체에서 검출되었고, 배양체의 시간 0에 주혈흡충 알을 첨가함으로써 유의적으로 증가되었다. IL-22는 대조군 휴지 배양체에서는 144시간에만 검출되었고, 알의 첨가에 의해 증가되지 않았다. 본 발명자는 144시간 배양체에서 유의미한 IL-17A 수준을 검출하였으나, IL-17 수준은 알-자극(egg-stimulation)에 의해 증가하지 않았다(도 1b). 따라서, 배양체 내의 IL-22가 Th17에 의해 제조되었을 가능성은 낮다. 노출된 환자의 혈액의 IL22+ 세포의 FACS에 의한 분석은 IL-22가 CD3+CD4+에 의해 그리고 CD3-CD4-에 의해 제조되고, 이들 세포군 중 아무것도 IL-17을 제조하지 않았다는 것을 나타낸다(도 1c). 후자는 NK 세포일 것이다. 대조군 및 풍토 대상체에서의 CD3+CD4+IL17-IL22+ T 세포 및 CD3-CD4-IL17-IL22+의 비율은 도 1c에 나타난다.

IL-22 제조의 조절은 항-주혈흡충 치료에 의해 조정되고, 간섬유증에 따라 조절된다.

알-자극된 배양체의 IL-22 수준은 노출된 배양체에서 뚜렷하게 달랐다. 항-주혈흡충 프라지콴텔(Praziquantel) 치료는 벌레를 파괴하고 재감염일 일어날 때까지 알 생산을 중단시키기 때문에, 프라지콴텔 치료가 IL-22 제조를 조절할 수 있었는지를 평가하였다. 특정 환자는 최소 10년 동안 매년 치료되었고, 어떤 환자들은 치료를 받은 적이 없고, 어떤 환자들은 지난 10년 동안 1 내지 10번의 치료를 받았다. 도 2a는 프라지콴텔 치료의 횟수는 대상체 PBMC에 의한 IL-22 제조에 유의미한 영향을 가짐을 나타낸다: 알-자극된 배양체의 IL-22는 지난 10년에 걸쳐 치료의 횟수와 함께 유의적으로 증가하였고(p=0.005, 회귀 모델의 공변량(covariate)은 성별이었음 p=0.08); 그러나 이와 같은 효과는 매년 최소 1번 이상 치료를 받은 대상체에 대해서는 매우 작았고, 이는 아마도 이들 대상체가 재감염되었기 때문이다(하기 참조). 이때, 지난 10년에 걸친 프라지콴텔 치료의 빈도는 노출된 대상체로부터의 PBMC에 의한 IL-22 제조에 유의미하게 영향을 주었다.

본 발명자는 그 후 배양체의 IL-22 수준이 환자의 간 질병의 정도와 관련이 되었는지 여부를 평가하였다. 도 2b는 간섬유증 등급에 의해 측정시 경증 간 질병을 갖는 대상체에서 IL-22는 낮았고, 섬유증 등급이 증가함에 따라 점진적으로 증가하였으며, 후기 중앙 문맥주위 섬유증(advanced central periportal fibrosis)을 갖는 대상체에서 최고 수준에 도달하였다는 것을 나타낸다. 이는 중증 간질병에 대한 반응으로/중증 간질병과 공동으로 IL-22의 증가된 제조가 일어날 수 있음을 시사한다. 그러나, 놀랍게도 매우 중증 간섬유증(HF 등급 D,E,F)을 갖는 환자로부터의 IL-22는 많은 IL-22를 제조하지 못했다.

이와 같은 패턴의 프란지콴텔 치료의 수의 효과는 도 2c에 나타난다. 프라지콴텔 치료는 모든 섬유증 집단으로부터의 세포에 의해 제조된 IL-22에 영향을 주었다. 3가지의 관찰결과가 우리의 연구에 가장 관련이 깊다: 첫째, 후기 섬유증(CLH)에서 증가된 IL-22 제조가 다른 프라지콴텔 치료 횟수에서 관찰되고, 이는 이와 같은 화자의 치료의 빈도의 차이 때문이 아님; 둘째, 프라지콴텔 치료는 모든 배양체에서 IL-22 제조를 개선시켰지만, 중증 섬유증 등급을 갖는 대상체로부터의 세포의 배양체에서는 개선시키지 않음; 셋째, 높은 프라지콴텔 치료 횟수(10번 초과, 매년 적어도 1번)를 갖는 대상체는 경증 섬유증 군에 있고 이와 같은 군에서 관찰된 IL-22 제조의 증가를 고려함. 요약하면, IL-22는 2개의 독립적인 요소인 프라지콴텔 치료 및 간 질병의 정도에 의해 영향을 받는다. 더욱이, 매우 중증 간 질병을 갖는 대상체는 많은 IL-22를 제조할 수 없고, 이는 프라지콴텔 치료에 의해 개선되지 않았으며, 반면 동일한 치료는 경증 내지 후기 간섬유증을 갖는 대상체에 의한 IL-22 제조에 증가 효과를 나타내었다.

IL-6 및 가능하게는 IL-1β는 다른 간섬유증 등급 및 다른 치료 횟수를 갖는 대상체에서의 IL-22 제조의 주요 조절인자가 될 가능성이 높다.

본 발명자는 노출된 대상체로부터의 PBMC의 24시간 배양체에서 알-자극에 의해 시토킨 IL-6, IL-1β 및 IL-23이 유의적으로 증가되었다는 것을 관찰하였다(IL-23(p=3.10-6), IL-6(p<10-6) 및 IL-1β(p<10-6)). 이들 3가지의 시토킨 중 어느 하나가 IL-22 수준을 조절하는 역할을 할 수 있는지 측정하기 위해, 이들 3가지의 시토킨, 환자 나이 및 성별을 포함하는 알-자극된 배양체의 IL-22 수준에 의해 선형 회귀 분석을 수행하였다. 이와 같은 분석은 IL-22와 IL-6 사이의 매우 유의적인 연관관계(p=0.0002), 및 IL-1β와의 약한 연관관계(p=0.06)를 나타내었다. IL-23은 회귀모델에서 제외되었다. 상기 결과는 프라지콴텔 치료(도 3b) 및 간섬유증(도 3c)에 의한 IL-6, IL-1β 및 IL-23의 변화를 나타내는 도 3b 및 도 3에 나타난다. 따라서, 프라지콴텔 치료와 IL-22 사이의 관계, 및 섬유증 등급과 IL-22 사이의 연결고리한 최소한 부분적으로 IL-6이다.

상기에 나타난 결과는 보호적인 IL-22 반응의 보충이 간손상에 의해 증가하였고, 가장 중한 간 질병은 부분적으로 이와 같은 반응을 보충할 수 없는 무능력으로부터 일어난다는 관점과 일치한다. 이와 같은 가정을 추가적으로 실험하기 위해, 본 발명자는 IL-22는 사실 간섬유증의 제어에 매우 중요하고, 간 질병에 유의적인 영향을 갖는다는 유전적 증거를 찾았다.

실시예 2: S. japonicum 의 풍토지역에 사는 중국인 어부 및 농부의 2개의 샘플에서 IL22 BP 를 인코딩하는 IL22RA2 의 다형은 간섬유증에 연관됨.

재료 및 방법

통계적 분석

주혈흡충에 의해 감염된 대상체에서 질환 진행에 영향을 미치는 것으로 알려진 주요 공변량들을 포함하는 유전적 변이체와 섬유증이 발생된 개체의 확률 사이의 관계를 분석하기 위하여, 다변량 로지스틱 회귀가 사용되었다. 이러한 분석을 위해, 통계적 SPSS 소프트웨어(10.0 버전)가 사용되었다. 연령, 성별, 및 감염에 대한 노출이 회귀 모델에서 테스트되었으며, 이들이 질환과 연관을 보여줄 때(p<0.05) 유지되었다. 집단은 성별과 연령에 대해 매치되었기 때문에, 이러한 공변량들은 유전적 변이체와 질환 사이의 연관에 대해 거의 영향을 미치지 않았다. HBV에 의한 감염 및 감염에 대한 노출은, 이러한 공변량들이 중국인 어민들(노출, 치료 횟수) 또는 중국인 농민들(HBV 감염, 출생 장소)에서와 같이 정확하게 평가될 수 있을 때, 회귀 모델에 포함되었다.

DNA 추출

5 내지 15 ml의 혈액의 분취량은 시트르산나트륨에서 수집되고, -20℃에서 유지되었다. DNA는 표준 염석 방법(Sambrook et al., 1989)을 사용하여 추출되었다.

DNA 증폭

FTA 카드로부터 정제된 모든 DNA는 유전자형 분석 이전에 사전증폭되었다. 폴리머라제 연쇄반응(전체 게놈 증폭)은 일 펀치(one punch)의 생물학적 샘플(FTA1-결합 구강 세포 DNA) 또는 100 ng의 게놈 DNA를 함유하는 50 μl의 반응물, 1.5 OD의 15-염기 완전 퇴화 랜덤 프라이머(Genetix, Paris, France), 200 mM dNTP, 5 mM MgCl₂, 5 ml의 10x PCR 완충액, 및 0.5 유닛(unit)의 고신뢰도(high fidelity) Taq DNA 폴리머라제(BIOTAQ DNA Polymerase, Bioline London, England)에서 수행되었다. 샘플은 하기에 따라 멀티블록 서모사이클러에서 증폭되었다: 94℃에서 3분의 사전-변성 단계, 94℃에서 1분, 37℃에서 2분, 경사로(37-55℃)에서 1분, 및 55℃에서 4분으로 이루어진 50회 사이클. 72℃에서 5분의 최종 신장 단계.

시퀀싱

정제된 PCR 산물은 ABI Prism 자동화 서열분석기에서 ABI Prism BigDye Terminator 사이클 시퀀싱 시스템(PE Applied Biosystems, Foster City, U.S.A.)을 사용하여 서열화되었다. 시퀀싱 반응은 GATC biotech(GATC, Marseille France)에 의한 양 가닥 시퀀싱에 대해 수행되었다.

특이적 TaqMan 프로브에 의한 PCR 을 통한 다형 유전자형 분석( genotyping )

대립유전자의 구별은 TaqMan 프로브 분석(Applied Biosystems, Lafayette USA)을 사용하여 평가되었다. 각각의 반응물은 전체 부피 5 μl 중 12.5 ng의 게놈 DNA, TaqMan Universal PCR Master Mix(Applied Biosystems, Lafayette USA), 900 nM의 각각의 프라이머, 및 200 nM의 각각의 형광-표지된 하이브리드화 프로브를 포함하였다. RT-PCR은 하기 조건을 사용하여 ABI Prism Sequence Detection System 7900(Applied Biosystems, Lafayette USA)에서 수행되었다: 2분 동안 50℃, 10분 동안 95℃ 및 40회 사이클의 증폭(15초 동안 95℃ 변성, 1분 동안 60℃ 어닐링/신장).

결과

본 발명자는 10%를 초과하는 중국인에게서 마이너 대립유전자 빈도를 가졌던 유전자의 3' 및 5'의 IL22RA2(29.7 Kb) 및 10 Kb에 포함되는 SNP를 HapMap 데이터 베이스에서 선택하였다. 이와 같은 SNP들은 도 4와 같이 위치된, n= 10(빈 I), 5(II), 2(III), 3(IV), 13(V) 및 3(VI)를 포함하는 6개의 상관관계(r²=0.8) 빈 및 4개의 단독 계체에 분류되었다. 본 발명자는 S.japonicum이 최소 40년 동안 풍토적이었던 둥팅호에서 최소 20년 동안 어업을 해온 중국인 어부(n=268, 경증 HF를 갖는 176명의 대상체 및 중증 HF를 갖는 92명의 환자)의 샘플의 각 빈으로부터 1 또는 2개의 SNP를 유전자형 분석하였다. 이들은 2개의 빈에 속하는 3개의 SNP가 HF와 연관된다는 것을 발견하였다. 모두 빈 I에 있는 SNP rs6570136 GG(p=0.007, OR=2.7(CI=1.3-5.6)) 및 rs7774663 TT(p=0.006, OR=2.5(1.3-4.7))와 rs7749054 TT(p=0.045, OR=1.8(1.1-3.1))는 HF와의 어떤 연관관계를 나타내었다(표 3). 통계 모델에 도입된 유의적인 공변량은 성별(p<10-3, OR=6.9(2.8-17)), 노출(어업의 연수)(p=0.05, OR=1.02(1-1.05)), 비장절제술(splenectomy)(p=0.008, OR=6.6(1.6-27))이었다. 동일한 공변량이 존재하는 동일한 모델에서 동시에 2개의 SNP를 실험하는 다변량(multivariate) 분석은 rs 6570136(p=0.007 OR=2.9(1.4-6))의 존재하에서 실험하였을 때 SNPrs 11154915 TC가 연관된다는 것(p=0.04, OR=1.9(1-3.5)을 나타내었다. 흡미롭게도(수단인 및 브라질인의 연구 참조), SNP rs 2064501은 다른 SNP가 회귀 모델에 도입되었을 때 감소되지 않은 HF와의 연관관계에 대한 경향을 나타내었다.

마지막으로, rs7749054의 연관관계는 빈 I의 SNP와 이의 LD 때문일 가능성이 높았는데, 이는 HF와의 rs7749054의 연관관계가 SNP rs6570136 또는 SNP rs7774663의 존재하에서는 완전히 없어졌기 때문이다.

본 발명자는 그 후 S. japonicum에 대해 풍토적인 지역의 농부로부터의 두번째 중국인 샘플에서 이와 같은 결과를 모사하려고 하였다. 상기 샘플은 복수, 정맥류 출혈 및 강경변을 포함한 중증 간 질병을 치료하는 외래 환자 진로소로부터 병원에 기반하여 모집되었기 때문에 어부와는 다르다. 모집된 환자 중 92.2%는 S.japonicum이 여전히 풍토적인 지역에 살고 있었고, 7.8%는 주혈흡충 풍토 지역에 살았지만 그들의 지역에서 전염이 15 내지 20년 전에 차단되었다. 이들 대상체 중에 일부(86.5%)는 앞서 HBV 감염(20.9% AgHBS+)된 증거가 있었고, 1명의 환자는 HCV에 의해 감염되었었다. 따라서, 이와 같은 두번째 샘플 중 대부분의 농부의 간 질병은 주혈흡충 및 HBV 감염 모두로부터 일어났을 것이다.

어부 샘플에서 실험된 모든 SNP는 농부 샘플(298명, 경증 간 질병을 갖는 97명의 대상체 및 중증 간 질병을 갖는 201명의 대상체)에 대해 유전자형 분석되었다. 간 질병의 연관관계는 3개의 다른 빈으로부터의 4개의 SNP에 의해 관찰되었다: 모두 빈 I에 있는 SNP rs6570136 GG,GA(p=0.009, OR=2(1.2-3.3)), rs7774663 TT,TC(p=0.01, OR=2(1.2-3.3); 빈 IV에 있는 SNP rs 276466 GA(p=0.01, OR=2.2(1.2-4)); 빈 V에 있는 SNP rs1114915 CC,CT(p=0.04, OR=5.7(1.1-29.6))(표 4). 또한, 연관관계에 대한 경향이 빈 III의 SNP rs202563 AA,GG(p=0.06) 및 SNP rs2064501 CT(p=0.08)에 대해서 관찰되었다. 이와 같은 연관관계 실험의 곤변량은 나이(p=0.05, OR=1.03(1-1.06)), 성별(p=0.02, OR=2.3(1.1-4.8) 및 환자가 풍토적/비풍토적 지역 중 어디에 살았는지(p=0.09, OR=2)이다.

다른 빈으로부터의 SNP에 수행된 다변량 분석은 2개의 가능한 통계적 모델을 나타내었다: 하나의 모델은 빈 I의 SNPs rs6570136(또는 rs7774663)(p=.03, OR=1.8(1.1-3)) 및 빈 V의 SNP rs11154915(p=0.1, OR=4 (0.8-21.2))를 포함하였고; 다른 모델은 SNP rs 276466(p=0.02, OR=2(1.1-3.8)) 및 SNP rs11154915(p=0.05, OR=9.2(1.1-80))를 포함하였다. 상기 분석은 이와 같은 2개의 모델을 구별할 수 없었다.

실시예 3: 시스토조마 만소니에 노출된 수단 및 브라질으로부터의 인구로의 연관관계의 확장

우리의 관찰결과가 S. mansoni에 의해 감염된 대상체에도 확장될 수 있는지 평가하기 위해, 수단 및 브라질로부터의 샘플의 동일한 SNP를 실험하였다. 중국인 농부에서와 같이 수단인 샘플의 대상체 중 유의적인 일부가 또한 HBV에 의해 감염되었으며, 반면 매우 소수의 브라질인 만이 HBV 감염을 가졌다.

수단인 샘플(n=202, 144명의 경증 HF 및 58명의 중증 HF)의 유전자형 검사는 SNP rs6570136 GG(p=0.01, OR=3.1(1.3-7.2)), rs7774663 TT,TC(p=0.01, OR=1.7(1-3.1), rs11154915 TT(p=0.05 , OR= 6.2(1-35.3))가 HF와의 연관관계를 나타내었고, 반면 연관관계에 대한 경향이 또한 SNPrs7749054 TT(p=0.07, OR=2(1-3.6)) 및 rs2064501 CC(p=0.06, OR=2.7 1-7.3))에 대해 검출되었다는 것을 나타내었다. 표 5 참조.

유사하게, 브라질인 샘플(n=161, 119명의 경증 HF 및 42명의 중증 HF)의 동일한 SNP의 유전자형 검사는 SNP rs6570136 GG(p=0.0001, OR=6(2.4-14.7)), rs7774663 TT(p=0.03, OR=3(1.4-6.8)) 및 SNPrs7749054 TT(p=0.03, OR=2.8(1.2-5.6)에 대해 HF와의 연관관계를 나타내었다. 더욱이, rs11154915 TT,TC는 HF와의 연관관계(p=0.14 , OR=2.4(0.9-6.5))에 대한 경향을 나타내었다. 표 6 참조.

수단인 샘플에서 수행된 다변량 분석은 SNP rs6570136, 20564501 및 11154915의 독립적인 연관관계를 입증하였다. rs11154915와 연관된 높은 OR이 다변량 모델에서 입증되었다는 점이 가장 놀라웠다. 더욱이, 양 SNP모두에 대해 악화되는 유전자형을 갖는 대상체는 양 모델 모두에서 25를 초과하는 OR을 가졌다. 다변량 분석은 SNPs rs7749054의 연관관계는 SNP rs6570136이 존재하는 경우에는 없어졌으며, 이는 상기 연관관계는 SNP rs6570136와 독립적이지 않다는 점을 입증한다.

요약하면, 동일한 상관관계 빈에 속하는 SNPs rs6570136 GG 및 rs7774663 TT는 실험된 4개의 샘플 모두에서 HF에 연관되었다. SNPrs11154915 TT, CT 및 rs2064501 CC는 모든 샘플에서 HF와의 연관관계에 대한 경향을 나타냈고; 더욱 중요하게는, 이와 같은 경향은 상기 SNP들이 SNP rs6570136과 독립적으로 작용한다는 점을 나타내는 다변량 분석에 의해 입증되었으며; 이는 이들 2개의 SNP가 HF와 SNP rs6570136의 연관관계의 강도를 증가시켰음을 고려하였다.

실시예 4: IL22RA2 의 SNP 와 항- HCV 치료 사이의 연관관계

본 발명자는 이들은 유전자 분석을 HCV 유전자형 1 또는 4에 의해 감염되었었거나 감염된 123명의 대상체(리바비린 + IFN에 의한 치료에 대한 69명의 반응자, 54명의 비반응자)에 대해 수행하였다. 이들은 Hapmap 데이터를 사용하여 IL22RA2에서 동정된 7개의 빈 각각의 하나 이상의 SNP를 실험하였다. 일변량 분석이 NP rs2064501(빈 VI, p=0.013) 및 SNP rs1543509(빈 VII, p=0.012)와의 연관관계를 나타내었을 뿐만 아니라, 가능성 있는 SNPs rs7774663, rs6570136(빈 I, p<0.13), SNP rs77449054(빈 II, p=0.1), SNP rs202563(빈 III, p=0.07), SNP rs28366(빈 IV p=0.15) 및 SNP rs2064501(빈 VI, p=0.2)과의 연관관계를 시사하였다. 치료에 대한 반응과의 가능성 있는 연관관계의 SNP의 수가 많은 점은 실험된 SNP들 사이의 상관관계 때문이었을 수 있고, 또한 이는 다른 SNP들이 서로에 대해 교략 효과를 가할 수 있었다는 점을 시사하였다. 그 후, 다변량 분석이 순차적으로 수행되었다.

모든 SNP들을 2개씩 실험한 것은 치료에 반응하여 SNP rs202563 및 rs6570136의 연관관계는 동등하였지만, SNP rs276466 및 rs28366는 SNP rs6570136에 의한 회귀 모델로부터 분명하게 제외되었다는 점을 나타낸다. 모든 실험은 치료에 대한 반응과의 SNP rs1154915의 연관관계는 회귀 모델의 다른 SNP(예를 들어, SNP rs6570136 또는 SNP rs2064501 또는 SNP rs1543509)의 존재에 의해 강화된다는 점을 나타내었다. 치료에 대한 반응과의 rs6570136의 연관관계는 SNP rs2064501 또는 rs1543509가 존재하면 사라졌지만, SNP rs11154915가 모델에 첨가되는 경우에 다시 일어났다(모델에 3개의 SNP). 이는 SNP rs11154915와 SNP rs6570136(또는 빈 I의 다른 SNP) 사이의 강한 연관불균형 때문이고, 결과적으로 SNP rs1154915 TT 반응자 유전자형은 빈 I의 비반응자 유전자형과 100% 연관된다. 따라서, 상기 모델은 적어도 3개의 SNP(rs11154915(p=0.03), rs7774663(또는 rs6570136, p=0.03) 및 SNP rs2064501(p=0.001)를 포함하여야 한다. 마지막으로, SNP rs1543509 및 빈 I로부터의 SNP(p=0.15)가 또한 상기 모델에 도입된다.

요약하면, 본 발명자는 IL22RA2의 4개의 다른 빈에 속하는 SNP들은 치료에 대한 반응과 독립적으로 연관된다는 점을 발견하였다. 중요하게는, TagSNP를 실험하여 획득된 이와 같은 결과는 동일한 빈의 임의의 SNP에 확장될 수 있다. 이때, 빈 I, V, VI 및 VII의 전부 또는 대부분의 SNP가 IFN + 리바비린 치료에 대한 유전자 마커임이 예측된다. 또한, 동정된 상기 빈들 중 3개는 섬유증 진행과 연관되었다는 점을 볼 수 있다(빈 VII의 SNP들은 섬유증에 대해서는 아직 실험되지 않음). 흥미롭게도, 감섬유증을 악화시키는 대부분은 유전자형은 치료에 대한 더 뛰어난 반응과 연관된다.

참고문헌

Bedossa P., Poynard, T. The METAVIR cooperative study group. An algorithm for the grading of activity in chronic hepatitis C, Hepatology 1996; 24:289-293.

Dessein, A. J., D. Hillaire, N. E. Elwali, S. Marquet, Q. Mohamed-Ali, A. Mirghani, S. Henri, A. A. Abdelhameed, O. K. Saeed, M. M. Magzoub, and L. Abel. 1999. Severe hepatic fibrosis in Schistosoma mansoni infection is controlled by a major locus that is closely linked to the interferon-gamma receptor gene. Am J Hum Genet 65:709.

EASL Clinical Practice Guideline: Management of hepatitis C virus infection, J Hepatol. 2011; 55:245-264

Fried MW et al; N Engl J Med. 2002; 347(13):975-82

Mohamed-Ali Q, Elwali NE, Abdelhameed AA, Mergani A, Rahoud S, Elagib KE, Saeed OK, Abel L, Magzoub MM, Dessein AJ. Susceptibility to periportal (Symmers) fibrosis in human schistosoma mansoni infections: evidence that intensity and duration of infection, gender, and inherited factors are critical in disease progression. J Infect Dis. 1999 Oct;180(4):1298-306. PMID: 10479161.

Parkes J, Guha IN, Roderick P et al. Performance of serum marker panels for liver fibrosis in hepatitis C. J Hepatol 2006; 44: 462-474.

Sebastiani G, Vario A, Guido M et al. Stepwise combination algorithms of non-invasive markers to diagnose significant fibrosis in chronic hepatitis C. J Hepatol 2006; 44: 686-693.

Testino G et al; Hepatogastroenterology 2011; 58(106):536-8

Ziol M, et al. Noninvasive assessment of liver fibrosis by measurement of stiffness in patients with chronic hepatitis C. Hepatology 2005; 41:48-54.

SEQUENCE LISTING <110> UNIVERSITE D'AIX-MARSEILLE <110> INSERM (Institut National de la Sante et de la Recherche Medicale) <120> Fibrosis susceptibility IL22RA2 gene and uses thereof <130> IP20142391FR <160> 39 <170> KopatentIn 2.0 <210> 1 <211> 4000 <212> DNA <213> Homo sapiens <220> <221> allele <222> (2000)..(2000) <223> y = c or t <400> 1 acatgacaag gccagagaaa acagaaaggc agaaagagaa gccaaaagag ctgcaatgac 60 agcgataact aagaaggaag aggaaaccct taccatgccc ttattggagc ttcctcttac 120 agaaccccct aactactcct ctaatgaaaa ggcttggttt gagcaggaaa gtggaagtta 180 ccagaaagga agttggtgga agttctcaaa tgggaggctc gccagctatc ccagaagcaa 240 tagcccctgg ttcataaaac agtttcatca aggaacacat atgggaaaaa ctgcattaga 300 gactcttgta ggatggcatt tctattgctg agcctaactg ccatcactcg agccatttat 360 gagtaatgtt taacttgtgc cccaaacaat ccacagcagg ggccaacatg gcccccaggg 420 attcaagaaa ctggagctac accctgtgaa aacctgcatg tgggctttac tgagctgcct 480 cgaaccggag gctaccggtg catgctagtg tttgtctgca ctttctcagg gtgggttgag 540 gcatttccca ccaggacaaa gaaagctcgg gaagtaacca gaatcttact aaaggacatt 600 attcctagat ttcgactgcc tctaacttta ggatcagaca atggcccagc atttgtggca 660 gaaatagtac aacagctaac acagaggtta aaaatcaaat gaaaactgca tacagcttat 720 cacccataga gttctggaaa gttgaaagaa taaaccggac actcaaacag ccgttaaaaa 780 agttttgcca tgaaactcat ctaagatggg atcaggtgct gcccatggtc cttctctgag 840 tcaggtgcac ccctactaaa ttaactgggt attcacccta taagatagtg tttggccgac 900 accctgatca taactcagat aaacggggat ttaaaaaatt ggggaattaa ccttaagaag 960 gcaaatgcaa gccttaggtg aggtctcgca ggaaatgcaa ggatgggtaa gagaaagaat 1020 acctgttagc ctcacagatg cagtacaacc cttctaacct ggagactctg tctgggtcaa 1080 acaatggaac ccaaccactt tagggccttt atgggatagt ccccatattg tgatcttgtc 1140 tactcccact gctgttaaag ttgcaggtat cataccttgg gttcatcata gccggctgaa 1200 accagaagca gccaccaccc aggaccagtg gacaagtcaa caaaacccag accactcaac 1260 atggctgatc ctgtggtgaa accaagccac tgctgacaag gacaactgcc ctgcttcaac 1320 cacaccagag gctggttggt ccacgcacgg ctgaagcttg aggaaacatc gagccctgtt 1380 ctagtcacac aaatggaagc tgactagtct atgcatggct gaagcctgag gaagtcaatg 1440 atacataagt aaatgtagac taaatttaca aacatagtta tactcttact tgtagtaatt 1500 attttgctgt catgttatct ttgcaaatgc tgccaagctt gttgcccaga aaggtgccca 1560 tgcatagtat aagtttaatc atattagtaa tactgaagcc actgacactt tcacctatgg 1620 ttataaaagg ggaccaggat gactgtcatc actgtatgat agaagcctgg tctggaaaag 1680 gtgtgactaa aactctgtta taccagacct actatgagtg tacagggact catacaggaa 1740 cttgttgttt ataaccagac taattactca gtctgtgatc ctggaaacgg gcagccccaa 1800 atatgttatg acccagagtt cttgccctat gacttcttat ttgaagtcca aatttggtga 1860 acccctaatg ccatcatata caaaccccac agaaactggg gtcagtaaac ttgtaaacaa 1920 aacgcaagta ttcacttacg cgcataaagg gcccgtctcc atatattttg atgcctgcca 1980 agctgcacat ctcagtaaay taaataatat ttggaccatc tgtaaaaatc taggacaaga 2040 aagagtcagc agcagagcca ccaaggccat aataggagag tccgaaaaag agtgccctga 2100 ttgtgataat cagtggacca cacatgaatt taatcagcac ctatacactg gaagggctgc 2160 tctgtttgcc agccaagagg agaagatagg gtacacaact ggaacatgct acccactcaa 2220 tctgacaata ctaaagccaa atatgacttt ctggactaaa gggcataaag gattactaac 2280 ctttgatcag gcaggagctc tcctaggact tggtattcct ctggtcatca caaagaaaac 2340 ccaaaggact caagttcaac ttagcccaat acaacagttc aggttttata aatctttcaa 2400 tgaacacttt aattctgaag tatcaaaaat tcaaattcct cctatatcaa ctgaaaatct 2460 gtttgtccag ctagccaaaa gtattgctaa caatttagga gttacttcct gttatgtatg 2520 tggaggtgct aatatgagag atcaatggcc ctgggaagcc agagaattga tgctgcaaga 2580 caattttacc ttgcctgaat ttgttacaaa attcaatgca aatccaagtg tttggctatt 2640 aaggaacccc atcattggaa aatactgtat tgcctgttgg ggcaagtcct ttcagaacca 2700 gataggggaa acaacttgcc taggtcaaca atattttgaa gaatctgaga acagaacaca 2760 atggagaagc tttatagatg attcctctgt gtcactttaa tccctttttg cagttcccaa 2820 cactaaatca atcatggtac caattagaag ctccaactgt ttggagagca cctgcaggat 2880 tatataggat ctgtggaaca aaggcttatc aattactaac cgataaatgg acaggggcat 2940 gtatattagg aacaataagg ccattctttt tgctactccc cctgcagcaa ggggaagatc 3000 taagctatct ggtctatgat gaaggcagaa aaagagtcaa aagaaatgtg tttacaaaaa 3060 taagtactga ggaaaaaata aatactaaca ttaaaaagga cattgaaata gggggctgga 3120 aagataatga atggccccct gggcacaaga tgggtcatgg ggatactgta ctcctattta 3180 tatgttaaac cacatcataa ggttgcaagc agttctggaa attatagtca atgaaacagc 3240 ctgagcctta gacttgctag ccatacaggc aacccagatg agagatgcca tttatcagaa 3300 caggttagta ctgaattatg ttttagcttc agaagggggt ttgtggaaaa cttaatttaa 3360 caaattgctg cttacaaatt gatgacaatg gaaaagctgt catggaaatc actgccagga 3420 tgcggaagtt agctcatgtt ctggttcaga catggtctgg ttggaacccg agttcactct 3480 ttggaggacg gttttcatgg tttggaggct ttaaaactgt aatactaggc tttgtggcca 3540 taaaaggtgg atgcctactg cttccctgtc tcttgccatt tctaatcgga agcatccaat 3600 ccaccataga ctcaatggta gacagacata ccaccatccg aataaaggct ctgcaaaagt 3660 accaactggt atcccaagat gagtatgtac ccactcaaga agaaatagct aactgtggtg 3720 ctctttatta atctacattt gtgtcgagca ccaaaagggg gaaatgaaga aggaattaat 3780 gaaatcaact ataacctaag agtagtagta atacaaattt taaaatcctt ttaaagttcc 3840 tgcaaaatgt gacccctgcc ttacattcac gttaaaaggg aatattaaca gcctgtcttc 3900 tctctgtgga cagtggacct tatctatact ccccaactcc acattcctca aagtttatta 3960 caggcccagt gagttcctgc atgactgcag ggtcacaaga 4000 <210> 2 <211> 1001 <212> DNA <213> Homo sapiens <220> <221> allele <222> (501)..(501) <223> r = a or g <400> 2 taactgttga aattgggtgt caggtttatt atactctact tttgtatgta cttaaaattg 60 ttcataacaa agaaaaaaga tttttaaagt ttatctacaa gatgtggcca gacacggtgg 120 ctcacacctg taatctcagc actttggaag gcggaggtgg gtggatcatt tgaggtgtgg 180 agttccagac cagcctggcc aacatggtgc aaccccgtct gtactaaaaa tacaaaaatt 240 agccaggcgt gacggtgtgt gcctgtaatc ccagctactc agtggggctg aggcaggaga 300 attgcttgag tcaaggaggt gaggtttgca gtgagccgag atcgcgccac tgcgctccag 360 tctgggcagc gataaagcga gagtccatct caaaaaaata aataaataaa taaataaagt 420 ttacttacca gatgctgtct tccttttggt aattttaatg ccattttagt gtcaataata 480 agatctaata attatgggac rccatgttat gtttttccca tattttgtct ttgttaatcc 540 tcttatgaag tctaggagat tggtattatt attcatttga tgttacagat gaagaaactg 600 agacatagat agagaggtgg agagaacttg accagggctc tatagcgagt agtggtaaag 660 tgagggctga aatcagatct ggttagcctc agggcctgag gagtattatg aaactcctct 720 tgtgttattc tttgcttgta atagacattc cataaaggga tagaatgatg tcaaagaaca 780 tttgtccatt ggcttctcga atcgtttatt cagtcaaaca aatgtttatt gagcaactgt 840 tatatgccag gcactgtgtt agacatcggg gatgcagaaa tgaacaagac tacagagcca 900 gccctcaggg aaccaacagc attttcttca accaggtctt ggtagcaaag ggctaagtgt 960 ttcttattgt ttttcagaga agtgtttaaa aactggtgtt c 1001 <210> 3 <211> 818 <212> DNA <213> Homo sapiens <220> <221> allele <222> (501)..(501) <223> y = c or t <400> 3 ccatgggaag gattccaacc ttcttccaca tccatgttcc ttgcttagcc caacaagacc 60 ctggcagagg ctcctgccca agggccatgc tgggccttgg gctcccctct cggcccttag 120 ctggctcctt gtcctctgag ctgcacttgt tccagcctga ggcatccctc cctcccaccc 180 ttcatccaca agaccccagc yctgcctcct caatgtttta tttgcattct gagttcctac 240 tatattgtat tcccaagaca tatctcttct aaatttctaa attacagtaa aacaacttct 300 aaatttcatg tgtgatatgg tttggctgtg tccccaccaa aatcttgtct tgcattgtag 360 cttccataat ccccatatat tgtgggaggg acctggtggg aggtaaatga atcatggggg 420 tgtttttttc ccatgctgtt ctcatgatag tgaataagtc ttacaagatc tgatgatttt 480 ataaagggca gttcccctgc acacatctct tgcctgccac catgtaagac gtgcctttgc 540 ttctcctcct tctgccatga ttgtgaggcc tacccagtca tggggaactg ttaatccatt 600 aaacctcttt ttatttataa attacccagt cttgggtatg tctttattag aagtgtgaga 660 aaggactaat acactgtgcc tcagtttcct cactggaaaa aaatgtataa tactagtctt 720 accagatagc taggagtgtc aataagagaa actttgccaa ccatctgcct atagtagagg 780 ctcaggcgca ttagttctcc ctcccatttc tttccact 818 <210> 4 <211> 7142 <212> DNA <213> Homo sapiens <220> <221> allele <222> (1706)..(1706) <223> k = g or t <400> 4 tgagcagggg gcacagcaaa gccccaaggc tgaggccaga tgaaggagca ggaggcaatg 60 tggctggaga ggagggagca aggggcagag tgttggtggt gaggtcaggg gcccagcagc 120 ctgatccagg ggacttgaac aggatggaag gactttgggt gcgttctgaa gaaggggaag 180 ccactggaag gcattaagta gaaaaaattg gaagtgagag taattatatg tgaaagttgt 240 tagagtcaca atggagtgac gatgaggcag gacaggtagt caaggaagta agtgcagtta 300 acacaatgag ccccagtatt cgcattgtaa tccagctcat gcaagcacag ctatctcctg 360 cagggaatat ttcccataga cagcatttgc actttgattt tacctcttct caaacggacc 420 ctgttctcat gataatagta aaaaacacac ccctaggtgg agatttaaga tgctgatgaa 480 ttatgagatg tatgaacaag catgtacagc tactgcacat gtgcacccag aggaccaccg 540 aggacatgct tactagcaac accttttctc accctcttat gaataatcat gtaagagtcc 600 cataaaagga tttctccagc aataatcagt gctgtccatt cagtggctca tgcctgtaac 660 ccagcacttt gggaggccga ggtgggtgga tcacctgagg tcaggagttt gagaccagcc 720 tggtcaacat ggtgaaacct cgtttctatt aaaaatacaa aaaaagtagc caggtgtaat 780 ggcacatgcc tgtaatccca gctacttggg aggctgaagc aggagaactg attgaacctg 840 ggaggtggag gttgcagtga gtcatgactg tgccactgca ctccagccaa cagagtaaga 900 ctctgttccc cctcggcccc ctgcaaaaaa aaataataac aatgataaga ggcaagatca 960 atggccacca aaattttatt ttttcccata gcgttgctgg ggtggcatgg ctgcctgccc 1020 tgggttcatc ctgtccctaa gtggaactcc ctatggctga gggactcaga atcaaatgac 1080 ttatagccaa ttaaatgttc tagtccagat gcccaattaa atgggcatgg acagacattc 1140 attagccttt aaattatttt ctaagtaaaa agtcaacaaa caaaaagtta aaggtgaggt 1200 tacaaaactg acttttcttt aacttctatg ctactgtaat cttgggtttt gttatggact 1260 tatagcaatt atttatacaa aacataagaa ttgttctgaa aaaattaaaa aatatatacc 1320 tgcatggctc ataactggaa atattatacc aggaggcttt gtcacttggt atctttatcc 1380 ttttacttat tattttcttt taattctaca ggaagcagta aattctttat ggttggagtg 1440 gatgaagagg tgccatgtaa tagctcagaa ggcaaagtcc cttgttttac cagctgttta 1500 ggcatccatg tactcatcct tgatttgaag ggtttgagtt aattctatcc ttccaaatca 1560 gcccttacaa tctcacgtgc ccacctcttc tgcaacagtc tctgggccta gagggaggac 1620 gcttgcaata caggattttt tgcatgttcc cagtggctcc accccattct cccagtgcac 1680 atgcaggccc ttagtctgaa cccackctac attgatttat ttcccttact gagcatgtgt 1740 taagggatgg aatttttcac catgggcatg tttaggcaag ccccctgtac acaatgtcct 1800 ggatggcatt tggctgtctt ctgcctctat cattccccca tctaaaagag tacatctaac 1860 tgccattaga ataaggataa gaagaaagac aaagacccat cttaactgct ttctgctgac 1920 agagggcact gttttggaaa gacagcagtt gggtctccct cagaggccta tctaagggta 1980 tctggtaaaa gggaccatca ttcgaggctc tggttgcata actgtttgga gtttgagggc 2040 ctgaaggcga gaagagacaa accaggttat tagaagacat gtaccaaaat gaaatggggg 2100 aagggtaagg acagttcaaa aatcctgagg ctgctgacat gcccagataa ctggtagctg 2160 tagttgtgcc tgctaagatt tgggtgcatg ggacttggct ttggttagct cccgtagttt 2220 attttcccaa aaaagaaacc tctgggttat gggcacccta tttactccca ttatctggca 2280 ggatttgtag gataattgtt cagaactaga atactgttcc agatttttac attacccatg 2340 ccttttgttt cttctgagct gcagccagag atcactggtt agttcacagg aataagcagg 2400 gttaatttaa aatgtaggca aaaaacttaa aaacaactaa tgagtctaga atttaatgac 2460 aaatgtatga taagttttga aacataattt ctttctcccc agtcctcatt tttgttaaaa 2520 acaaatcata ataggagtga gttgtttgta aaataaactt tagtcttaca cttggtctgc 2580 ttatttgcac aaagtacaac aagaataatt atttttacat aggcttttta aattggcttt 2640 gatggaactc tgttccacaa ggaatttcag ataggacttc ataaaaatga gcccagccat 2700 gggtttgtac cctctaatac ctatgagttg ggtgaattgc tctcttcttg aggtcccaag 2760 aatatgcggt tcctggccct gttagaaagt gacattcttt actcactaca ggttagggaa 2820 cctgtatggg gactgtgtag acaaagtatg aggctggttt acccaagggg cttttattgg 2880 ctctgcaagt tgagcttgat tccttaaagg gaaacatacc cttccagtca aagttacagt 2940 tactggttgg taaagttaaa gttacagcta ctggttgcta aagcaaccag tttctccaat 3000 tgcatcctgt tgcaaaagaa agtggattct tactgcactg atgcaaataa ccgtattgcc 3060 ctaagttaag aatactcaca gatagtttcc aaattctaga ggaagcaggc agagagaaaa 3120 aaaagtgcta aattttgttc ataggagtct gcattactca attattaaag attgtgtata 3180 gctcaaaaaa aaagatcagc actgttttaa gctaaagttt aaaaaagatt acttcaattt 3240 tctattagtt cagtctgttc agttaactct tgttctgctt gatatttgtg aacatttcag 3300 ctcttcatga gtcctgtacg tttttccatt attccaatgt cacaatctcc aaagttatca 3360 gaaacctgca tttgagagca cctgttacgt ttctatagct gattataaat cctatttgaa 3420 gaagatcaaa acaaaacaat ggtctgtgaa tagcaaaatg tccatggtag ttacagtcaa 3480 aaacacaatt gacaaagaaa ttttgttatc tctgtggctt ataatcacct aacataacac 3540 ctttaattgt gagtgatagc atatacttag atattagaat tttagaaatc ccatacagtt 3600 ttggagcata tattattatt cactaaaata taacccaaag aagattaaat atcattttgg 3660 caatcccatg tacataaatt tgtcaggtaa tcctatttac ctctcttctg gatgctccag 3720 ggatgctagg ggtcaggaaa gacaaccttg aagctgacat ttgattttgg gaagcccatt 3780 aaatatgtta gaggtttaaa acaatgttat gaagtagaat tccagattac cataaattac 3840 ttattttgcc aaaatgatga ctcaaaaatt ttaaaacaag ccaaaaactt ttactcattt 3900 agagggaaga cttagatttc caaagaattt gtctcctgtc ttcactttca tttccttggc 3960 agtctatctg gaagacaaac tgaaatattt aattatcctt tactattaca tgaaaatctt 4020 atacaaggga gagaaagcca aattttaccc tcacattagt ttactattaa tgtcaacccc 4080 aattttttaa tgaaacctta tagacaattc tatccaatct taaccagttt gatcatgagg 4140 taagattcct gtaagccttt tataaccttt tacaaattac taatttacta atctgctaaa 4200 gagcagatta gggctttaag aaaaccttgt tgtgctttca tttcaatgct cagtttgtag 4260 aaaaaccata taatagagtt ttggatttaa tcaatgttca cacacagaat ttcttttgca 4320 agattaattt ttagaaacct cccacaactt gtttaaacct ttagtttatc ttatctaatt 4380 tataatagtc ctttaacctt aggcaaaaac ttacatttcc atgcattctt ataatctttg 4440 actaataaca cattttactg ttcttacata ccttgcatgt aaatctattt tcagtggtct 4500 caattacatg ttataatggt acctcttagc actttttaat tttagtttaa aacctggtaa 4560 gtcgttttaa ttacgcacta ggtgctgata aagtttgatt ccttccagca taattaaggg 4620 tgtggttaat tccatatgtc cctgtgcctt accaagttgt aaagcaggca gattgaacag 4680 ttttcaaagg caaaagaagc cgtttacaac cttaaaacat ttagccacct agtgcctgac 4740 ttgcataatt tagaccagct atttacattt taagaacatt tgcattttat caattatctt 4800 taagactact tttatttctc agagattaaa gtcacaagaa ctaaaaggca ttatagcttt 4860 tatctttcct ccaaaaatat ttgatcttag tgctgatttt tctttaagcc aattaattag 4920 agctcttttt tataactaca cagatggaga agaagattga gtgttataag atttttcatt 4980 tgcccatctc ctaattggat tcttggtctc tgggtgggac cctttaagag cagggctaag 5040 aaagcatgca gtttattttc tttttttctt tttcttttct ttttttttga gaaagagttt 5100 cactcttgtt gcccaggctg gagtgcaatg gtgcgatctc agctcactgc aacctctgcc 5160 tcccaggttc aagcgattct cttacctcag cctcccaagt ggctgcatgc agtttctagg 5220 gcctaataaa caggcatagc tggaaaacaa aaacggattt tgagagcgat ctatttgcct 5280 ctaattcctg gggttccatg aggaaaacag aggtttctcc caaaatggaa tccatggtgc 5340 cttttctgtt tttaccaagc agccctatgc catcagaaat tatcttaggg cctctcatgt 5400 gcgcattaac actggcaaga caaggtggag aaaagtaatt cagtcaactg agaaaaaaat 5460 ctttttccag caaaacaaga tccaagaaga gaaaaacata aaggcctttc aaatatacgt 5520 atagcttgga tatccacttt taattaagct gagctctctt taagaaagtc cttttaaatc 5580 ccacattacc tgacttcagc catgccaagc agccaatatt tctggctttg gaagtttatc 5640 aaaagaacct caaggttcaa ccaacaagcc tcaattaaga cacgcgaagc acaccagatt 5700 ggctacacct taagaccagc ctcataaaac ctttttcact aatggaaact ttacagggaa 5760 tatcaacagt gatccttatc attcttttca ccagtttaca cagggagaga gaggccaaaa 5820 gtctgactgg ttaaaaaact tttatccttt tgctggcatg tcatgcttct gggttccctt 5880 cccctgagct caattctaag ccaaccagtt taaggtttgg gaaattaact tttctcagtt 5940 tggaggatgc atcctatggg aatgtccttt agtacaggga cacagtcacc catctgtgaa 6000 gagaggacaa aggaggaaaa agtaaaaaaa gatttttttc aaaggctccc caggggttca 6060 ggatgcattt gaaaggggga cagattgaag atgaatggct actcatctag aaagagggga 6120 gccagacatc cctggttcct ttctctttct aggaaatagc cagggtatgt gagggaaaga 6180 aggaacaagc atccattttc cttcttccgt ccttatgtcc ccaagtcctg acaacctcga 6240 cagggtgcca cccatgggtg ccaatacggt tctcacccat ggtaacaggg gacctagtgg 6300 atgggattat ccactgttac ccacaaactg tctttccccc tgctctcaat agccttcaag 6360 tgccctagac ctcatttagg ccattgatac tagtatgacc tttatccatg aaacaagagg 6420 cttggcttaa ttgtcaggaa ttagtcatgc tcacctatac tgtgcttttt aatttttgtt 6480 gttgtctgcc tctggatccc tccgatgcag ttatctttcc tagggcttct acatgaagct 6540 tggaattgag tttgggacaa aagaactgcc tcagtaggtg ggtgcatgga ctcatcaatc 6600 cccaggtgtc cctcaccagt ctggctgctg ccgccttatc ataagctgaa ggctaaggtg 6660 caactgtgaa attaggtcct tctcaaacaa gggagggaaa atggtgtcct gtgaattagg 6720 gtcctggtct aataagatgc cttccaaaag gaagaaaact tctggcacag agaagacccc 6780 tctacccgca gggctgtgtt attaggttgg tgcgaaagca attgtggtgc ccatcattct 6840 aagtaatgac aaaaaccaca actactttca caccagccta ctaactcatg acttggtgga 6900 caaaagaaaa taacaacaac aacaacagct taaatgcagg gctgtgttta ctgctgacaa 6960 ggtggagaaa agaaaaatat gcctgagaaa tgcaaatgta tttctccaac aggcagagaa 7020 acttaattgc tattgcactg agctggaccc cttggcttgg ggtggggaag actctgtgga 7080 tacatggcag gggacactgg ccagttggct gcatggggcc caggcccctg agatcaccct 7140 gg 7142 <210> 5 <211> 7142 <212> DNA <213> Homo sapiens <220> <221> allele <222> (1807)..(1807) <223> r = a or g <400> 5 gaaggagcag gaggcaatgt ggctggagag gagggagcaa ggggcagagt gttggtggtg 60 aggtcagggg cccagcagcc tgatccaggg gacttgaaca ggatggaagg actttgggtg 120 cgttctgaag aaggggaagc cactggaagg cattaagtag aaaaaattgg aagtgagagt 180 aattatatgt gaaagttgtt agagtcacaa tggagtgacg atgaggcagg acaggtagtc 240 aaggaagtaa gtgcagttaa cacaatgagc cccagtattc gcattgtaat ccagctcatg 300 caagcacagc tatctcctgc agggaatatt tcccatagac agcatttgca ctttgatttt 360 acctcttctc aaacggaccc tgttctcatg ataatagtaa aaaacacacc cctaggtgga 420 gatttaagat gctgatgaat tatgagatgt atgaacaagc atgtacagct actgcacatg 480 tgcacccaga ggaccaccga ggacatgctt actagcaaca ccttttctca ccctcttatg 540 aataatcatg taagagtccc ataaaaggat ttctccagca ataatcagtg ctgtccattc 600 agtggctcat gcctgtaacc cagcactttg ggaggccgag gtgggtggat cacctgaggt 660 caggagtttg agaccagcct ggtcaacatg gtgaaacctc gtttctatta aaaatacaaa 720 aaaagtagcc aggtgtaatg gcacatgcct gtaatcccag ctacttggga ggctgaagca 780 ggagaactga ttgaacctgg gaggtggagg ttgcagtgag tcatgactgt gccactgcac 840 tccagccaac agagtaagac tctgttcccc ctcggccccc tgcaaaaaaa aataataaca 900 atgataagag gcaagatcaa tggccaccaa aattttattt tttcccatag cgttgctggg 960 gtggcatggc tgcctgccct gggttcatcc tgtccctaag tggaactccc tatggctgag 1020 ggactcagaa tcaaatgact tatagccaat taaatgttct agtccagatg cccaattaaa 1080 tgggcatgga cagacattca ttagccttta aattattttc taagtaaaaa gtcaacaaac 1140 aaaaagttaa aggtgaggtt acaaaactga cttttcttta acttctatgc tactgtaatc 1200 ttgggttttg ttatggactt atagcaatta tttatacaaa acataagaat tgttctgaaa 1260 aaattaaaaa atatatacct gcatggctca taactggaaa tattatacca ggaggctttg 1320 tcacttggta tctttatcct tttacttatt attttctttt aattctacag gaagcagtaa 1380 attctttatg gttggagtgg atgaagaggt gccatgtaat agctcagaag gcaaagtccc 1440 ttgttttacc agctgtttag gcatccatgt actcatcctt gatttgaagg gtttgagtta 1500 attctatcct tccaaatcag cccttacaat ctcacgtgcc cacctcttct gcaacagtct 1560 ctgggcctag agggaggacg cttgcaatac aggatttttt gcatgttccc agtggctcca 1620 ccccattctc ccagtgcaca tgcaggccct tagtctgaac ccacgctaca ttgatttatt 1680 tcccttactg agcatgtgtt aagggatgga atttttcacc atgggcatgt ttaggcaagc 1740 cccctgtaca caatgtcctg gatggcattt ggctgtcttc tgcctctatc attcccccat 1800 ctaaaaragt acatctaact gccattagaa taaggataag aagaaagaca aagacccatc 1860 ttaactgctt tctgctgaca gagggcactg ttttggaaag acagcagttg ggtctccctc 1920 agaggcctat ctaagggtat ctggtaaaag ggaccatcat tcgaggctct ggttgcataa 1980 ctgtttggag tttgagggcc tgaaggcgag aagagacaaa ccaggttatt agaagacatg 2040 taccaaaatg aaatggggga agggtaagga cagttcaaaa atcctgaggc tgctgacatg 2100 cccagataac tggtagctgt agttgtgcct gctaagattt gggtgcatgg gacttggctt 2160 tggttagctc ccgtagttta ttttcccaaa aaagaaacct ctgggttatg ggcaccctat 2220 ttactcccat tatctggcag gatttgtagg ataattgttc agaactagaa tactgttcca 2280 gatttttaca ttacccatgc cttttgtttc ttctgagctg cagccagaga tcactggtta 2340 gttcacagga ataagcaggg ttaatttaaa atgtaggcaa aaaacttaaa aacaactaat 2400 gagtctagaa tttaatgaca aatgtatgat aagttttgaa acataatttc tttctcccca 2460 gtcctcattt ttgttaaaaa caaatcataa taggagtgag ttgtttgtaa aataaacttt 2520 agtcttacac ttggtctgct tatttgcaca aagtacaaca agaataatta tttttacata 2580 ggctttttaa attggctttg atggaactct gttccacaag gaatttcaga taggacttca 2640 taaaaatgag cccagccatg ggtttgtacc ctctaatacc tatgagttgg gtgaattgct 2700 ctcttcttga ggtcccaaga atatgcggtt cctggccctg ttagaaagtg acattcttta 2760 ctcactacag gttagggaac ctgtatgggg actgtgtaga caaagtatga ggctggttta 2820 cccaaggggc ttttattggc tctgcaagtt gagcttgatt ccttaaaggg aaacataccc 2880 ttccagtcaa agttacagtt actggttggt aaagttaaag ttacagctac tggttgctaa 2940 agcaaccagt ttctccaatt gcatcctgtt gcaaaagaaa gtggattctt actgcactga 3000 tgcaaataac cgtattgccc taagttaaga atactcacag atagtttcca aattctagag 3060 gaagcaggca gagagaaaaa aaagtgctaa attttgttca taggagtctg cattactcaa 3120 ttattaaaga ttgtgtatag ctcaaaaaaa aagatcagca ctgttttaag ctaaagttta 3180 aaaaagatta cttcaatttt ctattagttc agtctgttca gttaactctt gttctgcttg 3240 atatttgtga acatttcagc tcttcatgag tcctgtacgt ttttccatta ttccaatgtc 3300 acaatctcca aagttatcag aaacctgcat ttgagagcac ctgttacgtt tctatagctg 3360 attataaatc ctatttgaag aagatcaaaa caaaacaatg gtctgtgaat agcaaaatgt 3420 ccatggtagt tacagtcaaa aacacaattg acaaagaaat tttgttatct ctgtggctta 3480 taatcaccta acataacacc tttaattgtg agtgatagca tatacttaga tattagaatt 3540 ttagaaatcc catacagttt tggagcatat attattattc actaaaatat aacccaaaga 3600 agattaaata tcattttggc aatcccatgt acataaattt gtcaggtaat cctatttacc 3660 tctcttctgg atgctccagg gatgctaggg gtcaggaaag acaaccttga agctgacatt 3720 tgattttggg aagcccatta aatatgttag aggtttaaaa caatgttatg aagtagaatt 3780 ccagattacc ataaattact tattttgcca aaatgatgac tcaaaaattt taaaacaagc 3840 caaaaacttt tactcattta gagggaagac ttagatttcc aaagaatttg tctcctgtct 3900 tcactttcat ttccttggca gtctatctgg aagacaaact gaaatattta attatccttt 3960 actattacat gaaaatctta tacaagggag agaaagccaa attttaccct cacattagtt 4020 tactattaat gtcaacccca attttttaat gaaaccttat agacaattct atccaatctt 4080 aaccagtttg atcatgaggt aagattcctg taagcctttt ataacctttt acaaattact 4140 aatttactaa tctgctaaag agcagattag ggctttaaga aaaccttgtt gtgctttcat 4200 ttcaatgctc agtttgtaga aaaaccatat aatagagttt tggatttaat caatgttcac 4260 acacagaatt tcttttgcaa gattaatttt tagaaacctc ccacaacttg tttaaacctt 4320 tagtttatct tatctaattt ataatagtcc tttaacctta ggcaaaaact tacatttcca 4380 tgcattctta taatctttga ctaataacac attttactgt tcttacatac cttgcatgta 4440 aatctatttt cagtggtctc aattacatgt tataatggta cctcttagca ctttttaatt 4500 ttagtttaaa acctggtaag tcgttttaat tacgcactag gtgctgataa agtttgattc 4560 cttccagcat aattaagggt gtggttaatt ccatatgtcc ctgtgcctta ccaagttgta 4620 aagcaggcag attgaacagt tttcaaaggc aaaagaagcc gtttacaacc ttaaaacatt 4680 tagccaccta gtgcctgact tgcataattt agaccagcta tttacatttt aagaacattt 4740 gcattttatc aattatcttt aagactactt ttatttctca gagattaaag tcacaagaac 4800 taaaaggcat tatagctttt atctttcctc caaaaatatt tgatcttagt gctgattttt 4860 ctttaagcca attaattaga gctctttttt ataactacac agatggagaa gaagattgag 4920 tgttataaga tttttcattt gcccatctcc taattggatt cttggtctct gggtgggacc 4980 ctttaagagc agggctaaga aagcatgcag tttattttct ttttttcttt ttcttttctt 5040 tttttttgag aaagagtttc actcttgttg cccaggctgg agtgcaatgg tgcgatctca 5100 gctcactgca acctctgcct cccaggttca agcgattctc ttacctcagc ctcccaagtg 5160 gctgcatgca gtttctaggg cctaataaac aggcatagct ggaaaacaaa aacggatttt 5220 gagagcgatc tatttgcctc taattcctgg ggttccatga ggaaaacaga ggtttctccc 5280 aaaatggaat ccatggtgcc ttttctgttt ttaccaagca gccctatgcc atcagaaatt 5340 atcttagggc ctctcatgtg cgcattaaca ctggcaagac aaggtggaga aaagtaattc 5400 agtcaactga gaaaaaaatc tttttccagc aaaacaagat ccaagaagag aaaaacataa 5460 aggcctttca aatatacgta tagcttggat atccactttt aattaagctg agctctcttt 5520 aagaaagtcc ttttaaatcc cacattacct gacttcagcc atgccaagca gccaatattt 5580 ctggctttgg aagtttatca aaagaacctc aaggttcaac caacaagcct caattaagac 5640 acgcgaagca caccagattg gctacacctt aagaccagcc tcataaaacc tttttcacta 5700 atggaaactt tacagggaat atcaacagtg atccttatca ttcttttcac cagtttacac 5760 agggagagag aggccaaaag tctgactggt taaaaaactt ttatcctttt gctggcatgt 5820 catgcttctg ggttcccttc ccctgagctc aattctaagc caaccagttt aaggtttggg 5880 aaattaactt ttctcagttt ggaggatgca tcctatggga atgtccttta gtacagggac 5940 acagtcaccc atctgtgaag agaggacaaa ggaggaaaaa gtaaaaaaag atttttttca 6000 aaggctcccc aggggttcag gatgcatttg aaagggggac agattgaaga tgaatggcta 6060 ctcatctaga aagaggggag ccagacatcc ctggttcctt tctctttcta ggaaatagcc 6120 agggtatgtg agggaaagaa ggaacaagca tccattttcc ttcttccgtc cttatgtccc 6180 caagtcctga caacctcgac agggtgccac ccatgggtgc caatacggtt ctcacccatg 6240 gtaacagggg acctagtgga tgggattatc cactgttacc cacaaactgt ctttccccct 6300 gctctcaata gccttcaagt gccctagacc tcatttaggc cattgatact agtatgacct 6360 ttatccatga aacaagaggc ttggcttaat tgtcaggaat tagtcatgct cacctatact 6420 gtgcttttta atttttgttg ttgtctgcct ctggatccct ccgatgcagt tatctttcct 6480 agggcttcta catgaagctt ggaattgagt ttgggacaaa agaactgcct cagtaggtgg 6540 gtgcatggac tcatcaatcc ccaggtgtcc ctcaccagtc tggctgctgc cgccttatca 6600 taagctgaag gctaaggtgc aactgtgaaa ttaggtcctt ctcaaacaag ggagggaaaa 6660 tggtgtcctg tgaattaggg tcctggtcta ataagatgcc ttccaaaagg aagaaaactt 6720 ctggcacaga gaagacccct ctacccgcag ggctgtgtta ttaggttggt gcgaaagcaa 6780 ttgtggtgcc catcattcta agtaatgaca aaaaccacaa ctactttcac accagcctac 6840 taactcatga cttggtggac aaaagaaaat aacaacaaca acaacagctt aaatgcaggg 6900 ctgtgtttac tgctgacaag gtggagaaaa gaaaaatatg cctgagaaat gcaaatgtat 6960 ttctccaaca ggcagagaaa cttaattgct attgcactga gctggacccc ttggcttggg 7020 gtggggaaga ctctgtggat acatggcagg ggacactggc cagttggctg catggggccc 7080 aggcccctga gatcaccctg gggctggggc agcagctgtg gctcaatcct gcactggatg 7140 gc 7142 <210> 6 <211> 7142 <212> DNA <213> Homo sapiens <220> <221> allele <222> (3512)..(3512) <223> k = g or t <400> 6 gaaggagcag gaggcaatgt ggctggagag gagggagcaa ggggcagagt gttggtggtg 60 aggtcagggg cccagcagcc tgatccaggg gacttgaaca ggatggaagg actttgggtg 120 cgttctgaag aaggggaagc cactggaagg cattaagtag aaaaaattgg aagtgagagt 180 aattatatgt gaaagttgtt agagtcacaa tggagtgacg atgaggcagg acaggtagtc 240 aaggaagtaa gtgcagttaa cacaatgagc cccagtattc gcattgtaat ccagctcatg 300 caagcacagc tatctcctgc agggaatatt tcccatagac agcatttgca ctttgatttt 360 acctcttctc aaacggaccc tgttctcatg ataatagtaa aaaacacacc cctaggtgga 420 gatttaagat gctgatgaat tatgagatgt atgaacaagc atgtacagct actgcacatg 480 tgcacccaga ggaccaccga ggacatgctt actagcaaca ccttttctca ccctcttatg 540 aataatcatg taagagtccc ataaaaggat ttctccagca ataatcagtg ctgtccattc 600 agtggctcat gcctgtaacc cagcactttg ggaggccgag gtgggtggat cacctgaggt 660 caggagtttg agaccagcct ggtcaacatg gtgaaacctc gtttctatta aaaatacaaa 720 aaaagtagcc aggtgtaatg gcacatgcct gtaatcccag ctacttggga ggctgaagca 780 ggagaactga ttgaacctgg gaggtggagg ttgcagtgag tcatgactgt gccactgcac 840 tccagccaac agagtaagac tctgttcccc ctcggccccc tgcaaaaaaa aataataaca 900 atgataagag gcaagatcaa tggccaccaa aattttattt tttcccatag cgttgctggg 960 gtggcatggc tgcctgccct gggttcatcc tgtccctaag tggaactccc tatggctgag 1020 ggactcagaa tcaaatgact tatagccaat taaatgttct agtccagatg cccaattaaa 1080 tgggcatgga cagacattca ttagccttta aattattttc taagtaaaaa gtcaacaaac 1140 aaaaagttaa aggtgaggtt acaaaactga cttttcttta acttctatgc tactgtaatc 1200 ttgggttttg ttatggactt atagcaatta tttatacaaa acataagaat tgttctgaaa 1260 aaattaaaaa atatatacct gcatggctca taactggaaa tattatacca ggaggctttg 1320 tcacttggta tctttatcct tttacttatt attttctttt aattctacag gaagcagtaa 1380 attctttatg gttggagtgg atgaagaggt gccatgtaat agctcagaag gcaaagtccc 1440 ttgttttacc agctgtttag gcatccatgt actcatcctt gatttgaagg gtttgagtta 1500 attctatcct tccaaatcag cccttacaat ctcacgtgcc cacctcttct gcaacagtct 1560 ctgggcctag agggaggacg cttgcaatac aggatttttt gcatgttccc agtggctcca 1620 ccccattctc ccagtgcaca tgcaggccct tagtctgaac ccacgctaca ttgatttatt 1680 tcccttactg agcatgtgtt aagggatgga atttttcacc atgggcatgt ttaggcaagc 1740 cccctgtaca caatgtcctg gatggcattt ggctgtcttc tgcctctatc attcccccat 1800 ctaaaagagt acatctaact gccattagaa taaggataag aagaaagaca aagacccatc 1860 ttaactgctt tctgctgaca gagggcactg ttttggaaag acagcagttg ggtctccctc 1920 agaggcctat ctaagggtat ctggtaaaag ggaccatcat tcgaggctct ggttgcataa 1980 ctgtttggag tttgagggcc tgaaggcgag aagagacaaa ccaggttatt agaagacatg 2040 taccaaaatg aaatggggga agggtaagga cagttcaaaa atcctgaggc tgctgacatg 2100 cccagataac tggtagctgt agttgtgcct gctaagattt gggtgcatgg gacttggctt 2160 tggttagctc ccgtagttta ttttcccaaa aaagaaacct ctgggttatg ggcaccctat 2220 ttactcccat tatctggcag gatttgtagg ataattgttc agaactagaa tactgttcca 2280 gatttttaca ttacccatgc cttttgtttc ttctgagctg cagccagaga tcactggtta 2340 gttcacagga ataagcaggg ttaatttaaa atgtaggcaa aaaacttaaa aacaactaat 2400 gagtctagaa tttaatgaca aatgtatgat aagttttgaa acataatttc tttctcccca 2460 gtcctcattt ttgttaaaaa caaatcataa taggagtgag ttgtttgtaa aataaacttt 2520 agtcttacac ttggtctgct tatttgcaca aagtacaaca agaataatta tttttacata 2580 ggctttttaa attggctttg atggaactct gttccacaag gaatttcaga taggacttca 2640 taaaaatgag cccagccatg ggtttgtacc ctctaatacc tatgagttgg gtgaattgct 2700 ctcttcttga ggtcccaaga atatgcggtt cctggccctg ttagaaagtg acattcttta 2760 ctcactacag gttagggaac ctgtatgggg actgtgtaga caaagtatga ggctggttta 2820 cccaaggggc ttttattggc tctgcaagtt gagcttgatt ccttaaaggg aaacataccc 2880 ttccagtcaa agttacagtt actggttggt aaagttaaag ttacagctac tggttgctaa 2940 agcaaccagt ttctccaatt gcatcctgtt gcaaaagaaa gtggattctt actgcactga 3000 tgcaaataac cgtattgccc taagttaaga atactcacag atagtttcca aattctagag 3060 gaagcaggca gagagaaaaa aaagtgctaa attttgttca taggagtctg cattactcaa 3120 ttattaaaga ttgtgtatag ctcaaaaaaa aagatcagca ctgttttaag ctaaagttta 3180 aaaaagatta cttcaatttt ctattagttc agtctgttca gttaactctt gttctgcttg 3240 atatttgtga acatttcagc tcttcatgag tcctgtacgt ttttccatta ttccaatgtc 3300 acaatctcca aagttatcag aaacctgcat ttgagagcac ctgttacgtt tctatagctg 3360 attataaatc ctatttgaag aagatcaaaa caaaacaatg gtctgtgaat agcaaaatgt 3420 ccatggtagt tacagtcaaa aacacaattg acaaagaaat tttgttatct ctgtggctta 3480 taatcaccta acataacacc tttaattgtg aktgatagca tatacttaga tattagaatt 3540 ttagaaatcc catacagttt tggagcatat attattattc actaaaatat aacccaaaga 3600 agattaaata tcattttggc aatcccatgt acataaattt gtcaggtaat cctatttacc 3660 tctcttctgg atgctccagg gatgctaggg gtcaggaaag acaaccttga agctgacatt 3720 tgattttggg aagcccatta aatatgttag aggtttaaaa caatgttatg aagtagaatt 3780 ccagattacc ataaattact tattttgcca aaatgatgac tcaaaaattt taaaacaagc 3840 caaaaacttt tactcattta gagggaagac ttagatttcc aaagaatttg tctcctgtct 3900 tcactttcat ttccttggca gtctatctgg aagacaaact gaaatattta attatccttt 3960 actattacat gaaaatctta tacaagggag agaaagccaa attttaccct cacattagtt 4020 tactattaat gtcaacccca attttttaat gaaaccttat agacaattct atccaatctt 4080 aaccagtttg atcatgaggt aagattcctg taagcctttt ataacctttt acaaattact 4140 aatttactaa tctgctaaag agcagattag ggctttaaga aaaccttgtt gtgctttcat 4200 ttcaatgctc agtttgtaga aaaaccatat aatagagttt tggatttaat caatgttcac 4260 acacagaatt tcttttgcaa gattaatttt tagaaacctc ccacaacttg tttaaacctt 4320 tagtttatct tatctaattt ataatagtcc tttaacctta ggcaaaaact tacatttcca 4380 tgcattctta taatctttga ctaataacac attttactgt tcttacatac cttgcatgta 4440 aatctatttt cagtggtctc aattacatgt tataatggta cctcttagca ctttttaatt 4500 ttagtttaaa acctggtaag tcgttttaat tacgcactag gtgctgataa agtttgattc 4560 cttccagcat aattaagggt gtggttaatt ccatatgtcc ctgtgcctta ccaagttgta 4620 aagcaggcag attgaacagt tttcaaaggc aaaagaagcc gtttacaacc ttaaaacatt 4680 tagccaccta gtgcctgact tgcataattt agaccagcta tttacatttt aagaacattt 4740 gcattttatc aattatcttt aagactactt ttatttctca gagattaaag tcacaagaac 4800 taaaaggcat tatagctttt atctttcctc caaaaatatt tgatcttagt gctgattttt 4860 ctttaagcca attaattaga gctctttttt ataactacac agatggagaa gaagattgag 4920 tgttataaga tttttcattt gcccatctcc taattggatt cttggtctct gggtgggacc 4980 ctttaagagc agggctaaga aagcatgcag tttattttct ttttttcttt ttcttttctt 5040 tttttttgag aaagagtttc actcttgttg cccaggctgg agtgcaatgg tgcgatctca 5100 gctcactgca acctctgcct cccaggttca agcgattctc ttacctcagc ctcccaagtg 5160 gctgcatgca gtttctaggg cctaataaac aggcatagct ggaaaacaaa aacggatttt 5220 gagagcgatc tatttgcctc taattcctgg ggttccatga ggaaaacaga ggtttctccc 5280 aaaatggaat ccatggtgcc ttttctgttt ttaccaagca gccctatgcc atcagaaatt 5340 atcttagggc ctctcatgtg cgcattaaca ctggcaagac aaggtggaga aaagtaattc 5400 agtcaactga gaaaaaaatc tttttccagc aaaacaagat ccaagaagag aaaaacataa 5460 aggcctttca aatatacgta tagcttggat atccactttt aattaagctg agctctcttt 5520 aagaaagtcc ttttaaatcc cacattacct gacttcagcc atgccaagca gccaatattt 5580 ctggctttgg aagtttatca aaagaacctc aaggttcaac caacaagcct caattaagac 5640 acgcgaagca caccagattg gctacacctt aagaccagcc tcataaaacc tttttcacta 5700 atggaaactt tacagggaat atcaacagtg atccttatca ttcttttcac cagtttacac 5760 agggagagag aggccaaaag tctgactggt taaaaaactt ttatcctttt gctggcatgt 5820 catgcttctg ggttcccttc ccctgagctc aattctaagc caaccagttt aaggtttggg 5880 aaattaactt ttctcagttt ggaggatgca tcctatggga atgtccttta gtacagggac 5940 acagtcaccc atctgtgaag agaggacaaa ggaggaaaaa gtaaaaaaag atttttttca 6000 aaggctcccc aggggttcag gatgcatttg aaagggggac agattgaaga tgaatggcta 6060 ctcatctaga aagaggggag ccagacatcc ctggttcctt tctctttcta ggaaatagcc 6120 agggtatgtg agggaaagaa ggaacaagca tccattttcc ttcttccgtc cttatgtccc 6180 caagtcctga caacctcgac agggtgccac ccatgggtgc caatacggtt ctcacccatg 6240 gtaacagggg acctagtgga tgggattatc cactgttacc cacaaactgt ctttccccct 6300 gctctcaata gccttcaagt gccctagacc tcatttaggc cattgatact agtatgacct 6360 ttatccatga aacaagaggc ttggcttaat tgtcaggaat tagtcatgct cacctatact 6420 gtgcttttta atttttgttg ttgtctgcct ctggatccct ccgatgcagt tatctttcct 6480 agggcttcta catgaagctt ggaattgagt ttgggacaaa agaactgcct cagtaggtgg 6540 gtgcatggac tcatcaatcc ccaggtgtcc ctcaccagtc tggctgctgc cgccttatca 6600 taagctgaag gctaaggtgc aactgtgaaa ttaggtcctt ctcaaacaag ggagggaaaa 6660 tggtgtcctg tgaattaggg tcctggtcta ataagatgcc ttccaaaagg aagaaaactt 6720 ctggcacaga gaagacccct ctacccgcag ggctgtgtta ttaggttggt gcgaaagcaa 6780 ttgtggtgcc catcattcta agtaatgaca aaaaccacaa ctactttcac accagcctac 6840 taactcatga cttggtggac aaaagaaaat aacaacaaca acaacagctt aaatgcaggg 6900 ctgtgtttac tgctgacaag gtggagaaaa gaaaaatatg cctgagaaat gcaaatgtat 6960 ttctccaaca ggcagagaaa cttaattgct attgcactga gctggacccc ttggcttggg 7020 gtggggaaga ctctgtggat acatggcagg ggacactggc cagttggctg catggggccc 7080 aggcccctga gatcaccctg gggctggggc agcagctgtg gctcaatcct gcactggatg 7140 gc 7142 <210> 7 <211> 3609 <212> DNA <213> Homo sapiens <220> <221> allele <222> (1609)..(1609) <223> y = c or t <400> 7 cagacagtca tgcaccccag ccaggaggga agggggaatg gggagatgct gtcttcctat 60 ccatcctaca catgtgccta tggccattgg gttgggagtg gaacaccccc aatattgtaa 120 aagaaaagat aggtgccatt acaatccccc taaaaagaag gaaaatgcca tagaaaagac 180 tgggttggac tgaggccgat gttcctgacc cctgagagca atggggggtt gaagggtggg 240 gtgcaatttc ccccatcctt agaaaacacc tgagaacaag aaagctcaga aacaaaaggg 300 aaagaaatgt tctgggttca cattttactc acccaggcaa tgtcagcttt ctcattataa 360 cttttggctt ttgatttttt ttttttaatt ttacaatctg gacaaatagt gttttaaata 420 cctttgtttt aaccccctca atttccattc tatttatttc atttcttaac aaccatccaa 480 agatttctat cacccttctg gggcgactcc tttgactctc ttttgccttt ctcatttttt 540 tttaaattac ctcaacattt tattaaggat ctgtaagacc cacaagggac agcaaatttg 600 atacaacttg tcaaacaatt gtatggttct gtcggagaaa tgtcacctgg gatgcctatg 660 taaaagggac ctctttaacc cccaaattta ccatgacctg ggtaataggc atataaagtg 720 ggagaatatc ctggtcatca taaagccagt accatgtggc ttgcttatga atcatatcta 780 ctgcttcatc tgggttactc cacttggcat tttataggga gagttgggca gtccctttct 840 tggggtaaac agactttaca gtggcattta tccagtccac tagggttgga tgttctctca 900 ggaataacct cctatgcatt tggatcactt atactcatta gagatttaat agtgagctgt 960 gggtcatgga tcaaactaaa gaagctcttt cactctgtag catttaaaat taaggattct 1020 atccttaaat tagttatttt taaatccatt atagtaaaag tgtctcagga agctgactat 1080 accaatctac aaaatggaac aattccttta cattatagcc tctggtttta atagttgttt 1140 tgccctgccc ctacatttac tatcttcttg gtaaccacag gtctcagagg taaactttgt 1200 tgccccggtt taatttatat ttttgtgagt agcttggatg ctagaggctt gagctgagac 1260 agacccactt ctggtcttgg tccactctta aggaccaacc caacactctt ttactctcat 1320 ttcagctttt acagataata accaaaggat gaaacatttt tcttccttat tagcttgcct 1380 tcccttatgc attcagggaa ctaactccct gggagtatga gtaggatcca tctctaattc 1440 cactggtaac ttttactttt agtaactgac tatagcccag ctgcagctcc ttaagatggg 1500 caaccacatg gctactcaag agtcaggatt tctcatttca caccctttta tttttttctt 1560 tatccattta gttttatcta tataattttt tcctttattt tagagtgayt cataaatagt 1620 ctctagaaaa aaattacatt ttctttagca aaaactagtt ccttgtgttt tcagaaacct 1680 caccaaaaac accttttatt cacctactag tttaagtctt attaactcaa attcccagtg 1740 gaaaaaaaac tcataggttt acttaattta aacattacat gacttattaa cccaaatccc 1800 cagtggggga aaaaagtaac ctaggtttac ttaatttaaa cataacatga ctttaagatt 1860 ttaaattact ggaaataatt gagattaaat ttaccaaatt aatcttacca aagattacta 1920 gtcatgtgag ctaaaaggca tctgagctag gttccatcag tctgataagc attaacattc 1980 tccaagccaa ttgattagag ctcttttgta ccacttgtta gtgaaatatc acttccacat 2040 ggcacatgta aacatgtaga tataacagac atatagaaaa cggcaggtcc aaaagatttt 2100 tcatttgcct cttttcaaaa attctctccc ctactttaga ttattaattt aaaaaagtta 2160 taaggccaaa caaaagttga aggagagagt taccatccta ggccttttca aaagcgaaaa 2220 aaggactgag atatcaattt gaataatttc aaaaagaaac attacagaat ttaaaaatta 2280 aaaactttgt gcattgagta actcaatatt ttaaataaaa tcttgttcta accaaatctt 2340 tagttattta ttagtgtatt tttttttgag acagagtctt gctcttgttg ctcaggctgg 2400 agtgcaatgg tgcgatctca gctcactgca acttctgcct cccaggttca agtgattctc 2460 ctgcctcagc ttcccaagta gctgggatta caggcacctg ccaccatgcc cagctaattt 2520 tttaattttt agtagagaca gggtttcacc atgttggcca ggctggtctc gaactcctga 2580 cctatatgat ctgctcgcct cggcctccca aagtgctagg attacaggcg tgagcaccgc 2640 acccagtcta gtgtattttt aacataaaag ttcaatttaa aaaaaagatt ataattttct 2700 gtaattatgg acaacttaat cacataacat ttgtataaat ttctttttta ctaactttat 2760 tatgacttac acagaccatt cacaacatgc ttggactttc tgctttgacc taagtgtcac 2820 tctttctgga ataactcggt cattttatct taggacaaaa attcaccaaa caatattttt 2880 ctcatacaaa attacttttc ttttaagctt tcttaccaaa aatacctctg tatatctata 2940 cttttcttta tattggtcta tttcctggtt cctttcacat tcttatttat acaggacttt 3000 taaataagct ttgaattaga caaaaattat ttacctttta ataagaacat attttaaaaa 3060 aagaataaaa tataattttt tgaattggaa aatacccaga tatttaatta aatatctatt 3120 attgaattta atataatttt atattctaaa ttatgacaag tttatttaca ggtatttatc 3180 cctttacatt tacctgatta ttttatttta atattttatg tagactatga aaactgtgat 3240 agtcatcatt taaagttatt tccctgtcaa tgatttttat agcctatgaa gttcaggtgt 3300 ttacctaagt aagaacctca ggattaaata tatggttatt ttaccaataa ttccaagttt 3360 agctgttttc attaaaccaa caatatttga tatcttgttt gtcaaaaact acacaagcaa 3420 agatcattct gttttgggtt ggtgtattag tctgttctca cattgttatt aaaaaatcct 3480 ggaattgggt aatctataaa gaaaagaggt ttaattggct tacagtttta caggctatat 3540 aggaagcata gcagcttttg cttggaaact tataatcatg gtgaaaggtg aaggtgaagc 3600 aggcatgtc 3609 <210> 8 <211> 3659 <212> DNA <213> Homo sapiens <220> <221> allele <222> (1659)..(1659) <223> w = a or t <400> 8 cagacagtca tgcaccccag ccaggaggga agggggaatg gggagatgct gtcttcctat 60 ccatcctaca catgtgccta tggccattgg gttgggagtg gaacaccccc aatattgtaa 120 aagaaaagat aggtgccatt acaatccccc taaaaagaag gaaaatgcca tagaaaagac 180 tgggttggac tgaggccgat gttcctgacc cctgagagca atggggggtt gaagggtggg 240 gtgcaatttc ccccatcctt agaaaacacc tgagaacaag aaagctcaga aacaaaaggg 300 aaagaaatgt tctgggttca cattttactc acccaggcaa tgtcagcttt ctcattataa 360 cttttggctt ttgatttttt ttttttaatt ttacaatctg gacaaatagt gttttaaata 420 cctttgtttt aaccccctca atttccattc tatttatttc atttcttaac aaccatccaa 480 agatttctat cacccttctg gggcgactcc tttgactctc ttttgccttt ctcatttttt 540 tttaaattac ctcaacattt tattaaggat ctgtaagacc cacaagggac agcaaatttg 600 atacaacttg tcaaacaatt gtatggttct gtcggagaaa tgtcacctgg gatgcctatg 660 taaaagggac ctctttaacc cccaaattta ccatgacctg ggtaataggc atataaagtg 720 ggagaatatc ctggtcatca taaagccagt accatgtggc ttgcttatga atcatatcta 780 ctgcttcatc tgggttactc cacttggcat tttataggga gagttgggca gtccctttct 840 tggggtaaac agactttaca gtggcattta tccagtccac tagggttgga tgttctctca 900 ggaataacct cctatgcatt tggatcactt atactcatta gagatttaat agtgagctgt 960 gggtcatgga tcaaactaaa gaagctcttt cactctgtag catttaaaat taaggattct 1020 atccttaaat tagttatttt taaatccatt atagtaaaag tgtctcagga agctgactat 1080 accaatctac aaaatggaac aattccttta cattatagcc tctggtttta atagttgttt 1140 tgccctgccc ctacatttac tatcttcttg gtaaccacag gtctcagagg taaactttgt 1200 tgccccggtt taatttatat ttttgtgagt agcttggatg ctagaggctt gagctgagac 1260 agacccactt ctggtcttgg tccactctta aggaccaacc caacactctt ttactctcat 1320 ttcagctttt acagataata accaaaggat gaaacatttt tcttccttat tagcttgcct 1380 tcccttatgc attcagggaa ctaactccct gggagtatga gtaggatcca tctctaattc 1440 cactggtaac ttttactttt agtaactgac tatagcccag ctgcagctcc ttaagatggg 1500 caaccacatg gctactcaag agtcaggatt tctcatttca caccctttta tttttttctt 1560 tatccattta gttttatcta tataattttt tcctttattt tagagtgatt cataaatagt 1620 ctctagaaaa aaattacatt ttctttagca aaaactagwt ccttgtgttt tcagaaacct 1680 caccaaaaac accttttatt cacctactag tttaagtctt attaactcaa attcccagtg 1740 gaaaaaaaac tcataggttt acttaattta aacattacat gacttattaa cccaaatccc 1800 cagtggggga aaaaagtaac ctaggtttac ttaatttaaa cataacatga ctttaagatt 1860 ttaaattact ggaaataatt gagattaaat ttaccaaatt aatcttacca aagattacta 1920 gtcatgtgag ctaaaaggca tctgagctag gttccatcag tctgataagc attaacattc 1980 tccaagccaa ttgattagag ctcttttgta ccacttgtta gtgaaatatc acttccacat 2040 ggcacatgta aacatgtaga tataacagac atatagaaaa cggcaggtcc aaaagatttt 2100 tcatttgcct cttttcaaaa attctctccc ctactttaga ttattaattt aaaaaagtta 2160 taaggccaaa caaaagttga aggagagagt taccatccta ggccttttca aaagcgaaaa 2220 aaggactgag atatcaattt gaataatttc aaaaagaaac attacagaat ttaaaaatta 2280 aaaactttgt gcattgagta actcaatatt ttaaataaaa tcttgttcta accaaatctt 2340 tagttattta ttagtgtatt tttttttgag acagagtctt gctcttgttg ctcaggctgg 2400 agtgcaatgg tgcgatctca gctcactgca acttctgcct cccaggttca agtgattctc 2460 ctgcctcagc ttcccaagta gctgggatta caggcacctg ccaccatgcc cagctaattt 2520 tttaattttt agtagagaca gggtttcacc atgttggcca ggctggtctc gaactcctga 2580 cctatatgat ctgctcgcct cggcctccca aagtgctagg attacaggcg tgagcaccgc 2640 acccagtcta gtgtattttt aacataaaag ttcaatttaa aaaaaagatt ataattttct 2700 gtaattatgg acaacttaat cacataacat ttgtataaat ttctttttta ctaactttat 2760 tatgacttac acagaccatt cacaacatgc ttggactttc tgctttgacc taagtgtcac 2820 tctttctgga ataactcggt cattttatct taggacaaaa attcaccaaa caatattttt 2880 ctcatacaaa attacttttc ttttaagctt tcttaccaaa aatacctctg tatatctata 2940 cttttcttta tattggtcta tttcctggtt cctttcacat tcttatttat acaggacttt 3000 taaataagct ttgaattaga caaaaattat ttacctttta ataagaacat attttaaaaa 3060 aagaataaaa tataattttt tgaattggaa aatacccaga tatttaatta aatatctatt 3120 attgaattta atataatttt atattctaaa ttatgacaag tttatttaca ggtatttatc 3180 cctttacatt tacctgatta ttttatttta atattttatg tagactatga aaactgtgat 3240 agtcatcatt taaagttatt tccctgtcaa tgatttttat agcctatgaa gttcaggtgt 3300 ttacctaagt aagaacctca ggattaaata tatggttatt ttaccaataa ttccaagttt 3360 agctgttttc attaaaccaa caatatttga tatcttgttt gtcaaaaact acacaagcaa 3420 agatcattct gttttgggtt ggtgtattag tctgttctca cattgttatt aaaaaatcct 3480 ggaattgggt aatctataaa gaaaagaggt ttaattggct tacagtttta caggctatat 3540 aggaagcata gcagcttttg cttggaaact tataatcatg gtgaaaggtg aaggtgaagc 3600 aggcatgtct tacatggctg gagaaggagg aagagaaggt tgttggggag gtgccacac 3659 <210> 9 <211> 3876 <212> DNA <213> Homo sapiens <220> <221> allele <222> (1876)..(1876) <223> k = g or t <400> 9 cagacagtca tgcaccccag ccaggaggga agggggaatg gggagatgct gtcttcctat 60 ccatcctaca catgtgccta tggccattgg gttgggagtg gaacaccccc aatattgtaa 120 aagaaaagat aggtgccatt acaatccccc taaaaagaag gaaaatgcca tagaaaagac 180 tgggttggac tgaggccgat gttcctgacc cctgagagca atggggggtt gaagggtggg 240 gtgcaatttc ccccatcctt agaaaacacc tgagaacaag aaagctcaga aacaaaaggg 300 aaagaaatgt tctgggttca cattttactc acccaggcaa tgtcagcttt ctcattataa 360 cttttggctt ttgatttttt ttttttaatt ttacaatctg gacaaatagt gttttaaata 420 cctttgtttt aaccccctca atttccattc tatttatttc atttcttaac aaccatccaa 480 agatttctat cacccttctg gggcgactcc tttgactctc ttttgccttt ctcatttttt 540 tttaaattac ctcaacattt tattaaggat ctgtaagacc cacaagggac agcaaatttg 600 atacaacttg tcaaacaatt gtatggttct gtcggagaaa tgtcacctgg gatgcctatg 660 taaaagggac ctctttaacc cccaaattta ccatgacctg ggtaataggc atataaagtg 720 ggagaatatc ctggtcatca taaagccagt accatgtggc ttgcttatga atcatatcta 780 ctgcttcatc tgggttactc cacttggcat tttataggga gagttgggca gtccctttct 840 tggggtaaac agactttaca gtggcattta tccagtccac tagggttgga tgttctctca 900 ggaataacct cctatgcatt tggatcactt atactcatta gagatttaat agtgagctgt 960 gggtcatgga tcaaactaaa gaagctcttt cactctgtag catttaaaat taaggattct 1020 atccttaaat tagttatttt taaatccatt atagtaaaag tgtctcagga agctgactat 1080 accaatctac aaaatggaac aattccttta cattatagcc tctggtttta atagttgttt 1140 tgccctgccc ctacatttac tatcttcttg gtaaccacag gtctcagagg taaactttgt 1200 tgccccggtt taatttatat ttttgtgagt agcttggatg ctagaggctt gagctgagac 1260 agacccactt ctggtcttgg tccactctta aggaccaacc caacactctt ttactctcat 1320 ttcagctttt acagataata accaaaggat gaaacatttt tcttccttat tagcttgcct 1380 tcccttatgc attcagggaa ctaactccct gggagtatga gtaggatcca tctctaattc 1440 cactggtaac ttttactttt agtaactgac tatagcccag ctgcagctcc ttaagatggg 1500 caaccacatg gctactcaag agtcaggatt tctcatttca caccctttta tttttttctt 1560 tatccattta gttttatcta tataattttt tcctttattt tagagtgatt cataaatagt 1620 ctctagaaaa aaattacatt ttctttagca aaaactagtt ccttgtgttt tcagaaacct 1680 caccaaaaac accttttatt cacctactag tttaagtctt attaactcaa attcccagtg 1740 gaaaaaaaac tcataggttt acttaattta aacattacat gacttattaa cccaaatccc 1800 cagtggggga aaaaagtaac ctaggtttac ttaatttaaa cataacatga ctttaagatt 1860 ttaaattact ggaaakaatt gagattaaat ttaccaaatt aatcttacca aagattacta 1920 gtcatgtgag ctaaaaggca tctgagctag gttccatcag tctgataagc attaacattc 1980 tccaagccaa ttgattagag ctcttttgta ccacttgtta gtgaaatatc acttccacat 2040 ggcacatgta aacatgtaga tataacagac atatagaaaa cggcaggtcc aaaagatttt 2100 tcatttgcct cttttcaaaa attctctccc ctactttaga ttattaattt aaaaaagtta 2160 taaggccaaa caaaagttga aggagagagt taccatccta ggccttttca aaagcgaaaa 2220 aaggactgag atatcaattt gaataatttc aaaaagaaac attacagaat ttaaaaatta 2280 aaaactttgt gcattgagta actcaatatt ttaaataaaa tcttgttcta accaaatctt 2340 tagttattta ttagtgtatt tttttttgag acagagtctt gctcttgttg ctcaggctgg 2400 agtgcaatgg tgcgatctca gctcactgca acttctgcct cccaggttca agtgattctc 2460 ctgcctcagc ttcccaagta gctgggatta caggcacctg ccaccatgcc cagctaattt 2520 tttaattttt agtagagaca gggtttcacc atgttggcca ggctggtctc gaactcctga 2580 cctatatgat ctgctcgcct cggcctccca aagtgctagg attacaggcg tgagcaccgc 2640 acccagtcta gtgtattttt aacataaaag ttcaatttaa aaaaaagatt ataattttct 2700 gtaattatgg acaacttaat cacataacat ttgtataaat ttctttttta ctaactttat 2760 tatgacttac acagaccatt cacaacatgc ttggactttc tgctttgacc taagtgtcac 2820 tctttctgga ataactcggt cattttatct taggacaaaa attcaccaaa caatattttt 2880 ctcatacaaa attacttttc ttttaagctt tcttaccaaa aatacctctg tatatctata 2940 cttttcttta tattggtcta tttcctggtt cctttcacat tcttatttat acaggacttt 3000 taaataagct ttgaattaga caaaaattat ttacctttta ataagaacat attttaaaaa 3060 aagaataaaa tataattttt tgaattggaa aatacccaga tatttaatta aatatctatt 3120 attgaattta atataatttt atattctaaa ttatgacaag tttatttaca ggtatttatc 3180 cctttacatt tacctgatta ttttatttta atattttatg tagactatga aaactgtgat 3240 agtcatcatt taaagttatt tccctgtcaa tgatttttat agcctatgaa gttcaggtgt 3300 ttacctaagt aagaacctca ggattaaata tatggttatt ttaccaataa ttccaagttt 3360 agctgttttc attaaaccaa caatatttga tatcttgttt gtcaaaaact acacaagcaa 3420 agatcattct gttttgggtt ggtgtattag tctgttctca cattgttatt aaaaaatcct 3480 ggaattgggt aatctataaa gaaaagaggt ttaattggct tacagtttta caggctatat 3540 aggaagcata gcagcttttg cttggaaact tataatcatg gtgaaaggtg aaggtgaagc 3600 aggcatgtct tacatggctg gagaaggagg aagagaaggt tgttggggag gtgccacaca 3660 cttttaaaca accagatctc atgagaactt actatcacca tgacagcccc aagggggatg 3720 gtgttaaacc atgagaaact accccatgat ccaatcacct tccaccaggt tcctcctcca 3780 acactgggga ttacaatttg acatgagatt tgggtgggga tacagatcca accataacgg 3840 ttgggtttac agttttataa actttatgtc aaattt 3876 <210> 10 <211> 6995 <212> DNA <213> Homo sapiens <220> <221> allele <222> (3428)..(3428) <223> y = c or t <400> 10 tgtcttccta tccatcctac acatgtgcct atggccattg ggttgggagt ggaacacccc 60 caatattgta aaagaaaaga taggtgccat tacaatcccc ctaaaaagaa ggaaaatgcc 120 atagaaaaga ctgggttgga ctgaggccga tgttcctgac ccctgagagc aatggggggt 180 tgaagggtgg ggtgcaattt cccccatcct tagaaaacac ctgagaacaa gaaagctcag 240 aaacaaaagg gaaagaaatg ttctgggttc acattttact cacccaggca atgtcagctt 300 tctcattata acttttggct tttgattttt tttttttaat tttacaatct ggacaaatag 360 tgttttaaat acctttgttt taaccccctc aatttccatt ctatttattt catttcttaa 420 caaccatcca aagatttcta tcacccttct ggggcgactc ctttgactct cttttgcctt 480 tctcattttt ttttaaatta cctcaacatt ttattaagga tctgtaagac ccacaaggga 540 cagcaaattt gatacaactt gtcaaacaat tgtatggttc tgtcggagaa atgtcacctg 600 ggatgcctat gtaaaaggga cctctttaac ccccaaattt accatgacct gggtaatagg 660 catataaagt gggagaatat cctggtcatc ataaagccag taccatgtgg cttgcttatg 720 aatcatatct actgcttcat ctgggttact ccacttggca ttttataggg agagttgggc 780 agtccctttc ttggggtaaa cagactttac agtggcattt atccagtcca ctagggttgg 840 atgttctctc aggaataacc tcctatgcat ttggatcact tatactcatt agagatttaa 900 tagtgagctg tgggtcatgg atcaaactaa agaagctctt tcactctgta gcatttaaaa 960 ttaaggattc tatccttaaa ttagttattt ttaaatccat tatagtaaaa gtgtctcagg 1020 aagctgacta taccaatcta caaaatggaa caattccttt acattatagc ctctggtttt 1080 aatagttgtt ttgccctgcc cctacattta ctatcttctt ggtaaccaca ggtctcagag 1140 gtaaactttg ttgccccggt ttaatttata tttttgtgag tagcttggat gctagaggct 1200 tgagctgaga cagacccact tctggtcttg gtccactctt aaggaccaac ccaacactct 1260 tttactctca tttcagcttt tacagataat aaccaaagga tgaaacattt ttcttcctta 1320 ttagcttgcc ttcccttatg cattcaggga actaactccc tgggagtatg agtaggatcc 1380 atctctaatt ccactggtaa cttttacttt tagtaactga ctatagccca gctgcagctc 1440 cttaagatgg gcaaccacat ggctactcaa gagtcaggat ttctcatttc acaccctttt 1500 atttttttct ttatccattt agttttatct atataatttt ttcctttatt ttagagtgat 1560 tcataaatag tctctagaaa aaaattacat tttctttagc aaaaactagt tccttgtgtt 1620 ttcagaaacc tcaccaaaaa caccttttat tcacctacta gtttaagtct tattaactca 1680 aattcccagt ggaaaaaaaa ctcataggtt tacttaattt aaacattaca tgacttatta 1740 acccaaatcc ccagtggggg aaaaaagtaa cctaggttta cttaatttaa acataacatg 1800 actttaagat tttaaattac tggaaataat tgagattaaa tttaccaaat taatcttacc 1860 aaagattact agtcatgtga gctaaaaggc atctgagcta ggttccatca gtctgataag 1920 cattaacatt ctccaagcca attgattaga gctcttttgt accacttgtt agtgaaatat 1980 cacttccaca tggcacatgt aaacatgtag atataacaga catatagaaa acggcaggtc 2040 caaaagattt ttcatttgcc tcttttcaaa aattctctcc cctactttag attattaatt 2100 taaaaaagtt ataaggccaa acaaaagttg aaggagagag ttaccatcct aggccttttc 2160 aaaagcgaaa aaaggactga gatatcaatt tgaataattt caaaaagaaa cattacagaa 2220 tttaaaaatt aaaaactttg tgcattgagt aactcaatat tttaaataaa atcttgttct 2280 aaccaaatct ttagttattt attagtgtat ttttttttga gacagagtct tgctcttgtt 2340 gctcaggctg gagtgcaatg gtgcgatctc agctcactgc aacttctgcc tcccaggttc 2400 aagtgattct cctgcctcag cttcccaagt agctgggatt acaggcacct gccaccatgc 2460 ccagctaatt ttttaatttt tagtagagac agggtttcac catgttggcc aggctggtct 2520 cgaactcctg acctatatga tctgctcgcc tcggcctccc aaagtgctag gattacaggc 2580 gtgagcaccg cacccagtct agtgtatttt taacataaaa gttcaattta aaaaaaagat 2640 tataattttc tgtaattatg gacaacttaa tcacataaca tttgtataaa tttctttttt 2700 actaacttta ttatgactta cacagaccat tcacaacatg cttggacttt ctgctttgac 2760 ctaagtgtca ctctttctgg aataactcgg tcattttatc ttaggacaaa aattcaccaa 2820 acaatatttt tctcatacaa aattactttt cttttaagct ttcttaccaa aaatacctct 2880 gtatatctat acttttcttt atattggtct atttcctggt tcctttcaca ttcttattta 2940 tacaggactt ttaaataagc tttgaattag acaaaaatta tttacctttt aataagaaca 3000 tattttaaaa aaagaataaa atataatttt ttgaattgga aaatacccag atatttaatt 3060 aaatatctat tattgaattt aatataattt tatattctaa attatgacaa gtttatttac 3120 aggtatttat ccctttacat ttacctgatt attttatttt aatattttat gtagactatg 3180 aaaactgtga tagtcatcat ttaaagttat ttccctgtca atgattttta tagcctatga 3240 agttcaggtg tttacctaag taagaacctc aggattaaat atatggttat tttaccaata 3300 attccaagtt tagctgtttt cattaaacca acaatatttg atatcttgtt tgtcaaaaac 3360 tacacaagca aagatcattc tgttttgggt tggtgtatta gtctgttctc acattgttat 3420 taaaaaaycc tggaattggg taatctataa agaaaagagg tttaattggc ttacagtttt 3480 acaggctata taggaagcat agcagctttt gcttggaaac ttataatcat ggtgaaaggt 3540 gaaggtgaag caggcatgtc ttacatggct ggagaaggag gaagagaagg ttgttgggga 3600 ggtgccacac acttttaaac aaccagatct catgagaact tactatcacc atgacagccc 3660 caagggggat ggtgttaaac catgagaaac taccccatga tccaatcacc ttccaccagg 3720 ttcctcctcc aacactgggg attacaattt gacatgagat ttgggtgggg atacagatcc 3780 aaccataacg gttgggttta cagttttata aactttatgt caaattttga cacagagtat 3840 ttgtcaggga taagtatgaa attgctgatc aataaatgca aacaaaaata tatgttgaca 3900 atttataaga catttctaat attacttgac caataatttt aagccagttt atttataaaa 3960 ggttttactt gtcacatgac cttgaaaagc atttgggctt attgtttaat gtatgagtac 4020 ccttcaactt taagccattt tagtaccttg tggccaaaaa cacataataa aatacatgtt 4080 tgtacacata aacacacata tacacactca tacaaagatc ctgttgcttt cacttcaaaa 4140 ttttagctat gagatattaa tataaactta ccagtttgca aaaacaataa caaaaagaaa 4200 cggttggatg caaacagtgg attttatctc agtagaaatg tgttaataat agcagacaaa 4260 gcaggtggaa aagaaaacag agatagagaa cttaggaact ttagagttgc aggttgaact 4320 ttaggttctg aattttcctt gatgtaattt gcccatcagt ttaaaatgcg cacaagaaca 4380 gacctaatgt gtaaccagct ggagtattag aaaacctggc acgcccttcc atttacacaa 4440 ccacttgcaa gtagaggcac catgaaacga aatgaggtgc ctgagaggcc ttgttcttgt 4500 ttttccatat ccttaattta ttccccacat attttcttaa aaggaggaac tgagctgtgg 4560 cctaagtttt agtttagtgg gtcaaaatat gctgattctg ggtggggctc cacagtgtgt 4620 caccagtgag tcgttgccac cctcttatgt atctcagttt ctctctctgg aggtttagac 4680 ctccgagtgc tcaaaacatg gagttcctac atgagcttcc tggatgaacc tttttaaact 4740 aattttgctg ggggttccct gtagggcggc tgcatttcat ggggttggta gtcaacccct 4800 taggctccac cccagtaacc cagggatgcc ttttggctgg aaggagcaaa atgccctttc 4860 ttttcagagc ttaggaaact cagtctgaca tttatctaca aaaacaacag tttagttgct 4920 ctcacaaata cacagacaag ccaatcgaga ttaattttgg gagagaagac aatgagaaag 4980 ctctttagaa tgcacctctg aactagaatt aggatcctaa acaacaactt cattggtggg 5040 ggcagcgggg tggaaaaagc taagaccagc tgtaaactgt cctcagccac tcctaacttt 5100 atagctcttg tctgccatta cacactccaa ggtcacatct tctcacagta caaggtaatc 5160 tctggtgccc gcaaaagcca agagggtcag gtaatgcaat acaggaaagc agagttttaa 5220 atctaagaag aatctgccca tgactcttga aaccccacaa agaaaacaga acaccccaaa 5280 agggggtggg agtggtgcct ttgttctgag ttctttaagg ggtctgagac attagaaccc 5340 ttctgtagat ttttcttggt accagagatg gtgaaggggg aaggaaaaat agagtggaac 5400 aaaagtaaac agaagaataa ctgttttttg tttttttttt ttaagaaagg aagtgaacac 5460 agaaaccaag cacatgtttt tgtttttgtt tgtgcagctg ccaggaattt tagccaattc 5520 agaggccttg tttcccctaa tttggaattc tcattggaat ttgaccaagt ctgttatagt 5580 tgatcaaatc ctatgggaga aagatcagaa caacaaaaac cccaacaata tgattactga 5640 gtgctctaac ggtaaggaga aattaaaacc agctgcttgt caatttcaac ttgtagtcat 5700 taaggagaat ttccaagaca aaaaaatccc aattcttgct acttacctag gaatagagcc 5760 ctggcacaag attgctcttt accatcttag aagcaggaaa aatacctgga aaggtgcaca 5820 ggaacagaca taaggttctt gccttcccta tcggaaacta gctgaaactc cagaaatgag 5880 ttacctgcta tgcatcatca tggaagcaga aaaacttgct ttccttgttg gaatcaagta 5940 aaactccaga aaaggagttg tagagcaaaa taagctttag atctcgacca aattttgaga 6000 gatcagggat tctctggagg gggaactccc aggcctcagc aaattgtcct tctgatttga 6060 gccataagga tagctcaagc tggtaccaag caccaataga ttcatcaaag gtcaggggca 6120 cctccactca gaatcccttc atcaccaatt tgtgaactca aaagtatctg agacagatct 6180 caatacattt agacggttta ttttgccaag gttaaggatg tgcccatgac acatgtgccc 6240 atgacacagc ctcaggaggt cctgatgaca tgtgcccacg gtggtcaggg tacaacttgc 6300 ttttatactt tttagggagg cataatacat caatcaatac ctgtaagatg tacactggtt 6360 caatctggaa aagcaggaca acttgaagtg ggggcttcca ggttataggt agatttaaga 6420 attttctgat tggcaatttg ttgaaagagt tatgttgtta cccaaagacc cagaatcaat 6480 agaaatacct gggttatgat gataaggggt tgtagagacc aaagtttatc aggcagatga 6540 agcctccagg tagcagattt cagagagaat agattgaaaa tgtttcttat cagacgtaag 6600 tttaatgctg gtcagctttt cctaagttcc aaaagggagg agggtatact gagttatatc 6660 caactctccc ttcccatcat ggcctgaact agtttttcag gttaacttta caatgcgctt 6720 ggccaagagg gggcgtccgt ttagatggtt tgaggtgggg agggcttaca attttatttt 6780 tggcttacat agtaaaggtt aattatctca atacaattag gtcatcttca tttttctttt 6840 aaaaactttt gtcttccttt atctccctga atacacaggc agtttactat tttctcattg 6900 caagacccat tctcaaatat tattttcttt tagagagact cttgctgtta tttaggttca 6960 caagatggtg tcagaagtga aataaaagtg gcctc 6995 <210> 11 <211> 601 <212> DNA <213> Homo sapiens <220> <221> allele <222> (301)..(301) <223> r = a or g <400> 11 tgaaatgctc tattctttgc ctcaagtgat cctcctacct cggcctccca aagtgctggg 60 attacaggca tggagccaac acacctggcc ttcacatcta tttttaatcc aagtaattct 120 agggtcaaat aatactgaaa tctcgctaag tatcaaacgc tgcttttaac tgaagaaagt 180 ttactttgtt ttattttatt tttaaaatct tgctttgtct ctagatagac accataaatc 240 agaacttctt aatctaagat aacatcctgc tgctcaaaaa caggtgtcag aggaggcaat 300 rcatgcagct ggctcattag tctatatcac agatgccaca aacatgctgt cttgaggaac 360 tagaaacgtg cttttttgaa atatgttctt cagaagttct taggagctgt ggtgggagag 420 cgcaagcctg ggggtgagga ggcagctgag tgggtgattc ttctcactat tgcatcaaca 480 agagtagtag ctatagactg ggtttcttat tcttctacta agaggccccg aaataaaatg 540 gctttttaaa ggacctggtc taaagctttt ttcttttctt ttcttttctg attttttttt 600 t 601 <210> 12 <211> 2429 <212> DNA <213> Homo sapiens <220> <221> allele <222> (2000)..(2000) <223> r = a or g <400> 12 aaataaaaag atttgattaa attttttaaa tgggcaaagg atctcaatgg acaattctcc 60 aaggaaggta caaaatagcc aataagcata aaacagaagc tcaacatcat taattagcag 120 gtaaatgcaa ataaaaacca catgagttac cattttatac ctattaggat ggctatagtc 180 aaaaaagatt ggtaaaaatg tggaaaaatc aaaactctca tatattgctg atgggaatgt 240 aaaatagtgc agatgctttg aaagtagtct ggcatttcct caaatgatta aatatagagt 300 tactatgaga cccagcaatt ccactcctat gtatatattg aagagaaata taaaggtatg 360 cccagctatg tgtggtggcg tatgcctgat agtccttggt acttgggagg ctgaggtgga 420 aggattgctg gagcccaggg gttcaagact gaagtgagct atgtttgtgc cactgcgctc 480 cagcccaggt gacagagcag gatcctgtct ctcaaaaaaa caaacaagaa aaaaaaacaa 540 aaaaactcac actcaaaaat ttttacatga ctgtttatag tagcattatt cataatagcc 600 aaaaagtgga aactacccaa atgtctatca actgaagaaa ggataaataa tatgtggtat 660 atccatataa tgtattattt ggtcacaaaa aagaatgaag tactgataca tactacaatc 720 tgaatgaact ttgaaaacac gttaagtgaa agaagccagt caaaaaaatc atgtattata 780 ttagtctatc tagaacaggg aactctatag agacagaaag attagtagtt gccggggctg 840 agggctaagg gaatggtgag actggaaggt gatagccaaa gggtatggag ttgctttttg 900 aggtgataaa aatgttctaa aattgactgt gagtgatggt tgtacatatt tgtgaatata 960 gtaaaaacca ttaaactgta tgctatatgc ttaaagtata ggctgtgtga attatatctc 1020 aataaggctg tttaaaaaaa tctaagtgga tgcagtgacc atctatttcc ccagtgtcct 1080 gtagttgctc tatgggctct tgaacaaaat agttgcatga tggaggctat atatagactt 1140 aacaatatgg atctcctctt accaaagttg gtctgacctg cagagtgtcc aactttccag 1200 taaggaagat caatgttgaa cccctagtat agtgccatat tccaggggct ctcatcttcc 1260 atctcgttgc aggtaggttt atttttgttc ccttccaaaa gggagggggc aagagacatt 1320 ggttatagat tttctttact gctggatata gattctggtt acagattttg tttatagatt 1380 tttatttact gcttcaatgc ttttattagc agacccctaa ccactcctgg gaccacacat 1440 acacccatag atgtagtcaa tgccttgttc atgagcatag tactccacaa tacattgctt 1500 atgacaaaga acttaagtta atgtgaaagg agtgaagcaa ggtctcaaga cccataggac 1560 aaatatatat catatatttg tcgctcagaa atccatgact ttataggaag gtgaaatgga 1620 taattgaaaa ctcagtttga gagacgtctt gtgaattggc atatgaattg gtaaatgctc 1680 caattggtaa atgcttcact aagcctaggg ccaatatatg gtgctatttc ttccacagac 1740 agaattcact ggtctaggat acaagaagta gaagtgggag gggcaactct gactgttacc 1800 catagtgaac aacttatgac atgtttttgt ttcccatatg cttggccttg aattcttctg 1860 gtttataaca aaaatggttt ccaaaaattg gaagtcgagg ctctctcctg accatttgga 1920 gcgcctcatg ccatttaact aacaaaaaga aaatgaggtt cttatattgt ctagggtgat 1980 tcattctgat tttcaaggcr taatatagtt ataaatacaa tggggtcagg tggaagaatt 2040 cttggtatcc tctggtgtgc ctcttagagc ttctctattc agtgataaaa attaatgtaa 2100 ggttaggtca agcggagaca ggaaacacca aaaggactca aactcctcgt ggataaagag 2160 ctgaagtgct ggctggaaag aaagtgaatg ttgagtttat aatgaaggaa gaagtcataa 2220 atattaacta cagcttcatg actagttgac ttgttgcaat tatgaggact gtggtaaata 2280 tctttttttt ttcttgttct atttatgcac atctttatat ctatacatta aaccccttct 2340 ctctctctct ctactatttt atccaatgtc tgttggtaat ggttaatttt aacacctatg 2400 tcttagatta tattattcta tggttgtga 2429 <210> 13 <211> 778 <212> DNA <213> Homo sapiens <220> <221> allele <222> (391)..(391) <223> m = a or c <400> 13 tcactgcctg atcagtcatc tttagaacat aaacattcca gaagttttca ggagatgaca 60 ggcacaattt cctgaaggcc tgcctagaat tgatttgcta acatgaagat agatggctta 120 atgcccttaa tctctctgtc tatggatttc ttctctcatt tttgtaacat cagtgctacc 180 accaccaaca gtaataacac tgcaccaggc actgagggac ttttatctgc attcactcat 240 ttaatttgcc cagctcttct gtgaggaagg tactgtgcat tatggtcttc ctcttacaga 300 ctgaaaaaac gaagccttgg acacctgaag gagattgcca ggcagccaat ggtgaagctg 360 attttgtacc cagacagtct gagtgcagag mctgccatta ccctccaaca gaaaaccaag 420 agcaaagcca tgggagagag gagctaatga aagaggcaga ccaattagaa gctgaggcta 480 tactttatct tcttccttct tccctcctcc tcctccttct ggccggcatt catcaaacat 540 tgaacatata tgaacattaa cttatgttag gcactatgtt caaagcttta caacttactt 600 aattcccaca gccaccaagt aaggtaaata tttttattat cgcattctac agatgaggaa 660 gctgaggctt tagaaagttg catctcttac tcgaggttac aggtttggta agatgcagag 720 ccaggaacat tttggtagca tttgaattcc tgccgtattt tgctaaatgt gcccttgc 778 <210> 14 <211> 1001 <212> DNA <213> Homo sapiens <220> <221> allele <222> (501)..(501) <223> w = a or t <400> 14 ctaacattaa aaaggacatt gaaatagggg gctggaaaga taatgaatgg ccccctgggc 60 acaagatggg tcatggggat actgtactcc tatttatatg ttaaaccaca tcataaggtt 120 gcaagcagtt ctggaaatta tagtcaatga aacagcctga gccttagact tgctagccat 180 acaggcaacc cagatgagag atgccattta tcagaacagg ttagtactga attatgtttt 240 agcttcagaa gggggtttgt ggaaaactta atttaacaaa ttgctgctta caaattgatg 300 acaatggaaa agctgtcatg gaaatcactg ccaggatgcg gaagttagct catgttctgg 360 ttcagacatg gtctggttgg aacccgagtt cactctttgg aggacggttt tcatggtttg 420 gaggctttaa aactgtaata ctaggctttg tggccataaa aggtggatgc ctactgcttc 480 cctgtctctt gccatttcta wtcggaagca tccaatccac catagactca atggtagaca 540 gacataccac catccgaata aaggctctgc aaaagtacca actggtatcc caagatgagt 600 atgtacccac tcaagaagaa atagctaact gtggtgctct ttattaatct acatttgtgt 660 cgagcaccaa aagggggaaa tgaagaagga attaatgaaa tcaactataa cctaagagta 720 gtagtaatac aaattttaaa atccttttaa agttcctgca aaatgtgacc cctgccttac 780 attcacgtta aaagggaata ttaacagcct gtcttctctc tgtggacagt ggaccttatc 840 tatactcccc aactccacat tcctcaaagt ttattacagg cccagtgagt tcctgcatga 900 ctgcagggtc acaagactga taagtttagg ctgcaagaca tgtctttctc aaaatgtaac 960 aaacgttgta atactgcctt tgtttcttgc ttctgtaact c 1001 <210> 15 <211> 7028 <212> DNA <213> Homo sapiens <220> <221> allele <222> (642)..(642) <223> k = g or t <400> 15 catatgaaca aaggtctgag ttgggtgagg caggatgcca cacagacatt ggaggaggaa 60 aatctgagca gggggcacag caaagcccca aggctgaggc cagatgaagg agcaggaggc 120 aatgtggctg gagaggaggg agcaaggggc agagtgttgg tggtgaggtc aggggcccag 180 cagcctgatc caggggactt gaacaggatg gaaggacttt gggtgcgttc tgaagaaggg 240 gaagccactg gaaggcatta agtagaaaaa attggaagtg agagtaatta tatgtgaaag 300 ttgttagagt cacaatggag tgacgatgag gcaggacagg tagtcaagga agtaagtgca 360 gttaacacaa tgagccccag tattcgcatt gtaatccagc tcatgcaagc acagctatct 420 cctgcaggga atatttccca tagacagcat ttgcactttg attttacctc ttctcaaacg 480 gaccctgttc tcatgataat agtaaaaaac acacccctag gtggagattt aagatgctga 540 tgaattatga gatgtatgaa caagcatgta cagctactgc acatgtgcac ccagaggacc 600 accgaggaca tgcttactag caacaccttt tctcaccctc tkatgaataa tcatgtaaga 660 gtcccataaa aggatttctc cagcaataat cagtgctgtc cattcagtgg ctcatgcctg 720 taacccagca ctttgggagg ccgaggtggg tggatcacct gaggtcagga gtttgagacc 780 agcctggtca acatggtgaa acctcgtttc tattaaaaat acaaaaaaag tagccaggtg 840 taatggcaca tgcctgtaat cccagctact tgggaggctg aagcaggaga actgattgaa 900 cctgggaggt ggaggttgca gtgagtcatg actgtgccac tgcactccag ccaacagagt 960 aagactctgt tccccctcgg ccccctgcaa aaaaaaataa taacaatgat aagaggcaag 1020 atcaatggcc accaaaattt tattttttcc catagcgttg ctggggtggc atggctgcct 1080 gccctgggtt catcctgtcc ctaagtggaa ctccctatgg ctgagggact cagaatcaaa 1140 tgacttatag ccaattaaat gttctagtcc agatgcccaa ttaaatgggc atggacagac 1200 attcattagc ctttaaatta ttttctaagt aaaaagtcaa caaacaaaaa gttaaaggtg 1260 aggttacaaa actgactttt ctttaacttc tatgctactg taatcttggg ttttgttatg 1320 gacttatagc aattatttat acaaaacata agaattgttc tgaaaaaatt aaaaaatata 1380 tacctgcatg gctcataact ggaaatatta taccaggagg ctttgtcact tggtatcttt 1440 atccttttac ttattatttt cttttaattc tacaggaagc agtaaattct ttatggttgg 1500 agtggatgaa gaggtgccat gtaatagctc agaaggcaaa gtcccttgtt ttaccagctg 1560 tttaggcatc catgtactca tccttgattt gaagggtttg agttaattct atccttccaa 1620 atcagccctt acaatctcac gtgcccacct cttctgcaac agtctctggg cctagaggga 1680 ggacgcttgc aatacaggat tttttgcatg ttcccagtgg ctccacccca ttctcccagt 1740 gcacatgcag gcccttagtc tgaacccacg ctacattgat ttatttccct tactgagcat 1800 gtgttaaggg atggaatttt tcaccatggg catgtttagg caagccccct gtacacaatg 1860 tcctggatgg catttggctg tcttctgcct ctatcattcc cccatctaaa agagtacatc 1920 taactgccat tagaataagg ataagaagaa agacaaagac ccatcttaac tgctttctgc 1980 tgacagaggg cactgttttg gaaagacagc agttgggtct ccctcagagg cctatctaag 2040 ggtatctggt aaaagggacc atcattcgag gctctggttg cataactgtt tggagtttga 2100 gggcctgaag gcgagaagag acaaaccagg ttattagaag acatgtacca aaatgaaatg 2160 ggggaagggt aaggacagtt caaaaatcct gaggctgctg acatgcccag ataactggta 2220 gctgtagttg tgcctgctaa gatttgggtg catgggactt ggctttggtt agctcccgta 2280 gtttattttc ccaaaaaaga aacctctggg ttatgggcac cctatttact cccattatct 2340 ggcaggattt gtaggataat tgttcagaac tagaatactg ttccagattt ttacattacc 2400 catgcctttt gtttcttctg agctgcagcc agagatcact ggttagttca caggaataag 2460 cagggttaat ttaaaatgta ggcaaaaaac ttaaaaacaa ctaatgagtc tagaatttaa 2520 tgacaaatgt atgataagtt ttgaaacata atttctttct ccccagtcct catttttgtt 2580 aaaaacaaat cataatagga gtgagttgtt tgtaaaataa actttagtct tacacttggt 2640 ctgcttattt gcacaaagta caacaagaat aattattttt acataggctt tttaaattgg 2700 ctttgatgga actctgttcc acaaggaatt tcagatagga cttcataaaa atgagcccag 2760 ccatgggttt gtaccctcta atacctatga gttgggtgaa ttgctctctt cttgaggtcc 2820 caagaatatg cggttcctgg ccctgttaga aagtgacatt ctttactcac tacaggttag 2880 ggaacctgta tggggactgt gtagacaaag tatgaggctg gtttacccaa ggggctttta 2940 ttggctctgc aagttgagct tgattcctta aagggaaaca tacccttcca gtcaaagtta 3000 cagttactgg ttggtaaagt taaagttaca gctactggtt gctaaagcaa ccagtttctc 3060 caattgcatc ctgttgcaaa agaaagtgga ttcttactgc actgatgcaa ataaccgtat 3120 tgccctaagt taagaatact cacagatagt ttccaaattc tagaggaagc aggcagagag 3180 aaaaaaaagt gctaaatttt gttcatagga gtctgcatta ctcaattatt aaagattgtg 3240 tatagctcaa aaaaaaagat cagcactgtt ttaagctaaa gtttaaaaaa gattacttca 3300 attttctatt agttcagtct gttcagttaa ctcttgttct gcttgatatt tgtgaacatt 3360 tcagctcttc atgagtcctg tacgtttttc cattattcca atgtcacaat ctccaaagtt 3420 atcagaaacc tgcatttgag agcacctgtt acgtttctat agctgattat aaatcctatt 3480 tgaagaagat caaaacaaaa caatggtctg tgaatagcaa aatgtccatg gtagttacag 3540 tcaaaaacac aattgacaaa gaaattttgt tatctctgtg gcttataatc acctaacata 3600 acacctttaa ttgtgagtga tagcatatac ttagatatta gaattttaga aatcccatac 3660 agttttggag catatattat tattcactaa aatataaccc aaagaagatt aaatatcatt 3720 ttggcaatcc catgtacata aatttgtcag gtaatcctat ttacctctct tctggatgct 3780 ccagggatgc taggggtcag gaaagacaac cttgaagctg acatttgatt ttgggaagcc 3840 cattaaatat gttagaggtt taaaacaatg ttatgaagta gaattccaga ttaccataaa 3900 ttacttattt tgccaaaatg atgactcaaa aattttaaaa caagccaaaa acttttactc 3960 atttagaggg aagacttaga tttccaaaga atttgtctcc tgtcttcact ttcatttcct 4020 tggcagtcta tctggaagac aaactgaaat atttaattat cctttactat tacatgaaaa 4080 tcttatacaa gggagagaaa gccaaatttt accctcacat tagtttacta ttaatgtcaa 4140 ccccaatttt ttaatgaaac cttatagaca attctatcca atcttaacca gtttgatcat 4200 gaggtaagat tcctgtaagc cttttataac cttttacaaa ttactaattt actaatctgc 4260 taaagagcag attagggctt taagaaaacc ttgttgtgct ttcatttcaa tgctcagttt 4320 gtagaaaaac catataatag agttttggat ttaatcaatg ttcacacaca gaatttcttt 4380 tgcaagatta atttttagaa acctcccaca acttgtttaa acctttagtt tatcttatct 4440 aatttataat agtcctttaa ccttaggcaa aaacttacat ttccatgcat tcttataatc 4500 tttgactaat aacacatttt actgttctta cataccttgc atgtaaatct attttcagtg 4560 gtctcaatta catgttataa tggtacctct tagcactttt taattttagt ttaaaacctg 4620 gtaagtcgtt ttaattacgc actaggtgct gataaagttt gattccttcc agcataatta 4680 agggtgtggt taattccata tgtccctgtg ccttaccaag ttgtaaagca ggcagattga 4740 acagttttca aaggcaaaag aagccgttta caaccttaaa acatttagcc acctagtgcc 4800 tgacttgcat aatttagacc agctatttac attttaagaa catttgcatt ttatcaatta 4860 tctttaagac tacttttatt tctcagagat taaagtcaca agaactaaaa ggcattatag 4920 cttttatctt tcctccaaaa atatttgatc ttagtgctga tttttcttta agccaattaa 4980 ttagagctct tttttataac tacacagatg gagaagaaga ttgagtgtta taagattttt 5040 catttgccca tctcctaatt ggattcttgg tctctgggtg ggacccttta agagcagggc 5100 taagaaagca tgcagtttat tttctttttt tctttttctt ttcttttttt ttgagaaaga 5160 gtttcactct tgttgcccag gctggagtgc aatggtgcga tctcagctca ctgcaacctc 5220 tgcctcccag gttcaagcga ttctcttacc tcagcctccc aagtggctgc atgcagtttc 5280 tagggcctaa taaacaggca tagctggaaa acaaaaacgg attttgagag cgatctattt 5340 gcctctaatt cctggggttc catgaggaaa acagaggttt ctcccaaaat ggaatccatg 5400 gtgccttttc tgtttttacc aagcagccct atgccatcag aaattatctt agggcctctc 5460 atgtgcgcat taacactggc aagacaaggt ggagaaaagt aattcagtca actgagaaaa 5520 aaatcttttt ccagcaaaac aagatccaag aagagaaaaa cataaaggcc tttcaaatat 5580 acgtatagct tggatatcca cttttaatta agctgagctc tctttaagaa agtcctttta 5640 aatcccacat tacctgactt cagccatgcc aagcagccaa tatttctggc tttggaagtt 5700 tatcaaaaga acctcaaggt tcaaccaaca agcctcaatt aagacacgcg aagcacacca 5760 gattggctac accttaagac cagcctcata aaaccttttt cactaatgga aactttacag 5820 ggaatatcaa cagtgatcct tatcattctt ttcaccagtt tacacaggga gagagaggcc 5880 aaaagtctga ctggttaaaa aacttttatc cttttgctgg catgtcatgc ttctgggttc 5940 ccttcccctg agctcaattc taagccaacc agtttaaggt ttgggaaatt aacttttctc 6000 agtttggagg atgcatccta tgggaatgtc ctttagtaca gggacacagt cacccatctg 6060 tgaagagagg acaaaggagg aaaaagtaaa aaaagatttt tttcaaaggc tccccagggg 6120 ttcaggatgc atttgaaagg gggacagatt gaagatgaat ggctactcat ctagaaagag 6180 gggagccaga catccctggt tcctttctct ttctaggaaa tagccagggt atgtgaggga 6240 aagaaggaac aagcatccat tttccttctt ccgtccttat gtccccaagt cctgacaacc 6300 tcgacagggt gccacccatg ggtgccaata cggttctcac ccatggtaac aggggaccta 6360 gtggatggga ttatccactg ttacccacaa actgtctttc cccctgctct caatagcctt 6420 caagtgccct agacctcatt taggccattg atactagtat gacctttatc catgaaacaa 6480 gaggcttggc ttaattgtca ggaattagtc atgctcacct atactgtgct ttttaatttt 6540 tgttgttgtc tgcctctgga tccctccgat gcagttatct ttcctagggc ttctacatga 6600 agcttggaat tgagtttggg acaaaagaac tgcctcagta ggtgggtgca tggactcatc 6660 aatccccagg tgtccctcac cagtctggct gctgccgcct tatcataagc tgaaggctaa 6720 ggtgcaactg tgaaattagg tccttctcaa acaagggagg gaaaatggtg tcctgtgaat 6780 tagggtcctg gtctaataag atgccttcca aaaggaagaa aacttctggc acagagaaga 6840 cccctctacc cgcagggctg tgttattagg ttggtgcgaa agcaattgtg gtgcccatca 6900 ttctaagtaa tgacaaaaac cacaactact ttcacaccag cctactaact catgacttgg 6960 tggacaaaag aaaataacaa caacaacaac agcttaaatg cagggctgtg tttactgctg 7020 acaaggtg 7028 <210> 16 <211> 1656 <212> DNA <213> Homo sapiens <220> <221> allele <222> (1001)..(1001) <223> r = a or g <400> 16 gggtatatac ccaaaggaaa taaagtcatt acctcgtgaa gatatctgta ttcctatgtt 60 aactgcagca ttattgacaa tagccaagat atggaaacaa actagatgtc cttcaatgga 120 taaactatga tatgtacata caatggaata ttattcagcc tttaaaaaga ggaaaatgag 180 gaaatcttgc tattttccac aacatggatt gacctggagg acattatact aggagaaata 240 agccagagac aaaaagaaaa atattgtata atttcactta tatgtggtat tcttcccaaa 300 agatcaaata tatagagaga atgaaacagg gttaccagtg ctggagtctg ggaggggaga 360 atggggagat ctaggtaaaa ggttacaaag tagcaaatat atagaataaa caagtcaaaa 420 aatgtgttgt acagcaacat gtggattaaa attaataata gtgttatata caggattttt 480 tctaaactaa gtatattata gctgtttgcc acaaggagaa acatggtata ttagctcatt 540 ttgcattgct gtaaaggaat acctgagatt aggtaattta taaagaaaag agattgattt 600 ggctcaccgt tctacaaacc gtacaagagg ctcatggttc cacaaaccgt gcagcttctg 660 cttctggtga agacttcagg aagctttcaa tcatggtgga aggtgaaggg aagcaggtgt 720 gtcgcatggt gaagggaagc aggtgtgttg catgatgaag gtgggagcga gggcaagggg 780 tgaggtccca ggatgtttaa gaaccagctt tcatgtgaac aaacagagca agaacccatt 840 cattactgca aagagggcag caagccattc atgaaacatc cacccccagg actcaaacac 900 ctcccaccaa gcctcacctc cagcactggg gatcacattt caacatgagg tttggagggg 960 acaaactata tcaaatggta actgagaaga ttaataaatt rttccactat agtaaccatt 1020 ttactacaca catgcatctt ataacatcac gttttatacc ttaaatatac acaatacaat 1080 ttttttttaa aaaagctagt tagatatgga atttaccaat gagtgaatgt tttccagtaa 1140 ttgtgtagac ttcagagctc tttctggcga gtacatatgg cctccaactt aataaggttc 1200 gacttaaggt tttttgactt acgatggatt catcaggatg taacctcaca ataagctgag 1260 gagcatccat atgtacctcc attcatgctg gataaatgga ttcttttttt tttttttttt 1320 tttttttttg agacacagtc ttgctctgtc actaggctgg agtgcagtgg catgatcttg 1380 gctcattgca gcctccgcct cccggattca agcaattctc ctgcctcagc ctcccgagca 1440 gctgggatta gaggtgcatg ccaccacacc agctaatttt tgtattttta gtagagacgg 1500 ggttttgcca cgttggcccg gatggtctca atctcttgac ctcgtgatcc gcccgcctcg 1560 gcctcccaaa gtgctgagat tacaggcatg agccaccgcg cctggccaac aaataggctc 1620 tttaaggcac tgctcttctt tgtccctgag agcaga 1656 <210> 17 <211> 936 <212> DNA <213> Homo sapiens <220> <221> allele <222> (436)..(436) <223> y = c or t <400> 17 tgagtgtcac ttcctaggta ttgtttcttc tccctggctg gtggtcaagt ccagaagtcc 60 tgtcccagaa tttcttcaaa aggagagagg gagtaaaatt gggtatggaa aaaagactca 120 cattgacaaa aaagaatttt agagtcttct ctaaaatgtt gcggcaagta gataaaacca 180 tgaaaaacca ggatgcccta tgtgattgtt aatattaagt gtcaacttga ttggattgaa 240 ggatgcaaag tattattcct gaatgtgtct atgaggatgt tgccaataga gattaatatt 300 tgagtcagtg actgggagag gcagacccac cctctatctc agtgggcacc atctgagcag 360 ctgccagcgc agctagagta aagcaggtag aagaagatgg aaagaacaga cctgccgagt 420 cttctggcct ccaccyttct cccttgctgg atgcttcctg ccctcgaata tcagactcca 480 agttcttcag cttttggact cctgcactta catcagtggc ttaccagggg ttctcaggcc 540 ttcagccaca gactgaaggc tgcactgtca ctttcgaggt tttgagactc ggactggctt 600 ccctgctcct cagtttgcac acggcctatt gtgggacttc actttgtgat tgtgtgagtc 660 aatactcctt aataaactcc ctttcatata tacatctatc ctattagtcc tgtccctcag 720 gaaaccctga ctaatacacc ctataggcag atgagcctat tttacctggg gttagatcaa 780 agttgtttga gggaaggggc aacagaagag agctaacttc tcatgtgcca atgagaccga 840 aggaaagatt ctaatggaca cacaagatgc aatacagaaa tctggagaaa tggttcaata 900 gggaacacac agctcctagt gaggattaag cacccc 936 <210> 18 <211> 938 <212> DNA <213> Homo sapiens <220> <221> allele <222> (363)..(363) <223> s = c or g <400> 18 tgggggtgct taatcctcac taggagctgt gtgttcccta ttgaaccatt tctccagatt 60 tctgtattgc atcttgtgtg tccattagaa tctttccttc ggtctcattg gcacatgaga 120 agttagctct cttctgttgc cccttccctc aaacaacttt gatctaaccc caggtaaaat 180 aggctcatct gcctataggg tgtattagtc agggtttcct gagggacagg actaatagga 240 tagatgtata tatgaaaggg agtttattaa ggagtattga ctcacacaat cacaaagtga 300 agtcccacaa taggccgtgt gcaaactgag gagcagggaa gccagtccga gtctcaaaac 360 ctsgaaagtg acagtgcagc cttcagtctg tggctgaagg cctgagaacc cctggtaagc 420 cactgatgta agtgcaggag tccaaaagct gaagaacttg gagtctgata ttcgagggca 480 ggaagcatcc agcaagggag aaaggtggag gccagaagac tcggcaggtc tgttctttcc 540 atcttcttct acctgcttta ctctagctgc gctggcagct gctcagatgg tgcccactga 600 gatagagggt gggtctgcct ctcccagtca ctgactcaaa tattaatctc tattggcaac 660 atcctcatag acacattcag gaataatact ttgcatcctt caatccaatc aagttgacac 720 ttaatattaa caatcacata gggcatcctg gtttttcatg gttttatcta cttgccgcaa 780 cattttagag aagactctaa aattcttttt tgtcaatgtg agtctttttt ccatacccaa 840 ttttactccc tctctccttt tgaagaaatt ctgggacagg acttctggac ttgaccacca 900 gccagggaga agaaacaata cctaggaagt gacactca 938 <210> 19 <211> 1239 <212> DNA <213> Homo sapiens <220> <221> allele <222> (458)..(458) <223> r = a or g <400> 19 tctctgctgt ggcaccagga ctgcacgaga tctggtctct gcacatcttg gtgtctgcat 60 cctggtaaaa aatggccccc tttcccacac ctacccatgg aggaagatga ggcagcaagt 120 tgtaagaaat taccagaaaa gcctcactcc tgatctcctg acccaccccc tcatgctctc 180 agtgcttcta ctcttgcttc attaatttat ccaacaaata ctaattgtcg gctaggtacc 240 aagttctgtt atagataatg aagatatggc tgtggaaaaa gaaccagaaa cctgccttta 300 cattctagtg gaagaggagg aagataaaca ataaacaagg tcaacaagta actacagcat 360 gtcaggtgat ttaagtgctg ggaaggaaac tgagtggtat agatcattgc agagggtagg 420 ttgcaatttt aaatggaata gtgaagttag cctcactrat aaggcagtct tccagcaaag 480 atctgacaga ggtgaggaag tgaatctatg gaaacctggg ggtacagcct tccagcaaat 540 aacaggtgca aaggcccaga agcctagggc atttgtattt gagggcaagc aaggggtctg 600 tgtgctggag aagagtgagg aaggtgagaa ttagggagtg aggcctggga gattatgagg 660 aaaggaaaca gatcatacag cgccttggag gccattataa agactttggt ttttaccctt 720 atgagatggg aagctattgg cggttttaga gcaggaaagt gacatgatct gatttatgtt 780 ccaaggctca tgctggccac cttgttaaga caaaactgga gggaggcaag cagagcgggg 840 acaccaatga ggtaaccata gtgaccatcc agaggagaaa tgatggtggc ctggaatagg 900 tagttctgag aagtgttgta ttttggaggt agatcaatag aatttattgg tgcattgaat 960 atatatgatg tgaaagaaag cggggagaca aagataacct caacgctttt ggcctgagca 1020 gctgtaagac tgggattgca tttgatcaca gggcaagctc agtcgggctc aaaactgttt 1080 gctccttcct ggctggaact tcgtgtgggc ctaagatgtt taactggaat ttcatctggc 1140 agacttaaac attgtgttct tcttttaaaa gctcaaataa caaatattcc aaaatgtaaa 1200 gcaaaaaaag gatttattga aatcatgtga caatatatc 1239 <210> 20 <211> 801 <212> DNA <213> Homo sapiens <220> <221> allele <222> (401)..(401) <223> r = a or g <400> 20 aaatatttaa taataataaa tatataaaaa gtatattcat ataaaataga aatgtatgaa 60 aaatattcac ctttatagaa gttttaaatt gtcaaagcaa tgtcaattta attggctcaa 120 taagagagtg aaaaaccatt gcttcaggac cgcctcagtc tgtaatgcta ttttaaaaaa 180 attatttcaa cattttctta aatactattc cttggttgtt aaatttttat tttgctgtat 240 tagaagaatg aaggttgtta ttagggatgt tacattcaga aataaagttc tgaatttcat 300 agaacacttt attctctgcc tcatctttac atttcaattt ttcgggggga atgtcgttca 360 aatatagttt acaaatgaaa tataaaggat aaaagaatgg rtaaacaaag aagtccccaa 420 ggtgtaacag tgaatattgc tttaagaaaa tacaaaaaca attttaaata agatccttca 480 aacacgagtc atcctgttct cagggagctt tagaatttcc acattgctga atgccaaatt 540 ccacaagtca tggaatttcc acacatctct cttcacttct ctgacttctt ctgtctaaca 600 tgggctgata tatttcagcc actacacagt agctggagtg tggtgttaga gcttcaattt 660 caaccgctct gtgagcccct tcataaacct tttgctccta cacacgagag agaaaataat 720 cagttggtaa atggctgcca ttaagtcaca gctgcatttt tgtttaaatt aacaagttgt 780 acatggtcac agcagtagat g 801 <210> 21 <211> 1715 <212> DNA <213> Homo sapiens <220> <221> allele <222> (219)..(219) <223> y = c or t <400> 21 tcctatatag agatgaggaa ggcgccacaa gcaagacact cttggccaga aggattgagt 60 aatgaggttt cctttcttct ttgtcactaa aaaaattaca tttaattttg agaataaaga 120 taagttcttc taagacagga ttaaaaacta aacaaaacaa aaacaaacag aaaagaaaag 180 cttaatatat cttttaaatg agggacaatt gtacagagya gacttccttg ttgttgatag 240 ttttaattca gatatcaatc cagaaatcat aagatttttt tccccaaaac ctgttcttat 300 ttacataaag tagactttaa aacaaaattt tgattcatta agtagaaata tttaataata 360 ataaatatat aaaaagtata ttcatataaa atagaaatgt atgaaaaata ttcaccttta 420 tagaagtttt aaattgtcaa agcaatgtca atttaattgg ctcaataaga gagtgaaaaa 480 ccattgcttc aggaccgcct cagtctgtaa tgctatttta aaaaaattat ttcaacattt 540 tcttaaatac tattccttgg ttgttaaatt tttattttgc tgtattagaa gaatgaaggt 600 tgttattagg gatgttacat tcagaaataa agttctgaat ttcatagaac actttattct 660 ctgcctcatc tttacatttc aatttttcgg ggggaatgtc gttcaaatat agtttacaaa 720 tgaaatataa aggataaaag aatggataaa caaagaagtc cccaaggtgt aacagtgaat 780 attgctttaa gaaaatacaa aaacaatttt aaataagatc cttcaaacac gagtcatcct 840 gttctcaggg agctttagaa tttccacatt gctgaatgcc aaattccaca agtcatggaa 900 tttccacaca tctctcttca cttctctgac ttcttctgtc taacatgggc tgatatattt 960 cagccactac acagtagctg gagtgtggtg ttagagcttc aatttcaacc gctctgtgag 1020 ccccttcata aaccttttgc tcctacacac gagagagaaa ataatcagtt ggtaaatggc 1080 tgccattaag tcacagctgc atttttgttt aaattaacaa gttgtacatg gtcacagcag 1140 tagatgggtt gtggggtttc ttcccagaca catccttctt ttctagagtc ctaggccata 1200 gcctggtaaa gggacaaggc aagtggctgt gtaggtgcaa cttgacttct ccttgagggc 1260 tgttggctgg ttgaccccat ggtcagagtc ttgtttttaa gaattttgtt tgttttttga 1320 gatacagttt cactccatca tccagcctgg agtgcagtgt caccatctcg gctcactgca 1380 acctctgcct ctcaggttca agagattctc gtgcctcagc ctcctgagta gctgggattg 1440 cagacgcata ccaccacgcc tggctaattt ttgtattttc agtagagatg gagtttcacc 1500 atgttgacca ggcaggtctt gaactcctga cctcaaatga tttgcctgcc tcagcctccc 1560 aaagtgctgg gattacaggc atgaaccacc ccacctggcc ttctttttaa gaatttgaag 1620 tgtgcagtga gaatgatgtg cagcgagatg agcagagata actgcaggca tgaaactgtg 1680 gccacataga gacagaaagt ctgagagaca gagca 1715 <210> 22 <211> 1231 <212> DNA <213> Homo sapiens <220> <221> allele <222> (201)..(201) <223> y = c or t <400> 22 agctgcggac atcacagggc tcctggctta tgatctgtga tgctagattt tgcaattgat 60 tgcaaaatca gttttgcaat cagttgcaag tttcttgacc cattcactgg attgtgattg 120 tgttacaaga ccaagtcaag attatttgac ctcatagcac tttactcttt aacagctctc 180 tccttgaaat attaccttcc ygcactattc atgaacatat cagcccacag atttcctcct 240 acctctttgg ctattccttc tcagtctcct tttaagattt ttcttactca ggcatctttg 300 ggtgaaagtc cctcaatatc tggtcttact caaaactgcc tctcactcac tactctctcc 360 ctaggcaatc ctatcaatgt ccactgtact gtatgcatga aatgactcac aaatttttgt 420 ctctaataaa gactttactt tgagtcttgg atctgaagag atatgtcccc tggatctctt 480 aaaagcatat taagcttaac atattcaaaa ccaaactcat aatctctatt accttgcatc 540 ccaccaaact ggtctttttc atcaaacccc atcaaaaaga tctcagcaat tcatctaatt 600 atgcatgcaa gaaacttaga ggtcatcttt gacatgtcct cttcaccatt atatccgatc 660 tatcacctgg tcctgccaat gttgcttact aaatgtccct ccaggaataa attttctcta 720 gtccttttca taagccaaat tcggtctcct gtagactatt attagtaacc tgctacttca 780 cttatctgca tccaacctgt tccccaaaat atagtcaaaa tgatcttttc tatacacaag 840 tctgatcata tggctcctaa ataaaattat gtttttctgg aggaagtcac aactccttaa 900 aaaattcttg tacctgccta cctttccagt cccatctcat tatggactcc ttcctgcatg 960 ctcttcttca atatattggt tatctttcag tcccttgagt ttgctatgcc agagggcctt 1020 tgcaaatgct ggtcccttgc ttgaaatgct ctattctttg cctcaagtga tcctcctacc 1080 tcggcctccc aaagtgctgg gattacaggc atggagccaa cacacctggc cttcacatct 1140 atttttaatc caagtaattc tagggtcaaa taatactgaa atctcgctaa gtatcaaacg 1200 ctgcttttaa ctgaagaaag tttactttgt t 1231 <210> 23 <211> 511 <212> DNA <213> Homo sapiens <220> <221> allele <222> (256)..(256) <223> y = c or t <400> 23 tttcaacatg aattttggtg gagacaaact caaaccatag cagcttggga gtcctcttta 60 ggaaaagatt tataaatata aaatccttgc attggggtcc tgaagtttaa tcttcattag 120 attcatggta aaacagtttc taatcttctt agtactttgg accacaaata ggtccacttt 180 tgacctattt atactactcc aggggaagca taaaaagagt accaatcttt actttctgca 240 tgctgaaagt atctcyagca atgcacaaat ctacttttgt aatggagaaa ccttcattgt 300 aaagatttgt acattttaca atcgctacat aaaatatgta gagagaagtc gtagcggtta 360 aagatggaga tgcttctggg gatattcctt ccgaaattaa ttagcaggaa aatctgacct 420 aggacctacc ccatgctgga gagacatgga tgaatttatg ggataaaaat tgctactttg 480 gccatagctg catttgattt cctgaatttc t 511 <210> 24 <211> 701 <212> DNA <213> Homo sapiens <220> <221> allele <222> (201)..(201) <223> r = a or g <400> 24 tcatgctaat gaggaaaact gcccaagacc ctgctggggg gtagtgtttc tgagactaat 60 catggcatgg catgggataa ttttgcactg gcatgacttg tgctttcttc ctcaaatcag 120 gcaacatagg tggtacaacc ttgcttgcct ttagttgcat ggaggcaaga gaattttggc 180 aaaattttac ttagggttca rggtttttta taagggataa gaagttgggc agaaggagga 240 gtcaagaagc atatcttttt tttttggatg gagtttcact cttgtcgccc tggctggagt 300 gcagtggcgt gatctcagct cactgcaacc tctgcctccc ggattcaagc gattctcctg 360 cctcagcctc ctgagtagct gggattacag gtgcccgcca ccatgcctgg ctaatttttt 420 tgtattttta gtagagatgg ggttttgcca tgttgggcag gctggtctcg aactcctgac 480 ctcaagtgat ccgcccacct cggcctccca aagtgctggg attacaggcg tgagccactg 540 cacccggcca ggaagcatat cttctgtttt ctccctgacc tcatcttctg tcaccccgac 600 ccctgtgttt gcagtgttga ctccttcact tgctccacca tgactccagt gactctgcct 660 tagggcctct gcactggccc ttcccttttc ctggtctgct c 701 <210> 25 <211> 801 <212> DNA <213> Homo sapiens <220> <221> allele <222> (401)..(401) <223> y = c or t <400> 25 ttgttctgta tgaagtctct gcaccctcta gagagccttt tctttagtgg gaactcatta 60 agtacatgtg gggtcattca agctgcagat agacactaac cccatgcctg ctctgatcat 120 ttagtgacat caaaagctgc agcctttata aagttcaaaa aagcaccagt gccatttcca 180 acagatcctt gattggactc agatgacaaa gctatgagca attaaaaaga aacaaagcac 240 ttacctgcta caccagtaag gaagaaactg atgaggaagc ctagaaagca atgtttaggc 300 atcatggttg caagtgtgac tgttcaggca accagtgttc cttttaacca gctcaggacc 360 aaagaggaaa ctgtaaaatc cacaaacaga caatcactcc ygggtttaag gcagatggtt 420 ccttgaagca actacaattt tattttgata ctacattata ttattttatt ttaggaaaaa 480 tatgaaagta taaaaatcac ttcaaaaaac atttgctgtc acttttatgt ggaagctcgt 540 tttattggga agctcgtttt ttgttggggc ttcattagct gcagaaaggt aaaacactga 600 ggatgggcag atctgaaggg cagggcagtg cagggattgt gcaagtggca agcaggtgag 660 tgaatgaaac aactagtggg gccttaaggg aatctggccc caggaggcgg agaggctgcc 720 aaggactagg acttggctgc cagggtgatt ttgagtaatg tgcttggcat ttgcagctat 780 cggggcccct ggcagtggtt c 801 <210> 26 <211> 2172 <212> DNA <213> Homo sapiens <220> <221> allele <222> (2033)..(2033) <223> y = c or t <400> 26 tgcctgatca gtcatcttta gaacataaac attccagaag ttttcaggag atgacaggca 60 caatttcctg aaggcctgcc tagaattgat ttgctaacat gaagatagat ggcttaatgc 120 ccttaatctc tctgtctatg gatttcttct ctcatttttg taacatcagt gctaccacca 180 ccaacagtaa taacactgca ccaggcactg agggactttt atctgcattc actcatttaa 240 tttgcccagc tcttctgtga ggaaggtact gtgcattatg gtcttcctct tacagactga 300 aaaaacgaag ccttggacac ctgaaggaga ttgccaggca gccaatggtg aagctgattt 360 tgtacccaga cagtctgagt gcagagcctg ccattaccct ccaacagaaa accaagagca 420 aagccatggg agagaggagc taatgaaaga ggcagaccaa ttagaagctg aggctatact 480 ttatcttctt ccttcttccc tcctcctcct ccttctggcc ggcattcatc aaacattgaa 540 catatatgaa cattaactta tgttaggcac tatgttcaaa gctttacaac ttacttaatt 600 cccacagcca ccaagtaagg taaatatttt tattatcgca ttctacagat gaggaagctg 660 aggctttaga aagttgcatc tcttactcga ggttacaggt ttggtaagat gcagagccag 720 gaacattttg gtagcatttg aattcctgcc gtattttgct aaatgtgccc ttgctgttac 780 caagtaccag agtcttctca aatccaaaca cttctggaag atgaaggctt gaattgcttt 840 tatgtattag tcactggaca actgcaccat cttggcaagt tacttaaatc acttacactg 900 agaggtaccc atttgttaac ttgcattctt acaggcttgc tcagaagtat gtggtgctga 960 taagatgctc tacactcctg cagtttcctc cacgaatacc agaagcaaat tctcacctgt 1020 tgtttgtggt ccctatcctg tgccaggcac ttctctaagc atttggcata tattaattga 1080 tttaatcttc acagtgacct agaatcccca ttctactaat gaggaaattg agggtgttaa 1140 gtaaatttcc caagttttcc tagatggtaa atggcagatc tgaaatccag accatgatag 1200 cttggcttag gagcctgtgc tggtaaccac catgatttag tgttccttca aggtaaaaga 1260 cattctaagg tgagtgagag ccagagagaa agagagaggg agagaaagaa agagggaggg 1320 agggaaggag agagagagag agaaatggat gtacatttgt tctgtatgaa gtctctgcac 1380 cctctagaga gccttttctt tagtgggaac tcattaagta catgtggggt cattcaagct 1440 gcagatagac actaacccca tgcctgctct gatcatttag tgacatcaaa agctgcagcc 1500 tttataaagt tcaaaaaagc accagtgcca tttccaacag atccttgatt ggactcagat 1560 gacaaagcta tgagcaatta aaaagaaaca aagcacttac ctgctacacc agtaaggaag 1620 aaactgatga ggaagcctag aaagcaatgt ttaggcatca tggttgcaag tgtgactgtt 1680 caggcaacca gtgttccttt taaccagctc aggaccaaag aggaaactgt aaaatccaca 1740 aacagacaat cactcccggg tttaaggcag atggttcctt gaagcaacta caattttatt 1800 ttgatactac attatattat tttattttag gaaaaatatg aaagtataaa aatcacttca 1860 aaaaacattt gctgtcactt ttatgtggaa gctcgtttta ttgggaagct cgttttttgt 1920 tggggcttca ttagctgcag aaaggtaaaa cactgaggat gggcagatct gaagggcagg 1980 gcagtgcagg gattgtgcaa gtggcaagca ggtgagtgaa tgaaacaact agyggggcct 2040 taagggaatc tggccccagg aggcggagag gctgccaagg actaggactt ggctgccagg 2100 gtgattttga gtaatgtgct tggcatttgc agctatcggg gcccctggca gtggttcaaa 2160 gcaagagggg tc 2172 <210> 27 <211> 3078 <212> DNA <213> Homo sapiens <220> <221> allele <222> (1078)..(1078) <223> r = a or g <400> 27 aaaaaagtca tgttccatag tgaacaggtc tgtgcaaacc tacccttaaa gtccaaggaa 60 gctgagaggt caaagaaaaa ggctgacata tccagtttct cagaaagaaa catttcgtag 120 ggacttatga acagagccat gtgtgtgtcc tggacagtgg caagacaaga tggtggaccc 180 tcatgccatt accctgtaga cctgaagaag gaattaagga aatcaactat aacctaatag 240 tagtagtagt aatagaaatt ttaaaatcct cttaaagttg ctgcaaagtg tgacccccca 300 ccttacactc aagttaaaag ggaatattaa cagcctgtct tctctctgtg gacagtggac 360 cttatctata cttcccaaat ccacattcct cagagtttat tacaggccca gtgagttcct 420 gcatgactgc agggtcacaa gactgataag tttaggttgc aagacatgtc tttctcaaaa 480 tataacaaat gttgtaatgc tgcctttgtt tcttgcttct gtatctcgct tcctgcctca 540 tgtagttccc accttaagat gtttaaacgt aggaaaagcc ctttgctcag ggctcagact 600 ttctggacat atgtgctact gatcacctta atttagtaaa ctctcctgaa cctttttcgg 660 tctctccaat ctttggttgt cccacaacat ttccggggac cagtctggga ttggagatgg 720 cagattttcg tctcctttgc ctgtgggtta gagccccagg acatgggaaa tctggggtcc 780 ttggtgccac cgggagagtt ttagcccaga aggagaacag cccttccacg ttctggagcc 840 ttcctccaac agtgcaaatg gaaccagtgg aaagggttgc aggacagtca caagaacagt 900 gcatagacat atgaactgca gtaaggtttg ggccctaagg caagacccgt cccataagga 960 tggaagggga gcctggtcac ctccaagggc atgacaacta gtctgacccg agggggttgg 1020 gacaatggga gaggcccatt gattcagatg aaactcacac cctaattgac accagacrta 1080 agtggggctc atgagtcggt cagaaaggaa aaccattttg gggatggggg aggtgtgtga 1140 aagtgtgtaa aagagatggt ctcgggagag accaaggcgg ggttgatgtg gggaggcaca 1200 gatctcttag cgtggactgt gtgctcccag gcgagtgtgg gaaaaaccag acctaggaca 1260 ctgcatacgg cccagaggac cagctccaca gctgcagcta gctgtgacag gaattaaggc 1320 atgctcctgg ctaagcagtg tccgaacctc ctgtaatagg acccagtctg gtggatccaa 1380 gagtgaaagt gagagtgaaa gtgcatcaca agggaggaaa caggaggaaa agcgtcaaag 1440 cctattccac tggagtgcgt gctgaaaaac tttaaaaaaa gttttaatgg tgactatggg 1500 gttaagctaa cttcacagaa actgagaact tttttgagat aaaatagcca tcttttaatg 1560 tagggtggcc agccaagggg acaatagaca gggagataat tggccgagtg tttcgggtgg 1620 tcaccaggct tggagaacag cccgggcacc tggatcagtt tccgtatatt gactcctggc 1680 taagtataat tcagaccctc cctaagtggc tgcaggccta ctttgagatc tactgtaaga 1740 ctctaacggc caagacaaaa ccaggaacaa tagaaagaaa ctgcaaggca tcagaaaaag 1800 aaaagtcaca ggaaaagcag taaaaacctg tcctacaggc cccgcctgaa gagttagaaa 1860 ttccacccca ctatgcacca atttatccac ctctggcaaa gcttagacag aaggctgccc 1920 cggctgcctc cggagactca gactcagaag gaagcacccc tcaggcaaca ccacgcagag 1980 aggagccaga gcccttgact gaaaagccaa gggaggaact ccagggtgat gaggtcggcc 2040 gccttaggtc ggtccgtgcc caagcaatgc agatgccact ctgagaaaca tggggacaaa 2100 tttatttgaa tgcacagaat gaagtccaag ggggagaaca gctcttcttt tatcagccct 2160 tctctactac tgatctctta aattggagac aacatactcc ctcctataga gagaagcctc 2220 aggctcttat agatctaatg cagtccattt tcctaactca caatcctacc tgggttgatt 2280 gtaaacattt ttttctgtca ttatttaata tggaagagca ccgtagagtt atacaagctg 2340 ctctccagtg gctggagaaa aatgcatctt caagcacagg agatatcagg cagtatacac 2400 aacaagcact cctgatagag gctgacccag gctgggaccc taaccaggct caagggctac 2460 aagtttgcag cagtattgag aggcactcct aaatggaata aacgctggag agaaaaaggc 2520 caccaatatc ggaaaggtct cagaggttcg ccagaagcca gataaaagtc ccggtgaatt 2580 ttatgagagg ctgtgcgagg cttaccagct ttacatgcca cttgacccag aggctgcggg 2640 taatcagtgt atggttaatg tggcatttgt aagccaggtg caagaagaca tcggaagtta 2700 gaagggtttg aaggtgtgaa tattacccag cttatccagg tggctactaa ggtgtttgta 2760 aatcagaagg aggaggccaa gagaaaagct agatgcagag ctaaggaaaa ggcagacttg 2820 ctggcggtgg ccttagttgg aagagaaact ggttttgtga gaggatgtgg tcgtggttgc 2880 ggtcatgata gaggacaaac taggtaaaac caggaagcta agccaggaca agagggccaa 2940 cttaggctta agggagatca atgtgtgaga tgcaagcaga tgggacacta gaagaatgaa 3000 tgccaaattt tccggtgccc ttgttaggaa gagatttcct ccagaaattg caagcacaaa 3060 tctcctttat accagaag 3078 <210> 28 <211> 3164 <212> DNA <213> Homo sapiens <220> <221> allele <222> (1164)..(1164) <223> r = a or g <400> 28 aaaaaagtca tgttccatag tgaacaggtc tgtgcaaacc tacccttaaa gtccaaggaa 60 gctgagaggt caaagaaaaa ggctgacata tccagtttct cagaaagaaa catttcgtag 120 ggacttatga acagagccat gtgtgtgtcc tggacagtgg caagacaaga tggtggaccc 180 tcatgccatt accctgtaga cctgaagaag gaattaagga aatcaactat aacctaatag 240 tagtagtagt aatagaaatt ttaaaatcct cttaaagttg ctgcaaagtg tgacccccca 300 ccttacactc aagttaaaag ggaatattaa cagcctgtct tctctctgtg gacagtggac 360 cttatctata cttcccaaat ccacattcct cagagtttat tacaggccca gtgagttcct 420 gcatgactgc agggtcacaa gactgataag tttaggttgc aagacatgtc tttctcaaaa 480 tataacaaat gttgtaatgc tgcctttgtt tcttgcttct gtatctcgct tcctgcctca 540 tgtagttccc accttaagat gtttaaacgt aggaaaagcc ctttgctcag ggctcagact 600 ttctggacat atgtgctact gatcacctta atttagtaaa ctctcctgaa cctttttcgg 660 tctctccaat ctttggttgt cccacaacat ttccggggac cagtctggga ttggagatgg 720 cagattttcg tctcctttgc ctgtgggtta gagccccagg acatgggaaa tctggggtcc 780 ttggtgccac cgggagagtt ttagcccaga aggagaacag cccttccacg ttctggagcc 840 ttcctccaac agtgcaaatg gaaccagtgg aaagggttgc aggacagtca caagaacagt 900 gcatagacat atgaactgca gtaaggtttg ggccctaagg caagacccgt cccataagga 960 tggaagggga gcctggtcac ctccaagggc atgacaacta gtctgacccg agggggttgg 1020 gacaatggga gaggcccatt gattcagatg aaactcacac cctaattgac accagacgta 1080 agtggggctc atgagtcggt cagaaaggaa aaccattttg gggatggggg aggtgtgtga 1140 aagtgtgtaa aagagatggt ctcrggagag accaaggcgg ggttgatgtg gggaggcaca 1200 gatctcttag cgtggactgt gtgctcccag gcgagtgtgg gaaaaaccag acctaggaca 1260 ctgcatacgg cccagaggac cagctccaca gctgcagcta gctgtgacag gaattaaggc 1320 atgctcctgg ctaagcagtg tccgaacctc ctgtaatagg acccagtctg gtggatccaa 1380 gagtgaaagt gagagtgaaa gtgcatcaca agggaggaaa caggaggaaa agcgtcaaag 1440 cctattccac tggagtgcgt gctgaaaaac tttaaaaaaa gttttaatgg tgactatggg 1500 gttaagctaa cttcacagaa actgagaact tttttgagat aaaatagcca tcttttaatg 1560 tagggtggcc agccaagggg acaatagaca gggagataat tggccgagtg tttcgggtgg 1620 tcaccaggct tggagaacag cccgggcacc tggatcagtt tccgtatatt gactcctggc 1680 taagtataat tcagaccctc cctaagtggc tgcaggccta ctttgagatc tactgtaaga 1740 ctctaacggc caagacaaaa ccaggaacaa tagaaagaaa ctgcaaggca tcagaaaaag 1800 aaaagtcaca ggaaaagcag taaaaacctg tcctacaggc cccgcctgaa gagttagaaa 1860 ttccacccca ctatgcacca atttatccac ctctggcaaa gcttagacag aaggctgccc 1920 cggctgcctc cggagactca gactcagaag gaagcacccc tcaggcaaca ccacgcagag 1980 aggagccaga gcccttgact gaaaagccaa gggaggaact ccagggtgat gaggtcggcc 2040 gccttaggtc ggtccgtgcc caagcaatgc agatgccact ctgagaaaca tggggacaaa 2100 tttatttgaa tgcacagaat gaagtccaag ggggagaaca gctcttcttt tatcagccct 2160 tctctactac tgatctctta aattggagac aacatactcc ctcctataga gagaagcctc 2220 aggctcttat agatctaatg cagtccattt tcctaactca caatcctacc tgggttgatt 2280 gtaaacattt ttttctgtca ttatttaata tggaagagca ccgtagagtt atacaagctg 2340 ctctccagtg gctggagaaa aatgcatctt caagcacagg agatatcagg cagtatacac 2400 aacaagcact cctgatagag gctgacccag gctgggaccc taaccaggct caagggctac 2460 aagtttgcag cagtattgag aggcactcct aaatggaata aacgctggag agaaaaaggc 2520 caccaatatc ggaaaggtct cagaggttcg ccagaagcca gataaaagtc ccggtgaatt 2580 ttatgagagg ctgtgcgagg cttaccagct ttacatgcca cttgacccag aggctgcggg 2640 taatcagtgt atggttaatg tggcatttgt aagccaggtg caagaagaca tcggaagtta 2700 gaagggtttg aaggtgtgaa tattacccag cttatccagg tggctactaa ggtgtttgta 2760 aatcagaagg aggaggccaa gagaaaagct agatgcagag ctaaggaaaa ggcagacttg 2820 ctggcggtgg ccttagttgg aagagaaact ggttttgtga gaggatgtgg tcgtggttgc 2880 ggtcatgata gaggacaaac taggtaaaac caggaagcta agccaggaca agagggccaa 2940 cttaggctta agggagatca atgtgtgaga tgcaagcaga tgggacacta gaagaatgaa 3000 tgccaaattt tccggtgccc ttgttaggaa gagatttcct ccagaaattg caagcacaaa 3060 tctcctttat accagaaggg cacatgactc taaatctagg tcaaagaaaa gccatgataa 3120 agacccttac tgtcccaaca acagaggaat ggtaataatt tggg 3164 <210> 29 <211> 1001 <212> DNA <213> Homo sapiens <220> <221> allele <222> (501)..(501) <223> s = c or g <400> 29 gaaccggagg ctaccggtgc atgctagtgt ttgtctgcac tttctcaggg tgggttgagg 60 catttcccac caggacaaag aaagctcggg aagtaaccag aatcttacta aaggacatta 120 ttcctagatt tcgactgcct ctaactttag gatcagacaa tggcccagca tttgtggcag 180 aaatagtaca acagctaaca cagaggttaa aaatcaaatg aaaactgcat acagcttatc 240 acccatagag ttctggaaag ttgaaagaat aaaccggaca ctcaaacagc cgttaaaaaa 300 gttttgccat gaaactcatc taagatggga tcaggtgctg cccatggtcc ttctctgagt 360 caggtgcacc cctactaaat taactgggta ttcaccctat aagatagtgt ttggccgaca 420 ccctgatcat aactcagata aacggggatt taaaaaattg gggaattaac cttaagaagg 480 caaatgcaag ccttaggtga sgtctcgcag gaaatgcaag gatgggtaag agaaagaata 540 cctgttagcc tcacagatgc agtacaaccc ttctaacctg gagactctgt ctgggtcaaa 600 caatggaacc caaccacttt agggccttta tgggatagtc cccatattgt gatcttgtct 660 actcccactg ctgttaaagt tgcaggtatc ataccttggg ttcatcatag ccggctgaaa 720 ccagaagcag ccaccaccca ggaccagtgg acaagtcaac aaaacccaga ccactcaaca 780 tggctgatcc tgtggtgaaa ccaagccact gctgacaagg acaactgccc tgcttcaacc 840 acaccagagg ctggttggtc cacgcacggc tgaagcttga ggaaacatcg agccctgttc 900 tagtcacaca aatggaagct gactagtcta tgcatggctg aagcctgagg aagtcaatga 960 tacataagta aatgtagact aaatttacaa acatagttat a 1001 <210> 30 <211> 701 <212> DNA <213> Homo sapiens <220> <221> allele <222> (201)..(201) <223> y = c or t <400> 30 acctttgcaa aatcatgcaa tgttgcagtc agctcgtcag ttggataaat taatctgagt 60 gacctaggaa ttatctgctt cttaaggata catagatttc cctgagaaat catctgggtg 120 cttttggaat ttgggggcag aaaatacagg atagtattat ctgacaattt tctaattctt 180 ctatggtaat tagtgtgttt ygattttttt tttatctcat ctagattcag ttgctacaaa 240 gtatattttc tttagaagac tatccttttt attcatgcct ttaaatttat tggtacagag 300 ttgtgcaagt tattccttta tgatttattt aattctcctt tttctgtgac ttccctttta 360 taattttctg ttttgagtaa tgattttccc cttgttttct tagtaaattg gctggatatt 420 tattttcaaa tttcttttca aggaactaaa ttttgtagtt ttgtattcta ctttaaaaaa 480 agtcatgtct catttttatc tcctttacct ttaaaaattc cttccttttg tttttgtttt 540 atttaatttg ttggattttt caaaaaacaa aaactcctga gtcagatatt tgttctgttt 600 gttttattct ttattttata ccaatacaaa tttttacact aggaatttct ctgaaatgta 660 taagctccct cattggctct aaaatgtgat gttttctttt t 701 <210> 31 <211> 501 <212> DNA <213> Homo sapiens <220> <221> allele <222> (251)..(251) <223> m = a or c <400> 31 ctctcttttt gctttgattt ctgggaggtg gattagcatt tactattaga ttcactattt 60 aatttactct ttaagaacaa agataaagtg tagccagaca actgcttagg agtgtatcag 120 tccaacaaga tgtacattga gctctaaaca aaatttaaaa atcttcatga gccttagaat 180 aagaaaaata ccttttacat tttaaaacag tgacttaaat tttttttttt ttttactgta 240 gcatatgagc mgccaccata actaacttat tttgtatttc tagcttcacc taaagctatt 300 tctggatgtg gctgctagtt tgtcaaagtt aaataaagcg tgacgcatat tgttcaaagg 360 caagcggaag atctaacgtt tctttttgaa atataggaaa ctggagatat caggcaacag 420 tggaaaagca tgcactttgg agaaaggtga aacctgaatt caattctctc aaaatgtact 480 tcgagcttca tccatttgca t 501 <210> 32 <211> 1486 <212> DNA <213> Homo sapiens <220> <221> allele <222> (731)..(731) <223> s = c or g <400> 32 tgtttctttc tctataatac ataaaataaa ttatattaat attctaggtt atatataata 60 acacatataa ataaatataa aattatatta tatatagaaa tatatttttt atttttataa 120 gtacgtattt atttgtaaac tgtaaaacca taataaagga gtaaaactga catgaatata 180 agtgaaatgg agggggttgt gtagacaata tgtttagctg acaaatattt attgagcact 240 tgtcctatgc caggcactgt ctgaagttct gggaatacgc agggattaga caagttcttg 300 ttctcataga gctgatatcc tagtgtccgt ggcagggagg cagataataa actgacacat 360 cactattttg tcaggtggtg ctaagtgcca tggagacaca gtaggtgcag ggagggagaa 420 taatgggaag ataccattgc aggtaggggg tgaggaatag ccttgctgga cagggacata 480 tgaacaaagg tctgagttgg gtgaggcagg atgccacaca gacattggag gaggaaaatc 540 tgagcagggg gcacagcaaa gccccaaggc tgaggccaga tgaaggagca ggaggcaatg 600 tggctggaga ggagggagca aggggcagag tgttggtggt gaggtcaggg gcccagcagc 660 ctgatccagg ggacttgaac aggatggaag gactttgggt gcgttctgaa gaaggggaag 720 ccactggaag scattaagta gaaaaaattg gaagtgagag taattatatg tgaaagttgt 780 tagagtcaca atggagtgac gatgaggcag gacaggtagt caaggaagta agtgcagtta 840 acacaatgag ccccagtatt cgcattgtaa tccagctcat gcaagcacag ctatctcctg 900 cagggaatat ttcccataga cagcatttgc actttgattt tacctcttct caaacggacc 960 ctgttctcat gataatagta aaaaacacac ccctaggtgg agatttaaga tgctgatgaa 1020 ttatgagatg tatgaacaag catgtacagc tactgcacat gtgcacccag aggaccaccg 1080 aggacatgct tactagcaac accttttctc accctcttat gaataatcat gtaagagtcc 1140 cataaaagga tttctccagc aataatcagt gctgtccatt cagtggctca tgcctgtaac 1200 ccagcacttt gggaggccga ggtgggtgga tcacctgagg tcaggagttt gagaccagcc 1260 tggtcaacat ggtgaaacct cgtttctatt aaaaatacaa aaaaagtagc caggtgtaat 1320 ggcacatgcc tgtaatccca gctacttggg aggctgaagc aggagaactg attgaacctg 1380 ggaggtggag gttgcagtga gtcatgactg tgccactgca ctccagccaa cagagtaaga 1440 ctctgttccc cctcggcccc ctgcaaaaaa aaataataac aatgat 1486 <210> 33 <211> 4000 <212> DNA <213> Homo sapiens <220> <221> allele <222> (2000)..(2000) <223> r = a or g <400> 33 tttgttatgg acttatagca attatttata caaaacataa gaattgttct gaaaaaatta 60 aaaaatatat acctgcatgg ctcataactg gaaatattat accaggaggc tttgtcactt 120 ggtatcttta tccttttact tattattttc ttttaattct acaggaagca gtaaattctt 180 tatggttgga gtggatgaag aggtgccatg taatagctca gaaggcaaag tcccttgttt 240 taccagctgt ttaggcatcc atgtactcat ccttgatttg aagggtttga gttaattcta 300 tccttccaaa tcagccctta caatctcacg tgcccacctc ttctgcaaca gtctctgggc 360 ctagagggag gacgcttgca atacaggatt ttttgcatgt tcccagtggc tccaccccat 420 tctcccagtg cacatgcagg cccttagtct gaacccacgc tacattgatt tatttccctt 480 actgagcatg tgttaaggga tggaattttt caccatgggc atgtttaggc aagccccctg 540 tacacaatgt cctggatggc atttggctgt cttctgcctc tatcattccc ccatctaaaa 600 gagtacatct aactgccatt agaataagga taagaagaaa gacaaagacc catcttaact 660 gctttctgct gacagagggc actgttttgg aaagacagca gttgggtctc cctcagaggc 720 ctatctaagg gtatctggta aaagggacca tcattcgagg ctctggttgc ataactgttt 780 ggagtttgag ggcctgaagg cgagaagaga caaaccaggt tattagaaga catgtaccaa 840 aatgaaatgg gggaagggta aggacagttc aaaaatcctg aggctgctga catgcccaga 900 taactggtag ctgtagttgt gcctgctaag atttgggtgc atgggacttg gctttggtta 960 gctcccgtag tttattttcc caaaaaagaa acctctgggt tatgggcacc ctatttactc 1020 ccattatctg gcaggatttg taggataatt gttcagaact agaatactgt tccagatttt 1080 tacattaccc atgccttttg tttcttctga gctgcagcca gagatcactg gttagttcac 1140 aggaataagc agggttaatt taaaatgtag gcaaaaaact taaaaacaac taatgagtct 1200 agaatttaat gacaaatgta tgataagttt tgaaacataa tttctttctc cccagtcctc 1260 atttttgtta aaaacaaatc ataataggag tgagttgttt gtaaaataaa ctttagtctt 1320 acacttggtc tgcttatttg cacaaagtac aacaagaata attattttta cataggcttt 1380 ttaaattggc tttgatggaa ctctgttcca caaggaattt cagataggac ttcataaaaa 1440 tgagcccagc catgggtttg taccctctaa tacctatgag ttgggtgaat tgctctcttc 1500 ttgaggtccc aagaatatgc ggttcctggc cctgttagaa agtgacattc tttactcact 1560 acaggttagg gaacctgtat ggggactgtg tagacaaagt atgaggctgg tttacccaag 1620 gggcttttat tggctctgca agttgagctt gattccttaa agggaaacat acccttccag 1680 tcaaagttac agttactggt tggtaaagtt aaagttacag ctactggttg ctaaagcaac 1740 cagtttctcc aattgcatcc tgttgcaaaa gaaagtggat tcttactgca ctgatgcaaa 1800 taaccgtatt gccctaagtt aagaatactc acagatagtt tccaaattct agaggaagca 1860 ggcagagaga aaaaaaagtg ctaaattttg ttcataggag tctgcattac tcaattatta 1920 aagattgtgt atagctcaaa aaaaaagatc agcactgttt taagctaaag tttaaaaaag 1980 attacttcaa ttttctattr gttcagtctg ttcagttaac tcttgttctg cttgatattt 2040 gtgaacattt cagctcttca tgagtcctgt acgtttttcc attattccaa tgtcacaatc 2100 tccaaagtta tcagaaacct gcatttgaga gcacctgtta cgtttctata gctgattata 2160 aatcctattt gaagaagatc aaaacaaaac aatggtctgt gaatagcaaa atgtccatgg 2220 tagttacagt caaaaacaca attgacaaag aaattttgtt atctctgtgg cttataatca 2280 cctaacataa cacctttaat tgtgagtgat agcatatact tagatattag aattttagaa 2340 atcccataca gttttggagc atatattatt attcactaaa atataaccca aagaagatta 2400 aatatcattt tggcaatccc atgtacataa atttgtcagg taatcctatt tacctctctt 2460 ctggatgctc cagggatgct aggggtcagg aaagacaacc ttgaagctga catttgattt 2520 tgggaagccc attaaatatg ttagaggttt aaaacaatgt tatgaagtag aattccagat 2580 taccataaat tacttatttt gccaaaatga tgactcaaaa attttaaaac aagccaaaaa 2640 cttttactca tttagaggga agacttagat ttccaaagaa tttgtctcct gtcttcactt 2700 tcatttcctt ggcagtctat ctggaagaca aactgaaata tttaattatc ctttactatt 2760 acatgaaaat cttatacaag ggagagaaag ccaaatttta ccctcacatt agtttactat 2820 taatgtcaac cccaattttt taatgaaacc ttatagacaa ttctatccaa tcttaaccag 2880 tttgatcatg aggtaagatt cctgtaagcc ttttataacc ttttacaaat tactaattta 2940 ctaatctgct aaagagcaga ttagggcttt aagaaaacct tgttgtgctt tcatttcaat 3000 gctcagtttg tagaaaaacc atataataga gttttggatt taatcaatgt tcacacacag 3060 aatttctttt gcaagattaa tttttagaaa cctcccacaa cttgtttaaa cctttagttt 3120 atcttatcta atttataata gtcctttaac cttaggcaaa aacttacatt tccatgcatt 3180 cttataatct ttgactaata acacatttta ctgttcttac ataccttgca tgtaaatcta 3240 ttttcagtgg tctcaattac atgttataat ggtacctctt agcacttttt aattttagtt 3300 taaaacctgg taagtcgttt taattacgca ctaggtgctg ataaagtttg attccttcca 3360 gcataattaa gggtgtggtt aattccatat gtccctgtgc cttaccaagt tgtaaagcag 3420 gcagattgaa cagttttcaa aggcaaaaga agccgtttac aaccttaaaa catttagcca 3480 cctagtgcct gacttgcata atttagacca gctatttaca ttttaagaac atttgcattt 3540 tatcaattat ctttaagact acttttattt ctcagagatt aaagtcacaa gaactaaaag 3600 gcattatagc ttttatcttt cctccaaaaa tatttgatct tagtgctgat ttttctttaa 3660 gccaattaat tagagctctt ttttataact acacagatgg agaagaagat tgagtgttat 3720 aagatttttc atttgcccat ctcctaattg gattcttggt ctctgggtgg gaccctttaa 3780 gagcagggct aagaaagcat gcagtttatt ttcttttttt ctttttcttt tctttttttt 3840 tgagaaagag tttcactctt gttgcccagg ctggagtgca atggtgcgat ctcagctcac 3900 tgcaacctct gcctcccagg ttcaagcgat tctcttacct cagcctccca agtggctgca 3960 tgcagtttct agggcctaat aaacaggcat agctggaaaa 4000 <210> 34 <211> 4000 <212> DNA <213> Homo sapiens <220> <221> allele <222> (2000)..(2000) <223> w = a or t <400> 34 cagctactgg ttgctaaagc aaccagtttc tccaattgca tcctgttgca aaagaaagtg 60 gattcttact gcactgatgc aaataaccgt attgccctaa gttaagaata ctcacagata 120 gtttccaaat tctagaggaa gcaggcagag agaaaaaaaa gtgctaaatt ttgttcatag 180 gagtctgcat tactcaatta ttaaagattg tgtatagctc aaaaaaaaag atcagcactg 240 ttttaagcta aagtttaaaa aagattactt caattttcta ttagttcagt ctgttcagtt 300 aactcttgtt ctgcttgata tttgtgaaca tttcagctct tcatgagtcc tgtacgtttt 360 tccattattc caatgtcaca atctccaaag ttatcagaaa cctgcatttg agagcacctg 420 ttacgtttct atagctgatt ataaatccta tttgaagaag atcaaaacaa aacaatggtc 480 tgtgaatagc aaaatgtcca tggtagttac agtcaaaaac acaattgaca aagaaatttt 540 gttatctctg tggcttataa tcacctaaca taacaccttt aattgtgagt gatagcatat 600 acttagatat tagaatttta gaaatcccat acagttttgg agcatatatt attattcact 660 aaaatataac ccaaagaaga ttaaatatca ttttggcaat cccatgtaca taaatttgtc 720 aggtaatcct atttacctct cttctggatg ctccagggat gctaggggtc aggaaagaca 780 accttgaagc tgacatttga ttttgggaag cccattaaat atgttagagg tttaaaacaa 840 tgttatgaag tagaattcca gattaccata aattacttat tttgccaaaa tgatgactca 900 aaaattttaa aacaagccaa aaacttttac tcatttagag ggaagactta gatttccaaa 960 gaatttgtct cctgtcttca ctttcatttc cttggcagtc tatctggaag acaaactgaa 1020 atatttaatt atcctttact attacatgaa aatcttatac aagggagaga aagccaaatt 1080 ttaccctcac attagtttac tattaatgtc aaccccaatt ttttaatgaa accttataga 1140 caattctatc caatcttaac cagtttgatc atgaggtaag attcctgtaa gccttttata 1200 accttttaca aattactaat ttactaatct gctaaagagc agattagggc tttaagaaaa 1260 ccttgttgtg ctttcatttc aatgctcagt ttgtagaaaa accatataat agagttttgg 1320 atttaatcaa tgttcacaca cagaatttct tttgcaagat taatttttag aaacctccca 1380 caacttgttt aaacctttag tttatcttat ctaatttata atagtccttt aaccttaggc 1440 aaaaacttac atttccatgc attcttataa tctttgacta ataacacatt ttactgttct 1500 tacatacctt gcatgtaaat ctattttcag tggtctcaat tacatgttat aatggtacct 1560 cttagcactt tttaatttta gtttaaaacc tggtaagtcg ttttaattac gcactaggtg 1620 ctgataaagt ttgattcctt ccagcataat taagggtgtg gttaattcca tatgtccctg 1680 tgccttacca agttgtaaag caggcagatt gaacagtttt caaaggcaaa agaagccgtt 1740 tacaacctta aaacatttag ccacctagtg cctgacttgc ataatttaga ccagctattt 1800 acattttaag aacatttgca ttttatcaat tatctttaag actactttta tttctcagag 1860 attaaagtca caagaactaa aaggcattat agcttttatc tttcctccaa aaatatttga 1920 tcttagtgct gatttttctt taagccaatt aattagagct cttttttata actacacaga 1980 tggagaagaa gattgagtgw tataagattt ttcatttgcc catctcctaa ttggattctt 2040 ggtctctggg tgggaccctt taagagcagg gctaagaaag catgcagttt attttctttt 2100 tttctttttc ttttcttttt ttttgagaaa gagtttcact cttgttgccc aggctggagt 2160 gcaatggtgc gatctcagct cactgcaacc tctgcctccc aggttcaagc gattctctta 2220 cctcagcctc ccaagtggct gcatgcagtt tctagggcct aataaacagg catagctgga 2280 aaacaaaaac ggattttgag agcgatctat ttgcctctaa ttcctggggt tccatgagga 2340 aaacagaggt ttctcccaaa atggaatcca tggtgccttt tctgttttta ccaagcagcc 2400 ctatgccatc agaaattatc ttagggcctc tcatgtgcgc attaacactg gcaagacaag 2460 gtggagaaaa gtaattcagt caactgagaa aaaaatcttt ttccagcaaa acaagatcca 2520 agaagagaaa aacataaagg cctttcaaat atacgtatag cttggatatc cacttttaat 2580 taagctgagc tctctttaag aaagtccttt taaatcccac attacctgac ttcagccatg 2640 ccaagcagcc aatatttctg gctttggaag tttatcaaaa gaacctcaag gttcaaccaa 2700 caagcctcaa ttaagacacg cgaagcacac cagattggct acaccttaag accagcctca 2760 taaaaccttt ttcactaatg gaaactttac agggaatatc aacagtgatc cttatcattc 2820 ttttcaccag tttacacagg gagagagagg ccaaaagtct gactggttaa aaaactttta 2880 tccttttgct ggcatgtcat gcttctgggt tcccttcccc tgagctcaat tctaagccaa 2940 ccagtttaag gtttgggaaa ttaacttttc tcagtttgga ggatgcatcc tatgggaatg 3000 tcctttagta cagggacaca gtcacccatc tgtgaagaga ggacaaagga ggaaaaagta 3060 aaaaaagatt tttttcaaag gctccccagg ggttcaggat gcatttgaaa gggggacaga 3120 ttgaagatga atggctactc atctagaaag aggggagcca gacatccctg gttcctttct 3180 ctttctagga aatagccagg gtatgtgagg gaaagaagga acaagcatcc attttccttc 3240 ttccgtcctt atgtccccaa gtcctgacaa cctcgacagg gtgccaccca tgggtgccaa 3300 tacggttctc acccatggta acaggggacc tagtggatgg gattatccac tgttacccac 3360 aaactgtctt tccccctgct ctcaatagcc ttcaagtgcc ctagacctca tttaggccat 3420 tgatactagt atgaccttta tccatgaaac aagaggcttg gcttaattgt caggaattag 3480 tcatgctcac ctatactgtg ctttttaatt tttgttgttg tctgcctctg gatccctccg 3540 atgcagttat ctttcctagg gcttctacat gaagcttgga attgagtttg ggacaaaaga 3600 actgcctcag taggtgggtg catggactca tcaatcccca ggtgtccctc accagtctgg 3660 ctgctgccgc cttatcataa gctgaaggct aaggtgcaac tgtgaaatta ggtccttctc 3720 aaacaaggga gggaaaatgg tgtcctgtga attagggtcc tggtctaata agatgccttc 3780 caaaaggaag aaaacttctg gcacagagaa gacccctcta cccgcagggc tgtgttatta 3840 ggttggtgcg aaagcaattg tggtgcccat cattctaagt aatgacaaaa accacaacta 3900 ctttcacacc agcctactaa ctcatgactt ggtggacaaa agaaaataac aacaacaaca 3960 acagcttaaa tgcagggctg tgtttactgc tgacaaggtg 4000 <210> 35 <211> 1191 <212> DNA <213> Homo sapiens <220> <221> allele <222> (819)..(819) <223> r = a or g <400> 35 tgctagattt tgcaattgat tgcaaaatca gttttgcaat cagttgcaag tttcttgacc 60 cattcactgg attgtgattg tgttacaaga ccaagtcaag attatttgac ctcatagcac 120 tttactcttt aacagctctc tccttgaaat attaccttcc cgcactattc atgaacatat 180 cagcccacag atttcctcct acctctttgg ctattccttc tcagtctcct tttaagattt 240 ttcttactca ggcatctttg ggtgaaagtc cctcaatatc tggtcttact caaaactgcc 300 tctcactcac tactctctcc ctaggcaatc ctatcaatgt ccactgtact gtatgcatga 360 aatgactcac aaatttttgt ctctaataaa gactttactt tgagtcttgg atctgaagag 420 atatgtcccc tggatctctt aaaagcatat taagcttaac atattcaaaa ccaaactcat 480 aatctctatt accttgcatc ccaccaaact ggtctttttc atcaaacccc atcaaaaaga 540 tctcagcaat tcatctaatt atgcatgcaa gaaacttaga ggtcatcttt gacatgtcct 600 cttcaccatt atatccgatc tatcacctgg tcctgccaat gttgcttact aaatgtccct 660 ccaggaataa attttctcta gtccttttca taagccaaat tcggtctcct gtagactatt 720 attagtaacc tgctacttca cttatctgca tccaacctgt tccccaaaat atagtcaaaa 780 tgatcttttc tatacacaag tctgatcata tggctcctra ataaaattat gtttttctgg 840 aggaagtcac aactccttaa aaaattcttg tacctgccta cctttccagt cccatctcat 900 tatggactcc ttcctgcatg ctcttcttca atatattggt tatctttcag tcccttgagt 960 ttgctatgcc agagggcctt tgcaaatgct ggtcccttgc ttgaaatgct ctattctttg 1020 cctcaagtga tcctcctacc tcggcctccc aaagtgctgg gattacaggc atggagccaa 1080 cacacctggc cttcacatct atttttaatc caagtaattc tagggtcaaa taatactgaa 1140 atctcgctaa gtatcaaacg ctgcttttaa ctgaagaaag tttactttgt t 1191 <210> 36 <211> 844 <212> DNA <213> Homo sapiens <220> <221> allele <222> (501)..(501) <223> y = c or t <400> 36 atttcctcaa cagaaaattc ctgtaatcag tattttcatg aacttaaccc tcgtgtttgg 60 ggaaggacta ggcactatga caaattctgc tgtctaaaaa tactttttta ggggctgggc 120 atggtggctc acacccataa tcccagcact ttgggaggcc aaagggggca gatcacctga 180 ggtcaggagt ttgaaaccag cctggccaat atgatgaaac cccgtctcta ctaaaaatac 240 aaaaattagc caagggtggt ggcacacact tgtaatccta gctactcggg aggcagaggc 300 cggagaatcg cttgaacccg ggatgcagag gttgcagtga gccaagatcg tgccactgca 360 ctccagcctg ggtgacaaag cgagaccctg tcacacacaa acacacacac acacacacac 420 acacaaggtg acaaattgat ggagtggagg ctctgcagtc agatatagca aatttgaacc 480 ctgacttgga taatacagat ygcgagattg gagcaatgac taaagcctct acatcttgat 540 gttctggact agaaaattag gataataaaa gctatctcct agagttgttc tgacaattag 600 accaaaagag ataatgatgt agagacctca gcaaagcaca aggcctagtc actagccgtg 660 ctccgggagg gctgtccaaa agcaggaaga acaagggcaa agaaactcca tggaactcac 720 tttcccacca gggagtgaac cgcggcgtca tgctccattc tgagtagctc ccagccgagg 780 ccgccctcac cctcccgtaa taaggttcct gtatgtctga ggtttcactg gtaaggtcac 840 aaga 844 <210> 37 <211> 801 <212> DNA <213> Homo sapiens <220> <221> allele <222> (401)..(401) <223> y = c or t <400> 37 aaggtttccc aaaatattta ttgaaagact tgaaatctag ctttctagac acataataag 60 gaagatagac ggtatctata ctcggtaatc tacatggtga cagcagtttc attccatcac 120 aattaaagca gaaccacaac atatattgag tataatttga tgttttaaaa ttattattta 180 tttataataa gtcttgaact tagctgtaat gacagacttc tcttttaaaa taatatctca 240 ttgtttatcc tattctaaac gcaagggata taacagtatt atagcccatg aactggatac 300 accaaagtga aagttttcaa aattataaat ttgtcttgtg ctgttgaaaa tcccttagag 360 acaggaatgg attcaggtat tctggggtct gaaatttata yaatcttggt ccatttaatg 420 tttctataac agaacacctg aggctaggta attgataagg aaaagaggtg tacttagcca 480 atgttctgca gcctgggaag ttacaagaaa tgtgctgcca gcatccactt ggcttctggt 540 gagagctttt catgctgcat gagaacatgc tagagaaggt caatggggaa aacagatcgt 600 gtgaagaggc caaactcaag gggcatcctg gctttacaac aaccactctc atagaaacat 660 ttccatgaca aattcagtct tgcaagagtg agaactcact caactgcagc aataatggta 720 ccaagccatt catgagtgct ccatccccat gacccaaaca cctcctacga ggccctactt 780 ccaacaccac cacactaagg a 801 <210> 38 <211> 801 <212> DNA <213> Homo sapiens <220> <221> allele <222> (401)..(401) <223> y = c or t <400> 38 atattaagct tttcttttct gtttgttttt gttttgttta gtttttaatc ctgtcttaga 60 agaacttatc tttattctca aaattaaatg taattttttt agtgacaaag aagaaaggaa 120 acctcattac tcaatccttc tggccaagag tgtcttgctt gtggcgcctt cctcatctct 180 atataggagg atcccatgaa tgatggttta ttgggaactg ctggggtcga ccccatacag 240 agaactcagc ttgaagctgg aagcacacag tgggtagcag gagaaggacc ggtgttggta 300 ggtgcctaca gagactatag agctagacaa agccctccaa actggcccct cctgctcact 360 gcctctcctg agtagaaatc tggtgaccta aggctcagtg yggtcaacag aaagctgcct 420 tcttcacttg aggctaagtc ttcatatatg tttaaggttg tctttctagt gaggagatac 480 atatcagaga acatttgtac aattccccat gaaaattgct ccaaagttga taacaatata 540 gtcggtgctt ctagttatat gcaagtactc agtgataaat ggattaaaaa atattcagaa 600 atgtattggg gggtggagga gaataagagg cagagcaaga gctagagaat tggtttcctt 660 gcttccctgt atgctcagaa aacattgatt tgagcataga cgcagagact gaaaaaaaaa 720 tttactttga tctctgtttt tgaattctta ttatttatat tttgcttact accttttttg 780 ccttttgtcc ttttgtggag a 801 <210> 39 <211> 701 <212> DNA <213> Homo sapiens <220> <221> allele <222> (501)..(501) <223> s = c or g <400> 39 atttgagggc aagcaagggg tctgtgtgct ggagaagagt gaggaaggtg agaattaggg 60 agtgaggcct gggagattat gaggaaagga aacagatcat acagcgcctt ggaggccatt 120 ataaagactt tggtttttac ccttatgaga tgggaagcta ttggcggttt tagagcagga 180 aagtgacatg atctgattta tgttccaagg ctcatgctgg ccaccttgtt aagacaaaac 240 tggagggagg caagcagagc ggggacacca atgaggtaac catagtgacc atccagagga 300 gaaatgatgg tggcctggaa taggtagttc tgagaagtgt tgtattttgg aggtagatca 360 atagaattta ttggtgcatt gaatatatat gatgtgaaag aaagcgggga gacaaagata 420 acctcaacgc ttttggcctg agcagctgta agactgggat tgcatttgat cacagggcaa 480 gctcagtcgg gctcaaaact stttgctcct tcctggctgg aacttcgtgt gggcctaaga 540 tgtttaactg gaatttcatc tggcagactt aaacattgtg ttcttctttt aaaagctcaa 600 ataacaaata ttccaaaatg taaagcaaaa aaaggattta ttgaaatcat gtgacaatat 660 atccctaaca ccatgaagaa gatgacaatt atgatttcca t 701

Claims

대상체에서 발생한 세포외 기질 단백질(extra cellular matrix protein: ECMP)의 비정상적인 침착에 대한 소인을 검출하거나, 또는 세포외 기질 단백질의 비정상적인 침착을 진단 및/또는 예후하기 위한 시험관내(in vitro ) 방법으로서,
상기 대상체의 생물학적 샘플에서 IL22RA2 유전자 자리의 변경(alteration)의 존재를 검출하는 단계를 포함하는 것을 특징으로 하는 방법.
제1항에 있어서,
섬유증에 대한 소인을 검출하거나, 또는 섬유증을 진단 및/또는 예후하기 위한 것을 특징으로 하는 방법.
제2항에 있어서,
섬유증의 진행을 평가하기 위한 것을 특징으로 하는 방법.
제1항 내지 제3항 중 어느 한 항에 있어서,
상기 변경은 IL22RA2 유전자의 개시코돈의 업스트림에서 500kb 이내, 바람직하게는 100kb 이내, 바람직하게는 20kb 이내, 더 바람직하게는 10kb 이내에 위치하고, IL22RA2 유전자의 3'UTR의 다운스트림에서 500kb 이내, 바람직하게는 100kb 이내, 바람직하게는 20kb 이내, 더 바람직하게는 10kb 이내에 위치하는 것을 특징으로 하는 방법.
제1항 내지 제4항 중 어느 한 항에 있어서,
상기 변경은 하나 이상의 염기의 돌연변이, 삽입 또는 결실인 것을 특징으로 하는 방법.
제5항에 있어서,
상기 변경은 하나 이상의 단일 뉴클레오티드 다형(single nucleotide polymorphism: SNP)인 것을 특징으로 하는 방법.
제6항에 있어서,
상기 SNP는 rs6570136, rs7774663, rs11154915 및 rs2064501로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
제7항에 있어서,
대상체의 생물학적 샘플의 IL22RA2 유전자 자리에서 SNP를 유전자형 분석하는 단계를 포함하고,
SNP rs6570136에서 유전자형 GG의 존재, SNP rs7774663에서 유전자형 TT의 존재, SNP rs11154915에서 유전자형 TT, CT의 존재 및/또는 SNP rs2064501에서 유전자형 CC의 존재는 대상체에서 세포외 기질 단백질(ECMP)의 비정상적인 침착 또는 섬유증이 발생하거나, 세포외 기질 단백질(ECMP)의 비정상적인 침착 또는 섬유증이 진행될 위험, 또는 섬유증의 나쁜 예후를 나타내는 것을 특징으로 하는 방법.
제2항 내지 제8항 중 어느 한 항에 있어서,
상기 섬유증은 간섬유증, 간경변, 피부 켈로이드, 비후성 반흔, 경피증 및 비만증 중에서 선택되는 인간 섬유증 질환에서 발생하는 것을 특징으로 하는 방법.
제9항에 있어서,
상기 간섬유증은 A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, 시스토조마 자포니쿰(Schistosoma japonicum) 또는 시스토조마 만소니(Schistosoma mansoni) 감염에 의해 유발되는 것을 특징으로 하는 방법.
제1항 내지 제10항 중 어느 한 항에 있어서,
상기 IL22RA2 유전자 자리의 변경의 존재는 시퀀싱, 선택적 하이브리드화 및/또는 선택적 증폭에 의해 검출되는 것을 특징으로 하는 방법.
제1항 내지 제10항 중 어느 한 항에 있어서,
SNP의 존재가 제한효소 소화에 의해 검출되고, 하나 이상의 상기 SNP의 검출이 세포외 기질 단백질(ECMP)의 비정상적인 침착 또는 섬유증의 지표가 되는 것을 특징으로 하는 방법.
세포외 기질 단백질(ECMP)의 비정상적인 침착 또는 섬유증을 앓거나, 또는 세포외 기질 단백질(ECMP)의 비정상적인 침착 또는 섬유증이 발생할 소인이 있는 대상체를 위한 치료적 화합물을 선택하는 방법으로서,
시험 화합물을 IL22RA2 폴리펩티드 또는 유전자 또는 이의 단편과 접촉시키는 단계, 및 IL22RA2 유전자 자리와 관련된 경로의 생물학적 활성 또는 기능을 증대 또는 감소시키는 상기 시험 화합물의 능력을 측정하는 단계를 포함하는 것을 특징으로 하는 방법.
바이러스에 감염된 환자가 항바이러스제 및/또는 인터페론에 의한 치료에 반응할 가능성을 측정하는 시험관내 방법으로서,
상기 환자의 생물학적 샘플에서 IL22RA2 유전자 자리 또는 IL22RA2 발현 또는 IL22RA2 단백질 활성의 변경을 측정하는 단계를 포함하는 방법.
제14항에 있어서,
상기 변경은 IL22RA2 유전자의 개시코돈의 업스트림에서 500kb 이내, 바람직하게는 100kb 이내, 바람직하게는 20kb 이내, 더 바람직하게는 10kb 이내에 위치하고, IL22RA2 유전자의 3'UTR의 다운스트림에서 500kb 이내, 바람직하게는 100kb 이내, 바람직하게는 20kb 이내, 더 바람직하게는 10kb 이내에 위치하는 것을 특징으로 하는 방법.
제14항 또는 제15항에 있어서,
상기 변경은 하나 이상의 염기의 돌연변이, 삽입 또는 결실인 것을 특징으로 하는 방법.
제16항에 있어서,
상기 변경은 하나 이상의 단일 뉴클레오티드 다형(SNP)인 것을 특징으로 하는 방법.
제17항에 있어서,
상기 SNP는 rs11154915, rs6570136, rs2064501 및 rs1543509로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
제19항에 있어서,
대상체의 생물학적 샘플의 IL22RA2 유전자 자리에서 SNP를 유전자형 분석하는 단계를 포함하고,
SNP rs11154915에 대해 유전자형 TT의 존재, SNP rs6570136에 대해 유전자형 AG 또는 GG의 존재, SNP rs2064501에 대해 유전자형 CT의 존재 및/또는 SNP rs1543509에 대해 유전자형 AA의 존재는 상기 치료에 대한 환자의 양성반응을 지지하는 것을 특징으로 하는 방법.
제14항 내지 제19항 중 어느 한 항에 있어서,
상기 치료는 인터페론과 조합될 수 있는 항바이러스제를 포함하는 것을 특징으로 하는 방법.
제20항에 있어서,
상기 항바이러스제는 바이러스 복제 억제제인 것을 특징으로 하는 방법.
제20항에 있어서,
상기 항바이러스제는 리바비린(ribavirin)인 것을 특징으로 하는 방법.
제20항에 있어서,
상기 항바이러스제는 바이러스 단백질분해효소 억제제인 것을 특징으로 하는 방법.
제14항 내지 제23항 중 어느 한 항에 있어서,
상기 인터페론은 인터페론 감마인 것을 특징으로 하는 방법.
제14항 내지 제23항 중 어느 한 항에 있어서,
상기 인터페론은 인터페론 알파인 것을 특징으로 하는 방법.
제24항 또는 제25항에 있어서,
상기 인터페론은 PEG화 인터페론 감마 또는 알파인 것을 특징으로 하는 방법.
제14항 내지 제26항 중 어느 한 항에 있어서,
상기 치료는 리바비린 및 인터페론 감마 또는 알파, 바람직하게는 PEG화 인터페론 감마 또는 알파를 포함하는 것을 특징으로 하는 방법.
제14항 내지 제27항 중 어느 한 항에 있어서,
라사(Lassa) 바이러스와 같은 아레나비리다에(Arenaviridae); 중증급성호흡기증후군(Sever Acute Respiratory Syndrome virus) 바이러스와 같은 코로나비리다에(Coronaviridae); C형 간염 바이러스, 뎅기(Dengue) 바이러스, 웨스트 나일(West Nile) 바이러스, 황열(Yellow Fever) 바이러스, 진드기매개뇌염(Tick-Borne Encephalitis) 바이러스와 같은 플라비비리다에(Flaviviridae); 에볼라(Ebola), 마부르크(Marburg)와 같은 필로비리다에(Filoviridae); 헤르페스 심플렉스(Herpes Simplex) 바이러스, 거대세포바이러스(Cytomegalovirus), 엡스타인-바르(Epstein-Barr) 바이러스, 바리셀라 조스터(Varicella Zoster) 바이러스와 같은 헤르페스비리다에(Herpesviridae); A형 및 B형 독감과 같은 오르토믹소비리다에(Orthomyxoviridae); 호흡기 세포융합(Respiratory Syncytial) 바이러스, 파라인플루엔자(ParaInfluenza) 바이러스, PMV, 홍역(Measles)과 같은 파라믹소비리다에(Paramyxoviridae); 백시니아(Vaccinia), 바리올라(Variola)와 같은 폭스비리다에(Poxviridae); 수포성 구내염(Vesicular Stomatitis) 바이러스, 바이러스성 출혈성 패혈증(Viral Hemorrhagic Septicemia) 바이러스, 광견병(Rabies)과 같은 랍도비리다에(Rhabdoviridae); HIV 및 다른 레트로바이러스와 같은 레트로비리다에(Retroviridae); 치쿤구니야(Chikungunya), 신드비스(Sindbis), 셀미키 삼림(Semliki Forest) 바이러스, 로스강(Ross River) 바이러스, 동부형 마뇌막염(Eastern Equine Encephalitis) 바이러스와 같은 토가비리다에(Togaviridae)의 과(family)의 바이러스로 이루어진 군에서 선택된 바이러스에 의해 상기 환자가 감염된 것을 특징으로 하는 방법.
제28항에 있어서,
상기 바이러스는 C형 간염 바이러스인 것을 특징으로 하는 방법.
제28항에 있어서,
상기 바이러스는 B형 간염 바이러스인 것을 특징으로 하는 방법.
제14항 내지 제30항 중 어느 한 항에 있어서,
상기 IL22RA2 유전자 자리의 변경의 존재는 시퀀싱, 선택적 하이브리드화 및/또는 선택적 증폭에 의해 검출되는 것을 특징으로 하는 방법.
제14항 내지 제30항 중 어느 한 항에 있어서,
SNP의 존재가 제한효소 소화에 의해 검출되고, 하나 이상의 상기 SNP의 검출이 섬유증의 지표가 되는 것을 특징으로 하는 방법.