KR20220156899A - 결장직장 신생물의 스크리닝을 위한 방법 및 키트 - Google Patents

결장직장 신생물의 스크리닝을 위한 방법 및 키트 Download PDF

Info

Publication number
KR20220156899A
KR20220156899A KR1020227036453A KR20227036453A KR20220156899A KR 20220156899 A KR20220156899 A KR 20220156899A KR 1020227036453 A KR1020227036453 A KR 1020227036453A KR 20227036453 A KR20227036453 A KR 20227036453A KR 20220156899 A KR20220156899 A KR 20220156899A
Authority
KR
South Korea
Prior art keywords
dna
intergenic region
target
marker
markers
Prior art date
Application number
KR1020227036453A
Other languages
English (en)
Inventor
루이 리우
후이 왕
Original Assignee
싱글레라 헬스 테크놀로지스 (상하이) 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 싱글레라 헬스 테크놀로지스 (상하이) 엘티디. filed Critical 싱글레라 헬스 테크놀로지스 (상하이) 엘티디.
Publication of KR20220156899A publication Critical patent/KR20220156899A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법, 결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 방법, 및 상기 방법에서 사용하기 위한 키트가 제공된다.

Description

결장직장 신생물의 스크리닝을 위한 방법 및 키트
본 개시내용은 일반적으로 생물의학 분야에 관한 것이다. 특히, 본 개시내용은 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법, 결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 방법, 및 상기 방법에서 사용하기 위한 키트에 관한 것이다.
전암성 후기 선종 병기 또는 초기 암성 병기에서 결장직장 신생물의 조기 검출은 환자 사망률을 유의하게 감소시키는 것으로 확인되었다. 결장경검사 또는 배변/혈액 샘플에 대한 분자적 검사를 통한 현행 결장직장 신생물 스크리닝은 침습적이거나 또는 매우 소수의 마커만을 가져서, 암 스크리닝 및 검출 감도에 환자 순응성을 제한한다.
그러므로, 생물학적 샘플로부터 유래되는 제한적인 양의 세포-무함유 DNA로부터 후생유전학 정보를 효율적으로 판독할 수 있고 임상 실험실에서 쉽게 배치하여 견고하게 구현할 수 있는 방법 및/또는 키트의 개발에 대한 요구가 증가하고 있다.
일 양태에서, 본 개시내용은 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법을 제공하고, 상기 방법은 하기 단계를 포함한다:
(I). 생물학적 샘플로부터 수득된 DNA를, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
(II). 단계 (I)의 처리된 DNA 내의 표적 마커 세트의 개별 메틸화 수준을 정량화하는 단계로서, 표적 마커는 셉틴9(Septin9), BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역(INTERGENIC REGION) 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 것인 단계; 및
(III). 단계 (II)에서 정량화된 표적 마커 세트의 적어도 하나의 표적 마커의 메틸화 수준을 각각, 상응하는 기준 수준과 비교하는 단계로서, 하나 이상의 표적 마커의, 그의 상응하는 기준 수준에 비해서 동일하거나 더 높은 메틸화 수준은, 대상체가 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타내는 것인 단계.
다른 양태에서, 본 개시내용은 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법을 제공하고, 상기 방법은 하기 단계를 포함한다:
(I). 생물학적 샘플로부터 수득된 DNA를, DNA에서 비메틸화된 부위 및 메틸화된 부위를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
(II). 단계 (I)의 처리된 DNA 내의 표적 마커 세트의 개별 메틸화 수준을 정량화하는 단계로서, 적어도 2개의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, PKNOX2, VAV3, NDRG4 및 IRF4로 이루어진 군으로부터 선택되고, 적어도 2개의 표적 마커는 POU4F2, SALL1, SDC2, ASCL4, 유전자간 영역 1, TMEFF2, 유전자간 영역 4, NKX2-6, 유전자간 영역 5, SLC24A2, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, 및 CRHBP로 이루어진 군으로부터 선택되는 것인 단계.
(III). 단계 (II)에서 정량화된 표적 마커 세트의 적어도 하나의 표적 마커의 메틸화 수준을 각각, 상응하는 기준 수준과 비교하는 단계로서, 하나 이상의 표적 마커의, 그의 상응하는 기준 수준에 비해서 동일하거나 더 높은 메틸화 수준은 대상체가 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타내는 것인 단계.
일부 실시형태에서, 본 개시내용의 표적 마커 세트는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 또는 그 초과의 표적 마커를 포함한다.
일부 실시형태에서, 본 개시내용의 단계 (II)는 하기를 포함한다:
(i) 단계 (I)로부터 수득된 처리된 DNA 내의 표적 마커 세트의 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭 프라이머 풀을 사용해 사전-증폭하는 단계로서, 표적 마커 세트는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 것인 단계; 및
(ii) 상기 하위 단계 (i)로부터 획득된 DNA 내의 표적 마커 세트의 개별 메틸화 수준을 정량화하는 단계.
일부 실시형태에서, 본 개시내용의 방법은 단계 (I) 이전에 대상체로부터 유래하는 생물학적 샘플로부터 DNA를 수득하는 단계를 더 포함한다.
다른 양태에서, 본 개시내용은 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법을 제공하고, 상기 방법은 하기 단계를 포함한다:
(a) 대상체로부터 DNA를 함유하는 생물학적 샘플을 수득하는 단계;
(b) 단계 (a)로부터 수득된 생물학적 샘플 중 DNA를, DNA에서 비메틸화된 부위 및 메틸화된 부위를 구별할 수 있는 시약으로 처리하여 처리된 DNA를 수득하는 단계;
(c) 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭 프라이머 풀을 사용하여 사전-증폭하는 단계로서, 적어도 하나 (예를 들어, 각각)의 표적 마커(들)의 적어도 일부분은 사전-증폭되고, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하고; 단계 (c)는 존재하거나 또는 부재하는 것인 단계;
(d) 단계 (c)가 존재하면, 단계 (c)로부터 획득된 DNA를 기반으로 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하고; 단계 (c)가 부재하면, 단계 (b)로부터 수득된 처리된 DNA 내의 표적 마커 중 적어도 하나 (예를 들어, 각각)의 메틸화 수준을 개별적으로 정량화하는 단계로서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하는 것인 단계; 및
(e) 단계 (d)로부터의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 각각, 상응하는 기준 수준과 비교하는 단계로서, 하나 이상의 표적 마커(들)의, 그의 상응하는 기준 수준에 비해서 동일하거나 더 높은 메틸화 수준은, 대상체가 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타내는 것인 단계.
일부 실시형태에서, 상기 방법의 단계 (c) 또는 단계 (d)에서 적어도 하나의 표적 마커는 다수의 표적 마커를 포함하고, 다수의 표적 마커는 셉틴9, BCAT1, 및 IKZF1로 이루어진 군으로부터 선택되는 적어도 2개의 마커를 포함한다.
다른 양태에서, 본 개시내용은 하기 단계를 포함하는, 결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 방법을 제공한다:
(a) 대상체로부터 DNA를 함유하는 생물학적 샘플을 수득하는 단계;
(b) 단계 (a)로부터 수득된 생물학적 샘플 중 DNA를, DNA에서 비메틸화된 부위 및 메틸화된 부위를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
(c) 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭 프라이머 풀을 사용하여 사전-증폭하는 단계로서, 적어도 하나 (예를 들어, 각각)의 표적 마커 (들)의 적어도 일부분은 사전-증폭되고, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하고; 단계 (c)는 존재하거나 또는 부재하는 것인 단계;
(d) 단계 (c)가 존재하면, 단계 (c)로부터 획득된 DNA를 기반으로 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하고; 단계 (c)가 부재하면, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하는 것인 단계로서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하는 것인 단계; 및
(e) 단계 (d)로부터의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 각각 치료 전 대상체로부터 수득된 DNA를 함유하는 생물학적 샘플에 대해서 단계 (a), 단계 (b), 임의로 단계 (c), 및 단계 (d)를 반복함으로써 정량화된 치료 전 동일 대상체로부터 수득된 하나 이상의 표적 마커(들)의 상응하는 메틸화 수준과 비교하는 단계로서, 하나 이상의 표적 마커(들)의, 치료 전 그의 상응하는 메틸화 수준에 비해서 더 낮은 메틸화 수준은, 대상체가 치료에 반응성임을 나타내는 것인 단계.
일부 실시형태에서, 상기 방법의 단계 (c) 또는 단계 (d)에서 적어도 하나의 표적 마커는 다수의 표적 마커를 포함하고, 다수의 표적 마커는 셉틴9, BCAT1, 및 IKZF1로 이루어진 군으로부터 선택되는 적어도 2개의 마커를 포함한다.
일부 실시형태에서, 다수의 표적 마커는 BCAN, PKNOX2, VAV3, NDRG4, 및 IRF4로 이루어진 군으로부터 선택되는 하나 이상의 추가 마커를 더 포함한다. 일부 실시형태에서, 다수의 표적 마커는 POU4F2, SALL1, SDC2, ASCL4, 유전자간 영역 1, TMEFF2, 유전자간 영역 4, NKX2-6, 유전자간 영역 5, SLC24A2, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, 및 CRHBP로 이루어진 군으로부터 선택되는 하나 이상의 추가 마커를 더 포함한다.
일부 실시형태에서, 각각의 표적 마커는 a) 하기 기재된 바와 같은 Hg19 좌표에 의해 정의되는 각각의 영역: 및 각각의 출발 부위 상류의 5 kb 및 상기 기술된 각 영역의 각 말단 부위 하류의 5 kb, 또는 b) a)의 바이술파이트(bisulfite) 전환된 대응물, 또는 c) a)의 MSRE 처리된 대응물이거나 또는 그를 포함한다:
Figure pct00001
Figure pct00002
일부 실시형태에서, 단계 (a)로부터 수득된 생물학적 샘플 중 DNA는 게놈 DNA 또는 세포-무함유 DNA를 포함한다. 일부 실시형태에서, 세포-무함유 DNA는 순환 종양 DNA를 포함한다. 일부 실시형태에서, 세포-무함유 DNA 중 표적 마커는 1 ng, 0.8 ng, 0.6 ng, 0.4 ng, 0.2 ng, 0.1 ng, 0.08 ng 이하 또는 0.04 ng 이하의 양으로 생물학적 샘플에 존재한다. 일부 실시형태에서, 세포-무함유 DNA 중 표적 마커는 표적 마커에 대한 검출 어세이의 감도 수준 미만의 농도로 생물학적 샘플에 존재한다.
일부 실시형태에서, 하위 단계 (i) 또는 단계 (c)로부터 수득된 DNA는 하위 단계 (ii) 또는 단계 (d) 전에 희석제로 희석된다.
일부 실시형태에서, 생물학적 샘플은 조직 절편, 생검, 파라핀-포매 조직, 체액, 결장 삼출액, 수술 절제 샘플, 단리된 혈액 세포, 혈액 단리 세포, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 체액은 전체 혈액, 혈액 혈청, 혈액 혈장, 소변, 점액, 타액, 복막액, 흉막액, 흉부액, 활액, 뇌척수액, 흉막천자액, 복수, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 생물학적 샘플은 대상체의 혈액 혈장으로부터 수득된다. 일부 실시형태에서, 결장 삼출액은 분변 샘플 및 관장 세척 샘플로 이루어진 군으로부터 선택된다.
일부 실시형태에서, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약은, CpG 부위(들)에서 비메틸화된 시토신 잔기(들)를 선택적으로 변형시켜서 변형된 잔기(들)를 생성시키지만, 메틸화된 시토신 잔기(들)를 유의하게 변형시키지 않는다. 일부 실시형태에서, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약은 바이술파이트 시약을 포함한다. 일부 실시형태에서, 바이술파이트 시약은 암모늄 바이술파이트, 나트륨 바이술파이트, 칼륨 바이술파이트, 칼슘 바이술파이트, 마그네슘 바이술파이트, 알루미늄 바이술파이트, 아황산수소 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
일부 실시형태에서, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약은 비메틸화 경우에 잔기를 선택적으로 절단하지만 메틸화 경우에 잔기를 절단하지 않거나, 또는 메틸화 경우에 잔기를 선택적으로 절단하지만 비메틸화 경우에 잔기를 절단하지 않는다. 일부 실시형태에서, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약은 메틸화 감응성 제한 효소 (MSRE)이다. 일부 실시형태에서, MSRE는 HpaII, SalI, SalI-HF®, ScrFI, BbeI, NotI, SmaI, XmaI, MboI, BstBI, ClaI, MluI, NaeI, NarI, PvuI, SacII, HhaI 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
일부 실시형태에서, 사전-증폭 프라이머 풀은 적어도 하나의 메틸화-특이적 프라이머 쌍을 포함한다. 일부 실시형태에서, 적어도 하나의 메틸화-특이적 프라이머 쌍은, 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서 표적 마커(들) 중 하나의 적어도 9개의 연속 뉴클레오티드에 혼성화하는 올리고뉴클레오티드 서열을 각각 포함하는 전방향 프라이머 및 역방향 프라이머를 포함하고, 표적 마커(들) 중 하나의 적어도 9개의 연속 뉴클레오티드는 적어도 하나의 CpG 부위를 포함한다.
일부 실시형태에서, 사전-증폭 프라이머 풀은 대조 마커의 증폭을 위한 대조 프라이머 쌍을 더 포함한다. 일부 실시형태에서, 대조 마커는 ACTB, GAPDH, 튜불린, ALDOA, PGK1, LDHA, RPS27A, RPL19, RPL11, ARHGDIA, RPL32, C1orf43, CHMP2A, EMC7, GPI, PSMB2, PSMB4, RAB7A, REEP5, SNRPD3, VCP, 및 VPS29로 이루어진 군으로부터 선택된다.
일부 실시형태에서, 적어도 하나의 메틸화-특이적 프라이머 쌍은 하기 표 2에 표시된 바와 같이, 서열번호 1/2, 3/4, 5/6, 7/8, 9/10, 11/12, 13/14, 15/16, 17/18, 19/20, 21/22, 23/24, 25/26, 27/28, 29/30, 31/32, 33/34, 35/36, 37/38, 39/40, 41/42, 43/44, 45/46, 47/48, 49/50, 51/52, 53/54, 및 170/171로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 하나 이상의 쌍을 포함한다.
일부 실시형태에서, 단계 (c)에서, 적어도 하나의 표적 마커는 하나 이상의 차단제 올리고뉴클레오티드의 존재 하에서 증폭된다.
일부 실시형태에서, 정량화는 중합효소 연쇄 반응 (PCR) (예를 들어, 실시간 PCR, 디지탈 PCR), 핵산 시퀀싱, 질량-기반 분리 (예를 들어, 전기영동, 질량 분광법), 또는 표적 포획 (예를 들어, 혼성화, 마이크로어레이)에 의해 수행된다. 일부 실시형태에서, 정량화는 실시간 PCR에 의해 수행되고, 임의로 실시간 PCR은 다중복합 실시간 PCR이다.
일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)의 정량화는 정량화 프라이머 쌍(들) 및 DNA 중합효소를 사용하여 단계 (c)로부터 획득된 DNA를 증폭시키는 단계를 포함하고, 획득된 DNA의 적어도 일부분이 증폭된다. 일부 실시형태에서, 단계 (c)가 부재하면, 단계 (d)의 정량화는 정량화 프라이머 쌍(들) 및 DNA 중합효소를 사용하여 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커를 증폭하는 것을 포함한다.
일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)에서 사용되는 정량화 프라이머 쌍(들)은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서 단계 (c)로부터 획득된 DNA의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있다. 일부 실시형태에서, 단계 (c)가 부재하면, 단계 (d)에서 사용되는 정량화 프라이머 쌍(들)은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있다.
일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)에서 사용되는 적어도 하나의 정량화 프라이머 쌍(들)은, 단계 (c)의 사전-증폭 프라이머 풀 중 적어도 하나의 메틸화-특이적 프라이머 쌍(들)과 동일하다. 일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)에서 사용되는 정량화 프라이머 쌍(들)은, 단계 (c)로부터 획득된 DNA 내의 적어도 일부분을 증폭하도록 디자인된다. 일부 실시형태에서, 단계 (c)가 부재하면, 단계 (d)에서 사용되는 정량화 프라이머 쌍(들)은, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커 내의 적어도 일부분을 증폭하도록 디자인된다.
일부 실시형태에서, 단계 (d)는 검출제의 존재 하에서 수행된다. 일부 실시형태에서, 검출제는 형광 프로브, 인터컬레이팅 염료, 발색단-표지된 프로브, 방사성동위원소-표지된 프로브, 및 바이오틴-표지된 프로브로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 형광 프로브는 서열번호 57-85, 172로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함한다. 일부 실시형태에서, 형광 프로브는 그의 5' 말단에서 형광 염료 (예를 들어, FAM, HEX/VIC, TAMRA, Texas Red, 또는 Cy5)로 표시되고 그의 3' 말단에서 소광제(quencher)(예를 들어, BHQ1, BHQ2, BHQ3, DABCYL 또는 TAMRA)로 표지된다.
일부 실시형태에서, 단계 (e)는 단계 (d)의 표적 마커(들)의 Ct 값(들)을 기준 Ct 값과 비교하는 것을 포함하고, 적어도 하나의 표적 마커의, 그의 상응하는 기준 Ct 값에 비해서 동일하거나 더 낮은 Ct 값은, 대상체가 결장직장 신생물을 갖거나, 결장직장 신생물의 발생 또는 발생 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 높거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타내거나; 또는 적어도 하나의 표적 마커의, 치료 전 그의 상응하는 Ct 값에 비해서 더 높은 Ct 값은, 결장직장 신생물의 치료를 받은 대상체가 치료에 반응성이라는 것을 나타낸다.
일부 실시형태에서, 사전-증폭은 5 내지 30 사이클의 반응을 포함하고, 각 사이클은 40∼80℃에서 5초 내지 5분의 반응 이전에 85∼99℃에서 5초 내지 5분의 반응을 포함한다.
일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)의 정량화는, 단계 (c)로부터 획득된 DNA 중 다수의 CpG 디뉴클레오티드, TpG 디뉴클레오티드, 또는 CpA 디뉴클레오티드의 존재 또는 수준을 기반으로 메틸화 수준을 결정하는 것을 포함한다. 일부 실시형태에서, 단계 (c)가 부재하면, 단계 (d)의 정량화는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커 중 다수의 CpG 디뉴클레오티드, TpG 디뉴클레오티드, 또는 CpA 디뉴클레오티드의 존재 또는 수준을 기반으로 메틸화 수준을 결정하는 것을 포함한다. 일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)의 정량화는, 단계 (c)로부터 획득된 DNA 중 하나 이상의 CpG 디뉴클레오티드의 존재 또는 수준을 기반으로 시토신 잔기(들)의 메틸화 수준을 결정하는 것을 포함한다. 일부 실시형태에서, 단계 (c)가 부재하면, 단계 (d)의 정량화는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커 중 하나 이상의 CpG 디뉴클레오티드의 존재 또는 수준을 기반으로 시토신 잔기(들)의 메틸화 수준을 결정하는 것을 포함한다. 일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)의 정량화는, 단계 (c)로부터 획득된 DNA를 다수의 분획으로 분할함으로써 수행된다. 일부 실시형태에서, 단계 (c)가 부재하면, 단계 (d)의 정량화는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커를 다수의 분획으로 분할함으로써 수행된다.
일부 실시형태에서, 단계 (e)의 기준 수준은, 결장직장 신생물을 갖거나 또는 가질 위험성이 있는 개체의 그룹 및 결장직장 신생물을 갖지 않거나 또는 가질 위험성이 없는 개체의 그룹으로부터 수득된 임상 샘플을 기반으로 결정된다.
일부 실시형태에서, 결장직장 신생물은 결장직장암, 거대 결장직장 선종, 및/또는 무경성 톱니상 용종이다. 일부 실시형태에서, 결장직장 신생물은 전암성이다. 일부 실시형태에서, 대상체는 인간이다.
다른 양태에서, 본 개시내용은 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 위한 키트를 제공하고, 다음을 포함한다:
(a) DNA를 처리하기 위한 제1 시약으로서, DNA에서 비메틸화된 부위 및 메틸화된 부위를 구별할 수 있는 것인 제1 시약;
(b) 임의로, 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나의 표적 마커 중 적어도 하나의 표적 서열을 사전-증폭하기 위한 적어도 하나의 프라이머 쌍을 포함하는 제1 프라이머 풀로서, 적어도 하나의 프라이머 쌍은 제1 시약으로 처리된 적어도 하나의 표적 서열의 적어도 9개의 연속 뉴클레오티드에 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서 혼성화할 수 있고; 표적 서열은 적어도 하나의 CpG 부위를 포함하는 제1 프라이머 풀; 및
(c) 제2 시약으로서, 제1 프라이머 풀이 존재하면, 제2 시약은 제1 프라이머 풀에 의해서 사전-증폭된 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 정량화하기 위한 것이고; 제1 프라이머 풀이 부재하면, 제2 시약은 제1 시약으로 처리된 DNA 내의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 정량화하기 위한 것이며, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하는 것인, 제2 시약.
일부 실시형태에서, 적어도 하나의 표적 마커는 다수의 표적 마커를 포함하고, 다수의 표적 마커는 셉틴9, BCAT1, 및 IKZF1로 이루어진 군으로부터 선택되는 적어도 2개의 마커를 포함한다.
일부 실시형태에서, 제1 프라이머 풀이 존재하면, 제2 시약은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서, 제1 프라이머 풀에 의해 사전-증폭된 적어도 하나의 표적 서열의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있는 다수의 정량화 프라이머 쌍을 포함하는 제2 프라이머 풀을 포함한다. 일부 실시형태에서, 제1 프라이머 풀이 부재하면, 제2 시약은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서, 제1 시약으로 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 하나의 표적 서열의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있는 다수의 정량화 프라이머 쌍을 포함하는 제3 프라이머 풀을 포함한다.
일부 실시형태에서, 제2 프라이머 풀 중 적어도 하나의 정량화 프라이머 쌍은 제1 프라이머 풀 중 적어도 하나의 프라이머 쌍과 동일하다. 일부 실시형태에서, 제1 프라이머 풀이 존재하면, 제2 프라이머 풀의 정량화 프라이머 쌍은 제1 프라이머 풀에 의해 사전-증폭된 적어도 하나의 표적 서열 내 적어도 일부분을 증폭하도록 디자인다. 일부 실시형태에서, 제1 프라이머 풀이 부재하면, 제3 프라이머 풀의 정량화 프라이머 쌍은 제1 시약으로 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 하나의 표적 서열 내 적어도 일부분을 증폭하도록 디자인된다.
일부 실시형태에서, 제1, 제2, 또는 제3 프라이머 풀은 적어도 하나의 메틸화-특이적 프라이머 쌍을 포함한다.
일부 실시형태에서, 제1 프라이머 풀 및 제2 프라이머 풀은 단일 용기 또는 별개 용기에 포장된다. 일부 실시형태에서, 키트는 하나 이상의 차단제 올리고뉴클레오티드를 더 포함한다.
일부 실시형태에서, 키트는 검출제를 더 포함한다. 일부 실시형태에서, 검출제는 형광 프로브, 인터컬레이팅 염료, 발색단-표지된 프로브, 방사성동위원소-표지된 프로브, 및 바이오틴-표지된 프로브로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 형광 프로브는 서열번호 57-85, 172로 이루어진 군으로부터 선택되는 올리고뉴클레오티드 서열을 포함한다. 일부 실시형태에서, 형광 프로브는 그의 5' 말단에서 형광 염료 (예를 들어, FAM, HEX/VIC, TAMRA, Texas Red, 또는 Cy5)로 표지되고 그의 3' 말단에서 소광제 (예를 들어, BHQ1, BHQ2, BHQ3, DABCYL, TAMRA 또는 lowa Black Dark Quenchers)로 표지된다.
일부 실시형태에서, 키트는 DNA 중합효소 및/또는 대상체로부터 유래되는 생물학적 샘플을 함유하기에 적합한 용기를 더 포함한다. 일부 실시형태에서, 키트는 사용 및/또는 키트 결과의 해석을 위한 설명서를 더 포함한다.
일부 실시형태에서, 제1 시약은 바이술파이트 시약 또는 메틸화 감응성 제한 효소 (MSRE)를 포함한다. 일부 실시형태에서, 바이술파이트 시약은 암모늄 바이술파이트, 나트륨 바이술파이트, 칼륨 바이술파이트, 칼슘 바이술파이트, 마그네슘 바이술파이트, 알루미늄 바이술파이트, 아황산수소 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 실시형태에서, MSRE는 HpaII, SalI, SalI-HF®, ScrFI, BbeI, NotI, SmaI, XmaI, MboI, BstBI, ClaI, MluI, NaeI, NarI, PvuI, SacII, HhaI 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
일부 실시형태에서, 제1 프라이머 풀이 존재하면, 제1 프라이머 풀은 다수의 표적 마커 중 적어도 하나의 표적 서열을 사전-증폭하기 위한 다수의 프라이머 쌍을 포함하고, 다수의 표적 마커는 셉틴9, BCAT1, 및 IKZF1로 이루어진 군으로부터 선택되는 적어도 2개의 마커를 포함하고, BCAN, PKNOX2, VAV3, NDRG4, 및 IRF4로 이루어진 군으로부터 선택되는 하나 이상의 추가 마커를 더 포함한다. 일부 실시형태에서, 제1 프라이머 풀이 부재하면, 제3 프라이머 풀은 다수의 표적 마커 중 적어도 하나의 표적 서열을 증폭하기 위한 다수의 프라이머 쌍을 포함하고, 다수의 표적 마커는 셉틴9, BCAT1, 및 IKZF1로 이루어진 군으로부터 선택되는 적어도 2개의 마커를 포함하고, BCAN, PKNOX2, VAV3, NDRG4, 및 IRF4로 이루어진 군으로부터 선택되는 하나 이상의 추가 마커를 더 포함한다. 일부 실시형태에서, 다수의 표적 마커는 POU4F2, SALL1, SDC2, ASCL4, 유전자간 영역 1, TMEFF2, 유전자간 영역 4, NKX2-6, 유전자간 영역 5, SLC24A2, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, 및 CRHBP로 이루어진 군으로부터 선택되는 하나 이상의 추가 마커를 더 포함한다.
일부 실시형태에서, 각각의 표적 마커는 a) 하기 기재된 바와 같이 Hg19 좌표로 정의되는 각각의 영역: 및 각각의 출발 부위의 상류 5 kb 및 상기 기술된 각 영역의 각각의 말단 부위의 하류 5 kb, 또는 b) a)의 바이술파이트 전환된 대응물, 또는 c) a)의 MSRE 처리된 대응물이거나 또는 그를 포함한다:
Figure pct00003
Figure pct00004
일부 실시형태에서, 제1 프라이머 풀이 존재하면, 제1 프라이머 풀은 하기 표 2에 표시된 바와 같이 서열번호 1/2, 3/4, 5/6, 7/8, 9/10, 11/12, 13/14, 15/16, 17/18, 19/20, 21/22, 23/24, 25/26, 27/28, 29/30, 31/32, 33/34, 35/36, 37/38, 39/40, 41/42, 43/44, 45/46, 47/48, 49/50, 51/52, 53/54, 및 170/171로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 적어도 하나의 쌍을 포함하거나 또는 그로 이루어진 적어도 하나의 프라이머 쌍을 포함하고, 임의로 제2 프라이머 풀은 제1 프라이머 풀 중 적어도 하나의 프라이머 쌍과 동일한 적어도 하나의 프라이머 쌍을 포함한다. 일부 실시형태에서, 제1 프라이머 풀이 부재하면, 제3 프라이머 풀은 하기 표 2에 표시된 바와 같은 서열번호 1/2, 3/4, 5/6, 7/8, 9/10, 11/12, 13/14, 15/16, 17/18, 19/20, 21/22, 23/24, 25/26, 27/28, 29/30, 31/32, 33/34, 35/36, 37/38, 39/40, 41/42, 43/44, 45/46, 47/48, 49/50, 51/52, 53/54, 및 170/171로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 적어도 하나의 쌍을 포함하거나 또는 그로 이루어진 적어도 하나의 프라이머 쌍을 포함한다.
일부 실시형태에서, 제1 프라이머 풀, 제2 프라이머 풀, 또는 임의로 제3 프라이머 풀은 대조 마커를 증폭하기 위한 프라이머 쌍을 더 포함한다. 일부 실시형태에서, 대조 마커는 ACTB, GAPDH, 튜불린, ALDOA, PGK1, LDHA, RPS27A, RPL19, RPL11, ARHGDIA, RPL32, C1orf43, CHMP2A, EMC7, GPI, PSMB2, PSMB4, RAB7A, REEP5, SNRPD3, VCP, 및 VPS29로 이루어진 군으로부터 선택된다.
일부 실시형태에서, 키트는 각각이 제2 프라이머 풀의 분획을 수용하기 위한 다수의 용기를 더 포함한다.
다른 양태에서, 본 개시내용은 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 위한, 또는 결장직장 신생물의 치료를 받은 대상체에서 치료 반응의 모니터링을 위한 진단 키트의 제조에서의 본 개시내용의 키트의 용도를 제공한다.
다른 양태에서, 본 개시내용은 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법에서 사용을 위한 키트의 제조에서 표적 마커의 메틸화 수준을 정량화하기 위한 시약의 용도를 제공하고, 상기 방법은 하기 단계를 포함한다:
(a) 대상체로부터 DNA를 함유하는 생물학적 샘플을 수득하는 단계;
(b) 단계 (a)로부터 수득된 생물학적 샘플 중 DNA를, DNA에서 비메틸화 및 메틸화 CpG 부위(들)를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
(c) 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭 프라이머 풀을 사용하여 사전-증폭하는 단계로서, 적어도 하나 (예를 들어, 각각)의 표적 마커 (들)의 적어도 일부분이 사전-증폭되고, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하고; 단계 (c)는 존재하거나 또는 부재하는 것인 단계;
(d) 단계 (c)가 존재하면, 단계 (c)로부터 획득된 DNA를 기반으로 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하고; 단계 (c)가 부재하면, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 (예를 들어, 각각) 마커의 메틸화 수준을 개별적으로 정량화하는 단계로서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하는 것인 단계; 및
(e) 단계 (d)로부터의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 각각, 상응하는 기준 수준과 비교하는 단계로서, 적어도 하나의 표적 마커의, 그의 상응하는 기준 수준에 비해서 동일하거나 더 높은 메틸화 수준은, 대상체가 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타내는 것인 단계.
다른 양태에서, 본 개시내용은 결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 방법에서 사용을 위한 키트의 제조에서 표적 마커의 메틸화 수준을 정량화하기 위한 시약의 용도를 제공하고, 상기 방법은 하기 단계를 포함한다:
(a) 대상체로부터 DNA를 함유하는 생물학적 샘플을 수득하는 단계;
(b) 단계 (a)로부터 수득된 생물학적 샘플 중 DNA를, DNA에서 비메틸화 및 메틸화 CpG 부위(들)를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
(c) 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭 프라이머 풀을 사용하여 사전-증폭하는 단계로서, 적어도 하나 (예를 들어, 각각)의 표적 마커 (들)의 적어도 일부분이 사전-증폭되고, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하고; 단계 (c)는 존재하거나 또는 부재하는 것인 단계;
(d) 단계 (c)가 존재하면, 단계 (c)로부터 획득된 DNA를 기반으로 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하고; 단계 (c)가 부재하면, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하는 것인 단계로서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하는 것인 단계; 및
(e) 단계 (d)의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 치료 전 대상체로부터 수득된 DNA를 함유하는 생물학적 샘플에 대해서 단계 (a), 단계 (b), 임의로 단계 (c), 및 단계 (d)를 반복함으로써 정량화된 치료 전 동일 대상체로부터 수득된 하나 이상의 표적 마커(들)의 상응하는 메틸화 수준과 각각 비교하는 단계로서, 하나 이상의 표적 마커(들)의, 치료 전 그의 상응하는 메틸화 수준에 비해서 더 낮은 메틸화 수준은, 대상체가 치료에 반응성임을 나타내는 것인 단계.
도 1 은 표적 마커 PKNOX2 (도 1A) 및 대조 마커 ACTB (도 1B)에 대한 메틸화-특이적 프라이머의 검증을 예시한다. Y-축은 표시된 사이클에서 형광 강도로부터 기준점 형광 강도를 차감하여 결정된, ΔRn 값을 표시한다. X-축은 사이클의 수를 표시한다. 도 1A에 표시된 바와 같이, Ct 값은 전환된 메틸화 DNA의 백분율이 혼합된 DNA 조성물에서 증가됨에 따라서 감소하였고, PKNOX2를 사전-증폭하는데 사용된 프라이머가 메틸화-특이적이었음을 의미한다. 도 1B에 표시된 바와 같이, 각 DNA 조성물에 대한 곡선이 중복되어서, 전환된 메틸화 DNA의 백분율 증가에도 불구하고 Ct 값은 동일하게 유지되었음을 의미하고, 이것은 대조 마커 ACTB를 사전-증폭하는데 사용된 프라이머가 메틸화-비특이적이었다는 사실과 일관된다.
도 2 는 각각 백혈 세포 (WBC, 실선 원형 "●"으로 표시), 주변암성 조직 (주변-조직, 실선 박스 "■"로 표시), 후기 선종 조직 (AA-조직, 실선 정삼각형 "▲"으로 표시), 및 결장직장암 조직 (CRC-조직, 실선 역삼각형 "▼"으로 표시)에서 대조 마커 ACTB, 및 표적 마커 SALL1 및 PKNOX2의 메틸화 존재도를 예시한다. Y-축은 Ct 값을 표시하고, X-축은 대조 마커 및 표적 마커의 명칭을 표시한다. 더 높은 Ct 값은 마커의 더 낮은 메틸화 존재도를 의미한다. 그러므로, 백혈 세포 중 표적 마커의 메틸화 존재도는 조직 샘플에 비해서 유의하게 더 낮았다는 것을 도 2에서 확인할 수 있다. 특히, 표적 마커의 메틸화 존재도는 후기 선종 조직 및 결장직장암 조직에 비해서 주변암성 조직에서 더 낮았다.
도 3 은 각각 결장직장암을 갖는 개체군 (CRC 혈장, 실선 원형 "●"으로 표시) 및 음성 결장경검사 개체군 (건강한 혈장, 실선 정삼각형 "▲")에서 수득된 생물학적 샘플 중 대조 마커 ACTB 및 표적 마커 SALL1 및 BCAN의 분포를 예시한다. Y-축은 Ct 값을 표시하고, X-축은 대조 마커 및 표적 마커의 명칭을 표시한다. 더 낮은 Ct 값은 마커의 더 높은 메틸화 수준을 의미한다. 그러므로, 결장직장암을 갖는 개체군에서 각 표적 마커의 메틸화 수준은 음성 결장경검사 개체군에 비해서 유의하게 더 높았다는 것을 도 3에서 확인할 수 있다.
도 4 는 모든 검사된 13 표적 마커의 AUC 값을 예시한다. Y-축은 동일 범위의 AUC 값에서 발생수를 표시하고, X-축은 AUC 값을 표시한다. AUC 값은 0 내지 1이고, 더 큰 AUC 값은 더 나은 분류력을 나타낸다. 도면에 표시된 바와 같이 모든 검사된 마커 (즉, NDRG4, 셉틴9, BCAT1, IKZF1, BCAN, VAV3, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2 및 유전자간 영역 1)는 0.8 내지 0.9 범위의 AUC에서 CRC를 대조군으로부터 분리시키는 분류력을 가졌다.
도 5 는 마커 SALL1, BCAT1 및 셉틴9의 조합의 ROC 곡선을 예시한다. Y-축은 참 양성률 (즉, 감도)을 표시하고, X-축은 거짓 양성율 (즉, 1-특이성)을 표시한다. 실선은 ROC 곡선을 표시하고, 점선은 45도 대각선을 표시한다. 대각선 위의 점은 양호한 분류 결과 (즉, 무작위보다 우수)를 나타내고, 선 아래 점은 나쁜 결과 (즉, 무작위보다 나쁨)를 나타낸다. 그러므로, 표적 마커 SALL1, BCAT1 및 셉틴9의 조합은 결장직장 신생물의 분류에서 고감도 및 고특이성을 갖는다.
도 6 표적 마커의 예시적인 하위영역의 뉴클레오티드 서열을 도시한다.
본 개시내용의 다양한 양태 및 실시형태가 하기 기술될 것이지만, 당업자는 본 출원의 대상 주제의 정신 및 범주를 벗어나지 않고 다양한 동등한 변화 및 변형을 만들 수 있다. 본 명세서에 개시된 다양한 양태 및 실시형태는 오직 예시로 제공되고, 본 개시내용을 제한하려는 의도가 아니다. 본 출원의 실제 보호 범위는 청구항에 의해 한정된다. 달리 정의하지 않으면, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 분야의 통상의 기술을 갖는 당업자가 일반적으로 이해하는 바와 동일한 의미를 갖는다. 본 개시내용에서 인용되는 모든 참조, 특허, 특허 출원은 그들 전체로 참조로 본 명세서에 편입된다.
명세서 및 첨부된 청구항에서 사용되는 단수형 "일", "하나" 및 "그"는 문맥에서 달리 명확하게 명시하지 않으면 그의 복수 형태를 포함한다는 것을 유의해야 한다. 따라서, 예를 들어, "하나의 시약"에 대한 언급은 다수의 시약을 포함한다.
문맥에서 달리 요구하지 않으면, 하기 명세서 및 청구항 전반에서, 단어 "포함하다", "함유하다" 또는 "포괄하다" 및 "포함한다", "포함하는", "함유한다", "함유하는", "포괄한다" 및 "포괄하는" 같은 별형은 명시된 정수 또는 단계 또는 정수 또는 단계의 그룹의 포함을 암시하지만 임의의 다른 정수 또는 단계 또는 정수 또는 단계의 그룹의 배제를 암시하는 것이 아님을 이해한다.
암 진단은 전통적으로 단일 마커 (예를 들어, 유전자 돌연변이)의 검출에 의존하였다. 안타깝게도, 암은 단일 마커가 전형적으로 많은 형태의 질환을 검출하거나 또는 구별하는데 실패한 질환 상태이다. 또한, 생물학적 샘플 중 단일 마커의 수준은 일반적으로 매우 제한적이어서, 암의 진단 특이성 및/또는 진단 감도를 더 감소시킨다. 따라서, 오직 단일 마커만을 인식하는 어세이는 제한적인 예측 가치인 것으로 확인되었다.
본 개시내용의 일 양태는 적어도 하나의 표적 마커(들)의 적어도 일부분이 사전-증폭으로 획득된 DNA를 기반으로 적어도 하나 (예를 들어, 각각)의 표적 마커의 개별 메틸화 수준의 정량화 이전에 사전-증폭시키기 위해 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭시키는 것이다. 이러한 사전-증폭 단계는 표적 마커(들)의 양(들)/수준(들)을 증가시키는 것으로 여겨지고, 결장직장 신생물의 진단 특이성 및/또는 진단 감도를 유의하게 증가시키는 것으로 확인된다. 본 개시내용의 다른 양태는 결장직장 신생물의 진단 특이성 및/또는 진단 감도를 증가시키기 위해서 생물학적 샘플 내 다수의 표적 마커의 메틸화 수준을 동시에 정량화하는 것이다. 일정 실시형태에서, 다수의 표적 마커는 정량화 전에 사전-증폭되지 않는다. 일정 실시형태에서, 다수의 표적 마커는 정량화 전에 사전 증폭된다. 특히, 본 개시내용의 발명자는 생물학적 샘플 내 다수의 표적 마커의 메틸화 수준의 동시 정량화, 또는 사전-증폭 단계 및 정량화 단계의 조합이 결장직장 신생물의 진단 특이성 및/또는 진단 감도를 유의하게 증가시켜서, 예를 들어 전암성 선종 병기 또는 초기 암성 병기에서, 결장직장 신생물의 조기 검출을 가능하게 만든다는 것을 놀랍게도 발견하였다. 당업자가 이해하는 바와 같이, 진단 문맥에서 "감도"는 올바르게 확인된 양성 결과의 비율, 즉, 문제가 되는 질환을 갖는 것으로 올바르게 확인된 대상체의 백분율로 정의한다. 그러나, "특이성"은 올바르게 확인된 음성 결과의 비율, 즉 문제가 되는 질환을 갖지 않는 것으로 올바르게 확인된 대상체의 백분율을 정의한다.
방법
일 양태에서, 본 개시내용은 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법을 제공하고, 상기 방법은 하기 단계를 포함한다:
(I). 생물학적 샘플로부터 수득된 DNA를, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
(II). 단계 (I)의 처리된 DNA 내의 표적 마커 세트의 개별 메틸화 수준을 정량화하는 단계로서, 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 것인 단계; 및
(III). 단계 (II)에서 정량화된 표적 마커 세트의 적어도 하나의 표적 마커의 메틸화 수준을 각각, 상응하는 기준 수준과 비교 하는 단계로서, 하나 이상의 표적 마커의, 그의 상응하는 기준 수준에 비해서 동일하거나 더 높은 메틸화 수준은, 대상체가 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타내는 것인 단계.
다른 양태에서, 본 개시내용은 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법을 제공하고, 상기 방법은 하기 단계를 포함한다:
(I). 생물학적 샘플로부터 수득된 DNA를, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
(II). 단계 (I)의 처리된 DNA 내의 표적 마커 세트의 개별 메틸화 수준을 정량화하는 단계로서, 적어도 2개의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, PKNOX2, VAV3, NDRG4 및 IRF4로 이루어진 군으로부터 선택되고, 적어도 2개의 표적 마커는 POU4F2, SALL1, SDC2, ASCL4, 유전자간 영역 1, TMEFF2, 유전자간 영역 4, NKX2-6, 유전자간 영역 5, SLC24A2, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, 및 CRHBP로 이루어진 군으로부터 선택되는 것인 단계; 및
(III). 단계 (II)에서 정량화된 표적 마커 세트의 적어도 하나의 표적 마커의 메틸화 수준을 각각, 상응하는 기준 수준과 비교하는 단계로서, 하나 이상의 표적 마커의, 그의 상응하는 기준 수준에 비해서 동일하거나 더 높은 메틸화 수준은 대상체가 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타내는 것인 단계.
다른 양태에서, 본 개시내용은 하기 단계를 포함하는, 결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 방법을 제공한다:
(I). 생물학적 샘플로부터 수득된 DNA를, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
(II). 단계 (I)의 처리된 DNA 내의 표적 마커 세트의 개별 메틸화 수준을 정량화하는 단계로서, 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 것인 단계; 및
(III). 단계 (II)에서 정량화된 표적 마커 세트의 적어도 하나의 표적 마커의 메틸화 수준을 각각 치료 전 대상체로부터 수득된 DNA를 함유하는 생물학적 샘플에 대해서 단계 (I) 및 단계 (II)를 반복함으로써 정량화된 치료 전 동일 대상체로부터 수득된 하나 이상의 표적 마커(들)의 상응하는 메틸화 수준과 비교하는 단계로서, 하나 이상의 표적 마커(들)의, 치료 전 그의 상응하는 메틸화 수준에 비해서 더 낮은 메틸화 수준은, 대상체가 치료에 반응성임을 나타내는 것인 단계.
다른 양태에서, 본 개시내용은 하기 단계를 포함하는, 결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 방법을 제공한다:
(I). 생물학적 샘플로부터 수득된 DNA를, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
(II). 단계 (I)의 처리된 DNA 내의 표적 마커 세트의 개별 메틸화 수준을 정량화하는 단계로서, 적어도 2개의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, PKNOX2, VAV3, NDRG4 및 IRF4로 이루어진 군으로부터 선택되고, 적어도 2개의 표적 마커는 POU4F2, SALL1, SDC2, ASCL4, 유전자간 영역 1, TMEFF2, 유전자간 영역 4, NKX2-6, 유전자간 영역 5, SLC24A2, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, 및 CRHBP로 이루어진 군으로부터 선택되는 것인 단계; 및
(III). 단계 (II)에서 정량화된 표적 마커 세트의 적어도 하나의 표적 마커의 메틸화 수준을 각각 치료 전 대상체로부터 수득된 DNA를 함유하는 생물학적 샘플에 대해서 단계 (I) 및 단계 (II)를 반복함으로써 정량화된 치료 전 동일 대상체로부터 수득된 하나 이상의 표적 마커(들)의 상응하는 메틸화 수준을 비교하는 단계로서, 하나 이상의 표적 마커(들)의, 치료 전 그의 상응하는 메틸화 수준에 비해서 더 낮은 메틸화 수준은, 대상체가 치료에 반응성임을 나타내는 것인 단계.
일부 실시형태에서, 본 개시내용의 표적 마커 세트는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 또는 그 초과의 표적 마커를 포함한다.
일부 실시형태에서, 본 개시내용의 단계 (II)는 하기를 포함한다:
(i) 단계 (I)에서 수득된 처리된 DNA 내의 표적 마커 세트의 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭 프라이머 풀을 사용해 사전-증폭하는 단계로서, 표적 마커 세트는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 것인 단계; 및
(ii) 상기 하위 단계 (i)에서 획득된 DNA 내의 표적 마커 세트의 개별 메틸화 수준을 정량화하는 단계.
일부 실시형태에서, 단계 (II)의 하위 단계 (i)이 존재한다. 일부 실시형태에서, 단계 (II)의 하위 단계 (i)은 부재한다. 일부 실시형태에서, 상기 기술된 방법은 단계 (I) 전에 대상체로부터 유래된 생물학적 샘플로부터 DNA를 수득하는 단계를 더 포함한다.
다른 양태에서, 본 개시내용은 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법을 제공하고, 상기 방법은 하기 단계를 포함한다:
(a) 대상체로부터 DNA를 함유하는 생물학적 샘플을 수득하는 단계;
(b) 단계 (a)로부터 수득된 생물학적 샘플 중 DNA를, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
(c) 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭 프라이머 풀을 사용하여 사전-증폭하는 단계로서, 적어도 하나 (예를 들어, 각각)의 표적 마커 (들)의 적어도 일부분이 사전-증폭되고, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하고; 단계 (c)는 존재하거나 또는 부재하는 것인 단계;
(d) 단계 (c)가 존재하면, 단계 (c)로부터 획득된 DNA를 기반으로 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하고; 단계 (c)가 부재하면, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하는 단계로서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하는 것인 단계; 및
(e) 단계 (d)의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 각각, 상응하는 기준 수준과 비교하는 단계로서, 하나 이상의 표적 마커(들)의, 그의 상응하는 기준 수준에 비해서 동일하거나 더 높은 메틸화 수준은, 대상체가 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타내는 것인 단계.
다른 양태에서, 본 개시내용은 하기 단계를 포함하는, 결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 방법을 제공한다:
(a) 대상체로부터 DNA를 함유하는 생물학적 샘플을 수득하는 단계;
(b) 단계 (a)로부터 수득된 생물학적 샘플 중 DNA를, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
(c) 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭 프라이머 풀을 사용해 사전-증폭하는 단계로서, 적어도 하나 (예를 들어, 각각)의 표적 마커 (들)의 적어도 일부분이 사전-증폭되고, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하고; 단계 (c)는 존재하거나 또는 부재하는 것인 단계;
(d) 단계 (c)가 존재하면, 단계 (c)로부터 획득된 DNA를 기반으로 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하고; 단계 (c)가 부재하면, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하는 단계로서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하는 것인 단계; 및
(e) 단계 (d)의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 각각 치료 전 대상체로부터 수득된 DNA를 함유하는 생물학적 샘플에 대해서 단계 (a), 단계 (b), 임의로 단계 (c), 및 단계 (d)를 반복함으로써 정량화된 치료 전 동일 대상체로부터 수득된 하나 이상의 표적 마커(들)의 상응하는 메틸화 수준과 비교하는 단계로서, 하나 이상의 표적 마커(들)의, 치료 전 그의 상응하는 메틸화 수준에 비해서 더 낮은 메틸화 수준은, 대상체가 치료에 반응성임을 나타내는 것인 단계.
본 명세서에서 사용되는 용어 "에 대해 스크리닝하다", 및 "에 대해 스크리닝한다" 또는 "에 대해 스크리닝하는" 같은 별형은 병리학적 상태, 질환 또는 병태의 확인, 예컨대 결장직장 신생물의 확인을 의미하거나, 또는 특정 치료 용법으로 이득을 얻을 수 있는 결장직장 신생물을 갖는 대상체의 확인을 의미한다. 본 개시내용에서, 용어 "스크리닝", "에 대해 스크리닝", "진단" 및 "진단하는"은 상호교환적으로 사용될 수 있다.
본 명세서에서 사용되는 용어 "신생물"은 병변, 종양, 또는 다른 캡슐화 또는 비캡슐화 종괴 또는 신생물성 세포를 포함하는 다른 성장 형태에 대한 언급으로서 이해해야 한다. "신생물성 세포"는 비정상적인 성장을 보이는 세포에 대한 언급으로서 이해해야 한다. 용어 "성장"은 이의 광역 의미로 이해해야 하고 증식에 대한 언급을 포함한다. 이와 관련하여, 비정상적인 세포 성장의 예는 세포의 비제어적인 증식이다. 다른 예는 세포의 실패한 아폽토시스에 따라, 이의 일반적인 생명 주기의 연장이다. 신생물성 세포는 양성 세포 또는 악성 세포일 수 있다. 일부 실시형태에서, 대상 신생물은 선종 또는 선암종이다. 어느 하나의 이론 또는 작용 방식에 본 발명을 제한하지 않고, 선종은 일반적으로 상피 조직에서 유래되거나 또는 명확하게 정의된 상피 구조를 나타내는 상피 기원의 양성 종양이다. 이들 구조는 선상 외관을 취할 수 있다. 양성 선종 또는 양성 신생물성 병변의 악성 선암종으로의 진행에 따라 발생되는 바와 같은, 선종 내 악성 세포 개체군을 포함할 수 있다. 일부 실시형태에서, 신생물은 악성, 예컨대 암종이다. 일부 실시형태에서, 신생물은 비악성, 예컨대 선종이다.
본 명세서에서 사용되는 용어 "결장직장 신생물"은 결장, 직장, 및/또는 충수 돌기에서 발생되는 신생물을 의미한다. 일부 실시형태에서, 결장직장 신생물은 결장직장암, 거대 결장직장 선종, 및/또는 무경성 톱니상 용종이다. 일부 실시형태에서, 결장직장 신생물은 전암성이다.
본 명세서에서 사용되는 용어 전암성"은 암 발달의 높은 위험성와 연관된 조직학적 변화를 나타내는 신생물을 의미한다. 이러한 병태의 예는 결장직장 세포 증식 장애와 관련하여, 고도의 이형성을 수반하는 세포 증식성 장애, 예를 들어, 결장의 선종성 용종을 포함한다.
본 명세서에서 사용되는 신생물, 예컨대 선종 또는 선암종과 관련한 용어 "발생"은 이형성증을 나타내는 그 대상체의 하나 이상의 세포에 대한 언급으로서 이해해야 한다. 이와 관련하여 선종 또는 선암종은 이형성 세포의 덩어리가 발달되었다는 점에서 잘 발달된 것일 수 있다. 대안적으로, 선종 또는 선암종은 단지 상대적으로 소수의 비정상적인 세포 분열이 진단 시점에 발생되었다는 점에서 최초기 병기일 수 있다. 본 개시내용은 또한 결장직장 신생물, 예컨대 결장직장암의 개시에 대한 대상체의 위험성의 평가까지 확장된다.
본 명세서에서 사용되는 용어 "평가하다" 또는 "평가"는 결장직장 신생물 발달로 영향받은 대상체 및 영향받지 않은 대상체 유래 샘플을 구별하는 능력 또는 결장직장 신생물 발달의 상이한 병기를 갖는 대상체 유래 샘플을 구별하는 능력을 의미한다. 일부 실시형태에서, 평가는 대상체의 종양이 발달 병기에 들어갔는지 여부 또는 대상체의 종양이 발달 병기로 들어갈 높은 확률이 존재하는지 여부의 결정에 관한 것이다. 일부 실시형태에서, 평가는 대상체 종양의 분류 (예를 들어, 병기 I, 병기 II, 병기 III, 병기 IV 등)에 관한 것이다. 일부 실시형태에서, 평가는 대상체 종양의 발달이 줄었는지 또는 더 증증이 되었는지 여부의 결정에 관한 것이다. 일부 실시형태에서, 평가는 요법으로부터의 임상 이득의 가능성을 평가하는데 도움을 줄 수 있다. 일부 실시형태에서,평가는 환자가 치료, 예를 들어 특정 치료제를 사용한 치료 이후에 개선되는지 여부 및/또는 개선될 확률에 관한 것이다. 본 개시내용의 평가 방법은 임의의 특정 환자에 대한 가장 적절한 치료 양식을 선택하여 치료 결정하기 위해 임상적으로 사용될 수 있다. 본 개시내용의 평가 방법은 치료 용법, 예컨대, 예를 들어, 소정 치료제 또는 병용물의 투여, 외과적 중재술, 스테로이드 치료 등을 포함한, 소정 치료 용법 이후에, 환자의 장기간 생존이 가능한지 여부를 평가하는데 가치있는 도구일 수 있다.
당업자가 이해하는 바와 같이 판단 단계 또는 판단은 분석 샘플의 100%에서 정확한 것을 목표로 하지 않을 수 있다. 그러나, 분석된 샘플의 통계적으로 유의한 분량이 올바르게 분류되는 것을 요구한다. 통계적으로 유의한 분량은 상이한 통계적 도구의 사용에 의해서, 예를 들어, 제한없이, 신뢰 구간의 결정, p 값의 결정, 스튜던트 (Student) 검정 또는 피셔 (Fisher) 판별 함수에 의해서 당업자가 확립할 수 있다. 상세사항은 문헌 [Dowdy and Wearden, Statistics for Research, John Wiley & Sons, New York 1983]을 참조한다. 일정 실시형태에서, 신뢰 구간은 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%이다. 일부 실시형태에서, p 값은 0.1, 0.05, 0.01, 0.005 또는 0.0001 미만이다.
본 명세서에서 사용되는 용어 "발달"은 유전적으로 결정된 경로, 예를 들어, 이전, 하급 또는 초기 병기부터 이후에, 보다 복잡하거나 또는 진행된 병기로 물리적 성숙화의 천연 진행 과정에 따른 세포 형상 및 생리의 변경을 의미한다.
본 명세서에서 사용되는 용어 "예후"는 예를 들어, 질환 (예를 들어, 암)의 재발, 발적, 및 약물 내성을 포함한 질환 증상의 결과 가능성의 예측을 의미한다. 이 용어는 또한 요법으로부터의 임상적 이득의 가능성의 예측을 의미한다. 일부 실시형태에서, 통계 알고리즘의 사용은 대상체에서 질환의 예후를 제공한다. 예를 들어, 예후는 수술, 암의 임상적 아형 (예를 들어, 고형 종양, 예컨대 결장직장암, 흑색종, 및 신장 세포 암종)의 발달, 하나 이상의 임상적 인자의 발달, 또는 질환으로부터의 회복일 수 있다. 예후는 불량한 예후 (예를 들어, 재발 또는 약물 내성 발생 가능성), 또는 양성 예후일 수 있다.
본 명세서에서 사용되는 용어 "반응성"은 치료에 대한 대상체의 유리한 반응을 의미한다. 치료에 대한 대상체의 반응도는 제한없이, (1) 어느 정도까지, 둔화 및 완전한 정지를 포함한, 질환 진행의 억제; (2) 질환 에피소드 및/또는 증상의 수의 감소; (3) 병변 크기의 감소; (4) 인접한 말초 장기 및/또는 조직으로 질환 세포 침윤의 억제 (즉, 감소, 둔화 또는 완전 정지); (5) 질환 확산의 억제 (즉, 감소, 둔화 또는 완전 정지); (6) 어느 정도까지, 장애와 연관된 하나 이상의 증상의 경감; (7) 치료 후 무질환 발현 기간의 증가; (8) 반드시는 아니지만, 질환 병변의 퇴행 또는 절제, 예를 들어, 무진행 생존을 야기시킬 수 있는, 자가면역 반응의 감소; (9) 증가된 전체 생존; (10) 더 높은 반응률; 및/또는 (11) 치료 후 소정 시점에 감소된 사망률을 포함한, 대상체에 대한 이득을 의미하는 임의 종료점을 사용해 평가될 수 있다. 용어 "이득" 또는 "유리한"은 가장 넓은 의미로 사용되고 임의의 바람직한 효과를 의미한다.
본 개시내용에서, 단계 (a), 단계 (b), 단계 (c) 및 단계 (d)의 상세한 설명은 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법, 및 결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 방법 둘 모두에 적용한다. 양쪽 방법에 대한 단계 (e)는 별도로 설명될 것이다. 또한, 본 개시내용에서, 본 개시내용의 단계 (I)은 본 개시내용의 단계 (b)와 동일하거나 또는 적어도 유사하다. 또한, 본 개시내용의 단계 (II)의 하위 단계 (i)은 본 개시내용의 단계 (c)와 동일하거나 또는 적어도 유사하고; 본 개시내용의 단계 (II)의 하위 단계 (ii)는 본 개시내용의 단계 (d)와 동일하거나 또는 적어도 유사하다. 또한, 본 개시내용의 단계 (III)은 본 개시내용의 단계 (e)와 동일하거나 또는 적어도 유사하다. 따라서, 단계 (I) 및 단계 (b)는 하기에서 "단계 (b)"로서 총칭하여 기술되고, 단계 (II) 및 단계 (c)의 하위 단계 (i)은 하기에서 "단계 (c)"로서 총칭하여 기술되고, 단계 (II) 및 단계 (d)의 하위 단계 (ii)는 하기에서 "단계 (d)"로서 총칭하여 기술되고, 단계 (III) 및 단계 (e)는 하기에서 "단계 (e)"로서 총칭하여 기술된다.
단계 (a)
본 개시내용에 따른 방법의 단계 (a)에서, 대상체 유래 DNA를 함유하는 생물학적 샘플을 수득한다.
본 명세서에서 사용되는 용어 "생물학적 샘플"은 예를 들어, 물리적, 생화학적, 화학적 및/또는 생리적 특징을 기반으로, 특징규명 및/또는 확인하려는 세포 및/또는 다른 분자적 독립체 (예를 들어, DNA)를 함유하는 관심 대상체로부터 수득하거나 또는 유래된 생물학적 조성물을 의미한다. 생물학적 샘플은 제한없이, 당업자에게 공지된 임의의 방법을 통해서 수득된, 대상체의 세포, 조직, 장기 및/또는 생물학적 유체를 포함한다. 일부 실시형태에서, 생물학적 샘플은 조직 절편, 생검, 파라핀-포매 조직, 체액, 결장 삼출액, 수술 절제 샘플, 단리된 혈액 세포, 혈액 단리 세포, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 체액은 전체 혈액, 혈액 혈청, 혈액 혈장, 소변, 점액, 타액, 복막액, 흉막액, 흉부액, 활액, 뇌척수액, 흉막천자액, 복수, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 결장 삼출액은 분변 샘플 및 관장 세척 샘플로 이루어진 군으로부터 선택된다. 본 명세서에 개시된 방법에 따라서 검사에 가장 적합한 유형의 샘플의 선택은 상황의 특성에 의존하게 될 것이다. 일부 실시형태에서, 생물학적 샘플은 대상체의 전체 혈액으로부터 수득된다. 일부 실시형태에서, 생물학적 샘플은 대상체의 혈액 혈장으로부터 수득된다. 당업자는 전체 혈액으로부터 혈액 혈장을 제조하기 위한 다양한 방법을 인식할 것이다. 예를 들어, 일부 실시형태에서, 혈액 혈장은 대상체로부터 전체 혈액의 1회, 2회, 3회, 4회, 5회, 또는 그 초과의 횟수의 원심분리를 통해서 수득된다.
본 명세서에서 사용되는 용어 "대상체"는 인간 및 비-인간 동물을 포함한다. 비-인간 동물은 모든 척추동물, 예컨대 포유동물 및 비-포유동물을 포함한다. "대상체"는 또한 가축 예컨대 소, 돼지, 양, 가금류 및 말; 또는 설치류 예컨대 래트, 마우스; 또는 비-인간 영장류 예컨대 유인원, 원숭이, 레서스 원숭이; 또는 가축 예컨대 개 또는 고양이일 수 있다. 일부 실시형태에서, 대상체는 인간 또는 비-인간 영장류이다. 일부 실시형태에서, 대상체는 인간이다. 용어 "대상체" 및 "개체"는 본 개시내용에서 상호교환적으로 사용될 수 있다.
일부 실시형태에서, DNA는 생물학적 샘플로부터 단리된다. 생물학적 샘플로부터 DNA의 단리 및 정제는 상업적으로 입수가능한 키트의 사용을 포함하여, 당분야에 공지된 다양한 방법을 사용하여 수행될 수 있다. 예를 들어, DNA는 부분적으로 단백질-분해 효소를 사용하여, 고도의 변성 및 환원 조건 하에서 출발 물질을 용해시키고, 페놀/클로로포름 추출 방법을 통해 수득된 핵산 분획을 정제하고 투석 또는 에탄올 침전을 통해 수층으로부터 핵산을 회수하여 세포 및 조직으로부터 단리된다 (참조: 예를 들어, Sambrook, J., Fritsch, E. F. in T. Maniatis, C S H, Molecular Cloning, 1989). 다른 예로서, 이제 특히 아가로스 겔로부터 DNA 단편을 정제하고, 박테리아 용해물로부터 플라스미드 DNA를 단리할뿐만 아니라, 혈액, 조직 또는 세포 배양물로부터 보다 긴 사슬의 핵산 (게놈 DNA, 전체 세포 RNA)을 단리하기 위한 다수의 시약 시스템이 존재한다. 많은 이들 상업적으로 입수가능한 정제 시스템은 상이한 카오트로픽 염의 용액의 존재 하에서 미네랄 담체에 핵산을 결합시키는 합리적으로 충분히 공지된 원리를 기반으로 한다. 이들 시스템에서, 미세하게 분쇄된 유리 분말, 규조토 또는 실리카 겔의 현탁액이 담체 재료로서 사용된다. 생물학적 샘플로부터 DNA를 단리하고 정제하기 위한 일부 다른 방법은 예를 들어, US7888006B2 및 EP1626085A1에 기술된다. 방법의 선택은 시간, 비용, 및 DNA의 필요 분량을 포함한 몇몇 인자에 의해 영향받을 것이다.
일부 실시형태에서, 생물학적 샘플에 함유된 DNA는 게놈 DNA를 포함한다. 본 명세서에서 사용되는 용어 "게놈 DNA"는 세포 또는 유기체의 완전한 게놈, 및 이의 단편 또는 부분을 함유하는 DNA를 의미한다. 게놈 DNA는 대상체로부터 유래하는 DNA의 큰 조각 (예를 들어, 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 또는 300 kb 초과)이고, 천연 변형 예컨대 DNA 메틸화를 가질 수 있다.
일부 실시형태에서, 생물학적 샘플에 함유하는 DNA는 세포 DNA를 포함한다. 본 명세서에서 사용되는 용어 "세포 DNA"는 생체내에서 세포에 존재하는 DNA, 또는 생체내에서 세포로부터 수득되어, DNA가 생체내 세포로부터 제거되지 않았으면 시험관내에서 분리, 단리 또는 달리 조작된 DNA를 의미한다.
일부 실시형태에서, 생물학적 샘플에 함유하는 DNA는 세포-무함유 DNA를 포함한다. 본 명세서에서 사용되는 용어 "세포-무함유 DNA"는 생체내에서 세포 밖에 존재하는 DNA 단편을 의미한다. 이 용어는 또한 생체내 세포외 공급원으로부터 수득되어 시험관내에서 분리, 단리 또는 달리 조작된 DNA 단편을 의미하고자 사용할 수 있다. 세포-무함유 DNA 중 DNA 단편은 전형적으로 약 100 내지 200 bp 범위의 길이를 갖는데, 아마도 뉴클레오솜 주변을 감싼 DNA 스트레치의 길이와 관련된다. 세포-무함유 DNA는 예를 들어, 세포-무함유 태아 DNA 및 순환 종양 DNA를 포함한다. 세포-무함유 태아 DNA는 임산부의 체내에서, 예컨대 혈액에서 순환하고, 태아 게놈을 나타내는 반면, 순환 종양 DNA는 암 환자의 체내에서, 예컨대 혈액에서 순환한다. 일부 실시형태에서, 세포-무함유 DNA는 대상체의 세포 DNA가 실질적으로 없을 수 있다. 예를 들어, 세포-무함유 DNA는 mL 당 약 1,000 ng 미만, mL 당 약 100 ng 미만, mL 당 약 10 ng 미만, 또는 mL 당 약 1 ng 미만의 세포 DNA를 함유할 수 있다.
세포-무함유 DNA는 당분야에 공지된 통상의 기술을 사용해 제조될 수 있다. 예를 들어, 혈액 샘플의 세포-무함유 DNA는 약 3-30분, 약 3-15분, 약 3-10분, 약 3-5분 동안, 약 200 - 20,000g, 약 200 - 10,000g, 약 200 - 5,000g, 약 300 - 4000g 등의 속도로, 혈액 샘플을 원심분리하여 수득될 수 있다. 예를 들어, 일부 실시형태에서, 혈액 샘플의 세포-무함유 DNA는 대상체로부터의 혈액 혈장 또는 혈청의 1회, 2회, 3회, 4회, 5회 또는 그 초과의 횟수의 원심분리를 통해서 수득될 수 있다. 일부 실시형태에서, 생물학적 샘플은 가용성 DNA를 포함하는 세포-무함유 분획으로부터 세포 및 그들 단편을 분리하기 위해 미세여과를 통해 수득될 수 있다. 통상적으로, 미세여과는 필터, 예를 들어, 0.1 ㎛ ∼ 0.45 ㎛ 막 필터, 예컨대 0.22 ㎛ 막 필터를 사용해 수행될 수 있다.
일부 실시형태에서, 분석을 위해서 전체 혈액, 혈액 혈청 또는 혈액 혈장으로부터 세포-무함유 DNA의 추출은 상업적으로 입수가능한 DNA 추출 생산물을 사용해 수행된다. 이러한 추출 방법은 순환 DNA의 높은 회수 (>50%)를 주장하고 일부 생산물 (예를 들어; QIAamp 순환 핵산 키트, Qiagen에서 제조)은 소형 크기의 DNA 단편을 추출한다고 주장한다. 사용되는 전형적은 샘플 부피는 1-5 mL 범위의 혈청 또는 혈장이다.
일부 실시형태에서, 세포-무함유 DNA는 순환 종양 DNA를 포함한다. 순환 종양 DNA ("ctDNA")는 세포와 회합되지 않은 체액 (예를 들어, 혈액, 소변, 타액, 가래, 분변, 흉막액, 뇌척수액 등) 중 종양-유래 단편화 DNA이다. 일반적으로, ctDNA는 대략 150 염기쌍의 평균 길이로, 고도로 단편화된다. ctDNA는 일반적으로 체액 (예를 들어, 혈장) 중 매우 작은 분획의 세포-무함유 DNA를 포함하고, 예를 들어, ctDNA는 약 10% 미만의 혈장 DNA를 구성할 수 있다. 일반적으로, 이러한 백분율은 약 1% 미만, 예를 들어, 약 0.5% 미만 또는 약 0.01 % 미만이다. 추가로, 혈장 DNA의 총량은 일반적으로 매우 낮은데, 예를 들어, 혈장 중 약 10 ng/mL이다. ctDNA의 분량은 개체마다 다양하고 종양의 유형, 이의 위치, 및 암성 종양 경우, 암 병기에 의존하게 된다. 그러나, ctDNA는 일반적으로 체액 중에 매우 드물고 극도로 민감하고 특이적인 기술을 통해서만 검출될 수 있다. ctDNA의 검출은 종양의 검출 및 진단, 종양-특이적 치료의 안내, 및 암의 관해 모니터링에서 도움이 될 수 있다.
단계 (b)
본 개시내용에 다른 방법의 단계 (b)에서, 단계 (a)로부터 수득된 생물학적 샘플 중 DNA는 DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약으로 처리되어서, 처리된 DNA가 수득된다.
DNA 메틸화는 메틸기를 (예를 들어, DNA 메틸 트랜스퍼라제 효소의 작용에 의해) DNA 분자 (예를 들어, DNA 분자의 시토신 염기 또는 염기들)에 첨가하는 생물학적 과정이다. 포유동물에서, DNA 메틸화는 시토신-포스페이트-구아닌 (CpG) 디뉴클레오티드 (즉, "CpG 부위")의 5' 위치에서 거의 발견되며, 프로모터 내 또는 유전자의 제1 엑손에서 5'-CpG-3' 디뉴클레오티드에서 발견될 때 유전자의 후생적 불활성화를 초래한다. DNA 메틸화가 유전자 발현, 종양형성, 및 기타 유전 및 후생적 질환의 조절에서 중요한 역할을 한다는 것은 충분히 입증되어 있다.
본 명세서에서 사용되는 용어 "메틸화된 시토신 잔기"는 메틸기가 시토신 고리의 탄소 원자 (예를 들어, C5 원자)에 부착된 시토신 잔기의 유도체를 의미한다. 용어 "비메틸화된 시토신 잔기"는 "메틸화된 시토신 잔기"와 대조적으로 시토신 고리의 탄소 원자 (예를 들어, C5 원자)에 메틸기가 부착되지 않은 비유도체화된 시토신 잔기를 의미한다. 시토신 잔기가 메틸화된 CpG 부위는 메틸화된 CpG 부위인 한편, 시토신 잔기가 메틸화되지 않은 CpG 부위는 비메틸화된 CpG 부위이다.
일부 실시형태에서, 단계 (b)에서 사용되는 시약은 DNA에서 비메틸화 및 메틸화 CpG 부위(들)를 구별할 수 있어서, 처리된 DNA를 수득한다. 시약은 비메틸화된 시토신 잔기(들)에서 선택적으로 작용할 수 있지만 메틸화된 시토신 잔기(들)에서는 유의하게 작용하지 않거나; 또는 시약은 메틸화된 시토신 잔기(들)에서 선택적으로 작용할 수 있지만 비메틸화된 시토신 잔기(들)에서 유의하게 작용할 수 없다. 결론적으로, 본래 DNA는 메틸화 의존적 방식으로 처리된 DNA로 전환되어서, 처리된 DNA는 이의 혼성화 거동을 통해서 본래 DNA와 구별할 수 있다.
예를 들어, 일부 시약은 비메틸화된 시토신 잔기(들)를 우라실, 티민, 또는 혼성화 관점에서 시토신과 유사하지 않은 다른 염기로 선택적으로 전환시킬 수 있는 반면, 메틸화된 시토신 잔기(들)는 비전환된 채로 남아있었다. 다른 예의 경우, 일부 시약은 메틸화된 경우에는 잔기를 선택적으로 절단할 수 있거나, 또는 비메틸화된 경우에는 잔기를 선택적으로 절단할 수 있다.
본 명세서에서 사용되는 용어 "처리된 DNA"는 DNA에서 비메틸화된 부위 및 메틸화된 부위를 구별할 수 있는 시약으로 처리된 DNA를 의미하고, 즉, DNA의 DNA 메틸화 상태가 변화되었다.
일정 실시형태에서, 단계 (b)의 시약은, CpG 부위(들)에서 비메틸화된 시토신 잔기(들)를 선택적으로 변형시켜서 변형된 잔기(들)를 생성시키지만, 메틸화된 시토신 잔기(들)를 유의하게 변형시키지 않는다.
일부 실시형태에서, 단계 (b)의 시약은 바이술파이트 시약을 포함한다. 본 명세서에서 사용되는 용어 "바이술파이트 시약"은 메틸화 및 비메틸화 CpG 디뉴클레오티드 서열을 구별하기 위해 본 명세서에 개시된 바와 같이 유용한, 바이술파이트, 다이술파이트, 아황산수소 또는 이들의 임의의 조합을 포함하는 시약을 의미한다. 본 개시내용에서, 바이술파이트 시약으로 DNA의 처리는 "바이술파이트 반응" 또는 "바이술파이트 처리"로서도 기술되는데, 바이술파이트 이온의 존재 하에서, 메틸화된 시토신 잔기는 유의하게 전환되지 않지만, 비메틸화된 시토신 잔기, 특히 핵산에서 비메틸화된 시토신 잔기를 우라실 염기(들), 티민 염기(들) 또는 혼성화 거동 관점에서 시토신(들)과 유사하지 않은 다른 염기(들)로 전환을 위한 반응을 의미한다. 달리 말해서, 바이술파이트 처리는 메틸화 및 비메틸화 CpG 디뉴클레오티드를 구별하는데 유용하다.
메틸화된 시토신 잔기의 검출을 위한 바이술파이트 반응은 [Frommer, M., et al., Proc Natl Acad Sci USA 89 (1992) 1827-31] 및 [Grigg, G., and Clark, S., Bioessays 16 (1994) 431-6]에 상세히 기술되어 있다. 바이술파이트 반응은 탈아민화 단계 및 탈술폰화 단계를 함유한다 (참조: Grigg and Clark, supra). 메틸화된 시토신 잔기가 유의하게 전환되지 않는다는 진술은 매우 적은 백분율 (예를 들어, 0.1% 미만, 0.2% 미만, 0.3% 미만, 0.4% 미만, 0.5% 미만, 0.6% 미만, 0.7% 미만, 0.8% 미만, 0.9% 미만, 1% 미만, 2% 미만, 3% 미만, 4% 미만, 5% 미만, 6% 미만, 7% 미만, 8% 미만, 9% 미만, 10% 미만, 11% 미만, 12% 미만, 13% 미만, 14% 미만, 15% 미만, 16% 미만, 17% 미만, 18% 미만, 19% 미만, 20% 미만)의 메틸화된 시토신 잔기가 우라실, 티민, 또는 혼성화 거동 관점에서 시토신과 유사하지 않은 다른 염기로 전환된다는 것을 배제할 수 없다는 사실만을 고려해야 하지만, 비메틸화된 시토신 잔기를 유일하게 독점적으로 전환시키는 것을 의도한다.
당업자는 예를 들어, 바이술파이트 처리의 주요 매개변수를 개시한 문헌 [Frommer M., et al. supra] 또는 [Grigg and Clark, supra]을 참조하여, 바이술파이트 처리, 특히 탈아민화 단계 및 탈술폰화 단계를 수행하는 방법을 알고있다. 탈아민화 효율에 대한 인큐베이션 시간 및 온도의 영향 및 DNA 분해에 영향을 미치는 매개변수가 개시된다.
일부 실시형태에서, 바이술파이트 시약은 암모늄 바이술파이트, 나트륨 바이술파이트, 칼륨 바이술파이트, 칼슘 바이술파이트, 마그네슘 바이술파이트, 알루미늄 바이술파이트, 아황산수소 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 바이술파이트 시약은 나트륨 바이술파이트이다. 일부 실시형태에서, 바이술파이트 시약은 상업적으로 입수가능한, 예를 들어, MethylCode™ 바이술파이트 전환 키트, EpiMark™ 바이술파이트 전환 키트, EpiJET™ 바이술파이트 전환 키트, EZ DNA 메틸화-Gold™ 키트 등이다. 일부 실시형태에서, 바이술파이트 반응은 키트의 사용 설명서에 따라서 수행된다.
일부 실시형태에서, 단계 (b)의 시약은 비메틸화된 경우 잔기를 선택적으로 절단하지만 메틸화된 경우 잔기를 절단하지 않거나, 또는 메틸화된 경우에는 잔기를 선택적으로 절단하지만 비메틸화된 경우에는 잔기를 절단하지 않는다.
일부 실시형태에서, 단계 (b)의 시약은 메틸화 감응성 제한 효소 (MSRE)이다.
용어 "메틸화 감응성 제한 효소"는 이의 인식 부위의 메틸화 상태에 의존하여 핵산을 선택적으로 분해하는 효소를 의미한다. 인식 부위가 메틸화되지 않거나 또는 반메틸화된 경우에 특이적으로 절단하는 이러한 제한 효소의 경우에, 절단은 일어나지 않거나 또는 인식 부위가 메틸화되면 효율이 유의하게 감소된다. 인식 부위가 메틸화된 경우에 특이적으로 절단하는 이러한 제한 효소의 경우에, 절단은 일어나지 않거나 또는 인식 부위가 메틸화되지 않으면 효율이 유의하게 감소된다. 일부 실시형태에서, 메틸화 감응성 제한 효소의 인식 서열은 CG 디뉴클레오티드 (예를 들어, cgcg 또는 cccggg)를 함유한다. 일부 실시형태에서, 메틸화 감응성 제한 효소는 이러한 CG 디뉴클레오티드의 시토신 잔기가 탄소 원자 C5에서 메틸화되면 절단하지 않는다.
일부 실시형태에서, MSRE는 HpaII, SalI, SalI-HF®, ScrFI, BbeI, NotI, SmaI, XmaI, MboI, BstBI, ClaI, MluI, NaeI, NarI, PvuI, SacII, HhaI 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
메틸화 감응성 제한 효소, 또는 표적 영역 내 메틸화 및 비-메틸화 CpG 디뉴클레오티드를 구별하는 메틸화 감응성 제한 효소를 포함하는 일련의 제한 효소 시약이 메틸화 결정에 사용되는 방법, 예를 들어, 제한없이 차등 메틸화 혼성화 ("DMH")가 당분야에 공지되어 있다.
일부 실시형태에서, 단계 (a)의 DNA는 메틸화 감응성 제한 효소로 처리 전에 절단될 수 있다. 이러한 방법은 당분야에 공지되어 있고 물리적 및 효소적 수단 둘 모두를 포함할 수 있다. 특히 바람직한 것은 메틸화 감응성이 아니고, 그의 인식 부위는 AT 풍부하고, CG 디뉴클레오티드를 포함하지 않는 하나 또는 다수의 제한 효소의 사용이다. 이러한 효소의 사용은 단편화된 DNA에서 CpG 부위 및 CpG 풍부 영역의 전환을 가능하게 한다. 일부 실시형태에서, 이러한 제한 효소는 MseI, BfaI, Csp6I, Tru1I, Tru9I, MaeI. XspI 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
단계 (c)
본 개시내용에 따른 방법의 단계 (c)에서, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커는 사전-증폭 프라이머 풀을 사용해 사전-증폭되고, 적어도 하나 (예를 들어, 각각)의 표적 마커 (들)의 적어도 일부분이 사전-증폭된다. 본 개시내용에서, 단계 (c)는 또한 사전-증폭 단계로서 지정될 수 있다. 임의 이론에 국한하고 싶지 않지만, 단계 (c)는 본 발명의 목적을 획득하기 위해 반드시 필요한 것은 아니라고 여겨진다. 일부 실시형태에서, 본 개시내용에 따른 방법의 단계 (c)가 존재한다. 일부 실시형태에서, 본 개시내용에 따른 방법의 단계 (c)는 부재한다.
표적 마커(들)의 사전-증폭의 목적 중 하나는 처리된 DNA 내의 표적 마커(들)의 양(들)을, 예를 들어, 표적 마커(들)의 소량(들)으로부터 증가시키는 것이다. 본 명세서에서 사용되는 용어 "증폭", 및 "증폭하는", "증폭된" 및 "증폭하다"같은 별형은 일반적으로 분자 또는 관련 분자 세트의 카피 수의 증가를 야기하는 임의 과정이다. 이것은 폴리뉴클레오티드 분자에 적용되므로, 증폭은 전형적으로 소량의 폴리뉴클레오티드로부터 출발하여, 다수 카피의 폴리뉴클레오티드 분자, 또는 폴리뉴클레오티드 분자의 일부분의 생산을 의미하고, 여기서 증폭된 물질 (앰플리콘, PCR 앰플리콘)은 전형적으로 검출가능하다. 폴리뉴클레오티드의 증폭은 다양한 화학적 및 효소적 과정을 포괄한다. 중합효소 연쇄 반응 (역전사 PCR, PCR), 가닥 치환 증폭 (SDA) 반응, 전사 매개 증폭 (TMA) 반응, 핵산 서열-기반 증폭 (NASBA) 반응, 또는 리가제 연쇄 반응 (LCR) 동안 하나 또는 소수 카피의 주형 RNA 또는 DNA 분자로부터 다수의 DNA 카피의 생성이 증폭의 형태이다.
본 명세서에서 사용되는 용어 "표적 마커"는 그의 메틸화 수준이 결장직장 신생물 (예를 들어, 결장직장암)을 의미하거나, 또는 결장직장 신생물 (예를 들어, 결장직장암)의 발생 또는 발생 위험성을 의미하거나, 또는 결장직장 신생물 (예를 들어, 결장직장암)의 발달 또는 예후를 의미하는, 관심 핵산, 또는 유전자 영역을 의미한다. 용어 "마커" 및 "유전자"는 본 개시내용에서 상호교환적으로 사용될 수 있다. 용어 "마커" 또는 "유전자"는 모든 이의 전사물 변이체 (예를 들어, 용어 "셉틴9"는 예를 들어 이의 절두된 전사물 Q9HC74를 포함함) 및 이의 모든 프로모터 및 조절 구성요소를 포함하는 것으로 간주되어야 한다. 당업자가 이해하게 되는 바와 같이, 일부 유전자는 대상체 또는 단일 뉴클레오티드 다형성 ("SNP") 간에 대립유전자 변이를 나타내는 것으로 알려져 있다. SNP는 다양한 크기의 삽입 및 결실 및 단순 서열 반복, 예컨대 디뉴클레오티드 및 트리뉴클레오티드 반복을 포괄한다. 그러므로, 본 개시내용은 임의의 다른 돌연변이, 다형성 또는 대립유전자 변이로부터 발생된 모든 형태의 마커/유전자로 확장되는 것으로 이해해야 한다. 또한, 용어 "마커" 및 "유전자"는 마커 또는 유전자의 센스 가닥 및 안티센스 가닥 둘 모두의 서열을 포함하는 것으로 이해해야 한다.
본 명세서에서 사용되는 용어 "표적 마커"는 1) 생물학적 샘플 또는 게놈 DNA에서 발견되는 본래 마커 (특히 메틸화 상태), 및 2) 이의 처리된 서열 (예를 들어, 바이술파이트 전환된 대응물 또는 MSRE 처리된 대응물) 둘 모두를 포괄하는 것으로 광범위하게 이해된다. 바이술파이트 전환된 대응물은 하나 이상의 비메틸화된 시토신 잔기가 우라실 염기(들), 티민 염기(들) 또는 혼성화 거동 관점에서 시토신(들)과 유사하지 않은 다른 염기(들)로 전환된다는 점에서 게놈 서열의 표적 마커와 상이하다. MSRE 처리된 대응물은 서열이 하나 이상의 MSRE 절단 부위에서 절단된다는 점에서 게놈 서열의 표적 마커와 상이하다.
일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 또는 다수의 마커 (예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 마커)를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 NDRG4, 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2 및 유전자간 영역 1로 이루어진 군으로부터 선택되는 14개 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 NDRG4, 셉틴9, BCAT1, IKZF1, BCAN, VAV3, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2 및 유전자간 영역 1로 이루어진 군으로부터 선택되는 13개 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, VAV3, IRF4, BCAN, NDRG4, SDC2, PKNOX2, TMEFF2, 및 유전자간 영역 1로 이루어진 군으로부터 선택되는 11개 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, VAV3, BCAN, NDRG4, SDC2, PKNOX2, TMEFF2, 및 유전자간 영역 1로 이루어진 군으로부터 선택되는 10개 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, VAV3, IRF4, BCAN, NDRG4, SDC2, PKNOX2, 및 TMEFF2로 이루어진 군으로부터 선택되는 10개 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, VAV3, BCAN, NDRG4, SDC2, PKNOX2, 및 TMEFF2로 이루어진 군으로부터 선택되는 9 개 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, VAV3, IRF4, BCAN, 및 NDRG4로 이루어진 군으로부터 선택되는 7개 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, VAV3, BCAN, 및 NDRG4로 이루어진 군으로부터 선택되는 6개 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, VAV3, IRF4, 및 BCAN으로 이루어진 군으로부터 선택되는 6개 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, VAV3, 및 BCAN으로 이루어진 군으로부터 선택되는 5개 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, VAV3, 및 IRF4로 이루어진 군으로부터 선택되는 5개 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 SALL1, BCAT1, 및 셉틴9으로 이루어진 군으로부터 선택되는 3개 마커를 포함한다.
일부 실시형태에서, 적어도 하나의 표적 마커는 최대 하나의 표적 마커 (즉, 하나의 마커이지만 하나 이하의 마커)일 수 있다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 BCAT1이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 IKZF1이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 NDRG4이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 BCAN이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 PKNOX2이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 VAV3이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 IRF4이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 POU4F2이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 SALL1이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 TMEFF2이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 ASCL4이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 FGF12이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 유전자간 영역 1이다.
일부 실시형태에서, 적어도 하나의 표적 마커는 다수의 표적 마커를 포함한다. 일부 실시형태에서, 다수의 표적 마커는 셉틴9, BCAT1, 및 IKZF1로 이루어진 군으로부터 선택되는 적어도 2개 또는 3개 마커를 포함한다. 일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 BCAN, PKNOX2, VAV3, NDRG4, 및 IRF4로 이루어진 군으로부터 선택되는 1개, 2개, 3개, 4개, 또는 5개의 추가 마커를 더 포함한다. 일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 POU4F2, SALL1, SDC2, ASCL4, 유전자간 영역 1, TMEFF2, 유전자간 영역 4, NKX2-6, 유전자간 영역 5, SLC24A2, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, 및 CRHBP으로 이루어진 군으로부터 선택되는 하나 이상 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20)의 추가 마커를 더 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 셉틴9, 및 BCAN, BCAT1, IKZF1, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 BCAN, BCAT1, IKZF1, NDRG4, PKNOX2, VAV3, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 NDRG4, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 BCAT1, 및 BCAN, 셉틴9, IKZF1, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 BCAN, 셉틴9, NDRG4, IKZF1, PKNOX2, VAV3, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 NDRG4, 셉틴9, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 IKZF1, 및 BCAN, 셉틴9, BCAT1, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 BCAN, 셉틴9, BCAT1, PKNOX2, NDRG4, VAV3, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 NDRG4, 셉틴9, 및/또는 BCAT1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 BCAN, 및 셉틴9, BCAT1, IKZF1, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, PKNOX2, VAV3, NDRG4, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 NDRG4, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 VAV3, 및 셉틴9, BCAT1, IKZF1, BCAN, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, PKNOX2, NDRG4, IRF4 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, NDRG4, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 IRF4, 및 셉틴9, BCAT1, IKZF1, BCAN, VAV3, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, NDRG4, PKNOX2, VAV3 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 NDRG4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 PKNOX2, 및 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, NDRG4, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 POU4F2, 및 셉틴9, BCAT1, IKZF1, VAV3, IRF4, BCAN, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, PKNOX2, VAV3, NDRG4, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 SALL1, 및 셉틴9, BCAT1, IKZF1, VAV3, IRF4, BCAN, POU4F2, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, PKNOX2, VAV3, NDRG4, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 TMEFF2, 및 셉틴9, BCAT1, IKZF1, VAV3, IRF4, BCAN, POU4F2, PKNOX2, SDC2, ASCL4, SALL1, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, PKNOX2, VAV3, IRF4, NDRG4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 ASCL4, 및 셉틴9, BCAT1, IKZF1, VAV3, IRF4, BCAN, POU4F2, PKNOX2, SDC2, TMEFF2, SALL1, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, PKNOX2, VAV3, IRF4, NDRG4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 FGF12, 및 셉틴9, BCAT1, IKZF1, VAV3, IRF4, BCAN, POU4F2, PKNOX2, SDC2, TMEFF2, SALL1, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, ASCL4, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, PKNOX2, VAV3, IRF4, NDRG4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 유전자간 영역 1, 및 셉틴9, BCAT1, IKZF1, VAV3, IRF4, BCAN, POU4F2, PKNOX2, SDC2, TMEFF2, SALL1, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, ASCL4, KCTD8, HMX1, MARCH11, CRHBP, FGF12, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, PKNOX2, VAV3, IRF4, NDRG4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 NDRG4, 및 셉틴9, BCAT1, IKZF1, VAV3, IRF4, BCAN, POU4F2, PKNOX2, SDC2, TMEFF2, SALL1, SLC24A2, NKX2-6, KCNA6, SOX1, HS3ST2, ASCL4, KCTD8, HMX1, MARCH11, CRHBP, FGF12, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, PKNOX2, VAV3, IRF4, BCAN, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
본 개시내용에서, 제의 마커/유전자는 그들 명칭 및 그들 염색체 좌표 둘 모두를 참조하여 본 명세서에 기술된다는 것을 이해한다. 염색체 좌표는 2009년 2월에 공개된 인간 게놈 데이터베이스 버전 Hg19 (본 명세서에서 "Hg19 좌표"라고 함)와 일치한다.
본 개시내용에서 표적 마커는 "유전자간 영역 1", "유전자간 영역 2", "유전자간 영역 3", "유전자간 영역 4", "유전자간 영역 5"로서 명명되고, 그들 각각의 염색체 좌표에 의해 정의되는 유전자간 영역을 또한 포함한다는 것을 이해해야 한다. 예를 들어, 본 개시내용에서, 유전자간 영역 1은 chr6:19679885-19693988로 정의되는 영역을 의미하고; 유전자간 영역 2는 chr10:130082033-130087148로 정의되는 영역을 의미하고; 유전자간 영역 3은 chr10:133107880-133113966으로 정의되는 영역을 의미하고; 유전자간 영역 4는 chr7:152620588-152624685로 정의되는 영역을 의미하고; 유전자간 영역 5은 chr8:70945014-70949177로 정의되는 영역을 의미한다.
일부 실시형태에서, 각각의 표적 마커는 a) 하기 기재된 바와 같이 Hg19 좌표로 정의되는 각각의 영역, 및 각각의 출발 부위의 상류 5 kb 및 상기 기술된 각 영역의 각각의 말단 부위의 하류 5 kb, 또는 b) a)의 바이술파이트 전환된 대응물, 또는 c) a)의 MSRE 처리된 대응물이거나 또는 그를 포함한다:
Figure pct00005
Figure pct00006
상기 열거된 바와 같은 Hg19 좌표의 특이적 뉴클레오티드 서열 및 각각의 출발 부위의 상류 5 kb 및 각 영역의 각각의 말단 부위의 하류 5 kb는 공공 데이터베이스 예컨대 UCSC Genome Browser, Ensemble, 및 NCBI 웹사이트에서 입수가능하다.
일부 실시형태에서, 각각의 표적 마커는 또한 이의 모든 변이체를 포함한다. 변이체는 본 명세서에 기술된 마커/유전자 영역에 대해서, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 서열 동일성을 공유하고, 즉 하나 이상의 결실, 부가, 치환, 반전 서열을 갖는 동일한 영역으로부터의 핵산 서열을 포함한다. 따라서, 본 개시내용은 실제 핵산 서열 간 소수의 유전자 변이가 대상체 간에 존재할 수 있다는 사실에도 불구하고 동일한 결과를 획득하는 이러한 변이체로 확장시킨다는 것을 이해해야 한다.
본 명세서에서 사용되는 용어 "백분율 (%) 서열 동일성"은 서열을 정렬하고, 최대 개수의 동일한 아미노산 (또는 핵산)을 획득하기 위해서, 필요하면, 갭을 도입시킨 후에, 기준 서열 중 아미노산 (또는 핵산) 잔기와 동일한 후보 서열 중 아미노산 (또는 핵산) 잔기의 백분율을 의미한다. 달리 말해서, 아미노산 서열 (또는 핵산 서열)의 퍼센트 (%) 서열 동일성은 후보 서열 또는 기준 서열 중에서, 더 짧은 쪽의 아미노산 잔기 (또는 염기)의 총 개수로 비교되는 기준 서열에 대해 동일한 아미노산 잔기 (또는 염기)의 개수를 나누어서 계산될 수 있다. 아미노산 잔기의 보존성 치환은 동일한 잔기로서 간주될 수 있거나 또는 간주되지 않을 수 있다. 퍼센트 아미노산 (또는 핵산) 서열 동일성을 결정하는 목적을 위한 정렬은 예를 들어, 공공으로 입수가능한 도구 예컨대 BLASTN, BLASTp (미국 국립 생물공학 정보 센터 (U.S. National Center for Biotechnology Information) (NCBI)의 웹사이트에서 입수가능, 또한, [Altschul S.F. et al., J. Mol. Biol., 215:403-410 (1990)]; [Stephen F. et al., Nucleic Acids Res, 25:3389-3402 (1997)] 참조), ClustalW2 (유럽 생물정보학 연구소 (European Bioinformatics Institute)의 웹사이트에서 입수가능, 또한, [Higgins D.G. et al., Methods in Enzymology, 266:383-402 (1996)]; [Larkin M.A. et al., Bioinformatics (Oxford, England), 23(21): 2947-8 (2007))] 참조), 및 ALIGN 또는 Megalign (DNASTAR) 소프트웨어를 사용하여 획득할 수 있다. 당업자는 도구에 의해 제공되는 디폴트 매개변수를 사용할 수 있거나, 또는 정렬에 적절한 매개변수, 예컨대 예를 들어, 적합한 알고리즘을 선택하여 사용자 맞춤할 수 있다.
본 명세서에서 제공되는 단계 (c)에서, 적어도 하나 (예를 들어, 각각)의 표적 마커 (들)의 적어도 일부분이 사전-증폭된다. 일정 실시형태에서, 표적 마커의 사전-증폭된 부분은 표적 마커의 하위영역 내에 있다.
어느 하나의 이론 또는 작용 방식에 본 개시내용을 제한하지 않지만, 결장직장 신생물, 예컨대 결장직장암에서 빈번하게 과메틸화되는 고밀도의 CpG 디뉴클레오티드를 함유하는 하위영역 중 표적 마커의 메틸화 수준을 측정하는 것이 특히 유용한 것으로 여겨진다. 이러한 발견은 하위영역을 분석에 특히 유용한 표적이게 만드는데 분석을 요구하는 DNA의 더 짧고 보다 명확하게 정의된 영역 덕분에 스크리닝 과정을 단순화시키고, 또한 이들 영역으로부터의 결과가 분석이 전체로서 표적 마커의 Hg19 영역 전반에서 수행되는 경우 획득되는 것에 비해서 과메틸화의 존재 여부에 관하여 유의하게 더 한정적인 결과를 제공하게 되기 때문이다. 그러므로, 이러한 발견은 진단, 스크리닝/모니터링 과정을 단순화하고 결장직장 신생물 진단의 감도 및 특이성을 증가시킨다. 일부 실시형태에서, 각각의 표적 마커의 하위영역은 a) 하기 기재된 바와 같은 Hg19 좌표에 의해 정의되는 서열, 및 각각의 출발 부위의 상류 5 kb 및 상기 기술된 각 영역의 각각의 말단 부위의 하류 5 kb, 또는 b) a)의 바이술파이트 전환된 대응물, 또는 c) a)의 MSRE 처리된 대응물이거나 또는 그를 포함한다:
Figure pct00007
Figure pct00008
일정 실시형태에서, 각각의 표적 마커의 하위영역은 서열번호 86-112, 167로 이루어진 군으로부터 선택되는 폴리뉴클레오티드 서열, 또는 이의 바이술파이트 전환된 대응물, 또는 이의 MSRE 처리된 대응물이거나 또는 그를 포함한다. 일정 실시형태에서, 표적 마커의 하위영역의 바이술파이트 전환된 대응물은 서열번호 113-166, 168, 169로 이루어진 군으로부터 선택되는 폴리뉴클레오티드 서열이거나 또는 그를 포함한다. 각 표적 마커의 하위영역의 서열번호는 하기 표 1에 표시되고, 서열은 도 6에 제공된다.
Figure pct00009
Figure pct00010
일정 실시형태에서, NDRG4의 하위영역은 서열번호 86, 113, 및 140으로부터 선택되는 서열을 포함하고/하거나; BCAT1의 하위영역은 서열번호 87, 114, 및 141로부터 선택되는 서열을 포함하고/하거나; IKZF1의 하위영역은 서열번호 88, 115, 및 142로부터 선택되는 서열을 포함하고/하거나; 셉틴9의 하위영역은 서열번호 89, 116, 및 143으로부터 선택되는 서열을 포함하고/하거나; SDC2의 하위영역은 서열번호 90, 117, 및 144로부터 선택되는 서열을 포함하고/하거나; VAV3의 하위영역은 서열번호 91, 118, 및 145로부터 선택되는 서열을 포함하고/하거나; TMEFF2의 하위영역은 서열번호 92, 119, 및 146으로부터 선택되는 서열을 포함하고/하거나; SALL1의 하위영역은 서열번호 93, 120, 및 147로부터 선택되는 서열을 포함하고/하거나; BCAN의 하위영역은 서열번호 94, 121, 및 148로부터 선택되는 서열을 포함하고/하거나; POU4F2의 하위영역은 서열번호 95, 122, 및 149로부터 선택되는 서열을 포함하고/하거나; PKNOX2의 하위영역은 서열번호 96, 123, 및 150으로부터 선택되는 서열을 포함하고/하거나; ASCL4의 하위영역은 서열번호 97, 124, 및 151로부터 선택되는 서열을 포함하고/하거나; KCNA6의 하위영역은 서열번호 98, 125, 및 152로부터 선택되는 서열을 포함하고/하거나; SOX1의 하위영역은 서열번호 99, 126, 및 153으로부터 선택되는 서열을 포함하고/하거나; HS3ST2의 하위영역은 서열번호 100, 127, 및 154로부터 선택되는 서열을 포함하고/하거나; FGF12의 하위영역은 서열번호 101, 128, 및 155로부터 선택되는 서열을 포함하고/하거나; KCTD8의 하위영역은 서열번호 102, 129, 및 156으로부터 선택되는 서열을 포함하고/하거나; HMX1의 하위영역은 서열번호 103, 130, 및 157로부터 선택되는 서열을 포함하고/하거나; MARCH11의 하위영역은 서열번호 104, 131, 및 158로부터 선택되는 서열을 포함하고/하거나; CRHBP의 하위영역은 서열번호 105, 132, 및 159로부터 선택되는 서열을 포함하고/하거나; NKX2-6의 하위영역은 서열번호 106, 133, 및 160으로부터 선택되는 서열을 포함하고/하거나; SLC24A2의 하위영역은 서열번호 107, 134, 및 161로부터 선택되는 서열을 포함하고/하거나; 유전자간 영역 1의 하위영역은 서열번호 108, 135, 및 162로부터 선택되는 서열을 포함하고/하거나; 유전자간 영역 2의 하위영역은 서열번호 109, 136, 및 163으로부터 선택되는 서열을 포함하고/하거나; 유전자간 영역 3의 하위영역은 서열번호 110, 137, 및 164로부터 선택되는 서열을 포함하고/하거나; 유전자간 영역 4의 하위영역은 서열번호 111, 138, 및 165로부터 선택되는 서열을 포함하고/하거나; 유전자간 영역 5의 하위영역은 서열번호 112, 139, 및 166으로부터 선택되는 서열을 포함하고/하거나; IRF4의 하위영역은 서열번호 167, 168, 및 169로부터 선택되는 서열을 포함한다.
일부 실시형태에서, 세포-무함유 DNA 중 표적 마커는 1 ng 이하, 0.9 ng 이하, 0.8 ng 이하, 0.7 ng 이하, 0.6 ng 이하, 0.5 ng 이하, 0.4 ng 이하, 0.3 ng 이하, 0.2 ng 이하, 0.1 ng 이하, 0.09 ng 이하, 0.08 ng 이하, 0.07 ng 이하, 0.06 ng 이하, 0.05 ng 이하, 0.04 ng 이하, 0.03 ng 이하, 0.02 ng 이하, 또는 0.01 ng 이하의 양으로 생물학적 샘플에 존재한다. 일부 실시형태에서, 세포-무함유 DNA 중 표적 마커는 0.1% 이하, 0.2% 이하, 0.3% 이하, 0.4% 이하, 0.5% 이하, 0.6% 이하, 0.7% 이하, 0.8% 이하, 0.9% 이하, 1% 이하의 비율로 생물학적 샘플에 존재한다. 일부 실시형태에서, 세포-무함유 DNA 중 표적 마커는 표적 마커에 대한 검출 어세이의 감도 수준 미만의 농도로 생물학적 샘플에 존재한다. "검출 어세이의 감도"는 분석물 농도/양의 작은 차이를 구별하는 검출 어세이의 능력의 측정치이다. 생물학적 샘플에 존재하는 세포-무함유 DNA 중 표적 마커가 검출 어세이의 감도 수준 미만이면, 통상의 방법을 사용하여 샘플 중 표적 마커의 각각 및 전부의 메틸화 수준의 정량화를 방해하게 된다. 대조적으로, 본 명세서에 개시된 방법은 샘플 중에서 매우 소량의 표적 마커를 검출하는데 유용하고 유리하다. 일부 실시형태에서, 세포-무함유 DNA 중 표적 마커는 0.08 ng 이하 또는 0.04 ng 이하의 양으로 생물학적 샘플에 존재한다.
일부 실시형태에서, 단계 (c)로부터 획득된 DNA는 다음 단계 (즉, 단계 (d)) 전에 희석제로 희석된다. 일부 실시형태에서, 희석제는 뉴클레아제 무함유 물, Tris-EDTA 완충제, 및 PCR 억제없는 임의의 다른 완충제로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 단계 (c)의 사전-증폭된 DNA는 사전 희석없이 다음 단계 (즉, 단계 (d))에 직접 첨가된다.
처리된 DNA 내의 적어도 하나의 표적 마커는 사전-증폭 프라이머 풀로 사전-증폭된다. 본 명세서에서 사용되는 용어 "프라이머"는 4개의 상이한 뉴클레오시드 트리포스페이트 및 중합제, 예컨대, 예를 들어, DNA 중합효소의 존재 하에서, 적합한 조건, 예를 들어, 완충제 및 온도 하에서 주형-지정 DNA 합성의 개시점으로서 작용할 수 있는 단일-가닥 올리고뉴클레오티드를 의미한다. 임의의 소정 경우에, 프라이머의 길이는 예를 들어, 프라이머의 의도하는 용도에 의존하며, 일반적으로 15 내지 30 뉴클레오티드 범위이다. 짧은 프라이머 분자는 일반적으로 주형과 충분히 안정한 하이브리드 복합체를 형성하기 위해 보다 낮은 온도를 요구한다. 프라이머는 주형의 정확한 서열을 반영할 필요는 없지만, 이러한 주형과 혼성화하기에 충분히 상보성이어야만 한다. 프라이머 부위는 프라이머가 혼성화하는 주형의 영역이다. 프라이머 쌍은 증폭하려는 서열의 5' 말단과 혼성화하는 5' 전방향 프라이머 및 증폭하려는 서열의 3' 말단의 상보체와 혼성화하는 3' 역방향 프라이머를 포함하는 프라이머 세트이다. 당업자는 당분야의 통상의 지식을 기반으로 증폭하려는 마커(들)에 따라서 프라이머를 디자인할 수 있다 (참조, 예를 들어, PCR Primer: A Laboratory Manual, Cold Spring Harbor Laboratories, NY, 1995). 더 나아가서, 몇몇 소프트웨어 패키지는 다양한 어세이를 위한 최적 프로브 및/또는 프라이머를 디자인하기 위해 공공으로 입수가능하고, 예를 들어, 게놈 연구 센터 (Center for Genome Research) (Cambridge, Mass., USA)에서 입수가능한 Primer 3이 있다. 분명하게, 프로브 또는 프라이머의 잠재적인 사용은 이의 디자인 동안 고려되어야 한다. 예를 들어, 본 발명의 목적을 위해 디자인된 프라이머는 적어도 하나의 CpG 부위를 포함할 수 있거나, 또는 프라이머로부터 수득된 증폭 생산물은 적어도 하나의 CpG 부위를 포함할 수 있다. DNA 메틸화 상태를 검출하기 위한 프라이머를 디자인하기 위한 도구가 또한 당분야에서 입수가능한데, 예를 들어, MethPrimer (Li LC and Dahiya R. MethPrimer: designing primers for Methylation PCRs. Bioinformatics. 2002 Nov;18(11):1427-31)가 있다. 본 개시내용에서, 풀로서 사전-증폭 프라이머를 사용하여, 처리된 DNA 내의 임의의 표적 마커(들) (적어도 하나 (예를 들어, 각각)의 표적 마커 (들)의 적어도 일부분 또는 적어도 하나의 표적 마커의 하위영역)가 사전-증폭될 수 있다.
본 명세서에서 사용되는 용어 "올리고뉴클레오티드"는 2 이상의 뉴클레오티드 (예를 들어, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드), 바람직하게 적어도 5 뉴클레오티드, 보다 바람직하게 적어도 약 10-15 뉴클레오티드 및 보다 바람직하게 적어도 약 15 내지 30 뉴클레오티드, 또는 그 초과 (예를 들어, 올리고뉴클레오티드는 전형적으로 200 잔기 미만의 길이 (예를 들어, 15 내지 100 뉴클레오티드)이지만, 본 명세서에서 사용되는 이 용어는 또한 보다 긴 폴리뉴클레오티드 사슬을 포괄하고자 함)를 포함하는 분자로서 정의된다. 정확한 크기는 많은 인자들에 의존하게 되고, 결국 올리고뉴클레오티드의 궁극적인 기능 또는 용도에 의존한다. 올리고뉴클레오티드는 종종 그들 길이에 의해 지칭된다. 예를 들어, 24 잔기 올리고뉴클레오티드는 "24-량체"라고 한다. 올리고뉴클레오티드는 다른 폴리뉴클레오티드와 혼성화하거나 또는 자가-혼성화하여 2차 및 3차 구조를 형성할 수 있다. 이러한 구조는 듀플렉스, 헤어핀, 십자형, 벤드 및 트리플렉스를 포함할 수 있지만, 이에 제한되지 않는다. 올리고뉴클레오티드는 화학 합성, DNA 복제, 역전사, PCR, 또는 이의 조합을 포함하는, 임의 방식으로 생성될 수 있다.
본 명세서에서 사용되는 용어 "상보적" 또는 "상보성"은 뉴클레오티드 또는 핵산 간, 예컨대, 예를 들어, 이중 가닥 DNA 분자의 2개 가닥 간, 또는 올리고뉴클레오티드 프라이머 및 시퀀싱 또는 증폭하려는 단일 가닥 핵산 상의 프라이머 결합 부위 간 혼성화 또는 염기 쌍형성을 의미한다. 상보적 뉴클레오티드는 일반적으로 A 및 T (또는 A 및 U), 또는 C 및 G이다. 2개 단일 가닥 RNA 또는 DNA 분자는 최적으로 정렬되고 비교되고 적절한 뉴클레오티드 삽입 또는 결실을 갖는 한 가닥의 뉴클레오티드가 다른 가닥의 뉴클레오티드의 적어도 약 80%, 일반적으로 적어도 약 90% 내지 95%, 및 보다 바람직하게 약 98 내지 100%와 쌍형성할 때 상보적이라고 한다. 대안적으로, 상보성은 RNA 또는 DNA 가닥이 이의 상보체와 선택적 혼성화 조건 하에 혼성화되는 경우에 존재한다. 전형적으로, 선택적 혼성화는 적어도 14 내지 25 뉴클레오티드의 스트레치 상에서 적어도 약 65% 상보성, 바람직하게 적어도 약 75%, 보다 바람직하게 적어도 약 90% 상보성이 존재할 때 일어날 것이다. 참조로 본 명세서에 편입되는, 문헌 [M. Kanehisa, Nucleic Acids Res. 12:203 (1984)]을 참조한다.
일부 실시형태에서, 사전-증폭 프라이머 풀은 적어도 하나의 메틸화-특이적 프라이머 쌍을 포함한다. 일부 실시형태에서, 사전-증폭 프라이머 풀은 다수의 메틸화-특이적 프라이머 쌍을 포함한다. 일부 실시형태에서, 사전-증폭 단계는 메틸화-특이적 프라이머를 사용하는 PCR인, 메틸화-특이적 PCR ("MSP")에 의해 수행된다. 이러한 기술 (즉, MSP)은 [Herman et al., Methylation-specific PCR: a novel PCR assay for Methylation status of CpG islands. Proc Natl Acad Sci USA. 1996 September 3; 93 (18): 9821-6], 및 미국 특허 제6,265,171호에 기술되었다.
본 명세서에서 사용되는 용어 "메틸화-특이적 프라이머 쌍"은 처리된 DNA 내의 특이적 표적 마커(들)를 증폭시키기 위해서 메틸화의 차이를 이용하도록 CpG 부위(들)를 인식하게 특이적으로 디자인된 프라이머 쌍을 의미한다. 프라이머는 특이적 메틸화 상황을 갖거나 또는 특이적 메틸화 상황을 갖지 않는 분자에 대해서만 작용한다. 예를 들어, 프라이머는 메틸화를 갖는 특이적 CpG 부위에 메틸화-특이적 방식으로 특이적으로 혼성화할 수 있지만, 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서 메틸화를 갖지 않는 특이적 CpG 부위에 혼성화할 수 없는 올리고뉴클레오티드일 수 있고, 그러므로 프라이머는 특이적 CpG 부위에 메틸화를 갖는 표적 마커를 특이적으로 증폭시키게 된다. 다른 예를 위해서, 프라이머는 메틸화없는 특이적 CpG 부위에 메틸화-특이적 방식으로 특이적으로 혼성화할 수 있지만, 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서 메틸화를 갖는 특이적 CpG 부위에 혼성화할 수 없는 올리고뉴클레오티드일 수 있고, 그러므로 프라이머는 특이적 CpG 부위에 메틸화가 없는 표적 마커를 특이적으로 증폭하게 된다. 그러므로, 본 개시내용에서, 처리된 DNA 내의 적어도 하나의 표적 마커의 사전-증폭을 위한 메틸화-특이적 프라이머 쌍(들)의 사용은 메틸화 및 비메틸화 CpG 부위를 구분할 수 있게 한다. 본 개시내용의 메틸화-특이적 프라이머 쌍은 바이술파이트 처리된 CpG 디뉴클레오티드에 혼성화하는 적어도 하나의 프라이머를 함유한다. 그러므로, 메틸화된 DNA에 특이적인 상기 프라이머의 서열은 적어도 하나의 CpG 디뉴클레오티드를 포함하고, 비메틸화된 DNA에 특이적인 상기 프라이머의 서열은 CpG의 C 위치의 위치에 "T"를 함유하고/하거나, CpG의 G 위치의 위치에 "A"를 함유한다.
일부 실시형태에서, 적어도 하나의 메틸화-특이적 프라이머 쌍은 엄격 조건, 중등도 엄격 조건 또는 고도 엄격 조건 하에서 표적 마커(들) (또는 표적 마커(들)의 하위영역) 중 하나의 적어도 9개의 연속 뉴클레오티드에 혼성화하는 올리고뉴클레오티드 서열을 각각 포함하는 전방향 프라이머 및 역방향 프라이머를 포함하고, 표적 마커(들) (또는 표적 마커(들)의 하위영역) 중 하나의 적어도 9개의 연속 뉴클레오티드는 적어도 하나 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과)의 CpG 부위를 포함한다.
본 명세서에서 사용되는 용어 "혼성화하다", 및 "혼성화하는", "혼성화한다" 또는 "혼성화" 같은 별형은 2개 단일 가닥 폴리뉴클레오티드가 비공유적으로 결합하여 안정한 이중 가닥 폴리뉴클레오티드를 형성하는 과정을 의미할 수 있다. 일 양태에서, 최종 이중 가닥 폴리뉴클레오티드는 "하이브리드" 또는 "듀플렉스"일 수 있다. "혼성화 조건"은 전형적으로 1 M 미만, 종종 약 500 mM 미만의 염 농도를 포함하고, 약 200 mM 미만일 수 있다. "혼성화 완충액"은 완충 염 용액 예컨대 5% SSPE, 또는 다른 당분야에 공지된 이러한 완충제를 포함한다. 혼성화 온도는 5℃ 만큼 낮을 수 있지만, 전형적으로 22℃ 초과이고, 보다 전형적으로 약 30℃ 초과이고, 전형적으로 37℃ 초과이다. 혼성화는 종종 엄격 조건, 즉, 서열이 이의 표적 서열에 혼성화하게 되지만 다른, 비-상보적 서열에 혼성화하지 않는 조건 하에서 수행된다. 엄격 조건은 서열-의존적이고 상이한 환경에서 상이하다. 예를 들어, 더 긴 단편은 짧은 단편에 비해서 특이적 혼성화를 위해 더 높은 혼성화 온도를 요구할 수 있다. 염기 조성 및 상보성 가닥의 길이, 유기 용매의 존재, 및 염기 불일치 정도를 포함한, 다른 인자들이 혼성화의 엄격도에 영향을 미칠 수 있으므로, 매개변수의 조합은 어느 하나의 매개변수 단독의 절대 측정치보다 더 중요하다. 일반적으로, 엄격 조건은 정의된 이온 강도 및 pH에서 특이적 서열에 대한 용융 온도 (Tm)에 비해서 약 5℃ 더 낮게 선택된다.
Tm 은 이중 가닥 핵산 분자의 개체군이 단일 가닥으로 절단 해리되는 온도일 수 있다. 핵산의 Tm 을 계산하기 위한 몇몇 방정식이 당분야에 충분히 공지되어 있다. 표준 기준으로 표시된 바와 같이, Tm 값의 단순 추정치는, 핵산이 1 M NaCl의 수용액 중에 존재할 때, 방정식, Tm =81.5 + 0.41 (% G + C)에 의해 계산될 수 있다 (참조: 예를 들어, Anderson and Young, Quantitative Filter Hybridization, in Nucleic Acid Hybridization (1985)). 다른 참조 (예를 들어, Allawi and SantaLucia, Jr., Biochemistry, 36:10581-94 (1997))는 Tm 의 계산에 서열 특징뿐만 아니라, 구조적 및 환경적 특징을 고려하는 대체 계산 방법을 포함한다.
일반적으로, 하이브리드의 안정성은 이온 농도 및 온도의 함수이다. 전형적으로, 혼성화 반응은 저 엄격도의 조건 하에서 수행된 이후에, 다양하지만, 더 높은 엄격도의 세척이 후속된다. 예시적인 엄격 조건은 약 7.0 내지 약 8.3의 pH 및 적어도 25℃의 온도에서 적어도 0.01 M 내지 1 M 이하의 나트륨 이온 농도 (또는 다른 염)의 염 농도를 포함한다. 예를 들어, 5 x SSPE (750 mM NaCl, 50 mM 인산나트륨, 5 mM EDTA, pH 7.4) 및 대략 30℃ 온도의 조건이 대립유전자-특이적 혼성화에 적합하지만, 적합한 온도는 혼성화되는 영역의 길이 및/또는 GC 함량에 의존한다. 일 양태에서, 불일치 백분율의 결정에서 "혼성화의 엄격도"는 다음과 같을 수 있다: 1) 고도 엄격: 0.1 x SSPE, 0.1% SDS, 65℃; 2) 중등도 엄격: 0.2 x SSPE, 0.1% SDS, 50℃ (중도 엄격이라고도 함); 및 3) 저 엄격: 1.0 x SSPE, 0.1 % SDS, 50℃. 동등한 엄격도는 대안적인 완충제, 염, 및 온도를 사용해 획득될 수 있다는 것을 이해한다. 예를 들어, 중등도 엄격 혼성화는 핵산 분자 예컨대 프로브가 상보적 핵산 분자에 결합하도록 허용하는 조건을 의미할 수 있다. 혼성화된 핵산 분자는 일반적으로 예를 들어, 70%, 75%, 80%, 85%, 90%, 또는 95% 동일성 중 적어도 어느 하나를 포함하여, 적어도 60% 동일성을 갖는다. 중등도 엄격 조건은 50% 포름 아미드, 5 x 덴하르트 용액, 5x SSPE, 0.2% SDS 중에 42℃에서 혼성화에 이어서, 0.2 x SSPE, 0.2% SDS 중에, 42℃에서 세척과 동등한 조건일 수 있다. 고도 엄격 조건은 예를 들어, 50% 포름 아미드, 5 x 덴하르트 용액, 5 x SSPE, 0.2% SDS 중에 42℃에서 혼성화에 이어서, 0.1 x SSPE, 및 0.1 % SDS 중에 65℃에서 세척으로 제공될 수 있다. 저 엄격 혼성화는 10% 포름 아미드, 5 x 덴하르트 용액, 6 x SSPE, 0.2% SDS 중에 22℃에서 혼성화에 이어서, 1x SSPE, 0.2% SDS 중에 37℃에서 세척과 동등한 조건을 의미할 수 있다. 덴하르트 용액은 1% 피콜, 1% 폴리비닐피롤리돈, 및 1% 소 혈청 알부민 (BSA)을 함유한다. 20 x SSPE (염화나트륨, 인산나트륨, EDTA)는 3 M 염화나트륨, 0.2 M 인산나트륨, 및 0.025 M EDTA를 함유한다. 다른 적합한 중등도 엄격 및 고도 엄격 혼성화 완충액 및 조건은 당업자에게 충분히 공지되어 있고, 예를 들어, 문헌 [Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor Press, Plainview, N.Y. (1989)]; 및 [Ausubel et al., Short Protocols in Molecular Biology, 4th ed., John Wiley & Sons (1999)]에 기술되어 있다.
일부 실시형태에서, 사전-증폭 프라이머 풀은 대조 마커를 증폭하기 위한 대조 프라이머 쌍을 더 포함한다. 일반적으로, 대조 마커는 실험 표적 (예를 들어, 미지 농도의 핵산)과 비교에서 사용을 위해, 기지 특성 (예를 들어, 기지 서열, 세포 당 기지 카피수)을 갖는 핵산이다. 대조군은 어세이에서 검사 또는 표적 핵산을 정규화할 수 있는 내생성, 바람직하게 불변 유전자일 수 있다. 예를 들어, 샘플 가공에서 발생될 수 있는 샘플 대 샘플 변동, 어세이 효율 등에 대한 이러한 정규화 대조군은 정확한 샘플 대 샘플 데이터 비교를 허용하고, 증폭 효율 및 편향성을 정량화한다.
일부 실시형태에서, 대조 마커는 ACTB, GAPDH, 튜불린, ALDOA, PGK1, LDHA, RPS27A, RPL19, RPL11, ARHGDIA, RPL32, C1orf43, CHMP2A, EMC7, GPI, PSMB2, PSMB4, RAB7A, REEP5, SNRPD3, VCP, 및 VPS29로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 대조군 프라이머 쌍의 서열은 하기 표 2의 서열번호 55 및 56으로 표시된다.
일부 실시형태에서, 적어도 하나의 메틸화-특이적 프라이머 쌍은 하기 표 2에 표시된 바와 같은 서열번호 1/2, 3/4, 5/6, 7/8, 9/10, 11/12, 13/14, 15/16, 17/18, 19/20, 21/22, 23/24, 25/26, 27/28, 29/30, 31/32, 33/34, 35/36, 37/38, 39/40, 41/42, 43/44, 45/46, 47/48, 49/50, 51/52, 53/54, 및 170/171로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 하나 이상의 쌍을 포함한다. 본 개시내용에서 사용되는 프라이머 쌍(들)의 서열 번호는 "서열번호 n/m"의 형태로 표시된다. 예를 들어, 서열번호 1/2는 하기 표 2에 표시된 바와 같이 각각 서열번호 1 및 서열번호 2로서 기재된 핵산 서열을 갖는 프라이머 쌍을 의미한다.
서열번호 1/2, 3/4, 5/6, 7/8, 9/10, 11/12, 13/14, 15/16, 17/18, 19/20, 21/22, 23/24, 25/26, 27/28, 29/30, 31/32, 33/34, 35/36, 37/38, 39/40, 41/42, 43/44, 45/46, 47/48, 49/50, 51/52, 53/54, 및 170/171로 기재된 바와 같은 프라이머 쌍은 각각 마커 NDRG4, BCAT1, IKZF1, 셉틴9, SDC2, VAV3, TMEFF2, SALL1, BCAN, POU4F2, PKNOX2, 유전자간 영역 1, ASCL4, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 4, NKX2-6, SLC24A2, 유전자간 영역 5, IRF4를 증폭시키기 위한 것이다.
일부 실시형태에서, 단계 (c)에서, 적어도 하나의 표적 마커는 하나 이상의 차단제 올리고뉴클레오티드의 존재 하에서 증폭된다. 이러한 차단제 올리고뉴클레오티드의 사용은 [Yu et al., BioTechniques 23:714-720, 1997]에 기술된다. 차단제 서열은 사전-증폭 프라이머 쌍(들)으로 동시발생적으로 처리된 DNA에 혼성화된다. 표적 마커의 사전-증폭은 차단제 서열의 5' 위치에서 종료되어서, 표적 마커의 사전-증폭은 차단제 서열에 대한 상보적 서열이 존재하는 경우에 억제된다. 차단제 서열은 메틸화 상황 특이적 방식으로 처리된 DNA에 혼성화하도록 디자인될 수 있다. 예를 들어, 비메틸화 핵산의 개체군 내 메틸화 핵산의 검출을 위해서, 문제 위치에서 비메틸화된 핵산 증폭의 억제는 메틸화 핵산 증폭의 억제가 바람직한 경우에 'CpG'와 반대로, 문제 위치에 'CpA' 또는 'TpA'를 포함하는 차단제 서열의 사용을 통해서 수행된다.
차단제 올리고뉴클레오티드를 사용하는 PCR 방법 경우에, 중합효소-매개 증폭의 효율적인 파괴는 차단제 올리고뉴클레오티드가 중합효소에 의해 연장되지 않는 것을 요구한다. 바람직하게, 이것은 3'-데옥시올리고뉴클레오티드, 또는 "유리" 히드록실 기 이외에 3' 위치에서 유도체화된 올리고뉴클레오니드인 차단제의 사용을 통해서 획득된다. 예를 들어, 3'-O-아세틸 올리고뉴클레오티드는 차단제 분자의 바람직한 부류를 대표한다.
추가로, 차단제 올리고뉴클레오티드의 중합효소-매개 분해는 배제되어야 한다. 바람직하게, 이러한 배제는 5'-3' 엑소뉴클레아제 활성이 결여된 중합효소의 사용, 또는 예를 들어 차단제 분자를 뉴클레아제-내성이게 만드는 그의 5'-말단에 티올레이트 브릿지를 갖는 변형된 차단제 올리고뉴클레오티드의 사용을 포함한다. 특정 용도는 차단제의 이러한 5' 변형을 요구하지 않을 수 있다. 예를 들어, 차단제- 및 프라이머-결합 부위가 중복되어서, 프라이머의 결합을 배제하는 경우 (예를 들어, 과량의 차단제 사용), 차단제 올리고뉴클레오티드의 분해는 실질적으로 배제될 것이다. 이것은 프라이머를 차단제를 향해서, 그를 통해 서(5'-3' 방향으로) 확장하지 않기 때문이고, 이것은 보통 혼성화된 차단제 올리고뉴클레오티드의 분해를 일으키는 과정이다.
본 개시내용의 목적상, 본 명세서에서 구현되는 바와 같은, 특히 바람직한 차단제/PCR 실시형태는 차단 올리고뉴클레오티드로서 펩티드 핵산 (PNA) 올리고머의 사용을 포함한다. 이러한 PNA 차단제 올리고머는 그들이 중합효소에 의해 분해 또는 확장되지 않기 때문에 이상적으로 적합하다.
일정 실시형태에서, 적어도 하나의 표적 마커는 DNA 중합효소를 사용해 사전-증폭된다. 본 명세서에서 사용되는 용어 "DNA 중합효소"는 모노-데옥시리보뉴클레오시드 트리포스페이트 (dNTP)로부터 폴리데옥시리보뉴클레오티드의 합성을 촉매하고, DNA 복제, 복구, 및 일부 경우에, 세포 분화의 가장 기본적인 기능을 수행하는 효소를 의미한다.
원핵생물에서 DNA 중합효소의 예는 DNA 중합효소 I, DNA 중합효소 II, DNA 중합효소 III, DNA 중합효소 IV, 및 DNA 중합효소 V를 포함한다. DNA 중합효소 I, II, 및 III은 이. 콜라이에서 알려져 있다. DNA 중합효소 III은 게놈 복제에서 가장 중요한 것으로 보인다. DNA 중합효소 I은 성장하는 가닥의 말단에서 쌍 비형성된 염기를 편집하는 이의 능력에서 중요하다. 레트로바이러스는 DNA를 합성하기 위해 RNA 주형을 사용하는, 고유한 DNA 중합효소, 즉, 역전사효소를 보유한다. 진핵생물의 경우, DNA 중합효소의 예는 중합효소 α, β, λ, γ, σ, μ, δ, ε, η, ι, κ, ξ, θ 및 Rev1이다. 동물 세포는 핵 및 미토콘드리아에서 DNA의 복제를 담당하는 DNA 중합효소를 갖는다.
사전-증폭 단계에서 사용되는 PCR 시약은 처리된 DNA를 증폭하는데 사용될 수 있는 임의의 상업적으로 입수가능한 PCR 믹스 (예를 들어, KAPA2G Fast Multiplex PCR Kit, Luna® Universal Probe qPCR Master Mix, EpiTect MethyLight PCR Kit 등)일 수 있다. 대안적으로, 당업자는 실험실에서 Mg2+, dNTP, DNA 중합효소 등을 포함하는 PCR 시약을 제조할 수 있다. 당업자는 또한 그들 실제 요구에 따라서 적절한 PCR 반응 시스템 및 PCR 반응 조건을 선택할 수 있다. 일부 실시형태에서, 단계 (c)의 사전-증폭은 5 내지 30 사이클의 반응을 포함하고, 각 사이클은 40∼80℃에서 5초 내지 5분의 반응 이전에 85∼99℃에서 5초 내지 5분 동안의 반응을 포함한다. 일부 실시형태에서, 단계 (c)의 사전-증폭은 10 내지 20 사이클의 반응을 포함하고, 각 사이클은 45∼60℃에서 30초 내지 3분 동안의 반응 이전에 90∼99℃에서 15초 내지 2분 동안의 반응을 포함한다. 일부 실시형태에서, 단계 (c)의 사전-증폭은 15 사이클의 반응을 포함하고, 각 사이클은 56℃에서 60초 동안의 반응 전에 95℃에서 30초의 반응을 포함한다.
단계 (d)
본 개시내용에 따른 방법의 단계 (d)에서, 단계 (c)가 존재하면, 적어도 하나의 표적 마커의 메틸화 수준은 단계 (c)로부터 획득된 DNA를 기반으로 개별적으로 정량화되고; 단계 (c)가 부재하면, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 메틸화 수준이 개별적으로 정량화된다. 본 개시내용에서, 단계 (d)는 또한 정량화 단계로서 지정될 수 있다.
본 명세서에서 사용되는 용어 "메틸화 상태" 또는 "메틸화 상황"은 DNA 영역 내, 특정 뉴클레오티드, 또는 뉴클레오티드들에서 메틸화의 존재, 부재 및/또는 분량을 의미한다. 특정 DNA 서열 (예를 들어, 본 명세서에 기술된 바와 같은 표적 마커)의 메틸화 상황은 서열 내 모든 염기의 메틸화 상태를 의미할 수 있거나 또는 서열 내 염기 쌍의 서브세트의 메틸화 상태 (예를 들어, 시토신 잔기의 것 또는 하나 이상의 특이적 제한 효소 인식 서열의 메틸화 상태)를 의미할 수 있거나, 또는 서열에서 메틸화가 발생되는 위치의 정확한 정보를 제공하지 않고 서열 내 국소 메틸화 밀도에 관한 정보를 의미할 수 있다. 메틸화 상황은 임의로 "메틸화 수준"으로 나타내거나 또는 표시될 수 있다. 메틸화 수준은 예를 들어, 메틸화 감응성 제한 효소로 제한효소 분해 이후에 존재하는 온전한 DNA의 양을 정량화하여 생성될 수 있다. 이러한 예에서, DNA 중 특정 서열이 정량화적 PCR을 사용해 정량화되면, 모의 처리된 대조군과 대략 동일한 주형 DNA의 양은 서열이 고도로 메틸화되지 않았다는 것을 나타내는 반면 모의 처리된 샘플에서 발생된 것에 비해서 실질적으로 적은 주형의 양은 서열에서 메틸화된 DNA의 존재를 의미한다. 따라서, 예를 들어, 상기 기술된 예로부터의 메틸화 수준은 메틸화 상황을 나타내고, 따라서 메틸화 상황의 정량화적 지시자로서 사용될 수 있다. 이것은 샘플 중 서열의 메틸화 상황을 한계 수준과 비교하는 것이 바람직할 때 특히 유용하다.
DNA 서열 내 하나 이상의 특정 CpG 메틸화 부위 (각각은 2개의 CpG 디뉴클레오티드 서열을 가짐)에서 메틸화 상태는 "비메틸화," "완전-메틸화" 및 "반-메틸화"를 포함한다. 용어 "반-메틸화" 또는 "반메틸화"는 그의 오직 한 가닥만이 메틸화된, 이중 가닥 DNA의 메틸화 상태를 의미한다. 용어 "과메틸화"는 정상 대조군 DNA 샘플 내 상응하는 CpG 디뉴클레오티드에서 발견된 5-메틸시토신의 양에 비해서, 검사 DNA 샘플의 DNA 서열 내 하나 또는 다수의 CpG 디뉴클레오티드에서 5-메틸시토신의 증가된 존재에 상응하는 평균 메틸화 상태를 의미한다. 잔기에서 메틸화 상황은 예를 들어, 메틸화 수준으로서 표시되는, 정성적 또는 정량화적 판독치일 수 있다. 본 개시내용에서, 용어 "메틸화 상황" 및 "메틸화 수준"은 상호교환적으로 사용될 수 있다. 본 개시내용에 따라서, 하나 초과의 상이한 메틸화 수준을 동시에 결정하는 것이 가능하다.
본 명세서에 기술된 바와 같이, 단계 (c)가 존재하면, 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준은 단계 (c)에서 획득된 DNA를 기반으로 개별적으로 정량화되고; 단계 (c)가 부재하면, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준이 개별적으로 정량화되며, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, VAV3, 및 BCAN으로 이루어진 군으로부터 선택되는 5개 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, VAV3, 및 IRF4로 이루어진 군으로부터 선택되는 5개 마커를 포함한다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, NDRG4, BCAN, VAV3, IRF4, 또는 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 적어도 2, 3, 4, 5, 6, 또는 7개 마커를 포함한다. 상기 단계 (c) 하에서 "표적 마커"에 대한 상세한 설명 (표적 마커의 정의, 표적 마커의 특이적 조합 등을 포함하나 이에 제한되지 않음)은 또한 단계 (d)에서 인용되는 "단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커"에서의 "표적 마커"에 적용된다 (단계 (c)가 부재하는 시나리오 경우). DNA 서열 (예를 들어, 표적 마커) 내 하나 이상의 CpG 디뉴클레오티드 서열의 메틸화 수준/상태는 당분야에 공지된 다양한 어세이를 통해서 결정될 수 있다.
일부 실시형태에서, 단계 (d)의 정량화는 PCR (예를 들어, 실시간 PCR, 디지탈 PCR), 핵산 시퀀싱, 질량-기반 분리 (예를 들어, 전기영동, 질량 분광법), 또는 표적 포획 (예를 들어, 혼성화, 마이크로어레이)에 의해 수행된다.
일부 실시형태에서, 단계 (c)가 존재하면, 적어도 하나의 표적 마커(들)의 메틸화 수준은 MSP (참조: Herman supra)를 사용하여 단계 (c)로부터 획득된 DNA를 기반으로 개별적으로 정량화된다. 예를 들어, 중간 및/또는 고도 엄격 조건 하에서 비전환된 서열과 특이적으로 혼성화하는 하나 이상의 프라이머를 사용하여서, 증폭 생산물은 주형이 CpG 부위에 메틸화된 시토신을 포함할 때만 생산된다.
일부 실시형태에서, 단계 (d)의 정량화는 실시간 PCR을 통해서 수행된다. 실시간 PCR의 비제한적인 예는 [Cottrell et al., Nucl. Acids Res. 32: e10, 2003]에 기술된 HeavyMethyl™ PCR; [Eads et al., Cancer Res. 59:2302-2306, 1999]에 기술된 MethyLight™ PCR; [Rand et al., Nucl. Acids Res. 33:e 127, 2005]에 기술된 Headloop PCR을 포함한다.
본 명세서에서 사용되는 용어 "HeavyMethyl™ PCR"은 당분야에서 인식되는 실시간 PCR 기술을 의미하는데, 하나 이상의 비확장성 핵산 (예를 들어, 올리고뉴클레오티드) 차단제가 메틸화 특이적 방식으로 바이술파이트-처리된 핵산에 결합한다 (즉, 차단제/들은 중간 내지 고도 엄격 조건 하에서 비돌연변이된 DNA에 특이적으로 결합함). 증폭 반응은 임의로 메틸화 특이적일 수 있지만 하나 이상의 차단제에 측접된 하나 이상의 프라이머를 사용해 수행된다. 비메틸화 핵산 (즉, 비-돌연변이된 DNA)의 존재 하에서, 차단제/들이 결합하고 PCR 생산물은 생산되지 않는다. 예를 들어, 문헌 [Holland et al., Proc. Natl. Acad. Sci. USA, 88:7276-7280, 1991]에 본질적으로 기술된 바와 같은 TaqMan™ 어세이를 사용하여, 샘플 중 핵산의 메틸화 수준을 결정한다.
본 명세서에서 사용되는 용어 "MethyLight™ PCR"은 당분야에서 인식되는 형광-기반 실시간 PCR 기술을 의미하고, TaqMan™ 프로브라고 하는 이중-표지된 형광 올리고뉴클레오티드 프로브가 적용되는데, 전방향 및 역방향 증폭 프라이머 사이에 위치된 CpG-풍부 서열에 혼성화하도록 디자인된다. TaqMan™ 프로브는 TaqMan™ 올리고뉴클레오티드의 뉴클레오티드에 부착된 링커 모이어티 (예를 들어, 포스포르아미다이트)에 공유적으로 결합된 형광 "리포터 모이어티" 및 "소광제 모이어티"를 포함한다. PCR 증폭 동안, CpG-풍부 서열에 혼성화된 TaqMan™ 프로브는 Taq 중합효소의 5' 뉴클레아제 활성에 의해 절단되어서 PCR 반응 동안 실시간 방식으로 검출가능한 신호를 생산한다. 이러한 방법에서, 분자 비콘이 검출가능한 프로브로서 사용될 수 있고, 이 시스템은 사용되는 DNA 중합효소의 5'-3' 엑소뉴클레아제 활성에 독립적이다 (참조: Mhlanga and Malmberg, Methods 25:463-471, 2001).
본 명세서에서 사용되는 용어 "헤드루프 PCR"은 표적 핵산을 선택적으로 증폭시키지만, 추가 증폭을 위한 주형을 더 이상 제공할 수 없는 헤어핀 구조를 형성하도록 3' 스템-루프의 확장을 통해서 비-증폭 표적 변이체의 증폭을 억제하는, 당분야에서 인식되는 실시간 PCR을 의미한다.
일정 실시형태에서, 실시간 PCR은 다중복합화 실시간 PCR이다.
본 명세서에서 사용되는 용어 "다중복합" 또는 "다중복합화"는 다수의 표적, 예를 들어 다수의 핵산 서열의 존재 및/또는 양이, 그 각각이 적어도 하나의 상이한 검출 특징, 예를 들어, 형광 특징 (예를 들어, 여기 파장, 방출 파장, 방출 강도, FWHM (full width at half maximum peak height), 또는 형광 수명) 또는 고유한 핵산 또는 단백질 서열 특징을 갖는, 하나 초과의 마커를 사용하여 동시에 어세이될 수 있는 어세이 또는 다른 분석 방법을 의미할 수 있다.
일부 실시형태에서, 단계 (d)의 정량화는 핵산 시퀀싱에 의해 수행된다. 핵산 시퀀싱에 대한 예시적인 방법은 당분야에 공지되어 있고, 예를 들어, 문헌 [Frommer et al., Proc. Natl. Acad. Sci. USA 89:1827-1831, 1992]; [lark et al., Nucl. Acids Res. 22:2990-2997, 1994]을 참조한다. 예를 들어, 바이술파이트로 처리되지 않은 샘플을 사용해 수득된 서열, 또는 관심 영역의 기지의 뉴클레오티드 서열을 바이술파이트-처리된 샘플을 사용해 수득된 서열과 비교하여, DNA 서열 내 메틸화된 시토신(들)의 확인을 용이하게 한다. 미처리된 샘플과 비교된 바이술파이트-처리된 샘플 중 시토신의 부위에서 검출된 임의의 티민 잔기는 바이술파이트 처리의 결과로서 돌연변이에 의해 초래되는 것으로 간주될 수 있고, 즉 이 부위에 메틸화된 시토신이 존재한다.
시퀀싱 DNA를 시퀀싱하는 방법은 당분야에 공지되어 있고, 예를 들어, 디데옥시 사슬 종결 방법 또는 막삼-길버트 (Maxam-Gilbert) 방법 (참조: Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd Ed., CSHP, New York 1989), 파이로시퀀싱 (참조: Uhlmann et al., Electrophoresis, 23: 4072-4079, 2002), 고체상 파이로시퀀싱 (참조: Landegren et al., Genome Res., 8(8): 769-776, 1998), 고체상 미니시퀀싱 (참조: 예를 들어, Southern et al., Genomics, 13:1008-1017, 1992), FRET에 의한 미니시퀀싱 (참조: 예를 들어, Chen and Kwok, Nucleic Acids Res. 25:347-353, 1997), 결찰에 의한 시퀀싱, 및 초심층 시퀀싱 (참조: Marguiles et al., Nature 437 (7057): 376-80 (2005))을 포함한다.
일정 실시형태에서, 단계 (d)의 정량화는 질량-기반 분리 (예를 들어, 전기영동, 질량 분광법)에 의해 수행된다.
예를 들어, 메틸화된 시토신 잔기의 존재는 문헌 [Xiong and Laird, Nucl. Acids Res., 25:2532-2534, 2001]에 실질적으로 기술된 바와 같은 조합 바이술파이트 제한 분석 (COBRA)을 사용해 검출된다. 이 방법은 비-메틸화 시토신 잔기를 선택적으로 돌연변이시키는 화합물, 예를 들어, 바이술파이트로 처리 후 메틸화 및 비메틸화 핵산 간 제한 효소 인식 부위의 차이를 이용한다. 예를 들어, 제한 엔도뉴클레아제 Taql은 서열 TCGA를 절단하는데, 서열 중 비메틸화 핵산의 바이술파이트 처리 이후에, 서열이 TTGA가 되어서, 그 결과로 절단되지 않는다. 그 다음에 분히 및/또는 비분해 핵산은 당분야에 공지된 검출 방식, 예컨대, 예를 들어, 전기영동 및/또는 질량 분광법을 사용해 검출된다.
다른 예의 경우에, 비메틸화된 시토신 잔기를 선택적으로 돌연변이시키는 화합물로 처리 후 뉴클레오티드 서열 및/또는 2차 구조의 차이를 기반으로 하는 증폭 생산물 중 핵산 차이를 검출하기 위한 상이한 기술이 사용되고, 예를 들어, 메틸화-특이적 단일 가닥 입체배열 분석 (MS-SSCA) (Bianco et al., Hum. Mutat., 14:289-293, 1999), 메틸화-특이적 변성 구배 겔 전기영동 (MS-DGGE) (Abrams and Stanton, Methods Enzymol., 212:71-74, 1992) 및 메틸화-특이적 변성 고성능 액상 크로마토그래피 (MS-DHPLC) (Deng et al., Chin. J. Cancer Res., 12:171-191, 2000)이다.
일부 실시형태에서, 단계 (d)의 정량화는 표적 포획 (예를 들어, 혼성화, 마이크로어레이)에 의해 수행된다.
혼성화에 의한 적합한 검출 방법은 당분야에 공지되어 있고, 예컨대 서던, 도트 블롯, 슬롯 블롯 또는 다른 핵산 혼성화 수단 (Kawai et al., Mol. Cell. Biol. 14:7421 -7427, 1994; Gonzalgo et al., Cancer Res. 57:594-599, 197)이 있다. 일부 실시형태에서, 혼성화 어세이를 위한 프로브는 검출가능하게 표지된다. 일부 실시형태에서, 혼성화 어세이를 위한 핵산-기반 프로브는 미표지된다. 이러한 미표지된 프로브?z 고형 지지체 예컨대 마이크로어레이 상에 고정될 수 있고, 검출가능하게 표지된 표적 핵산 분자에 혼성화할 수 있다.
마이크로어레이의 예는 전환된 시토신 잔기(들)를 갖는 서열 및 비전환된 시토신 잔기(들)를 갖는 서열을 구별하는데 유용한 메틸화 특이적 마이크로어레이이다 (참조: Adorjan et al., Nucl. Acids Res., 30: e21, 2002). 혼성화 기반 어세이는 또한 메틸화-감응성 제한 효소로 처리 후 핵산에 대해 사용될 수 있다.
또 다른 예의 경우에, DNA 서열 내 CpG 디뉴클레오티드 서열의 메틸화 상황은 PCR 증폭 프라이머로 동시발생적으로 바이술파이트 처리된 DNA에 혼성화하는 올리고뉴클레오티드 프로브를 통해서 확인할 수 있다 (상기 프라이머는 메틸화 특이적일 수 있거나 표준일 수 있음).
일부 실시형태에서, 단계 (d)는 검출제의 존재 하에서 수행된다. 본 명세서에서 사용되는 용어 "검출제"는 핵산의 존재, 부재 또는 양을 검출하기 위한 정량화 단계에서 사용되는 작용제이다.
당분야에 공지된 다양한 검출제가 본 개시내용에서 사용될 수 있다. 일부 실시형태에서, 검출제는 형광 프로브, 인터컬레이팅 염료, 발색단-표지된 프로브, 방사성동위원소-표지된 프로브, 및 바이오틴-표지된 프로브로 이루어진 군으로부터 선택된다.
일부 실시형태에서, 형광 프로브는 하기 표 2에 표시된 바와 같은 서열번호 57-85, 172로 이루어진 군으로부터 선택된다.
일부 실시형태에서, 형광 프로브는 그의 5' 말단에서 형광 염료 (예를 들어, FAM, HEX/VIC, TAMRA, Texas Red, 또는 Cy5)로 표지되고, 그의 3' 말단에서 소광제 (예를 들어, BHQ1, BHQ2, BHQ3, DABCYL 또는 TAMRA)로 표시된다.
표지화는 직접 또는 간접 방법으로 수행될 수 있다. 직접 표지화는 시약에 직접적으로 (공유적으로 또는 비공유적으로) 표지의 커플링을 포함한다. 간접 표지화는 제1 시약에 제2 시약의 (공유적으로 또는 비공유적으로) 결합을 포함한다. 제2 시약은 제1 시약에 특이적으로 결합해야만 한다. 상기 제2 시약은 적합한 표지와 커플링될 수 있고/있거나 제2 시약에 결합하는 제3 시약의 표적 (수용체)일 수 있다. 제2, 제3, 또는 더 고차의 시약의 사용은 종종 신호 강도를 증가시키기 위한 것이다. 적합한 2차 및 보다 고차의 시약은 항체, 2차 항체, 및 충분히 공지된 스트렙타비딘-바이오틴 시스템 (Vector Laboratories, Inc.)을 포함할 수 있다. 시약 또는 기질은 또한 당분야에 공지된 바와 같은 하나 이상의 태그로 "태그화"될 수 있다.
일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)의 정량화는 정량화 프라이머 쌍(들) 및 DNA 중합효소를 사용하여 단계 (c)로부터 획득된 DNA를 증폭하는 것을 포함하고, 획득된 DNA의 적어도 일부분이 증폭된다. 일부 실시형태에서, 단계 (c)가 부재하면, 단계 (d)의 정량화는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커를 정량화 프라이머 쌍(들) 및 DNA 중합효소를 사용해 증폭시키는 단계를 포함한다.
본 명세서에서 사용되는 용어 "정량화 프라이머 쌍(들)"은 정량화 단계에서 사용되는 프라이머 쌍(들)을 의미한다.
일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)에서 사용되는 정량화 프라이머 쌍(들)은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서 단계 (c)로부터 획득된 DNA의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있다. 일부 실시형태에서, 단계 (c)가 부재하면, 단계 (d)에서 사용되는 정량화 프라이머 쌍(들)은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있다. 일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)에서 사용되는 정량화 프라이머 쌍(들)의 적어도 하나 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 또는 그 초과)는 단계 (c)의 사전-증폭 프라이머 풀 중 메틸화-특이적 프라이머 쌍(들)의 적어도 하나 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 또는 그 초과)와 동일하다.
일부 실시형태에서, 단계 (c)가 부재하면, 단계 (d)에서 사용되는 정량화 프라이머 쌍(들)은, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커 내의 적어도 일부분을 증폭시키도록 디자인된다. 일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)에서 사용되는 정량화 프라이머 쌍(들)은, 단계 (c)로부터 획득된 DNA 내의 적어도 일부분을 증폭시키도록 디자인되고, 다시 말해서, 단계 (c) 및 단계 (d)는 네스티드 PCR로서 디자인된다.
네스티드 PCR은 감도 및 특이성을 개선시키도록 디자인된 PCR의 변형이다. 네스티드 PCR은 2개 프라이머 세트 및 2회 연속 PCR 반응의 사용을 포함한다. 제1 라운드의 증폭을 수행하여 제1 앰플리콘을 생성시키고, 제2 라운드의 증폭은 프라이머 중 하나 또는 둘 모두가 초기 프라이머 쌍에 의해 한정되는 영역 내부 부위에 어닐링되는 프라이머 쌍을 사용해 수행되는데, 다시 말해서, 제2 프라이머 쌍은 제1 프라이머 쌍 내에 "내포된 (nested)"것으로 간주된다. 이러한 방식에서, 올바른 내부 서열을 함유하지 않는 제1 PCR 반응으로부터의 배경 증폭 생산물은 제2 PCR 반응에서 추가로 증폭되지 않는다.
일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)의 정량화는, 단계 (c)로부터 획득된 DNA 중에서 다수의 CpG 디뉴클레오티드, TpG 디뉴클레오티드, 또는 CpA 디뉴클레오티드의 존재 또는 수준을 기반으로 적어도 하나 (예를 들어, 각각)의 표적 마커(들)의 메틸화 수준을 결정하는 것을 포함한다. 일부 실시형태에서, 단계 (c)가 부재하면, 단계 (d)의 정량화는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커 중에서 다수의 CpG 디뉴클레오티드, TpG 디뉴클레오티드, 또는 CpA 디뉴클레오티드의 존재 또는 수준을 기반으로 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 결정하는 것을 포함한다. 일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)의 정량화는, 단계 (c)로부터 획득된 DNA 중에서 하나 이상의 CpG 디뉴클레오티드의 존재 또는 수준을 기반으로 시토신 잔기(들)의 메틸화 수준을 결정하는 것을 포함한다. 일부 실시형태에서, 단계 (c)가 부재하면, 단계 (d)의 정량화는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커 중에서 하나 이상의 CpG 디뉴클레오티드의 존재 또는 수준을 기반으로 시토신 잔기(들)의 메틸화 수준을 결정하는 것을 포함한다. 일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)의 정량화는, 단계 (c)로부터 획득된 DNA 중에서 하나 이상의 TpG 디뉴클레오티드의 존재 또는 수준을 기반으로 시토신 잔기(들)의 메틸화 수준을 결정하는 것을 포함한다. 일부 실시형태에서, 단계 (c)가 부재하면, 단계 (d)의 정량화는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커 중에서 하나 이상의 TpG 디뉴클레오티드의 존재 또는 수준을 기반으로 시토신 잔기(들)의 메틸화 수준을 결정하는 것을 포함한다. 일부 실시형태에서, 단계 (c)가 존재하면, 단계 (d)의 정량화는, 단계 (c)로부터 획득된 DNA 중에서 하나 이상의 CpA 디뉴클레오티드의 존재를 기반으로 시토신 잔기(들)의 메틸화 수준을 결정하는 것을 포함한다. 일부 실시형태에서, 단계 (c)가 부재하면, 단계 (d)의 정량화는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커 중에서 하나 이상의 CpA 디뉴클레오티드의 존재 또는 수준을 기반으로 시토신 잔기(들)의 메틸화 수준을 결정하는 것을 포함한다.
일부 실시형태에서, 단계 (c)가 존재하면, 정량화 단계는 단계 (c)로부터 획득된 DNA를 다수의 분획으로 분할함으로써 수행된다. 일부 실시형태에서, 단계 (c)가 부재하면, 정량화 단계는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커를 다수의 분획으로 분할함으로써 수행된다. 일부 실시형태에서, 다수의 상이한 정량화 실험이 다수의 분획을 사용해 수행되며, 단계 (c)로부터 획득된 DNA (또는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커)의 상이한 세트는, 분획으로 존재하면, 다수의 분획 중 하나에서 정량화된다. 일부 실시형태에서, 대조 마커는 각각의 분획에서 정량화된다.
단계 (e)
대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법의 단계 (e)에서, 단계 (d)의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준은 상응하는 기준 수준과 각각 비교되고, 하나 이상의 표적 마커(들)의, 그의 상응하는 기준 수준에 비해서 동일하거나 더 높은 메틸화 수준은, 대상체가 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타낸다.
결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 방법의 단계 (e)에서, 단계 (d)의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준은 각각 치료 전 대상체로부터 수득된 DNA를 함유하는 생물학적 샘플에 대해서 단계 (a), 단계 (b), 임의로 단계 (c), 및 단계 (d)를 반복함으로써 정량화된 치료 전 동일 대상체로부터 수득된 하나 이상의 표적 마커(들)의 상응하는 메틸화 수준과 비교되고, 하나 이상의 표적 마커(들)의, 치료 전 그의 상응하는 메틸화 수준에 비해서 더 낮은 메틸화 수준은, 대상체가 치료에 반응성임을 의미한다.
본 개시내용에 따른 방법의 단계 (e)는 또한 비교 단계라고 명명될 수 있다.
본 명세서에서 사용되는 용어 "비교하다", "비교하는", "비교되는", 또는 "비교"는 분석하려는 검사 생물학적 샘플에 포함된 정량화 단계로부터의 적어도 하나 (예를 들어, 각각)의 표적 마커(들)의 메틸화 수준을 각각, 상응하는 기준 수준과 비교하는 것을 나타낸다. 본 명세서에서 사용되는 이 용어는 상응하는 매개변수 또는 값의 비교를 의미하는 것으로 이해해야 하며, 예를 들어, 절대량은 기준 절대량과 비교되는 한편 농도는 기준 농도와 비교되거나 또는 검사 샘플에서 수득된 강도 신호는 기준 샘플의 동일 유형의 강도 신호와 비교된다. 비교는 수동으로 또는 컴퓨터 보조로 수행될 수 있다. 컴퓨터 보조 비교 경우에, 결정된 양의 값은 컴퓨터 프로그램에 의해서 데이터베이스에 저장된 적합한 기준에 상응하는 값과 비교될 수 있다. 컴퓨터 프로그램은 비교의 결과를 더 평가할 수 있고, 자동으로 적합한 출력 형식으로 바람직한 평가를 제공한다. 정량화 단계로부터의 적어도 하나 (예를 들어, 각각)의 표적 마커(들)의 메틸화 수준과 상응하는 기준 수준의 비교를 기반으로, 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는 대상체를 확인하는 것이 가능하고; 또한 결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 것이 가능하다.
본 명세서에서 사용되는 용어 "기준 수준"은 결장직장 신생물, 또는 대상체에서 결장직장 신생물의 발생 또는 발생 위험성의 포함 또는 배제를 가능하게 하는 한계 수준, 또는 결장직장 신생물의 치료를 받은 대상체에서 치료 반응의 모니터링을 가능하게 하는 한계 수준을 의미한다.
예를 들어, 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법과 관련하여, 검사 샘플 중 하나 이상의 표적 마커(들)의 메틸화 수준이 그의 상응하는 기준 수준과 동일하거나 또는 그에 비해 더 높으면, 대상체는 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 또는 발생 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다고 간주될 수 있다. 일부 실시형태에서, 검사 샘플 중 하나 이상의 표적 마커(들)의 메틸화 수준은 그의 상응하는 기준 수준의 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10배 이상이다. 본 개시내용에서, 대상체에서 결장직장 신생물을 진단하거나, 결장직장 신생물의 발생 또는 발생 위험성에 대해 스크리닝하거나 또는 결장직장 신생물의 발달 또는 예후를 평가하기 위해서, 표적 마커의 각각 및 모두의 메틸화 수준이 그의 상응하는 기준 수준과 동일하거나 또는 그에 비해 높을 필요는 없다. 대신에, 정량화 단계에서 정량화된 적어도 하나의 표적 마커의 메틸화 수준이 그의 상응하는 기준 수준과 동일하거나 또는 그에 비해 높은 경우면 충분하다.
다른 예에서, 결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 방법에 대해서, 검사 샘플 중 하나 이상의 표적 마커(들)의 메틸화 수준이 결장직장 신생물의 치료 전 그의 상응하는 메틸화 수준에 비해서 낮으면, 대상체는 치료에 반응성으로 간주될 수 있다. 일부 실시형태에서, 결장직장 신생물의 치료 후 수득된 생물학적 샘플 중에서 하나 이상의 표적 마커(들)의 메틸화 수준은 결장직장 신생물의 치료 전 그의 상응하는 메틸화 수준에 비해서 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99%, 100% 낮다. 본 개시내용에서, 결장직장 신생물의 치료를 받은 대상체가 치료에 반응성임을 표시하기 위해서, 표적 마커의 각각 및 모두의 메틸화 수준이 결장직장 신생물의 치료 전 그의 상응하는 메틸화 수준에 비해 낮을 필요는 없다. 대신에, 결장직장 신생물의 치료 후 수득된 생물학적 샘플 중에서 적어도 하나의 표적 마커의 메틸화 수준이 결장직장 신생물의 치료 전 그의 상응하는 메틸화 수준에 비해서 낮은 경우면 충분하다.
표적 마커의 메틸화의 기준 수준은 하나 이상의 기준 샘플로부터 유래될 수 있고, 기준 수준은 관심 샘플을 검사하기 위한 실험과 동시에 수행되는 실험으로부터 수득된다. 대안적으로, 기준 수준은 하나 이상의 기준 샘플 또는 질환 기준 샘플로부터의 데이터, 표준, 또는 수준의 컬렉션을 포함하는, 데이터베이스에서 수득될 수 있다. 일부 실시형태에서, 이러한 데이터, 표준 또는 수준의 컬렉션은 그들을 하나 이상의 샘플로부터의 데이터와 비교 목적을 위해 사용할 수 있도록 정규화된다. "정규화되다" 또는 "정규화"는 측정 원시 데이터를 다른 그렇게 정규화된 데이터와 직접 비교할 수 있는 데이터로 전환시키는 과정이다. 정규화는 어세이마다 가변적일 수 있는 요인들로 인해 초래된 어세이-특이적 오류, 예를 들어, 로딩 분량의 변동, 결합 효율, 검출 감도, 및 다른 다양한 오류를 극복하기 위해 사용된다.
일부 실시형태에서, 기준 데이터베이스는 표적 마커의 메틸화 수준 및/또는 하나 이상의 기준 샘플로부터의 다른 실험실 및 임상 데이터를 포함한다. 일부 실시형태에서, 기준 데이터는 기준 샘플과 동일한 조건 하에서 시험된 대조 마커의 메틸화 수준의 백분율로서 각각 정규화된 표적 마커의 메틸화 수준을 포함한다. 표적 마커의 이러한 정규화된 메틸화 수준과 비교를 위해서, 검사 샘플의 표적 마커의 메틸화 수준이 또한 측정되고 검사 샘플과 동일한 조건 하에서 검사된 대조 마커의 메틸화 수준의 백분율로서 계산된다.
일부 실시형태에서, 기준 데이터베이스는 건강한 대상체, 및/또는 비-신생물 대상체 (즉, 신생물을 갖지 않는다고 알려진 대상체)에서 수득된 기준 샘플로부터 기준 수준 데이터를 편집하여 확립된다. 일부 실시형태에서, 기준 데이터베이스는 결장직장 신생물에 대한 치료 하에 있는 개체로부터의 기준 샘플로부터 기준 수준 데이터를 편집하여 확립된다. 일부 실시형태에서, 기준 데이터베이스는 예를 들어, 표적 마커의 상이한 메틸화 수준에 의해 입증된 바와 같이 결장직장 신생물의 상이한 병기에 있는 개체로부터의 기준 샘플로부터의 데이터를 편집하여 확립된다.
기준 수준은 바람직한 감도 및 특이성에 따라서 당업자가 선택할 수 있다. 적합한 기준 수준을 결정하기 위한 수단은 당업자에게 공지되어 있고, 예를 들어, 기준 수준은 임상 연구에서 수집된 데이터로부터 결정될 수 있다.
일부 실시형태에서, 단계 (e)의 기준 수준은, 결장직장 신생물을 갖거나 또는 가질 위험성이 있는 개체의 그룹 및 결장직장 신생물을 갖지 않거나 또는 가질 위험성이 없는 개체의 그룹에서 수득된 임상 샘플을 기반으로 결정된다.
당업자는 다양한 인자, 예컨대 연령, 성별, 병력, 가족력, 증상 등을 기반으로 결장직장 신생물을 개체가 갖는지 여부 또는 가질 위험성을 갖는지 여부를 결정할 수 있다.
일부 실시형태에서, 표적 마커의 메틸화 수준 및 기준 수준은 사이클 한계값 (즉, Ct 값)으로 표시된다. 본 명세서에서 사용되는 용어 "Ct 값"은 PCR 생산물의 형광성이 배경 신호 초과에서 검출될 수 있을 때 사이클수를 의미한다. Ct 값은 샘플 중 표적 마커의 양에 반비례하고, 다시 말해서, Ct 값이 낮을수록, 샘플 중 표적 마커의 양은 더 크다.
예를 들어, 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법의 단계 (e)에서, 단계 (d)의 표적 마커(들)의 Ct 값(들)은 기준 Ct 값과 비교되고, 적어도 하나의 표적 마커의, 그의 상응하는 기준 Ct 값에 비해서 동일하거나 더 낮은 Ct 값은, 대상체가 결장직장 신생물을 갖거나, 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타낸다. 일부 실시형태에서, 단계 (d)의 다수의 표적 마커 중 적어도 하나의 Ct 값이 그의 상응하는 기준 Ct 값에 비해서 2-10 사이클 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10 사이클)이 더 낮으면, 대상체가 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다고 결정된다.
본 명세서에서 사용되는 용어 "증가된 확률"은 기준 샘플이 수득된 대상체와 비교하여, 대상체가 결장직장 신생물이 발달되거나 또는 결장직장 신생물의 불량한 예후일 가능성 수준에서, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 이상의 전체 증가를 의미한다.
다른 예에서, 결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 방법의 단계 (e)에서, 단계 (d)의 표적 마커(들)의 Ct 값(들)은 기준 Ct 값과 비교되고, 적어도 하나의 표적 마커의, 치료 전 그의 상응하는 Ct 값에 비해서 더 높은 Ct 값은, 결장직장 신생물의 치료를 받은 대상체가 치료에 반응성임을 의미한다. 일부 실시형태에서, 단계 (d)의 다수의 표적 마커 중 적어도 하나의 Ct 값이 치료 전 그의 상응하는 기준 Ct 값에 비해서 2-10 사이클 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10 사이클) 만큼 더 높으면, 대상체가 결장직장 신생물의 치료에 반응성이라고 결정된다.
키트
다른 양태에서, 본 개시내용은 또한 하기를 포함하는, 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 위한 키트를 제공한다:
(a) DNA를 치료하기 위한 제1 시약으로서, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 것인 제1 시약;
(b) 임의로, 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나의 표적 마커 중 적어도 하나의 표적 서열을 사전-증폭하기 위한 적어도 하나의 프라이머 쌍을 포함하는 제1 프라이머 풀로서, 적어도 하나의 프라이머 쌍은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서, 제1 시약으로 처리된 적어도 하나의 표적 서열의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있고, 표적 서열은 적어도 하나의 CpG 부위를 포함하는 것인, 제1 프라이머 풀; 및
(c) 제2 시약으로서, 제1 프라이머 풀이 존재하면, 제2 시약은 제1 프라이머 풀에 의해 사전-증폭된 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 정량화하기 위한 것이고; 제1 프라이머 풀이 부재하면, 제2 시약은 제1 시약으로 처리된 DNA 내의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 정량화하기 위한 것이며, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하는 것인 제2 시약.
일부 실시형태에서, 적어도 하나의 표적 마커는 다수의 표적 마커를 포함하고, 다수의 표적 마커는 셉틴9, BCAT1, 및 IKZF1로 이루어진 군으로부터 선택되는 적어도 2개 (예를 들어, 2, 3개) 마커를 포함한다.
일부 실시형태에서, 제1 프라이머 풀이 존재하면, 제2 시약은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서, 제1 프라이머 풀에 의해 사전-증폭된 적어도 하나의 표적 서열의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있는 다수의 정량화 프라이머 쌍을 포함하는 제2 프라이머 풀을 포함한다. 일부 실시형태에서, 제1 프라이머 풀이 부재하면, 제2 시약은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서, 제1 시약으로 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 하나의 표적 서열의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있는 다수의 정량화 프라이머 쌍을 포함하는 제3 프라이머 풀을 포함한다.
일부 실시형태에서, 제1 프라이머 풀이 존재하면, 제2 프라이머 풀 중 적어도 하나의 정량화 프라이머 쌍은 제1 프라이머 풀 중 적어도 하나의 프라이머 쌍과 동일하다. 일부 실시형태에서, 제1 프라이머 풀이 존재하면, 제2 프라이머 풀의 정량화 프라이머 쌍은 제1 프라이머 풀에 의해 사전-증폭된 적어도 하나의 표적 서열 내 적어도 일부분을 증폭하도록 디자인된다. 일부 실시형태에서, 제1 프라이머 풀이 부재하면, 제3 프라이머 풀의 정량화 프라이머 쌍은 제1 시약으로 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 하나의 표적 서열 내 적어도 일부분을 증폭하도록 디자인된다. 일부 실시형태에서, 제1, 제2, 또는 제3 프라이머 풀은 적어도 하나의 메틸화-특이적 프라이머 쌍을 포함한다.
일부 실시형태에서, 제1 프라이머 풀 및 제2 프라이머 풀은 단일 용기 또는 별개 용기에 포장된다. 일부 실시형태에서, 키트는 하나 이상의 차단제 올리고뉴클레오티드를 더 포함한다.
일부 실시형태에서, 키트는 검출제를 더 포함한다. 일부 실시형태에서, 검출제는 형광 프로브, 인터컬레이팅 염료, 발색단-표지된 프로브, 방사성동위원소-표지된 프로브, 및 바이오틴-표지된 프로브로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 형광 프로브는 서열번호 57-85, 172로 이루어진 군으로부터 선택되는 올리고뉴클레오티드 서열을 포함한다. 일부 실시형태에서, 형광 프로브는 그의 5' 말단에서 형광 염료 (예를 들어, FAM, HEX/VIC, TAMRA, Texas Red, 또는 Cy5)로 표지되고, 그의 3' 말단에서 소광제 (예를 들어, BHQ1, BHQ2, BHQ3, DABCYL, TAMRA 또는 lowa Black Dark Quenchers)로 표지된다.
일부 실시형태에서, 키트는 DNA 중합효소 및/또는 대상체 유래의 생물학적 샘플을 함유하기에 적합한 용기를 더 포함한다. 일부 실시형태에서, 키트는 사용 및/또는 키트 결과의 해석을 위한 설명서를 더 포함한다.
일부 실시형태에서, 키트는 별개 용기에 포장된, 중합효소에 의해 매개되는 프라이머 연장, 예컨대 PCR에 최적화된 반응 완충제를 함유할 수 있다. 키트는, 대상체의 생물학적 샘플 중에서 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, 유전자간 영역 1, TMEFF2, 유전자간 영역 4, NKX2-6, 유전자간 영역 5, SLC24A2, NDRG4, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, 및 CRHBP로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 또는 그 초과)의 표적 마커의 메틸화를 결정하기 위한 수단을 함유하기에 적합한 용기를 더 포함하는 것이 바람직하다.
일부 실시형태에서, 제1 시약은 바이술파이트 시약 또는 메틸화 감응성 제한 효소 (MSRE)를 포함한다. 일부 실시형태에서, 바이술파이트 시약은 암모늄 바이술파이트, 나트륨 바이술파이트, 칼륨 바이술파이트, 칼슘 바이술파이트, 마그네슘 바이술파이트, 알루미늄 바이술파이트, 아황산수소 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 바이술파이트 시약은 나트륨 바이술파이트이다. 일부 실시형태에서, MSRE는 HpaII, SalI, SalI-HF®, ScrFI, BbeI, NotI, SmaI, XmaI, MboI, BstBI, ClaI, MluI, NaeI, NarI, PvuI, SacII, HhaI 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
일부 실시형태에서, 제1 프라이머 풀은 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나의 표적 마커 중 적어도 하나의 표적 서열을 사전-증폭하기 위한 적어도 하나의 메틸화-특이적 프라이머 쌍을 포함한다.
일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 또는 다수의 마커 (예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 마커)를 포함한다.
일부 실시형태에서, 적어도 하나의 표적 마커는 최대 하나의 표적 마커 (즉, 하나의 마커이지만 하나 이하의 마커)일 수 있다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 BCAT1이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 IKZF1이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 NDRG4이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 BCAN이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 PKNOX2이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 VAV3이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 IRF4이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 POU4F2이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 SALL1이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 TMEFF2이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 ASCL4이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 FGF12이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 유전자간 영역 1이다.
일부 실시형태에서, 적어도 하나의 표적 마커는 다수의 표적 마커를 포함한다. 일부 실시형태에서, 다수의 표적 마커는 셉틴9, BCAT1, 및 IKZF1로 이루어진 군으로부터 선택되는 적어도 2 또는 3개 마커를 포함한다. 일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 BCAN, PKNOX2, VAV3, NDRG4 및 IRF4로 이루어진 군으로부터 선택되는 1, 2, 3, 4, 또는 5개의 추가 마커를 더 포함한다. 일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 POU4F2, SALL1, SDC2, ASCL4, 유전자간 영역 1, TMEFF2, 유전자간 영역 4, NKX2-6, 유전자간 영역 5, SLC24A2, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, 및 CRHBP로 이루어진 군으로부터 선택되는 하나 이상 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20)의 추가 마커를 더 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 셉틴9, 및 BCAN, BCAT1, IKZF1, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 BCAN, BCAT1, IKZF1, NDRG4, PKNOX2, VAV3, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 BCAT1, 및 BCAN, 셉틴9, IKZF1, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 BCAN, 셉틴9, NDRG4, IKZF1, PKNOX2, VAV3, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 NDRG4, 셉틴9, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 IKZF1, 및 BCAN, 셉틴9, BCAT1, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 BCAN, 셉틴9, BCAT1, PKNOX2, NDRG4, VAV3, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 NDRG4, 셉틴9, 및/또는 BCAT1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 BCAN, 및 셉틴9, BCAT1, IKZF1, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, PKNOX2, VAV3, NDRG4, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 NDRG4, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 VAV3, 및 셉틴9, BCAT1, IKZF1, BCAN, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, PKNOX2, NDRG4, IRF4 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, NDRG4, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 IRF4, 및 셉틴9, BCAT1, IKZF1, BCAN, VAV3, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, NDRG4, PKNOX2, VAV3 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 NDRG4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 PKNOX2, 및 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, NDRG4, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 NDRG4, 및 셉틴9, BCAT1, IKZF1, VAV3, IRF4, BCAN, POU4F2, PKNOX2, SDC2, TMEFF2, SALL1, SLC24A2, NKX2-6, KCNA6, SOX1, HS3ST2, ASCL4, KCTD8, HMX1, MARCH11, CRHBP, FGF12, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, PKNOX2, VAV3, IRF4, BCAN, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 각각의 표적 마커는 a) 하기 기재된 바와 같이 Hg19 좌표로 정의되는 각각의 영역, 및 각각의 출발 부위의 상류 5 kb 및 상기 기술된 각 영역의 각각의 말단 부위의 하류 5 kb, 또는 b)a)의 바이술파이트 전환된 대응물, 또는 c) a)의 MSRE 처리된 대응물이거나, 또는 그를 포함한다:
Figure pct00011
Figure pct00012
일부 실시형태에서, 제1 프라이머 풀이 존재하면, 제1 프라이머 풀은 하기 표 2에 표시된 바와 같은 서열번호 1/2, 3/4, 5/6, 7/8, 9/10, 11/12, 13/14, 15/16, 17/18, 19/20, 21/22, 23/24, 25/26, 27/28, 29/30, 31/32, 33/34, 35/36, 37/38, 39/40, 41/42, 43/44, 45/46, 47/48, 49/50, 51/52, 53/54, 및 170/171로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 적어도 하나의 쌍을 포함하거나 또는 그로 이루어진 적어도 하나의 프라이머 쌍을 포함하고, 임의로 제2 프라이머 풀은 제1 프라이머 풀 중 적어도 하나의 프라이머 쌍과 동일한 적어도 하나의 프라이머 쌍을 포함한다. 일부 실시형태에서, 제1 프라이머 풀이 부재하면, 제3 프라이머 풀은 하기 표 2에 표시된 바와 같은 서열번호 1/2, 3/4, 5/6, 7/8, 9/10, 11/12, 13/14, 15/16, 17/18, 19/20, 21/22, 23/24, 25/26, 27/28, 29/30, 31/32, 33/34, 35/36, 37/38, 39/40, 41/42, 43/44, 45/46, 47/48, 49/50, 51/52, 53/54, 및 170/171로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 적어도 하나의 쌍을 포함하거나 또는 그로 이루어진 적어도 하나의 프라이머 쌍을 포함한다.
일부 실시형태에서, 제1 프라이머 풀, 제2 프라이머 풀, 또는 임의로 제3 프라이머 풀은 대조 마커를 증폭하기 위한 프라이머 쌍을 더 포함한다. 일부 실시형태에서, 대조 마커는 ACTB, GAPDH, 튜불린, ALDOA, PGK1, LDHA, RPS27A, RPL19, RPL11, ARHGDIA, RPL32, C1orf43, CHMP2A, EMC7, GPI, PSMB2, PSMB4, RAB7A, REEP5, SNRPD3, VCP, 및 VPS29로 이루어진 군으로부터 선택된다.
일부 실시형태에서, 키트는 각각이 제2 프라이머 풀의 분획을 수용하기 위한, 다수의 용기를 더 포함한다.
일부 실시형태에서, 키트는 CpG 위치-특이적 메틸화 분석을 수행하기 위한 표준 시약을 더 포함하고, 상기 분석은 하기 기술 중 하나 이상을 포함한다: MS-SNuPE, MSP, MethyLight™, HeavyMethyl™, COBRA, 및 핵산 시퀀싱.
일부 실시형태에서, 키트는 완충제 (예를 들어, 제한 효소, PCR, 저장 또는 세척 완충제); DNA 회수 시약 또는 키트 (예를 들어, 침전, 한외여과, 친화성 컬럼) 및 DNA 회수 성분으로 이루어진 군으로부터 선택되는 추가 시약을 포함할 수 있다.
일부 실시형태에서, 본 개시내용의 키트는 다음을 포함할 수 있다:
(a) 바이술파이트 시약;
(b) 임의로, 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, 유전자간 영역 1, TMEFF2, 유전자간 영역 4, NKX2-6, 유전자간 영역 5, SLC24A2, NDRG4, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, 및 CRHBP로 이루어진 군으로부터 선택되는 적어도 2개 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 또는 그 초과) 마커를 포함하는 다수의 표적 마커 중 적어도 2개의 표적 서열을 사전-증폭하기 위한 다수의 메틸화-특이적 프라이머 쌍을 포함하는 제1 프라이머 풀로서, 메틸화-특이적 프라이머 쌍은 하기 표 2에 표시되는 바와 같은 서열번호 1/2, 3/4, 5/6, 7/8, 9/10, 11/12, 13/14, 15/16, 17/18, 19/20, 21/22, 23/24, 25/26, 27/28, 29/30, 31/32, 33/34, 35/36, 37/38, 39/40, 41/42, 43/44, 45/46, 47/48, 49/50, 51/52, 53/54, 및 170/171로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 적어도 2개 쌍을 포함하거나 또는 그로 이루어지는 것인, 제1 프라이머 풀;
(c) 제2 시약으로서, 제1 프라이머 풀이 존재하면, 제2 시약은 제1 프라이머 풀에 의해 사전-증폭된 다수의 표적 마커의 적어도 하나 (예를 들어, 각각)의 메틸화 수준을 정량화하기 위한 것이고, 제2 시약은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서, 제1 프라이머 풀에 의해 사전-증폭된 다수의 표적 마커의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있는 다수의 정량화 프라이머 쌍을 포함하는 제2 프라이머 풀을 포함하고; 제1 프라이머 풀이 부재하면, 제2 시약은 제1 시약으로 처리된 DNA 내의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 정량화하기 위한 것이고, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하고, 제2 시약은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서, 제1 시약으로 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 하나의 표적 서열의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있는 다수의 정량화 프라이머 쌍을 포함하는 제3 프라이머 풀을 포함하는 것인, 제2 시약.
본 개시내용의 키트는 또한 별개 용기에 포장된, 다른 성분 예컨대 차단, 세척 또는 코팅에 적합한 완충제 또는 용액을 함유할 수 있다.
본 개시내용의 키트는 DNA 농축을 위한, 당분야에 공지된, 하기 성분 중 하나 또는 몇개를 더 포함할 수 있다: 단백질 성분으로서, 상기 단백질은 메틸화된 DNA에 선택적으로 결합함; 임의로, 적합한 용액 중, 삼중체-형성 핵산 성분, 하나 또는 다수의 링커; 결찰 수행을 위한 물질 또는 용액, 예를 들어, 리가제, 완충액; 컬럼 크로마토그래피 수행을 위한 물질 또는 용액; 면역학 기반 농축 (예를 들어, 면역침강)을 수행하기 위한 물질 또는 용액; 핵산 증폭, 예를 들어 PCR을 수행하기 위한 물질 또는 용액; 적용가능하면 커플링 시약과 함께, 적용가능하면 용액 중에, 하나의 염료 또는 몇개 염료; 혼성화를 수행하기 위한 물질 또는 용액; 및/또는 세척 단계를 수행하기 위한 물질 또는 용액.
용도
다른 양태에서, 본 개시내용은 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가, 또는 결장직장 신생물의 치료를 받는 대상체에서 치료 반응의 모니터링을 위한 진단 키트의 제조에서 본 개시내용의 키트의 용도를 제공한다.
다른 양태에서, 본 개시내용은 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법에서 사용을 위한 키트의 제조에서 표적 마커의 메틸화 수준의 정량화를 위한 시약의 용도를 제공하고, 상기 방법은 하기 단계를 포함한다:
(a) 대상체로부터 DNA를 함유하는 생물학적 샘플을 수득하는 단계;
(b) 단계 (a)로부터 수득된 생물학적 샘플 중 DNA를, DNA에서 비메틸화 및 메틸화 CpG 부위(들)를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
(c) 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭 프라이머 풀을 사용하여 사전-증폭하는 단계로서, 적어도 하나 (예를 들어, 각각)의 표적 마커 (들)의 적어도 일부분이 사전-증폭되고, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하고; 단계 (c)는 존재하거나 또는 부재하는 것인 단계;
(d) 단계 (c)가 존재하면,단계 (c)로부터 획득된 DNA를 기반으로 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하고; 단계 (c)가 부재하면, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하는 단계로서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 것인 단계; 및
(e) 단계 (d)의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 각각, 상응하는 기준 수준과 비교하는 단계로서, 하나 이상의 표적 마커(들)의, 그의 상응하는 기준 수준에 비해서 동일하거나 더 높은 메틸화 수준은, 대상체가 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타내는 것인 단계.
다른 양태에서, 본 개시내용은 결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 방법에서 사용을 위한 키트의 제조에서 표적 마커의 메틸화 수준을 정량화하기 위한 시약의 용도를 제공하고, 상기 방법은 하기 단계를 포함한다:
(a) 대상체로부터 DNA를 함유하는 생물학적 샘플을 수득하는 단계;
(b) 단계 (a)로부터 수득된 생물학적 샘플 중 DNA를, DNA에서 비메틸화 및 메틸화 CpG 부위(들)를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
(c) 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭 프라이머 풀을 사용해 사전-증폭하는 단계로서, 적어도 하나 (예를 들어, 각각)의 표적 마커 (들)의 적어도 일부분이 사전-증폭되고, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하고; 단계 (c)는 존재하거나 또는 부재하는 것인 단계;
(d) 단계 (c)가 존재하면, 단계 (c)로부터 획득된 DNA를 기반으로 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하고; 단계 (c)가 부재하면, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 개별적으로 정량화하는 단계로서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하는 것인 단계; 및
(e) 단계 (d)의 적어도 하나 (예를 들어, 각각)의 표적 마커의 메틸화 수준을 각각, 치료전 대상체로부터 수득된 DNA를 함유하는 생물학적 샘플에 대해서 단계 (a), 단계 (b), 임의로 단계 (c), 및 단계 (d)를 반복함으로써 정량화된 치료 전 동일 대상체로부터 수득된 하나 이상의 표적 마커(들)의 상응하는 메틸화 수준과 비교하는 단계로서, 하나 이상의 표적 마커(들)의, 치료 전 그의 상응하는 메틸화 수준에 비해서 더 낮은 메틸화 수준는 대상체가 치료에 반응성임을 나타내는 것인 단계.
일부 실시형태에서, 상기 단계 (c)의 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 또는 다수의 마커 (예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 마커)를 포함한다.
일부 실시형태에서, 상기 단계 (c)의 적어도 하나의 표적 마커는 최대 하나의 표적 마커 (즉, 하나의 마커이지만 하나 이하의 마커)일 수 있다. 일부 실시형태에서, 적어도 하나의 표적 마커는 셉틴9이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 BCAT1이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 IKZF1이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 BCAN이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 PKNOX2이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 VAV3이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 IRF4이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 NDRG4이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 POU4F2이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 SALL1이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 TMEFF2이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 ASCL4이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 FGF12이다. 일부 실시형태에서, 적어도 하나의 표적 마커는 유전자간 영역 1이다.
일부 실시형태에서, 상기 단계 (c)의 적어도 하나의 표적 마커는 다수의 표적 마커를 포함한다. 일부 실시형태에서, 다수의 표적 마커는 셉틴9, BCAT1, 및 IKZF1로 이루어진 군으로부터 선택되는 적어도 2 또는 3개 마커를 포함한다. 일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 BCAN, PKNOX2, VAV3, NDRG4 및 IRF4로 이루어진 군으로부터 선택되는 1, 2, 3, 4, 또는 5개 추가 마커를 더 포함한다. 일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 POU4F2, SALL1, SDC2, ASCL4, 유전자간 영역 1, TMEFF2, 유전자간 영역 4, NKX2-6, 유전자간 영역 5, SLC24A2, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, 및 CRHBP로 이루어진 군으로부터 선택되는 하나 이상 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20)의 추가 마커를 더 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 셉틴9, 및 BCAN, BCAT1, IKZF1, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 BCAN, BCAT1, IKZF1, NDRG4, PKNOX2, VAV3, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 BCAT1, 및 BCAN, 셉틴9, IKZF1, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 BCAN, 셉틴9, NDRG4, IKZF1, PKNOX2, VAV3, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 NDRG4, 셉틴9, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 IKZF1, 및 BCAN, 셉틴9, BCAT1, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 BCAN, 셉틴9, BCAT1, PKNOX2, NDRG4, VAV3, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 NDRG4, 셉틴9, 및/또는 BCAT1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 BCAN, 및 셉틴9, BCAT1, IKZF1, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, VAV3, NDRG4, IRF4, PKNOX2, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 VAV3, 및 셉틴9, BCAT1, IKZF1, BCAN, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, PKNOX2, NDRG4, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 IRF4, 및 셉틴9, BCAT1, IKZF1, BCAN, VAV3, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, NDRG4, PKNOX2, VAV3 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 PKNOX2, 및 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, NDRG4, IRF4, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
일부 실시형태에서, 본 개시내용의 다수의 표적 마커는 NDRG4, 및 셉틴9, BCAT1, IKZF1, VAV3, IRF4, BCAN, POU4F2, PKNOX2, SDC2, TMEFF2, SALL1, SLC24A2, NKX2-6, KCNA6, SOX1, HS3ST2, ASCL4, KCTD8, HMX1, MARCH11, CRHBP, FGF12, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27)의 추가적 표적 마커를 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 3, 4, 5, 6, 또는 7)의 추가적 표적 마커는 셉틴9, BCAT1, IKZF1, PKNOX2, VAV3, IRF4, BCAN, 또는 이들의 임의의 조합을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 셉틴9, BCAT1, 및/또는 IKZF1을 포함한다. 일부 실시형태에서, 적어도 하나 (예를 들어, 적어도 1, 2, 또는 3)의 추가적 표적 마커는 BCAN, VAV3, 및/또는 IRF4를 포함한다.
실시형태
모든 실시예에서 사용되는 생물학적 재료, 다양한 클론 및 발현 플라스미드, 배지 효소, 완충 용액, 및 다양한 배양 방법, 단백질 추출 및 정제 방법, 및 다른 분자 생물학적 작업 방법은 모두 당업자에게 충분히 공지되어 있다. 보다 상세하게는, 하기 문헌들을 참조한다: "Molecular Cloning: A Laboratory Manual" edited by Sambrook, et al. (Cold Spring Harbor, 1989) 및 "Short Protocols in Molecular Biology" (Frederick M. Ausubel, et al., translated by Yan Ziying et al., Science Press (Beijing), 1998).
실시예 1: 메틸화-특이적 프라이머의 검증
초기 개념 증명을 위해서, 본 발명자는 프라이머/프로브 특이성을 평가하기 위해 바이술파이트-전환된 기준 DNA를 선택하였다. 사용자 맞춤 프라이머/프로브 세트가 28개 표적 마커 (즉, NDRG4, BCAT1, IKZF1, 셉틴9, SDC2, VAV3, IRF4, TMEFF2, SALL1, BCAN, POU4F2, PKNOX2, ASCL4, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, NKX2-6, SLC24A2, 및 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5를 포함한, 5개 유전자가 영역)에 대해 디자인되었다. 개념 증명 실험에서, 본 발명자는 4 ng의 총 투입량으로 완전히 비메틸화된 DNA 중에 모든 CpG 부위에서 완전히 메틸화된 DNA의 혼합물 (10%, 25%, 50%, 100%)을 생성하였다. 표 2에 표시된 서열을 갖는 프라이머 및 프로브를 사용하여, 28개 표적 마커를 삼중으로 이들 혼합물에 대해 평가하였다.
바이술파이트 전환된 완전 메틸화된 DNA 및 바이술파이트 전환된 완전 비메틸화된 DNA는 Qiagen company (EpiTect Control DNA)에서 구입하였고, 혼합하여서 각각 완전 비메틸화된 DNA 중 100%, 50%, 25%, 및 10%의 완전 메틸화된 DNA를 함유하는 혼합된 DNA 조성물을 제공하였고, 여기서 DNA의 총량은 각 혼합된 DNA 조성물 중 4 ng이었다.
혼합된 DNA 조성물은 28개 표적 마커 (즉, NDRG4, BCAT1, IKZF1, 셉틴9, SDC2, VAV3, IRF4, TMEFF2, SALL1, BCAN, POU4F2, PKNOX2, ASCL4, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, NKX2-6, SLC24A2, 및 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5을 포함한, 5개 유전자간 영역)에 특이적인 메틸화-특이적 프라이머 쌍 (표 2 참조) 및 검출 프로브 (표 2 참조)의 존재 하에서 PCR 반응을 통해 증폭시켰다. 대조 마커 ACTB를 또한 메틸화-비특이적 프라이머 (표 2 참조), 및 검출 프로브 (표 2 참조)를 사용한 PCR 반응에서 증폭시켰다. 각각의 28개 표적 마커 및 하나의 대조 마커가 별개 검출 어세이에서 각각 증폭되었다. 상이한 마커에 대한 검출 프로브는 상이한 형광제 (FAM, HEX, VIC, TAMRA, Texas Red, 또는 Cy5) 및 상응하는 소광제 (BHQ1, BHQ2, BHQ3, DABCYL 또는 TAMRA)로 표지되었다. PCR 반응 시스템에서, 각각의 프라이머는 500 nM의 최종 농도였고, 각각의 검출 프로브는 200 nM의 최종 농도였다.
Figure pct00013
Figure pct00014
Figure pct00015
PCR 반응 시스템은 10 ㎕의 혼합된 DNA 조성물 (4 ng DNA), 상기 기재된 프라이머, 및 프로브를 함유하는 2.5 ㎕의 사전혼합 용액; 및 12.5 ㎕의 PCR 시약 믹스 (Luna® 유니버설 프로브 qPCR 마스터 믹스 (NEB))를 함유하는 것을 제조하였다.
PCR 반응은 다음과 같이 수행하였다: 95℃에서 5분에 이어서, 95℃에서 15초 및 56℃에서 40초의 50 사이클 (이 동안 형광이 검출됨). ABI 7500 실시간 PCR 시스템을 사용하여 상응하는 형광 채널에서 상이한 형광을 검출하였다.
결과
Ct (사이클 한계) 값은 각각의 PCR 반응에 대해 계산되었고 상이한 혼합 DNA 조성물에 의한 각 마커에 대한 PCR 반응의 Ct 값을 분석하였다. 검사된 각 마커에 대해서, PCR 반응에서 사용된 메틸화-특이적 프라이머의 쌍은 혼합 DNA 조성물에서 전환된 메틸화된 DNA의 백분율이 증가함에 따라서 비례적으로 감소되는 Ct 값을 제공한 것으로 확인되었다. 모든 검사된 마커에 대해서, 메틸화된 주형의 백분율은 예상 Ct 값과 높은 상관성 (모든 검사된 마커에 대해서 상관 계수 R>0.9) 및 선형성을 가져서, 표적 마커를 사전-증폭하는데 사용된 프라이머가 메틸화-특이적이었음을 의미한다. 상관성은 도 1B (대조 마커 ACTB에 대해 메틸화-비특이적 프라이머로 수득)에 도시된 중복된 곡선과 비교하여, 도 1A (PKNOX2에 대한 메틸화-특이적 프라이머로 수득)에 도시된 바와 같은 곡선의 수평 이동으로부터 확인할 수 있다. PKNOX2 이외의 다른 마커에 대해 검사된 다른 메틸화-특이적 프라이머의 결과는 도 1A와 유사하였고, 여기에 도시하지는 않았다.
실시예 2: 상이한 조직에서 표적 마커의 메틸화 존재도의 비교
종양 샘플에 대한 선택된 표적 마커의 실현가능성 및 특이성을 검증하기 위해서, 우리는 결장직장암 환자로부터의 결장직장암 조직 (CRC-조직), 후기 선종 조직 (AA-조직), 주변암성 조직 (주변-조직), 및 대조군으로서 결장경검사 음성자의 백혈 세포 (WBC)에서 28개 마커를 검사하였다. 실험 방법은 하기에 상술한다.
표적 마커의 메틸화 존재도는 결장직장 신생물에 대한 진단 또는 스크리닝에서 이들 표적 마커의 잠재성을 조사하기 위해, 상이한 세포 및 조직 유래의 DNA 샘플에서 검출하였다. 이 실시예에서 검사된 표적 마커는 NDRG4, BCAT1, IKZF1, 셉틴9, SDC2, VAV3, IRF4, TMEFF2, SALL1, BCAN, POU4F2, PKNOX2, ASCL4, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, NKX2-6, SLC24A2, 및 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5를 포함한, 5개 유전자간 영역을 포함하였다.
절차는 하기 단계를 포함한다:
1. DNA 샘플은 각각 백혈 세포, 주변암성 조직, 후기 선종 조직, 및 결장직장암 조직에서 수득하였고, 각 유형의 샘플에 대해 10개 생물학적 샘플이었다 (즉, 총 40개 샘플). 백혈 세포 DNA는 Qiagen QIAamp DNA Mini 키트로 추출하였고, 조직 DNA는 공급사의 설명서에 따라 Qiagen QIAamp DNA FFPE 조직 키트로 추출하였다.
2. 상기 단계 1에서 수득된 DNA 샘플은 바이술파이트 시약 (MethylCode™ 바이술파이트 전환 키트)을 처리하여 전환된 DNA를 수득하였다.
3. 형광 PCR을 전환된 DNA에 대해 수행하였다. 간략하게, 단계 2에서 수득된 전환된 DNA는 NDRG4, BCAT1, IKZF1, 셉틴9, SDC2, VAV3, IRF4, TMEFF2, SALL1, BCAN, POU4F2, PKNOX2, ASCL4, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, NKX2-6, SLC24A2, 및 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5을 포함한, 5개 유전자간 영역에 특이적인 메틸화-특이적 프라이머 쌍 (표 2 참조), 및 검출 프로브 (표 2 참조)의 존재 하에서 PCR 반응으로 증폭하였다. 대조 마커 ACTB는 또한 메틸화-비특이적 프라이머 (표 2 참조), 및 검출 프로브 (표 2 참조)를 사용한 PCR 반응으로 증폭하였다. 상이한 마커에 대한 검출 프로브는 상이한 형광으로 표지하였다. PCR 반응 시스템에서, 각 프라이머는 500 nM의 최종 농도였고, 각각의 검출 프로브는 200 nM의 최종 농도였다.
PCR 반응 시스템은 10 ㎕의 전환된 DNA, 상기 기재된 프라이머 및 프로브를 함유하는 2.5 ㎕의 사전혼합된 용액; 및 12.5 ㎕의 PCR 시약 믹스 (Luna® 유니버설 프로브 qPCR 마스터 믹스 (NEB))를 함유하는 것을 제조하였다.
PCR 반응은 다음과 같이 수행하였다: 95℃에서 5분에 이어서, 95℃에서 30초 및 56℃에서 60초의 10 사이클 (이 동안 형광이 검출됨). ABI 7500 실시간 PCR 시스템을 사용하여, 상응하는 형광 채널에서 상이한 형광이 검출되었다.
4. 백혈 세포, 주변암성 조직, 후기 선종 조직, 및 결장직장암 조직에서 수득된 샘플에 대해 Ct 값을 계산, 통합하고, 비교하였다. 미결정된 웰의 Ct 값은 50으로 지정하였다.
결과
결과는 결장경검사 음성자 유래 백혈 세포에서 본 개시내용의 표적 마커 (NDRG4, BCAT1, IKZF1, 셉틴9, SDC2, VAV3, IRF4, TMEFF2, SALL1, BCAN, POU4F2, PKNOX2, ASCL4, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, NKX2-6, SLC24A2, 및 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5을 포함한 5개 유전자간 영역)의 메틸화 존재도가 SALL1 및 PKNOX2를 예로 들면, 결장암 환자로부터의 조직 샘플에 비해서 유의하게 더 낮다 (p < 0.01)는 것을 보여주었다 (도 2 참조). 나머지 검사된 표적 마커 각각에서도 유의한 차이 (p < 0.01)가 관찰되었고, 그 결과는 여기에 도시하지 않았다. 특히, 표적 마커의 메틸화 존재도는 후기 선종 조직 및 결장직장암 조직에 비해서 주변암성 조직에서 더 낮았다. 이것은 검사된 각각의 표적 마커가 백혈 세포 샘플을 사용하여 결장직장 신생물에 대한 진단 및 스크리닝에서 잠재적 적용성을 갖는다는 것을 보여주었다.
실시예 3: 세포-무함유 DNA를 사용한 메틸화된 표적 마커의 정량화
CRC 혈장 샘플에 대한 메틸화된 마커의 임상 성능을 검증하기 위해서, 우리는 본 명세서에 개시된 방법 (또한 사전-증폭 방법이라고도 함)을 사용하여 결장경검사에서 음성인 107개 혈장 대조군 샘플 및 88개 임상적으로 진단된 CRC 혈장 샘플에서 13개 마커 (즉, NDRG4, 셉틴9, BCAT1, IKZF1, BCAN, VAV3, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2 및 유전자간 영역 1)를 검사하였다. 88개 임상 진단된 CRC 혈장 샘플 중에서, 15개 샘플은 CRC 병기 I로 진단된 대상체 유래였고, 26개 샘플은 CRC 병기 II로 진단된 대상체 유래였으며, 28개 샘플은 CRC 병기 III으로 진단된 대상체 유래였고, 19 개 샘플은 CRC 병기 IV로 진단된 대상체 유래였다.
사전-증폭 방법
사전-증폭 방법은 하기 단계를 포함한다:
1. 세포-무함유 DNA (cfDNA) 샘플은 QIAamp 순환 핵산 키트 (Qiagen)를 사용하여 1-4 mL 혈장 샘플로부터 수득하였다.
2. 바이술파이트 시약 (MethylCode™ 바이술파이트 전환 키트)을 사용한 바이술파이트 전환을 위한 투입량으로 20 ng cfDNA를 사용하여 전환된 cfDNA를 수득하였다.
3. 전환된 cfDNA 샘플을 사전-증폭하였다. 간략하게, 상기 단계 2에서 수득된 전환된 cfDNA는 NDRG4, 셉틴9, BCAT1, IKZF1, BCAN, VAV3, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2 및 유전자간 영역 1에 특이적인 메틸화 특이적 프라이머 쌍 (표 2 참조)의 존재 하에서 PCR 반응으로 사전-증폭하였다. PCR 반응 시스템에서, 각 프라이머는 200 nM의 최종 농도였다.
25 ㎕ PCR 믹스는 10 ㎕의 cfDNA, 상기 기재된 프라이머 세트를 함유하는 2.5 ㎕의 사전혼합된 용액, 및 12.5 ㎕의 PCR 시약 믹스 (Luna® 유니버설 프로브 qPCR 마스터 믹스 (NEB))로 구성되었다.
PCR 반응은 다음과 같이 수행되었다: ProFlex™ PCR 시스템 (Thermo Fisher)을 사용하여, 95℃에서 3분에 이어서, 95℃에서 30초 및 56℃에서 60초의 8 사이클.
4. 상기 단계 3에서 획득된 생산물을 10배까지 희석한 다음에 NDRG4, 셉틴9, BCAT1, IKZF1, BCAN, VAV3, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2 및 유전자간 영역 1에 특이적인, 몇몇 다수의 형광 PCR 검출에 사용하였다.
qPCR 믹스는 10 ㎕의 희석된 단계 3에서 획득된 생산물, 2.5 ㎕ 프라이머/프로브 풀, 12.5 ㎕의 PCR 시약 믹스 (Luna® 유니버설 프로브 qPCR 마스터 믹스 (NEB))로 구성되었다. 비-CpG ACTB 영역이 각 반응 웰에 대한 내부 대조군으로서 사용되었다 (표 2 참조). 상이한 마커에 대한 검출 프로브는 상이한 형광으로 표지하였다. PCR 반응 시스템에서, 각각의 프라이머는 500 nM의 최종 농도였고, 각각의 검출 프로브는 200 nM의 최종 농도였다.
PCR 반응은 다음과 같이 수행하였다: 95℃에서 5분에 이어서, 95℃에서 15초 및 56℃에서 40초의 50 사이클 (이 동안 형광이 검출됨). ABI 7500 실시간 PCR 시스템을 사용하여, 상응하는 형광 채널에서 상이한 형광이 검출되었다.
결과
증폭 신호없는 샘플에 대한 Ct 값은 50으로 설정되었다. 기준 Ct 값은 개별적으로, 각 검사된 마커에 대해 설정되었다. 검사된 마커 중 어느 하나의 Ct 값이 그의 상응하는 기준 Ct 값과 동일하거나 또는 그에 비해 낮으면, 샘플은 양성 샘플로서 분류된다. 도 3은 결장경 검사에서 음성인 개체군 및 CRC를 갖는 개체군에서 표적 마커 SALL1 및 BCAN의 Ct 값 분포를 도시한다. 도 3에서 확인된 바와 같이, CRC를 갖는 개체군에서 표적 마커 SALL1 및 BCAN의 메틸화 수준은 결장경 검사 음성인 개체군에 비해서 유의하게 (p 값 = SALL1 및 BCAN에 대해 각각 2.14E-4 및 1.07E-8) 더 높았다. 다른 표적 마커에 대한 결과는 유사하였고 (p < 0.01), 도시되지 않았다.
하기 표 3은 사전-증폭 방법에서 5개 표적 마커 (즉, 셉틴9, BCAT1, IKZF1, BCAN 및 VAV3)를 사용한 비교 결과를 도시한다. 표 3에 표시된 바와 같이, 사전-증폭 방법은 CRC에 대해 초고감도 (86.4%) 및 결장경검사 음성 개체군에 대해 고특이성 (90.7%)을 보였고, 이것은 예를 들어, 임상 시험 샘플 중 CRC에 대해 48.2%의 감도를 갖는, 기존 상용화된 마커, 예를 들어 셉티9에 비해 매우 월등하였다 (참조: T.R. Church et al., Gut.; 63:317-325 (2014)). 13개 표적 마커 내에서 나머지 마커 조합 (예를 들어, 셉틴9, BCAT1, IKZF1, VAV3, BCAN, 및 NDRG4의 조합; 셉틴9, BCAT1, IKZF1, VAV3, BCAN, NDRG4, SDC2, PKNOX2, 및 TMEFF2의 조합, 셉틴9, BCAT1, IKZF1, VAV3, BCAN, NDRG4, SDC2, PKNOX2, TMEFF2, 및 유전자간 영역 1의 조합 등)을 분석하였고, 결과는 CRC에 대한 감도가 85% 이상이고, 결장경검사 음성 개체군에 대한 특이성은 90% 이상인 것으로 확인되었다.
Figure pct00016
CRC 분류에서 사전-증폭 방법 및 셉틴9 단독 방법의 감도를 또한 비교하였다. 셉틴9 단독 방법은 표적 마커가 오직 셉틴9인 것을 제외하고, 사전-증폭 방법과 유사하게 수행하였다.
표 4에 표시된 바와 같이, 사전-증폭 방법에서, CRC 병기 I, 병기 II, 병기 III, 및 병기 IV의 감도는 각각 73.3%, 80.8%, 89.3%, 및 100%였다. 대조적으로, 셉틴9 단독 방법에서, CRC 병기 I, 병기 II, 병기 III, 및 병기 IV의 감도는 각각 26.7%, 65.4%, 75.0%, 및 79%였다. 그러므로, 사전-증폭 방법은 셉틴9 단독 방법과 비교하여 감도의 유의한 증가를 보였다.
Figure pct00017
각각의 검사된 표적 마커의 Ct 값은 CRC 샘플에서 메틸화된 카피의 부재 또는 이의 존재를 확인하기 위해 정량화되었다. 대안적으로, 내부 대조군 ACTB에 대한 각 검사된 표적 마커의 델타 Ct 값은 상대적 메틸화 수준을 나타내기 위해 계산되었다. 중요한 것은, 모든 검사된 마커가 0.8 내지 0.9 범위의 AUC로 대조군으로부터 CRC를 분리하는 분류력을 가졌다는 것이다 (도 4에 도시된 바와 같음). 상이한 알고리즘, 예컨대 선형 판별 분석, SVM, 랜덤 포레스트, 선형 회귀, 로지스틱 회귀 등을 사용하여 조기 암 검출의 분류자를 구축하였다. 마커의 상이한 조합을 사용하여 최적 성능을 획득하였다. 조합 중 하나 (SALL1, BCAT1, 및 셉틴9)에 대한 ROC 곡선이 도 5에 도시되었다. 다른 조합에 대한 ROC 곡선은 도 5와 유사하였고, 여기에 도시하지 않았다.
실시예 4: 사전-증폭 방법 및 직접 qPCR 방법 간 LOD 비교
사전-증폭 방법 및 직접 qPCR 방법의 LOD를 비교하기 위해서, 본 발명자는 사전-증폭 방법 및 직접 qPCR 방법 둘 모두를 사용하여 13개 표적 마커 (즉, VAV3, NDRG4, 셉틴9, BCAT1, IKZF1, BCAN, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2 및 유전자간 영역 1)를 검사하였다. 직접 qPCR 방법은 사전-증폭 단계가 없는 것을 제외하고, 사전-증폭 방법과 동일하게 수행하였다. 각 방법에서, 13개 표적 마커는 동시에 사전-증폭/증폭되었지만, 정량화는 각 표적 마커에 대해 별도로 수행하였다. 표적 마커 VAV3에 대한 사전-증폭 방법 및 직접 qPCR 방법 간 LOD 비교는 하기에 표시하였다. 나머지 12개의 표적 마커에 대한 사전-증폭 방법 및 직접 qPCR 방법 간 LOD 비교는 유사하게 수행하였고, 여기에 도시하지는 않았다.
간략하게, CRC 조직 DNA는 0.5% 및 0.2% 비율로 혈액 세포 DNA에 혼합하였고, 40 ng DNA를 바이술파이트-처리하였으며 (MethylCode™ 바이술파이트 전환 키트), 전환된 DNA 절반을 사전-증폭에 이어서 qPCR (즉, 사전-증폭 방법)에 사용하였고, 나머지 절반의 전환된 DNA는 qPCR에 직접 (즉, 직접 qPCR 방법) 사용하였다. 사전-증폭 단계에서 최종 프라이머 농도는 50 nM이었다. 25 ㎕ PCR 믹스는 10 ㎕의 전환된 DNA, 상기 기재된 프라이머를 함유하는 2.5 ㎕의 사전믹스된 용액; 및 12.5 ㎕의 PCR 시약 믹스 (Luna® 유니버설 프로브 qPCR 마스터 믹스 (NEB))로 구성되었다. PCR 프로그램은 95℃에서 3분에 이어서, 95℃에서 30초 및 56℃에서 60초의 8 사이클이었다. 사전-증폭 단계 후에 획득된 생산물은 10배로 희석하였고 qPCR에 사용하였다. qPCR 믹스는 10 ㎕ 주형 DNA, 2.5 ㎕ 프라이머/프로브 풀 및 12.5 ㎕의 LUNA 마스터 믹스로 구성되었다. qPCR 프로그램은 95℃에서 5분에 이어서, 95℃에서 15초 및 56℃에서 40초의 50 사이클 (이 동안 형광이 검출됨)로, ABI 7500 실시간 PCR 시스템 상에서 실행하였다. 4개 복제물을 동시에 수행하였다. 결과는 하기 표 5에 표시되었다.
Figure pct00018
표 5에 표시된 바와 같이, 직접 qPCR 방법과 비교하여, 사전-증폭 방법은 개선된 LOD (0.50% 대 0.20% CRC DNA 백분율), 안정성, 및 더 높은 검출 감도를 보였다. 나머지 12개의 표적 마커 (즉, NDRG4, 셉틴9, BCAT1, IKZF1, BCAN, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2 및 유전자간 영역 1)에 대한 사전-증폭 방법은 직접 qPCR 방법에 비해서 더 양호하거나 또는 나쁘지 않은 결과를 보였고, 그 결과는 여기에 도시하지 않았다.
실시예 5: 세포-무함유 DNA를 사용한 메틸화된 표적 마커의 정량화, 및 사전-증폭 방법 없음과 비교.
CRC 혈장 샘플에 대한 메틸화된 마커의 임상 성능을 검증하기 위해서, 우리는 사전-증폭 방법 및 사전-증폭 방법 없음을 사용하여 32개 임상적으로 진단된 CRC 혈장 샘플 및 결장경검사에서 음성인 29 개 혈장 대조군 샘플에서 5개 마커 (셉틴9, BCAT1, IKZF1, BCAN, VAV3)를 검사하였다. 사전-증폭 방법 없음은 사전-증폭 단계 및 희석 단계가 부재하는 것을 제외하고, 사전-증폭 방법과 유사하게 수행하였다. 32개 임상적으로 진단된 CRC 혈장 샘플 중에서, 2개 샘플은 CRC 병기 I로 진단된 대상체 유래였고, 9 개 샘플은 CRC 병기 II로 진단된 대상체 유래였으며, 13개 샘플은 CRC 병기 III으로 진단된 대상체 유래였고, 5개 샘플은 CRC 병기 IV으로 진단된 대상체 유래였고, 3개 샘플은 미지 병기였다.
실험은 하기 단계를 포함하였다:
1. 세포-무함유 DNA (cfDNA) 샘플은 QIAamp 순환 핵산 키트 (Qiagen)를 사용하여 3-5 mL 혈장 샘플에서 수득하였다.
2. DNA가 40 ng 미만이었으면, cfDNA는 2개 부분으로 나누었고 바이술파이트 시약 (MethylCode™ 바이술파이트 전환 키트)을 사용한 바이술파이트 전환을 위한 투입물로서 사용하여서, 하나는 사전-증폭 방법을 위한 10 ㎕ 용출액, 나머지 하나는 20 ㎕ 용출액으로서, 2개의 동시 반응으로, 전환된 cfDNA를 수득하였다. DNA가 40 ng 초과이면, 20 ng cfDNA를 2개 반응에 사용하였고, 용출 과정은 상기와 동일하였다.
3. 사전-증폭 방법 경우에, 1개 반응 (10 ㎕ 용출액) 중 전환된 cfDNA를 사전-증폭하였다. 간략하게, 상기 단계 2에서 수득된 전환된 cfDNA 샘플은 셉틴9, BCAT1, IKZF1, BCAN, VAV3에 특이적인, 메틸화-특이적 프라이머 쌍 (표 2 참조)의 존재 하에서 PCR 반응을 통해 사전-증폭시켰다. PCR 반응 시스템에서, 각각의 프라이머는 200 nM의 최종 농도였다. 사전-증폭 프로그램, 희석 및 qPCR 어세이는 실시예 3과 동일하였다.
4. 사전-증폭 방법 없음 경우에, 나머지 반응 (20 ㎕ 용출액)의 전환된 cfDNA 샘플을 2개의 상이한 웰에서 qPCR 어세이에 사용하였는데, 각 웰은 10 ㎕의 전환된 DNA가 존재하였다. qPCR 믹스 및 프로그램은 사전-증폭 방법과 동일하였다.
5. 비-CpG ACTB 영역이 각 반응 웰에 대한 내부 표준으로서 사용되었다 (표 2 참조). 상이한 마커에 대한 검출 프로브는 상이한 형광으로 표지되었다. PCR 반응 시스템에서, 각각의 프라이머는 500 nM의 최종 농도였고, 각각의 검출 프로브는 200 nM의 최종 농도였다.
결과
Ct 값은 증폭 신호없는 샘플에 대해 50으로 설정하였다. 기준 Ct 값은 개별적으로 각 검사된 마커에 대해 설정되었다. 검사된 마커 중 어느 하나의 Ct 값이 그의 상응하는 기준 Ct 값과 동일하거나 또는 그에 비해 낮으면, 샘플은 양성 샘플로서 분류된다.
하기 표 6은 사전-증폭 방법 및 사전-증폭 방법 없음에서 5개 표적 마커 (셉틴9, BCAT1, IKZF1, BCAN 및 VAV3)를 사용한 비교 결과를 표시한다. 표 6에 표시된 바와 같이, 사전-증폭 방법은 CRC에 대해 초고 감도 (96.9%) 및 결장경검사 음성 개체군에 대해 고 특이성 (93.1%)을 보였고, 사전-증폭 방법 없음에 대한 감도 및 특이성은 각각 84.4% 및 93.1%였다. 사전-증폭 방법 없음의 감도는 또한 셉틴9 단독 방법에 비해서 훨씬 더 높았다.
Figure pct00019
CRC 혈장 샘플에 대한 메틸화된 마커의 임상 성능을 검증하기 위해서, 우리는 상기 기술된 바와 같이 사전-증폭 방법 및 사전-증폭 방법 없음을 사용하여 임상적으로 진단된 CRC 혈장 샘플 및 결장경검사 음성 혈장 대조군 샘플에서 셉틴9, BCAT1, IKZF1, BCAN, VAV3, NDRG4, 및 IRF4로 이루어진 군으로부터 선택되는 마커의 임의의 조합을 포함한, 더 많은 마커를 검사하였다. 예를 들어, 하기 조합 중 어느 하나가 검사된다: (1) 셉틴9, (2) 셉틴9, BCAT1; (3) 셉틴9 및 IKZF1; (4) 셉틴9 및 NDRG4; (5) 셉틴9 및 BCAN; (6) 셉틴9 및 VAV3; (7) 셉틴9 및 IRF4; (8) BCAT1 및 IKZF1; (9) BCAT1 및 NDRG4; (10) BCAT1 및 BCAN; (11) BCAT1 및 VAV3; (12) BCAT1 및 IRF4; (13) IKZF1 및 NDRG4; (14) IKZF1 및 BCAN; (15) IKZF1 및 VAV3; (16) IKZF1 및 IRF4; (17) NDRG4 및 BCAN; (18) NDRG4 및 VAV3; (19) NDRG4 및 IRF4; (20) BCAN 및 VAV3; (21) BCAN 및 IRF4; (22) VAV3 및 IRF4; (23) 셉틴9, BCAT1, 및 IKZF1; (24) BCAT1, IKZF1, 및 NDRG4; (25) IKZF1, NDRG4, 및 BCAN; (26) NDRG4, BCAN, 및 VAV3; (27) BCAN, VAV3, 및 IRF4; (28) 셉틴9, BCAT1, 및 NDRG4; (29) 셉틴9, BCAT1, 및 BCAN; (30) 셉틴9, BCAT1, 및 VAV3; (31) 셉틴9, BCAT1, 및 IRF4; (32) BCAT1, IKZF1, 및 BCAN; (33) BCAT1, IKZF1, 및 VAV3; (34) BCAT1, IKZF1, 및 IRF4.
실시예 6: 세포-무함유 DNA를 사용한 CRC 메틸화된 표적 마커 (셉틴9, BCAT1, IKZF1, VAV3 및 IRF4)의 정량화에 의한 CRC 검출.
더 많은 마커 조합의 임상 성능을 평가하기 위해서, 우리는 본 명세서에 개시된 방법 (또한 사전-증폭 방법이라고도 함)을 사용하여 286개 임상적으로 진단된 CRC 혈장 샘플 및 112개 결장경검사 음성 혈장 대조군 샘플에서 5개 마커 (셉틴9, BCAT1, IKZF1, VAV3 및 IRF4)를 검사하였다. 286개 임상적으로 진단된 CRC 혈장 샘플 중에, 48개 샘플은 CRC 병기 I로 진단된 대상체 유래이고, 113개 샘플은 CRC 병기 II로 진단된 대상체 유래이고, 107개 샘플은 CRC 병기 III으로 진단된 대상체 유래이고, 18개 샘플은 CRC 병기 IV로 진단된 대상체 유래였다.
실험 방법은 실시예 3과 유사하였다.
결과
Ct 값은 증폭 신호없는 샘플에 대해 50으로 설정되었다. 기준 Ct 값은 개별적으로 각 검사 마커에 대해 검사된 마커 중 어느 하나의 Ct 값이 그의 상응하는 기준 Ct 값과 동일하거나 또는 그에 비해 낮으면, 샘플은 양성 샘플로 분류된다.
표 7에 표시된 바와 같이, 사전-증폭 방법 (CRC 메틸화된 마커 셉틴9, BCAT1, IKZF1, VAV3 및 IRF4의 정량화)은 CRC에 대해 초고 감도 (84.3%) 및 결장경검사 음성 개체군에 대해 고 특이성 (90.3%)을 보였다.
Figure pct00020
표 8에 표시된 바와 같이, 사전-증폭 방법 (CRC 메틸화된 마커 셉틴9, BCAT1, IKZF1, VAV3 및 IRF4의 정량화)에서, CRC 병기 I, 병기 II, 병기 III, 및 병기 IV의 감도는 각각 62.5%, 85.8%, 88.8%, 및 100%였다.
Figure pct00021
더 많은 마커 조합의 임상 성능을 평가하기 위해서, 우리는 상기 개시된 방법을 사용하여 임상적으로 진단된 CRC 혈장 샘플 및 결장경검사 음성 혈장 대조군 샘플에서 셉틴9, BCAT1, IKZF1, BCAN, VAV3, NDRG4, 및 IRF4로 이루어진 군으로부터 선택되는 마커의 임의의 조합을 포함한, 더 많은 마커를 검사하였다. 예를 들어, 하기 조합 중 어느 하나가 검사된다: (1) 셉틴9, (2) 셉틴9, BCAT1; (3) 셉틴9 및 IKZF1; (4) 셉틴9 및 NDRG4; (5) 셉틴9 및 BCAN; (6) 셉틴9 및 VAV3; (7) 셉틴9 및 IRF4; (8) BCAT1 및 IKZF1; (9) BCAT1 및 NDRG4; (10) BCAT1 및 BCAN; (11) BCAT1 및 VAV3; (12) BCAT1 및 IRF4; (13) IKZF1 및 NDRG4; (14) IKZF1 및 BCAN; (15) IKZF1 및 VAV3; (16) IKZF1 및 IRF4; (17) NDRG4 및 BCAN; (18) NDRG4 및 VAV3; (19) NDRG4 및 IRF4; (20) BCAN 및 VAV3; (21) BCAN 및 IRF4; (22) VAV3 및 IRF4; (23) 셉틴9, BCAT1, 및 IKZF1; (24) BCAT1, IKZF1, 및 NDRG4; (25) IKZF1, NDRG4, 및 BCAN; (26) NDRG4, BCAN, 및 VAV3; (27) BCAN, VAV3, 및 IRF4; (28) 셉틴9, BCAT1, 및 NDRG4; (29) 셉틴9, BCAT1, 및 BCAN; (30) 셉틴9, BCAT1, 및 VAV3; (31) 셉틴9, BCAT1, 및 IRF4; (32) BCAT1, IKZF1, 및 BCAN; (33) BCAT1, IKZF1, 및 VAV3; (34) BCAT1, IKZF1, 및 IRF4.
SEQUENCE LISTING <110> SINGLERA HEALTH TECHNOLOGIES (SHANGHAI) LTD. <120> METHODS AND KITS FOR SCREENING COLORECTAL NEOPLASM <130> 071918-8008WO03 <160> 172 <170> PatentIn version 3.5 <210> 1 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 1 caacgcaccc aacaca 16 <210> 2 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 2 gcggagtttg gggga 15 <210> 3 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 3 tacgtggcgg gttgg 15 <210> 4 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 4 aaaaaaacaa ccttaatatc ttc 23 <210> 5 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 5 gtttttttgg ttcggagttg 20 <210> 6 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 6 caaaacgaaa cacgaaaaaa ata 23 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 7 gtagttggat gggattattt 20 <210> 8 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 8 cacccgcaaa atcctct 17 <210> 9 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 9 ggagtgtaga aattaataag 20 <210> 10 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 10 ctcgcttcct cctcctac 18 <210> 11 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 11 cggagtcgag tttag 15 <210> 12 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 12 accgccgacc cttt 14 <210> 13 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 13 gtaatattta gggattggg 19 <210> 14 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 14 ctccttataa caacaacttc 20 <210> 15 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 15 gagggtgggt ttggtaa 17 <210> 16 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 16 gatataaaaa caaccctcca 20 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 17 gggaagaaag ggggttttgt 20 <210> 18 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 tacgacgaaa actacgcgaa 20 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 19 aacatccgtt caaactaaca 20 <210> 20 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 20 ggttgtgcga agttgag 17 <210> 21 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 21 gttttaggag ttatttgggt ttgc 24 <210> 22 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 22 actataacac ctcgctacta acgct 25 <210> 23 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 23 tttttgaaag tttgagaaaa tgt 23 <210> 24 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 24 ccgacgcctc taccaa 16 <210> 25 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 25 ttgttggagy gttaggtttg g 21 <210> 26 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 26 ccraaaaaac cttaaactcc cc 22 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 27 ttatttcggg gaaggttacg 20 <210> 28 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 28 gcgaaaacga aatcataaaa taaac 25 <210> 29 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 29 cgagtcgagt ttgggt 16 <210> 30 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 30 acctccgaaa caaaatcta 19 <210> 31 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 31 tgttagagtt tattgggatg 20 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 32 gaaaaccgaa tctcaaacac 20 <210> 33 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 33 atacgggaga aagagtacgt ta 22 <210> 34 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 34 aacgtaaccg tacaacctaa acg 23 <210> 35 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 35 tagttttcgg agaagacggc 20 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 36 ctataaccct acgatcgcct 20 <210> 37 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 37 agggagttta atagcgatcg agt 23 <210> 38 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 tttactaaac accccgaaaa c 21 <210> 39 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 39 aggtcggttt ttatatggtg 20 <210> 40 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 40 tcgatataac tactccaaat c 21 <210> 41 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 41 gggagggggt agtagg 16 <210> 42 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 42 cgctcattta atttaaattt atttc 25 <210> 43 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 43 gggcgcgata gtttgag 17 <210> 44 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 44 cccgcgccct ttcc 14 <210> 45 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 45 ggggcgcggt tttttta 17 <210> 46 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 46 ctaaactacg ctaaattcct 20 <210> 47 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 47 agggatttag gttaggggtc 20 <210> 48 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 48 acgacatcct tcaaaccgac 20 <210> 49 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 49 aggttcgggt gaggag 16 <210> 50 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 50 aaacgtctat cccaaaactt 20 <210> 51 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 51 agttaaaagt aagggtagga 20 <210> 52 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 52 ccccgctaaa aattaacca 19 <210> 53 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 53 ggtcgggttg agattgg 17 <210> 54 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 54 ggtggggttg agattgg 17 <210> 55 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 gtgatggagg aggtttagta agtt 24 <210> 56 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 56 ccaataaaac ctactcctcc cttaa 25 <210> 57 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 57 gtcgattcgc gttttcgtcg 20 <210> 58 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 58 tcggtttttt cgcggcg 17 <210> 59 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 59 cgccccgtcg ccgaat 16 <210> 60 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 60 ttgttgcggt cgcggacg 18 <210> 61 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 61 agggcgtcgc gttttcggg 19 <210> 62 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 62 tttcgatttc gcgcgggg 18 <210> 63 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 63 tgcgccggag acgcg 15 <210> 64 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 64 cgcgttcgag ttaagagtcg cg 22 <210> 65 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 65 cgtcgggagg gtcgg 15 <210> 66 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 66 cgtcgtcgtt ttcggatttt gtacg 25 <210> 67 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 67 cggtggttcg taggggtcgc g 21 <210> 68 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 68 cgtagcgcgg cgggg 15 <210> 69 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 69 ttcgttattt gggtcgcggg 20 <210> 70 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 70 cgacgccgac cgcgccctcg 20 <210> 71 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 71 tcggacgcgt tttcggg 17 <210> 72 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 72 cgcgtagtta tcgttagacg gcg 23 <210> 73 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 73 tcgaaaagac gcgtggtttc gt 22 <210> 74 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 74 ggttacgcgg cgcgtgg 17 <210> 75 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 75 tcgtggtagc gttacgcga 19 <210> 76 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 76 agacgggcgt tttttgtgcg a 21 <210> 77 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 77 tcgttaatta gtatcgcgac ga 22 <210> 78 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 78 agtcggtcga ggttttcgt 19 <210> 79 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 79 tgttttgggc gcgttcga 18 <210> 80 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 80 cgcgttcggg gcgt 14 <210> 81 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 81 ttcgtttcgg ggcgggg 17 <210> 82 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 82 cgttttgtcg ttgtaggttt cgt 23 <210> 83 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 83 cgggggtttt aaatttacgt ttcg 24 <210> 84 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 84 cggtttttgt cggggtgcgg 20 <210> 85 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 85 accaccaccc aacacacaat aacaaacaca 30 <210> 86 <211> 7316 <212> DNA <213> Homo sapiens <400> 86 gcactgttct gcttttcact gttaatccaa cctgctccca aacatcaccc ctcctccgca 60 gagtgctgaa gatgaagaga gcccagcggc acaggggacc cagagcttgc ccttctgctg 120 actcagtagt gactccgctg cctgtcatga ctgatgtttc cagaagggtc agggcctcct 180 caacctacct cttccttatg cacctttgtt tgatgcaata gccctgggga ctctcacgat 240 tacgtttctt cttcatctat tgtctccact tttatttatt tatttatgta ttttttagac 300 tctatcaccc aggctggagt gcagcagcgc gatctcggct cactgcaacg tccgcctcct 360 gggttcaagt gattctcctg cctcagcctc ctgagtagct aggattacag gtatgtgcac 420 cacgcccagt taatttttgt atttttagta gagatggggt ttcaccatgt tggccaggct 480 ggtcttgaac tcctgacctc aggtgatcca cccacctcgg cccccaaatg tgctgggatt 540 acaggcatga gccaccgcgc ccggccctac tgtctccact tttaggagtt caaatccaca 600 acctgactca ctggaatgct cacaggagtt catgaactat ctgagctaca tggatagtct 660 gcatgagttc aaggccactg cagacaccat gtctcagaca ggcgtgtcat agtgtcaaag 720 ctcctgttag gcagcctgca gaacagccta ggccccgtga attatgtcac tagaacatca 780 acaattaatt ttgtccaatg acaaagtctg aaatgactga aaagggtagg actcaggtaa 840 gcctgaaaga atctctcatg cgataataac aatttcatca tgaataataa taatgaccat 900 gtattgaaca cttaaactta agtcatgcgt ctggcactat attaagcatt ttctttatat 960 tctgttattt aatctttaca ggaatcctga ggtcagcatc atcccaattt cacagagtat 1020 gacatgacgt ctcagagagg gtaagcagct tgccaaacat tccacagcca ggaagctgta 1080 ggaccagcct gtgctcctaa ggactggctc ctggctgcta tatatagaac taagcctggt 1140 ggaggtgtca gaaatagagg ttcacttctg tcatcaccga cctccctcca cacctttgca 1200 aaggaggaaa ctgagaggca gggatttccg cagagcaagg aacccaaatt gctgcctcct 1260 gtgatttata cactgcaccc caagctgtag gggtaaccca aggacaaagc tgtaacccaa 1320 gcgggaacat atgccccatc tggggccacc aaaatcttac cagcttcctc agctggtgga 1380 tcggttaatt cacggccaca gccccctgga gctgggggaa aggaaaacca gggcgtctcc 1440 gcaaaccagc ccagagagag gtctgcggaa gggcccggaa gcctgcaggc ccctctgcac 1500 ccccaacccc accgccatcc tggacctcca agatgacctg gtccaacaga gtcctgcatg 1560 gaaaagactg gaacccaggg aggagcagag ccccgcccaa ggtcaccggc cgagcctgaa 1620 tagaacccgg ttctccagga gccctgtctt tagctgtctt gtccaaataa aatttttcag 1680 gccatcagat ttccgtactc cctggagtgg gacttcatct gggaccaaag gagggctggt 1740 gaggggagtg gcaggaggga ggagtgcctc ggggccccga gcaggatgag cctgaggaag 1800 agacgggtcc ccatgttccc tttcccgctc agataatgga ggtgaattga ggggagcaga 1860 gacctcccca ccttcagggt gggaccctga gggaccagga cacctttgct aggggatgtc 1920 cctcctcact cctgcacaag ttcctcaagg acaccctcgg gctccgaaaa cggggggagg 1980 gggacgacgc cccagaggcc cctgagcccc tggttcttcc cgaccctaag ggcttttctc 2040 cctcggttcc caggcggcga cggcgggtag cgcgaagcag caggcgcagg ggcgctggga 2100 tggggatgtc tctgcaggtc taaggttccc cttgggagtc taaacaaaga ctacggcagc 2160 gccgtcccct cccccgggaa cccgacgccg cgcggccaca gggggcctgg aggggcgggc 2220 agggcctcgc agcgcaccca gcacagtccg cgcggcggag cgggtgagaa gtcggcgggg 2280 gcgcggatcg accggggtgt cccccaggct ccgcgtcgcg gtccccgctc gccctcccgc 2340 ccgcccaccg ggcaccccag ccgcgcagaa ggcggaagcc acgcgcgagg gaccgcggtc 2400 cgtccgggac tagccccagg cccggcaccg ccccgcgggc cgagcgccca cacccgccaa 2460 acccacgcgg gcacgccccc gcggcgcacc gcccccagcc cggcctccgc ccctgcagcc 2520 gcgggcacgc ggaggggctc ctggctgccc gcacctgcac ccgcgcgtcg gcggcgccga 2580 agccccgctc cccgcctgcg cgtctgtctc gtccgcatct ccgcggtgag tcggcggcgc 2640 cctcgcccct gagcccaggg ccagcttctc tcgccgccgc ggctgctgcg cgcgtccccg 2700 cccagcccag cccagccccg agcacgaccc cagccccacg cacgacccta gccccgcgag 2760 tcccgcaccg actcgctccc gccccatttc gcctccgcgg gggcggcgcc ccctcctccc 2820 cgcggctccc gctctccttc ctcgccttcc cggccgcgct ggggaccccc agccgccgtc 2880 cgcgaccccc caccgcgacg cccggaggcg gcggggtctc tttgttcggg cggcgggcac 2940 gggggaccac ctcccacggt gtcaccgcac ccaccccgcg cccttcctcc gcctcctgga 3000 gttcaccggg accaggtggc ggcgggtgcc tttttggggg tgcgcggcca tgcaattggt 3060 ggattttttt aaaccgtttt ggagggggga gcgcggcgtt gggggcggga gagcgctcct 3120 ggctgtgagc tgctcctgcc gcttcgctcc gcgctctcct gccgctccgc tccgggtctc 3180 ccgcgctcct ctccccggct cggccgagcg cgctgccccg acgccgccac ccagagccgg 3240 gccgcgccgg gcgccgagat gaaggtgctg ggacaccggc tggagctgct cacaggtacc 3300 gcccgcctgc cccgcagccg gccgccactt tccgagttgg agcggactcc gggcgcggcg 3360 gccggggact ggggcggctc gggtctgagc aggaaggggt gcggacccca actaagtcct 3420 agttttgtgc tacctgtttg tgtgcggagc ccagccccgg gagaggactt gaggttgtgg 3480 cgagtccctg gcgctggcgt ccgggctgcg ggagcaccgg tcagggggtg gccccatggg 3540 gtctctgacc agcggagctc ggattaggac cctgaaagct agctcagggc tcctgccctc 3600 caatcagtgt cgcttgtccc ctaagaaagg acccgtgggc ttctggcagg acccgcgcca 3660 tggacctctt atttctgcgc cctgtgacaa tctgagccgt ctttctctgg gggagaagtt 3720 tcttgctggg agtggaggcg acgccaagtg gcctgggaag tgggaagcca gattggaccc 3780 tactgactgg ggaccctcag ccttggggct cctctggaga agtgatcagt tgccctgctg 3840 gaaactcaca tccagggggc agtggctgga gagcaagagc gaacggtcag gaagaggagg 3900 tgggaaaggg agcagggacg ggggggagga ttcgaggagt gacttctgtg ttctccccgg 3960 tgtggagaga cccagacagg aggaaaggaa agcaacccgg tttcctccag ctctgggact 4020 tataggtgct ccatccgtgt atgtcagatg agcacagatt ccagtaagtg tcctccgaca 4080 cctgggggag ggggctgatc actgccttcc aggaccttaa tgtccgatga gggagcagag 4140 ccccggagcc ctgttacaag gctggaaggg gcagccgtct gtgggtgcgc tcaggaaacg 4200 gtggaatccg agtcgggggc agcttttgaa gacctcgaaa aacaattttt gttaatgaag 4260 aaggaggtgg cattatgggt tcaggatcaa gggaatggcc catgctctgg ggtgtgagag 4320 aggcttgttc ggggagaggt atggaggctg aatggcctgg aatgtgcgtg tgtgttgcgg 4380 gggagggggc tagaaggtgg gggtggggta cgttgggtga ggttttatta aatcggcagt 4440 agcaggccag gcgcagtggc tcatgcctgt aatcccagca ctttgtgagg ctgaggccag 4500 aggatcgctt aaggccagga gttcaagacc agcctgggta acatagcgag accccatctt 4560 tacaaaaaaa taaataaata aatcagcaat agctcgtgac agacttgtag agaaggaaag 4620 gtggaagctg ttcctgggac actggaaact gactgggtgc tcagaagttc cagcgctgag 4680 cccagttagc cacggggctg gcaccccctc caatcccttg ccaacttttt ctttgtggag 4740 ctcacttgag gcaggcccag ctcacccaac ttggaaggga accgcgcagg ccactgaact 4800 tgttaacccc ctggagggaa ggcttgcggt tccatgggtg ttttgtttgt ttgttttgtt 4860 ttgagatgga gtcccactct gtcgcccagg ctggagtgca gtggcacagt ctcggctccc 4920 tgcagcgtcc gtctcccagg atcaagggat tctcgtgcct cagcttctca agtagctggg 4980 attacaggca cgcgccacca tgcatgccta atttttgtat tcttagtaga gatgggtttc 5040 gccatgttgg ccaggctggt ctcgaacttc tgacctcaag tgatccacct gcccctgcct 5100 cctaaagtgc tgggattaca ggcgtgagcc accgcaccca gcccccacca tgggttttta 5160 gagctctgca tggtgaacag atctcctggt tcctctcttc cccaactctt cctgccccca 5220 aagggcctgg atgagaaatg ctcacaggag acatgtgtgg ggggctcaag caggggtcta 5280 ggctttggag accccatgca ctgttctctc atctcctgga tagaggagtc aggacccctc 5340 ttcccccacc agatggggtc accagattct ggcgggcttt ctaagtccct ggccagggtg 5400 gatgaggccc ctctcagtta ctgtcatcag tcacaggctc cgcccccatt gtacctgcaa 5460 cctggccctg ggagacaacc catcccctct gttgctattt tgtggtcttc acagacttcc 5520 ctctctgtcc tcttcctttt ctcacagatc gggattctaa ctccaacccc atcagtagcc 5580 agctgtgtga cttcagacag gttgcttaac ctctcagact tcagccctct catcttaaag 5640 atggaactgt tggcccctgt ctctaagaga tggtgtaagg cttgctgaga tagtgtaggc 5700 gacacacgtg gttgggacct agaccctggt gggcacctct tgggccccac ctgtcctggc 5760 tggttggcac ctagagcatt tggatctgcc cccaccctcc tttatccctg ctttcctgcg 5820 tctgtgagat ttgacccatc tcccccattg gataacaagc aggtcacagt ccgggaggtg 5880 gccactttat tgtggtggca cacagcaaat gctcaagggt tgctgactga ggctaggctc 5940 acacagccca ctcggcatct acgtctctag gataattctg tagaggcctc taactccctg 6000 ccccgacatc agccttagga aatttttact gaattttaaa aactcatatt gaaggctggg 6060 cacagtggct cacacctgta attccagcac tttgggaggc caaggcaggc agatcactga 6120 ggtcaggagt tcaagaccag cctggccaac gtggtgaaac ccccatctct actaaaaata 6180 caaaatcagc tgggtgtggt ggcgcacgcc tgtagtccca gctacttggg aggctaaggc 6240 aggagaatca cttggacctg ggagagggag gttgcagtgg gccaagattg caccactgca 6300 gtccagccta cgcaacagag caagactctg tctcaaaaaa aaaaaattga tttagttctg 6360 tatacttttc acattctcct attttattat cttgcctgtc ttgccagtga agtcagtgac 6420 ttcctcatgt tcctatttct cagaagaggc agcactggat tcagaaccca gccctgagcc 6480 gggagttgtc ccatatggca ttctaactgc ctggctttgg gacagtctaa tagccgttcc 6540 acacttcatt ttcctcatct gtaaaatggg atcgtcgtgg tgcctacctg gctgggatct 6600 ttggagatta ggtgtgtgag cgtgtgcaag acgtcgagtg cagcttctgg cgggcggata 6660 gttgatgaca gtcgtggagc tggcgtcctc aggccgcctc ccgagtgcac tccatcactg 6720 tgctgggggc tccttctcct cccactgtgc tccagtttcc agattccctc cccgcagggt 6780 gttccagttc cttcgttggg ttctcacaac agtccaggcc tctctgagct gtgtctctgg 6840 gggaccctac ttaggtctca ggttcctgtg agtcaggcat ggcctcaggg ggtggggccc 6900 ttccagccag acacccacag ctctgacatc atggggaagg ccaggtgccc cctcacatgt 6960 gggactagaa ggagacccat gggttgtcat gcccagatcc agcatgtctt tttgttctgg 7020 agagaagagg aggctgttgg ggtccttctg gaggctttgt aaatcatgaa tgcttgtcga 7080 ggccatttcc aggcgcctca gcggggtctt gctgcaacag ggacaaggaa ggcgggggtt 7140 ttggaatcag aggatgtgaa tttcggggtc tcccctgtgc ttctcagctc ctgggcaaat 7200 tgttaccttc tttcggcctc agtcttatca gtaaaatggg aataatagcc ctcattaaca 7260 gtgttaggcc agagcagttg tctcacgcct gtaatcccag tactttggga ggccca 7316 <210> 87 <211> 1587 <212> DNA <213> Homo sapiens <400> 87 ggatgggttg tagataagag cagttgagaa ccacgcttca tctccctcct tagaaactct 60 gaaacgaggc tttattccta ccagaagttc agattgcatt atggtcatct caattccaaa 120 atgttagatg gcaagaatat ctgcccatcc ttcactttcc ttggaaaaag ttgctcttcg 180 ggttttatat gcgattgcag ttttccagtg tgtgaaacta ggaaaacaaa acactcaacg 240 gtgtacatcc ctacacctaa atagtcagaa ataataggca gctaggctaa ttatccttga 300 ttagcaagat cagagccatt agggtgctca ctggtttaac aaatgaatgc ccttaggcgt 360 ctatcatttg taactcctag aagctttaat ttccacaaga aacaaaataa gaggggcctt 420 ctgcttttaa cagtgaaaag atcgttctcc ctcccctctc cacccgggtc aactcttcca 480 gccgctccct cctgcatcac gaacacacgc tgcaggaaag cgcatttaca gcccgggaca 540 tccccagacc tcctctccaa aattccccac ctcctgtgca taggagaaac tgagagaagc 600 cctcacttcc tttccaaact tcacaagcag gggagggagc tgtagcagac tttcacctcc 660 gttcccaaaa gcgaatgtga aaaagtccga gaaggcacgt cctgcgagtg gaggttaaac 720 cgaaatctga acagaatgca cggtccccgc aaactacgat tgataaagaa gatactgaga 780 cgtttgcggg ggatataagc catggttgtc tcgccttcct cccctccctg ccaactatgt 840 ttcttggaga aatcgccggt tcgattcacg cacacatttt tgtaaaacac ggacaaaacc 900 ataagtagtt accttcattg ttccgtcggc cacgagggaa gctcgagctg agcggagggc 960 agatcccaag ggtcgtagcc cctggccgtg tggaccgggt ctgcggctgc agagcgcggt 1020 cccggctgca gcaagacctg gggcagtgcc cgaggcggcg gcgagtacac gtggcgggct 1080 ggattgcaga ccggccctct cgcggcggag actcgcgacc tagcggattg catcagcagg 1140 aagacactaa ggctgctccc ccaggccgcc cccagatggt ggagtctctc ccagcccgaa 1200 gattcggagc cagcgcccag acccgagcct cactcactgc tcactcccgg ggtgcagggc 1260 agaggtgcca gtgttgcaag caaatgacac ggttaccccc gaatcagcca ctgtgggtgc 1320 gtatccgagt gtggggatgc ccgtgtaaca tttatatgga gacgtcaagg aggaggaaat 1380 aaacagatca gaggtcaaat gtgattgcca ttccgtcatc actggctcct gcccacctcc 1440 ctactgtccc caaagtaact ttgctgcatg ctgagaggac cacggcacaa tcctgcccaa 1500 aagtatacat gtatcccccg cggctacttt aaatgtactt ttgcagtagt caagaacatg 1560 tgcctggttt gccgatctct ttcccag 1587 <210> 88 <211> 3381 <212> DNA <213> Homo sapiens <400> 88 ggtaaatcaa tggacctttc actaccttcc ccttctctgg gctgtagcag tgagttaact 60 ggctcagact tgcccagcgg aatgcccttc aggacacact gagtactgta gtaagagctg 120 catatgcgct cagggagaat gtggatagac gctgtttgtg attcacgggt aaagggcctt 180 ctcccagagg cagcagaggc agatcctgtc tctggtgtgc cctggccccc gacttggagg 240 cctcctgggc caggccaaga ccttccccgg cagcgatggt ctccagccac actcaactgc 300 cctgaaggga catttcctgc ttattccctt gcccggctgt gtcctccacc cggaaggcct 360 gtgccttctt cgcctgcatg tcctaccctg aggaggctcc cttggtcttt catcgctctc 420 cctatgggtc ttcacgcctt cccgaaccac cgcgcccaag caggagcacg ttctcggccc 480 tcttcacagg gcgctcctcc tcacaggggt gcccgggatt tttattctgt gccttcctgg 540 tggctcctac aagtctggaa gggcaggagg cgcatctcac tcctctgggt cccctcccct 600 agcgcctggc gggagcccag gctgcatttg tggaattcat gactttttct ctcctgctca 660 agctgaacac attgctggct cctgctcggg tggagcccgg ctaattagag tgaggggctc 720 cccgtagggc gaaggggtgc gctgtcagat gtggcattcc cgttttacgg agacacacgg 780 tgtcttacac gccagggaga ggtctgagac gcaaagagcc gtcgagcggg ctgcgggatt 840 gcttcgctgt cacctccgcc tgcagccacc cttccgcacg cacttgtgtg tgcacccagg 900 ccaacatgga aggcgccatc ctaacttctg ccgtgagcag gtgggaggga agagagacga 960 gaggtattcc attggttgtc tgggaaaatg aattgcacct tcccctccct tgcggaggat 1020 caacttttcc caccccctcg ggtgggcact cgcatcctgg ggccggagcc tgaacccggg 1080 agccaagggg ccccagttcc agggacgtga agctgagcgt acagcgggcg ctcccagaca 1140 ctggggaaag tgctttacga tgtcccgagt ccctccagtc tcgccagcgg ggcgagcgtg 1200 agggtgcccc gaccgaccag cggccccggg tgcagggtgg cgggcccggc ggcgcgcgtc 1260 cccctccccc tcctggcggc ccgcacgtgt cgcccgcgcc gcgcccccac gggttacgcg 1320 cgggtcccgc agcgccgcgg ccgagccggg ctgcccggcc cgcggacaca gcgccggccg 1380 ccgcatcccg tgcggggccg cggcgcgatg ctgcgctgga atgaggaagc gcggcggcga 1440 ggggagggcc cgggcgcggt gcgcgcgggg gtggcggcgg cgcgccgagc gggcccggcg 1500 cgggcgagcg ggctgcagcc ggcggcggcg ccagcaggta cggcccgcac ccgccgccgc 1560 cccggcggcc tttgggggct gagccggagc ccggcgcgat tgcaaagttt tcgtgcgcgg 1620 cccctctggc ccggagttgc ggctgagacg cgcgccgcgc gagccggggg actcggcgac 1680 ggggcgggga cgggacgacg caccctctcc gtgtcccgct ctgcgccctt ctgcgcgccc 1740 cgctccctgt accggagcag cgatccggga ggcggccgag aggtgcgcgc ggggccgagc 1800 cggctgcggg gcaggtcgag cagggaccgc cagcgtgcgt caccccaaag tttgcggggt 1860 ggcagggcgc gcgctctggc cacccgccgc tctgggcggc agctggtggc aacgcaaggg 1920 cgcggcgggg gcggccggcg cggagggggc caggtacggg gcccgcgggc ggcgctgtgc 1980 gcgcggggca gccggtcggc cgggagcgcg aaagcctggt ctgagccggc tgggggcggg 2040 gagtgtggcg gagaaatggg gaacaatgcg agtgagcaac ttcaggaagt cattgtgaaa 2100 gaaagctggg aagagctccg cggccaagtt agcaggacac tctaacaagt gactgcgcgg 2160 cccgcgcccg gggcggtgac tgcggcaagc cccctgggtc cccgcgcggc gcatcccagc 2220 ctgggcggga cgctcggccg cggcgaggcg ggcaagcctg gcagggcaga gggagccccg 2280 gctccgaggt tgctcttcgc acccgaggat cagtcttggc cccaaagcgc gacgcacaaa 2340 tccacgtgag tgttttcaaa ttgaatttca ataggaaaac ttggggtaac tggtgaattt 2400 aaaaaaaaaa aaacacagta aagaaaagcg gtaaggttgg tagaccctgg tgtcgctcag 2460 gtccgcctct cttttctgag gacagtgaga gagttcactt ctgtcaagcg tctgttgctc 2520 tgcactgtgc cagcaggtgc aggaccaggc cgacatggga cacttctgag cagccccgct 2580 gtcaccagga gaggagttct agctcccaac catatttaaa tttatgtaga cctacatata 2640 cccacggaag tcagccttta taaagtcgtg tgtaaagagt tttccttata tttgagccgg 2700 gagctttctt tttatactat aaatatgatg agatcgagtc tgaacttaat ttctgcaaga 2760 gaggaattat cccggctttg aaaagttagt ccttttgctg accgcaggtt tgacgctcaa 2820 gtcaccaaac cttctcagga aaacccttag taatattaag gcatcaggtt acttgcggtt 2880 atatttgaaa tgtattttaa atatttgtca agcatcgctg ctgatgccta aggaacctcg 2940 tgagggcttg tttttccttc taatttggag gcatctaatg accgaaaacc gtagcgattc 3000 catagggtct gaccaggcac agctttcaaa tgcagcttcc ctctctctag ggactgcagc 3060 ccacccagac tgaatttcaa tgcggtgcgc tttgcttagg ttacccactc acaatttccc 3120 actgcgccgc aggcagtata tttcagcttt gagatacctt gttttaaaat tccagacaaa 3180 atggtgttga ggaaatgtct ccttactagt cccatcaact tctgttaaaa gaggaaaatt 3240 tatggaattt gaaaatactg cgtatgatat ttaaactttc atagacattc aaatgctttt 3300 aaggccaggt tcaatttggt tatgagtcga ggggtggggg ggacccacat agaaatgtcc 3360 tgggtcctct tgagtttatt t 3381 <210> 89 <211> 7398 <212> DNA <213> Homo sapiens <400> 89 ctggagccgg tgggctctga gcacagtcac gaaggcatgc gcactttctg gctgctctcc 60 tgccattgtc ccttgggttc ccattttggt gaggcgtgca ccctggcggc gctccccagg 120 gaactaaata tgtttgctgc actgtgcgtg gagatggaga atgtacaatt ggctgaccct 180 gtgctaatct ggtggaactc catgccagcc ctgggaaaga acaattgcat gggtgtgtcc 240 acactcacca ggtgcttttt agaaaaacac tcgagaataa tgctgtggct taggatggct 300 gttgtgccgg acccggcatc ttcccagggg ggctgtgttg ttgggctgag tttcttaggt 360 actggacccc caaatcccca aatacggcgt ggacaggtgg cccagtaggg gctggactat 420 ccgataggcc caggtgctgg agttcagaca agacataccc tggcctggcg tggaagatac 480 ggggtgctat taatggcagc aatggctgca tttctgaaac ccgggctccc aggccgacga 540 gggtgtgcac gcatctgaaa tgtctgtggt tttgcagttc ccatgtccac aaactcactt 600 ggttgaaaat agttcaaaat atccaaagca tgagggaggg agtgcctgct tttcttaaaa 660 aggaaggact tgatttcatc tacttaaaaa gccacccaaa cctagaacat tttccgcaag 720 agaccccctg ccccccgcct ctccagaatg gctggagagt ctcagcactc ctgcacattt 780 gggatatttc agagggggtg gggaggggca agtgggcagc gagcgacctc agacccagga 840 tgagctgtca ggcgctcccc ggccacacat tcaagggacc ggagtgcagt tgtagcgttg 900 cggcctgctg cttcgggggt gggggtgttg ttccatgctg tgaattctca catggcccct 960 gactctgggc agaggccgag ggtctaaggg acggggtgac agggagagca tgcaggagtg 1020 ggtttctggc tttccagggc gagtggaaga agcgcctctc tctcttgtag gtgacagacc 1080 tggggggccc ttcttgagga tgagagcctg ttgcttctca agttctgtgt ctaacccagg 1140 tccccaggtc taccccagcc cctcggccct gcctgccttg tggatgatat agtttaaggg 1200 tagagaccgc tggcctggag ggaaggctag gcctcaggtt agggcccaga agggagggag 1260 aagcccttgg ggcagctccc tttctgctca ctcactgcct agctccttcc ttcacacctt 1320 ccttcggaaa cgtctgctcc tgacaaggtc tacttcctgc tctcaggagg cccttattgt 1380 ggaggaaggg aggcgtcgcc cgtccctggc ttctctgaca gccgtgttcc atccccgccc 1440 tgtgcccctt ctcccggaca gtgccttctc cagggctcac ccaggagggt gcagcggtgg 1500 cccccggggc ggtggtcgtg gtgggggtgt tagctgcagg ggtgccctcg gtgggtggga 1560 gttggtggcc tctcgctggt gccatgggac tcgcatgttc gccctgcgcc cctcggctct 1620 tgagcccaca ggccgggatc ctgcctgcca gccgcgtgcg ctgccgttta acccttgcag 1680 gcgcagagcg cgcggcggcg gtgacagaga actttgtttg gctgcccaaa tacagcctcc 1740 tgcagaagga ccctgcgccc ggggaagggg aggaatctct tcccctctgg gcgcccgccc 1800 tcctcgccat ggcccggcct ccacatccgc ccacatctgg ccgcagcggg gcgcccgggg 1860 ggaggggctg aggccgcgtc tctcgccgtc ccctgggcgc gggccaggcg gggaggaggg 1920 gggcgctccg gtcgtgtgcc caggactgtc ccccagcggc cactcgggcc ccagcccccc 1980 aggcctggcc ttgacaggcg ggcggagcag ccagtgcgag acagggaggc cggtgcgggt 2040 gcgggaacct gatccgcccg ggaggcgggg gcggggcggg ggcgcagcgc gcggggaggg 2100 gccggcgccc gccttcctcc cccattcatt cagctgagcc agggggccta ggggctcctc 2160 cggcggctag ctctgcactg caggagcgcg ggcgcggcgc cccagccagc gcgcagggcc 2220 cgggccccgc cgggggcgct tcctcgccgc tgccctccgc gcgacccgct gcccaccagc 2280 catcatgtcg gaccccgcgg tcaacgcgca gctggatggg atcatttcgg acttcgaagg 2340 tgggtgctgg gctggctgct gcggccgcgg acgtgctgga gaggaccctg cgggtgggcc 2400 tggcgcggga cgggggtgcg ctgaggggag acgggagtgc gctgagggga gacgggaccc 2460 ctaatccagg cgccctcccg ctgagagcgc cgcgcgcccc cggccccgtg cccgcgccgc 2520 ctacgtgggg gaccctgtta ggggcacccg cgtagaccct gcgcgccctc acaggaccct 2580 gtgctcgttc tgcgcactgc cgcctgggtt tccttccttt tattgttgtt tgtgtttgcc 2640 aagcgacagc gacctcctcg agggctcgcg aggctgcctc ggaactctcc aggacgcaca 2700 gtttcactct gggaaatcca tcggtcccct ccctttggct ctccccggcg gctctcgggc 2760 cccgcttgga cccggcaacg ggatagggag gtcgttcctc acctccgact gagtggacag 2820 ccgcgtcctg ctcgggtgga cagccctccc ctcccccacg ccagtttcgg ggccgccaag 2880 ttgtgcagcc cgtgggccgg gagcaccgaa cggacacagc ccaggtcgtg gcagggtcta 2940 gagtgggatg tcccatggcc cccatccagg cctggggata tcctcatccg cctcccagaa 3000 tcgggccgtg ggggacagaa ggggcctgcg tgcgggcagg gagagtattt tggctctctc 3060 ctgtcttcgg ggtttacaaa gtgtgttggg acttgcgggg ctgctctgtc caagcctggg 3120 tctggcgtcc gcgtctctga gcctgtgagt gcgtgcgctt tcctgcgtcc tcttgactgc 3180 cggtgctggg gctctgcgtc ctgcgtccgc gggagtaaat acagcaggcg aaggggaagc 3240 tcacacaatg gtctccagcg ctctggggca gggcttctga ggggcgggcc tgcctctgcc 3300 gggacctgga gcccccgccc ctcggagagg ctcctaggct gacttgggca gagccctctg 3360 gtgggccggg agggggaaag gctgtgttga aatgagcaaa ctgtccaggt gtcaggccaa 3420 gctgggaggt gaccagcctg aggtcctccc cgctccatgg ccagaaccag ggctgacatc 3480 tgggtgtcct gagcccagct gcccacacgg cccacctggg gtcagcccta tctgagtggg 3540 ggaggcgggg cctcctgggg gaccagaact ttggctggac gccaagcaga gtgccagtgg 3600 ctgttcttca gggctgggcc tgaggagggt gtggggcggc gaagggacgg gagggggttg 3660 tgatccagtg gccactggcg ctgtgcagag tgtgagctgg aaacatcgta gttactttgt 3720 cagcttagtg gtgaaagccc tttttcaggc tctatccctt tgcatccctg cttcccagag 3780 ggaggggagg tctgggtctg cagagctggg agggcttgct gttcccgccc ccctccccca 3840 caacacctcc tcatctggac atctttgggc acatgctcat actggggtct ccctaggtcc 3900 actgtgttcc gttgagcctc ctgcagtccc cgagtgaatg tgacctccct gcccctgcct 3960 ctttgcaact cctccctgcg accgctcctc caggggcctt ccttgtccca aatgtccaag 4020 tggcacgact tagccggtct gaccactttc cagtaagccc ttatggagag aggccctgtg 4080 ttgtgcagag ctctcctcct gcctgcggga tcgaggtctc tgctctcagt tcctaacaga 4140 aagtgtcggg cccccagtgg gatttctggg gaagaactct cgtgtctcaa cgggagccct 4200 gtggcgggag gggaggccag ggtttggggt tgtgttcgtt gtacagctgt caccatttgc 4260 actatgaaag ttgttagtgc cccttccttg ggtctctggg tgtaactcca cccttgcccc 4320 catgtgcctc catctggagc tgcttctgcg gctgtctccc aagccagttt tgtgaccctg 4380 taatttagtc caagacaatg ggctcattga gaccatcctg gtgcagcagt tggcaatcct 4440 ttggctctgg gggaaggttt ctcagtctcg gggagtgggg cctcaatctg ctggttccct 4500 gtgtttatca gtctccccct tgtgtgtcct gaatggtttt gctgggaatt ctggtcttag 4560 agccatcagg tggcccgagt cgataggcgt gagagagtgt gtgtgtgcat gagtgcgcat 4620 gtgcatgggg gctgacctgg ggtatggaaa ggtggccctc cctggtgccc aaggagcctg 4680 gagtatagtt ggagggtgtg ggggtgtgta tatgggagtt ggacaacctt gggtggacag 4740 acagacgtgg ggaagggatg attgaaggag gtggaggaga gagtgtgatt cagcccagcc 4800 aggggtgatg tggacaggca gcttccgaat cagggtagag aaaagtcacc actagctagc 4860 aggggagaag tcagtatgga ggaggcggac cttgagggag agtaggaatt ggattgcaag 4920 aggaaggaga gccttctggc cagcagcagc cagcagcagt gggggaggct ggaatgagct 4980 ggctggagag ggggctgggg cataaggagg ggcctgcctg tgaagatcat atgggccagg 5040 ctgcggaggg ccaggcatgc ccgccgggag tgcagctggt ccacgggaag catctggagt 5100 ggctgggaat gggcgcagga gcagcgccgt gggagcacag gtctctttcc cggggcggct 5160 cacctggtgt cttggttcct gcaaggtagg ccgaaagggt ggggaggaaa ctgccagctc 5220 cttacagcgc tgggatggtg gccccagggt tcctgaggcc agcggatgtg ggtgcctgtc 5280 accatgtggg ttgctgaggg gcggagactc caggggccac cccaaagcag gacgagctct 5340 gagccacggc atctctgggg gcagttttcc aatcgagcag acgtctaggc ctggaatcct 5400 gtaacagagg ccacagggcc ctgatcaggg tgttctggga ggcttagaac tagtggcagt 5460 atacagggta gacggcaagt gacctggcat ggggaaagag gcaggtgccc aggccggcac 5520 agcacacccg taaggaacag gtagacggga agccgtccgt gggcctgtgt gtgtgctcgg 5580 agttaaaatt ctgccaatgt cccatgtcct gggcacatct accccctccc tggggagcac 5640 ctttctcttc accttttcct tccccgcctg tccccttcac ccagggcctt ccccatccct 5700 cccgtcttgg ggaccgaggg caccatggct ttatgttcca tcaccgatga gttgcacagg 5760 gattcagtcc ttccgctgtt caggccgggt ccttcaggct cagggttccc aggaatggag 5820 agggtatcag tgtcttccat ggactcaaac ttcccgcatc ccgcctttgc tcccccttca 5880 agataggtct ccgagcttca aggttttagg gctctgtgga ggccgccacg tagcagcaag 5940 gagaatgttt tgtatttggc tgatgagatt tttagagtct cattttctac ttttccactg 6000 tacaaacggg cctccaggcg actgcagcac ccgccactgc ccgtaatagg gtgacaagag 6060 ggatgaccct ttcctctttc tcccttctgg ttggtggagg cacggggctg gcggacggca 6120 tgtgctttcg tgaattcagg ccaaatctgt tatcgcaaac acgattacaa ctcgggtctt 6180 tgtgtaacaa aagcctttcc aagtaccagc tgttggcctg ctttgctcag cggtgtttgc 6240 tgtaaccaga tttgcacacc gagaaagaat ccaaaagtcc ttgatgtttg ttgaaacaat 6300 ctggcccagg acccacgtgc tcagatccca gagctgtgtg gcatctgagc ttctcccgag 6360 cccccactgt cgcccgagga ggacccccag atctgtgttc tggaggcaga gcaggctgtg 6420 ggacgggctt ctgggtggga aggaccatgt ggatatgcct tcttgtctga gagtcccaac 6480 acctccggga cgtgggagct ggcgcgctgg caggattcag gtgcctcttt cctctctaga 6540 gaaaaaggcc ccgttgcttg gtaataggtg cagacctgtc cctaattaat gccagtaggc 6600 ctcttgcgtg atgaaccctg cctttcagcc aagactcaag gcatcctgtg aatactgcct 6660 ctctgcagtt tgagcttttg tggtgggagg caggagccat ggggagtggg ggcaggcctc 6720 ttacacgggt cccacagcca ctggcagcac tgacttgatg ctctttgagt tcagagccca 6780 gggccagaca gacccactgt cccgactacg agttggttca tttagagggg ggcggacaca 6840 gcacccaggc agcagatgca ctgtgatcag ccttgcagcg gggctgtggg ttctctgggc 6900 tggatgtccg ggaagaggca ggtggaggta aacgccagga cacccctgca gtgactgggt 6960 gactgcaggc tggaaatgct ttctgtgggc tgtggctgtc caggaaggtt ttgaatgggg 7020 ctagtggaca gagtttgcat ccagaggggc agtgctttgg aggagtgagg ggtatggcag 7080 tgtagggatg cccaggccgc cctcactctg ccattggaaa gctgggcggc ttcggtttct 7140 tcagtttctt cgcctgtttc cctgcctgca aagtggggtt agaaacagct ctctttgagg 7200 gttgctgggg gactctgaga tgcagcccat ggcgctgagc acgggtcctg cctcctacgg 7260 gtgtggtggg tgtcgcggct ggtgtggcat ctgggcggga aaagggggca tttgcaaagg 7320 acaggtaggt ttggatgctt aaatatgcag atctggggat gggaggtctc aggcaagggc 7380 ctgtgtgatg ccactgta 7398 <210> 90 <211> 2396 <212> DNA <213> Homo sapiens <400> 90 gaacacttca cattgcttga aagcatctta cacttttttt ttccctcaac tcacaaagca 60 gtttctttct actggtcgaa ttctcaaggc agaaaagcta catacgtctc tcgtttcttc 120 actaattgtt ctctagaaaa gggaaagtga agaagggaaa gagaaaagac aacggggaag 180 aaaagagcat agaggagaga ggaaaagtgg ggagagaaag gaagaaaagg actgagaaaa 240 cgcaggagcc ctggcttgcc ggtgagcaga gccggcgcag ccacagcgcg gagccgcggc 300 gcccactggt cctcggagct gccaatcggc gtgtaatcct gtaggaattt ctcccgggtt 360 tatctgggag tcacactgcc gcctcctctc cccagtcgcc caggggagcc cggagaagca 420 ggctcaggag ggagggagcc agaggaaaag aagaggagga gaaggaggag gacccgggga 480 gggaggcgcg gcgcgggagg aggaggggcg cagccgcgga gccagtggcc ccgcttggac 540 gcgctgctct ccagataccc ccggagctcc agccgcgcgg atcgcgcgct cccgccgctc 600 tgcccctaaa cttctgccgt agctcccttt caagccagcg aatttattcc ttaaaaccag 660 aaactgaacc tcggcacggg aaaggagtcc gcggaggagc aaaaccacag cagagcaaga 720 agagcttcag agagcagcct tcccggagca ccaactccgt gtcgggagtg cagaaaccaa 780 caagtgagag ggcgccgcgt tcccggggcg cagctgcggg cggcgggagc aggcgcagga 840 ggaggaagcg agcgcccccg agccccgagc ccgagtcccc gagcctgagc cgcaatcgct 900 gcggtactct gctccggatt cgtgtgcgcg ggctgcgccg agcgctgggc aggaggcttc 960 gttttgccct ggttgcaagc agcggctggg agcagccggt ccctggggaa tatgcggcgc 1020 gcgtggatcc tgctcacctt gggcttggtg gcctgcgtgt cggcggagtc ggtgagtggg 1080 ccaggcggag gatgcgcgcg ccgtttaggg tgtttgaagc tacgagagga gcccgcaggg 1140 aataggggag cgccacctgg ggaaccccca gtccccaagt atacaccgga gatccgctgg 1200 gacaaatgcg ctcgtccggt caccctttcc ccctcttccc ttcctcagaa aagcgctgct 1260 cgctggcgtt accccgcggt ccgcgggaat gggggcaccg agaattgcgg tttggtctag 1320 ccgcagaggc ccctgaagtc actcccaact tcttcgccct cggcgggtct tgctgcgtgg 1380 tctgggaagg acggagggga aagggtggca ggagggggga gcctgggtcg ggcccgcgag 1440 ggaacggctc cactccgcgc gctcctcgag accagggatg acctggaaac ttcggggtcc 1500 cttcctccgc acaccatccc ccccgcgcca gctttcctgt ttgactgcat gcaagttctg 1560 gggagatggg ggccagattt aagagacccg cgagtgtcca gagagaaaag tttgcaaaag 1620 ttcttttgtt tgatgctccc tgcggctagg gcgaggtaac cgacactacg tggaatcgca 1680 gtaggcgatc cctcaagggg atactggggg aggcacggaa cgcgtccgaa aatgctggga 1740 cgccggccac tggattccca gtcctgcggc gaccccctcc tcgttgaggg gtggaggttg 1800 caccgcgggg cgtcagggac gggaggacat tttcatagga gttacacggg agtgccgcaa 1860 gcagggcgag gcggggtacg tgtgacacgg cgctcggctt cgggtcgcct ggccgctggg 1920 ggacagaggc ttccctcccg ccacgctcgc cctctctggc cctggcgggg cgcttctggg 1980 gccgggagga gtctcgtctc cggcggagcg cctgccggca cccagcttcc ctcccccgcc 2040 ctggcggtgg gaacttgatt tctccttttg gtcgcgcttc gggggctgga gcttgtttcc 2100 ccacgtcgcc caatgagcgc cctctaaagg gaactgcctc cttggcctcc tctcgtccgc 2160 agctgcctcc acctgggcgc caggagctct gtcgggccag gtggaagctt gagcacccca 2220 gatttcgtct gcagcctcag tgccctctgg ggtctcaggg agtgcggctg tttctggccc 2280 ttctggttcc ccacgtcctc tccctttgcc atttaataac gtgtcaattt ctaattaatt 2340 gaatggtctt ttcaaagaca aattatatca tcttaaggtc ttttaggtag ttttat 2396 <210> 91 <211> 3696 <212> DNA <213> Homo sapiens <400> 91 tgaaccgagt ttaacatcct tctgtacaaa aattttccga caggacaaat aaactactct 60 tccactgaac tgtgactttt gagctgactc tagggtgcac ccaaccttcc agaggtgtct 120 ggcttaaccc tcaaagaggc agctccagcc ccaggagccg accggcacca cagcacctga 180 gcagggcact gcaggaagga aagcggaatc tctagtgaaa cttctcattt cctgtcgctg 240 ctgagagagg ctggactcgc tccttctcac atggcttagg aagagctgta aacgggagct 300 tgccggctgg ccaccagctc aggggccctg ggggcggcct ccgggttctg ctccctgttc 360 ttccctttga ccaatgtcac tcctggacag ataacgggac caaacgccct tcacttcctc 420 gagtcctcat gtatgtcatg gttcctcttt taggaaaaca tgagtacaag acgcaaagca 480 aaagaagaga ctaaaggcaa attaccccat cacctcgttt cgtccctccc cttcgttatt 540 atagaagagc ttgatcaaat tccctttgtc gcgccacaca cacgcagagt aggtgaaggg 600 caccctaaga caacttattt ctttcccgcc tcacagaaag cctttacgaa atcctcacac 660 catctccgga cgcaaagctt tcgcattcag cttgaggagc taaaccattt caagccaagg 720 taggaaacgc caaagtggtg ccgaagtggt cccaaagcag aaggctggga agcagggcaa 780 gctcagcgca cctagacgtt tgcatttaca caaagaaatt agccgcatga ttaatgggag 840 ctgccggctg gaggcggggc gcccgtgccg gcctcctcac ctgggacatc tgcggcctca 900 ggttgatctc cttcaggttg atggagtgcg cccggaggtt gttaagcagc tggcagagca 960 ggactccatc gcggagggtc tgcgcaaggt cgaacacctg agccgagtcc caggtcaccc 1020 ggtggttggt gggcagcacc ttgcaatgga tgagccactg cgcgcactgc ttccacggct 1080 ccatgcccga cggctccggg acgcggctgg gccggggcgg gcggcaagga tgcggccgcc 1140 gccgccgccg ccgcggttcc tccgcgcccc gccgacgcca acagccgccg gccctttccc 1200 cgcgcgggat cgagggagca ggagccgcgg ctgacgggtc gcgggcgccg cgctaggctc 1260 ggctccggtc ccggcccggg tgcgccgcga cccggccgcc gctgcagcga gtcccgcgcg 1320 ctctccgtgc gccccggccg gctcggcggc ggctgccgcg cacaggcttc cgactccagc 1380 gcccggcccg ccactgagca tgcccagcac gccggccggt ctcgctgcgg tccgcaagtc 1440 cccagacgcg cgggtgggag cgcgccggcg gccggggctg gggtctgtgg ccgagggcgg 1500 ggcgcggggg aggggccggc ggaggggggc ggcggccaga aaggggatcc cgcgcccccg 1560 cctgcagcct tgcggggctc acgcagcccc cggcgtcctg gggtcttctc tcggggcggc 1620 ttcccggctt tgcggggagt gtggctgaat actgtaatac gatggggtcc cccaggaccc 1680 cctaaacaac aaatgctcaa aggagcgacg gattaattgg ggcacccaga ctccccagag 1740 caatgaaaaa agtgcctaga gcatcagtag agcacggcgc tgaaagtttt agagatcgtc 1800 gccccctcgc cccttgcagc tctatcccct ccattctcta tagctgattc ctcagcctat 1860 tcctcctagt tgcccctagt ggtgttttgg caccctcaaa gtgagtgaga gtgcgtgtgt 1920 ggagacgcct gcggaaaccg ccccgatccc tgagcctatt tcctcgcgag gtgattttca 1980 cttggagctg gtttgcccct gcactgtcag gctcggaact gtttgccgtt gctgttctgg 2040 cccttttgct gaccccacaa aaacctgctt gagaaaggcc tgtgccacgg tgctagactg 2100 cgcatgcgtc ggcgactggc ggccgggttt gagagcaaag cgcgttagcc ctgggcagct 2160 cctgccgggc tgttctggga tccttagtga aagttggaac ttgaccccag aacttttgcg 2220 cagtgcacaa gcagtgcatt cgtgtttctt aagtaaatct tttggagact ctaaacccta 2280 ccccttttac tcccactgca cactgcccct caaaaccaca attaatgttt aaattatttg 2340 tggcaagata ttgccacagt gaattattgc tgttcgatag gaatgtggtc cttcgtcacc 2400 cttttgagat gcattcactt aaaattagaa aataggccgg gcgcggtggc tcacgcctgt 2460 aatcccagca ctttgggagg ccgaggcggg cggatcacga ggtcaggaga tcgagaccat 2520 cctggctaac acggtgaaaa cccgtctcta ctaaaaatac aaaaaattgg ccgggcgtgg 2580 tggcacgcac ctgtagtccc agctgctcgg gaggctgagg taggagaatc gcttgaaccc 2640 atgaggcgga ggttgcggtg agctgagatc cagccactgc actccagcct ggacgacaga 2700 gccagactct gtctcaaaaa acaaacaaac aaacaaacaa aaagatggga gtttggataa 2760 tttaattgta ttatatttct gtagcccaaa ttttttatta cgaaccatgc tttataagca 2820 ggccaaaata ttatttttaa aagaatgatc tgttcaggat agtgattgcg tcctttttcg 2880 tttggctgtg acaaggatag cacactgttt acactcagcg ctgaacaata aatcagcctg 2940 aggatttcct ttcctcacac gcatccttcc ctagcaattt cctcttgtgt tcaatgcgga 3000 ttccatcaat agcacgacat tttctaggcc ataattttgg caaataaatc atactaatct 3060 ctacatacct ttagaagcaa aatccaacac atttgaatca ccatttaaca cagtctttca 3120 taaagagaaa ttaaaaagaa atttcattaa acgggtcaaa atttaaacta aaactatgaa 3180 tttttttcag gtagcatcag atcacctttg gatgttggag aatatttcca aaatccacat 3240 tatatacact atcccaggac gcaaatctgg atttagagcc cgagctgtac tgctttctag 3300 caacatgacc ttggataaat tctctacagt tcagtttcca tagatacgaa ataagaaatt 3360 tttttttttt tttgtggggg gtggacggag tctcgctctg tcgctcaggc tggagtgcag 3420 tggcgcgatc tcagctcact gcaagctcca cttcccgggt tcacgccatt ctcctacctc 3480 agcctcccaa gtagctagga ctacaggcgc cggccgccac gcccggctaa ttttttttgt 3540 atttttagta cagacagggt ttcaccgtgt tagccagaat ggtctagatc ttctgacctc 3600 gtgatccgcc cgcctcggcc tcccaaaatg ctaggattac aggcgttagc cgccgtgcct 3660 ggccataaga agtaatttct aactaatagg gttgtt 3696 <210> 92 <211> 4199 <212> DNA <213> Homo sapiens <400> 92 tgctaaaact agaacagacc acacctaggg gacaataccc aggcatgtta acggagttta 60 aaatgccaag gaaattacac cacaattctg cccagtatac tacaggctgt caaaccgaaa 120 tgctatgcca gctaggagtg cagcaactcc catcctctgg ccctatttaa ttaggaagct 180 tcagcagagc gaagcctgcc aagcgttcgc cgtcagaatc tgaaggaacc cgagcgagca 240 agaagagtgc ctgacccact ccacagaagc ctgtccagaa atggaggagt cagcgcccac 300 tgaagtcggt tccgccctcg gctcgcctac atggagcctg accagcctca gtcatgccca 360 ctccggcctg ggagacccgc aaagtgttct ttttctcaac tcccctgtac taccttgaag 420 cttagggaag caaagagagg ggcatatctg gactgcaaaa ccaatgtctt ttgccgccta 480 ggagagaagg gaatgagaga gagagagaga tagatagata gagagagaga gagagagaga 540 gagagagaga gagagagaga gagagaaatt ctattgaaac ccagctcctc tagaatctgt 600 gtgacctggt cttcaacggg agaccagtgc gacctcatgg cacctttgcc aggaatcagc 660 gattcccctg cagtcaccat ttgatttatt gctttctcgc tcattctttc tcataaagtt 720 atttcttcct catcctagta agactttttt ctttaatgat gacaaagctt ctgtttcagt 780 gtttccccta ggattggtgc tctttcaaaa cagtgaaccc agaaaaccat cccgtttaat 840 atttctcaaa atcctcgcag ctccaatgta agcgcaagca tgcaaaggtt tcctgctaca 900 cctgcacttt ctgcccatcc cagaaccacc cctcaccccc gggcctgcaa cagttcccct 960 tgtttctctg gatagaggtg ggtggtatta ggggtctagg gcagtaggag gtgaggggct 1020 gaggaggcgc gctagggtag gctggtctgt gctggatacg cgtgttcttc tgcggagtta 1080 aagggtcggg gacgggggtt ctggacttac cagagcaatt ccagccggtg ggcgtttggc 1140 agtcacttaa ggaggtaggg aaagcagcga gcttcaccgg gcgggctacg atgagtagca 1200 tgacgggcag cagcagcagc cagcaaaagc cctcgcaaag tgtccagctg ctgcactgcc 1260 gcggggactc ccacagcacc atgactagtt cgtgcaactc tgcagcagca aacggcttcc 1320 gaggaacaca ggatcgcggg ggccgggcag cgggctactg agcatcccgc ggacggcggc 1380 agcagaggcg gcggcggtgg cagtggcacc cggcggggaa gcagcagcca aacccgcgca 1440 tgatctcgag agtttcagca acatccaggg actgggctca gccccggagc gagagggtcg 1500 tccgctgaga agctgcgccg gagacgcggg aagctgctgc cataaggagg gagctctggg 1560 aagccggagg acaggaggag acgggagtcc aggggcagac gagtggagcc cgaggaggca 1620 gggtggaggg agagtcaagg cgccccgcag cccggcagcc gcctctcgag ctctgccgcc 1680 cgcatccctc tggcgtttgg gaagcagcag gtcctcagcc cgcccggggt cacgtgggaa 1740 gaggcagtcg ggctctgatt ggtggagcag gatgcaggtc ccgggaggga ggggtcgacg 1800 aggaggtgca aggatgcaag gaggaggcgg ccgcggaagc cacagatggg ctcgctcgcc 1860 aggcgctggc ccgagtgggg ctaggcgggg atggctcaaa tgagaagctc gggcttcagg 1920 gtgggctacc cgcacactca tataccattc gcctcactct ccgctccagg acgcccccta 1980 ccgaaggcgg ggtccggact agcgcccctc ttccgcgcgt gaccccgggc cgcgagtgcg 2040 ggccgcggct gggtggcgtc tctccgagct ggagatggtg ggggcggagg tgtcagagga 2100 gcagcagcag cagggcagag aggggcgagt cggcgcggga gagggcgtcc tgctggcgac 2160 cggcgctcca gcgtgcggga gcgcgccgcc taggctgtag ggggatgcag gctgggaatg 2220 tcgcggcgga gaggccaggg acgtttctct agggatttac aggaaagagg gtgagaggcg 2280 atggtgttag aaccgctctt gccgacctgg aagcaacagc agcatctccc acaagagcgt 2340 gcaaccccaa ggctgctcgc cgaggcagct cagccatccc ggcaggcgct ctccttcctt 2400 ctctcttctc ccctctctcc tcccaggccc cccgcagctc cgacccagcc caagcgttcg 2460 caggtttgaa tccctctcct catcacccgc tcctctccag cccgtagcct attagtgtgt 2520 ccacctggga ggtgcggtca gatgtgtttg gaaggtcaga ttggtcggga caagtggtct 2580 gagagaaaga gaaaggctcc tctgcatacg ccgcgggtgg gttgccggga gcatcggccg 2640 ggcagcggcg tccgggaagg ggagagcggg ctccatttgt tggcccaggc agtgaccctg 2700 cgttccttac tcgggtcttt gccggatggc cggtgacctg gggcgacgag agaaggtcta 2760 actcggcagg agtctctggc tctgcgcgtt tctttcattc tctccagcgg gaagggcaaa 2820 cggcatagcg ggacccgcct tccgtctgct gcattcttca ggcagttaga cacactcttt 2880 agcctaatgg aattttagtc gccagtaacg ggaccaagag ctttcgggga caagggtgga 2940 gaggaacatc tttcttccat gaccggggtc actattgcag tctcagtgtt ttggatgccc 3000 catagggaag agctttcttt ttggtgtgtg attattcagt gattcctgtt tttgtttttg 3060 tttatcttct ctccgctctc cttctctatt cctctctgtt atccctcctc cttcttctcc 3120 ccccgctttc aaaagcctcc ggatcctccc tttttctatt taaattctcc ttttgtgccc 3180 ctctttctgt gtcccctgaa tttaggagag catttgataa catttaacag gcaattagtg 3240 tccattccca atcacttaaa agaggcattc atatactttg aaaacgggac tatctatcct 3300 ttgcagacac cagcagaaaa acaaattgta cccgagtaat ccttttaagt actttaacct 3360 ccaacctcct cccacttcct tgctttttaa cttctccttt gagagatgtg atcgtgcagc 3420 acctcagtgc ctcaacgaaa tctttttttt tttcctgtgt gaaatccatc cctttatctt 3480 acatctccgc ctccgtccga gactgtccct ctcccctccc acctccaaag atttctgaat 3540 ctcagtgtct ctcactcctg gcaattaagc agcagatccc agcattctag tcggtggcat 3600 ctcgctcctc accgacgaag actccattaa aacagatcaa ttagaccaga cgttggaggc 3660 atcagaaaat cggcttctag acagagcagc taaattcttt aaggaaacag aatacccatt 3720 agatagagct gccaactaat attgcaaaac aaggaattag aaatttcttt cgctacaggc 3780 tttcagcaga gaaggcaaca taaatataga tcaagattta acaactctac agcagagaat 3840 gagaacatgt cattttccat agcaaggctg gtgtggtaac taatcaggct tatgaaaata 3900 agtcatgctt gaaactaaag gcaaagtcct taaaagtgtt tatgcagtaa ttatgataat 3960 gaaacaggac ctgctaggat ttcagagttt ggctatgtaa gtagaatttt agagaacctc 4020 ttagcagagg aaaactgttt ttgaattttc tgctaagtaa atttttggca tactttctaa 4080 taatatatgc tcttcctaag acgttttgcc aaaagtaagt taaaactcca aaggagttaa 4140 ttactggttg taactggtta acaaatgcgg ttgcttccac agaggtcctt taaattatt 4199 <210> 93 <211> 5716 <212> DNA <213> Homo sapiens <400> 93 tgtgtgtgtg tccacggcgc gggccggagc actcaccatc tcgccggggg agcgaggcca 60 cttcggggtc ggattggaaa tgttgaggct tcgcttgctt cctccgcgac atgctggctc 120 aaacatcagc tggggcagaa taaaaaatta ctaaaaaaaa atcttctcaa aattacggaa 180 atcgagcggc ggcggcggcg gcggctcccc ccgcccgccg gcccgcccgc cccctccccg 240 gctccccggc cccgggcgca gcgcgcatgt gtcctgctat aattatgatt atcaataatg 300 cattgcgatt aatcatagag gggctctttg aaaggcgatt ggcaccgggc cagcgctatt 360 caaacccgct cgccttaatc aattagttcg tgatttgctg cagacccctg tctctccgcg 420 cgctggccca ataagccggc cgcggggctg gctctgcgcg ccgcgccgcc cgacactggg 480 ttaaccctct ttgcgaccgc ccgggactcc gcggcccggc cgccgggggc cggcctcctc 540 tccactgcgg gcccggcgcc ccggcaggcg ccccccgctc tctccctctc ccctccctct 600 tccctccctc cttcgccccc ccccacaatc ccgggctggg ccgacccaaa ttagcatgcc 660 ctccccggaa ttgagccgcc ccgggtgggg ggtggggccg ggcggcgagg gctggggacc 720 cgggctgccg gcgcgctgcg aacttcccaa ctcgggggcg aggcgcgccg gcccgcgggg 780 ggagggagtc ccgcggcggg atcagggggg agggcgtccc gtttcgtgag tgtttcttcg 840 tttctttaag agctaccaga aagcagccca cccccacccc cattaaaaaa aaaaataagc 900 gagtggggaa gagccagccc cacgccggtc cgcctcccgc ccacggctcg gcctccctcc 960 cgcctggctc ggcgctcctc cgccccgagt tctccatccc ctggatcccg ggctcgcggg 1020 ggcgcggaga agaggatcca ggaaaggttt gggaacctga tgggtttgtg gctgggggga 1080 ggggcagttc tcccgccacc ccatcccctc cccgccaggg gcactgatcc tccagcttct 1140 tgcttgctcc ctcgctccct ttctctacct cggacattcc caggacaatt agggctgaag 1200 ttttcgggag aagcagcccc gagcccgtgg gataaggggg cggcccggct ccgcccagga 1260 cccctcccgg acctcccccc cggctgcccc ggttggctgc agggcgcgtc actccgcggg 1320 gaggcggcgg cagcggtggc gccgcagagc cccgggcggg cggagagcgg ggaccggcct 1380 gggctccgag ttcagctccg gccgggggga ggggaggggc tgcggctcac actgagcgca 1440 gcagcgagca ccggcctagg gagacacagc ccgggcggac ccggcactgg actgggccag 1500 tccctgggac ccctgggcac cccgccctgg ggagggggcc gcgccccagc cttccgggac 1560 gaggtggcgg cgcagagccg gaaagcgggg tggggggagg gcggtgggga ggtgttctgt 1620 ccgaggctgc ctggcggcgc cgaagctcgc ctccactttt tgggcacttg ccgagcgcgg 1680 cgcccgaact tttcgctcta tcaccatctc cctcaagctg agatgcaacc tccctaccct 1740 cgccccagag cccagagcca ggagcccgat ccctctgccg ggctcaggcg cccgcgaacc 1800 tgagactcgg tacgcggctc agcctagctc tttcccctcg cgcctcgggg tctcctcgct 1860 ccaaggttct cgaagtcttg cgcccgaagg actaaactaa actaaacttc ggctgagtaa 1920 tgggggagga ggggggtgca gatacacaat ccctgcccta tctcacgatc aggaaaggag 1980 agggctcata aggacgcccc aattcgcgag cgcccttgag tctggccggt gccacggtcg 2040 gttcgcgcga agtgggcacc ggtctcccga gccgacttcg tgtactccgg acctgtactg 2100 cgctccggta gaggaccctt ccctttctct tagcttctta aatcttttct tttaaggtgt 2160 aaatgtgtgt gtgtgccgat gaatgtttct gtttttcatc tgctgacttt attttttttt 2220 attggtataa cttctccctt ctctctccct gctcgtccgt tttccacctt ttctcttact 2280 tatcttctgc cctcgctcac tccctaacac acacattcac accctctccg cctcgctctc 2340 ccgttctcgc caggtcctga tgggtacagt agattttgat aaaaagacaa acgaagctat 2400 cagtggggct gatgttgaag aatgaagata ataatgtttc cataggtggt gcttcaaatg 2460 ccattatttc tcactgaata tttaaagaga tccctcggca aagatggatc tgcgcactcc 2520 tggggtgtga gcggctcgca tctcccagac cccggggaac gtgtacggga gcacgtgtaa 2580 atcccgcacc cgcctccatc tcacaaacag gggtcctcgc acacccacca atccacactg 2640 tcccaggtac acgaacgcgt ttgtgtgcac ttgcacactc ctttcccgga atgtgcccgt 2700 gtttggagcc gcccgcatcc ttctctaaca atcttggctt cttgaaagtc cgggcctccc 2760 gggcaccgca tgcagccagg aacctagcgg agctggcggt cccgcaaagc ttttctcctg 2820 gtgcgcgccg cgtgcgcagc aggaagctcc cgggaataac ttcacacgtg tttgttactt 2880 ggtctacgtg tgatttaaga ttaagtgtag gaaaaaaaaa aattcccccc ccccaaaaaa 2940 acaccacaac aaacaaccaa acgaaatgaa catgcgaaaa gcagctacgc gatgcttaat 3000 taaaaatggg cgagcagaga cgaataaatt gggggatcca aactttaata acttttttcg 3060 tttttttgcg tcctcgacgg cgtagaggcg ggcgtttcga tctgcgcttg gcgtcccccg 3120 ctaatttctt gtttgttttc tttccctcgg tggccccggg aaaggagatg ggaggtggag 3180 gaggggggga tgggaggagg gggatggtcg gaatggcggg gagaggagaa ttggtcttta 3240 ttgttgatgg caatacatca attacgggcc attgtctcgg tcccaagttc cgtggttcgc 3300 tggtgcgggc gctgcagtgt cagggcgctg gcgaggctcc gcgtgccgcg atgcaaagaa 3360 atacatcaat aaaaacagaa gcagagtggg ggttattctt tatttttgtg cgggtcgaaa 3420 gtaggcggcg agcgggagtg aggtgccact cctggagtcc ctccacgcgc cctgctcacc 3480 ccagagacct gcgcgctcta cgtgcggtag caccctccta actctgggtg gaggtggggt 3540 ggggggggga ctactgggga atccgggtag cgaagtttgg acttgcaggt tccgccagag 3600 ggcctggtac ttaggggctg atccgcaata gcgaatgggg atagcccgaa gtgaggcggc 3660 agctgcgccg gggtcgcgac ctcactggcg gagaggaacc gcacccgggg gaggcgcttg 3720 gcgagttttg caaactccca tcttggggga ttgatgctcg ttcctactaa tacgtcccct 3780 tagttttccc aagtcctaga gtatccttgg tgggttggcg gggccgaagg tctgtgcccc 3840 aaggccgcag gccacaactg gggtcccagc catgaggttt ccaggcttct ttgctcaacc 3900 tctggtccta cgaagggcaa cgtggggggc gtcaaggctc gcgcattctg aggcctggtt 3960 cttctaccct caaaagtatc ttattctggc ccgatctgac ctcgggtctg ggatggggcc 4020 tgggatgagg ccttgcctgg gccccagacc ctcttttccg ttccgttgac ggtgcttggc 4080 caccctaccc cagaaatgga ggacgtctcc aagtgctctc cctgcacccc tgtttcctca 4140 gtccccagct caaggccccg ctggcccccg gccgaggcta gaagggcagt agtggaggtt 4200 tcgttttctt aagcaaggca aaaagcggcg aaaaggcggc agcggcgccc cgggggcggg 4260 ggacgaggca catcgatggt atcaacatta ttgatgggga aaagttcggg gcaggagccc 4320 ggagatcagg ttcccagtcc ctcccctgcc cggaggtggg tgggacagag cgggtggcca 4380 gctgtgtgtg tgtgtgcatg tgtgtgtgtt ggtggggggg tgttcctgaa tgcacccgca 4440 ttaaccacct ggggtttatt tgtattttcc ttgtctgaaa gtttgcgggg gcagagggaa 4500 aaggaagggt tgaggtggct tgtaccctct agcccttagg gctcttaact agggttgggg 4560 ttggggttgg agttagggtt gggggagggg tgcggggaga acaggaaaaa aatgacagaa 4620 aaaaagatca agtttggaaa gctctccgta gattcggtta tttttccaaa ccccgggacc 4680 ttgcttcccc gggagtttca gaaactcctt tcctactgaa ctgctgtcac tcaatcctaa 4740 cctctcttag aacactggag cggcttcgaa cccgaagtat ggagcaggct tgggtgggta 4800 cctcgcccct ggccaagtct acactgtgcg ccctcggcgc actcgctctc cagcagttca 4860 ataccagcag caaaacgcag gtttttgggg gaactcccgc cgcccgccac caagggctat 4920 ctccagacgg gcgccgggtg cagcgccgtg accgggcgcc ctggcgccgg ctcgggcgcg 4980 aaattcagcg gtggcaagcg gagggtgggc ttggtaacca cccgcgcgcg cccgagccaa 5040 gagtcgcgta ctgtctgccc gcggcaaagt tcgtctttct ccgcttggag ggctgttcct 5100 acaccggtat taagaaaccg acttcgctag cgactgcaag tgcttgcgat tttgactttc 5160 cgtccacagt tgagcgtctt gcacttaaat tcactgcgcc ccgcatgcaa cagtgcctcg 5220 ccaaggggcc tctgggtatg aaattcctcc cagaggaaat gtcccgacgt agagaaagtg 5280 gaaaaggcta atcgaattta taaaaagaaa atctttcctc cttttggtta aatccctttg 5340 cggttttctg agcgcgaaaa aaaaattatc accatgtaat agagtgtagc taattcttag 5400 aacctagtag taggatgttc aggaagccca gcaggacgca cagattccca tctgccgctc 5460 cagtaggacc ttagttagga tccagcgaat agtggttagt tcctgtgtct tctgttggaa 5520 ataggtgtga gatctgtgga gtcctgttct cggagcgtgt gcatttggaa gagactggta 5580 gtctgccagg aaactcactt tcattcataa atgagatccc ctcaaacgac ctccttatgg 5640 cattcctgga tgaactaact tagcacatct cttgcaacaa agttttattt aaaaaaaatt 5700 tacgctgcca cttttt 5716 <210> 94 <211> 5474 <212> DNA <213> Homo sapiens <400> 94 ttttcaggag caaagccccc attctccctt catccacttc ttacagtcta attgactccc 60 tcctccttct tctttgaaca acgagaagac tctccagttg tccaacttcc acccctccag 120 ctgcaacatc gtcatccttt agctcagcga acgctgggcg aacgctccct ccccgcccct 180 cctgcccctc ctccctactc caagccctcg gcttctcatc cgctgaacga tgtcctactt 240 cgctcgtcct tgctctcgcc gctgctgccg gagccgaagc agagaaggca gcgggtcccg 300 tgaccgtccc gagagccccg cgctcccgac cagggggcgg gggcggcccc ggggagggcg 360 gggcaggggc ggggggaaga aagggggttt tgtgctgcgc cgggagggcc ggcgccctct 420 tccgaatgtc ctgcggcccc agcctctcct cacgctcgcg cagtctccgc cgcagtctca 480 gctgcagctg caggactgag ccgtgcaccc ggaggagacc cccggaggag gcgacaaact 540 tcgcagtgcc gcgacccaac cccagccctg ggtaggtgag tgcctccgca gccccgccgc 600 ccgccgtggg gtcggggaca gggagaaggg agtgcctgcc tggtctgcgc cccccgcctg 660 tcagcccttg cctcgaggct ctggggcacc caactcgtcg actcctgaca ccgcagcggg 720 gtaggctgct ggacagcccc gagcgcctgc agctgctgct gccatctctg atctacatgc 780 ttccagctct gccagtggca gcccccctgc tgctcgcagt ctgatcagca acccctcggg 840 tcctcgcatc ttccctgctg cgcgctcctg tcccagcgcg gccgccgaga tttccgacct 900 tgtcccaggc agggcggtag cgttccggat cagtccttgc ctccgtgccc ccacgcacag 960 gcagctccag gagcagcggc cagcaaccct tctggggaca ccttactgta gtccggcagg 1020 acagccgatc agagccgctc tagggggtgg tcggagtgcc catttcggct ggaatcccaa 1080 ctcggctcct tgctctgtga ccttggggta gttagttgac ttctctgaac ctcgggttcc 1140 tcatcggtgt aatgagcaaa acataaacaa tctttttctc acagttgagg ttatccacag 1200 gaagcattta ggagaactgg ctcaggtaga catcagtaac tattagctgg aattcggtta 1260 ccactattgc attccttcct agcactgcca ggggcctggg aattccctct cccaggtatt 1320 tccatatcct gtcaggtatt cccccaccta ttggaatagc tctgcctaca tggttctaat 1380 aggaccaaga gattggcgtc aagtccaagg ggcaccatta ttatctgcat tacttagatt 1440 gcagatgatg acagtaagat cagggaacag tgttaccctt agacccaccc acagtattac 1500 cagtgcctat gttgctatgg ctaactttgc tatttataac agcatcatcc acatttcaga 1560 ttctatacga gagggatctg caactgctcg gctggtgtca ttgctaatag tattattagt 1620 tttgcttcca ataaaaagga ctatttatat gatgattgca attacttcta caggccctaa 1680 ggccctgctt atattgtgta ggctcatgtt gctcctcatg aagccgttaa gggggtagca 1740 gagagcttcc ctcctgctat agccaaagct ctggcttctt gtgcctccct gctgaccctg 1800 ctgagtgctg gagctcagtt cctatgggac agaccttggc tgccggctga tgggcattca 1860 gcatggaggt ggtgggtgtt gttagatgtg tgtacacacg tgcatgccta cacacacaca 1920 cacacacaca cacacagaga gagagagaga gagagagaga gagagagacc tggtcttaac 1980 tctctgggtt gggtctatga agactgtgag ggagatggac atcccgggtc agacagaaat 2040 gatgtgacaa gaggaaagtt tcctgaacag ctcaagaaat tcaaaacaag ggcagagata 2100 cagacgctgg agctgaaaca gagaggggga tgttgtggcg tcaagggaac ggaccgcatg 2160 actgctgagc tctcagggtt agagttggag aggtgtggcc tgctctggag gaagagaaga 2220 ggaagtggag atgagtggtg tgtgggatag agaaggccac agaaccctgg acccctgggt 2280 tctgaggctg gtaccggatg tggggaagtc tgagtttcct cagggctcct agctgcaatt 2340 gggaggctga ggcccgagac tggagagaca gagctctctc agaactgcac ggggctaccc 2400 tcttggcctc actggtcagt gactcccatt tttggggtca agggtaggtt gccctccatg 2460 ttccagagca gttaggtcct cattggcctt aggccctctt ccctcactct cccactgtca 2520 gacagaggtg aaagggtggt ccagggtgtt ggccccaaaa tgactccaac tatatgggtc 2580 tctgggctgc ccgtcagaga gatgggagcc aggtctgtga gcagctccag ctccagccca 2640 gagagaaggg agggagggca ccagaagggg gccaggccca ggccctggca cagctcagat 2700 gcatggcaaa cagtcttccc agcacccggt gggcactggc tgctcctgcc caatggtccc 2760 cactccagcc ccagaacagt cctcccaagc accccaatgc ctggagctgg tctccgcacc 2820 tctaatctgg ccccatcaag aacctcctcc ctctgaaagg tcagagagag gccctaagca 2880 tctggttgtg ccactcctct cccaactctg accctaggga atgatatcca gacacagtgg 2940 gggagatggg ggttatgatg gcagggaggt gggaggatct gggaaaagta ggaaatttcc 3000 catcatctca ggcttaggaa agtgcaggga caggtatgaa ggcagatgct gagagggcag 3060 ggaagatggg ggataaacag tgggcctgga atgggagtgc acagccagtg gaataaacct 3120 gatctctagg aagtcctgcc tgtagtctaa ccttcaattc tcttgctgca tcattggcct 3180 attccatggc atacctggat ctccatgctc ttctaagttt agcccaaccc ttaaagatga 3240 tgtagctctg agtcttctct cctgggagca cattgccctc gtgcctgact tggctttact 3300 agggatccag ggtcagccct atccttctct gagcctcagt ctccatttct caatgtcaca 3360 acacatcctt tttatgagag tgtaagtgct tcgagatctt tggaggaata ttctgggttc 3420 tagagcttct gatagccagg ggtaggaagg ggtagcccct cccatttatt ctcccccccc 3480 ttagtccacc ctccagccca aggctttcac aaaaggtagg gtgggggaag ggaggggctg 3540 gatagaggcc agactggcag agacaggggc tttgtcccaa ctgatttctg agccaagagt 3600 tccggtggga aagcccgtgc caggcagaaa ggagaggctg ggaagaagaa gggaggaggc 3660 agccaaggaa gggggatgga gaatgttggg gagtaaagag aggagtttcc ttacaaataa 3720 tggtggggag gaagtagagg agagggtggg ctcaggagaa gctgtgctta cttgcgttcg 3780 gtctaggagg ccctcctgga aaaggccagg tgagtatggt gtccctggag gcagggacag 3840 tctagaaggc agaagaggct aaagagatac tatgggagaa ggctctgggt tcgaggaagg 3900 agtctggcac tgggaggagc agatggaatt ctgagtataa gagcacccac cattcatgct 3960 gtaaactgag ctcctactgt ctgcctggtg ctatgcattt gtacaggagt tttaagatac 4020 taaacactct caaagcacat ggtcctatct caactcatga gatagtaatg atgatgcttt 4080 tttataagta agaaaataaa ggctcagaga aggtaaggag cttggcttag gtcacacagt 4140 gagttgacta ggactcgggt tttggttctg agaagaaatc acttgctggg aagatgggga 4200 tcagaaacag agagtccatg gtgatgtgaa ggtaggggac ttctggagcc aggatatgtg 4260 tgaacccaca tgggtgtggt agggagcagg ggggaagtcc atcctgaagt ctaaccccat 4320 ctttccttct catgtccctc tgtcagcctg cagcatggcc cagctgttcc tgcccctgct 4380 ggcagccctg gtcctggccc aggctcctgc agctttagca gatgttctgg aaggagacag 4440 ctcaggtaag caaccccact tggggtcacc gtctctgtct tgttcagccc taaccaactg 4500 cttccaggct taggggcccc aggaagagag agaattggag ggctgtgggg aagcgtccag 4560 gctggaacac ttggaaataa gggctgagct gtgagcatct ggtgggttgg agaaatcatg 4620 gggcaggact agggaagggc actgggtgca aggctttggg cccctaaggt ggaggatagg 4680 ggatcctgaa gctaggaggt gggaaagggg tggaactggg agaaaccctg aaggaggccc 4740 taaagggagc agactgggaa actgggctgg aggactcagg gggcgaggtt ggaggaccct 4800 ggggtgtggt ctaggaattt tggagaggaa gtggaagact ctgagagcag ggcaaggaat 4860 cctgggggct gaattgactg ggagactttg ggggatgggt ctggagaccg tcggggtggt 4920 cctggaggac ctagaggtag ggctgcagga ccctggcccc tggcccctgg cccctggtcc 4980 taggggggcc ggggaatcct ggggccggaa ggagggatcc tggagcgggg cttggaggcc 5040 accgggtggg actctgaggg tcgacagcgt taagttccag ccggctccac ccgttcacag 5100 aggaccgcgc ttttcgcgtg cgcatcgcgg gcgacgcgcc actgcagggc gtgctcggcg 5160 gcgccctcac catcccttgc cacgtccact acctgcggcc accgccgagc cgccgggctg 5220 tgctgggctc tccgcgggtc aagtggactt tcctgtcccg gggccgggag gcagaggtgc 5280 tggtggcgcg gggagtgcgc gtcaaggtga acgaggccta ccggttccgc gtggcactgc 5340 ctgcgtaccc agcgtcgctc accgacgtct ccctggcgct gagcgagctg cgccccaacg 5400 actcaggtat ctatcgctgt gaggtccagc acggcatcga tgacagcagc gacgctgtgg 5460 aggtcaaggt caaa 5474 <210> 95 <211> 5414 <212> DNA <213> Homo sapiens <400> 95 tacacagtga agcgcggtgt ctcccgagcc taaatgaaat ttcaatctaa taattccttc 60 ctggcccagt cataatttgt ttagagatgt tgttctactt ctttcaaagc gctattcgca 120 ctataattaa atgatactca agcttttaac tttgatttat ttcatttctt gaagcttgag 180 acagagctgt acaatgtcat tttttttttg tttccttgaa aattactctg gctgttgttg 240 aggtagaaat taaacaccta agcacttact tgaaccgtcc ggcacaagcc acattcattc 300 acgtgaacac tcccctttcc ctaccccatg tccaggtttc gctgagctca cacccggcaa 360 cactgctgct aggagttccc ttcggctact atttattatt ttcctccaca caggggaaga 420 gaaagggaag cccgagagga tccagggaaa gcagaagggg gttaaggacc atggacagag 480 cccgtcgcgc gctcgttgct gccgccttcc ccagcactct ggcggctcct gaggacagcg 540 gtcccatctt gaaaccgcta ttccgcccgg ctgaggtcag gggtggacag gcggtcccct 600 actctccacc gccgcttccg ggagctgacc acccgagggt tccccttttc cactctcctt 660 cccactctgt ttttgtccca gcgcgcgcca gcgcctctca ggcctgccgc ctgctctcgc 720 acctgctcgc cttccccagg cgcccagtgc ctgcacctgc tcccggtcaa cccccgtccg 780 gattgggcca cccgcgggtt cctgcgtcgg ggtcccgggg ccttctcacc ctcgcctgca 840 ccctgctcct tccgctctct agggaggtga cagcagcccc caacaccgcg ggaagtatag 900 agaaaatggg atccagaagg agaggaagta gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 960 gtgtgtgaca gagagagaga gatagataga aagagattat ctccttttgc aactggaacc 1020 aagagtgtgt gtccatctct aggaaaagtg gtctgcactg ggactgggac agaagtggga 1080 gtgaagtgtc agctaaaaat aggctccgca ccgagaggct gtggaaatga agataagtga 1140 ggtttgtgcc agcccccgag ggtgtgtgtg tgtgtgtctg tgttgtgggg tgtattcagc 1200 agcatatgcg ctgtgtaatt tctgaccttc cctctccctg tcagttgccc cttcttcctt 1260 tgattgtggc taatgaagaa taataaatcc aggggcaggg tttgccagtg gatccttcca 1320 agactcaact cgaactgtac tggatacagg gaggaggagg aagagaaaag gggggcaaga 1380 ggagcgtgtg tgtgtgcctg tgtgtatgtg tgtgtgtgtt gtgggagggg tggggacagc 1440 ggggaggggg aggagtcgca tgcgcacaga cgacccgagc ctgctccgcg gctgtccaat 1500 ccgctgagag ctgcgagaaa tcgagtgaga gaaagccctg cagcccctcc gaccccatgt 1560 ctctttggca ccaggcaccc gccgggccgt ggggggctcg tagccgaacg ccgacctccg 1620 ctcgtattgg gctgggagtt cagagccgcg cgcagaaccc gggttggccg caacgtctgt 1680 gttctcagcg gtggccggga acctgggatc agggtcacct gagctgacgg ggtgggggcg 1740 ggccgagtgg ggttggaagc ctggaactta gtggtaagca ggaggcgtag gaggtggcag 1800 ccaggtaaga ggcactctta cctacccaac gctggcttgg gccgcaactt tatttgggag 1860 tttctttttc cggtgagaca gagacccggc agaagaagcg ggaggggctg gaggctggtc 1920 cttaggtagg cactgcccgg cgactggagc gcggacctgg ccatttgggt ggggttgagt 1980 gggggcgcga ttgtgagtag cagccgcggg acgctgcgaa ggggcggcgg caacagagca 2040 cgggcggggg cagaaaagag gcggcggagg gcgcggtggg ggagcgcgag gcgagtgctg 2100 agagagcaga aaggactcaa gcctgagggg agtagagagg aagaaggggc aacgcgagaa 2160 accgaacagg agccggcgtt tcctggcaag ggagggcgga ggcgcgcggg agagagggag 2220 agagggaggg cggggggcgc gggggtaggc gcggggagag gggagtataa ctcgccggcc 2280 gcgaggagcg ggggcagttt cgggtgccga ggtctgcagc tagcggcaag cggagtcagg 2340 catccgttca gactgacagc agaggcggcg aaggagcgcg tagccgagat caggcgtaca 2400 gagtccggag gcggcggcgg gtgagctcaa cttcgcacag cccttcccag ctccagcccc 2460 ggctggcccg gcacttctcg gagggtcccg gcagccggga ccagtgagtg cctctacgga 2520 ccagcgcccc ggcgggcggg aagatgatga tgatgtccct gaacagcaag caggcgttta 2580 gcatgccgca cggcggcagc ctgcacgtgg agcccaagta ctcggcactg cacagcacct 2640 cgccgggctc ctcggctccc atcgcgccct cggccagctc ccccagcagc tcgagcaacg 2700 ctggtggtgg cggcggcggc ggcggcggcg gcggcggcgg cggaggccga agcagcagct 2760 ccagcagcag tggcagcagc ggcggcgggg gctcggaggc tatgcggaga gcctgtcttc 2820 caaccccacc ggtgcgtatt tctgcataat caccgcttaa aggcacattt tgacagcccc 2880 ctttatctgc ttgatgtttt tttcatgtct gcacagcaaa tcaccccaca cctccaacca 2940 attttcccct ctctctctct taagtattca gcaggtcttg cctttcatat taatttttat 3000 gacctgggat gttgcctgtg cgcgtgttgt gttgtgtttc gttgtgtcta caggctcact 3060 ttcctcctcc tcctgcactc tcggcttctt tctgtggctt ccctcttttt ctcttcacct 3120 ctgttttcag gattattatt attattattt taacgatctg ggaatgttgt aggcgcggcg 3180 acggtgtcga gccctgggcc ggggcttccg gagagagggc gtacaattcc ctgctgagcg 3240 taatgtgtgc cttctactta caattgcaga gcaatatatt cggcgggctg gatgagagtc 3300 tgctggcccg cgccgaggct ctggcagccg tggacatcgt ctcccagagc aagagccacc 3360 accaccatcc accccaccac agccccttca aaccggacgc cacctaccac actatgaata 3420 ccatcccgtg cacgtcggcc gcctcttctt catcggtgcc catctcgcac ccttccgcgt 3480 tggcgggcac gcaccaccac caccaccatc accaccacca ccaccaccaa ccgcaccagg 3540 cgctggaggg cgagctgctg gagcacctga gtcccgggct ggccctgggc gctatggcgg 3600 gccccgacgg cgctgtggtg tccacgccgg ctcacgcgcc gcacatggcc accatgaacc 3660 ccatgcacca agcagcgctc agcatggccc acgcgcacgg gctgccgtcg cacatgggct 3720 gcatgagcga cgtggacgcc gacccgcggg acctggaggc attcgccgag cgcttcaagc 3780 agcgacgcat caagctgggg gtgacccagg cagatgtggg ctccgcgctg gccaacctca 3840 agatccccgg cgtgggctcg cttagccaga gcaccatctg caggttcgag tccctcacac 3900 tgtcccacaa taatatgatc gcgctcaaac ccatcctgca ggcatggctc gaggaggccg 3960 agaagtccca ccgcgagaag ctcaccaagc ctgaactctt caatggcgcg gagaagaagc 4020 gcaagcgcac gtccatcgct gcgccagaga agcgctcgct cgaagcctac tttgccattc 4080 agcctcggcc ctcctctgaa aagatcgccg ccatcgcgga gaagctggac ctgaagaaaa 4140 acgtggtgcg cgtctggttc tgcaaccaga ggcagaaaca gaaaagaatg aaatattccg 4200 ccggcattta gaagactctt ggcctctcca gagacgcccc tttcctcgtc cgctcttttc 4260 tctcctctct tctgcctctt ttcacttttg gcgactagaa acaattccag taaatgtgaa 4320 tctcgacaaa tcgaggactg aagagggagc gaacgagcga acaactgagc ccaagccggt 4380 gagaatgtga aacagtttct caaaggaaag aataacaaaa gatggtattt gtctgttgta 4440 gcaaagttgt ccctttgaac cccacctcgg cttcttcaga ggaagtgtgg agatggctgt 4500 ttgcaggaag gcagacgaga cagtgtttaa aaagtccaca agaatgatca agtaagattt 4560 gtttttattc ttacagacat cacccgtgtt caagtttaaa agtacacttt gcaactattt 4620 ttcagaaata gaaattgatt caggactaaa actttaaact agagttgatg cttaatgtga 4680 tagagacatc tctaaagtat tttgaatttt aaaaaaagat ggcagatttt ctgcatttac 4740 actgtatatt atatatatat ttttattgtg gttcttaccc ccttttcctt ctctgaagtg 4800 ttaatgctta agaaaagagt tgcgcctgct gtgttcactg atcttgaaag ctattattag 4860 attattgcag aacaaccctc tgtaaattat taatttatct ctctagcaac ttaattttgt 4920 gcacattcta attaattaaa cttcttccgt ctaaaaaaag tgggggaaat gtatagctag 4980 taacgttcaa aaaattttgt ttgatgagtt taccgaattt ttacagcttt cctcctatac 5040 tgtgttcctt ttgacccatt tgtatattct cacttgaatg aagattgttt ttttctttgt 5100 ttttactggt agtgttctga tttgtgagtc gacactcagt aatggatgtc ttaatcgtgt 5160 agacctgatt cactgtctga agtattgttt acttcgttac atatttaatg gggattccca 5220 cattgtcccc atgacacatg agcgctctca cttaccctta cacacacaca cacacacaca 5280 cacacctcta acagaaggga agaagcagtt ggaagcatga ccgatgcacc attttctagt 5340 tttaggtgca tttgccactt ggtgtttgcc cttcagattt tagatttcac caaggtattt 5400 cagtcttcca gttt 5414 <210> 96 <211> 3381 <212> DNA <213> Homo sapiens <400> 96 ttcatcattt ctggggagtt ctcttggggt ccacagaaaa tctcacctca tctcggtccc 60 ctcagcaccg gtgatatctt ggaactcggc cccggttgtt cgctaaggag gacttggctt 120 gggggcggga gggtgctcca gagttcctgg gggtccaccg cactccccat ccgaggctcc 180 tcgcgagcgg agccgcttct ccaggccgcc cgcctccctg ccgcaggagc aggcccgcgc 240 ccgccgcccg agagcctccg gtagagggag acactccagc ggctcctccg acttggcagc 300 ggccgggccg ggagtgggtg ggggtgatgg ggggtgggga gaaaaggggg agtggggaga 360 ggggaggtgt gtgaaggggg ggtccggggg gcgggtccct gtgccgctga cgtcccgagc 420 agtgctggga agtataggct gtgttgtcac gccggtgtca gtctgatgaa gattggcatc 480 aggtaagctg tcattcattt ccatgtcaga gacgcttttg caggcggcgg cggcggcgcg 540 gcggcggctg ctgctgcggg cggctgcctc agagcgcgtg tgttttattc cagtccccaa 600 gccagagtat tattcattgc gacagggcaa ggaggagaga gggagagagg gaggcagcag 660 ggaggagaga gagggaggca gcagggagga gggaggcagg gagcagcgag ggacggcggg 720 agcgtgcaga gagaagctgg ggaagcgccg ggagagcgcg gagcggagca gcgcgagggg 780 cggcgaggcc gggcacggag gctgcgagag ccccgcgggc cgcccgctcc cctgcccggc 840 cagcgctcag ccccgccgcc gccgccgccg ccgcctcgcc gcgcttgggc ccgtggccgg 900 ccgcgcattg tcctcgggtg caaggagccg ggctgcggac tcgaatcgcc gcgggcccaa 960 ccccgtagcg ggcgggcggg gagctgtgcg ccaggagcgc caggggaccc gagaatagga 1020 acaggcacgc cggcccgagc ccgggtgcag aaggctcccg gccgggcgct ccgcggggag 1080 aggctgggaa ccgcgggcag gctccaggtt ctctttctcc cggcttcggg cgtccttggg 1140 gccggcgctt actccgcgcc accagcctgg agatgctttc cagcggctgg aggcgggagc 1200 ggtcccaggc tggggccagg tgaccggagg agtcgaggag ccgcggccgc ggcctgggga 1260 ggcagggcga atgagggttt gcagacggat cagtggagac aggggaacac cggcggggcc 1320 cgggaagcca ggatccgagg ggctacacgc acggaccctc acccagggag gagcgagaat 1380 gtgtagggtc accggctttc catgattgct ggggatcttt ggtgaggcgg gcgtaggggc 1440 ccgcgcgagg cttgggaatc gggagccctt ctggctcgag aactagggga tgagttcgta 1500 aaagagggaa ctgaaagcga tcgagagcgg agagctgagg gggatggcgc aggatcccga 1560 atctgccgct caaagtttgc atttctttcg ggttaggaga cgggctttcc tggctcccga 1620 tccccaggaa gaaacgagcg aaatgggccg tcctttcccg gggctcttca cgggggagcc 1680 gggggtttcc gcgcggtggg gagactcggg ttgggaattg aggggtaggg gcttgtggat 1740 cggcctgaat tagggctggg ttttaggacc agtctagagt tcggtttata ggatccagac 1800 tgtttacgga atcgggatcg aggggccgat aagtagttta cacgccggcc agagcagagg 1860 gctggaggtc ggagttgggg gctggaggaa cgggtggcgt ttttaggatt cagtaacagg 1920 atcacagctt tttcttgtgg tggaagctat tggaatttgg ggagggtagc acgaggggtc 1980 ctgcagctcc gcgtgtgaaa aagcgtttag gtaggcgatg aaagtagttg atctgagcca 2040 tggcaggcga gccccgaatt tttgctgctt ccccctgaaa gtgtttcttt aggaggagag 2100 gacttgggcc acacaggacc cggtcctaag agagcgattc cgggaagcgg acagatcgaa 2160 gagaccttct gggcgaagcg gcagggcagc ctcgcggggc tgggagtgga tctgaggtcc 2220 cgacccaggc ggctcggagt gctccaggag ccacctgggt ctgcgggcgc agcgcggcgg 2280 ggcgggagcg gtggcccgca ggggccgcgg cctgcgatga aggccggggg gcagcgctag 2340 cagcgaggtg ccacagtggg ccgaggagtc tgggctgtgg cccagggtag gaccggctca 2400 aactccagtg ccctgattgg agccgcttcc tgtgcttacc cgcgccggac tgagaagccc 2460 acaaacccgg cctttggtgc gcccggggga ggaggaagct tggagtgccc tactgtcatc 2520 tctcctgtcc ggagacttca ggatattagc ttttcgggtt tcaaatgctc tataaccggt 2580 ggcagccaaa agcttcgcat tttaggcagt ttagacgatc ctccccgccc caaatctgag 2640 aatgatggtg ttcaaacata acacggtgta ttacccaaag cccctgccct tgccctcctg 2700 ctctctctgc cgttctggcc ttcggaggcc ccaggacctt ggtggaagcg gggagggagg 2760 gtcccgtttc tggtctcata atctcccact cgggctgcat ccccatagct tgggcctagc 2820 tgtggggtgt ggggtgggaa ggggtcccga ccagggaggt aggttattct ctgggcatct 2880 agagaaagag tgtgtgtggg gggtgggagc gggggggagg agggcattga ggggaggaag 2940 atttgagatt tcctcctctt aatattaaac ccaccatccc agccccctgc acccctggca 3000 gggagagcca gacagccctt acaggacacg gaagacgcac gacccacgac ccacgagtgg 3060 cctcggcggc ccggggcgcg gcgactgccg ccgcggagct ccaaggctgt tgttttgtag 3120 gcttggaatt cgtgagagct ctctcccgct gagagcccga ggggggaggg agccgtgacc 3180 ccacggagac tccctggtca ccgcctcccc tttgtgagcg ggaaaggctt gaaagccaag 3240 agaaagagag gctgctcaga ataaggggca gggggttacc ggagggagat gggcccgacc 3300 accgctcaca gtaaaatgcc tcgtgcgaat tgcactgaag tatacccaac ttgagactgg 3360 ctgttttatg atcctctctg g 3381 <210> 97 <211> 1266 <212> DNA <213> Homo sapiens <400> 97 ccttccatta gacctggtcg cgggaaacca caaaggacag tcaagtgatt ttcaaggaga 60 aagcctctgg tccactttcc ctccgccgcc agatctgcag gttcctggga ggagctcttc 120 tcaaatcctg aagattgcta ggctcttggc gaacgactca tctcttgaag acctagagtg 180 gtggattaca ggcattgaaa agcttttggt ggctttggaa gatgactctg gtgtgagctc 240 acctttccag gctgggggac caggcagagg aacccccttt gttatcttct gaaagaagat 300 cagtggggaa gacggggttt gaagtgtgga ttaggagatc ctacgtcttt gcctaccacc 360 tctgcctaaa tcataaaaag atcgaggagt gcaatgaact tcaggaatca tgcaccgttt 420 ccctgaagcc tgtccaggaa cctaacttct ggacccagaa acttctgcaa agacagaccc 480 actgagccag gcagtctgca ccagcacctc tgcttctaag attctgtttc gtcttcttct 540 attgagagat tgacctcttg agtgatttgt gtgctttccg gcaaatgatg gagacgcgta 600 aaccggcgga acggctggcc ttgccatact cgctgcgcac cgcgcccctg ggcgttccgg 660 ggaccctgcc cggactcccg cggagggacc ccctcagggt cgccctgcgt ctggacgccg 720 cgtgctggga gtgggcgcgc agcggctgcg cacggggatg gcagtacttg cccgtgccgc 780 tggacagcgc cttcgagccc gccttcctcc gcaagcgcaa cgagcgcgag cggcagcggg 840 tgcgctgcgt gaacgagggc tatgcgcgcc tccgagacca cctgccccgg gagctggcag 900 acaagcgcct cagcaaagtg gagacgctcc gcgctgccat cgactacatc aagcacctgc 960 aggagctgct ggagcgccag gcctgggggc tcgagggcgc ggccggcgcc gtcccccagc 1020 gcagggcgga atgcaacagc gacggggagt ccaaggcctc ttcggcgcct tcgcccagca 1080 gcgagcccga ggaggggggc agctagcgag cgcccgaact ggccaggacc cccgcgcccg 1140 ccgcacagcg cgcagccggg cgctcaacct aaggtcctct tcgaaggtgg tttgcattct 1200 taatctggca tcttctccag gcctaaatct taagaaaaag aaatgggtgc tggggtttgg 1260 gggatg 1266 <210> 98 <211> 2968 <212> DNA <213> Homo sapiens <400> 98 ttgcagcccc gccctcccag gcttgcaaag gtagacggag aattatattg gaatttaaat 60 cggaagctct caaggcatct caaaaatact ttctctattt tttttttcct gtagatattg 120 gagaggttgg caaacgggtc ttcctgaaga cagaagaatg tatgatttaa tgttttcttt 180 agatttctgt atgagtggat gcacagtgct ccgtattgtg tggtggggcg gggtgtgtct 240 tcttattgat gaaatacact gcgcaggtca actcggtaaa ttgaaatgag aagagccgac 300 tgcgggggtg gagggggtgt ggtattaggg tgccggcgct tgtggagggg ggcgcgaatg 360 tgaacgtgtg aaagcgagag gcgtgccagg agagcgcggg aaagcttact ggtgaggcaa 420 gtgtgcgtct atttccatgg cgccctggct cgcggcagcc cctggctggg cgaggggtgt 480 gatgtgggag tggggtggga gggggcagca ggcggggcct gccacgtcac ttggagagtg 540 tgtgttggga aggaagggca gagcggagag ccgagccgct gcagctgcgg cggcggcagc 600 gaagccttga gccgtgggga ggtgggtccc cgcgctcggg cgccggggca gccccgggcc 660 ctctgcgagg cctgcggcgc ggctcctagg gaggaggtgg cggctgtggc ggccggaacc 720 gcgaccttgg ccggacccag ccccgcggtg gacgcagggc ggaggccgag ccccgccagg 780 agtctttgcc gagccggagg gaggcgcatc tggcgcttcg gtaccagcgg cagccggggg 840 tccggagcgg ctggaggagc gcagtgggaa ctgggaagag ctagcccggc tggagggcgg 900 acctctgcgt ccgggagccg ggtctcaggc accgctgggg gcgaagccac gcgtcttttc 960 gggcagccaa tttcacacgc gcctgtgtgc ggttccgggc atcccagtaa gctctagcac 1020 ccgggcgcgg gtaacgggaa gcgcagaacc aaatccccag cgcccaggtc acctccccag 1080 acccagcctt gcagggacca gggctttagg gctcacggac ccaacggcca ggtcagaccg 1140 cgaaccggga ggagcgcggg ccccacccta aagagggcgc agccgggagc tggggagcgg 1200 gtgccgcgct ccagagattg tgtcgtgggc gccgtcctag tggcggggag cgcacctccg 1260 agggggcatg agatcggaga aatcccttac gctggcggcg ccgggggagg tccgtgggcc 1320 ggagggagag caacaggatg cgggagactt cccggaggcc ggcgggggcg ggggctgctg 1380 tagtagcgag cggctggtga tcaatatctc cgggctgcgc tttgagacac aattgcgcac 1440 cctgtcgctg tttccggaca cgctgctcgg agaccctggc cggcgagtcc gcttcttcga 1500 ccccctgagg aacgagtact tcttcgaccg caaccggccc agcttcgacg ccatcctcta 1560 ctactaccag tctgggggcc gcctgcggag gccggtcaac gtgcccctgg acattttcct 1620 ggaggagatc cgcttctacc agctggggga cgaggccctg gcggccttcc gggaggacga 1680 gggctgcctg cccgaaggtg gcgaggacga gaagccgctg ccctcccagc ccttccagcg 1740 ccaggtgtgg ctgctctttg agtacccaga gagctctggg ccggccaggg gcatcgccat 1800 cgtctccgtg ttggtcattc tcatctccat agtcatcttt tgcctggaga ccttacccca 1860 gttccgtgta gatggtcgag gtggaaacaa tggtggtgtg agtcgagtct ccccagtttc 1920 cagggggagt caggaggaag aggaggatga agacgattcc tacacatttc atcatggcat 1980 cacccctggg gaaatgggga ccgggggctc ctcctcactc agtactcttg ggggctcctt 2040 ctttacagac cccttctttc tggtggagac gctgtgcatt gtctggttca cttttgagct 2100 cctggtgcgc ttctccgcct gccctagcaa gccggccttc ttccggaaca tcatgaacat 2160 cattgacttg gtggctatct tcccctactt catcaccctg ggcactgagc tggtgcagca 2220 gcaggagcag caaccagcca gtggaggagg cggccagaat gggcagcagg ccatgtccct 2280 ggccatcctc cgagtcatcc gcctggtccg ggtgttccgc atcttcaagc tctcccgcca 2340 ctccaagggg ctgcagatcc tgggcaagac cttgcaggcc tccatgaggg agctggggct 2400 gctcatcttc ttcctcttca tcggggtcat cctcttctcc agtgccgtct acttcgcaga 2460 ggctgacgat gacgattcgc tttttcccag catcccggat gccttctggt gggcagtggt 2520 tacaatgacc acggtaggtt acggggacat gtaccccatg actgtggggg gaaagatcgt 2580 gggctcgctg tgtgccatcg ctggggtcct caccattgcc ctgcctgtgc ccgtcatcgt 2640 ctccaacttc aactacttct accaccggga gacggagcag gaggagcaag gccagtatac 2700 ccacgtcact tgtgggcagc ctgcgccgga cctgagggca actgacaacg gacttggcaa 2760 gcctgacttc cccgaggcta accgggaacg gagacccagc taccttccta caccacatcg 2820 ggcctatgca gagaaaagaa tgctcacgga ggtctgaccc atgcaggcag ggcctgcagg 2880 aggggagcac tgagctaaca gtctcttagg cttccttctc atttccacta ctcactctag 2940 cttcagttga cttcttgact ctctcccc 2968 <210> 99 <211> 4899 <212> DNA <213> Homo sapiens <400> 99 gaggcagccc tgggaggcac tggtctgaag ggctagaccc ttggtaagaa cctctggaag 60 aacgcctgtc ttccggaacc agacagggag gcgtgcaacg gggtggggtg gggggtactc 120 ccagctgcag gcacctctac tcctaactat ctgcaagagg acacacacac acacacaccc 180 tgggtgtcag agaagtcctc ccttccctgt acctcctcct tcccaagccc ctgaaatcca 240 gaagtgcctg tttccaggcg ccagccctgc tgagtggatg tggggatgga ggtcactgga 300 ggcccagggc tggtttgttg tttttgtttc ctgttaggag tactgtgaag gctttgcagg 360 gctagttttg ggaaatctta ggtttggctt catctgactc ctctactgga gcgaggcgtg 420 cagccaagcc tgcttagacc tccccaggcc acgggcccgc ggcagcccag ctcagcacct 480 gcaggcgggg ggaccgcgcg cttggctcga agaccccgcc ctgggcaggg gacagaaaat 540 atgaaatcag atggggagtt atgaataact gtcctcccct cccctctgcc gtgtttcctg 600 aatccgtacg ctatgcagga ggggggcggg ggcgggggcg cggggaggag gagggggccg 660 tttgccatta atctgggaac aagcggctaa cctcggtgac tggtattttc gcttttcttt 720 tctcactttt ctcagtgtgg ggaaagcagt caagcccgcg cggagcgatt gtgaggggct 780 ctgctggaat ttggcagcgc ggaggcttgg agagaagccc catgctggct cccattcagc 840 cggcccgttt tcctcgagct ttggaagttt cactcagccg tgcactcaat ggcttcacaa 900 agctgattac aagcttcagc gcattcctga aggagccaaa agcgacgcag gtgcaaacga 960 gccgagggag ccccttatcc cggtgacaga atgggacaag ctgggaaagg cttagaccac 1020 acaagtccaa ggctcaccag gccgcagaaa gcctgccttg ggaaccgggg gtcattatcc 1080 gccctattca gcggggcccg gggaccctgg gggccgagcg aggccagccc gggcgggagc 1140 accgccgcca gcgcgcgccg gcgacagggg ggaaccccgc tgggcgctgc ggccaggccg 1200 gggctcaggg cgctgggctg tgcgtttgca caaatctgtg ttccggcggg ccggtgtcaa 1260 ccctagtggg gacacgggag aaagagcacg ccagtaggcc acgcggcgcg tgggcagtgc 1320 gcaacttctg tcggcgtcca ggctgtacgg ccacgtttca gccggtgccc ccaggccatg 1380 gacacccagc tccagggtcg ctctgcgccc tttctcccca gcccaccttt cccattggtc 1440 ccctctcctg tccgagtggc agcgcggccc cgcagggagc gaccccggga gggacagtga 1500 ccgcacgcgt ggagtgggga cggcggggca caggacggta gtctaagagt gttcgcatgg 1560 ccgaggacgc tttcgctgcg agtttggggt cgaggggcag ttccctcccg gagtcattaa 1620 cttcgtctcc tcgtgctcag ggaccagcaa cttggtgctg cgggcgccag aaagaaaagg 1680 gtagcgcctc gcggagcgcg cgggggaaga gggactgcgg cagcgggacg cgagggcggg 1740 aggggcgcag cagcggggag ccggagcgca gcggagggga gcgctggggg gcggggagcg 1800 ctcgggcagc caccctgtcc ccgtctggag ccccgcgctg cgtctaggag ggcgcaacac 1860 gcagtccccg cgggggccag agctcggagc cccctagtgc atgccccctc tcctcgcgcc 1920 ctgccgaggc ctcggccctg cctgccgtgc cctgggcctg gttgtgcccg ggggtccccg 1980 cgggcagggc gcggggcagg cagggcgcgc gcgccgacgc tcttttgtct gataactaat 2040 ttgagttaat gcgatcttta tgtaaagcta acagcggata attgtctatt ttctcgccaa 2100 cagtctccat cacaatcact tatctggaaa cctgcggttg gattaatcgt tatattcccg 2160 agatgagcgt cgctgcaatc cgcagcgaac gcgggtaggg acctggagac gcctcccggg 2220 cgctggcggg gccggtgtgg gccagctccg ctaccgcctg agacgcggtg tgcccaggtg 2280 ttggtgcccg cgggagaggg ctgtggggcg ccttccccag gatttgcttg acttgctttt 2340 cgctcgagtg ggtggtgcgc gggtgcggga ggcggaggga ggaggagggg tgaggggagg 2400 agggcctgtg gggctgcgga cccggagcag cctgggtgga gcgcggcctc gggaggccct 2460 gggtgcatcg cggcggggcc tgggggggcc caggcgccgg aggagccgtc ggtgccggaa 2520 tgcagcgtgt ttcacttggg agaaacgttg ccctcggtcc cttgcctccc tcctgttgtc 2580 tcggtttttc tggcttcgtc cttcgtccca cccacccgtt cccacctcag gtccctcccc 2640 caggatcccc tccttaagga tccaggtctc tgaaaattat tggcaacagt tacacgcccc 2700 acgattgaaa tccacaagag aagagtccca gttctgcagg ccgctccagg gctaggggta 2760 gagatggtgg caggtggtgc gtcaactctc tagggaagag gaacttgcat tacaaagact 2820 tgtctttctg agctgaagtc aaaacggggg cgtcaagcgc gctccgtttg gcggcggtgg 2880 aggggccgcg cgcccgcgct gtcccagccg gagctgccct ggctggtgat tggaggttta 2940 acgtccggaa ttcaggcgct tctgcagctc agatttgccg gccaaggggc ctcagttgca 3000 acttttcaaa atggtgtttc tggaaaataa caaattcaga ctcaactggt gacagctttt 3060 ggctatagag aatgaaactg cttccctttg gcggtggaac tcttaaactt cgaagagtga 3120 aagaatacaa tgaaataaaa tgccataaga tcactggatt tttcagaaaa aggaagaccc 3180 caaattactc ccaaaatgag gctttgtaaa ttcttgttaa aaatctttaa atctcgaatt 3240 tccccctaca acatctgatg agtgctttaa gagcaaacga gcaaatccca cctcgagaat 3300 caacaaaccc aagctctggc caaggctctc cccgcgtttt cttctcgtga cctggggaat 3360 gtcccgcccc atcgctcacc tggctcttgt catctcgctc atcttgaagt gacccgtgga 3420 caatgctgct ccctgccgca gctccgccgg tcactcaggc agaacggggt atgcaaatgg 3480 cctggagagg ccgaggccga acactgcgcc cattgtcccg ggcgctcaaa gcgccgagca 3540 gctgcgcaga ctttctgggc tcggaccctc ggccgccacg ctaatgtcat cattgcaaaa 3600 catcagattt tgagaactat gcagtctgaa ttcattagca gccttctcgg cgaaggttct 3660 tttccccgtg acaagtttca aagtccagac cccctccaac gttggtaggg gtaggaagag 3720 gaggaggggc ccagggaggg gggtctttcg caagtggggc ctcgggggat ccctgctctc 3780 cttctggtgc attccgcaac tttaaaagcc ttccttgggg ttctgagcgc ggatgtctga 3840 cttgaatgac ctgagatttg gacatattcc cgttttctcc caagagttgc tttaatgttg 3900 cgagtttaaa ttcactgaaa gaggcccaga taccaagtcg agtgaatttc atagacatca 3960 tcttctgttt taatgatcgc ggcagtgatc gtttctgaag tcataccctt tagggtgaac 4020 tcacaacaat gcatgtcaga gaggctgcgc gccctaaagc aaaacagtta aaacatcagg 4080 ccacgctcct caaactgcag gattgcaagc agctcacaaa cttccagtcc ccaccccaag 4140 gtgaggagag tctcagtgac ttgaggacct gcttgcactc ccgctttcca cgcccggtcc 4200 cctacccgca cctgcccaag tggtctcgtt cctctagaat ctgaatggtg gggaggggtg 4260 ctcctgatgc cccgggtgca gggcgggcac cagcgagcga gacccaaggg cgctagaacc 4320 caggagcgca aaccaccgtt agggcctgag ggacgcagag gcgggtggag tagtgtttct 4380 cagattcgtg ggaggccgca ggcgccagca gaggcaattt tcctcccctg agcaatgcta 4440 gttctcctca ggcccaggat ctccactaac gtgtccttcc acctcctcac aggactccaa 4500 gctgctgtcc cctctctgcc gcatctgagg ctgggaaaac ttcctaggag aaggcaagag 4560 aaagccacca gaccagagcc gaggactaaa ctttaaggtc gaagacggca gaggggcagg 4620 ttctcccctg cacaccccaa ggcctctcct gcacccgcga ggccttcctt gagcgcccag 4680 gcccccgaaa tgcctgccct ccttctgaca aaaggagggg gtaggatgtg aaggggtagt 4740 gcaaccaaca atgtttttgt aaacacaaca acagggaaat acatggagga aatctattta 4800 ttgggtgtgt catttttggt ggggggcggg attgaaagtg gcgccatcta gacccaggaa 4860 aaagctacgg ggtgggcggg gtaagcgggg gactcttgg 4899 <210> 100 <211> 2346 <212> DNA <213> Homo sapiens <400> 100 actcaccttg tgaacactcg gacatggtga attggcattg gcattgctgt tgaaggacaa 60 ctcagccgtg ttcttagcca tggccattta ggcctgttct gatgcagggt tctgatccaa 120 ggtaccagtg tggtccctca gggaagtact ggggatcgtc acttatgcct gttctggaca 180 tggtcaccga gaactgtcct gtaggcattc acttaggaat cattcgaagt ggaattgctc 240 ctggatacgt tctccttgta ctctgtttcc tcctcctagt gtctctgtgt gaagaagccc 300 tcctcactca gccctcggcg accctctggt accctggaca gctccccggg gagcagtcta 360 ccgctaggcg gcggctgcta agagaggaac cctcctgacg cggagtctgc cgctccgggg 420 ctcgctctcc ggcaggcccg gggagaggtg gggtgacaat gggttggggt gcgcgcgtgc 480 ctcataggtg cgagacagag cgagccgccg gggtgtgagt cagcgcgctg ggggctaaga 540 agctgggtga atagtcacgg aatctcactc acgctcggct cctccaccca tcccgtctac 600 agcgcgtgtc ccagtccagg gcgtgcgtgc gctcggtgtc cgattccggg ctgtgtgtgt 660 ccatttggcg agatgtcgag agcgggggga gtgtccttgt cggtgtatct gggcccaggt 720 taggggactt ctcctcccca cccccgcgtg ggtgtggggg tgtgtccggg ctagggcgcg 780 tgtgcttctg tgcctgtgcg tgcgtgtgcg ggtcagggtg gtgggaccgc gcatcagggc 840 agggtgcctg cgtctgcgtc tgggtctgtc tggtctgcat gtcggcgcga tctcgacctg 900 gattcgtgtc cctggatgtc gagaggccag cgtggtgggg gtgtccagcc tcccggagga 960 gtactatgcc ttgacacctt cgtttcaccg ccccaaagct ggcctggggc tccgtaggga 1020 gtggcctgca tggggagggc ccgcgtgctg tgtttctggg aggggtaaga gagtgggggc 1080 gcagggggcg ggccaggtcc ctgggcgcgg cgcgggctcg ggggacccgc gcggctgacg 1140 tcaggccact ccttaaatag agccggcagc gcgctccgct cggcatttcc cgaagagcca 1200 gatcgcggcc ggcgccagcg ccaccgtccg gtccacccgc cagcccgcac agccgcgccg 1260 ccgccgagcg tttcgtgagc ggcgctccga ggatcaggaa tggggcttcg ggcgctgggc 1320 gcgctccgaa cccggcgcac gtaagagcct gggagcgccc gagccgcccg gctgcccgga 1380 gccccatcgc ctaggaccgg gagatgctgg aaatgcaacc gcctgttccc cgaggagccg 1440 ctgcccccgg gaccccctgg cactgtgcgc accctggtca gcagcccccg gagaagacgg 1500 cgcccccaac gcccgacccg cgtggccgtg gcagcgccac gcgagccctc taggcgaccg 1560 cagggccaca gcagctcagc cgccggtgcc ccctcggaaa ccatgacccc cggcgcgggc 1620 ccatggagcc atggcctata gggtcctggg ccgcgcgggg ccacctcagc cgcggagggc 1680 gcgcaggctg ctcttcgcct tcacgctctc gctctcctgc acttacctgt gttacagctt 1740 cctgtgctgc tgcgacgacc tgggtcggag ccgcctcctc ggcgcgcctc gctgcctccg 1800 cggccccagc gcgggcggcc agaaacttct ccagaagtcc cgcccctgtg atccctccgg 1860 gccgacgccc agcgagccca gcgctcccag cgcgcccgcc gccgccgtgc ccgcccctcg 1920 cctctccggt tccaaccact ccggctcacc caagctgggt accaagcggt tgccccaagc 1980 cctcattgtg ggcgtgaaga aggggggcac ccgggccgtg ctggagttta tccgagtaca 2040 cccggacgtg cgggccttgg gcacggaacc ccacttcttt gacaggaact acggccgcgg 2100 gctggattgg tacaggtaag gaccaggagc tccgctccgt gcgccgggtc tctgatcgct 2160 tccattggga gagccatccg tctcttgtgt tttctctttc ttttaaccca actcattgta 2220 tgggttcagg ctgacacaca gggccatggg gggctatagc agaatttacc cagaacttcc 2280 cagtgataat ctagacgggc agtttctgga actgcaaagg gcgttccctc gtcactggag 2340 tcgttg 2346 <210> 101 <211> 2695 <212> DNA <213> Homo sapiens <400> 101 gttcccttcc acgggggtcc cgaggtgctt tgaggaggga gaaagagggc gtcccctctg 60 gggagcccac tctccgggct tctactgacc tggtctccgc ctcaccggcc tcttgcggcc 120 gctgcagaag cgcactttgc tgaacacccc gaggacgtgc ctctcgcaca gggagcgccc 180 gtctttgctg gggctggagc ggcgcttgga ggccgacact cggtcgctgt tggactccct 240 cgcctgccgc ttctgccgga tcaaggagct ggctatcgcc gcagccatag ctgctcagcg 300 agggcctcag gccccagcct ctactgcgcc ctccggcttg cgctccgccg gggcgagggc 360 aggacctggg cggccaggga aagggcagtc gcggggaggc agtgctaaaa tttgaggagg 420 ctgcagtatc gaaaacccgg cgctcacaag gttagtcaaa gtctgggcag tggcgacaaa 480 atgtgtgaaa atccagatgt aaacttcccc aacctctggc ggccgggggg cggggcgggg 540 cggtcccagg ccctcttgcg aagtagacgt ttgcacccca aacttgcacc ccaaggcgat 600 cggcgtccaa ggggcagtgg ggagtttagt cacactgcgt tcggggtacc aagtggaagg 660 ggaagaacga tgcccaaaat aacaagacgt gcctctgttg gagaggcgca agcgttgtaa 720 ggtgtccaaa gtatacctac acatacatac atagaaaacc cgtttacaaa gcagagtctg 780 gacccaggcg ggtagcgcgc ccccggtaga aaatactaaa aagtgaataa aacgttcctt 840 tagaaaacaa gccaccaacc gcacgagaga aggagaggaa ggcagcaatt taactccctg 900 cggcccgcgg ttctgaagat taggaggtcc gtcccagcag ggtgaggtct acagaatgca 960 tcgcgccggc tgcggctttc caggggccgg ccacccgagt tctggaattc cgagaggcgc 1020 gaagtgggag cggttacccg gagtctgggt aggggcgcgg ggcgggggca gctgtttcca 1080 gctgcggtga gagcaactcc cggccagcag cactgcaaag agagcgggag gcgagggagg 1140 ggggagggcg cgagggaggg agggagatcc tcgagggcca agcacccctc ggggagaaac 1200 cagcgagagg cgatctgcgg ggtcccaaga gtgggcgctc tttctctttc cgcttgcttt 1260 ccggcacgag acgggcacag ttggtgatta tttagggaat cctaaatctg gaatgactca 1320 gtagtttaaa taagccccct caaaaggcag cgatgccgaa ggtgtcctct ccagctcggc 1380 gcccacacgc ctttaactgg agctccccgc catggtccac ccggggccgc cgcaccgagc 1440 tggtctccgc acaggctcag agggagcgag ggaagggagg gaaggaaggg gcgccctggc 1500 gggctcggga tcaggtcatc gccgcgctgc tgcccgtgcc ccctaggctc gcgcgccccg 1560 gcagtcagca gctcacaggc agcagatcag atggggatta cccgccggac gcaaggccga 1620 tcactcagtc ccgcgccgcc catcccggcc gaggaaggaa gtgacccgcg cgctgcgaat 1680 acccgcgcgt ccgctcgggt ggggcggggg ctggctgcag gcgatgttgg ctcgcggcgg 1740 ctgaggctcc tggccggagc tgcccaccat ggtctggcgc caggggcgca ggcggggccc 1800 ctaggcctcc tggggctacc tcgcgaggca gccgagggcg caacccgggc gcttggggcc 1860 ggaggcggaa tcaggggccg gggccaggag gcaggtgcag gcggctgcca actcgcccaa 1920 cttgctgcgc gggtggccgc tcagagccgc gggcttgcgg ggcgcccccc gccgccgcgc 1980 cgccgcctcc ccaggcccgg gagggggcgc tcagggtgga gtcccattca tgggctgagg 2040 ctctgggcgc gcggagccgc cgccgcccct ccggctggct cagctggagt gctagctccg 2100 caggaaactc ggggcccggg cgagagccac cgagatggca ggtgggacgc agagcccgcg 2160 gcagccagag ttcctcccgc acggcccgcc gacccacgga agagcgaaag agcgcccagg 2220 tggggccgag ctgggggccg ggcccctgga gcgctgggaa gcacagcgcg ctctagtcag 2280 gttccctttc ctggagccct ccgcttccag actcccttct ttcctccctc cctcccgcca 2340 cccctctccc tcctctctgt gtcttctgtc tctccccttt tctcctctct acgcaatcct 2400 acgtgattga ggtttggatg agaaattctc agaggcagag cgagggaact gcagcttggg 2460 tctgctccgt ccggtccctc ccacaagaga aacacaacca cagtgggagt taaaggaccc 2520 taggtgcgca aagaagaggt gggatggggg agctgagaaa atgcagtcca cactctctcc 2580 aataagcttg agcacgtaga attctctgtt tagttaggaa gaaagtgaac actggagaaa 2640 gtaaaaatga cctcttggac cttatcgtgg gccccaccta tggctcattt tggaa 2695 <210> 102 <211> 2837 <212> DNA <213> Homo sapiens <400> 102 aataatgttc ctgctgccat cccagctggc ttttcgtttg tccaaatcgc tctctagtcg 60 ttgtcttttc acttcataaa cgccactgag aattgtgccc accacagccc caccccactc 120 ccaatcccac tcccaatccc caggttcaga ttatggtatt tggtatagtt cttgaactcc 180 acatagcccg ctccggaagc gcactgcaaa acgcacccca gatgctttcc caaatctatt 240 ccttcattct ctcatttcag aaaatcgctc tatttattca ccctgagaaa gtggactcaa 300 cccccgcttt cgcgctggag aaggaaacac aatcattctc tctttctctt cccctccctc 360 cccaacacct tccctccctc ctcccttgcc cctcctaatc tccaacccta agagcagcac 420 tcagacatgc aaactttcta attccttcca ccctcccctg tcccaaacac tgggcaatta 480 gactggagat aacagacgca gggaaatctg ggtttccatc tgtcaaggag tcccctttcc 540 ccacacccgc tctcatgccc ccgccccctc gaggggctct gggggcacct ttatcgcttc 600 tcccctgccc tctagaaaac cacccgtaac tggaggctcc cgcgcggcag ctgcaccaac 660 agcaggtgat ccaggtggtg cgaggcgatg ccttgttatg gcatcctgcc ctctgcaggg 720 acaccactga gggccacatg aaatgacccc cagcagtcct gcaaaagcaa aggggtggag 780 gagggtctat gcaccctgcc ctgtgcccca gtctctccca ccctgtcctc cgcaaccgag 840 gagaccctgg catctgggag cgggctgggc cgagaaggca agatcaataa agttcagcaa 900 gtagacagct gggagctggg tgctactgag ttctagaaag ggggagtaga gacggaaata 960 tccgaatcgg tgaaatgtaa atcgtgtcta ctgcataagg gaatcgtgca gggagagccg 1020 ctctctataa ggagttaacc agcgcctgcc ccggacaccc ccgcggggcc tccagcgggg 1080 ctcaaactgg cggcggctca gcagggggcg aggggtgctg ggaaacgccg gggctgcgaa 1140 cttacggaag aaaatgtact cggtgtagct gctccagatc ttgtcgtcgc ggtactggtt 1200 gacgaaggcg gcggtgcccg aggagttaca cgccaccatg tggaagccgg cctcggacag 1260 gcgatcaaag gcctgctcca agtaggtgaa cttgaggtag aagcgggacg tgtacttctc 1320 cggctgccgg tcggggtcgc ggctctcgtt gagcgtgtcc ccgaagacct ccttggccag 1380 cgcgatgcgc ccgcacacca tgatgcgcgc cacacgccgg aatttggcgt cggcctggtt 1440 gtcgcgcacg gtggtgtagg agccccggta gcccagcgtg aggaagcccg agcgcttgtc 1500 ctgcgcgccg ccgccgccgc caccaccgtg cgctcccggg cccgagggca cggcggccgc 1560 cgccccgcgc agcagcagcg cgtcgctgct accctgcgag acgttgtcct ccaggtcgct 1620 ctggcagccc tcgtcgttga gagagttctg cttggtgacc ttgggcgaca gcagcttgac 1680 caagtcggtg agctggaaat actcggcctc gcgcagcagc cgctccttct cggggaagtg 1740 ctccggcagc gcgagttgct tgtcccgcag ataatccagc acgtacctga aaaggaagcc 1800 gtcccggtcg atgaagaagc gcgcccggct gtccctgggc agctcgcccc ggcgccgggc 1860 gccgccacgg ggactagagg gcgagaacat gctggccaaa gtactgtccg ggacgctgag 1920 cagcgtcgag tgcttggtca cataaacctg gccgcctacg ttcagctcca ctacttcagg 1980 gaagggcgag ggtgcgcagg gccccggggc ggcggcggcc gacgcgccgg gcgagctgga 2040 cgaggaaacc atctcgctaa tgggcaggat ggtgctgccg ccgctgcccg tgtccttcag 2100 agccatagtc cccccgccgc cggcccagtg acccgagaga gctgcacttt ctcgttcccg 2160 gagcccgcgc cccagccctc cgcgtgctcc tggcgctctg cgccctcgga ctgggcggcg 2220 cgttcctccg accggggcgg ccccgctcag ggttcggggc agcggcggcg tcggcggcgc 2280 ccgagctcca tcggaggaga gacgcgcgag agaggagctc cgccggtgcg gcggcggcaa 2340 tggagaggca agaaggagct gctgctcctt tggggcgagg gcggggaagt gtgagagaga 2400 cttgcgagag gctctagggc tgctgctcgg ctctccgtgg ggagggcggg aggaggggcc 2460 gaagcaaaga aaactcgccg ccccggcagc ttgcaagcgt gccgcgaggc cggagcgccg 2520 acggtggcgc taactactcc tggcagcacg ggaggaggca ctgacgtcaa gccccggact 2580 gggacccgag cctcagctgt catttaaaga gataggctgc agccgcggct cccgggctcc 2640 gacgctaggg ggcggggccg agagccgagc ctgcaagagg tgcagctccc cgacccgcgg 2700 ggacaggcag gcagggagct cctaaagcaa aagcgagaaa aagggacagc gctctcattc 2760 cttcatttca ctccctcctt gggtctgtgc cacccccttt cctccctcct ttccttcttc 2820 tcttccttcc ttccttg 2837 <210> 103 <211> 7618 <212> DNA <213> Homo sapiens <400> 103 agaggtccag aaggttctct cacctggcac ttagcaaggt caaggattca ccctccagga 60 cactctgcag cccagggatg tggccaggac ccttggagac tcccagtctg tgcttgggtg 120 tgaaccggga gtgaaatgtg acccagaagt cgcagagaaa gtttcaagca gctgaggagg 180 tgcacgtgag ggcaggaagg gcctggggag tgtgggaggc tgggagtgag agccaatctg 240 cctgctgacc tgcagaagcc tctggacttg ctctctgaaa gcaggatcca gcgggagctg 300 gaaagaggag gttcctgtac ggggccagcc tgccctcccc ctccccactc aatgtggtgg 360 ggtccctggg gatctacgcc ctccagcgga cagtagcatg ctggaaggga gcttggggac 420 agatgaacaa caggaccaca gaaaaccaag ggggaaaagg ccactagtat agaacaaacg 480 tgtgctcata gtgcacgccc agctgtgcag gttgttcatg ggaagccgct gtgagcgctg 540 gaccgtctca gctcagtcca atggagagag ggagggaagg gccctgagtg cttttgagtg 600 gcatgtgagc aagtgaactt cccaccttcc agacaagaca tagacagttg atagattcct 660 tttaaaaaag aaagaaccga aaaaatgaat tcaagcaatc gtggcagaag cgtcctattt 720 agaaatatag aggcaggtag aagcagaaag agctggcggg gttgacagct gtgtcctccg 780 gtgggggtgg gatgaggaat ctcttctggt agtggtttat gctctttgta gaagtggagg 840 acattttaag ttgtgtgctg agtagctctg gtacaaatga agactaggag gaggagaaga 900 ggccgggcag gggaagggga ggaagaaggg ggcactaggt ctctctgaat ttaaaccgtt 960 taggcgtcta tgtagacatt tttctttctt aaaaaaatgg ggatgcgggt ggtggctaca 1020 cgggtgtgca catttatcaa aattcctctg attgcactct taaatttgtg cttttctccc 1080 taagtacatt cacttcccat tttgaagaag gaggggaggg aggctttcca tcttctacct 1140 ggttatacgt tcgaatttcg tgccttggcg atgcattgct tgtttaaaaa ctacatacat 1200 catgagggaa aatctttatc aaaaactctg gtcgggcgca gtggctcaag cctgtaatcc 1260 caacacttgg ggaggccgag gcagacggac cacttgagct taggagttca cgacgagcct 1320 gggcaacata cagcacccct tctctacaaa aaataaaaat tagccgggcg tggtggccgc 1380 gcctgaagtc ccagctactc ggagactgag atgggaggat cactcgagcc caggaaatgg 1440 aggctgcagt gagccctgat cgcgacactg cactccagcc tgggcgacac agcggaccat 1500 ctcaataaca aaccgaaact ctggctatct ccaggtagtc gaacttggga tgccttttgt 1560 tttcagtgct tgtaattttc tgaattttta aaataacgaa cagagtctcc ttgcgacatt 1620 aaatgcaatg cagccgccga ggaagcgtcg gggacagatg gggttggacg ccgtccccac 1680 ttcctcccct gcagccgcct ccaggccgcc aacctcgccc agccggagcc tcagtcctgg 1740 agggtcgggc ggcggcggcc ttcccctgga gtggcattct tgttgcccgt ggggccccct 1800 ccccaggtag gaggcaggag gcggggtctg gggcagcctc cgctttctcc ttcctccttc 1860 ccccgcggct tccctgctgc gccgggcctc ccaggtctca ccccgagttt ccgcacccgg 1920 tggggcgcgg gttccggccc agcttctctc ggaagtgacg gctgacctag agcccatccc 1980 tggcctcggc ctccgcaccc ccccgccccc ctgcctgtgg aacccgcagc ccagaagcct 2040 ggagcctctc tgcgagcacg caggggtctc ccagcttccg gatcgttccg ccgttcgccc 2100 tgggtctgag tctgggggtt cgggaaacaa ttttggacgt ttctggttgg attgtgtcta 2160 aatcgtgcat tttacgcgac aggggactcg aggtccttga ggatcccaaa ctgccgcagc 2220 ccctccctcc tcctcccctt gcccttgccc ctgcccagag aagtgcgctc ctccagggtc 2280 atccacacgc gccgtgccga gccccgggcc ccagttccag gagccgcgtc tctacgggcc 2340 agtgggtcct gagagagtag ggcttcgggc gctcggggag aggaggcgga ggaggggtga 2400 agccgagggg tggcttttaa cgaaaaagaa gttgaagcat cagctaagcc attagggcta 2460 atgcgatgta ctgtaagacg gggatcaatg ccgggcctcg gggaccggcg tgggggaggg 2520 ggcagcaggc cgaccgcccc caagccggtc gaggcccccg tccatttggg ggaaatggat 2580 tttcgcgatt taagaaacaa acccaaatca aatgagcgag gcccggatgt gctgacgctg 2640 cggttacgcg cgcggagctg gagccccgag agcgctctag gaaaggcgca gcggcgaccg 2700 cgggaggggg tgagaagccg aggcagagag gtccggagaa gcagaaagag atgccgaccg 2760 gcagagaaag agcgagacag acacaccgag gggtgagggg gcaaaaggga gcagcctcgc 2820 aattttcgca gaagaaaaca ggccggcgcg gctggggatg cgcttctggg ccaggcgcgg 2880 caagacccca ggaactagcc agagccccaa gacccaggcg cctatttgag ctcctttgag 2940 tccggcagga ggcctaggtc cattcgggag agagaggtgc cagcccctac cttgtgcagt 3000 cccctcgccc ggacgtcatg gggggagtgc cccctgagcg caggcccccg ggcggccggg 3060 gcctcgcttc tggcggccgg gagaggtcgg caccgtgaca ctcaggcaca catacaccaa 3120 tgccccgggc ccgctaggga cgctgagctc caggcaacga aaaacgaagg tcctggagtc 3180 ggtcctgagt gcattcctcc actgggcccc gtcgagaatg aaactctcgg agcatcgtca 3240 ctgggaggtc ctggggggac actggggtgg gcgagcttct tcaaagactc ggtttccact 3300 gggccctccc attccctcct ctcttcgtca cgcggtggtg gtggtggtgg ggggtgcaat 3360 agcccctctg gttcctgggg caccccttgt ggtggggtgt gccctcctgg ctggacccac 3420 tccttgctgg gtgcaggagc agagtgggga ggaaggaggc cggtggattt ggcttctggg 3480 cagcccacct ctgcctctcc tggggccaca ctgggcttat ctgtaaaatg ggcacaggtg 3540 agatagagtt ggccaaggtc tcttctagca ggctaagggt ctgctgggga ggcgggctcg 3600 ctccaaggct ggcccccccc cacgcctctt gacagtgcca cccccaggat atgaggaacc 3660 tcaggcaaat atgggggatt cttgtctata taaacagttt tagtcatcgc aaactcataa 3720 tgtcagcacc atcccgttag cacgatttct ctagtcccga ttgacagccc tcccagaacc 3780 tgggccttac aggtctgagc tggcttagag cttccacccc aatcccagaa aaggcccgcg 3840 ggacttagaa aattccaaaa ataaaaggca ctccacagta tggggccctc tgaggtgcag 3900 cctgggggca caagggtact gcctctcaga cccccatgtg gagagcccgc tggaagaggg 3960 agaggaggat tgaggaagtg gggagggtgc gagacctccg gagctgacac cctcccccac 4020 tcacccagac caggggtgag ctgggctcag catcctcatc tcctcgccct gtcattgccg 4080 ccactagaga aatggggaca gagtctctgc cttctctaca cacgtgcgtg gtctatgtga 4140 cgtggagtcg cactgggacc cgaatgagga catccccccg ccccttcgtc atcgtgggaa 4200 taccgtggaa caaggcgggc aaagggctga tcagctcccg tcccggcccg aagaaagctt 4260 ccaggggagg cggaagggcc attcgccatt ccagagcagg cgcgggcagt ggcccacggc 4320 tctgggcccg gatctgtgtc cacctctgga tacccaattc ccgccaccat gttgttggga 4380 gcaaggaggc acaactgccc gtggtgggag tggagggctt aggtccccat tagaaccggc 4440 agagccccga cggggccaac ggcggtgctg acagcgcgaa ctgcgtcagg ggcgaagccg 4500 agttcgtgga gcgccgttgc gcacaagtgc gcgggtcagc agggccctgg tgcctggaca 4560 cccccgggtg cgcgcggcgt ggctgccctg gtgccccagt gagagcatga ctgcgcgcca 4620 aatggaagtg ggggcgcccc ctggcctttc ctatacccgg ggccaaaacc gctgggaccg 4680 atatactgca ggagtccggg cacaggctga ggggaccggc ccgtgcgttg agcgcctcgg 4740 aggtgctccg ggtcatggtg ggtgctgagc gggaacacgg aaggctgtgt acacagcagc 4800 aagcaatgca cccgcgctcc cgtcattaca tcgcgccgcc ttcacccccg ctacgatgac 4860 cactccgcag atgggcaaga cgggctcaga gagatgaagt gactttccca aagccacaca 4920 gcgggccagt gaaggcaccg cgcacggtcc aggaatctaa cccttcctgg ggagtgggga 4980 gggaagggct cgacccgaag gggccaggcg gcagagagcc ccgcgtcccc cgccacgggc 5040 taagacgcaa ggcggcccgc cgtgtctcca cctgcgcgcc tcgagcttcg ctccgctcta 5100 gccttcgggt taacaccgct tccttccaga agcctaagga ggcccgggcg gatcagacgc 5160 ctcccttctc cgcagcccca tgccctgccc gcagcttgag ctcaccgccc ttctcggggt 5220 ggcggtgcgg agaccggacg gctccactgt gcagaccccg aggggtaagg ggccgggtag 5280 gggaggggag cgagaagtgg cgaggtgaga actgaggggc gaggctgaag gctgagccag 5340 acttccagac gccagagaga cgccaggtga gccgggcggg ggcgggggcg agggcggggg 5400 agggggcggg gccggaaccg cggggagggg gcggggcgcc cgggagggcc gcgagctggg 5460 aaggtcccgg gcggccggag acggtgaaga ggcggggccg agtcgcgtcc gcggggtccc 5520 ggacacagcg gagctggcgc cactgtcggg gttccgttcc atctaggtcg ggcagccccg 5580 cgggtccggg cgccgctgcc ctcctctacc tgctgggaag cgcaggccga gcagggatga 5640 acctggctcc agggccccag cggggcaggc agggcccgga ccagaagctg cggcaccgac 5700 ttcccactgc ccgaccgggc gacgcggggc ctgggagggg cgggtcggga tcagagcgcc 5760 gctgcgcccc ggaggccgcg cttcccgcgg cctgtgccga ggagcctctc cgcaaagaaa 5820 taaacacgcc ctgtctcccc gaccccgact cgggccggtc agaagtaggg agaatcacgc 5880 tcgggaaagg ggggtaggga acgacggggg agcctcggtg accagggcag atgcacgcgc 5940 gcgcgggatc ctcgtgcgcc gcgaagaggg acgagcagag gagcatcgga agaagacagg 6000 cgaaggggac cgcggagcag cgtaggcgga gccccggggg cacggccgag gctgcgcttc 6060 aggagtgtcc gccaggcgcc ttcccgggcg gttggcgaaa cccgaggagg cccacagctc 6120 tggcctgggg cgccgtcgtt ccaggggcct ctgcgcctct ctctggcgtc tgtctggacc 6180 ctcagagccc cgggatcaag gcgcccatcc tcttgatggc ggggcgcacc tttcgcgtgg 6240 gtcgggcgct gcagaccaag cacgccgagt gcgtcaagga agtgcccgga aaccaaagac 6300 aacgcacccg ggaccaagag gaggccgctg cgcgcaacct cccaaacact gcagcgaagt 6360 cggaaccacg tccgcgtggg tgactcgggc tggggagccg ggaggcggcg ccaaggaccc 6420 ttcagccctt gtccgtcctc cctgatatgt cctcgacgcg gtctgaggcc tccccagcgg 6480 aggcgacgcc ccggcgccag gtgccctggg tgggggaacc cggagggggc accacgacca 6540 gtggagaagg ggcggaggcc gggaaagctg cgtggaaaag aggaagggtt aagactgaaa 6600 tcattctaca gagaccacgt taatgggttt aaatgcgaac attctagcta agtagaaaaa 6660 aatttaaaag cagagtgcaa gctggaccaa agtgagaccc cgattgggcg tagataaacc 6720 tgcaaccaaa acagccccag gcagagattc agccgctggg gagcacaaac ccctaatgtt 6780 tcttggtagt cactttttga aacattttat tatggaagtt ttcaaatata aaacaaaatc 6840 gagggaggct tcaagtgaat tcccgtgtac ccacccctat cccacagttc ttaaaccgtg 6900 accaatctag ttccctctat tggcctcctt ttatttgtac taacttattt ttgttgcctt 6960 attataaagc aaacacagac acattttcac tgaatacata aatgcatttt cactgataat 7020 aacttttttt aaaataacaa tacggcttaa gttacaattc ccagtaaatc cacactcaaa 7080 ggcagttggc ttttgatgtt ggaagtgcag acgtatttcc atttgaactt cactgcaatg 7140 tccagataat aaaaagcact attacttttg taataaaaaa taaacaaaaa ctcagcccca 7200 cagctccaga acgtggcgag ggccgtttgc tccccaggcg gtgaggctgg ctcttcgacc 7260 acttagctgt tctcggcgcc cgatcctgtg tgtccttccg tgcatgacac gcagagctta 7320 gctctgtgag gacagggctg tcccctctcc ggcccaccta tgaaggggtg tccacctctc 7380 cgtttccctc cagggcagtc attcattggg tgatccgcct tggggacctg gggatcggcg 7440 agtccaggag gcccagcgaa cgaatttccg gtggctggga cccacttccc agcgggaccc 7500 tggataggca tgcccactct ggctaccaga agggcagggt ggccgaaggg tatgaagcat 7560 atgagtgcac aggcggggag gaacagcagc agcaccagcg caggagtagc ccgctggc 7618 <210> 104 <211> 2194 <212> DNA <213> Homo sapiens <400> 104 ttaaacccag tattcaccac tgggacattt ctatttgcct tcacaggaag ggaaagggga 60 aggcatattg gagccagcgc tcacagggca gaaccagacg agcctcactg gaggcaaact 120 gggaggtagg cgtgcgctgt ccgtggtgct gaaagcttga ccggcgcgag ctggagccgc 180 caccggctgc ctcggggtct cgccgggcct tacctgctcc gcgccctgga agcagatctt 240 gcagatgggc tggtggtgct ggtgctggtg cccagcgcgc tggtcgccgc cgccactgct 300 gctgctgcgg ctgctgcaca ccgagcgcgt ctcgggctgg tctccggcgc cccgccgctc 360 gcgctcgccg cccgcgccgg cctcagactc cccggggccg cctttcgctg ctgccgcctc 420 cgggaggcgc ctcggacctt ccccggagtc gccggccgcc gccacttcct ggccggcggg 480 ctgcaggggc aggggcggag gcggcagctc gtccgctccc ctgcaccgcg gggccacctc 540 ccctagcggc tcgcttggcc ccgcggcgcg ctcgggggtc tcgggggacg cgggcagcgg 600 cggcaggtag cgcggggccg cggggaccgg ggccggctct cccggcggcg gcgtcggcgg 660 cggcggcggg ggaggttgcg ggggaggctc ggcgtccccg ctctccgccc cgcgacaccg 720 actgccgccg tggccgccct caaagctcat ggttgtgccg ccgccgccct cctgccggcc 780 cggctggcgg gccgggctct ggctgcaggg aaagagagcg cggagggggc gggagggaga 840 ggggaaaagg agggaggggg cccggacgcc tggggctagg gggcgggacg gggaggggat 900 gcggaaggtt ctgcagctgc ggcggcggca ggcgcggccg ttcggtggag ccgccggctc 960 ggctctgatg gaggcggcgc cgaattcggc tgcgcgtgag agccgcgccg cggaaggggg 1020 ggccggagaa gcgagggggc gggagggagg agcggcgcgg cgggggtgac ggggcgcggg 1080 cgcggggtgg gctgggggcg cggatcagtg ggacggagtt cggggttcgg ctccgagcgg 1140 gcgggctgga agtgggggat ccctcagccg cctccacggg ccggccccgc gctcacgtcg 1200 gttccggggc ggatgacccc tctccaaacg gcgcagcgct gcggctctcg tgagctggga 1260 agtagggggc aggggagagg ccgcgggtcc agaaaccgtt actggatggg ccggtgggat 1320 gtggcgcggg ccgggtgggg cgcgacagtc tgagccgaga cccgcgtggg cttaagggtg 1380 cgcgaggcgg gtgccctggg cgcgcccgaa ctggctgagc agtggagcgg gaaagggcgc 1440 gggacccggg actgtaaccg ccacttccag gccctcgctc cccgcgcttg gagccctcaa 1500 gggcactctc agggatcctc gagagcctta aaacagaagt ctctggaacc tgtgtcctct 1560 ccctgtctgt cccgccctcg aatccctgtg tcctcctcac ccgctccctc ctgcagtgag 1620 catcccgggt tgttggtaaa gatcttggtg cctgggaggt cggagcttcg tctcctgaaa 1680 tggtttatac tagtgaaccc tggcgccacg ttctgtggct tataatcact ttcgtcgttg 1740 ccgcatgagg aagcaaatga caccgcccct taccctggaa aagtggctgc agccttcccc 1800 ggatcttagt tttactcacc ccgaagtcaa tttctcggta actccaccct gcaaaacctc 1860 tgtgggactc atcttcaggg cagagctaac agttttcttt ctggaaaaaa aaaaaaatcc 1920 ctcacctgca gggaactagg ctgagaatcg tgcacatgca gtagtttcca aatccgtgca 1980 gtgtgagatc ataaagcacc ggatttatat gcggcagtgt gtctatccga attttcactg 2040 atgtgacgct ttcagtcttt gacacaaaga cacagagcag tcatttttgg cagcgtttca 2100 tagccgaaga cccaggatca gaaaggcaaa ataacttgtt caaggttata gaactattaa 2160 caaagaactt ctgtgttccc tgaccagatt ttct 2194 <210> 105 <211> 1958 <212> DNA <213> Homo sapiens <400> 105 atgctgggcc acgctgaaaa tttgtggctg agagctggac cctcgtcatc gccacgtact 60 ctgtcaatga gacagggtaa cccatggtta ctgagctccg atcagttaag gggcagagag 120 cctccgctcc ccactgctct ataaaagaga cccagcaaag ggaccctacc agcttctagc 180 tctcagtctg cgcgagggtg taggaaggaa agcccaggac ctccggagca gagcacagca 240 gctgcagagg caaggccagc atgtcgccca acttcaaact tcagtgtcac ttcattctca 300 tcttcctgac ggctctaaga ggggaaagcc ggtacctaga ggtgagccac ccctggactg 360 acccatctca ccttccttgc gtgttagccc taggcggcag gcaggctgcc tctgctcgca 420 gccttttggg gttcgctgtt tcttccctct ctgctggatg ctgtcttgcc cctggtttcc 480 cctatcctgt tctccctcct tgcctctgag catcccagac tgcctgcctg ccttcctctg 540 gccgctgggg ataccctggc ctgatggaga gggtctaaga ccttcccgtc ttctccggac 600 acgggaaaac attacccctc tctctttatt cgctatgctg agtggcaggg agggtgcccc 660 gctcctggtc ccctttttta tccccagccc ttgaactttt ccggactgac ctatgtttct 720 tgccagctga gggaagcggc ggactacgat cctttcctgc tcttcagcgc caacctgaag 780 cgggagctgg ctggggagca gccgtaccgc cgcgctctgc gtgagtcgag gctgcccggc 840 tcgcgggcgc ccgggacgcg gggaaggtgg gactctgtgc ggggggcaga gggctcgcgg 900 acatctcggg gaaggggctg gccggaaccg ccaggggcgc ggtcccctta gctaaggatc 960 ggtccgcgga ggcgcgccag gagcgggaga gggtggcgcg cccggggcgc aggaacccag 1020 cgcagcctag gctggaagtc ggggcgctgg gcactacaga gcccgggaat ggggcgcgcg 1080 gagagcggcc gcccgaggac ggcgctgcgg cggctgcagc ccgggactta ttgccccatg 1140 ccctcctccc ccagggtgcc tggacatgct gagcctccag ggccagttca ccttcaccgc 1200 cgaccggccg cagctgcact gcgcagcctt cttcatcagc gagcccgagg agttcattac 1260 catccactac gaccaggtct ccatcgactg tcagggcggc gacttcctga aggtgaggcg 1320 cccacggcca gccaacctag ccggagggcg gcacgggagg gttggaaagg gctggggcgc 1380 tgcacccagc gtggggctgc tgagcgtagg tagccagtgg cacttcttag acacttcgct 1440 ggtgcccgag tcggagaggc gcgttcgagg acccccacac ggcgagaatc tcgcccttac 1500 ccgaagacct cgacccacac acatccagtg gggctggggc cggtgcctct ggacgctgcc 1560 atggtttaaa ttcccttctg ggcgctttcg aggccctagg aacttctaaa gacttgaact 1620 cgcagcgcgg aactctgacg caatccaggg ccgaggaaaa atgattaaaa cccaacaagc 1680 tcgagtgctg gggtccacca agcgggccgt cttggttaga aggcccgccc cacacgtctc 1740 acatctgagc ccgcctcgct cctgctggtc cacgctcggc agagccgttc cgagagcaca 1800 gaggctgtct tcagtgcgcg ggtgacccga ttttggagca gtaggggact ggctgccgag 1860 ggggcatcta gattgagata ggtgggaggg caggacaaga cccctaagct cactgcctcc 1920 tcgattccag tcgtcagact ccataagtat aacagggc 1958 <210> 106 <211> 9660 <212> DNA <213> Homo sapiens <400> 106 gattttgttc tcctagcact tctgggcttc atttttactt taactcgaaa ttgtttcaag 60 gtaatggtga atatatgttc taatggccta cacacacgca accacatgca cacctattta 120 gtatatttat tggaggtgct gtgctgtaca aagagataaa atgcacaaca gtgaaaggga 180 ccagaatgta gagcctactt ccaggagagc agtcgtggcc agaaaagagt gctcctctgg 240 attaacggag tcccctgggg cgcggcctta tggggatgtt taagtcccaa aggaagaggc 300 tcaaagcagg ttactcttcg tgaacttccc ggatcctcaa gttcccagct cttcagcccc 360 cttcccgccc tcccgtcctc ttctctttct tccccaacag ctgtcattaa ttggaggatg 420 gtaggcccgc tagatcacca tctccattca ccgccgatgc cccggggctg ctgcgtacag 480 atgcaagagc ctctcgggcc tctggggttg aagccccaaa agtcacgcgc cttagtactg 540 ctcccacacc ccaaactgcc agccagcctt ggtgttcttc agtccctgtg ttgcttggtg 600 ggtgaccggt ggaggggtct tcttttgggg gaagaacgtc ccaggcgggg cctttaactg 660 ggtgactgtg gtgcagatcg cagtttcaga gatccctccg gaaagaagcg ccgttgggta 720 gcagcttcct tccagcgccg cgtcccctcc ttgtcacgac ctgcgggcgg aggggaaggg 780 aacgagcatc tggccctggt tggcagagtc aagccgagga gcctcaccag gccctgacac 840 cctgcagcgt ggctgccaga tggccctgcg gggtggcatt ctggccaccg tgtccgaagc 900 ccgcgctggc cagtggtgtg tgtggcgcag gacccgaggg cgcgcccgcg tagcaggtgc 960 cgtagcctgc gccgtagggt gctccgctgt agcctccgta gcaagagtag ggcgacactg 1020 ctgcactgta ggggctgggg aaggcaggtg cgccgggccc ggggcccagg cagggcttgc 1080 catcgcgcac caggacgggc acagctactc ggcgcggcgt tagagggtgg ccagccagtt 1140 ccagcgactt gtcctggcgc tgtctcttgc atttgtagcg tcggttctgg aaccagatct 1200 tgacctgcgt ggacgtgagc tgcagcgcgc tggccaggtg ctcgcgctcg ggcgctgaca 1260 ggtaccgctg ctgcttgaag cgccgctcca gggccagcac ctgcgcctgc gaaaagagca 1320 cgcgcggctt ccgtcgttgc cgcgccttgg gctgctccga gcggccaccc cgcacgctgt 1380 cgccgctgtt gccaacgccg cgctctggca ccctggtccc gccgccgagg ggcgaggccg 1440 cgttcaggcc gggctctaaa agcacaggaa gggacacatc agcgcccagc ctaaggctca 1500 cctgagcggt tcctacttag ttttcaagac tttcctctcc ctggcagcct tcactctgcg 1560 caggctcctc ctccctccta ctgcccccga accctgtccc aggacgaacc ctgtcccagg 1620 actgtctcca tgttttttcc ctccaagctc tgtcaccttt atatgttact gctggaacat 1680 aaattgtgac aacctatggt ccctcgtgtg tgcgtccttt tcctaaaggt agactctaga 1740 taaagagtta aggcagctcc atttgcttct tagaatgtgt gtgcatgggc cgggcgcagt 1800 ggctcatgcc tgtaatccca gcactttggg aggccgagac gggcggatca cgaggtcagg 1860 agatcgagac catcctggct aacacgatga aaccccgtct ctactaaaaa tacaaaaaat 1920 tagccgggcg aggtggcatg tgcctgtagt cccagctact cgggaggctg aggcaggaga 1980 atggcgtgaa cccgggaggc ggagcttgca gtgagccgag atcgtgccac tgcactccag 2040 cctgggtgac agagcgagac tccgtctcaa aaaacaaaca aacaaaaaac aaacaaacaa 2100 aaaaaaaact gtgtgtgcat ggtaaacctt cgctgtgagg aacaagtgtg agtggaggtg 2160 tctatcagat tgaggagact ttggaccctc cttggaagta gagaaagaag gagaagaaag 2220 aggaagagga agaggaggag gaagaggagg aggagaagaa gaagaaggaa aggaaggaaa 2280 aacagagaga agcccgggtg tcaagaaggc gcaaactcgg tgacaggctc tcaggaggct 2340 cctgtctgcc tcattttcct tcgcagcccc aagcgcactg cagggaactt ggctgtaagt 2400 ccaggagcgg gagccttgag tgtctcctac cttcacccaa cttttgtgca cactcttgtc 2460 tttttgacgc agcgctccac caacaccagg gatgcatccc agctttcttg gatgtgatgc 2520 tttgtaatcc aaattaacaa tatatgatga aaacaaaata tttattggct cctgactttt 2580 ggctcagaaa ctgaggttct ctttgagaga tacataaagt tgaggtccac atttggcttc 2640 ttaaaaagta gcctctccct cctttggggt ctttctggca agcaggtggt gtgggcttca 2700 ccctgaagtc ttcctttcac ccagggcgac ccctacagct gagactgtgc ccaccaagat 2760 gcagcgtttt cctcccttct cacttctctc ctgtctgggc ttaaaccccg ttttacccca 2820 agggtggata gaagggaaat gctgagtttt catgggatct cacgccagga gaaaatcagg 2880 agcatggaag gggtgcaagt tcatggcaag acgggacagg actctaaatg agccagtgcg 2940 attggaacca gactcctaat acccaaggca ctggcacaat ctcctggagg gggatggagc 3000 tgtttggtat gtaaagtttg aggacagaac aacttccttc agagacgtct gtgctcagat 3060 aaactgaggc catctccact tgcaaagagg aaaaattctg aggagggttt gttttcttag 3120 cgcatcgaaa ggtaacaact gaccttcagc caggctgcag agcaaggagg accccatttc 3180 aaagtcacag atcatgcagg ccctggggct gcacagcacc gcagggtggg ccagcaccct 3240 gcgcccttct gttcacaatc ctggagttct tgagggcaag gtggttagct gcgatggagg 3300 aaggcatgaa gcccaccgaa ggtgtcttcc ctgtccggat cgctaccgcg gccttgggct 3360 cagttcctgg agccggcctc gggtccggcc tcgggtccct cctcggcggc gtccactgct 3420 gccgcagaag agacgctccc aggatttggt ttccagtggg agaaggaagg cgccgcaaat 3480 accatcggct gcgaggcgac tgtggtggtc gaaggaacgt gatcctttgt cagctcagcg 3540 gagccgaagt gatcgccgag ttggctgagc agcgccgagg gagtttagaa tccgctgcag 3600 aaaacctacc agcttcttcg cggacacagc aggtaatgtt cttaggcttc tggagttagt 3660 gagtagccgg cctgcaggcc ggtaaataac tccgatctag ccccttggtt tatttctttc 3720 gttcgcgcct tgaatggagg cgccatggca cagtctggca gaggaggcct gccctggcgg 3780 gcgctactca gggcccctgc gttgagaatg ccgagtgagg tgctgaggtt tggagagaaa 3840 aaggtggcgt tttcatccct tggaatatcg ggcctctcca gctgaagcct ccggatcgac 3900 acaacacaac tcccggatcg acgcaacaca actccccgcc agccccttcc cttccagcgg 3960 gctggacaca ggtgcgtggg cctcgcagcc cggcgcgcac ggttgcgcct ttggatacct 4020 gcgacaggac tcggccagaa ccgtgtccca gggcagagaa aaccctggca acctttaacg 4080 ttctccctga cgcggagaat cctgcgccaa cggggccttc cacttcggga gactcaatcg 4140 ccacccggtc cccaactttc gtcttccaga agaaaaatcc atgaggagga atgggggggt 4200 cccccgacca gaccagcaag aaagggccca gttaggagtg acctcagcgc cacgagggtt 4260 ccactgcttt gatggccaca cgcttttgca aacggtttgg gggtggagag acaccaggtg 4320 atggtaggga agggcggtgg tgactggcac ggctaagaca ctgcggaggg tttcgctgtg 4380 gagatgagaa ggtggaggtt ctgggcactg tggctgcgag tgtgagcgat gcgtttgtgg 4440 gaatcagagg agcggatttg ggaaaagtga atccttgaga ttcagggcct tactttcgtt 4500 aggggtgtgt gaagcacact gggtgtcagg agaggatggg aatgggattc gagaggcctt 4560 tttttggact cctcgagaga aaatggagag agtctcgaac ccaggagata ggaggcgtat 4620 tttccccatg cacccatgga tcacgccccc gcccccacat tccccccgta ggaggcaaga 4680 cctgagcgct tactcacgtg gctcccccat ccgttccgcg tccatctcca agactgcctc 4740 acagggaccc ccaggaggct ccgaaccatc cagctttctg tcaccgccgc cgccaccagc 4800 gttgtgaacc tctgaccctc gcggctctgc gtccattctc aggtactgaa agttttccgg 4860 gctcttccgc acccgcggat gtggcgaagc cgcggggcag ctccgctcgc gctccagtcg 4920 caggatgtcc ttgaccgaga agggggtgga ggtgacgggg ctcagcagca tcccgaaggc 4980 ggatggggcg gggccgagga ggtccgggtg aggagcggca ccctgaactt cccgtcttgt 5040 cgctgcaggc cccgcagaca gacccaagct ctgggacaga cgcccagcgt cccagacagc 5100 gccttcctct gggccatgct ggtaggcccg ggtccagggc cgggtgacga gaccgtagcc 5160 ccccattggt tctcgcagaa accacgtgct agctctgcac cttcctcccc cagcgctttc 5220 ttcccgcgcc cgtcgaatcc tctccagtcc ccagtcgcct tcctgggagg tttggttcgt 5280 attgacggtt ctcaaagcaa agaaaacgtg gagagacagt gctgcgcgcg gcttggatct 5340 ccgtcaatac ggtactagcg ggagcttccg aggtcaacct agggtccacg gggaccctcc 5400 tagtggacat gcggggattg gaggtggagt ccttgctgtg caacccgatc cggtccatcc 5460 agcctggtct tagctcaact ctgcattctt atggcggagg aaagctaaga tagagacagc 5520 tgggacccgc ggaatttgag gcgcgcgctg ggatcttacg tgcgcagagg ccggaccgca 5580 gagtagaagt gagtcttgac ccaccagggc ctatattgag atggaaacct ctctctttga 5640 acagaatcca ggtctgcgga gtcccgaccc gccacttcct aggagcagct tctcagcccc 5700 aggaccgagg aatgggtgtg ggggctacat gtggggagcc ctcgacctct taaagggctc 5760 cgcgaatggt gggggagact ggaaggcaat ctctgcggcc cgcgcaaagt ggtcagaggc 5820 gggagtgggg gtgggggggg gtgggcttcc gtcgcccttg gcgtccccac gttctttttc 5880 ttcctctcct ttatcctcct taaagcggat tgcctggagc gtgccagctt gtgtgcgcgt 5940 ataaatgcgg cgcccgccga agggctggga agatttgact cgcattagat ctccagaaaa 6000 ggcccttggt tacggcgggc accgagtaaa tggcgcagtg tggcacaaag gttaccaaca 6060 cggagatagc gccaacagat ccagcccctg ctgttactac tcctggatca gggaaacgtg 6120 atttggtgtc agctgttcca gcactgaatc gaagagggtt taaaaattgt gttttaatca 6180 caatgggatc tcattagagt tcttttgggg atttcagatc aaatgtttct ttttgttttt 6240 ctttccttcc tttccctccc tccctccctc ctttttcttt ctttcttttc tttctttctc 6300 tttcttcctt tttttttttt tttttggtta cagggtctct ctctgtctcc caggctggaa 6360 tgcagtggcc ggatcatggc tcgctgcagc ctcgacccgg actcagtgat cctcccacct 6420 cagcctcctg agtagctggg accacagatg cagccactaa gcctggctat ttatttattt 6480 atttattgct tgtagagccg gggtttcgcc atgttgctta ggctggtctt gaactcctgg 6540 gctcaagtaa tgtgcccacc tcggcctccc aaagtgctgg gattacaggt gtgagccacc 6600 gcgcaggctt caaatgcttc ttaaacctac ttacgtgaat tcaatgttac aacagctgtt 6660 tgaatatgat tatctcctga aattcagata aacccaactc atctccccag gctaatgggt 6720 gcaaaattgc acacaaatat ttatgcaaaa tttcagcaca tttgatcatt cagctacaaa 6780 gtaatgattt cctatacatg gtaacattta atcttcacat caaagctata cccaaatatt 6840 tccagctgct gctccttctt cttcttcctc ctcctcttct tcttcttctt cttcttcttc 6900 ttcttcttct tcttcttctt cttcttcttc ttcttcttct tcttcttccc ctcctcctcc 6960 tcctcctcct tctccttctc cttcttcttc ttttgttcag cgaggagtcc agatcagaga 7020 ggtggcccag atagttcacc aaatggcaag accagactag cctctaaacc aagacaattt 7080 accctgtctt tctttctttt tgaaatatac atcctttgct cttagagatc tcaaaatctt 7140 ctgatgaccc atacatttat ttgaattttt gtttcctgat aaaagtcatc atgcgcacct 7200 tggaaaaagt gaagaaaagt taaaagaaaa tatccaccca gagacaacat tttagtggac 7260 cttcttgtct ttatttctgt atatatgagc tcatagggta tatatgtttg tatatgttta 7320 aatttacatc ataagcatgc ccagttcatc tttagaattt tttaaacaaa tataatttaa 7380 aataggaatc taatatttca tgttattgat agaccgtagt agactgtgtt tgtattttta 7440 gataatatct ttttttatca ctgtaaataa gactttattt tgtgccttca attttcatcc 7500 ttgtcaatat tttctgttat tttctcagga tacatatgta gaagaaacat caatcagtca 7560 aatattttaa tgctcataag acatgccatt ccagggcttc ctagaaaaac agtattatcg 7620 tattttgttc ccggaggtgc aggcgagtgc ctggtctacg ggtgtttaca atcatcaccg 7680 ggcacccaca agagaccctg aacttagaat atttccgcgg taggagttcc gcctcgtcct 7740 tccaggggat actgacgact cgctgggttc tcgccttcca agtgctggag gggggaagta 7800 gggccacccg gggtagaaac ctaacgccag aaaccttcca gcgccttatc agttggtgga 7860 attttcgtgg cagacagtcg cgctctacct aagtcgtaga agaaaagaca ccttgtgggg 7920 gacttggcgt cggaagcctt gagttcaaat cgtagcccta ggtccccagc cttgcccttc 7980 ctggcttgct gcgaggatga aatgagattt ttgtacgtga aaatgctttc taacccctct 8040 cgaggggtgg aaacgtctcc attcgaccag agtccgggtc tgcggagcaa tttacccgcc 8100 gctttccaag agcaggctcc ccagcgtagc gagtccttgt tatggaaagg gtcgtttcgg 8160 ctcaggatgc gcgctcccgg cgtagacctg gggatagggg tccctgtcgc gctcgcccca 8220 cccctgcagg gagcaaggcc gtccttctgc agcaccgcgc cacgcggcgg gaatttgcag 8280 tgtcctgctt tctggtttca gcttcttcgc tcgcttgggt ctctctcggt cacctctcgg 8340 aggggcctgg agtccctcct ccctcctcct acttcagcgc cagaagcatt gaaagccgcc 8400 cgcccgccga gagtggaacc ggtacctcga atctcgctca ttccgggtca attggaggcg 8460 cattagcggc tgccttgcag tgcaacagag gctcgagtga caggccacct gcctaagcgc 8520 tggcgcccag gaaagccggg gaggaaacta ggaagggagg cgacagcaga aaagccagag 8580 agtccagaga ctcctaggca ggcctccgtg cagccccaac agcgtggtgc cgggaggtgt 8640 gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtcccttact caggaatgga 8700 gacatcgtga tcacctctgt tcttaggtga gatggagacg gccgtgctag gggtgtgatt 8760 gatccgcttt gcttcactca ggtccgcaga gtgttttaag cgcctaccgt gggccagctc 8820 tgcccaagct ctgggaatac tgagaaaatg agaggtctca gccttcttat ccgaacttgc 8880 attcttgcat agaagacaga cttttaaata attcccatac attgtgttac cttgcacaat 8940 cagacggaat ttgtacacta tatttattga tttttttttt ttgagacgga gtttcgctct 9000 tttgcccagg ctggagtgca gtggcatgat ctcggctcac tgcaacctcc gccttttcgg 9060 tttcaagcaa ttctcctgcc tcagcctccc gagtagctgg gattacaggt gcccgccacc 9120 acacccggct aatttttgta tttttagtag agaccgggtt tcaccatgtt ggccaggtta 9180 gtctcgaact cctgacctcg tgatctaccc gcctcggcct cccaaagtgc tgggattaca 9240 ggcgtgaacc accgcgcccg gccctgaacc tctacttctc cgtggttaac aaaagtcatt 9300 atttcctgtt tctttcactc tcctgaaacg aagggattcc ctccagcaag taccatactc 9360 aacaggcaat tcctggtaac ctcgcggctt agtgggccct gtgggccgag gtgaaatcag 9420 tcctctttaa cccaagtgca ggatccccgt tagactagac tagacttggg ctctgggtct 9480 gttgtcacag ctgtgtcccc aaggcacgta gtaggtcttt aacaaatatt tattgaggac 9540 aggtatctgt cctgcttgat tggggatagt tcctaggata ctctggggac tgtcccaaag 9600 ggtgtctggg gaccatcaat ggtggcaatt tctgctttgc cacggtccct tttgctggga 9660 <210> 107 <211> 1451 <212> DNA <213> Homo sapiens <400> 107 tttttcttta aaaagactat tcttttccat atcaacgatt tcattttgga ggcagtcgct 60 gagataatct caggtgtaaa ataagctaat taaacacacg ccacttaaat actgagatta 120 gctggagctc aggttttcag agcaaagcaa gagcacaaat caaccccgct gagttgctgc 180 tactcctgag ataacccgac cccatcacgg agattcccag gtggctgcga acgtcaacgc 240 ttagcaggaa cgattaagcg attcacagca ctcaggggat tgtgtaaatg cccggcccgg 300 gcgaccagca gggacagatt caactccccg ggcgcaaagt catctccagc ccgatcctcg 360 ctccccctga aaacccaccg ctcgtctccc cgggagctgc ctccgtagga gaatgttcgc 420 ccccagccgc gccccaactt tgccttgcgt ggtcccaaac tttccctggt ggattaatag 480 gaaaataaat ctaaaggaca gacgccccac ctgtgagctt ggagctgggt tgcatttggt 540 gaggcgcttg gcccgcatcc ccctgagtcg tttgtaggtg gctggggaat ggaagcgccc 600 ctctgcgcgt ctcccccgac ggcaggccct gccccacgcc ccccatccca agccaaaagc 660 aagggtagga gaggcggggg ctccaaatcc acgccccgga gcacagagag ttggctaact 720 cctagcgggg cctggggcgc ccacatccac ggcagagcca cctgtgagcc tgcagagcag 780 caacgggatg cgcgcaaccg ggatgcgggg acgaccgcca cagcggctac agcggcaggc 840 ggggcgcagc cgcccgcact taccaggata agatgggagg acgcgcacac ggcggggccc 900 ccgagcgcgg cccgccgctc cagtccgccg gccctccgcc tacccgctct gaggcccggg 960 ctctggctcg cactggctgc cgctctcgcc agccgggctg ggttcgggag gagactgagc 1020 cgctgtgagc ccggcgctcc gagtctggcg ctgcccggcc cccgccggcc cctccctctg 1080 ggctgtgcgc tgtgcgctgg gagcggggcc gcagcgcgct cagctcccga gtcctttgct 1140 ccacgcctcc tgggcgcaga ggcgacgctg gcagccgtct cttaggagat ttctccgcag 1200 tgtggacggg ggtcaggatt tgcaggcgag caagggcaga gaggagaaat cgtacaggtc 1260 ggtgacgcgc ctaattcaca aagcctgaaa gtgctgtcaa ctttggggtc atcttatgct 1320 gggcaccgcc tctccaatta tctgcaaaaa gtgatagcag tcgcgctttt ctttaggagg 1380 cgatgtgatg tgtaatggtg gaaaagacgt tcaatgaaaa ggcacggagg cctgcaggac 1440 aggctgttgg g 1451 <210> 108 <211> 1242 <212> DNA <213> Homo sapiens <400> 108 ccgaataaaa aatataaact ttgacaggca aactaagatg ctttcatgca ttttatgcta 60 aaaccgtacc aactctccgt aaaactcttt acctgcgttc gccccatccc ctggttcgca 120 ttgttctcag taatgaagac ctccttgcct atcactaaca ccaattagct tacaccaaac 180 ttcaggacgc caaggaaaag gaaaaatcac tcttccagca gcggtcattt aagaaaaaaa 240 aaaattgata ataatgtgga actccctcca aaattagcct acaccgtgat ataaattggt 300 tttctttgtg atctaaaatt gactcgcagt tgactagtta gaaaatagtt gctgaaaagc 360 cggggccttg gagctttcgg atcctgcccg cctttcatca tgtaaacaaa cgcatcagat 420 ttaaagcttt cccataattg ttatgctaac cttggagcgc aacctctcca tttgcatttg 480 aaggagctaa atattaggca ggaaagaaag tgctcttttt gaaagcctga gaaaatgtcc 540 ccgctcgggg ctgctccgcc atctgggccg cgggctgggc gcgcggctcc cgcccccagc 600 tccttggcag aggcgccgga ggaaggggcg ccgcgaaggg ccgtcatctt gttggaaaag 660 aatgcagaaa tgccccccta aggctgaatg agcaccactt ccacactcag ggcgggggag 720 gccgggggac gtgggagcgg cgcgccagga gcgaggcgtc cctggtgaca gcgcgtcccg 780 agggctctcc cttttcccag agcgcatacc aaaggcagac tcctttgcag gctccacgag 840 ccccattcgc ggtggaaagg ggcgttccag actgcagggt gaggggctcc ggtgtgtgtg 900 tggtgtgtgt ggtgtgtgtg tgtacgcgcg cgcacgccct taaggaaaaa tccatctttt 960 ataagtgctg tggcccactt ttaactggat ctcgtggagt actcagatac agccggtata 1020 gtgaaggcta atagcatcag cacactttcg cgcattaatc ttggagtaat taaaaataaa 1080 aacagtgagc tatggggttt tgttaaacaa gggagaaaaa aggttccaac ctcccatcag 1140 cctattctgg gggaatccag agagcccatg catccctcta cctttccatg caacctgcac 1200 acaaagcatg tctatcggga gtcacgggga aaatcattcc tg 1242 <210> 109 <211> 1206 <212> DNA <213> Homo sapiens <400> 109 gagagcagca ctcatttctt cttatcattt ctgaactgcg agacaaagaa ctttaatttt 60 ggggctagaa tttaatttgt ttttgagaat accgaatatt accaagcaac gccagcacgg 120 atataatagt agtgtgaggt ttgcacacac gcagctgaaa tggtaaattt aaaataggag 180 acactgtgtg cacgtatagt gtgtgcatac agtatcaaga cattctttgc tcctggagtt 240 ttctctgctt tgccaaactt cacgcccctt ttggaaaggg ggagcgaatt ttccaagttg 300 tgaggatact tttcctccat ccagccacac cctcttccgg gccagtcttt ggtgaaacct 360 gggcgatgtg gagtcactgg gggatgtgag tgagggcgtt tttgctcatc ttaacccagg 420 tctctgggag agcctttagg atcgctctgg gacttagagg aggttccgtc ctgggccggg 480 agctgaggct ctccggacaa acgctaagca gctctcactt atcggtgtcc aataggcctt 540 atataaagtg ccaaagtgcc ccagcaaggc tttaccagca cctgggccgt agttgtctcc 600 tggctcctgg ggtccgcgga gctctagatg tacctgcagc tcctcccgag tcctgcaagc 660 cacccttgtc cctcttctcc cgctcacccc ccggcccccc catctctttt gctattccgg 720 ggaaggccac gcagggtgca acccggacgc gcccccgggg gaagcccgcg acgcagcagc 780 cacaccccca gcctgcactg gcgcccaccc catgacttcg ccttcgcggt cgcgggcagg 840 gagcgcgcgt ttccatcggt tgattagaag cgggagtcgg aggagccccc gcccgccggc 900 ggccagcgca cagcccggcc aggggcgccc tccctgccgc cgccggccct ttgatcgccc 960 gcggcccgcg gcccgcagac cacagccagc gctgtgctgg gcaggtggcg gcagcggggc 1020 gcggcgcgct caggcgcacg ggtccccggg ccgcggcgcg ctccccgcca cgccgcacat 1080 caaggcccgg ccggccggcg ggcgccttca ttagcagcct gaaattataa tattatgtta 1140 aagaacaaag ctgctccccg gaaaaatatg tgctgcatat ctgacaaaga taaattggat 1200 tattca 1206 <210> 110 <211> 2308 <212> DNA <213> Homo sapiens <400> 110 ctagttctaa agtgcagtgt ggcattagcg aatgtggtgg actccggcag gcctggggca 60 ggggaatctc cggtaacatc cctcagtacc gaaggcagga tttcccggcc acttccgtcg 120 gttggaattc tcttaagcat tgccctgagt ctattttcaa atgaaagggg gaaaaaccca 180 aaccagatta gaatctgaaa cagctgaaac agctatcgat ttccagcttg ctttcaagtc 240 tggcagagac tgtgaaagtc ctaacttctc cgcgatgtca gccacggccc gcggcggtca 300 cggagccact tcagcacctc gcgatggaca gtgacccccg gcgtggcgcg agttccctgc 360 ggtccccacg cgggcctggg cggcgggtcc ctccacggct ccgtccagac acccggaggc 420 acctgccaaa gctgcggagg tggacgaccg ggcgtccaag cacgaacttt ctcgccgagg 480 cacggctgcc gggctccgtc ctgagggttt ggggcggcga ggaccgccgg ggaggagggc 540 gcgcgagccg gaggccagag ccgggccggg cagggcgcgc ccaggagcag gggagacggc 600 gacccgggcc gaggcgggac ggggacacgt tacctgcccg tggagcgcgg ggaaggggtg 660 cgcggcggcg gcggcggcgg agtctggcgc agagggcagc ggcagcagcg ggagcaccgg 720 ctcgctcggg gccggccagc cggggagacc ggggagcagc ggggccgcgg gcggcggggc 780 cgaggcgagc agcaccgggg gaaccacgac ccccgcgctg agccggagca gcccggccga 840 gcccggcacc atccagaccc agggcggcgg cggcggcggc tctgcgtcca tcggccagag 900 gagaggctgc cgccgccggg gctgctgctg ctgcagctgc cgccgccgcc gctggaacct 960 ggcgcccgcc tgcatcctac atccccgcgc tgacggcggc ggcgggggcg gcgggcgccc 1020 gagatgctgg gccggcggcg gcgcggctcc ggagcgaact cacttggctc cgcggcgcgg 1080 ccgctcgctc cgcccctgcc ccgcgcggga agctcctcct cctcccgccc gcgccgccgc 1140 cgcccccgga cccggccccc gccccggtcc ccgcccgccc gcgcccctcc ccgccggacc 1200 ccgccccgcc ctcgcgctcc ccggccctgg ccggggtctc ctccccgctg cgcccctgga 1260 cccgggcggc cgcggaggac gtgggtggga gagggccgag ggcgcgcccg gctgggctcc 1320 cgccgatgcc ggccccctgg tggcctctgg ccctctggga cccagcgcac cgcgagggag 1380 gctccgggct ccgcactcaa gggcaagcgg aagccgaggt ggcggcgccg gagccaggca 1440 tgtcccgctg cccagcgcgg ggctgagggc gcagacgggg accgcgcgag ccgctctcta 1500 cctggcctcc tcggagtcca gggcgcggag ggtactgggc tgcggatccg gcgcaggcgg 1560 ccccggacgc tgctaggcgc gggcggattt ctgttgcaca aatgggccaa acaggttcgt 1620 aaggcccccg cgggtcccct ggcccggaag ttgagccgcg ggtgcctggt ctgaagttcc 1680 gcgccccaca gtggcccgcg ggcctcggcg gctcctgccc tacgccctcc aaggcaccag 1740 gcaggtggcc ccagggcctt tgcccacgac accccctggg tggggcagga ccacccctct 1800 gtgaattcgt cctggatgcc cccaggcaca gtctgtactc ctccctcccc cagcacacgc 1860 ggcctctgac gctgcacgcc gagcttcctg ggacccagga cgaaccgggc tccaaggacc 1920 ctcgctccgc ccggaccaca cgcaggcagc gccggccgag ccgagcctgg gtccgcactg 1980 gccacgcgca gccaccgcca gacggcgcta gccctccccc gctgtagacc ctgcttcgga 2040 ggccgccagc ctcctcccca tcccgggtcc acagcttcag tgcagcccct ggcgacgcgc 2100 gctgacagct gggcagagac ttccgtgcgc tgtaaacccc ttaggtcgct aaacccagga 2160 aacccaagca cagctaatgc cagcgcgaga ccagtgttgt tagaggcatt tgaagggtct 2220 ttctggatgc aaaaggcagc attatgatcc atgcatttaa gaacttgcat gaaaaaccct 2280 ccctgacctg ggtgggagag caggcacc 2308 <210> 111 <211> 2201 <212> DNA <213> Homo sapiens <400> 111 tctccctttc tgcatgtaac cccgggcgag ggaaagcaga acttgggggg agactgtaaa 60 acccagagta aggtggaccc tgggcagagt gggggagctc acacctgcaa gctgcgtgca 120 accgaaaggc tggcgacctg tagcttgtca gattcagata tggtgcaggt gagggcctgg 180 caaacattta gtttaatttc tgagaccgtt agagacaagg ttaaattcca ggtgaacgcg 240 gttccagagt ggctgggatt cccactctca gatgggaacc cttcagacaa gagtaaaaca 300 ggagggactt cttcgccgcc cgccctgcgg tgtgtgccac ggaggccgct gggtgggggc 360 gtccaaatgt ggaagcgttc ctccagcatg cgtggatatc ctgaggactc acggacaccg 420 attccctctt ccgggcccag acgtcctaat tcccgtcccc cttgaggtga gatcccgttt 480 tcccccagcc aaagggactc cggagccgca ttcacctgac ttggctgcca gcgcccgcct 540 tcctcgagtt ctcagggcaa ggggctgtgg tgcattttct ggggatggtt tgtggatgtg 600 gaagagggaa atcctttcag ggattttagt catttggcaa ttggtgattt tcatatgacg 660 tgctggtttt aggggccaac tctgataagc tgggacgccc tccccttgat tctagaacag 720 aaggcatttt gggctaagga cgctcacaac ccggtttcct gtcccgcgtg gttcatgggg 780 cttgccctgg gcctgggagg ccggtggcgg gagcctcccc tacagtgagg tgggtggggg 840 gcgccacacg gcgtctcagg gagaggggag aggcggcttc tgttccggga agagggaacg 900 gtggaggccg ccgttctctt gggcgcggcc tctgctgggg gacggcgggg atcgcagggc 960 cgaggggccg ggcgcgcgcg ggggagggac ccaggccagg ggccgctcgc ctcggggcgg 1020 ggtctctgga gagcgcgcag aggggacgct tcgtgaatgc ctgccggcct gaaggatgtc 1080 gctgatctct gcccccttcg ccaaggccgg gccaggcgag taggggcgcg gcctgagccc 1140 ctgcggtgat tccccaggtg tggaatcaaa acagatccca gagcgcgatc cgcggggctt 1200 ttggaaggag ccgcccaggg ctggagattc cgacgcaaag acccggaggc ccgcggagct 1260 gtgggcgcag ctggagatgg cggaggcccc agcagggagt gggggctcgg ggtccgcaga 1320 ggcagctcca tccccggcgc tgggggccgc atggttcccg caggctgtgg ccaatcgagg 1380 accgggctcc gcattcttca gacgttcctg agccccctct tgccccaacg tccccctccc 1440 gggcagcccc acagtgggcg attttcccgc actccgcacg agtccatccc catggtggac 1500 taggggccgg gtctaggctc tgcgctaccc ggccagagcg tccagcggcc ccactgggcg 1560 gcggcgccac gcggacgtgg gtgggaacag cccccggacc cgccgggaga ccctcgcggg 1620 gaagagaagc cgagcagctt gggggcgccc cggcagggag ggacgtgcgg ctgggaagag 1680 ctggcaggtg gcacccgacc cgcagcctgg tgagcaaggt gccaactgtc cgcccaattt 1740 cctgtccttg cagtaaaact gtaaagggag acatttagct cggcaggaaa ctcagagcta 1800 aattttgcaa tttaattttg caatttaatt ttaattaaaa acaaaattat ctttttttaa 1860 tatgtgtata tatatagaga cagcaagcga actgatttgg gaactttata tatatacata 1920 tatacgtata tgtatataca tatgtgtgtg tgtgtacata tatgtatgta tatacgtata 1980 gctgatttgg gaacaaatag ctgctcactg tgtggaattt ctgaacattc acaaaagtta 2040 tttaaagaaa gtaaaggccg ggcacggcgg ctcacacctg taatcccagc actttgggag 2100 gccgaggctg gcggatcact tgaggtcagg agttccagac cagcctggtc aacgtggtga 2160 aacaccttct ctaccaaaca aacaaacaaa caaacaaaca g 2201 <210> 112 <211> 3047 <212> DNA <213> Homo sapiens <400> 112 gcatcggcct tgcactaagg cttcatcctt tcactccctg aacagctagc aaaacacgaa 60 gacaaggatg ggaggaaagg cctccctccg gctttgacgc cttgctccct cacgaaccgc 120 tttcagatgt acggatcccc ttcaggcaaa aagaaaaaca ccactaaaag aaaccagtca 180 cccccatttc agtgtgcaga taaagaacct ggagttagac cctttcctcc atcggctggt 240 ctctagctgt ggttgggcac tcccgaaaga tagatggaga gggagccaag cccccagggt 300 tagggcagta gctggccggg cggagctctg ccaggagcgg gtctgggagc tccaggatgc 360 ctggggcgtg agcggaggga gggagtaaag ccgcgctcag ttccctctct gccgctgcgc 420 gtggtccgcg ctcgggctcg cttgccccct ctctagccca aagccccatt cgcagcgcct 480 gggctggtcc cactcatctg cgccaggtgg aggggaaggg gaggaggtct aaaggtgtgg 540 agtaagggag ggagaggaga aaggaggaag ggagagactg ggcacttcaa gggtcagagg 600 aggaccacct gtggtcacag ccatcgtcac gaccccctgc cgcgcccacg cacgcgtgga 660 tggggccagg ctctgggtgc cacctgggag gagcatccat tcataatccg gatctgcccc 720 cgcctgtgcc ttttctcctc gtaactccca ccccccatcc ccgaccccgg gtctctgagc 780 taggtttctt aaggggaaaa catctctggc accgtttgtc ctggtgaaat caggtccctg 840 ctttatccag ctcagctctg aataataatt attgggagga caggaagcaa caaggtaaat 900 caagaaagtg acaaggaggt gggcgcagcg gctcacgcct gtaatcccag cgctttggga 960 ggccgaggcg ggaggatcgc ttgagcccag gagttcgaga ccagcctggc caacatggcg 1020 agacccgtct ctactaaaaa tacaaaaatt agccgggcgt ggcggcatgc gcctgtaatc 1080 ccagctactt ggcaggctgg ggtgggagga gcgcttgagc ccgggaggca gaggttgtat 1140 gaaccgagat ccaaaaataa aaagaaggaa aagaaaagaa aaaagaaaca aaaaagcgag 1200 gaagcaagaa aagcaagcaa gcaagaaaga aaagaaaaga aaggaagaag tggccactgt 1260 ttctgtgctg tcgctgtgct attctcggca cacctgggcc caacctttcc attccttacc 1320 tgtgttttct tccatttgtt cacgtctaga aatgtattca agtgaacaac agtctgggat 1380 gtaggtatat tatttaatct acactgatgt ttagcacagc tatttgtaat actcaaaaaa 1440 ttgtaagcta cctgtttcac aatagtcgat tgattgtaaa tcatggtaat tttttttttt 1500 tgatacgcag tcttgctctg tcgcccaggc tggagtgcag tggcgcgacc accgcctccc 1560 tggttcaagc aattctctgc ctcagcctcc cgagtagctg ggattacagg tgtctgccac 1620 cgcgcctggc taattttttt gtatttttag tacagacggg gtttcaccat cttggccagg 1680 ctggtcttga actcctgacc tcgtaatgca cccgcctcgg cctcctaaag tgctgggatt 1740 acaggtgtga gccacgcgcc cgaccaatca ttttggtcga ctttaatggg cacgtttcaa 1800 gtcattttac cggagaatac tatcaaaatg aaatgctcac tacacactaa atggggggaa 1860 agctgtttac agaacagttt ctggtgaaaa gagaaaacac gtagacataa tctggatggc 1920 ggagactgaa gagtgattat ctctaggtgg ctggatgctg ggtataggtt ggccgcaatg 1980 ttatttttgt aaggctagga gaaaaacgtt attttaaata tacggaattt gctcctctcc 2040 aaatccactc tccctttcgc ctccctagag gttgtcaggt tcaagaagcg gcccggagtt 2100 gcaggaaggg cgccggcgtc actggcccca agagctcgga acgcgcgcgc cgcaggagtg 2160 ccggctgcgg ggtcgggttg agactggcgg gaccctcggc ctctgccggg gtgcggaagg 2220 tggatgctac gggcaaaggg gcggggcttg cggttcccag atccagaggc gggttgggga 2280 cgtgagccgg cgtccatgtg ttctgcaccc cttctcgccc ggtgcctctc tcaaggcacg 2340 ttttccaaag tgtgttgaat tcgggaatcg atcgaaaatt tcaaggccaa ttaaatgccc 2400 tctgatgtag agctccgatt aggcccgaaa ggcttcaaac agcccctcta gaccctcgag 2460 ggtcttcgcc gcggtaacct taggcgtccc ctccccgaga agtctccctg aggctttcac 2520 agagggcggg aggggctgcg ctggggcctc cgttcccagt gcccctgact ggtggggagg 2580 gatggcctta gtgtctgaga gcagagacca gattgactcc cacttgagac cagaaaacga 2640 agaggaagcg gaacccgagg tggctgcggc tcccccggga cacaaccggg agaggaagtc 2700 ctggccatct gccggccccg cctgggggca tctgctcgag gatccctggg agccgttatc 2760 gtattcctca gaatctgccg tgctgtccct ccgcccccaa aaccaacagg acacccattc 2820 tgtgattctc ttcttctcca tcgcccagtt ggaggctgct ggggaccagg agaaaaaaaa 2880 tgcctttccc gagttctcta attcaaatgc ttatcagctt tgcacaccat tcggcctttc 2940 caaaagggac cagaaaacaa agatatgcta atgacaaagg ataattgaga cctcgcctgc 3000 cttgcatatt ttgttcatag aagctgtagc aataataatg taatcct 3047 <210> 113 <211> 7316 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 113 gtattgtttt gttttttatt gttaatttaa tttgttttta aatattattt ttttttcgta 60 gagtgttgaa gatgaagaga gtttagcggt ataggggatt tagagtttgt ttttttgttg 120 atttagtagt gatttcgttg tttgttatga ttgatgtttt tagaagggtt agggtttttt 180 taatttattt tttttttatg tatttttgtt tgatgtaata gttttgggga tttttacgat 240 tacgtttttt ttttatttat tgtttttatt tttatttatt tatttatgta ttttttagat 300 tttattattt aggttggagt gtagtagcgc gatttcggtt tattgtaacg ttcgtttttt 360 gggtttaagt gatttttttg ttttagtttt ttgagtagtt aggattatag gtatgtgtat 420 tacgtttagt taatttttgt atttttagta gagatggggt tttattatgt tggttaggtt 480 ggttttgaat ttttgatttt aggtgattta tttatttcgg tttttaaatg tgttgggatt 540 ataggtatga gttatcgcgt tcggttttat tgtttttatt tttaggagtt taaatttata 600 atttgattta ttggaatgtt tataggagtt tatgaattat ttgagttata tggatagttt 660 gtatgagttt aaggttattg tagatattat gttttagata ggcgtgttat agtgttaaag 720 tttttgttag gtagtttgta gaatagttta ggtttcgtga attatgttat tagaatatta 780 ataattaatt ttgtttaatg ataaagtttg aaatgattga aaagggtagg atttaggtaa 840 gtttgaaaga attttttatg cgataataat aattttatta tgaataataa taatgattat 900 gtattgaata tttaaattta agttatgcgt ttggtattat attaagtatt ttttttatat 960 tttgttattt aatttttata ggaattttga ggttagtatt attttaattt tatagagtat 1020 gatatgacgt tttagagagg gtaagtagtt tgttaaatat tttatagtta ggaagttgta 1080 ggattagttt gtgtttttaa ggattggttt ttggttgtta tatatagaat taagtttggt 1140 ggaggtgtta gaaatagagg tttatttttg ttattatcga ttttttttta tatttttgta 1200 aaggaggaaa ttgagaggta gggattttcg tagagtaagg aatttaaatt gttgtttttt 1260 gtgatttata tattgtattt taagttgtag gggtaattta aggataaagt tgtaatttaa 1320 gcgggaatat atgttttatt tggggttatt aaaattttat tagttttttt agttggtgga 1380 tcggttaatt tacggttata gttttttgga gttgggggaa aggaaaatta gggcgttttc 1440 gtaaattagt ttagagagag gtttgcggaa gggttcggaa gtttgtaggt ttttttgtat 1500 ttttaatttt atcgttattt tggattttta agatgatttg gtttaataga gttttgtatg 1560 gaaaagattg gaatttaggg aggagtagag tttcgtttaa ggttatcggt cgagtttgaa 1620 tagaattcgg ttttttagga gttttgtttt tagttgtttt gtttaaataa aattttttag 1680 gttattagat tttcgtattt tttggagtgg gattttattt gggattaaag gagggttggt 1740 gaggggagtg gtaggaggga ggagtgtttc ggggtttcga gtaggatgag tttgaggaag 1800 agacgggttt ttatgttttt tttttcgttt agataatgga ggtgaattga ggggagtaga 1860 gattttttta tttttagggt gggattttga gggattagga tatttttgtt aggggatgtt 1920 tttttttatt tttgtataag ttttttaagg atattttcgg gtttcgaaaa cggggggagg 1980 gggacgacgt tttagaggtt tttgagtttt tggttttttt cgattttaag ggtttttttt 2040 tttcggtttt taggcggcga cggcgggtag cgcgaagtag taggcgtagg ggcgttggga 2100 tggggatgtt tttgtaggtt taaggttttt tttgggagtt taaataaaga ttacggtagc 2160 gtcgtttttt ttttcgggaa ttcgacgtcg cgcggttata gggggtttgg aggggcgggt 2220 agggtttcgt agcgtattta gtatagttcg cgcggcggag cgggtgagaa gtcggcgggg 2280 gcgcggatcg atcggggtgt tttttaggtt tcgcgtcgcg gttttcgttc gttttttcgt 2340 tcgtttatcg ggtattttag tcgcgtagaa ggcggaagtt acgcgcgagg gatcgcggtt 2400 cgttcgggat tagttttagg ttcggtatcg tttcgcgggt cgagcgttta tattcgttaa 2460 atttacgcgg gtacgttttc gcggcgtatc gtttttagtt cggttttcgt ttttgtagtc 2520 gcgggtacgc ggaggggttt ttggttgttc gtatttgtat tcgcgcgtcg gcggcgtcga 2580 agtttcgttt ttcgtttgcg cgtttgtttc gttcgtattt tcgcggtgag tcggcggcgt 2640 tttcgttttt gagtttaggg ttagtttttt tcgtcgtcgc ggttgttgcg cgcgttttcg 2700 tttagtttag tttagtttcg agtacgattt tagttttacg tacgatttta gtttcgcgag 2760 tttcgtatcg attcgttttc gttttatttc gttttcgcgg gggcggcgtt tttttttttt 2820 cgcggttttc gttttttttt ttcgtttttt cggtcgcgtt ggggattttt agtcgtcgtt 2880 cgcgattttt tatcgcgacg ttcggaggcg gcggggtttt tttgttcggg cggcgggtac 2940 gggggattat tttttacggt gttatcgtat ttatttcgcg tttttttttc gttttttgga 3000 gtttatcggg attaggtggc ggcgggtgtt tttttggggg tgcgcggtta tgtaattggt 3060 ggattttttt aaatcgtttt ggagggggga gcgcggcgtt gggggcggga gagcgttttt 3120 ggttgtgagt tgtttttgtc gtttcgtttc gcgttttttt gtcgtttcgt ttcgggtttt 3180 tcgcgttttt tttttcggtt cggtcgagcg cgttgtttcg acgtcgttat ttagagtcgg 3240 gtcgcgtcgg gcgtcgagat gaaggtgttg ggatatcggt tggagttgtt tataggtatc 3300 gttcgtttgt ttcgtagtcg gtcgttattt ttcgagttgg agcggatttc gggcgcggcg 3360 gtcggggatt ggggcggttc gggtttgagt aggaaggggt gcggatttta attaagtttt 3420 agttttgtgt tatttgtttg tgtgcggagt ttagtttcgg gagaggattt gaggttgtgg 3480 cgagtttttg gcgttggcgt tcgggttgcg ggagtatcgg ttagggggtg gttttatggg 3540 gtttttgatt agcggagttc ggattaggat tttgaaagtt agtttagggt ttttgttttt 3600 taattagtgt cgtttgtttt ttaagaaagg attcgtgggt ttttggtagg attcgcgtta 3660 tggatttttt atttttgcgt tttgtgataa tttgagtcgt ttttttttgg gggagaagtt 3720 ttttgttggg agtggaggcg acgttaagtg gtttgggaag tgggaagtta gattggattt 3780 tattgattgg ggatttttag ttttggggtt tttttggaga agtgattagt tgttttgttg 3840 gaaatttata tttagggggt agtggttgga gagtaagagc gaacggttag gaagaggagg 3900 tgggaaaggg agtagggacg ggggggagga ttcgaggagt gatttttgtg tttttttcgg 3960 tgtggagaga tttagatagg aggaaaggaa agtaattcgg ttttttttag ttttgggatt 4020 tataggtgtt ttattcgtgt atgttagatg agtatagatt ttagtaagtg tttttcgata 4080 tttgggggag ggggttgatt attgtttttt aggattttaa tgttcgatga gggagtagag 4140 tttcggagtt ttgttataag gttggaaggg gtagtcgttt gtgggtgcgt ttaggaaacg 4200 gtggaattcg agtcgggggt agtttttgaa gatttcgaaa aataattttt gttaatgaag 4260 aaggaggtgg tattatgggt ttaggattaa gggaatggtt tatgttttgg ggtgtgagag 4320 aggtttgttc ggggagaggt atggaggttg aatggtttgg aatgtgcgtg tgtgttgcgg 4380 gggagggggt tagaaggtgg gggtggggta cgttgggtga ggttttatta aatcggtagt 4440 agtaggttag gcgtagtggt ttatgtttgt aattttagta ttttgtgagg ttgaggttag 4500 aggatcgttt aaggttagga gtttaagatt agtttgggta atatagcgag attttatttt 4560 tataaaaaaa taaataaata aattagtaat agttcgtgat agatttgtag agaaggaaag 4620 gtggaagttg tttttgggat attggaaatt gattgggtgt ttagaagttt tagcgttgag 4680 tttagttagt tacggggttg gtattttttt taattttttg ttaatttttt ttttgtggag 4740 tttatttgag gtaggtttag tttatttaat ttggaaggga atcgcgtagg ttattgaatt 4800 tgttaatttt ttggagggaa ggtttgcggt tttatgggtg ttttgtttgt ttgttttgtt 4860 ttgagatgga gttttatttt gtcgtttagg ttggagtgta gtggtatagt ttcggttttt 4920 tgtagcgttc gttttttagg attaagggat tttcgtgttt tagtttttta agtagttggg 4980 attataggta cgcgttatta tgtatgttta atttttgtat ttttagtaga gatgggtttc 5040 gttatgttgg ttaggttggt ttcgaatttt tgattttaag tgatttattt gtttttgttt 5100 tttaaagtgt tgggattata ggcgtgagtt atcgtattta gtttttatta tgggttttta 5160 gagttttgta tggtgaatag attttttggt tttttttttt tttaattttt tttgttttta 5220 aagggtttgg atgagaaatg tttataggag atatgtgtgg ggggtttaag taggggttta 5280 ggttttggag attttatgta ttgttttttt attttttgga tagaggagtt aggatttttt 5340 tttttttatt agatggggtt attagatttt ggcgggtttt ttaagttttt ggttagggtg 5400 gatgaggttt tttttagtta ttgttattag ttataggttt cgtttttatt gtatttgtaa 5460 tttggttttg ggagataatt tatttttttt gttgttattt tgtggttttt atagattttt 5520 ttttttgttt tttttttttt tttatagatc gggattttaa ttttaatttt attagtagtt 5580 agttgtgtga ttttagatag gttgtttaat tttttagatt ttagtttttt tattttaaag 5640 atggaattgt tggtttttgt ttttaagaga tggtgtaagg tttgttgaga tagtgtaggc 5700 gatatacgtg gttgggattt agattttggt gggtattttt tgggttttat ttgttttggt 5760 tggttggtat ttagagtatt tggatttgtt tttatttttt tttatttttg tttttttgcg 5820 tttgtgagat ttgatttatt ttttttattg gataataagt aggttatagt tcgggaggtg 5880 gttattttat tgtggtggta tatagtaaat gtttaagggt tgttgattga ggttaggttt 5940 atatagttta ttcggtattt acgtttttag gataattttg tagaggtttt taattttttg 6000 tttcgatatt agttttagga aatttttatt gaattttaaa aatttatatt gaaggttggg 6060 tatagtggtt tatatttgta attttagtat tttgggaggt taaggtaggt agattattga 6120 ggttaggagt ttaagattag tttggttaac gtggtgaaat ttttattttt attaaaaata 6180 taaaattagt tgggtgtggt ggcgtacgtt tgtagtttta gttatttggg aggttaaggt 6240 aggagaatta tttggatttg ggagagggag gttgtagtgg gttaagattg tattattgta 6300 gtttagttta cgtaatagag taagattttg ttttaaaaaa aaaaaattga tttagttttg 6360 tatatttttt atattttttt attttattat tttgtttgtt ttgttagtga agttagtgat 6420 ttttttatgt ttttattttt tagaagaggt agtattggat ttagaattta gttttgagtc 6480 gggagttgtt ttatatggta ttttaattgt ttggttttgg gatagtttaa tagtcgtttt 6540 atattttatt ttttttattt gtaaaatggg atcgtcgtgg tgtttatttg gttgggattt 6600 ttggagatta ggtgtgtgag cgtgtgtaag acgtcgagtg tagtttttgg cgggcggata 6660 gttgatgata gtcgtggagt tggcgttttt aggtcgtttt tcgagtgtat tttattattg 6720 tgttgggggt tttttttttt tttattgtgt tttagttttt agattttttt ttcgtagggt 6780 gttttagttt tttcgttggg tttttataat agtttaggtt tttttgagtt gtgtttttgg 6840 gggattttat ttaggtttta ggtttttgtg agttaggtat ggttttaggg ggtggggttt 6900 ttttagttag atatttatag ttttgatatt atggggaagg ttaggtgttt ttttatatgt 6960 gggattagaa ggagatttat gggttgttat gtttagattt agtatgtttt tttgttttgg 7020 agagaagagg aggttgttgg ggtttttttg gaggttttgt aaattatgaa tgtttgtcga 7080 ggttattttt aggcgtttta gcggggtttt gttgtaatag ggataaggaa ggcgggggtt 7140 ttggaattag aggatgtgaa tttcggggtt ttttttgtgt tttttagttt ttgggtaaat 7200 tgttattttt tttcggtttt agttttatta gtaaaatggg aataatagtt tttattaata 7260 gtgttaggtt agagtagttg ttttacgttt gtaattttag tattttggga ggttta 7316 <210> 114 <211> 1587 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 114 ggatgggttg tagataagag tagttgagaa ttacgtttta tttttttttt tagaaatttt 60 gaaacgaggt tttattttta ttagaagttt agattgtatt atggttattt taattttaaa 120 atgttagatg gtaagaatat ttgtttattt tttatttttt ttggaaaaag ttgtttttcg 180 ggttttatat gcgattgtag ttttttagtg tgtgaaatta ggaaaataaa atatttaacg 240 gtgtatattt ttatatttaa atagttagaa ataataggta gttaggttaa ttatttttga 300 ttagtaagat tagagttatt agggtgttta ttggtttaat aaatgaatgt ttttaggcgt 360 ttattatttg taatttttag aagttttaat ttttataaga aataaaataa gaggggtttt 420 ttgtttttaa tagtgaaaag atcgtttttt tttttttttt tattcgggtt aattttttta 480 gtcgtttttt tttgtattac gaatatacgt tgtaggaaag cgtatttata gttcgggata 540 tttttagatt ttttttttaa aattttttat tttttgtgta taggagaaat tgagagaagt 600 ttttattttt tttttaaatt ttataagtag gggagggagt tgtagtagat ttttattttc 660 gtttttaaaa gcgaatgtga aaaagttcga gaaggtacgt tttgcgagtg gaggttaaat 720 cgaaatttga atagaatgta cggttttcgt aaattacgat tgataaagaa gatattgaga 780 cgtttgcggg ggatataagt tatggttgtt tcgttttttt tttttttttg ttaattatgt 840 tttttggaga aatcgtcggt tcgatttacg tatatatttt tgtaaaatac ggataaaatt 900 ataagtagtt atttttattg tttcgtcggt tacgagggaa gttcgagttg agcggagggt 960 agattttaag ggtcgtagtt tttggtcgtg tggatcgggt ttgcggttgt agagcgcggt 1020 ttcggttgta gtaagatttg gggtagtgtt cgaggcggcg gcgagtatac gtggcgggtt 1080 ggattgtaga tcggtttttt cgcggcggag attcgcgatt tagcggattg tattagtagg 1140 aagatattaa ggttgttttt ttaggtcgtt tttagatggt ggagtttttt ttagttcgaa 1200 gattcggagt tagcgtttag attcgagttt tatttattgt ttattttcgg ggtgtagggt 1260 agaggtgtta gtgttgtaag taaatgatac ggttattttc gaattagtta ttgtgggtgc 1320 gtattcgagt gtggggatgt tcgtgtaata tttatatgga gacgttaagg aggaggaaat 1380 aaatagatta gaggttaaat gtgattgtta tttcgttatt attggttttt gtttattttt 1440 ttattgtttt taaagtaatt ttgttgtatg ttgagaggat tacggtataa ttttgtttaa 1500 aagtatatat gtatttttcg cggttatttt aaatgtattt ttgtagtagt taagaatatg 1560 tgtttggttt gtcgattttt tttttag 1587 <210> 115 <211> 3381 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 115 ggtaaattaa tggatttttt attatttttt ttttttttgg gttgtagtag tgagttaatt 60 ggtttagatt tgtttagcgg aatgtttttt aggatatatt gagtattgta gtaagagttg 120 tatatgcgtt tagggagaat gtggatagac gttgtttgtg atttacgggt aaagggtttt 180 tttttagagg tagtagaggt agattttgtt tttggtgtgt tttggttttc gatttggagg 240 ttttttgggt taggttaaga tttttttcgg tagcgatggt ttttagttat atttaattgt 300 tttgaaggga tattttttgt ttattttttt gttcggttgt gttttttatt cggaaggttt 360 gtgttttttt cgtttgtatg ttttattttg aggaggtttt tttggttttt tatcgttttt 420 tttatgggtt tttacgtttt ttcgaattat cgcgtttaag taggagtacg ttttcggttt 480 tttttatagg gcgttttttt ttataggggt gttcgggatt tttattttgt gtttttttgg 540 tggtttttat aagtttggaa gggtaggagg cgtattttat ttttttgggt tttttttttt 600 agcgtttggc gggagtttag gttgtatttg tggaatttat gatttttttt tttttgttta 660 agttgaatat attgttggtt tttgttcggg tggagttcgg ttaattagag tgaggggttt 720 ttcgtagggc gaaggggtgc gttgttagat gtggtatttt cgttttacgg agatatacgg 780 tgttttatac gttagggaga ggtttgagac gtaaagagtc gtcgagcggg ttgcgggatt 840 gtttcgttgt tattttcgtt tgtagttatt ttttcgtacg tatttgtgtg tgtatttagg 900 ttaatatgga aggcgttatt ttaatttttg tcgtgagtag gtgggaggga agagagacga 960 gaggtatttt attggttgtt tgggaaaatg aattgtattt tttttttttt tgcggaggat 1020 taattttttt tattttttcg ggtgggtatt cgtattttgg ggtcggagtt tgaattcggg 1080 agttaagggg ttttagtttt agggacgtga agttgagcgt atagcgggcg tttttagata 1140 ttggggaaag tgttttacga tgtttcgagt ttttttagtt tcgttagcgg ggcgagcgtg 1200 agggtgtttc gatcgattag cggtttcggg tgtagggtgg cgggttcggc ggcgcgcgtt 1260 tttttttttt ttttggcggt tcgtacgtgt cgttcgcgtc gcgtttttac gggttacgcg 1320 cgggtttcgt agcgtcgcgg tcgagtcggg ttgttcggtt cgcggatata gcgtcggtcg 1380 tcgtatttcg tgcggggtcg cggcgcgatg ttgcgttgga atgaggaagc gcggcggcga 1440 ggggagggtt cgggcgcggt gcgcgcgggg gtggcggcgg cgcgtcgagc gggttcggcg 1500 cgggcgagcg ggttgtagtc ggcggcggcg ttagtaggta cggttcgtat tcgtcgtcgt 1560 ttcggcggtt tttgggggtt gagtcggagt tcggcgcgat tgtaaagttt tcgtgcgcgg 1620 tttttttggt tcggagttgc ggttgagacg cgcgtcgcgc gagtcggggg attcggcgac 1680 ggggcgggga cgggacgacg tatttttttc gtgtttcgtt ttgcgttttt ttgcgcgttt 1740 cgttttttgt atcggagtag cgattcggga ggcggtcgag aggtgcgcgc ggggtcgagt 1800 cggttgcggg gtaggtcgag tagggatcgt tagcgtgcgt tattttaaag tttgcggggt 1860 ggtagggcgc gcgttttggt tattcgtcgt tttgggcggt agttggtggt aacgtaaggg 1920 cgcggcgggg gcggtcggcg cggagggggt taggtacggg gttcgcgggc ggcgttgtgc 1980 gcgcggggta gtcggtcggt cgggagcgcg aaagtttggt ttgagtcggt tgggggcggg 2040 gagtgtggcg gagaaatggg gaataatgcg agtgagtaat tttaggaagt tattgtgaaa 2100 gaaagttggg aagagtttcg cggttaagtt agtaggatat tttaataagt gattgcgcgg 2160 ttcgcgttcg gggcggtgat tgcggtaagt tttttgggtt ttcgcgcggc gtattttagt 2220 ttgggcggga cgttcggtcg cggcgaggcg ggtaagtttg gtagggtaga gggagtttcg 2280 gtttcgaggt tgtttttcgt attcgaggat tagttttggt tttaaagcgc gacgtataaa 2340 tttacgtgag tgtttttaaa ttgaatttta ataggaaaat ttggggtaat tggtgaattt 2400 aaaaaaaaaa aaatatagta aagaaaagcg gtaaggttgg tagattttgg tgtcgtttag 2460 gttcgttttt tttttttgag gatagtgaga gagtttattt ttgttaagcg tttgttgttt 2520 tgtattgtgt tagtaggtgt aggattaggt cgatatggga tatttttgag tagtttcgtt 2580 gttattagga gaggagtttt agtttttaat tatatttaaa tttatgtaga tttatatata 2640 tttacggaag ttagttttta taaagtcgtg tgtaaagagt tttttttata tttgagtcgg 2700 gagttttttt tttatattat aaatatgatg agatcgagtt tgaatttaat ttttgtaaga 2760 gaggaattat ttcggttttg aaaagttagt ttttttgttg atcgtaggtt tgacgtttaa 2820 gttattaaat ttttttagga aaatttttag taatattaag gtattaggtt atttgcggtt 2880 atatttgaaa tgtattttaa atatttgtta agtatcgttg ttgatgttta aggaatttcg 2940 tgagggtttg tttttttttt taatttggag gtatttaatg atcgaaaatc gtagcgattt 3000 tatagggttt gattaggtat agtttttaaa tgtagttttt ttttttttag ggattgtagt 3060 ttatttagat tgaattttaa tgcggtgcgt tttgtttagg ttatttattt ataatttttt 3120 attgcgtcgt aggtagtata ttttagtttt gagatatttt gttttaaaat tttagataaa 3180 atggtgttga ggaaatgttt ttttattagt tttattaatt tttgttaaaa gaggaaaatt 3240 tatggaattt gaaaatattg cgtatgatat ttaaattttt atagatattt aaatgttttt 3300 aaggttaggt ttaatttggt tatgagtcga ggggtggggg ggatttatat agaaatgttt 3360 tgggtttttt tgagtttatt t 3381 <210> 116 <211> 7398 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 116 ttggagtcgg tgggttttga gtatagttac gaaggtatgc gtattttttg gttgtttttt 60 tgttattgtt ttttgggttt ttattttggt gaggcgtgta ttttggcggc gttttttagg 120 gaattaaata tgtttgttgt attgtgcgtg gagatggaga atgtataatt ggttgatttt 180 gtgttaattt ggtggaattt tatgttagtt ttgggaaaga ataattgtat gggtgtgttt 240 atatttatta ggtgtttttt agaaaaatat tcgagaataa tgttgtggtt taggatggtt 300 gttgtgtcgg attcggtatt tttttagggg ggttgtgttg ttgggttgag ttttttaggt 360 attggatttt taaattttta aatacggcgt ggataggtgg tttagtaggg gttggattat 420 tcgataggtt taggtgttgg agtttagata agatatattt tggtttggcg tggaagatac 480 ggggtgttat taatggtagt aatggttgta tttttgaaat tcgggttttt aggtcgacga 540 gggtgtgtac gtatttgaaa tgtttgtggt tttgtagttt ttatgtttat aaatttattt 600 ggttgaaaat agtttaaaat atttaaagta tgagggaggg agtgtttgtt ttttttaaaa 660 aggaaggatt tgattttatt tatttaaaaa gttatttaaa tttagaatat ttttcgtaag 720 agattttttg tttttcgttt ttttagaatg gttggagagt tttagtattt ttgtatattt 780 gggatatttt agagggggtg gggaggggta agtgggtagc gagcgatttt agatttagga 840 tgagttgtta ggcgtttttc ggttatatat ttaagggatc ggagtgtagt tgtagcgttg 900 cggtttgttg tttcgggggt gggggtgttg ttttatgttg tgaattttta tatggttttt 960 gattttgggt agaggtcgag ggtttaaggg acggggtgat agggagagta tgtaggagtg 1020 ggtttttggt tttttagggc gagtggaaga agcgtttttt ttttttgtag gtgatagatt 1080 tggggggttt tttttgagga tgagagtttg ttgtttttta agttttgtgt ttaatttagg 1140 tttttaggtt tattttagtt tttcggtttt gtttgttttg tggatgatat agtttaaggg 1200 tagagatcgt tggtttggag ggaaggttag gttttaggtt agggtttaga agggagggag 1260 aagtttttgg ggtagttttt tttttgttta tttattgttt agtttttttt tttatatttt 1320 ttttcggaaa cgtttgtttt tgataaggtt tattttttgt ttttaggagg tttttattgt 1380 ggaggaaggg aggcgtcgtt cgtttttggt ttttttgata gtcgtgtttt attttcgttt 1440 tgtgtttttt ttttcggata gtgttttttt tagggtttat ttaggagggt gtagcggtgg 1500 ttttcggggc ggtggtcgtg gtgggggtgt tagttgtagg ggtgttttcg gtgggtggga 1560 gttggtggtt tttcgttggt gttatgggat tcgtatgttc gttttgcgtt tttcggtttt 1620 tgagtttata ggtcgggatt ttgtttgtta gtcgcgtgcg ttgtcgttta atttttgtag 1680 gcgtagagcg cgcggcggcg gtgatagaga attttgtttg gttgtttaaa tatagttttt 1740 tgtagaagga ttttgcgttc ggggaagggg aggaattttt ttttttttgg gcgttcgttt 1800 ttttcgttat ggttcggttt ttatattcgt ttatatttgg tcgtagcggg gcgttcgggg 1860 ggaggggttg aggtcgcgtt tttcgtcgtt ttttgggcgc gggttaggcg gggaggaggg 1920 gggcgtttcg gtcgtgtgtt taggattgtt ttttagcggt tattcgggtt ttagtttttt 1980 aggtttggtt ttgataggcg ggcggagtag ttagtgcgag atagggaggt cggtgcgggt 2040 gcgggaattt gattcgttcg ggaggcgggg gcggggcggg ggcgtagcgc gcggggaggg 2100 gtcggcgttc gttttttttt tttatttatt tagttgagtt agggggttta ggggtttttt 2160 cggcggttag ttttgtattg taggagcgcg ggcgcggcgt tttagttagc gcgtagggtt 2220 cgggtttcgt cgggggcgtt ttttcgtcgt tgtttttcgc gcgattcgtt gtttattagt 2280 tattatgtcg gatttcgcgg ttaacgcgta gttggatggg attatttcgg atttcgaagg 2340 tgggtgttgg gttggttgtt gcggtcgcgg acgtgttgga gaggattttg cgggtgggtt 2400 tggcgcggga cgggggtgcg ttgaggggag acgggagtgc gttgagggga gacgggattt 2460 ttaatttagg cgttttttcg ttgagagcgt cgcgcgtttt cggtttcgtg ttcgcgtcgt 2520 ttacgtgggg gattttgtta ggggtattcg cgtagatttt gcgcgttttt ataggatttt 2580 gtgttcgttt tgcgtattgt cgtttgggtt tttttttttt tattgttgtt tgtgtttgtt 2640 aagcgatagc gattttttcg agggttcgcg aggttgtttc ggaatttttt aggacgtata 2700 gttttatttt gggaaattta tcggtttttt ttttttggtt tttttcggcg gttttcgggt 2760 ttcgtttgga ttcggtaacg ggatagggag gtcgtttttt attttcgatt gagtggatag 2820 tcgcgttttg ttcgggtgga tagttttttt tttttttacg ttagtttcgg ggtcgttaag 2880 ttgtgtagtt cgtgggtcgg gagtatcgaa cggatatagt ttaggtcgtg gtagggttta 2940 gagtgggatg ttttatggtt tttatttagg tttggggata tttttattcg ttttttagaa 3000 tcgggtcgtg ggggatagaa ggggtttgcg tgcgggtagg gagagtattt tggttttttt 3060 ttgttttcgg ggtttataaa gtgtgttggg atttgcgggg ttgttttgtt taagtttggg 3120 tttggcgttc gcgtttttga gtttgtgagt gcgtgcgttt ttttgcgttt ttttgattgt 3180 cggtgttggg gttttgcgtt ttgcgttcgc gggagtaaat atagtaggcg aaggggaagt 3240 ttatataatg gtttttagcg ttttggggta gggtttttga ggggcgggtt tgtttttgtc 3300 gggatttgga gttttcgttt ttcggagagg tttttaggtt gatttgggta gagttttttg 3360 gtgggtcggg agggggaaag gttgtgttga aatgagtaaa ttgtttaggt gttaggttaa 3420 gttgggaggt gattagtttg aggttttttt cgttttatgg ttagaattag ggttgatatt 3480 tgggtgtttt gagtttagtt gtttatacgg tttatttggg gttagtttta tttgagtggg 3540 ggaggcgggg ttttttgggg gattagaatt ttggttggac gttaagtaga gtgttagtgg 3600 ttgtttttta gggttgggtt tgaggagggt gtggggcggc gaagggacgg gagggggttg 3660 tgatttagtg gttattggcg ttgtgtagag tgtgagttgg aaatatcgta gttattttgt 3720 tagtttagtg gtgaaagttt ttttttaggt tttatttttt tgtatttttg ttttttagag 3780 ggaggggagg tttgggtttg tagagttggg agggtttgtt gttttcgttt ttttttttta 3840 taatattttt ttatttggat atttttgggt atatgtttat attggggttt ttttaggttt 3900 attgtgtttc gttgagtttt ttgtagtttt cgagtgaatg tgattttttt gtttttgttt 3960 ttttgtaatt tttttttgcg atcgtttttt taggggtttt ttttgtttta aatgtttaag 4020 tggtacgatt tagtcggttt gattattttt tagtaagttt ttatggagag aggttttgtg 4080 ttgtgtagag tttttttttt gtttgcggga tcgaggtttt tgtttttagt ttttaataga 4140 aagtgtcggg tttttagtgg gatttttggg gaagaatttt cgtgttttaa cgggagtttt 4200 gtggcgggag gggaggttag ggtttggggt tgtgttcgtt gtatagttgt tattatttgt 4260 attatgaaag ttgttagtgt tttttttttg ggtttttggg tgtaatttta tttttgtttt 4320 tatgtgtttt tatttggagt tgtttttgcg gttgtttttt aagttagttt tgtgattttg 4380 taatttagtt taagataatg ggtttattga gattattttg gtgtagtagt tggtaatttt 4440 ttggttttgg gggaaggttt tttagtttcg gggagtgggg ttttaatttg ttggtttttt 4500 gtgtttatta gttttttttt tgtgtgtttt gaatggtttt gttgggaatt ttggttttag 4560 agttattagg tggttcgagt cgataggcgt gagagagtgt gtgtgtgtat gagtgcgtat 4620 gtgtatgggg gttgatttgg ggtatggaaa ggtggttttt tttggtgttt aaggagtttg 4680 gagtatagtt ggagggtgtg ggggtgtgta tatgggagtt ggataatttt gggtggatag 4740 atagacgtgg ggaagggatg attgaaggag gtggaggaga gagtgtgatt tagtttagtt 4800 aggggtgatg tggataggta gttttcgaat tagggtagag aaaagttatt attagttagt 4860 aggggagaag ttagtatgga ggaggcggat tttgagggag agtaggaatt ggattgtaag 4920 aggaaggaga gttttttggt tagtagtagt tagtagtagt gggggaggtt ggaatgagtt 4980 ggttggagag ggggttgggg tataaggagg ggtttgtttg tgaagattat atgggttagg 5040 ttgcggaggg ttaggtatgt tcgtcgggag tgtagttggt ttacgggaag tatttggagt 5100 ggttgggaat gggcgtagga gtagcgtcgt gggagtatag gttttttttt cggggcggtt 5160 tatttggtgt tttggttttt gtaaggtagg tcgaaagggt ggggaggaaa ttgttagttt 5220 tttatagcgt tgggatggtg gttttagggt ttttgaggtt agcggatgtg ggtgtttgtt 5280 attatgtggg ttgttgaggg gcggagattt taggggttat tttaaagtag gacgagtttt 5340 gagttacggt atttttgggg gtagtttttt aatcgagtag acgtttaggt ttggaatttt 5400 gtaatagagg ttatagggtt ttgattaggg tgttttggga ggtttagaat tagtggtagt 5460 atatagggta gacggtaagt gatttggtat ggggaaagag gtaggtgttt aggtcggtat 5520 agtatattcg taaggaatag gtagacggga agtcgttcgt gggtttgtgt gtgtgttcgg 5580 agttaaaatt ttgttaatgt tttatgtttt gggtatattt attttttttt tggggagtat 5640 tttttttttt attttttttt ttttcgtttg ttttttttat ttagggtttt ttttattttt 5700 ttcgttttgg ggatcgaggg tattatggtt ttatgtttta ttatcgatga gttgtatagg 5760 gatttagttt tttcgttgtt taggtcgggt tttttaggtt tagggttttt aggaatggag 5820 agggtattag tgttttttat ggatttaaat ttttcgtatt tcgtttttgt ttttttttta 5880 agataggttt tcgagtttta aggttttagg gttttgtgga ggtcgttacg tagtagtaag 5940 gagaatgttt tgtatttggt tgatgagatt tttagagttt tattttttat ttttttattg 6000 tataaacggg tttttaggcg attgtagtat tcgttattgt tcgtaatagg gtgataagag 6060 ggatgatttt tttttttttt ttttttttgg ttggtggagg tacggggttg gcggacggta 6120 tgtgttttcg tgaatttagg ttaaatttgt tatcgtaaat acgattataa ttcgggtttt 6180 tgtgtaataa aagttttttt aagtattagt tgttggtttg ttttgtttag cggtgtttgt 6240 tgtaattaga tttgtatatc gagaaagaat ttaaaagttt ttgatgtttg ttgaaataat 6300 ttggtttagg atttacgtgt ttagatttta gagttgtgtg gtatttgagt ttttttcgag 6360 tttttattgt cgttcgagga ggatttttag atttgtgttt tggaggtaga gtaggttgtg 6420 ggacgggttt ttgggtggga aggattatgt ggatatgttt ttttgtttga gagttttaat 6480 attttcggga cgtgggagtt ggcgcgttgg taggatttag gtgttttttt tttttttaga 6540 gaaaaaggtt tcgttgtttg gtaataggtg tagatttgtt tttaattaat gttagtaggt 6600 tttttgcgtg atgaattttg ttttttagtt aagatttaag gtattttgtg aatattgttt 6660 ttttgtagtt tgagtttttg tggtgggagg taggagttat ggggagtggg ggtaggtttt 6720 ttatacgggt tttatagtta ttggtagtat tgatttgatg ttttttgagt ttagagttta 6780 gggttagata gatttattgt ttcgattacg agttggttta tttagagggg ggcggatata 6840 gtatttaggt agtagatgta ttgtgattag ttttgtagcg gggttgtggg ttttttgggt 6900 tggatgttcg ggaagaggta ggtggaggta aacgttagga tatttttgta gtgattgggt 6960 gattgtaggt tggaaatgtt ttttgtgggt tgtggttgtt taggaaggtt ttgaatgggg 7020 ttagtggata gagtttgtat ttagaggggt agtgttttgg aggagtgagg ggtatggtag 7080 tgtagggatg tttaggtcgt ttttattttg ttattggaaa gttgggcggt ttcggttttt 7140 ttagtttttt cgtttgtttt tttgtttgta aagtggggtt agaaatagtt ttttttgagg 7200 gttgttgggg gattttgaga tgtagtttat ggcgttgagt acgggttttg ttttttacgg 7260 gtgtggtggg tgtcgcggtt ggtgtggtat ttgggcggga aaagggggta tttgtaaagg 7320 ataggtaggt ttggatgttt aaatatgtag atttggggat gggaggtttt aggtaagggt 7380 ttgtgtgatg ttattgta 7398 <210> 117 <211> 2396 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 117 gaatatttta tattgtttga aagtatttta tatttttttt tttttttaat ttataaagta 60 gttttttttt attggtcgaa tttttaaggt agaaaagtta tatacgtttt tcgttttttt 120 attaattgtt ttttagaaaa gggaaagtga agaagggaaa gagaaaagat aacggggaag 180 aaaagagtat agaggagaga ggaaaagtgg ggagagaaag gaagaaaagg attgagaaaa 240 cgtaggagtt ttggtttgtc ggtgagtaga gtcggcgtag ttatagcgcg gagtcgcggc 300 gtttattggt tttcggagtt gttaatcggc gtgtaatttt gtaggaattt ttttcgggtt 360 tatttgggag ttatattgtc gttttttttt tttagtcgtt taggggagtt cggagaagta 420 ggtttaggag ggagggagtt agaggaaaag aagaggagga gaaggaggag gattcgggga 480 gggaggcgcg gcgcgggagg aggaggggcg tagtcgcgga gttagtggtt tcgtttggac 540 gcgttgtttt ttagatattt tcggagtttt agtcgcgcgg atcgcgcgtt ttcgtcgttt 600 tgtttttaaa tttttgtcgt agtttttttt taagttagcg aatttatttt ttaaaattag 660 aaattgaatt tcggtacggg aaaggagttc gcggaggagt aaaattatag tagagtaaga 720 agagttttag agagtagttt tttcggagta ttaatttcgt gtcgggagtg tagaaattaa 780 taagtgagag ggcgtcgcgt tttcggggcg tagttgcggg cggcgggagt aggcgtagga 840 ggaggaagcg agcgttttcg agtttcgagt tcgagttttc gagtttgagt cgtaatcgtt 900 gcggtatttt gtttcggatt cgtgtgcgcg ggttgcgtcg agcgttgggt aggaggtttc 960 gttttgtttt ggttgtaagt agcggttggg agtagtcggt ttttggggaa tatgcggcgc 1020 gcgtggattt tgtttatttt gggtttggtg gtttgcgtgt cggcggagtc ggtgagtggg 1080 ttaggcggag gatgcgcgcg tcgtttaggg tgtttgaagt tacgagagga gttcgtaggg 1140 aataggggag cgttatttgg ggaattttta gtttttaagt atatatcgga gattcgttgg 1200 gataaatgcg ttcgttcggt tatttttttt tttttttttt ttttttagaa aagcgttgtt 1260 cgttggcgtt atttcgcggt tcgcgggaat gggggtatcg agaattgcgg tttggtttag 1320 tcgtagaggt ttttgaagtt atttttaatt ttttcgtttt cggcgggttt tgttgcgtgg 1380 tttgggaagg acggagggga aagggtggta ggagggggga gtttgggtcg ggttcgcgag 1440 ggaacggttt tatttcgcgc gtttttcgag attagggatg atttggaaat ttcggggttt 1500 tttttttcgt atattatttt tttcgcgtta gtttttttgt ttgattgtat gtaagttttg 1560 gggagatggg ggttagattt aagagattcg cgagtgttta gagagaaaag tttgtaaaag 1620 tttttttgtt tgatgttttt tgcggttagg gcgaggtaat cgatattacg tggaatcgta 1680 gtaggcgatt ttttaagggg atattggggg aggtacggaa cgcgttcgaa aatgttggga 1740 cgtcggttat tggattttta gttttgcggc gatttttttt tcgttgaggg gtggaggttg 1800 tatcgcgggg cgttagggac gggaggatat ttttatagga gttatacggg agtgtcgtaa 1860 gtagggcgag gcggggtacg tgtgatacgg cgttcggttt cgggtcgttt ggtcgttggg 1920 ggatagaggt ttttttttcg ttacgttcgt tttttttggt tttggcgggg cgtttttggg 1980 gtcgggagga gtttcgtttt cggcggagcg tttgtcggta tttagttttt ttttttcgtt 2040 ttggcggtgg gaatttgatt tttttttttg gtcgcgtttc gggggttgga gtttgttttt 2100 ttacgtcgtt taatgagcgt tttttaaagg gaattgtttt tttggttttt tttcgttcgt 2160 agttgttttt atttgggcgt taggagtttt gtcgggttag gtggaagttt gagtatttta 2220 gatttcgttt gtagttttag tgttttttgg ggttttaggg agtgcggttg tttttggttt 2280 ttttggtttt ttacgttttt tttttttgtt atttaataac gtgttaattt ttaattaatt 2340 gaatggtttt tttaaagata aattatatta ttttaaggtt ttttaggtag ttttat 2396 <210> 118 <211> 3696 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 118 tgaatcgagt ttaatatttt tttgtataaa aatttttcga taggataaat aaattatttt 60 tttattgaat tgtgattttt gagttgattt tagggtgtat ttaatttttt agaggtgttt 120 ggtttaattt ttaaagaggt agttttagtt ttaggagtcg atcggtatta tagtatttga 180 gtagggtatt gtaggaagga aagcggaatt tttagtgaaa ttttttattt tttgtcgttg 240 ttgagagagg ttggattcgt ttttttttat atggtttagg aagagttgta aacgggagtt 300 tgtcggttgg ttattagttt aggggttttg ggggcggttt tcgggttttg ttttttgttt 360 ttttttttga ttaatgttat ttttggatag ataacgggat taaacgtttt ttattttttc 420 gagtttttat gtatgttatg gttttttttt taggaaaata tgagtataag acgtaaagta 480 aaagaagaga ttaaaggtaa attattttat tatttcgttt cgtttttttt tttcgttatt 540 atagaagagt ttgattaaat tttttttgtc gcgttatata tacgtagagt aggtgaaggg 600 tattttaaga taatttattt ttttttcgtt ttatagaaag tttttacgaa atttttatat 660 tattttcgga cgtaaagttt tcgtatttag tttgaggagt taaattattt taagttaagg 720 taggaaacgt taaagtggtg tcgaagtggt tttaaagtag aaggttggga agtagggtaa 780 gtttagcgta tttagacgtt tgtatttata taaagaaatt agtcgtatga ttaatgggag 840 ttgtcggttg gaggcggggc gttcgtgtcg gtttttttat ttgggatatt tgcggtttta 900 ggttgatttt ttttaggttg atggagtgcg ttcggaggtt gttaagtagt tggtagagta 960 ggattttatc gcggagggtt tgcgtaaggt cgaatatttg agtcgagttt taggttattc 1020 ggtggttggt gggtagtatt ttgtaatgga tgagttattg cgcgtattgt ttttacggtt 1080 ttatgttcga cggtttcggg acgcggttgg gtcggggcgg gcggtaagga tgcggtcgtc 1140 gtcgtcgtcg tcgcggtttt ttcgcgtttc gtcgacgtta atagtcgtcg gttttttttt 1200 cgcgcgggat cgagggagta ggagtcgcgg ttgacgggtc gcgggcgtcg cgttaggttc 1260 ggtttcggtt tcggttcggg tgcgtcgcga ttcggtcgtc gttgtagcga gtttcgcgcg 1320 tttttcgtgc gtttcggtcg gttcggcggc ggttgtcgcg tataggtttt cgattttagc 1380 gttcggttcg ttattgagta tgtttagtac gtcggtcggt ttcgttgcgg ttcgtaagtt 1440 tttagacgcg cgggtgggag cgcgtcggcg gtcggggttg gggtttgtgg tcgagggcgg 1500 ggcgcggggg aggggtcggc ggaggggggc ggcggttaga aaggggattt cgcgttttcg 1560 tttgtagttt tgcggggttt acgtagtttt cggcgttttg gggttttttt tcggggcggt 1620 ttttcggttt tgcggggagt gtggttgaat attgtaatac gatggggttt tttaggattt 1680 tttaaataat aaatgtttaa aggagcgacg gattaattgg ggtatttaga ttttttagag 1740 taatgaaaaa agtgtttaga gtattagtag agtacggcgt tgaaagtttt agagatcgtc 1800 gttttttcgt tttttgtagt tttatttttt ttatttttta tagttgattt tttagtttat 1860 tttttttagt tgtttttagt ggtgttttgg tatttttaaa gtgagtgaga gtgcgtgtgt 1920 ggagacgttt gcggaaatcg tttcgatttt tgagtttatt ttttcgcgag gtgattttta 1980 tttggagttg gtttgttttt gtattgttag gttcggaatt gtttgtcgtt gttgttttgg 2040 tttttttgtt gattttataa aaatttgttt gagaaaggtt tgtgttacgg tgttagattg 2100 cgtatgcgtc ggcgattggc ggtcgggttt gagagtaaag cgcgttagtt ttgggtagtt 2160 tttgtcgggt tgttttggga tttttagtga aagttggaat ttgattttag aatttttgcg 2220 tagtgtataa gtagtgtatt cgtgtttttt aagtaaattt tttggagatt ttaaatttta 2280 ttttttttat ttttattgta tattgttttt taaaattata attaatgttt aaattatttg 2340 tggtaagata ttgttatagt gaattattgt tgttcgatag gaatgtggtt tttcgttatt 2400 tttttgagat gtatttattt aaaattagaa aataggtcgg gcgcggtggt ttacgtttgt 2460 aattttagta ttttgggagg tcgaggcggg cggattacga ggttaggaga tcgagattat 2520 tttggttaat acggtgaaaa ttcgttttta ttaaaaatat aaaaaattgg tcgggcgtgg 2580 tggtacgtat ttgtagtttt agttgttcgg gaggttgagg taggagaatc gtttgaattt 2640 atgaggcgga ggttgcggtg agttgagatt tagttattgt attttagttt ggacgataga 2700 gttagatttt gttttaaaaa ataaataaat aaataaataa aaagatggga gtttggataa 2760 tttaattgta ttatattttt gtagtttaaa ttttttatta cgaattatgt tttataagta 2820 ggttaaaata ttatttttaa aagaatgatt tgtttaggat agtgattgcg ttttttttcg 2880 tttggttgtg ataaggatag tatattgttt atatttagcg ttgaataata aattagtttg 2940 aggatttttt ttttttatac gtattttttt ttagtaattt ttttttgtgt ttaatgcgga 3000 ttttattaat agtacgatat tttttaggtt ataattttgg taaataaatt atattaattt 3060 ttatatattt ttagaagtaa aatttaatat atttgaatta ttatttaata tagtttttta 3120 taaagagaaa ttaaaaagaa attttattaa acgggttaaa atttaaatta aaattatgaa 3180 ttttttttag gtagtattag attatttttg gatgttggag aatattttta aaatttatat 3240 tatatatatt attttaggac gtaaatttgg atttagagtt cgagttgtat tgttttttag 3300 taatatgatt ttggataaat tttttatagt ttagttttta tagatacgaa ataagaaatt 3360 tttttttttt tttgtggggg gtggacggag tttcgttttg tcgtttaggt tggagtgtag 3420 tggcgcgatt ttagtttatt gtaagtttta tttttcgggt ttacgttatt tttttatttt 3480 agttttttaa gtagttagga ttataggcgt cggtcgttac gttcggttaa ttttttttgt 3540 atttttagta tagatagggt tttatcgtgt tagttagaat ggtttagatt ttttgatttc 3600 gtgattcgtt cgtttcggtt ttttaaaatg ttaggattat aggcgttagt cgtcgtgttt 3660 ggttataaga agtaattttt aattaatagg gttgtt 3696 <210> 119 <211> 4199 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 119 tgttaaaatt agaatagatt atatttaggg gataatattt aggtatgtta acggagttta 60 aaatgttaag gaaattatat tataattttg tttagtatat tataggttgt taaatcgaaa 120 tgttatgtta gttaggagtg tagtaatttt tattttttgg ttttatttaa ttaggaagtt 180 ttagtagagc gaagtttgtt aagcgttcgt cgttagaatt tgaaggaatt cgagcgagta 240 agaagagtgt ttgatttatt ttatagaagt ttgtttagaa atggaggagt tagcgtttat 300 tgaagtcggt ttcgttttcg gttcgtttat atggagtttg attagtttta gttatgttta 360 tttcggtttg ggagattcgt aaagtgtttt tttttttaat ttttttgtat tattttgaag 420 tttagggaag taaagagagg ggtatatttg gattgtaaaa ttaatgtttt ttgtcgttta 480 ggagagaagg gaatgagaga gagagagaga tagatagata gagagagaga gagagagaga 540 gagagagaga gagagagaga gagagaaatt ttattgaaat ttagtttttt tagaatttgt 600 gtgatttggt ttttaacggg agattagtgc gattttatgg tatttttgtt aggaattagc 660 gatttttttg tagttattat ttgatttatt gttttttcgt ttattttttt ttataaagtt 720 attttttttt tattttagta agattttttt ttttaatgat gataaagttt ttgttttagt 780 gtttttttta ggattggtgt ttttttaaaa tagtgaattt agaaaattat ttcgtttaat 840 attttttaaa attttcgtag ttttaatgta agcgtaagta tgtaaaggtt ttttgttata 900 tttgtatttt ttgtttattt tagaattatt ttttattttc gggtttgtaa tagttttttt 960 tgtttttttg gatagaggtg ggtggtatta ggggtttagg gtagtaggag gtgaggggtt 1020 gaggaggcgc gttagggtag gttggtttgt gttggatacg cgtgtttttt tgcggagtta 1080 aagggtcggg gacgggggtt ttggatttat tagagtaatt ttagtcggtg ggcgtttggt 1140 agttatttaa ggaggtaggg aaagtagcga gttttatcgg gcgggttacg atgagtagta 1200 tgacgggtag tagtagtagt tagtaaaagt tttcgtaaag tgtttagttg ttgtattgtc 1260 gcggggattt ttatagtatt atgattagtt cgtgtaattt tgtagtagta aacggttttc 1320 gaggaatata ggatcgcggg ggtcgggtag cgggttattg agtatttcgc ggacggcggt 1380 agtagaggcg gcggcggtgg tagtggtatt cggcggggaa gtagtagtta aattcgcgta 1440 tgatttcgag agttttagta atatttaggg attgggttta gtttcggagc gagagggtcg 1500 ttcgttgaga agttgcgtcg gagacgcggg aagttgttgt tataaggagg gagttttggg 1560 aagtcggagg ataggaggag acgggagttt aggggtagac gagtggagtt cgaggaggta 1620 gggtggaggg agagttaagg cgtttcgtag ttcggtagtc gtttttcgag ttttgtcgtt 1680 cgtatttttt tggcgtttgg gaagtagtag gtttttagtt cgttcggggt tacgtgggaa 1740 gaggtagtcg ggttttgatt ggtggagtag gatgtaggtt tcgggaggga ggggtcgacg 1800 aggaggtgta aggatgtaag gaggaggcgg tcgcggaagt tatagatggg ttcgttcgtt 1860 aggcgttggt tcgagtgggg ttaggcgggg atggtttaaa tgagaagttc gggttttagg 1920 gtgggttatt cgtatattta tatattattc gttttatttt tcgttttagg acgtttttta 1980 tcgaaggcgg ggttcggatt agcgtttttt tttcgcgcgt gatttcgggt cgcgagtgcg 2040 ggtcgcggtt gggtggcgtt ttttcgagtt ggagatggtg ggggcggagg tgttagagga 2100 gtagtagtag tagggtagag aggggcgagt cggcgcggga gagggcgttt tgttggcgat 2160 cggcgtttta gcgtgcggga gcgcgtcgtt taggttgtag ggggatgtag gttgggaatg 2220 tcgcggcgga gaggttaggg acgttttttt agggatttat aggaaagagg gtgagaggcg 2280 atggtgttag aatcgttttt gtcgatttgg aagtaatagt agtatttttt ataagagcgt 2340 gtaattttaa ggttgttcgt cgaggtagtt tagttatttc ggtaggcgtt tttttttttt 2400 tttttttttt tttttttttt ttttaggttt ttcgtagttt cgatttagtt taagcgttcg 2460 taggtttgaa tttttttttt tattattcgt ttttttttag ttcgtagttt attagtgtgt 2520 ttatttggga ggtgcggtta gatgtgtttg gaaggttaga ttggtcggga taagtggttt 2580 gagagaaaga gaaaggtttt tttgtatacg tcgcgggtgg gttgtcggga gtatcggtcg 2640 ggtagcggcg ttcgggaagg ggagagcggg ttttatttgt tggtttaggt agtgattttg 2700 cgttttttat tcgggttttt gtcggatggt cggtgatttg gggcgacgag agaaggttta 2760 attcggtagg agtttttggt tttgcgcgtt ttttttattt tttttagcgg gaagggtaaa 2820 cggtatagcg ggattcgttt ttcgtttgtt gtatttttta ggtagttaga tatatttttt 2880 agtttaatgg aattttagtc gttagtaacg ggattaagag ttttcgggga taagggtgga 2940 gaggaatatt ttttttttat gatcggggtt attattgtag ttttagtgtt ttggatgttt 3000 tatagggaag agtttttttt ttggtgtgtg attatttagt gatttttgtt tttgtttttg 3060 tttatttttt tttcgttttt tttttttatt tttttttgtt attttttttt tttttttttt 3120 tttcgttttt aaaagttttc ggattttttt tttttttatt taaatttttt ttttgtgttt 3180 ttttttttgt gttttttgaa tttaggagag tatttgataa tatttaatag gtaattagtg 3240 tttattttta attatttaaa agaggtattt atatattttg aaaacgggat tatttatttt 3300 ttgtagatat tagtagaaaa ataaattgta ttcgagtaat ttttttaagt attttaattt 3360 ttaatttttt tttatttttt tgttttttaa tttttttttt gagagatgtg atcgtgtagt 3420 attttagtgt tttaacgaaa tttttttttt ttttttgtgt gaaatttatt tttttatttt 3480 atattttcgt tttcgttcga gattgttttt tttttttttt atttttaaag atttttgaat 3540 tttagtgttt tttatttttg gtaattaagt agtagatttt agtattttag tcggtggtat 3600 ttcgtttttt atcgacgaag attttattaa aatagattaa ttagattaga cgttggaggt 3660 attagaaaat cggtttttag atagagtagt taaatttttt aaggaaatag aatatttatt 3720 agatagagtt gttaattaat attgtaaaat aaggaattag aaattttttt cgttataggt 3780 ttttagtaga gaaggtaata taaatataga ttaagattta ataattttat agtagagaat 3840 gagaatatgt tattttttat agtaaggttg gtgtggtaat taattaggtt tatgaaaata 3900 agttatgttt gaaattaaag gtaaagtttt taaaagtgtt tatgtagtaa ttatgataat 3960 gaaataggat ttgttaggat tttagagttt ggttatgtaa gtagaatttt agagaatttt 4020 ttagtagagg aaaattgttt ttgaattttt tgttaagtaa atttttggta tattttttaa 4080 taatatatgt tttttttaag acgttttgtt aaaagtaagt taaaatttta aaggagttaa 4140 ttattggttg taattggtta ataaatgcgg ttgtttttat agaggttttt taaattatt 4199 <210> 120 <211> 5716 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 120 tgtgtgtgtg tttacggcgc gggtcggagt atttattatt tcgtcggggg agcgaggtta 60 tttcggggtc ggattggaaa tgttgaggtt tcgtttgttt ttttcgcgat atgttggttt 120 aaatattagt tggggtagaa taaaaaatta ttaaaaaaaa atttttttaa aattacggaa 180 atcgagcggc ggcggcggcg gcggtttttt tcgttcgtcg gttcgttcgt ttttttttcg 240 gtttttcggt ttcgggcgta gcgcgtatgt gttttgttat aattatgatt attaataatg 300 tattgcgatt aattatagag gggttttttg aaaggcgatt ggtatcgggt tagcgttatt 360 taaattcgtt cgttttaatt aattagttcg tgatttgttg tagatttttg ttttttcgcg 420 cgttggttta ataagtcggt cgcggggttg gttttgcgcg tcgcgtcgtt cgatattggg 480 ttaatttttt ttgcgatcgt tcgggatttc gcggttcggt cgtcgggggt cggttttttt 540 tttattgcgg gttcggcgtt tcggtaggcg tttttcgttt tttttttttt tttttttttt 600 tttttttttt tttcgttttt ttttataatt tcgggttggg tcgatttaaa ttagtatgtt 660 tttttcggaa ttgagtcgtt tcgggtgggg ggtggggtcg ggcggcgagg gttggggatt 720 cgggttgtcg gcgcgttgcg aattttttaa ttcgggggcg aggcgcgtcg gttcgcgggg 780 ggagggagtt tcgcggcggg attagggggg agggcgtttc gtttcgtgag tgttttttcg 840 tttttttaag agttattaga aagtagttta tttttatttt tattaaaaaa aaaaataagc 900 gagtggggaa gagttagttt tacgtcggtt cgtttttcgt ttacggttcg gttttttttt 960 cgtttggttc ggcgtttttt cgtttcgagt tttttatttt ttggatttcg ggttcgcggg 1020 ggcgcggaga agaggattta ggaaaggttt gggaatttga tgggtttgtg gttgggggga 1080 ggggtagttt tttcgttatt ttattttttt ttcgttaggg gtattgattt tttagttttt 1140 tgtttgtttt ttcgtttttt ttttttattt cggatatttt taggataatt agggttgaag 1200 ttttcgggag aagtagtttc gagttcgtgg gataaggggg cggttcggtt tcgtttagga 1260 tttttttcgg attttttttt cggttgtttc ggttggttgt agggcgcgtt atttcgcggg 1320 gaggcggcgg tagcggtggc gtcgtagagt ttcgggcggg cggagagcgg ggatcggttt 1380 gggtttcgag tttagtttcg gtcgggggga ggggaggggt tgcggtttat attgagcgta 1440 gtagcgagta tcggtttagg gagatatagt tcgggcggat tcggtattgg attgggttag 1500 tttttgggat ttttgggtat ttcgttttgg ggagggggtc gcgttttagt ttttcgggac 1560 gaggtggcgg cgtagagtcg gaaagcgggg tggggggagg gcggtgggga ggtgttttgt 1620 tcgaggttgt ttggcggcgt cgaagttcgt ttttattttt tgggtatttg tcgagcgcgg 1680 cgttcgaatt tttcgtttta ttattatttt ttttaagttg agatgtaatt tttttatttt 1740 cgttttagag tttagagtta ggagttcgat ttttttgtcg ggtttaggcg ttcgcgaatt 1800 tgagattcgg tacgcggttt agtttagttt ttttttttcg cgtttcgggg ttttttcgtt 1860 ttaaggtttt cgaagttttg cgttcgaagg attaaattaa attaaatttc ggttgagtaa 1920 tgggggagga ggggggtgta gatatataat ttttgtttta ttttacgatt aggaaaggag 1980 agggtttata aggacgtttt aattcgcgag cgtttttgag tttggtcggt gttacggtcg 2040 gttcgcgcga agtgggtatc ggtttttcga gtcgatttcg tgtatttcgg atttgtattg 2100 cgtttcggta gaggattttt tttttttttt tagtttttta aatttttttt tttaaggtgt 2160 aaatgtgtgt gtgtgtcgat gaatgttttt gttttttatt tgttgatttt attttttttt 2220 attggtataa tttttttttt tttttttttt gttcgttcgt tttttatttt tttttttatt 2280 tattttttgt tttcgtttat tttttaatat atatatttat atttttttcg tttcgttttt 2340 tcgttttcgt taggttttga tgggtatagt agattttgat aaaaagataa acgaagttat 2400 tagtggggtt gatgttgaag aatgaagata ataatgtttt tataggtggt gttttaaatg 2460 ttattatttt ttattgaata tttaaagaga tttttcggta aagatggatt tgcgtatttt 2520 tggggtgtga gcggttcgta ttttttagat ttcggggaac gtgtacggga gtacgtgtaa 2580 atttcgtatt cgtttttatt ttataaatag gggttttcgt atatttatta atttatattg 2640 ttttaggtat acgaacgcgt ttgtgtgtat ttgtatattt ttttttcgga atgtgttcgt 2700 gtttggagtc gttcgtattt ttttttaata attttggttt tttgaaagtt cgggtttttc 2760 gggtatcgta tgtagttagg aatttagcgg agttggcggt ttcgtaaagt tttttttttg 2820 gtgcgcgtcg cgtgcgtagt aggaagtttt cgggaataat tttatacgtg tttgttattt 2880 ggtttacgtg tgatttaaga ttaagtgtag gaaaaaaaaa aatttttttt ttttaaaaaa 2940 atattataat aaataattaa acgaaatgaa tatgcgaaaa gtagttacgc gatgtttaat 3000 taaaaatggg cgagtagaga cgaataaatt gggggattta aattttaata atttttttcg 3060 tttttttgcg ttttcgacgg cgtagaggcg ggcgtttcga tttgcgtttg gcgtttttcg 3120 ttaatttttt gtttgttttt tttttttcgg tggtttcggg aaaggagatg ggaggtggag 3180 gaggggggga tgggaggagg gggatggtcg gaatggcggg gagaggagaa ttggttttta 3240 ttgttgatgg taatatatta attacgggtt attgtttcgg ttttaagttt cgtggttcgt 3300 tggtgcgggc gttgtagtgt tagggcgttg gcgaggtttc gcgtgtcgcg atgtaaagaa 3360 atatattaat aaaaatagaa gtagagtggg ggttattttt tatttttgtg cgggtcgaaa 3420 gtaggcggcg agcgggagtg aggtgttatt tttggagttt ttttacgcgt tttgtttatt 3480 ttagagattt gcgcgtttta cgtgcggtag tattttttta attttgggtg gaggtggggt 3540 ggggggggga ttattgggga attcgggtag cgaagtttgg atttgtaggt ttcgttagag 3600 ggtttggtat ttaggggttg attcgtaata gcgaatgggg atagttcgaa gtgaggcggt 3660 agttgcgtcg gggtcgcgat tttattggcg gagaggaatc gtattcgggg gaggcgtttg 3720 gcgagttttg taaattttta ttttggggga ttgatgttcg tttttattaa tacgtttttt 3780 tagttttttt aagttttaga gtatttttgg tgggttggcg gggtcgaagg tttgtgtttt 3840 aaggtcgtag gttataattg gggttttagt tatgaggttt ttaggttttt ttgtttaatt 3900 tttggtttta cgaagggtaa cgtggggggc gttaaggttc gcgtattttg aggtttggtt 3960 tttttatttt taaaagtatt ttattttggt tcgatttgat ttcgggtttg ggatggggtt 4020 tgggatgagg ttttgtttgg gttttagatt ttttttttcg tttcgttgac ggtgtttggt 4080 tattttattt tagaaatgga ggacgttttt aagtgttttt tttgtatttt tgttttttta 4140 gtttttagtt taaggtttcg ttggttttcg gtcgaggtta gaagggtagt agtggaggtt 4200 tcgttttttt aagtaaggta aaaagcggcg aaaaggcggt agcggcgttt cgggggcggg 4260 ggacgaggta tatcgatggt attaatatta ttgatgggga aaagttcggg gtaggagttc 4320 ggagattagg tttttagttt tttttttgtt cggaggtggg tgggatagag cgggtggtta 4380 gttgtgtgtg tgtgtgtatg tgtgtgtgtt ggtggggggg tgtttttgaa tgtattcgta 4440 ttaattattt ggggtttatt tgtatttttt ttgtttgaaa gtttgcgggg gtagagggaa 4500 aaggaagggt tgaggtggtt tgtatttttt agtttttagg gtttttaatt agggttgggg 4560 ttggggttgg agttagggtt gggggagggg tgcggggaga ataggaaaaa aatgatagaa 4620 aaaaagatta agtttggaaa gtttttcgta gattcggtta tttttttaaa tttcgggatt 4680 ttgttttttc gggagtttta gaaatttttt ttttattgaa ttgttgttat ttaattttaa 4740 ttttttttag aatattggag cggtttcgaa ttcgaagtat ggagtaggtt tgggtgggta 4800 tttcgttttt ggttaagttt atattgtgcg ttttcggcgt attcgttttt tagtagttta 4860 atattagtag taaaacgtag gtttttgggg gaattttcgt cgttcgttat taagggttat 4920 ttttagacgg gcgtcgggtg tagcgtcgtg atcgggcgtt ttggcgtcgg ttcgggcgcg 4980 aaatttagcg gtggtaagcg gagggtgggt ttggtaatta ttcgcgcgcg ttcgagttaa 5040 gagtcgcgta ttgtttgttc gcggtaaagt tcgttttttt tcgtttggag ggttgttttt 5100 atatcggtat taagaaatcg atttcgttag cgattgtaag tgtttgcgat tttgattttt 5160 cgtttatagt tgagcgtttt gtatttaaat ttattgcgtt tcgtatgtaa tagtgtttcg 5220 ttaaggggtt tttgggtatg aaattttttt tagaggaaat gtttcgacgt agagaaagtg 5280 gaaaaggtta atcgaattta taaaaagaaa attttttttt tttttggtta aatttttttg 5340 cggttttttg agcgcgaaaa aaaaattatt attatgtaat agagtgtagt taatttttag 5400 aatttagtag taggatgttt aggaagttta gtaggacgta tagattttta tttgtcgttt 5460 tagtaggatt ttagttagga tttagcgaat agtggttagt ttttgtgttt tttgttggaa 5520 ataggtgtga gatttgtgga gttttgtttt cggagcgtgt gtatttggaa gagattggta 5580 gtttgttagg aaatttattt ttatttataa atgagatttt tttaaacgat ttttttatgg 5640 tatttttgga tgaattaatt tagtatattt tttgtaataa agttttattt aaaaaaaatt 5700 tacgttgtta tttttt 5716 <210> 121 <211> 5474 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 121 tttttaggag taaagttttt attttttttt tatttatttt ttatagttta attgattttt 60 tttttttttt tttttgaata acgagaagat tttttagttg tttaattttt atttttttag 120 ttgtaatatc gttatttttt agtttagcga acgttgggcg aacgtttttt tttcgttttt 180 tttgtttttt ttttttattt taagttttcg gttttttatt cgttgaacga tgttttattt 240 cgttcgtttt tgttttcgtc gttgttgtcg gagtcgaagt agagaaggta gcgggtttcg 300 tgatcgtttc gagagtttcg cgttttcgat tagggggcgg gggcggtttc ggggagggcg 360 gggtaggggc ggggggaaga aagggggttt tgtgttgcgt cgggagggtc ggcgtttttt 420 ttcgaatgtt ttgcggtttt agtttttttt tacgttcgcg tagttttcgt cgtagtttta 480 gttgtagttg taggattgag tcgtgtattc ggaggagatt ttcggaggag gcgataaatt 540 tcgtagtgtc gcgatttaat tttagttttg ggtaggtgag tgttttcgta gtttcgtcgt 600 tcgtcgtggg gtcggggata gggagaaggg agtgtttgtt tggtttgcgt ttttcgtttg 660 ttagtttttg tttcgaggtt ttggggtatt taattcgtcg atttttgata tcgtagcggg 720 gtaggttgtt ggatagtttc gagcgtttgt agttgttgtt gttatttttg atttatatgt 780 ttttagtttt gttagtggta gtttttttgt tgttcgtagt ttgattagta atttttcggg 840 ttttcgtatt ttttttgttg cgcgtttttg ttttagcgcg gtcgtcgaga ttttcgattt 900 tgttttaggt agggcggtag cgtttcggat tagtttttgt tttcgtgttt ttacgtatag 960 gtagttttag gagtagcggt tagtaatttt tttggggata ttttattgta gttcggtagg 1020 atagtcgatt agagtcgttt tagggggtgg tcggagtgtt tatttcggtt ggaattttaa 1080 ttcggttttt tgttttgtga ttttggggta gttagttgat ttttttgaat ttcgggtttt 1140 ttatcggtgt aatgagtaaa atataaataa tttttttttt atagttgagg ttatttatag 1200 gaagtattta ggagaattgg tttaggtaga tattagtaat tattagttgg aattcggtta 1260 ttattattgt attttttttt agtattgtta ggggtttggg aatttttttt tttaggtatt 1320 tttatatttt gttaggtatt tttttattta ttggaatagt tttgtttata tggttttaat 1380 aggattaaga gattggcgtt aagtttaagg ggtattatta ttatttgtat tatttagatt 1440 gtagatgatg atagtaagat tagggaatag tgttattttt agatttattt atagtattat 1500 tagtgtttat gttgttatgg ttaattttgt tatttataat agtattattt atattttaga 1560 ttttatacga gagggatttg taattgttcg gttggtgtta ttgttaatag tattattagt 1620 tttgttttta ataaaaagga ttatttatat gatgattgta attattttta taggttttaa 1680 ggttttgttt atattgtgta ggtttatgtt gttttttatg aagtcgttaa gggggtagta 1740 gagagttttt tttttgttat agttaaagtt ttggtttttt gtgttttttt gttgattttg 1800 ttgagtgttg gagtttagtt tttatgggat agattttggt tgtcggttga tgggtattta 1860 gtatggaggt ggtgggtgtt gttagatgtg tgtatatacg tgtatgttta tatatatata 1920 tatatatata tatatagaga gagagagaga gagagagaga gagagagatt tggttttaat 1980 tttttgggtt gggtttatga agattgtgag ggagatggat atttcgggtt agatagaaat 2040 gatgtgataa gaggaaagtt ttttgaatag tttaagaaat ttaaaataag ggtagagata 2100 tagacgttgg agttgaaata gagaggggga tgttgtggcg ttaagggaac ggatcgtatg 2160 attgttgagt ttttagggtt agagttggag aggtgtggtt tgttttggag gaagagaaga 2220 ggaagtggag atgagtggtg tgtgggatag agaaggttat agaattttgg atttttgggt 2280 tttgaggttg gtatcggatg tggggaagtt tgagtttttt tagggttttt agttgtaatt 2340 gggaggttga ggttcgagat tggagagata gagttttttt agaattgtac ggggttattt 2400 ttttggtttt attggttagt gatttttatt tttggggtta agggtaggtt gttttttatg 2460 ttttagagta gttaggtttt tattggtttt aggttttttt tttttatttt tttattgtta 2520 gatagaggtg aaagggtggt ttagggtgtt ggttttaaaa tgattttaat tatatgggtt 2580 tttgggttgt tcgttagaga gatgggagtt aggtttgtga gtagttttag ttttagttta 2640 gagagaaggg agggagggta ttagaagggg gttaggttta ggttttggta tagtttagat 2700 gtatggtaaa tagttttttt agtattcggt gggtattggt tgtttttgtt taatggtttt 2760 tattttagtt ttagaatagt ttttttaagt attttaatgt ttggagttgg ttttcgtatt 2820 tttaatttgg ttttattaag aatttttttt ttttgaaagg ttagagagag gttttaagta 2880 tttggttgtg ttattttttt tttaattttg attttaggga atgatattta gatatagtgg 2940 gggagatggg ggttatgatg gtagggaggt gggaggattt gggaaaagta ggaaattttt 3000 tattatttta ggtttaggaa agtgtaggga taggtatgaa ggtagatgtt gagagggtag 3060 ggaagatggg ggataaatag tgggtttgga atgggagtgt atagttagtg gaataaattt 3120 gatttttagg aagttttgtt tgtagtttaa tttttaattt ttttgttgta ttattggttt 3180 attttatggt atatttggat ttttatgttt ttttaagttt agtttaattt ttaaagatga 3240 tgtagttttg agtttttttt tttgggagta tattgttttc gtgtttgatt tggttttatt 3300 agggatttag ggttagtttt attttttttt gagttttagt ttttattttt taatgttata 3360 atatattttt tttatgagag tgtaagtgtt tcgagatttt tggaggaata ttttgggttt 3420 tagagttttt gatagttagg ggtaggaagg ggtagttttt tttatttatt tttttttttt 3480 ttagtttatt ttttagttta aggtttttat aaaaggtagg gtgggggaag ggaggggttg 3540 gatagaggtt agattggtag agataggggt tttgttttaa ttgatttttg agttaagagt 3600 ttcggtggga aagttcgtgt taggtagaaa ggagaggttg ggaagaagaa gggaggaggt 3660 agttaaggaa gggggatgga gaatgttggg gagtaaagag aggagttttt ttataaataa 3720 tggtggggag gaagtagagg agagggtggg tttaggagaa gttgtgttta tttgcgttcg 3780 gtttaggagg tttttttgga aaaggttagg tgagtatggt gtttttggag gtagggatag 3840 tttagaaggt agaagaggtt aaagagatat tatgggagaa ggttttgggt tcgaggaagg 3900 agtttggtat tgggaggagt agatggaatt ttgagtataa gagtatttat tatttatgtt 3960 gtaaattgag tttttattgt ttgtttggtg ttatgtattt gtataggagt tttaagatat 4020 taaatatttt taaagtatat ggttttattt taatttatga gatagtaatg atgatgtttt 4080 tttataagta agaaaataaa ggtttagaga aggtaaggag tttggtttag gttatatagt 4140 gagttgatta ggattcgggt tttggttttg agaagaaatt atttgttggg aagatgggga 4200 ttagaaatag agagtttatg gtgatgtgaa ggtaggggat ttttggagtt aggatatgtg 4260 tgaatttata tgggtgtggt agggagtagg ggggaagttt attttgaagt ttaattttat 4320 tttttttttt tatgtttttt tgttagtttg tagtatggtt tagttgtttt tgtttttgtt 4380 ggtagttttg gttttggttt aggtttttgt agttttagta gatgttttgg aaggagatag 4440 tttaggtaag taattttatt tggggttatc gtttttgttt tgtttagttt taattaattg 4500 tttttaggtt taggggtttt aggaagagag agaattggag ggttgtgggg aagcgtttag 4560 gttggaatat ttggaaataa gggttgagtt gtgagtattt ggtgggttgg agaaattatg 4620 gggtaggatt agggaagggt attgggtgta aggttttggg tttttaaggt ggaggatagg 4680 ggattttgaa gttaggaggt gggaaagggg tggaattggg agaaattttg aaggaggttt 4740 taaagggagt agattgggaa attgggttgg aggatttagg gggcgaggtt ggaggatttt 4800 ggggtgtggt ttaggaattt tggagaggaa gtggaagatt ttgagagtag ggtaaggaat 4860 tttgggggtt gaattgattg ggagattttg ggggatgggt ttggagatcg tcggggtggt 4920 tttggaggat ttagaggtag ggttgtagga ttttggtttt tggtttttgg tttttggttt 4980 taggggggtc ggggaatttt ggggtcggaa ggagggattt tggagcgggg tttggaggtt 5040 atcgggtggg attttgaggg tcgatagcgt taagttttag tcggttttat tcgtttatag 5100 aggatcgcgt ttttcgcgtg cgtatcgcgg gcgacgcgtt attgtagggc gtgttcggcg 5160 gcgtttttat tattttttgt tacgtttatt atttgcggtt atcgtcgagt cgtcgggttg 5220 tgttgggttt ttcgcgggtt aagtggattt ttttgtttcg gggtcgggag gtagaggtgt 5280 tggtggcgcg gggagtgcgc gttaaggtga acgaggttta tcggtttcgc gtggtattgt 5340 ttgcgtattt agcgtcgttt atcgacgttt ttttggcgtt gagcgagttg cgttttaacg 5400 atttaggtat ttatcgttgt gaggtttagt acggtatcga tgatagtagc gacgttgtgg 5460 aggttaaggt taaa 5474 <210> 122 <211> 5414 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 122 tatatagtga agcgcggtgt ttttcgagtt taaatgaaat tttaatttaa taattttttt 60 ttggtttagt tataatttgt ttagagatgt tgttttattt tttttaaagc gttattcgta 120 ttataattaa atgatattta agtttttaat tttgatttat tttatttttt gaagtttgag 180 atagagttgt ataatgttat tttttttttg tttttttgaa aattattttg gttgttgttg 240 aggtagaaat taaatattta agtatttatt tgaatcgttc ggtataagtt atatttattt 300 acgtgaatat tttttttttt ttattttatg tttaggtttc gttgagttta tattcggtaa 360 tattgttgtt aggagttttt ttcggttatt atttattatt tttttttata taggggaaga 420 gaaagggaag ttcgagagga tttagggaaa gtagaagggg gttaaggatt atggatagag 480 ttcgtcgcgc gttcgttgtt gtcgtttttt ttagtatttt ggcggttttt gaggatagcg 540 gttttatttt gaaatcgtta tttcgttcgg ttgaggttag gggtggatag gcggtttttt 600 attttttatc gtcgttttcg ggagttgatt attcgagggt tttttttttt tatttttttt 660 tttattttgt ttttgtttta gcgcgcgtta gcgtttttta ggtttgtcgt ttgttttcgt 720 atttgttcgt tttttttagg cgtttagtgt ttgtatttgt tttcggttaa ttttcgttcg 780 gattgggtta ttcgcgggtt tttgcgtcgg ggtttcgggg tttttttatt ttcgtttgta 840 ttttgttttt ttcgtttttt agggaggtga tagtagtttt taatatcgcg ggaagtatag 900 agaaaatggg atttagaagg agaggaagta gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 960 gtgtgtgata gagagagaga gatagataga aagagattat ttttttttgt aattggaatt 1020 aagagtgtgt gtttattttt aggaaaagtg gtttgtattg ggattgggat agaagtggga 1080 gtgaagtgtt agttaaaaat aggtttcgta tcgagaggtt gtggaaatga agataagtga 1140 ggtttgtgtt agttttcgag ggtgtgtgtg tgtgtgtttg tgttgtgggg tgtatttagt 1200 agtatatgcg ttgtgtaatt tttgattttt tttttttttg ttagttgttt tttttttttt 1260 tgattgtggt taatgaagaa taataaattt aggggtaggg tttgttagtg gattttttta 1320 agatttaatt cgaattgtat tggatatagg gaggaggagg aagagaaaag gggggtaaga 1380 ggagcgtgtg tgtgtgtttg tgtgtatgtg tgtgtgtgtt gtgggagggg tggggatagc 1440 ggggaggggg aggagtcgta tgcgtataga cgattcgagt ttgtttcgcg gttgtttaat 1500 tcgttgagag ttgcgagaaa tcgagtgaga gaaagttttg tagttttttc gattttatgt 1560 ttttttggta ttaggtattc gtcgggtcgt ggggggttcg tagtcgaacg tcgattttcg 1620 ttcgtattgg gttgggagtt tagagtcgcg cgtagaattc gggttggtcg taacgtttgt 1680 gtttttagcg gtggtcggga atttgggatt agggttattt gagttgacgg ggtgggggcg 1740 ggtcgagtgg ggttggaagt ttggaattta gtggtaagta ggaggcgtag gaggtggtag 1800 ttaggtaaga ggtattttta tttatttaac gttggtttgg gtcgtaattt tatttgggag 1860 tttttttttt cggtgagata gagattcggt agaagaagcg ggaggggttg gaggttggtt 1920 tttaggtagg tattgttcgg cgattggagc gcggatttgg ttatttgggt ggggttgagt 1980 gggggcgcga ttgtgagtag tagtcgcggg acgttgcgaa ggggcggcgg taatagagta 2040 cgggcggggg tagaaaagag gcggcggagg gcgcggtggg ggagcgcgag gcgagtgttg 2100 agagagtaga aaggatttaa gtttgagggg agtagagagg aagaaggggt aacgcgagaa 2160 atcgaatagg agtcggcgtt ttttggtaag ggagggcgga ggcgcgcggg agagagggag 2220 agagggaggg cggggggcgc gggggtaggc gcggggagag gggagtataa ttcgtcggtc 2280 gcgaggagcg ggggtagttt cgggtgtcga ggtttgtagt tagcggtaag cggagttagg 2340 tattcgttta gattgatagt agaggcggcg aaggagcgcg tagtcgagat taggcgtata 2400 gagttcggag gcggcggcgg gtgagtttaa tttcgtatag ttttttttag ttttagtttc 2460 ggttggttcg gtatttttcg gagggtttcg gtagtcggga ttagtgagtg tttttacgga 2520 ttagcgtttc ggcgggcggg aagatgatga tgatgttttt gaatagtaag taggcgttta 2580 gtatgtcgta cggcggtagt ttgtacgtgg agtttaagta ttcggtattg tatagtattt 2640 cgtcgggttt ttcggttttt atcgcgtttt cggttagttt ttttagtagt tcgagtaacg 2700 ttggtggtgg cggcggcggc ggcggcggcg gcggcggcgg cggaggtcga agtagtagtt 2760 ttagtagtag tggtagtagc ggcggcgggg gttcggaggt tatgcggaga gtttgttttt 2820 taattttatc ggtgcgtatt tttgtataat tatcgtttaa aggtatattt tgatagtttt 2880 ttttatttgt ttgatgtttt ttttatgttt gtatagtaaa ttattttata tttttaatta 2940 attttttttt tttttttttt taagtattta gtaggttttg ttttttatat taatttttat 3000 gatttgggat gttgtttgtg cgcgtgttgt gttgtgtttc gttgtgttta taggtttatt 3060 tttttttttt ttttgtattt tcggtttttt tttgtggttt tttttttttt ttttttattt 3120 ttgtttttag gattattatt attattattt taacgatttg ggaatgttgt aggcgcggcg 3180 acggtgtcga gttttgggtc ggggttttcg gagagagggc gtataatttt ttgttgagcg 3240 taatgtgtgt tttttattta taattgtaga gtaatatatt cggcgggttg gatgagagtt 3300 tgttggttcg cgtcgaggtt ttggtagtcg tggatatcgt tttttagagt aagagttatt 3360 attattattt attttattat agttttttta aatcggacgt tatttattat attatgaata 3420 ttatttcgtg tacgtcggtc gttttttttt tatcggtgtt tatttcgtat tttttcgcgt 3480 tggcgggtac gtattattat tattattatt attattatta ttattattaa tcgtattagg 3540 cgttggaggg cgagttgttg gagtatttga gtttcgggtt ggttttgggc gttatggcgg 3600 gtttcgacgg cgttgtggtg tttacgtcgg tttacgcgtc gtatatggtt attatgaatt 3660 ttatgtatta agtagcgttt agtatggttt acgcgtacgg gttgtcgtcg tatatgggtt 3720 gtatgagcga cgtggacgtc gattcgcggg atttggaggt attcgtcgag cgttttaagt 3780 agcgacgtat taagttgggg gtgatttagg tagatgtggg tttcgcgttg gttaatttta 3840 agattttcgg cgtgggttcg tttagttaga gtattatttg taggttcgag ttttttatat 3900 tgttttataa taatatgatc gcgtttaaat ttattttgta ggtatggttc gaggaggtcg 3960 agaagtttta tcgcgagaag tttattaagt ttgaattttt taatggcgcg gagaagaagc 4020 gtaagcgtac gtttatcgtt gcgttagaga agcgttcgtt cgaagtttat tttgttattt 4080 agtttcggtt tttttttgaa aagatcgtcg ttatcgcgga gaagttggat ttgaagaaaa 4140 acgtggtgcg cgtttggttt tgtaattaga ggtagaaata gaaaagaatg aaatatttcg 4200 tcggtattta gaagattttt ggttttttta gagacgtttt ttttttcgtt cgtttttttt 4260 tttttttttt tttgtttttt tttatttttg gcgattagaa ataattttag taaatgtgaa 4320 tttcgataaa tcgaggattg aagagggagc gaacgagcga ataattgagt ttaagtcggt 4380 gagaatgtga aatagttttt taaaggaaag aataataaaa gatggtattt gtttgttgta 4440 gtaaagttgt ttttttgaat tttatttcgg tttttttaga ggaagtgtgg agatggttgt 4500 ttgtaggaag gtagacgaga tagtgtttaa aaagtttata agaatgatta agtaagattt 4560 gtttttattt ttatagatat tattcgtgtt taagtttaaa agtatatttt gtaattattt 4620 tttagaaata gaaattgatt taggattaaa attttaaatt agagttgatg tttaatgtga 4680 tagagatatt tttaaagtat tttgaatttt aaaaaaagat ggtagatttt ttgtatttat 4740 attgtatatt atatatatat ttttattgtg gtttttattt tttttttttt ttttgaagtg 4800 ttaatgttta agaaaagagt tgcgtttgtt gtgtttattg attttgaaag ttattattag 4860 attattgtag aataattttt tgtaaattat taatttattt ttttagtaat ttaattttgt 4920 gtatatttta attaattaaa tttttttcgt ttaaaaaaag tgggggaaat gtatagttag 4980 taacgtttaa aaaattttgt ttgatgagtt tatcgaattt ttatagtttt ttttttatat 5040 tgtgtttttt ttgatttatt tgtatatttt tatttgaatg aagattgttt ttttttttgt 5100 ttttattggt agtgttttga tttgtgagtc gatatttagt aatggatgtt ttaatcgtgt 5160 agatttgatt tattgtttga agtattgttt atttcgttat atatttaatg gggattttta 5220 tattgttttt atgatatatg agcgttttta tttattttta tatatatata tatatatata 5280 tatattttta atagaaggga agaagtagtt ggaagtatga tcgatgtatt attttttagt 5340 tttaggtgta tttgttattt ggtgtttgtt ttttagattt tagattttat taaggtattt 5400 tagtttttta gttt 5414 <210> 123 <211> 3381 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 123 tttattattt ttggggagtt tttttggggt ttatagaaaa ttttatttta tttcggtttt 60 tttagtatcg gtgatatttt ggaattcggt ttcggttgtt cgttaaggag gatttggttt 120 gggggcggga gggtgtttta gagtttttgg gggtttatcg tattttttat tcgaggtttt 180 tcgcgagcgg agtcgttttt ttaggtcgtt cgtttttttg tcgtaggagt aggttcgcgt 240 tcgtcgttcg agagttttcg gtagagggag atattttagc ggttttttcg atttggtagc 300 ggtcgggtcg ggagtgggtg ggggtgatgg ggggtgggga gaaaaggggg agtggggaga 360 ggggaggtgt gtgaaggggg ggttcggggg gcgggttttt gtgtcgttga cgtttcgagt 420 agtgttggga agtataggtt gtgttgttac gtcggtgtta gtttgatgaa gattggtatt 480 aggtaagttg ttatttattt ttatgttaga gacgtttttg taggcggcgg cggcggcgcg 540 gcggcggttg ttgttgcggg cggttgtttt agagcgcgtg tgttttattt tagtttttaa 600 gttagagtat tatttattgc gatagggtaa ggaggagaga gggagagagg gaggtagtag 660 ggaggagaga gagggaggta gtagggagga gggaggtagg gagtagcgag ggacggcggg 720 agcgtgtaga gagaagttgg ggaagcgtcg ggagagcgcg gagcggagta gcgcgagggg 780 cggcgaggtc gggtacggag gttgcgagag tttcgcgggt cgttcgtttt tttgttcggt 840 tagcgtttag tttcgtcgtc gtcgtcgtcg tcgtttcgtc gcgtttgggt tcgtggtcgg 900 tcgcgtattg ttttcgggtg taaggagtcg ggttgcggat tcgaatcgtc gcgggtttaa 960 tttcgtagcg ggcgggcggg gagttgtgcg ttaggagcgt taggggattc gagaatagga 1020 ataggtacgt cggttcgagt tcgggtgtag aaggttttcg gtcgggcgtt tcgcggggag 1080 aggttgggaa tcgcgggtag gttttaggtt tttttttttt cggtttcggg cgtttttggg 1140 gtcggcgttt atttcgcgtt attagtttgg agatgttttt tagcggttgg aggcgggagc 1200 ggttttaggt tggggttagg tgatcggagg agtcgaggag tcgcggtcgc ggtttgggga 1260 ggtagggcga atgagggttt gtagacggat tagtggagat aggggaatat cggcggggtt 1320 cgggaagtta ggattcgagg ggttatacgt acggattttt atttagggag gagcgagaat 1380 gtgtagggtt atcggttttt tatgattgtt ggggattttt ggtgaggcgg gcgtaggggt 1440 tcgcgcgagg tttgggaatc gggagttttt ttggttcgag aattagggga tgagttcgta 1500 aaagagggaa ttgaaagcga tcgagagcgg agagttgagg gggatggcgt aggatttcga 1560 atttgtcgtt taaagtttgt atttttttcg ggttaggaga cgggtttttt tggttttcga 1620 tttttaggaa gaaacgagcg aaatgggtcg ttttttttcg gggtttttta cgggggagtc 1680 gggggttttc gcgcggtggg gagattcggg ttgggaattg aggggtaggg gtttgtggat 1740 cggtttgaat tagggttggg ttttaggatt agtttagagt tcggtttata ggatttagat 1800 tgtttacgga atcgggatcg aggggtcgat aagtagttta tacgtcggtt agagtagagg 1860 gttggaggtc ggagttgggg gttggaggaa cgggtggcgt ttttaggatt tagtaatagg 1920 attatagttt ttttttgtgg tggaagttat tggaatttgg ggagggtagt acgaggggtt 1980 ttgtagtttc gcgtgtgaaa aagcgtttag gtaggcgatg aaagtagttg atttgagtta 2040 tggtaggcga gtttcgaatt tttgttgttt ttttttgaaa gtgttttttt aggaggagag 2100 gatttgggtt atataggatt cggttttaag agagcgattt cgggaagcgg atagatcgaa 2160 gagatttttt gggcgaagcg gtagggtagt ttcgcggggt tgggagtgga tttgaggttt 2220 cgatttaggc ggttcggagt gttttaggag ttatttgggt ttgcgggcgt agcgcggcgg 2280 ggcgggagcg gtggttcgta ggggtcgcgg tttgcgatga aggtcggggg gtagcgttag 2340 tagcgaggtg ttatagtggg tcgaggagtt tgggttgtgg tttagggtag gatcggttta 2400 aattttagtg ttttgattgg agtcgttttt tgtgtttatt cgcgtcggat tgagaagttt 2460 ataaattcgg tttttggtgc gttcggggga ggaggaagtt tggagtgttt tattgttatt 2520 ttttttgttc ggagatttta ggatattagt ttttcgggtt ttaaatgttt tataatcggt 2580 ggtagttaaa agtttcgtat tttaggtagt ttagacgatt tttttcgttt taaatttgag 2640 aatgatggtg tttaaatata atacggtgta ttatttaaag tttttgtttt tgtttttttg 2700 ttttttttgt cgttttggtt ttcggaggtt ttaggatttt ggtggaagcg gggagggagg 2760 gtttcgtttt tggttttata attttttatt cgggttgtat ttttatagtt tgggtttagt 2820 tgtggggtgt ggggtgggaa ggggtttcga ttagggaggt aggttatttt ttgggtattt 2880 agagaaagag tgtgtgtggg gggtgggagc gggggggagg agggtattga ggggaggaag 2940 atttgagatt tttttttttt aatattaaat ttattatttt agttttttgt atttttggta 3000 gggagagtta gatagttttt ataggatacg gaagacgtac gatttacgat ttacgagtgg 3060 tttcggcggt tcggggcgcg gcgattgtcg tcgcggagtt ttaaggttgt tgttttgtag 3120 gtttggaatt cgtgagagtt ttttttcgtt gagagttcga ggggggaggg agtcgtgatt 3180 ttacggagat tttttggtta tcgttttttt tttgtgagcg ggaaaggttt gaaagttaag 3240 agaaagagag gttgtttaga ataaggggta gggggttatc ggagggagat gggttcgatt 3300 atcgtttata gtaaaatgtt tcgtgcgaat tgtattgaag tatatttaat ttgagattgg 3360 ttgttttatg attttttttg g 3381 <210> 124 <211> 1266 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 124 ttttttatta gatttggtcg cgggaaatta taaaggatag ttaagtgatt tttaaggaga 60 aagtttttgg tttatttttt tttcgtcgtt agatttgtag gtttttggga ggagtttttt 120 ttaaattttg aagattgtta ggtttttggc gaacgattta ttttttgaag atttagagtg 180 gtggattata ggtattgaaa agtttttggt ggttttggaa gatgattttg gtgtgagttt 240 atttttttag gttgggggat taggtagagg aatttttttt gttatttttt gaaagaagat 300 tagtggggaa gacggggttt gaagtgtgga ttaggagatt ttacgttttt gtttattatt 360 tttgtttaaa ttataaaaag atcgaggagt gtaatgaatt ttaggaatta tgtatcgttt 420 ttttgaagtt tgtttaggaa tttaattttt ggatttagaa atttttgtaa agatagattt 480 attgagttag gtagtttgta ttagtatttt tgtttttaag attttgtttc gttttttttt 540 attgagagat tgattttttg agtgatttgt gtgtttttcg gtaaatgatg gagacgcgta 600 aatcggcgga acggttggtt ttgttatatt cgttgcgtat cgcgtttttg ggcgtttcgg 660 ggattttgtt cggattttcg cggagggatt tttttagggt cgttttgcgt ttggacgtcg 720 cgtgttggga gtgggcgcgt agcggttgcg tacggggatg gtagtatttg ttcgtgtcgt 780 tggatagcgt tttcgagttc gttttttttc gtaagcgtaa cgagcgcgag cggtagcggg 840 tgcgttgcgt gaacgagggt tatgcgcgtt ttcgagatta tttgtttcgg gagttggtag 900 ataagcgttt tagtaaagtg gagacgtttc gcgttgttat cgattatatt aagtatttgt 960 aggagttgtt ggagcgttag gtttgggggt tcgagggcgc ggtcggcgtc gttttttagc 1020 gtagggcgga atgtaatagc gacggggagt ttaaggtttt ttcggcgttt tcgtttagta 1080 gcgagttcga ggaggggggt agttagcgag cgttcgaatt ggttaggatt ttcgcgttcg 1140 tcgtatagcg cgtagtcggg cgtttaattt aaggtttttt tcgaaggtgg tttgtatttt 1200 taatttggta ttttttttag gtttaaattt taagaaaaag aaatgggtgt tggggtttgg 1260 gggatg 1266 <210> 125 <211> 2968 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 125 ttgtagtttc gtttttttag gtttgtaaag gtagacggag aattatattg gaatttaaat 60 cggaagtttt taaggtattt taaaaatatt ttttttattt tttttttttt gtagatattg 120 gagaggttgg taaacgggtt tttttgaaga tagaagaatg tatgatttaa tgtttttttt 180 agatttttgt atgagtggat gtatagtgtt tcgtattgtg tggtggggcg gggtgtgttt 240 ttttattgat gaaatatatt gcgtaggtta attcggtaaa ttgaaatgag aagagtcgat 300 tgcgggggtg gagggggtgt ggtattaggg tgtcggcgtt tgtggagggg ggcgcgaatg 360 tgaacgtgtg aaagcgagag gcgtgttagg agagcgcggg aaagtttatt ggtgaggtaa 420 gtgtgcgttt atttttatgg cgttttggtt cgcggtagtt tttggttggg cgaggggtgt 480 gatgtgggag tggggtggga gggggtagta ggcggggttt gttacgttat ttggagagtg 540 tgtgttggga aggaagggta gagcggagag tcgagtcgtt gtagttgcgg cggcggtagc 600 gaagttttga gtcgtgggga ggtgggtttt cgcgttcggg cgtcggggta gtttcgggtt 660 ttttgcgagg tttgcggcgc ggtttttagg gaggaggtgg cggttgtggc ggtcggaatc 720 gcgattttgg tcggatttag tttcgcggtg gacgtagggc ggaggtcgag tttcgttagg 780 agtttttgtc gagtcggagg gaggcgtatt tggcgtttcg gtattagcgg tagtcggggg 840 ttcggagcgg ttggaggagc gtagtgggaa ttgggaagag ttagttcggt tggagggcgg 900 atttttgcgt tcgggagtcg ggttttaggt atcgttgggg gcgaagttac gcgttttttc 960 gggtagttaa ttttatacgc gtttgtgtgc ggtttcgggt attttagtaa gttttagtat 1020 tcgggcgcgg gtaacgggaa gcgtagaatt aaatttttag cgtttaggtt atttttttag 1080 atttagtttt gtagggatta gggttttagg gtttacggat ttaacggtta ggttagatcg 1140 cgaatcggga ggagcgcggg ttttatttta aagagggcgt agtcgggagt tggggagcgg 1200 gtgtcgcgtt ttagagattg tgtcgtgggc gtcgttttag tggcggggag cgtattttcg 1260 agggggtatg agatcggaga aattttttac gttggcggcg tcgggggagg ttcgtgggtc 1320 ggagggagag taataggatg cgggagattt ttcggaggtc ggcgggggcg ggggttgttg 1380 tagtagcgag cggttggtga ttaatatttt cgggttgcgt tttgagatat aattgcgtat 1440 tttgtcgttg ttttcggata cgttgttcgg agattttggt cggcgagttc gttttttcga 1500 ttttttgagg aacgagtatt ttttcgatcg taatcggttt agtttcgacg ttatttttta 1560 ttattattag tttgggggtc gtttgcggag gtcggttaac gtgtttttgg atattttttt 1620 ggaggagatt cgtttttatt agttggggga cgaggttttg gcggtttttc gggaggacga 1680 gggttgtttg ttcgaaggtg gcgaggacga gaagtcgttg tttttttagt ttttttagcg 1740 ttaggtgtgg ttgttttttg agtatttaga gagttttggg tcggttaggg gtatcgttat 1800 cgttttcgtg ttggttattt ttatttttat agttattttt tgtttggaga ttttatttta 1860 gtttcgtgta gatggtcgag gtggaaataa tggtggtgtg agtcgagttt ttttagtttt 1920 tagggggagt taggaggaag aggaggatga agacgatttt tatatatttt attatggtat 1980 tatttttggg gaaatgggga tcgggggttt ttttttattt agtatttttg ggggtttttt 2040 ttttatagat tttttttttt tggtggagac gttgtgtatt gtttggttta tttttgagtt 2100 tttggtgcgt tttttcgttt gttttagtaa gtcggttttt tttcggaata ttatgaatat 2160 tattgatttg gtggttattt ttttttattt tattattttg ggtattgagt tggtgtagta 2220 gtaggagtag taattagtta gtggaggagg cggttagaat gggtagtagg ttatgttttt 2280 ggttattttt cgagttattc gtttggttcg ggtgtttcgt atttttaagt tttttcgtta 2340 ttttaagggg ttgtagattt tgggtaagat tttgtaggtt tttatgaggg agttggggtt 2400 gtttattttt ttttttttta tcggggttat tttttttttt agtgtcgttt atttcgtaga 2460 ggttgacgat gacgattcgt ttttttttag tatttcggat gttttttggt gggtagtggt 2520 tataatgatt acggtaggtt acggggatat gtattttatg attgtggggg gaaagatcgt 2580 gggttcgttg tgtgttatcg ttggggtttt tattattgtt ttgtttgtgt tcgttatcgt 2640 ttttaatttt aattattttt attatcggga gacggagtag gaggagtaag gttagtatat 2700 ttacgttatt tgtgggtagt ttgcgtcgga tttgagggta attgataacg gatttggtaa 2760 gtttgatttt ttcgaggtta atcgggaacg gagatttagt tattttttta tattatatcg 2820 ggtttatgta gagaaaagaa tgtttacgga ggtttgattt atgtaggtag ggtttgtagg 2880 aggggagtat tgagttaata gttttttagg tttttttttt atttttatta tttattttag 2940 ttttagttga ttttttgatt tttttttt 2968 <210> 126 <211> 4899 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 126 gaggtagttt tgggaggtat tggtttgaag ggttagattt ttggtaagaa tttttggaag 60 aacgtttgtt tttcggaatt agatagggag gcgtgtaacg gggtggggtg gggggtattt 120 ttagttgtag gtatttttat ttttaattat ttgtaagagg atatatatat atatatattt 180 tgggtgttag agaagttttt ttttttttgt attttttttt ttttaagttt ttgaaattta 240 gaagtgtttg tttttaggcg ttagttttgt tgagtggatg tggggatgga ggttattgga 300 ggtttagggt tggtttgttg tttttgtttt ttgttaggag tattgtgaag gttttgtagg 360 gttagttttg ggaaatttta ggtttggttt tatttgattt ttttattgga gcgaggcgtg 420 tagttaagtt tgtttagatt tttttaggtt acgggttcgc ggtagtttag tttagtattt 480 gtaggcgggg ggatcgcgcg tttggttcga agatttcgtt ttgggtaggg gatagaaaat 540 atgaaattag atggggagtt atgaataatt gttttttttt tttttttgtc gtgttttttg 600 aattcgtacg ttatgtagga ggggggcggg ggcgggggcg cggggaggag gagggggtcg 660 tttgttatta atttgggaat aagcggttaa tttcggtgat tggtattttc gttttttttt 720 ttttattttt tttagtgtgg ggaaagtagt taagttcgcg cggagcgatt gtgaggggtt 780 ttgttggaat ttggtagcgc ggaggtttgg agagaagttt tatgttggtt tttatttagt 840 cggttcgttt ttttcgagtt ttggaagttt tatttagtcg tgtatttaat ggttttataa 900 agttgattat aagttttagc gtatttttga aggagttaaa agcgacgtag gtgtaaacga 960 gtcgagggag ttttttattt cggtgataga atgggataag ttgggaaagg tttagattat 1020 ataagtttaa ggtttattag gtcgtagaaa gtttgttttg ggaatcgggg gttattattc 1080 gttttattta gcggggttcg gggattttgg gggtcgagcg aggttagttc gggcgggagt 1140 atcgtcgtta gcgcgcgtcg gcgatagggg ggaatttcgt tgggcgttgc ggttaggtcg 1200 gggtttaggg cgttgggttg tgcgtttgta taaatttgtg tttcggcggg tcggtgttaa 1260 ttttagtggg gatacgggag aaagagtacg ttagtaggtt acgcggcgcg tgggtagtgc 1320 gtaatttttg tcggcgttta ggttgtacgg ttacgtttta gtcggtgttt ttaggttatg 1380 gatatttagt tttagggtcg ttttgcgttt ttttttttta gtttattttt tttattggtt 1440 tttttttttg ttcgagtggt agcgcggttt cgtagggagc gatttcggga gggatagtga 1500 tcgtacgcgt ggagtgggga cggcggggta taggacggta gtttaagagt gttcgtatgg 1560 tcgaggacgt tttcgttgcg agtttggggt cgaggggtag ttttttttcg gagttattaa 1620 tttcgttttt tcgtgtttag ggattagtaa tttggtgttg cgggcgttag aaagaaaagg 1680 gtagcgtttc gcggagcgcg cgggggaaga gggattgcgg tagcgggacg cgagggcggg 1740 aggggcgtag tagcggggag tcggagcgta gcggagggga gcgttggggg gcggggagcg 1800 ttcgggtagt tattttgttt tcgtttggag tttcgcgttg cgtttaggag ggcgtaatac 1860 gtagttttcg cgggggttag agttcggagt tttttagtgt atgttttttt ttttcgcgtt 1920 ttgtcgaggt ttcggttttg tttgtcgtgt tttgggtttg gttgtgttcg ggggttttcg 1980 cgggtagggc gcggggtagg tagggcgcgc gcgtcgacgt ttttttgttt gataattaat 2040 ttgagttaat gcgattttta tgtaaagtta atagcggata attgtttatt ttttcgttaa 2100 tagtttttat tataattatt tatttggaaa tttgcggttg gattaatcgt tatattttcg 2160 agatgagcgt cgttgtaatt cgtagcgaac gcgggtaggg atttggagac gtttttcggg 2220 cgttggcggg gtcggtgtgg gttagtttcg ttatcgtttg agacgcggtg tgtttaggtg 2280 ttggtgttcg cgggagaggg ttgtggggcg ttttttttag gatttgtttg atttgttttt 2340 cgttcgagtg ggtggtgcgc gggtgcggga ggcggaggga ggaggagggg tgaggggagg 2400 agggtttgtg gggttgcgga ttcggagtag tttgggtgga gcgcggtttc gggaggtttt 2460 gggtgtatcg cggcggggtt tgggggggtt taggcgtcgg aggagtcgtc ggtgtcggaa 2520 tgtagcgtgt tttatttggg agaaacgttg ttttcggttt tttgtttttt ttttgttgtt 2580 tcggtttttt tggtttcgtt tttcgtttta tttattcgtt tttattttag gttttttttt 2640 taggattttt tttttaagga tttaggtttt tgaaaattat tggtaatagt tatacgtttt 2700 acgattgaaa tttataagag aagagtttta gttttgtagg tcgttttagg gttaggggta 2760 gagatggtgg taggtggtgc gttaattttt tagggaagag gaatttgtat tataaagatt 2820 tgtttttttg agttgaagtt aaaacggggg cgttaagcgc gtttcgtttg gcggcggtgg 2880 aggggtcgcg cgttcgcgtt gttttagtcg gagttgtttt ggttggtgat tggaggttta 2940 acgttcggaa tttaggcgtt tttgtagttt agatttgtcg gttaaggggt tttagttgta 3000 attttttaaa atggtgtttt tggaaaataa taaatttaga tttaattggt gatagttttt 3060 ggttatagag aatgaaattg tttttttttg gcggtggaat ttttaaattt cgaagagtga 3120 aagaatataa tgaaataaaa tgttataaga ttattggatt ttttagaaaa aggaagattt 3180 taaattattt ttaaaatgag gttttgtaaa tttttgttaa aaatttttaa atttcgaatt 3240 tttttttata atatttgatg agtgttttaa gagtaaacga gtaaatttta tttcgagaat 3300 taataaattt aagttttggt taaggttttt ttcgcgtttt tttttcgtga tttggggaat 3360 gtttcgtttt atcgtttatt tggtttttgt tatttcgttt attttgaagt gattcgtgga 3420 taatgttgtt ttttgtcgta gtttcgtcgg ttatttaggt agaacggggt atgtaaatgg 3480 tttggagagg tcgaggtcga atattgcgtt tattgtttcg ggcgtttaaa gcgtcgagta 3540 gttgcgtaga ttttttgggt tcggattttc ggtcgttacg ttaatgttat tattgtaaaa 3600 tattagattt tgagaattat gtagtttgaa tttattagta gttttttcgg cgaaggtttt 3660 ttttttcgtg ataagtttta aagtttagat tttttttaac gttggtaggg gtaggaagag 3720 gaggaggggt ttagggaggg gggtttttcg taagtggggt ttcgggggat ttttgttttt 3780 tttttggtgt atttcgtaat tttaaaagtt ttttttgggg ttttgagcgc ggatgtttga 3840 tttgaatgat ttgagatttg gatatatttt cgtttttttt taagagttgt tttaatgttg 3900 cgagtttaaa tttattgaaa gaggtttaga tattaagtcg agtgaatttt atagatatta 3960 ttttttgttt taatgatcgc ggtagtgatc gtttttgaag ttatattttt tagggtgaat 4020 ttataataat gtatgttaga gaggttgcgc gttttaaagt aaaatagtta aaatattagg 4080 ttacgttttt taaattgtag gattgtaagt agtttataaa tttttagttt ttattttaag 4140 gtgaggagag ttttagtgat ttgaggattt gtttgtattt tcgtttttta cgttcggttt 4200 tttattcgta tttgtttaag tggtttcgtt tttttagaat ttgaatggtg gggaggggtg 4260 tttttgatgt ttcgggtgta gggcgggtat tagcgagcga gatttaaggg cgttagaatt 4320 taggagcgta aattatcgtt agggtttgag ggacgtagag gcgggtggag tagtgttttt 4380 tagattcgtg ggaggtcgta ggcgttagta gaggtaattt tttttttttg agtaatgtta 4440 gtttttttta ggtttaggat ttttattaac gtgttttttt atttttttat aggattttaa 4500 gttgttgttt tttttttgtc gtatttgagg ttgggaaaat tttttaggag aaggtaagag 4560 aaagttatta gattagagtc gaggattaaa ttttaaggtc gaagacggta gaggggtagg 4620 tttttttttg tatattttaa ggtttttttt gtattcgcga ggtttttttt gagcgtttag 4680 gttttcgaaa tgtttgtttt ttttttgata aaaggagggg gtaggatgtg aaggggtagt 4740 gtaattaata atgtttttgt aaatataata atagggaaat atatggagga aatttattta 4800 ttgggtgtgt tatttttggt ggggggcggg attgaaagtg gcgttattta gatttaggaa 4860 aaagttacgg ggtgggcggg gtaagcgggg gatttttgg 4899 <210> 127 <211> 2346 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 127 atttattttg tgaatattcg gatatggtga attggtattg gtattgttgt tgaaggataa 60 tttagtcgtg tttttagtta tggttattta ggtttgtttt gatgtagggt tttgatttaa 120 ggtattagtg tggtttttta gggaagtatt ggggatcgtt atttatgttt gttttggata 180 tggttatcga gaattgtttt gtaggtattt atttaggaat tattcgaagt ggaattgttt 240 ttggatacgt tttttttgta ttttgttttt tttttttagt gtttttgtgt gaagaagttt 300 tttttattta gttttcggcg attttttggt attttggata gtttttcggg gagtagttta 360 tcgttaggcg gcggttgtta agagaggaat ttttttgacg cggagtttgt cgtttcgggg 420 ttcgtttttc ggtaggttcg gggagaggtg gggtgataat gggttggggt gcgcgcgtgt 480 tttataggtg cgagatagag cgagtcgtcg gggtgtgagt tagcgcgttg ggggttaaga 540 agttgggtga atagttacgg aattttattt acgttcggtt tttttattta tttcgtttat 600 agcgcgtgtt ttagtttagg gcgtgcgtgc gttcggtgtt cgatttcggg ttgtgtgtgt 660 ttatttggcg agatgtcgag agcgggggga gtgtttttgt cggtgtattt gggtttaggt 720 taggggattt ttttttttta ttttcgcgtg ggtgtggggg tgtgttcggg ttagggcgcg 780 tgtgtttttg tgtttgtgcg tgcgtgtgcg ggttagggtg gtgggatcgc gtattagggt 840 agggtgtttg cgtttgcgtt tgggtttgtt tggtttgtat gtcggcgcga tttcgatttg 900 gattcgtgtt tttggatgtc gagaggttag cgtggtgggg gtgtttagtt tttcggagga 960 gtattatgtt ttgatatttt cgttttatcg ttttaaagtt ggtttggggt ttcgtaggga 1020 gtggtttgta tggggagggt tcgcgtgttg tgtttttggg aggggtaaga gagtgggggc 1080 gtagggggcg ggttaggttt ttgggcgcgg cgcgggttcg ggggattcgc gcggttgacg 1140 ttaggttatt ttttaaatag agtcggtagc gcgtttcgtt cggtattttt cgaagagtta 1200 gatcgcggtc ggcgttagcg ttatcgttcg gtttattcgt tagttcgtat agtcgcgtcg 1260 tcgtcgagcg tttcgtgagc ggcgtttcga ggattaggaa tggggtttcg ggcgttgggc 1320 gcgtttcgaa ttcggcgtac gtaagagttt gggagcgttc gagtcgttcg gttgttcgga 1380 gttttatcgt ttaggatcgg gagatgttgg aaatgtaatc gtttgttttt cgaggagtcg 1440 ttgttttcgg gattttttgg tattgtgcgt attttggtta gtagttttcg gagaagacgg 1500 cgtttttaac gttcgattcg cgtggtcgtg gtagcgttac gcgagttttt taggcgatcg 1560 tagggttata gtagtttagt cgtcggtgtt ttttcggaaa ttatgatttt cggcgcgggt 1620 ttatggagtt atggtttata gggttttggg tcgcgcgggg ttattttagt cgcggagggc 1680 gcgtaggttg tttttcgttt ttacgttttc gtttttttgt atttatttgt gttatagttt 1740 tttgtgttgt tgcgacgatt tgggtcggag tcgttttttc ggcgcgtttc gttgttttcg 1800 cggttttagc gcgggcggtt agaaattttt ttagaagttt cgtttttgtg attttttcgg 1860 gtcgacgttt agcgagttta gcgtttttag cgcgttcgtc gtcgtcgtgt tcgtttttcg 1920 ttttttcggt tttaattatt tcggtttatt taagttgggt attaagcggt tgttttaagt 1980 ttttattgtg ggcgtgaaga aggggggtat tcgggtcgtg ttggagttta ttcgagtata 2040 ttcggacgtg cgggttttgg gtacggaatt ttattttttt gataggaatt acggtcgcgg 2100 gttggattgg tataggtaag gattaggagt ttcgtttcgt gcgtcgggtt tttgatcgtt 2160 tttattggga gagttattcg ttttttgtgt tttttttttt ttttaattta atttattgta 2220 tgggtttagg ttgatatata gggttatggg gggttatagt agaatttatt tagaattttt 2280 tagtgataat ttagacgggt agtttttgga attgtaaagg gcgttttttc gttattggag 2340 tcgttg 2346 <210> 128 <211> 2695 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 128 gttttttttt acgggggttt cgaggtgttt tgaggaggga gaaagagggc gttttttttg 60 gggagtttat ttttcgggtt tttattgatt tggttttcgt tttatcggtt ttttgcggtc 120 gttgtagaag cgtattttgt tgaatatttc gaggacgtgt ttttcgtata gggagcgttc 180 gtttttgttg gggttggagc ggcgtttgga ggtcgatatt cggtcgttgt tggatttttt 240 cgtttgtcgt ttttgtcgga ttaaggagtt ggttatcgtc gtagttatag ttgtttagcg 300 agggttttag gttttagttt ttattgcgtt tttcggtttg cgtttcgtcg gggcgagggt 360 aggatttggg cggttaggga aagggtagtc gcggggaggt agtgttaaaa tttgaggagg 420 ttgtagtatc gaaaattcgg cgtttataag gttagttaaa gtttgggtag tggcgataaa 480 atgtgtgaaa atttagatgt aaattttttt aatttttggc ggtcgggggg cggggcgggg 540 cggttttagg tttttttgcg aagtagacgt ttgtatttta aatttgtatt ttaaggcgat 600 cggcgtttaa ggggtagtgg ggagtttagt tatattgcgt tcggggtatt aagtggaagg 660 ggaagaacga tgtttaaaat aataagacgt gtttttgttg gagaggcgta agcgttgtaa 720 ggtgtttaaa gtatatttat atatatatat atagaaaatt cgtttataaa gtagagtttg 780 gatttaggcg ggtagcgcgt tttcggtaga aaatattaaa aagtgaataa aacgtttttt 840 tagaaaataa gttattaatc gtacgagaga aggagaggaa ggtagtaatt taattttttg 900 cggttcgcgg ttttgaagat taggaggttc gttttagtag ggtgaggttt atagaatgta 960 tcgcgtcggt tgcggttttt taggggtcgg ttattcgagt tttggaattt cgagaggcgc 1020 gaagtgggag cggttattcg gagtttgggt aggggcgcgg ggcgggggta gttgttttta 1080 gttgcggtga gagtaatttt cggttagtag tattgtaaag agagcgggag gcgagggagg 1140 ggggagggcg cgagggaggg agggagattt tcgagggtta agtatttttc ggggagaaat 1200 tagcgagagg cgatttgcgg ggttttaaga gtgggcgttt tttttttttt cgtttgtttt 1260 tcggtacgag acgggtatag ttggtgatta tttagggaat tttaaatttg gaatgattta 1320 gtagtttaaa taagtttttt taaaaggtag cgatgtcgaa ggtgtttttt ttagttcggc 1380 gtttatacgt ttttaattgg agtttttcgt tatggtttat tcggggtcgt cgtatcgagt 1440 tggttttcgt ataggtttag agggagcgag ggaagggagg gaaggaaggg gcgttttggc 1500 gggttcggga ttaggttatc gtcgcgttgt tgttcgtgtt ttttaggttc gcgcgtttcg 1560 gtagttagta gtttataggt agtagattag atggggatta ttcgtcggac gtaaggtcga 1620 ttatttagtt tcgcgtcgtt tatttcggtc gaggaaggaa gtgattcgcg cgttgcgaat 1680 attcgcgcgt tcgttcgggt ggggcggggg ttggttgtag gcgatgttgg ttcgcggcgg 1740 ttgaggtttt tggtcggagt tgtttattat ggtttggcgt taggggcgta ggcggggttt 1800 ttaggttttt tggggttatt tcgcgaggta gtcgagggcg taattcgggc gtttggggtc 1860 ggaggcggaa ttaggggtcg gggttaggag gtaggtgtag gcggttgtta attcgtttaa 1920 tttgttgcgc gggtggtcgt ttagagtcgc gggtttgcgg ggcgtttttc gtcgtcgcgt 1980 cgtcgttttt ttaggttcgg gagggggcgt ttagggtgga gttttattta tgggttgagg 2040 ttttgggcgc gcggagtcgt cgtcgttttt tcggttggtt tagttggagt gttagtttcg 2100 taggaaattc ggggttcggg cgagagttat cgagatggta ggtgggacgt agagttcgcg 2160 gtagttagag tttttttcgt acggttcgtc gatttacgga agagcgaaag agcgtttagg 2220 tggggtcgag ttgggggtcg ggtttttgga gcgttgggaa gtatagcgcg ttttagttag 2280 gttttttttt ttggagtttt tcgtttttag attttttttt tttttttttt tttttcgtta 2340 tttttttttt ttttttttgt gttttttgtt tttttttttt tttttttttt acgtaatttt 2400 acgtgattga ggtttggatg agaaattttt agaggtagag cgagggaatt gtagtttggg 2460 tttgtttcgt tcggtttttt ttataagaga aatataatta tagtgggagt taaaggattt 2520 taggtgcgta aagaagaggt gggatggggg agttgagaaa atgtagttta tatttttttt 2580 aataagtttg agtacgtaga attttttgtt tagttaggaa gaaagtgaat attggagaaa 2640 gtaaaaatga ttttttggat tttatcgtgg gttttattta tggtttattt tggaa 2695 <210> 129 <211> 2837 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 129 aataatgttt ttgttgttat tttagttggt ttttcgtttg tttaaatcgt tttttagtcg 60 ttgttttttt attttataaa cgttattgag aattgtgttt attatagttt tattttattt 120 ttaattttat ttttaatttt taggtttaga ttatggtatt tggtatagtt tttgaatttt 180 atatagttcg tttcggaagc gtattgtaaa acgtatttta gatgtttttt taaatttatt 240 tttttatttt tttattttag aaaatcgttt tatttattta ttttgagaaa gtggatttaa 300 ttttcgtttt cgcgttggag aaggaaatat aattattttt tttttttttt tttttttttt 360 tttaatattt tttttttttt tttttttgtt ttttttaatt tttaatttta agagtagtat 420 ttagatatgt aaatttttta atttttttta tttttttttg ttttaaatat tgggtaatta 480 gattggagat aatagacgta gggaaatttg ggtttttatt tgttaaggag tttttttttt 540 ttatattcgt ttttatgttt tcgttttttc gaggggtttt gggggtattt ttatcgtttt 600 ttttttgttt tttagaaaat tattcgtaat tggaggtttt cgcgcggtag ttgtattaat 660 agtaggtgat ttaggtggtg cgaggcgatg ttttgttatg gtattttgtt ttttgtaggg 720 atattattga gggttatatg aaatgatttt tagtagtttt gtaaaagtaa aggggtggag 780 gagggtttat gtattttgtt ttgtgtttta gtttttttta ttttgttttt cgtaatcgag 840 gagattttgg tatttgggag cgggttgggt cgagaaggta agattaataa agtttagtaa 900 gtagatagtt gggagttggg tgttattgag ttttagaaag ggggagtaga gacggaaata 960 ttcgaatcgg tgaaatgtaa atcgtgttta ttgtataagg gaatcgtgta gggagagtcg 1020 ttttttataa ggagttaatt agcgtttgtt tcggatattt tcgcggggtt tttagcgggg 1080 tttaaattgg cggcggttta gtagggggcg aggggtgttg ggaaacgtcg gggttgcgaa 1140 tttacggaag aaaatgtatt cggtgtagtt gttttagatt ttgtcgtcgc ggtattggtt 1200 gacgaaggcg gcggtgttcg aggagttata cgttattatg tggaagtcgg tttcggatag 1260 gcgattaaag gtttgtttta agtaggtgaa tttgaggtag aagcgggacg tgtatttttt 1320 cggttgtcgg tcggggtcgc ggttttcgtt gagcgtgttt tcgaagattt ttttggttag 1380 cgcgatgcgt tcgtatatta tgatgcgcgt tatacgtcgg aatttggcgt cggtttggtt 1440 gtcgcgtacg gtggtgtagg agtttcggta gtttagcgtg aggaagttcg agcgtttgtt 1500 ttgcgcgtcg tcgtcgtcgt tattatcgtg cgttttcggg ttcgagggta cggcggtcgt 1560 cgtttcgcgt agtagtagcg cgtcgttgtt attttgcgag acgttgtttt ttaggtcgtt 1620 ttggtagttt tcgtcgttga gagagttttg tttggtgatt ttgggcgata gtagtttgat 1680 taagtcggtg agttggaaat attcggtttc gcgtagtagt cgtttttttt cggggaagtg 1740 tttcggtagc gcgagttgtt tgtttcgtag ataatttagt acgtatttga aaaggaagtc 1800 gtttcggtcg atgaagaagc gcgttcggtt gtttttgggt agttcgtttc ggcgtcgggc 1860 gtcgttacgg ggattagagg gcgagaatat gttggttaaa gtattgttcg ggacgttgag 1920 tagcgtcgag tgtttggtta tataaatttg gtcgtttacg tttagtttta ttattttagg 1980 gaagggcgag ggtgcgtagg gtttcggggc ggcggcggtc gacgcgtcgg gcgagttgga 2040 cgaggaaatt atttcgttaa tgggtaggat ggtgttgtcg tcgttgttcg tgttttttag 2100 agttatagtt ttttcgtcgt cggtttagtg attcgagaga gttgtatttt ttcgttttcg 2160 gagttcgcgt tttagttttt cgcgtgtttt tggcgttttg cgttttcgga ttgggcggcg 2220 cgttttttcg atcggggcgg tttcgtttag ggttcggggt agcggcggcg tcggcggcgt 2280 tcgagtttta tcggaggaga gacgcgcgag agaggagttt cgtcggtgcg gcggcggtaa 2340 tggagaggta agaaggagtt gttgtttttt tggggcgagg gcggggaagt gtgagagaga 2400 tttgcgagag gttttagggt tgttgttcgg tttttcgtgg ggagggcggg aggaggggtc 2460 gaagtaaaga aaattcgtcg tttcggtagt ttgtaagcgt gtcgcgaggt cggagcgtcg 2520 acggtggcgt taattatttt tggtagtacg ggaggaggta ttgacgttaa gtttcggatt 2580 gggattcgag ttttagttgt tatttaaaga gataggttgt agtcgcggtt ttcgggtttc 2640 gacgttaggg ggcggggtcg agagtcgagt ttgtaagagg tgtagttttt cgattcgcgg 2700 ggataggtag gtagggagtt tttaaagtaa aagcgagaaa aagggatagc gtttttattt 2760 ttttatttta tttttttttt gggtttgtgt tatttttttt tttttttttt tttttttttt 2820 tttttttttt ttttttg 2837 <210> 130 <211> 7618 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 130 agaggtttag aaggtttttt tatttggtat ttagtaaggt taaggattta ttttttagga 60 tattttgtag tttagggatg tggttaggat ttttggagat ttttagtttg tgtttgggtg 120 tgaatcggga gtgaaatgtg atttagaagt cgtagagaaa gttttaagta gttgaggagg 180 tgtacgtgag ggtaggaagg gtttggggag tgtgggaggt tgggagtgag agttaatttg 240 tttgttgatt tgtagaagtt tttggatttg ttttttgaaa gtaggattta gcgggagttg 300 gaaagaggag gtttttgtac ggggttagtt tgtttttttt ttttttattt aatgtggtgg 360 ggtttttggg gatttacgtt ttttagcgga tagtagtatg ttggaaggga gtttggggat 420 agatgaataa taggattata gaaaattaag ggggaaaagg ttattagtat agaataaacg 480 tgtgtttata gtgtacgttt agttgtgtag gttgtttatg ggaagtcgtt gtgagcgttg 540 gatcgtttta gtttagttta atggagagag ggagggaagg gttttgagtg tttttgagtg 600 gtatgtgagt aagtgaattt tttatttttt agataagata tagatagttg atagattttt 660 tttaaaaaag aaagaatcga aaaaatgaat ttaagtaatc gtggtagaag cgttttattt 720 agaaatatag aggtaggtag aagtagaaag agttggcggg gttgatagtt gtgtttttcg 780 gtgggggtgg gatgaggaat tttttttggt agtggtttat gttttttgta gaagtggagg 840 atattttaag ttgtgtgttg agtagttttg gtataaatga agattaggag gaggagaaga 900 ggtcgggtag gggaagggga ggaagaaggg ggtattaggt ttttttgaat ttaaatcgtt 960 taggcgttta tgtagatatt tttttttttt aaaaaaatgg ggatgcgggt ggtggttata 1020 cgggtgtgta tatttattaa aatttttttg attgtatttt taaatttgtg tttttttttt 1080 taagtatatt tattttttat tttgaagaag gaggggaggg aggtttttta ttttttattt 1140 ggttatacgt tcgaatttcg tgttttggcg atgtattgtt tgtttaaaaa ttatatatat 1200 tatgagggaa aatttttatt aaaaattttg gtcgggcgta gtggtttaag tttgtaattt 1260 taatatttgg ggaggtcgag gtagacggat tatttgagtt taggagttta cgacgagttt 1320 gggtaatata tagtattttt tttttataaa aaataaaaat tagtcgggcg tggtggtcgc 1380 gtttgaagtt ttagttattc ggagattgag atgggaggat tattcgagtt taggaaatgg 1440 aggttgtagt gagttttgat cgcgatattg tattttagtt tgggcgatat agcggattat 1500 tttaataata aatcgaaatt ttggttattt ttaggtagtc gaatttggga tgttttttgt 1560 ttttagtgtt tgtaattttt tgaattttta aaataacgaa tagagttttt ttgcgatatt 1620 aaatgtaatg tagtcgtcga ggaagcgtcg gggatagatg gggttggacg tcgtttttat 1680 tttttttttt gtagtcgttt ttaggtcgtt aatttcgttt agtcggagtt ttagttttgg 1740 agggtcgggc ggcggcggtt tttttttgga gtggtatttt tgttgttcgt ggggtttttt 1800 ttttaggtag gaggtaggag gcggggtttg gggtagtttt cgtttttttt tttttttttt 1860 tttcgcggtt tttttgttgc gtcgggtttt ttaggtttta tttcgagttt tcgtattcgg 1920 tggggcgcgg gtttcggttt agtttttttc ggaagtgacg gttgatttag agtttatttt 1980 tggtttcggt tttcgtattt tttcgttttt ttgtttgtgg aattcgtagt ttagaagttt 2040 ggagtttttt tgcgagtacg taggggtttt ttagttttcg gatcgtttcg tcgttcgttt 2100 tgggtttgag tttgggggtt cgggaaataa ttttggacgt ttttggttgg attgtgttta 2160 aatcgtgtat tttacgcgat aggggattcg aggtttttga ggattttaaa ttgtcgtagt 2220 tttttttttt tttttttttt gtttttgttt ttgtttagag aagtgcgttt ttttagggtt 2280 atttatacgc gtcgtgtcga gtttcgggtt ttagttttag gagtcgcgtt tttacgggtt 2340 agtgggtttt gagagagtag ggtttcgggc gttcggggag aggaggcgga ggaggggtga 2400 agtcgagggg tggtttttaa cgaaaaagaa gttgaagtat tagttaagtt attagggtta 2460 atgcgatgta ttgtaagacg gggattaatg tcgggtttcg gggatcggcg tgggggaggg 2520 ggtagtaggt cgatcgtttt taagtcggtc gaggttttcg tttatttggg ggaaatggat 2580 tttcgcgatt taagaaataa atttaaatta aatgagcgag gttcggatgt gttgacgttg 2640 cggttacgcg cgcggagttg gagtttcgag agcgttttag gaaaggcgta gcggcgatcg 2700 cgggaggggg tgagaagtcg aggtagagag gttcggagaa gtagaaagag atgtcgatcg 2760 gtagagaaag agcgagatag atatatcgag gggtgagggg gtaaaaggga gtagtttcgt 2820 aattttcgta gaagaaaata ggtcggcgcg gttggggatg cgtttttggg ttaggcgcgg 2880 taagatttta ggaattagtt agagttttaa gatttaggcg tttatttgag tttttttgag 2940 ttcggtagga ggtttaggtt tattcgggag agagaggtgt tagtttttat tttgtgtagt 3000 tttttcgttc ggacgttatg gggggagtgt tttttgagcg taggttttcg ggcggtcggg 3060 gtttcgtttt tggcggtcgg gagaggtcgg tatcgtgata tttaggtata tatatattaa 3120 tgtttcgggt tcgttaggga cgttgagttt taggtaacga aaaacgaagg ttttggagtc 3180 ggttttgagt gtattttttt attgggtttc gtcgagaatg aaattttcgg agtatcgtta 3240 ttgggaggtt ttggggggat attggggtgg gcgagttttt ttaaagattc ggtttttatt 3300 gggttttttt attttttttt tttttcgtta cgcggtggtg gtggtggtgg ggggtgtaat 3360 agtttttttg gtttttgggg tattttttgt ggtggggtgt gtttttttgg ttggatttat 3420 tttttgttgg gtgtaggagt agagtgggga ggaaggaggt cggtggattt ggtttttggg 3480 tagtttattt ttgttttttt tggggttata ttgggtttat ttgtaaaatg ggtataggtg 3540 agatagagtt ggttaaggtt ttttttagta ggttaagggt ttgttgggga ggcgggttcg 3600 ttttaaggtt ggtttttttt tacgtttttt gatagtgtta tttttaggat atgaggaatt 3660 ttaggtaaat atgggggatt tttgtttata taaatagttt tagttatcgt aaatttataa 3720 tgttagtatt atttcgttag tacgattttt ttagtttcga ttgatagttt ttttagaatt 3780 tgggttttat aggtttgagt tggtttagag tttttatttt aattttagaa aaggttcgcg 3840 ggatttagaa aattttaaaa ataaaaggta ttttatagta tggggttttt tgaggtgtag 3900 tttgggggta taagggtatt gttttttaga tttttatgtg gagagttcgt tggaagaggg 3960 agaggaggat tgaggaagtg gggagggtgc gagattttcg gagttgatat ttttttttat 4020 ttatttagat taggggtgag ttgggtttag tatttttatt ttttcgtttt gttattgtcg 4080 ttattagaga aatggggata gagtttttgt tttttttata tacgtgcgtg gtttatgtga 4140 cgtggagtcg tattgggatt cgaatgagga tattttttcg ttttttcgtt atcgtgggaa 4200 tatcgtggaa taaggcgggt aaagggttga ttagttttcg tttcggttcg aagaaagttt 4260 ttaggggagg cggaagggtt attcgttatt ttagagtagg cgcgggtagt ggtttacggt 4320 tttgggttcg gatttgtgtt tatttttgga tatttaattt tcgttattat gttgttggga 4380 gtaaggaggt ataattgttc gtggtgggag tggagggttt aggtttttat tagaatcggt 4440 agagtttcga cggggttaac ggcggtgttg atagcgcgaa ttgcgttagg ggcgaagtcg 4500 agttcgtgga gcgtcgttgc gtataagtgc gcgggttagt agggttttgg tgtttggata 4560 ttttcgggtg cgcgcggcgt ggttgttttg gtgttttagt gagagtatga ttgcgcgtta 4620 aatggaagtg ggggcgtttt ttggtttttt ttatattcgg ggttaaaatc gttgggatcg 4680 atatattgta ggagttcggg tataggttga ggggatcggt tcgtgcgttg agcgtttcgg 4740 aggtgtttcg ggttatggtg ggtgttgagc gggaatacgg aaggttgtgt atatagtagt 4800 aagtaatgta ttcgcgtttt cgttattata tcgcgtcgtt tttattttcg ttacgatgat 4860 tatttcgtag atgggtaaga cgggtttaga gagatgaagt gattttttta aagttatata 4920 gcgggttagt gaaggtatcg cgtacggttt aggaatttaa ttttttttgg ggagtgggga 4980 gggaagggtt cgattcgaag gggttaggcg gtagagagtt tcgcgttttt cgttacgggt 5040 taagacgtaa ggcggttcgt cgtgttttta tttgcgcgtt tcgagtttcg tttcgtttta 5100 gttttcgggt taatatcgtt tttttttaga agtttaagga ggttcgggcg gattagacgt 5160 tttttttttt cgtagtttta tgttttgttc gtagtttgag tttatcgttt ttttcggggt 5220 ggcggtgcgg agatcggacg gttttattgt gtagatttcg aggggtaagg ggtcgggtag 5280 gggaggggag cgagaagtgg cgaggtgaga attgaggggc gaggttgaag gttgagttag 5340 atttttagac gttagagaga cgttaggtga gtcgggcggg ggcgggggcg agggcggggg 5400 agggggcggg gtcggaatcg cggggagggg gcggggcgtt cgggagggtc gcgagttggg 5460 aaggtttcgg gcggtcggag acggtgaaga ggcggggtcg agtcgcgttc gcggggtttc 5520 ggatatagcg gagttggcgt tattgtcggg gtttcgtttt atttaggtcg ggtagtttcg 5580 cgggttcggg cgtcgttgtt tttttttatt tgttgggaag cgtaggtcga gtagggatga 5640 atttggtttt agggttttag cggggtaggt agggttcgga ttagaagttg cggtatcgat 5700 tttttattgt tcgatcgggc gacgcggggt ttgggagggg cgggtcggga ttagagcgtc 5760 gttgcgtttc ggaggtcgcg tttttcgcgg tttgtgtcga ggagtttttt cgtaaagaaa 5820 taaatacgtt ttgttttttc gatttcgatt cgggtcggtt agaagtaggg agaattacgt 5880 tcgggaaagg ggggtaggga acgacggggg agtttcggtg attagggtag atgtacgcgc 5940 gcgcgggatt ttcgtgcgtc gcgaagaggg acgagtagag gagtatcgga agaagatagg 6000 cgaaggggat cgcggagtag cgtaggcgga gtttcggggg tacggtcgag gttgcgtttt 6060 aggagtgttc gttaggcgtt ttttcgggcg gttggcgaaa ttcgaggagg tttatagttt 6120 tggtttgggg cgtcgtcgtt ttaggggttt ttgcgttttt ttttggcgtt tgtttggatt 6180 tttagagttt cgggattaag gcgtttattt ttttgatggc ggggcgtatt tttcgcgtgg 6240 gtcgggcgtt gtagattaag tacgtcgagt gcgttaagga agtgttcgga aattaaagat 6300 aacgtattcg ggattaagag gaggtcgttg cgcgtaattt tttaaatatt gtagcgaagt 6360 cggaattacg ttcgcgtggg tgattcgggt tggggagtcg ggaggcggcg ttaaggattt 6420 tttagttttt gttcgttttt tttgatatgt tttcgacgcg gtttgaggtt tttttagcgg 6480 aggcgacgtt tcggcgttag gtgttttggg tgggggaatt cggagggggt attacgatta 6540 gtggagaagg ggcggaggtc gggaaagttg cgtggaaaag aggaagggtt aagattgaaa 6600 ttattttata gagattacgt taatgggttt aaatgcgaat attttagtta agtagaaaaa 6660 aatttaaaag tagagtgtaa gttggattaa agtgagattt cgattgggcg tagataaatt 6720 tgtaattaaa atagttttag gtagagattt agtcgttggg gagtataaat ttttaatgtt 6780 ttttggtagt tattttttga aatattttat tatggaagtt tttaaatata aaataaaatc 6840 gagggaggtt ttaagtgaat tttcgtgtat ttatttttat tttatagttt ttaaatcgtg 6900 attaatttag ttttttttat tggttttttt ttatttgtat taatttattt ttgttgtttt 6960 attataaagt aaatatagat atatttttat tgaatatata aatgtatttt tattgataat 7020 aatttttttt aaaataataa tacggtttaa gttataattt ttagtaaatt tatatttaaa 7080 ggtagttggt ttttgatgtt ggaagtgtag acgtattttt atttgaattt tattgtaatg 7140 tttagataat aaaaagtatt attatttttg taataaaaaa taaataaaaa tttagtttta 7200 tagttttaga acgtggcgag ggtcgtttgt tttttaggcg gtgaggttgg tttttcgatt 7260 atttagttgt tttcggcgtt cgattttgtg tgttttttcg tgtatgatac gtagagttta 7320 gttttgtgag gatagggttg tttttttttc ggtttattta tgaaggggtg tttatttttt 7380 cgtttttttt tagggtagtt atttattggg tgattcgttt tggggatttg gggatcggcg 7440 agtttaggag gtttagcgaa cgaattttcg gtggttggga tttatttttt agcgggattt 7500 tggataggta tgtttatttt ggttattaga agggtagggt ggtcgaaggg tatgaagtat 7560 atgagtgtat aggcggggag gaatagtagt agtattagcg taggagtagt tcgttggt 7618 <210> 131 <211> 2194 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 131 ttaaatttag tatttattat tgggatattt ttatttgttt ttataggaag ggaaagggga 60 aggtatattg gagttagcgt ttatagggta gaattagacg agttttattg gaggtaaatt 120 gggaggtagg cgtgcgttgt tcgtggtgtt gaaagtttga tcggcgcgag ttggagtcgt 180 tatcggttgt ttcggggttt cgtcgggttt tatttgtttc gcgttttgga agtagatttt 240 gtagatgggt tggtggtgtt ggtgttggtg tttagcgcgt tggtcgtcgt cgttattgtt 300 gttgttgcgg ttgttgtata tcgagcgcgt ttcgggttgg ttttcggcgt ttcgtcgttc 360 gcgttcgtcg ttcgcgtcgg ttttagattt ttcggggtcg tttttcgttg ttgtcgtttt 420 cgggaggcgt ttcggatttt tttcggagtc gtcggtcgtc gttatttttt ggtcggcggg 480 ttgtaggggt aggggcggag gcggtagttc gttcgttttt ttgtatcgcg gggttatttt 540 ttttagcggt tcgtttggtt tcgcggcgcg ttcgggggtt tcgggggacg cgggtagcgg 600 cggtaggtag cgcggggtcg cggggatcgg ggtcggtttt ttcggcggcg gcgtcggcgg 660 cggcggcggg ggaggttgcg ggggaggttc ggcgttttcg tttttcgttt cgcgatatcg 720 attgtcgtcg tggtcgtttt taaagtttat ggttgtgtcg tcgtcgtttt tttgtcggtt 780 cggttggcgg gtcgggtttt ggttgtaggg aaagagagcg cggagggggc gggagggaga 840 ggggaaaagg agggaggggg ttcggacgtt tggggttagg gggcgggacg gggaggggat 900 gcggaaggtt ttgtagttgc ggcggcggta ggcgcggtcg ttcggtggag tcgtcggttc 960 ggttttgatg gaggcggcgt cgaattcggt tgcgcgtgag agtcgcgtcg cggaaggggg 1020 ggtcggagaa gcgagggggc gggagggagg agcggcgcgg cgggggtgac ggggcgcggg 1080 cgcggggtgg gttgggggcg cggattagtg ggacggagtt cggggttcgg tttcgagcgg 1140 gcgggttgga agtgggggat tttttagtcg tttttacggg tcggtttcgc gtttacgtcg 1200 gtttcggggc ggatgatttt tttttaaacg gcgtagcgtt gcggttttcg tgagttggga 1260 agtagggggt aggggagagg tcgcgggttt agaaatcgtt attggatggg tcggtgggat 1320 gtggcgcggg tcgggtgggg cgcgatagtt tgagtcgaga ttcgcgtggg tttaagggtg 1380 cgcgaggcgg gtgttttggg cgcgttcgaa ttggttgagt agtggagcgg gaaagggcgc 1440 gggattcggg attgtaatcg ttatttttag gttttcgttt ttcgcgtttg gagtttttaa 1500 gggtattttt agggattttc gagagtttta aaatagaagt ttttggaatt tgtgtttttt 1560 ttttgtttgt ttcgttttcg aatttttgtg ttttttttat tcgttttttt ttgtagtgag 1620 tatttcgggt tgttggtaaa gattttggtg tttgggaggt cggagtttcg ttttttgaaa 1680 tggtttatat tagtgaattt tggcgttacg ttttgtggtt tataattatt ttcgtcgttg 1740 tcgtatgagg aagtaaatga tatcgttttt tattttggaa aagtggttgt agtttttttc 1800 ggattttagt tttatttatt tcgaagttaa tttttcggta attttatttt gtaaaatttt 1860 tgtgggattt atttttaggg tagagttaat agtttttttt ttggaaaaaa aaaaaaattt 1920 tttatttgta gggaattagg ttgagaatcg tgtatatgta gtagttttta aattcgtgta 1980 gtgtgagatt ataaagtatc ggatttatat gcggtagtgt gtttattcga atttttattg 2040 atgtgacgtt tttagttttt gatataaaga tatagagtag ttatttttgg tagcgtttta 2100 tagtcgaaga tttaggatta gaaaggtaaa ataatttgtt taaggttata gaattattaa 2160 taaagaattt ttgtgttttt tgattagatt tttt 2194 <210> 132 <211> 1958 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 132 atgttgggtt acgttgaaaa tttgtggttg agagttggat tttcgttatc gttacgtatt 60 ttgttaatga gatagggtaa tttatggtta ttgagtttcg attagttaag gggtagagag 120 ttttcgtttt ttattgtttt ataaaagaga tttagtaaag ggattttatt agtttttagt 180 ttttagtttg cgcgagggtg taggaaggaa agtttaggat tttcggagta gagtatagta 240 gttgtagagg taaggttagt atgtcgttta attttaaatt ttagtgttat tttattttta 300 tttttttgac ggttttaaga ggggaaagtc ggtatttaga ggtgagttat ttttggattg 360 atttatttta ttttttttgc gtgttagttt taggcggtag gtaggttgtt tttgttcgta 420 gttttttggg gttcgttgtt tttttttttt ttgttggatg ttgttttgtt tttggttttt 480 tttattttgt tttttttttt tgtttttgag tattttagat tgtttgtttg tttttttttg 540 gtcgttgggg atattttggt ttgatggaga gggtttaaga ttttttcgtt tttttcggat 600 acgggaaaat attatttttt tttttttatt cgttatgttg agtggtaggg agggtgtttc 660 gtttttggtt ttttttttta tttttagttt ttgaattttt tcggattgat ttatgttttt 720 tgttagttga gggaagcggc ggattacgat ttttttttgt tttttagcgt taatttgaag 780 cgggagttgg ttggggagta gtcgtatcgt cgcgttttgc gtgagtcgag gttgttcggt 840 tcgcgggcgt tcgggacgcg gggaaggtgg gattttgtgc ggggggtaga gggttcgcgg 900 atatttcggg gaaggggttg gtcggaatcg ttaggggcgc ggttttttta gttaaggatc 960 ggttcgcgga ggcgcgttag gagcgggaga gggtggcgcg ttcggggcgt aggaatttag 1020 cgtagtttag gttggaagtc ggggcgttgg gtattataga gttcgggaat ggggcgcgcg 1080 gagagcggtc gttcgaggac ggcgttgcgg cggttgtagt tcgggattta ttgttttatg 1140 tttttttttt ttagggtgtt tggatatgtt gagtttttag ggttagttta tttttatcgt 1200 cgatcggtcg tagttgtatt gcgtagtttt ttttattagc gagttcgagg agtttattat 1260 tatttattac gattaggttt ttatcgattg ttagggcggc gattttttga aggtgaggcg 1320 tttacggtta gttaatttag tcggagggcg gtacgggagg gttggaaagg gttggggcgt 1380 tgtatttagc gtggggttgt tgagcgtagg tagttagtgg tattttttag atatttcgtt 1440 ggtgttcgag tcggagaggc gcgttcgagg atttttatac ggcgagaatt tcgtttttat 1500 tcgaagattt cgatttatat atatttagtg gggttggggt cggtgttttt ggacgttgtt 1560 atggtttaaa tttttttttg ggcgttttcg aggttttagg aatttttaaa gatttgaatt 1620 cgtagcgcgg aattttgacg taatttaggg tcgaggaaaa atgattaaaa tttaataagt 1680 tcgagtgttg gggtttatta agcgggtcgt tttggttaga aggttcgttt tatacgtttt 1740 atatttgagt tcgtttcgtt tttgttggtt tacgttcggt agagtcgttt cgagagtata 1800 gaggttgttt ttagtgcgcg ggtgattcga ttttggagta gtaggggatt ggttgtcgag 1860 ggggtattta gattgagata ggtgggaggg taggataaga tttttaagtt tattgttttt 1920 tcgattttag tcgttagatt ttataagtat aatagggt 1958 <210> 133 <211> 9660 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 133 gattttgttt ttttagtatt tttgggtttt atttttattt taattcgaaa ttgttttaag 60 gtaatggtga atatatgttt taatggttta tatatacgta attatatgta tatttattta 120 gtatatttat tggaggtgtt gtgttgtata aagagataaa atgtataata gtgaaaggga 180 ttagaatgta gagtttattt ttaggagagt agtcgtggtt agaaaagagt gtttttttgg 240 attaacggag ttttttgggg cgcggtttta tggggatgtt taagttttaa aggaagaggt 300 ttaaagtagg ttatttttcg tgaatttttc ggatttttaa gtttttagtt ttttagtttt 360 tttttcgttt tttcgttttt tttttttttt tttttaatag ttgttattaa ttggaggatg 420 gtaggttcgt tagattatta tttttattta tcgtcgatgt ttcggggttg ttgcgtatag 480 atgtaagagt ttttcgggtt tttggggttg aagttttaaa agttacgcgt tttagtattg 540 tttttatatt ttaaattgtt agttagtttt ggtgtttttt agtttttgtg ttgtttggtg 600 ggtgatcggt ggaggggttt ttttttgggg gaagaacgtt ttaggcgggg tttttaattg 660 ggtgattgtg gtgtagatcg tagttttaga gattttttcg gaaagaagcg tcgttgggta 720 gtagtttttt tttagcgtcg cgtttttttt ttgttacgat ttgcgggcgg aggggaaggg 780 aacgagtatt tggttttggt tggtagagtt aagtcgagga gttttattag gttttgatat 840 tttgtagcgt ggttgttaga tggttttgcg gggtggtatt ttggttatcg tgttcgaagt 900 tcgcgttggt tagtggtgtg tgtggcgtag gattcgaggg cgcgttcgcg tagtaggtgt 960 cgtagtttgc gtcgtagggt gtttcgttgt agttttcgta gtaagagtag ggcgatattg 1020 ttgtattgta ggggttgggg aaggtaggtg cgtcgggttc ggggtttagg tagggtttgt 1080 tatcgcgtat taggacgggt atagttattc ggcgcggcgt tagagggtgg ttagttagtt 1140 ttagcgattt gttttggcgt tgttttttgt atttgtagcg tcggttttgg aattagattt 1200 tgatttgcgt ggacgtgagt tgtagcgcgt tggttaggtg ttcgcgttcg ggcgttgata 1260 ggtatcgttg ttgtttgaag cgtcgtttta gggttagtat ttgcgtttgc gaaaagagta 1320 cgcgcggttt tcgtcgttgt cgcgttttgg gttgtttcga gcggttattt cgtacgttgt 1380 cgtcgttgtt gttaacgtcg cgttttggta ttttggtttc gtcgtcgagg ggcgaggtcg 1440 cgtttaggtc gggttttaaa agtataggaa gggatatatt agcgtttagt ttaaggttta 1500 tttgagcggt ttttatttag tttttaagat tttttttttt ttggtagttt ttattttgcg 1560 taggtttttt ttttttttta ttgttttcga attttgtttt aggacgaatt ttgttttagg 1620 attgttttta tgtttttttt ttttaagttt tgttattttt atatgttatt gttggaatat 1680 aaattgtgat aatttatggt ttttcgtgtg tgcgtttttt ttttaaaggt agattttaga 1740 taaagagtta aggtagtttt atttgttttt tagaatgtgt gtgtatgggt cgggcgtagt 1800 ggtttatgtt tgtaatttta gtattttggg aggtcgagac gggcggatta cgaggttagg 1860 agatcgagat tattttggtt aatacgatga aatttcgttt ttattaaaaa tataaaaaat 1920 tagtcgggcg aggtggtatg tgtttgtagt tttagttatt cgggaggttg aggtaggaga 1980 atggcgtgaa ttcgggaggc ggagtttgta gtgagtcgag atcgtgttat tgtattttag 2040 tttgggtgat agagcgagat ttcgttttaa aaaataaata aataaaaaat aaataaataa 2100 aaaaaaaatt gtgtgtgtat ggtaaatttt cgttgtgagg aataagtgtg agtggaggtg 2160 tttattagat tgaggagatt ttggattttt tttggaagta gagaaagaag gagaagaaag 2220 aggaagagga agaggaggag gaagaggagg aggagaagaa gaagaaggaa aggaaggaaa 2280 aatagagaga agttcgggtg ttaagaaggc gtaaattcgg tgataggttt ttaggaggtt 2340 tttgtttgtt ttattttttt tcgtagtttt aagcgtattg tagggaattt ggttgtaagt 2400 ttaggagcgg gagttttgag tgttttttat ttttatttaa tttttgtgta tatttttgtt 2460 tttttgacgt agcgttttat taatattagg gatgtatttt agtttttttg gatgtgatgt 2520 tttgtaattt aaattaataa tatatgatga aaataaaata tttattggtt tttgattttt 2580 ggtttagaaa ttgaggtttt ttttgagaga tatataaagt tgaggtttat atttggtttt 2640 ttaaaaagta gttttttttt tttttggggt ttttttggta agtaggtggt gtgggtttta 2700 ttttgaagtt ttttttttat ttagggcgat ttttatagtt gagattgtgt ttattaagat 2760 gtagcgtttt tttttttttt tatttttttt ttgtttgggt ttaaatttcg ttttatttta 2820 agggtggata gaagggaaat gttgagtttt tatgggattt tacgttagga gaaaattagg 2880 agtatggaag gggtgtaagt ttatggtaag acgggatagg attttaaatg agttagtgcg 2940 attggaatta gatttttaat atttaaggta ttggtataat tttttggagg gggatggagt 3000 tgtttggtat gtaaagtttg aggatagaat aatttttttt agagacgttt gtgtttagat 3060 aaattgaggt tatttttatt tgtaaagagg aaaaattttg aggagggttt gtttttttag 3120 cgtatcgaaa ggtaataatt gatttttagt taggttgtag agtaaggagg attttatttt 3180 aaagttatag attatgtagg ttttggggtt gtatagtatc gtagggtggg ttagtatttt 3240 gcgttttttt gtttataatt ttggagtttt tgagggtaag gtggttagtt gcgatggagg 3300 aaggtatgaa gtttatcgaa ggtgtttttt ttgttcggat cgttatcgcg gttttgggtt 3360 tagtttttgg agtcggtttc gggttcggtt tcgggttttt tttcggcggc gtttattgtt 3420 gtcgtagaag agacgttttt aggatttggt ttttagtggg agaaggaagg cgtcgtaaat 3480 attatcggtt gcgaggcgat tgtggtggtc gaaggaacgt gattttttgt tagtttagcg 3540 gagtcgaagt gatcgtcgag ttggttgagt agcgtcgagg gagtttagaa ttcgttgtag 3600 aaaatttatt agttttttcg cggatatagt aggtaatgtt tttaggtttt tggagttagt 3660 gagtagtcgg tttgtaggtc ggtaaataat ttcgatttag ttttttggtt tatttttttc 3720 gttcgcgttt tgaatggagg cgttatggta tagtttggta gaggaggttt gttttggcgg 3780 gcgttattta gggtttttgc gttgagaatg tcgagtgagg tgttgaggtt tggagagaaa 3840 aaggtggcgt ttttattttt tggaatatcg ggttttttta gttgaagttt tcggatcgat 3900 ataatataat tttcggatcg acgtaatata atttttcgtt agtttttttt tttttagcgg 3960 gttggatata ggtgcgtggg tttcgtagtt cggcgcgtac ggttgcgttt ttggatattt 4020 gcgataggat tcggttagaa tcgtgtttta gggtagagaa aattttggta atttttaacg 4080 ttttttttga cgcggagaat tttgcgttaa cggggttttt tatttcggga gatttaatcg 4140 ttattcggtt tttaattttc gttttttaga agaaaaattt atgaggagga atgggggggt 4200 ttttcgatta gattagtaag aaagggttta gttaggagtg attttagcgt tacgagggtt 4260 ttattgtttt gatggttata cgtttttgta aacggtttgg gggtggagag atattaggtg 4320 atggtaggga agggcggtgg tgattggtac ggttaagata ttgcggaggg tttcgttgtg 4380 gagatgagaa ggtggaggtt ttgggtattg tggttgcgag tgtgagcgat gcgtttgtgg 4440 gaattagagg agcggatttg ggaaaagtga atttttgaga tttagggttt tattttcgtt 4500 aggggtgtgt gaagtatatt gggtgttagg agaggatggg aatgggattc gagaggtttt 4560 tttttggatt tttcgagaga aaatggagag agtttcgaat ttaggagata ggaggcgtat 4620 tttttttatg tatttatgga ttacgttttc gtttttatat ttttttcgta ggaggtaaga 4680 tttgagcgtt tatttacgtg gtttttttat tcgtttcgcg tttattttta agattgtttt 4740 atagggattt ttaggaggtt tcgaattatt tagttttttg ttatcgtcgt cgttattagc 4800 gttgtgaatt tttgattttc gcggttttgc gtttattttt aggtattgaa agtttttcgg 4860 gttttttcgt attcgcggat gtggcgaagt cgcggggtag tttcgttcgc gttttagtcg 4920 taggatgttt ttgatcgaga agggggtgga ggtgacgggg tttagtagta tttcgaaggc 4980 ggatggggcg gggtcgagga ggttcgggtg aggagcggta ttttgaattt ttcgttttgt 5040 cgttgtaggt ttcgtagata gatttaagtt ttgggataga cgtttagcgt tttagatagc 5100 gttttttttt gggttatgtt ggtaggttcg ggtttagggt cgggtgacga gatcgtagtt 5160 ttttattggt tttcgtagaa attacgtgtt agttttgtat tttttttttt tagcgttttt 5220 ttttcgcgtt cgtcgaattt tttttagttt ttagtcgttt ttttgggagg tttggttcgt 5280 attgacggtt tttaaagtaa agaaaacgtg gagagatagt gttgcgcgcg gtttggattt 5340 tcgttaatac ggtattagcg ggagttttcg aggttaattt agggtttacg gggatttttt 5400 tagtggatat gcggggattg gaggtggagt ttttgttgtg taattcgatt cggtttattt 5460 agtttggttt tagtttaatt ttgtattttt atggcggagg aaagttaaga tagagatagt 5520 tgggattcgc ggaatttgag gcgcgcgttg ggattttacg tgcgtagagg tcggatcgta 5580 gagtagaagt gagttttgat ttattagggt ttatattgag atggaaattt ttttttttga 5640 atagaattta ggtttgcgga gtttcgattc gttatttttt aggagtagtt ttttagtttt 5700 aggatcgagg aatgggtgtg ggggttatat gtggggagtt ttcgattttt taaagggttt 5760 cgcgaatggt gggggagatt ggaaggtaat ttttgcggtt cgcgtaaagt ggttagaggc 5820 gggagtgggg gtgggggggg gtgggttttc gtcgtttttg gcgtttttac gttttttttt 5880 tttttttttt ttattttttt taaagcggat tgtttggagc gtgttagttt gtgtgcgcgt 5940 ataaatgcgg cgttcgtcga agggttggga agatttgatt cgtattagat ttttagaaaa 6000 ggtttttggt tacggcgggt atcgagtaaa tggcgtagtg tggtataaag gttattaata 6060 cggagatagc gttaatagat ttagtttttg ttgttattat ttttggatta gggaaacgtg 6120 atttggtgtt agttgtttta gtattgaatc gaagagggtt taaaaattgt gttttaatta 6180 taatgggatt ttattagagt ttttttgggg attttagatt aaatgttttt ttttgttttt 6240 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 6300 tttttttttt tttttttttt tttttggtta tagggttttt ttttgttttt taggttggaa 6360 tgtagtggtc ggattatggt tcgttgtagt ttcgattcgg atttagtgat ttttttattt 6420 tagttttttg agtagttggg attatagatg tagttattaa gtttggttat ttatttattt 6480 atttattgtt tgtagagtcg gggtttcgtt atgttgttta ggttggtttt gaatttttgg 6540 gtttaagtaa tgtgtttatt tcggtttttt aaagtgttgg gattataggt gtgagttatc 6600 gcgtaggttt taaatgtttt ttaaatttat ttacgtgaat ttaatgttat aatagttgtt 6660 tgaatatgat tattttttga aatttagata aatttaattt atttttttag gttaatgggt 6720 gtaaaattgt atataaatat ttatgtaaaa ttttagtata tttgattatt tagttataaa 6780 gtaatgattt tttatatatg gtaatattta atttttatat taaagttata tttaaatatt 6840 tttagttgtt gttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 6900 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 6960 tttttttttt tttttttttt tttttttttt ttttgtttag cgaggagttt agattagaga 7020 ggtggtttag atagtttatt aaatggtaag attagattag tttttaaatt aagataattt 7080 attttgtttt tttttttttt tgaaatatat attttttgtt tttagagatt ttaaaatttt 7140 ttgatgattt atatatttat ttgaattttt gttttttgat aaaagttatt atgcgtattt 7200 tggaaaaagt gaagaaaagt taaaagaaaa tatttattta gagataatat tttagtggat 7260 ttttttgttt ttatttttgt atatatgagt ttatagggta tatatgtttg tatatgttta 7320 aatttatatt ataagtatgt ttagtttatt tttagaattt tttaaataaa tataatttaa 7380 aataggaatt taatatttta tgttattgat agatcgtagt agattgtgtt tgtattttta 7440 gataatattt ttttttatta ttgtaaataa gattttattt tgtgttttta atttttattt 7500 ttgttaatat tttttgttat ttttttagga tatatatgta gaagaaatat taattagtta 7560 aatattttaa tgtttataag atatgttatt ttagggtttt ttagaaaaat agtattatcg 7620 tattttgttt tcggaggtgt aggcgagtgt ttggtttacg ggtgtttata attattatcg 7680 ggtatttata agagattttg aatttagaat attttcgcgg taggagtttc gtttcgtttt 7740 tttaggggat attgacgatt cgttgggttt tcgtttttta agtgttggag gggggaagta 7800 gggttattcg gggtagaaat ttaacgttag aaatttttta gcgttttatt agttggtgga 7860 attttcgtgg tagatagtcg cgttttattt aagtcgtaga agaaaagata ttttgtgggg 7920 gatttggcgt cggaagtttt gagtttaaat cgtagtttta ggtttttagt tttgtttttt 7980 ttggtttgtt gcgaggatga aatgagattt ttgtacgtga aaatgttttt taattttttt 8040 cgaggggtgg aaacgttttt attcgattag agttcgggtt tgcggagtaa tttattcgtc 8100 gttttttaag agtaggtttt ttagcgtagc gagtttttgt tatggaaagg gtcgtttcgg 8160 tttaggatgc gcgttttcgg cgtagatttg gggatagggg tttttgtcgc gttcgtttta 8220 tttttgtagg gagtaaggtc gtttttttgt agtatcgcgt tacgcggcgg gaatttgtag 8280 tgttttgttt tttggtttta gttttttcgt tcgtttgggt ttttttcggt tatttttcgg 8340 aggggtttgg agtttttttt tttttttttt attttagcgt tagaagtatt gaaagtcgtt 8400 cgttcgtcga gagtggaatc ggtatttcga atttcgttta tttcgggtta attggaggcg 8460 tattagcggt tgttttgtag tgtaatagag gttcgagtga taggttattt gtttaagcgt 8520 tggcgtttag gaaagtcggg gaggaaatta ggaagggagg cgatagtaga aaagttagag 8580 agtttagaga tttttaggta ggttttcgtg tagttttaat agcgtggtgt cgggaggtgt 8640 gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gttttttatt taggaatgga 8700 gatatcgtga ttatttttgt ttttaggtga gatggagacg gtcgtgttag gggtgtgatt 8760 gattcgtttt gttttattta ggttcgtaga gtgttttaag cgtttatcgt gggttagttt 8820 tgtttaagtt ttgggaatat tgagaaaatg agaggtttta gtttttttat tcgaatttgt 8880 atttttgtat agaagataga tttttaaata atttttatat attgtgttat tttgtataat 8940 tagacggaat ttgtatatta tatttattga tttttttttt ttgagacgga gtttcgtttt 9000 tttgtttagg ttggagtgta gtggtatgat ttcggtttat tgtaattttc gttttttcgg 9060 ttttaagtaa tttttttgtt ttagtttttc gagtagttgg gattataggt gttcgttatt 9120 atattcggtt aatttttgta tttttagtag agatcgggtt ttattatgtt ggttaggtta 9180 gtttcgaatt tttgatttcg tgatttattc gtttcggttt tttaaagtgt tgggattata 9240 ggcgtgaatt atcgcgttcg gttttgaatt tttatttttt cgtggttaat aaaagttatt 9300 attttttgtt ttttttattt ttttgaaacg aagggatttt ttttagtaag tattatattt 9360 aataggtaat ttttggtaat ttcgcggttt agtgggtttt gtgggtcgag gtgaaattag 9420 ttttttttaa tttaagtgta ggattttcgt tagattagat tagatttggg ttttgggttt 9480 gttgttatag ttgtgttttt aaggtacgta gtaggttttt aataaatatt tattgaggat 9540 aggtatttgt tttgtttgat tggggatagt ttttaggata ttttggggat tgttttaaag 9600 ggtgtttggg gattattaat ggtggtaatt tttgttttgt tacggttttt tttgttggga 9660 <210> 134 <211> 1451 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 134 ttttttttta aaaagattat ttttttttat attaacgatt ttattttgga ggtagtcgtt 60 gagataattt taggtgtaaa ataagttaat taaatatacg ttatttaaat attgagatta 120 gttggagttt aggtttttag agtaaagtaa gagtataaat taatttcgtt gagttgttgt 180 tatttttgag ataattcgat tttattacgg agatttttag gtggttgcga acgttaacgt 240 ttagtaggaa cgattaagcg atttatagta tttaggggat tgtgtaaatg ttcggttcgg 300 gcgattagta gggatagatt taatttttcg ggcgtaaagt tatttttagt tcgattttcg 360 ttttttttga aaatttatcg ttcgtttttt cgggagttgt tttcgtagga gaatgttcgt 420 ttttagtcgc gttttaattt tgttttgcgt ggttttaaat tttttttggt ggattaatag 480 gaaaataaat ttaaaggata gacgttttat ttgtgagttt ggagttgggt tgtatttggt 540 gaggcgtttg gttcgtattt ttttgagtcg tttgtaggtg gttggggaat ggaagcgttt 600 ttttgcgcgt ttttttcgac ggtaggtttt gttttacgtt ttttatttta agttaaaagt 660 aagggtagga gaggcggggg ttttaaattt acgtttcgga gtatagagag ttggttaatt 720 tttagcgggg tttggggcgt ttatatttac ggtagagtta tttgtgagtt tgtagagtag 780 taacgggatg cgcgtaatcg ggatgcgggg acgatcgtta tagcggttat agcggtaggc 840 ggggcgtagt cgttcgtatt tattaggata agatgggagg acgcgtatac ggcggggttt 900 tcgagcgcgg ttcgtcgttt tagttcgtcg gtttttcgtt tattcgtttt gaggttcggg 960 ttttggttcg tattggttgt cgttttcgtt agtcgggttg ggttcgggag gagattgagt 1020 cgttgtgagt tcggcgtttc gagtttggcg ttgttcggtt ttcgtcggtt tttttttttg 1080 ggttgtgcgt tgtgcgttgg gagcggggtc gtagcgcgtt tagttttcga gttttttgtt 1140 ttacgttttt tgggcgtaga ggcgacgttg gtagtcgttt tttaggagat tttttcgtag 1200 tgtggacggg ggttaggatt tgtaggcgag taagggtaga gaggagaaat cgtataggtc 1260 ggtgacgcgt ttaatttata aagtttgaaa gtgttgttaa ttttggggtt attttatgtt 1320 gggtatcgtt tttttaatta tttgtaaaaa gtgatagtag tcgcgttttt ttttaggagg 1380 cgatgtgatg tgtaatggtg gaaaagacgt ttaatgaaaa ggtacggagg tttgtaggat 1440 aggttgttgg g 1451 <210> 135 <211> 1242 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 135 tcgaataaaa aatataaatt ttgataggta aattaagatg tttttatgta ttttatgtta 60 aaatcgtatt aatttttcgt aaaatttttt atttgcgttc gttttatttt ttggttcgta 120 ttgtttttag taatgaagat ttttttgttt attattaata ttaattagtt tatattaaat 180 tttaggacgt taaggaaaag gaaaaattat ttttttagta gcggttattt aagaaaaaaa 240 aaaattgata ataatgtgga atttttttta aaattagttt atatcgtgat ataaattggt 300 tttttttgtg atttaaaatt gattcgtagt tgattagtta gaaaatagtt gttgaaaagt 360 cggggttttg gagttttcgg attttgttcg ttttttatta tgtaaataaa cgtattagat 420 ttaaagtttt tttataattg ttatgttaat tttggagcgt aattttttta tttgtatttg 480 aaggagttaa atattaggta ggaaagaaag tgtttttttt gaaagtttga gaaaatgttt 540 tcgttcgggg ttgtttcgtt atttgggtcg cgggttgggc gcgcggtttt cgtttttagt 600 tttttggtag aggcgtcgga ggaaggggcg tcgcgaaggg tcgttatttt gttggaaaag 660 aatgtagaaa tgttttttta aggttgaatg agtattattt ttatatttag ggcgggggag 720 gtcgggggac gtgggagcgg cgcgttagga gcgaggcgtt tttggtgata gcgcgtttcg 780 agggtttttt ttttttttag agcgtatatt aaaggtagat ttttttgtag gttttacgag 840 ttttattcgc ggtggaaagg ggcgttttag attgtagggt gaggggtttc ggtgtgtgtg 900 tggtgtgtgt ggtgtgtgtg tgtacgcgcg cgtacgtttt taaggaaaaa tttatttttt 960 ataagtgttg tggtttattt ttaattggat ttcgtggagt atttagatat agtcggtata 1020 gtgaaggtta atagtattag tatattttcg cgtattaatt ttggagtaat taaaaataaa 1080 aatagtgagt tatggggttt tgttaaataa gggagaaaaa aggttttaat tttttattag 1140 tttattttgg gggaatttag agagtttatg tattttttta tttttttatg taatttgtat 1200 ataaagtatg tttatcggga gttacgggga aaattatttt tg 1242 <210> 136 <211> 1206 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 136 gagagtagta tttatttttt tttattattt ttgaattgcg agataaagaa ttttaatttt 60 ggggttagaa tttaatttgt ttttgagaat atcgaatatt attaagtaac gttagtacgg 120 atataatagt agtgtgaggt ttgtatatac gtagttgaaa tggtaaattt aaaataggag 180 atattgtgtg tacgtatagt gtgtgtatat agtattaaga tattttttgt ttttggagtt 240 ttttttgttt tgttaaattt tacgtttttt ttggaaaggg ggagcgaatt ttttaagttg 300 tgaggatatt ttttttttat ttagttatat tttttttcgg gttagttttt ggtgaaattt 360 gggcgatgtg gagttattgg gggatgtgag tgagggcgtt tttgtttatt ttaatttagg 420 tttttgggag agtttttagg atcgttttgg gatttagagg aggtttcgtt ttgggtcggg 480 agttgaggtt tttcggataa acgttaagta gtttttattt atcggtgttt aataggtttt 540 atataaagtg ttaaagtgtt ttagtaaggt tttattagta tttgggtcgt agttgttttt 600 tggtttttgg ggttcgcgga gttttagatg tatttgtagt ttttttcgag ttttgtaagt 660 tatttttgtt tttttttttt cgtttatttt tcggtttttt tatttttttt gttatttcgg 720 ggaaggttac gtagggtgta attcggacgc gttttcgggg gaagttcgcg acgtagtagt 780 tatattttta gtttgtattg gcgtttattt tatgatttcg ttttcgcggt cgcgggtagg 840 gagcgcgcgt ttttatcggt tgattagaag cgggagtcgg aggagttttc gttcgtcggc 900 ggttagcgta tagttcggtt aggggcgttt tttttgtcgt cgtcggtttt ttgatcgttc 960 gcggttcgcg gttcgtagat tatagttagc gttgtgttgg gtaggtggcg gtagcggggc 1020 gcggcgcgtt taggcgtacg ggttttcggg tcgcggcgcg tttttcgtta cgtcgtatat 1080 taaggttcgg tcggtcggcg ggcgttttta ttagtagttt gaaattataa tattatgtta 1140 aagaataaag ttgtttttcg gaaaaatatg tgttgtatat ttgataaaga taaattggat 1200 tattta 1206 <210> 137 <211> 2308 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 137 ttagttttaa agtgtagtgt ggtattagcg aatgtggtgg atttcggtag gtttggggta 60 ggggaatttt cggtaatatt ttttagtatc gaaggtagga tttttcggtt attttcgtcg 120 gttggaattt ttttaagtat tgttttgagt ttatttttaa atgaaagggg gaaaaattta 180 aattagatta gaatttgaaa tagttgaaat agttatcgat ttttagtttg tttttaagtt 240 tggtagagat tgtgaaagtt ttaatttttt cgcgatgtta gttacggttc gcggcggtta 300 cggagttatt ttagtatttc gcgatggata gtgattttcg gcgtggcgcg agttttttgc 360 ggtttttacg cgggtttggg cggcgggttt ttttacggtt tcgtttagat attcggaggt 420 atttgttaaa gttgcggagg tggacgatcg ggcgtttaag tacgaatttt ttcgtcgagg 480 tacggttgtc gggtttcgtt ttgagggttt ggggcggcga ggatcgtcgg ggaggagggc 540 gcgcgagtcg gaggttagag tcgggtcggg tagggcgcgt ttaggagtag gggagacggc 600 gattcgggtc gaggcgggac ggggatacgt tatttgttcg tggagcgcgg ggaaggggtg 660 cgcggcggcg gcggcggcgg agtttggcgt agagggtagc ggtagtagcg ggagtatcgg 720 ttcgttcggg gtcggttagt cggggagatc ggggagtagc ggggtcgcgg gcggcggggt 780 cgaggcgagt agtatcgggg gaattacgat tttcgcgttg agtcggagta gttcggtcga 840 gttcggtatt atttagattt agggcggcgg cggcggcggt tttgcgttta tcggttagag 900 gagaggttgt cgtcgtcggg gttgttgttg ttgtagttgt cgtcgtcgtc gttggaattt 960 ggcgttcgtt tgtattttat attttcgcgt tgacggcggc ggcgggggcg gcgggcgttc 1020 gagatgttgg gtcggcggcg gcgcggtttc ggagcgaatt tatttggttt cgcggcgcgg 1080 tcgttcgttt cgtttttgtt tcgcgcggga agtttttttt tttttcgttc gcgtcgtcgt 1140 cgttttcgga ttcggttttc gtttcggttt tcgttcgttc gcgttttttt tcgtcggatt 1200 tcgtttcgtt ttcgcgtttt tcggttttgg tcggggtttt tttttcgttg cgtttttgga 1260 ttcgggcggt cgcggaggac gtgggtggga gagggtcgag ggcgcgttcg gttgggtttt 1320 cgtcgatgtc ggttttttgg tggtttttgg ttttttggga tttagcgtat cgcgagggag 1380 gtttcgggtt tcgtatttaa gggtaagcgg aagtcgaggt ggcggcgtcg gagttaggta 1440 tgtttcgttg tttagcgcgg ggttgagggc gtagacgggg atcgcgcgag tcgtttttta 1500 tttggttttt tcggagttta gggcgcggag ggtattgggt tgcggattcg gcgtaggcgg 1560 tttcggacgt tgttaggcgc gggcggattt ttgttgtata aatgggttaa ataggttcgt 1620 aaggttttcg cgggtttttt ggttcggaag ttgagtcgcg ggtgtttggt ttgaagtttc 1680 gcgttttata gtggttcgcg ggtttcggcg gtttttgttt tacgtttttt aaggtattag 1740 gtaggtggtt ttagggtttt tgtttacgat attttttggg tggggtagga ttattttttt 1800 gtgaattcgt tttggatgtt tttaggtata gtttgtattt tttttttttt tagtatacgc 1860 ggtttttgac gttgtacgtc gagttttttg ggatttagga cgaatcgggt tttaaggatt 1920 ttcgtttcgt tcggattata cgtaggtagc gtcggtcgag tcgagtttgg gttcgtattg 1980 gttacgcgta gttatcgtta gacggcgtta gttttttttc gttgtagatt ttgtttcgga 2040 ggtcgttagt ttttttttta tttcgggttt atagttttag tgtagttttt ggcgacgcgc 2100 gttgatagtt gggtagagat tttcgtgcgt tgtaaatttt ttaggtcgtt aaatttagga 2160 aatttaagta tagttaatgt tagcgcgaga ttagtgttgt tagaggtatt tgaagggttt 2220 ttttggatgt aaaaggtagt attatgattt atgtatttaa gaatttgtat gaaaaatttt 2280 ttttgatttg ggtgggagag taggtatt 2308 <210> 138 <211> 2201 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 138 tttttttttt tgtatgtaat ttcgggcgag ggaaagtaga atttgggggg agattgtaaa 60 atttagagta aggtggattt tgggtagagt gggggagttt atatttgtaa gttgcgtgta 120 atcgaaaggt tggcgatttg tagtttgtta gatttagata tggtgtaggt gagggtttgg 180 taaatattta gtttaatttt tgagatcgtt agagataagg ttaaatttta ggtgaacgcg 240 gttttagagt ggttgggatt tttattttta gatgggaatt ttttagataa gagtaaaata 300 ggagggattt tttcgtcgtt cgttttgcgg tgtgtgttac ggaggtcgtt gggtgggggc 360 gtttaaatgt ggaagcgttt ttttagtatg cgtggatatt ttgaggattt acggatatcg 420 attttttttt tcgggtttag acgttttaat tttcgttttt tttgaggtga gatttcgttt 480 ttttttagtt aaagggattt cggagtcgta tttatttgat ttggttgtta gcgttcgttt 540 ttttcgagtt tttagggtaa ggggttgtgg tgtatttttt ggggatggtt tgtggatgtg 600 gaagagggaa atttttttag ggattttagt tatttggtaa ttggtgattt ttatatgacg 660 tgttggtttt aggggttaat tttgataagt tgggacgttt tttttttgat tttagaatag 720 aaggtatttt gggttaagga cgtttataat tcggtttttt gtttcgcgtg gtttatgggg 780 tttgttttgg gtttgggagg tcggtggcgg gagttttttt tatagtgagg tgggtggggg 840 gcgttatacg gcgttttagg gagaggggag aggcggtttt tgtttcggga agagggaacg 900 gtggaggtcg tcgttttttt gggcgcggtt tttgttgggg gacggcgggg atcgtagggt 960 cgaggggtcg ggcgcgcgcg ggggagggat ttaggttagg ggtcgttcgt ttcggggcgg 1020 ggtttttgga gagcgcgtag aggggacgtt tcgtgaatgt ttgtcggttt gaaggatgtc 1080 gttgattttt gtttttttcg ttaaggtcgg gttaggcgag taggggcgcg gtttgagttt 1140 ttgcggtgat tttttaggtg tggaattaaa atagatttta gagcgcgatt cgcggggttt 1200 ttggaaggag tcgtttaggg ttggagattt cgacgtaaag attcggaggt tcgcggagtt 1260 gtgggcgtag ttggagatgg cggaggtttt agtagggagt gggggttcgg ggttcgtaga 1320 ggtagtttta ttttcggcgt tgggggtcgt atggttttcg taggttgtgg ttaatcgagg 1380 atcgggtttc gtatttttta gacgtttttg agtttttttt tgttttaacg tttttttttc 1440 gggtagtttt atagtgggcg attttttcgt atttcgtacg agtttatttt tatggtggat 1500 taggggtcgg gtttaggttt tgcgttattc ggttagagcg tttagcggtt ttattgggcg 1560 gcggcgttac gcggacgtgg gtgggaatag ttttcggatt cgtcgggaga ttttcgcggg 1620 gaagagaagt cgagtagttt gggggcgttt cggtagggag ggacgtgcgg ttgggaagag 1680 ttggtaggtg gtattcgatt cgtagtttgg tgagtaaggt gttaattgtt cgtttaattt 1740 tttgtttttg tagtaaaatt gtaaagggag atatttagtt cggtaggaaa tttagagtta 1800 aattttgtaa tttaattttg taatttaatt ttaattaaaa ataaaattat ttttttttaa 1860 tatgtgtata tatatagaga tagtaagcga attgatttgg gaattttata tatatatata 1920 tatacgtata tgtatatata tatgtgtgtg tgtgtatata tatgtatgta tatacgtata 1980 gttgatttgg gaataaatag ttgtttattg tgtggaattt ttgaatattt ataaaagtta 2040 tttaaagaaa gtaaaggtcg ggtacggcgg tttatatttg taattttagt attttgggag 2100 gtcgaggttg gcggattatt tgaggttagg agttttagat tagtttggtt aacgtggtga 2160 aatatttttt ttattaaata aataaataaa taaataaata g 2201 <210> 139 <211> 3047 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 139 gtatcggttt tgtattaagg ttttattttt ttattttttg aatagttagt aaaatacgaa 60 gataaggatg ggaggaaagg ttttttttcg gttttgacgt tttgtttttt tacgaatcgt 120 ttttagatgt acggattttt tttaggtaaa aagaaaaata ttattaaaag aaattagtta 180 tttttatttt agtgtgtaga taaagaattt ggagttagat tttttttttt atcggttggt 240 ttttagttgt ggttgggtat tttcgaaaga tagatggaga gggagttaag tttttagggt 300 tagggtagta gttggtcggg cggagttttg ttaggagcgg gtttgggagt tttaggatgt 360 ttggggcgtg agcggaggga gggagtaaag tcgcgtttag tttttttttt gtcgttgcgc 420 gtggttcgcg ttcgggttcg tttgtttttt ttttagttta aagttttatt cgtagcgttt 480 gggttggttt tatttatttg cgttaggtgg aggggaaggg gaggaggttt aaaggtgtgg 540 agtaagggag ggagaggaga aaggaggaag ggagagattg ggtattttaa gggttagagg 600 aggattattt gtggttatag ttatcgttac gattttttgt cgcgtttacg tacgcgtgga 660 tggggttagg ttttgggtgt tatttgggag gagtatttat ttataattcg gatttgtttt 720 cgtttgtgtt tttttttttc gtaattttta ttttttattt tcgatttcgg gtttttgagt 780 taggtttttt aaggggaaaa tatttttggt atcgtttgtt ttggtgaaat taggtttttg 840 ttttatttag tttagttttg aataataatt attgggagga taggaagtaa taaggtaaat 900 taagaaagtg ataaggaggt gggcgtagcg gtttacgttt gtaattttag cgttttggga 960 ggtcgaggcg ggaggatcgt ttgagtttag gagttcgaga ttagtttggt taatatggcg 1020 agattcgttt ttattaaaaa tataaaaatt agtcgggcgt ggcggtatgc gtttgtaatt 1080 ttagttattt ggtaggttgg ggtgggagga gcgtttgagt tcgggaggta gaggttgtat 1140 gaatcgagat ttaaaaataa aaagaaggaa aagaaaagaa aaaagaaata aaaaagcgag 1200 gaagtaagaa aagtaagtaa gtaagaaaga aaagaaaaga aaggaagaag tggttattgt 1260 ttttgtgttg tcgttgtgtt attttcggta tatttgggtt taattttttt attttttatt 1320 tgtgtttttt tttatttgtt tacgtttaga aatgtattta agtgaataat agtttgggat 1380 gtaggtatat tatttaattt atattgatgt ttagtatagt tatttgtaat atttaaaaaa 1440 ttgtaagtta tttgttttat aatagtcgat tgattgtaaa ttatggtaat tttttttttt 1500 tgatacgtag ttttgttttg tcgtttaggt tggagtgtag tggcgcgatt atcgtttttt 1560 tggtttaagt aattttttgt tttagttttt cgagtagttg ggattatagg tgtttgttat 1620 cgcgtttggt taattttttt gtatttttag tatagacggg gttttattat tttggttagg 1680 ttggttttga atttttgatt tcgtaatgta ttcgtttcgg ttttttaaag tgttgggatt 1740 ataggtgtga gttacgcgtt cgattaatta ttttggtcga ttttaatggg tacgttttaa 1800 gttattttat cggagaatat tattaaaatg aaatgtttat tatatattaa atggggggaa 1860 agttgtttat agaatagttt ttggtgaaaa gagaaaatac gtagatataa tttggatggc 1920 ggagattgaa gagtgattat ttttaggtgg ttggatgttg ggtataggtt ggtcgtaatg 1980 ttatttttgt aaggttagga gaaaaacgtt attttaaata tacggaattt gttttttttt 2040 aaatttattt tttttttcgt ttttttagag gttgttaggt ttaagaagcg gttcggagtt 2100 gtaggaaggg cgtcggcgtt attggtttta agagttcgga acgcgcgcgt cgtaggagtg 2160 tcggttgcgg ggtcgggttg agattggcgg gattttcggt ttttgtcggg gtgcggaagg 2220 tggatgttac gggtaaaggg gcggggtttg cggtttttag atttagaggc gggttgggga 2280 cgtgagtcgg cgtttatgtg ttttgtattt tttttcgttc ggtgtttttt ttaaggtacg 2340 ttttttaaag tgtgttgaat tcgggaatcg atcgaaaatt ttaaggttaa ttaaatgttt 2400 tttgatgtag agtttcgatt aggttcgaaa ggttttaaat agttttttta gattttcgag 2460 ggttttcgtc gcggtaattt taggcgtttt tttttcgaga agtttttttg aggtttttat 2520 agagggcggg aggggttgcg ttggggtttt cgtttttagt gtttttgatt ggtggggagg 2580 gatggtttta gtgtttgaga gtagagatta gattgatttt tatttgagat tagaaaacga 2640 agaggaagcg gaattcgagg tggttgcggt tttttcggga tataatcggg agaggaagtt 2700 ttggttattt gtcggtttcg tttgggggta tttgttcgag gatttttggg agtcgttatc 2760 gtatttttta gaatttgtcg tgttgttttt tcgtttttaa aattaatagg atatttattt 2820 tgtgattttt ttttttttta tcgtttagtt ggaggttgtt ggggattagg agaaaaaaaa 2880 tgtttttttc gagtttttta atttaaatgt ttattagttt tgtatattat tcggtttttt 2940 taaaagggat tagaaaataa agatatgtta atgataaagg ataattgaga tttcgtttgt 3000 tttgtatatt ttgtttatag aagttgtagt aataataatg taatttt 3047 <210> 140 <211> 7316 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 140 acactattct acttttcact attaatccaa cctactccca aacatcaccc ctcctccgca 60 aaatactaaa aataaaaaaa acccaacgac acaaaaaacc caaaacttac ccttctacta 120 actcaataat aactccgcta cctatcataa ctaatatttc caaaaaaatc aaaacctcct 180 caacctacct cttccttata cacctttatt taatacaata accctaaaaa ctctcacgat 240 tacgtttctt cttcatctat tatctccact tttatttatt tatttatata ttttttaaac 300 tctatcaccc aaactaaaat acaacaacgc gatctcgact cactacaacg tccgcctcct 360 aaattcaaat aattctccta cctcaacctc ctaaataact aaaattacaa atatatacac 420 cacgcccaat taatttttat atttttaata aaaataaaat ttcaccatat taaccaaact 480 aatcttaaac tcctaacctc aaataatcca cccacctcga cccccaaata tactaaaatt 540 acaaacataa accaccgcgc ccgaccctac tatctccact tttaaaaatt caaatccaca 600 acctaactca ctaaaatact cacaaaaatt cataaactat ctaaactaca taaataatct 660 acataaattc aaaaccacta caaacaccat atctcaaaca aacgtatcat aatatcaaaa 720 ctcctattaa acaacctaca aaacaaccta aaccccgtaa attatatcac taaaacatca 780 acaattaatt ttatccaata acaaaatcta aaataactaa aaaaaataaa actcaaataa 840 acctaaaaaa atctctcata cgataataac aatttcatca taaataataa taataaccat 900 atattaaaca cttaaactta aatcatacgt ctaacactat attaaacatt ttctttatat 960 tctattattt aatctttaca aaaatcctaa aatcaacatc atcccaattt cacaaaatat 1020 aacataacgt ctcaaaaaaa ataaacaact taccaaacat tccacaacca aaaaactata 1080 aaaccaacct atactcctaa aaactaactc ctaactacta tatataaaac taaacctaat 1140 aaaaatatca aaaataaaaa ttcacttcta tcatcaccga cctccctcca cacctttaca 1200 aaaaaaaaaa ctaaaaaaca aaaatttccg caaaacaaaa aacccaaatt actacctcct 1260 ataatttata cactacaccc caaactataa aaataaccca aaaacaaaac tataacccaa 1320 acgaaaacat ataccccatc taaaaccacc aaaatcttac caacttcctc aactaataaa 1380 tcgattaatt cacgaccaca accccctaaa actaaaaaaa aaaaaaacca aaacgtctcc 1440 gcaaaccaac ccaaaaaaaa atctacgaaa aaacccgaaa acctacaaac ccctctacac 1500 ccccaacccc accgccatcc taaacctcca aaataaccta atccaacaaa atcctacata 1560 aaaaaaacta aaacccaaaa aaaaacaaaa ccccgcccaa aatcaccgac cgaacctaaa 1620 taaaacccga ttctccaaaa accctatctt taactatctt atccaaataa aatttttcaa 1680 accatcaaat ttccgtactc cctaaaataa aacttcatct aaaaccaaaa aaaaactaat 1740 aaaaaaaata acaaaaaaaa aaaatacctc gaaaccccga acaaaataaa cctaaaaaaa 1800 aaacgaatcc ccatattccc tttcccgctc aaataataaa aataaattaa aaaaaacaaa 1860 aacctcccca ccttcaaaat aaaaccctaa aaaaccaaaa cacctttact aaaaaatatc 1920 cctcctcact cctacacaaa ttcctcaaaa acaccctcga actccgaaaa cgaaaaaaaa 1980 aaaacgacgc cccaaaaacc cctaaacccc taattcttcc cgaccctaaa aacttttctc 2040 cctcgattcc caaacgacga cgacgaataa cgcgaaacaa caaacgcaaa aacgctaaaa 2100 taaaaatatc tctacaaatc taaaattccc cttaaaaatc taaacaaaaa ctacgacaac 2160 gccgtcccct cccccgaaaa cccgacgccg cgcgaccaca aaaaacctaa aaaaacgaac 2220 aaaacctcgc aacgcaccca acacaatccg cgcgacgaaa cgaataaaaa atcgacgaaa 2280 acgcgaatcg accgaaatat cccccaaact ccgcgtcgcg atccccgctc gccctcccgc 2340 ccgcccaccg aacaccccaa ccgcgcaaaa aacgaaaacc acgcgcgaaa aaccgcgatc 2400 cgtccgaaac taaccccaaa cccgacaccg ccccgcgaac cgaacgccca cacccgccaa 2460 acccacgcga acacgccccc gcgacgcacc gcccccaacc cgacctccgc ccctacaacc 2520 gcgaacacgc gaaaaaactc ctaactaccc gcacctacac ccgcgcgtcg acgacgccga 2580 aaccccgctc cccgcctacg cgtctatctc gtccgcatct ccgcgataaa tcgacgacgc 2640 cctcgcccct aaacccaaaa ccaacttctc tcgccgccgc gactactacg cgcgtccccg 2700 cccaacccaa cccaaccccg aacacgaccc caaccccacg cacgacccta accccgcgaa 2760 tcccgcaccg actcgctccc gccccatttc gcctccgcga aaacgacgcc ccctcctccc 2820 cgcgactccc gctctccttc ctcgccttcc cgaccgcgct aaaaaccccc aaccgccgtc 2880 cgcgaccccc caccgcgacg cccgaaaacg acgaaatctc tttattcgaa cgacgaacac 2940 gaaaaaccac ctcccacgat atcaccgcac ccaccccgcg cccttcctcc gcctcctaaa 3000 attcaccgaa accaaataac gacgaatacc tttttaaaaa tacgcgacca tacaattaat 3060 aaattttttt aaaccgtttt aaaaaaaaaa acgcgacgtt aaaaacgaaa aaacgctcct 3120 aactataaac tactcctacc gcttcgctcc gcgctctcct accgctccgc tccgaatctc 3180 ccgcgctcct ctccccgact cgaccgaacg cgctaccccg acgccgccac ccaaaaccga 3240 accgcgccga acgccgaaat aaaaatacta aaacaccgac taaaactact cacaaatacc 3300 gcccgcctac cccgcaaccg accgccactt tccgaattaa aacgaactcc gaacgcgacg 3360 accgaaaact aaaacgactc gaatctaaac aaaaaaaaat acgaacccca actaaatcct 3420 aattttatac tacctattta tatacgaaac ccaaccccga aaaaaaactt aaaattataa 3480 cgaatcccta acgctaacgt ccgaactacg aaaacaccga tcaaaaaata accccataaa 3540 atctctaacc aacgaaactc gaattaaaac cctaaaaact aactcaaaac tcctaccctc 3600 caatcaatat cgcttatccc ctaaaaaaaa acccgtaaac ttctaacaaa acccgcgcca 3660 taaacctctt atttctacgc cctataacaa tctaaaccgt ctttctctaa aaaaaaaatt 3720 tcttactaaa aataaaaacg acgccaaata acctaaaaaa taaaaaacca aattaaaccc 3780 tactaactaa aaaccctcaa ccttaaaact cctctaaaaa aataatcaat taccctacta 3840 aaaactcaca tccaaaaaac aataactaaa aaacaaaaac gaacgatcaa aaaaaaaaaa 3900 taaaaaaaaa aacaaaaacg aaaaaaaaaa ttcgaaaaat aacttctata ttctccccga 3960 tataaaaaaa cccaaacaaa aaaaaaaaaa aacaacccga tttcctccaa ctctaaaact 4020 tataaatact ccatccgtat atatcaaata aacacaaatt ccaataaata tcctccgaca 4080 cctaaaaaaa aaaactaatc actaccttcc aaaaccttaa tatccgataa aaaaacaaaa 4140 ccccgaaacc ctattacaaa actaaaaaaa acaaccgtct ataaatacgc tcaaaaaacg 4200 ataaaatccg aatcgaaaac aacttttaaa aacctcgaaa aacaattttt attaataaaa 4260 aaaaaaataa cattataaat tcaaaatcaa aaaaataacc catactctaa aatataaaaa 4320 aaacttattc gaaaaaaaat ataaaaacta aataacctaa aatatacgta tatattacga 4380 aaaaaaaaac taaaaaataa aaataaaata cgttaaataa aattttatta aatcgacaat 4440 aacaaaccaa acgcaataac tcatacctat aatcccaaca ctttataaaa ctaaaaccaa 4500 aaaatcgctt aaaaccaaaa attcaaaacc aacctaaata acataacgaa accccatctt 4560 tacaaaaaaa taaataaata aatcaacaat aactcgtaac aaacttataa aaaaaaaaaa 4620 ataaaaacta ttcctaaaac actaaaaact aactaaatac tcaaaaattc caacgctaaa 4680 cccaattaac cacgaaacta acaccccctc caatccctta ccaacttttt ctttataaaa 4740 ctcacttaaa acaaacccaa ctcacccaac ttaaaaaaaa accgcgcaaa ccactaaact 4800 tattaacccc ctaaaaaaaa aacttacgat tccataaata ttttatttat ttattttatt 4860 ttaaaataaa atcccactct atcgcccaaa ctaaaataca ataacacaat ctcgactccc 4920 tacaacgtcc gtctcccaaa atcaaaaaat tctcgtacct caacttctca aataactaaa 4980 attacaaaca cgcgccacca tacataccta atttttatat tcttaataaa aataaatttc 5040 gccatattaa ccaaactaat ctcgaacttc taacctcaaa taatccacct acccctacct 5100 cctaaaatac taaaattaca aacgtaaacc accgcaccca acccccacca taaattttta 5160 aaactctaca taataaacaa atctcctaat tcctctcttc cccaactctt cctaccccca 5220 aaaaacctaa ataaaaaata ctcacaaaaa acatatataa aaaactcaaa caaaaatcta 5280 aactttaaaa accccataca ctattctctc atctcctaaa taaaaaaatc aaaacccctc 5340 ttcccccacc aaataaaatc accaaattct aacgaacttt ctaaatccct aaccaaaata 5400 aataaaaccc ctctcaatta ctatcatcaa tcacaaactc cgcccccatt atacctacaa 5460 cctaacccta aaaaacaacc catcccctct attactattt tataatcttc acaaacttcc 5520 ctctctatcc tcttcctttt ctcacaaatc gaaattctaa ctccaacccc atcaataacc 5580 aactatataa cttcaaacaa attacttaac ctctcaaact tcaaccctct catcttaaaa 5640 ataaaactat taacccctat ctctaaaaaa taatataaaa cttactaaaa taatataaac 5700 gacacacgta attaaaacct aaaccctaat aaacacctct taaaccccac ctatcctaac 5760 taattaacac ctaaaacatt taaatctacc cccaccctcc tttatcccta ctttcctacg 5820 tctataaaat ttaacccatc tcccccatta aataacaaac aaatcacaat ccgaaaaata 5880 accactttat tataataaca cacaacaaat actcaaaaat tactaactaa aactaaactc 5940 acacaaccca ctcgacatct acgtctctaa aataattcta taaaaacctc taactcccta 6000 ccccgacatc aaccttaaaa aatttttact aaattttaaa aactcatatt aaaaactaaa 6060 cacaataact cacacctata attccaacac tttaaaaaac caaaacaaac aaatcactaa 6120 aatcaaaaat tcaaaaccaa cctaaccaac gtaataaaac ccccatctct actaaaaata 6180 caaaatcaac taaatataat aacgcacgcc tataatccca actacttaaa aaactaaaac 6240 aaaaaaatca cttaaaccta aaaaaaaaaa attacaataa accaaaatta caccactaca 6300 atccaaccta cgcaacaaaa caaaactcta tctcaaaaaa aaaaaattaa tttaattcta 6360 tatacttttc acattctcct attttattat cttacctatc ttaccaataa aatcaataac 6420 ttcctcatat tcctatttct caaaaaaaac aacactaaat tcaaaaccca accctaaacc 6480 gaaaattatc ccatataaca ttctaactac ctaactttaa aacaatctaa taaccgttcc 6540 acacttcatt ttcctcatct ataaaataaa atcgtcgtaa tacctaccta actaaaatct 6600 ttaaaaatta aatatataaa cgtatacaaa acgtcgaata caacttctaa cgaacgaata 6660 attaataaca atcgtaaaac taacgtcctc aaaccgcctc ccgaatacac tccatcacta 6720 tactaaaaac tccttctcct cccactatac tccaatttcc aaattccctc cccgcaaaat 6780 attccaattc cttcgttaaa ttctcacaac aatccaaacc tctctaaact atatctctaa 6840 aaaaccctac ttaaatctca aattcctata aatcaaacat aacctcaaaa aataaaaccc 6900 ttccaaccaa acacccacaa ctctaacatc ataaaaaaaa ccaaataccc cctcacatat 6960 aaaactaaaa aaaaacccat aaattatcat acccaaatcc aacatatctt tttattctaa 7020 aaaaaaaaaa aaactattaa aatccttcta aaaactttat aaatcataaa tacttatcga 7080 aaccatttcc aaacgcctca acgaaatctt actacaacaa aaacaaaaaa aacgaaaatt 7140 ttaaaatcaa aaaatataaa tttcgaaatc tcccctatac ttctcaactc ctaaacaaat 7200 tattaccttc tttcgacctc aatcttatca ataaaataaa aataataacc ctcattaaca 7260 atattaaacc aaaacaatta tctcacgcct ataatcccaa tactttaaaa aaccca 7316 <210> 141 <211> 1587 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 141 aaataaatta taaataaaaa caattaaaaa ccacgcttca tctccctcct taaaaactct 60 aaaacgaaac tttattccta ccaaaaattc aaattacatt ataatcatct caattccaaa 120 atattaaata acaaaaatat ctacccatcc ttcactttcc ttaaaaaaaa ttactcttcg 180 aattttatat acgattacaa ttttccaata tataaaacta aaaaaacaaa acactcaacg 240 atatacatcc ctacacctaa ataatcaaaa ataataaaca actaaactaa ttatccttaa 300 ttaacaaaat caaaaccatt aaaatactca ctaatttaac aaataaatac ccttaaacgt 360 ctatcattta taactcctaa aaactttaat ttccacaaaa aacaaaataa aaaaaacctt 420 ctacttttaa caataaaaaa atcgttctcc ctcccctctc cacccgaatc aactcttcca 480 accgctccct cctacatcac gaacacacgc tacaaaaaaa cgcatttaca acccgaaaca 540 tccccaaacc tcctctccaa aattccccac ctcctataca taaaaaaaac taaaaaaaac 600 cctcacttcc tttccaaact tcacaaacaa aaaaaaaaac tataacaaac tttcacctcc 660 gttcccaaaa acgaatataa aaaaatccga aaaaacacgt cctacgaata aaaattaaac 720 cgaaatctaa acaaaataca cgatccccgc aaactacgat taataaaaaa aatactaaaa 780 cgtttacgaa aaatataaac cataattatc tcgccttcct cccctcccta ccaactatat 840 ttcttaaaaa aatcgccgat tcgattcacg cacacatttt tataaaacac gaacaaaacc 900 ataaataatt accttcatta ttccgtcgac cacgaaaaaa actcgaacta aacgaaaaac 960 aaatcccaaa aatcgtaacc cctaaccgta taaaccgaat ctacgactac aaaacgcgat 1020 cccgactaca acaaaaccta aaacaatacc cgaaacgacg acgaatacac gtaacgaact 1080 aaattacaaa ccgaccctct cgcgacgaaa actcgcgacc taacgaatta catcaacaaa 1140 aaaacactaa aactactccc ccaaaccgcc cccaaataat aaaatctctc ccaacccgaa 1200 aattcgaaac caacgcccaa acccgaacct cactcactac tcactcccga aatacaaaac 1260 aaaaatacca atattacaaa caaataacac gattaccccc gaatcaacca ctataaatac 1320 gtatccgaat ataaaaatac ccgtataaca tttatataaa aacgtcaaaa aaaaaaaaat 1380 aaacaaatca aaaatcaaat ataattacca ttccgtcatc actaactcct acccacctcc 1440 ctactatccc caaaataact ttactacata ctaaaaaaac cacgacacaa tcctacccaa 1500 aaatatacat atatcccccg cgactacttt aaatatactt ttacaataat caaaaacata 1560 tacctaattt accgatctct ttcccaa 1587 <210> 142 <211> 3381 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 142 aataaatcaa taaacctttc actaccttcc ccttctctaa actataacaa taaattaact 60 aactcaaact tacccaacga aatacccttc aaaacacact aaatactata ataaaaacta 120 catatacgct caaaaaaaat ataaataaac gctatttata attcacgaat aaaaaacctt 180 ctcccaaaaa caacaaaaac aaatcctatc tctaatatac cctaaccccc gacttaaaaa 240 cctcctaaac caaaccaaaa ccttccccga caacgataat ctccaaccac actcaactac 300 cctaaaaaaa catttcctac ttattccctt acccgactat atcctccacc cgaaaaacct 360 ataccttctt cgcctacata tcctacccta aaaaaactcc cttaatcttt catcgctctc 420 cctataaatc ttcacgcctt cccgaaccac cgcgcccaaa caaaaacacg ttctcgaccc 480 tcttcacaaa acgctcctcc tcacaaaaat acccgaaatt tttattctat accttcctaa 540 taactcctac aaatctaaaa aaacaaaaaa cgcatctcac tcctctaaat cccctcccct 600 aacgcctaac gaaaacccaa actacattta taaaattcat aactttttct ctcctactca 660 aactaaacac attactaact cctactcgaa taaaacccga ctaattaaaa taaaaaactc 720 cccgtaaaac gaaaaaatac gctatcaaat ataacattcc cgttttacga aaacacacga 780 tatcttacac gccaaaaaaa aatctaaaac gcaaaaaacc gtcgaacgaa ctacgaaatt 840 acttcgctat cacctccgcc tacaaccacc cttccgcacg cacttatata tacacccaaa 900 ccaacataaa aaacgccatc ctaacttcta ccgtaaacaa ataaaaaaaa aaaaaaacga 960 aaaatattcc attaattatc taaaaaaata aattacacct tcccctccct tacgaaaaat 1020 caacttttcc caccccctcg aataaacact cgcatcctaa aaccgaaacc taaacccgaa 1080 aaccaaaaaa ccccaattcc aaaaacgtaa aactaaacgt acaacgaacg ctcccaaaca 1140 ctaaaaaaaa tactttacga tatcccgaat ccctccaatc tcgccaacga aacgaacgta 1200 aaaatacccc gaccgaccaa cgaccccgaa tacaaaataa cgaacccgac gacgcgcgtc 1260 cccctccccc tcctaacgac ccgcacgtat cgcccgcgcc gcgcccccac gaattacgcg 1320 cgaatcccgc aacgccgcga ccgaaccgaa ctacccgacc cgcgaacaca acgccgaccg 1380 ccgcatcccg tacgaaaccg cgacgcgata ctacgctaaa ataaaaaaac gcgacgacga 1440 aaaaaaaacc cgaacgcgat acgcgcgaaa ataacgacga cgcgccgaac gaacccgacg 1500 cgaacgaacg aactacaacc gacgacgacg ccaacaaata cgacccgcac ccgccgccgc 1560 cccgacgacc tttaaaaact aaaccgaaac ccgacgcgat tacaaaattt tcgtacgcga 1620 cccctctaac ccgaaattac gactaaaacg cgcgccgcgc gaaccgaaaa actcgacgac 1680 gaaacgaaaa cgaaacgacg caccctctcc gtatcccgct ctacgccctt ctacgcgccc 1740 cgctccctat accgaaacaa cgatccgaaa aacgaccgaa aaatacgcgc gaaaccgaac 1800 cgactacgaa acaaatcgaa caaaaaccgc caacgtacgt caccccaaaa tttacgaaat 1860 aacaaaacgc gcgctctaac cacccgccgc tctaaacgac aactaataac aacgcaaaaa 1920 cgcgacgaaa acgaccgacg cgaaaaaaac caaatacgaa acccgcgaac gacgctatac 1980 gcgcgaaaca accgatcgac cgaaaacgcg aaaacctaat ctaaaccgac taaaaacgaa 2040 aaatataacg aaaaaataaa aaacaatacg aataaacaac ttcaaaaaat cattataaaa 2100 aaaaactaaa aaaaactccg cgaccaaatt aacaaaacac tctaacaaat aactacgcga 2160 cccgcgcccg aaacgataac tacgacaaac cccctaaatc cccgcgcgac gcatcccaac 2220 ctaaacgaaa cgctcgaccg cgacgaaacg aacaaaccta acaaaacaaa aaaaaccccg 2280 actccgaaat tactcttcgc acccgaaaat caatcttaac cccaaaacgc gacgcacaaa 2340 tccacgtaaa tattttcaaa ttaaatttca ataaaaaaac ttaaaataac taataaattt 2400 aaaaaaaaaa aaacacaata aaaaaaaacg ataaaattaa taaaccctaa tatcgctcaa 2460 atccgcctct cttttctaaa aacaataaaa aaattcactt ctatcaaacg tctattactc 2520 tacactatac caacaaatac aaaaccaaac cgacataaaa cacttctaaa caaccccgct 2580 atcaccaaaa aaaaaattct aactcccaac catatttaaa tttatataaa cctacatata 2640 cccacgaaaa tcaaccttta taaaatcgta tataaaaaat tttccttata tttaaaccga 2700 aaactttctt tttatactat aaatataata aaatcgaatc taaacttaat ttctacaaaa 2760 aaaaaattat cccgacttta aaaaattaat ccttttacta accgcaaatt taacgctcaa 2820 atcaccaaac cttctcaaaa aaacccttaa taatattaaa acatcaaatt acttacgatt 2880 atatttaaaa tatattttaa atatttatca aacatcgcta ctaataccta aaaaacctcg 2940 taaaaactta tttttccttc taatttaaaa acatctaata accgaaaacc gtaacgattc 3000 cataaaatct aaccaaacac aactttcaaa tacaacttcc ctctctctaa aaactacaac 3060 ccacccaaac taaatttcaa tacgatacgc tttacttaaa ttacccactc acaatttccc 3120 actacgccgc aaacaatata tttcaacttt aaaatacctt attttaaaat tccaaacaaa 3180 ataatattaa aaaaatatct ccttactaat cccatcaact tctattaaaa aaaaaaaatt 3240 tataaaattt aaaaatacta cgtataatat ttaaactttc ataaacattc aaatactttt 3300 aaaaccaaat tcaatttaat tataaatcga aaaataaaaa aaacccacat aaaaatatcc 3360 taaatcctct taaatttatt t 3381 <210> 143 <211> 7398 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 143 ctaaaaccga taaactctaa acacaatcac gaaaacatac gcactttcta actactctcc 60 taccattatc ccttaaattc ccattttaat aaaacgtaca ccctaacgac gctccccaaa 120 aaactaaata tatttactac actatacgta aaaataaaaa atatacaatt aactaaccct 180 atactaatct aataaaactc cataccaacc ctaaaaaaaa acaattacat aaatatatcc 240 acactcacca aatacttttt aaaaaaacac tcgaaaataa tactataact taaaataact 300 attataccga acccgacatc ttcccaaaaa aactatatta ttaaactaaa tttcttaaat 360 actaaacccc caaatcccca aatacgacgt aaacaaataa cccaataaaa actaaactat 420 ccgataaacc caaatactaa aattcaaaca aaacataccc taacctaacg taaaaaatac 480 gaaatactat taataacaac aataactaca tttctaaaac ccgaactccc aaaccgacga 540 aaatatacac gcatctaaaa tatctataat tttacaattc ccatatccac aaactcactt 600 aattaaaaat aattcaaaat atccaaaaca taaaaaaaaa aatacctact tttcttaaaa 660 aaaaaaaact taatttcatc tacttaaaaa accacccaaa cctaaaacat tttccgcaaa 720 aaacccccta ccccccgcct ctccaaaata actaaaaaat ctcaacactc ctacacattt 780 aaaatatttc aaaaaaaata aaaaaaaaca aataaacaac gaacgacctc aaacccaaaa 840 taaactatca aacgctcccc gaccacacat tcaaaaaacc gaaatacaat tataacgtta 900 cgacctacta cttcgaaaat aaaaatatta ttccatacta taaattctca cataacccct 960 aactctaaac aaaaaccgaa aatctaaaaa acgaaataac aaaaaaaaca tacaaaaata 1020 aatttctaac tttccaaaac gaataaaaaa aacgcctctc tctcttataa ataacaaacc 1080 taaaaaaccc ttcttaaaaa taaaaaccta ttacttctca aattctatat ctaacccaaa 1140 tccccaaatc taccccaacc cctcgaccct acctacctta taaataatat aatttaaaaa 1200 taaaaaccgc taacctaaaa aaaaaactaa acctcaaatt aaaacccaaa aaaaaaaaaa 1260 aaacccttaa aacaactccc tttctactca ctcactacct aactccttcc ttcacacctt 1320 ccttcgaaaa cgtctactcc taacaaaatc tacttcctac tctcaaaaaa cccttattat 1380 aaaaaaaaaa aaacgtcgcc cgtccctaac ttctctaaca accgtattcc atccccgccc 1440 tatacccctt ctcccgaaca ataccttctc caaaactcac ccaaaaaaat acaacgataa 1500 cccccgaaac gataatcgta ataaaaatat taactacaaa aataccctcg ataaataaaa 1560 attaataacc tctcgctaat accataaaac tcgcatattc gccctacgcc cctcgactct 1620 taaacccaca aaccgaaatc ctacctacca accgcgtacg ctaccgttta acccttacaa 1680 acgcaaaacg cgcgacgacg ataacaaaaa actttattta actacccaaa tacaacctcc 1740 tacaaaaaaa ccctacgccc gaaaaaaaaa aaaaatctct tcccctctaa acgcccgccc 1800 tcctcgccat aacccgacct ccacatccgc ccacatctaa ccgcaacgaa acgcccgaaa 1860 aaaaaaacta aaaccgcgtc tctcgccgtc ccctaaacgc gaaccaaacg aaaaaaaaaa 1920 aaacgctccg atcgtatacc caaaactatc ccccaacgac cactcgaacc ccaacccccc 1980 aaacctaacc ttaacaaacg aacgaaacaa ccaatacgaa acaaaaaaac cgatacgaat 2040 acgaaaacct aatccgcccg aaaaacgaaa acgaaacgaa aacgcaacgc gcgaaaaaaa 2100 accgacgccc gccttcctcc cccattcatt caactaaacc aaaaaaccta aaaactcctc 2160 cgacgactaa ctctacacta caaaaacgcg aacgcgacgc cccaaccaac gcgcaaaacc 2220 cgaaccccgc cgaaaacgct tcctcgccgc taccctccgc gcgacccgct acccaccaac 2280 catcatatcg aaccccgcga tcaacgcgca actaaataaa atcatttcga acttcgaaaa 2340 taaatactaa actaactact acgaccgcga acgtactaaa aaaaacccta cgaataaacc 2400 taacgcgaaa cgaaaatacg ctaaaaaaaa acgaaaatac gctaaaaaaa aacgaaaccc 2460 ctaatccaaa cgccctcccg ctaaaaacgc cgcgcgcccc cgaccccgta cccgcgccgc 2520 ctacgtaaaa aaccctatta aaaacacccg cgtaaaccct acgcgccctc acaaaaccct 2580 atactcgttc tacgcactac cgcctaaatt tccttccttt tattattatt tatatttacc 2640 aaacgacaac gacctcctcg aaaactcgcg aaactacctc gaaactctcc aaaacgcaca 2700 atttcactct aaaaaatcca tcgatcccct ccctttaact ctccccgacg actctcgaac 2760 cccgcttaaa cccgacaacg aaataaaaaa atcgttcctc acctccgact aaataaacaa 2820 ccgcgtccta ctcgaataaa caaccctccc ctcccccacg ccaatttcga aaccgccaaa 2880 ttatacaacc cgtaaaccga aaacaccgaa cgaacacaac ccaaatcgta acaaaatcta 2940 aaataaaata tcccataacc cccatccaaa cctaaaaata tcctcatccg cctcccaaaa 3000 tcgaaccgta aaaaacaaaa aaaacctacg tacgaacaaa aaaaatattt taactctctc 3060 ctatcttcga aatttacaaa atatattaaa acttacgaaa ctactctatc caaacctaaa 3120 tctaacgtcc gcgtctctaa acctataaat acgtacgctt tcctacgtcc tcttaactac 3180 cgatactaaa actctacgtc ctacgtccgc gaaaataaat acaacaaacg aaaaaaaaac 3240 tcacacaata atctccaacg ctctaaaaca aaacttctaa aaaacgaacc tacctctacc 3300 gaaacctaaa acccccgccc ctcgaaaaaa ctcctaaact aacttaaaca aaaccctcta 3360 ataaaccgaa aaaaaaaaaa actatattaa aataaacaaa ctatccaaat atcaaaccaa 3420 actaaaaaat aaccaaccta aaatcctccc cgctccataa ccaaaaccaa aactaacatc 3480 taaatatcct aaacccaact acccacacga cccacctaaa atcaacccta tctaaataaa 3540 aaaaacgaaa cctcctaaaa aaccaaaact ttaactaaac gccaaacaaa ataccaataa 3600 ctattcttca aaactaaacc taaaaaaaat ataaaacgac gaaaaaacga aaaaaaatta 3660 taatccaata accactaacg ctatacaaaa tataaactaa aaacatcgta attactttat 3720 caacttaata ataaaaaccc tttttcaaac tctatccctt tacatcccta cttcccaaaa 3780 aaaaaaaaaa tctaaatcta caaaactaaa aaaacttact attcccgccc ccctccccca 3840 caacacctcc tcatctaaac atctttaaac acatactcat actaaaatct ccctaaatcc 3900 actatattcc gttaaacctc ctacaatccc cgaataaata taacctccct acccctacct 3960 ctttacaact cctccctacg accgctcctc caaaaacctt ccttatccca aatatccaaa 4020 taacacgact taaccgatct aaccactttc caataaaccc ttataaaaaa aaaccctata 4080 ttatacaaaa ctctcctcct acctacgaaa tcgaaatctc tactctcaat tcctaacaaa 4140 aaatatcgaa cccccaataa aatttctaaa aaaaaactct cgtatctcaa cgaaaaccct 4200 ataacgaaaa aaaaaaccaa aatttaaaat tatattcgtt atacaactat caccatttac 4260 actataaaaa ttattaatac cccttcctta aatctctaaa tataactcca cccttacccc 4320 catatacctc catctaaaac tacttctacg actatctccc aaaccaattt tataacccta 4380 taatttaatc caaaacaata aactcattaa aaccatccta atacaacaat taacaatcct 4440 ttaactctaa aaaaaaattt ctcaatctcg aaaaataaaa cctcaatcta ctaattccct 4500 atatttatca atctccccct tatatatcct aaataatttt actaaaaatt ctaatcttaa 4560 aaccatcaaa taacccgaat cgataaacgt aaaaaaatat atatatacat aaatacgcat 4620 atacataaaa actaacctaa aatataaaaa aataaccctc cctaataccc aaaaaaccta 4680 aaatataatt aaaaaatata aaaatatata tataaaaatt aaacaacctt aaataaacaa 4740 acaaacgtaa aaaaaaaata attaaaaaaa ataaaaaaaa aaatataatt caacccaacc 4800 aaaaataata taaacaaaca acttccgaat caaaataaaa aaaaatcacc actaactaac 4860 aaaaaaaaaa tcaatataaa aaaaacgaac cttaaaaaaa aataaaaatt aaattacaaa 4920 aaaaaaaaaa accttctaac caacaacaac caacaacaat aaaaaaaact aaaataaact 4980 aactaaaaaa aaaactaaaa cataaaaaaa aacctaccta taaaaatcat ataaaccaaa 5040 ctacgaaaaa ccaaacatac ccgccgaaaa tacaactaat ccacgaaaaa catctaaaat 5100 aactaaaaat aaacgcaaaa acaacgccgt aaaaacacaa atctctttcc cgaaacgact 5160 cacctaatat cttaattcct acaaaataaa ccgaaaaaat aaaaaaaaaa ctaccaactc 5220 cttacaacgc taaaataata accccaaaat tcctaaaacc aacgaatata aatacctatc 5280 accatataaa ttactaaaaa acgaaaactc caaaaaccac cccaaaacaa aacgaactct 5340 aaaccacgac atctctaaaa acaattttcc aatcgaacaa acgtctaaac ctaaaatcct 5400 ataacaaaaa ccacaaaacc ctaatcaaaa tattctaaaa aacttaaaac taataacaat 5460 atacaaaata aacgacaaat aacctaacat aaaaaaaaaa acaaataccc aaaccgacac 5520 aacacacccg taaaaaacaa ataaacgaaa aaccgtccgt aaacctatat atatactcga 5580 aattaaaatt ctaccaatat cccatatcct aaacacatct accccctccc taaaaaacac 5640 ctttctcttc accttttcct tccccgccta tccccttcac ccaaaacctt ccccatccct 5700 cccgtcttaa aaaccgaaaa caccataact ttatattcca tcaccgataa attacacaaa 5760 aattcaatcc ttccgctatt caaaccgaat ccttcaaact caaaattccc aaaaataaaa 5820 aaaatatcaa tatcttccat aaactcaaac ttcccgcatc ccgcctttac tcccccttca 5880 aaataaatct ccgaacttca aaattttaaa actctataaa aaccgccacg taacaacaaa 5940 aaaaatattt tatatttaac taataaaatt tttaaaatct cattttctac ttttccacta 6000 tacaaacgaa cctccaaacg actacaacac ccgccactac ccgtaataaa ataacaaaaa 6060 aaataaccct ttcctctttc tcccttctaa ttaataaaaa cacgaaacta acgaacgaca 6120 tatactttcg taaattcaaa ccaaatctat tatcgcaaac acgattacaa ctcgaatctt 6180 tatataacaa aaacctttcc aaataccaac tattaaccta ctttactcaa cgatatttac 6240 tataaccaaa tttacacacc gaaaaaaaat ccaaaaatcc ttaatattta ttaaaacaat 6300 ctaacccaaa acccacgtac tcaaatccca aaactatata acatctaaac ttctcccgaa 6360 cccccactat cgcccgaaaa aaacccccaa atctatattc taaaaacaaa acaaactata 6420 aaacgaactt ctaaataaaa aaaaccatat aaatatacct tcttatctaa aaatcccaac 6480 acctccgaaa cgtaaaaact aacgcgctaa caaaattcaa atacctcttt cctctctaaa 6540 aaaaaaaacc ccgttactta ataataaata caaacctatc cctaattaat accaataaac 6600 ctcttacgta ataaacccta cctttcaacc aaaactcaaa acatcctata aatactacct 6660 ctctacaatt taaactttta taataaaaaa caaaaaccat aaaaaataaa aacaaacctc 6720 ttacacgaat cccacaacca ctaacaacac taacttaata ctctttaaat tcaaaaccca 6780 aaaccaaaca aacccactat cccgactacg aattaattca tttaaaaaaa aacgaacaca 6840 acacccaaac aacaaataca ctataatcaa ccttacaacg aaactataaa ttctctaaac 6900 taaatatccg aaaaaaaaca aataaaaata aacgccaaaa cacccctaca ataactaaat 6960 aactacaaac taaaaatact ttctataaac tataactatc caaaaaaatt ttaaataaaa 7020 ctaataaaca aaatttacat ccaaaaaaac aatactttaa aaaaataaaa aatataacaa 7080 tataaaaata cccaaaccgc cctcactcta ccattaaaaa actaaacgac ttcgatttct 7140 tcaatttctt cgcctatttc cctacctaca aaataaaatt aaaaacaact ctctttaaaa 7200 attactaaaa aactctaaaa tacaacccat aacgctaaac acgaatccta cctcctacga 7260 atataataaa tatcgcgact aatataacat ctaaacgaaa aaaaaaaaca tttacaaaaa 7320 acaaataaat ttaaatactt aaatatacaa atctaaaaat aaaaaatctc aaacaaaaac 7380 ctatataata ccactata 7398 <210> 144 <211> 2396 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 144 aaacacttca cattacttaa aaacatctta cacttttttt ttccctcaac tcacaaaaca 60 atttctttct actaatcgaa ttctcaaaac aaaaaaacta catacgtctc tcgtttcttc 120 actaattatt ctctaaaaaa aaaaaaataa aaaaaaaaaa aaaaaaaaac aacgaaaaaa 180 aaaaaaacat aaaaaaaaaa aaaaaaataa aaaaaaaaaa aaaaaaaaaa actaaaaaaa 240 cgcaaaaacc ctaacttacc gataaacaaa accgacgcaa ccacaacgcg aaaccgcgac 300 gcccactaat cctcgaaact accaatcgac gtataatcct ataaaaattt ctcccgaatt 360 tatctaaaaa tcacactacc gcctcctctc cccaatcgcc caaaaaaacc cgaaaaaaca 420 aactcaaaaa aaaaaaaacc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aacccgaaaa 480 aaaaaacgcg acgcgaaaaa aaaaaaaacg caaccgcgaa accaataacc ccgcttaaac 540 gcgctactct ccaaataccc ccgaaactcc aaccgcgcga atcgcgcgct cccgccgctc 600 tacccctaaa cttctaccgt aactcccttt caaaccaacg aatttattcc ttaaaaccaa 660 aaactaaacc tcgacacgaa aaaaaaatcc gcgaaaaaac aaaaccacaa caaaacaaaa 720 aaaacttcaa aaaacaacct tcccgaaaca ccaactccgt atcgaaaata caaaaaccaa 780 caaataaaaa aacgccgcgt tcccgaaacg caactacgaa cgacgaaaac aaacgcaaaa 840 aaaaaaaacg aacgcccccg aaccccgaac ccgaatcccc gaacctaaac cgcaatcgct 900 acgatactct actccgaatt cgtatacgcg aactacgccg aacgctaaac aaaaaacttc 960 gttttaccct aattacaaac aacgactaaa aacaaccgat ccctaaaaaa tatacgacgc 1020 gcgtaaatcc tactcacctt aaacttaata acctacgtat cgacgaaatc gataaataaa 1080 ccaaacgaaa aatacgcgcg ccgtttaaaa tatttaaaac tacgaaaaaa acccgcaaaa 1140 aataaaaaaa cgccacctaa aaaaccccca atccccaaat atacaccgaa aatccgctaa 1200 aacaaatacg ctcgtccgat caccctttcc ccctcttccc ttcctcaaaa aaacgctact 1260 cgctaacgtt accccgcgat ccgcgaaaat aaaaacaccg aaaattacga tttaatctaa 1320 ccgcaaaaac ccctaaaatc actcccaact tcttcgccct cgacgaatct tactacgtaa 1380 tctaaaaaaa acgaaaaaaa aaaaataaca aaaaaaaaaa acctaaatcg aacccgcgaa 1440 aaaacgactc cactccgcgc gctcctcgaa accaaaaata acctaaaaac ttcgaaatcc 1500 cttcctccgc acaccatccc ccccgcgcca actttcctat ttaactacat acaaattcta 1560 aaaaaataaa aaccaaattt aaaaaacccg cgaatatcca aaaaaaaaaa tttacaaaaa 1620 ttcttttatt taatactccc tacgactaaa acgaaataac cgacactacg taaaatcgca 1680 ataaacgatc cctcaaaaaa atactaaaaa aaacacgaaa cgcgtccgaa aatactaaaa 1740 cgccgaccac taaattccca atcctacgac gaccccctcc tcgttaaaaa ataaaaatta 1800 caccgcgaaa cgtcaaaaac gaaaaaacat tttcataaaa attacacgaa aataccgcaa 1860 acaaaacgaa acgaaatacg tataacacga cgctcgactt cgaatcgcct aaccgctaaa 1920 aaacaaaaac ttccctcccg ccacgctcgc cctctctaac cctaacgaaa cgcttctaaa 1980 accgaaaaaa atctcgtctc cgacgaaacg cctaccgaca cccaacttcc ctcccccgcc 2040 ctaacgataa aaacttaatt tctcctttta atcgcgcttc gaaaactaaa acttatttcc 2100 ccacgtcgcc caataaacgc cctctaaaaa aaactacctc cttaacctcc tctcgtccgc 2160 aactacctcc acctaaacgc caaaaactct atcgaaccaa ataaaaactt aaacacccca 2220 aatttcgtct acaacctcaa taccctctaa aatctcaaaa aatacgacta tttctaaccc 2280 ttctaattcc ccacgtcctc tccctttacc atttaataac gtatcaattt ctaattaatt 2340 aaataatctt ttcaaaaaca aattatatca tcttaaaatc ttttaaataa ttttat 2396 <210> 145 <211> 3696 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 145 taaaccgaat ttaacatcct tctatacaaa aattttccga caaaacaaat aaactactct 60 tccactaaac tataactttt aaactaactc taaaatacac ccaaccttcc aaaaatatct 120 aacttaaccc tcaaaaaaac aactccaacc ccaaaaaccg accgacacca caacacctaa 180 acaaaacact acaaaaaaaa aaacgaaatc tctaataaaa cttctcattt cctatcgcta 240 ctaaaaaaaa ctaaactcgc tccttctcac ataacttaaa aaaaactata aacgaaaact 300 taccgactaa ccaccaactc aaaaacccta aaaacgacct ccgaattcta ctccctattc 360 ttccctttaa ccaatatcac tcctaaacaa ataacgaaac caaacgccct tcacttcctc 420 gaatcctcat atatatcata attcctcttt taaaaaaaca taaatacaaa acgcaaaaca 480 aaaaaaaaaa ctaaaaacaa attaccccat cacctcgttt cgtccctccc cttcgttatt 540 ataaaaaaac ttaatcaaat tccctttatc gcgccacaca cacgcaaaat aaataaaaaa 600 caccctaaaa caacttattt ctttcccgcc tcacaaaaaa cctttacgaa atcctcacac 660 catctccgaa cgcaaaactt tcgcattcaa cttaaaaaac taaaccattt caaaccaaaa 720 taaaaaacgc caaaataata ccgaaataat cccaaaacaa aaaactaaaa aacaaaacaa 780 actcaacgca cctaaacgtt tacatttaca caaaaaaatt aaccgcataa ttaataaaaa 840 ctaccgacta aaaacgaaac gcccgtaccg acctcctcac ctaaaacatc tacgacctca 900 aattaatctc cttcaaatta ataaaatacg cccgaaaatt attaaacaac taacaaaaca 960 aaactccatc gcgaaaaatc tacgcaaaat cgaacaccta aaccgaatcc caaatcaccc 1020 gataattaat aaacaacacc ttacaataaa taaaccacta cgcgcactac ttccacgact 1080 ccatacccga cgactccgaa acgcgactaa accgaaacga acgacaaaaa tacgaccgcc 1140 gccgccgccg ccgcgattcc tccgcgcccc gccgacgcca acaaccgccg accctttccc 1200 cgcgcgaaat cgaaaaaaca aaaaccgcga ctaacgaatc gcgaacgccg cgctaaactc 1260 gactccgatc ccgacccgaa tacgccgcga cccgaccgcc gctacaacga atcccgcgcg 1320 ctctccgtac gccccgaccg actcgacgac gactaccgcg cacaaacttc cgactccaac 1380 gcccgacccg ccactaaaca tacccaacac gccgaccgat ctcgctacga tccgcaaatc 1440 cccaaacgcg cgaataaaaa cgcgccgacg accgaaacta aaatctataa ccgaaaacga 1500 aacgcgaaaa aaaaaccgac gaaaaaaaac gacgaccaaa aaaaaaatcc cgcgcccccg 1560 cctacaacct tacgaaactc acgcaacccc cgacgtccta aaatcttctc tcgaaacgac 1620 ttcccgactt tacgaaaaat ataactaaat actataatac gataaaatcc cccaaaaccc 1680 cctaaacaac aaatactcaa aaaaacgacg aattaattaa aacacccaaa ctccccaaaa 1740 caataaaaaa aatacctaaa acatcaataa aacacgacgc taaaaatttt aaaaatcgtc 1800 gccccctcgc cccttacaac tctatcccct ccattctcta taactaattc ctcaacctat 1860 tcctcctaat tacccctaat aatattttaa caccctcaaa ataaataaaa atacgtatat 1920 aaaaacgcct acgaaaaccg ccccgatccc taaacctatt tcctcgcgaa ataattttca 1980 cttaaaacta atttacccct acactatcaa actcgaaact atttaccgtt actattctaa 2040 cccttttact aaccccacaa aaacctactt aaaaaaaacc tataccacga tactaaacta 2100 cgcatacgtc gacgactaac gaccgaattt aaaaacaaaa cgcgttaacc ctaaacaact 2160 cctaccgaac tattctaaaa tccttaataa aaattaaaac ttaaccccaa aacttttacg 2220 caatacacaa acaatacatt cgtatttctt aaataaatct tttaaaaact ctaaacccta 2280 ccccttttac tcccactaca cactacccct caaaaccaca attaatattt aaattattta 2340 taacaaaata ttaccacaat aaattattac tattcgataa aaatataatc cttcgtcacc 2400 cttttaaaat acattcactt aaaattaaaa aataaaccga acgcgataac tcacgcctat 2460 aatcccaaca ctttaaaaaa ccgaaacgaa cgaatcacga aatcaaaaaa tcgaaaccat 2520 cctaactaac acgataaaaa cccgtctcta ctaaaaatac aaaaaattaa ccgaacgtaa 2580 taacacgcac ctataatccc aactactcga aaaactaaaa taaaaaaatc gcttaaaccc 2640 ataaaacgaa aattacgata aactaaaatc caaccactac actccaacct aaacgacaaa 2700 accaaactct atctcaaaaa acaaacaaac aaacaaacaa aaaaataaaa atttaaataa 2760 tttaattata ttatatttct ataacccaaa ttttttatta cgaaccatac tttataaaca 2820 aaccaaaata ttatttttaa aaaaataatc tattcaaaat aataattacg tcctttttcg 2880 tttaactata acaaaaataa cacactattt acactcaacg ctaaacaata aatcaaccta 2940 aaaatttcct ttcctcacac gcatccttcc ctaacaattt cctcttatat tcaatacgaa 3000 ttccatcaat aacacgacat tttctaaacc ataattttaa caaataaatc atactaatct 3060 ctacatacct ttaaaaacaa aatccaacac atttaaatca ccatttaaca caatctttca 3120 taaaaaaaaa ttaaaaaaaa atttcattaa acgaatcaaa atttaaacta aaactataaa 3180 tttttttcaa ataacatcaa atcaccttta aatattaaaa aatatttcca aaatccacat 3240 tatatacact atcccaaaac gcaaatctaa atttaaaacc cgaactatac tactttctaa 3300 caacataacc ttaaataaat tctctacaat tcaatttcca taaatacgaa ataaaaaatt 3360 tttttttttt tttataaaaa ataaacgaaa tctcgctcta tcgctcaaac taaaatacaa 3420 taacgcgatc tcaactcact acaaactcca cttcccgaat tcacgccatt ctcctacctc 3480 aacctcccaa ataactaaaa ctacaaacgc cgaccgccac gcccgactaa ttttttttat 3540 atttttaata caaacaaaat ttcaccgtat taaccaaaat aatctaaatc ttctaacctc 3600 gtaatccgcc cgcctcgacc tcccaaaata ctaaaattac aaacgttaac cgccgtacct 3660 aaccataaaa aataatttct aactaataaa attatt 3696 <210> 146 <211> 4199 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 146 tactaaaact aaaacaaacc acacctaaaa aacaataccc aaacatatta acgaaattta 60 aaataccaaa aaaattacac cacaattcta cccaatatac tacaaactat caaaccgaaa 120 tactatacca actaaaaata caacaactcc catcctctaa ccctatttaa ttaaaaaact 180 tcaacaaaac gaaacctacc aaacgttcgc cgtcaaaatc taaaaaaacc cgaacgaaca 240 aaaaaaatac ctaacccact ccacaaaaac ctatccaaaa ataaaaaaat caacgcccac 300 taaaatcgat tccgccctcg actcgcctac ataaaaccta accaacctca atcataccca 360 ctccgaccta aaaaacccgc aaaatattct ttttctcaac tcccctatac taccttaaaa 420 cttaaaaaaa caaaaaaaaa aacatatcta aactacaaaa ccaatatctt ttaccgccta 480 aaaaaaaaaa aaataaaaaa aaaaaaaaaa taaataaata aaaaaaaaaa aaaaaaaaaa 540 aaaaaaaaaa aaaaaaaaaa aaaaaaaatt ctattaaaac ccaactcctc taaaatctat 600 ataacctaat cttcaacgaa aaaccaatac gacctcataa cacctttacc aaaaatcaac 660 gattccccta caatcaccat ttaatttatt actttctcgc tcattctttc tcataaaatt 720 atttcttcct catcctaata aaactttttt ctttaataat aacaaaactt ctatttcaat 780 atttccccta aaattaatac tctttcaaaa caataaaccc aaaaaaccat cccgtttaat 840 atttctcaaa atcctcgcaa ctccaatata aacgcaaaca tacaaaaatt tcctactaca 900 cctacacttt ctacccatcc caaaaccacc cctcaccccc gaacctacaa caattcccct 960 tatttctcta aataaaaata aataatatta aaaatctaaa acaataaaaa ataaaaaact 1020 aaaaaaacgc gctaaaataa actaatctat actaaatacg cgtattcttc tacgaaatta 1080 aaaaatcgaa aacgaaaatt ctaaacttac caaaacaatt ccaaccgata aacgtttaac 1140 aatcacttaa aaaaataaaa aaaacaacga acttcaccga acgaactacg ataaataaca 1200 taacgaacaa caacaacaac caacaaaaac cctcgcaaaa tatccaacta ctacactacc 1260 gcgaaaactc ccacaacacc ataactaatt cgtacaactc tacaacaaca aacgacttcc 1320 gaaaaacaca aaatcgcgaa aaccgaacaa cgaactacta aacatcccgc gaacgacgac 1380 aacaaaaacg acgacgataa caataacacc cgacgaaaaa acaacaacca aacccgcgca 1440 taatctcgaa aatttcaaca acatccaaaa actaaactca accccgaaac gaaaaaatcg 1500 tccgctaaaa aactacgccg aaaacgcgaa aaactactac cataaaaaaa aaactctaaa 1560 aaaccgaaaa acaaaaaaaa acgaaaatcc aaaaacaaac gaataaaacc cgaaaaaaca 1620 aaataaaaaa aaaatcaaaa cgccccgcaa cccgacaacc gcctctcgaa ctctaccgcc 1680 cgcatccctc taacgtttaa aaaacaacaa atcctcaacc cgcccgaaat cacgtaaaaa 1740 aaaacaatcg aactctaatt aataaaacaa aatacaaatc ccgaaaaaaa aaaatcgacg 1800 aaaaaataca aaaatacaaa aaaaaaacga ccgcgaaaac cacaaataaa ctcgctcgcc 1860 aaacgctaac ccgaataaaa ctaaacgaaa ataactcaaa taaaaaactc gaacttcaaa 1920 ataaactacc cgcacactca tataccattc gcctcactct ccgctccaaa acgcccccta 1980 ccgaaaacga aatccgaact aacgcccctc ttccgcgcgt aaccccgaac cgcgaatacg 2040 aaccgcgact aaataacgtc tctccgaact aaaaataata aaaacgaaaa tatcaaaaaa 2100 acaacaacaa caaaacaaaa aaaaacgaat cgacgcgaaa aaaaacgtcc tactaacgac 2160 cgacgctcca acgtacgaaa acgcgccgcc taaactataa aaaaatacaa actaaaaata 2220 tcgcgacgaa aaaaccaaaa acgtttctct aaaaatttac aaaaaaaaaa ataaaaaacg 2280 ataatattaa aaccgctctt accgacctaa aaacaacaac aacatctccc acaaaaacgt 2340 acaaccccaa aactactcgc cgaaacaact caaccatccc gacaaacgct ctccttcctt 2400 ctctcttctc ccctctctcc tcccaaaccc cccgcaactc cgacccaacc caaacgttcg 2460 caaatttaaa tccctctcct catcacccgc tcctctccaa cccgtaacct attaatatat 2520 ccacctaaaa aatacgatca aatatattta aaaaatcaaa ttaatcgaaa caaataatct 2580 aaaaaaaaaa aaaaaactcc tctacatacg ccgcgaataa attaccgaaa acatcgaccg 2640 aacaacgacg tccgaaaaaa aaaaaacgaa ctccatttat taacccaaac aataacccta 2700 cgttccttac tcgaatcttt accgaataac cgataaccta aaacgacgaa aaaaaatcta 2760 actcgacaaa aatctctaac tctacgcgtt tctttcattc tctccaacga aaaaaacaaa 2820 cgacataacg aaacccgcct tccgtctact acattcttca aacaattaaa cacactcttt 2880 aacctaataa aattttaatc gccaataacg aaaccaaaaa ctttcgaaaa caaaaataaa 2940 aaaaaacatc tttcttccat aaccgaaatc actattacaa tctcaatatt ttaaataccc 3000 cataaaaaaa aactttcttt ttaatatata attattcaat aattcctatt tttattttta 3060 tttatcttct ctccgctctc cttctctatt cctctctatt atccctcctc cttcttctcc 3120 ccccgctttc aaaaacctcc gaatcctccc tttttctatt taaattctcc ttttataccc 3180 ctctttctat atcccctaaa tttaaaaaaa catttaataa catttaacaa acaattaata 3240 tccattccca atcacttaaa aaaaacattc atatacttta aaaacgaaac tatctatcct 3300 ttacaaacac caacaaaaaa acaaattata cccgaataat ccttttaaat actttaacct 3360 ccaacctcct cccacttcct tactttttaa cttctccttt aaaaaatata atcgtacaac 3420 acctcaatac ctcaacgaaa tctttttttt tttcctatat aaaatccatc cctttatctt 3480 acatctccgc ctccgtccga aactatccct ctcccctccc acctccaaaa atttctaaat 3540 ctcaatatct ctcactccta acaattaaac aacaaatccc aacattctaa tcgataacat 3600 ctcgctcctc accgacgaaa actccattaa aacaaatcaa ttaaaccaaa cgttaaaaac 3660 atcaaaaaat cgacttctaa acaaaacaac taaattcttt aaaaaaacaa aatacccatt 3720 aaataaaact accaactaat attacaaaac aaaaaattaa aaatttcttt cgctacaaac 3780 tttcaacaaa aaaaacaaca taaatataaa tcaaaattta acaactctac aacaaaaaat 3840 aaaaacatat cattttccat aacaaaacta atataataac taatcaaact tataaaaata 3900 aatcatactt aaaactaaaa acaaaatcct taaaaatatt tatacaataa ttataataat 3960 aaaacaaaac ctactaaaat ttcaaaattt aactatataa ataaaatttt aaaaaacctc 4020 ttaacaaaaa aaaactattt ttaaattttc tactaaataa atttttaaca tactttctaa 4080 taatatatac tcttcctaaa acgttttacc aaaaataaat taaaactcca aaaaaattaa 4140 ttactaatta taactaatta acaaatacga ttacttccac aaaaatcctt taaattatt 4199 <210> 147 <211> 5716 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 147 tatatatata tccacgacgc gaaccgaaac actcaccatc tcgccgaaaa aacgaaacca 60 cttcgaaatc gaattaaaaa tattaaaact tcgcttactt cctccgcgac atactaactc 120 aaacatcaac taaaacaaaa taaaaaatta ctaaaaaaaa atcttctcaa aattacgaaa 180 atcgaacgac gacgacgacg acgactcccc ccgcccgccg acccgcccgc cccctccccg 240 actccccgac cccgaacgca acgcgcatat atcctactat aattataatt atcaataata 300 cattacgatt aatcataaaa aaactcttta aaaaacgatt aacaccgaac caacgctatt 360 caaacccgct cgccttaatc aattaattcg taatttacta caaaccccta tctctccgcg 420 cgctaaccca ataaaccgac cgcgaaacta actctacgcg ccgcgccgcc cgacactaaa 480 ttaaccctct ttacgaccgc ccgaaactcc gcgacccgac cgccgaaaac cgacctcctc 540 tccactacga acccgacgcc ccgacaaacg ccccccgctc tctccctctc ccctccctct 600 tccctccctc cttcgccccc ccccacaatc ccgaactaaa ccgacccaaa ttaacatacc 660 ctccccgaaa ttaaaccgcc ccgaataaaa aataaaaccg aacgacgaaa actaaaaacc 720 cgaactaccg acgcgctacg aacttcccaa ctcgaaaacg aaacgcgccg acccgcgaaa 780 aaaaaaaatc ccgcgacgaa atcaaaaaaa aaaacgtccc gtttcgtaaa tatttcttcg 840 tttctttaaa aactaccaaa aaacaaccca cccccacccc cattaaaaaa aaaaataaac 900 gaataaaaaa aaaccaaccc cacgccgatc cgcctcccgc ccacgactcg acctccctcc 960 cgcctaactc gacgctcctc cgccccgaat tctccatccc ctaaatcccg aactcgcgaa 1020 aacgcgaaaa aaaaaatcca aaaaaaattt aaaaacctaa taaatttata actaaaaaaa 1080 aaaacaattc tcccgccacc ccatcccctc cccgccaaaa acactaatcc tccaacttct 1140 tacttactcc ctcgctccct ttctctacct cgaacattcc caaaacaatt aaaactaaaa 1200 ttttcgaaaa aaacaacccc gaacccgtaa aataaaaaaa cgacccgact ccgcccaaaa 1260 cccctcccga acctcccccc cgactacccc gattaactac aaaacgcgtc actccgcgaa 1320 aaaacgacga caacgataac gccgcaaaac cccgaacgaa cgaaaaacga aaaccgacct 1380 aaactccgaa ttcaactccg accgaaaaaa aaaaaaaaac tacgactcac actaaacgca 1440 acaacgaaca ccgacctaaa aaaacacaac ccgaacgaac ccgacactaa actaaaccaa 1500 tccctaaaac ccctaaacac cccgccctaa aaaaaaaacc gcgccccaac cttccgaaac 1560 gaaataacga cgcaaaaccg aaaaacgaaa taaaaaaaaa acgataaaaa aatattctat 1620 ccgaaactac ctaacgacgc cgaaactcgc ctccactttt taaacactta ccgaacgcga 1680 cgcccgaact tttcgctcta tcaccatctc cctcaaacta aaatacaacc tccctaccct 1740 cgccccaaaa cccaaaacca aaaacccgat ccctctaccg aactcaaacg cccgcgaacc 1800 taaaactcga tacgcgactc aacctaactc tttcccctcg cgcctcgaaa tctcctcgct 1860 ccaaaattct cgaaatctta cgcccgaaaa actaaactaa actaaacttc gactaaataa 1920 taaaaaaaaa aaaaaataca aatacacaat ccctacccta tctcacgatc aaaaaaaaaa 1980 aaaactcata aaaacgcccc aattcgcgaa cgcccttaaa tctaaccgat accacgatcg 2040 attcgcgcga aataaacacc gatctcccga accgacttcg tatactccga acctatacta 2100 cgctccgata aaaaaccctt ccctttctct taacttctta aatcttttct tttaaaatat 2160 aaatatatat atataccgat aaatatttct atttttcatc tactaacttt attttttttt 2220 attaatataa cttctccctt ctctctccct actcgtccgt tttccacctt ttctcttact 2280 tatcttctac cctcgctcac tccctaacac acacattcac accctctccg cctcgctctc 2340 ccgttctcgc caaatcctaa taaatacaat aaattttaat aaaaaaacaa acgaaactat 2400 caataaaact aatattaaaa aataaaaata ataatatttc cataaataat acttcaaata 2460 ccattatttc tcactaaata tttaaaaaaa tccctcgaca aaaataaatc tacgcactcc 2520 taaaatataa acgactcgca tctcccaaac cccgaaaaac gtatacgaaa acacgtataa 2580 atcccgcacc cgcctccatc tcacaaacaa aaatcctcgc acacccacca atccacacta 2640 tcccaaatac acgaacgcgt ttatatacac ttacacactc ctttcccgaa atatacccgt 2700 atttaaaacc gcccgcatcc ttctctaaca atcttaactt cttaaaaatc cgaacctccc 2760 gaacaccgca tacaaccaaa aacctaacga aactaacgat cccgcaaaac ttttctccta 2820 atacgcgccg cgtacgcaac aaaaaactcc cgaaaataac ttcacacgta tttattactt 2880 aatctacgta taatttaaaa ttaaatataa aaaaaaaaaa aattcccccc ccccaaaaaa 2940 acaccacaac aaacaaccaa acgaaataaa catacgaaaa acaactacgc gatacttaat 3000 taaaaataaa cgaacaaaaa cgaataaatt aaaaaatcca aactttaata acttttttcg 3060 tttttttacg tcctcgacga cgtaaaaacg aacgtttcga tctacgctta acgtcccccg 3120 ctaatttctt atttattttc tttccctcga taaccccgaa aaaaaaaata aaaaataaaa 3180 aaaaaaaaaa taaaaaaaaa aaaataatcg aaataacgaa aaaaaaaaaa ttaatcttta 3240 ttattaataa caatacatca attacgaacc attatctcga tcccaaattc cgtaattcgc 3300 taatacgaac gctacaatat caaaacgcta acgaaactcc gcgtaccgcg atacaaaaaa 3360 atacatcaat aaaaacaaaa acaaaataaa aattattctt tatttttata cgaatcgaaa 3420 ataaacgacg aacgaaaata aaataccact cctaaaatcc ctccacgcgc cctactcacc 3480 ccaaaaacct acgcgctcta cgtacgataa caccctccta actctaaata aaaataaaat 3540 aaaaaaaaaa ctactaaaaa atccgaataa cgaaatttaa acttacaaat tccgccaaaa 3600 aacctaatac ttaaaaacta atccgcaata acgaataaaa ataacccgaa ataaaacgac 3660 aactacgccg aaatcgcgac ctcactaacg aaaaaaaacc gcacccgaaa aaaacgctta 3720 acgaatttta caaactccca tcttaaaaaa ttaatactcg ttcctactaa tacgtcccct 3780 taattttccc aaatcctaaa atatccttaa taaattaacg aaaccgaaaa tctatacccc 3840 aaaaccgcaa accacaacta aaatcccaac cataaaattt ccaaacttct ttactcaacc 3900 tctaatccta cgaaaaacaa cgtaaaaaac gtcaaaactc gcgcattcta aaacctaatt 3960 cttctaccct caaaaatatc ttattctaac ccgatctaac ctcgaatcta aaataaaacc 4020 taaaataaaa ccttacctaa accccaaacc ctcttttccg ttccgttaac gatacttaac 4080 caccctaccc caaaaataaa aaacgtctcc aaatactctc cctacacccc tatttcctca 4140 atccccaact caaaaccccg ctaacccccg accgaaacta aaaaaacaat aataaaaatt 4200 tcgttttctt aaacaaaaca aaaaacgacg aaaaaacgac aacgacgccc cgaaaacgaa 4260 aaacgaaaca catcgataat atcaacatta ttaataaaaa aaaattcgaa acaaaaaccc 4320 gaaaatcaaa ttcccaatcc ctcccctacc cgaaaataaa taaaacaaaa cgaataacca 4380 actatatata tatatacata tatatatatt aataaaaaaa tattcctaaa tacacccgca 4440 ttaaccacct aaaatttatt tatattttcc ttatctaaaa atttacgaaa acaaaaaaaa 4500 aaaaaaaaat taaaataact tataccctct aacccttaaa actcttaact aaaattaaaa 4560 ttaaaattaa aattaaaatt aaaaaaaaaa tacgaaaaaa acaaaaaaaa aataacaaaa 4620 aaaaaaatca aatttaaaaa actctccgta aattcgatta tttttccaaa ccccgaaacc 4680 ttacttcccc gaaaatttca aaaactcctt tcctactaaa ctactatcac tcaatcctaa 4740 cctctcttaa aacactaaaa cgacttcgaa cccgaaatat aaaacaaact taaataaata 4800 cctcgcccct aaccaaatct acactatacg ccctcgacgc actcgctctc caacaattca 4860 ataccaacaa caaaacgcaa atttttaaaa aaactcccgc cgcccgccac caaaaactat 4920 ctccaaacga acgccgaata caacgccgta accgaacgcc ctaacgccga ctcgaacgcg 4980 aaattcaacg ataacaaacg aaaaataaac ttaataacca cccgcgcgcg cccgaaccaa 5040 aaatcgcgta ctatctaccc gcgacaaaat tcgtctttct ccgcttaaaa aactattcct 5100 acaccgatat taaaaaaccg acttcgctaa cgactacaaa tacttacgat tttaactttc 5160 cgtccacaat taaacgtctt acacttaaat tcactacgcc ccgcatacaa caatacctcg 5220 ccaaaaaacc tctaaatata aaattcctcc caaaaaaaat atcccgacgt aaaaaaaata 5280 aaaaaaacta atcgaattta taaaaaaaaa atctttcctc cttttaatta aatcccttta 5340 cgattttcta aacgcgaaaa aaaaattatc accatataat aaaatataac taattcttaa 5400 aacctaataa taaaatattc aaaaaaccca acaaaacgca caaattccca tctaccgctc 5460 caataaaacc ttaattaaaa tccaacgaat aataattaat tcctatatct tctattaaaa 5520 ataaatataa aatctataaa atcctattct cgaaacgtat acatttaaaa aaaactaata 5580 atctaccaaa aaactcactt tcattcataa ataaaatccc ctcaaacgac ctccttataa 5640 cattcctaaa taaactaact taacacatct cttacaacaa aattttattt aaaaaaaatt 5700 tacgctacca cttttt 5716 <210> 148 <211> 5474 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 148 ttttcaaaaa caaaaccccc attctccctt catccacttc ttacaatcta attaactccc 60 tcctccttct tctttaaaca acgaaaaaac tctccaatta tccaacttcc acccctccaa 120 ctacaacatc gtcatccttt aactcaacga acgctaaacg aacgctccct ccccgcccct 180 cctacccctc ctccctactc caaaccctcg acttctcatc cgctaaacga tatcctactt 240 cgctcgtcct tactctcgcc gctactaccg aaaccgaaac aaaaaaaaca acgaatcccg 300 taaccgtccc gaaaaccccg cgctcccgac caaaaaacga aaacgacccc gaaaaaaacg 360 aaacaaaaac gaaaaaaaaa aaaaaaattt tatactacgc cgaaaaaacc gacgccctct 420 tccgaatatc ctacgacccc aacctctcct cacgctcgcg caatctccgc cgcaatctca 480 actacaacta caaaactaaa ccgtacaccc gaaaaaaacc cccgaaaaaa acgacaaact 540 tcgcaatacc gcgacccaac cccaacccta aataaataaa tacctccgca accccgccgc 600 ccgccgtaaa atcgaaaaca aaaaaaaaaa aatacctacc taatctacgc cccccgccta 660 tcaaccctta cctcgaaact ctaaaacacc caactcgtcg actcctaaca ccgcaacgaa 720 ataaactact aaacaacccc gaacgcctac aactactact accatctcta atctacatac 780 ttccaactct accaataaca acccccctac tactcgcaat ctaatcaaca acccctcgaa 840 tcctcgcatc ttccctacta cgcgctccta tcccaacgcg accgccgaaa tttccgacct 900 tatcccaaac aaaacgataa cgttccgaat caatccttac ctccgtaccc ccacgcacaa 960 acaactccaa aaacaacgac caacaaccct tctaaaaaca ccttactata atccgacaaa 1020 acaaccgatc aaaaccgctc taaaaaataa tcgaaatacc catttcgact aaaatcccaa 1080 ctcgactcct tactctataa ccttaaaata attaattaac ttctctaaac ctcgaattcc 1140 tcatcgatat aataaacaaa acataaacaa tctttttctc acaattaaaa ttatccacaa 1200 aaaacattta aaaaaactaa ctcaaataaa catcaataac tattaactaa aattcgatta 1260 ccactattac attccttcct aacactacca aaaacctaaa aattccctct cccaaatatt 1320 tccatatcct atcaaatatt cccccaccta ttaaaataac tctacctaca taattctaat 1380 aaaaccaaaa aattaacgtc aaatccaaaa aacaccatta ttatctacat tacttaaatt 1440 acaaataata acaataaaat caaaaaacaa tattaccctt aaacccaccc acaatattac 1500 caatacctat attactataa ctaactttac tatttataac aacatcatcc acatttcaaa 1560 ttctatacga aaaaaatcta caactactcg actaatatca ttactaataa tattattaat 1620 tttacttcca ataaaaaaaa ctatttatat aataattaca attacttcta caaaccctaa 1680 aaccctactt atattatata aactcatatt actcctcata aaaccgttaa aaaaataaca 1740 aaaaacttcc ctcctactat aaccaaaact ctaacttctt atacctccct actaacccta 1800 ctaaatacta aaactcaatt cctataaaac aaaccttaac taccgactaa taaacattca 1860 acataaaaat aataaatatt attaaatata tatacacacg tacataccta cacacacaca 1920 cacacacaca cacacaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaacc taatcttaac 1980 tctctaaatt aaatctataa aaactataaa aaaaataaac atcccgaatc aaacaaaaat 2040 aatataacaa aaaaaaaatt tcctaaacaa ctcaaaaaat tcaaaacaaa aacaaaaata 2100 caaacgctaa aactaaaaca aaaaaaaaaa tattataacg tcaaaaaaac gaaccgcata 2160 actactaaac tctcaaaatt aaaattaaaa aaatataacc tactctaaaa aaaaaaaaaa 2220 aaaaataaaa ataaataata tataaaataa aaaaaaccac aaaaccctaa acccctaaat 2280 tctaaaacta ataccgaata taaaaaaatc taaatttcct caaaactcct aactacaatt 2340 aaaaaactaa aacccgaaac taaaaaaaca aaactctctc aaaactacac gaaactaccc 2400 tcttaacctc actaatcaat aactcccatt tttaaaatca aaaataaatt accctccata 2460 ttccaaaaca attaaatcct cattaacctt aaaccctctt ccctcactct cccactatca 2520 aacaaaaata aaaaaataat ccaaaatatt aaccccaaaa taactccaac tatataaatc 2580 tctaaactac ccgtcaaaaa aataaaaacc aaatctataa acaactccaa ctccaaccca 2640 aaaaaaaaaa aaaaaaaaca ccaaaaaaaa accaaaccca aaccctaaca caactcaaat 2700 acataacaaa caatcttccc aacacccgat aaacactaac tactcctacc caataatccc 2760 cactccaacc ccaaaacaat cctcccaaac accccaatac ctaaaactaa tctccgcacc 2820 tctaatctaa ccccatcaaa aacctcctcc ctctaaaaaa tcaaaaaaaa accctaaaca 2880 tctaattata ccactcctct cccaactcta accctaaaaa ataatatcca aacacaataa 2940 aaaaaataaa aattataata acaaaaaaat aaaaaaatct aaaaaaaata aaaaatttcc 3000 catcatctca aacttaaaaa aatacaaaaa caaatataaa aacaaatact aaaaaaacaa 3060 aaaaaataaa aaataaacaa taaacctaaa ataaaaatac acaaccaata aaataaacct 3120 aatctctaaa aaatcctacc tataatctaa ccttcaattc tcttactaca tcattaacct 3180 attccataac atacctaaat ctccatactc ttctaaattt aacccaaccc ttaaaaataa 3240 tataactcta aatcttctct cctaaaaaca cattaccctc gtacctaact taactttact 3300 aaaaatccaa aatcaaccct atccttctct aaacctcaat ctccatttct caatatcaca 3360 acacatcctt tttataaaaa tataaatact tcgaaatctt taaaaaaata ttctaaattc 3420 taaaacttct aataaccaaa aataaaaaaa aataacccct cccatttatt ctcccccccc 3480 ttaatccacc ctccaaccca aaactttcac aaaaaataaa ataaaaaaaa aaaaaaacta 3540 aataaaaacc aaactaacaa aaacaaaaac tttatcccaa ctaatttcta aaccaaaaat 3600 tccgataaaa aaacccgtac caaacaaaaa aaaaaaacta aaaaaaaaaa aaaaaaaaac 3660 aaccaaaaaa aaaaaataaa aaatattaaa aaataaaaaa aaaaatttcc ttacaaataa 3720 taataaaaaa aaaataaaaa aaaaaataaa ctcaaaaaaa actatactta cttacgttcg 3780 atctaaaaaa ccctcctaaa aaaaaccaaa taaatataat atccctaaaa acaaaaacaa 3840 tctaaaaaac aaaaaaaact aaaaaaatac tataaaaaaa aactctaaat tcgaaaaaaa 3900 aatctaacac taaaaaaaac aaataaaatt ctaaatataa aaacacccac cattcatact 3960 ataaactaaa ctcctactat ctacctaata ctatacattt atacaaaaat tttaaaatac 4020 taaacactct caaaacacat aatcctatct caactcataa aataataata ataatacttt 4080 tttataaata aaaaaataaa aactcaaaaa aaataaaaaa cttaacttaa atcacacaat 4140 aaattaacta aaactcgaat tttaattcta aaaaaaaatc acttactaaa aaaataaaaa 4200 tcaaaaacaa aaaatccata ataatataaa aataaaaaac ttctaaaacc aaaatatata 4260 taaacccaca taaatataat aaaaaacaaa aaaaaaatcc atcctaaaat ctaaccccat 4320 ctttccttct catatccctc tatcaaccta caacataacc caactattcc tacccctact 4380 aacaacccta atcctaaccc aaactcctac aactttaaca aatattctaa aaaaaaacaa 4440 ctcaaataaa caaccccact taaaatcacc gtctctatct tattcaaccc taaccaacta 4500 cttccaaact taaaaacccc aaaaaaaaaa aaaattaaaa aactataaaa aaacgtccaa 4560 actaaaacac ttaaaaataa aaactaaact ataaacatct aataaattaa aaaaatcata 4620 aaacaaaact aaaaaaaaac actaaataca aaactttaaa cccctaaaat aaaaaataaa 4680 aaatcctaaa actaaaaaat aaaaaaaaaa taaaactaaa aaaaacccta aaaaaaaccc 4740 taaaaaaaac aaactaaaaa actaaactaa aaaactcaaa aaacgaaatt aaaaaaccct 4800 aaaatataat ctaaaaattt taaaaaaaaa ataaaaaact ctaaaaacaa aacaaaaaat 4860 cctaaaaact aaattaacta aaaaacttta aaaaataaat ctaaaaaccg tcgaaataat 4920 cctaaaaaac ctaaaaataa aactacaaaa ccctaacccc taacccctaa cccctaatcc 4980 taaaaaaacc gaaaaatcct aaaaccgaaa aaaaaaatcc taaaacgaaa cttaaaaacc 5040 accgaataaa actctaaaaa tcgacaacgt taaattccaa ccgactccac ccgttcacaa 5100 aaaaccgcgc ttttcgcgta cgcatcgcga acgacgcgcc actacaaaac gtactcgacg 5160 acgccctcac catcccttac cacgtccact acctacgacc accgccgaac cgccgaacta 5220 tactaaactc tccgcgaatc aaataaactt tcctatcccg aaaccgaaaa acaaaaatac 5280 taataacgcg aaaaatacgc gtcaaaataa acgaaaccta ccgattccgc gtaacactac 5340 ctacgtaccc aacgtcgctc accgacgtct ccctaacgct aaacgaacta cgccccaacg 5400 actcaaatat ctatcgctat aaaatccaac acgacatcga taacaacaac gacgctataa 5460 aaatcaaaat caaa 5474 <210> 149 <211> 5414 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 149 tacacaataa aacgcgatat ctcccgaacc taaataaaat ttcaatctaa taattccttc 60 ctaacccaat cataatttat ttaaaaatat tattctactt ctttcaaaac gctattcgca 120 ctataattaa ataatactca aacttttaac tttaatttat ttcatttctt aaaacttaaa 180 acaaaactat acaatatcat ttttttttta tttccttaaa aattactcta actattatta 240 aaataaaaat taaacaccta aacacttact taaaccgtcc gacacaaacc acattcattc 300 acgtaaacac tcccctttcc ctaccccata tccaaatttc gctaaactca cacccgacaa 360 cactactact aaaaattccc ttcgactact atttattatt ttcctccaca caaaaaaaaa 420 aaaaaaaaaa cccgaaaaaa tccaaaaaaa acaaaaaaaa attaaaaacc ataaacaaaa 480 cccgtcgcgc gctcgttact accgccttcc ccaacactct aacgactcct aaaaacaacg 540 atcccatctt aaaaccgcta ttccgcccga ctaaaatcaa aaataaacaa acgatcccct 600 actctccacc gccgcttccg aaaactaacc acccgaaaat tccccttttc cactctcctt 660 cccactctat ttttatccca acgcgcgcca acgcctctca aacctaccgc ctactctcgc 720 acctactcgc cttccccaaa cgcccaatac ctacacctac tcccgatcaa cccccgtccg 780 aattaaacca cccgcgaatt cctacgtcga aatcccgaaa ccttctcacc ctcgcctaca 840 ccctactcct tccgctctct aaaaaaataa caacaacccc caacaccgcg aaaaatataa 900 aaaaaataaa atccaaaaaa aaaaaaaata atatatatat atatatatat atatatatat 960 atatataaca aaaaaaaaaa aataaataaa aaaaaattat ctccttttac aactaaaacc 1020 aaaaatatat atccatctct aaaaaaaata atctacacta aaactaaaac aaaaataaaa 1080 ataaaatatc aactaaaaat aaactccgca ccgaaaaact ataaaaataa aaataaataa 1140 aatttatacc aacccccgaa aatatatata tatatatcta tattataaaa tatattcaac 1200 aacatatacg ctatataatt tctaaccttc cctctcccta tcaattaccc cttcttcctt 1260 taattataac taataaaaaa taataaatcc aaaaacaaaa tttaccaata aatccttcca 1320 aaactcaact cgaactatac taaatacaaa aaaaaaaaaa aaaaaaaaaa aaaaacaaaa 1380 aaaacgtata tatataccta tatatatata tatatatatt ataaaaaaaa taaaaacaac 1440 gaaaaaaaaa aaaaatcgca tacgcacaaa cgacccgaac ctactccgcg actatccaat 1500 ccgctaaaaa ctacgaaaaa tcgaataaaa aaaaacccta caacccctcc gaccccatat 1560 ctctttaaca ccaaacaccc gccgaaccgt aaaaaactcg taaccgaacg ccgacctccg 1620 ctcgtattaa actaaaaatt caaaaccgcg cgcaaaaccc gaattaaccg caacgtctat 1680 attctcaacg ataaccgaaa acctaaaatc aaaatcacct aaactaacga aataaaaacg 1740 aaccgaataa aattaaaaac ctaaaactta ataataaaca aaaaacgtaa aaaataacaa 1800 ccaaataaaa aacactctta cctacccaac gctaacttaa accgcaactt tatttaaaaa 1860 tttctttttc cgataaaaca aaaacccgac aaaaaaaacg aaaaaaacta aaaactaatc 1920 cttaaataaa cactacccga cgactaaaac gcgaacctaa ccatttaaat aaaattaaat 1980 aaaaacgcga ttataaataa caaccgcgaa acgctacgaa aaaacgacga caacaaaaca 2040 cgaacgaaaa caaaaaaaaa acgacgaaaa acgcgataaa aaaacgcgaa acgaatacta 2100 aaaaaacaaa aaaaactcaa acctaaaaaa aataaaaaaa aaaaaaaaac aacgcgaaaa 2160 accgaacaaa aaccgacgtt tcctaacaaa aaaaaacgaa aacgcgcgaa aaaaaaaaaa 2220 aaaaaaaaaa cgaaaaacgc gaaaataaac gcgaaaaaaa aaaaatataa ctcgccgacc 2280 gcgaaaaacg aaaacaattt cgaataccga aatctacaac taacgacaaa cgaaatcaaa 2340 catccgttca aactaacaac aaaaacgacg aaaaaacgcg taaccgaaat caaacgtaca 2400 aaatccgaaa acgacgacga ataaactcaa cttcgcacaa cccttcccaa ctccaacccc 2460 gactaacccg acacttctcg aaaaatcccg acaaccgaaa ccaataaata cctctacgaa 2520 ccaacgcccc gacgaacgaa aaaataataa taatatccct aaacaacaaa caaacgttta 2580 acataccgca cgacgacaac ctacacgtaa aacccaaata ctcgacacta cacaacacct 2640 cgccgaactc ctcgactccc atcgcgccct cgaccaactc ccccaacaac tcgaacaacg 2700 ctaataataa cgacgacgac gacgacgacg acgacgacga cgaaaaccga aacaacaact 2760 ccaacaacaa taacaacaac gacgacgaaa actcgaaaac tatacgaaaa acctatcttc 2820 caaccccacc gatacgtatt tctacataat caccgcttaa aaacacattt taacaacccc 2880 ctttatctac ttaatatttt tttcatatct acacaacaaa tcaccccaca cctccaacca 2940 attttcccct ctctctctct taaatattca acaaatctta cctttcatat taatttttat 3000 aacctaaaat attacctata cgcgtattat attatatttc gttatatcta caaactcact 3060 ttcctcctcc tcctacactc tcgacttctt tctataactt ccctcttttt ctcttcacct 3120 ctattttcaa aattattatt attattattt taacgatcta aaaatattat aaacgcgacg 3180 acgatatcga accctaaacc gaaacttccg aaaaaaaaac gtacaattcc ctactaaacg 3240 taatatatac cttctactta caattacaaa acaatatatt cgacgaacta aataaaaatc 3300 tactaacccg cgccgaaact ctaacaaccg taaacatcgt ctcccaaaac aaaaaccacc 3360 accaccatcc accccaccac aaccccttca aaccgaacgc cacctaccac actataaata 3420 ccatcccgta cacgtcgacc gcctcttctt catcgatacc catctcgcac ccttccgcgt 3480 taacgaacac gcaccaccac caccaccatc accaccacca ccaccaccaa ccgcaccaaa 3540 cgctaaaaaa cgaactacta aaacacctaa atcccgaact aaccctaaac gctataacga 3600 accccgacga cgctataata tccacgccga ctcacgcgcc gcacataacc accataaacc 3660 ccatacacca aacaacgctc aacataaccc acgcgcacga actaccgtcg cacataaact 3720 acataaacga cgtaaacgcc gacccgcgaa acctaaaaac attcgccgaa cgcttcaaac 3780 aacgacgcat caaactaaaa ataacccaaa caaatataaa ctccgcgcta accaacctca 3840 aaatccccga cgtaaactcg cttaaccaaa acaccatcta caaattcgaa tccctcacac 3900 tatcccacaa taatataatc gcgctcaaac ccatcctaca aacataactc gaaaaaaccg 3960 aaaaatccca ccgcgaaaaa ctcaccaaac ctaaactctt caataacgcg aaaaaaaaac 4020 gcaaacgcac gtccatcgct acgccaaaaa aacgctcgct cgaaacctac tttaccattc 4080 aacctcgacc ctcctctaaa aaaatcgccg ccatcgcgaa aaaactaaac ctaaaaaaaa 4140 acgtaatacg cgtctaattc tacaaccaaa aacaaaaaca aaaaaaaata aaatattccg 4200 ccgacattta aaaaactctt aacctctcca aaaacgcccc tttcctcgtc cgctcttttc 4260 tctcctctct tctacctctt ttcactttta acgactaaaa acaattccaa taaatataaa 4320 tctcgacaaa tcgaaaacta aaaaaaaaac gaacgaacga acaactaaac ccaaaccgat 4380 aaaaatataa aacaatttct caaaaaaaaa aataacaaaa aataatattt atctattata 4440 acaaaattat ccctttaaac cccacctcga cttcttcaaa aaaaatataa aaataactat 4500 ttacaaaaaa acaaacgaaa caatatttaa aaaatccaca aaaataatca aataaaattt 4560 atttttattc ttacaaacat cacccgtatt caaatttaaa aatacacttt acaactattt 4620 ttcaaaaata aaaattaatt caaaactaaa actttaaact aaaattaata cttaatataa 4680 taaaaacatc tctaaaatat tttaaatttt aaaaaaaaat aacaaatttt ctacatttac 4740 actatatatt atatatatat ttttattata attcttaccc ccttttcctt ctctaaaata 4800 ttaatactta aaaaaaaaat tacgcctact atattcacta atcttaaaaa ctattattaa 4860 attattacaa aacaaccctc tataaattat taatttatct ctctaacaac ttaattttat 4920 acacattcta attaattaaa cttcttccgt ctaaaaaaaa taaaaaaaat atataactaa 4980 taacgttcaa aaaattttat ttaataaatt taccgaattt ttacaacttt cctcctatac 5040 tatattcctt ttaacccatt tatatattct cacttaaata aaaattattt ttttctttat 5100 ttttactaat aatattctaa tttataaatc gacactcaat aataaatatc ttaatcgtat 5160 aaacctaatt cactatctaa aatattattt acttcgttac atatttaata aaaattccca 5220 cattatcccc ataacacata aacgctctca cttaccctta cacacacaca cacacacaca 5280 cacacctcta acaaaaaaaa aaaaacaatt aaaaacataa ccgatacacc attttctaat 5340 tttaaataca tttaccactt aatatttacc cttcaaattt taaatttcac caaaatattt 5400 caatcttcca attt 5414 <210> 150 <211> 3381 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 150 ttcatcattt ctaaaaaatt ctcttaaaat ccacaaaaaa tctcacctca tctcgatccc 60 ctcaacaccg ataatatctt aaaactcgac cccgattatt cgctaaaaaa aacttaactt 120 aaaaacgaaa aaatactcca aaattcctaa aaatccaccg cactccccat ccgaaactcc 180 tcgcgaacga aaccgcttct ccaaaccgcc cgcctcccta ccgcaaaaac aaacccgcgc 240 ccgccgcccg aaaacctccg ataaaaaaaa acactccaac gactcctccg acttaacaac 300 gaccgaaccg aaaataaata aaaataataa aaaataaaaa aaaaaaaaaa aataaaaaaa 360 aaaaaaatat ataaaaaaaa aatccgaaaa acgaatccct ataccgctaa cgtcccgaac 420 aatactaaaa aatataaact atattatcac gccgatatca atctaataaa aattaacatc 480 aaataaacta tcattcattt ccatatcaaa aacgctttta caaacgacga cgacgacgcg 540 acgacgacta ctactacgaa cgactacctc aaaacgcgta tattttattc caatccccaa 600 accaaaatat tattcattac gacaaaacaa aaaaaaaaaa aaaaaaaaaa aaaacaacaa 660 aaaaaaaaaa aaaaaaaaca acaaaaaaaa aaaaaacaaa aaacaacgaa aaacgacgaa 720 aacgtacaaa aaaaaactaa aaaaacgccg aaaaaacgcg aaacgaaaca acgcgaaaaa 780 cgacgaaacc gaacacgaaa actacgaaaa ccccgcgaac cgcccgctcc cctacccgac 840 caacgctcaa ccccgccgcc gccgccgccg ccgcctcgcc gcgcttaaac ccgtaaccga 900 ccgcgcatta tcctcgaata caaaaaaccg aactacgaac tcgaatcgcc gcgaacccaa 960 ccccgtaacg aacgaacgaa aaactatacg ccaaaaacgc caaaaaaccc gaaaataaaa 1020 acaaacacgc cgacccgaac ccgaatacaa aaaactcccg accgaacgct ccgcgaaaaa 1080 aaactaaaaa ccgcgaacaa actccaaatt ctctttctcc cgacttcgaa cgtccttaaa 1140 accgacgctt actccgcgcc accaacctaa aaatactttc caacgactaa aaacgaaaac 1200 gatcccaaac taaaaccaaa taaccgaaaa aatcgaaaaa ccgcgaccgc gacctaaaaa 1260 aacaaaacga ataaaaattt acaaacgaat caataaaaac aaaaaaacac cgacgaaacc 1320 cgaaaaacca aaatccgaaa aactacacgc acgaaccctc acccaaaaaa aaacgaaaat 1380 atataaaatc accgactttc cataattact aaaaatcttt aataaaacga acgtaaaaac 1440 ccgcgcgaaa cttaaaaatc gaaaaccctt ctaactcgaa aactaaaaaa taaattcgta 1500 aaaaaaaaaa ctaaaaacga tcgaaaacga aaaactaaaa aaaataacgc aaaatcccga 1560 atctaccgct caaaatttac atttctttcg aattaaaaaa cgaactttcc taactcccga 1620 tccccaaaaa aaaacgaacg aaataaaccg tcctttcccg aaactcttca cgaaaaaacc 1680 gaaaatttcc gcgcgataaa aaaactcgaa ttaaaaatta aaaaataaaa acttataaat 1740 cgacctaaat taaaactaaa ttttaaaacc aatctaaaat tcgatttata aaatccaaac 1800 tatttacgaa atcgaaatcg aaaaaccgat aaataattta cacgccgacc aaaacaaaaa 1860 actaaaaatc gaaattaaaa actaaaaaaa cgaataacgt ttttaaaatt caataacaaa 1920 atcacaactt tttcttataa taaaaactat taaaatttaa aaaaaataac acgaaaaatc 1980 ctacaactcc gcgtataaaa aaacgtttaa ataaacgata aaaataatta atctaaacca 2040 taacaaacga accccgaatt tttactactt ccccctaaaa atatttcttt aaaaaaaaaa 2100 aacttaaacc acacaaaacc cgatcctaaa aaaacgattc cgaaaaacga acaaatcgaa 2160 aaaaccttct aaacgaaacg acaaaacaac ctcgcgaaac taaaaataaa tctaaaatcc 2220 cgacccaaac gactcgaaat actccaaaaa ccacctaaat ctacgaacgc aacgcgacga 2280 aacgaaaacg ataacccgca aaaaccgcga cctacgataa aaaccgaaaa acaacgctaa 2340 caacgaaata ccacaataaa ccgaaaaatc taaactataa cccaaaataa aaccgactca 2400 aactccaata ccctaattaa aaccgcttcc tatacttacc cgcgccgaac taaaaaaccc 2460 acaaacccga cctttaatac gcccgaaaaa aaaaaaaact taaaataccc tactatcatc 2520 tctcctatcc gaaaacttca aaatattaac ttttcgaatt tcaaatactc tataaccgat 2580 aacaaccaaa aacttcgcat tttaaacaat ttaaacgatc ctccccgccc caaatctaaa 2640 aataataata ttcaaacata acacgatata ttacccaaaa cccctaccct taccctccta 2700 ctctctctac cgttctaacc ttcgaaaacc ccaaaacctt aataaaaacg aaaaaaaaaa 2760 atcccgtttc taatctcata atctcccact cgaactacat ccccataact taaacctaac 2820 tataaaatat aaaataaaaa aaaatcccga ccaaaaaaat aaattattct ctaaacatct 2880 aaaaaaaaaa tatatataaa aaataaaaac gaaaaaaaaa aaaacattaa aaaaaaaaaa 2940 atttaaaatt tcctcctctt aatattaaac ccaccatccc aaccccctac acccctaaca 3000 aaaaaaacca aacaaccctt acaaaacacg aaaaacgcac gacccacgac ccacgaataa 3060 cctcgacgac ccgaaacgcg acgactaccg ccgcgaaact ccaaaactat tattttataa 3120 acttaaaatt cgtaaaaact ctctcccgct aaaaacccga aaaaaaaaaa aaccgtaacc 3180 ccacgaaaac tccctaatca ccgcctcccc tttataaacg aaaaaaactt aaaaaccaaa 3240 aaaaaaaaaa actactcaaa ataaaaaaca aaaaattacc gaaaaaaaat aaacccgacc 3300 accgctcaca ataaaatacc tcgtacgaat tacactaaaa tatacccaac ttaaaactaa 3360 ctattttata atcctctcta a 3381 <210> 151 <211> 1266 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 151 ccttccatta aacctaatcg cgaaaaacca caaaaaacaa tcaaataatt ttcaaaaaaa 60 aaacctctaa tccactttcc ctccgccgcc aaatctacaa attcctaaaa aaaactcttc 120 tcaaatccta aaaattacta aactcttaac gaacgactca tctcttaaaa acctaaaata 180 ataaattaca aacattaaaa aacttttaat aactttaaaa aataactcta atataaactc 240 acctttccaa actaaaaaac caaacaaaaa aacccccttt attatcttct aaaaaaaaat 300 caataaaaaa aacgaaattt aaaatataaa ttaaaaaatc ctacgtcttt acctaccacc 360 tctacctaaa tcataaaaaa atcgaaaaat acaataaact tcaaaaatca tacaccgttt 420 ccctaaaacc tatccaaaaa cctaacttct aaacccaaaa acttctacaa aaacaaaccc 480 actaaaccaa acaatctaca ccaacacctc tacttctaaa attctatttc gtcttcttct 540 attaaaaaat taacctctta aataatttat atactttccg acaaataata aaaacgcgta 600 aaccgacgaa acgactaacc ttaccatact cgctacgcac cgcgccccta aacgttccga 660 aaaccctacc cgaactcccg cgaaaaaacc ccctcaaaat cgccctacgt ctaaacgccg 720 cgtactaaaa ataaacgcgc aacgactacg cacgaaaata acaatactta cccgtaccgc 780 taaacaacgc cttcgaaccc gccttcctcc gcaaacgcaa cgaacgcgaa cgacaacgaa 840 tacgctacgt aaacgaaaac tatacgcgcc tccgaaacca cctaccccga aaactaacaa 900 acaaacgcct caacaaaata aaaacgctcc gcgctaccat cgactacatc aaacacctac 960 aaaaactact aaaacgccaa acctaaaaac tcgaaaacgc gaccgacgcc gtcccccaac 1020 gcaaaacgaa atacaacaac gacgaaaaat ccaaaacctc ttcgacgcct tcgcccaaca 1080 acgaacccga aaaaaaaaac aactaacgaa cgcccgaact aaccaaaacc cccgcgcccg 1140 ccgcacaacg cgcaaccgaa cgctcaacct aaaatcctct tcgaaaataa tttacattct 1200 taatctaaca tcttctccaa acctaaatct taaaaaaaaa aaataaatac taaaatttaa 1260 aaaata 1266 <210> 152 <211> 2968 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 152 ttacaacccc gccctcccaa acttacaaaa ataaacgaaa aattatatta aaatttaaat 60 cgaaaactct caaaacatct caaaaatact ttctctattt tttttttcct ataaatatta 120 aaaaaattaa caaacgaatc ttcctaaaaa caaaaaaata tataatttaa tattttcttt 180 aaatttctat ataaataaat acacaatact ccgtattata taataaaacg aaatatatct 240 tcttattaat aaaatacact acgcaaatca actcgataaa ttaaaataaa aaaaaccgac 300 tacgaaaata aaaaaaatat aatattaaaa taccgacgct tataaaaaaa aacgcgaata 360 taaacgtata aaaacgaaaa acgtaccaaa aaaacgcgaa aaaacttact aataaaacaa 420 atatacgtct atttccataa cgccctaact cgcgacaacc cctaactaaa cgaaaaatat 480 aatataaaaa taaaataaaa aaaaacaaca aacgaaacct accacgtcac ttaaaaaata 540 tatattaaaa aaaaaaaaca aaacgaaaaa ccgaaccgct acaactacga cgacgacaac 600 gaaaccttaa accgtaaaaa aataaatccc cgcgctcgaa cgccgaaaca accccgaacc 660 ctctacgaaa cctacgacgc gactcctaaa aaaaaaataa cgactataac gaccgaaacc 720 gcgaccttaa ccgaacccaa ccccgcgata aacgcaaaac gaaaaccgaa ccccgccaaa 780 aatctttacc gaaccgaaaa aaaacgcatc taacgcttcg ataccaacga caaccgaaaa 840 tccgaaacga ctaaaaaaac gcaataaaaa ctaaaaaaaa ctaacccgac taaaaaacga 900 acctctacgt ccgaaaaccg aatctcaaac accgctaaaa acgaaaccac gcgtcttttc 960 gaacaaccaa tttcacacgc gcctatatac gattccgaac atcccaataa actctaacac 1020 ccgaacgcga ataacgaaaa acgcaaaacc aaatccccaa cgcccaaatc acctccccaa 1080 acccaacctt acaaaaacca aaactttaaa actcacgaac ccaacgacca aatcaaaccg 1140 cgaaccgaaa aaaacgcgaa ccccacccta aaaaaaacgc aaccgaaaac taaaaaacga 1200 ataccgcgct ccaaaaatta tatcgtaaac gccgtcctaa taacgaaaaa cgcacctccg 1260 aaaaaacata aaatcgaaaa aatcccttac gctaacgacg ccgaaaaaaa tccgtaaacc 1320 gaaaaaaaaa caacaaaata cgaaaaactt cccgaaaacc gacgaaaacg aaaactacta 1380 taataacgaa cgactaataa tcaatatctc cgaactacgc tttaaaacac aattacgcac 1440 cctatcgcta tttccgaaca cgctactcga aaaccctaac cgacgaatcc gcttcttcga 1500 ccccctaaaa aacgaatact tcttcgaccg caaccgaccc aacttcgacg ccatcctcta 1560 ctactaccaa tctaaaaacc gcctacgaaa accgatcaac gtacccctaa acattttcct 1620 aaaaaaaatc cgcttctacc aactaaaaaa cgaaacccta acgaccttcc gaaaaaacga 1680 aaactaccta cccgaaaata acgaaaacga aaaaccgcta ccctcccaac ccttccaacg 1740 ccaaatataa ctactcttta aatacccaaa aaactctaaa ccgaccaaaa acatcgccat 1800 cgtctccgta ttaatcattc tcatctccat aatcatcttt tacctaaaaa ccttacccca 1860 attccgtata aataatcgaa ataaaaacaa taataatata aatcgaatct ccccaatttc 1920 caaaaaaaat caaaaaaaaa aaaaaaataa aaacgattcc tacacatttc atcataacat 1980 cacccctaaa aaaataaaaa ccgaaaactc ctcctcactc aatactctta aaaactcctt 2040 ctttacaaac cccttctttc taataaaaac gctatacatt atctaattca cttttaaact 2100 cctaatacgc ttctccgcct accctaacaa accgaccttc ttccgaaaca tcataaacat 2160 cattaactta ataactatct tcccctactt catcacccta aacactaaac taatacaaca 2220 acaaaaacaa caaccaacca ataaaaaaaa cgaccaaaat aaacaacaaa ccatatccct 2280 aaccatcctc cgaatcatcc gcctaatccg aatattccgc atcttcaaac tctcccgcca 2340 ctccaaaaaa ctacaaatcc taaacaaaac cttacaaacc tccataaaaa aactaaaact 2400 actcatcttc ttcctcttca tcgaaatcat cctcttctcc aataccgtct acttcgcaaa 2460 aactaacgat aacgattcgc tttttcccaa catcccgaat accttctaat aaacaataat 2520 tacaataacc acgataaatt acgaaaacat ataccccata actataaaaa aaaaaatcgt 2580 aaactcgcta tataccatcg ctaaaatcct caccattacc ctacctatac ccgtcatcgt 2640 ctccaacttc aactacttct accaccgaaa aacgaaacaa aaaaaacaaa accaatatac 2700 ccacgtcact tataaacaac ctacgccgaa cctaaaaaca actaacaacg aacttaacaa 2760 acctaacttc cccgaaacta accgaaaacg aaaacccaac taccttccta caccacatcg 2820 aacctataca aaaaaaaaaa tactcacgaa aatctaaccc atacaaacaa aacctacaaa 2880 aaaaaaacac taaactaaca atctcttaaa cttccttctc atttccacta ctcactctaa 2940 cttcaattaa cttcttaact ctctcccc 2968 <210> 153 <211> 4899 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 153 aaaacaaccc taaaaaacac taatctaaaa aactaaaccc ttaataaaaa cctctaaaaa 60 aacgcctatc ttccgaaacc aaacaaaaaa acgtacaacg aaataaaata aaaaatactc 120 ccaactacaa acacctctac tcctaactat ctacaaaaaa acacacacac acacacaccc 180 taaatatcaa aaaaatcctc ccttccctat acctcctcct tcccaaaccc ctaaaatcca 240 aaaataccta tttccaaacg ccaaccctac taaataaata taaaaataaa aatcactaaa 300 aacccaaaac taatttatta tttttatttc ctattaaaaa tactataaaa actttacaaa 360 actaatttta aaaaatctta aatttaactt catctaactc ctctactaaa acgaaacgta 420 caaccaaacc tacttaaacc tccccaaacc acgaacccgc gacaacccaa ctcaacacct 480 acaaacgaaa aaaccgcgcg cttaactcga aaaccccgcc ctaaacaaaa aacaaaaaat 540 ataaaatcaa ataaaaaatt ataaataact atcctcccct cccctctacc gtatttccta 600 aatccgtacg ctatacaaaa aaaaaacgaa aacgaaaacg cgaaaaaaaa aaaaaaaccg 660 tttaccatta atctaaaaac aaacgactaa cctcgataac taatattttc gcttttcttt 720 tctcactttt ctcaatataa aaaaaacaat caaacccgcg cgaaacgatt ataaaaaact 780 ctactaaaat ttaacaacgc gaaaacttaa aaaaaaaccc catactaact cccattcaac 840 cgacccgttt tcctcgaact ttaaaaattt cactcaaccg tacactcaat aacttcacaa 900 aactaattac aaacttcaac gcattcctaa aaaaaccaaa aacgacgcaa atacaaacga 960 accgaaaaaa ccccttatcc cgataacaaa ataaaacaaa ctaaaaaaaa cttaaaccac 1020 acaaatccaa aactcaccaa accgcaaaaa acctacctta aaaaccgaaa atcattatcc 1080 gccctattca acgaaacccg aaaaccctaa aaaccgaacg aaaccaaccc gaacgaaaac 1140 accgccgcca acgcgcgccg acgacaaaaa aaaaccccgc taaacgctac gaccaaaccg 1200 aaactcaaaa cgctaaacta tacgtttaca caaatctata ttccgacgaa ccgatatcaa 1260 ccctaataaa aacacgaaaa aaaaaacacg ccaataaacc acgcgacgcg taaacaatac 1320 gcaacttcta tcgacgtcca aactatacga ccacgtttca accgataccc ccaaaccata 1380 aacacccaac tccaaaatcg ctctacgccc tttctcccca acccaccttt cccattaatc 1440 ccctctccta tccgaataac aacgcgaccc cgcaaaaaac gaccccgaaa aaaacaataa 1500 ccgcacgcgt aaaataaaaa cgacgaaaca caaaacgata atctaaaaat attcgcataa 1560 ccgaaaacgc tttcgctacg aatttaaaat cgaaaaacaa ttccctcccg aaatcattaa 1620 cttcgtctcc tcgtactcaa aaaccaacaa cttaatacta cgaacgccaa aaaaaaaaaa 1680 ataacgcctc gcgaaacgcg cgaaaaaaaa aaaactacga caacgaaacg cgaaaacgaa 1740 aaaaacgcaa caacgaaaaa ccgaaacgca acgaaaaaaa acgctaaaaa acgaaaaacg 1800 ctcgaacaac caccctatcc ccgtctaaaa ccccgcgcta cgtctaaaaa aacgcaacac 1860 gcaatccccg cgaaaaccaa aactcgaaac cccctaatac ataccccctc tcctcgcgcc 1920 ctaccgaaac ctcgacccta cctaccgtac cctaaaccta attatacccg aaaatccccg 1980 cgaacaaaac gcgaaacaaa caaaacgcgc gcgccgacgc tcttttatct aataactaat 2040 ttaaattaat acgatcttta tataaaacta acaacgaata attatctatt ttctcgccaa 2100 caatctccat cacaatcact tatctaaaaa cctacgatta aattaatcgt tatattcccg 2160 aaataaacgt cgctacaatc cgcaacgaac gcgaataaaa acctaaaaac gcctcccgaa 2220 cgctaacgaa accgatataa accaactccg ctaccgccta aaacgcgata tacccaaata 2280 ttaatacccg cgaaaaaaaa ctataaaacg ccttccccaa aatttactta acttactttt 2340 cgctcgaata aataatacgc gaatacgaaa aacgaaaaaa aaaaaaaaaa taaaaaaaaa 2400 aaaacctata aaactacgaa cccgaaacaa cctaaataaa acgcgacctc gaaaaaccct 2460 aaatacatcg cgacgaaacc taaaaaaacc caaacgccga aaaaaccgtc gataccgaaa 2520 tacaacgtat ttcacttaaa aaaaacgtta ccctcgatcc cttacctccc tcctattatc 2580 tcgatttttc taacttcgtc cttcgtccca cccacccgtt cccacctcaa atccctcccc 2640 caaaatcccc tccttaaaaa tccaaatctc taaaaattat taacaacaat tacacgcccc 2700 acgattaaaa tccacaaaaa aaaaatccca attctacaaa ccgctccaaa actaaaaata 2760 aaaataataa caaataatac gtcaactctc taaaaaaaaa aaacttacat tacaaaaact 2820 tatctttcta aactaaaatc aaaacgaaaa cgtcaaacgc gctccgttta acgacgataa 2880 aaaaaccgcg cgcccgcgct atcccaaccg aaactaccct aactaataat taaaaattta 2940 acgtccgaaa ttcaaacgct tctacaactc aaatttaccg accaaaaaac ctcaattaca 3000 acttttcaaa ataatatttc taaaaaataa caaattcaaa ctcaactaat aacaactttt 3060 aactataaaa aataaaacta cttcccttta acgataaaac tcttaaactt cgaaaaataa 3120 aaaaatacaa taaaataaaa taccataaaa tcactaaatt tttcaaaaaa aaaaaaaccc 3180 caaattactc ccaaaataaa actttataaa ttcttattaa aaatctttaa atctcgaatt 3240 tccccctaca acatctaata aatactttaa aaacaaacga acaaatccca cctcgaaaat 3300 caacaaaccc aaactctaac caaaactctc cccgcgtttt cttctcgtaa cctaaaaaat 3360 atcccgcccc atcgctcacc taactcttat catctcgctc atcttaaaat aacccgtaaa 3420 caatactact ccctaccgca actccgccga tcactcaaac aaaacgaaat atacaaataa 3480 cctaaaaaaa ccgaaaccga acactacgcc cattatcccg aacgctcaaa acgccgaaca 3540 actacgcaaa ctttctaaac tcgaaccctc gaccgccacg ctaatatcat cattacaaaa 3600 catcaaattt taaaaactat acaatctaaa ttcattaaca accttctcga cgaaaattct 3660 tttccccgta acaaatttca aaatccaaac cccctccaac gttaataaaa ataaaaaaaa 3720 aaaaaaaaac ccaaaaaaaa aaatctttcg caaataaaac ctcgaaaaat ccctactctc 3780 cttctaatac attccgcaac tttaaaaacc ttccttaaaa ttctaaacgc gaatatctaa 3840 cttaaataac ctaaaattta aacatattcc cgttttctcc caaaaattac tttaatatta 3900 cgaatttaaa ttcactaaaa aaaacccaaa taccaaatcg aataaatttc ataaacatca 3960 tcttctattt taataatcgc gacaataatc gtttctaaaa tcataccctt taaaataaac 4020 tcacaacaat acatatcaaa aaaactacgc gccctaaaac aaaacaatta aaacatcaaa 4080 ccacgctcct caaactacaa aattacaaac aactcacaaa cttccaatcc ccaccccaaa 4140 ataaaaaaaa tctcaataac ttaaaaacct acttacactc ccgctttcca cgcccgatcc 4200 cctacccgca cctacccaaa taatctcgtt cctctaaaat ctaaataata aaaaaaaata 4260 ctcctaatac cccgaataca aaacgaacac caacgaacga aacccaaaaa cgctaaaacc 4320 caaaaacgca aaccaccgtt aaaacctaaa aaacgcaaaa acgaataaaa taatatttct 4380 caaattcgta aaaaaccgca aacgccaaca aaaacaattt tcctccccta aacaatacta 4440 attctcctca aacccaaaat ctccactaac gtatccttcc acctcctcac aaaactccaa 4500 actactatcc cctctctacc gcatctaaaa ctaaaaaaac ttcctaaaaa aaaacaaaaa 4560 aaaaccacca aaccaaaacc gaaaactaaa ctttaaaatc gaaaacgaca aaaaaacaaa 4620 ttctccccta cacaccccaa aacctctcct acacccgcga aaccttcctt aaacgcccaa 4680 acccccgaaa tacctaccct ccttctaaca aaaaaaaaaa ataaaatata aaaaaataat 4740 acaaccaaca atatttttat aaacacaaca acaaaaaaat acataaaaaa aatctattta 4800 ttaaatatat catttttaat aaaaaacgaa attaaaaata acgccatcta aacccaaaaa 4860 aaaactacga aataaacgaa ataaacgaaa aactcttaa 4899 <210> 154 <211> 2346 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 154 actcacctta taaacactcg aacataataa attaacatta acattactat taaaaaacaa 60 ctcaaccgta ttcttaacca taaccattta aacctattct aatacaaaat tctaatccaa 120 aataccaata taatccctca aaaaaatact aaaaatcgtc acttatacct attctaaaca 180 taatcaccga aaactatcct ataaacattc acttaaaaat cattcgaaat aaaattactc 240 ctaaatacgt tctccttata ctctatttcc tcctcctaat atctctatat aaaaaaaccc 300 tcctcactca accctcgacg accctctaat accctaaaca actccccgaa aaacaatcta 360 ccgctaaacg acgactacta aaaaaaaaac cctcctaacg cgaaatctac cgctccgaaa 420 ctcgctctcc gacaaacccg aaaaaaaata aaataacaat aaattaaaat acgcgcgtac 480 ctcataaata cgaaacaaaa cgaaccgccg aaatataaat caacgcgcta aaaactaaaa 540 aactaaataa ataatcacga aatctcactc acgctcgact cctccaccca tcccgtctac 600 aacgcgtatc ccaatccaaa acgtacgtac gctcgatatc cgattccgaa ctatatatat 660 ccatttaacg aaatatcgaa aacgaaaaaa atatccttat cgatatatct aaacccaaat 720 taaaaaactt ctcctcccca cccccgcgta aatataaaaa tatatccgaa ctaaaacgcg 780 tatacttcta tacctatacg tacgtatacg aatcaaaata ataaaaccgc gcatcaaaac 840 aaaataccta cgtctacgtc taaatctatc taatctacat atcgacgcga tctcgaccta 900 aattcgtatc cctaaatatc gaaaaaccaa cgtaataaaa atatccaacc tcccgaaaaa 960 atactatacc ttaacacctt cgtttcaccg ccccaaaact aacctaaaac tccgtaaaaa 1020 ataacctaca taaaaaaaac ccgcgtacta tatttctaaa aaaaataaaa aaataaaaac 1080 gcaaaaaacg aaccaaatcc ctaaacgcga cgcgaactcg aaaaacccgc gcgactaacg 1140 tcaaaccact ccttaaataa aaccgacaac gcgctccgct cgacatttcc cgaaaaacca 1200 aatcgcgacc gacgccaacg ccaccgtccg atccacccgc caacccgcac aaccgcgccg 1260 ccgccgaacg tttcgtaaac gacgctccga aaatcaaaaa taaaacttcg aacgctaaac 1320 gcgctccgaa cccgacgcac gtaaaaacct aaaaacgccc gaaccgcccg actacccgaa 1380 accccatcgc ctaaaaccga aaaatactaa aaatacaacc gcctattccc cgaaaaaccg 1440 ctacccccga aaccccctaa cactatacgc accctaatca acaacccccg aaaaaaacga 1500 cgcccccaac gcccgacccg cgtaaccgta acaacgccac gcgaaccctc taaacgaccg 1560 caaaaccaca acaactcaac cgccgatacc ccctcgaaaa ccataacccc cgacgcgaac 1620 ccataaaacc ataacctata aaatcctaaa ccgcgcgaaa ccacctcaac cgcgaaaaac 1680 gcgcaaacta ctcttcgcct tcacgctctc gctctcctac acttacctat attacaactt 1740 cctatactac tacgacgacc taaatcgaaa ccgcctcctc gacgcgcctc gctacctccg 1800 cgaccccaac gcgaacgacc aaaaacttct ccaaaaatcc cgcccctata atccctccga 1860 accgacgccc aacgaaccca acgctcccaa cgcgcccgcc gccgccgtac ccgcccctcg 1920 cctctccgat tccaaccact ccgactcacc caaactaaat accaaacgat taccccaaac 1980 cctcattata aacgtaaaaa aaaaaaacac ccgaaccgta ctaaaattta tccgaataca 2040 cccgaacgta cgaaccttaa acacgaaacc ccacttcttt aacaaaaact acgaccgcga 2100 actaaattaa tacaaataaa aaccaaaaac tccgctccgt acgccgaatc tctaatcgct 2160 tccattaaaa aaaccatccg tctcttatat tttctctttc ttttaaccca actcattata 2220 taaattcaaa ctaacacaca aaaccataaa aaactataac aaaatttacc caaaacttcc 2280 caataataat ctaaacgaac aatttctaaa actacaaaaa acgttccctc gtcactaaaa 2340 tcgtta 2346 <210> 155 <211> 2695 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 155 attcccttcc acgaaaatcc cgaaatactt taaaaaaaaa aaaaaaaaac gtcccctcta 60 aaaaacccac tctccgaact tctactaacc taatctccgc ctcaccgacc tcttacgacc 120 gctacaaaaa cgcactttac taaacacccc gaaaacgtac ctctcgcaca aaaaacgccc 180 gtctttacta aaactaaaac gacgcttaaa aaccgacact cgatcgctat taaactccct 240 cgcctaccgc ttctaccgaa tcaaaaaact aactatcgcc gcaaccataa ctactcaacg 300 aaaacctcaa accccaacct ctactacgcc ctccgactta cgctccgccg aaacgaaaac 360 aaaacctaaa cgaccaaaaa aaaaacaatc gcgaaaaaac aatactaaaa tttaaaaaaa 420 ctacaatatc gaaaacccga cgctcacaaa attaatcaaa atctaaacaa taacgacaaa 480 atatataaaa atccaaatat aaacttcccc aacctctaac gaccgaaaaa cgaaacgaaa 540 cgatcccaaa ccctcttacg aaataaacgt ttacacccca aacttacacc ccaaaacgat 600 cgacgtccaa aaaacaataa aaaatttaat cacactacgt tcgaaatacc aaataaaaaa 660 aaaaaaacga tacccaaaat aacaaaacgt acctctatta aaaaaacgca aacgttataa 720 aatatccaaa atatacctac acatacatac ataaaaaacc cgtttacaaa acaaaatcta 780 aacccaaacg aataacgcgc ccccgataaa aaatactaaa aaataaataa aacgttcctt 840 taaaaaacaa accaccaacc gcacgaaaaa aaaaaaaaaa aacaacaatt taactcccta 900 cgacccgcga ttctaaaaat taaaaaatcc gtcccaacaa aataaaatct acaaaataca 960 tcgcgccgac tacgactttc caaaaaccga ccacccgaat tctaaaattc cgaaaaacgc 1020 gaaataaaaa cgattacccg aaatctaaat aaaaacgcga aacgaaaaca actatttcca 1080 actacgataa aaacaactcc cgaccaacaa cactacaaaa aaaacgaaaa acgaaaaaaa 1140 aaaaaaaacg cgaaaaaaaa aaaaaaatcc tcgaaaacca aacacccctc gaaaaaaaac 1200 caacgaaaaa cgatctacga aatcccaaaa ataaacgctc tttctctttc cgcttacttt 1260 ccgacacgaa acgaacacaa ttaataatta tttaaaaaat cctaaatcta aaataactca 1320 ataatttaaa taaaccccct caaaaaacaa cgataccgaa aatatcctct ccaactcgac 1380 gcccacacgc ctttaactaa aactccccgc cataatccac ccgaaaccgc cgcaccgaac 1440 taatctccgc acaaactcaa aaaaaacgaa aaaaaaaaaa aaaaaaaaaa acgccctaac 1500 gaactcgaaa tcaaatcatc gccgcgctac tacccgtacc ccctaaactc gcgcgccccg 1560 acaatcaaca actcacaaac aacaaatcaa ataaaaatta cccgccgaac gcaaaaccga 1620 tcactcaatc ccgcgccgcc catcccgacc gaaaaaaaaa ataacccgcg cgctacgaat 1680 acccgcgcgt ccgctcgaat aaaacgaaaa ctaactacaa acgatattaa ctcgcgacga 1740 ctaaaactcc taaccgaaac tacccaccat aatctaacgc caaaaacgca aacgaaaccc 1800 ctaaacctcc taaaactacc tcgcgaaaca accgaaaacg caacccgaac gcttaaaacc 1860 gaaaacgaaa tcaaaaaccg aaaccaaaaa acaaatacaa acgactacca actcgcccaa 1920 cttactacgc gaataaccgc tcaaaaccgc gaacttacga aacgcccccc gccgccgcgc 1980 cgccgcctcc ccaaacccga aaaaaaacgc tcaaaataaa atcccattca taaactaaaa 2040 ctctaaacgc gcgaaaccgc cgccgcccct ccgactaact caactaaaat actaactccg 2100 caaaaaactc gaaacccgaa cgaaaaccac cgaaataaca aataaaacgc aaaacccgcg 2160 acaaccaaaa ttcctcccgc acgacccgcc gacccacgaa aaaacgaaaa aacgcccaaa 2220 taaaaccgaa ctaaaaaccg aacccctaaa acgctaaaaa acacaacgcg ctctaatcaa 2280 attccctttc ctaaaaccct ccgcttccaa actcccttct ttcctccctc cctcccgcca 2340 cccctctccc tcctctctat atcttctatc tctccccttt tctcctctct acgcaatcct 2400 acgtaattaa aatttaaata aaaaattctc aaaaacaaaa cgaaaaaact acaacttaaa 2460 tctactccgt ccgatccctc ccacaaaaaa aacacaacca caataaaaat taaaaaaccc 2520 taaatacgca aaaaaaaaat aaaataaaaa aactaaaaaa atacaatcca cactctctcc 2580 aataaactta aacacgtaaa attctctatt taattaaaaa aaaaataaac actaaaaaaa 2640 ataaaaataa cctcttaaac cttatcgtaa accccaccta taactcattt taaaa 2695 <210> 156 <211> 2837 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 156 aataatattc ctactaccat cccaactaac ttttcgttta tccaaatcgc tctctaatcg 60 ttatcttttc acttcataaa cgccactaaa aattataccc accacaaccc caccccactc 120 ccaatcccac tcccaatccc caaattcaaa ttataatatt taatataatt cttaaactcc 180 acataacccg ctccgaaaac gcactacaaa acgcacccca aatactttcc caaatctatt 240 ccttcattct ctcatttcaa aaaatcgctc tatttattca ccctaaaaaa ataaactcaa 300 cccccgcttt cgcgctaaaa aaaaaaacac aatcattctc tctttctctt cccctccctc 360 cccaacacct tccctccctc ctcccttacc cctcctaatc tccaacccta aaaacaacac 420 tcaaacatac aaactttcta attccttcca ccctccccta tcccaaacac taaacaatta 480 aactaaaaat aacaaacgca aaaaaatcta aatttccatc tatcaaaaaa tcccctttcc 540 ccacacccgc tctcataccc ccgccccctc gaaaaactct aaaaacacct ttatcgcttc 600 tcccctaccc tctaaaaaac cacccgtaac taaaaactcc cgcgcgacaa ctacaccaac 660 aacaaataat ccaaataata cgaaacgata ccttattata acatcctacc ctctacaaaa 720 acaccactaa aaaccacata aaataacccc caacaatcct acaaaaacaa aaaaataaaa 780 aaaaatctat acaccctacc ctatacccca atctctccca ccctatcctc cgcaaccgaa 840 aaaaccctaa catctaaaaa cgaactaaac cgaaaaaaca aaatcaataa aattcaacaa 900 ataaacaact aaaaactaaa tactactaaa ttctaaaaaa aaaaaataaa aacgaaaata 960 tccgaatcga taaaatataa atcgtatcta ctacataaaa aaatcgtaca aaaaaaaccg 1020 ctctctataa aaaattaacc aacgcctacc ccgaacaccc ccgcgaaacc tccaacgaaa 1080 ctcaaactaa cgacgactca acaaaaaacg aaaaatacta aaaaacgccg aaactacgaa 1140 cttacgaaaa aaaatatact cgatataact actccaaatc ttatcgtcgc gatactaatt 1200 aacgaaaacg acgatacccg aaaaattaca cgccaccata taaaaaccga cctcgaacaa 1260 acgatcaaaa acctactcca aataaataaa cttaaaataa aaacgaaacg tatacttctc 1320 cgactaccga tcgaaatcgc gactctcgtt aaacgtatcc ccgaaaacct ccttaaccaa 1380 cgcgatacgc ccgcacacca taatacgcgc cacacgccga aatttaacgt cgacctaatt 1440 atcgcgcacg ataatataaa aaccccgata acccaacgta aaaaaacccg aacgcttatc 1500 ctacgcgccg ccgccgccgc caccaccgta cgctcccgaa cccgaaaaca cgacgaccgc 1560 cgccccgcgc aacaacaacg cgtcgctact accctacgaa acgttatcct ccaaatcgct 1620 ctaacaaccc tcgtcgttaa aaaaattcta cttaataacc ttaaacgaca acaacttaac 1680 caaatcgata aactaaaaat actcgacctc gcgcaacaac cgctccttct cgaaaaaata 1740 ctccgacaac gcgaattact tatcccgcaa ataatccaac acgtacctaa aaaaaaaacc 1800 gtcccgatcg ataaaaaaac gcgcccgact atccctaaac aactcgcccc gacgccgaac 1860 gccgccacga aaactaaaaa acgaaaacat actaaccaaa atactatccg aaacgctaaa 1920 caacgtcgaa tacttaatca cataaaccta accgcctacg ttcaactcca ctacttcaaa 1980 aaaaaacgaa aatacgcaaa accccgaaac gacgacgacc gacgcgccga acgaactaaa 2040 cgaaaaaacc atctcgctaa taaacaaaat aatactaccg ccgctacccg tatccttcaa 2100 aaccataatc cccccgccgc cgacccaata acccgaaaaa actacacttt ctcgttcccg 2160 aaacccgcgc cccaaccctc cgcgtactcc taacgctcta cgccctcgaa ctaaacgacg 2220 cgttcctccg accgaaacga ccccgctcaa aattcgaaac aacgacgacg tcgacgacgc 2280 ccgaactcca tcgaaaaaaa aacgcgcgaa aaaaaaactc cgccgatacg acgacgacaa 2340 taaaaaaaca aaaaaaaact actactcctt taaaacgaaa acgaaaaaat ataaaaaaaa 2400 cttacgaaaa actctaaaac tactactcga ctctccgtaa aaaaaacgaa aaaaaaaacc 2460 gaaacaaaaa aaactcgccg ccccgacaac ttacaaacgt accgcgaaac cgaaacgccg 2520 acgataacgc taactactcc taacaacacg aaaaaaaaca ctaacgtcaa accccgaact 2580 aaaacccgaa cctcaactat catttaaaaa aataaactac aaccgcgact cccgaactcc 2640 gacgctaaaa aacgaaaccg aaaaccgaac ctacaaaaaa tacaactccc cgacccgcga 2700 aaacaaacaa acaaaaaact cctaaaacaa aaacgaaaaa aaaaaacaac gctctcattc 2760 cttcatttca ctccctcctt aaatctatac cacccccttt cctccctcct ttccttcttc 2820 tcttccttcc ttcctta 2837 <210> 157 <211> 7618 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 157 aaaaatccaa aaaattctct cacctaacac ttaacaaaat caaaaattca ccctccaaaa 60 cactctacaa cccaaaaata taaccaaaac ccttaaaaac tcccaatcta tacttaaata 120 taaaccgaaa ataaaatata acccaaaaat cgcaaaaaaa atttcaaaca actaaaaaaa 180 tacacgtaaa aacaaaaaaa acctaaaaaa tataaaaaac taaaaataaa aaccaatcta 240 cctactaacc tacaaaaacc tctaaactta ctctctaaaa acaaaatcca acgaaaacta 300 aaaaaaaaaa attcctatac gaaaccaacc taccctcccc ctccccactc aatataataa 360 aatccctaaa aatctacgcc ctccaacgaa caataacata ctaaaaaaaa acttaaaaac 420 aaataaacaa caaaaccaca aaaaaccaaa aaaaaaaaaa ccactaatat aaaacaaacg 480 tatactcata atacacgccc aactatacaa attattcata aaaaaccgct ataaacgcta 540 aaccgtctca actcaatcca ataaaaaaaa aaaaaaaaaa accctaaata cttttaaata 600 acatataaac aaataaactt cccaccttcc aaacaaaaca taaacaatta ataaattcct 660 tttaaaaaaa aaaaaaccga aaaaataaat tcaaacaatc gtaacaaaaa cgtcctattt 720 aaaaatataa aaacaaataa aaacaaaaaa aactaacgaa attaacaact atatcctccg 780 ataaaaataa aataaaaaat ctcttctaat aataatttat actctttata aaaataaaaa 840 acattttaaa ttatatacta aataactcta atacaaataa aaactaaaaa aaaaaaaaaa 900 aaccgaacaa aaaaaaaaaa aaaaaaaaaa aacactaaat ctctctaaat ttaaaccgtt 960 taaacgtcta tataaacatt tttctttctt aaaaaaataa aaatacgaat aataactaca 1020 cgaatataca catttatcaa aattcctcta attacactct taaatttata cttttctccc 1080 taaatacatt cacttcccat tttaaaaaaa aaaaaaaaaa aaactttcca tcttctacct 1140 aattatacgt tcgaatttcg taccttaacg atacattact tatttaaaaa ctacatacat 1200 cataaaaaaa aatctttatc aaaaactcta atcgaacgca ataactcaaa cctataatcc 1260 caacacttaa aaaaaccgaa acaaacgaac cacttaaact taaaaattca cgacgaacct 1320 aaacaacata caacacccct tctctacaaa aaataaaaat taaccgaacg taataaccgc 1380 gcctaaaatc ccaactactc gaaaactaaa ataaaaaaat cactcgaacc caaaaaataa 1440 aaactacaat aaaccctaat cgcgacacta cactccaacc taaacgacac aacgaaccat 1500 ctcaataaca aaccgaaact ctaactatct ccaaataatc gaacttaaaa taccttttat 1560 tttcaatact tataattttc taaattttta aaataacgaa caaaatctcc ttacgacatt 1620 aaatacaata caaccgccga aaaaacgtcg aaaacaaata aaattaaacg ccgtccccac 1680 ttcctcccct acaaccgcct ccaaaccgcc aacctcgccc aaccgaaacc tcaatcctaa 1740 aaaatcgaac gacgacgacc ttcccctaaa ataacattct tattacccgt aaaaccccct 1800 ccccaaataa aaaacaaaaa acgaaatcta aaacaacctc cgctttctcc ttcctccttc 1860 ccccgcgact tccctactac gccgaacctc ccaaatctca ccccgaattt ccgcacccga 1920 taaaacgcga attccgaccc aacttctctc gaaaataacg actaacctaa aacccatccc 1980 taacctcgac ctccgcaccc ccccgccccc ctacctataa aacccgcaac ccaaaaacct 2040 aaaacctctc tacgaacacg caaaaatctc ccaacttccg aatcgttccg ccgttcgccc 2100 taaatctaaa tctaaaaatt cgaaaaacaa ttttaaacgt ttctaattaa attatatcta 2160 aatcgtacat tttacgcgac aaaaaactcg aaatccttaa aaatcccaaa ctaccgcaac 2220 ccctccctcc tcctcccctt acccttaccc ctacccaaaa aaatacgctc ctccaaaatc 2280 atccacacgc gccgtaccga accccgaacc ccaattccaa aaaccgcgtc tctacgaacc 2340 aataaatcct aaaaaaataa aacttcgaac gctcgaaaaa aaaaaacgaa aaaaaaataa 2400 aaccgaaaaa taacttttaa cgaaaaaaaa attaaaacat caactaaacc attaaaacta 2460 atacgatata ctataaaacg aaaatcaata ccgaacctcg aaaaccgacg taaaaaaaaa 2520 aacaacaaac cgaccgcccc caaaccgatc gaaacccccg tccatttaaa aaaaataaat 2580 tttcgcgatt taaaaaacaa acccaaatca aataaacgaa acccgaatat actaacgcta 2640 cgattacgcg cgcgaaacta aaaccccgaa aacgctctaa aaaaaacgca acgacgaccg 2700 cgaaaaaaaa taaaaaaccg aaacaaaaaa atccgaaaaa acaaaaaaaa ataccgaccg 2760 acaaaaaaaa aacgaaacaa acacaccgaa aaataaaaaa acaaaaaaaa acaacctcgc 2820 aattttcgca aaaaaaaaca aaccgacgcg actaaaaata cgcttctaaa ccaaacgcga 2880 caaaacccca aaaactaacc aaaaccccaa aacccaaacg cctatttaaa ctcctttaaa 2940 tccgacaaaa aacctaaatc cattcgaaaa aaaaaaatac caacccctac cttatacaat 3000 cccctcgccc gaacgtcata aaaaaaatac cccctaaacg caaacccccg aacgaccgaa 3060 acctcgcttc taacgaccga aaaaaatcga caccgtaaca ctcaaacaca catacaccaa 3120 taccccgaac ccgctaaaaa cgctaaactc caaacaacga aaaacgaaaa tcctaaaatc 3180 gatcctaaat acattcctcc actaaacccc gtcgaaaata aaactctcga aacatcgtca 3240 ctaaaaaatc ctaaaaaaac actaaaataa acgaacttct tcaaaaactc gatttccact 3300 aaaccctccc attccctcct ctcttcgtca cgcgataata ataataataa aaaatacaat 3360 aacccctcta attcctaaaa caccccttat aataaaatat accctcctaa ctaaacccac 3420 tccttactaa atacaaaaac aaaataaaaa aaaaaaaaac cgataaattt aacttctaaa 3480 caacccacct ctacctctcc taaaaccaca ctaaacttat ctataaaata aacacaaata 3540 aaataaaatt aaccaaaatc tcttctaaca aactaaaaat ctactaaaaa aacgaactcg 3600 ctccaaaact aacccccccc cacgcctctt aacaatacca cccccaaaat ataaaaaacc 3660 tcaaacaaat ataaaaaatt cttatctata taaacaattt taatcatcgc aaactcataa 3720 tatcaacacc atcccgttaa cacgatttct ctaatcccga ttaacaaccc tcccaaaacc 3780 taaaccttac aaatctaaac taacttaaaa cttccacccc aatcccaaaa aaaacccgcg 3840 aaacttaaaa aattccaaaa ataaaaaaca ctccacaata taaaaccctc taaaatacaa 3900 cctaaaaaca caaaaatact acctctcaaa cccccatata aaaaacccgc taaaaaaaaa 3960 aaaaaaaaat taaaaaaata aaaaaaatac gaaacctccg aaactaacac cctcccccac 4020 tcacccaaac caaaaataaa ctaaactcaa catcctcatc tcctcgccct atcattaccg 4080 ccactaaaaa aataaaaaca aaatctctac cttctctaca cacgtacgta atctatataa 4140 cgtaaaatcg cactaaaacc cgaataaaaa catccccccg ccccttcgtc atcgtaaaaa 4200 taccgtaaaa caaaacgaac aaaaaactaa tcaactcccg tcccgacccg aaaaaaactt 4260 ccaaaaaaaa cgaaaaaacc attcgccatt ccaaaacaaa cgcgaacaat aacccacgac 4320 tctaaacccg aatctatatc cacctctaaa tacccaattc ccgccaccat attattaaaa 4380 acaaaaaaac acaactaccc gtaataaaaa taaaaaactt aaatccccat taaaaccgac 4440 aaaaccccga cgaaaccaac gacgatacta acaacgcgaa ctacgtcaaa aacgaaaccg 4500 aattcgtaaa acgccgttac gcacaaatac gcgaatcaac aaaaccctaa tacctaaaca 4560 cccccgaata cgcgcgacgt aactacccta ataccccaat aaaaacataa ctacgcgcca 4620 aataaaaata aaaacgcccc ctaacctttc ctatacccga aaccaaaacc gctaaaaccg 4680 atatactaca aaaatccgaa cacaaactaa aaaaaccgac ccgtacgtta aacgcctcga 4740 aaatactccg aatcataata aatactaaac gaaaacacga aaaactatat acacaacaac 4800 aaacaataca cccgcgctcc cgtcattaca tcgcgccgcc ttcacccccg ctacgataac 4860 cactccgcaa ataaacaaaa cgaactcaaa aaaataaaat aactttccca aaaccacaca 4920 acgaaccaat aaaaacaccg cgcacgatcc aaaaatctaa cccttcctaa aaaataaaaa 4980 aaaaaaaact cgacccgaaa aaaccaaacg acaaaaaacc ccgcgtcccc cgccacgaac 5040 taaaacgcaa aacgacccgc cgtatctcca cctacgcgcc tcgaacttcg ctccgctcta 5100 accttcgaat taacaccgct tccttccaaa aacctaaaaa aacccgaacg aatcaaacgc 5160 ctcccttctc cgcaacccca taccctaccc gcaacttaaa ctcaccgccc ttctcgaaat 5220 aacgatacga aaaccgaacg actccactat acaaaccccg aaaaataaaa aaccgaataa 5280 aaaaaaaaaa cgaaaaataa cgaaataaaa actaaaaaac gaaactaaaa actaaaccaa 5340 acttccaaac gccaaaaaaa cgccaaataa accgaacgaa aacgaaaacg aaaacgaaaa 5400 aaaaaacgaa accgaaaccg cgaaaaaaaa acgaaacgcc cgaaaaaacc gcgaactaaa 5460 aaaatcccga acgaccgaaa acgataaaaa aacgaaaccg aatcgcgtcc gcgaaatccc 5520 gaacacaacg aaactaacgc cactatcgaa attccgttcc atctaaatcg aacaaccccg 5580 cgaatccgaa cgccgctacc ctcctctacc tactaaaaaa cgcaaaccga acaaaaataa 5640 acctaactcc aaaaccccaa cgaaacaaac aaaacccgaa ccaaaaacta cgacaccgac 5700 ttcccactac ccgaccgaac gacgcgaaac ctaaaaaaaa cgaatcgaaa tcaaaacgcc 5760 gctacgcccc gaaaaccgcg cttcccgcga cctataccga aaaacctctc cgcaaaaaaa 5820 taaacacgcc ctatctcccc gaccccgact cgaaccgatc aaaaataaaa aaaatcacgc 5880 tcgaaaaaaa aaaataaaaa acgacgaaaa aacctcgata accaaaacaa atacacgcgc 5940 gcgcgaaatc ctcgtacgcc gcgaaaaaaa acgaacaaaa aaacatcgaa aaaaaacaaa 6000 cgaaaaaaac cgcgaaacaa cgtaaacgaa accccgaaaa cacgaccgaa actacgcttc 6060 aaaaatatcc gccaaacgcc ttcccgaacg attaacgaaa cccgaaaaaa cccacaactc 6120 taacctaaaa cgccgtcgtt ccaaaaacct ctacgcctct ctctaacgtc tatctaaacc 6180 ctcaaaaccc cgaaatcaaa acgcccatcc tcttaataac gaaacgcacc tttcgcgtaa 6240 atcgaacgct acaaaccaaa cacgccgaat acgtcaaaaa aatacccgaa aaccaaaaac 6300 aacgcacccg aaaccaaaaa aaaaccgcta cgcgcaacct cccaaacact acaacgaaat 6360 cgaaaccacg tccgcgtaaa taactcgaac taaaaaaccg aaaaacgacg ccaaaaaccc 6420 ttcaaccctt atccgtcctc cctaatatat cctcgacgcg atctaaaacc tccccaacga 6480 aaacgacgcc ccgacgccaa ataccctaaa taaaaaaacc cgaaaaaaac accacgacca 6540 ataaaaaaaa aacgaaaacc gaaaaaacta cgtaaaaaaa aaaaaaaatt aaaactaaaa 6600 tcattctaca aaaaccacgt taataaattt aaatacgaac attctaacta aataaaaaaa 6660 aatttaaaaa caaaatacaa actaaaccaa aataaaaccc cgattaaacg taaataaacc 6720 tacaaccaaa acaaccccaa acaaaaattc aaccgctaaa aaacacaaac ccctaatatt 6780 tcttaataat cactttttaa aacattttat tataaaaatt ttcaaatata aaacaaaatc 6840 gaaaaaaact tcaaataaat tcccgtatac ccacccctat cccacaattc ttaaaccgta 6900 accaatctaa ttccctctat taacctcctt ttatttatac taacttattt ttattacctt 6960 attataaaac aaacacaaac acattttcac taaatacata aatacatttt cactaataat 7020 aacttttttt aaaataacaa tacgacttaa attacaattc ccaataaatc cacactcaaa 7080 aacaattaac ttttaatatt aaaaatacaa acgtatttcc atttaaactt cactacaata 7140 tccaaataat aaaaaacact attactttta taataaaaaa taaacaaaaa ctcaacccca 7200 caactccaaa acgtaacgaa aaccgtttac tccccaaacg ataaaactaa ctcttcgacc 7260 acttaactat tctcgacgcc cgatcctata tatccttccg tacataacac gcaaaactta 7320 actctataaa aacaaaacta tcccctctcc gacccaccta taaaaaaata tccacctctc 7380 cgtttccctc caaaacaatc attcattaaa taatccgcct taaaaaccta aaaatcgacg 7440 aatccaaaaa acccaacgaa cgaatttccg ataactaaaa cccacttccc aacgaaaccc 7500 taaataaaca tacccactct aactaccaaa aaaacaaaat aaccgaaaaa tataaaacat 7560 ataaatacac aaacgaaaaa aaacaacaac aacaccaacg caaaaataac ccgctaac 7618 <210> 158 <211> 2194 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 158 ttaaacccaa tattcaccac taaaacattt ctatttacct tcacaaaaaa aaaaaaaaaa 60 aaacatatta aaaccaacgc tcacaaaaca aaaccaaacg aacctcacta aaaacaaact 120 aaaaaataaa cgtacgctat ccgtaatact aaaaacttaa ccgacgcgaa ctaaaaccgc 180 caccgactac ctcgaaatct cgccgaacct tacctactcc gcgccctaaa aacaaatctt 240 acaaataaac taataatact aatactaata cccaacgcgc taatcgccgc cgccactact 300 actactacga ctactacaca ccgaacgcgt ctcgaactaa tctccgacgc cccgccgctc 360 gcgctcgccg cccgcgccga cctcaaactc cccgaaaccg cctttcgcta ctaccgcctc 420 cgaaaaacgc ctcgaacctt ccccgaaatc gccgaccgcc gccacttcct aaccgacgaa 480 ctacaaaaac aaaaacgaaa acgacaactc gtccgctccc ctacaccgcg aaaccacctc 540 ccctaacgac tcgcttaacc ccgcgacgcg ctcgaaaatc tcgaaaaacg cgaacaacga 600 cgacaaataa cgcgaaaccg cgaaaaccga aaccgactct cccgacgacg acgtcgacga 660 cgacgacgaa aaaaattacg aaaaaaactc gacgtccccg ctctccgccc cgcgacaccg 720 actaccgccg taaccgccct caaaactcat aattataccg ccgccgccct cctaccgacc 780 cgactaacga accgaactct aactacaaaa aaaaaaaacg cgaaaaaaac gaaaaaaaaa 840 aaaaaaaaaa aaaaaaaaaa cccgaacgcc taaaactaaa aaacgaaacg aaaaaaaaat 900 acgaaaaatt ctacaactac gacgacgaca aacgcgaccg ttcgataaaa ccgccgactc 960 gactctaata aaaacgacgc cgaattcgac tacgcgtaaa aaccgcgccg cgaaaaaaaa 1020 aaccgaaaaa acgaaaaaac gaaaaaaaaa aacgacgcga cgaaaataac gaaacgcgaa 1080 cgcgaaataa actaaaaacg cgaatcaata aaacgaaatt cgaaattcga ctccgaacga 1140 acgaactaaa aataaaaaat ccctcaaccg cctccacgaa ccgaccccgc gctcacgtcg 1200 attccgaaac gaataacccc tctccaaacg acgcaacgct acgactctcg taaactaaaa 1260 aataaaaaac aaaaaaaaaa ccgcgaatcc aaaaaccgtt actaaataaa ccgataaaat 1320 ataacgcgaa ccgaataaaa cgcgacaatc taaaccgaaa cccgcgtaaa cttaaaaata 1380 cgcgaaacga ataccctaaa cgcgcccgaa ctaactaaac aataaaacga aaaaaaacgc 1440 gaaacccgaa actataaccg ccacttccaa accctcgctc cccgcgctta aaaccctcaa 1500 aaacactctc aaaaatcctc gaaaacctta aaacaaaaat ctctaaaacc tatatcctct 1560 ccctatctat cccgccctcg aatccctata tcctcctcac ccgctccctc ctacaataaa 1620 catcccgaat tattaataaa aatcttaata cctaaaaaat cgaaacttcg tctcctaaaa 1680 taatttatac taataaaccc taacgccacg ttctataact tataatcact ttcgtcgtta 1740 ccgcataaaa aaacaaataa caccgcccct taccctaaaa aaataactac aaccttcccc 1800 gaatcttaat tttactcacc ccgaaatcaa tttctcgata actccaccct acaaaacctc 1860 tataaaactc atcttcaaaa caaaactaac aattttcttt ctaaaaaaaa aaaaaaatcc 1920 ctcacctaca aaaaactaaa ctaaaaatcg tacacataca ataatttcca aatccgtaca 1980 atataaaatc ataaaacacc gaatttatat acgacaatat atctatccga attttcacta 2040 atataacgct ttcaatcttt aacacaaaaa cacaaaacaa tcatttttaa caacgtttca 2100 taaccgaaaa cccaaaatca aaaaaacaaa ataacttatt caaaattata aaactattaa 2160 caaaaaactt ctatattccc taaccaaatt ttct 2194 <210> 159 <211> 1958 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 159 atactaaacc acgctaaaaa tttataacta aaaactaaac cctcgtcatc gccacgtact 60 ctatcaataa aacaaaataa cccataatta ctaaactccg atcaattaaa aaacaaaaaa 120 cctccgctcc ccactactct ataaaaaaaa cccaacaaaa aaaccctacc aacttctaac 180 tctcaatcta cgcgaaaata taaaaaaaaa aacccaaaac ctccgaaaca aaacacaaca 240 actacaaaaa caaaaccaac atatcgccca acttcaaact tcaatatcac ttcattctca 300 tcttcctaac gactctaaaa aaaaaaaacc gatacctaaa aataaaccac ccctaaacta 360 acccatctca ccttccttac gtattaaccc taaacgacaa acaaactacc tctactcgca 420 accttttaaa attcgctatt tcttccctct ctactaaata ctatcttacc cctaatttcc 480 cctatcctat tctccctcct tacctctaaa catcccaaac tacctaccta ccttcctcta 540 accgctaaaa ataccctaac ctaataaaaa aaatctaaaa ccttcccgtc ttctccgaac 600 acgaaaaaac attacccctc tctctttatt cgctatacta aataacaaaa aaaatacccc 660 gctcctaatc ccctttttta tccccaaccc ttaaactttt ccgaactaac ctatatttct 720 taccaactaa aaaaaacgac gaactacgat cctttcctac tcttcaacgc caacctaaaa 780 cgaaaactaa ctaaaaaaca accgtaccgc cgcgctctac gtaaatcgaa actacccgac 840 tcgcgaacgc ccgaaacgcg aaaaaaataa aactctatac gaaaaacaaa aaactcgcga 900 acatctcgaa aaaaaaacta accgaaaccg ccaaaaacgc gatcccctta actaaaaatc 960 gatccgcgaa aacgcgccaa aaacgaaaaa aaataacgcg cccgaaacgc aaaaacccaa 1020 cgcaacctaa actaaaaatc gaaacgctaa acactacaaa acccgaaaat aaaacgcgcg 1080 aaaaacgacc gcccgaaaac gacgctacga cgactacaac ccgaaactta ttaccccata 1140 ccctcctccc ccaaaatacc taaacatact aaacctccaa aaccaattca ccttcaccgc 1200 cgaccgaccg caactacact acgcaacctt cttcatcaac gaacccgaaa aattcattac 1260 catccactac gaccaaatct ccatcgacta tcaaaacgac gacttcctaa aaataaaacg 1320 cccacgacca accaacctaa ccgaaaaacg acacgaaaaa attaaaaaaa actaaaacgc 1380 tacacccaac gtaaaactac taaacgtaaa taaccaataa cacttcttaa acacttcgct 1440 aatacccgaa tcgaaaaaac gcgttcgaaa acccccacac gacgaaaatc tcgcccttac 1500 ccgaaaacct cgacccacac acatccaata aaactaaaac cgatacctct aaacgctacc 1560 ataatttaaa ttcccttcta aacgctttcg aaaccctaaa aacttctaaa aacttaaact 1620 cgcaacgcga aactctaacg caatccaaaa ccgaaaaaaa ataattaaaa cccaacaaac 1680 tcgaatacta aaatccacca aacgaaccgt cttaattaaa aaacccgccc cacacgtctc 1740 acatctaaac ccgcctcgct cctactaatc cacgctcgac aaaaccgttc cgaaaacaca 1800 aaaactatct tcaatacgcg aataacccga ttttaaaaca ataaaaaact aactaccgaa 1860 aaaacatcta aattaaaata aataaaaaaa caaaacaaaa cccctaaact cactacctcc 1920 tcgattccaa tcgtcaaact ccataaatat aacaaaac 1958 <210> 160 <211> 9660 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 160 aattttattc tcctaacact tctaaacttc atttttactt taactcgaaa ttatttcaaa 60 ataataataa atatatattc taataaccta cacacacgca accacataca cacctattta 120 atatatttat taaaaatact atactataca aaaaaataaa atacacaaca ataaaaaaaa 180 ccaaaatata aaacctactt ccaaaaaaac aatcgtaacc aaaaaaaaat actcctctaa 240 attaacgaaa tcccctaaaa cgcgacctta taaaaatatt taaatcccaa aaaaaaaaac 300 tcaaaacaaa ttactcttcg taaacttccc gaatcctcaa attcccaact cttcaacccc 360 cttcccgccc tcccgtcctc ttctctttct tccccaacaa ctatcattaa ttaaaaaata 420 ataaacccgc taaatcacca tctccattca ccgccgatac cccgaaacta ctacgtacaa 480 atacaaaaac ctctcgaacc tctaaaatta aaaccccaaa aatcacgcgc cttaatacta 540 ctcccacacc ccaaactacc aaccaacctt aatattcttc aatccctata ttacttaata 600 aataaccgat aaaaaaatct tcttttaaaa aaaaaacgtc ccaaacgaaa cctttaacta 660 aataactata atacaaatcg caatttcaaa aatccctccg aaaaaaaacg ccgttaaata 720 acaacttcct tccaacgccg cgtcccctcc ttatcacgac ctacgaacga aaaaaaaaaa 780 aacgaacatc taaccctaat taacaaaatc aaaccgaaaa acctcaccaa accctaacac 840 cctacaacgt aactaccaaa taaccctacg aaataacatt ctaaccaccg tatccgaaac 900 ccgcgctaac caataatata tataacgcaa aacccgaaaa cgcgcccgcg taacaaatac 960 cgtaacctac gccgtaaaat actccgctat aacctccgta acaaaaataa aacgacacta 1020 ctacactata aaaactaaaa aaaacaaata cgccgaaccc gaaacccaaa caaaacttac 1080 catcgcgcac caaaacgaac acaactactc gacgcgacgt taaaaaataa ccaaccaatt 1140 ccaacgactt atcctaacgc tatctcttac atttataacg tcgattctaa aaccaaatct 1200 taacctacgt aaacgtaaac tacaacgcgc taaccaaata ctcgcgctcg aacgctaaca 1260 aataccgcta ctacttaaaa cgccgctcca aaaccaacac ctacgcctac gaaaaaaaca 1320 cgcgcgactt ccgtcgttac cgcgccttaa actactccga acgaccaccc cgcacgctat 1380 cgccgctatt accaacgccg cgctctaaca ccctaatccc gccgccgaaa aacgaaaccg 1440 cgttcaaacc gaactctaaa aacacaaaaa aaaacacatc aacgcccaac ctaaaactca 1500 cctaaacgat tcctacttaa ttttcaaaac tttcctctcc ctaacaacct tcactctacg 1560 caaactcctc ctccctccta ctacccccga accctatccc aaaacgaacc ctatcccaaa 1620 actatctcca tattttttcc ctccaaactc tatcaccttt atatattact actaaaacat 1680 aaattataac aacctataat ccctcgtata tacgtccttt tcctaaaaat aaactctaaa 1740 taaaaaatta aaacaactcc atttacttct taaaatatat atacataaac cgaacgcaat 1800 aactcatacc tataatccca acactttaaa aaaccgaaac gaacgaatca cgaaatcaaa 1860 aaatcgaaac catcctaact aacacgataa aaccccgtct ctactaaaaa tacaaaaaat 1920 taaccgaacg aaataacata tacctataat cccaactact cgaaaaacta aaacaaaaaa 1980 ataacgtaaa cccgaaaaac gaaacttaca ataaaccgaa atcgtaccac tacactccaa 2040 cctaaataac aaaacgaaac tccgtctcaa aaaacaaaca aacaaaaaac aaacaaacaa 2100 aaaaaaaact atatatacat aataaacctt cgctataaaa aacaaatata aataaaaata 2160 tctatcaaat taaaaaaact ttaaaccctc cttaaaaata aaaaaaaaaa aaaaaaaaaa 2220 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2280 aacaaaaaaa aacccgaata tcaaaaaaac gcaaactcga taacaaactc tcaaaaaact 2340 cctatctacc tcattttcct tcgcaacccc aaacgcacta caaaaaactt aactataaat 2400 ccaaaaacga aaaccttaaa tatctcctac cttcacccaa cttttataca cactcttatc 2460 tttttaacgc aacgctccac caacaccaaa aatacatccc aactttctta aatataatac 2520 tttataatcc aaattaacaa tatataataa aaacaaaata tttattaact cctaactttt 2580 aactcaaaaa ctaaaattct ctttaaaaaa tacataaaat taaaatccac atttaacttc 2640 ttaaaaaata acctctccct cctttaaaat ctttctaaca aacaaataat ataaacttca 2700 ccctaaaatc ttcctttcac ccaaaacgac ccctacaact aaaactatac ccaccaaaat 2760 acaacgtttt cctcccttct cacttctctc ctatctaaac ttaaaccccg ttttacccca 2820 aaaataaata aaaaaaaaat actaaatttt cataaaatct cacgccaaaa aaaaatcaaa 2880 aacataaaaa aaatacaaat tcataacaaa acgaaacaaa actctaaata aaccaatacg 2940 attaaaacca aactcctaat acccaaaaca ctaacacaat ctcctaaaaa aaaataaaac 3000 tatttaatat ataaaattta aaaacaaaac aacttccttc aaaaacgtct atactcaaat 3060 aaactaaaac catctccact tacaaaaaaa aaaaattcta aaaaaaattt attttcttaa 3120 cgcatcgaaa aataacaact aaccttcaac caaactacaa aacaaaaaaa accccatttc 3180 aaaatcacaa atcatacaaa ccctaaaact acacaacacc gcaaaataaa ccaacaccct 3240 acgcccttct attcacaatc ctaaaattct taaaaacaaa ataattaact acgataaaaa 3300 aaaacataaa acccaccgaa aatatcttcc ctatccgaat cgctaccgcg accttaaact 3360 caattcctaa aaccgacctc gaatccgacc tcgaatccct cctcgacgac gtccactact 3420 accgcaaaaa aaacgctccc aaaatttaat ttccaataaa aaaaaaaaaa cgccgcaaat 3480 accatcgact acgaaacgac tataataatc gaaaaaacgt aatcctttat caactcaacg 3540 aaaccgaaat aatcgccgaa ttaactaaac aacgccgaaa aaatttaaaa tccgctacaa 3600 aaaacctacc aacttcttcg cgaacacaac aaataatatt cttaaacttc taaaattaat 3660 aaataaccga cctacaaacc gataaataac tccgatctaa ccccttaatt tatttctttc 3720 gttcgcgcct taaataaaaa cgccataaca caatctaaca aaaaaaacct accctaacga 3780 acgctactca aaacccctac gttaaaaata ccgaataaaa tactaaaatt taaaaaaaaa 3840 aaaataacgt tttcatccct taaaatatcg aacctctcca actaaaacct ccgaatcgac 3900 acaacacaac tcccgaatcg acgcaacaca actccccgcc aaccccttcc cttccaacga 3960 actaaacaca aatacgtaaa cctcgcaacc cgacgcgcac gattacgcct ttaaatacct 4020 acgacaaaac tcgaccaaaa ccgtatccca aaacaaaaaa aaccctaaca acctttaacg 4080 ttctccctaa cgcgaaaaat cctacgccaa cgaaaccttc cacttcgaaa aactcaatcg 4140 ccacccgatc cccaactttc gtcttccaaa aaaaaaatcc ataaaaaaaa ataaaaaaat 4200 cccccgacca aaccaacaaa aaaaaaccca attaaaaata acctcaacgc cacgaaaatt 4260 ccactacttt aataaccaca cgcttttaca aacgatttaa aaataaaaaa acaccaaata 4320 ataataaaaa aaaacgataa taactaacac gactaaaaca ctacgaaaaa tttcgctata 4380 aaaataaaaa aataaaaatt ctaaacacta taactacgaa tataaacgat acgtttataa 4440 aaatcaaaaa aacgaattta aaaaaaataa atccttaaaa ttcaaaacct tactttcgtt 4500 aaaaatatat aaaacacact aaatatcaaa aaaaaataaa aataaaattc gaaaaacctt 4560 tttttaaact cctcgaaaaa aaataaaaaa aatctcgaac ccaaaaaata aaaaacgtat 4620 tttccccata cacccataaa tcacgccccc gcccccacat tccccccgta aaaaacaaaa 4680 cctaaacgct tactcacgta actcccccat ccgttccgcg tccatctcca aaactacctc 4740 acaaaaaccc ccaaaaaact ccgaaccatc caactttcta tcaccgccgc cgccaccaac 4800 gttataaacc tctaaccctc gcgactctac gtccattctc aaatactaaa aattttccga 4860 actcttccgc acccgcgaat ataacgaaac cgcgaaacaa ctccgctcgc gctccaatcg 4920 caaaatatcc ttaaccgaaa aaaaaataaa aataacgaaa ctcaacaaca tcccgaaaac 4980 gaataaaacg aaaccgaaaa aatccgaata aaaaacgaca ccctaaactt cccgtcttat 5040 cgctacaaac cccgcaaaca aacccaaact ctaaaacaaa cgcccaacgt cccaaacaac 5100 gccttcctct aaaccatact aataaacccg aatccaaaac cgaataacga aaccgtaacc 5160 ccccattaat tctcgcaaaa accacgtact aactctacac cttcctcccc caacgctttc 5220 ttcccgcgcc cgtcgaatcc tctccaatcc ccaatcgcct tcctaaaaaa tttaattcgt 5280 attaacgatt ctcaaaacaa aaaaaacgta aaaaaacaat actacgcgcg acttaaatct 5340 ccgtcaatac gatactaacg aaaacttccg aaatcaacct aaaatccacg aaaaccctcc 5400 taataaacat acgaaaatta aaaataaaat ccttactata caacccgatc cgatccatcc 5460 aacctaatct taactcaact ctacattctt ataacgaaaa aaaactaaaa taaaaacaac 5520 taaaacccgc gaaatttaaa acgcgcgcta aaatcttacg tacgcaaaaa ccgaaccgca 5580 aaataaaaat aaatcttaac ccaccaaaac ctatattaaa ataaaaacct ctctctttaa 5640 acaaaatcca aatctacgaa atcccgaccc gccacttcct aaaaacaact tctcaacccc 5700 aaaaccgaaa aataaatata aaaactacat ataaaaaacc ctcgacctct taaaaaactc 5760 cgcgaataat aaaaaaaact aaaaaacaat ctctacgacc cgcgcaaaat aatcaaaaac 5820 gaaaataaaa ataaaaaaaa ataaacttcc gtcgccctta acgtccccac gttctttttc 5880 ttcctctcct ttatcctcct taaaacgaat tacctaaaac gtaccaactt atatacgcgt 5940 ataaatacga cgcccgccga aaaactaaaa aaatttaact cgcattaaat ctccaaaaaa 6000 aacccttaat tacgacgaac accgaataaa taacgcaata taacacaaaa attaccaaca 6060 cgaaaataac gccaacaaat ccaaccccta ctattactac tcctaaatca aaaaaacgta 6120 atttaatatc aactattcca acactaaatc gaaaaaaatt taaaaattat attttaatca 6180 caataaaatc tcattaaaat tcttttaaaa atttcaaatc aaatatttct ttttattttt 6240 ctttccttcc tttccctccc tccctccctc ctttttcttt ctttcttttc tttctttctc 6300 tttcttcctt tttttttttt tttttaatta caaaatctct ctctatctcc caaactaaaa 6360 tacaataacc gaatcataac tcgctacaac ctcgacccga actcaataat cctcccacct 6420 caacctccta aataactaaa accacaaata caaccactaa acctaactat ttatttattt 6480 atttattact tataaaaccg aaatttcgcc atattactta aactaatctt aaactcctaa 6540 actcaaataa tatacccacc tcgacctccc aaaatactaa aattacaaat ataaaccacc 6600 gcgcaaactt caaatacttc ttaaacctac ttacgtaaat tcaatattac aacaactatt 6660 taaatataat tatctcctaa aattcaaata aacccaactc atctccccaa actaataaat 6720 acaaaattac acacaaatat ttatacaaaa tttcaacaca tttaatcatt caactacaaa 6780 ataataattt cctatacata ataacattta atcttcacat caaaactata cccaaatatt 6840 tccaactact actccttctt cttcttcctc ctcctcttct tcttcttctt cttcttcttc 6900 ttcttcttct tcttcttctt cttcttcttc ttcttcttct tcttcttccc ctcctcctcc 6960 tcctcctcct tctccttctc cttcttcttc ttttattcaa cgaaaaatcc aaatcaaaaa 7020 aataacccaa ataattcacc aaataacaaa accaaactaa cctctaaacc aaaacaattt 7080 accctatctt tctttctttt taaaatatac atcctttact cttaaaaatc tcaaaatctt 7140 ctaataaccc atacatttat ttaaattttt atttcctaat aaaaatcatc atacgcacct 7200 taaaaaaaat aaaaaaaaat taaaaaaaaa tatccaccca aaaacaacat tttaataaac 7260 cttcttatct ttatttctat atatataaac tcataaaata tatatattta tatatattta 7320 aatttacatc ataaacatac ccaattcatc tttaaaattt tttaaacaaa tataatttaa 7380 aataaaaatc taatatttca tattattaat aaaccgtaat aaactatatt tatattttta 7440 aataatatct ttttttatca ctataaataa aactttattt tataccttca attttcatcc 7500 ttatcaatat tttctattat tttctcaaaa tacatatata aaaaaaacat caatcaatca 7560 aatattttaa tactcataaa acataccatt ccaaaacttc ctaaaaaaac aatattatcg 7620 tattttattc ccgaaaatac aaacgaatac ctaatctacg aatatttaca atcatcaccg 7680 aacacccaca aaaaacccta aacttaaaat atttccgcga taaaaattcc gcctcgtcct 7740 tccaaaaaat actaacgact cgctaaattc tcgccttcca aatactaaaa aaaaaaaata 7800 aaaccacccg aaataaaaac ctaacgccaa aaaccttcca acgccttatc aattaataaa 7860 attttcgtaa caaacaatcg cgctctacct aaatcgtaaa aaaaaaaaca ccttataaaa 7920 aacttaacgt cgaaaacctt aaattcaaat cgtaacccta aatccccaac cttacccttc 7980 ctaacttact acgaaaataa aataaaattt ttatacgtaa aaatactttc taacccctct 8040 cgaaaaataa aaacgtctcc attcgaccaa aatccgaatc tacgaaacaa tttacccgcc 8100 gctttccaaa aacaaactcc ccaacgtaac gaatccttat tataaaaaaa atcgtttcga 8160 ctcaaaatac gcgctcccga cgtaaaccta aaaataaaaa tccctatcgc gctcgcccca 8220 cccctacaaa aaacaaaacc gtccttctac aacaccgcgc cacgcgacga aaatttacaa 8280 tatcctactt tctaatttca acttcttcgc tcgcttaaat ctctctcgat cacctctcga 8340 aaaaacctaa aatccctcct ccctcctcct acttcaacgc caaaaacatt aaaaaccgcc 8400 cgcccgccga aaataaaacc gatacctcga atctcgctca ttccgaatca attaaaaacg 8460 cattaacgac taccttacaa tacaacaaaa actcgaataa caaaccacct acctaaacgc 8520 taacgcccaa aaaaaccgaa aaaaaaacta aaaaaaaaaa cgacaacaaa aaaaccaaaa 8580 aatccaaaaa ctcctaaaca aacctccgta caaccccaac aacgtaatac cgaaaaatat 8640 atatatatat atatatatat atatatatat atatatatat atcccttact caaaaataaa 8700 aacatcgtaa tcacctctat tcttaaataa aataaaaacg accgtactaa aaatataatt 8760 aatccgcttt acttcactca aatccgcaaa atattttaaa cgcctaccgt aaaccaactc 8820 tacccaaact ctaaaaatac taaaaaaata aaaaatctca accttcttat ccgaacttac 8880 attcttacat aaaaaacaaa cttttaaata attcccatac attatattac cttacacaat 8940 caaacgaaat ttatacacta tatttattaa tttttttttt ttaaaacgaa atttcgctct 9000 tttacccaaa ctaaaataca ataacataat ctcgactcac tacaacctcc gccttttcga 9060 tttcaaacaa ttctcctacc tcaacctccc gaataactaa aattacaaat acccgccacc 9120 acacccgact aatttttata tttttaataa aaaccgaatt tcaccatatt aaccaaatta 9180 atctcgaact cctaacctcg taatctaccc gcctcgacct cccaaaatac taaaattaca 9240 aacgtaaacc accgcgcccg accctaaacc tctacttctc cgtaattaac aaaaatcatt 9300 atttcctatt tctttcactc tcctaaaacg aaaaaattcc ctccaacaaa taccatactc 9360 aacaaacaat tcctaataac ctcgcgactt aataaaccct ataaaccgaa ataaaatcaa 9420 tcctctttaa cccaaataca aaatccccgt taaactaaac taaacttaaa ctctaaatct 9480 attatcacaa ctatatcccc aaaacacgta ataaatcttt aacaaatatt tattaaaaac 9540 aaatatctat cctacttaat taaaaataat tcctaaaata ctctaaaaac tatcccaaaa 9600 aatatctaaa aaccatcaat aataacaatt tctactttac cacgatccct tttactaaaa 9660 <210> 161 <211> 1451 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 161 tttttcttta aaaaaactat tcttttccat atcaacgatt tcattttaaa aacaatcgct 60 aaaataatct caaatataaa ataaactaat taaacacacg ccacttaaat actaaaatta 120 actaaaactc aaattttcaa aacaaaacaa aaacacaaat caaccccgct aaattactac 180 tactcctaaa ataacccgac cccatcacga aaattcccaa ataactacga acgtcaacgc 240 ttaacaaaaa cgattaaacg attcacaaca ctcaaaaaat tatataaata cccgacccga 300 acgaccaaca aaaacaaatt caactccccg aacgcaaaat catctccaac ccgatcctcg 360 ctccccctaa aaacccaccg ctcgtctccc cgaaaactac ctccgtaaaa aaatattcgc 420 ccccaaccgc gccccaactt taccttacgt aatcccaaac tttccctaat aaattaataa 480 aaaaataaat ctaaaaaaca aacgccccac ctataaactt aaaactaaat tacatttaat 540 aaaacgctta acccgcatcc ccctaaatcg tttataaata actaaaaaat aaaaacgccc 600 ctctacgcgt ctcccccgac gacaaaccct accccacgcc ccccatccca aaccaaaaac 660 aaaaataaaa aaaacgaaaa ctccaaatcc acgccccgaa acacaaaaaa ttaactaact 720 cctaacgaaa cctaaaacgc ccacatccac gacaaaacca cctataaacc tacaaaacaa 780 caacgaaata cgcgcaaccg aaatacgaaa acgaccgcca caacgactac aacgacaaac 840 gaaacgcaac cgcccgcact taccaaaata aaataaaaaa acgcgcacac gacgaaaccc 900 ccgaacgcga cccgccgctc caatccgccg accctccgcc tacccgctct aaaacccgaa 960 ctctaactcg cactaactac cgctctcgcc aaccgaacta aattcgaaaa aaaactaaac 1020 cgctataaac ccgacgctcc gaatctaacg ctacccgacc cccgccgacc cctccctcta 1080 aactatacgc tatacgctaa aaacgaaacc gcaacgcgct caactcccga atcctttact 1140 ccacgcctcc taaacgcaaa aacgacgcta acaaccgtct cttaaaaaat ttctccgcaa 1200 tataaacgaa aatcaaaatt tacaaacgaa caaaaacaaa aaaaaaaaat cgtacaaatc 1260 gataacgcgc ctaattcaca aaacctaaaa atactatcaa ctttaaaatc atcttatact 1320 aaacaccgcc tctccaatta tctacaaaaa ataataacaa tcgcgctttt ctttaaaaaa 1380 cgatataata tataataata aaaaaaacgt tcaataaaaa aacacgaaaa cctacaaaac 1440 aaactattaa a 1451 <210> 162 <211> 1242 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 162 ccgaataaaa aatataaact ttaacaaaca aactaaaata ctttcataca ttttatacta 60 aaaccgtacc aactctccgt aaaactcttt acctacgttc gccccatccc ctaattcgca 120 ttattctcaa taataaaaac ctccttacct atcactaaca ccaattaact tacaccaaac 180 ttcaaaacgc caaaaaaaaa aaaaaatcac tcttccaaca acgatcattt aaaaaaaaaa 240 aaaattaata ataatataaa actccctcca aaattaacct acaccgtaat ataaattaat 300 tttctttata atctaaaatt aactcgcaat taactaatta aaaaataatt actaaaaaac 360 cgaaacctta aaactttcga atcctacccg cctttcatca tataaacaaa cgcatcaaat 420 ttaaaacttt cccataatta ttatactaac cttaaaacgc aacctctcca tttacattta 480 aaaaaactaa atattaaaca aaaaaaaaaa tactcttttt aaaaacctaa aaaaatatcc 540 ccgctcgaaa ctactccgcc atctaaaccg cgaactaaac gcgcgactcc cgcccccaac 600 tccttaacaa aaacgccgaa aaaaaaaacg ccgcgaaaaa ccgtcatctt attaaaaaaa 660 aatacaaaaa taccccccta aaactaaata aacaccactt ccacactcaa aacgaaaaaa 720 accgaaaaac gtaaaaacga cgcgccaaaa acgaaacgtc cctaataaca acgcgtcccg 780 aaaactctcc cttttcccaa aacgcatacc aaaaacaaac tcctttacaa actccacgaa 840 ccccattcgc gataaaaaaa aacgttccaa actacaaaat aaaaaactcc gatatatata 900 taatatatat aatatatata tatacgcgcg cgcacgccct taaaaaaaaa tccatctttt 960 ataaatacta taacccactt ttaactaaat ctcgtaaaat actcaaatac aaccgatata 1020 ataaaaacta ataacatcaa cacactttcg cgcattaatc ttaaaataat taaaaataaa 1080 aacaataaac tataaaattt tattaaacaa aaaaaaaaaa aaattccaac ctcccatcaa 1140 cctattctaa aaaaatccaa aaaacccata catccctcta cctttccata caacctacac 1200 acaaaacata tctatcgaaa atcacgaaaa aaatcattcc ta 1242 <210> 163 <211> 1206 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 163 aaaaacaaca ctcatttctt cttatcattt ctaaactacg aaacaaaaaa ctttaatttt 60 aaaactaaaa tttaatttat ttttaaaaat accgaatatt accaaacaac gccaacacga 120 atataataat aatataaaat ttacacacac gcaactaaaa taataaattt aaaataaaaa 180 acactatata cacgtataat atatacatac aatatcaaaa cattctttac tcctaaaatt 240 ttctctactt taccaaactt cacgcccctt ttaaaaaaaa aaaacgaatt ttccaaatta 300 taaaaatact tttcctccat ccaaccacac cctcttccga accaatcttt aataaaacct 360 aaacgatata aaatcactaa aaaatataaa taaaaacgtt tttactcatc ttaacccaaa 420 tctctaaaaa aacctttaaa atcgctctaa aacttaaaaa aaattccgtc ctaaaccgaa 480 aactaaaact ctccgaacaa acgctaaaca actctcactt atcgatatcc aataaacctt 540 atataaaata ccaaaatacc ccaacaaaac tttaccaaca cctaaaccgt aattatctcc 600 taactcctaa aatccgcgaa actctaaata tacctacaac tcctcccgaa tcctacaaac 660 cacccttatc cctcttctcc cgctcacccc ccgacccccc catctctttt actattccga 720 aaaaaaccac gcaaaataca acccgaacgc gcccccgaaa aaaacccgcg acgcaacaac 780 cacaccccca acctacacta acgcccaccc cataacttcg ccttcgcgat cgcgaacaaa 840 aaacgcgcgt ttccatcgat taattaaaaa cgaaaatcga aaaaaccccc gcccgccgac 900 gaccaacgca caacccgacc aaaaacgccc tccctaccgc cgccgaccct ttaatcgccc 960 gcgacccgcg acccgcaaac cacaaccaac gctatactaa acaaataacg acaacgaaac 1020 gcgacgcgct caaacgcacg aatccccgaa ccgcgacgcg ctccccgcca cgccgcacat 1080 caaaacccga ccgaccgacg aacgccttca ttaacaacct aaaattataa tattatatta 1140 aaaaacaaaa ctactccccg aaaaaatata tactacatat ctaacaaaaa taaattaaat 1200 tattca 1206 <210> 164 <211> 2308 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 164 ctaattctaa aatacaatat aacattaacg aatataataa actccgacaa acctaaaaca 60 aaaaaatctc cgataacatc cctcaatacc gaaaacaaaa tttcccgacc acttccgtcg 120 attaaaattc tcttaaacat taccctaaat ctattttcaa ataaaaaaaa aaaaaaccca 180 aaccaaatta aaatctaaaa caactaaaac aactatcgat ttccaactta ctttcaaatc 240 taacaaaaac tataaaaatc ctaacttctc cgcgatatca accacgaccc gcgacgatca 300 cgaaaccact tcaacacctc gcgataaaca ataacccccg acgtaacgcg aattccctac 360 gatccccacg cgaacctaaa cgacgaatcc ctccacgact ccgtccaaac acccgaaaac 420 acctaccaaa actacgaaaa taaacgaccg aacgtccaaa cacgaacttt ctcgccgaaa 480 cacgactacc gaactccgtc ctaaaaattt aaaacgacga aaaccgccga aaaaaaaaac 540 gcgcgaaccg aaaaccaaaa ccgaaccgaa caaaacgcgc ccaaaaacaa aaaaaacgac 600 gacccgaacc gaaacgaaac gaaaacacgt tacctacccg taaaacgcga aaaaaaaata 660 cgcgacgacg acgacgacga aatctaacgc aaaaaacaac gacaacaacg aaaacaccga 720 ctcgctcgaa accgaccaac cgaaaaaacc gaaaaacaac gaaaccgcga acgacgaaac 780 cgaaacgaac aacaccgaaa aaaccacgac ccccgcgcta aaccgaaaca acccgaccga 840 acccgacacc atccaaaccc aaaacgacga cgacgacgac tctacgtcca tcgaccaaaa 900 aaaaaactac cgccgccgaa actactacta ctacaactac cgccgccgcc gctaaaacct 960 aacgcccgcc tacatcctac atccccgcgc taacgacgac gacgaaaacg acgaacgccc 1020 gaaatactaa accgacgacg acgcgactcc gaaacgaact cacttaactc cgcgacgcga 1080 ccgctcgctc cgcccctacc ccgcgcgaaa aactcctcct cctcccgccc gcgccgccgc 1140 cgcccccgaa cccgaccccc gccccgatcc ccgcccgccc gcgcccctcc ccgccgaacc 1200 ccgccccgcc ctcgcgctcc ccgaccctaa ccgaaatctc ctccccgcta cgcccctaaa 1260 cccgaacgac cgcgaaaaac gtaaataaaa aaaaaccgaa aacgcgcccg actaaactcc 1320 cgccgatacc gaccccctaa taacctctaa ccctctaaaa cccaacgcac cgcgaaaaaa 1380 actccgaact ccgcactcaa aaacaaacga aaaccgaaat aacgacgccg aaaccaaaca 1440 tatcccgcta cccaacgcga aactaaaaac gcaaacgaaa accgcgcgaa ccgctctcta 1500 cctaacctcc tcgaaatcca aaacgcgaaa aatactaaac tacgaatccg acgcaaacga 1560 ccccgaacgc tactaaacgc gaacgaattt ctattacaca aataaaccaa acaaattcgt 1620 aaaacccccg cgaatcccct aacccgaaaa ttaaaccgcg aatacctaat ctaaaattcc 1680 gcgccccaca ataacccgcg aacctcgacg actcctaccc tacgccctcc aaaacaccaa 1740 acaaataacc ccaaaacctt tacccacgac accccctaaa taaaacaaaa ccacccctct 1800 ataaattcgt cctaaatacc cccaaacaca atctatactc ctccctcccc caacacacgc 1860 gacctctaac gctacacgcc gaacttccta aaacccaaaa cgaaccgaac tccaaaaacc 1920 ctcgctccgc ccgaaccaca cgcaaacaac gccgaccgaa ccgaacctaa atccgcacta 1980 accacgcgca accaccgcca aacgacgcta accctccccc gctataaacc ctacttcgaa 2040 aaccgccaac ctcctcccca tcccgaatcc acaacttcaa tacaacccct aacgacgcgc 2100 gctaacaact aaacaaaaac ttccgtacgc tataaacccc ttaaatcgct aaacccaaaa 2160 aacccaaaca caactaatac caacgcgaaa ccaatattat taaaaacatt taaaaaatct 2220 ttctaaatac aaaaaacaac attataatcc atacatttaa aaacttacat aaaaaaccct 2280 ccctaaccta aataaaaaaa caaacacc 2308 <210> 165 <211> 2201 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 165 tctccctttc tacatataac cccgaacgaa aaaaaacaaa acttaaaaaa aaactataaa 60 acccaaaata aaataaaccc taaacaaaat aaaaaaactc acacctacaa actacgtaca 120 accgaaaaac taacgaccta taacttatca aattcaaata taatacaaat aaaaacctaa 180 caaacattta atttaatttc taaaaccgtt aaaaacaaaa ttaaattcca aataaacgcg 240 attccaaaat aactaaaatt cccactctca aataaaaacc cttcaaacaa aaataaaaca 300 aaaaaaactt cttcgccgcc cgccctacga tatataccac gaaaaccgct aaataaaaac 360 gtccaaatat aaaaacgttc ctccaacata cgtaaatatc ctaaaaactc acgaacaccg 420 attccctctt ccgaacccaa acgtcctaat tcccgtcccc cttaaaataa aatcccgttt 480 tcccccaacc aaaaaaactc cgaaaccgca ttcacctaac ttaactacca acgcccgcct 540 tcctcgaatt ctcaaaacaa aaaactataa tacattttct aaaaataatt tataaatata 600 aaaaaaaaaa atcctttcaa aaattttaat catttaacaa ttaataattt tcatataacg 660 tactaatttt aaaaaccaac tctaataaac taaaacgccc tccccttaat tctaaaacaa 720 aaaacatttt aaactaaaaa cgctcacaac ccgatttcct atcccgcgta attcataaaa 780 cttaccctaa acctaaaaaa ccgataacga aaacctcccc tacaataaaa taaataaaaa 840 acgccacacg acgtctcaaa aaaaaaaaaa aaacgacttc tattccgaaa aaaaaaaacg 900 ataaaaaccg ccgttctctt aaacgcgacc tctactaaaa aacgacgaaa atcgcaaaac 960 cgaaaaaccg aacgcgcgcg aaaaaaaaac ccaaaccaaa aaccgctcgc ctcgaaacga 1020 aatctctaaa aaacgcgcaa aaaaaacgct tcgtaaatac ctaccgacct aaaaaatatc 1080 gctaatctct acccccttcg ccaaaaccga accaaacgaa taaaaacgcg acctaaaccc 1140 ctacgataat tccccaaata taaaatcaaa acaaatccca aaacgcgatc cgcgaaactt 1200 ttaaaaaaaa ccgcccaaaa ctaaaaattc cgacgcaaaa acccgaaaac ccgcgaaact 1260 ataaacgcaa ctaaaaataa cgaaaacccc aacaaaaaat aaaaactcga aatccgcaaa 1320 aacaactcca tccccgacgc taaaaaccgc ataattcccg caaactataa ccaatcgaaa 1380 accgaactcc gcattcttca aacgttccta aaccccctct taccccaacg tccccctccc 1440 gaacaacccc acaataaacg attttcccgc actccgcacg aatccatccc cataataaac 1500 taaaaaccga atctaaactc tacgctaccc gaccaaaacg tccaacgacc ccactaaacg 1560 acgacgccac gcgaacgtaa ataaaaacaa cccccgaacc cgccgaaaaa ccctcgcgaa 1620 aaaaaaaaac cgaacaactt aaaaacgccc cgacaaaaaa aaacgtacga ctaaaaaaaa 1680 ctaacaaata acacccgacc cgcaacctaa taaacaaaat accaactatc cgcccaattt 1740 cctatcctta caataaaact ataaaaaaaa acatttaact cgacaaaaaa ctcaaaacta 1800 aattttacaa tttaatttta caatttaatt ttaattaaaa acaaaattat ctttttttaa 1860 tatatatata tatataaaaa caacaaacga actaatttaa aaactttata tatatacata 1920 tatacgtata tatatataca tatatatata tatatacata tatatatata tatacgtata 1980 actaatttaa aaacaaataa ctactcacta tataaaattt ctaaacattc acaaaaatta 2040 tttaaaaaaa ataaaaaccg aacacgacga ctcacaccta taatcccaac actttaaaaa 2100 accgaaacta acgaatcact taaaatcaaa aattccaaac caacctaatc aacgtaataa 2160 aacaccttct ctaccaaaca aacaaacaaa caaacaaaca a 2201 <210> 166 <211> 3047 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 166 acatcgacct tacactaaaa cttcatcctt tcactcccta aacaactaac aaaacacgaa 60 aacaaaaata aaaaaaaaaa cctccctccg actttaacgc cttactccct cacgaaccgc 120 tttcaaatat acgaatcccc ttcaaacaaa aaaaaaaaca ccactaaaaa aaaccaatca 180 cccccatttc aatatacaaa taaaaaacct aaaattaaac cctttcctcc atcgactaat 240 ctctaactat aattaaacac tcccgaaaaa taaataaaaa aaaaaccaaa cccccaaaat 300 taaaacaata actaaccgaa cgaaactcta ccaaaaacga atctaaaaac tccaaaatac 360 ctaaaacgta aacgaaaaaa aaaaataaaa ccgcgctcaa ttccctctct accgctacgc 420 gtaatccgcg ctcgaactcg cttaccccct ctctaaccca aaaccccatt cgcaacgcct 480 aaactaatcc cactcatcta cgccaaataa aaaaaaaaaa aaaaaaatct aaaaatataa 540 aataaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaacta aacacttcaa aaatcaaaaa 600 aaaaccacct ataatcacaa ccatcgtcac gaccccctac cgcgcccacg cacgcgtaaa 660 taaaaccaaa ctctaaatac cacctaaaaa aaacatccat tcataatccg aatctacccc 720 cgcctatacc ttttctcctc gtaactccca ccccccatcc ccgaccccga atctctaaac 780 taaatttctt aaaaaaaaaa catctctaac accgtttatc ctaataaaat caaatcccta 840 ctttatccaa ctcaactcta aataataatt attaaaaaaa caaaaaacaa caaaataaat 900 caaaaaaata acaaaaaaat aaacgcaacg actcacgcct ataatcccaa cgctttaaaa 960 aaccgaaacg aaaaaatcgc ttaaacccaa aaattcgaaa ccaacctaac caacataacg 1020 aaacccgtct ctactaaaaa tacaaaaatt aaccgaacgt aacgacatac gcctataatc 1080 ccaactactt aacaaactaa aataaaaaaa acgcttaaac ccgaaaaaca aaaattatat 1140 aaaccgaaat ccaaaaataa aaaaaaaaaa aaaaaaaaaa aaaaaaaaca aaaaaacgaa 1200 aaaacaaaaa aaacaaacaa acaaaaaaaa aaaaaaaaaa aaaaaaaaaa taaccactat 1260 ttctatacta tcgctatact attctcgaca cacctaaacc caacctttcc attccttacc 1320 tatattttct tccatttatt cacgtctaaa aatatattca aataaacaac aatctaaaat 1380 ataaatatat tatttaatct acactaatat ttaacacaac tatttataat actcaaaaaa 1440 ttataaacta cctatttcac aataatcgat taattataaa tcataataat tttttttttt 1500 taatacgcaa tcttactcta tcgcccaaac taaaatacaa taacgcgacc accgcctccc 1560 taattcaaac aattctctac ctcaacctcc cgaataacta aaattacaaa tatctaccac 1620 cgcgcctaac taattttttt atatttttaa tacaaacgaa atttcaccat cttaaccaaa 1680 ctaatcttaa actcctaacc tcgtaataca cccgcctcga cctcctaaaa tactaaaatt 1740 acaaatataa accacgcgcc cgaccaatca ttttaatcga ctttaataaa cacgtttcaa 1800 atcattttac cgaaaaatac tatcaaaata aaatactcac tacacactaa ataaaaaaaa 1860 aactatttac aaaacaattt ctaataaaaa aaaaaaacac gtaaacataa tctaaataac 1920 gaaaactaaa aaataattat ctctaaataa ctaaatacta aatataaatt aaccgcaata 1980 ttatttttat aaaactaaaa aaaaaacgtt attttaaata tacgaaattt actcctctcc 2040 aaatccactc tccctttcgc ctccctaaaa attatcaaat tcaaaaaacg acccgaaatt 2100 acaaaaaaaa cgccgacgtc actaacccca aaaactcgaa acgcgcgcgc cgcaaaaata 2160 ccgactacga aatcgaatta aaactaacga aaccctcgac ctctaccgaa atacgaaaaa 2220 taaatactac gaacaaaaaa acgaaactta cgattcccaa atccaaaaac gaattaaaaa 2280 cgtaaaccga cgtccatata ttctacaccc cttctcgccc gatacctctc tcaaaacacg 2340 ttttccaaaa tatattaaat tcgaaaatcg atcgaaaatt tcaaaaccaa ttaaataccc 2400 tctaatataa aactccgatt aaacccgaaa aacttcaaac aacccctcta aaccctcgaa 2460 aatcttcgcc gcgataacct taaacgtccc ctccccgaaa aatctcccta aaactttcac 2520 aaaaaacgaa aaaaactacg ctaaaacctc cgttcccaat acccctaact aataaaaaaa 2580 aataacctta atatctaaaa acaaaaacca aattaactcc cacttaaaac caaaaaacga 2640 aaaaaaaacg aaacccgaaa taactacgac tcccccgaaa cacaaccgaa aaaaaaaatc 2700 ctaaccatct accgaccccg cctaaaaaca tctactcgaa aatccctaaa aaccgttatc 2760 gtattcctca aaatctaccg tactatccct ccgcccccaa aaccaacaaa acacccattc 2820 tataattctc ttcttctcca tcgcccaatt aaaaactact aaaaaccaaa aaaaaaaaaa 2880 tacctttccc gaattctcta attcaaatac ttatcaactt tacacaccat tcgacctttc 2940 caaaaaaaac caaaaaacaa aaatatacta ataacaaaaa ataattaaaa cctcgcctac 3000 cttacatatt ttattcataa aaactataac aataataata taatcct 3047 <210> 167 <211> 3780 <212> DNA <213> Homo sapiens <400> 167 ttgcaggttg acctacggtg gtggtggtct aaaatcatat agaaaccaga gatctgatgg 60 tttacctgaa aatgcgaagt aaatgcacat actcagcatc tcagacgatc gaaagctcaa 120 cgggtgaaag ctcagggggt taattttgcg attaaggaca tcttggaaaa gtatgtaaaa 180 tccctggtcc acttaagtat tattcctatt ttgggctttt atttatttat tttgagatgg 240 agtcttgctc tgtcgcccac ctcggctcac tgcaacttca gcctcccggg ttcaagcgat 300 tctcgtggct cgtcctctca agtagctggg gccacgcccg gctaattttt gtatttttag 360 tagagatggg gtttcaccgt gttggccagg ctggtctcga actcctgacc tcaggcgatc 420 caccgcctcg gcctcccaaa gtgctgggat tacaggcttg agccacagcg cctggcctat 480 tttgggcttt tataccccac tggtaaactg ctttcctcca ggttgaggtt aaaacgacat 540 cattttaagg tgaactgaag tctggaagtg attaagcact tggatcctta gggagcctct 600 ccccgccccc atctctttca tgctaagata attaaaactt cggggccggg gcattgtctg 660 agtcacttca attcaccagc ctaatagatg caaaaggatg taagcatgtc agacacgcag 720 agacagtatt tgaatcaagc ttaatagctc aagggagctg ggccatttcc tattttcttt 780 ttagtgagtg cgatgttctc taaacaccgc ggagaggcag ggttcccggt gatggccttg 840 ccgagggtgc tcccgcaacc tccacctcca gttctctttg gaccattcct ccgtcttccg 900 ttacacgctc tgcaaagcga agtccccttc gcaccagatt cccgctacta cacgcccccc 960 atttcccgcc ctggccacat cgctgcagtt tagtgattga ctggcctcct gaggtcctgg 1020 cgcaaaggcg agattcgcat ttcgcacctc gcccttcgcg ggaaacggcc ccagtgacag 1080 tccccgaagc ggcgcgcgcc cggctggagg tgcgctctcc gggcgcggcg cgcggagggt 1140 cgccaagggc gcgggaaccc caccccggcc gcggcagccc ccagccttca cgccggccct 1200 gaggctcgcc cgcccggccg gccccggctc tcggcttgca aagtccctct ccccagtcca 1260 acccccggcc cccacaggcc tcggcgcccc gccccgcccc aggccccgcc ccagagagtt 1320 ctataaagtt cctctttccc acctcgcact ctcagtttca ccgctcgatc ttgggaccca 1380 ccgctgccct cagctccgag tccagggcga ggtaagggct ggagtcgggc aggaggaggg 1440 gtgtgaggct gataccagag aggacccgga gcgcgaacca gaggttcgac ctccagggca 1500 gcgcagggta ccccggcttc ggagcgggaa gggagcgcgc cccgtcctgg agctccgact 1560 cccaccccat ctgcgctgag ccggaggcgc tggtttgggc tccaaggccc gcctccttgg 1620 ctctgcccga gcctccccgc ctgccctccg cgctcctgcg acggggtcgc cacaagctgg 1680 acgggatgag ctaaccggac tgtcggggcc ccaggagtgg ctgaggcggg gccgtccaag 1740 gcacccacac aagacggcac aactgcctgc gagaaacagg cccggccctg tggaccccaa 1800 tccgaggctc cttcccctgc tcttcgttcc taaggggccc aagctcacgg cggcctccgg 1860 cgcggtgctc acccgctggc gcaggaggag gaggagctcc acatttgggt cgctccgagc 1920 cttgcgtgcg gtggcctagc cggcctggcg cggtccctgc ctcccaggct ccgcagctgt 1980 cgtcgccctc tcccgcgccc tccccgcctc cgctctcccg ggcctgctcc ggggtccggc 2040 ggacgctctg cgcgcggaat cccccgtact ggggctgcag cccccgcgtc tgcgccactt 2100 gtcgtttgca gagcccactt agtgcgcgct agctgggcag ggataggggt cctattcggg 2160 gcgaagggtc tggatgcgag cagagaaagc ggagggtgga ggaacccggg gctgcgcccc 2220 tggaacgccc ggccgcaggc gaggtcctcc gcgcgtggag gccgccaggg gagtggaaac 2280 tgacagagtc gcggggaagg ggcgagaagc gggttgggag tgagcgaagg caagcgagag 2340 ctgcgagtga gtgcggaagg agggccagga ggggtggcgg ctgggtgggg agagagggtg 2400 caagacgagc ggcgcgtgtc gggagccttt gggctgcggg tgcgttacag gagagcaggc 2460 gggtaggagc cttcgcgggg gccgagctcg gaaggcggac ggctgtgccc gcccagggga 2520 tgcgcccggg ccggccgcga aggtgccttc ttccgggggc ccggacgacc ctgacacggc 2580 acgcgcgcgc ttcgcagcct caaagactcc ggggcctcgt ggtcactggc gcaggggatc 2640 ggggcggggt gcccggagtg cggtgcctcg tggctgaagg gcagctcttc tccccgcagt 2700 gcagagcaga gcgggcggag gaccccgggc gcgggcgcgg acggcacgcg gggcatgaac 2760 ctggagggcg gcggccgagg cggagagttc ggcatgagcg cggtgagctg cggcaacggg 2820 aagctccgcc agtggctgat cgaccagatc gacagcggca agtaccccgg gctggtgtgg 2880 gagaacgagg agaagagcat cttccgcatc ccctggaagc acgcgggcaa gcaggactac 2940 aaccgcgagg aggacgccgc gctcttcaag gtctccggcc tcgggagccg gcgggggcgc 3000 gccggggagg gcccagagac agagcccggg gtccccggcg ccgcctccga ggcgagccca 3060 ggggaccgcg cggggcggac gggcgggcgg cggaggcatc aggtggcgtc gccggagccg 3120 caggaggagg aaaggaggcc tcggctctca gcgggaccgc gggggccggg agccgggtcc 3180 tgggcgcgtg gaggctgcag ggaaaccgct gaaggcccgg ccgggcccgg ggaagggcgg 3240 ccaaaggctt gaggggtttt gcgcgttcgt ccgtgcgttc tcgtttccac gcaagcctcc 3300 cgcccttcct ccgggctccc gtctgccgcc tccgtccgtg ggtccccctc gccctctccg 3360 tgcgtccgcg cctgtgccgg cggctgtttt cgtctctcac cgcgtctctg tttctctttt 3420 cgctgctttt ctctctgagt ctctctctct ccatgttttt cctgaggtca gcctctcttc 3480 tcgctcctgc tagctctctg cgggtactcc cacctctgtc tttctctttg tgtgtctctg 3540 tctctctctt tcccccatcg cagtggaact cagggcctct gtctagagct gtctcccttg 3600 ccctttgcgc gagtgcacac acgtgtgtcg ttgttacgat tgttctcccc taaggcagtt 3660 tacccagaga actacgtgtc tgggcccagc ccccacctgt gggcagagca ggggaagggg 3720 acttcctccg ggaatttggt ctcaatttgc tctcagagtg cctcagctgt gctgccatcc 3780 <210> 168 <211> 3780 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 168 ttgtaggttg atttacggtg gtggtggttt aaaattatat agaaattaga gatttgatgg 60 tttatttgaa aatgcgaagt aaatgtatat atttagtatt ttagacgatc gaaagtttaa 120 cgggtgaaag tttagggggt taattttgcg attaaggata ttttggaaaa gtatgtaaaa 180 tttttggttt atttaagtat tatttttatt ttgggttttt atttatttat tttgagatgg 240 agttttgttt tgtcgtttat ttcggtttat tgtaatttta gtttttcggg tttaagcgat 300 tttcgtggtt cgttttttta agtagttggg gttacgttcg gttaattttt gtatttttag 360 tagagatggg gttttatcgt gttggttagg ttggtttcga atttttgatt ttaggcgatt 420 tatcgtttcg gttttttaaa gtgttgggat tataggtttg agttatagcg tttggtttat 480 tttgggtttt tatattttat tggtaaattg ttttttttta ggttgaggtt aaaacgatat 540 tattttaagg tgaattgaag tttggaagtg attaagtatt tggattttta gggagttttt 600 tttcgttttt atttttttta tgttaagata attaaaattt cggggtcggg gtattgtttg 660 agttatttta atttattagt ttaatagatg taaaaggatg taagtatgtt agatacgtag 720 agatagtatt tgaattaagt ttaatagttt aagggagttg ggttattttt tatttttttt 780 ttagtgagtg cgatgttttt taaatatcgc ggagaggtag ggttttcggt gatggttttg 840 tcgagggtgt tttcgtaatt tttattttta gttttttttg gattattttt tcgtttttcg 900 ttatacgttt tgtaaagcga agtttttttc gtattagatt ttcgttatta tacgtttttt 960 atttttcgtt ttggttatat cgttgtagtt tagtgattga ttggtttttt gaggttttgg 1020 cgtaaaggcg agattcgtat ttcgtatttc gtttttcgcg ggaaacggtt ttagtgatag 1080 ttttcgaagc ggcgcgcgtt cggttggagg tgcgtttttc gggcgcggcg cgcggagggt 1140 cgttaagggc gcgggaattt tatttcggtc gcggtagttt ttagttttta cgtcggtttt 1200 gaggttcgtt cgttcggtcg gtttcggttt tcggtttgta aagttttttt ttttagttta 1260 attttcggtt tttataggtt tcggcgtttc gtttcgtttt aggtttcgtt ttagagagtt 1320 ttataaagtt tttttttttt atttcgtatt tttagtttta tcgttcgatt ttgggattta 1380 tcgttgtttt tagtttcgag tttagggcga ggtaagggtt ggagtcgggt aggaggaggg 1440 gtgtgaggtt gatattagag aggattcgga gcgcgaatta gaggttcgat ttttagggta 1500 gcgtagggta tttcggtttc ggagcgggaa gggagcgcgt ttcgttttgg agtttcgatt 1560 tttattttat ttgcgttgag tcggaggcgt tggtttgggt tttaaggttc gtttttttgg 1620 ttttgttcga gttttttcgt ttgtttttcg cgtttttgcg acggggtcgt tataagttgg 1680 acgggatgag ttaatcggat tgtcggggtt ttaggagtgg ttgaggcggg gtcgtttaag 1740 gtatttatat aagacggtat aattgtttgc gagaaatagg ttcggttttg tggattttaa 1800 ttcgaggttt ttttttttgt ttttcgtttt taaggggttt aagtttacgg cggttttcgg 1860 cgcggtgttt attcgttggc gtaggaggag gaggagtttt atatttgggt cgtttcgagt 1920 tttgcgtgcg gtggtttagt cggtttggcg cggtttttgt tttttaggtt tcgtagttgt 1980 cgtcgttttt tttcgcgttt ttttcgtttt cgttttttcg ggtttgtttc ggggttcggc 2040 ggacgttttg cgcgcggaat ttttcgtatt ggggttgtag ttttcgcgtt tgcgttattt 2100 gtcgtttgta gagtttattt agtgcgcgtt agttgggtag ggataggggt tttattcggg 2160 gcgaagggtt tggatgcgag tagagaaagc ggagggtgga ggaattcggg gttgcgtttt 2220 tggaacgttc ggtcgtaggc gaggtttttc gcgcgtggag gtcgttaggg gagtggaaat 2280 tgatagagtc gcggggaagg ggcgagaagc gggttgggag tgagcgaagg taagcgagag 2340 ttgcgagtga gtgcggaagg agggttagga ggggtggcgg ttgggtgggg agagagggtg 2400 taagacgagc ggcgcgtgtc gggagttttt gggttgcggg tgcgttatag gagagtaggc 2460 gggtaggagt tttcgcgggg gtcgagttcg gaaggcggac ggttgtgttc gtttagggga 2520 tgcgttcggg tcggtcgcga aggtgttttt tttcgggggt tcggacgatt ttgatacggt 2580 acgcgcgcgt ttcgtagttt taaagatttc ggggtttcgt ggttattggc gtaggggatc 2640 ggggcggggt gttcggagtg cggtgtttcg tggttgaagg gtagtttttt ttttcgtagt 2700 gtagagtaga gcgggcggag gatttcgggc gcgggcgcgg acggtacgcg gggtatgaat 2760 ttggagggcg gcggtcgagg cggagagttc ggtatgagcg cggtgagttg cggtaacggg 2820 aagtttcgtt agtggttgat cgattagatc gatagcggta agtatttcgg gttggtgtgg 2880 gagaacgagg agaagagtat ttttcgtatt ttttggaagt acgcgggtaa gtaggattat 2940 aatcgcgagg aggacgtcgc gttttttaag gttttcggtt tcgggagtcg gcgggggcgc 3000 gtcggggagg gtttagagat agagttcggg gttttcggcg tcgttttcga ggcgagttta 3060 ggggatcgcg cggggcggac gggcgggcgg cggaggtatt aggtggcgtc gtcggagtcg 3120 taggaggagg aaaggaggtt tcggttttta gcgggatcgc gggggtcggg agtcgggttt 3180 tgggcgcgtg gaggttgtag ggaaatcgtt gaaggttcgg tcgggttcgg ggaagggcgg 3240 ttaaaggttt gaggggtttt gcgcgttcgt tcgtgcgttt tcgtttttac gtaagttttt 3300 cgtttttttt tcgggttttc gtttgtcgtt ttcgttcgtg ggtttttttc gtttttttcg 3360 tgcgttcgcg tttgtgtcgg cggttgtttt cgttttttat cgcgtttttg tttttttttt 3420 cgttgttttt ttttttgagt tttttttttt ttatgttttt tttgaggtta gttttttttt 3480 tcgtttttgt tagttttttg cgggtatttt tatttttgtt tttttttttg tgtgtttttg 3540 tttttttttt ttttttatcg tagtggaatt tagggttttt gtttagagtt gttttttttg 3600 ttttttgcgc gagtgtatat acgtgtgtcg ttgttacgat tgtttttttt taaggtagtt 3660 tatttagaga attacgtgtt tgggtttagt ttttatttgt gggtagagta ggggaagggg 3720 atttttttcg ggaatttggt tttaatttgt ttttagagtg ttttagttgt gttgttattt 3780 <210> 169 <211> 3780 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 169 ttacaaatta acctacgata ataataatct aaaatcatat aaaaaccaaa aatctaataa 60 tttacctaaa aatacgaaat aaatacacat actcaacatc tcaaacgatc gaaaactcaa 120 cgaataaaaa ctcaaaaaat taattttacg attaaaaaca tcttaaaaaa atatataaaa 180 tccctaatcc acttaaatat tattcctatt ttaaactttt atttatttat tttaaaataa 240 aatcttactc tatcgcccac ctcgactcac tacaacttca acctcccgaa ttcaaacgat 300 tctcgtaact cgtcctctca aataactaaa accacgcccg actaattttt atatttttaa 360 taaaaataaa atttcaccgt attaaccaaa ctaatctcga actcctaacc tcaaacgatc 420 caccgcctcg acctcccaaa atactaaaat tacaaactta aaccacaacg cctaacctat 480 tttaaacttt tataccccac taataaacta ctttcctcca aattaaaatt aaaacgacat 540 cattttaaaa taaactaaaa tctaaaaata attaaacact taaatcctta aaaaacctct 600 ccccgccccc atctctttca tactaaaata attaaaactt cgaaaccgaa acattatcta 660 aatcacttca attcaccaac ctaataaata caaaaaaata taaacatatc aaacacgcaa 720 aaacaatatt taaatcaaac ttaataactc aaaaaaacta aaccatttcc tattttcttt 780 ttaataaata cgatattctc taaacaccgc gaaaaaacaa aattcccgat aataacctta 840 ccgaaaatac tcccgcaacc tccacctcca attctcttta aaccattcct ccgtcttccg 900 ttacacgctc tacaaaacga aatccccttc gcaccaaatt cccgctacta cacgcccccc 960 atttcccgcc ctaaccacat cgctacaatt taataattaa ctaacctcct aaaatcctaa 1020 cgcaaaaacg aaattcgcat ttcgcacctc gcccttcgcg aaaaacgacc ccaataacaa 1080 tccccgaaac gacgcgcgcc cgactaaaaa tacgctctcc gaacgcgacg cgcgaaaaat 1140 cgccaaaaac gcgaaaaccc caccccgacc gcgacaaccc ccaaccttca cgccgaccct 1200 aaaactcgcc cgcccgaccg accccgactc tcgacttaca aaatccctct ccccaatcca 1260 acccccgacc cccacaaacc tcgacgcccc gccccgcccc aaaccccgcc ccaaaaaatt 1320 ctataaaatt cctctttccc acctcgcact ctcaatttca ccgctcgatc ttaaaaccca 1380 ccgctaccct caactccgaa tccaaaacga aataaaaact aaaatcgaac aaaaaaaaaa 1440 atataaaact aataccaaaa aaaacccgaa acgcgaacca aaaattcgac ctccaaaaca 1500 acgcaaaata ccccgacttc gaaacgaaaa aaaaacgcgc cccgtcctaa aactccgact 1560 cccaccccat ctacgctaaa ccgaaaacgc taatttaaac tccaaaaccc gcctccttaa 1620 ctctacccga acctccccgc ctaccctccg cgctcctacg acgaaatcgc cacaaactaa 1680 acgaaataaa ctaaccgaac tatcgaaacc ccaaaaataa ctaaaacgaa accgtccaaa 1740 acacccacac aaaacgacac aactacctac gaaaaacaaa cccgacccta taaaccccaa 1800 tccgaaactc cttcccctac tcttcgttcc taaaaaaccc aaactcacga cgacctccga 1860 cgcgatactc acccgctaac gcaaaaaaaa aaaaaactcc acatttaaat cgctccgaac 1920 cttacgtacg ataacctaac cgacctaacg cgatccctac ctcccaaact ccgcaactat 1980 cgtcgccctc tcccgcgccc tccccgcctc cgctctcccg aacctactcc gaaatccgac 2040 gaacgctcta cgcgcgaaat cccccgtact aaaactacaa cccccgcgtc tacgccactt 2100 atcgtttaca aaacccactt aatacgcgct aactaaacaa aaataaaaat cctattcgaa 2160 acgaaaaatc taaatacgaa caaaaaaaac gaaaaataaa aaaacccgaa actacgcccc 2220 taaaacgccc gaccgcaaac gaaatcctcc gcgcgtaaaa accgccaaaa aaataaaaac 2280 taacaaaatc gcgaaaaaaa aacgaaaaac gaattaaaaa taaacgaaaa caaacgaaaa 2340 ctacgaataa atacgaaaaa aaaaccaaaa aaaataacga ctaaataaaa aaaaaaaata 2400 caaaacgaac gacgcgtatc gaaaaccttt aaactacgaa tacgttacaa aaaaacaaac 2460 gaataaaaac cttcgcgaaa accgaactcg aaaaacgaac gactataccc gcccaaaaaa 2520 tacgcccgaa ccgaccgcga aaataccttc ttccgaaaac ccgaacgacc ctaacacgac 2580 acgcgcgcgc ttcgcaacct caaaaactcc gaaacctcgt aatcactaac gcaaaaaatc 2640 gaaacgaaat acccgaaata cgatacctcg taactaaaaa acaactcttc tccccgcaat 2700 acaaaacaaa acgaacgaaa aaccccgaac gcgaacgcga acgacacgcg aaacataaac 2760 ctaaaaaacg acgaccgaaa cgaaaaattc gacataaacg cgataaacta cgacaacgaa 2820 aaactccgcc aataactaat cgaccaaatc gacaacgaca aataccccga actaatataa 2880 aaaaacgaaa aaaaaaacat cttccgcatc ccctaaaaac acgcgaacaa acaaaactac 2940 aaccgcgaaa aaaacgccgc gctcttcaaa atctccgacc tcgaaaaccg acgaaaacgc 3000 gccgaaaaaa acccaaaaac aaaacccgaa atccccgacg ccgcctccga aacgaaccca 3060 aaaaaccgcg cgaaacgaac gaacgaacga cgaaaacatc aaataacgtc gccgaaaccg 3120 caaaaaaaaa aaaaaaaacc tcgactctca acgaaaccgc gaaaaccgaa aaccgaatcc 3180 taaacgcgta aaaactacaa aaaaaccgct aaaaacccga ccgaacccga aaaaaaacga 3240 ccaaaaactt aaaaaatttt acgcgttcgt ccgtacgttc tcgtttccac gcaaacctcc 3300 cgcccttcct ccgaactccc gtctaccgcc tccgtccgta aatccccctc gccctctccg 3360 tacgtccgcg cctataccga cgactatttt cgtctctcac cgcgtctcta tttctctttt 3420 cgctactttt ctctctaaat ctctctctct ccatattttt cctaaaatca acctctcttc 3480 tcgctcctac taactctcta cgaatactcc cacctctatc tttctcttta tatatctcta 3540 tctctctctt tcccccatcg caataaaact caaaacctct atctaaaact atctccctta 3600 ccctttacgc gaatacacac acgtatatcg ttattacgat tattctcccc taaaacaatt 3660 tacccaaaaa actacgtatc taaacccaac ccccacctat aaacaaaaca aaaaaaaaaa 3720 acttcctccg aaaatttaat ctcaatttac tctcaaaata cctcaactat actaccatcc 3780 <210> 170 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 170 aaaaaaaaaa aaactccaca ttt 23 <210> 171 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (7)..(7) <223> n is a, c, g, or t <400> 171 tagttgngga gtttggg 17 <210> 172 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 172 atcgtacgta aggttcggag cga 23

Claims (78)

  1. 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법으로서, 상기 방법은 하기 단계:
    (I). 생물학적 샘플로부터 수득된 DNA를, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
    (II). 단계 (I)의 처리된 DNA 내의 표적 마커 세트의 개별 메틸화 수준을 정량화하는 단계로서, 표적 마커는 셉틴9(Septin9), BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역(INTERGENIC REGION) 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 것인 단계; 및
    (III). 단계 (II)에서 정량화된 표적 마커 세트의 적어도 하나의 표적 마커의 메틸화 수준을 각각 상응하는 기준 수준과 비교하는 단계로서, 하나 이상의 표적 마커의, 그의 상응하는 기준 수준에 비해서 동일하거나 더 높은 메틸화 수준은, 대상체가 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타내는 것인 단계
    를 포함하는 것인 방법.
  2. 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법으로서, 상기 방법은 하기 단계:
    (I). 생물학적 샘플로부터 수득된 DNA를, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
    (II). 단계 (I)의 처리된 DNA 내의 표적 마커 세트의 개별 메틸화 수준을 정량화하는 단계로서, 적어도 2개의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, PKNOX2, VAV3, NDRG4 및 IRF4로 이루어진 군으로부터 선택되고, 적어도 2개의 표적 마커는 POU4F2, SALL1, SDC2, ASCL4, 유전자간 영역 1, TMEFF2, 유전자간 영역 4, NKX2-6, 유전자간 영역 5, SLC24A2, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, 및 CRHBP로 이루어진 군으로부터 선택되는 것인 단계; 및
    (III). 단계 (II)에서 정량화된 표적 마커 세트의 적어도 하나의 표적 마커의 메틸화 수준을 각각 상응하는 기준 수준과 비교하는 단계로서, 하나 이상의 표적 마커의, 그의 상응하는 기준 수준에 비해서 동일하거나 더 높은 메틸화 수준은, 대상체가 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타내는 것인 단계
    를 포함하는 것인 방법.
  3. 제1항 또는 제2항에 이어서, 표적 마커 세트는 4, 5, 6, 7, 8, 9 개 또는 그 초과의 표적 마커를 포함하는 것인 방법.
  4. 제1항 또는 제2항에 있어서, 단계 (II)는
    (i) 단계 (I)에서 수득된 처리된 DNA 내의 표적 마커 세트의 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭 프라이머 풀을 사용하여 사전-증폭하는 단계로서, 표적 마커 세트는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 것인 단계; 및
    (ii) 상기 하위 단계 (i)로부터 획득된 DNA 내의 표적 마커 세트의 개별 메틸화 수준을 정량화하는 단계
    를 포함하는 것인 방법.
  5. 제1항 또는 제2항에 있어서, 단계 (I) 전에 대상체 유래 생물학적 샘플로부터 DNA를 수득하는 단계를 더 포함하는 방법.
  6. 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 하는 방법으로서, 상기 방법은 하기 단계:
    (a). 대상체로부터 DNA를 함유하는 생물학적 샘플을 수득하는 단계;
    (b). 단계 (a)로부터 수득된 생물학적 샘플 중 DNA를, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
    (c). 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭 프라이머 풀을 사용하여 사전-증폭하는 단계로서, 적어도 하나의 표적 마커(들)의 적어도 일부분이 사전-증폭되고, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하며; 단계 (c)는 존재하거나 또는 부재하는 것인 단계;
    (d). 단계 (c)가 존재하면, 단계 (c)로부터 획득된 DNA를 기반으로 적어도 하나의 표적 마커의 메틸화 수준을 개별적으로 정량화하고; 단계 (c)가 부재하면, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 메틸화 수준을 개별적으로 정량화하는 단계로서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하는 것인 단계; 및
    (e). 단계 (d)로부터의 적어도 하나의 표적 마커의 메틸화 수준을 각각, 상응하는 기준 수준과 비교하는 단계로서, 하나 이상의 표적 마커(들)의, 그의 상응하는 기준 수준에 비해서 동일하거나 더 높은 메틸화 수준은, 대상체가 결장직장 신생물을 갖거나, 또는 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타내는 것인 단계
    를 포함하는 것인 방법.
  7. 결장직장 신생물의 치료를 받은 대상체에서 치료 반응을 모니터링하는 방법으로서, 하기 단계:
    (a). 대상체로부터 DNA를 함유하는 생물학적 샘플을 수득하는 단계;
    (b). 단계 (a)로부터 수득된 생물학적 샘플 중 DNA를, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약으로 처리하여, 처리된 DNA를 수득하는 단계;
    (c). 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 일부분을, 사전-증폭 프라이머 풀을 사용하여 사전-증폭하는 단계로서, 적어도 하나의 표적 마커(들)의 적어도 일부분이 사전-증폭되고, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하며; 단계 (c)는 존재하거나 또는 부재하는 것인 단계;
    (d). 단계 (c)가 존재하면, 단계 (c)로부터 획득된 DNA를 기반으로 적어도 하나의 표적 마커의 메틸화 수준을 개별적으로 정량화하고; 단계 (c)가 부재하면, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 메틸화 수준을 개별적으로 정량화하는 단계로서, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하는 것인 단계; 및
    (e). 단계 (d)로부터의 적어도 하나의 표적 마커의 메틸화 수준을 각각, 치료전 대상체로부터 수득된 DNA를 함유하는 생물학적 샘플에 대해서 단계 (a), 단계 (b), 임의로 단계 (c), 및 단계 (d)를 반복함으로써 정량화된 치료 전 동일 대상체로부터 수득된 하나 이상의 표적 마커(들)의 상응하는 메틸화 수준과 비교하는 단계로서, 하나 이상의 표적 마커(들)의, 치료 전 그의 상응하는 메틸화 수준에 비해서 더 낮은 메틸화 수준은, 대상체가 치료에 반응성임을 나타내는 것인 단계
    를 포함하는 방법.
  8. 제6항에 있어서, 적어도 하나의 표적 마커는 다수의 표적 마커를 포함하고, 다수의 표적 마커는 셉틴9, BCAT1, 및 IKZF1로 이루어진 군으로부터 선택되는 적어도 2개의 마커를 포함하는 것인 방법.
  9. 제7항에 있어서, 적어도 하나의 표적 마커는 다수의 표적 마커를 포함하고, 다수의 표적 마커는 셉틴9, BCAT1, 및 IKZF1로 이루어진 군으로부터 선택되는 적어도 2개의 마커를 포함하는 것인 방법.
  10. 제8항 또는 제9항에 있어서, 다수의 표적 마커는 BCAN, PKNOX2, VAV3, NDRG4, 및 IRF4로 이루어진 군으로부터 선택되는 하나 이상의 추가 마커를 더 포함하는 것인 방법.
  11. 제10항에 있어서, 다수의 표적 마커는 POU4F2, SALL1, SDC2, ASCL4, 유전자간 영역 1, TMEFF2, 유전자간 영역 4, NKX2-6, 유전자간 영역 5, SLC24A2, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, 및 CRHBP로 이루어진 군으로부터 선택되는 하나 이상의 추가 마커를 더 포함하는 것인 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 각각의 표적 마커는 a) 하기 기재된 Hg19 좌표로 정의되는 각각의 영역, 및 각각의 출발 부위의 상류 5 kb 및 상기 기술된 각 영역의 각각의 말단 부위의 하류 5 kb, 또는 b) a)의 바이술파이트(bisulfite) 전환된 대응물, 또는 c) a)의 MSRE 처리된 대응물이거나 또는 그를 포함하는 것인 방법:
    Figure pct00022

    Figure pct00023
    .
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, DNA는 게놈 DNA 또는 세포-무함유 DNA를 포함하는 것인 방법.
  14. 제13항에 있어서, 세포-무함유 DNA는 순환 종양 DNA를 포함하는 것인 방법.
  15. 제13항 또는 제14항에 있어서, 세포-무함유 DNA 중 표적 마커는 1 ng, 0.8 ng, 0.6 ng, 0.4 ng, 0.2 ng, 0.1 ng, 0.08 ng 이하 또는 0.04 ng 이하의 양으로 생물학적 샘플에 존재하는 것인 방법.
  16. 제15항에 있어서, 세포-무함유 DNA 중 표적 마커는 표적 마커에 대한 검출 어세이의 감도 수준 미만의 농도로 생물학적 샘플에 존재하는 것인 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 하위 단계 (i) 또는 단계 (c)로부터 획득된 DNA는 하위 단계 (ii) 또는 단계 (d) 전에 희석제로 희석되는 것인 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 생물학적 샘플은 조직 절편, 생검, 파라핀-포매 조직, 체액, 결장 삼출액, 수술 절제 샘플, 단리된 혈액 세포, 혈액 단리 세포, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
  19. 제18항에 있어서, 체액은 전체 혈액, 혈액 혈청, 혈액 혈장, 소변, 점액, 타액, 복막액, 흉막액, 흉부액, 활액, 뇌척수액, 흉막천자액, 복수, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
  20. 제19항에 있어서, 생물학적 샘플은 대상체의 혈액 혈장으로부터 수득되는 것인 방법.
  21. 제18항에 있어서, 결장 삼출액은 분변 샘플 및 관장 세척 샘플로 이루어진 군으로부터 선택되는 것인 방법.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약은, CpG 부위(들)에 비메틸화된 시토신 잔기(들)를 선택적으로 변형시켜서 변형된 잔기(들)를 생성시키지만, 메틸화된 시토신 잔기(들)는 유의하게 변형시키지 않는 것인 방법.
  23. 제22항에 있어서, 시약은 바이술파이트 시약을 포함하는 것인 방법.
  24. 제23항에 있어서, 바이술파이트 시약은 암모늄 바이술파이트, 나트륨 바이술파이트, 칼륨 바이술파이트, 칼슘 바이술파이트, 마그네슘 바이술파이트, 알루미늄 바이술파이트, 아황산수소 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 시약은, 비메틸화된 경우에는 잔기를 선택적으로 절단하지만 메틸화된 경우에는 잔기를 절단하지 않거나, 또는 메틸화된 경우에는 잔기를 선택적으로 절단하지만 비메틸화된 경우에는 잔기를 절단하지 않는 것인 방법.
  26. 제25항에 있어서, 시약은 메틸화 감응성 제한 효소(MSRE)인 방법.
  27. 제26항에 있어서, MSRE은 HpaII, SalI, SalI-HF®, ScrFI, BbeI, NotI, SmaI, XmaI, MboI, BstBI, ClaI, MluI, NaeI, NarI, PvuI, SacII, HhaI 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
  28. 제4항 내지 제27항 중 어느 한 항에 있어서, 사전-증폭 프라이머 풀은 적어도 하나의 메틸화-특이적 프라이머 쌍을 포함하는 것인 방법.
  29. 제28항에 있어서, 적어도 하나의 메틸화-특이적 프라이머 쌍은, 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서 표적 마커(들) 중 하나의 적어도 9개의 연속 뉴클레오티드에 혼성화하는 올리고뉴클레오티드 서열을 각각 포함하는 전방향 프라이머 및 역방향 프라이머를 포함하고, 표적 마커(들) 중 하나의 적어도 9개의 연속 뉴클레오티드는 적어도 하나의 CpG 부위를 포함하는 것인 방법.
  30. 제28항 또는 제29항에 있어서, 사전-증폭 프라이머 풀은 대조 마커를 증폭하기 위한 대조 프라이머 쌍을 더 포함하는 것인 방법.
  31. 제30항에 있어서, 대조 마커는 ACTB, GAPDH, 튜불린, ALDOA, PGK1, LDHA, RPS27A, RPL19, RPL11, ARHGDIA, RPL32, C1orf43, CHMP2A, EMC7, GPI, PSMB2, PSMB4, RAB7A, REEP5, SNRPD3, VCP, 및 VPS29로 이루어진 군으로부터 선택되는 것인 방법.
  32. 제28항 내지 제31항 중 어느 한 항에 있어서, 적어도 하나의 메틸화-특이적 프라이머 쌍은 서열번호 1/2, 3/4, 5/6, 7/8, 9/10, 11/12, 13/14, 15/16, 17/18, 19/20, 21/22, 23/24, 25/26, 27/28, 29/30, 31/32, 33/34, 35/36, 37/38, 39/40, 41/42, 43/44, 45/46, 47/48, 49/50, 51/52, 53/54, 및 170/171로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 하나 이상의 쌍을 포함하는 것인 방법.
  33. 제28항 내지 제32항 중 어느 한 항에 있어서, 단계 (c)에서, 적어도 하나의 표적 마커는 하나 이상의 차단제 올리고뉴클레오티드 존재 하에서 증폭되는 것인 방법.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, 정량화는 중합효소 연쇄 반응 (PCR)(예를 들어, 실시간 PCR, 디지탈 PCR), 핵산 시퀀싱, 질량-기반 분리 (예를 들어, 전기영동, 질량 분광법), 또는 표적 포획(예를 들어, 혼성화, 마이크로어레이)에 의해 수행되는 것인 방법.
  35. 제1항 내지 제34항 중 어느 한 항에 있어서, 정량화는 실시간 PCR에 의해 수행되는 것인 방법.
  36. 제35항에 있어서, 실시간 PCR은 다중복합 실시간 PCR인 방법.
  37. 제6항 내지 제36항 중 어느 한 항에 있어서, 단계 (c)가 존재하면, 단계 (d)의 정량화는, 단계 (c)로부터 획득된 DNA를 정량화 프라이머 쌍(들) 및 DNA 중합효소를 사용하여 증폭하는 것을 포함하고, 획득된 DNA의 적어도 일부분이 증폭되며; 단계 (c)가 부재하면, 단계 (d)의 정량화는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커를 정량화 프라이머 쌍(들) 및 DNA 중합효소를 사용하여 증폭하는 것을 포함하는 것인 방법.
  38. 제37항에 있어서, 단계 (c)가 존재하면, 단계 (d)에서 사용되는 정량화 프라이머 쌍(들)은, 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서 단계 (c)로부터 획득된 DNA의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있고; 단계 (c)가 부재하면, 단계 (d)에서 사용되는 정량화 프라이머 쌍(들)은, 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있는 것인 방법.
  39. 제38항에 있어서, 단계 (c)가 존재하면, 단계 (d)에서 사용되는 적어도 하나의 정량화 프라이머 쌍(들)은, 단계 (c)의 사전-증폭 프라이머 풀 중 적어도 하나의 메틸화-특이적 프라이머 쌍(들)과 동일한 것인 방법.
  40. 제38항에 있어서, 단계 (c)가 존재하면, 단계 (d)에서 사용되는 정량화 프라이머 쌍(들)은, 단계 (c)로부터 획득된 DNA 내의 적어도 일부분을 증폭하도록 디자인되고; 단계 (c)가 부재하면, 단계 (d)에서 사용되는 정량화 프라이머 쌍(들)은, 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커 내의 적어도 일부분을 증폭하도록 디자인되는 것인 방법.
  41. 제35항 내지 제40항 중 어느 한 항에 있어서, 단계 (d)는 검출제의 존재 하에서 수행되는 것인 방법.
  42. 제41항에 있어서, 검출제는 형광 프로브, 인터컬레이팅 염료, 발색단-표지된 프로브, 방사성동위원소-표지된 프로브, 및 바이오틴-표지된 프로브로 이루어진 군으로부터 선택되는 것인 방법.
  43. 제42항에 있어서, 형광 프로브는 서열번호 57-85, 172로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함하는 것인 방법.
  44. 제42항 또는 제43항에 있어서, 형광 프로브는 그의 5' 말단에서 형광 염료(예를 들어, FAM, HEX/VIC, TAMRA, Texas Red, 또는 Cy5)로 표지되고, 그의 3' 말단에서 소광제(quencher)(예를 들어, BHQ1, BHQ2, BHQ3, DABCYL 또는 TAMRA)로 표지되는 것인 방법.
  45. 제35항 내지 제44항 중 어느 한 항에 있어서, 단계 (e)는 단계 (d)의 표적 마커(들)의 Ct 값(들)을 기준 Ct 값과 비교하는 것을 포함하고, 적어도 하나의 표적 마커의, 그의 상응하는 기준 Ct 값에 비해서 동일하거나 더 낮은 Ct 값은, 대상체가 결장직장 신생물을 갖거나, 결장직장 신생물이 발생되거나 발생될 위험성이 있거나, 또는 결장직장 신생물이 발달되거나 발달될 확률이 증가되거나, 또는 결장직장 신생물의 불량한 예후 또는 불량한 예후의 위험성을 갖는다는 것을 나타내거나; 또는 적어도 하나의 표적 마커의, 치료 전 그의 상응하는 Ct 값에 비해서 더 높은 Ct 값은, 결장직장 신생물의 치료를 받은 대상체가 치료에 반응성임을 나타내는 것인 방법.
  46. 제4항 내지 제45항 중 어느 한 항에 있어서, 사전-증폭은 5 내지 30 사이클의 반응을 포함하고, 각 사이클은 40℃∼80℃에서 5초 내지 5분의 반응 전에 85℃∼99℃에서 5초 내지 5분의 반응을 포함하는 것인 방법.
  47. 제6항 내지 제46항 중 어느 한 항에 있어서, 단계 (c)가 존재하면, 단계 (d)의 정량화는, 단계 (c)로부터 획득된 DNA 중 다수의 CpG 디뉴클레오티드, TpG 디뉴클레오티드, 또는 CpA 디뉴클레오티드의 존재 또는 수준을 기반으로 메틸화 수준을 결정하는 것을 포함하고; 단계 (c)가 부재하면, 단계 (d)의 정량화는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커 중 다수의 CpG 디뉴클레오티드, TpG 디뉴클레오티드, 또는 CpA 디뉴클레오티드의 존재 또는 수준을 기반으로 적어도 하나의 표적 마커의 메틸화 수준을 결정하는 것을 포함하는 것인 방법.
  48. 제47항에 있어서, 단계 (c)가 존재하면, 단계 (d)의 정량화는, 단계 (c)로부터 획득된 DNA 중 하나 이상의 CpG 디뉴클레오티드의 존재 또는 수준을 기반으로 시토신 잔기(들)의 메틸화 수준을 결정하는 것을 포함하고; 단계 (c)가 부재하면, 단계 (d)의 정량화는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커 중 하나 이상의 CpG 디뉴클레오티드의 존재 또는 수준을 기반으로 시토신 잔기(들)의 메틸화 수준을 결정하는 것을 포함하는 것인 방법.
  49. 제6항 내지 제48항 중 어느 한 항에 있어서, 단계 (c)가 존재하면, 단계 (d)의 정량화는, 단계 (c)로부터 획득된 DNA를 다수의 분획으로 분할함으로써 수행되고; 단계 (c)가 부재하면, 단계 (d)의 정량화는 단계 (b)로부터 수득된 처리된 DNA 내의 적어도 하나의 표적 마커를 다수의 분획으로 분할함으로써 수행되는 것인 방법.
  50. 제6항 내지 제49항 중 어느 한 항에 있어서, 단계 (e)의 기준 수준은, 결장직장 신생물을 갖거나 또는 가질 위험성이 있는 개체의 그룹 및 결장직장 신생물을 갖지 않거나 또는 가질 위험성이 없는 개체의 그룹으로부터 수득된 임상 샘플을 기반으로 결정되는 것인 방법.
  51. 제1항 내지 제50항 중 어느 한 항에 있어서, 결장직장 신생물은 결장직장암, 거대 결장직장 선종, 및/또는 무경성 톱니상 용종인 방법.
  52. 제1항 내지 제51항 중 어느 한 항에 있어서, 결장직장 신생물은 전암성인 방법.
  53. 제1항 내지 제52항 중 어느 한 항에 있어서, 대상체는 인간인 방법.
  54. 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 위한 키트로서,
    (a). DNA를 처리하기 위한 제1 시약으로서, DNA에서 비메틸화 부위와 메틸화 부위를 구별할 수 있는 것인 제1 시약;
    (b). 임의로, 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 적어도 하나의 표적 마커 중 적어도 하나의 표적 서열을 사전-증폭하기 위한 적어도 하나의 프라이머 쌍을 포함하는 제1 프라이머 풀로서, 적어도 하나의 프라이머 쌍은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서, 제1 시약으로 처리된 적어도 하나의 표적 서열의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있고, 표적 서열은 적어도 하나의 CpG 부위를 포함하는 제1 프라이머 풀; 및
    (c). 제2 시약으로서, 제1 프라이머 풀이 존재하면, 제2 시약은 제1 프라이머 풀에 의해 사전-증폭된 적어도 하나의 표적 마커의 메틸화 수준을 정량화하기 위한 것이고; 제1 프라이머 풀이 부재하면, 제2 시약은 제1 시약으로 처리된 DNA 내의 적어도 하나의 표적 마커의 메틸화 수준을 정량화하기 위한 것이며, 적어도 하나의 표적 마커는 셉틴9, BCAT1, IKZF1, BCAN, VAV3, IRF4, POU4F2, SALL1, PKNOX2, SDC2, ASCL4, TMEFF2, SLC24A2, NDRG4, NKX2-6, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, CRHBP, 유전자간 영역 1, 유전자간 영역 2, 유전자간 영역 3, 유전자간 영역 4, 및 유전자간 영역 5로 이루어진 군으로부터 선택되는 하나 이상의 마커를 포함하는 것인 제2 시약
    을 포함하는, 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 위한 키트.
  55. 제54항에 있어서, 적어도 하나의 표적 마커는 다수의 표적 마커를 포함하고, 다수의 표적 마커는 셉틴9, BCAT1, 및 IKZF1로 이루어진 군으로부터 선택되는 적어도 2개의 마커를 포함하는 것인 키트.
  56. 제55항에 있어서, 제1 프라이머 풀이 존재하면, 제2 시약은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서, 제1 프라이머 풀에 의해 사전-증폭된 적어도 하나의 표적 서열의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있는 다수의 정량화 프라이머 쌍을 포함하는 제2 프라이머 풀을 포함하고; 제1 프라이머 풀이 부재하면, 제2 시약은 엄격 조건, 중등도 엄격 조건, 또는 고도 엄격 조건 하에서, 제1 시약으로 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 하나의 표적 서열의 적어도 9개의 연속 뉴클레오티드에 혼성화할 수 있는 다수의 정량화 프라이머 쌍을 포함하는 제3 프라이머 풀을 포함하는 것인 키트.
  57. 제56항에 있어서, 제2 프라이머 풀 중 적어도 하나의 정량화 프라이머 쌍은 제1 프라이머 풀 중 적어도 하나의 프라이머 쌍과 동일한 것인 키트.
  58. 제56항에 있어서, 제1 프라이머 풀이 존재하면, 제2 프라이머 풀의 정량화 프라이머 쌍은 제1 프라이머 풀에 의해 사전-증폭된 적어도 하나의 표적 서열 내 적어도 일부분을 증폭하도록 디자인되고; 제1 프라이머 풀이 부재하면, 제3 프라이머 풀의 정량화 프라이머 쌍은 제1 시약으로 처리된 DNA 내의 적어도 하나의 표적 마커의 적어도 하나의 표적 서열 내 적어도 일부분을 증폭하도록 디자인되는 것인 키트.
  59. 제54항 내지 제58항 중 어느 한 항에 있어서, 제1, 제2, 또는 제3 프라이머 풀은 적어도 하나의 메틸화-특이적 프라이머 쌍을 포함하는 것인 키트.
  60. 제56항 내지 제59항 중 어느 한 항에 있어서, 제1 프라이머 풀 및 제2 프라이머 풀은 단일 용기 또는 별개 용기에 포장되는 것인 키트.
  61. 제55항 내지 제60항 중 어느 한 항에 있어서, 하나 이상의 차단제 올리고뉴클레오티드를 더 포함하는 키트.
  62. 제55항 내지 제61항 중 어느 한 항에 있어서, 검출제를 더 포함하는 키트.
  63. 제62항에 있어서, 검출제는 형광 프로브, 인터컬레이팅 염료, 발색단-표지된 프로브, 방사성동위원소-표지된 프로브, 및 바이오틴-표지된 프로브로 이루어진 군으로부터 선택되는 것인 키트.
  64. 제63항에 있어서, 형광 프로브는 서열번호 57-85, 172로 이루어진 군으로부터 선택되는 올리고뉴클레오티드 서열을 포함하는 것인 키트.
  65. 제63항 또는 제64항에 있어서, 형광 프로브는 그의 5' 말단에서 형광 염료(예를 들어, FAM, HEX/VIC, TAMRA, Texas Red, 또는 Cy5)로 표지되고, 그의 3' 말단에서 소광제(예를 들어, BHQ1, BHQ2, BHQ3, DABCYL, TAMRA 또는 lowa Black Dark Quenchers)로 표지되는 것인 키트.
  66. 제55항 내지 제65항 중 어느 한 항에 있어서, DNA 중합효소 및/또는 대상체 유래 생물학적 샘플을 함유하기에 적합한 용기를 더 포함하는 키트.
  67. 제55항 내지 제66항 중 어느 한 항에 있어서, 사용 및/또는 키트 결과의 해석을 위한 설명서를 더 포함하는 키트.
  68. 제55항 내지 제67항 중 어느 한 항에 있어서, 제1 시약은 바이술파이트 시약 또는 메틸화 감응성 제한 효소(MSRE)를 포함하는 것인 키트.
  69. 제68항에 있어서, 바이술파이트 시약은 암모늄 바이술파이트, 나트륨 바이술파이트, 칼륨 바이술파이트, 칼슘 바이술파이트, 마그네슘 바이술파이트, 알루미늄 바이술파이트, 아황산수소 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 키트.
  70. 제68항에 있어서, MSRE는 HpaII, SalI, SalI-HF®, ScrFI, BbeI, NotI, SmaI, XmaI, MboI, BstBI, ClaI, MluI, NaeI, NarI, PvuI, SacII, HhaI 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 키트.
  71. 제55항 내지 제70항 중 어느 한 항에 있어서, 다수의 표적 마커는 BCAN, PKNOX2, VAV3, NDRG4, 및 IRF4로 이루어진 군으로부터 선택되는 하나 이상의 추가 마커를 더 포함하는 것인 키트.
  72. 제71항에 있어서, 다수의 표적 마커는 POU4F2, SALL1, SDC2, ASCL4, 유전자간 영역 1, TMEFF2, 유전자간 영역 4, NKX2-6, 유전자간 영역 5, SLC24A2, 유전자간 영역 2, 유전자간 영역 3, KCNA6, SOX1, HS3ST2, FGF12, KCTD8, HMX1, MARCH11, 및 CRHBP로 이루어진 군으로부터 선택되는 하나 이상의 추가 마커를 더 포함하는 것인 키트.
  73. 제54항 내지 제72항 중 어느 한 항에 있어서, 각각의 표적 마커는 a) 하기 기재된 Hg19 좌표로 정의되는 각각의 영역, 및 각각의 출발 부위의 상류 5 kb 및 상기 기술된 각 영역의 각각의 말단 부위의 하류 5 kb, 또는 b) a)의 바이술파이트 전환된 대응물, 또는 c) a)의 MSRE 처리된 대응물이거나 또는 그를 포함하는 것인 키트:
    Figure pct00024

    Figure pct00025
    .
  74. 제55항 내지 제73항 중 어느 한 항에 있어서, 제1 프라이머 풀이 존재하면, 제1 프라이머 풀은 서열번호 1/2, 3/4, 5/6, 7/8, 9/10, 11/12, 13/14, 15/16, 17/18, 19/20, 21/22, 23/24, 25/26, 27/28, 29/30, 31/32, 33/34, 35/36, 37/38, 39/40, 41/42, 43/44, 45/46, 47/48, 49/50, 51/52, 53/54, 170/171로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 적어도 하나의 쌍을 포함하거나 또는 그로 이루어진 적어도 하나의 프라이머 쌍을 포함하고, 임의로, 제2 프라이머 풀은 제1 프라이머 풀 중 적어도 하나의 프라이머 쌍과 동일한 적어도 하나의 프라이머 쌍을 포함하며; 제1 프라이머 풀이 부재하면, 제3 프라이머 풀은 서열번호 1/2, 3/4, 5/6, 7/8, 9/10, 11/12, 13/14, 15/16, 17/18, 19/20, 21/22, 23/24, 25/26, 27/28, 29/30, 31/32, 33/34, 35/36, 37/38, 39/40, 41/42, 43/44, 45/46, 47/48, 49/50, 51/52, 53/54, 및 170/171로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 적어도 하나의 쌍을 포함하거나 또는 그로 이루어진 적어도 하나의 프라이머 쌍을 포함하는 것인 키트.
  75. 제56항 내지 제74항 중 어느 한 항에 있어서, 제1 프라이머 풀, 제2 프라이머 풀, 또는 임의로 제3 프라이머 풀은 대조 마커를 증폭하기 위한 프라이머 쌍을 더 포함하는 것인 키트.
  76. 제75항에 있어서, 대조 마커는 ACTB, GAPDH, 튜불린, ALDOA, PGK1, LDHA, RPS27A, RPL19, RPL11, ARHGDIA, RPL32, C1orf43, CHMP2A, EMC7, GPI, PSMB2, PSMB4, RAB7A, REEP5, SNRPD3, VCP, 및 VPS29로 이루어진 군으로부터 선택되는 것인 키트.
  77. 제54항 내지 제76항 중 어느 한 항에 있어서, 제2 프라이머 풀의 분획을 각각 수용하기 위한 다수의 용기를 더 포함하는 키트.
  78. 대상체에서 결장직장 신생물의 진단, 결장직장 신생물의 발생 또는 발생 위험성에 대한 스크리닝, 또는 결장직장 신생물의 발달 또는 예후의 평가를 위한, 또는 결장직장 신생물의 치료를 받은 대상체에서 치료 반응의 모니터링을 위한 진단 키트의 제조에서의 제54항 내지 제77항 중 어느 한 항의 키트의 용도.
KR1020227036453A 2020-03-20 2021-03-01 결장직장 신생물의 스크리닝을 위한 방법 및 키트 KR20220156899A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CNPCT/CN2020/080469 2020-03-20
CN2020080469 2020-03-20
CNPCT/CN2021/074409 2021-01-29
CN2021074409 2021-01-29
PCT/CN2021/078445 WO2021185061A1 (en) 2020-03-20 2021-03-01 Methods and kits for screening colorectal neoplasm

Publications (1)

Publication Number Publication Date
KR20220156899A true KR20220156899A (ko) 2022-11-28

Family

ID=77771914

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227036453A KR20220156899A (ko) 2020-03-20 2021-03-01 결장직장 신생물의 스크리닝을 위한 방법 및 키트

Country Status (10)

Country Link
US (1) US20230193395A1 (ko)
EP (1) EP3911756A4 (ko)
JP (1) JP2023517394A (ko)
KR (1) KR20220156899A (ko)
CN (1) CN114207153A (ko)
AU (1) AU2021238717A1 (ko)
CA (1) CA3173044A1 (ko)
IL (1) IL296453A (ko)
TW (1) TW202144586A (ko)
WO (1) WO2021185061A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114574584A (zh) * 2021-11-30 2022-06-03 江苏鹍远生物技术有限公司 一组肿瘤检测标志物及其用途
WO2024056008A1 (zh) * 2022-09-16 2024-03-21 江苏鹍远生物科技股份有限公司 鉴别癌症的甲基化标志物及应用

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6017704A (en) 1996-06-03 2000-01-25 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
DE10147439B4 (de) 2001-09-26 2014-01-30 Qiagen Gmbh Verfahren zur Isolierung von DNA aus biologischen Proben
EP1626085A1 (en) 2004-08-10 2006-02-15 Agilent Technologies, Inc. Devices and methods for isolating RNA
BR112014028122B1 (pt) * 2012-05-11 2022-08-23 Commonwealth Scientific And Industrial Research Organisation Método para triar o princípio ou a predisposição ao princípio de neoplasma no intestino grosso ou para monitorar neoplasma no intestino grosso em indivíduo
EP3126529B1 (en) * 2014-03-31 2020-05-27 Mayo Foundation for Medical Education and Research Detecting colorectal neoplasm
BR112016028521B1 (pt) * 2014-06-04 2023-03-14 Clinical Genomics Pty Ltd Métodos para triagem de um neoplasma colorretal e para análise de metilação de dna, e, composição de oligonucleotídeos
WO2016094839A2 (en) * 2014-12-12 2016-06-16 Exact Sciences Corporation Compositions and methods for performing methylation detection assays
CN108350485A (zh) * 2015-10-30 2018-07-31 精密科学发展有限责任公司 血浆dna的多重扩增检测测定以及分离和检测
AU2018211956A1 (en) * 2017-01-27 2019-07-25 Exact Sciences Corporation Detection of colon neoplasia by analysis of methylated DNA
CN108624684B (zh) * 2017-03-24 2023-07-14 北京艾克伦医疗科技有限公司 基于多个基因诊断结肠癌患者的检测试剂盒
EP3792362A4 (en) * 2018-01-23 2021-11-17 Excellen Medical Technology Co., Ltd. METHOD AND KIT FOR IDENTIFYING THE STATE OF COLORECTAL CANCER
AU2019253569A1 (en) * 2018-04-12 2020-10-29 Singlera Genomics, Inc. Compositions and methods for cancer or neoplasia assessment
CN108642180A (zh) * 2018-05-21 2018-10-12 上海锐翌生物科技有限公司 检测sdc2基因甲基化的方法和试剂盒

Also Published As

Publication number Publication date
TW202144586A (zh) 2021-12-01
IL296453A (en) 2022-11-01
AU2021238717A1 (en) 2022-08-25
WO2021185061A1 (en) 2021-09-23
EP3911756A4 (en) 2022-08-10
JP2023517394A (ja) 2023-04-25
EP3911756A1 (en) 2021-11-24
CN114207153A (zh) 2022-03-18
US20230193395A1 (en) 2023-06-22
CA3173044A1 (en) 2021-09-23

Similar Documents

Publication Publication Date Title
US6605432B1 (en) High-throughput methods for detecting DNA methylation
KR101708544B1 (ko) 세포 증식 질환을 분석하기 위한 방법 및 핵산
DK2644711T3 (en) A method for diagnosing neoplasms
KR102046668B1 (ko) 암 대상자의 예후를 결정하기 위한 방법 및 핵산
KR101778036B1 (ko) 전립선암 마커로서의 포스포디에스테라제 4d7
KR102110469B1 (ko) 악성의 호르몬 민감성 전립선 암에 대한 마커로서의 포스포디에스테라제 4d7
KR20210027384A (ko) Scn9a 발현을 조절하기 위한 올리고뉴클레오티드
GB2424886A (en) Polynucleotide primers against epidermal growth factor receptor and method of detecting gene mutations
CN106636344B (zh) 一种基于二代高通量测序技术的地中海贫血症的基因检测试剂盒
CN109476698B (zh) 基于基因的炎性肠病诊断
CN101258250A (zh) 用于乳腺癌的诊断的方法
KR20130123357A (ko) 저산소증과 관련된 질환의 진단방법 및 키트
KR20220156899A (ko) 결장직장 신생물의 스크리닝을 위한 방법 및 키트
KR20090087486A (ko) 타입 2 당뇨병의 유전적 감수성 변이
CN101631876A (zh) 2型糖尿病的遗传易感性变体
CN101864480B (zh) 一种癌症筛检的方法
AU2018360287B2 (en) Method for determining the response of a malignant disease to an immunotherapy
KR20120083868A (ko) 실시간 중합효소 연쇄반응을 이용한 표적 유전자의 단일 염기 다형성 판별 방법 및 이를 이용한 표적 유전자의 단일 염기 다형성 판별 키트
KR20170116009A (ko) 전립선암의 진단을 위한 신규한 rna-바이오마커 시그니처
KR101474053B1 (ko) 골다공증 또는 골다공성 골절 발생 위험도 예측용 다형성 마커
CN114908159A (zh) 结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒
KR102458466B1 (ko) Snp를 검출 또는 증폭할 수 있는 제제를 포함하는 소의 등지방두께 판별용 조성물 및 이를 포함하는 키트
KR102642320B1 (ko) 항암제에 대한 내성 진단용 조성물
US20030124536A1 (en) Diagnosis and treatment of vascular disease
CN117836411A (zh) 使用α-N-乙酰半乳糖胺α-2,6-唾液酸转移酶5(ST6GALNAC5)抑制剂治疗认知障碍