KR20180108820A - 암 후생유전적 프로파일링 - Google Patents

암 후생유전적 프로파일링 Download PDF

Info

Publication number
KR20180108820A
KR20180108820A KR1020187026079A KR20187026079A KR20180108820A KR 20180108820 A KR20180108820 A KR 20180108820A KR 1020187026079 A KR1020187026079 A KR 1020187026079A KR 20187026079 A KR20187026079 A KR 20187026079A KR 20180108820 A KR20180108820 A KR 20180108820A
Authority
KR
South Korea
Prior art keywords
enhancer
super
biological sample
cancer
cancerous biological
Prior art date
Application number
KR1020187026079A
Other languages
English (en)
Inventor
패트릭 탄
웬 퐁 우이
Original Assignee
에이전시 포 사이언스, 테크놀로지 앤드 리서치
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에이전시 포 사이언스, 테크놀로지 앤드 리서치 filed Critical 에이전시 포 사이언스, 테크놀로지 앤드 리서치
Publication of KR20180108820A publication Critical patent/KR20180108820A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/5308Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6875Nucleoproteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Abstract

본 발명은 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 검출하는 방법에 관한 것이다. 본 발명은 또한 대상체에서 적어도 하나의 암 관련 슈퍼-인핸서의 존재를 결정하는 방법, 대상체에서 암의 예후를 결정하는 방법, 암 또는 위장 질환에 대한 대상체의 감수성을 결정하는 방법, 세포에서 적어도 하나의 암 관련 슈퍼-인핸서의 활성을 조절하는 방법 및 대상체에서 암을 검출하기 위한 바이오마커에 관한 것이다.

Description

암 후생유전적 프로파일링
관련 출원의 상호 참조
본원은 2016년 2월 16일자로 출원된 싱가포르 출원 제10201601141X호 및 2016년 8월 16일자로 출원된 싱가포르 출원 제10201606828P호의 우선권의 이점을 주장하고, 이들의 내용은 모든 목적을 위해 그 전체가 본원에 참고로 인용된다.
본 발명은 암, 특히 암의 조절 요소에 관한 것이다.
비정상적인 유전자 발현 패턴은 증식, 침입 및 전이와 같은 임상적으로 중요한 특성을 구동하는 인간 악성 종양의 보편적인 특징이다. 체세포 돌연변이, 카피 수의 변경, 및 구조적 변화를 포함하는 DNA 서열 기반 변경이 신호전달 분자와 전사 인자(TF)의 활성 및 발현을 변경함으로써 암 전사체를 재프로그램화하는 능력을 갖는다. 단백질 코딩 유전자 외에, 인핸서와 같은 비코딩 게놈 영역에서 시스-조절 요소는 또한 TF 접근성을 촉진시키거나 제한하여 전사 프로그램에 영향을 미칠 수 있다.
인핸서는 프로모터 및 전사 개시 부위(TSS) 원위부 국소 조절 요소이다. 인간 게놈의 10-15%를 차지하는 인핸서는 큰 거리(> 1 Mb)에서 하나 이상의 유전자를 조절함으로써 세포 동일성 및 조직 특이적 발현에 중요한 역할을 하는 것으로 나타났다. 인핸서는 인간의 질환에 중요한 역할을 하고, 그들의 중요성은 상이한 세포 유형 및 질환 상태에서 인핸서 카탈로그의 필요성을 제기한다. 암의 조절 요소를 프로파일링하기 위한 연구가 존재하였고, 지금까지 이러한 연구의 대부분은 두 가지 제한을 갖는 시험관내 배양 암 세포주에 의존했다. 첫째, 시험관내 세포주는 반복 계대 후 상당한 후생유전적 변경을 경험하는 것으로 공지되어 있다. 둘째, 많은 암 세포주의 경우, 일치하는 정상 대응물은 자주 이용가능하지 않아 진정한 체세포 변경을 동정하는 능력을 복잡하게 한다. 따라서, 상기한 단점 중 하나 이상을 극복하거나 적어도 개선시키는 암의 조절 요소를 프로파일링하는 방법이 필요하다.
하나의 측면에서, 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서(super-enhancer)의 존재 또는 부재를 결정하는 방법으로서,
a) 대상체로부터 수득된 암성 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체와 접촉시키는 단계;
b) 상기 암성 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역을 포함하는, 단계;
c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호 강도에 기초하는 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
d) 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
e) 비암성 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호 강도에 대해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계; 및
f) 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계를 포함하는, 방법이 제공된다.
하나의 측면에서, 대상체에서 적어도 하나의 암 관련 슈퍼-인핸서의 존재를 결정하는 방법으로서,
a) 상기 대상체로부터 수득된 암성 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체와 접촉시키는 단계;
b) 상기 암성 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역을 포함하는, 단계;
c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호 강도에 기초하는 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
d) 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
e) 비암성 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호 강도에 대해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계; 및
f) 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 대상체에서 적어도 하나의 암 관련 슈퍼-인핸서의 존재를 결정하는 단계를 포함하고,
상기 비암성 생물학적 샘플에 비해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 증가된 신호 강도가 적어도 하나의 암 관련 슈퍼-인핸서의 존재의 지표인, 방법이 제공된다.
하나의 측면에서, 대상체에서 암을 검출하기 위한 바이오마커(biomarker)로서, 상기 바이오마커가 정상적 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 H3K27ac의 증가된 신호 강도를 갖는 적어도 하나의 슈퍼-인핸서, 또는 변경되지 않은 슈퍼-인핸서에 비해 암 관련 전사 인자 결합 부위에서 증가와 관련된 적어도 하나의 슈퍼-인핸서 또는 둘 다를 포함하는, 바이오마커가 제공된다.
하나의 측면에서, 대상체에서 암의 예후를 결정하는 방법으로서,
a) 상기 대상체로부터 수득된 암성 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체와 접촉시키는 단계;
b) 상기 암성 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역을 포함하는, 단계;
c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호에 기초하여 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
d) 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
e) 비암성 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호 강도에 대해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계; 및
f) 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 대상체에서 적어도 하나의 암 관련 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계를 포함하고,
상기 적어도 하나의 암 관련 슈퍼-인핸서의 존재 또는 부재가 상기 대상체에서 암 예후의 지표인, 방법이 제공된다.
하나의 측면에서, 암 또는 위장 질환에 대한 대상체의 민감성을 결정하는 방법으로서,
a) 상기 대상체로부터 수득된 암성 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체와 접촉시키는 단계;
b) 상기 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역을 포함하는, 단계;
c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호 강도에 기초하는 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
d) 상기 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
e) 대조군 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호에 대해 상기 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계;
f) 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 상기 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계; 및
g) 암 또는 위장 질환 관련 SNP를 포함하는 참조 게놈 서열에 대해 상기 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 매핑하는 단계를 포함하고,
상기 하나 이상의 암 또는 위장 질환 관련 SNP와 관련된 적어도 하나의 슈퍼-인핸서의 존재 또는 부재가 상기 대상체의 암 또는 위장 질환에 대한 민감성의 지표인, 방법이 제공된다.
하나의 측면에서, 세포에 CDX2 및/또는 HNF4α의 억제제를 투여하는 단계를 포함하는, 세포에서 적어도 하나의 암 관련 슈퍼-인핸서의 활성을 조절하는 방법이 제공된다.
하나의 측면에서, 대상체에서 암을 검출하는데 사용하기 위한, 정상적 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 H3K27ac의 증가된 신호 강도를 갖는 적어도 하나의 슈퍼-인핸서, 또는 변경되지 않은 슈퍼-인핸서에 비해 암 관련 전사 인자 결합 부위의 증가와 관련된 적어도 하나의 슈퍼-인핸서, 또는 둘 다를 포함하는 바이오마커가 제공된다.
하나의 측면에서, 대상체에서 암을 검출하기 위한 약제를 제조하는데 있어서, 정상적 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 H3K27ac의 증가된 신호 강도를 갖는 적어도 하나의 슈퍼-인핸서, 또는 변경되지 않은 슈퍼-인핸서에 비해 암 관련 전사 인자 결합 부위의 증가와 관련된 적어도 하나의 슈퍼-인핸서, 또는 둘 다를 포함하는 바이오마커의 용도가 제공된다.
하나의 측면에서, 세포에서 적어도 하나의 암 관련 슈퍼-인핸서의 활성을 조절하는데 사용하기 위한 CDX2 및/또는 HNF4α의 억제제가 제공된다.
하나의 측면에서, 세포에서 적어도 하나의 암 관련 슈퍼-인핸서의 활성을 조절하기 위한 약제를 제조하는데 있어서 CDX2 및/또는 HNF4α의 억제제의 용도가 제공된다.
하나의 측면에서, 대상체로부터 수득된 암성 샘플학적 샘플에서 암 세포 생존 또는 암 세포 생존능을 예측하는 방법으로서,
a) 상기 암성 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체와 접촉시키는 단계;
b) 상기 암성 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역을 포함하는, 단계;
c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호 강도에 기초하는 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
d) 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
e) 비암성 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호 강도에 대해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계; 및
f) 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 대상체에서 적어도 하나의 암 관련 슈퍼-인핸서의 존재를 결정하는 단계를 포함하고,
상기 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 증가된 신호 강도가 암 세포 생존 또는 암 세포 생존능의 지표인, 방법이 제공된다.
정의
본원에 사용된 다음 단어 및 용어는 지시된 의미를 갖는다:
용어 "슈퍼-인핸서"는 서로 근접하여 발생하는 DNA 인핸서 요소의 클러스터를 의미한다. DNA 인핸서 요소는 이펙터 유전자 발현 프로그램을 조절하기 위해 다양한 세포 및 신호전달 입력을 통합할 수 있는 DNA의 영역이다. 전형적인 인핸서와 비교하여, 슈퍼-인핸서는 크기가 더 클 수 있고, 더 높은 전사 인자 결합 밀도를 나타낼 수 있고, 유전자좌 조절 영역(LCR), DNA 메틸화 밸리, 전사 개시 플랫폼 및 스트레치 인핸서와 유사한 중요한 세포 동일성 조절제와 더 강하게 관련될 수 있다. 슈퍼-인핸서는 또한 질환 관련 유전자 변이체에서 농축될 수 있고, 주요 종양 유전자에서 암 세포에 의해 획득될 수 있고, 치료 섭동에 보다 민감할 수 있다.
용어 "히스톤 변형"은 히스톤 단백질의 공유 결합 변형을 의미한다. 히스톤 변형은 메틸화, 인산화, 아세틸화, 유비퀴틴화 및 수모일화를 포함하지만, 이에 제한되지 않는다. 히스톤의 변형은 크로마틴 구조를 변경할 수 있고, 유전자 발현에 영향을 미칠 수 있다. 일반적으로, 히스톤의 변형은 하나 이상의 히스톤 중의 하나 이상의 아미노산에서 발생할 수 있는 것으로 이해된다.
용어 "주석이 달린 게놈 서열"은 코딩 및 비코딩 영역, 조절 영역 또는 모티프, 전사 개시 부위 및 유전자를 포함하지만, 이에 제한되지 않는 정보가 동정된 게놈 서열을 의미한다. 용어 "주석이 달린 전사 개시 부위"는 동정된 전사 개시 부위를 의미한다.
본원에 사용된 용어 "참조", "대조군" 또는 "표준"은 비교가 수행될 수 있는 샘플 또는 대상체를 의미한다. "참조", "대조군" 또는 "표준"의 예는 동일한 대상체로부터 수득된 비암성 샘플, 비전이성 종양으로부터 수득된 샘플, 암을 갖지 않는 대상체로부터 수득된 샘플 또는 상이한 암 하위유형을 갖는 대상체로부터 수득된 샘플을 포함한다. 본원에 사용된 용어 "참조", "대조군" 또는 "표준"은 또한 크로마틴 변형의 평균 신호 강도를 의미할 수 있다. 본원에 사용된 용어 "참조", "대조군" 또는 "표준"은 또한 암으로 고통받지 않거나 상이한 유형의 암으로 고통받고 있는 대상체를 의미한다. 본원에 사용된 용어 "참조", "대조군" 또는 "표준"은 또한 비교가 수행될 수 있는 핵산 서열을 의미한다. 예를 들어, 참조, 대조군 또는 표준은 형질감염되지 않은 세포일 수 있다.
본원에 사용된 용어 "암성"은 암의 이상 특징에 의해 영향을 받거나 암의 이상 특징을 나타내는 것에 관한 것이다.
본원에 사용된 용어 "항체" 또는 "항체들"은 면역글로불린형 도메인을 갖는 분자를 의미하고, 항원 결합 단편, 모노클로날, 재조합, 폴리클로날, 키메라, 완전 인간, 인간화, 이중특이적 및 이종접합체 항체; 단일 가변 도메인, 단일 쇄 Fv, 도메인 항체, 면역학적으로 효과적인 단편 및 디아바디를 포함한다.
본원에 사용된 용어 "단리된" 또는 "단리하는"은 성분이 자연적으로 발생하는 유기체의 세포에서 다른 생물학적 성분으로부터 실질적으로 분리되거나 정제된 생물학적 성분(예: 핵산 분자, 단백질 또는 세포 소기관), 즉 다른 염색체 및 염색체외 DNA 및 RNA, 단백질 및 세포 소기관을 의미한다. "단리된" 핵산 및 단백질은 표준 정제 방법에 의해 정제된 핵산 및 단백질을 포함한다. 상기 용어는 또한 화학적으로 합성된 핵산 뿐만 아니라 숙주 세포에서 재조합 발현에 의해 제조된 핵산 및 단백질을 포함한다.
본원에 사용된 용어 "핵산"은 일본쇄 또는 이본쇄 형태의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중합체를 의미하고, 다르게 제한되지 않는 한, 자연 발생 뉴클레오티드와 유사한 방식으로 핵산으로 하이브리드화하는 천연 뉴클레오티드의 공지된 유사체를 포함한다. "뉴클레오티드"는 펩티드 핵산(PNA)에서와 같이 당에 연결된 염기, 예를 들어, 피리미딘, 퓨린 또는 이의 합성 유사체 또는 아미노산에 연결된 염기를 포함하는 단량체를 포함한다. 뉴클레오티드는 폴리뉴클레오티드의 하나의 단량체이다. 뉴클레오티드 서열은 폴리뉴클레오티드의 염기 서열을 의미한다.
본원에 사용된 용어 "바이오마커"는 생물학적 상태 또는 조건의 지표를 의미한다.
본원에 사용된 용어 "샘플" 또는 "생물학적 샘플"은 대상체로부터 수득되거나 제거되거나 단리된 하나 이상의 세포, 세포의 단편, 조직 또는 유체를 의미한다. 본원에 사용된 용어 "로부터 수득되거나 유래된"은 포괄적으로 사용되는 것을 의미한다. 즉, 생물학적 샘플로부터 직접 단리된 임의의 뉴클레오티드 서열 또는 상기 샘플로부터 유래된 임의의 뉴클레오티드 서열을 포함하는 것으로 의도된다. 샘플의 예는 종양 조직 생검이다. 샘플은 동결된 새로운 조직, 파라핀 매립 조직 또는 포르말린 고정 파라핀 매립(FFPE) 조직일 수 있다. 생물학적 샘플 또는 유체 샘플의 예는 혈액, 대변, 혈청, 타액, 소변, 뇌척수액 및 골수액을 포함하나, 이에 제한되지 않는다.
본원에 사용된 용어 "예후" 또는 이의 문법적 변형은 임상적 상태 또는 질환의 가능한 경로 및 결과의 예측을 의미한다. 환자의 예후는 일반적으로 질환의 유리하거나 불리한 경과 또는 결과를 나타내는 질환의 인자 또는 증상을 평가함으로써 이루어진다. 용어 "예후"는 100% 정확도로 상태의 경과 또는 결과를 예측하는 능력을 의미하지 않는다. 대신, 용어 "예후"는 특정 경과 또는 결과가 발생할 가능성이 증가되었음을 의미하고; 즉, 경과 또는 결과가 그 상태를 나타내지 않는 개체와 비교할 때 소정의 상태를 나타내는 환자에서 발생할 확률이 높다는 것을 의미한다.
본원에 사용된 용어 "암에 대한 민감성"은 대상체가 암을 발생시킬 가능성 또는 확률을 의미한다. 암에 민감한 대상체는 이미 암을 앓고 있거나 앓고 있지 않거나, 상이한 종류의 암을 앓고 있을 수 있다.
본원에 사용된 용어 "억제제"는 생물학적 활성을 감소시키거나 억제하는 제제를 의미한다. 예를 들어, 억제제는 유전자의 발현을 감소시키거나 사일런싱할 수 있다. 억제제는 또한 단백질, 효소 또는 전사 인자의 활성을 감소시킬 수 있다. 억제제의 예는 올리고뉴클레오티드, 소분자 또는 화합물을 포함하나, 이에 제한되지 않는다. 올리고뉴클레오티드는 작은 간섭성 RNA (siRNA) 또는 짧은 헤어핀 RNA (shRNA)를 포함하나, 이에 제한되지 않는 간섭성 RNA (iRNA)일 수 있다. 소분자는 일반적으로 당해 기술 분야에서 저분자량을 갖는 화합물로서 이해될 것이다. 억제제의 다른 예는 클러스터링된 규칙적으로 간격을 둔 짧은 회문 반복 (CRISPR) 게놈 편집 시스템일 수 있다. CRISPR 게놈 편집 시스템은 CRISPR/Cas 시스템일 수 있다. CRISPR/Cas 시스템은 게놈을 변형시킴으로써 유전자 발현을 억제할 수 있다. 게놈의 변형은 뉴클레오티드의 결실, 삽입 또는 치환을 포함하나, 이에 제한되지 않는다. CRISPR/Cas 시스템은 또한 하나 이상의 히스톤의 번역후 변형에 의해 유전자 발현을 억제할 수 있다. 일부 구현예에서, CRISPR/Cas 시스템은 CRISPR/Cas9일 수 있다.
본 명세서 전반에 걸쳐, 특정 구현예는 범위 포맷으로 개시될 수 있다. 범위 포맷의 설명은 단지 편의상 및 간략화를 위한 것이며, 개시된 범위의 범주에 대한 융통성 없는 제한으로서 해석되어서는 안된다. 따라서, 범위의 설명은 구체적으로 개시된 모든 가능한 하위 범위뿐만 아니라 그 범위 내의 개별적 수치 값을 갖는 것으로 고려되어야 한다. 예를 들어, 1 내지 6과 같은 범위의 설명은 구체적으로 개시된 하위 범위, 예를 들어, 1 내지 3, 1 내지 4, 1 내지 5, 2 내지 4, 2 내지 6, 3 내지 6 등 뿐만 아니라 그 범위 내의 개별적 수치 값, 예를 들어, 1, 2, 3, 4, 5, 및 6을 갖는 것으로 고려되어야 한다. 이는 범위의 폭에 관계 없이 적용된다.
특정 구현예는 또한 본원에서 광범위하게 일반적으로 기재될 수 있다. 일반적인 개시 내용에 속하는 보다 협소한 종 및 하위속 그룹 각각은 또한 명세서의 일부를 형성한다. 이는 절제된 물질이 구체적으로 본원에서 인용되는지의 여부와 관계없이 속으로부터 임의의 주제를 제거하는 단서 또는 부정적인 제한을 갖는 구현예의 일반적인 설명을 포함한다.
문맥이 달리 필요로 하거나 구체적으로 반대로 명시되지 않는 한, 단수의 정수, 단계 또는 요소로서 본원에 인용된 본 발명의 정수, 단계 또는 요소는 단수 및 복수 형태의 인용된 정수, 단계 또는 요소를 포함한다.
"실질적으로"라는 단어는 "완전히"를 배제하지 않는다, 예를 들어, Y가 "실질적으로 없는" 조성물은 완전히 Y가 없을 수 있다. 필요할 경우, "실질적으로"라는 단어는 본 발명의 정의로부터 생략될 수 있다.
본원에 예시적으로 기재된 본 발명은 본원에 구체적으로 개시되지 않은 임의의 요소 또는 요소들, 제한 또는 제한들의 부재하에 적합하게 실시될 수 있다. 따라서, 예를 들어, 용어 "포함하는(comprising)", "포함하는(including)", "함유하는" 등은 광범위하게 제한 없이 판독되어야 한다. 추가로, 본원에 사용된 용어 및 표현은 설명의 용어로서 제한 없이 사용되었고, 도시되고 기재된 특징 또는 그의 일부의 임의의 등가물을 배제하는 용어 및 표현의 사용에 대한 의도는 없지만 청구된 본 발명의 범위 내에서 다양한 변형이 가능하다는 것이 인식된다. 따라서, 본 발명은 바람직한 구현예 및 임의의 특징들에 의해 구체적으로 개시되었지만, 본원에 개시된 구체화된 본 발명의 변형 및 변화는 당업자에 의해 가능할 수 있고, 이러한 변형 및 변화는 본 발명의 범주 내에 있는 것으로 간주되는 것으로 이해되어야 한다.
본 발명은 본원에서 광범위하게 일반적으로 기재되었다. 일반적인 개시 내용에 속하는 더 협소한 종 및 하위속 그룹 각각은 또한 본 발명의 일부를 형성한다. 이는 절제된 물질이 본원에서 구체적으로 인용되는지의 여부와 관계 없이 속으로부터 임의의 주제를 제거하는 단서 또는 부정적인 제한을 갖는 본 발명의 일반적인 설명을 포함한다.
다른 구현예는 다음 청구범위 및 비제한적인 실시예 내에 있다. 또한, 본 발명의 특징 또는 측면이 마커시(Markush) 그룹으로 기재되는 경우, 당업자는 본 발명이 또한 이로써 마커시 그룹의 임의의 개별 구성원 또는 구성원의 하위그룹의 관점에서 기재된다는 것을 인식할 것이다.
본 발명은 비제한적인 실시예 및 이하 동반되는 도면과 함께 고려될 때 상세한 설명을 참조하여 더 잘 이해될 것이다:
도 1 GC 세포주의 원위 예측된 인핸서 경관.
a. OCUM-1 및 NCC59 GC 세포의 히스톤 프로파일은 DDX47 전사 개시 부위(TSS) 주위의 H3K27ac 및 H3K4me3의 농축을 나타낸다. H3K27ac 농축을 나타내고 DDX47 TSS로부터 >2.5Kb 떨어진 예측된 인핸서 요소가 동정되었다.
b. 예측된 인핸서 주위의 상위 2000개의 예측된 인핸서 및 게놈 전체 평균 H3K27ac 신호의 활성을 가시화하는 11개의 GC 세포주 중 4개에서 원위 H3K27ac 프로파일의 스냅 사진.
c. GC 세포주에서 예측된 인핸서 및 활성 TSS 주위의 게놈 전체 평균 H3K4me3 신호.
d. 세포주의 수의 함수로서, 두 개 이상의 위암 세포주에서 발견된 일반적인 조절 요소(인핸서 - 암회색; 프로모터 - 밝은 회색)의 백분율.
e. 예측된 인핸서 대 무작위로 선택된 영역의 크로마틴 접근성. 정상 위 조직42으로부터의 DNase I 과민성(DHS) 데이터는 대용물(surrogate)로서 사용되었다. DHS 신호의 분포는 통계적 유의성을 위해 단측 웰치 t-테스트(one-side Welch's t-test)를 사용하여 시험되었다.
f. 9개의 상이한 조직/세포 카테고리에서 유래하는 5개의 후생유전적 프로파일로부터 예측된 인핸서, 크로마틴 접근가능한 영역(DHS+로서 표시됨, x-축) 및 활성 조절 요소(H3K27ac+로서 표시됨, y-축) 사이의 중첩 백분율.
g. EP300 및 전사 인자 결합 부위와 중첩되는 예측된 인핸서의 백분율.
h. 예측된 인핸서와 무작위로 선택된 영역에서 최대 Phast 스코어(DNA 서열 보존의 척도)의 분포.
도 2 GC 세포주 유래 예측된 슈퍼-인핸서
a. H3K27ac ChIP-seq 신호의 분포는 불균등하게 높은 H3K27ac 신호를 나타내는 예측된 슈퍼-인핸서의 위치를 나타낸다. 예측된 슈퍼-인핸서에 근접한 공지된 암 관련 유전자가 표시된다. 2개의 세포주가 도시된다.
b. 증가하는 수의 GC 세포주에 걸쳐 무작위로 선택된 영역 이상(>99%)의 H3K27ac 농축을 나타내는 원위 조절 요소(예측된 전형적인 인핸서 - 밝은 회색, 예측된 슈퍼-인핸서 - 암회색)의 백분율.
c. MALAT1 유전자좌에서 H3K27ac ChIP-seq 신호는 높은 H3K27ac 신호를 갖는 예측된 슈퍼-인핸서(채워진 박스 중)에 상응하는 예측된 인핸서의 스트레치를 보여준다.
d. 반복적인 원위 조절 요소(예측된 슈퍼-인핸서 및 상위 예측된 전형적인 인핸서)와 관련된 상위 유의하게 관련된 생물학적 과정의 예. GOrilla로부터의 음성의 로그-변환 원료 p-값이 사용되었다.
도 3 1차 GC 및 정합된 정상 샘플에서 체세포 예측된 슈퍼-인핸서.
a. 19개의 1차 종양 및 정합된 정상 샘플에서 세포주 유래 예측된 슈퍼-인핸서의 활성. 컬럼-변환 RPKM 값(z-스코어)의 단위로 H3K27ac 예측된 슈퍼-인핸서 신호가 가시화되었다. 시험관내 GC 라인에서 활성 예측된 슈퍼-인핸서의 빈도는 상단 히스토그램(블랙, 히트맵 위)으로서 제시된다. 예측된 슈퍼-인핸서는 체세포 증가, 체세포 손실, 변경되지 않음 및 불활성으로 분류되었다. 각 카테고리에서, 예측된 슈퍼-인핸서는 종양 샘플과 정상 샘플 사이의 감소하는 평균 차이로 정렬시켰다(왼쪽에서 오른쪽으로).
b. 재발성 체세포 증가 예측된 슈퍼-인핸서 신호를 이용하는 주성분 분석은 종양 샘플과 정상 샘플 사이의 분리를 확립한다.
c. 체세포 증가, 체세포 손실 및 변경되지 않은 3개의 예측된 슈퍼-인핸서 카테고리에서 5개의 종양 및 정합된 정상 샘플로부터 H3K4me1 프로파일을 사용하는 H3K4me1(T-N) 신호(RPKM)의 차이. *P<2.2x10-16, 단측 웰치 t-테스트.
d. 예측된 슈퍼-인핸서의 시차 β 값은 종양 및 정합된 정상 샘플 사이의 메틸화 상태: 과메틸화(>0) 또는 저메틸화(<0)를 나타낸다.
e. ABLIM2 유전자좌에서 체세포 증가 예측된 슈퍼-인핸서에서 DNA 저메틸화.
f. SLC1A2 유전자좌에서 체세포 감소 예측된 슈퍼-인핸서에서 DNA 과메틸화.
도 4 유전자 발현 및 크로마틴 상호작용을 갖는 체세포 예측된 슈퍼-인핸서 사이의 연관성
a. 상이한 부류의 예측된 슈퍼-인핸서(변경되지 않음, 체세포 증가, 체세포 손실)의 유전자 발현 및 예측된 표적 유전자 발현 사이의 로그-변환 배수 변화 사이의 상관관계.
b. 12개의 체세포 증가 예측된 슈퍼-인핸서를 포함하는 20개의 포획 지점으로부터 상호작용 히트 맵. 각 환은 블랙 화살표로 표시된 단일 포획 지점으로부터의 프로파일을 나타낸다. 예측된 슈퍼-인핸서의 위치는 각 환에서 유전자좌 유전자에 의해 표시된다. 게놈 전체 상호작용 신호는 100kb 빈에서 게놈에 걸쳐서 계산되었다. 포획 지점에 인접하는 2백만 염기 내 영역에서 신호가 가시화되었다.
c. CLDN4 유전자좌에서 체세포 증가 예측된 슈퍼-인핸서의 예 및 인접하는 유전자와의 상호작용. 체세포 증가 활성은 1차 GC에서 CLDN4 및 인접하는 유전자(CLDN3ABHD11)의 상향 조절과 관련된다. 상호작용은 포획-C에 의해 두 개의 포획 지점 #33 및 #34를 사용하여 SNU16에서 검출되었다. 요약된 상호작용(Q<0.05, r3Cseq)은 마지막 트랙으로서 제시된다. 2개의 성분 예측된 인핸서인 e1 및 e2는 CRISPR/Cas9 게놈 편집을 사용하여 SNU16 세포에서 독립적으로 결실되었다.
d. 예측된 슈퍼-인핸서 활성과 장거리 상호작용 사이의 상관관계. SLC35D3 프로모터에 대한 장거리 상호작용(밝은 회색 삼각형)은 SNU16 및 OCUM-1 세포에서 활성인 예측된 슈퍼-인핸서를 사용하여 검출되었다. 이러한 상호작용은 KATO-III 세포에서 관찰되지 않았고, 여기서 예측된 슈퍼-인핸서도 또한 검출되지 않았다.
도 5 체세포 예측된 슈퍼-인핸서는 환자 생존 및 질환 위험을 알려준다.
a. 재발성 체세포 증가, 재발성 체세포 손실 및 변형되지 않은 H3K27ac 신호를 나타내는 예측된 슈퍼-인핸서를 사용하는 암 특징 분석. 단측 피셔 정밀 테스트로부터의 음성 로그-변환 p-값을이 사용되었다.
b. 상위 재발성 체세포 증가 예측된 슈퍼-인핸서와 관련된 유전자로부터 낮은(밝은 회색) 및 높은(암회색) 발현을 나타내는 샘플과 환자 그룹을 비교하는 생존 분석. 서명은 848명의 GC 환자의 편집(P = 1.8x10-2, 로그-순위 테스트)에서 예후 인자이고, 종양을 갖는 환자에서 관찰된 나쁜 예후는 높은 서명 발현(위험비, 95% 신뢰 구간: 1.30 (1.05 - 1.61); 단계, 연령, 환자 지역 및 로렌의 조직학적 하위유형을 보정한 후 Cox 회귀 p-값 = 4.4x10-2)을 갖는다. 생존 데이터는 10개월 마다 표시된다.
c. 예측된 슈퍼-인핸서 중 질환 관련 SNP의 농축. 농축은 카이 제곱 테스트를 사용하여 두 부류의 예측된 슈퍼-인핸서인 재발성 체세포 변경된 및 변경되지 않은 예측된 슈퍼-인핸서에 대해 시험되었다. 모든 예측된 슈퍼-인핸서에서 발견된 적어도 10개의 SNP를 갖는 질환/특성만이 분석되었다.
d. 결장직장암 관련 SNP를 갖거나 갖지 않는 예측된 슈퍼-인핸서에서 시차 H3K27ac 신호. SNP를 갖거나 갖지 않는 환자의 총 수는 괄호 안에 표시된다. 두 그룹 사이의 차이는 단측 웰치 t-테스트를 사용하여 시험되었다.
도 6 GC에서 체세포 증가 예측된 슈퍼-인핸서는 CDX2 및 HNF4α 점유와 관련된다.
a. ReMap 데이터베이스를 사용하여 재발성 체세포 증가 예측된 슈퍼-인핸서 및 변경되지 않은 예측된 슈퍼-인핸서에서 상위 10개의 전사 인자 결합 농축.
b. 변경되지 않은 예측된 슈퍼-인핸서와 비교하여 재발성 체세포 증가 예측된 슈퍼-인핸서에서 ReMap 전사 인자의 농축 또는 고갈.
c. CDX2 결합 부위 및 드 노보(de novo) HOMER 모티프 동정을 사용하여 후보 CDX2 결합 파트너의 검출.  
d. 19개의 1차 종양 및 일치되는 정상 샘플로부터 RNA-seq를 사용하여 CDX2 및 상위 20개의 CDX2 후보 결합 파트너의 쌍방향 발현 상관관계.
e. OCUM-1 세포에서 500bp 윈도우 내의 HNF4α 결합 부위와 공동발생하는 CDX2 결합 부위의 백분율.
f. 재발성 체세포 증가 예측된 슈퍼-인핸서 및 변경되지 않은 예측된 슈퍼-인핸서 사이의 시차 CDX2(좌측) 및 HNF4α(우측) 평균 결합 신호 분석. 예측된 슈퍼-인핸서는 또한 OCUM-1에서 활성이었다.
g. 단일 및 이중 TF 사일런싱에 대해 OCUM-1 세포에서 체세포 증가 예측된 슈퍼-인핸서와 예측된 전형적인 인핸서 사이의 H3K27ac 고갈 크기의 분포. 통계적 유의성은 단측 윌콕슨 순위 합계 테스트를 사용하여 평가되었다.
h. CDX2, HNF4α 또는 CDX2/HNF4α 공결합 부위에 대해 체세포 증가 예측된 슈퍼-인핸서에서 H3K27ac 하위 영역 고갈 사이의 결합. 거리는 결합 부위에 대해 근위, 중간 및 원위인 3개의 카테고리로 균일하게 분포되었다. 통계적 유의성은 단측 윌콕슨 순위 합계 테스트를 사용하여 평가되었다.
도 7 상이한 매핑 품질 필터 사이의 비교(MAPQ≥10 및 MAPQ≥20).
a. MAPQ≥10을 사용하는 전체 매핑된 판독치와 비교하여 MAPQ≥20을 사용하여 검출된 매핑된 판독치의 백분율.
b. MAPQ≥10을 사용하는 ChIP-농축 피크의 총 수와 비교하여 MAPQ≥20를 사용하여 발견된 ChIP-농축 피크의 백분율.
도 8 KATO-III 세포로부터의 생물학적 복제물 중 H3K27ac-농축 피크의 일치.
복제물 1 및 2는 나노-ChIPseq를 사용하여 생성시켰고, 문헌(참조: Baek et al. Oncotarget (2016))으로부터의 데이터는 통상적인 ChIPseq 방법을 사용하여 생성시켰다. 복제물 1 및 2로부터 매핑된 판독치의 총 수는 백 등(Baek et al.)의 데이터보다 10배 이상 더 크고, 따라서 더 많은 피크가 본 복제물에서 검출되었다. 복제물의 피크는 BEDTool을 사용하여 병합시켰다. 이 접근법을 사용하여 30,734개의 고유 피크가 동정되었다. 총 수의 고유 피크와 비교하여 복제물에서 발견된 중첩 피크의 백분율이 계산되었다.
도 9 위암 세포주에서 원위 예측 인핸서 및 활성 TSS에 인접하는 게놈 전체 H3K4me1 신호.
도 10 GC 세포주에서 예측된 슈퍼-인핸서.
a. 각각 OCUM-1 및 NCC59 중의 KLF5- 및 MYC-관련 예측된 슈퍼-인핸서.
b. 상위 반복 예측된 슈퍼-인핸서(암회색) 및 예측된 전형적 인핸서(밝은 회색)에 연결된 유전자의 발현 수준(세포주에 걸쳐 백분위 단위). 무작위로 선택된 유전자(흑색)의 동정된 수는 참조로서 사용되었다. 유전자는 최고로부터 최저 순서의 백분위로 분류되었다.
도 11 공개 데이터 세트를 사용하여 반복 예측된 슈퍼-인핸서/유전자 상호작용의 검증. 백분율 값은 원래 예측된 슈퍼-인핸서/유전자 할당을 반영했다(참조: 결과 및 방법).
도 12 GREAT 분석 도구를 사용하여 반복 예측된 슈퍼-인핸서와 관련된 생물학적 과정. 검은색 화살표로 강조된 과정은 GOrilla(참조: 결과) 및 GREAT 둘 다에 의해 관찰된 과정을 의미한다.
도 13 1차 샘플의 히스톤 H3K27ac 프로파일을 사용하여 세포주 유도 예측된 슈퍼-인핸서의 카테고리화.
a. GCNT4 유전자좌에서 3개의 종양(T)/정합된 정상(N) 쌍에서 체세포 손실 예측된 슈퍼-인핸서.
b. CMIP 유전자좌에서 T/N20020720, T/N2001206 및 T/N980401 중 변경되지 않은 예측된 슈퍼-인핸서.
c. FU97 및 YCC22 GC 세포에서 검출된 예측된 슈퍼-인핸서는 ZNF326 유전자좌에서 3개의 T/N 쌍에서 불활성 상태를 나타낸다.
도 14 카피 수 변경과 예측된 슈퍼-인핸서 사이의 연관성.
a. 카피 수 중성 영역에서 검출된 체세포 증가 예측된 슈퍼-인핸서의 예.
b. KATO-III 세포 중 체세포 카피 수 증가 영역에서 검출된 FGFR2-관련 예측된 슈퍼-인핸서.
c. T/N980447 중 카피 수 증가 영역에서 검출된 체세포 증가 예측된 슈퍼-인핸서.
d. 고도로 반복된 체세포 증가 (H3K27ac) 예측된 슈퍼-인핸서는 CLDN4 유전자좌에서 검출되었다. 이 영역은 카피 수 증가와 관련되지 않았다.
도 15 포획-C 기술을 사용하여 OCUM-1에서 검출된 TM4SF4 프로모터와 TM4SF1 유전자좌에서 예측된 슈퍼-인핸서(검은색 직사각형) 사이의 장거리 상호작용. 하단 트랙은 포획 지점 #17로부터 요약된 상호작용을 나타낸다.
도 16 포획-C 상호작용 프로파일.
a. EHBP1 예측된 슈퍼-인핸서 (검은색 직사각형)로부터 TMEM1 및 EHBP1 유전자의 프로모터까지의 상호작용. 예측된 슈퍼-인핸서는 OCUM-1 세포에서 검출되고, 1차 종양 T20020720에서 체세포 증가를 나타내고, TMEM1 및 EBHP1의 상향 조절된 발현과 관련된다.
b. YWHAZ 유전자좌에서 예측된 슈퍼-인핸서 (검은색 직사각형)로부터 YWHAZ의 프로모터까지의 상호작용. 예측된 슈퍼-인핸서는 SNU16 세포에서 검출되고, 1차 종양 샘플 T990275에서 체세포 증가를 나타내고, YWHAZ의 상향 조절된 발현과 관련된다.
도 17 4C 상호작용 프로파일.
a. ELF3 유전자좌에서 체세포 증가 예측된 슈퍼-인핸서의 예 및 인접하는 유전자, 예를 들면, ELF3, RNPEP, ARL8A 및 LMOD1과의 상호작용. 체세포 증가 활성은 1차 GC에서 ELF3의 상향 조절과 관련된다. 상호작용(Q<0.05, r3Cseq)은 4C를 사용하여 OCUM-1 세포에서 검출되었다. 4C 신호 플롯(RPM의 단위)은 Basic4CSeq 패키지를 사용하여 생성되었다. 2개 성분 인핸서인 e3 및 e4는 CRISPR/Cas9 게놈 편집 기술을 사용하여 OCUM-1 세포에서 독립적으로 결실되었다.
b. KLF5 유전자좌에서 예측된 슈퍼-인핸서와 KLF5 프로모터 사이의 장거리 상호작용은 OCUM-1 세포에서 검출되었다. 1차 종양(T76629543)에서 체세포 증가 활성은 정합된 샘플에서 KLF5 발현의 상향 조절과 관련된다.
c. 인접하는 비코딩 영역에 대한 CABLES1 유전자좌와 CABLES1 및 RIOK3을 포함한 유전자의 프로모터의 상호작용.
도 18 포획-C 및 4C로부터의 상호작용 프로파일의 비교.
a. 벤 다이어그램은 OCUM-1 및 SNU16 세포로부터 2개의 생물학적 복제물 사이의 예측된 슈퍼-인핸서/유전자 상호작용(4C로부터)의 중첩을 나타낸다. 동정된 모든 상호작용에 대해 복제물 간 일치가 계산되었다(괄호 안의 백분율).
b. 벤 다이어그램은 예측된 슈퍼-인핸서/유전자 상호작용(포획-C로부터)과 동일 세포에서 4C로부터의 일치하는 상호작용의 세트의 중첩을 나타낸다. 포획-C 를 사용하여 동정된 상호작용의 75%-80%는 4C를 사용하는 결과에서 재발견되었다.
도 19 예측된 슈퍼-인핸서 활성과 장거리 상호작용의 존재 사이의 상관관계의 예. EHBP1 프로모터에 대한 장거리 상호작용(밝은 회색 삼각형)은 OCUM-1 및 KATO-III 세포에서 예측된 슈퍼-인핸서(검은색 직사각형) 활성으로 검출되었다. 이러한 상호작용은 SNU16 세포에서 관찰되지 않았고, 여기서 예측된 슈퍼-인핸서도 또한 검출되지 않았다.
도 20 CRISPR/Cas9 결실을 사용하는 예측된 인핸서 결실. a) SNU16 중 구성 인핸서 e1, b) OCUM-1 중 구성 인핸서 e2, c) OCUM-1 중 구성 인핸서 e3 및 e4의 CRISPR/Cas9 결실의 PCR 분석. (e-f) 돌연변이체(하나의 예측된 인핸서 결실을 가짐) 및 야생형 세포 사이의 시차 유전자 발현은 OCUM-1 및 SNU16 세포에서 RT-qPCR을 사용하여 수행되었다. 풀링된 세포가 분석되었다. *P<0.05, # P = 0.055, 단측 t-테스트; wt: 야생형; lad: DNA 래더(Bioline HyperLadder I); c1-c3: GAPDH 프라이머를 사용하는 야생형 세포.
도 21 다른 세포 및 조직 유형에서 GC-관련 예측된 슈퍼-인핸서의 경관. 무작위로 선택된 영역과 비교하여 86개의 세포 및 조직 샘플에서 검출된 슈퍼-인핸서와 중첩되는 GC에서 동정된 재발성 체세포 증가 예측된 슈퍼-인핸서의 농축 비. 암 세포주는 별표로 표지되고; 통계적으로 유의하지 않은(P > 0.001) 농축 비를 갖는 샘플은 회색으로 존재한다.
도 22 히스톤 변형 및 유전자 발현에 대한 전사 인사 사일런싱의 결과.
a. 재발성 체세포 증가 예측된 슈퍼-인핸서와 변경되지 않은 예측된 슈퍼-인핸서 사이의 시차 CDX2 (좌측) 및 HNF4α (우측) 평균 결합 신호 분석. 예측된 슈퍼-인핸서는 SNU16에서 또한 활성이었다.
b. 하나 또는 두 개의 전사 인자를 동시에 사일런싱(암회색) 후 H3K27ac의 글로벌 변화. 배경 변화는 두 대조군(NTCDX2 및 NTHNF4α) 간의 차이로부터 생성된다.
c. OCUM-1 세포에서 전사 인자(들)의 사일런싱 후 H3K27ac 고갈 크기.
d. OCUM-1 세포에서 CDX2 사일런싱 후 FGL1 유전자좌에서 예측된 슈퍼-인핸서에서 H3K27ac 고갈을 나타내는 시각적인 예.
e. SNU16 세포에서 CDX2 또는 HNF4α 결합 부위에 비해 체세포 증가 예측된 슈퍼-인핸서에서 H3K27ac 고갈 간의 연관성. 거리는 균일하게 분포되어 다음 3개의 카테고리로 분류되었다: 결합 부위의 근위, 중간 및 원위. 통계적 유의성은 단측 윌콕슨 순위 합계 테스트를 사용하여 평가되었다.
f. OCUM-1에서 체세포 증가 예측된 슈퍼-인핸서와 관련된 유전자 발현은 단일 또는 이중 전사 인자를 동시에 사일런싱 후(NT-siTF) 시험되었다. 발현의 변화를 나타내는 유전자의 백분율(FPKM 차이: 하향 조절시 > 0; 상향 조절시 < 0)이 표시된다. 하향 조절된 유전자의 비율은 실험적 접근법을 사용하여 시험되었다(참조: 방법).
도 23 웨스턴 블롯 및 실시간 (RT) PCR에 의한 CDX2, HNF4α 녹다운 효율.
a. SNU16 및 OCUM-1 세포에서 녹다운 전(siNT) 및 CDX2 녹다운 후(siCDX2) CDX2 단백질 풍부함을 측정하는 웨스턴 블롯. GADPH 단백질 풍부함은 대조군으로 사용되었다.
b. SNU16 및 OCUM-1 세포에서 녹다운 전(siNT) 및 HNF4α 녹다운 후(siHNF4α) HNF4α 단백질 풍부함을 측정하는 웨스턴 블롯. GADPH 단백질 풍부함은 대조군으로 사용되었다.
c. 대조군에 대한 CDX2의 상대적 RNA 풍부함은 OCUM-1 세포에서 2개의 복제물에서 RT-PCR을 사용하여 측정되었다.
d. 대조군에 대한 HNF4α의 상대적인 RNA 풍부함은 OCUM-1 세포에서 3개의 복제물에서 RT-PCR을 사용하여 측정되었다.
도 24 CLDN4 e1 CRISPR 결실에 대한 GC 세포의 내성. e1 동형 접합체 결실의 높은 비율은 H1 ES 대 SNU16 세포에서 관찰된다(20% 대 1%). CLDN4 e1 소구역은 SNU16에서 이배체인 것으로 확인되었다.
도 25 PCR을 사용하여 SNU16 세포로부터 91개 클론에서 인핸서 e1 결실 확인.
a. 외부 프라이머를 사용함으로써 생기는 PCR 밴드.
b. 내부 프라이머를 사용함으로써 생기는 PCR 밴드. 동형 접합체 결실을 갖는 클론은 외부 프라이머를 사용하여 약 450bp 밴드를 나타내고, 내부 프라이머를 사용하는 밴드는 보이지 않고; 이형 접합체 결실을 갖는 클론은 외부 및 내부 프라이머를 사용하여 450bp를 나타낸다.
도 26 PCR을 사용하여 H1 세포로부터 48개 클론에서 인핸서 e1 결실 확인.
a. 외부 프라이머를 사용함으로써 생기는 PCR 밴드.
b. 내부 프라이머를 사용함으로써 생기는 PCR 밴드. 동형 접합체 결실을 갖는 클론은 외부 프라이머를 사용하여 약 450bp 밴드를 나타내고, 내부 프라이머를 사용하는 밴드는 보이지 않고; 이형 접합체 결실을 갖는 클론은 외부 및 내부 프라이머를 사용하여 450bp를 나타낸다.
도 27 생거(Sanger) 서열분석을 사용하여 H1 ES 세포 중의 두 대립유전자에서 동형 접합체 e1-결실의 확인. 빈 공간은 결실된 하위 서열을 나타내고, 회색 강조는 sgRNA를 나타낸다.
도 28 생거 서열분석을 사용하여 SNU16 세포 중의 두 대립유전자에서 동형 접합체 e1-결실의 확인. 빈 공간은 결실된 하위 서열을 나타내고, 회색 강조는 sgRNA를 나타낸다.
하나의 측면에서, 본 발명은 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 결정하는 방법으로서,
a) 대상체로부터 수득된 암성 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체 또는 항체들과 접촉시키는 단계;
b) 상기 암성 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역 또는 영역들을 포함하는, 단계;
c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호 강도에 기초하는 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
d) 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
e) 비암성 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호 강도에 대해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계; 및
f) 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계를 포함하는, 방법을 의미한다.
하나의 구현예에서, 암성 및 비암성 생물학적 샘플은 단일 세포, 다중 세포, 세포의 단편, 체액 또는 조직을 포함할 수 있다. 하나의 구현예예서, 암성 및 비암성 생물학적 샘플은 동일 대상체로부터 수득될 수 있다.
하나의 구현예에서, 암성 및 비암성 생물학적 샘플은 각각 상이한 대상체로부터 수득된다.
본원에 기재된 방법에 따르는 접촉 단계는 히스톤 변형에 특이적인 적어도 하나의 항체를 포함할 수 있다. 히스톤 변형의 예는 H3K27ac, H3K4me3, H3K4me1 및 H2BK20ac를 포함하나, 이에 제한되지 않는다. 바람직한 구현예에서, 히스톤 변형은 H3K27ac이다.
본원에 기재된 방법에 따르는 단리 단계는 암성 생물학적 샘플로부터 핵산을 크로마틴의 면역침전에 의해 단리시키는 단계를 포함한다. 하나의 구현예에서, 단리된 핵산은 히스톤 변형에 특이적인 적어도 하나의 영역을 포함한다. 히스톤 변형의 예는 H3K27ac, H3K4me3, H3K4me1 및 H2BK20ac를 포함하나, 이에 제한되지 않는다. 바람직한 구현예예서, 히스톤 변형에 특이적인 적어도 하나의 영역은 히스톤 변형 H3K27ac에 특이적인 영역이다.
본원에 기재된 방법에 따르는 매핑 단계는 히스톤 변형의 신호 강도에 기초하는 주석이 달린 게놈 서열을 사용하는 단계를 포함할 수 있다. 하나의 구현예에서, 주석이 달린 게놈 서열은 공개적으로 이용 가능한 서열이다. 하나의 구현예에서, 주석이 달린 게놈 서열은 후성유전체 로드맵이다. 다른 구현예에서, 주석이 달린 게놈 서열은 GENCODEv19이다.
본원에 기재된 방법에 따르는 매핑 단계는 또한 주석이 달린 전사 개시 부위로부터 적어도 1kb, 적어도 1.5kb, 적어도 2kb, 적어도 2.5kb, 적어도 3kb, 적어도 3.5kb, 적어도 4kb, 적어도 4.5kb, 적어도 5kb, 적어도 5.5kb, 적어도 6kb, 적어도 6.5kb, 적어도 7kb, 적어도 7.5kb, 적어도 8kb, 적어도 8.5kb, 적어도 9kb, 적어도 9.5kb 또는 적어도 10kb에 있는 적어도 하나의 인핸서를 포함할 수 있다.
상기 방법은 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 중의 적어도 하나의 인핸서에 대해 단리된 핵산에서 적어도 하나의 인핸서를 매핑하는 단계를 추가로 포함할 수 있다.
일부 구현예에서, 적어도 하나의 참조 핵산 서열은 i) 주석이 달린 게놈 서열; ii) 드 노보 전사체 어셈블리; 및/또는 iii) 비암성 핵산 서열 라이브러리 또는 데이터베이스로부터 유도된 핵산 서열을 포함할 수 있다.
하나의 구현예에서, 적어도 하나의 참조 핵산 서열은 적어도 하나의 암 세포주로부터 선택된다.
하나의 구현예에서, 적어도 하나의 슈퍼-인핸서의 신호 강도는 히스톤 변형 H3K27ac의 백만 당 전사체 1킬로베이스 당 판독치(RPKM) 값을 기준으로 한다. 하나의 구현예에서, 적어도 하나의 슈퍼-인핸서의 신호 강도는 히스톤 변형 H3K27ac의 백만 당 전사체 1킬로베이스 당 단편(FPKM) 값을 기준으로 한다.
하나의 구현예에서, 암성 생물학적 샘플 중 적어도 하나의 슈퍼-인핸서는 ROSE (슈퍼 인핸서의 순위) 알고리즘을 사용하여 동정된다.
일부 구현예에서, 암성 생물학적 샘플 중 적어도 하나의 슈퍼-인핸서는 적어도 하나의 참조 핵산 샘플 중 적어도 하나의 인핸서와 중첩되는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개 또는 적어도 10개의 핵산 염기 쌍을 포함한다.
바람직한 구현예에서, 암성 생물학적 샘플 중 적어도 하나의 슈퍼-인핸서는 적어도 하나의 참조 핵산 샘플 중 적어도 하나의 인핸서와 중첩되는 적어도 하나의 핵산 염기 쌍을 포함한다.
하나의 구현예에서, 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계는 암성 생물학적 샘플 중 적어도 하나의 슈퍼 인핸서에 대한 RKPM 값이 i) 비암성 생물학적 샘플로부터 수득된 적어도 하나의 슈퍼-인핸서의 RPKM 값에 비해 1.5배 초과 변화, 2배 초과 변화, 3배 초과 변화, 4배 초과 변화, 5배 초과 변화, 6배 초과 변화, 7배 초과 변화, 8배 초과 변화, 9배 초과 변화 또는 10배 초과 변화된 RPKM 값이고; ii) 비암성 생물학적 샘플로부터 수득된 적어도 하나의 슈퍼-인핸서의 RPKM 값에 비해 0.5RPKM 초과, 1.0RPKM 초과, 1.5RPKM 초과, 2.0RPKM 초과, 2.5RPKM 초과, 3.0RPKM 초과, 3.5RPKM 초과, 4.0RPKM 초과, 4.5 RPKM 또는 5.0RPKM 초과의 절대 차이임을 결정하는 단계를 포함할 수 있다.
바람직한 구현예에서, 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계는 암성 생물학적 샘플 중 적어도 하나의 슈퍼 인핸서에 대한 RKPM 값이 i) 비암성 생물학적 샘플로부터 수득된 적어도 하나의 슈퍼-인핸서의 RPKM 값에 비해 RPKM 2배 초과 변화된 RPKM 값이고; ii) 비암성 생물학적 샘플로부터 수득된 적어도 하나의 슈퍼-인핸서의 RPKM 값에 비해 0.5RPKM 초과의 절대 차이임을 결정하는 단계를 포함한다.
하나의 구현예에서, 비암성 생물학적 샘플의 RPKM 값에 비해 암성 생물학적 샘플의 RPKM 값의 증가는 암성 생물학적 샘플 중 적어도 하나의 슈퍼-인핸서의 존재의 지표이다.
하나의 구현예에서, 비암성 생물학적 샘플의 RPKM 값에 비해 암성 생물학적 샘플의 RPKM 값의 감소는 암성 생물학적 샘플 중 적어도 하나의 슈퍼-인핸서의 부재의 지표이다.
일부 구현예에서, 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계는 암성 생물학적 샘플 중 적어도 하나의 슈퍼 인핸서에 대한 FKPM 값이 i) 비암성 생물학적 샘플로부터 수득된 적어도 하나의 슈퍼-인핸서의 FPKM 값에 비해 1.5배 초과 변화, 2배 초과 변화, 3배 초과 변화, 4배 초과 변화, 5배 초과 변화, 6배 초과 변화, 7배 초과 변화, 8배 초과 변화, 9배 초과 변화 또는 10배 초과 변화된 FPKM 값이고; ii) 비암성 생물학적 샘플로부터 수득된 적어도 하나의 슈퍼-인핸서의 FPKM 값에 비해 0.5FPKM 초과, 1.0FPKM 초과, 1.5FPKM 초과, 2.0FPKM 초과, 2.5FPKM 초과, 3.0FPKM 초과, 3.5FPKM 초과, 4.0FPKM 초과, 4.5FPKM 또는 5.0FRPKM 초과의 절대 차이임을 결정하는 단계를 포함할 수 있다.
바람직한 구현예에서, 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계는 암성 생물학적 샘플 중 적어도 하나의 슈퍼 인핸서에 대한 FKPM 값이 i) 비암성 생물학적 샘플로부터 수득된 적어도 하나의 슈퍼-인핸서의 FPKM 값에 비해 2배 초과 변화된 FPKM 값이고; ii) 비암성 생물학적 샘플로부터 수득된 적어도 하나의 슈퍼-인핸서의 FPKM 값에 비해 0.5FPKM 초과의 절대 차이임을 결정하는 단계를 포함한다.
하나의 구현예에서, 비암성 생물학적 샘플의 FPKM 값에 비해 암성 생물학적 샘플의 FPKM 값의 증가는 암성 생물학적 샘플 중 적어도 하나의 슈퍼-인핸서의 존재의 지표이다.
하나의 구현예에서, 비암성 생물학적 샘플의 FPKM 값에 비해 암성 생물학적 샘플의 FPKM 값의 감소는 암성 생물학적 샘플 중 적어도 하나의 슈퍼-인핸서의 부재의 지표이다.
일부 구현예에서, 적어도 하나의 슈퍼-인핸서는 유전자 전사 개시 부위에 대해 500kb, 600kb, 700kb, 800kb, 900kb, 1000kb, 1100kb, 1200kb, 1300kb, 1400kb, 1500kb 또는 2000kb 내에 위치된다. 바람직한 구현예에서, 적어도 하나의 슈퍼-인핸서는 유전자 전사 개시 부위에 대해 1000kb 내에 위치된다.
하나의 구현예에서, 유전자는 암 관련 유전자, 혈관 신생 유전자, 세포 증식 유전자, 세포 침입 유전자, 게놈 불안정성과 관련된 유전자, 세포사 내성 유전자, 세포 에너지론 유전자, 세포 주기 유전자 또는 종양 촉진 유전자이다.
일부 구현예에서, 유전자는 CLDN4, ABHD11, WBSCR28, ATAD2, KLH38, WDYHV1, CDH17, CCAT1, CLDN1, SMURF1, GDPD5, ADAMTS12, ASCL2, ASPM, ATP11A, AURKA, CAMK2N1, CBX2, CCNE1, CD9, CDC25B, CDCA7, CDK1, CXCL1, E2F7, ECT2, LAMC2, NID2, PMEPA1, RARRES1, RFC3, SLC39A10, TFAP2A, TMEM158, LINC00299 및 이의 조합으로 이루어진 그룹으로부터 선택된다.
하나의 구현예에서, 암성 생물학적 샘플은 위암이다.
본 발명의 다른 측면에서, 대상체에서 적어도 하나의 암 관련 슈퍼-인핸서의 존재를 결정하는 방법으로서,
a) 상기 대상체로부터 수득된 암성 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체 또는 항체들과 접촉시키는 단계;
b) 상기 암성 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역 또는 영역들을 포함하는, 단계;
c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호 강도에 기초하는 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
d) 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
e) 비암성 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호 강도에 대해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계; 및
f) 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 대상체에서 적어도 하나의 암 관련 슈퍼-인핸서의 존재를 결정하는 단계를 포함하고,
상기 비암성 생물학적 샘플에 비해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 증가된 신호 강도가 적어도 하나의 암 관련 슈퍼-인핸서의 존재의 지표인, 방법이 제공된다.
본 발명의 다른 측면에서, 대상체에서 암을 검출하기 위한 바이오마커로서, 상기 바이오마커가 정상적 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 H3K27ac의 증가된 신호 강도를 갖는 적어도 하나의 슈퍼-인핸서 또는 변경되지 않은 슈퍼-인핸서에 비해 암 관련 전사 인자 결합 부위에서 증가와 관련된 적어도 하나의 슈퍼-인핸서 또는 둘 다를 포함하는, 바이오마커가 제공된다. 일부 구현예에서, 상기 암 관련 전사 인자 결합 부위는 위암 관련 전사 인자 결합 부위이다.
일부 구현예에서, 위암 관련 전사 인자는 CDX2, KLF5 및 HNF4α로 이루어진 그룹으로부터 선택된다. 일부 구현예에서, 위암 관련 전사 인자는 CDX2, KLF5, HNF4α 및 이의 조합으로 이루어진 그룹으로부터 선택된다.
본 발명의 다른 측면에서, 대상체에서 암의 예후를 결정하는 방법으로서,
a) 상기 대상체로부터 수득된 암성 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체 또는 항체들과 접촉시키는 단계;
b) 상기 암성 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역 또는 영역들을 포함하는, 단계;
c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호에 기초하여 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
d) 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
e) 비암성 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호 강도에 대해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계; 및
f) 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 대상체에서 적어도 하나의 암 관련 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계를 포함하고,
상기 적어도 하나의 암 관련 슈퍼-인핸서의 존재 또는 부재가 상기 대상체에서 암 예후의 지표인, 방법이 제공된다.
하나의 구현예에서, 암성 생물학적 샘플 중 적어도 하나의 암 관련 슈퍼-인핸서의 존재는 대상체에서 암 생존의 불량한 예후의 지표이다.
하나의 구현예에서, 암성 생물학적 샘플 중 적어도 하나의 암 관련 슈퍼-인핸서의 부재는 대상체에서 암 생존의 향상된 예후의 지표이다.
하나의 구현예에서, 적어도 하나의 암 관련 슈퍼 인핸서는 하나 이상의 세포 칩입 유전자, 혈관 신생 유전자 또는 세포사 내성 유전자, 암 관련 유전자, 세포 증식 유전자, 게놈 불안정성과 관련된 유전자, 세포 에너지론 유전자, 세포 주기 유전자 또는 종양 촉진 유전자와 관련된다.
하나의 구현예에서, 적어도 하나의 암 관련 슈퍼-인핸서는 CLDN4, ABHD11, WBSCR28, ATAD2, KLH38, WDYHV1, CDH17, CCAT1, CLDN1, SMURF1, GDPD5, ADAMTS12, ASCL2, ASPM, ATP11A, AURKA, CAMK2N1, CBX2, CCNE1, CD9, CDC25B, CDCA7, CDK1, CXCL1, E2F7, ECT2, LAMC2, NID2, PMEPA1, RARRES1, RFC3, SLC39A10, TFAP2A, TMEM158, LINC00299 및 이의 조합으로 이루어진 그룹으로부터 선택된 유전자와 관련된다.
본 발명의 다른 측면에서, 암 또는 위장 질환에 대한 대상체의 민감성을 결정하는 방법으로서,
a) 상기 대상체로부터 수득된 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체 또는 항체들과 접촉시키는 단계;
b) 상기 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역 또는 영역들을 포함하는, 단계;
c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호 강도에 기초하는 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
d) 상기 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
e) 대조군 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호에 대해 상기 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계;
f) 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 상기 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계; 및
g) 암 또는 위장 질환 관련 SNP를 포함하는 참조 게놈 서열에 대해 상기 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 매핑하는 단계를 포함하고,
상기 하나 이상의 암 또는 위장 질환 관련 SNP와 관련된 적어도 하나의 슈퍼-인핸서의 존재 또는 부재가 상기 대상체의 암 또는 위장 질환에 대한 민감성의 지표인, 방법이 제공된다.
하나의 구현예에서, 위장 질환은 하나 이상의 이완 불능증, 바렛 식도, 간경화증, 담즙성 간경화증, 복강 질환, 결장직장 폴립, 크론병, 게실증, 게실염, 지방간, 담석, 위염, 헬리코박터 파일로리, 혈색소침착증, 간염, 과민성 대장 증후군, 현미경 대장염, 식도암, 췌장염, 소화성 궤양, 역류성 식도염, 궤양성 대장염, 결장직장암 및 변비로부터 선택된다.
하나의 구현예에서, 암은 하나 이상의 위암, 식도암, 결장직장암, 유방암 및 전립선암으로부터 선택된다.
본 발명의 다른 측면에서, 세포에서 적어도 하나의 암 관련 슈퍼-인핸서의 활성을 조절하는 방법으로서, CDX2 및/또는 HNF4α의 억제제를 상기 세포에 투여하는 단계를 포함하는, 방법이 제공된다.
하나의 구현예에서, 억제제는 작은 간섭성 RNA(siRNA)이다. 다른 구현예에서, 억제제는 짧은 헤어핀 RNA(shRNA)이다.
하나의 구현예에서, 억제제는 소분자 또는 항체이다.
하나의 구현예에서, 억제제는 메트포르민이다.
하나의 구현예에서, 세포에서 적어도 하나의 암 관련 슈퍼-인핸서의 활성은 CRISPR 게놈 편집 시스템에 의해 조절될 수 있다. 다른 구현예에서, CRISPR 게놈 편집 시스템은 CRISPR/Cas9이다.
하나의 구현예에서, 세포에서 적어도 하나의 암 관련 슈퍼-인핸서의 활성은 CRISPR 게놈 편집 시스템에 의해 억제될 수 있다. 다른 구현예에서, CRISPR 게놈 편집 시스템은 CRISPR/Cas9이다.
본 발명의 다른 측면에서, 대상체에서 암을 검출하는데 사용하기 위한, 정상적 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 H3K27ac의 증가된 신호 강도를 갖는 적어도 하나의 슈퍼-인핸서, 또는 변경되지 않은 슈퍼-인핸서에 비해 암 관련 전사 인자 결합 부위의 증가와 관련된 적어도 하나의 슈퍼-인핸서, 또는 둘 다를 포함하는 바이오마커가 제공된다.
본 발명의 다른 측면에서, 대상체에서 암을 검출하기 위한 약제를 제조하는데 있어서, 정상적 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 H3K27ac의 증가된 신호 강도를 갖는 적어도 하나의 슈퍼-인핸서, 또는 변경되지 않은 슈퍼-인핸서에 비해 암 관련 전사 인자 결합 부위의 증가와 관련된 적어도 하나의 슈퍼-인핸서, 또는 둘 다를 포함하는 바이오마커의 용도가 제공된다.
본 발명의 다른 측면에서, 세포에서 적어도 하나의 암 관련 슈퍼-인핸서의 활성을 조절하는데 사용하기 위한 CDX2 및/또는 HNF4α의 억제제가 제공된다.
본 발명의 다른 측면에서, 세포에서 적어도 하나의 암 관련 슈퍼-인핸서의 활성을 조절하기 위한 약제를 제조하는데 있어서 CDX2 및/또는 HNF4α의 억제제의 용도가 제공된다.
하나의 측면에서, 대상체로부터 수득된 암성 샘플학적 샘플에서 암 세포 생존 또는 암 세포 생존능을 예측하는 방법으로서,
a) 상기 암성 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체와 접촉시키는 단계;
b) 상기 암성 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역을 포함하는, 단계;
c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호 강도에 기초하는 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
d) 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
e) 비암성 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호 강도에 대해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계; 및
f) 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 대상체에서 적어도 하나의 암 관련 슈퍼-인핸서의 존재를 결정하는 단계를 포함하고,
상기 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 증가된 신호 강도가 암 세포 생존 또는 암 세포 생존능의 지표인, 방법이 제공된다.
본원에 예시적으로 기재된 본 발명은 본원에 구체적으로 개시되지 않은 임의의 요소 또는 요소들, 제한 또는 제한들의 부재하에 적합하게 실시될 수 있다. 따라서, 예를 들어, 용어 "포함하는", "포함하는", "함유하는" 등은 광범위하게 제한 없이 판독되어야 한다. 추가로, 본원에 사용된 용어 및 표현은 설명의 용어로서 제한 없이 사용되었고, 도시되고 기재된 특징 또는 그의 일부의 임의의 등가물을 배제하는 용어 및 표현의 사용에 대한 의도는 없지만 청구된 본 발명의 범위 내에서 다양한 변형이 가능하다는 것이 인식된다. 따라서, 본 발명은 바람직한 구현예 및 임의의 특징들에 의해 구체적으로 개시되었지만, 본원에 개시된 구체화된 본 발명의 변형 및 변화는 당업자에 의해 가능할 수 있고, 이러한 변형 및 변화는 본 발명의 범주 내에 있는 것으로 간주되는 것으로 이해되어야 한다.
본 발명은 본원에서 광범위하게 일반적으로 기재되었다. 일반적인 개시 내용에 속하는 더 협소한 종 및 하위속 그룹 각각은 또한 본 발명의 일부를 형성한다. 이는 절제된 물질이 본원에서 구체적으로 인용되는지의 여부와 관계 없이 속으로부터 임의의 주제를 제거하는 단서 또는 부정적인 제한을 갖는 본 발명의 일반적인 설명을 포함한다.
다른 구현예는 다음 청구범위 및 비제한적인 실시예 내에 있다. 또한, 본 발명의 특징 또는 측면이 마커시 그룹으로 기재되는 경우, 당업자는 본 발명이 또한 이로써 마커시 그룹의 임의의 개별 구성원 또는 구성원의 하위그룹의 관점에서 기재된다는 것을 인식할 것이다.
실험 부분
본 발명의 비제한적인 실시예 및 비교 실시예는 특정 실시예를 참조로 보다 상세히 추가로 기재되고, 이는 어떤 방식으로든 본 발명의 범위를 제한하는 것으로 해석되어서는 안된다.
방법
1차 조직 샘플 및 세포주
1차 환자 샘플은 SingHealth Centralised Institutional Review Board의 승인하에 SingHealth 조직 저장소로부터 얻었고 환자 정보에 입각한 동의서에 서명하였다. 이 연구에 사용된 '정상'(즉, 비악성) 샘플은 종양으로부터 멀리 떨어져 있는 부위로부터 수술 평가시 종양 또는 장의 생장/이형성증의 가시적인 증거를 나타내지 않는 위에서 수거된 샘플을 의미한다. 종양 샘플은 냉동절편에 의해 >40% 종양 세포를 함유하는 것으로 확인되었다. FU97, MKN7, OCUM-1 및 RERF-GC-1B 세포주는 일본 건강 과학 연구 자원 은행(Japan Health Science Research Resource Bank)으로부터 입수되었다. KATO-III 및 SNU16 세포는 American Type Culture Collection으로부터 입수되었다. NCC-59는 한국 세포주 은행으로부터 입수되었다. YCC3, YCC7, YCC21, YCC22는 한국 연세 암 센터의 선물이었다. 세포주 동일성은 번역 연구 및 진단 센터(싱가포르의 암 과학 연구소, 싱가포르)에서 수행된 STR DNA 프로파일링에 의해 확인되었다. STR 프로파일은 표준 ANSI/ATCC ASN-0002-2011 명명법에 따라 평가되었고, 본 세포주의 프로파일은 참조 데이터베이스와 >80% 유사성을 나타냈다. ICLAC (http://iclac.org/databases/cross-contaminations/)에 의해 통상적으로 잘못 동정된 하나의 라인인 MKN7 세포는 일본 연구 생물자원 세포 은행 콜렉션에서 MKN7 참조 프로파일과 완벽한 일치(100%)를 보여줌으로써 확인되었다. MycoAlertTM 마이코플라즈마 검출 키트(Lonza) 및 마이코센서 qPCR 검정 키트(Agilent Technologies)를 사용하여 마이코플라즈마 오염이 검출되었다. 모든 세포주는 마이코플라즈마 오염에 대해 음성이었다. 이 연구를 위해, OCUM-1 및 SNU16 세포가 2가지 이유로 주요 세포주 모델로서 선택되었다. 첫째, OCUM-1 및 SNU16 세포는 원래 불량하게 분화된 위 선암종 환자로부터 단리되었고, 이 연구에서 1차 GC의 대부분은 불량하게 분화되었다(63%). 둘째, OCUM-1 및 SNU16은 이전에 다수의 다른 공개된 연구에서 위암(GC) 모델로서 사용되었고, 따라서 그 분야에서 허용된 GC 모델로서 간주된다. 따라서, OCUM-1 및 SNU16은 포획-C, 4C, 인핸서 CRISPR, 전사 인자 결합 및 전사 인자 녹다운을 포함하는 다수의 실험을 위한 일관된 세포주 모델로서 사용되었다.
나노 ChIPseq
나노-ChIPseq는 약간의 변형으로 기재된 바와 같이 수행되었다. 1차 조직의 경우, 신성한 냉동 암 및 정상 조직은 액체 질소 중 면도날을 사용하여 해부하여 각 ChIP에 대해 약 5mg 크기의 조각을 수득했다. 조직 조각을 실온에서 10분 동안 1% 포름알데히드/PBS 완충제에 고정시켰다. 고정은 글리신을 최종 농도 125mM로 첨가하여 정지시켰다. 조직 조각을 TBSE 완충제로 3회 세척했다. 세포주의 경우, 1백만 개의 신선한 수거 세포를 실온에서 10분 동안 1% 포름알데히드/중간 완충제에 고정시켰다. 고정은 글리신을 최종 농도 125mM로 첨가하여 정지시켰다. 고정 세포를 TBSE 완충제로 3회 세척하고, 원심분리시켰다(5,000 r.p.m., 5분). 펠렛화 세포 및 분쇄된 조직을 100μl의 1% SDS 용해 완충제에 용해시키고, Bioruptor(Diagenode)를 사용하여 300-500bp로 초음파처리하였다. ChIP는 다음 항체를 사용하여 수행되었다: H3K4me3 (07-473, Millipore); H3K4me1 (ab8895, Abcam); H3K27ac (ab4729, Abcam).
ChIP 회수 및 DNA의 입력 후, WGA4 키트(Sigma-Aldrich) 및 BpmI-WGA 프라이머를 사용하여 전체 게놈 증폭을 수행하였다. 증폭된 DNA는 PCR 정제 컬럼(QIAGEN)을 사용하여 정제하고, BpmI(New England Biolabs)로 소화시켜 WGA 어댑터를 제거했다. 30ng의 증폭된 DNA를 라이브러리 제제(New England Biolabs)의 각 서열분석을 위해 사용했다. 8개의 라이브러리를 다중화하고(New England Biolabs), 라이브러리당 2천만 내지 3천만 판독치의 평균 깊이로 2개 레인의 Hiseq2500 (Illumina) 상에서 서열분석했다.
서열 매핑 및 ChIP-seq 밀도 분석
정렬 전에 처음 및 마지막 10개 염기를 절단한 후, 버로우-휠러 정렬기(BWA-MEM, 버전 0.7.0)를 사용하여 인간 참조 게놈(hg19)에 대해 서열 판독치를 매핑하였다. 다운스트림 분석을 위해 고품질 매핑된 판독치(MAPQ=10)만 유지시켰다. MAPQ 값(≥10)은 이것이 i) 이전에 양호한/자신감 있는 판독 매핑에 사용할 좋은 값인 것으로 보고되고; ii) MAPQ≥10이 또한 BWA-알고리즘의 개발자가 자신의 소프트웨어를 사용하여 자신감 있는 매핑에 사용할 적합한 임계값인 것으로 나타내었고; iii) 판독 정렬을 위한 다양한 알고리즘을 평가하는 연구가 또한 매핑 품질 스코어가 판독 매핑이 진정할/정확할 가능성과 충분히 상관되지 않음을 나타내고 매핑 정확성에 대해 수득된 정확성의 수준이 10-12 MAPQ 임계값에서 안정 상태를 유지한다는 것을 나타내었기 때문에 선택되었다. 이 연구는 다중 샘플에서 확실하게 검출되는 반복 예측된 인핸서 및 슈퍼-인핸서에 초점을 두었고, 이는 분석의 견고성을 증가시킨다. 서열분석 적용 범위는 50bp 윈도우 크기 및 200bp로의 판독 길이 확장을 갖는 MEDIPS를 사용하여 계산되었다. 입력 라이브러리에 대한 유의한 ChIP 농축(FDR<5%) 피크가 CCAT (버전 3)를 사용하여 검출되었다. 한 영역 내 피크 밀도는 라이브러리 및 영역 크기, 킬로베이스 당 백만 개의 매핑된 판독치 당 판독치(RPKM)에 등가인 미터법에 의해 표준화된 매핑 판독치의 총 수를 계산하여 계산되었다. 이 표준화 방법은 판독치가 더 긴 영역으로 떨어질 높은 가능성으로 인해 편향을 조정하고 이전 연구에서 적용되었다. 이 연구는 RPKM-기반 표준화를 적용하여 이 연구를 이러한 다른 연구에 필적할 수 있도록 하기로 선출되었다. 배경 신호를 설명하기 위해, 각 ChIP 라이브러리의 판독 밀도를 상응하는 입력 라이브러리에 대해 보정하였다. 샘플에 걸쳐 판독 밀도는 COMBAT를 사용하여 잠재적 배치 효과(예: ChIP 검정일)를 위해 그리고 동일한 샘플 변동을 보장하기 위해 보정했다. 2개 이상의 세포주에서 검출된 17,630개의 반복 예측된 인핸서 중 98%가 적어도 하나의 1차 샘플(정상 또는 GC)에 존재했다.
나노-ChIPseq 데이터의 품질 조절 평가
ChIP 라이브러리(H3K27ac, H3K4me3 및 H3K4me1)의 품질은 두 개의 상이한 방법을 사용하여 평가했다. 첫째, ChIP 품질, 특히 H3K27ac 및 H3K4me3은 단백질 코딩 유전자의 주석이 달린 프로모터에서 그들의 농축 수준을 조사함으로써 추정되었다. 구체적으로, 연구는 고도로 발현된 단백질 코딩 유전자와 관련된 1,000개의 프로모터에서 입력 및 입력 보정된 ChIP 신호의 중간 판독 밀도를 계산했다. 각 샘플의 경우, 입력에 대한 H3K27ac의 판독 밀도 비율은 데이터 품질의 대용물로 비교하여 H3K27ac/입력 비율이 4배 초과인 샘플들만 유지시켰다. 이 기준을 사용하여, 50개의 H3K27ac 샘플(GC 라인 및 1차 샘플) 중 48개가 4배 초과 농축되어 성공적인 농축을 나타낸다. 유사한 분석이 H3K4me3 라이브러리(프로모터 마크)에 대해서도 수행되었고, 42개 라이브러리 모두가 이 품질 조절 기준을 만족시켰다. 둘째, 라이브러리가 성공적인 또는 약한 농축을 나타내는지의 여부를 나타내는 ChIP-seq 품질 조질 및 프로토콜 최적화를 위한 소프트웨어인 CHANCE(CHip-seq ANalytics and Confidence Estimation)가 사용되었다. 연구에서 샘플 중 대다수(85%)가 CHANCE에 의해 평가된 바와 같이 성공적인 농축을 나타낸 것으로 밝혀졌다. 두 방법에 의해 평가된 각 라이브러리에 대한 평가 상태는 표 1에 보고되어 있다.
히스톤 ChIP-seq 라이브러리의 매핑 통계 및 품질 평가.
샘플명 라이브러리ID 히스톤 변형 총 매핑된 판독치 (MAPQ>10) 피크
(FDR <5%, CCAT)
CHANCE 프로모터에서 ChIP 농축 (> 4배)
T2000639 CHG018 H3K27ac 68,132,545 21,614 성공적 존재
N2000639 CHG022 H3K27ac 56,232,238 29,868 성공적 존재
T2000721 CHG026 H3K27ac 63,718,156 43,271 성공적 존재
N2000721 CHG030 H3K27ac 69,012,771 23,523 성공적 부재
T2000986 CHG034 H3K27ac 59,552,351 27,263 성공적 존재
N2000986 CHG038 H3K27ac 63,262,652 25,606 성공적 존재
N980437 CHG089 H3K27ac 24,841,454 14,717 성공적 존재
T980437 CHG093 H3K27ac 21,924,449 43,624 약함 존재
N980097 CHG097 H3K27ac 20,969,770 5,437 약함 부재
T980097 CHG101 H3K27ac 19,607,835 73,528 성공적 존재
T990489 CHG279 H3K27ac 17,247,914 52,036 성공적 존재
N990489 CHG284 H3K27ac 12,677,450 37,013 약함 존재
T76629543 CHG318 H3K27ac 12,912,838 12,636 성공적 존재
N76629543 CHG324 H3K27ac 16,361,856 30,714 약함 존재
T990068 CHG439 H3K27ac 28,128,868 92,041 성공적 존재
N990068 CHG443 H3K27ac 23,707,529 32,800 성공적 존재
T2000085 CHG447 H3K27ac 28,975,716 67,464 성공적 존재
N2000085 CHG451 H3K27ac 25,633,117 93,432 성공적 존재
T980401 GCC003 H3K27ac 61,492,830 118,309 성공적 존재
N980401 GCC007 H3K27ac 42,148,653 106,781 성공적 존재
T980447 GCC011 H3K27ac 69,872,340 109,853 성공적 존재
N980447 GCC015 H3K27ac 41,098,081 131,274 성공적 존재
T2001206 GCC019 H3K27ac 47,707,006 103,980 성공적 존재
N2001206 GCC023 H3K27ac 40,279,991 103,925 성공적 존재
T980436 GCC027 H3K27ac 42,255,541 99,869 성공적 존재
N980436 GCC031 H3K27ac 18,685,156 104,102 성공적 존재
T980417 GCC035 H3K27ac 31,413,426 72,174 성공적 존재
N980417 GCC039 H3K27ac 28,157,883 77,909 성공적 존재
T980319 GCC073 H3K27ac 39,373,811 99,105 성공적 존재
N980319 GCC077 H3K27ac 26,697,681 66,886 성공적 존재
T2000877 GCC080 H3K27ac 36,521,392 40,955 성공적 존재
N2000877 GCC083 H3K27ac 43,571,456 54,967 약함 존재
T990275 GCC086 H3K27ac 31,760,962 189,540 성공적 존재
N990275 GCC089 H3K27ac 29,830,003 77,678 성공적 존재
T20021007 GCC092 H3K27ac 24,455,102 128,614 성공적 존재
N20021007 GCC095 H3K27ac 37,328,252 140,389 성공적 존재
T20020720 GCC098 H3K27ac 33,143,174 75,297 성공적 존재
N20020720 GCC101 H3K27ac 41,166,130 64,078 성공적 존재
T2000639 CHG078 H3K4me3 67,834,207 15,445 성공적 존재
N2000639 CHG079 H3K4me3 55,494,042 13,233 성공적 존재
T2000721 CHG080 H3K4me3 46,397,600 12,513 성공적 존재
N2000721 CHG081 H3K4me3 49,140,770 13,183 성공적 존재
T2000986 CHG082 H3K4me3 64,771,240 13,416 성공적 존재
N2000986 CHG083 H3K4me3 55,125,882 14,221 성공적 존재
T980437 CHG091 H3K4me3 15,109,877 7,775 약함 존재
T980097 CHG099 H3K4me3 32,721,765 11,491 약함 존재
T990068 CHG437 H3K4me3 17,114,644 23,311 성공적 존재
N990068 CHG441 H3K4me3 21,403,480 9,608 성공적 존재
T2000085 CHG445 H3K4me3 16,983,508 16,274 성공적 존재
N2000085 CHG449 H3K4me3 16,171,233 13,421 약함 존재
T980401 GCC001 H3K4me3 23,909,424 12,005 성공적 존재
N980401 GCC005 H3K4me3 38,132,521 9,697 성공적 존재
T980447 GCC009 H3K4me3 34,216,551 9,474 성공적 존재
N980447 GCC013 H3K4me3 44,268,513 11,678 성공적 존재
T2001206 GCC017 H3K4me3 40,391,040 14,353 약함 존재
N2001206 GCC021 H3K4me3 37,385,163 12,831 성공적 존재
T980436 GCC025 H3K4me3 27,293,345 8,735 약함 존재
N980436 GCC029 H3K4me3 22,978,142 12,798 성공적 존재
T980417 GCC033 H3K4me3 34,433,924 10,222 성공적 존재
N980417 GCC037 H3K4me3 16,720,512 10,735 성공적 존재
T980319 GCC071 H3K4me3 26,211,223 14,712 성공적 존재
N980319 GCC075 H3K4me3 29,348,973 9,167 성공적 존재
T2000877 GCC079 H3K4me3 29,326,567 10,218 성공적 존재
N2000877 GCC082 H3K4me3 28,119,193 10,002 성공적 존재
T990275 GCC085 H3K4me3 18,145,486 25,313 성공적 존재
N990275 GCC088 H3K4me3 34,949,142 9,320 성공적 존재
T20021007 GCC091 H3K4me3 29,829,629 9,143 약함 존재
N20021007 GCC094 H3K4me3 26,657,454 15,570 성공적 존재
T20020720 GCC097 H3K4me3 22,283,141 11,351 성공적 존재
N20020720 GCC100 H3K4me3 43,532,126 9,899 성공적 존재
T2000639 CHG019 H3K4me1 74,550,475 8,757 성공적 해당 없음
N2000639 CHG023 H3K4me1 66,105,736 11,132 성공적 해당 없음
T2000721 CHG027 H3K4me1 63,149,869 49,925 성공적 해당 없음
N2000721 CHG031 H3K4me1 75,647,236 18,042 성공적 해당 없음
T2000986 CHG035 H3K4me1 56,988,063 26,669 성공적 해당 없음
N2000986 CHG039 H3K4me1 61,038,200 15,277 성공적 해당 없음
N980401 GCC006 H3K4me1 44,116,192 34,319 성공적 해당 없음
T980447 GCC010 H3K4me1 45,487,925 8,573 성공적 해당 없음
N980447 GCC014 H3K4me1 47,830,291 21,889 성공적 해당 없음
T2001206 GCC018 H3K4me1 39,039,599 38,861 성공적 해당 없음
N2001206 GCC022 H3K4me1 40,849,598 56,599 성공적 해당 없음
T980436 GCC026 H3K4me1 43,909,448 60,720 성공적 해당 없음
연구는 KATO-III 세포를 사용하여 H3K27ac 나노-ChIP-seq의 제2 생물학적 복제물을 실험적으로 생성하였고, 또한 규칙적인 ChIP-seq 프로토콜로부터 생성된 독립적인 H3K27ac KATO-III 데이터에 대한 결과와 비교했다. 공개된 서열분석 판독치는 서열 트리밍을 제외하고 나노ChIP-seq 라이브러리와 유사하게 처리되었다. FDR <5%에서 CCAT에 의해 검출된 피크를 비교했다.
크로마틴 접근성, 보존 및 결합 농축
후성유전체 로드맵 정상 위 조직의 크로마틴 접근성 프로파일은 유전자 발현 옴니버스(GSM1027325, GSM1027320)로부터 입수했다. 크로마틴 접근성 프로파일의 판독 밀도는 예측된 인핸서 영역에 대해 계산되었고, RPKM 단위로 100,000개의 무작위로 선택된 영역에 대해 비교했다. 연구는 또한 25 로드맵 크로마틴 접근성 및 H3K27ac 프로파일로부터 개방 크로마틴 영역(.narrowPeak) 및 활성 조절 요소 (H3K27ac, .gappedPeak)를 중첩하는 예측된 인핸서의 분획을 계산했다. 전사 인자 결합 농축 분석의 경우, P300과 ENCODE (wgEncodeRegTfbsClusteredV3.bed)에 의해 큐레이트된 다른 전사 인자 결합 좌표는 UCSC 게놈 브라우저로부터 다운로드했다. 적어도 1bp의 중첩은 BEDTools 교차를 사용하여 동정되었다. 진화 서열 보존 수준은 PhastConst 스코어를 사용하여 평가했다(Castelo R. phastCons100way.UCSC.hg19: UCSC phastCons conservation scores for hg19. R 패키지 버전 3.2.0). 인핸서 중점으로부터 500bp 내의 최대 스코어가 인핸서 보존 스코어로서 사용되었다. 보존 스코어는 또한 예비 검출된 인핸서 영역을 제외하고 10,000개의 무작위로 선택된 영역에 대해 계산했다.
예측된 슈퍼 인핸서의 동정
예측된 인핸서는 주석이 달린 전사 개시 부위(TSS)로부터 적어도 2.5kb의 농축된 H3K27ac 영역으로서 정의되었고, 또한 H3K4me1의 농축 및 H3K4me3의 고갈을 나타낸다. 이 연구를 위한 TSS 주석은 GENCODE 버전 19로부터 유도되었다. H3K4me3/H3K4me1 로그 비는 GC 세포주 및 1차 샘플로부터 집계된 H3K4me3 및 H3K4me1 신호를 사용하여 계산했다. 높은 H3K27ac 신호를 나타내지만 높은 H3K4me3/H3K4me1 로그 비(> 2.4)를 나타내는 원위 예측된 인핸서는 잘못된 예측으로 분류되어 분석에서 제외되었다. 이어서, 예측된 인핸서는 ROSE 알고리즘을 사용하여 예측된 슈퍼-인핸서 또는 전형적인 인핸서로 추가로 세분되었다. 다중 GC 라인에 걸쳐 적어도 하나의 염기 중첩을 갖는 예측된 슈퍼-인핸서 영역은 BEDTools을 사용하여 병합되었고, 예측된 슈퍼-인핸서 영역과는 다른 영역에 국소화되는 예측된 인핸서는 예측된 전형적인 인핸서라고 칭명되었다. 개별 샘플에서 예측된 전형적인 또는 예측된 슈퍼-인핸서의 존재는 배경 위 H3K27ac 농축 수준(P < 0.01, 실험적 테스트)에 의해 결정되었고, 후자는 100,000개의 무작위로 선택된 영역으로부터의 H3K27ac 신호(RPKM)이다. 예측된 인핸서/슈퍼-인핸서를 유전자에 할당하기 위해, 예측된 인핸서/슈퍼-인핸서 중심으로부터 가장 가까운 활성 전사 개시 부위(TSS)까지의 거리를 계산하여 무작위로 선택된 영역 위 H3K27ac 농축을 갖는 프로모터(TSS에 인접하는 500bp)로서 정의했다. 반복 예측된 슈퍼-인핸서와 관련된 유전자를 단측 피셔 정밀 테스트(one-sided Fisher's exact test)를 사용하여 종양 유전자 농축에 대해 시험하였다. 상위 500개의 종양 유전자가 사용되었다. 반복 예측된 인핸서 및 예측된 슈퍼-인핸서를 동정하기 위해, 각 GC 라인 중의 영역을 신호 강도에 따라서 순위를 매겼다. 라인에 걸쳐 각각의 예측된 인핸서/슈퍼-인핸서의 순위를 곱하여 순위 생성물을 계산했다. 순위 생성물의 통계적 유의성을 결정하기 위해, 무효 분포에 대한 관찰된 순위 생성물을 계산하였고, 각 라인에서 순위는 정비되었고, 순위 생성물이 계산되었다. 정비 절차는 10,000회 반복에 대해 반복했다. 무효 분포 미만의 관찰된 순위 생성물은 통계적으로 유의하다고 간주되었다.
예측된 상호작용의 검증
슈퍼-인핸서/유전자 할당은 3개의 직교 상호작용 데이터 세트를 사용하여 검증되었다. 여기에는 다음이 포함된다:
i) 12개의 세포주에서 PreSTIGE에 의해 검출된 소정의 상호작용. PreSTIGE 상호작용 데이터는 시스-조절 요소 및 표적 유전자를 포함하는 PreSTIGE 웹 사이트(prestige.case.edu)로부터 다운로드되었다.
ii) 기본 매개변수를 사용하여 GREAT에 의한 시스-조절 요소/유전자 할당
iii) K562, HCT-116, NB4, MCF-7, HeLa-S3 및 GM12878 세포에서 RNAPII ChIA-PET 연구로부터 인핸서-프로모터 상호작용의 참조 세트. ChIA-PET 상호작용 데이터는 encodeproject.org 및 GSE72816으로부터 다운로드되었다. 각 생물학적 복제물에서 동정된 모든 상호작용은 검증을 위해 고려되었다. 이러한 상호작용은 2개의 유전자좌(앵커)를 포함하고, 이중 하나는 TSS의 2.5kb 이내이고, 다른 앵커는 본 연구에서 발견된 예측된 슈퍼-인핸서 영역과 중첩된다.
i)-iii) 이외에, GC 라인에 대해 포획-C 분석을 사용하여 추가의 검증이 수행되었다(참조: 도 4).
기능적 농축 분석
GOrilla가 반복 예측된 슈퍼-인핸서/유전자 프로모터 또는 예측된 전현적인 인핸서/유전자 프로모터 상호작용에서 농축된 생물학적 과정(유전자 존재론 주석)을 동정하기 위해 사용되었다. 기본 GOrilla 매개변수가 사용되었고, GENCODE v19의 유전자가 배경으로 사용되었다. 비교가능성을 보장하기 위해, 세포주에 걸쳐 최고 H3K27ac를 갖는 예측된 전형적인 인핸서가 동일한 수의 반복 예측된 슈퍼-인핸서와 일치하도록 선택되었다. 전자를 선택하기 위해, 예측된 전형적인 인핸서는 각 라인에서 순위가 매겨지고, 순위 생성물 스코어에 기초하여 선택되었다. 이어서, 반복 예측된 슈퍼-인핸서와 관련된 가장 중용한 용어(> 1.5배 농축)를 상위 예측된 전형적인 인핸서와 관련된 농축 수준과 비교했다. GOrilla 이외에, GREAT가 더 큰 유전자간 영역에 인접된 유전자에 대한 보정을 제공하기 때문에 반복 예측된 슈퍼-인핸서 및 상위 예측된 전형적인 인핸서와 관련된 기능적 농축도 또한 기본 매개변수를 사용하는 GREAT를 사용하여 연구되었다. 유의한 용어(또한, >1.5배 농축 포함)는 이항 p-값을 기준으로 정렬되었다.
1차 샘플 중 세포주 유래된 슈퍼 인핸서
2배 이상의 H3K27ac 농축 또는 고갈을 나타내고 0.5RPKM 초과의 절대 차이를 갖는 영역은 GC와 정합된 정상 샘플 사이에 차별적으로 존재하는 것으로 간주되었다. 주성분 분석(PCA)의 경우, 예측된 슈퍼-인핸서의 신호가 사용되어 2명 이상의 환자에서 체세포 증가를 나타내었다. PCA 분석은 R을 사용하여 수행되었고, 'pca3d' 패키지를 사용하여 플롯팅되었다. 80% 전력 및 5% 유형 I 오류 (http://powerandsamplesize.com/)를 달성하기 위해 필요한 샘플 크기는 종양 및 정상 샘플로부터 100개의 예측된 슈퍼-인핸서의 평균 신호(표 2)에 기초하여 추정되었다. 이 결과는 권장된 샘플 크기가 13(평균)이었고, 이는 연구(19 N/T)에서 충족되었다. 1차 샘플에 기초하여 3가지 부류의 예측된 슈퍼-인핸서가 정의되었다: i) 체세포 증가, ii) 체세포 손실 및 iii) 변경되지 않음. i), ii) 및 iii)과 관련된 유전자는 이전에 문헌(참조: Hnisz, 2013)에 보고된 유전자 그룹으로 메핑되었고, 여기서 각 그룹은 다수의 유전자 존재론 카테고리의 편집이고, 다양한 암성 특징에 대한 프록시로서 사용되었다. 통계적 유의성은 R에서 단측 피셔 정밀 테스트를 사용하여 계산되었다. 다른 조직 유형에 걸쳐 반복적으로 증가된 체세포 예측된 슈퍼-인핸서의 계통-특이성을 평가하기 위해, 위 예측된 슈퍼-인핸서 사이의 중첩이 다른 비-위 조직에 대해 계산되었다. 각 비-위 조직과의 농축 비는 전체 관찰된 중첩 대 chance에 의한 전체 중첩에 기초하여 계산되었다.
10명 이상의 환자 및 할당된 유전자에서 체세포 증가를 나타내는 상위 100개의 슈퍼-인핸서
콘틱 개시 정지 전체 환자 할당된 유전자 기호
chr1 233,242,450 233,253,100 14 PCNXL2
chr3 148,314,000 148,323,900 14 GYG1
chr7 575,600 583,900 14 PDGFA;AC147651.3
chr10 95,142,550 95,149,000 13 MYOF
chr12 93,703,300 93,716,550 13 RP11-486A14.1
chr13 31,402,050 31,421,550 13 USPL1;LINC00398
chr15 72,528,100 72,532,050 13 PKM
chr20 46,597,900 46,609,000 13 RP11-347D21.4
chr20 61,334,350 61,336,500 13 RP11-93B14.4
chr4 143,467,400 143,475,500 13 INPP4B
chr6 138,405,450 138,413,000 13 PERP
chr10 33,420,550 33,448,450 12 NRP1
chr10 124,022,000 124,073,650 12 BTBD16
chr11 89,337,050 89,342,700 12 TRIM77
chr2 8,766,400 8,785,950 12 AC011747.6;SNRPEP5
chr2 30,886,400 30,890,950 12 CAPN13
chr2 151,380,100 151,387,900 12 RND3
chr20 36,722,600 36,785,850 12 TGM2
chr20 50,302,150 50,379,300 12 RP5-827A12.2;ATP9A
chr20 56,271,150 56,275,000 12 PMEPA1
chr3 141,655,450 141,661,750 12 ATP1B3
chr5 67,062,650 67,073,700 12 RP11-434D9.1;RP11-83M16.6;PIK3R1
chr6 86,108,600 86,129,950 12 NT5E;RP11-30P6.6
chr7 17,242,450 17,252,950 12 AC003075.4
chr7 27,713,900 27,721,650 12 HIBADH
chr8 19,516,550 19,525,800 12 RP11-1105O14.1
chr8 94,880,850 94,899,700 12 RP3-388N13.3;PDP1;MIR378D2
chr8 124,681,700 124,695,650 12 CTD-2552K11.2
chrX 132,807,600 132,814,350 12 RP3-417G15.1
chr1 19,331,100 19,342,550 11 IFFO2;UBR4;RP5-1126H10.2
chr1 149,987,150 149,996,100 11 OTUD7B
chr1 162,316,150 162,324,600 11 C1orf226
chr10 75,645,800 75,660,400 11 PLAU;VCL
chr11 12,186,850 12,207,700 11 MICAL2
chr11 35,357,500 35,360,800 11 AC090625.1
chr12 2,268,950 2,280,050 11 CACNA1C-AS4
chr12 14,360,100 14,362,500 11 RN7SL46P
chr12 118,122,450 118,125,400 11 KSR2
chr12 132,344,550 132,346,400 11 RP11-417L19.2
chr14 61,643,050 61,647,400 11 PRKCH
chr14 75,507,300 75,510,200 11 MLH3
chr14 102,536,000 102,540,650 11 HSP90AA1
chr15 101,259,950 101,276,450 11 RP11-66B24.5;RP11-66B24.2
chr18 29,088,000 29,095,100 11 DSG2
chr19 42,274,750 42,285,750 11 CEACAM6;AC011513.4;CEACAM3
chr19 50,670,050 50,685,350 11 MYH14
chr2 8,445,650 8,457,150 11 LINC00299
chr20 56,841,250 56,845,250 11 PPP4R1L
chr4 113,002,500 113,008,400 11 TUBB8P3
chr7 46,017,900 46,020,700 11 RNU7-76P
chr7 46,229,800 46,262,500 11 AC023669.1;AC023669.2
chr7 73,204,750 73,314,500 11 WBSCR27
chr7 100,396,800 100,402,200 11 EPHB4
chr8 37,447,750 37,479,500 11 RP11-150O12.3
chr8 142,213,300 142,220,550 11 SLC45A4
chr1 20,806,050 20,825,150 10 CAMK2N1
chr1 59,037,200 59,059,450 10 TACSTD2
chr1 186,806,100 186,820,000 10 PLA2G4A
chr1 201,223,450 201,282,500 10 RP11-567E21.3;TMEM9;TNNT2
chr1 235,804,100 235,807,100 10 GNG4
chr10 97,877,700 97,886,350 10 ZNF518A
chr11 12,145,900 12,173,050 10 MICAL2
chr12 12,985,800 12,991,300 10 RP11-59H1.1;DDX47
chr12 104,245,750 104,255,900 10 RP11-650K20.3
chr13 74,243,950 74,259,650 10 LINC00392;KLF12
chr13 80,655,150 80,663,050 10 SPRY2
chr13 106,790,700 106,804,950 10 LINC00460;RNA5SP38;AL603632.1
chr14 54,911,250 54,917,100 10 CNIH1
chr16 52,483,700 52,506,000 10 RP11-297L17.2;TOX3
chr16 86,695,500 86,700,800 10 MTHFSD;FOXL1
chr18 3,814,650 3,818,650 10 snoU13
chr18 9,823,650 9,840,800 10 RAB31;RN7SL862P
chr19 42,233,300 42,251,850 10 CEACAM6
chr2 8,548,250 8,558,050 10 LINC00299
chr2 62,791,800 62,808,700 10 AC107083.1;EHBP1;TMEM17
chr2 121,688,900 121,702,700 10 FLJ14816;AC016764.1
chr20 19,858,600 19,864,650 10 RIN2
chr20 48,802,850 48,878,800 10 CEBPB;RP11-290F20.3
chr22 30,645,950 30,655,100 10 LIF;RP1-102K2.6
chr3 14,098,050 14,100,800 10 TPRXL
chr3 122,160,250 122,165,300 10 KPNA1
chr3 158,485,100 158,509,400 10 RP11-379F4.1;RP11-379F4.8
chr3 159,823,350 159,827,600 10 IL12A
chr3 190,019,750 190,027,750 10 CLDN1
chr3 197,313,350 197,328,100 10 BDH1;AC024560.3
chr4 7,945,700 7,982,500 10 AC097381.1;AFAP1;ABLIM2
chr4 57,079,600 57,085,100 10 KIAA1211
chr6 137,279,250 137,292,400 10 RP11-204P2.3;RPL35AP3
chr7 27,456,650 27,466,800 10 AC004009.3
chr7 48,177,150 48,189,350 10 UPP1
chr7 97,712,250 97,718,650 10 LMTK2
chr7 97,738,750 97,766,850 10 LMTK2
chr8 53,241,850 53,257,600 10 RPL34P17
chr8 95,200,950 95,225,750 10 KB-1247B1.1;CDH17
chr8 95,244,800 95,256,850 10 CDH17
chr8 128,402,500 128,419,900 10 RP11-382A18.3;POU5F1B;CASC8
chr9 111,234,600 111,241,950 10 RP11-240E2.2
chr9 139,421,550 139,429,600 10 NOTCH1
chr1 7,597,450 7,611,950 9 VAMP3
chr1 20,171,500 20,206,000 9 OTUD3
포획-C 및 데이터 분석
포획-C는 전술한 바와 같이 수행하였다. 간단하게, 1x107 세포를 2% 포름알데히드로 가교결합시키고, 용해, 균질화, DpnII 소화, 결찰 및 탈가교결합시켰다. DNA는 Covaris를 사용하여 150-200bp로 초음파처리하여 올리고 포획에 적합한 DNA를 생성시켰다. 3μg의 베어낸 DNA를 라이브러리 제제(New England Biolabs)의 서열분석용으로 사용했다. 예측된 슈퍼-인핸서 서열은 맞춤형 바이오티닐화 올리고(IDT, 표 3)로의 순차적 하이브리드화 및 Dynabead(LifeTech)에 의한 농축으로 이중 포획되었다. 포획된 DNA는 Illumina MiSEQ 상에서 150bp 쌍-말단 구성을 사용하여 서열분석되었다.
포획-C 기술에서 사용되는 포획점 좌표 및 서열.
#1 chr1:202003857-202003977 ATCTCTTTCCTTCAGCCTGCCGTTCTTTCTGCAGCACCAGGGCCCTGGGACCAGCTGGTGGTTTCCACCAGAGCAGCCTCGGGGTGAATTTAGTCAGGAATGTGCCCTCAGCTCAAGAGA (서열번호:1)
#2 chr1:202015440-202015560 GCTAAGTGAGGTGCAAACAAGAAACCTGGGTTGCCTTTGCCCTCTGTCCGCCCCTTGTCCTCTGTTTACATCCTCCCTTCCCGTAAATGAGTTGGGTGCTGGGCCCCACTGGCCCTGATC(서열번호:2)
#3 chr1:202025797-202025917 ATCTGGAAGGCTTTTCCCAGCTTAGCGTGGTCAAGATAGGGATGGGCCGAGGCTGGCACTGATGCTAGACTTCCGTGCACAGGGCAAGTATGGACAAGCCCCAAGTGGCTTTGTGAGGCC (서열번호:3)
#4 chr1:202054225-202054345 ATCCCGGAGATGGGGGGTGGCCCTGGGCCAAATCAGGCACCTCCCTTTCTCACCAGGTAGTGCCTCCCTGCACGTTCACACCCAATGCTGTGTTGTCAGGGGCTGTAACCTGAGCCCTGG (서열번호:4)
#5 chr1:202077797-202077917 GCTAGCCATCTGTTGAACCACACCCCTGCCCCAACCATTCTAGAAAGAAATATAAATCTCTTTTACAGCTGTAAATGGAGAGCTCTGTAACTCTAATATGGAGGGAGATACACGCTGATC (서열번호:5)
#6 chr1:212656104-212656224 TTAAATCATTAGAGGGATTTATTTCCTTTCCGGAAGAGTCACTCTTCTGCGGTCCTTCCACACCCAGCTTTGGACTGGGCCACCTGGCAAGGGTGTGAAGTGGACTTGTGGTTGATGATC (서열번호:6)
#7 chr1:212658162-212658282 ATCCACAGTCTGAAGGGCATTGCATTAGGGCCAGCCCAGGGCGAGTGGCCTTAGCTGGGCTGGCTATAGCGTGTAGCAGAGGTCAGTATGGAAAATGGCCCTAGGTGCATTCTGGGGCTC (서열번호:7)
#8 chr1:212691818-212691938 ATCATTCTGAAATTGCTTTAGGGGGAAAGACGTGGGAACTTCACACTTCCACCCAGGGTGCCCCCTCAGCAATCTGGAATGATGGACTAACCATTAGCTGAGGGAGGAGGGGGCAGGACA (서열번호:8)
#9 chr2:62796950-62797070 ATCACTTGGTCTGAATATAGGCTAGTAAGGCCCATATCATAAGGCCGGTAAGATTCAAAAAAGGTAAAAAAAAAAACATCTAGTTTCGCAGACTGCAATCTTAAATACAGCAAGCCATTT (서열번호:9)
#10 chr2:62805211-62805331 ATCTTTTTGCCAAATTGGATGTGAGCTGACTCACTGACATATTTCTCAAGTGACCCATTGGTTCAATGAGTAACATCCTGGAAGAAACATGAGTTATTGTTAATCATAATTATTCCTTCA (서열번호:10)
#11 chr2:106020684-106020804 ACAAGCTGTTCCTCCCACTCAAACCTTGGCCAGGAAACTGGTGGATGATTTGCCCTTGATTCAGAGGCAATCATTCTTAATTGCCTCACATGGTTGGAAGGTGAGTAAGTGTCTAAGATC (서열번호:11)
#12 chr2:106065222-106065342 ATCAGTAAAGCGACGCTTTGAGAAGGGGAATTCCTTAACCAGCCTAAATCAGTGAATAGGATTTTGCAGAGGGAATTAGCTAAATACATTCCAAATTAGGGAAGAAGGGATTTTGACAGC (서열번호:12)
#13 chr2:106071749-106071869 AACACAGATGCTTCAAGTGCCAACAGCCAATAACCTATAACCCGAATGACATTAGGCTGGGACTGAAAGAAGTCAGGCAGCAGGCAGGCAAGCCTTTTAAAGAAAACTGAATCCAAGATC (서열번호:13)
#14 chr2:114039690-114039810 ATCTGCTGAGCCTTCAAAAGATGTTCTTTCTTTTCTGGACTCAGCTGTAATGCACTGGGCTGGTGGTAGGGTAATAAAGTGCCCTGGTTTGCCCTGGACGAAAACCAACAGTGTTTTCTA (서열번호:14)
#15 chr2:114046487-114046607 CAGACCCTTTTGGGGCCCTGATTTACAGGTGCCCTGAAGGGGGAGGTATTGTTCTAATGGCCCTGCGGGAGGATGAGGTCACTTCTGTGGGACTGTCTTACTCTGGCCTGCGCTGAGATC (서열번호:15)
#16 chr3:149057460-149057580 ATCAATTGTTATTTGGAAGATGGTTCCAGAAGAATGACAGAAGTGAATGAAGAGGATATTCCTGGCTGGAAAACTTGATAAAATTGTTGAAAAGGGAGTTGAGTAATTTATTTGTCTTTG (서열번호:16)
#17 chr3:149086491-149086611 CTGTCACTTGAAAGAGCCTAACCCTGTACAGTAAGGAGAAAAATGCCTGTTACCCTTCCAGGGAGGCTGATACTTGCAGCACCTGGTAGAAAGGACCAGTGCCTAACTGGGGTGATGATC (서열번호:17)
#18 chr3:149105264-149105384 CTCTGATGAGACCCTTCAGAATAGCTGTCCCTAAGAGGAACTAAATCAGGAATTGGGGATAGCTGGCAAGAAGACATCAAAGAAAGCTCAGGATGTGGAATCTCTACATTGCCCTGGATC (서열번호:18)
#19 chr3:149119076-149119196 ATCTCCAGTTGCCTGTCACTACCCTCTGTCAAGACCCTTGGAGTCATGACTAACAGGAAGGGAGCAGGTGGCAGCGTGGCCACCTGCCATGCAGAAAGACTGGGTCACTTCCTGTTGGTA (서열번호:19)
#20 chr3:193544590-193544710 TTGTGAAACTGAGTTGAATGGAGAGGGTTGGCTGGAGACCTGAAAGAGGATTTTTAAAGGCCCAGGTCTCATCATCAACGTGGCCACTCACTAGGTGGTGGAAGGAATGTAGAAAGGATC (서열번호:20)
#21 chr3:193570162-193570282 TCTGCAGAGCGGCTCTCCCACCTGCTGGGATTCTCCAGAGGAATCCTTTTTCTTCCGTCTGAGTTCAGCAAACTTCCTGCTTCCTCTACCCAGCGCAGCGAGCCCCTCTCTGTACTGATC (서열번호:21)
#22 chr3:193591177-193591297 CTGCCACCTCAGCTTTGCAGCGCCTGGTGGGTAAACTCTTGTCCCCTCTCCGTGGCTCTGGTCAAAGGTACCTTCATTTGTGAGGTCTTCTCAGAACCCTCAGGCACAGTTAAATTGATC (서열번호:22)
#23 chr6:6812846-6812966 ATCCCAAGCCTGTGGGTTCACCTGCTCTAAGAAATCAATAAGTCAAGGGAAACATCAAAGGGCATTACACATATGGGCTTTGACGCCAGGCCGACCAACTTCAATCCAGGTCTAAATGAG (서열번호:23)
#24 chr6:6821149-6821269 GGACAGGTGAGGCAGGCCAGAACCGGTGACTCATGGGCTCCCCTTGGTCAGGAGGGCTGGAGCAGGTAAAGCCCGCCCACAGCCGGGGAACCCACACCCAGCACACGTTCTCTCCTGATC (서열번호:24)
#25 chr6:6857714-6857834 GGAATGAGGTGGGGCAGGACCTGAGAGCAAAGTGTGAGCTGGTGTGCAGAACCACCCGGAGGTGGAAGGAAGCTAGAATCTAGTGTAGGGTGCCTCTGACACTTGTCCCACACATAGATC (서열번호:25)
#26 chr6:137283834-137283954 ATCAACTCCTTTCGGACCCACAACCTCTTCTTTTTAAGGCTGCTTGAACTATTTATTAGTCTGTAATTAGAGTCCCAAGCGTTTCCTTCTGTTTCCTAAAGGGTTGGAAAAATGCCCCGA (서열번호:26)
#27 chr6:137285302-137285422 ATCCATGTTCCCTATTTAACATGCTATTCCTGTCCCCAGAAAAATCCTAAGACACATACACGCGTGCTCTCTCTCTCACCTCTCACATTGCTTAAATAAGAGACCACAACATACTGTGAA (서열번호:27)
#28 chr6:137291056-137291176 CATAGGGCTTTGCTCTTGTCTCCATCCCTGAAAAATCCTTCCTAAGCACTGTATGGTATAAATATTTTAGTATCTGTCCATGGATTGGCTTGTTGTCTTTGTTGAGTTGCACGCATGATC (서열번호:28)
#29 chr6:137322790-137322910 ATAGAGTCTAGATAGAAGACCCTCCTCTCCGAGCCCATCCCCCTCAGAAGGCTCGCAGCCCTCTGAATCCTGGTCGAAGCTGGACAGCGAAGGAATACACAGCCTGCCAGTTTGGGGATC (서열번호:29)
#30 chr6:137347579-137347699 ATCTGCACAGTCAGAAGATACTCAACAGCTGCGTTTTAATGAAGGCACAGTAACCCATGGCATGGCAAGTGGTTGCTACATATTTTATGTGTATTTTTAAATAGGAAAATACCTTCATAG (서열번호:30)
#31 chr6:137358698-137358818 TCCTTTTAGACATCAGAGGCCTGTGTTCATCAGGAACCTGATGCTGAATCATTGGAGGGTAAATGAACCTTCCAAGGTTCAGTGTTTAGAATGTTGTAGACCAGCAGTCTCATCATGATC (서열번호:31)
#32 chr7:579567-579687 AGCCCGCCCTCCTAGGAGAAGCCTGGCCAGGTTCCAGTGGGGTGGTGGCCCGGCCCATAAACAGGAGGGGTTTATGGCCCAGTGACAGGCAAAACTGGTGGGGCAAGCCCAGGCTAGATC (서열번호:32)
#33 chr7:73236865-73236985 ATCTGGCAGCTGGACTTCTTGGGCTCTGAGAAGGCAAGAGATTAGTATCTGTGTGTGACAGGAGAGGGCGTGGCTGGTGTCCACCCATCCATGCTGGGAGACGTGGGAGAGATGGGGCGG (서열번호:33)
#34 chr7:73265873-73265993 AAACCAGAAGGGCACTACTGAATCAGGGTACAGGCAGTGTCTGAGACTCTGGTTAGCCTACAGAGTCATCAACGCACGTGTGCTGTAGACTTTTTTGTTTTTGCAAATGAGGGTGAGATC (서열번호:34)
#35 chr7:77108916-77109036 CATTTCATGAAAGGAGTCTGATGCTTGTAAACTAGCTCAAATTACCTACTGGATGACCAGAGATGCAAGGCTAGAGAAAGAGGAGCTCTATTGCATCAGGAGCTGAGGCAGGAGAGGATC (서열번호:35)
#36 chr7:77110971-77111091 ATCAAGAACAACCCCATTCACTCCTAATCAAATGACCAACCTGGCCTTTGGCCTTAATAGGAAGTAAAAGTGTCTCTTCCGGCATTGTATCAGTGGTATGTGCCGCACCTACCACACCTG (서열번호:36)
#37 chr8:42334716-42334836 GTGAGGAACAAACTTAATTGGGTAGAAGTGTTTCGCCTCAAGCAACTTGTAATTACTGGCATCGCTGTAGTCACAGGAAGAATAACAAATGAGAGGTTCCAGAATCCTTCTGGAAGGATC (서열번호:37)
#38 chr8:42349895-42350015 ATCTGCCCATGCAAGGTGTGTCTTCACTTCCTAAGGAAGTAATACTGCAGAGAGGAATGTCATGACTACTCCTCTCATATAATTGCAGTAGAAAGACACGAGATGATGAAGAAAGGAAGG (서열번호:38)
#39 chr8:42356194-42356314 GCTGAAGGCATCCCTCCTGCTCACTGCTCCTTCCACTTTAGATGAACAGCTGGAACTCACATAACACAGCCTCTTCCGACAAGATTTCCTTTAGAGAGAGAACATTCTAGGGATGTGATC (서열번호:39)
#40 chr8:102017079-102017199 ACTAGGATGAAAGGCAGCTAAAAAAGAAATATATGGCCAGGCCAGTTTACCTGGAGTAAGATACAAGTAGAATAACAGGAGTTGTAATTACAAAGCTTGGTGGGAAGGCTATGTTAGATC (서열번호:40)
#41 chr8:102039348-102039468 ATCTCCTTGACCCTGCAGCCAATGCCTCGGTCAGCCAGTGCACCTGTACTGTCTCTCCTCTTGGGATAGGGTCCCTCTCCATCAGGTACAATATATGGGAAATCGAGGGGTGGCCTTTGT (서열번호:41)
#42 chr9:36316800-36316920 GGAGGGCAGCTGGCAGGGGCAGGCTCTGAAAGCACAGCTGTGTGAAGGTCCGGTTCAATATCCGCTTCAGAAGACACACAGCCCTTTGTTGCTCATGTCTGTTGCTGTCTAAAGTTGATC (서열번호:42)
#43 chr9:36317845-36317965 ATCCCTGAGGGAATGAGCCACGGTTCAGCACCCAACCCCCACTTGAACTCTGCAGTTTCCCAGTTTCATTAAGAAGCCCATTGTTGAGTCTGGCCATGCGTCAAGGACACGTGGACTCTT (서열번호:43)
#44 chr9:36320662-36320782 GAGGCCTCAGCACTCCACTGACTCATCAACCCTTCTGTCCTTTGATGGGTAGGATGGGGTGAACGCTAATGCCAGCAGACCTGGTTTCATAATATCTTAGTGTGTTCTGCATGTGTGATC (서열번호:44)
#48 chr12:6325227-6325347 ATCCTGTTTGTTCTTGCTGGCACTGCCTGGCCCGGCTTCCTGAGGAGTGAATCAGCCCATCCAAGGCTTGGCATGCAGTAGTGAGCCAAGGGTTGCCATGGAGATGGGCGAGGCCCAGAG (서열번호:45)
#49 chr12:6387778-6387898 AGGGCCCGCGGGAACGGCCTGGCCCAGGCCCGCGCGCCCTGCCCTGTGTTCCCGGGAGGCGCGGTCTCCTGGCGGCAGGGGAGTCCCGGGAGGGCGCAGGGCGGCGCAGAGCCTGGGATC (서열번호:46)
#50 chr12:6389188-6389308 ATCATTTGCATAGCTCTTAGTTATTTGAGCAACACATTCATTTAATTCCACAGCAATGTGGGGAATGAGGGACTCTTCCCTGCTTTCCAGGTCAGCAACAGGAAAAACAAATGATTTGCT (서열번호:47)
#51 chr12:6404529-6404649 GGTTGCCTGGGGCAACCCTGGGAAGGTGAGGCCCTGGATTTCCTGGTCTGGCCTCTGAGAACCTCCTAGCACCCCAGAACTCCCAGACAGAATGTTAGGTAATGCCAATGAGCACAGATC (서열번호:48)
#52 chr12:12988275-12988395 ATCCAAGTTATCAAAAGTGGGTAACAAAGCAACATCAAGAAACTGTGTCCTTAAAACTAAGAGAATATACAAGACATTCTAATCCACATGGTTCTTAGGGTGAAATCTAGCCTCTGGGCA (서열번호:49)
#53 chr12:12989691-12989811 CTTCCTGTGTTTCAACCTTCTTATCTGAAGACACACAGTTATAGTACAGCATTGTGAAGTTAAATGAACTATACTGTGGCTCATGATAACAATCAGTAAGTGTTAGTCATTATAATGATC (서열번호:50)
#54 chr12:53364077-53364197 GCTGCATGCCTGGCAGCTAGTAGGTACTGCATAAATACAAGTTCATTGGCTCTCCTTGAGTTGTCTGGCTGGGGTCCCAGAGACTGAAACTTTGCTCTTGGCTGCAGCAGGGGCAAGATC (서열번호:51)
#55 chr12:53386828-53386948 ATCTGGTAACGTTGGGCCCTATTTCAGTTGACAATGAGAGTCAGGGTTGAGTTGTGACTGTCACCTTTAAAGAAAGTACATAGAGTAGGCTAGGCGACAATGACAAAATATCAGCAACTT (서열번호:52)
#56 chr12:125073621-125073741 CTCTTTAGAACGTCTCTTCCTCCCGTGGGATTGGAAAGAACATTTGTCCTCAGCGGCAAAGGCAGGGCTTCATCAAAGACGAGTGACTCAGTGCTTTTCCTGCTGTCTGGCCACATGATC (서열번호:53)
#57 chr12:125088201-125088321 ATCCCCCCAACAATCGTCTTGTATTTTTTTCAGCTCAGTTTCCTGAGCCTGCCACACCGAGGGCCCCACAGTCGGAAACCACGTTTGGTTCGAAGCTCTCCTGTTCTCATCTGGAAATTC (서열번호:54)
#58 chr12:125122284-125122404 GAAGATAAAAATCTATTAGCTGCCAAGAGGATTGCTGGGAAAAGCCAAGCCGTGATTCATAGGGTAATAAATAGAAAGACAGTCCCGGCCCCGGGGCTGCATCTTCCTTGCATGCTGATC (서열번호:55)
#59 chr12:125168228-125168348 TATTTTCCCTTCAGAAATAGCATCCTTAACTTTCTTTTTTTTTTCCTTATTAAAAATGTACTCATGTAATCCACATGCACTGGCTGTGAGAAATTCCAAAATGTCTTTTGGAGAGAGATC (서열번호:56)
#60 chr13:73900379-73900499 TTGTGAAGTGGGATATGTTTTTAAATTTCAGAGAACAGGAAGATGAATTGTTTTTAATGGATTTTTTTTAATAGGCAAAGCTGTGTATGCACAAATGCTGGCCAGTGTAGGGCTATGATC (서열번호:57)
#61 chr13:73909247-73909367 ATCTATTTCTCTTATTTTTTTTTAAATCTAGTGTTTCATAATGTCTAAAAGAAAGTGTTTGCAAGTCATTGTGGTTTTTTTTTTTCATCAAAGTATTCCTTGTTTCACTCTCTGTCGCAT (서열번호:58)
#62 chr13:73910858-73910978 ATCCTGTCTCATCTTGGATGTAATTCCTACAGTTAGACTTCTATCAAAGGGTCATTGTGCCAACTGGAATTCTTTCCAATTCGAGAAATAAGAATTTGAGGAATCTCTAAGGGTAGAAAT (서열번호:59)
#63 chr13:74002592-74002712 ATCTCCTTACATAAGGAGAAATTTTCAGAAATTAATAAAATGAAGTTCAGCCTTAAGGAATGTGACTAATACATCTGAGATAAGTGACTCAAACACTAGAAGAGGGAGATACTTGCAGTT (서열번호:60)
#64 chr13:74025384-74025504 ATCTTGACAAACACTAGAGACCCATCAGCCAGAGTGAATTCCCTTAGTGAAATCACTATTCTCTGCCAAGAATCAAAGGTCATCCCAGTGGAGTGCCGTCTTCGTGTTCAGCAGCTACGG (서열번호:61)
#65 chr13:74039936-74040056 CTCTGTGAGTCAGCGAAATGGATTGAATTATAAACCAGAAACCAGCACTTCAATCTGATGAAACTCATCCTATAGAGGAAAGTGTCACTACATGTTGGCAGTTTGTAAAATGTGATGATC (서열번호:62)
#66 chr13:76278885-76279005 ATCAGAACTGGAACTGAGCGATAGAGCTTCAGAGAAACTTGTTGTTTACATTGGCAAGAAATCTTATCCAGCAAGAGGATTAAAATAAAACCATGACCAAAACAGTAAAGGGTGTGAAGA (서열번호:63)
#67 chr13:76298560-76298680 ATCCTAGTACATAGAGGTATCTGGAAGGTTATTATGTTATCTGAATCTTGAATAGAATCAGTTACCTGAAGCCAGTGTTACCTTAGGAATTCCATATGTGTGATTGAAGATTGCTTATTA (서열번호:64)
#71 chr14:93510901-93511021 GCCACAGGGCCCCCCAGGTAAAGGACTGACAGCCAGCCATGCAAGCCCCTGGGACTGACCCAGATGCAGAACTGACCAATGTGGCGACAACCATCACCCAACCCTGTGGGGCTGTAGATC (서열번호:65)
#72 chr14:93516507-93516627 TACACAAGGAGGACTGGGTTGCACTCGGTGCATTTTAAAGAAAGCCCGGCGGACACACGGGTTCTCCTGCTGGTGCTGCCAGCCTGGAAAATGACAGCTGAGACTCAAGCAGGCAGGATC (서열번호:66)
#73 chr15:101262583-101262703 ATCCAGTGACTATACCTGGAATTTGGCCTCTAAGCGAGTGTTTCTTTTTGCACTTGGACTTCTTGAGAGATTACTCATTACTCAGGAGATAACACCAAAGCATTCTCAAAACCAATCTTT (서열번호:67)
#74 chr15:101272951-101273071 AATATAGGAGAAAGGTCACAGTGGCTTGGAGATGAATTCCAGGACACAGCACTGCAGGAGGGACCATGCCCCTCGAGGCTTCTTATATGTGGTTCCTCAGTTCTTGGCTAAGTTAGGATC (서열번호:68)
#75 chr16:17369195-17369315 TGTGGGCTGTTAACAACTACGCTTGGCTCAGTGCCCCACAGGTTTCTAAAGTCCCCCCCAGGAGGAAACACCACTTCCACCAAAGGCCCTGGAAGAAAGCAATCACTAAGTGAGCTGATC (서열번호:69)
#76 chr16:19010165-19010285 GCTGTTTGCTCATCTGTTTGTAAAGCCTTAGACCCAGCCAGTCACCGGCCCCACCCAGGTGCCAGTTGACGTGAGTCATGCAGTTTCTCCTGACACTACTGTTACAAAGTCTAGCAGATC (서열번호:70)
#77 chr16:19016835-19016955 ATCCTCCATTCCCGAGATGAGAAAAATGTGACTCTGAGGCAGCTGTGGTCTCTCCTGGGGTGGCTTGGCTGGTGGGTGACAGGCCAGTATTTTAAACCAACCCAGGCTCCAGCCTGGGGC (서열번호:71)
#78 chr16:19440596-19440716 ATCTCAATACTAACAAATGTTTATTTACAGGAAGGCTTTGTTAATTGAGTGATGGAAGCTATTGCTCTCACTTGCTATTTAGAGACTATTGACATTACCTTTATTTCCTGGTCCTAAACA (서열번호:72)
#79 chr16:19443483-19443603 ATCCCTAGAAGATTTCTGAATTAGCTGAATGACAAACACAAGATACTTAGATGACCCATTCGAACCAGGAAGCCTTGCAACATCAAGTAAGGAGTCCTCAATTAACAGCCTTAGAAGACA (서열번호:73)
#80 chr16:69430565-69430685 ATCAAAGAATACTTTTTTTCAGGGGGGAGGATGTTGGTATTTACTTAACTCACTGATGGAGAAAAAGAACGCTCCCACTCTATAAATGTTTAGCATGTGTGTAAAGGTCGTAGGTCTGGT (서열번호:74)
#81 chr16:69438576-69438696 TAGGTTTGAGTCCAGAGCATGACCTTTGGGCTTATCAGACAGTGAAGGGATGGGTCAGAACTTGTCACCTGTGTTCACGGGATGCTGATTCACTCAGCAAGGATGAAGTCTTTTCAGATC (서열번호:75)
#82 chr16:69441798-69441918 ATCAAGAAGGGAGCACAAATTCTCTCCCTCCACATGGGAGGGTGCTCCGGTCCACCGCTGCTTGTGACTGATGGGACAGTCTGTCTTATTAGGATACAAGGACACACTCAGCCACATTCT (서열번호:76)
#83 chr17:39058295-39058415 ATCAATAATGCATTAGATAATGGTGTTCTGAGGCAGGATTTCAATGAAAGGCTAAGTGCTGTAACTATGTAACAAAACACCAGCACAGGACAAAGAGTAGGTTTCTCAATCAACAAGGAT (서열번호:77)
#84 chr17:39059208-39059328 AGTCTTTCCAGTGCTTCGGATGCATGGTAAAGTTGGAGAACCATGGCTGTAAAGTATCAGTAGTCGAGGAGCAGGAAGATATTTCCACTGGTTGTACATTTTAGTTTAGAATGCTTGATC (서열번호:78)
#85 chr17:39061487-39061607 GTAATGATTCGGAGTGAGACCCCTAACACCTCCCGAATGGGGGCAAGAAGCTCAGGACTCTGGTAGCCCAGGCAGAGTCTGAGTAACTGGCGTTGCCTCTCTTCATGCATCTACCTGATC (서열번호:79)
#86 chr17:39807749-39807869 ATCCTGAAGAAGCAGTGCCAGCTCCTCCCAGACAGCCCGCCCCAGCTGGCCCGCTGGCTCCAGCCCAGCCAGGAGCGAGGGCAGTGGGGGAGCCCCACAGGAGGGAACGGGGGCTCAGGA (서열번호:80)
#87 chr17:39810377-39810497 ATCTCCCCCAGCCTGCACCCCACCCAGCAAGGACATGCAAGCCAAGCAGTTCCCACACCCCGTTCCTGGTGGCTGCCAGAAGCTTCCTTACAAGGCCCCAGCGCTGAGCTGGCTCAGCTG (서열번호:81)
#88 chr17:39811992-39812112 ATGTTTGGGCCCCGGGCTGAAGGTGTGGGTGGCAGGGAAGGTGGAGGATTTGAGGTGGGGAGGCTCACTTCCCGCTCCCAGGGCTCGAGGGCAGGGCAAGCCAGCTGGGACTGCCAGATC (서열번호:82)
#89 chr17:39822111-39822231 ATCGTGCTAGTTAAATGAATGAACATGTGGTGGTTACAGGCAAACCCACAATGCCACACAGGACACCGACCAACAACTGAAAACGGTGACAGCTGCCCTTACCCGCAGCTCCCCAGCGTA (서열번호:83)
#90 chr17:70614530-70614650 AGCTGAGCGAAACTCTTCCTCCTCCACGAGGCCTCTCCCAGCCCTTCAGTTCATGACGCCTTGGTGAGAGAGGTCTGTATAGCAACACGGCTGCACTGAAGCTTCCTTTGTAGGTCGATC (서열번호:84)
#91 chr17:70628016-70628136 ATCCGTGCCAGGGGGCCACTGAGCTCTCATTCCCAGAAGCCAACCAGAGCCAGTGAAGGGGCCGCAGAGACTCCGACACATCATTTTCATAAAAACAGCCCAAGGAGAGCATTGCATTAG (서열번호:85)
#92 chr18:3618163-3618283 ATCCTGTAAGTCAAAGACACAACCTGTTCCAGGAAGGACTTTGCAACAGCAATTACTCTAACAAGTTACAATTCGCAGAGTCCGGCCTTTAAGGGGCTTTGAAGAGAGAGAAACCCATGA (서열번호:86)
#93 chr18:3624785-3624905 ATCATATCACATCTGAGTTAGGCCATATGCACCCAGGGGGAATCTCAAGAGCAAACTAATCTAAACTCCAAGAAATAGACCACTAAGACCCACCCAGGTAGTACTCACTGAACGCTCTTC (서열번호:87)
#94 chr18:20680115-20680235 AGATTCACTTAAATACATCATGAATGATAGACTGGAATATTTTTGAATCATATTCACCAAAACATTAGAAGTGAATCAGTAGTAGTGTGGTCTCTGAAGTCAACTTTAAAAGAATTGATC (서열번호:88)
#95 chr18:20682099-20682219 CCAGAGACACAAAGCAGTTGATGCTGTTCATGTTCTGGGGTTCACTCGCAAGCACTTGAAGGGAAACGACTGGACAGTTCCTGTGAAGACAGGGTTTTCTTGAGAGTTTCTAGGAAGATC (서열번호:89)
#96 chr18:20686589-20686709 GTCCCCACCTTAGCTCCATTCTCACTCCCAGCTGTCAACTCTATGAGGTCAAGGTCTCTAACACAACTGGGTCCCTGGCGGCTCACAGCCGTGGCTGCTGGCACGGGAAAGATGCCGATC (서열번호:90)
#97 chr19:42245027-42245147 TGATGCTGTCTGACTGAGGTCAAAAGGATGGGTGTGGAAGGCATCACACCTTTCTCCCATTTAGAAATCCATTGTCCCTTCCTTCTCCCTTATTGGGTTACATTCCTCTGTCCATAGATC (서열번호:91)
#98 chr19:42251031-42251151 CAACATCAGCCTCAGCCTGAACTCTGCCAGTAAACTTGTAACTTTCCAAGGAAACTTACTCTACTGTAACAGTTCTTTTTCATCCGGAGACAAAATGTATCTGATTCGCAGTCACCGATC (서열번호:92)
원료 판독치의 전처리를 수행하여 어댑터 서열(trim_galore, http://www.bioinformatics.babraham.ac.uk/projects/trim_galore/)을 제거하였고, 중첩 판독치는 FLASH를 사용하여 병합되었다.  hg19 참조 게놈에 대한 짧은 판독 매핑을 달성하기 위해, 이어서 생성되는 전처리된 판독치를 DpnII로 인-실리코 소화시키고, Bowtie(p1, m2, 최상 및 지층 설정 사용)를 사용하여 정렬시켰다. 정렬된 판독치는 포획-C 분석기를 사용하여 처리하여 (i) PCR 복제물을 제거하고, (ii) 하위 단편을, 포획 단편 내에 함유된 경우 '포획'; 포획 단편의 양 측면 1kb 내에 존재하는 경우 '근접 배제'; 또는 '포획' 및 '근접 배제' 영역의 외부에 존재하는 경우 '리포터'로서 분류하였다. 추가로, 본 연구는 포획 및 리포터 단편 상의 r3Cseq 패키지를 사용하여 스케일링된 배경(Q<0.05, FDR)에 대한 관점의 유의한 상호작용을 동정하고, 또한 상이한 세포주 사이의 상호작용 프로파일을 비교하였다.
4C-seq 및 데이터 분석
4C 주형은 약간 변형한 이전에 공개된 프로토콜을 사용하여 제조했다. 간단히 말해서, 배양된 세포를 단일 세포 현탁액으로 희석시키고, 크로마틴을 실온에서 10분 동안 1% 포름알데히드와 가교결합시켰다. 세포를 용해시키고, 가교결합된 DNA를 1차 제한 효소 HindIII-HF[R3104L, New England Biolabs (NEB)]로 소화시켰다. 이어서, HindIII-소화된 DNA를 T4 DNA 리가제(EL0013, Thermo Scientific)를 사용하여 근접 결찰시킨 후 프로테이나제 K(AM2546, Ambion)를 사용하여 가교결합 제거하여 3C 라이브러리를 생성시켰다. 이어서, 3C 라이브러리를 DpnII(R0543L, NEB)를 사용하여 제2 제한 효소 소화시킨 후, T4 DNA 리가제를 사용하여 순환 반응시켰다. 각 관점을 경우, 3.2μg의 생성되는 4C 주형을 사용하여 스케일-업 역전을 수행하고, 32개 반응물(각각 100ng) 중 중첩 PCR(표 4)을 풀링시키고, MinElute PCR 정제 키트(Qiagen)를 사용하여 정제하였다. 이어서, 10μg의 PCR 생성물을 4-20% TBE PAGE 겔(5μg/웰) 상에서 실행시켰다. 겔 상에서, 200bp로부터 600bp까지의 얼룩을 절제하고, 불필요한 PCR 생성물 밴드를 제거하였다. 이어서, DNA를 Illumina Miseq(2x250 bp) 상에서 차세대 서열분석을 위한 잘라낸 겔 조각으로부터 추출시켰다.
선택된 관심 영역에 대한 중첩 프라이머 쌍. 굵은 글꼴은 Nextera® 인덱스 키트-PCR 프라이머를 나타내고; 이탤릭체는 i5 인덱스(N502)를 나타내고; 정상 글꼴은 i7 인덱스(위에서 아래로, N705 내지 N708)를 나타내고; 밑줄 글꼴은 Nextera® 트랜스포사제 서열을 나타내고, 검정색 강조 표시는 고안된 중첩 프라이머 서열을 나타낸다.
영역 좌표 정방향 프라이머 역방향 프라이머
chr18:20673650 -20703450 AATGATACGGCGACCACCGAGATCTACAC CTCTCTAT TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGTTGTCCATCCCCATATCTTGG (서열번호:101) CAAGCAGAAGACGGCATACGAGATAGGAGTCCGTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGAGGCTGTTTCCTGTCTTGGG (서열번호:102)
chr13:73,969,600 -74,042,900 AATGATACGGCGACCACCGAGATCTACAC CTCTCTAT TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGTCAACTGAATCAAGACATAAATTC (서열번호:103) CAAGCAGAAGACGGCATACGAGATCATGCCTAGTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGGGAGTCCTTCAGTGTAACC (서열번호:104)
chr1:201,985,650 -202,089,000 AATGATACGGCGACCACCGAGATCTACAC CTCTCTAT TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCCCCACTTCCCATTTCCCAA (서열번호:105) CAAGCAGAAGACGGCATACGAGATGTAGAGAGGTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGACCTAACAAAGCGCTCAGCT (서열번호:106)
chr6:137,279,250 -137,292,400 AATGATACGGCGACCACCGAGATCTACAC CTCTCTAT TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGTTGCTTTGGCTAACTATTTGGA (서열번호:107) CAAGCAGAAGACGGCATACGAGATCCTCTCTGGTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGTAATAGCCTTGGTCCCCAGG (서열번호:108)
역방향 프라이머는 관점 개념을 기반으로 고안되었다. UCSC 게놈 브라우저[어셈블리: 2009년 2월 (GRCh37/hg19)]를 사용하여 관심 영역의 정확한 위치를 찾아냈다. HindIII 및 DpnII 트랙의 첨가시, 관심 영역에 인접하는 2개의 HindIII 제한 부위가 동정되었고, 가장 가까운 HindIII 및 DpnII 제한 부위 사이의 서열이 관점 영역으로서 선택되었다. 이 영역에 기초하여, 두 쌍의 프라이머(외부 및 중첩)는 기본 설정으로 다음과 같은 적응과 함께 프라이머-BLAST 프로그램[National Center for Biotechnology Information (NCBI)]을 사용하여 고안되었다: 최적 프라이머 용융 온도 58℃, 최소 55℃ 및 최대 60℃; GC 함량 39 내지 60%. 이어서, 적절한 어댑터(Nextera® 인덱스 키트-PCR 프라이머, Nextera® 트랜스포사제 서열) 및 인덱스 서열을 중첩 프라이머 쌍에 첨가했다. 이 연구에 사용된 외부 및 중첩 프라이머는 각각 표 5 및 표 4에 제시되어 있다.
선택된 관심 영역에 대한 외부 프라이머 쌍.
영역 좌표 정방향 프라이머 역방향 프라이머
chr18:20673650-20703450 GTCTGCGCCTCAGGAAAAT (서열번호:93) AAGGCTGTTTCCTGTCTTGG (서열번호:94)
chr13:73,969,600-74,042,900 CCCTACCACTTTCCCTTTTC (서열번호:95) TATGCAAGGGCATCAATTAGG (서열번호:96)
chr1:201,985,650-202,089,000 CTTGAGGAACACAGAAGGGC (서열번호:97) CAGCACTCTGCAAACAGACT (서열번호:98)
chr6:137,279,250-137,292,400 AAAGTCTCTGCCATCTCCCAG (서열번호:99) AAATCAAAGCTCAGAGGACTGG (서열번호:100)
서열분석 판독치의 5' 말단에서 프라이머 서열은 TagDust2를 사용하여 트리밍하고, Bowtie2(2.2.6)를 사용하여 참조 게놈(hg19)에 매핑시켰다. 정렬되지 않은 판독치는 참조 게놈에 재정렬시키기 전에 처음 50개의 염기쌍에서 트리밍하였다. MAPQ≥30인 유일하게 매핑된 판독치만이 다운스트림 분석에 사용되었다. 통계적 유의한 상호작용(Q<0.05, FDR)은 비중첩 윈도우 접근법(윈도우 크기 = 5kb)을 사용하는 r3Cseq를 사용하여 검출되었다. 4C 데이터의 신호 플롯은 Basic4CSeq를 사용하여 생성되었다. DNA 증폭된 영역 내에서 검출된 상호작용은 배제되었다. 이어서, 상호작용은 상호작용과 중첩되는 프로모터(GENCODE v19의 주석이 달린 전사 개시 부위로부터 +/- 2.5kb)를 사용하여 유전자에 매핑되었다.
CRISPR/Cas9 인핸서 결실
CRISPR sgRNA 표적 검색은 Feng Zhang 실험실(http://tools.genome-engineering.org)에 의해 생성된 온라인 소프트웨어를 사용하여 수행되었다. sgRNA 쌍은 결실용으로 동정된 인핸서에 인접하는 서열을 표적화하도록 설계되었다. 간략하게, 인핸서의 5' 말단의 100bp 업스트림/20bp 다운스트림에 상응하는 서열, 및 인핸서의 3' 말단의 20bp 업스트림/100bp 다운스트림에 상응하는 서열이 검색에 사용되었다. 최저 수준의 코딩 영역 오프-타겟 예측을 갖는 탑 히트가 선택되었다. sgRNA를 pSpCas9(BB)-2A-GFP 또는 -Puro 벡터(Addgene)에 클로닝하였다. 간단히 말하면, 각 CRISPR 표적에 대해 올리고뉴클레오티드 쌍을 설계하였고, Integrated DNA Technologies, Inc.로부터 입수했다. 이어서, 올리고뉴클레오티드 쌍을 어닐링하여 용이한 클로닝을 위해 양 측면에 오버행을 함유하는 DNA 이중 가닥을 형성시켰다. 개별 인핸서의 5' 말단을 표적화하는데 사용된 가이드 RNA는 Bbs I-소화된 pSpCas9(BB)-2A-GFP 벡터에 클로닝된 반면, 각 인핸서의 3' 말단을 표적화하는 sgRNA는 Bbs I-소화된 pSpCas9(BB)-2A-Puro 벡터에 클로닝되었다. 삽입물 및 벡터를 T4 DNA 리가제(New England Biolabs)를 사용하여 결찰시켰다. DH5α 세포를 결찰 생성물로 형질전환시키고, 암피실린으로 보충된 LB 한천 상에 위치시켰다. 콜로니를 선발하여 배양하였고, 플라스미드를 Wizard Plus SV Minipreps DNA 정제 시스템(Promega)을 사용하여 추출시켰다. 플라스미드의 서열은 생거 서열분석을 실행하여 확인되었다. 이 실험에 사용된 올리고뉴클레오티드는 표 6에 열거되어 있다.
CRISPR/Cas9 게놈 편집 기술을 사용하는 인핸서 결실에 사용된 프라이머.
CRISPR sgRNA 플라스미드 작제 e1-5'-1 CACCgCCCCATGTCCCCATACAGGC (서열번호:109)
e1-5'-2 AAACGCCTGTATGGGGACATGGGGc (서열번호:110)
e1-3'-1 CACCGGCACACCAGGCAGGATTCC (서열번호:111)
e1-3'-2 AAACGGAATCCTGCCTGGTGTGCC (서열번호:112)
e2-5'-1 CACCgCGGGACTCAGACCTTAGTCA (서열번호:113)
e2-5'-2 AAACTGACTAAGGTCTGAGTCCCGc (서열번호:114)
e2-3'-1 CACCGAGGATTTCTTAAGCCCAGA (서열번호:115)
e2-3'-2 AAACTCTGGGCTTAAGAAATCCTC (서열번호:116)
e3-5'-1 CACCgTGAGGGAGGATAGGCGGGCC (서열번호:117)
e3-5'-2 AAACGGCCCGCCTATCCTCCCTCAc (서열번호:118)
e3-3'-1 CACCgCACCTAGAGGCCTGCTTTAG (서열번호:119)
e3-3'-2 AAACCTAAAGCAGGCCTCTAGGTGc (서열번호:120)
e4-5'-1 CACCGAAGAGAACTCCACCGGGTG (서열번호:121)
e4-5'-2 AAACCACCCGGTGGAGTTCTCTTC (서열번호:122)
e4-3'-1 CACCgCAGACATGACCTAGGTTCCC (서열번호:123)
e4-3'-2 AAACGGGAACCTAGGTCATGTCTGc (서열번호:124)
인핸서 (PCR)의 결실 결정 e1-5'-F GCCTTCCCTTCCTGATGTC (서열번호:125)
e1-3'-R TAATGGCAAGACTGGTATCCAC (서열번호:126)
e2-5'-F CTTGTGGTACTGTTCCCAGAC (서열번호:127)
e2-3'-R CAGCCTGGGAAGCATATTGA (서열번호:128)
e3-5'-F CTGGGTTCCCACCTGATAAT (서열번호:129)
e3-3'-R GATGAAATCCAAGTCATTGTGTCC (서열번호:130)
e4-5'-F CTTCTGGGTTCAAGTGAGTCT (서열번호:131)
e4-3'-R CATGAGCAAAGGTCCTCCTAC (서열번호:132)
표적화 (qPCR) 후 인핸서의 보유 결정 e1-int-F CAGTAGGTACACCTGGCAATAG (서열번호:133)
e1-int-R
ATCCTGCTTCCTCTTGGAATATC (서열번호:134)
e2-int-F CCAGCTTCTTTCCTCTCCTTATC (서열번호:135)
e2-int-R GGTGAAATCCCATCTCCACTAAA (서열번호:136)
e3-int-F ATCCAGACACACCTGTAGGA (서열번호:137)
e3-int-R CAGAACAAAGTCCAGAGAGAGG (서열번호:138)
e4-int-F CCTGCCTCTCTTCTGCTTTC (서열번호:139)
e4-int-R
GTTCATGCCCTGCCTTATCT (서열번호:140)
PScanChIP를 사용하는 CDX2 후보 결합 파트너 및 CDX2 발현과 이들의 발현 상관관계.
예측된 파트너 스피어만 상관관계 P-값
HNF4A 0.797 1.14E-07
ISX 0.796 2.29E-09
ONECUT2 0.735 6.48E-07
CDX1 0.699 2.40E-06
HES2 0.698 2.54E-06
FOXD2 0.687 3.78E-06
HNF4G 0.682 4.62E-06
MYB 0.682 4.78E-06
CEBPG 0.681 4.86E-06
HNF1A 0.660 1.12E-05
MNX1 0.647 1.79E-05
DMBX1 0.619 3.37E-05
EVX1 0.616 3.80E-05
SP8 0.589 9.92E-05
VDR 0.586 1.50E-04
LEF1 0.584 1.56E-04
HOXB13 0.582 1.25E-04
KLF5 0.580 1.76E-04
PDX1 0.576 2.03E-04
HOXC11 0.570 1.85E-04
HOXA9 0.565 2.78E-04
KLF16 0.547 4.62E-04
E2F2 0.542 5.38E-04
HOXA11 0.524 7.41E-04
HOXD13 0.523 7.54E-04
TGIF1 0.503 1.49E-03
ELF3 0.495 1.78E-03
HOXA10 0.494 1.85E-03
SREBF1 0.491 1.96E-03
SP3 0.471 3.17E-03
SNU16 및 OCUM-1 세포를 10% FBS, 1xP/S 및 0.5XNEAA가 보충된 RPMI에서 80-90% 컨플루언스까지 성장시켰다. 세포를 수거하고, 회전시키고, 37도에서 5분 동안 팁신으로 처리하고, 피펫팅으로 재현탁시켜 단일 세포 현탁액을 달성했다. 세포 수를 계수하고, 세포를 세포를 1xPBS로 1회 세척한 후 재현탁 완충제(R)에 1x107 세포/ml로 재현탁시켰다. 1ml의 재현탁 완충제 중 1x107 세포 마다 25ug의 pCas9-GFP-sgRNA 및 25ug의 pCas9-Puro-sgRNA 플라스미드를 SNU16 또는 OCUM-1 세포와 혼합시켰다. 100ul의 각 세포 현택액을 3ml의 전해질 완충제(E2)를 함유하는 네온 튜브에서 100ul 네온 피펫을 사용하여 전기천공시켰다. 전기천공 조건은 다음과 같다: 펄스, V 1050, MS 30, 번호 2. 전기천공 후, 세포를 10% FBS, 1xP/S 및 0.5XNEAA가 보충된 8ml의 RPMI 상에 플레이팅했다. 초기 형질감염 24시간 후, 세포를 48시간 동안 10㎍의 퓨로마이신으로 처리하고, 잔류하는 GFP-양성 세포를 FACS를 사용하여 분류하였다. 이어서, 잔류하는 생존 세포(GFP-양성 및 퓨로마이신 내성 모두)를 qPCR를 사용하여 후속적으로 분석하여 녹아웃 효율을 추정하였다.
정량적 PCR(qPCR)을 수행하여 CRISPR/Cas9-표적화 세포에서 개별 인핸서의 결실 효율을 결정했다. AllPrep DNA 마이크로 키트(QIAGEN)를 사용하여 표적화 세포 및 비표적화 세포(풀링됨)의 게놈 DNA를 추출하고, CFX96 터치 실시간 PCR 검출 시스템(Bio-Rad Laboratories, Inc.) 상에서 KAPA SYBR FAST qPCR 마스터 믹스(Kapa Biosystems)를 사용하여 기술적 삼중으로 qPCR에 적용시켰다. 이러한 반응에 사용된 프라이머는 표 6에 열거되어 있다(명칭에 "Int"를 갖는 프라이머가 이 목적에 사용되었다). 게놈 DNA 샘플에 존재하는 특정 표적화 영역의 상대적 양은 GAPDH 유전자로 표준화되고 비표적화된 세포에 비례하는 비교 CT(ΔΔCT) 방법을 사용하여 계산하였다.
게놈 DNA는 이전에 기재된 프로토콜을 사용하여 분류된 세포로부터 추출되었다. 간단히 말하면, 세포를 0.5x 직접-용해 완충제(10mM Tris pH 8.0, 2.5mM EDTA, 0.2M NaCl, 0.15% SDS, 0.3% Tween-20)에서 분쇄하고, 다음의 가열 및 냉각 프로그램에 적용시켰다 : 30초 동안 65℃, 30초 동안 8℃, 1.5분 동안 65℃, 3분 동안 97℃, 1분 동안 8℃, 3분 동안 65℃, 1분 동안 97℃, 1분 동안 65℃, 10분 동안 80℃. 이어서, 용해물을 물에서 약 4배로 희석시키고, 희석된 용해물 3μl를 사용하여 Taq DNA 폴리머라제(Life Technologies)를 사용하는 20μl PCR 반응을 수행하였다. 사용된 프라이머는 표 6에 존재한다(각 인핸서에 대해 "5' F" 및 "3' R"의 프라이머 쌍).
유전자 발현 수준을 측정하기 위한 RT-qPCR
세포를 GFP 양성 세포에 대해 FACS 분류하고, 총 RNA를 AllPrep DNA/RNA 마이크로 키트(QIAGEN)를 사용하여 세포로부터 추출시켰다. 역전사는 무작위 프라이머를 갖는 iScript Select cDNA 합성 키트(Bio-Rad)를 사용하여 풀링된 세포에서 수행하였다. qPCR은 CFX384 터치 실시간 PCR 검출 시스템(Bio-Rad) 상에서 TaqMan 유전자 발현 마스터 믹스 및 TaqMan 프로브(Applied Biosystems)를 사용하여 수행되었다. 모든 qPCR 실험을 삼중으로 실시하였고, 평균 값을 사용하여 mRNA 수준을 결정하였다. 상대적 정량화는 참조 유전자로서의 GAPDH 및 화학식 2-△△CT를 사용하는 비교 CT 방법을 사용하여 수행되었다.
카피 수 변경 및 DNA 메틸화
위 종양 및 정합된 정상 위 조직의 게놈 DNA를 Affymetrix SNP6.0 어레이에서 하이브리드화시켰다. (Affymetrix, Santa Clara, California, USA). .CEL 포맷의 데이터는 다음 순서로 처리되었다: (1) 표준화 : 원료 .CEL 파일은 Affymetrix Genotyping Console 4.2를 사용하여 처리되었다. 참조 모델은 하이브리드화 배치에 따라 정상 위 조직의 SNP6.0 프로파일로부터 생성되었다. 세포주 및 1차 종양 샘플의 카피 수 변화는 1차 정상 샘플의 참조 모델을 사용하여 결정되었다. (2) 분할: 카피 수 분할 데이터는 DNAcopy R 패키지에서 구현된 원형 이진 분할(CBS) 알고리즘을 사용하여 생성되었다. 변화 점을 검출하기 위한 p-값 컷오프는 0.01이었고, 순열 번호는 10,000이다. 각각 > 0.6 및 < -1.0의 평균 로그 비율을 나타내는 카피 수 증가 및 손실 영역이 정의되었다. Illumina HumanMethylation450 (HM450) Infinium DNA 메틸화 어레이를 또한 사용하여 DNA 메틸화 수준을 검정했다. 메틸화 β 값을 계산하고 배경은 methylumi R BioConductor 패키지를 사용하여 보정하였다. 표준화는 BMIQ 방법 (R의 수박 패키지)을 사용하여 수행되었다.
RNAseq 및 분석
총 RNA는 Qiagen RNeasy 미니 키트를 사용하여 추출시켰다. RNA-seq 라이브러리는 Illumina Stranded Total RNA Sample Prep Kit v2 (Illumina, San Diego, California, USA) Ribo-Zero Gold 옵션(Epicentre, Madison, Wisconsin, USA) 및 1ug의 총 RNA를 사용하여 제조업자의 지침에 따라서 작제되었다. 완성된 라이브러리는 Agilent Bioanalyzer(Agilent Technologies, Palo Alto, CA)로 검증되었고, Illumina Cluster Station을 통해 Illumina 유동 세포에 적용되었다. 서열분석은 쌍을 이룬-말단 101bp 판독 옵션을 사용하여 수행되었다. RNA-seq 판독치는 TopHat2-2.0.12(기본 매개변수 및 --라이브러리-유형 fr-firststrand)를 사용하여 인간 게놈(hg19)에 정렬되었다. 매핑된 판독치의 각 염기 서열 품질 및 각 서열 품질 스코어는 FastQC 버전 0.10.1(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)을 사용하여 평가되었다. 유전자 수준에서의 전사체 풍부는 커프링스크에 의해 추정되었다. 0보다 큰 변화를 나타내는 1차 샘플로부터 유전자 발현은 ComBat를 사용하여 잠재적 배치 효과에 대해 보정되었다. 유전자 발현 값은 FPKM 단위로 측정되었다. 그룹 간의 시차 발현은 적어도 2배 및 0.5FPKM의 절대 차이로 변경된 발현을 나타내는 유전자로서 동정되었다.
생존 분석
7개의 독립적인 연구로부터의 GC 샘플을 K-메도이드 접근법을 사용하여 클러스터링했다. 모두 7개의 연구에서 발현 값을 갖는 유전자만이 분석에 사용되었다. 카플란-마이어(Kaplan-Meier) 생존 분석은 결과 척도로서 전체 생존과 함께 사용했다. 로그-순위 테스트를 사용하여 카플란-마이어 곡선의 유의성을 평가했다. 연령, 종양 단계, 로렌의 조직학적 하위유형 및 지역(아시아권 대 비아시아권)과 같은 추가의 변수를 포함하는 다변수 분석은 Cox 회귀를 사용하여 수행되었다.
질환 관련 SNP 분석
특성 관련 SNP는 게놈 전체 연관 연구(2015년 8월 27일)의 UCSC 브라우저로부터 다운로드되었다. 이 연구를 위해, 본 발명자들은 비코딩 영역에서 발생하는 SNP에 초점을 맞추고, 코딩 영역 내의 SNP를 제외했다. 각 특성/질환으로부터의 SNP 및 체세포 예측된 슈퍼-인핸서 사이의 중첩은 BEDtools '교차' (nGWAS)를 사용하여 계산되었고, nGWAS를 예측된 슈퍼-인핸서 외부의 질환 관련 SNP의 총 수(nGWAS')에 대해 비교했다. 추가의 대조군으로서, "SNP 배경" 모델은 2개의 통상 사용되는 SNP 어레이(Illumina HumanHap550 및 Affymetrix SNP6)의 모든 SNP의 세트를 사용하여 생성시켰다. 예측되는 슈퍼-인핸서와 중첩되는 SNP 배경으로부터 SNP의 수를 계산하고(nBackground), 예측된 슈퍼-인핸서 외부의 배경 SNP의 총 수(nBackground')와 비교했다. 예측된 슈퍼-인핸서 중 정상 SNP의 비는 nBackground/nBackground'로서 계산되었다. 예측된 슈퍼-인핸서 중 질환 관련 SNP의 증가된 수는 이들 영역의 SNP의 높은 유병률과 관련된다는 것을 예상하여, 본 귀무 가설은 따라서 질환 관련 SNP의 비와 정상 SNP의 비(농축 비) 사이에 차이가 없다는 것이다. 카이 제곱 테스를 수행하였고, 농축 p-값 < 0.01은 통계적으로 유의한 것으로 간주되었다. 위험 관련 SNP와 히스톤 변형 사이의 관계를 이해하기 위해, 연구는 적어도 2개의 독립적인 연구에서 질환과 관련된다고 밝혀진 위장 질환(예: 궤양성 대장염 및 결장직장암)에서 검증된 SNP를 동정했다. 샘플은 GATK Unified Genotyper를 사용하여 질환 관련 SNP의 존재에 기초하여 두 그룹으로 분류되었다. 질환 관련 SNP를 갖거나 갖지 않는 샘플에서 종양과 정합된 정상 사이의 H3K27ac 신호의 차이를 비교했다.
전사 인자 결합 모티프 분석
연구는 ReMap 데이터베이스를 사용하여 체세포 증가 예측된 슈퍼-인핸서 및 변경되지 않은 예측된 슈퍼-인핸서에서 전사 인자의 농축을 조사했다. 예측된 슈퍼-인핸서와 적어도 60% 중첩되는 전사 인자 결합 부위를 계수하고, 상위 10개의 가장 농축된 전사 인자의 순위를 비교했다. 전사 인자의 결합 밀도는 백만개의 염기 쌍의 단위(Mbp)로 영역의 총 크기로 나눈 영역에서 검출된 전체 결합 부위로서 계산되었다. CDX2의 경우, CDX2 결합 부위는 기본 매개변수를 갖는 HOMER을 사용하여 다른 전사 인자의 인근 결합을 예측하기 위해 반복적으로 증가된 체세포 예측된 슈퍼-인핸서에서 시험되었다. HOMER 출력으로부터 동정된 상위 20개의 전사 인자가 발현 상관관계 분석을 위해 사용되었다. 추가로, CDX2 공-결합 모티프는 또한 JASPAR 2016을 갖는 PScanChIP을 사용하여 동정되었다. CDX2와 잠재적인 공-결합 파트너 사이의 발현 상관관계(스피어만 상관관계)가 평가되었다.
siRNA 형질감염
ON-TARGETplus 인간 siRNA SMARTpools(HNF4αCDX2), 개별 ON-TARGETplus 인간 개체 siRNAs(HNF4α) 및 ON-TARGETplus 비표적화 siRNA 대조군(Dharmacon/Thermo Fisher Scientific)을 사용하여 제조업자의 지침에 따라 Dharmafect 1 형질감염 시약을 사용하여 6-웰 플레이트 중 50nM에서 세포(2x105)를 형질감염시켰다. 72시간 RNAi 처리 후 녹다운 효율은 정량적 RT-PCR 및/또는 웨스턴 블롯 분석을 사용하여 조사하였다(도 23).
웨스턴 블롯팅
세포(2x105)를 RIPA 완충제(Sigma)에서 수거하고, 60분 동안 얼음 위에서 용해시켰다. 상청액의 농도는 Pierce BCA 단백질 검정(Thermo Scientific)을 사용하여 측정하였다. CDX2(1:500; MU392A-UC, Biogenex), HNF4α(1:1000; sc-8987, Santa Cruz BioTechnology) 및 GAPDH(1:3000; 60004-1-Ig, Proteintech Group) 항체를 사용하여 용해물을 프로빙하였다.
정량적 RT-PCR
RNeasy 미니 키트(Qiagen)를 사용하여 총 RNA를 단리시키고, DNA는 RNase-비함유 DNase 세트(Qiagen)를 사용하여 제거했다. 2ug의 RNA는 Superscript III 제1 가닥 합성 시스템(Invitrogen)을 사용하여 역전사시키고, 상보적 DNA는 SYBRGreen PCR 마스터 믹스(Applied Biosystems)를 사용하여 증폭시켰다. 배수 변화는 GAPDH로 표준화했다. 프라이머 서열은 다음과 같다: HNF4α: F1-5' GTGCGGAAGAACCACATGTACTC 3' (서열번호:143), R1- 5' CGGAAGCATTTCTTGAGCCTG 3' (서열번호:144), F2-5' CTGCAGGCTCAAGAAATGCTT 3' (서열번호:145), R2- 5' TCATTCTGGACGGCTTCCTT 3' (서열번호:146), F3- 5' TGTCCCGACAGATCACCTC 3' (서열번호:147), R3- 5' CACTCAACGAGAACCAGCAG 3' (서열번호:148); CDX2: F1- 5' GCAGCCAAGTGAAAACCAGG 3' (서열번호:149), R1- 5' CCTCCGGATGGTGATGTAGC 3' (서열번호:150), F2- 5' AGTCGCTACATCACCATCCG 3' (서열번호:151), R2- 5' TTCCTCTCCTTTGCTCTGCG 3' (서열번호:152); GAPDH: F - 5' CCAGGGCTGCTTTTAACTC 3' (서열번호:153), R - 5' GCTCCCCCCTGCAAATGA 3' (서열번호:154).
CDX2 및 HNF4α ChIP-seq 및 분석
세포를 실온에서 10분 동안 1% 포름알데히드와 가교결합시키고, 글리신을 최종 농도 0,2M로 첨가하여 정지시켰다. 크로마틴을 추출시키고, 500bp로 초음파 처리했다. CDX2(MU392A-UC, Biogenex) 및 HNF4α(sc-8987, Santa Cruz BioTechnology) 항체를 크로마틴 면역침전(ChIP)을 위해 사용했다. ChIPed DNA(10ng)를 제조업자 프로토콜(New England Biolabs)에 따라 DNA 서열분석(ChIP-seq) 라이브러리 작제와 함께 ChIP용으로 사용했다. 면역침전 이전 세포로부터 입력 DNA는 ChIP-seq 피크 호출을 표준화하는 데 사용되었다. 서열분석 이전에, qPCR을 사용하여 양성 및 음성 조절 ChIP 영역이 선형 범위에서 증폭되었다는 것을 입증했다. 라이브러리 샘플의 크기 분포는 바이오-분석기(Agilent Technologies)를 사용하여 조사했다. 장에 특이적인 반복적으로 증가된 예측된 슈퍼-인핸서와 확산형 GC를 비교하는 초기 분석(10개 장, 6개 확산형)에서, 2개의 하위유형 사이의 CDX2 결합에서 유의한 차이가 관찰되지 않았다. 그러나, 심층 분석은 CDX2 발현이 장 하위유형 GC와 절대적으로 관련되지 않는다는 이전의 보고와 일치하는, 동일한 하위유형의 개별 종양 사이의 CDX2 발현에서 높은 하위유형내 가변성을 나타냈다. 따라서, 이 연구는 GC가 개별적인 CDX2 발현 수준에 의해 정렬되고 검사되는 보완 분석을 수행하였다. 이어서, CDX2 결합 밀도는 높은(n=8) 및 낮은(n=8) CDX2 발현을 나타내는 GC 샘플에서 동정된 재발성 체세포 증가 예측된 슈퍼-인핸서에서 계산되었다. 시차 결합 신호 분석에서, CDX2 및 HNF4α에 대한 결합 신호는 체세포 증가를 나타내거나 1차 샘플에서의 변화가 없는 예측된 슈퍼-인핸서에 걸친 200개의 빈에 대해 계산되었고, 또한 OCUM-1 또는 SNU16 세포주에서 검출되었다. 신호는 RPKM 단위로 측정되었다. H3K27ac 강도에 대한 전사 인자(TF) 녹다운의 효과를 추정하기 위해, 독립적 야생형(WT) 샘플 사이의 H3K27ac 신호의 관찰된 변화를 포함하는 내부 대조군이 정의되었다. TF-사일런싱(siCDX2, siHNF4α, 또는 이중 TF) 샘플에 대한 WT 샘플 사이의 차이를 측정한 다음, 이를 이 배경 변화에 대해 비교하였다. 차이가 배경 변화의 > 99%인 하위 영역은 H3K27ac 고갈이라 칭명하고; 차이가 배경 변화의 < 1%인 하위 영역은 H3K27ac 증가라고 칭명하였다. 예측된 슈퍼-인핸서에 상응하는 H3K27ac-고갈된 하위 영역의 통계적 농축은 단측 피셔 정밀 테스트를 사용하여 수행되었다. 차동 영역과 근처 CDX2/HNF4α 결합 부위에 대한 거리 간의 관계를 연구하기 위해, 상기 영역은 또한 거리 분포에 따라 3개의 카테고리(근위, 중간, 원위)로 분리되었다. CDX2 및 HNF4α 정점 사이의 중점 위치는 H3K27ac-고갈된 하위 영역 및 CDX2-HNF4α 공결합 부위 사이의 거리를 분석하는데 사용되었다. TF-사일런싱 세포에서 유전자 발현과 체세포 증가 예측된 슈퍼-인핸서 사이의 연관성을 연구하기 위해, 본 발명자들은 1차 샘플에서 H3K27ac 예측된 슈퍼-인핸서 신호와 유의한 양성 발현 상관관계(r > 0.4; P < 0.05, 양측 t-테스트)를 나타내는 예측된 슈퍼-인핸서에 연결된 유전자를 선택하였고, 또한 GC 세포주에서 관찰했다. 예측된 슈퍼-인핸서 표적 유전자 발현에 대한 전사 인자 녹다운의 유의성을 평가하기 위해, 순열 접근법이 사용되었다. 구체적으로, TF 사이런싱 후 H3K27ac 고갈을 나타내는 예측된 슈퍼-인핸서에 초점을 맞추어 본 발명자들은 실제 슈퍼-인핸서를 유전자 할당 10,000회에 재배치했다. 이어서, 실험적 P-값은 재배치된 유전자/슈퍼-인핸서 세트에서 하향 조절된 유전자의 수가 실제 유전자/슈퍼-인핸서 세트에서 실험적으로 관찰된 하향 조절된 유전자의 수를 초과하는 횟수를 계수함으로써 유도되었다.
데이터 이용가능성
이 연구 동안 생성된 히스톤 NanoChIP-seq(GSE76153 및 GSE75898), SNP 어레이(GSE85466), RNA-seq(GSE85465) 및 DNA 메틸화 데이터(GSE85464)는 유전자 발현 옴니버스에 기탁되었다. 이 연구에 사용된 이전에 기탁된 히스톤 ChIP-seq (GSE51776 및 GSE75595) 및 SNP 어레이(GSE31168 및 GSE36138) 데이터는 유전자 발현 옴니버스에서 이용 가능하다. 후성 유전체 로드맵에서 정상 위 조직의 크로마틴 접근성 프로파일은 유전자 발현 옴니버스(GSM1027325, GSM1027320)에서 입수되었다. 이 연구에서 분석된 RNAPII ChIA-PET 데이터는 encodeproject.org 및 유전자 발현 옴니버스(GSE72816)로부터 입수되었다.
결과
GC 세포주의 원위 예측된 인핸서 경관
나노-ChIPseq를 사용하여, 19개의 1차 GC, 19개의 정합된 정상 조직, 및 다수의 히스톤 H3 변형(H3K27ac, H3K4me3, H3K4me1)을 포함하는 11개 GC 세포주로부터 110개의 크로마틴 프로파일(프로일당 당 평균 약 3.3 x 107 판독치)을 생성시켰다. 1차 GC의 임상적 정보 및 분자 분류는 표 8에, 서열분석 통계는 표 1에, GC 라인에 대한 임상병리학적 세부 사항은 표 9에 제시된다. 시리즈는 10개의 선 형성 선암종(53%, 장 유형), 고도의 침윤성 단리 세포를 갖는 6개의 샘플(32%, 확산형) 및 혼합 조직학을 갖는 3개의 GC 샘플(15%)을 포함하였다. 종양(n=12)의 60% 이상은 3단계 이상이었다(AJCC 7th edition). 매핑 품질 필터의 변화, 생물학적 복제물 및 프로모터 ChIP-농축의 분석 및 품질 조절 소프트웨어 CHANCE(CHip-seq ANalytics and Confidence Estimation)에 의한 평가를 포함하여 나노-ChIPseq 데이터의 광범위한 품질 조절 분석을 수행하였다. 증가하는 매핑 임계값 엄격도(MAPQ ≥10으로부터 20으로)는 매핑 통계를 크게 변경하지 않았고 - 총 매핑된 판독치의 >90%는 유지되었고, ChIP-농축 피크의 85% 및 예측된 인핸서의 98%가 각각 재발견되었다(도 7). 나노-ChIPseq에 의해 생성된 KATO-III 세포의 생물학적 복제물 사이 및 또한 기존의 ChIP-seq에 의해 생성된 독립적인 KATO-III H3K27ac 데이터에 대한 히스톤 피크 일치는 높은 재현성(약 85% 및 약 90%의 중첩)을 확인했다(도 8). 고도로 발현된 단백질-코딩 유전자와 관련된 1,000개의 프로모터에서 입력 및 입력 보정된 H3K27ac 및 H3K4me3 신호의 비교는 각각 50개의 H3K27ac 라이브러리 중 48개(96%) 및 42개의 H3K4me3 라이브러리 중 42개(100%)에서 성공적인 농축을 나타냈다. 특히, H3K4me1(프로모터에서 고갈됨)에 대한 ChIP 농축의 CHANCE 분석은, 대다수(85%)의 샘플이 성공적인 농축(방법)을 나타냈다는 것을 나타냈다. 이러한 결과는 나노-ChIPseq 코호트의 우수한 기술적 품질을 입증한다. 나노-ChIPseq 이외에, 샘플은 또한 DNA 메틸화 분석(Infinium HumanMethylation 450K BeadChip 어레이), 카피 수 분석(Affymetrix SNP arrays) 및 Illumina RNA-서열분석을 위해 처리되었다.
히스톤 ChIP-seq, RNA-seq, Affymetrix SNP6.0 어레이 및 Infinium HumanMethylation 450K BeadChip 어레이에 사용된 환자의 임상 정보.
환자 ID 종양 함량 분자 하위유형 로렌의 분류 AJCC7
2000085 95% GS 1B
2000639 60% GS 4
2000721 70% GS 확산 4
2000877 >90% CIN 2A
2000986 80% GS 확산 4
2001206 90% CIN 확산 4
20020720 80% CIN 2A
20021007 85% GS 2A
76629543 80% CIN 3A
980097 70% EBV 혼합됨/기타 2A
980319 70% GS 혼합됨/기타 3A
980401 90% GS 확산 3A
980417 80% GS 확산 3C
980436 80% GS 3A
980437 90% CIN 3C
980447 40% CIN 4
990068 95% GS 확산 3B
990275 50% CIN 2B
990489 90% CIN 혼합됨/기타 1B
위암 세포주 정보
번호 세포주 GC의 조직학적 하위 유형 유도
1 FU97 확산형 선암종;불량하게 분화됨; 림프절 전이 및 췌장암 전이가 관찰되었다 1차 위
2 KATOIII SRCC 흉막 삼출
3 MKN7 충분히 분화된 관상 선암종 림프절
4 NCC-59 적당히 분화된 관상 선암종 1차 위
5 OCUM-1 인환 세포를 함유하는 불량하게 분화됨 선암종; 흉막 삼출
6 RERF-GC-1B 선암종; 유문 림프절
7 SNU16 위 암종; 불량하게 분화됨 전이성 복수
8 YCC-21 선암종 복수
9 YCC-22 선암종 복수
10 YCC-3 불량하게 분화됨 복수
11 YCC-7 선암종 복수
세포주가 사실상 순전히 상피 세포이고, 최고 데이터 품질을 갖고 이전 연구가 1차 조직에서 기질 오염이 게놈 결과에 영향을 미칠 수 있다는 것을 보여주었기 때문에 GC 세포주가 GC에서 암 관련 원위 인핸서를 발견하기 위한 발견 코호트로 선택되었다. 상기 연구는 또한 다중 GC 샘플에 존재하는 반복 후생유전적 변경에 초점을 맞추었고, 이는 개별화된 세포주 특징과 관련된 "사적인" 후생유전적 변경의 도입을 감소시킨다. 첫째, 게놈 전체 시스-조절 요소는 이전에 활성 프로모터 및 인핸서를 마킹하는 것으로 나타난 H3K27ac 신호에 기초하여 매핑되었다. 인핸서 요소를 농축시키기 위해, 연구는 공지된 주석 달린 전사 개시 부위(TSS; >2.5 kb)(도 1a)로부터 멀리 위치된 H3K27ac 신호에 초점을 맞추었다. 이어서, 연구는 높은 H3K4me3/H3K4me1 로그 비(>2.4)를 나타내는 예측된 인핸서를 분석으로부터 제외하고 집계된 H3K4me1 및 H3K4me3 데이터를 사용하여 인핸서 예측을 추가로 개선시켰다. 이 접근법을 사용하여, 3,017 내지 14,338개의 추정 원위 인핸서는 평균 게놈 발자국 25Mb/라인으로 GC 라인(도 1b)에서 동정되었다.
전체적으로, 상기 연구는 약 140Mb 또는 인간 게놈의 약 5%에 걸쳐 36,973개의 예측된 원위 인핸서 영역을 검출하였다. 예측된 인핸서는 이정 H3K27ac 신호 분포(도 1b)를 나타내고, H3K4me3이 고갈되었고, H3K4me1 신호에서 농축되었다(도 1c 및 도 9). 이들 H3K27ac-농축 영역의 시각적 비교는 일부 영역이 다중 라인에서 활성인("반복적") 반면, 다른 영역은 1개의 라인에서만 활성("사적")이었음을 나타냈다. 약 47%의 예측된 인핸서가 재발되어 적어도 2개의 GC 세포주에서 활성을 나타냈다(도 1d). 재발성 인핸서의 비율은 프로모터에 비해 상당이 낮아(67% 대 47%, P < 2.2x10-16, 단측 비율 테스트) 인핸서 활성이 GC 세포주에 걸쳐 매우 가변적이다는 것을 나타낸다.
예측된 인핸서는 공개적으로 이용 가능한 후생유전적 데이터세트를 통합함으로써 검증되었다. 후생유전체 로드맵의 정상 위 조직의 DNase I 과민성(DHS) 데이터를 사용하여, 예측된 인핸서에서 DHS 신호 분포(로그-변환 RPKM)는 무작위로 선택된 영역보다 상당히 더 커서(P< 2.2x10-16, 단측 웰치 t-테스트; 도 1e, 방법), 예측된 인핸서가 개방 크로마틴과 관련된다는 것을 나타내었음이 밝혀졌다. 9개의 다른 조직 및 세포 카테고리의 DHS 및 H3K27ac 데이터를 비교했을 때, 예측된 인핸서는 소화 및 상피 조직(태아 장, 위 및 소장)의 DHS-양성 및 H3K27ac-양성 영역과의 최고 중첩을 나타내었고, 혈액 및 T-세포와 같은 비상피 조직 유형과는 달랐다(도 1f). 그들의 조절 가능성을 지지하여, 54%의 예측된 인핸서(n=20,127)는 EP300 결합 부위(도 1g; P<0.001, 실험적 테스트)와 관련되어 있었고, 92%는 전사 인자(TF) 결합 부위와 관련되어 있었다. DNA 서열 수준에서, 63%의 예측된 인핸서 서열이 진화적으로 보존되었다(도 1h; P<0.0001, 실험적 테스트).
슈퍼 인핸서는 암 서명에서 농축된다
ROSE 알고리즘을 사용하여 GC 라인당 133 내지 1,318개의 예측된 슈퍼-인핸서가 동정되었고, 총체적으로 3,759개의 비중복 예측된 슈퍼 인핸서를 포함하였다(도 2a). 따라서, GC 세포주 예측된 인핸서의 약 10%가 예측된 슈퍼-인핸서 활성과 관련되어 있는 것으로 추정된다. 예측된 전형적인 인핸서와 비교하여, 예측된 슈퍼-인핸서는 재발되는 현저히 더 큰 경향을 나타내었고(도 2b; 단측 비율 테스트, P< 2x10-16), 3,345개의 예측된 슈퍼-인핸서가 적어도 2개의 GC 세포주에서 활성이다. 예측된 슈퍼-인핸서가 또한, 최근에 GC 증식을 촉진시키는 것으로 보여지는 긴-비코딩 RNA(lncRNA)를 코딩하는 MALAT1 유전자좌(도 2c)에서와 같은 비단백질 코딩 유전자 영역에서 공지된 단백질 코딩 GC 종양유전자(예: MYCKLF5; 도 10a)와 관련된다는 것이 관찰되었다.
예측된 슈퍼-인핸서는 가장 가까운 활성 TSS(주석 달린 TSS의 500bp 내의 프로모터에서 H3K27ac 농축으로서 정의됨)를 나타내는 영역에 기초하여 표적 유전자에 할당되었다. 예측된 슈퍼-인핸서/유전자 상호작용의 53%만이 가장 근접한 근위 유전자와 관련되었다(참조: 방법, 평균 거리 76kb). 예측된 슈퍼-인핸서/유전자 할당이 3가지 직교 상호작용 데이터 세트를 사용하여 검증되었다: (i) PreSTIGE에 의해 예측된 소정의 상호작용, (ii) GREAT, 및 (iii) 공개된 RNAPII ChIA-PET 데이터(encodeproject.org, GSE72816). 단백질 코딩 유전자와 2,677건의 예측된 상호작용 중, 88%는 이들 3가지 데이터 세트 중 적어도 하나에 의해 지지되었다(도 11). 이 수치는 i)-iii)의 후자의 검증 데이터에 대한 생물학적 샘플이 위 조직과 관련이 없기 때문에 하한치일 가능성이 있다(참조: 후속 섹션). 예측된 슈퍼-인핸서와 관련된 생물학적 주제를 이해하기 위해, 본 연구는 GOrilla 경로 분석을 적용하였고, 신호 형질도입, 프로그램된 세포사 및 세포 증식의 조절과 같은 암 발달과 정말 같이 관련된 생물학적 과정이 예측된 슈퍼-인핸서 연결 유전자와 강하게 관련되었다(p-값 6.7x10-22 내지 2.3x10-13, GOrilla에 의한 초기하 테스트)(도 2d)는 것을 발견했다. 반복 예측된 슈퍼-인핸서가 GREAT에 의해 분석되었을 때 이들 과정(예: 프로그램된 세포사, 세포 증식의 조절) 중 다수가 유의미하게 관련되어 잔류되어 이들 농축이 큰 유전자간 영역이 인접된 유전자에 대한 편향 때문이 아니라는 것을 나타낸다(도 12). 상위 예측된 전현적인 인핸서에 연결된 유전자를 사용하는 유사한 분석은 보다 적은 정도의 농축을 생성했다(도 2d). 예측된 슈퍼-인핸서 관련 유전자는 또한 종양유전자에 대해 농축되었다(P=1.7x10-8, 단측 피셔 정밀 테스트). 유전자 발현과 상관관계될 때, 반복 예측된 슈퍼-인핸서 및 전형적인 인핸서와 관련된 유전자는 모두 RNA 발현과 유의하게 상관관계가 있었다(도 10b).
1차 종양에서 슈퍼 인핸서 이질성
어느 세포주에서 예측된 슈퍼-인핸서가 또한 생체내 체세포 변경과 관련되는지를 결정하기 위해, 연구는 19개의 1차 GC 및 정합된 정상 위 조직에 걸쳐 이들 영역에 대한 H3K27ac 농축 수준을 비교했다. 이전 연구는 제한된 샘플 크기로 인해 GC의 뚜렷한 분자 하위유형의 존재를 시사했지만, 현재의 연구는 정합된 정상 조직에 비해 다중 GC 조직에서 보존된 예측된 인핸서 차이에 초점을 맞추도록 선택되었다(참조: 논의). 분석 이전에, 1차 위 정상 샘플은 실제로 공개된 프로파일과의 상관관계에 의해 위 상피를 반영하였다는 것이 확인되었다(참조: "1차 위 비악성 샘플과 후생유전체 로드맵의 비교" 섹션). 3,759개의 세포주 예측된 슈퍼-인핸서 중, 2/3는 종양과 정합된 정상 샘플 사이에 시차 농축을 나타냈다(도 3a. 표 2, 이후 체세포로 변경됨으로 언급됨). 예측된 슈퍼-인핸서의 절반 가까이, n=1,748; 47%) 2개 이상의 1차 GC에서 체세포 증가(종양에서 > 2배 농축, 최소 0.5 RPKM 차이)를 나타냈고, 이들 증가된 예측된 슈퍼-인핸서를 사용하는 주성분 분석(PCA)은 GC와 정합된 정상 조직 사이의 분리를 확인했다(도 3b). 이러한 결과의 일관성을 지지하여, 모든 품질 조절 기준(14쌍, 이전 참조)을 통과하는 정상/종양(N/T) 1차 쌍만을 사용할 때, 이러한 재발성 체세포 증가 예측된 슈퍼-인핸서의 대다수(85%, >1.5배 변화 임계값)가 재발견되었다. 예기치 않게, 암 세포주에 대한 활성에도 불구하고, 예측된 슈퍼-인핸서의 상당량(18%)이 1차 GC에서 증가보다는 체세포 손실과 관련되었다(도 3a). 이러한 후자 영역은 1차 종양에서 후생유전적으로 사일런싱되었지만 시험관내 배양 동안 세포주에서 재활성화된 영역을 나타낼 수 있다는 것이 가능하다. 예측된 슈퍼-인핸서(n=416)의 11%는 암 관련되지 않지만 "하우스키핑" 또는 일반 조직 기능에 관련된 이들 영역과 일치하는, GC와 정상 조직 사이의 변경되지 않은 H3K27ac 수준을 나타냈다(도 3a, 도 13b). 최종적으로, 21%(n=808)의 세포주 예측된 슈퍼-인핸서는 분석을 위한 1차 샘플에서 충분한 H3K27ac 농축(RPKM < 0.5)을 나타내지 않았다(도 13c). 흥미롭게도, 이 부류는 또한 GC 라인에서 낮은 재발과 관련되어 있었다(도 3a - 검정색 막대그래프). 집합적으로, 이들 결과는 세포주로부터 유도된 예측된 슈퍼-인핸서는 히스톤 변형 데이터를 사용하여 1차 종양 및 정합된 정상 대조군으로부터 적어도 3개의 카테고리 -체세포 증가, 체세포 손실 및 변경되지 않음으로 추가로 하위 분류될 수 있다는 것을 입증한다. 상위 100개의 체세포 예측된 슈퍼-인핸서의 목록이 표 2에 제시되어 있다.
생물학적 특이성을 지지하여, 3개의 카테고리에 속하는 예측된 슈퍼-인핸서는 또한 생체내 다른 후생유전적 차이를 나타냈다. 예를 들어, H3K27ac에서 예측된 슈퍼-인핸서 변경은 H3K4me1 인핸서 마크 변경과 유사하게 상관관계가 있었고(도 3c), DNA 메틸화 수준에서 체세포 증가 예측된 슈퍼-인핸서는 상당히 낮은 DNA 메틸화 수준을 나타낸 반면, 체세포 손실 슈퍼-인핸서는 증가된 DNA 메틸화를 나타냈다(P = 3.8x10-229, 단측 웰치의 t-테스트). 변경되지 않은 예측된 슈퍼-인핸서는 중간 범위를 차지했다(도 3d). 가시적인 예로서, 감소된 DNA 메틸화(낮은 베타 값으로 나타냄)는 ABLIM2 유전자좌에서 체세포 증가 예측된 슈퍼-인핸서에 매핑하는 이의 정합된 정상(N2000721)과 비교하여 GC T2000721에서 관찰되었다(도 3e). 대조적으로, T2000639 중 SLC1A2 예측된 슈퍼-인핸서에서 H3K27ac 신호의 체세포 손실은 N2000639와 비교하여 증가된 DNA 메틸화를 나타냈다(도 3f). 이러한 결과는 위 조직에서 예측된 슈퍼-인핸서의 생물학적 및 분자 이질성을 추가로 지지한다.
슈퍼 인핸서는 복잡한 크로마틴 상호작용을 나타낸다.
카피 수 데이터와의 통합은 체세포 예측된 슈퍼-인핸서의 대부분이 카피 수 중성 영역에 국재화되어 있음을 나타냈다(도 14a-c, "위암에서 카피 수 변경 및 예측된 슈퍼-인핸서 사이의 연관성"이란 표제의 섹션). 예측된 슈퍼-인핸서 및 유전자 발현 사이의 연관성을 조사하기 위해, 연구는, 이전 경로 분석(도 2)과 동일한 예측된 슈퍼-인핸서/유전자 할당을 사용하여, 동일한 1차 샘플로부터의 RNA-seq 정보를 조사했다. 체세포 증가 예측된 슈퍼-인핸서는 정합된 정상 샘플과 비교하여 상승된 유전자 발현과 연관되었지만, 체세포 손실 예측된 슈퍼-인핸서는 감소된 발현과 연관되었다(P<2.2x10-16, 단측 웰치 t-테스트; 도 4a).
이전 연구는 또한 인핸서가 다중 유전자의 발현에 영향을 미칠 수 있는 장거리 크로마틴 상호작용에 종종 관여한다는 것을 나타냈다. GC에서 체세포 예측된 슈퍼-인핸서와 연관된 장거리 상호작용을 동정하기 위해, 연구는 1차 종양 샘플에서 재발성 체세포 증가를 나타내고 또한 GC 세포주에서 활성을 입증하는 영역으로부터 선택된 36개의 예측된 슈퍼-인핸서에 대한 상호작용을 조사하는 포획-C 기술을 적용했다. 3개의 GC 세포주(OCUM-1, SNU16, KATO-III)를 분석하면, 36개의 예측된 슈퍼-인핸서에 걸쳐 복수의 게놈 위치(n=92, "포획점"으로 지칭됨)이 프로빙되어, 유의한 상호작용을 갖는 88개의 포획점을 동정하였다(Q<0.05, r3Cseq 패키지). 도 4b는 20개의 포획점을 커버하는 12개의 대표적 예측된 슈퍼-인핸서를 도시한다. 평균하여, 각 예측된 슈퍼-인핸서는 각각 다른 게놈 위치 및 프로모터와의 20-26개 및 5-7개의 상호작용을 나타냈다. 포획점과 검출된 상호작용 사이의 평균 거리는 대략 17.0kb였다(표준 편차: 30.5kb). 연구는 또한 OCUM-1 세포에서 약 100kb의 거리에서 TM4SF4 프로모터와의 예측된 슈퍼-인핸서 상호작용을 포함하는 장거리 상호작용을 동정했다(도 15). 특히, 정보성 상호작용 데이터를 갖는 영역에 있어서, 실험적 포획-C 정보의 이용가능성은 본래 예측된 슈퍼-인핸서/유전자 상호작용의 93%(n=62)의 추가 검증을 또한 가능하게 했다. 세포주로부터 발현 데이터의 통합은 약 70%의 상호작용 프로모터가 검출가능한 유전자 발현과 연관되어 있음을 나타냈다(FPKM > 0).
대표적 예로서, 도 4c는 SNU16 세포에서 CLDN4 게놈 영역의 장거리 상호작용 경관을 도시한다(다른 예의 경우에 도 16). 이러한 영역은 CLDN4 발현이 이미 GC 진행 및 예후와 연관되기 때문에 선택되었고, CLDN4 예측된 슈퍼-인핸서의 반복 증가가 복수의 1차 GC에서 관찰되었다(도 14d). 구체적으로, 이 연구는 높은 H3K27ac 신호 및 또한 CDX2 및 HNF4α 공-결합을 나타내는 2개의 예측된 서브-슈퍼-인핸서 영역을 수반하는 상호작용을 조사해야 했다(후술 참조). CLDN4 프로모터와의 상호작용에 추가하여, 상호작용은 또한 다른 원위 프로모터(최대 약 100kb), 예를 들면, WBSCR27, CLDN3, ABHD11 및 ABHD11-AS1로 검출되었다. ABHD11-AS1은 긴 비-코딩 RNA이고, 위암에서 고도로 발현되는 것으로 이미 밝혀졌다. 포획-C 데이터를 검증하기 위해, 연구는 또한 2개 GC 세포주(OCUM-1, SNU16)에서 4개 선택된 예측된 슈퍼-인핸서에 대한 환상 염색체 입체구조 포획 검정(4C)을 수행했다(도 17). 포획-C 및 4C 데이터 사이에 75%의 일치가 4C 실험 복제물 사이의 일치율과 유사하게 관찰되었다(도 18). 4C 서열분석의 현저히 보다 큰 깊이 때문에, 약 350kb의 거리에서 예측된 슈퍼-인핸서 및 KLF5 프로모터 사이의 장거리 상호작용과 같은 추가 상호작용이 또한 동정되었다(도 17b).
이전 보고는 특정한 장거리 상호작용이 슈퍼-인핸서 활성과 연관되지만, 다른 상호작용은 보다 불변이고 세포 계통의 반사성인 것을 시사하고 있다. 이들 발견과 일치하여, GC 세포주 사이에서 상이한 활성을 나타내는 22개(36개 중에서) 예측된 슈퍼-인핸서 중에서, 4개의 예측된 슈퍼-인핸서는 예측된 슈퍼-인핸서 활성과 장거리 상호작용의 존재 사이의 우수한 상관관계를 나타냈다(도 4d 및 도 19). 나머지 18개의 예측된 슈퍼-인핸서의 경우, 장거리 상호작용은 예측된 슈퍼-인핸서 활성과 독립적으로 관찰되었다.
예측된 슈퍼-인핸서와 유전자 발현 사이의 인과적 역할을 조사하기 위해, 연구는 CLDN4 예측된 슈퍼-인핸서 영역 내의 2개의 인핸서 영역(e1 및 e2, 도 4c 참조)을 결실시키기 위해 CRISPR/Cas9 게놈 편집을 사용했다. OCUM-1 및 SNU16 세포에서 CRISPR 결실 효율을 확인한 후(도 20a-c), 인핸서-결실 및 야생형 세포 사이의 예측된 표적 유전자 발현 수준을 RT-qPCR에 의해 비교했다. 양 세포주에서, e1 CRISPR-결실은 ABHD11, CLDN3, 및 CLDN4 (SNU16 세포 중의 CLDN4, 도 20d)를 포함하여 복수의 CLDN4 유전자좌 유전자의 하향-조절을 유발했다. 유사한 방식으로, 연구는 또한 OCUM-1 세포에서의 e2 결실 후(e2-결실 SNU16 세포는 생존할 수 없고, 따라서 유전자 발현 분석을 배제한다; 도 20e)에 ABHD11, CLDN3, 및 CLDN4 하향-조절을 관찰했다. 이들 결과를 확장하기 위해, 연구는, 그 후, ELF3이 몇몇 악성종양에서 암 유전자로서 보고되었기 때문에, OCUM-1 세포 중의 ELF3 예측된 슈퍼-인핸서로부터 2개의 다른 예측된 인핸서 요소(e3 및 e4)를 결실한 CRISPR를 수행했다(도 17a, 도 20c). e3 및 e4 결실 둘 다는 ARL8A, ELF3, RNPEPTIMM17A를 포함하는 복수의 ELF3 유전자좌 유전자의 하향-조절을 초래했다(도 20f). 총괄하면, 이들 결과는 예측된 슈퍼-인핸서 활성과 종양 유전자 발현 사이의 인과적 관계를 뒷받침한다.
체세포 슈퍼 인핸서 및 임상 결과
예측된 슈퍼-인핸서 이종성의 생물학적 및 임상적 관련성을 추가로 조사하기 위해, 연구는 체세포 변형 상태(증가, 상실, 변경되지 않음)에 의해 분류된 암의 특징 분석을 수행했다. 10개의 암 특징 중에서, 체세포 증가 예측된 슈퍼-인핸서는 침입(P = 8.6x10-11, 단측 피셔 정밀 테스트), 혈관신생(P = 2.4x10-4, 단측 피셔 정밀 테스트) 및 세포사 내성(P = 7.8x10-3, 단측 피셔 정밀 테스트)과 관련된 유전자에서 현저히 농축되어 체세포 손실을 초과하고, 변경되지 않은 슈퍼-인핸서를 크기의 순서로 예측했다(도 5a). 이들 결과는 체세포 증가 예측된 슈퍼-인핸서가 공격적 GC와 연관된 특성에 관여할 수 있음을 시사한다. 86개의 세포 및 조직 샘플의 예측된 슈퍼-인핸서 프로파일에 대해 비교하는 경우, GC에서 >60%의 체세포 증가 예측된 슈퍼-인핸서는 고도의 조직-특이성을 나타냈다. 결장직장, 유방, 자궁경부 및 췌장 암 등의 다른 암 유형에서 이미 기재된 예측된 슈퍼-인핸서와의 현저한 중첩(P < 0.001, 실험적 테스트)이 또한 관찰되었고, 이는 특정 GC-관련 예측된 슈퍼-인핸서가 또한 다른 암 타입에서 활성적일 수 있음을 시사한다.
이어서, 연구는, 체세포 증가 예측된 슈퍼-인핸서와 연관된 유전자 발현 패턴이 GC 환자 생존과 연관될 수 있는지를 조사했다. 복수의 GC 환자에서 재발 체세포 증가를 나타내고 또한 표적 유전자 발현과의 최대 상관관계를 나타내는 영역으로부터, 상위 50개의 예측된 슈퍼-인핸서와 연관된 유전자가 선택되었다. 이러한 접근법의 타당성을 뒷받침하여, 이러한 방식으로 선택된 몇몇 유전자는 CDH17CCAT1 등의 GC에서 과발현되는 것으로 이미 밝혀진 것으로 관찰되었다. 유전자 목록은 또한 잠재적으로 신규한 GC 관련 유전자, 예를 들어, SMURF1LINC00299를 포함했다(표 10).
상위 예측된 슈퍼-인핸서와 관련된 유전자(별표). 환자 생존을 평가하는데 사용된 유전자는 "예"로서 표시되었다.
상위 N 슈퍼-인핸서와 관련된 유전자 N=60 N=50 N=30
ABTB2 예 * 예 * 예 *
AC104654.2 *
AGFG2 * * *
AP000344.3 *
ATP2C2 * * *
ATP6V1C2 * *
BAIAP2L1 예* 예 *
BFSP2 * *
BX470102.3 *
CAMK2N1 예* 예*
CCAT1 * * *
CCDC88C * *
CDH17 예 * 예 * 예 *
CDKN2B 예*
CLDN1 예 * 예 * 예 *
CLRN3 예 * 예 * 예 *
CREB3L1 예 * 예 * 예 *
DSG2 예 * 예 *
EGFR 예 * 예 * 예 *
EPHB2 예 * 예 * 예 *
ETV4 예 * 예 * 예 *
GDA 예 * 예 * 예 *
GDPD5 예 * 예 *
GLS 예 * 예 * 예 *
HRH1 * * *
IGFL4 * *
IL22RA1 * *
ITPK1 예 * 예 * 예 *
KB-1471A8.1 * * *
KIAA1211 * *
LAMC2 예*
LINC00299 * * *
MALL 예*
MMP20 * *
MYO16-AS1 * * *
notCH1 예*
PCSK5 *
PDP1 * * *
PFKP 예*
RARRES1 예 * 예 * 예 *
RBCK1 예 * 예 * 예 *
RNF170 예 * 예 * *
RP11-400N13.2 * * *
RP11-486A14.1 *
SLC9A4 * *
SMURF1 예 * 예 * 예 *
SOX13 예 * 예 *
SSTR5 * * *
ST3GAL4 예 * 예 *
TASP1 예 * 예 * 예 *
TPCN2 예 * 예 * 예 *
TPRXL * * *
TTYH3 예* 예*
UPP1 예 * 예 *
VIPR1 예 * 예 * 예 *
ZKSCAN1 * *
ZNRF3 * * *
생존 분석은 848명의 GC 환자를 포함하는 3개의 비-아시아 GC 및 4개의 아시아 GC 코호트에 대해 수행했다. 예측된 슈퍼-인핸서 관련 유전자의 고도 발현을 나타내는 GC 환자는 이들 유전자가 비교적 낮게 발현되는 GC 샘플과 비교하여 불량한 전체 생존을 나타냈다(도 5b, P = 1.8x10-2, 로그 순위 테스트). 이러한 연관의 견고성을 뒷받침하여, 환자 생존과의 관계는 예측된 슈퍼-인핸서의 수를 변화시킨 후에도 유의한 상태였다(n=30, P = 0.02, 로그 순위 테스트; n=60, P=0.03, 로그 순위 테스트). 다변량 분석에서, 생존과의 연관성은 연령, 단계, 환자 지역 및 조직학적 하위유형 등의 다른 위험 인자를 조정한 후에도 통계학적으로 유의했다(P = 0.044, 발드(Wald) 테스트). 이 데이터는 GC에서 체세포 증가 예측된 슈퍼-인핸서에 의해 유도된 유전자가 임상적으로 중요할 수 있음을 나타낸다.
상이한 예측된 슈퍼-인핸서 카테고리 및 질환 위험 사이의 관계에 대처하기 위해, 질환-관련 단일-뉴클레오티드 다형성(SNP)이 조절 요소에서 농축된다는 것을 나타내는 이전 게놈 전체 연관성 연구(GWAS) 연구가 고려되었다. 이러한 연구는 재발성 체세포 변경(증가 또는 손실) 또는 변경되지 않은 예측된 슈퍼-인핸서를 나타내는 이들 예측된 슈퍼-인핸서에 대한 1470개의 게놈 전체 연관성 연구로부터 보고된 질환-관련 SNP의 카탈로그를 매핑했다. 체세포 예측된 슈퍼-인핸서는 다양한 암(전립선, 결장직장, 유방; 농축비=3.0-7.2; P<4.4x10-3, 카이 제곱 테스트) 및 위장 질환, 예를 들면, 궤양성 대장염(농축비=3.3; P=5.2 x10-4, 카이 제곱 테스트)과 연관된 질환-위험 SNP에 대해 농축시켰다(도 5c). 대조적으로, 변경되지 않은 예측된 슈퍼-인핸서는 유사한 농축을 나타내지 않았다. 예상외로, 본 발명자들은 또한 체세포 변경된 예측된 슈퍼-인핸서에서 다발성 경화증의 농축을 관찰했고(농축비 = 4.3; P=1.8 x10-7, 카이 제곱 테스트), 이는 암 및 자가면역 반응 사이의 상호관계를 시사한다. 예측된 슈퍼-인핸서 질환 SNP가 크로마틴 변형에서 국소 변화와 연관될 수 있는지를 조사하기 위해, 연구는 적어도 2개 연구에서 보고된 결장직장암과 연관되고 또한 GC 환자의 적어도 1/3에서 이형접합성을 나타내는 SNP에 초점을 맞추었다(논의 참조). 2개의 SNP는 이들 기준(rs10411210 및 rs10505477)을 만족시켰다. rs10411210 SNP를 갖는 샘플은 종양 대 정합된 정상에서 유의적으로 높은 H3K27ac 신호를 나타냈고(도 5d; P = 0.01, 단측 웰치 t-테스트), 유사한 경향은 또한 rs10505477 SNP을 갖는 샘플에서 관찰되었다(P=0.07, 단측 웰치 t-테스트). 이러한 연관성은 질환-관련 위험 SNP와 암 관련 히스톤 변형 사이의 관계를 시사한다.
슈퍼-인핸서는 고밀도 전사 인자 점유를 나타낸다.
마지막으로, 체세포 증가 예측된 슈퍼-인핸서와 연관된 트랜스-작용 인자를 조사했다. GC 예측된 슈퍼-인핸서는 다른 게놈 영역과 비교하여 유의적으로 농축된 ENCODE TF 결합 프로파일을 나타냈고, 이는 전자를 TF "핫-스팟(hot-spot)"으로서 뒷받침한다(P<2.2 x10-16, 단측 비율 테스트). ReMap 데이터베이스에 문의하여, 연구는 이어서 상이한 예측된 슈퍼-인핸서 카테고리와 연관된 특정 TF를 동정했다. 체세포 증가 및 변경되지 않은 예측된 슈퍼-인핸서 둘 다는 CEBPB, MYC, 및 FOXA1 결합에서 농축을 나타냈다. 그러나, 상위 10개의 농축된 TF 중에서, CDX2는, 변화되지 않은 예측된 슈퍼-인핸서(순위 #8)와 비교하여 대략 30% 증가된 결합 밀도와 함께, 체세포 증가 예측된 슈퍼-인핸서(순위 #2)에서 상승된 농축을 나타냈다(도 6a 및 6b).
TF는 종종 협력적 방식으로 작용하기 때문에, 잠재적 CDX2 파트너는 드 노보 모티프 발견 알고리즘인 HOMER을 사용하여 동정했다. HOMER 분석은 CDX2 결합과 연관된 HNF4α, KLF5, 및 GATA4 결합 모티프를 동정했다(도 6c). 연구는 또한 JASPAR 2016과 함께 PScanChIP를 사용하여 CDX2 공-결합 모티프를 분석했다. PScanChIP를 사용하여, 연구는, HNF4α, KLF5 및 GATA4를 또한 포함하는 경우, 367개 단백질을 잠재적 CDX2 파트너로서 예측했다(표 7). 유전자 공-발현 분석은 HNF4α(스피어만 상관관계, r = 0.80) KLF5(r = 0.58)가 CDX2 발현과 가장 강력하게 상관된 후보임을 나타냈고, 이는 HNF4α 및 KLF5가 CDX2 파트너일 수도 있음을 시사한다(도 6d). 특히, CDX2는 장내 화생의 유도인자로서 GC에서 이미 동정되었고, KLF5 및 GATA4/6은 HNF4α를 상향조절하도록 협력하는 GC에서 발암성 전사 인자로서 이미 보고되었다.
HNF4α(최고 상관된 인자)와 CDX2의 게놈 공-점유를 실험적으로 확인하기 위해, CDX2 및 HNF4α ChIP-seq를 OCUM-1 위 세포 상에서 수행했고, TF 결합 위치를 예측된 슈퍼-인핸서 위치와 통합했다. OCUM-1 세포에서, CDX2 및 HNF4α 결합 정점(q<0.01, MACS2)은, HNF4α와 공-발생하는 76%의 CDX2 결합과 함께(CDX2/HNF4α 부위로서 공지됨), 높은 공-발생을 나타냈다(500bp 윈도우)(도 6e). 상위 50%의 높은 CDX2-발현 GC를 최저 50%와 비교하면, 본 발명자들은, 전자의 샘플에서, 재발성 체세포 증가 예측된 슈퍼-인핸서가 실제로 보다 높은 CDX2 결합 밀도와 연관되는 것을 발견했다(백만 염기쌍당 123개 결합, Mbp vs 92 Mbp; 방법 참조). CDX2/HNF4α 부위는 변경되지 않은 예측된 슈퍼-인핸서에 비해 체세포 증가 예측된 슈퍼-인핸서에 우선적으로 국재화되었고(P = 2.4x10-4, 카이 제곱 테스트), CDX2 및 HNF4α 결합 신호 둘 다는 변화되지 않은 예측된 슈퍼-인핸서에 비해 체세포 증가 예측된 슈퍼-인핸서에서 증가되었다(도 6f). 유사한 CDX2 및 HNF4α ChIP-seq 결과가 SNU16 세포에서 또한 수득되었다(도 22a). 이 결과는 GC에서 체세포 증가 예측된 슈퍼-인핸서가 CDX2 및 HNF4α 점유와 연관되는 것을 나타낸다.
CDX2 및 HNF4α가 GC 슈퍼-인핸서 유지에서 역할을 담당할 수 있는지를 시험하기 위해, 각 TF의 사일런싱을 단독으로 또는 양 인자로 동시에 수행한 다음, 게놈 전체 H3K27ac 프로파일링을 수행했다. 어느 인자의 고갈은, 단독 또는 조합하여, OCUM-1 세포에서 H3K27ac의 전체적 변화를 유도하지 않았다(도 22b). 그러나, CDX2HNF4α-사일런싱은 각각 게놈의 9.7Mb 및 4.3Mb에서 특정한 H3K27ac 변경을 유도했고, 이중-TF 녹다운은 유의적으로 큰 H3K27ac 고갈을 유도했다(CDX2HNF4α-단독과 비교하여 P=3.4x10-29 및 1.2x10-88, 단측 윌콕슨 순위 합계 테스트)(도 22c). 단일-TF 및 이중-TF 사일런싱 둘 다에 있어서, H3K27ac 고갈은 예측된 전형적 인핸서와 비교하여 체세포 증가 예측된 슈퍼-인핸서에서 보다 현저하게 발생했고, 이는 TF 고갈에 대한 슈퍼-인핸서 활성의 높은 감수성을 시사한다(도 6g, 도 2d, 표 11a 내지 11d; 각각 CDX2, HNF4α CDX2/HNF4α에 대해 P=5.3×10-7; P=1.8×10-17; P=1.5×10-10, 단측 윌콕슨 순위 합계 테스트). 이들 효과의 특이성을 뒷받침하면, 예측된 슈퍼-인핸서에서 H3K27ac 고갈은 CDX2 또는 HNF4α 결합 부위에 중심을 둔 영역, 특히 양 인자에 의해 공-점유된 부위에서 더욱 현저했다(도 6h). 유사한 결과는 또한 SNU16 세포에서 수득되었다(도 22e). 이어서, 예측된 슈퍼-인핸서 및 유전자 발현 사이의 관계를 평가하기 위해, 연구는 TF 사일런싱 후에 H3K27ac 고갈을 나타내는 예측된 슈퍼-인핸서에 초점을 맞추었다. >60%의 예측된 슈퍼-인핸서 표적 유전자가 또한 TF 사일런싱 후에 감소된 발현을 나타낸 것으로 관찰되었다(siCDX2, P = 4x10-4, 실험적 테스트; siHNF4α, P < 1x10-4, 실험적 테스트; si(CDX2/HNF4α), P < 1x10-4, 실험적 테스트; 도 22f). 이 비율은, 순열 분석(방법)에 의해 평가된 바와 같이, chance에 의해 예상된 비율을 현저히 상회했다. 총괄하면, 이들 결과는 GC 슈퍼-인핸서 유지에서 CDX2 및 HNF4α에 대한 기능적 요건을 뒷받침한다.
[표 11a] OCUM1에서 체세포 증가 예측된 슈퍼-인핸서. a. CDX2 사일런싱 후 예측된 슈퍼-인핸서에서 고갈된 H3K27ac 신호를 갖는 하위 영역의 농축 유의성.
Figure pct00001
Figure pct00002
[표 11b] HNF4α 사일런싱 후 예측된 슈퍼-인핸서에서 고갈된 H3K27ac 신호를 갖는 하위 영역의 농축 유의성.
Figure pct00003
Figure pct00004
[표 11c] CDX2 및 HNF4α 동시 사일런싱 후 예측된 슈퍼-인핸서에서 고갈된 H3K27ac 신호를 갖는 하위 영역의 농축 유의성.
Figure pct00005
Figure pct00006
[표 11d] OCUM1 세포에서 어느 하나의 인자 또는 둘 모두를 동시에 사일런싱 후 CDX2 및 HNF4α의 배수 변화. 음성 값은 사일런싱된 TF(들)를 갖는 세포에서 발현이 대조군에 비해 더 낮다는 것을 나타낸다.
Figure pct00007
암에서 계통 특이적 인핸서 요소
일부 인핸서 하위-영역이 암-특이적 필수성을 나타낼 수 있다는 개념의 증거로서, 본 연구는 CLDN4 서브-인핸서 영역(e1)이 GC 세포 또는 정상 ES 세포에서 결실될 수 있는 정도를 시험했다(도 15, 16; 표 12). 도 24에 도시된 바와 같이, CLDN4 e1 하위영역의 동형접합성 결실은 H1 ES 세포에서 용이하게 달성되었지만(도 26, 27), SNU16 GC 세포에서는 달성되지 않았고(도 25, 28), 이는 CLDN4 e1의 1개의 카피의 보유가 SNU16 암 세포 생존에 필수적일 수 있음을 시사한다.
인핸서 e1 결실을 위한 단일 가이드 RNA (sgRNA)의 설계
sgRNA hg19 좌표
5' chr7: 73,236,124 내지 73,236,143
3' chr7: 73,237,728 내지 73,237,747
이는 chr7:73,262,400-73,266,700 주위의 결실을 가능하게 한다. 결실의 크기는 실제 실험 동안 달라진다. 따라서, 상술한 결실된 영역은 sgRNA 설계에 기초한 추정에 불과하다. sgRNA의 서열은 표 13에 제시되어 있다.
sgRNA의 서열
5' sgRNA CGGGACTCAGACCTTAGTCATGG (서열번호:141)
3'sgRNA GAGGATTTCTTAAGCCCAGAAGG (서열번호:142)
유전자 발현 및 원위 예측된 조절 요소 사이의 상관관계
나노-ChIPseq에 의해 정의된 원위 예측된 조절 요소를 유전자 발현과 상관시키기 위해, 복수 세포주에 대해 높은 재발성을 나타내는 80개의 예측된 슈퍼-인핸서를 동정했다(P < 0.0001, 실험적 테스트). 동일한 접근법을 또한 사용하여 고도의 재발성 예측된 전형적 인핸서를 동정했다. 예측된 슈퍼-인핸서 및 예측된 전형적 인핸서 둘 다에 있어서, 원위 조절 요소와 연관된 유전자는 무작위 선택된 유전자보다 높은 발현을 나타냈다(도 10b). 예측된 슈퍼-인핸서/전형적 인핸서 연관된 유전자의 비교는 예측된 슈퍼-인핸서 연관된 유전자에 대해 보다 높은 전체 발현 수준(백분위 단위로)을 나타냈다(P = 5.2x10-3, 단측 윌콕슨 순위 합계 테스트). 이들 결과는 예측된 슈퍼-인핸서 및 예측된 전형적 인핸서에서 H3K27ac 농축과 표적 유전자 발현 사이의 양의 연관성을 시사한다.
1차 위 비-악성 샘플과 후성유전체 로드맵과의 비교
본 연구에서 비-악성 위 조직이 실제로 근육, 면역 세포 등이 아닌 위 상피를 반영하는 것을 확인하기 위해, 본 연구로부터의 비-악성 위 H3K27ac 프로파일을 사전 공개된 정상 위 프로파일 및 또한 위 평활근 프로파일과 비교했다. 각 나노-ChIPseq 프로파일에 있어서, 70%(평균)의 H3K27ac 신호는 공개된 정상 위 프로파일과 중첩된 반면, 단지 34%(평균)만이 위 평활근과 중첩되었다. 이 결과는 비-악성 위 샘플이 위 평활근이 아닌 위 상피를 실제로 반영한다는 것을 시사한다.
위 암에서 카피 수 변경과 예측된 슈퍼-인핸서 사이의 연관성
연구는 재발성 체세포 변경된 예측된 슈퍼-인핸서가 체세포 카피 수 변경(sCNA)과 연관될 수 있는 정도를 조사했다. 세포주 및 1차 GC로부터 예측된 슈퍼-인핸서 및 카피 수 정보 사이의 중첩은 사내 생성된 Affymetrix SNP6.0 어레이 데이터를 사용하여 계산했다. 이 분석은 sCNA의 영역이 확실하게 동정되도록 10kb당 적어도 6개의 SNP 프로브에 의해 커버된 영역으로 제한되었다(평균 게놈 전체 커버리지보다 2배 더 높음). sCNA 분석의 신뢰성을 확인하면, 분석에서 평균 98%의 카피 수 증가 및 82%의 카피 수 손실이 또한 이후(FU97, KATO-III, MKN7, OCUM-1, RERFGC1B, SNU16)에서 발견된 GC 세포주에 대한 암 세포주 백과사전에서 보고되었다.
세포주에서, 단지 5-6%(±6% 표준 편차)의 예측된 슈퍼-인핸서만이 카피 수 증가(평균 log2 비율 > 0.6)와 연관된 것으로 밝혀졌다. 예를 들면, KATO-III에서 검출된 FGFR2-관련 예측된 슈퍼-인핸서는 카피 수 증가와 중첩되었고(도 14b), 이는 유전자좌에서 관찰된 보다 높은 H3K27ac 판독 밀도가 잠재적으로 영역 게놈 증폭에 의해 유도된다는 것을 시사한다. 한편, GC 세포주에서 검출된 예측된 슈퍼-인핸서의 대부분은 카피 수 중성 영역에 국재화되었고, 이는 예측된 슈퍼-인핸서의 확립이 체세포 카피 수 사상과 독립적임을 시사한다. 이 분획은 무작위 chance보다 더 크다(P< 0.01, 실험적 테스트).
유사하게는, 1차 GC에서, 본 연구는 19 1차 T/N 쌍에서 1,748개의 재발성 체세포 증가 예측된 슈퍼-인핸서에 대한 CNA/SE 상관관계를 계산할 수 있었다. 개별적 T/N 쌍에서 발견된 >90%의 체세포 증가 예측된 슈퍼-인핸서와 함께, 카피 수 증가와 중첩된 체세포 증가 예측된 슈퍼-인핸서의 작은 분획(< 2% ± 3% s.d)(도 14c)만이 카피 수 중성 영역 내에서 검출되는 것으로 밝혀졌다(도 14a). 이 결과는 예측된 슈퍼-인핸서에서 H3K27ac의 체세포 증가 및 카피 수 변화 사이에는 강력한 연관성이 없고, 종양 샘플에서 예측된 슈퍼-인핸서에서 H3K27ac 획득이 카피 수 변경과는 별개의 메카니즘에 의해 유도될 가능성이 있음을 시사한다.
논의
GC는 임상적으로 이종성 질환이고, 외과수술 및 화학요법 이외에, 트라즈투주맵(항-HER2) 및 라무시루맵(항_VEGFR2)만이 현재까지 성공적이지 않은 것으로 입증된 다른 분자 표적화된 제제와 임상적으로 승인된다. 후성유전적 탈조절은 위 종양형성에서 중요한 경로로서 출현하였고, 크로마틴 변형제 유전자(eg ARID1A)는 위 전-악성종양과 연관된 GC 및 후성유전적 변화에서 빈번하게 돌연변이된다. 그러나, 현재까지, GC 후성유전적 연구의 대부분은 종양 억제인자 유전자 사일런싱과 관련하여 프로모터 DNA 메틸화에 초점이 맞추어져 있다. 대조적으로, GC에서 원위 조절 요소(즉, 인핸서)에 대해서는 현재 거의 공지되어 있지 않다.
이 연구는 1차 위 종양, 정합된 비-악성 조직 및 GC 세포주의 마이크로-규모 히스톤 변형 프로파일링을 통해 동정된 >35k 예측된 인핸서 요소를 분석했다. 소규모 ChIP 프로토콜은 기술적으로 도전적인 것으로 공지되어 있고, 종종 샘플간의 상당한 변동성을 제공할 수 있다. 안심하게는, 본 저자들은 종양과 정상 샘플 사이의 나노-ChIP 신호가 직교 ChIP-qPCR 결과와 양호한 일치를 나타내는 것을 이전에 입증했고, 본 연구에서 저자들은 또한 매핑 엄격성의 변화, 생물학적 복제 분석, 프로모터 ChIP 농축 및 CHANCE 분석을 포함하는 광범위한 품질 조절 분석을 수행하여 대부분(85-100%)의 나노-ChIPseq 라이브러리가 허용가능한 품질인 것을 확인했다. 복수의 샘플에 존재하는 재발성 후성유전적 변경에 대한 초점은, 분석이 프로모터-기반 및 CHANCE 품질 분석 둘 다를 통과하는 이들 "고-품질" 종양/정상 쌍만으로 한정되는 경우에 84%의 재발성 체세포 증가 예측된 슈퍼-인핸서가 여전히 재발견된다는 관찰에 의해 제시된 바와 같이, 생물학적 결론이 강력할 것을 추가로 보장했다.
본 연구에서, 재발성 예측된 슈퍼-인핸서는 발암성 프로세스에 관여하는 공지된 종양유전자 및 유전자에서 대부분 명백해졌다(도 2d). 근위 프로모터 요소를 초과하는 개개 샘플 사이의 높은 수준의 인핸서 변화(도 1d)가 또한 관찰되었다. 다른 조직 및 종양-유형에 대해 비교하는 경우, 거의 60%의 GC 예측된 슈퍼-인핸서는 조직-특이적이었다(도 21). 본 연구에서, GC는 최대 감수성을 위해 정합된 비-악성 위 조직에 대한 일반적 카테고리로서 연구되었음에 주목할 가치가 있다. 그러나, 명백한 조직병리학적 및 분자 GC 하위유형이 존재하고, 이는 GC의 상이한 조직학적 하위유형에서 명백한 인핸서 변경이 존재할 수 있음을 시사한다. 이러한 발견은 인핸서 요소의 절묘한 조직-특이적 성질, 및 확장된 환자 코호트 및 다수의 상이한 종양 유형에서 포괄적 인핸서 카탈로그를 생성할 결과적 필요성을 반영한다.
연구에서 분석된 대부분의 샘플은, 시험관내 배양된 세포주가 아니라, 환자로부터 직접 유래된 1차 조직이었다. 종양과 정합된 정상 사이의 예측된 인핸서 활성(H3K27ac)을 비교함으로써, 이들의 체세포 변경 상태(체세포 증가, 체세포 손실 및 변경되지 않음)에 따라 세포주 예측된 슈퍼-인핸서를 추가로 하위 분류할 수 있었다. 이들의 생물학적 특이성을 뒷받침하여, 하위-카테고리화된 예측된 슈퍼-인핸서는 또한 후성유전적 패턴(H3K4me1, DNA 메틸화), 유전자 전사, 및 암 특징을 포함하는 다른 직교 특징에서 특이적 차이를 나타냈다. 특히, 본 데이터에서는 체세포 증가 예측된 슈퍼-인핸서의 작은 분획만이 카피 수 증폭의 영역으로 국재화된다. 진실된 체세포 증가 또는 손실에 따라 예측된 슈퍼-인핸서를 하위분류하는 능력은 암에서 슈퍼-인핸서의 확립에 관여하는 발암성 메카니즘을 특정하는 다운스트림 시도를 개선할 가능성이 있다. 이러한 접근법은 또한 다른 질환 상태로 확장될 수 있다.
예측된 슈퍼-인핸서 이종성의 선험적 고찰은 또한 질환 위험과 연관된 생식계열 변이체를 분석하는 경우에 또한 유용할 수 있다. 이전 발견은 질환-관련 SNP가 일반적으로 조절 요소에서 과표현되는 것을 보고했지만, 체세포 변화되었지만 변경되지 않은 것은 아닌 예측된 슈퍼-인핸서는 암 및 염증성 위장 질환(위장암의 공지된 위험 인자)과 연관된 SNP에서 특이적으로 농축된 것으로 밝혀졌다. 이들 영역에서의 SNP는, TF 결합 모티프의 변형, 장거리 크로마틴 상호작용의 조절 또는 H3K27ac 수준의 변경을 포함하는 몇몇 비-배타적 메카니즘을 통해 질환 위험 및 암 발달을 변경할 수 있다. 실제로, 본 연구에서, 결장직장암(CRC) 위험과 연관된 2개 SNP(rs10505477 및 rs10411210)는 또한 1차 GC에서 크로마틴 변형의 국소적 변화와 연관된 것으로 관찰되었다. CRC 위험 데이터를 GC와 통합하는 것이 타당할 수 있는 몇가지 이유가 있다. 첫째, 적어도 하나의 이들 CRC 위험 SNP(rs10505477)는 치료 반응 및 환자 생존 둘 다에서 GC 임상적 결과에 또한 영향을 미치는 것으로 보고되었다. 둘째, GC 예측된 슈퍼-인핸서(CDX2, HNF4α)와 연관된 주요 전사 인자는 또한 결장 발달을 조절하는 것으로 공지되어 있다. 셋째, GC에 대한 전-악성 위험 인자로서 장내 화생(IM)의 역할은 잘 확립되어 있고, IM에서 위 상피 세포는 결장 상피와 유사한 세포 구조 및 외관을 채용한다. 이들 유전적 변이체가, 생식계열 DNA에 존재하지만, 종양에서 크로마틴 구조 및 유전자 발현에 영향을 미칠 수 있다는 관찰은 CRC에서 또한 관찰되었다. 이들 결과는 질환 소인의 근거가 되는 생식계열 과정의 이해를 개선하기 위한 이상 후성유전적 상태의 연구 중요성을 추가로 강조한다.
본 연구의 결과는, GC에서 개개 슈퍼-인핸서가 시스- 및 트랜스-작용 전사 기구와 어떻게 상호작용하는지에 관한 특정의 일반 원칙을 시사한다. 2개의 상이한 장거리 크로마틴 상호작용 검정(포획-C 및 4C)을 사용하여, 상승된 종양 발현을 나타내는 근위 및 원위 유전자 둘 다에 관여하는 체세포 증가 예측된 슈퍼-인핸서의 몇몇 예가 관찰되었다. 체세포 증가 예측된 슈퍼-인핸서에 연결된 유전자가 코헤신-매개된 인핸서-프로모터 루프를 통해 확립된 유사한 위상적 회합 도메인을 점유할 가능성이 있는 것으로 제안되어 있다. 근위 및 원위 유전자 발현 둘 다에 영향을 미치는 체세포 증가 예측된 슈퍼-인핸서의 능력은 예측된 슈퍼-인핸서를 위의 종양에서 이상 유전자 발현의 중추 조절인자로서 시사하고, 이는 질환 진행 및 화학반응에 기여할 수 있다(도 5b). 트랜스-수준에서, 데이터는 GC에서 체세포 증가 예측된 슈퍼-인핸서가 CDX2 및 HNF4α 점유와 연관되는 것을 나타냈다. 이전 연구는 위에서 이상 CDX2 발현이 위 종양 형성에서의 중요한 초기 사상인 점막 상피 세포의 장 화생과 연관되어 있고, CDX2가 GC 종양유전자로서 기능할 가능성이 있음을 밝혀냈다. HNF4α는 또한 최근에 계통-특이적 종양유전자 KLF5 및 GATA 인자 및 AMPK 신호전달 경로 둘 다의 표적으로서 GC에서 연루되어 있다. 1차 인간 종양에서의 결과는, CDX2가 장 유전자 발현을 조절하는 HNF4α 점유를 조절하는 것으로 밝혀진 마우스 소장에서의 최근 발견에 의해 뒷받침된다. 이들 연구를 반복하면, CDX2/HNF4α 고갈이 CDX2 및/또는 HNF4α 결합 부위에서 농축된 국소 영역에서 크로마틴 변경에 영향을 미친 것으로 또한 밝혀졌다.
결론적으로, 본 연구는 예측된 슈퍼-인핸서에서 이종성의 역할, 및 조절 생물학을 해부하기 위해 1차 조직 및 세포주로부터 교차 크로마틴 프로파일의 유용성을 입증한다. GC 원위 인핸서의 제1 세대 로드맵은 이제 GC 예측된 인핸서(eRNA)와 연관된 전사 특징을 수반하는 장래 통합 연구를 가능하게 하고, 예측된 슈퍼-인핸서 활성을 교란시키는 체세포 조절 돌연변이를 동정하게 한다.
SEQUENCE LISTING <110> AGENCY FOR SCIENCE, TECHNOLOGY AND RESEARCH <120> CANCER EPIGENETIC PROFILING <130> IPA180962-SG <150> SG10201601141X <151> 2016-02-16 <150> SG10201606828P <151> 2016-08-16 <160> 170 <170> PatentIn version 3.5 <210> 1 <211> 120 <212> DNA <213> Homo sapiens <400> 1 atctctttcc ttcagcctgc cgttctttct gcagcaccag ggccctggga ccagctggtg 60 gtttccacca gagcagcctc ggggtgaatt tagtcaggaa tgtgccctca gctcaagaga 120 <210> 2 <211> 120 <212> DNA <213> Homo sapiens <400> 2 gctaagtgag gtgcaaacaa gaaacctggg ttgcctttgc cctctgtccg ccccttgtcc 60 tctgtttaca tcctcccttc ccgtaaatga gttgggtgct gggccccact ggccctgatc 120 <210> 3 <211> 120 <212> DNA <213> Homo sapiens <400> 3 atctggaagg cttttcccag cttagcgtgg tcaagatagg gatgggccga ggctggcact 60 gatgctagac ttccgtgcac agggcaagta tggacaagcc ccaagtggct ttgtgaggcc 120 <210> 4 <211> 120 <212> DNA <213> Homo sapiens <400> 4 atcccggaga tggggggtgg ccctgggcca aatcaggcac ctccctttct caccaggtag 60 tgcctccctg cacgttcaca cccaatgctg tgttgtcagg ggctgtaacc tgagccctgg 120 <210> 5 <211> 120 <212> DNA <213> Homo sapiens <400> 5 gctagccatc tgttgaacca cacccctgcc ccaaccattc tagaaagaaa tataaatctc 60 ttttacagct gtaaatggag agctctgtaa ctctaatatg gagggagata cacgctgatc 120 <210> 6 <211> 120 <212> DNA <213> Homo sapiens <400> 6 ttaaatcatt agagggattt atttcctttc cggaagagtc actcttctgc ggtccttcca 60 cacccagctt tggactgggc cacctggcaa gggtgtgaag tggacttgtg gttgatgatc 120 <210> 7 <211> 120 <212> DNA <213> Homo sapiens <400> 7 atccacagtc tgaagggcat tgcattaggg ccagcccagg gcgagtggcc ttagctgggc 60 tggctatagc gtgtagcaga ggtcagtatg gaaaatggcc ctaggtgcat tctggggctc 120 <210> 8 <211> 120 <212> DNA <213> Homo sapiens <400> 8 atcattctga aattgcttta gggggaaaga cgtgggaact tcacacttcc acccagggtg 60 ccccctcagc aatctggaat gatggactaa ccattagctg agggaggagg gggcaggaca 120 <210> 9 <211> 120 <212> DNA <213> Homo sapiens <400> 9 atcacttggt ctgaatatag gctagtaagg cccatatcat aaggccggta agattcaaaa 60 aaggtaaaaa aaaaaacatc tagtttcgca gactgcaatc ttaaatacag caagccattt 120 <210> 10 <211> 120 <212> DNA <213> Homo sapiens <400> 10 atctttttgc caaattggat gtgagctgac tcactgacat atttctcaag tgacccattg 60 gttcaatgag taacatcctg gaagaaacat gagttattgt taatcataat tattccttca 120 <210> 11 <211> 120 <212> DNA <213> Homo sapiens <400> 11 acaagctgtt cctcccactc aaaccttggc caggaaactg gtggatgatt tgcccttgat 60 tcagaggcaa tcattcttaa ttgcctcaca tggttggaag gtgagtaagt gtctaagatc 120 <210> 12 <211> 120 <212> DNA <213> Homo sapiens <400> 12 atcagtaaag cgacgctttg agaaggggaa ttccttaacc agcctaaatc agtgaatagg 60 attttgcaga gggaattagc taaatacatt ccaaattagg gaagaaggga ttttgacagc 120 <210> 13 <211> 120 <212> DNA <213> Homo sapiens <400> 13 aacacagatg cttcaagtgc caacagccaa taacctataa cccgaatgac attaggctgg 60 gactgaaaga agtcaggcag caggcaggca agccttttaa agaaaactga atccaagatc 120 <210> 14 <211> 120 <212> DNA <213> Homo sapiens <400> 14 atctgctgag ccttcaaaag atgttctttc ttttctggac tcagctgtaa tgcactgggc 60 tggtggtagg gtaataaagt gccctggttt gccctggacg aaaaccaaca gtgttttcta 120 <210> 15 <211> 120 <212> DNA <213> Homo sapiens <400> 15 cagacccttt tggggccctg atttacaggt gccctgaagg gggaggtatt gttctaatgg 60 ccctgcggga ggatgaggtc acttctgtgg gactgtctta ctctggcctg cgctgagatc 120 <210> 16 <211> 120 <212> DNA <213> Homo sapiens <400> 16 atcaattgtt atttggaaga tggttccaga agaatgacag aagtgaatga agaggatatt 60 cctggctgga aaacttgata aaattgttga aaagggagtt gagtaattta tttgtctttg 120 <210> 17 <211> 120 <212> DNA <213> Homo sapiens <400> 17 ctgtcacttg aaagagccta accctgtaca gtaaggagaa aaatgcctgt tacccttcca 60 gggaggctga tacttgcagc acctggtaga aaggaccagt gcctaactgg ggtgatgatc 120 <210> 18 <211> 120 <212> DNA <213> Homo sapiens <400> 18 ctctgatgag acccttcaga atagctgtcc ctaagaggaa ctaaatcagg aattggggat 60 agctggcaag aagacatcaa agaaagctca ggatgtggaa tctctacatt gccctggatc 120 <210> 19 <211> 120 <212> DNA <213> Homo sapiens <400> 19 atctccagtt gcctgtcact accctctgtc aagacccttg gagtcatgac taacaggaag 60 ggagcaggtg gcagcgtggc cacctgccat gcagaaagac tgggtcactt cctgttggta 120 <210> 20 <211> 120 <212> DNA <213> Homo sapiens <400> 20 ttgtgaaact gagttgaatg gagagggttg gctggagacc tgaaagagga tttttaaagg 60 cccaggtctc atcatcaacg tggccactca ctaggtggtg gaaggaatgt agaaaggatc 120 <210> 21 <211> 120 <212> DNA <213> Homo sapiens <400> 21 tctgcagagc ggctctccca cctgctggga ttctccagag gaatcctttt tcttccgtct 60 gagttcagca aacttcctgc ttcctctacc cagcgcagcg agcccctctc tgtactgatc 120 <210> 22 <211> 120 <212> DNA <213> Homo sapiens <400> 22 ctgccacctc agctttgcag cgcctggtgg gtaaactctt gtcccctctc cgtggctctg 60 gtcaaaggta ccttcatttg tgaggtcttc tcagaaccct caggcacagt taaattgatc 120 <210> 23 <211> 120 <212> DNA <213> Homo sapiens <400> 23 atcccaagcc tgtgggttca cctgctctaa gaaatcaata agtcaaggga aacatcaaag 60 ggcattacac atatgggctt tgacgccagg ccgaccaact tcaatccagg tctaaatgag 120 <210> 24 <211> 120 <212> DNA <213> Homo sapiens <400> 24 ggacaggtga ggcaggccag aaccggtgac tcatgggctc cccttggtca ggagggctgg 60 agcaggtaaa gcccgcccac agccggggaa cccacaccca gcacacgttc tctcctgatc 120 <210> 25 <211> 120 <212> DNA <213> Homo sapiens <400> 25 ggaatgaggt ggggcaggac ctgagagcaa agtgtgagct ggtgtgcaga accacccgga 60 ggtggaagga agctagaatc tagtgtaggg tgcctctgac acttgtccca cacatagatc 120 <210> 26 <211> 120 <212> DNA <213> Homo sapiens <400> 26 atcaactcct ttcggaccca caacctcttc tttttaaggc tgcttgaact atttattagt 60 ctgtaattag agtcccaagc gtttccttct gtttcctaaa gggttggaaa aatgccccga 120 <210> 27 <211> 120 <212> DNA <213> Homo sapiens <400> 27 atccatgttc cctatttaac atgctattcc tgtccccaga aaaatcctaa gacacataca 60 cgcgtgctct ctctctcacc tctcacattg cttaaataag agaccacaac atactgtgaa 120 <210> 28 <211> 120 <212> DNA <213> Homo sapiens <400> 28 catagggctt tgctcttgtc tccatccctg aaaaatcctt cctaagcact gtatggtata 60 aatattttag tatctgtcca tggattggct tgttgtcttt gttgagttgc acgcatgatc 120 <210> 29 <211> 120 <212> DNA <213> Homo sapiens <400> 29 atagagtcta gatagaagac cctcctctcc gagcccatcc ccctcagaag gctcgcagcc 60 ctctgaatcc tggtcgaagc tggacagcga aggaatacac agcctgccag tttggggatc 120 <210> 30 <211> 120 <212> DNA <213> Homo sapiens <400> 30 atctgcacag tcagaagata ctcaacagct gcgttttaat gaaggcacag taacccatgg 60 catggcaagt ggttgctaca tattttatgt gtatttttaa ataggaaaat accttcatag 120 <210> 31 <211> 120 <212> DNA <213> Homo sapiens <400> 31 tccttttaga catcagaggc ctgtgttcat caggaacctg atgctgaatc attggagggt 60 aaatgaacct tccaaggttc agtgtttaga atgttgtaga ccagcagtct catcatgatc 120 <210> 32 <211> 120 <212> DNA <213> Homo sapiens <400> 32 agcccgccct cctaggagaa gcctggccag gttccagtgg ggtggtggcc cggcccataa 60 acaggagggg tttatggccc agtgacaggc aaaactggtg gggcaagccc aggctagatc 120 <210> 33 <211> 120 <212> DNA <213> Homo sapiens <400> 33 atctggcagc tggacttctt gggctctgag aaggcaagag attagtatct gtgtgtgaca 60 ggagagggcg tggctggtgt ccacccatcc atgctgggag acgtgggaga gatggggcgg 120 <210> 34 <211> 120 <212> DNA <213> Homo sapiens <400> 34 aaaccagaag ggcactactg aatcagggta caggcagtgt ctgagactct ggttagccta 60 cagagtcatc aacgcacgtg tgctgtagac ttttttgttt ttgcaaatga gggtgagatc 120 <210> 35 <211> 120 <212> DNA <213> Homo sapiens <400> 35 catttcatga aaggagtctg atgcttgtaa actagctcaa attacctact ggatgaccag 60 agatgcaagg ctagagaaag aggagctcta ttgcatcagg agctgaggca ggagaggatc 120 <210> 36 <211> 120 <212> DNA <213> Homo sapiens <400> 36 atcaagaaca accccattca ctcctaatca aatgaccaac ctggcctttg gccttaatag 60 gaagtaaaag tgtctcttcc ggcattgtat cagtggtatg tgccgcacct accacacctg 120 <210> 37 <211> 120 <212> DNA <213> Homo sapiens <400> 37 gtgaggaaca aacttaattg ggtagaagtg tttcgcctca agcaacttgt aattactggc 60 atcgctgtag tcacaggaag aataacaaat gagaggttcc agaatccttc tggaaggatc 120 <210> 38 <211> 120 <212> DNA <213> Homo sapiens <400> 38 atctgcccat gcaaggtgtg tcttcacttc ctaaggaagt aatactgcag agaggaatgt 60 catgactact cctctcatat aattgcagta gaaagacacg agatgatgaa gaaaggaagg 120 <210> 39 <211> 120 <212> DNA <213> Homo sapiens <400> 39 gctgaaggca tccctcctgc tcactgctcc ttccacttta gatgaacagc tggaactcac 60 ataacacagc ctcttccgac aagatttcct ttagagagag aacattctag ggatgtgatc 120 <210> 40 <211> 120 <212> DNA <213> Homo sapiens <400> 40 actaggatga aaggcagcta aaaaagaaat atatggccag gccagtttac ctggagtaag 60 atacaagtag aataacagga gttgtaatta caaagcttgg tgggaaggct atgttagatc 120 <210> 41 <211> 120 <212> DNA <213> Homo sapiens <400> 41 atctccttga ccctgcagcc aatgcctcgg tcagccagtg cacctgtact gtctctcctc 60 ttgggatagg gtccctctcc atcaggtaca atatatggga aatcgagggg tggcctttgt 120 <210> 42 <211> 120 <212> DNA <213> Homo sapiens <400> 42 ggagggcagc tggcaggggc aggctctgaa agcacagctg tgtgaaggtc cggttcaata 60 tccgcttcag aagacacaca gccctttgtt gctcatgtct gttgctgtct aaagttgatc 120 <210> 43 <211> 120 <212> DNA <213> Homo sapiens <400> 43 atccctgagg gaatgagcca cggttcagca cccaaccccc acttgaactc tgcagtttcc 60 cagtttcatt aagaagccca ttgttgagtc tggccatgcg tcaaggacac gtggactctt 120 <210> 44 <211> 120 <212> DNA <213> Homo sapiens <400> 44 gaggcctcag cactccactg actcatcaac ccttctgtcc tttgatgggt aggatggggt 60 gaacgctaat gccagcagac ctggtttcat aatatcttag tgtgttctgc atgtgtgatc 120 <210> 45 <211> 120 <212> DNA <213> Homo sapiens <400> 45 atcctgtttg ttcttgctgg cactgcctgg cccggcttcc tgaggagtga atcagcccat 60 ccaaggcttg gcatgcagta gtgagccaag ggttgccatg gagatgggcg aggcccagag 120 <210> 46 <211> 120 <212> DNA <213> Homo sapiens <400> 46 agggcccgcg ggaacggcct ggcccaggcc cgcgcgccct gccctgtgtt cccgggaggc 60 gcggtctcct ggcggcaggg gagtcccggg agggcgcagg gcggcgcaga gcctgggatc 120 <210> 47 <211> 120 <212> DNA <213> Homo sapiens <400> 47 atcatttgca tagctcttag ttatttgagc aacacattca tttaattcca cagcaatgtg 60 gggaatgagg gactcttccc tgctttccag gtcagcaaca ggaaaaacaa atgatttgct 120 <210> 48 <211> 120 <212> DNA <213> Homo sapiens <400> 48 ggttgcctgg ggcaaccctg ggaaggtgag gccctggatt tcctggtctg gcctctgaga 60 acctcctagc accccagaac tcccagacag aatgttaggt aatgccaatg agcacagatc 120 <210> 49 <211> 120 <212> DNA <213> Homo sapiens <400> 49 atccaagtta tcaaaagtgg gtaacaaagc aacatcaaga aactgtgtcc ttaaaactaa 60 gagaatatac aagacattct aatccacatg gttcttaggg tgaaatctag cctctgggca 120 <210> 50 <211> 120 <212> DNA <213> Homo sapiens <400> 50 cttcctgtgt ttcaaccttc ttatctgaag acacacagtt atagtacagc attgtgaagt 60 taaatgaact atactgtggc tcatgataac aatcagtaag tgttagtcat tataatgatc 120 <210> 51 <211> 120 <212> DNA <213> Homo sapiens <400> 51 gctgcatgcc tggcagctag taggtactgc ataaatacaa gttcattggc tctccttgag 60 ttgtctggct ggggtcccag agactgaaac tttgctcttg gctgcagcag gggcaagatc 120 <210> 52 <211> 120 <212> DNA <213> Homo sapiens <400> 52 atctggtaac gttgggccct atttcagttg acaatgagag tcagggttga gttgtgactg 60 tcacctttaa agaaagtaca tagagtaggc taggcgacaa tgacaaaata tcagcaactt 120 <210> 53 <211> 120 <212> DNA <213> Homo sapiens <400> 53 ctctttagaa cgtctcttcc tcccgtggga ttggaaagaa catttgtcct cagcggcaaa 60 ggcagggctt catcaaagac gagtgactca gtgcttttcc tgctgtctgg ccacatgatc 120 <210> 54 <211> 120 <212> DNA <213> Homo sapiens <400> 54 atccccccaa caatcgtctt gtattttttt cagctcagtt tcctgagcct gccacaccga 60 gggccccaca gtcggaaacc acgtttggtt cgaagctctc ctgttctcat ctggaaattc 120 <210> 55 <211> 120 <212> DNA <213> Homo sapiens <400> 55 gaagataaaa atctattagc tgccaagagg attgctggga aaagccaagc cgtgattcat 60 agggtaataa atagaaagac agtcccggcc ccggggctgc atcttccttg catgctgatc 120 <210> 56 <211> 120 <212> DNA <213> Homo sapiens <400> 56 tattttccct tcagaaatag catccttaac tttctttttt ttttccttat taaaaatgta 60 ctcatgtaat ccacatgcac tggctgtgag aaattccaaa atgtcttttg gagagagatc 120 <210> 57 <211> 120 <212> DNA <213> Homo sapiens <400> 57 ttgtgaagtg ggatatgttt ttaaatttca gagaacagga agatgaattg tttttaatgg 60 atttttttta ataggcaaag ctgtgtatgc acaaatgctg gccagtgtag ggctatgatc 120 <210> 58 <211> 120 <212> DNA <213> Homo sapiens <400> 58 atctatttct cttatttttt tttaaatcta gtgtttcata atgtctaaaa gaaagtgttt 60 gcaagtcatt gtggtttttt tttttcatca aagtattcct tgtttcactc tctgtcgcat 120 <210> 59 <211> 120 <212> DNA <213> Homo sapiens <400> 59 atcctgtctc atcttggatg taattcctac agttagactt ctatcaaagg gtcattgtgc 60 caactggaat tctttccaat tcgagaaata agaatttgag gaatctctaa gggtagaaat 120 <210> 60 <211> 120 <212> DNA <213> Homo sapiens <400> 60 atctccttac ataaggagaa attttcagaa attaataaaa tgaagttcag ccttaaggaa 60 tgtgactaat acatctgaga taagtgactc aaacactaga agagggagat acttgcagtt 120 <210> 61 <211> 120 <212> DNA <213> Homo sapiens <400> 61 atcttgacaa acactagaga cccatcagcc agagtgaatt cccttagtga aatcactatt 60 ctctgccaag aatcaaaggt catcccagtg gagtgccgtc ttcgtgttca gcagctacgg 120 <210> 62 <211> 120 <212> DNA <213> Homo sapiens <400> 62 ctctgtgagt cagcgaaatg gattgaatta taaaccagaa accagcactt caatctgatg 60 aaactcatcc tatagaggaa agtgtcacta catgttggca gtttgtaaaa tgtgatgatc 120 <210> 63 <211> 120 <212> DNA <213> Homo sapiens <400> 63 atcagaactg gaactgagcg atagagcttc agagaaactt gttgtttaca ttggcaagaa 60 atcttatcca gcaagaggat taaaataaaa ccatgaccaa aacagtaaag ggtgtgaaga 120 <210> 64 <211> 120 <212> DNA <213> Homo sapiens <400> 64 atcctagtac atagaggtat ctggaaggtt attatgttat ctgaatcttg aatagaatca 60 gttacctgaa gccagtgtta ccttaggaat tccatatgtg tgattgaaga ttgcttatta 120 <210> 65 <211> 120 <212> DNA <213> Homo sapiens <400> 65 gccacagggc cccccaggta aaggactgac agccagccat gcaagcccct gggactgacc 60 cagatgcaga actgaccaat gtggcgacaa ccatcaccca accctgtggg gctgtagatc 120 <210> 66 <211> 120 <212> DNA <213> Homo sapiens <400> 66 tacacaagga ggactgggtt gcactcggtg cattttaaag aaagcccggc ggacacacgg 60 gttctcctgc tggtgctgcc agcctggaaa atgacagctg agactcaagc aggcaggatc 120 <210> 67 <211> 120 <212> DNA <213> Homo sapiens <400> 67 atccagtgac tatacctgga atttggcctc taagcgagtg tttctttttg cacttggact 60 tcttgagaga ttactcatta ctcaggagat aacaccaaag cattctcaaa accaatcttt 120 <210> 68 <211> 120 <212> DNA <213> Homo sapiens <400> 68 aatataggag aaaggtcaca gtggcttgga gatgaattcc aggacacagc actgcaggag 60 ggaccatgcc cctcgaggct tcttatatgt ggttcctcag ttcttggcta agttaggatc 120 <210> 69 <211> 120 <212> DNA <213> Homo sapiens <400> 69 tgtgggctgt taacaactac gcttggctca gtgccccaca ggtttctaaa gtccccccca 60 ggaggaaaca ccacttccac caaaggccct ggaagaaagc aatcactaag tgagctgatc 120 <210> 70 <211> 120 <212> DNA <213> Homo sapiens <400> 70 gctgtttgct catctgtttg taaagcctta gacccagcca gtcaccggcc ccacccaggt 60 gccagttgac gtgagtcatg cagtttctcc tgacactact gttacaaagt ctagcagatc 120 <210> 71 <211> 120 <212> DNA <213> Homo sapiens <400> 71 atcctccatt cccgagatga gaaaaatgtg actctgaggc agctgtggtc tctcctgggg 60 tggcttggct ggtgggtgac aggccagtat tttaaaccaa cccaggctcc agcctggggc 120 <210> 72 <211> 120 <212> DNA <213> Homo sapiens <400> 72 atctcaatac taacaaatgt ttatttacag gaaggctttg ttaattgagt gatggaagct 60 attgctctca cttgctattt agagactatt gacattacct ttatttcctg gtcctaaaca 120 <210> 73 <211> 120 <212> DNA <213> Homo sapiens <400> 73 atccctagaa gatttctgaa ttagctgaat gacaaacaca agatacttag atgacccatt 60 cgaaccagga agccttgcaa catcaagtaa ggagtcctca attaacagcc ttagaagaca 120 <210> 74 <211> 120 <212> DNA <213> Homo sapiens <400> 74 atcaaagaat actttttttc aggggggagg atgttggtat ttacttaact cactgatgga 60 gaaaaagaac gctcccactc tataaatgtt tagcatgtgt gtaaaggtcg taggtctggt 120 <210> 75 <211> 120 <212> DNA <213> Homo sapiens <400> 75 taggtttgag tccagagcat gacctttggg cttatcagac agtgaaggga tgggtcagaa 60 cttgtcacct gtgttcacgg gatgctgatt cactcagcaa ggatgaagtc ttttcagatc 120 <210> 76 <211> 120 <212> DNA <213> Homo sapiens <400> 76 atcaagaagg gagcacaaat tctctccctc cacatgggag ggtgctccgg tccaccgctg 60 cttgtgactg atgggacagt ctgtcttatt aggatacaag gacacactca gccacattct 120 <210> 77 <211> 120 <212> DNA <213> Homo sapiens <400> 77 atcaataatg cattagataa tggtgttctg aggcaggatt tcaatgaaag gctaagtgct 60 gtaactatgt aacaaaacac cagcacagga caaagagtag gtttctcaat caacaaggat 120 <210> 78 <211> 120 <212> DNA <213> Homo sapiens <400> 78 agtctttcca gtgcttcgga tgcatggtaa agttggagaa ccatggctgt aaagtatcag 60 tagtcgagga gcaggaagat atttccactg gttgtacatt ttagtttaga atgcttgatc 120 <210> 79 <211> 120 <212> DNA <213> Homo sapiens <400> 79 gtaatgattc ggagtgagac ccctaacacc tcccgaatgg gggcaagaag ctcaggactc 60 tggtagccca ggcagagtct gagtaactgg cgttgcctct cttcatgcat ctacctgatc 120 <210> 80 <211> 120 <212> DNA <213> Homo sapiens <400> 80 atcctgaaga agcagtgcca gctcctccca gacagcccgc cccagctggc ccgctggctc 60 cagcccagcc aggagcgagg gcagtggggg agccccacag gagggaacgg gggctcagga 120 <210> 81 <211> 120 <212> DNA <213> Homo sapiens <400> 81 atctccccca gcctgcaccc cacccagcaa ggacatgcaa gccaagcagt tcccacaccc 60 cgttcctggt ggctgccaga agcttcctta caaggcccca gcgctgagct ggctcagctg 120 <210> 82 <211> 120 <212> DNA <213> Homo sapiens <400> 82 atgtttgggc cccgggctga aggtgtgggt ggcagggaag gtggaggatt tgaggtgggg 60 aggctcactt cccgctccca gggctcgagg gcagggcaag ccagctggga ctgccagatc 120 <210> 83 <211> 120 <212> DNA <213> Homo sapiens <400> 83 atcgtgctag ttaaatgaat gaacatgtgg tggttacagg caaacccaca atgccacaca 60 ggacaccgac caacaactga aaacggtgac agctgccctt acccgcagct ccccagcgta 120 <210> 84 <211> 120 <212> DNA <213> Homo sapiens <400> 84 agctgagcga aactcttcct cctccacgag gcctctccca gcccttcagt tcatgacgcc 60 ttggtgagag aggtctgtat agcaacacgg ctgcactgaa gcttcctttg taggtcgatc 120 <210> 85 <211> 120 <212> DNA <213> Homo sapiens <400> 85 atccgtgcca gggggccact gagctctcat tcccagaagc caaccagagc cagtgaaggg 60 gccgcagaga ctccgacaca tcattttcat aaaaacagcc caaggagagc attgcattag 120 <210> 86 <211> 120 <212> DNA <213> Homo sapiens <400> 86 atcctgtaag tcaaagacac aacctgttcc aggaaggact ttgcaacagc aattactcta 60 acaagttaca attcgcagag tccggccttt aaggggcttt gaagagagag aaacccatga 120 <210> 87 <211> 120 <212> DNA <213> Homo sapiens <400> 87 atcatatcac atctgagtta ggccatatgc acccaggggg aatctcaaga gcaaactaat 60 ctaaactcca agaaatagac cactaagacc cacccaggta gtactcactg aacgctcttc 120 <210> 88 <211> 120 <212> DNA <213> Homo sapiens <400> 88 agattcactt aaatacatca tgaatgatag actggaatat ttttgaatca tattcaccaa 60 aacattagaa gtgaatcagt agtagtgtgg tctctgaagt caactttaaa agaattgatc 120 <210> 89 <211> 120 <212> DNA <213> Homo sapiens <400> 89 ccagagacac aaagcagttg atgctgttca tgttctgggg ttcactcgca agcacttgaa 60 gggaaacgac tggacagttc ctgtgaagac agggttttct tgagagtttc taggaagatc 120 <210> 90 <211> 120 <212> DNA <213> Homo sapiens <400> 90 gtccccacct tagctccatt ctcactccca gctgtcaact ctatgaggtc aaggtctcta 60 acacaactgg gtccctggcg gctcacagcc gtggctgctg gcacgggaaa gatgccgatc 120 <210> 91 <211> 120 <212> DNA <213> Homo sapiens <400> 91 tgatgctgtc tgactgaggt caaaaggatg ggtgtggaag gcatcacacc tttctcccat 60 ttagaaatcc attgtccctt ccttctccct tattgggtta cattcctctg tccatagatc 120 <210> 92 <211> 120 <212> DNA <213> Homo sapiens <400> 92 caacatcagc ctcagcctga actctgccag taaacttgta actttccaag gaaacttact 60 ctactgtaac agttcttttt catccggaga caaaatgtat ctgattcgca gtcaccgatc 120 <210> 93 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 93 gtctgcgcct caggaaaat 19 <210> 94 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 94 aaggctgttt cctgtcttgg 20 <210> 95 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 95 ccctaccact ttcccttttc 20 <210> 96 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 96 tatgcaaggg catcaattag g 21 <210> 97 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 97 cttgaggaac acagaagggc 20 <210> 98 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 98 cagcactctg caaacagact 20 <210> 99 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 99 aaagtctctg ccatctccca g 21 <210> 100 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 100 aaatcaaagc tcagaggact gg 22 <210> 101 <211> 91 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 101 aatgatacgg cgaccaccga gatctacacc tctctattcg tcggcagcgt cagatgtgta 60 taagagacag ttgtccatcc ccatatcttg g 91 <210> 102 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 102 caagcagaag acggcatacg agataggagt ccgtctcgtg ggctcggaga tgtgtataag 60 agacagaggc tgtttcctgt cttggg 86 <210> 103 <211> 95 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 103 aatgatacgg cgaccaccga gatctacacc tctctattcg tcggcagcgt cagatgtgta 60 taagagacag gtcaactgaa tcaagacata aattc 95 <210> 104 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 104 caagcagaag acggcatacg agatcatgcc tagtctcgtg ggctcggaga tgtgtataag 60 agacagggga gtccttcagt gtaacc 86 <210> 105 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 105 aatgatacgg cgaccaccga gatctacacc tctctattcg tcggcagcgt cagatgtgta 60 taagagacag ccccacttcc catttcccaa 90 <210> 106 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 106 caagcagaag acggcatacg agatgtagag aggtctcgtg ggctcggaga tgtgtataag 60 agacagacct aacaaagcgc tcagct 86 <210> 107 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 107 aatgatacgg cgaccaccga gatctacacc tctctattcg tcggcagcgt cagatgtgta 60 taagagacag gttgctttgg ctaactattt gga 93 <210> 108 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 108 caagcagaag acggcatacg agatcctctc tggtctcgtg ggctcggaga tgtgtataag 60 agacagtaat agccttggtc cccagg 86 <210> 109 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 109 caccgcccca tgtccccata caggc 25 <210> 110 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 110 aaacgcctgt atggggacat ggggc 25 <210> 111 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 111 caccggcaca ccaggcagga ttcc 24 <210> 112 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 112 aaacggaatc ctgcctggtg tgcc 24 <210> 113 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 113 caccgcggga ctcagacctt agtca 25 <210> 114 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 114 aaactgacta aggtctgagt cccgc 25 <210> 115 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 115 caccgaggat ttcttaagcc caga 24 <210> 116 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 116 aaactctggg cttaagaaat cctc 24 <210> 117 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 117 caccgtgagg gaggataggc gggcc 25 <210> 118 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 118 aaacggcccg cctatcctcc ctcac 25 <210> 119 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 119 caccgcacct agaggcctgc tttag 25 <210> 120 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 120 aaacctaaag caggcctcta ggtgc 25 <210> 121 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 121 caccgaagag aactccaccg ggtg 24 <210> 122 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 122 aaaccacccg gtggagttct cttc 24 <210> 123 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 123 caccgcagac atgacctagg ttccc 25 <210> 124 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 124 aaacgggaac ctaggtcatg tctgc 25 <210> 125 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 125 gccttccctt cctgatgtc 19 <210> 126 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 126 taatggcaag actggtatcc ac 22 <210> 127 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 127 cttgtggtac tgttcccaga c 21 <210> 128 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 128 cagcctggga agcatattga 20 <210> 129 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 129 ctgggttccc acctgataat 20 <210> 130 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 130 gatgaaatcc aagtcattgt gtcc 24 <210> 131 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 131 cttctgggtt caagtgagtc t 21 <210> 132 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 132 catgagcaaa ggtcctccta c 21 <210> 133 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 133 cagtaggtac acctggcaat ag 22 <210> 134 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 134 atcctgcttc ctcttggaat atc 23 <210> 135 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 135 ccagcttctt tcctctcctt atc 23 <210> 136 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 136 ggtgaaatcc catctccact aaa 23 <210> 137 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 137 atccagacac acctgtagga 20 <210> 138 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 138 cagaacaaag tccagagaga gg 22 <210> 139 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 139 cctgcctctc ttctgctttc 20 <210> 140 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 140 gttcatgccc tgccttatct 20 <210> 141 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA <400> 141 cgggactcag accttagtca tgg 23 <210> 142 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA <400> 142 gaggatttct taagcccaga agg 23 <210> 143 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 143 gtgcggaaga accacatgta ctc 23 <210> 144 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 144 cggaagcatt tcttgagcct g 21 <210> 145 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 145 ctgcaggctc aagaaatgct t 21 <210> 146 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 146 tcattctgga cggcttcctt 20 <210> 147 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 147 tgtcccgaca gatcacctc 19 <210> 148 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 148 cactcaacga gaaccagcag 20 <210> 149 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 149 gcagccaagt gaaaaccagg 20 <210> 150 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 150 cctccggatg gtgatgtagc 20 <210> 151 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 151 agtcgctaca tcaccatccg 20 <210> 152 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 152 ttcctctcct ttgctctgcg 20 <210> 153 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 153 ccagggctgc ttttaactc 19 <210> 154 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 154 gctcccccct gcaaatga 18 <210> 155 <211> 2001 <212> DNA <213> Homo sapiens <400> 155 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 156 <211> 2001 <212> DNA <213> Homo sapiens <400> 156 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 157 <211> 2001 <212> DNA <213> Homo sapiens <400> 157 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 158 <211> 2001 <212> DNA <213> Homo sapiens <400> 158 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 159 <211> 2001 <212> DNA <213> Homo sapiens <400> 159 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 160 <211> 2001 <212> DNA <213> Homo sapiens <400> 160 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 161 <211> 2001 <212> DNA <213> Homo sapiens <400> 161 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 162 <211> 2001 <212> DNA <213> Homo sapiens <400> 162 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 163 <211> 2001 <212> DNA <213> Homo sapiens <400> 163 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 164 <211> 2001 <212> DNA <213> Homo sapiens <400> 164 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 165 <211> 2001 <212> DNA <213> Homo sapiens <400> 165 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 166 <211> 2001 <212> DNA <213> Homo sapiens <400> 166 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 167 <211> 2001 <212> DNA <213> Homo sapiens <400> 167 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 168 <211> 2001 <212> DNA <213> Homo sapiens <400> 168 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 169 <211> 2001 <212> DNA <213> Homo sapiens <400> 169 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001 <210> 170 <211> 2001 <212> DNA <213> Homo sapiens <400> 170 gctacaggaa ggactgactg tgagttctct gccagcctgc tgagatggca aagaatggga 60 atgaaattga ctgaaagaaa ataaacatgg atgcttgttg cacggatgtg ggtgaggaga 120 gccagcctgt atggggacat ggggatggag actgatgctg ggggggtagt gacaccaact 180 gggtggcagc tggcaggccc ctgggcatcc acactccccc tgctcagttg gagagaagca 240 agaaagcata aagggaggga gggagggagg aaaagaggtg ggagatgagt gctgtgggtg 300 agcgctgaag cacacttcaa aagctcaagc cacaatgctt acgccctgat ataaaaagag 360 cattgagttg agcgtggtgg cttacgcctg taatcccagc actttgggag gctaaggcgg 420 gtggatcact tgaggtcagg attttgagac cagcctggcc aacatggcga aaccctgtct 480 ctactaaaaa tacaaaaatt agccgggcat ggtggcgggc gtctgtagtc ccagctactc 540 tggaggctga ggcaggagga tcgcttgaac ctgggaggtg gagcttgcag tgagtggaga 600 tcgcgccatt gcactccagg ctgggtgaca gagtaagact ctgcctcaaa aaaaaaaaaa 660 aaaaattgaa aaattacaaa gctcaaacct aatcaccagt gtggctgctc ctggccccac 720 cctgcctcct gctccccagg ggaggggaca ggtcagagag gggtgtgccc ttccaggggc 780 ctgagatgat ccagacatgg gagctggcag ggaatgaggg ctccggcagg gctgggtcag 840 taggtacacc tggcaatagg gcaaagatct ggcagctgga cttcttgggc tctgagaagg 900 caagagatta gtatctgtgt gtgacaggag agggcgtggc tggtgtccac ccatccatgc 960 tgggagacgt gggagagatg gggcggggac acagggcagg agagaggcca ggcctggggc 1020 ctctgtgccg ggagggataa tacgatctct gagtcacccc gaaatggggt gagatggtgc 1080 tgatgatccc ggattccttg gttttgtccc tggctctgtc actgctgact catgggctgc 1140 cgacctagga gtctcctggt cagcgtgcgg gtttctctca gcctcttggt gtgtcacaga 1200 agcagacagc ttctctgtaa accgtcatcc tcaggggtgt gcccggcttc tgggttctgt 1260 gttctggcat cctccgatat tccaagagga agcaggatag gacgatccca gctccttgct 1320 ctgcctactg gtgacaagac ctgtcctggc ctgggaccag gggggcttct ctgggagtcc 1380 tggttggtcc tgagacaggg acaccctccc agtgaagccc tacctcctct gtcctccatc 1440 acccagccca cagcaaggcc accctcctga ctctccctcc aattaaccca agctcctggg 1500 ttgcgccctt gaggcccaca ccgatgctcc caacttactt tccagcccta ttccctcacc 1560 tgtctggctt ccgactcctc aagttgagtt ttccacagat acttcctccc cacacacaca 1620 cccgtttttg tccctgctac tctccttttg cgagagctct ctcctcttca taggtctcta 1680 agcttttact cacccttcag gtctcctctc cacctgccac ctcctccagg aatcctgcct 1740 ggtgtgcccc aggtagagtt gatttttcac tctccagtgc tcacacagag cttgttttcc 1800 ctgcgtggga gctgtttatt taaattcagg ctggcctgat tacaccctga tgagctccat 1860 gccagccctg ggcctggccc agtgcgctca gcatgtcctt ccagaaagaa tgaaggaata 1920 aaaaaagacg aagagtaata aataggagag taggggtaga ggatgagccc cagaatcaga 1980 cattaggcag ggtgtggata c 2001

Claims (34)

  1. 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서(super-enhancer)의 존재 또는 부재를 결정하는 방법으로서,
    a) 대상체로부터 수득된 암성 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체와 접촉시키는 단계;
    b) 상기 암성 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역을 포함하는, 단계;
    c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호 강도에 기초하는 주석이 달린 게놈 서열을 사용하여 매핑(mapping)하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
    d) 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
    e) 비암성 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호 강도에 대해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계; 및
    f) 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 암성 및 비암성 생물학적 샘플이 단일 세포, 다중 세포, 세포의 단편, 체액 또는 조직을 포함하는, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 암성 및 비암성 생물학적 샘플이 동일한 대상체로부터 수득되는, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 암성 및 비암성 생물학적 샘플이 각각 다른 대상체로부터 수득되는, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 핵산이 크로마틴의 면역침전에 의해 상기 암성 생물학적 샘플로부터 단리되는, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 적어도 하나의 슈퍼-인핸서의 신호 강도가 히스톤 변형 H3K27ac의 백만 당 전사체 1킬로베이스 당 판독치(RPKM) 값에 기초하는, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 적어도 하나의 참조 핵산 서열이 적어도 하나의 암 세포주로부터 수득되는, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 암성 생물학적 샘플 중 상기 적어도 하나의 슈퍼-인핸서가 ROSE (슈퍼 인핸서의 순위) 알고리즘을 사용하여 동정되는, 방법.
  9. 제8항에 있어서, 상기 암성 생물학적 샘플 중 상기 적어도 하나의 슈퍼-인핸서가 상기 적어도 하나의 참조 핵산 서열 중 적어도 하나의 인핸서와 중첩되는 적어도 하나의 핵산 염기 쌍을 포함하는, 방법.
  10. 제6항에 있어서, 상기 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계가 상기 암성 생물학적 샘플 중 적어도 하나의 슈퍼-인핸서의 RKPM 값이
    i) 상기 비암성 생물학적 샘플로부터 수득된 적어도 하나의 슈퍼-인핸서의 RPKM 값에 비해 2배 초과 변화된 RPKM 값이고;
    ii) 상기 비암성 생물학적 샘플로부터 수득된 적어도 하나의 슈퍼-인핸서의 RPKM 값에 비해 0.5 RPKM 초과의 절대 차이임을 결정하는 단계를 포함하는, 방법.
  11. 제10항에 있어서, 상기 비암성 생물학적 샘플의 RPKM 값에 비해 상기 암성 생물학적 샘플의 RPKM 값의 증가가 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서의 존재의 지표인, 방법.
  12. 제10항에 있어서, 상기 비암성 생물학적 샘플의 RPKM 값에 비해 상기 암성 생물학적 샘플의 RPKM 값의 감소가 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서의 부재의 지표인, 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 적어도 하나의 슈퍼-인핸서가 유전자 전사 개시 부위에 대해 1000kb 내에 위치되는, 방법.
  14. 제13항에 있어서, 상기 유전자가 하나 이상의 암 관련 유전자, 혈관 신생 유전자, 세포 증식 유전자, 세포 침입 유전자, 게놈 불안정성과 관련된 유전자, 세포사 내성 유전자, 세포 에너지론 유전자, 세포 주기 유전자 또는 종양 촉진 유전자인, 방법.
  15. 제13항에 있어서, 상기 유전자가 CLDN4, ABHD11, WBSCR28, ATAD2, KLH38, WDYHV1, CDH17, CCAT1, CLDN1, SMURF1, GDPD5, ADAMTS12, ASCL2, ASPM, ATP11A, AURKA, CAMK2N1, CBX2, CCNE1, CD9, CDC25B, CDCA7, CDK1, CXCL1, E2F7, ECT2, LAMC2, NID2, PMEPA1, RARRES1, RFC3, SLC39A10, TFAP2A, TMEM158, LINC00299 및 이의 조합으로 이루어진 그룹으로부터 선택되는, 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 암성 생물학적 샘플이 위암인, 방법.
  17. 대상체에서 적어도 하나의 암 관련 슈퍼-인핸서의 존재를 결정하는 방법으로서,
    a) 상기 대상체로부터 수득된 암성 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체와 접촉시키는 단계;
    b) 상기 암성 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역을 포함하는, 단계;
    c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호 강도에 기초하는 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
    d) 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
    e) 비암성 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호 강도에 대해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계; 및
    f) 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 대상체에서 적어도 하나의 암 관련 슈퍼-인핸서의 존재를 결정하는 단계를 포함하고,
    상기 비암성 생물학적 샘플에 비해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 증가된 신호 강도가 적어도 하나의 암 관련 슈퍼-인핸서의 존재의 지표인, 방법.
  18. 대상체에서 암을 검출하기 위한 바이오마커(biomarker)로서, 상기 바이오마커가 정상적 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 H3K27ac의 증가된 신호 강도를 갖는 적어도 하나의 슈퍼-인핸서 또는 변경되지 않은 슈퍼-인핸서에 비해 암 관련 전사 인자 결합 부위에서 증가와 관련된 적어도 하나의 슈퍼-인핸서 또는 둘 다를 포함하는, 바이오마커.
  19. 제18항에 있어서, 상기 암 관련 전사 인자 결합 부위가 위암 관련 전사 인자 결합 부위인, 바이오마커.
  20. 제19항에 있어서, 상기 위암 관련 전사 인자가 CDX2, KLF5 및 HNF4α로 이루어진 그룹으로부터 선택되는, 바이오마커.
  21. 대상체에서 암의 예후를 결정하는 방법으로서,
    a) 상기 대상체로부터 수득된 암성 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체와 접촉시키는 단계;
    b) 상기 암성 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역을 포함하는, 단계;
    c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호에 기초하여 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
    d) 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
    e) 비암성 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호 강도에 대해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계; 및
    f) 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 대상체에서 적어도 하나의 암 관련 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계를 포함하고,
    상기 적어도 하나의 암 관련 슈퍼-인핸서의 존재 또는 부재가 상기 대상체에서 암 예후의 지표인, 방법.
  22. 제21항에 있어서, 상기 암성 생물학적 샘플 중 상기 적어도 하나의 암 관련 슈퍼-인핸서의 존재가 대상체에서 암 생존의 불량한 예후의 지표인, 방법.
  23. 제21항에 있어서, 상기 암성 생물학적 샘플 중 상기 적어도 하나의 암 관련 슈퍼-인핸서의 부재가 대상체에서 암 생존의 향상된 예후의 지표인, 방법.
  24. 제21항에 있어서, 상기 적어도 하나의 암 관련 슈퍼-인핸서가 하나 이상의 세포 칩입 유전자, 혈관 신생 유전자 또는 세포사 내성 유전자, 암 관련 유전자, 세포 증식 유전자, 게놈 불안정성과 관련된 유전자, 세포 에너지론 유전자, 세포 주기 유전자 또는 종양 촉진 유전자와 관련되는, 방법.
  25. 제21항에 있어서, 상기 적어도 하나의 암 관련 슈퍼-인핸서가 CLDN4, ABHD11, WBSCR28, ATAD2, KLH38, WDYHV1, CDH17, CCAT1, CLDN1, SMURF1, GDPD5, ADAMTS12, ASCL2, ASPM, ATP11A, AURKA, CAMK2N1, CBX2, CCNE1, CD9, CDC25B, CDCA7, CDK1, CXCL1, E2F7, ECT2, LAMC2, NID2, PMEPA1, RARRES1, RFC3, SLC39A10, TFAP2A, TMEM158, LINC00299 및 이의 조합으로 이루어진 그룹으로부터 선택된 유전자와 관련되는, 방법.
  26. 암 또는 위장 질환에 대한 대상체의 민감성을 결정하는 방법으로서,
    a) 상기 대상체로부터 수득된 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체와 접촉시키는 단계;
    b) 상기 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역을 포함하는, 단계;
    c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호 강도에 기초하는 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
    d) 상기 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
    e) 대조군 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호에 대해 상기 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계;
    f) 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 상기 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 결정하는 단계; 및
    g) 암 또는 위장 질환 관련 SNP를 포함하는 참조 게놈 서열에 대해 상기 적어도 하나의 슈퍼-인핸서의 존재 또는 부재를 매핑하는 단계를 포함하고,
    하나 이상의 암 또는 위장 질환 관련 SNP와 관련된 상기 적어도 하나의 슈퍼-인핸서의 존재 또는 부재가 상기 대상체의 암 또는 위장 질환에 대한 민감성의 지표인, 방법.
  27. 세포에서 적어도 하나의 암 관련 슈퍼-인핸서의 활성을 조절하는 방법으로서, CDX2 및/또는 HNF4α의 억제제를 세포에 투여하는 단계를 포함하는, 방법.
  28. 제27항에 있어서, 상기 CDX2 및/또는 HNF4α의 억제제가 siRNA인, 방법.
  29. 제27항에 있어서, 상기 억제제가 메트포르민인, 방법.
  30. 대상체에서 암을 검출하는데 사용하기 위한, 정상적 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 H3K27ac의 증가된 신호 강도를 갖는 적어도 하나의 슈퍼-인핸서, 또는 변경되지 않은 슈퍼-인핸서에 비해 암 관련 전사 인자 결합 부위의 증가와 관련된 적어도 하나의 슈퍼-인핸서, 또는 둘 다를 포함하는 바이오마커.
  31. 대상체에서 암을 검출하기 위한 약제를 제조하는데 있어서, 정상적 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 H3K27ac의 증가된 신호 강도를 갖는 적어도 하나의 슈퍼-인핸서, 또는 변경되지 않은 슈퍼-인핸서에 비해 암 관련 전사 인자 결합 부위의 증가와 관련된 적어도 하나의 슈퍼-인핸서, 또는 둘 다를 포함하는 바이오마커의 용도.
  32. 세포에서 적어도 하나의 암 관련 슈퍼-인핸서의 활성을 조절하는데 사용하기 위한 CDX2 및/또는 HNF4α의 억제제.
  33. 세포에서 적어도 하나의 암 관련 슈퍼-인핸서의 활성을 조절하기 위한 약제를 제조하는데 있어서 CDX2 및/또는 HNF4α의 억제제의 용도.
  34. 대상체로부터 수득된 암성 샘플학적 샘플에서 암 세포 생존 또는 암 세포 생존능을 예측하는 방법으로서,
    a) 상기 암성 생물학적 샘플을 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 항체와 접촉시키는 단계;
    b) 상기 암성 생물학적 샘플로부터 핵산을 단리시키는 단계로서, 상기 단리된 핵산이 히스톤 변형 H3K27ac에 특이적인 적어도 하나의 영역을 포함하는, 단계;
    c) 적어도 하나의 인핸서를 히스톤 변형 H3K27ac의 신호 강도에 기초하는 주석이 달린 게놈 서열을 사용하여 매핑하는 단계로서, 상기 적어도 하나의 인핸서가 주석이 달린 전사 개시 부위로부터 적어도 2.5kb에 있는, 단계;
    d) 상기 암성 생물학적 샘플에서 적어도 하나의 슈퍼-인핸서를 동정하기 위해 적어도 하나의 참조 핵산 서열에서 적어도 하나의 인핸서에 대해 단리된 핵산에서 상기 적어도 하나의 인핸서를 매핑하는 단계;
    e) 비암성 생물학적 샘플로부터 수득된 상기 적어도 하나의 슈퍼-인핸서의 참조 신호 강도에 대해 상기 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 신호 강도를 비교하는 단계; 및
    f) 상기 적어도 하나의 슈퍼-인핸서의 신호 강도의 변화에 기초하여 대상체에서 적어도 하나의 암 관련 슈퍼-인핸서의 존재를 결정하는 단계를 포함하고,
    상기 비암성 생물학적 샘플에 비해 암성 생물학적 샘플에서 상기 적어도 하나의 슈퍼-인핸서의 증가된 신호 강도가 암 세포 생존 또는 암 세포 생존능의 지표인, 방법.
KR1020187026079A 2016-02-16 2017-02-16 암 후생유전적 프로파일링 KR20180108820A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
SG10201601141X 2016-02-16
SG10201601141X 2016-02-16
SG10201606828P 2016-08-16
SG10201606828P 2016-08-16
PCT/SG2017/050073 WO2017142485A1 (en) 2016-02-16 2017-02-16 Cancer epigenetic profiling

Publications (1)

Publication Number Publication Date
KR20180108820A true KR20180108820A (ko) 2018-10-04

Family

ID=59625365

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187026079A KR20180108820A (ko) 2016-02-16 2017-02-16 암 후생유전적 프로파일링

Country Status (7)

Country Link
US (1) US20210223249A1 (ko)
EP (1) EP3417076B1 (ko)
JP (2) JP7189020B2 (ko)
KR (1) KR20180108820A (ko)
CN (1) CN109072312A (ko)
SG (2) SG11201806945SA (ko)
WO (1) WO2017142485A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108085395A (zh) * 2018-02-24 2018-05-29 韩林志 基于高通量测序的宫颈癌多基因甲基化检测的引物组、试剂盒及方法
CN109735539B (zh) * 2019-01-22 2022-06-03 南通大学 一种基于pdl1/pdl2超增强子的调控pdl1和pdl2表达的控方法
CN112111576A (zh) * 2020-09-29 2020-12-22 杨帆 用于筛查鼻咽癌的方法及应用
CN114164210B (zh) * 2021-08-19 2023-10-10 上海海洋大学 一种调控原癌基因myb的长链非编码rna及其应用
CN114525249A (zh) * 2022-03-31 2022-05-24 广西大学 一种用于分离牛肌肉干细胞的肌肉组织提取方法及其应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120220664A1 (en) * 2009-08-25 2012-08-30 President And Fellows Of Harvard College Use of metformin in cancer treatment and prevention
US20140287932A1 (en) * 2012-10-25 2014-09-25 Whitehead Institute For Biomedical Research Super-enhancers and methods of use thereof
CN106103739B (zh) * 2013-12-30 2019-12-06 新加坡科技研究局 用于测量胃肠癌中的生物标记物的方法
US20190005191A1 (en) * 2015-07-14 2019-01-03 Whitehead Institute For Biomedical Research Chromosome neighborhood structures and methods relating thereto

Also Published As

Publication number Publication date
EP3417076A4 (en) 2019-10-23
US20210223249A1 (en) 2021-07-22
EP3417076B1 (en) 2022-11-09
SG11201806945SA (en) 2018-09-27
JP2019514344A (ja) 2019-06-06
WO2017142485A1 (en) 2017-08-24
JP7189020B2 (ja) 2022-12-13
SG10202007867PA (en) 2020-09-29
EP3417076A1 (en) 2018-12-26
JP2023029945A (ja) 2023-03-07
CN109072312A (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
Okholm et al. Circular RNA expression is abundant and correlated to aggressiveness in early-stage bladder cancer
Ooi et al. Epigenomic profiling of primary gastric adenocarcinoma reveals super-enhancer heterogeneity
Solyom et al. Extensive somatic L1 retrotransposition in colorectal tumors
Coppedè et al. Genetic and epigenetic biomarkers for diagnosis, prognosis and treatment of colorectal cancer
Pinto et al. Genomic landscape of paediatric adrenocortical tumours
JP6203209B2 (ja) 早期結腸直腸癌の検出のための血漿マイクロrna
Dong et al. MicroRNA dysregulation in colorectal cancer: a clinical perspective
KR20180108820A (ko) 암 후생유전적 프로파일링
US20190249257A1 (en) Long intergenic non-coding rna as pancancer biomarker
Anauate et al. Analysis of 8q24. 21 miRNA cluster expression and copy number variation in gastric cancer
WO2014152950A1 (en) Methods and compositions for correlating genetic markers with risk of aggressive prostate cancer
Teles Alves et al. Next-generation sequencing reveals novel rare fusion events with functional implication in prostate cancer
KR20110015013A (ko) 결장직장암의 평가 방법 및 여기에 사용하기 위한 조성물
WO2015148919A2 (en) Circulating micrornas as biomarkers for endometriosis
WO2012131092A2 (en) Method and kits for the prediction of response/nonresponse to the treatment with an anti-egfr antibody in patients with colorectal cancer of all uicc stages
WO2014173905A2 (en) Methods and kits for prognosis of stage i nsclc by determining the methylation pattern of cpg dinucleotides
Leeman-Neill et al. Noncoding mutations cause super-enhancer retargeting resulting in protein synthesis dysregulation during B cell lymphoma progression
Bersani et al. Exploring circular MET RNA as a potential biomarker in tumors exhibiting high MET activity
Masson et al. Copy number variants associated with 18p11. 32, DCC and the promoter 1B region of APC in colorectal polyposis patients
CN114875144A (zh) 用于评估肿瘤ibc疗法的疗效的生物标志物、系统、方法及试剂盒
Ghanei et al. Inconsistency in the expression pattern of a five-lncRNA signature as a potential diagnostic biomarker for gastric cancer patients in bioinformatics and in vitro
US20230015571A1 (en) Method for diagnosing colorectal cancer by detecting intragenic methylation
Isidori Addressing tumor heterogeneity in esophageal adenocarcinoma through different molecular approaches
Strefford et al. The Genomic and Epigenomic Landscape of Chronic Lymphocytic Leukemia
Lung Identification of candidate genes predisposing to familial colorectal cancer by germline whole exome sequencing