KR102453393B1 - 유방암과 관련된 염색체 상호 작용의 검출 - Google Patents

유방암과 관련된 염색체 상호 작용의 검출 Download PDF

Info

Publication number
KR102453393B1
KR102453393B1 KR1020187032201A KR20187032201A KR102453393B1 KR 102453393 B1 KR102453393 B1 KR 102453393B1 KR 1020187032201 A KR1020187032201 A KR 1020187032201A KR 20187032201 A KR20187032201 A KR 20187032201A KR 102453393 B1 KR102453393 B1 KR 102453393B1
Authority
KR
South Korea
Prior art keywords
site
brca
yes
brcama
chromosomal
Prior art date
Application number
KR1020187032201A
Other languages
English (en)
Other versions
KR20190025814A (ko
Inventor
이완 헌터
하워드 워머슬레이
아라울 라마다스
알렉산드르 아쿠우리체브
Original Assignee
옥스포드 바이오다이나믹스 피엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 옥스포드 바이오다이나믹스 피엘씨 filed Critical 옥스포드 바이오다이나믹스 피엘씨
Publication of KR20190025814A publication Critical patent/KR20190025814A/ko
Application granted granted Critical
Publication of KR102453393B1 publication Critical patent/KR102453393B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/101Crosslinking agents, e.g. psoralen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/501Detection characterised by immobilisation to a surface being an array of oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medicinal Chemistry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicinal Preparation (AREA)

Abstract

본 발명은 유방암과 관련된 염색체 영역과 상호 작용을 분석하는 방법에 관한 것이다.

Description

유방암과 관련된 염색체 상호 작용의 검출
본 발명은 염색체 상호 작용의 검출에 관한 것이다.
암은 세포 성장 및 분열에 대한 조절의 손실로 인해 발생한다. 이는 돌연변이를 고칠 수 있는 세포가 없이, 세포의 DNA에 돌연변이가 발생하는 경우에 일어나며, 상기 돌연변이는 선천적 유전(germline) 또는 후천적으로 발생(acquired)될 수 있다. 암은 양성(benign) 및 악성(malignant)의 두 가지 유형이 있는데, 양성 암은 세포 분열의 조절을 손실하는 경우에 발생하지만, 종양이 신체의 다른 부분으로 퍼지지 않는다. 악성(또는 전이성(metastatic)) 암은 암세포가 혈류 또는 림프계를 통해 신체의 다른 부위로 이동하는 경우에 발생하며, 더 심각한 형태의 암이다. 유방암은 유방에서 시작하는 암의 명칭이며 전 세계에서 두 번째로 흔한 암이다. 2012년에는 1,410만 건의 새로운 암이 발생한 것으로 추산된다. 현재 유방조영상(mammogram)을 이용한 암 스크리닝은 임의의 유방 이상을 검사하는 최적 표준이며 덩어리(lump)가 검출되면 생체검사(biopsy)를 수행한다. 침습성 유암(invasive mammary carcinoma)의 조직학적 등급은 침습성 유방암 환자를 상이한 예후를 가진 다음의 세 그룹으로 구분하는 데 사용한다: 양호(good), 중간(intermediate), 및 불량(poor) 그룹.
유전자 좌위(loci)에서 구체적인 염색체 형태 시그니처(Specific Chromosome Conformation Signatures, CCSs)는 병리 또는 치료와 관련된 조절가능한 후생적 유전 제어 설정(regulatory epigenetic control setting)으로 인하여 존재하거나 결핍되어 있다. CCS는 마일드 오프-비율(mild off-rates)을 가지고 있고, 특정 표현형 또는 병리를 나타내는 경우, 새로운 표현형으로 생리학적 신호 전달 또는 외부 간섭(external intervention)으로 변할 것이다. 또한, 이러한 사건의 측정은 이진법(binary)이므로, 이 판독(read-out)은 DNA 메틸화(methylation), 히스톤 변형 및 대부분의 비-코딩 RNA(non-coding RNA)의 다양한 레벨의 연속체 판독(continuum readout)과 현저한 대조를 이룬다. 지금까지 대부분 분자 바이오마커에 사용된 연속체 판독은 특정 바이오 마커에 대한 변화의 정도(magnitude)가 환자마다 크게 다르다는 점에서 데이터 분석에 대한 도전을 제공하며, 이는 환자 집단(cohort)을 계층화하는 데 사용될 때 분류 통계(classification statistics)에 문제를 야기한다. 이 분류 통계는 정도가 없고 표현형 차이의 “예 또는 아니오” 이진법적 스코어(binary score)만큼 제공하는 바이오마커의 사용에 더 적합하다 - EpiSwitchTM 바이오마커는 잠재적 진단, 예후 및 예측 바이오마커를 위한 훌륭한 자원임을 의미한다.
본 발명자들은 인구 내에서 서브그룹을 식별할 수 있는 접근법을 사용하여 유방암과 관련된 염색체 상호작용이 있는 게놈의 부위를 확인하였다. 따라서, 본 발명은 염색체 상호 작용이 게놈의 특정의 질병-관련 부위 내에 존재하는지 또는 부존재하는지를 결정하는 단계를 포함하는 인구내에서 서브그룹을 나타내는 염색체 상태를 검출하는 방법을 제공하며, 상기 질병은 유방암이다. 염색체 상호 작용은 인구의 유방암 서브그룹에 상응하는 염색체 상태와 관련있는 염색체 상호 작용을 결정하는 방법에 의해 선택적으로 확인되거나, 식별가능할 수 있으며(또는 추론할 수 있으며), 염색체의 다른 상태를 갖는 서브그룹으로부터 제1 핵산 세트를 제2 인덱스 핵산 세트와 접촉시키는 단계, 및 상보적인 서열을 하이브리드화(hybridise) 시키는 단계를 포함하고, 상기 제1 핵산 세트 및 제2 핵산 세트에서의 핵산은 염색체 상호작용에서 함께 나타나는 염색체 부분들의 서열을 포함하는 연결된 생성물을 나타내고, 제1 핵산 세트와 제2 핵산 세트 사이의 하이브리드화 패턴은 어느 염색체 상호작용이 유방암 서브 그룹에 특이적인 것인지 결정할 수 있게 한다.
도 1은 BCa1 및 BCa2 어레이로부터 중요한 프로브의 비교값을 나타낸 것이다. 프로브는 p-value<0.05로 조정하였다.
도 2는 환자 세트가 마커 감소 세트(118, 세트 1) 및 모델 유효성 세트(50, 세트 2)로 구분되어 있음을 보여주는 벤 다이어그램이다. 다른 환자 세트는 사이트 2 쉽먼트 122(site 2 shipment 122)로부터 제외된 대조군을 나타낸다.
도 3은 GLMNET 모델의 교차 검증 플롯(cross validation plot)은 람다(로지스틱 모델(logistic model)의 분류 수치(penalized value)) 및 계수(coefficients)(최소 오차)를 선택하는데 사용된다. Y축은 평균-제곱 오류(mean-squared error)이다. X축은 로그(람다(lambda))이다.
도 4는 쉽먼트 122를 위한 이상치 품질(outlier quality) 대조군을 나타낸 것이다. 최종 BrCa 모델의 8개 마커를 사용하여 사이트 2의 대조군 샘플의 요인 분석(주성분 분석) 플롯을 나타낸 것이다. 삼각형(site2_b2)으로 표시된 환자는 쉽먼트 122(30 명)로 전체 분석에서 제외되었으며, 원(site_2)으로 표시된 환자는 사용된 쉽먼트 113(25 명)의 사이트 2 대조군이다. 이 플롯은 동일한 위치로부터 이들 대조군 내에, BrCa와 비교 맥락에서 생물학적으로 유사한 환자를 구별하는 큰 변이 요소(large variation component)가 있음을 보여준다. 이 변이가 최종 모델에서 BrCa와 대조군의 차이에 대해 경쟁하기 때문에 이는 우려의 대상이다. 따라서 사이트 2 배치 2 쉽먼트 122(site 2 batch 2 shipment 122) 샘플이 제거되었다. Y축은 Dim 2 16.79%이다. X축은 Dim 1 18.11%이다.
도 5는 최종 BrCa 모델의 8 개 마커를 사용하여 분석에 사용된 모든 대조군 샘플(69 개 대조군)에 대한 요인 분석(주성분 분석) 플롯을 나타낸 것이다. 환자에서 약간의 위치적인 변화가 있지만 이는 사이트 2 대조군(shipment 122) 의 이상치 그룹(outlier group)과의 차이보다 작다. 원형은 사이트 1(site 1)이다. 삼각형은 사이트 2(site 2)이다. 검정 사각형은 사이트 3(site 3)이다. 십자가형은 사이트 4(site 4)이다. 십자가 박스형은 사이트 5(site 5)이다. Y축은 Dim 2 11.57%이다. Y축은 Dim 1 15.47%이다.
도 6은 분석에 사용된 모든 대조군 샘플(69개 대조군) 및 최종 BrCa 모델의 8개 마커를 사용하여 사이트 2의 30개가 제외된 이상 그룹(십자가 원형으로 표시된 shipment 122)에 대한 요인 분석(주성분 분석) 플롯을 보여준다. 데이터의 확산은 주로 사이트 2 쉽먼트 122의 문제로 야기된 것이다. 검정 다이아몬드는 사이트 1이다. 검정 원형은 사이트 2이다. 검정 사각형은 사이트 3이다. 검정 삼각형은 사이트 4이다. 십자가는 사이트 5이다. 밝은 삼각형은 사이트 6이다. 십자가 원형은 사이트 2_b2(site 2_b2)이다. Y 축은 Dim 2 11.14%이다. X축은 Dim 1 12.36%이다.
도 7은 마커 ATM_11_108118137_108126372_108155279_108156687_RF에 대한 결과를 나타낸다. 첫 번째 도면은 ATM 프라이머 54 및 56, 472bp 두 개 분석을 나타낸다. 두 번째 도면은 표준 곡선을 나타낸다. FAM을 사용하였다. 효율성은 91.7%이고, R2 0.996이고, 기울기는 -3.539이고 y 절편(y-int)은 39.706이다.
도 8은 ATM_11_108118137_108126372_108155279_108156687_RF의 증폭 라인을 나타낸다. 첫 번째 도면은 ATM 프라이머 54 및 56, 472bp 두 개 분석의 증폭을 나타낸다. 두 번째 도면은 ATM 프라이머 54 및 56, 472bp 두 개 분석, 행 D를 사용한 증폭을 나타낸다.
도 9는 마커 CDC6_17_38421089_38423079_38451196_38457050_FF에 대한 결과를 나타낸다. 첫 번째 도면은 PCR 2 CDC6 FF로 증폭한 결과이다. 두 번째 도면은 표준 곡선을 나타낸다. FAM을 사용하였다. 효율성은 90.7%이고, R2은 0.990이고, 기울기는 -3.568이며, y 절편은 40.652이다.
도 10은 마커 FOXC1_6_1577253_1581989_1604206_1605973_FR에 대한 결과를 나타낸다. 첫 번째 도면은 ATM 208bp FOXC1으로 증폭한 결과이다. 두 번째 도면은 표준 곡선을 나타낸다. FAM을 사용하였다. 효율성은 101.6%이고, R2는 0.992이고, 기울기는 -3.284이고, y절편은 37.746이다.
도 11은 마커 FOXC1_6_1577253_1581989_1604206_1605973_FR에 대한 증폭 라인을 나타낸다. 첫 번째 도면은 ATM 208bp, 행 C를 사용한 증폭을 나타낸다. 두 번째 도면은 ATM 208bp, 행 D 사용한 증폭을 나타낸다.
도 12는 마커 MAP3K1_5_56102259_56110500_56140227_56144076_FF에 대한 결과를 나타낸다. 첫 번째 도면은 증폭 PCR 9 MAP3K1 세포 C1 - C6(RFU 대 사이클)을 나타낸다. 두 번째 도면은 C1에서 C6에 대한 융해 피크(melt peak)를 나타낸다. Y 축은 -d(RFU)/dt를 나타낸다. x 축은 섭씨 온도를 나타낸다.
도 13은 마커 MAP3K1_5_56102259_56110500_56140227_56144076_FF에 대한 결과를 나타낸다. 첫 번째 도면은 MAP3K1 495bp의 증폭을 나타낸다. 두 번째 도면은 표준곡선을 나타낸다. FAM을 사용하였다. 효율성은 91.9%이고, R2는 0.999이고, 기울기는 -3.533이고 Y 절편은 40.940이다.
도 14는 마커 ME3_11_86300063_86304401_86420537_86426200_FR에 대한 결과를 나타낸다. 첫 번째 도면은 ME3 PCR 12, A7-A12 (RFU 대 사이클)의 증폭을 나타낸다. 두 번째 도면은 융해 피크(melt peak)를 나타낸다. y축은 -d(RFU)/dt를 나타낸다. x 축은 섭씨 온도를 나타낸다.
도 15는 마커 ME3_11_86300063_86304401_86420537_86426200_FR에 대한 결과를 나타낸다. 첫 번째 도면은 ME3 291bp의 증폭을 나타낸다. 두 번째 도면은 표준 곡선을 나타낸다. FAM을 사용하였다. 효율성은 96.8%이고, R2은 0.998이고, 기울기는 -3.400이고 y절편은 39.596이다.
도 16은 마커MELK_9_36577630_36579243_36637050_36643005_RF에 대한 결과를 나타낸다. 첫 번째 도면은 MELK 207bp의 증폭을 나타낸다. 두 번째 도면은 표준곡선을 나타낸다. FAM을 사용하였다. 효율성은 91.3%이고, R2는 0.995이고, 기울기는 -3.550이고, y 절편은 42.000이다.
도 17은 마커 MSH3_5_80021913_80025030_80153948_80159012_RF에 대한 결과를 나타낸다. 첫 번째 도면은 MSH3 207bp의 증폭을 나타낸다. 두 번째 도면은 표준 곡선을 나타낸다. FAM을 사용하였다. 효율성은 97.1%이고, R2는 0.990이고, 기울기는 -3.394이고, y 절편은 41.876이다.
도 18은 마커 NF1_17_29477103_29483764_29651799_29657368_FF에 대한 결과를 나타낸다. 첫 번째 도면은 NF1 401bp의 증폭을 나타낸다. 두 번째 도면은 표준곡선을 나타낸다. FAM을 사용하였다. 효율성은 99.0%이고, R2는 0.987이고, 기울기는 -3.347이고, y 축은 40.192이다.
도 19는 마커 SRD5A1_5_6634973_6639025_6667775_6669711_RF에 대한 결과를 나타낸다. 표준 곡선만 환자 데이터 없이 표시된다. 첫 번째 도면은 SRDA51에 대한 증폭을 나타낸다. 두 번째 도면은 표준곡선을 나타낸다. FAM을 사용하였다. 효율성은 95.5%이고, R2는 0.997이고, 기울기는 -3.434이고, y절편은 39.761이다.
도 20은 마커 TSPYL5_8_98276431_98282736_98316421_98318720_FF에 대한 결과를 나타낸다. 표준 곡선만 환자 데이터 없이 표시된다. 첫 번째 도면은 TSPYL5의 증폭을 나타낸다. 두 번째 도면은 표준 곡선을 나타낸다. FAM을 사용하였다. 효율성은 94.2%이고, R2는 0.998이고, 기울기는 -3.469이고, y절편은 41.344이다.
도 21은 실시예 2의 마커 세트 2에 상응하는 데이터를 나타낸다. 루프 검출 데이터는 마커가 암 질병 샘플 또는 대조군 샘플과 관련되어 있는지 여부를 나타낸다.
도 22는 실시예 3의 마커 세트 3에 상응하는 데이터를 나타낸다. 루프 검출 데이터는 마커가 악성 질병 샘플 또는 대조군 샘플과 관련되어 있는지 여부를 나타낸다. 표시된 통계는 중첩된 PCR 작업에 대한 것이다.
증폭 곡선을 나타내는 모든 도면에서 Y축은 RFU이고, X축은 사이클(cycle)이며, 웰의 행 C에서는 환자 샘플에 대한 증폭 라인은 X로 표시되고, 행 D에서는 환자 증폭 곡선이 삼각형(△)으로 지정하였다.
표준 곡선을 나타내는 모든 면에서 Y축은 Cq이고, X축은 로그 개시 수량(log starting quantity)이며, 원은 표준이고, 십자가는 알려지지 않은 것이다.
발명의 방법
본 발명의 방법은 유방암과 관련된 염색체 상호 작용을 검출하기 위한 타이핑 시스템(typing system)을 포함한다. 이 타이핑은 염색체 상호 작용에서 함께 나타나는 염색체의 가교-결합한 부위(cross-linking regions)를 기반으로 하는 본원에 언급된 EpiSwitch™ 시스템을 사용하여 수행할 수 있으며, 염색체 DNA를 절단하여 가교-결합된 실체(cross-linked entity)에서 존재하는 핵산을 결찰시켜, 염색체 상호 작용을 형성하는 두 부위로부터의 서열을 갖는 결찰된 핵산(ligated nucleic acid)을 유도한다. 상기 결찰된 핵산의 검출은 특정 염색체 상호 작용의 존재 또는 부존재의 결정을 가능하게 한다.
상기 염색체 상호 작용은 제1 및 제2 핵산의 집단이 사용되는 상기 기재된 방법을 사용하여 확인할 수 있다. 또한 이러한 핵산은 EpiSwitch™ 기술을 사용하여 생성할 수도 있다.
발명과 관련된 후생적 상호 작용(Epigenetic Interactions)
본원에서, 용어 ‘후생적(epigenetic)’ 및 ‘염색체(chromosome)’상호 작용은 전형적으로 염색체의 말초 부위(distal region) 사이의 상호작용을 의미하며, 상기 상호 작용은 염색체 부위의 상태에 따라 역동적(dynamic), 변화(altering), 형성(forming), 또는 파괴(breaking)적인 상호작용이다.
본 발명의 특정 방법에서 염색체 상호작용은 상호 작용의 일부인 염색체의 두 부위로부터의 서열을 포함하는 결찰된 핵산을 먼저 생성함으로써 검출된다. 이러한 방법에서 상기 부위는 임의의 적절한 수단에 의해 가교-결합될 수 있다. 바람직한 실시양태에서, 상기 상호 작용은 포름알데히드(formaldehyde)를 사용하여 가교-결합되거나, 또는 임의의 알데하이드(aldehyde), D-바이오티노일-e-아미노카프론산-N-하이드록시숙신이미드 에스테르(D-Biotinoyl-e-aminocaproic acid-N-hydroxysuccinimide ester) 또는 디곡시제닌-3-0-메틸카르보닐-e-아미노카프론산-N-하이드록시숙신이미드 에스테르(Digoxigenin-3-O-methylcarbonyl-e-aminocaproic acid-N-hydroxysuccinimide ester)에 의해 가교-결합될 수 있다. 파라-포름알데히드(para-formaldehyde)는 4 옹스트롬(Angstroms) 떨어져 있는 DNA 사슬을 가교 결합시킬 수 있다.
상기 염색체 상호 작용은, 예를 들어, 생리학적 조건의 변화에 따라 전사되거나 억제되는 경우에 염색체의 부위의 상태를 반영할 수 있다. 본원에 정의된 서브그룹에 특이적인 염색체 상호 작용은 안정적인 것으로 밝혀졌으며, 따라서 두 개 서브그룹 사이의 차이를 측정하는 신뢰할 수 있는 수단을 제공한다.
또한, 특성(예를 들면, 질병 상태)에 특이적인 염색체 상호작용은 일반적으로 예를 들어, 메틸화(methylation) 또는 히스톤 단백질의 결합 변화와 같은 다른 후생학적 마커와 비교하여, 생물학적 프로세스 초기에 발생한다. 따라서, 본 발명의 방법은 생물학적 프로세스의 초기 단계를 검출할 수 있다. 이는 결과가 더 효과적일 수 있는 초기 개입(예를 들어, 치료)이 가능하다. 게다가, 동일한 서브그룹 내의 개체들 간의 관련 염색체 상호 작용에는 약간의 변화가 있다. 염색체 상호작용을 검출하는 것은 유전자 마다 최대 50개의 다른 상호작용이 가능한 것으로 매우 유익하고, 본 발명의 방법은 500,000개의 상이한 상호 작용을 조사할 수 있다.
바람직한 마커 세트(marker set)
특정 마커들이 본원에 기재되어 있으며, 이들 중 어떠한 마커들은 본 발명에서 사용될 수 있다. 예를 들어, 본원에 기재된 조합 또는 번호로, 마커의 추가적인 세트를 사용할 수 있다. 마커 세트 1, 2 및 3이 바람직하다. 이들은 임의의 적합한 방법, 예를 들어, qPCR 방법을 포함하여, 본원에 기재된 PCR 또는 프로브에 기초한 방법에 의해 타이핑될 수 있다. 상기 마커는 위치 또는 프로브 및/또는 프라이머 서열에 의해 본원에서 정의된다.
후생적 상호작용의 위치 및 원인
후생적 염색체 상호작용은 중첩될 수 있고, 관련되거나 기재되지 않은 유전자를 코딩하는 것으로 보이는 염색체의 부위를 포함할 수 있으나, 유전자 간 부위(intergenic region)에서 동일하게 나타날 수 있다. 본 발명자들은 모든 부위에서의 후생적 상호작용이 염색체 유전자 좌위의 상태를 결정하는데 동등하게 중요하다는 것을 발견하였다. 이러한 상호작용은 유전자 좌위에 위치한 특정 유전자의 코딩 부위에 있을 필요는 없으며 유전자 간 부위에 있을 수 있다.
본 발명에서 검출되는 염색체 상호작용은 환경적 요인, DNA 메틸화, 비-코딩 안티센스 RNA 전사체, 비-돌연변이 발암물질, 히스톤 변형, 염색질 재구성 및 특이적인 국소 DNA 상호 작용에 의한 근본적인 DNA 서열의 변화에 의해 야기될 수 있다. 염색체 상호 작용을 유도하는 변화는 그 자체가 유전자 생성물 또는 유전자 발현 양식에 직접적으로 영향을 미치지 않는 근본적인 핵산 서열의 변화에 의해 야기될 수 있다. 이러한 변화는 예를 들어, 내부 및/또는 외부 유전자의 SNP, 유전자간 DNA의 유전자 융합 및/또는 결손. 마이크로 RNA 및 비-코딩 RNA일 수 있다. 예를 들어, 약 20%의 SNP가 비-코딩 부위에 있다고 알려져 있으므로, 본원에 기재된 방법은 비-코딩 상황에서도 유용하다. 하나의 실시양태에서 상호 작용을 형성하기 위해 함께 모이는 염색체의 부분은 동일한 염색체 상에서 5kb, 3kb, 1kb, 500 염기쌍(base pair) 또는 200 염기쌍 미만이다.
바람직하게는, 상기 검출된 염색체 상호 작용은 표 9에 기재된 임의의 유전자 내에 있다. 상기 검출된 염색체 상호 작용은 마커 세트 1, 2, 또는 3에 대해 기재된 임의의 유전자 내에 있을 수 있다. 그러나, 유전자의 상류 또는 하류, 예를 들어 유전자 또는 코딩 서열로부터 50,000개 이하, 30,000개 이하, 20,000개 이하, 10,000개 이하 또는 5000개 이하 염기의 상류 또는 하류에 있을 수 있다.
서브그룹, 진단 및 맞춤 치료
본 발명의 목적은 유방암 서브그룹과 관련된 염색체 상호작용의 검출을 허용하는 것이다. 그러므로 상기 방법은 유방암의 진단을 위해 사용되거나 사용되지 않을 수 있다. 본 발명의 상기 방법은 악성 유방암의 진단에 사용될 수 있으며, 바람직하게는 마커 세트 3의 마커가 이런 실시양태에 사용된다.
본원에서 ‘서브그룹(subgroup)’은 바람직하게는 개체군 서브그룹(개체군에서 하나의 서브그룹), 보다 바람직하게는 특정 진핵생물 또는 포유동물(예를 들어, 인간, 비-인간, 비-인간 영장류, 또는 마우스 또는 랫과 같은 설치류)과 같은 특정한 동물 개체군의 서브그룹을 의미한다. 가장 바람직하게는, ‘서브그룹’은 인간 개체군에서 서브 그룹을 의미한다.
본 발명은 개체군 내의 특정한 서브그룹을 검출 및 치료하는 것을 포함한다. 본 발명자들은 염색체 상호작용이 특정 개체군 내에서 서브세트(예를 들어 2개 또는 적어도 2개 이상의 서브세트)사이에서 상이하다는 것을 발견하였다. 이러한 차이를 확인함으로서 상기 기재된 방법에 따라 의사(physician)가 자신들의 환자를 개체군 내에서 하나의 서브세트의 한 부분으로 분류할 수 있다. 그러므로 본 발명은 의사가 환자들의 후생적 염색체 상호작용을 기반으로 하여 환자에게 약을 맞춤화하는 방법을 제공한다.
결찰된 핵산 생성
본 발명의 특정한 실시양태는 결찰된 핵산, 특히 결찰된 DNA를 사용한다. 이는 염색체 상호 작용에 함께 모이는 두 영역의 서열을 포함함으로서, 상호 작용에 대한 정보를 제공한다. 본원에 기재된 상기 EpSwitchTM 방법은 염색체 상호작용을 검출하기 위해, 결찰된 핵산의 생성을 이용한다.
따라서, 본 발명의 방법은 하기 단계(이들 단계를 포함하는 방법을 포함)에 의해 결찰된 핵산을 생성하는 단계를 포함할 수 있다:
(ⅰ) 바람직하게는 시험관내(in vitro)에서, 염색체 유전자 좌위(chromosomal locus)에 존재하는 후생적 염색체 상호작용의 가교-결합하는 단계;
(ⅱ) 선택적으로, 상기 염색체 유전자 좌위로부터 가교-결합된 DNA를 선택적으로 분리시키는 단계;
(ⅲ) 상기 가교-결합된 DNA를, 예를 들어 적어도 한번 절단하는 효소(특히, 상기 염색체 유전자 좌위 내에서 적어도 한번 절단하는 효소)로 제한효소 분해하여 절단하는 단계;
(ⅳ) 상기 절단된 가교-결합 DNA 말단을 결찰(특히 DNA 루프를 형성하기 위해)시키는 단계; 및
(ⅴ) 선택적으로, 특정 염색체 상호 작용의 존재를 확인하기 위해, 특히 PCR(polymerase chain reaction)과 같은 기술을 사용하여, 결찰된 DNA 및/또는 상기 DNA 루프의 존재를 확인하는 단계.
개인이 유방암 서브그룹의 부분인지 아닌지 결정하는 것과 같이, 상기 단계는 본원에서 기재된 임의의 실시양태에 대한 염색체 상호작용을 검출하기 위해 수행될 수 있다. 또한 상기 단계는 본원에 기재된 핵산의 제1 및/또는 제2 세트를 생성하기 위해 수행될 수 있다.
결찰된 핵산을 검출 또는 확인하는데 PCR(polymerase chain reaction)을 사용할 수 있고, 예를 들어, 생성된 상기 PCR 생성물의 크기는 존재하는 특정 염색체 상호작용을 나타낼 수 있으므로, 유전자 좌위의 상태를 확인하는데 사용될 수 있다. 바람직한 실시양태에서, 표 10에 나타난 바와 같이 적어도 1, 2, 3, 4, 5, 6, 7, 또는 8 프라이머 또는 프라이머 쌍이 PCR 반응에서 사용된다. 다른 바람직한 실시양태에서는, 마커 세트 2 또는 3과 관련되거나 표시된 바와 같이 적어도 1, 2, 3, 4, 5, 6, 7, 또는 8 프라이머 또는 프라이머 쌍이 PCR 반응에 사용된다. 당업자는 관심 있는 염색체 자리 내에서 DNA를 절단하는데 사용될 수 있는 다수의 제한 효소를 알 수 있을 것이다. 사용되는 특정 효소는 연구되는 유전자 좌위 및 그 안에 위치한 DNA의 서열에 의존할 것이라는 것은 명백하다. 본 발명에 기재된 바와 같이 DNA를 절단하는데 사용될 수 있는 제한 효소의 비-제한적인 예는 TaqⅠ이다.
EpiSwitch TM 기술과 같은 실시양태
상기 EpiSwitchTM 기술은 표현형이 특이적인 후생적 염색체 형태 시그니처의 검출에서 마이크로 어레이 EpiSwitchTM 마커 데이터의 사용과 관련이 있다. 본원에 기재된 방법으로 결찰된 핵산을 이용하는 EpiSwitchTM과 같은 실시양태는 몇 가지 장점을 갖는다. 예를 들어, 본 발명의 제1 핵산 세트로부터의 핵산 서열이 제2 핵산 세트와 하이브리드화 또는 하이브리드화에 실패하기 때문에 낮은 수준의 확률적 노이즈(stochastic noise)를 갖는다. 이는 후생적 유전에서 복잡한 매커니즘을 측정하기 위해 상대적으로 간단한 방법을 허용하는 바이너리(binary) 결과를 제공한다. 또한 EpiSwitchTM 기술은 빠른 처리 시간 및 저비용을 갖는다. 하나의 실시양태에서, 처리하는 시간은 3시간 내지 6시간이다.
샘플 및 샘플 처리
본 발명의 방법은 일반적으로 샘플에서 수행될 것이다. 상기 샘플은 일반적으로 개인의 DNA를 포함한다. 이는 일반적으로 세포를 포함한다. 하나의 실시양태에서, 샘플은 최소한의 침습 수단에 의해 얻어지며, 예를 들어 혈액 샘플일 수 있다. DNA는 추출되고 표준 제한 효소로 절단할 수 있다. 이는 EpiSwitchTM 플랫폼으로 어떤 염색체 형태가 유지되고 있고 검출될 수 있는지를 미리 결정할 수 있다. 수평적 이동(horizontal transfer)을 포함하여 조직과 혈액 사이의 염색체 상호 작용의 동기화(synchronisation)로 인해, 혈액 샘플은 질병과 관련 있는 조직과 같은, 조직 내에서 염색체 상호 작용을 검출하는데 사용될 수 있다. 암과 같은 특정 조건의 경우, 돌연변이로 인한 유전적 노이즈는 조직과 관련된 염색체 상호작용‘신호(signal)’에 영향을 미칠 수 있으므로 혈액을 사용하는 것이 유리하다.
본 발명의 핵산의 특성
본 발명은 본 발명의 방법에서 사용되거나 생성된 것으로서 본원에 묘사된 결찰된 핵산과 같은 특정 핵산에 관한 것이다. 이는 본원에서 언급된 제1 및 제2 핵산과 동일하거나 임의의 특성을 가질 수 있다. 본 발명의 핵산은 전형적으로 염색체 상호 작용에 함께 결합하는 염색체의 2 개의 부위 중 하나로부터의 서열을 각각 포함하는 2 개의 부위를 포함한다. 전형적으로 각 부위는 길이가 적어도 8, 10, 15, 20, 30 또는 40 뉴클레오티드, 예를 들어 길이가 10 내지 40 뉴클레오티드이다. 바람직한 핵산은 모든 표에서 언급된 임의의 유전자의 서열을 포함한다. 전형적으로 바람직한 핵산은 표 9에 기재된 특정 프로브 서열을 포함하거나, 그러한 서열의 단편 및/또는 상동체(homologue)를 포함한다. 또한 전형적으로 바람직한 핵산은 마커 세트 2 또는 3에 관련된 및/또는 기재된 특정 프로브 서열을 포함하거나, 그러한 서열의 단편 및/또는 상동체를 포함한다. 바람직하게는, 핵산은 DNA이다. 특정 서열이 제공되는 경우, 본 발명은 특정 실시 양태에서 요구되는 바와 같이 상보적인 서열을 사용할 수 있는 것으로 이해된다.
또한 표 10에 기재된 프라이머는 본원에 기재된 바와 같이 본 발명에서 사용될 수 있다. 하나의 실시양태에서, 프라이머는 표 10에 나타낸 서열; 또는 표 10에 나타낸 임의의 서열의 단편 및/또는 상동체를 포함한다. 마커 세트 2 또는 3에 관련된 및/또는 나타난 상기 프라이머는 또한 본원에서 기재된 바와 같이 본 발명에서 사용될 수 있다. 하나의 실시 양태에서, 마커 세트 2 또는 3에 나타난 서열; 또는 마커 세트 2 또는 3에 나타난 임의의 서열의 단편 및/또는 상동체를 포함하는 프라이머가 사용된다.
제2 핵산 세트 - ' 인덱스(index)'서열
제2 핵산 서열 세트는 인덱스 서열 세트의 기능을 가지며, 본질적으로 서브그룹 특이적 서열을 확인하는데 적절한 핵산 서열 세트이다. 그들은 '배경(background)' 염색체 상호 작용을 나타낼 수 있으며 어떤 방법으로 선택되거나 선택되지 않을 수 있다. 그들은 일반적으로 가능한 모든 염색체 상호 작용의 서브세트이다.
제2 핵산 세트는 임의의 적절한 방법에 의해 유도될 수 있다. 그들은 계산적으로 유도되거나 개인의 염색체 상호 작용에 기초할 수 있다. 그들은 전형적으로 제1 핵산 세트보다 더 큰 개체군 그룹을 나타낸다. 하나의 특정 실시양태에서, 상기 제2 핵산 세트는 유전자의 특정 세트에서 가능한 모든 후생적 염색체 상호작용을 나타낸다. 또 다른 특정 실시양태에서, 상기 제2 핵산 세트는 본원에 기재된 개체군에서 존재하는 모든 가능한 후생적 염색체 상호작용의 큰 부분을 나타낸다. 하나의 특정 실시양태에서, 상기 제2 핵산 세트는 적어도 20, 50, 100 또는 500 개 유전자, 예를 들어 20 내지 100 개 또는 50 내지 500 개 유전자에서 후생적 염색체 상호 작용의 적어도 50% 또는 적어도 80%를 나타낸다.
상기 제2 핵산 세트는 전형적으로 개체군에서 질병 상태/표현형을 변형, 조절 또는 임의의 방식으로 조절하는 적어도 100 가지 이상의 가능한 후생적 염색체 상호 작용을 나타낸다. 상기 제2 핵산 세트는 종에서, 예를 들어, 특정 질병 또는 질병 표현형에 대한 성향, 임의의 질병 상태와 관련된 사이토카인, 키나아제 또는 조절자를 코딩하는 유전자에서 염색체 상호작용과 같은 질병 상태에 영향을 주는 염색체 상호 작용을 나타낼 수 있다. 상기 제2 핵산 세트는 전형적으로 유방암 서브 그룹과 관련있는 후생적 상호작용 및 관련 없는 후생적 상호작용을 나타내는 서열을 포함한다.
하나의 특정 실시양태에서, 상기 제2 핵산 세트는 개체군에서 자연적으로 발생하는 서열로부터 적어도 부분적으로 유도되며, 전형적으로는 인실리코(in silico) 방법에 의해 얻어진다. 상기 핵산은 자연적으로 발생하는 핵산에 존재하는 핵산에 상응하는 부분과 비교하여 단일 또는 다중 돌연변이를 추가로 포함할 수 있다. 돌연변이는 하나 이상의 뉴클레오티드 염기쌍의 결실, 치환 및/또는 추가를 포함한다. 하나의 특정 실시양태에서, 상기 제2 핵산 세트는 자연적으로 발생하는 종에 존재하는 핵산에 상응하는 부분과 적어도 70%의 서열 동일성을 갖는 상동체(homologue) 및/또는 오르소로그(orthologue)를 나타내는 서열을 포함할 수 있다. 또 다른 특정 실시양태에서, 자연적으로 발생하는 종에 존재하는 핵산에 상응하는 부분에 대해 적어도 80% 서열 동일성 또는 적어도 90% 서열 동일성을 제공한다.
제2 핵산 세트의 특성
하나의 특정 실시양태에서, 제2 핵산 세트 중에 적어도 100개 이상의 상이한 핵산 서열이 존재하며, 바람직하게는 적어도 1000, 2000 또는 5000 개 이상의 상이한 핵산 서열, 100,000, 1,000,000 또는 10,000,000이하의 상이한 핵산 서열을 갖는다. 전형적인 수치는 1,000 내지 100,000개 상이한 핵산 서열과 같은 100 내지 1,000,000일 것이다. 이들 중 모두, 적어도 90%, 또는 적어도 50% 이상은 상이한 염색체 상호 작용에 상응할 것이다.
하나의 특정 실시양태에서, 상기 제2 핵산 세트는 적어도 20개 이상의 상이한 유전자 좌위 또는 유전자, 바람직하게는 적어도 40개 이상의 상이한 유전자 좌위 또는 유전자, 및 보다 바람직하게는 적어도 100개, 적어도 500개, 적어도 1000개, 또는 적어도 5000개의 상이한 유전자 좌위 또는 유전자(예를 들면, 100 내지 10,000개의 상이한 유전자 좌위 또는 유전자)에서 염색체 상호작용을 나타낸다. 상기 제2 핵산 세트의 길이는 서브그룹에 특이적인 염색체 상호작용의 확인을 가능하게 하는 제1 핵산 세트에 대한 왓슨 크릭(Watson Crick) 염기쌍에 따라 특이적으로 하이브리드화하는 데 적합하다. 전형적으로 상기 제2 핵산 세트는 염색체 상호작용에서 함께 나오는 두 개 염색체 부위에 대한 서열에 상응하는 두 개의 부위를 포함할 것이다. 상기 제2 핵산 세트는 전형적으로 길이가 적어도 10개 이상, 바람직하게는 20개 이상, 더 바람직하게는 30개 염기 (뉴클레오티드)인 핵산 서열을 포함한다. 다른 실시양태에서, 상기 핵산 서열은 길이가 500 이하, 바람직하게는 100 이하, 더 바람직하게는 50 이하 염기쌍일 수 있다. 바람직한 실시양태에서 상기 제2 핵산 세트는 17 내지 25 염기쌍의 핵산 서열을 포함한다. 하나의 실시양태에서 상기 핵산 서열의 제2 세트의 적어도 100, 80% 또는 50%는 상기 기재된 바와 같은 길이를 갖는다. 바람직하게는 상이한 핵산은 임의의 중첩 서열(overlapping sequence)을 갖지 않으며, 예를 들어, 상기 핵산의 적어도 100%, 90%, 80% 또는 50%는 적어도 5 개의 연속적인 뉴클레오타이드에 걸쳐 동일한 서열을 갖지 않는다.
제2 핵산 세트가 '인덱스'로서 작용하면 제2 핵산의 동일한 세트는 상이한 특성에 대한 서브 그룹을 나타내는 제1 핵산의 상이한 세트와 함께 사용될 수 있는데, 즉, 상기 제2 핵산 세트는 상이한 특성과 관련된 염색체 상호작용을 확인하는데 사용될 수 있는 핵산의 ‘유니버설(universal)’콜렉션(collection)을 나타낼 수 있다.
제1 핵산 세트
제1 핵산 세트는 일반적으로 유방암 환자이다. 제1 핵산은 본원에 기재된 제2 핵산 세트의 특성(characteristic) 및 성질(properties) 중 임의의 것을 가질 수 있다. 상기 제1 핵산 세트는, 특히 EpiSwitchTM 가교-결합 및 절단 단계와 같은 본원에 기재된 처리 및 공정된(processing) 개체에서 추출한 샘플로부터 통상적으로 유도된다. 전형적으로 상기 제1 핵산 세트는 개체로부터 수득한 샘플에 존재하는 염색체 상호작용의 전부 또는 적어도 80 % 또는 50 % 이상을 나타낸다.
전형적으로, 상기 제1 핵산 세트는 제2 핵산 세트에 의해 나타나는 염색체 상호 작용과 비교하여 핵산의 제2 세트에 의해 나타나는 유전자 좌위 또는 유전자에 걸친 염색체 상호 작용의 더 작은 개체군을 나타내는데, 즉, 상기 제2 핵산 세트는 정의된 유전자 좌위 또는 유전자 세트에서 상호 작용의 배경(background) 또는 인덱스 세트를 나타낸다.
핵산 라이브러리(library)
본원에 기재된 임의의 유형의 핵산 모집단(population)은 ‘제1’ 또는 ‘제2’ 핵산과 같이, 그 유형의 적어도 200, 적어도 500, 적어도 1000, 적어도 5000 또는 적어도 10000 개 이상의 상이한 핵산을 포함하는 라이브러리의 형태로 존재할 수 있다. 그러한 라이브러리는 어레이(array)에 결합하는 형태 일 수 있다.
하이브리드화(Hybridisation)
본 발명은 핵산의 제1 세트 및 핵산의 제2 세트로부터 상보적인 핵산 서열이 전체적으로 또는 부분적으로 하이브리드화되도록 하는 수단을 필요로 한다. 하나의 실시양태에서 상기 핵산의 제1 세트 전체는 단일 분석 즉, 단일 하이브리드화 단계에서 제2 핵산 세트 전체와 접촉된다. 그러나 임의의 적절한 검사(assay)가 사용될 수 있다.
표지된 핵산 및 하이브리드화의 패턴
본원에 기재된 상기 핵산은 바람직하게는 성공적인 하이브리드화의 검출을 돕는 형광 물질 (형광 분자) 또는 방사성 표지와 같은 독립적인 표지(label)를 사용하여 표지될 수 있다. 특정 표지는 자외선 하에서 감지될 수 있다. 예를 들어 본원에 기재된 어레이 상에서 하이브리드화 패턴은 두 개 서브그룹 사이의 후생적 염색체 상호작용의 차이를 나타내며, 후생적 염색체 상호작용을 비교하고 어떤 후생적 염색체 상호작용이 본 발명의 개체군 내 서브그룹에 특이적인지 결정 방법을 제공한다.
상기 용어 ‘하이브리드화 패턴(pattern of hybridisation)’은 제1 핵산 세트와 제2 핵산 세트 사이의 하이브리드화의 존재 및 부존재를 광범위하게 포함하는데, 즉 제1 세트의 어떠한 특정 핵산이 제2 세트의 어떠한 특정 핵산과 하이브리드화되는지를 포함하며, 따라서 임의의 특정 분석이나 기법, 또는 '패턴'이 검출될 수 있는 표면이나 어레이를 가질 필요성에 제한되지 않는다.
특정한 특성이 있는 서브그룹의 선택
본 발명은 개인의 유방암과 관련된 특성의 존재 또는 부존재를 결정하기 위해, 염색체 상호 작용, 통상적으로 5 내지 20 또는 5 내지 500 가지의 상호 작용, 바람직하게는 20 내지 300 또는 50 내지 100 가지의 상호 작용의 존재 또는 부존재를 검출하는 단계를 포함하는 방법을 제공한다. 바람직하게는 상기 염색체 상호 작용은 본원에 기재된 임의의 유전자에서의 상호 작용이다. 하나의 실시양태에서, 타이핑되는 상기 염색체 상호 작용은 표 9의 핵산에 의해 나타나는 염색체 상호 작용이다. 표 9의 '검출된 루프(Loop Detected)'열은 각 프로브에 의해 어떤 서브그룹(유방암 또는 대조군)이 검출되는지 나타낸다. 본 발명의 방법에 나타난 바와 같이, 시험의 일부로서 유방암 서브 그룹 및/또는 대조군 서브그룹(비 - 유방암)을 검출할 수 있다.
테스트된 개체(Individual)
테스트된 개체의 예는 본원에 기재되어 있다. 또한, 본 발명의 방법으로 테스트된 개체는 소정의 방식으로 선택될 수 있다. 예를 들어 개체는 여성일 수 있다.
바람직한 유전자 부위, 유전자 좌위, 유전자 및 염색체 상호작용
본 발명의 모든 측면에 있어서, 바람직한 유전자 부위, 유전자 좌위, 유전자 및 염색체 상호작용이 표 9에 기재되어 있다. 전형적으로 본 발명의 방법에서 염색체 상호작용은 표 9에 열거된 관련 유전자의 적어도 1, 2, 3, 4, 5, 6, 7 또는 8 개 이상으로부터 검출된다. 바람직하게는 표 9의 프로브 서열에 의해 표시되는 관련 있는 특정 염색체 상호 작용의 적어도 1, 2, 3, 4, 5, 6, 7 또는 8 이상의 존재 또는 부존재를 검출한다. 질병-관련된 부위는 본원에 기재된 임의의 유전자의 상류(upstream) 또는 하류(downstream), 예를 들어 코딩 서열로부터의 50kb 상류 또는 20kb 하류일 수 있다.
본 발명의 모든 측면에 있어서, 바람직한 유전자 부위, 유전자 좌위, 유전자 및 염색체 상호 작용은 다른 표에 기재되어 있다. 전형적으로, 본 발명의 방법에서 염색체 상호작용은 표에 열거된 관련 유전자, 예를 들어 마커 세트 2 또는 3에 대해 적어도 1, 2, 3, 4, 5, 6, 7 또는 8 개 이상의 관련 유전자에서 검출된다. 바람직하게는 표의 프로브 서열에 의해 나타나는 관련 있는 특정 염색체 상호 작용의 적어도 1, 2, 3, 4, 5, 6, 7 또는 8 이상의 존재 또는 부존재를 검출한다. 질병-관련된 부위는 본원에 기재된 임의의 유전자의 상류 또는 하류, 예를 들어 코딩 서열로부터의 50kb 상류 또는 20kb 하류일 수 있다.
하나의 실시양태에서, 상기 유전자 좌위(염색체 상호 작용이 검출되는 유전자 및/또는 장소 포함)는 CTCF 결합 사이트를 포함할 수 있다. 이는 전사 억제자(transcription repressor) CTCF에 결합할 수 있는 임의의 서열이다. 이 서열은 유전자 좌위에서 1, 2 또는 3 개의 카피로 존재할 수 있는 서열 CCCTC로 구성되거나 이를 포함할 수 있다. 상기 CTCF 결합 사이트 서열은 CCGCGNGGNGGCAG 서열 (IUPAC 표기법)을 포함할 수 있다. 상기 CTCF 결합 사이트는 표 9에 나타낸 임의의 염색체 부위 내 또는 염색체 상호 작용의 적어도 100, 500, 1000 또는 4000 염기 내에 존재할 수 있다. 상기 CTCF 결합 사이트는 임의의 표, 예를 들어 마커 세트 2 또는 3에 제시된 임의의 염색체 부위 내 또는 염색체 상호 작용의 적어도 100, 500, 1000 또는 4000 염기 내에 있을 수 있다.
하나의 실시양태에서, 상기 검출된 염색체 상호작용은 표 9에 나타난 임의의 유전자 부위에 존재한다. 결찰된 핵산이 상기 방법에서 검출되는 경우, 표 9의 임의의 프로브 서열에 나타난 서열이 검출될 수 있다. 다른 실시양태에서, 상기 검출된 염색체 상호작용은 다른 표, 예를 들어 마커 세트 2 또는 3에 나타난 임의의 유전자 부위에 존재한다. 결찰된 핵산이 상기 방법에서 검출되는 경우, 표의 임의의 프로브 서열에 나타난 서열, 예를 들어 표지 세트 2 또는 3에 대해 검출될 수 있다.
따라서, 프로브의 두 부위(즉, 염색체 상호 작용의 두 사이트)으로부터의 서열이 통상적으로 검출될 수 있다. 바람직한 실시양태에서, 임의의 표에 나타난 프로브와 동일하거나 상보적인 서열을 포함 또는 구성되는 프로브가 본 발명의 방법에서 사용된다. 일부 실시양태에서 표에 나타난 임의의 프로브 서열과 상동성이 있는 서열을 포함하는 프로브가 사용된다.
본원에서 제공된 표
표 9는 유방암과 관련된 염색체 상호 작용을 나타내는 프로브 (EpiswitchTM 마커) 데이터 및 유전자 데이터를 나타낸다. 다른 프로브 및 유전자 데이터는 다른 표, 예를 들어 마커 세트 2 또는 3에 대한 표에 나타나 있다. 상기 프로브 서열은 염색체 상호작용에 함께 나타나는 유전자 부위의 두 사이트로부터 생성된 결찰된 생성물을 검출하는데 사용될 수 있는 서열을 나타내는데, 즉, 상기 프로브는 결찰된 생성물의 서열에 상보적인 서열을 포함할 것이다. 첫 번째 두 세트의 개시-종료(Start-End) 위치는 프로브 위치를 나타내며, 두 번째 두 세트의 개시-종료 위치는 관련있는 4kb 부위를 나타낸다. 하기의 정보는 프로브 데이터 표에서 제공한다:
- 하이퍼G_통계(HyperG_Stats): 초기하 농축(hypergeometric enrichment)의 매개 변수를 기반으로 유전자 좌위에서 그 수의 중요한 EpiSwitch ™ 마커를 찾을 확률(probability)에 대한 p-값(p-value).
- 전체 프로브 카운트(Probe Count Total): 유전자 좌위에서 테스트한 EpiSwitch™ Conformation의 전체 수치
- 프로브 카운트 신호(Probe Count Sig): 유전자 좌위에서 통계적으로 유의미한 것으로 밝혀진 EpiSwitch ™ Conformation의 수치
- FDR HyperG: 다중-테스트 (오류 발견율(False Discovery Rate)) 보정된 초기하 P- 값
- 백분율 신호(Percent Sig): 유전자 좌위에서 테스트된 마커의 수치와 관련된 중요한 EpiSwitch™ 마커의 백분율
- 로그 FC(logFC): 로그 베이스 2인 후생적 비율(Epigenetic Ratio, FC)
- 평균발현(AveExpr): 모든 어레이(array)와 채널(channel)에서 프로브에 대한 평균 log2-발현
- T: 중재된 t- 통계(moderated t-statistic)
- p-값(p-value): 로우 p-값(raw p-value)
- adj. p-값: 조절된 p-값 or q-값
- B-B-통계(lods 또는 B)는 특정 유전자가 차별적으로 발현되는 로그 - 오즈(log-odds)이다.
- FC - 비-로그 폴드 변경
- FC_1 - 0에 집중된 비-로그 폴드 변경
- LS - FC_1 값과 관련된 이진 값(binary value)이다. FC_1 값이 -1.1 미만이면 -1로 설정되고, FC_1 값이 1보다 클 경우에 1로 설정된다. 이 값들 사이의 값은 0이다.
표 9는 관련 염색체 상호 작용이 일어나는 것으로 밝혀진 유전자들을 나타낸다. 다른 표들은 유사한 데이터를 나타낸다. 유전자 좌위 표에서 p-값은 HyperG_통계와 동일하다(초기하 농축의 매개 변수를 기반으로 하는 유전자 좌위에서 특정 수의 중요한 EpiSwitch ™ 마커를 발견한 확률에 대한 p-값).
상기 프로브는 Taq1 사이트에서 30bp 떨어져 설계되었다. PCR의 경우, PCR 프라이머는 결찰된 생성물을 검출하도록 설계되었지만 TaqⅠ 사이트로부터 위치는 다양하다.
프로브 위치(Probe locations):
개시(Start) 1 - 단편 1에서 TaqⅠ사이트의 30 염기 상류(upstream)
종료(End) 1 - 단편 1에서 TaqI 제한 사이트
개시(Start) 2 - 단편 2에서 TaqI 제한 사이트
종료(End) 2 - 단편 2에서 TaqⅠ사이트의 30 염기 하류(downstream)
4kb 서열 위치(4kb Sequence Location):
개시 1 - 단편 1에서 TaqⅠ사이트의 4000 염기 상류
종료 1 - 단편 1에서 TaqI 제한 사이트
개시 2 - 단편 2에서 TaqI 제한 사이트
종료 2 - 단편 2에서 TaqⅠ사이트의 4000 염기 하류
표 10 및 다른 표는 각 상위 PCR 마커를 나타낸다. GLMNET - 전체 라소(lasso) 또는 탄성-그물 정규화(elastic-net regularization)에 대한 피팅(fitting) 절차. 람다는 0.5 (탄성-그물)로 설정된다.
샘플 준비 및 염색체 상호작용 검출을 위한 바람직한 실시양태
샘플을 제조하고 염색체 형태를 검출하는 방법은 본원에 기재되어 있다. 이 섹션(section)에 기재된 바와 같이 이러한 방법의 최적화된 버전을 사용할 수 있다.
전형적으로 상기 샘플은 적어도 2x105 cells로 구성될 것이다. 상기 샘플은 최대 5x105 cells을 포함할 수 있다. 하나의 실시양태에서, 상기 샘플은 2x105 내지 5x105 cells을 포함하게 될 것이다.
염색체 유전자 좌위에 존재하는 후생적 염색체 상호 작용의 가교결합(crosslinking)은 본원에 기재되어 있다. 이는 세포 용해가 일어나기 전에 수행될 수 있다. 세포 용해(cell lysis)는 3 내지 7분 동안, 예를 들어 4 내지 6분 또는 약 5분 동안 수행될 수 있다. 일부 실시양태에서, 세포 용해는 적어도 5분 이상 및 10분 미만 동안 수행된다.
제한 효소로 DNA를 분해하는 것이 본원에 기재되어 있다. 전형적으로, DNA 제한(restriction)은 약 50℃ 내지 약 70℃, 예를 들어 약 65℃에서, 약 10 내지 30분, 예를 들어 약 20분 동안 수행된다.
바람직하게는, 빈번한 커터 제한 효소(frequent cutter restriction enzyme)를 사용하여 최대 4000 염기쌍의 평균 단편 크기를 갖는 결찰된 DNA의 단편을 야기한다. 선택적으로, 상기 제한 효소는 약 256 염기쌍과 같이, 약 200 내지 300 염기쌍의 평균 단편 크기를 갖는 결찰된 DNA의 단편을 야기한다. 하나의 실시양태에서, 상기 전형적인 단편 크기는 400 내지 2,000 또는 500 내지 1,000 염기쌍과 같이, 200 염기쌍 내지 4,000 염기쌍이다.
EpiSwitch 방법의 하나의 실시양태에서, DNA 침전(precipitation) 단계는 DNA 제한 효소 분해 단계 및 DNA 결찰 단계 사이에서 수행되지 않는다.
DNA 결찰(ligation)은 본원에 기재되어 있다. 전형적으로 상기 DNA 결찰은 약 10분과 같이, 5 내지 30분 동안 수행된다.
샘플 내의 단백질은 예를 들어, 단백질 분해효소(proteinase), 선택적으로 프로테이네이즈 K(Proteinase K)를 사용하여 효소적으로 분해될 수 있다. 상기 단백질은 약 30분 내지 1시간, 예를 들어, 약 45 분 동안 효소적으로 분해될 수 있다. 단백질의 분해, 예를 들어 프로테이네이즈 K 분해 후 하나의 실시양태에서, 가교-결합 반전 또는 페놀 DNA 추출 단계는 없다.
하나의 실시양태에서, PCR 검출은, 바람직하게는 결찰된 핵산의 존재/부존재에 대한 바이너리 판독(binary read-out)으로 결찰된 핵산의 단일 카피를 검출할 수 있다.
본 발명의 방법 및 용도
본 발명의 방법은 상이한 방식으로 기재될 수 있다. 이는 하기 단계를 포함하는 결찰된 핵산의 제조 방법으로 기재될 수 있다: (ⅰ) 염색체 상호작용에 함께 나타나는 염색체 부위의 in vitro 가교-결합하는 단계; (ⅱ) 상기 가교-결합된 DNA를 커팅(cutting) 또는 제한 효소 분해에 적용시키는 단계; 및 (ⅲ) 상기 가교-결합된 분해된 DNA 말단을 결찰시켜 결찰된 핵산을 생성하는 단계. 상기에서 결찰된 핵산의 검출은 유전자 좌위에서 염색체 상태를 결정하는데 사용할 수 있다. 또한 바람직하게는,
- 상기 유전자 좌위는 표 9에 기재된 임의의 유전자 좌위, 부위 또는 유전자일 수 있고/있거나,
- 상기 염색체 상호작용이 본원에 기재된 임의의 염색체 상호작용 또는 표 9에 기재된 임의의 프로브에 상응할 수 있고/있거나,
- 상기 결찰된 생성물은 (ⅰ) 표 9에 기재된 임의의 프로브 서열과 동일하거나 상동인 서열이거나, 또는 (ⅱ) (ⅱ)에 상보적인 서열을 가지거나 포함할 수 있다.
본 발명의 방법은 염색체 상호작용이 게놈의 특정된 후생적 활성(질병-관련된) 부위 내에 존재 또는 부존재인지 결정하는 단계를 포함하여, 개체군에서 상이한 서브그룹을 나타내는 염색체 상태를 검출하기 위한 방법으로 기재될 수 있으며, 바람직하게는,
- 상기 서브그룹은 유방암의 존재 또는 부존재로 한정되고/되거나,
- 상기 염색체 상태는 표 9에 기재된 임의의 유전자 좌위, 부위 또는 유전자에서의 상태이고/이거나,
- 상기 염색체 상호작용은 표 9에 기재된 것 또는 표에 개시된 임의의 프로브에 상응하는 것 중 임의의 것일 수 있다.
본 발명은 표 9에 기재된 임의의 유전자 좌위, 유전자 또는 부위에서의 염색체 상호작용의 검출을 포함한다. 본 발명은 염색체 상호작용을 검출하기 위해 본원에 기재된 핵산 및 프로브의 용도를 포함하며, 예를 들어 적어도 1, 2, 4, 6 또는 8 개 이상의 상이한 유전자 좌위 또는 유전자에서 염색체 상호작용을 검출하기 위해 적어도 1, 2, 4, 6, 또는 8 개의 핵산 또는 프로브를 사용하는 용도를 포함한다. 본 발명은 표 10에 열거된 임의의 프라이머 또는 프라이머 쌍을 사용하거나 또는 본원에 기재된 바와 같은 이들 프라이머의 변이체(프라이머 서열을 포함하거나 프라이머 서열의 단편 및/또는 상동체를 포함하는 서열)를 사용하는 염색체 상호 작용의 검출을 포함한다.
특정 실시양태에서,
- 상기 유전자 좌위는 임의의 표, 예를 들어 마커 세트 2 또는 3에 대해 기재된 임의의 유전자 좌위, 부위 또는 유전자일 수 있고/있거나,
- 상기 염색체 상호작용은 본원에 기재된 임의의 염색체 상호작용 또는 임의의 표, 예를 들어 마커 세트 2 또는 3에 대해 기재된 임의의 프로브에 상응하는 것일 수 있고/있거나,
- 상기 결찰된 생성물은 (i) 임의의 표, 예를 들어 마커 세트 2 또는 3에 기재된 임의의 프로브 서열에 대해 동일하거나 상동인 서열; 또는 (ⅱ) (ⅱ)에 상보적인 서열을 가지거나 포함할 수 있다.
본 발명의 방법은 게놈의 특정된 후생적 활성(질병-관련) 부위 내에 염색체 상호 작용이 존재 또는 부존재하는지를 결정하는 단계를 포함하는, 개체군에서 상이한 서브그룹을 나타내는 염색체 상태를 검출하기 위한 방법으로 기재될 수 있으며, 바람직하게는,
- 상기 서브그룹은 유방암의 존재 또는 부존재로 한정되고/되거나,
- 상기 염색체 상태는 임의의 표, 예를 들어 마커 세트 2 또는 3에 대해 기재된 임의의 유전자 좌위, 부위 또는 유전자 일 수 있고/있거나,
- 상기 염색체 상호작용은 임의의 표, 예를 들어 마커 세트 2 또는 3에 기재된 것 또는 표에 개시된 임의의 프로브에 상응하는 것 중 임의의 것일 수 있다.
본 발명은 임의의 표, 예를 들어 마커 세트 2 또는 3에 대해 기재된 임의의 유전자 좌위, 유전자 또는 부위에서의 염색체 상호작용의 검출을 포함한다. 본 발명은 염색체 상호작용을 검출하기 위해 본원에 기재된 핵산 및 프로브의 용도를 포함하며, 예를 들어 적어도 1, 2, 4, 6 또는 8 개 이상의 상이한 유전자 좌위 또는 유전자에서 염색체 상호작용을 검출하기 위해 적어도 1, 2, 4, 6, 또는 8 개 이상의 핵산 또는 프로브를 사용하는 용도를 포함한다. 본 발명은 임의의 표, 예를 들어 마커 세트 2 또는 3에 대해 열거된 임의의 프라이머 또는 프라이머 쌍을 사용하거나 또는 본원에 기재된 바와 같은 이들 프라이머의 변이체(프라이머 서열을 포함하거나 프라이머 서열의 단편 및/또는 상동체를 포함하는 서열)를 사용하는 염색체 상호 작용의 검출을 포함한다.
새로운 치료법을 확인하기 위한 본 발명의 용도
염색체 상호 작용에 대한 지식은 소정의 상태에 대한 새로운 치료법을 확인하는데 사용될 수 있다. 본 발명은 유방암에 대한 새로운 치료제를 동정 또는 디자인하기 위해 본원에서 정의된 염색체 상호 작용의 방법 및 용도를 제공한다.
상동체(Homologues)
폴리뉴클레오티드/핵산(예, DNA) 서열의 상동체가 본원에서 언급된다. 이와 같은 상동체는 전형적으로 적어도 70% 이상의 상보성, 바람직하게는 적어도 80% 이상, 적어도 85% 이상, 적어도 90% 이상, 적어도 95% 이상 적어도 97% 이상, 적어도 98% 이상, 또는 적어도 99% 이상의 상보성을 가지며, 예를 들어 적어도 10, 15, 20, 30, 100 또는 그 이상의 연속적인 뉴클레오티드의 부위, 또는 상기 염색체 상호작용에 관련된 염색체의 영역으로부터 유래된 핵산의 일부분에 걸쳐 존재한다. 상기 상동성(homology)은 뉴클레오티드 동일성(때로는 ‘경질 상동성(hard homology)’으로 지칭)에 기초하여 계산될 수 있다.
그러므로, 특정 실시양태에서, 폴리뉴클레오티드/핵산(예, DNA) 서열의 상동체는 서열 동일성 백분율(percentage sequence identityy)로 표시함으로써 본원에서 언급된다.
전형적으로 이와 같은 상동체는 적어도 70% 이상 서열 동일성, 바람직하게는 적어도 80% 이상, 적어도 85% 이상, 적어도 90% 이상, 적어도 95% 이상, 적어도 97% 이상, 적어도 98% 이상 또는 적어도 99% 이상 서열 동일성을 가지며, 예를 들어 적어도 10, 15, 20, 30, 100 또는 그 이상의 연속적인 뉴클레오티드의 부위, 또는 상기 염색체 상호작용에 관련된 염색체의 부위로부터 유래된 핵산의 일부분에 걸쳐 존재한다.
예를 들어, UWGCG 패키지(package)는 상동성 및/또는 % 서열 동일성(기본 설정(default setting)에서 사용된 예)을 계산하기 위해 사용될 수 있는 BESTFIT 프로그램을 제공한다(Devereux et al (1984) Nucleic Acids Research 12, p387-395). 예를 들어, Altschul S. F. (1993) J MoI Evol 36:290-300; Altschul, S, F et al (1990) J MoI Biol 215:403-10에 기재된 바와 같이, PILEUP 및 BLAST 알고리즘을 상동성 및/또는 % 서열 동일성 및/또는 정렬(line up) 서열을 계산(예를 들어, 동등하거나 상응하는 서열(전형적으로 기본 설정)을 확인하는 것)하기 위해 사용할 수 있다.
BLAST 분석을 수행하기 위한 소프트웨어는 National Center for Biotechnology Information(NCBI)을 통해 공개적으로 사용할 수 있다. 이 알고리즘은 데이터베이스 서열에서 동일한 길이의 단어에 맞춰 조정되는 경우에 몇몇 포지티브-값 임계 스코어(positive-valued threshold score) T와 일치 또는 만족하는 쿼리(query) 서열에서 길이가 W인 짧은 단어를 식별하여 높은 점수를 얻는 서열 쌍(high scoring sequence pair, HSP)을 먼저 식별하는 것을 포함한다. T는 인접 단어(neighbourhood word) 스코어 임계값으로 언급된다(Altschul et al, supra). 이러한 초기 인접 단어 히트(hit)는 이를 포함하는 HSP를 찾기 위한 초기 검색의 기초(seeds)으로 사용된다. 상기 단어 히트는 누적 정렬 스코어(cumulative alignment score)를 증가시킬 수 있는 한 각 서열을 따라 양방향으로 확장된다. 각 방향에서 상기 단어 히트에 대한 확장은 다음 경우에 중단된다: 상기 누적 정렬 스코어는 최대 달성 수치로부터 정량 X만큼 떨어지는 경우, 하나 이상의 네거티브-스코어 잔기 정렬(negative-scoring residue alignments)의 축적으로 인하여, 상기 누적 스코어가 0 또는 그 이하가 되는 경우, 또는 어느 한 쪽 서열의 말단에 도달하는 경우. 상기 BLAST 알고리즘 매개 변수 W5 T 및 X는 상기 정렬의 감도 및 속도를 결정한다. 상기 BLAST 프로그램은 단어 길이(word length, W) 11, BLOSUM62 스코어 매트릭스(Henikoff and Henikoff (1992) Proc. Natl. Acad. Sci. USA 89: 10915-10919 참조) 정렬(B) 50, 기대값(expectation, E) 10, M = 5, N = 4 및 두 가닥의 비교를 기본값(defaults)으로 사용한다.
상기 BLAST 알고리즘은 두 서열 간의 유사성에 대한 통계 분석을 수행한다(Karlin and Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-5787 참조). 상기 BLAST 알고리즘에 의해 제공되는 유사성 중 하나의 척도는 2개의 폴리뉴클레오티드 서열 사이의 일치가 우연히 일어날 확률의 표시를 제공하는 최소 합계 확률(smallest sum probability, P(N))이다. 예를 들어, 제1 서열과 제2 서열의 비교에서 최소 합계 확률이 약 1 미만, 바람직하게는 약 0.1 미만, 보다 바람직하게는 약 0.01 미만, 가장 바람직하게는 약 0.001 미만인 경우에 소정의 서열이 다른 서열과 유사한 것으로 간주된다.
상동체 서열은 전형적으로 1, 2, 3, 4, 또는 그 이상 염기, 예를 들어 10, 15 또는 20개 미만의 염기(뉴클레오티드의 치환, 결실 또는 삽입일 수 있음)가 상이하다. 이러한 변화는 상동성 및/또는 % 서열 동일성의 계산과 관련하여 상기 기재된 임의의 부위에 걸쳐 측정될 수 있다.
어레이(array)
상기 제2 핵산 세트는 어레이에 결합될 수 있으며, 하나의 실시양태에서, 어레이에 결합된 적어도 15,000, 45,000, 100,000 또는 250,000 개 이상의 상이한 제2 핵산이 존재하며, 바람직하게는 적어도 300, 900, 2000 또는 5000 개 이상의 유전자 좌위를 나타낸다. 하나의 실시양태에서, 제2 핵산의 상이한 개체군의 하나 또는 그 이상, 또는 모두는 어레이의 하나 이상의 구별된 부위에 결합하며, 어레이에서 반복되어 오류 검출(error detection)이 가능하다. 상기 어레이는 Agilent SurePrint G3 Custom CGH 마이크로어레이 플랫폼을 기반으로 할 수 있다. 어레이에 제1 핵산의 결합의 검출은 이중 색상 시스템(dual colour system)에 의해 수행될 수 있다.
치료제(Therapeutic agents)
치료제는 본원에 기재되어 있다. 본 발명은 특정 개체. 예를 들어 본 발명의 방법에 의해 확인된 개체에서 유방암의 예방 또는 치료에 사용하기 위한 제제를 제공한다. 이는 제제의 치료 유효량을 필요로 하는 개체에 투여하는 것을 포함할 수 있다. 본 발명은 특정 개체에서 유방암의 예방 또는 치료용 약제를 제조하기 위한 상기 제제의 용도를 제공한다.
바람직한 치료제는 암 세포의 성장을 방해하는데 사용되는 세포 독성 약물이다. 보통 유방암 치료에 사용되는 많은 수의 상이한 화학 치료 약물이 있다. 이는 시클로포스파미드(Cyclophosphamide), 에피루비신(Epirubicin), 플루오로우라실(Fluorouracil, 5FU), 메토트렉세이트(Methotrexate), 미토마이신(Mitomycin), 미토산트론(Mitozantrone), 독소루비신(Doxorubicin), 도세탁셀(Docetaxel; Taxotere) 및 젬시타빈(Gemcitabine; Gemzar)를 포함한다. 보통 환자들은 약 3가지 화학 치료 약물의 조합을 함께 사용한다. 상기 치료제는 암 세포의 성장을 유발하는 호르몬의 레벨을 감소시킬 수 있다. 호르몬 치료를 위해 사용되는 다양한 약물은 아나스트로졸(Anastrozole; Arimidex), 엑스메스탄(Exemestane; Aromasin), 레트로졸(Letrozole; Femara) 및 타목시펜(Tamoxifen)을 포함한다. 상기 치료제는 암세포 사이의 상호작용을 차단하여 세포 분열 및 성장을 억제시키는 약물과 같은 생물학적 치료제일 수 있다. 보통 생물학적 치료를 위해 사용되는 약물은 헤르셉틴(Herceptin; Trastuzumab), 라파티닙(Lapatinib; Tyverb), 페르투주맙(Pertuzumab; Perjeta) 및 에베로리무스(Everolimus; Afinitor)를 포함한다.
상기 제제의 제형은 제제의 성질에 의해 결정될 것이다. 상기 제제는 상기 제제 및 약학적으로 허용 가능한 담체 또는 희석제를 포함하는 약학적 조성물의 형태로 제공될 것이다. 적합한 담체 및 희석제에는 등장성 식염수 용액, 예를 들어 인산염-완충 식염수가 포함된다. 전형적인 경구 투여 조성물에는 정제, 캡슐, 액체 용액 및 액체 현탁액이 포함된다. 상기 제제는 비경구, 정맥 내, 근육 내, 피하, 경피 또는 경구 투여를 위해 제제화 될 수 있다.
제제의 투여량은 다양한 매개 변수, 특히 사용된 물질(substance); 치료할 개체의 연령, 체중 및 상태; 투여 경로; 및 필요한 식이요법에 따라 결정될 수 있다. 의사는 임의의 특정한 제제에 대하여 필요한 투여 경로 및 투여량을 결정할 수 있다. 그러나, 적절한 투여량은 0.1 내지 100 mg/체중kg 예를 들어, 1 내지 40 mg/체중kg이며, 예를 들어 1일 1회 내지 3회 복용할 수 있다.
본원에 기재된 물질(substance)의 제형
핵산 또는 치료제와 같이 본원에 기재된 임의의 물질은 정제 또는 분리된 형태일 수 있다. 상기 물질은 자연에서 발견되는 것과 다른 형태일 수 있으며, 예를 들어 자연에서 발생하지 않는 다른 물질과 조합하여 존재할 수 있다. 상기 핵산(본원에 기재된 서열의 부분을 포함함)은 자연에서 발견되는 것들과 상이한 서열을 가질 수 있으며, 예를 들어 상동성에 대한 섹션에 기재된 바와 같이 서열에서 적어도 1, 2, 3, 4 또는 그 이상 뉴클레오티드 변화를 갖는 서열을 가질 수 있다. 상기 핵산은 5 '또는 3'말단에서 이종 서열을 가질 수 있다. 상기 핵산은 자연에서 발견되는 것들과 화학적으로 상이할 수 있으며, 예를 들어, 어떤 방식으로 변형될 수 있지만, 바람직하게는 여전히 왓슨-크릭 염기쌍 형성이 가능하다. 적절하게, 상기 핵산은 이중 가닥 또는 단일 가닥 형태로 제공될 것이다. 본 발명은 본원에서 기재된 모든 특정 핵산 서열을 단일 또는 이중 가닥 형태로 제공하고, 개시된 임의의 서열에 대한 상보적 가닥을 포함한다.
본 발명은 또한 유방암과 관련된 염색체 상호 작용의 검출 또는 유방암의 진단을 포함하는, 본 발명의 임의의 방법을 수행하기 위한 키트를 제공한다. 본 발명의 키트는 본 발명의 방법에 의해 생성된 결찰된 핵산을 검출할 수 있는 제제와 같이, 관련 염색체 상호 작용을 검출할 수 있는 특이적 결합 제제를 포함할 수 있다. 상기 키트에 존재하는 바람직한 제제는, 결찰된 핵산 또는 프라이머 쌍을 하이브리드화 할 수 있는, 예를 들어 본원에 기재된 바와 같이, 결찰된 핵산을 PCR 반응에서 증폭시킬 수 있는 프로브를 포함한다.
본 발명은 또한 관련 염색체 상호 작용을 검출할 수 있는 장치를 제공한다. 상기 장치는 바람직하게는 염색체 상호 작용을 검출할 수 있는 임의의 특이적 결합 제제, 프로브 또는 프라이머 쌍, 예를 들어 본원에 기재된 임의의 제제, 프로브 또는 프라이머 쌍을 포함한다.
검출 방법
하나의 실시양태에서, 염색체 상호작용과 관련 있는 상기 결찰된 서열의 정량적 검출은 PCR 반응 동안 활성화 되며, 검출할 수 있는 프로브를 사용하여 수행되며, 상기 결찰된 서열은 후생적 염색체 상호작용에서 함께 나오는 2개 염색체 부위의 서열을 포함하고, 상기 방법은 PCR 반응 동안 프로브로 상기 결찰된 서열을 접촉시키는 단계, 및 상기 프로브의 활성 정도를 검출하는 단계를 포함하고, 상기 프로브는 상기 결찰 사이트에 결합한다. 상기 방법은 전형적으로 이중 표지 형광 가수 분해 프로브를 사용하여 MIQE에 따른 방식(MIQE compliant manner)으로 특정 상호 작용을 검출할 수 있게 한다.
상기 프로브는 일반적으로 비활성 및 활성 상태를 갖는 검출 가능한 라벨(label)로 표지되어, 활성화될 때만 검출되도록 한다. 상기 활성화의 정도는 PCR 반응에 존재하는 템플릿(template)(결찰 생성물(ligation product))의 정도와 관련될 수 있다. 검출은 PCR의 전부 또는 일부 동안, 예를 들어 PCR의 사이클의 적어도 50 % 또는 80 % 동안 수행될 수 있다.
상기 프로브는 올리고뉴클레오티드의 한쪽 말단에 공유 결합된 형광단(fluorophore) 및 뉴클레오티드의 다른 쪽 말단에 결합된 ??처(quencher)를 포함할 수 있으며, 상기 형광단의 형광물질은 ??처에 의해 ??치된다. 하나의 실시양태에서, 상기 형광단은 올리고뉴클레오티드의 5′말단에 부착되고, 상기 ??처는 올리고뉴클레오티드의 3′말단에 공유결합된다. 본 발명의 방법에 사용될 수 있는 형광단으로는 FAM, TET, JOE, Yakima Yellow, HEX, Cyanine3, ATTO 550, TAMRA, ROX, Texas Red, Cyanine 3.5, LC610, LC 640, ATTO 647N, Cyanine 5, Cyanine 5.5 및 ATTO 680이 포함된다. 적절한 형광단과 함께 사용될 수 있는 ??처로는 TAM, BHQ1, DAB, Eclip, BHQ2 및 BBQ650이 포함되며, 선택적으로 상기 형광단은 HEX, Texas Red 및 FAM으로 이루어진 군으로 부터 선택된다. 형광단 및 ??처의 바람직한 조합으로는 FAM과 BHQ1 및 Texas Red와 BHQ2가 포함된다.
qPCR 분석에서 프로브의 용도
본 발명의 가수 분해 프로브는 전형적으로 음성 대조군과 일치하는 농도로 온도 변화도(temperature gradient)가 최적화된다. 바람직하게는 단일-단계 PCR 반응을 최적화한다. 보다 바람직하게는 표준 곡선을 계산한다. 상기 결찰된 서열의 교차점(junction)을 가로 질러 결합하는 특정 프로브를 사용하는 것의 장점은, 네스트 PCR 접근법(nested PCR approach)을 사용하지 않고도 결찰된 서열에 대한 특이성이 이루어질 수 있다는 것이다. 본원에 기재된 방법은 낮은 카피 수 표적(target)의 정밀하고 정확한 정량화를 가능하게 한다. 상기 표적-결찰된 서열은 온도 변화도 최적화 전에 정제, 예를 들어, 겔-정제될 수 있다. 바람직하게는 약 10ng, 또는 5 내지 15 ng, 또는 10 내지 20ng, 또는 10 내지 50ng, 또는 10 내지 200ng 템플릿(template) DNA를 사용하여 PCR 반응을 수행한다. 정방향(forward) 및 역방향(reverse) 프라이머는 하나의 프라이머가 결찰된 DNA 서열에 나타난 상기 염색체 부위 중 하나의 서열에 결합하고, 또 다른 프라이머가 결찰된 DNA 서열, 예를 들어 서열에 상보적인 것으로 나타난 다른 염색체 부위에 결합하는 것으로 설계된다.
결찰된 DNA 표적의 선택
본 발명은, 상기 결찰된 서열을 결합 및 증폭시키는 능력에 기초하여 프라이머를 선택하는 단계 및 프로브 서열이 결합할 상기 표적 서열의 특성에 기초한 프로브 서열, 특히 표적 서열의 곡률(curvature)을 선택하는 단계를 포함하는, 본원에 기재된 바와 같이 PCR 방법에 사용하기 위한 프라이머 및 프로브를 선택하는 것을 포함한다.
통상적으로, 프로브는 제한 사이트를 스패닝(spanning)하는 제한 단편과 나란히 놓인 결찰된 서열에 결합하도록 설계/선택된다. 본 발명의 하나의 실시양태에서, 특정 염색체 상호 작용에 관련 있는 가능한 결찰된 서열의 예측된 곡률은, 예를 들어 본원에서 언급된 특정 알고리즘을 사용하여 계산된다. 상기 곡률은 나선형 회전(helical turn)당 각도, 예를 들어, 나선형 회전 당 10.5°로 표시될 수 있다. 결찰된 서열은 상기 결찰된 서열이 나선형 회전 당 적어도 5°이상, 통상적으로 나선형 회전당 적어도 10°이상, 15° 이상 또는 20° 이상, 예를 들어 나선형 회전 당 5° 내지 20°의 곡률 성향 피크 스코어(curvature propensity peak score)를 갖는 경우에 표적화를 위해 선택된다. 바람직하게는 나선형 회전 당 곡률 성향 스코어(curvature propensity score)는 상기 결찰 사이트의 상류 및/또는 하류 20 내지 400 염기와 같이 적어도 20, 50, 100, 2000 또는 400 이상의 염기에 대해 계산된다. 따라서, 하나의 실시양태에서, 결찰된 생성물 내의 상기 표적 서열은 상기한 임의의 곡률 수준을 갖는다. 표적 서열은 최저 열역학적 구조 자유 에너지에 기초하여 선택될 수 있다.
특정 실시양태(Particular Embodiments)
특정 실시양태에서 IGFBP3의 염색체 상호작용은 타이핑/검출되지 않는다.
임의의 실시양태에서, 본원에 기재된 임의의 유전자에서 염색체 상호작용은 타이핑/검출되지 않는다. 하나의 실시양태에서 하기 유전자 중 어떠한 유전자도 타이핑/검출되지 않는다:
BCAS1, ZNF217,TSHZ2, SUMO1P1, MIR4756, BCAS3, TBX2, C17orf82, TBX4, BCA54, LINC00651, UBE2V1, TMEM189, CEBPB, LOC284751, PTPNI, MIR645, FAM65C PARD68, ADNP, LINC00494, PREX1, ARFGEF2, CSE1L, PDE4DIP, SEC22B, NOTCH2NL NBP10, HFE2, TXNIP, POLR3GL, ANKRD34A, LIX1L, RBM8A, GNRHR2, PEX11B, ITGA10, ANKRD35, PIAS3, NUDTI7, POLR3C, RNF115, CD160, PDZK1, GPR89A, ZNF334. OCSTAMP, SLC13A3, TP53RK, SLC2A10, EYA2, MIR3616, ZMYND8, L0C100131496, DLG1, MIR4797, DLG1-AS1, BDH1, LOC220729, KIAA0226, MIR922, FYTTDl , LRCH3, IQCG, RPL35A, LMLN, ANKRD18DP, DDX59, CAMSAP2, GPR25, C1orf106, KIF21B, CACNA15, ASCLS, TMEM9, IGFN1, PKP1, TNN2, LAD1, TNNI1, PHLDA3, NCOA1, PTRHD1, CENPO, ADCY3, DNAJC27, DNAJC27-AS1, EFR3B. POMC, DNMT3A, MIR1301, DTNB, SPON2, LOC100130872, CTBP1, CTBP1-AS1, MAEA, UVSSA, CRIPAK, FAM53A, SLBP, TMEM129, TACC3, FGFR3, LETM1, WHSC1, SCARNA22, WHSC2, MIR943, C4orf48, NAT8L, POLN, HAUS3, MXD4, MIR4800, ZFYVE28, LOC402160, RNF4, LOC1OO506190, C9orf50, NTMT1, ASB6, PRRX2, PTGES, TOR1B, TOR1A, C9orf78, USP20, FNBP1, GPR107, NC51, ASS1.
하나의 실시양태에서, 염색체 내 상호작용만 타이핑/검출되고, 염색체 외 상호작용(상이한 염색체 사이)은 타이핑/검출되지 않는다.
간행물(publications)
본원에 기재된 모든 간행물의 내용은 본 명세서에 참고로 포함되며, 본 발명과 관련된 특징을 추가로 정의하는데 사용될 수 있다.
구체적인 실시양태(Specific Embodiments)
EpiSwitch™ 플랫폼 기술은 유전자 좌위에서 정상 및 비-정상 조건 사이의 조절 변화의 후생적 조절 시그니처를 검출한다. EpiSwitch™ 플랫폼은 염색체 형태 시그니처(chromosome conformation signature)라고도 알려진 인간 염색체의 조절 고차 구조(regulatory high order structures)와 관련된 유전자 조절의 기본적인 후생적 유전학 수준을 확인하고 모니터한다. 염색체 시그니처는 유전자 조절 완화의 캐스케이드(cascade)에서 특유의 초기 단계이다. 그들은 DNA 메틸화 및 RNA 프로파일링과 같은 후기 후생적 유전 및 유전자 발현 바이오 마커를 이용하는 바이오 마커 플랫폼에 대한 고유한 장점을 가진 고차 바이오마커이다.
EpiSwitch™ 어레이 분석
맞춤 EpiSwitch™ 어레이-스크리닝 플랫폼은 15K, 45K, 100K 및 250K 고유 염색체 형태의 4 가지 밀도로 제공되며, 각 키메라 단편(chimeric fragment)은 상기 어레이를 4 번 반복하여 각각 60K, 180K, 400K 및 1 백만의 유효 밀도를 만드는 것이다.
맞춤 설계된 EpiSwitch™ 어레이
15K EpiSwitch™ 어레이는 EpiSwitch™ 바이오마커 발견 기술로 조사 된 약 300 개의 유전자 좌위를 포함하여 전체 게놈을 스크리닝할 수 있다. EpiSwitch™ 어레이는 Agilent SurePrint G3 Custom CGH 마이크로 어레이 플랫폼에 내장되어 있다. 이 기술은 4 가지 밀도, 60K, 180K, 400K 및 1 백만 프로브를 제공한다. 각 EpiSwitch™ 프로브가 4 번 반복하여 나타내는 것으로서 어레이 당 밀도가 15K, 45K, 100K 및 250K로 감소되며, 그러므로 재현성에 대한 통계적 평가가 가능하다. 유전자 좌위 당 조사한 잠재적인 EpiSwitch™ 마커의 평균수는 50개이며, 조사될 수 있는 유전자 좌위의 수는 300, 900, 2000 및 5000이다.
EpiSwitch ™ 맞춤 어레이 파이프라인(Custom Array Pipeline)
EpiSwitch™ 어레이는 EpiSwitch™ 라이브러리 생성 후, Cy5에 표지된 샘플 세트와 Cy3에 표지된 비교/분석 위한 샘플(대조군) 세트가 있는 이중 색상 시스템이다. 상기 어레이는 Agilent SureScan Scanner를 사용하여 스캔하고 Agilent Feature Extraction 소프트웨어를 사용하여 결과를 추출한다. 그 다음 상기 데이터는 R에서 EpiSwitch™ 어레이 프로세싱 스크립트(array processing scripts)를 사용하여 처리된다. 상기 어레이는 R: 리마(Limma)*의 Bioconductor에서 표준 이중 색상 패키지를 사용하여 처리된다. 상기 어레이의 표준화(normalisation)는 리마(Limma)*의 표준화된 배열 내 기능(normalised Within Arrays function)을 사용하여 수행되며, 이는 Agilent 포지티브 컨트롤 및 EpiSwitch™ 포지티브 컨트롤 칩(chip)에서 수행된다. 리마(Limma)*를 사용하여 분석하기 위해서는, Agilent Flag 호출을 기반으로 데이터가 필터링되고, Agilent 대조군 프로브가 제거되고, 기술적 반복 프로브가 평균화된다. 상기 프로브는 2 가지 시나리오의 차이를 기반으로 모델링되어 False Discovery Rate를 사용하여 비교되고 수정된다. <=-1.1 또는 =>1.1이고 p<=0.1 FDR p-값을 통과하는 변이 계수(Coefficient of Variation, CV)가 <=30% 인 프로브는 추가 스크리닝에 사용된다. 프로브 세트를 줄이기 위해 R에서 FactorMineR 패키지를 사용하여 Multiple Factor Analysis를 추가적으로 수행한다.
* 참고: LIMMA는 마이크로어레이(Microarray) 실험에서 발현 차이 평가(Assessing Differential Expression)를 위한 선형 모델(Linear Models) 및 실증적 베이스 프로세스(Empirical Bayes Processes)이다. Limma는 마이크로어레이 또는 RNA-Seq에서 발생하는 유전자 발현 데이터 분석을 위한 R 패키지이다.
프로브 풀(pool)은 최종 피킹(picking)을 위해 조정된 p-값, FC 및 CV<30%(임의의 컷오프 포인트(cut off point)) 매개 변수를 기반으로 초기에 선택된다. 추가 분석 및 최종 목록은 첫 번째 두 개 매개 변수(adj. p-값; FC)만을 기반으로 작성된다.
본원에 기재된 유전자
TSPYL5 - TSPY-like 5
SRD5A1 - 스테로이드 4 알파-환원 효소 1(steroid 5 alpha-reductase 1)
MAP3K1 - 미토젠-활성 단백질 키나아제 키나아제 키나아제 1(mitogen-activated protein kinase kinase kinase 1)
VAV3 - vav 구아닌 뉴클레오티드 교환 인자 3(vav guanine nucleotide exchange factor 3)
ATM - ATM 세린/트레오닌 키나아제(ATM serine/threonine kinase)
SLC16A10 - 용질 캐리어 패밀리 16 멤버 10(solute carrier family 16 member 10)
ME3 - 말릭 효소 3(malic enzyme 3)
본 발명은 하기 비-제한적인 실시예에 의해 설명된다.
실시예 1
통계 파이프라인
EpiSwitch™ 스크리닝 어레이는 EpiSwitch™ PCR 플랫폼으로의 변환을 위해 높은 수치의 EpiSwitch™ 마커를 선택하기 위해 R에서 EpiSwitch™ 분석 패키지를 사용하여 처리한다.
제1 단계
프로브는 수정된 선형 회귀 모델의 생성물인 수정된 p-값(False Discovery Rate, FDR)을 기반으로 선택된다. p-값 <= 0.1 인 프로브를 선택하고 그들의 후생적 비율(Epigenetic ratio, ER)에 의해 추가적으로 감소시키며, 추가 분석을 위해 선택하기 위하여 프로브 ER은 <=-1.1 또는 =>1.1이어야 한다. 마지막 필터는 변동 계수 (CV)이며, 프로브는 <=0.3 이어야 한다.
제2 단계
통계 목록의 상위 40 개 마커는 PCR 번역을 위한 마커로서 선택하기 위해 ER을 기준으로 선택된다. 가장 높은 네거티브 ER 로드(load)를 갖는 상위 20개 마커와 가장 높은 포지티브 ER 로드를 갖는 상위 20개 마커가 목록을 형성한다.
제3 단계
상기 제1 단계의 결과로 생긴 마커는, 통계적으로 유의미한 프로브가 초기하 농축(hypergeometric enrichment, HE)을 사용하여 농축 분석의 기초를 형성한다. 이 분석은 상기 유의미한 프로브 목록에서 마커를 감소시킬 수 있으며, 마찬가지로 상기 제2 단계의 마커와 함께 EpiSwitch™ PCR 플랫폼으로 번역된 프로브 목록을 형성할 수 있다.
통계적 프로브에 대해 HE처리를 하여, 어느 유전자 위치가 후생적 차이의 중심(hub)인지를 나타내는 통계적으로 유의미한 프로브의 농축을 갖는 유전자 위치를 결정한다.
수정된 p-값에 기초하여 가장 유의미하게 농축된 유전자 좌위는 프로브 목록 생성을 위해 선택된다. p-값이 0.3 또는 0.2 미만인 유전자 위치가 선택된다. 2 단계의 마커를 사용하여 이들 유전자 위치에 매핑(mapping)하는 통계적 프로브는 EpiSwitch™ PCR 번역을 위한 높은 값의 마커를 형성한다.
어레이 설계 및 방법
어레이 설계
1. 유전자 좌위는 SII 소프트웨어(현재 v3.2)를 사용하여 처리된다:
a. 상기한 특정 유전자 좌위(50kb 하류 및 20kb 상류를 가진 유전자 서열)에서 게놈의 서열을 끌어내는 단계,
b. 이 부위 내의 서열이 CCs에 관여할 확률을 정의하는 단계,
c. 특정 RE를 사용하여 서열을 절단하는 단계,
d. 특정 방향으로 상호작용할 가능성이 있는 제한 단편을 결정하는 단계,
e. 함께 상호작용할 가능성이 있는 상이한 CC의 순위를 정하는 단계.
2. 어레이 크기 및 사용가능한 프로브 위치의 수(x)를 결정한다.
3. x/4 상호작용을 끌어낸다.
4. 각 상호 작용에 대해 파트(part) 1의 제한 사이트에 30bp의 서열을 정의하고 파트 2의 제한 사이트에 30bp의 서열을 정의한다. 해당 영역이 반복이 아닌지 확인하고, 반복인 경우에는 상기 목록에서 제외하고 다음 상호 작용으로 넘어간다. 2개의 30bp를 결합하여 프로브를 정의한다.
5. x/4 프로브와 정의된 대조군 프로브의 목록을 만들고, 4번 복제하여 어레이에 생성할 목록을 만든다.
6. 사용자 정의 CGH 어레이를위한 Agilent Sure 디자인 웹 사이트에 프로브 목록을 업로드한다.
7. Agilent 사용자 정의 CGH 어레이를 설계하기 위하여 프로브 그룹을 사용한다.
어레이 방법
1. 템플릿 생성을 위해 EpiSwitch™ 표준 작동 절차 (Standard Operating Procedure, SOP)를 사용하여 샘플을 처리한다.
2. 어레이 처리 실험실의 에탄올 침전법으로 정화한다.
3. 혈액, 세포 또는 조직에 게놈 DNA 분석 효소 표지를 위한 CGH를 기반으로 하는 Agilent SureTag complete DNA labeling kit-Agilent Oligonucleotide Array에 따라 시료를 처리한다.
4, Agilent 형상 추출 소프트웨어를 사용하는 Agilent C 스캐너를 사용하여 스캔한다.
유방암 개요
연령별 발생률은 침습성 유방암에 대한 연령 영향이 아시아와 서양 인구에서 더 유사하다는 것을 나타낸다. 사실, 최근 세대에서 아시아 유방암 비율은 역사적으로 높은 비율을 나타내는 미국을 훨씬 능가하고 있기 때문에, 아시아 인구의 효율적인 예방 및 치료 전략에 대한 시급한 필요성이 강조되고 있다. 그러나 대규모의 25 년간 연구 결과, 유방 촬영술(mammography)은 유방암 관련 사망률을 감소시키지 못했다는 것이 밝혀졌다. 종양이 육안으로 확인되기 전의 유방암 초기 검출은, 유방암이 더 치료 가능한 단계에서 의학적 개입이 시작될 수 있음을 의미한다.
EpiSwitch™ 기술 개요
EpiSwitch™ 플랫폼은 비정상적이고 반응이 빠른 유전자 발현과 관련된 주요 질병의 스크리닝, 조기 발견, 동반-진단, 모니터링 및 예후 분석의 매우 효과적인 수단을 제공한다. 이 접근법의 주요 장점은 비-침습적이고, 신속하며, 불안정한 단백질/RNA 분자가 아닌 염색체 시그니처의 일부로서 매우 안정적인 DNA 기반 표적에 의존한다는 것이다.
EpiSwitchTM 바이오마커 시그니처는 복잡한 질병 표현형의 계층화에서 높은 강건성(robustness), 민감성 및 특이성을 입증한다. 이 기술은 후생적 바이오마커의 매우 유익한 클래스(class)로서 염색체 형성 시그니처의 후생 유전학, 모니터링 및 평가에서 최신의 획기적 발전 내용을 이용한다. 학술 환경에서 사용되는 현재의 연구 방법론에서는 CCS를 검출하기 위해 세포 물질의 생화학적 처리를 위해 3-7 일을 요구한다. 이러한 절차는 제한된 감도 및 재현성을 가지고 있으며, 또한 설계 단계에서 EpiSwitch™ 분석 패키지(EpiSwitch™ Analytical Package)가 제공하는 표적으로 하는 통찰력의 이점을 갖지 않는다.
EpiSwitch™ 분석 패키지(EpiSwitch™ Analytical Package)
EpiSwitch™ 플랫폼 기술은 주요 후생 유전학적 조절 체계의 일부로서 인간의 염색체의 고차원 구조 변화를 검출한다. 염색체에서 멀리 떨어져 있는 사이트를 나란히 놓으면 특정 유형의 바이오 마커-조절 염색체 형성 시그니처(biomarker-regulatory chromosome conformation signatures)가 형성된다. 이 방법에서 가장 큰 과제 중 하나는 고차원 구조의 일부를 형성하는 염색체의 유전자/유전자 좌위에서 잠재적인 사이트를 확인하는 것이다. 이는 주어진 서열 내에서 잠재적인 사이트를 확인하는 독점적인 패턴 인식 소프트웨어를 사용하여 수행된다. 기계-학습 알고리즘이 포함된 EpiSwitch™ 분석 패키지 소프트웨어는 CCS의 고차원 구조를 형성할 가능성이 있는 DNA 패턴을 확인한다.
EpiSwitch™ 어레이 인 실리코( in silico ) 마커 확인
게놈에 걸쳐있는 CCS 사이트는 모든 관련 계층화를 야기하는 리드 바이오마커(lead biomarker)를 확인하기 위한 테스트 코호트(cohort)의 임상 샘플에서 상기 EpiSwitch™ 어레이에 의해 직접적으로 평가된다. 상기 EpiSwitch™ 어레이 플랫폼은 처리량이 높고 다수의 유전자 좌위를 빠르게 스크리닝할 수 있기 때문에 마커를 확인하는 데 사용된다. 상기 사용된 어레이는 인 실리코(in silico) 소프트웨어를 통해 확인된 마커를 조사할 수 있는 애질런트 맞춤-CGH 어레이(Agilent custom-CGH array)이다.
EpiSwitch™ PCR
EpiSwitch™ 어레이로 확인된 잠재적 마커는 EpiSwitch™ PCR 또는 DNA 시퀀서(sequencers)(즉, Roche 454, Nanopore MinION 등)에 의해 검증된다. 통계적으로 유의하고 최고의 재현성을 나타내는 상위 PCR 마커가 선택되어 추가적으로 감소되며 최종 EpiSwitch™ 시그니처 세트가 되고, 독립적인 샘플의 코호트(cohort)에서 검증된다. EpiSwitch™ PCR은 표준화된 작동 절차 프로토콜에 따라 숙련된 기술자가 수행할 수 있다. 모든 프로토콜 및 시약의 제조는 작업의 품질 및 프로토콜 전달 능력을 보장하기 위해 ISO 13485 및 9001 승인 하에 수행된다. EpiSwitch™ PCR 및 EpiSwitch™ 어레이 바이오 마커 플랫폼은 전혈 및 세포주 분석과 호환될 수 있다. 상기 실험은 소량의 혈액을 사용하여 매우 낮은 카피 수에서의 이상 현상을 충분히 검출할 만큼 민감하다.
요약
발명자들은 유방암 진단에서 동반 진단 방법으로 사용될 바이오 마커를 확인하기 위한 근거로서 후생적 염색체 상호 작용을 사용했다. EpiSwitch™ 바이오마커 발견 플랫폼은 유방암과 관련된 표현형 변화를 유발하는 것과 같은 후생적 조절 시그니처 변화를 검출하기 위해 본 발명자들에 의해 개발되었다. 상기 EpiSwitch™ 바이오마커 발견 플랫폼은 환경 단서(cues)를 후생 유전학 및 전사 기계에 통합하는 초기 조절 방법을 정의하는 CCS를 확인한다. 이와 같이, CCS는 유전자 조절의 캐스캐이드에서 주요한 단계이다. EpiSwitch™ 바이오 마커 발견 플랫폼에 의해 분리된 CCS는 몇 가지 잘 문서화 된 장점을 갖는다: 심각한 생화학적 및 생리적 안정성; 바이너리 특성 및 판독; 유전자 조절의 진핵 생물 캐스캐이드에서 주요한 위치.
상기 EpiSwitch™ 어레이 스크리닝 플랫폼은 본 발명에 적용되었으며 그 결과는 EpiSwitch™ PCR 플랫폼으로 번역되어 다음 목적을 달성했다:
1. 유방암 환자를 건강한 개체와 차별화시키는 EpiSwitch™ 마커를 확인.
2. 기존의 임상 실습과 관련하여, 민감도, 특이성, 또는 양성 예측 수치(positive predictive value, PPV)의 표준을 제공하는 검사로 개발할 수 있는 EpiSwitch™ 마커를 확인.
이 유방암 바이오마커 발견 프로젝트에서 8x60k 어레이를 이용하여 최대 56,964 개의 잠재적인 염색체 형태를 4배로 연구할 수 있었다. 2개의 어레이는 8개의 풀 테스트된 건강한 대조군 환자 샘플에 대해 개별적으로 테스트한 배경의 범위로부터 8개의 단계 II/III 유방암 환자 샘플을 사용하여 생산되었다. 각 어레이에는 56,964 개의 EpiSwitch™ 프로브가 포함된다. 각 샘플에 대해 EpiSwitch™ 템플릿을 준비했다. 첫 번째 어레이는 아시아인 유방암 샘플에서 수행되었다. 두 번째 어레이는 유럽인 및 아시아인 샘플을 사용했다. 아시아인 및 유럽인 유방암은 ER+와 ER- 상태가 다를 수 있다. 다수의 개체군에서 유사한 암에 대해 중복된 프로브가 발견되었다. 그 다음 각 프로브를 데이터의 통계 품질에 대해 테스트 한 다음, 그 후에 설명된대로 분석하였다.
혈액 샘플 품질 관리 결과
연구에 사용된 샘플은 말레이시아 출신이었다. EpiSwitch™ 어세이에 적합한 혈액 샘플의 생화학적 품질은 헤모글로빈과 같이 샘플 산화 및 단백질 변성의 정도에 의해 직접적으로 영향을 받는다. 이러한 2 가지의 매개 변수(parameter)는 표본 처리 전에 혈액 품질을 평가하는 표준 수단이다. 간단히 말해, 산화된 헤모글로빈 (산화 헤모글로빈(oxyhaemoglobin))이 산화되면 메타헤모글로빈(methaemoglobin)이 형성되고, 글로빈 도메인이 변성되면 메타헤모글로빈이 헤미크롬(hemichrome)으로 전환된다. 분광 변화는 Winterbourn(1990), Oxidative reactions of hemoglobin에 의해 기재된 품질 관리 방법에 의해 각 분획(fraction)의 정도를 계산하는데 사용되었다. 문헌(Methods Enzymol. 1990; 186 : 265-72)은 각 헤모글로빈 분획의 흡광 계수(extinction coefficient)에 기초한다. 이 문헌에 따라, 각 샘플의 품질 관리의 일부로서 혈액을 PBS로 희석하고 분광 광도계(Epoch Microplate (BioTek))로 560, 577 및 630 nm에서 분석했다. 각각의 3 가지 헤모글로빈 분획의 마이크로 몰 농도를 표준 계산에 따라 모니터링 하였다: μM 옥시헤모글로빈(oxyhaemoglobin) = 119*A577-39*A630-89*A560, μM 메타헤모글로빈(methaemoglobin) = 28*A577+307*A630-55*A560, μM 헤미크롬(hemichrome) = -133*A577-114*A630+233*A560. 옥시헤모글로빈:메타헤모글로빈 비율이 ≥0.75인 샘플은 품질 관리를 통과하여 EpiSwitch™ 처리에 적합하다고 판단하였다. 11개 샘플(샘플 BrCaMa132, BrCaMa136, BrCaMa137, BrCaMa147, BrCaMa164, BrCaMa165, BrCaMa166, BrCaMa167, BrCaMa168, BrCaMa169, 및 BrCaMa170)은 헤모글로빈 QC에 실패하여, 산화 및 변성의 생화학적 상태에 근거하여 제외하였다.
샘플의 옥시/메타-Hb(Oxy/met-Hb) 비율 임계 값 및 통계 프로세스 내 용도
샘플 ID 클라이언트(client) ID 기본 주석(Basic annotation) OD 577nm OD 630nm OD 560nm QC : nM oxYes-Hb est QC : μM met-Hb est QC: oxYes/met-Hb 비율(ratio) 개발 코호트
(Development Cohort)
독립 검증 코호트(Independent Validation Cohort) QC : 이상치(Outliers)
BrCaMa- 002 022 - 사이트 01 BrCa 대조군 1.924 0.296 1.243 1067.85 763.79 1.398 Yes
BrCaMa- 005 013 - 사이트 01 BrCa 대조군 2.602 0.205 1.572 1617.35 493.31 3.279 Yes
BrCaMa- 006 024 - 사이트 01 BrCa 대조군 1.887 0.269 1.204 1069.06 691.99 1.545 Yes
BrCaMa- 007 015 - 사이트 01 BrCa 대조군 2.384 0.196 1.44 1478.92 477.24 3.099 Yes
BrCaMa- 012 019 - 사이트 01 BrCa 대조군 1.861 0.341 1.232 985.12 890.35 1.106 Yes
BrCaMa- 014 020 - 사이트 01 BrCa 대조군 1.851 0.284 1.192 1031.05 734.56 1.404 Yes
BrCaMa- 015 008 - 사이트 01 BrCa 대조군 2.752 0.25 1.681 1681.29 613.51 2.74 Yes
BrCaMa- 016 007 - 사이트 01 BrCa 대조군 2.56 0.225 1.557 1572.92 551.2 2.854 Yes
BrCaMa- 017 009 - 사이트 01 BrCa 대조군 2.492 0.203 1.504 1547.75 493.77 3.135 Yes
BrCaMa- 018 010 - 사이트 01 BrCa 대조군 2.246 0.182 1.353 1397.59 443.47 3.151 Yes
BrCaMa- 019 038 - 사이트 01 BrCa 1.756 0.326 1.158 931.88 855.6 1.089 Yes
BrCaMa- 020 037 - 사이트 01 BrCa 1.68 0.317 1.114 884.11 830.89 1.064 Yes
BrCaMa- 021 031 - 사이트 01 BrCa 대조군 2.074 0.271 1.318 1189.35 687.79 1.729 Yes
BrCaMa- 022 032 - 사이트 01 BrCa 대조군 2.767 0.216 1.67 1722.19 519.38 3.316 Yes
BrCaMa- 023 030 - 사이트 01 BrCa 대조군 1.566 0.235 1 881.89 609.93 1.446 Yes
BrCaMa- 024 035 - 사이트 01 BrCa 2.18 0.32 1.402 1221.62 821.7 1.487 Yes
BrCaMa- 025 036 - 사이트 01 BrCa 1.844 0.326 1.212 988.54 850.54 1.162 Yes
BrCaMa- 026 034 - 사이트 01 BrCa 대조군 2.021 0.391 1.351 1050.11 1023.2 1.026 Yes
BrCaMa- 027 033 - 사이트 01 BrCa 대조군 1.761 0.208 1.101 1034.58 526.09 1.967 Yes
BrCaMa- 028 026 - 사이트 01 BrCa 대조군 1.485 0.32 1.003 749.68 846.55 0.886 Yes
BrCaMa- 029 025 - 사이트 01 BrCa 대조군 1.595 0.234 1.022 897.21 602.88 1.488 Yes
BrCaMa- 030 027 - 사이트 01 BrCa 대조군 2.044 0.326 1.321 1129.53 846.59 1.334 Yes
BrCaMa- 031 029 - 사이트 01 BrCa 대조군 1.944 0.379 1.296 1012.11 995.05 1.017 Yes
BrCaMa- 032 028 - 사이트 01 BrCa 1.634 0.26 1.056 903.22 674.92 1.338 Yes
BrCaMa- 036 005 - 사이트 01 BrCa 2.678 0.241 1.629 1643.02 593.76 2.767 Yes
BrCaMa- 039 001 - 사이트 04 BrCa 1.986 0.346 1.304 1067.84 901.1 1.185 Yes
BrCaMa- 040 002 - 사이트 04 BrCa 1.635 0.245 1.056 910.26 629.15 1.447 Yes
BrCaMa- 041 003 - 사이트 04 BrCa 1.847 0.365 1.235 956.43 958.46 0.998 Yes
BrCaMa- 042 007 - 사이트 04 BrCa 1.874 0.28 1.213 1041.29 717.17 1.452 Yes
BrCaMa- 043 004 - 사이트 04 BrCa 대조군 2.452 0.208 1.494 1507.1 503.42 2.994 Yes
BrCaMa- 044 005 - 사이트 04 BrCa 대조군 1.802 0.424 1.256 861.18 1115.44 0.772 Yes
BrCaMa- 045 006 - 사이트 04 BrCa 대조군 1.733 0.376 1.18 865.43 990.56 0.874 Yes
BrCaMa- 046 008 - 사이트 04 BrCa 대조군 1.888 0.329 1.241 1013.92 856.12 1.184 Yes
BrCaMa- 050 039 - 사이트 01 BrCa 1.537 0.312 1.034 787.09 819.5 0.96 Yes
BrCaMa- 051 040 - 사이트 01 BrCa 1.951 0.316 1.265 1072.6 820.65 1.307 Yes
BrCaMa- 055 044 - 사이트 01 BrCa 대조군 2.984 0.217 1.803 1861.66 510.06 3.65 Yes
BrCaMa- 056 045 - 사이트 01 BrCa 대조군 2.545 0.235 1.555 1552.95 578.8 2.683 Yes
BrCaMa- 057 046 - 사이트 01 BrCa 대조군 2.455 0.202 1.484 1521.91 491.34 3.097 Yes
BrCaMa- 058 047 - 사이트 01 BrCa 대조군 1.507 0.292 1.003 786.78 766.75 1.026 Yes
BrCaMa- 059 048 - 사이트 01 BrCa 대조군 2.69 0.236 1.638 1651.24 576.82 2.863 Yes
BrCaMa- 060 049 - 사이트 01 BrCa 1.863 0.341 1.238 982.16 887.61 1.107 Yes
BrCaMa- 061 050 - 사이트 01 BrCa 2.119 0.36 1.397 1137.88 930.17 1.223 Yes
BrCaMa- 062 051 - 사이트 01 BrCa 1.752 0.334 1.165 917.77 875.19 1.049 Yes
BrCaMa- 063 052 - 사이트 01 BrCa 1.758 0.331 1.169 922.52 865.46 1.066 Yes
BrCaMa- 064 053 - 사이트 01 BrCa 1.898 0.297 1.222 1055.21 771.13 1.368 Yes
BrCaMa- 065 054 - 사이트 01 BrCa 1.599 0.227 1.02 906.48 583.61 1.553 Yes
BrCaMa- 066 055 - 사이트 01 BrCa 1.5 0.286 0.996 787.02 750.22 1.049 Yes
BrCaMa- 067 001 - 사이트 02 BrCa 1.821 0.36 1.227 934.56 940.23 0.994 Yes
BrCaMa- 068 002 - 사이트 02 BrCa 2.476 0.231 1.51 1512.45 571.95 2.644 Yes
BrCaMa- 069 003 - 사이트 02 BrCa 2.461 0.452 1.644 1289.15 1172.52 1.099 Yes
BrCaMa- 070 004 - 사이트 02 BrCa 2.156 0.377 1.425 1150.36 977.32 1.177 Yes
BrCaMa- 071 005 - 사이트 02 BrCa 1.898 0.346 1.262 1000.5 899.56 1.112 Yes
BrCaMa- 072 006 - 사이트 02 BrCa 1.807 0.411 1.24 886.44 1085.73 0.816 Yes
BrCaMa- 073 007 - 사이트 02 BrCa 1.839 0.378 1.247 931.16 989.53 0.941 Yes
BrCaMa- 074 008 - 사이트 02 BrCa 1.767 0.317 1.176 932.46 821.15 1.136 Yes
BrCaMa- 075 009 - 사이트 02 BrCa 2.141 0.343 1.398 1169.8 883.59 1.324 Yes
BrCaMa- 076 010 - 사이트 02 BrCa 2.148 0.409 1.438 1116.79 1066.17 1.047 Yes
BrCaMa- 077 011 - 사이트 02 BrCa 1.721 0.344 1.156 884.99 902.16 0.981 Yes
BrCaMa- 078 012 - 사이트 02 BrCa 2.142 0.448 1.454 1080.2 1175.42 0.919 Yes
BrCaMa- 079 013 - 사이트 02 BrCa 1.888 0.281 1.213 1057.56 724.16 1.46 Yes
BrCaMa- 080 014 - 사이트 02 BrCa 1.97 0.301 1.264 1101.95 780.47 1.412 Yes
BrCaMa- 081 015 - 사이트 02 BrCa 2.128 0.312 1.373 1188.67 798.53 1.489 Yes
BrCaMa- 082 016 - 사이트 02 BrCa 1.978 0.332 1.303 1064.67 856.43 1.243 Yes
BrCaMa- 083 017 - 사이트 02 BrCa 2.025 0.389 1.357 1050.31 1014.88 1.035 Yes
BrCaMa- 084 018 - 사이트 02 BrCa 2.048 0.362 1.358 1087.32 937.88 1.159 Yes
BrCaMa- 085 019 - 사이트 02 BrCa 2.216 0.388 1.457 1188.99 1010.29 1.177 Yes
BrCaMa- 086 020 - 사이트 02 BrCa 1.549 0.354 1.066 756.51 934.2 0.81 Yes
BrCaMa- 087 021 - 사이트 02 BrCa 2.064 0.366 1.363 1100.35 951.89 1.156 Yes
BrCaMa- 088 022 - 사이트 02 BrCa 1.734 0.362 1.172 879.2 952.26 0.923 Yes
BrCaMa- 089 023 - 사이트 02 BrCa 2.063 0.431 1.393 1047.11 1134.66 0.923 Yes
BrCaMa- 090 024 - 사이트 02 BrCa 1.966 0.429 1.349 971.62 1125.56 0.863 Yes
BrCaMa- 091 025 - 사이트 02 BrCa 1.697 0.309 1.124 898.56 805.59 1.115 Yes
BrCaMa- 093 001 - 사이트 02 BrCa 대조군 1.539 0.295 1.025 804.11 772.82 1.04 Yes
BrCaMa- 094 002 - 사이트 02 BrCa 대조군 1.634 0.311 1.089 853.96 813.34 1.05 Yes
BrCaMa- 095 003 - 사이트 02 BrCa 대조군 1.381 0.313 0.947 678.49 826.74 0.821 Yes
BrCaMa- 096 004 - 사이트 02 BrCa 대조군 1.545 0.286 1.021 818.32 749.07 1.092 Yes
BrCaMa- 097 005 - 사이트 02 BrCa 대조군 1.817 0.297 1.177 998.87 773.2 1.292 Yes
BrCaMa- 098 006 - 사이트 02 BrCa 대조군 1.753 0.375 1.194 877.16 985.39 0.89 Yes
BrCaMa- 099 007 - 사이트 02 BrCa 대조군 2.129 0.336 1.381 1173.38 868.09 1.352 Yes
BrCaMa- 100 008 - 사이트 02 BrCa 대조군 1.693 0.274 1.102 927.03 709.12 1.307 Yes
BrCaMa- 101 009 - 사이트 02 BrCa 대조군 0.988 0.147 0.634 554.13 379.23 1.461 Yes
BrCaMa- 102 010 - 사이트 02 BrCa 대조군 2.017 0.274 1.279 1155.06 702.49 1.644 Yes
BrCaMa- 103 011 - 사이트 02 BrCa 대조군 2.011 0.287 1.283 1139.29 738.52 1.543 Yes
BrCaMa- 104 012 - 사이트 02 BrCa 대조군 1.853 0.356 1.231 970.64 934.71 1.038 Yes
BrCaMa- 105 013 - 사이트 02 BrCa 대조군 1.802 0.379 1.214 916.11 1000.39 0.916 Yes
BrCaMa- 106 014 - 사이트 02 BrCa 대조군 1.943 0.271 1.244 1099.32 691.81 1.589 Yes
BrCaMa- 107 015 - 사이트 02 BrCa 대조군 1.933 0.288 1.248 1077.23 739 1.458 Yes
BrCaMa- 108 016 - 사이트 02 BrCa 대조군 1.774 0.374 1.209 889.19 979.95 0.907 Yes
BrCaMa- 109 017 - 사이트 02 BrCa 대조군 1.774 0.316 1.166 950.08 825.54 1.151 Yes
BrCaMa- 110 018 - 사이트 02 BrCa 대조군 1.639 0.31 1.087 862.08 812.77 1.061 Yes
BrCaMa- 111 019 - 사이트 02 BrCa 대조군 2.169 0.399 1.435 1148.35 1043 1.101 Yes
BrCaMa- 112 020 - 사이트 02 BrCa 대조군 2.017 0.359 1.324 1081.86 938.69 1.153 Yes
BrCaMa- 113 021 - 사이트 02 BrCa 대조군 1.817 0.323 1.189 978.05 846.42 1.156 Yes
BrCaMa- 114 022 - 사이트 02 BrCa 대조군 1.716 0.296 1.13 920.9 767.7 1.2 Yes
BrCaMa- 115 023 - 사이트 02 BrCa 대조군 1.609 0.242 1.038 896.51 622.56 1.44 Yes
BrCaMa- 116 024 - 사이트 02 BrCa 대조군 2.054 0.348 1.349 1107.93 901.53 1.229 Yes
BrCaMa- 117 025 - 사이트 02 BrCa 대조군 1.956 0.362 1.304 1025.9 941.82 1.089 Yes
BrCaMa- 118 056 - 사이트 01 BrCa 1.153 0.203 0.755 620.95 530.8 1.17 Yes
BrCaMa- 119 057 - 사이트 01 BrCa 1.79 0.326 1.185 948.31 850.27 1.115 Yes
BrCaMa- 120 058 - 사이트 01 BrCa 1.383 0.286 0.933 703.86 752.11 0.936 Yes
BrCaMa- 121 059 - 사이트 01 BrCa 1.043 0.171 0.672 576.4 447.41 1.288 Yes
BrCaMa- 122 060 - 사이트 01 BrCa 1.834 0.316 1.198 993 824.74 1.204 Yes
BrCaMa- 123 061 - 사이트 01 BrCa 1.782 0.315 1.168 958.21 823.61 1.163 Yes
BrCaMa- 124 062 - 사이트 01 BrCa 1.166 0.184 0.754 644.72 476.66 1.353 Yes
BrCaMa- 125 063 - 사이트 01 BrCa 1.638 0.293 1.075 878.2 766.9 1.145 Yes
BrCaMa- 126 064 - 사이트 01 BrCa 1.542 0.274 1.011 828.33 716.89 1.155 Yes
BrCaMa- 127 065 - 사이트 01 BrCa 1.349 0.352 0.943 628.76 939.71 0.669 Yes
BrCaMa- 129 009 - 사이트 04 BrCa 1.727 0.31 1.139 920.52 808.81 1.138 Yes
BrCaMa- 130 010 - 사이트 04 BrCa 대조군 2.016 0.303 1.308 1116.75 775.29 1.44 Yes
BrCaMa- 131 001 - 사이트 03 BrCa 2.063 0.379 1.386 1073.62 978.87 1.097 Yes
BrCaMa- 132 002 - 사이트 03 BrCa 대조군 1.719 0.428 1.211 800.9 1129.23 0.709
BrCaMa- 133 003 - 사이트 03 BrCa 대조군 1.825 0.322 1.221 959.48 827.99 1.159 Yes
BrCaMa- 134 004 - 사이트 03 BrCa 1.855 0.383 1.256 940.24 1004.41 0.936 Yes
BrCaMa- 135 005 - 사이트 03 BrCa 대조군 2.024 0.402 1.365 1036.93 1050.11 0.987 Yes
BrCaMa- 136 사이트 3_006 BrCa 0.134 0.11 0.136 -4.48 300.42 -0.015
BrCaMa- 137 사이트 3_007 BrCa 0.139 0.116 0.141 -5.32 317.49 -0.017
BrCaMa- 138 008 - 사이트 03 BrCa 대조군 1.308 0.514 1.021 447.37 1382.67 0.324 Yes
BrCaMa- 139 009 - 사이트 03 BrCa 대조군 1.595 0.532 1.188 633.25 1426.44 0.444 Yes
BrCaMa- 140 010 - 사이트 03 BrCa 0.217 0.069 0.155 93.37 187.34 0.498 Yes
BrCaMa- 141 026 - 사이트 02 BrCa 1.715 0.397 1.182 834.04 1048.89 0.795 Yes
BrCaMa- 142 027 - 사이트 02 BrCa 1.626 0.276 1.063 881.23 717.95 1.227 Yes
BrCaMa- 143 028 - 사이트 02 BrCa 0.218 0.062 0.153 99.07 167.23 0.592 Yes
BrCaMa- 144 029 - 사이트 02 BrCa 1.704 0.341 1.142 878.39 895.89 0.98 Yes
BrCaMa- 145 030 - 사이트 02 BrCa 1.721 0.311 1.143 909.43 808 1.126 Yes
BrCaMa- 146 031 - 사이트 02 BrCa 1.96 0.385 1.317 1010.12 1006.4 1.004 Yes
BrCaMa- 147 032 - 사이트 02 BrCa 0.227 0.071 0.162 98.26 192.43 0.511
BrCaMa- 148 033 - 사이트 02 BrCa 1.502 0.317 1.018 757.73 833.85 0.909 Yes
BrCaMa- 149 035 - 사이트 02 BrCa 1.7 0.336 1.141 876.47 879.97 0.996 Yes
BrCaMa- 150 036 - 사이트 02 BrCa 1.955 0.339 1.283 1052.37 882.48 1.193 Yes
BrCaMa- 151 037 - 사이트 02 BrCa 1.66 0.333 1.112 855.85 875.51 0.978 Yes
BrCaMa- 152 038 - 사이트 02 BrCa 2.434 0.491 1.637 1248.04 1288.54 0.969 Yes
BrCaMa- 153 039 - 사이트 02 BrCa 1.77 0.324 1.175 934.19 844.03 1.107 Yes
BrCaMa- 154 040 - 사이트 02 BrCa 1.871 0.35 1.247 980.16 912.53 1.074 Yes
BrCaMa- 155 041 - 사이트 02 BrCa 1.694 0.363 1.159 842.78 951.28 0.886 Yes
BrCaMa- 156 042 - 사이트 02 BrCa 1.828 0.371 1.231 935.04 973.76 0.96 Yes
BrCaMa- 157 043 - 사이트 02 BrCa 1.75 0.337 1.17 909.77 881.09 1.033 Yes
BrCaMa- 158 044 - 사이트 02 BrCa 1.851 0.356 1.238 962.03 930.3 1.034 Yes
BrCaMa- 159 045 - 사이트 02 BrCa 1.77 0.321 1.171 938.92 837.02 1.122 Yes
BrCaMa- 160 046 - 사이트 02 BrCa 1.67 0.347 1.126 849.83 913.59 0.93 Yes
BrCaMa- 161 047 - 사이트 02 BrCa 0.18 0.06 0.131 74.21 162.55 0.457 Yes
BrCaMa- 162 048 - 사이트 02 BrCa 1.846 0.393 1.257 924.74 1032.04 0.896 Yes
BrCaMa- 163 049 - 사이트 02 BrCa 1.63 0.436 1.161 736.37 1156.37 0.637 Yes
BrCaMa- 164 050 - 사이트 02 BrCa 1.08 0.75 1.028 77.78 2039.5 0.038 Yes
BrCaMa- 165 사이트 2_051 BrCa 0.135 0.098 0.125 11.18 269.91 0.041
BrCaMa- 166 사이트 2_052 BrCa 0.578 0.388 0.567 31.87 1041.15 0.031
BrCaMa- 167 053 - 사이트 02 BrCa 1.021 0.692 0.974 78.25 1874.62 0.042 Yes
BrCaMa- 168 054 - 사이트 02 BrCa 0.899 0.63 0.849 68.5 1718.87 0.04 Yes
BrCaMa- 169 055 - 사이트 02 BrCa 1.799 1.162 1.754 126.57 3106.36 0.041 Yes
BrCaMa- 170 056 - 사이트 02 BrCa 1.497 0.939 1.431 141.63 2514.84 0.056 Yes
BrCaMa- 171 026 - 사이트 02 BrCa 대조군 1.495 0.373 1.048 700.86 987.31 0.71 Yes
BrCaMa- 172 027 - 사이트 02 BrCa 대조군 1.92 0.448 1.328 928.16 1182.56 0.785 Yes Yes
BrCaMa- 173 028 - 사이트 02 BrCa 대조군 2.1 0.392 1.392 1107.24 1025.84 1.079 Yes Yes
BrCaMa- 174 029 - 사이트 02 BrCa 대조군 2.125 0.335 1.377 1172.57 866.1 1.354 Yes
BrCaMa- 175 030 - 사이트 02 BrCa 대조군 1.935 0.41 1.313 974.18 1078.35 0.903 Yes
BrCaMa- 176 031 - 사이트 02 BrCa 대조군 1.812 0.314 1.186 978.28 819.04 1.194 Yes Yes
BrCaMa- 177 032 - 사이트 02 BrCa 대조군 1.821 0.344 1.213 953.26 898.81 1.061 Yes Yes
BrCaMa- 178 033 - 사이트 02 BrCa 대조군 1.617 0.324 1.08 836.67 853.44 0.98 Yes
BrCaMa- 179 034 - 사이트 02 BrCa 대조군 1.429 0.255 0.942 762.68 664.87 1.147 Yes
BrCaMa- 180 035 - 사이트 02 BrCa 대조군 1.44 0.217 0.921 809.28 562.84 1.438 Yes Yes
BrCaMa- 181 036 - 사이트 02 BrCa 대조군 1.882 0.358 1.253 984.79 936.87 1.051 Yes Yes
BrCaMa- 182 037 - 사이트 02 BrCa 대조군 1.752 0.329 1.16 924.17 862.59 1.071 Yes Yes
BrCaMa- 183 038 - 사이트 02 BrCa 대조군 2 0.363 1.321 1062.74 947.86 1.121 Yes Yes
BrCaMa- 184 039 - 사이트 02 BrCa 대조군 1.852 0.289 1.196 1026.73 747.99 1.373 Yes Yes
BrCaMa- 185 040 - 사이트 02 BrCa 대조군 1.618 0.361 1.103 802.96 954.66 0.841 Yes
BrCaMa- 186 041 - 사이트 02 BrCa 대조군 1.762 0.325 1.166 932.29 849.81 1.097 Yes
BrCaMa- 187 042 - 사이트 02 BrCa 대조군 1.818 0.309 1.186 987.37 805.37 1.226 Yes
BrCaMa- 188 043 - 사이트 02 BrCa 대조군 1.935 0.318 1.255 1061.68 827.81 1.283 Yes
BrCaMa- 189 044 - 사이트 02 BrCa 대조군 1.723 0.297 1.127 931.51 774.38 1.203 Yes
BrCaMa- 190 045 - 사이트 02 BrCa 대조군 1.875 0.36 1.248 980.13 943.8 1.038 Yes
BrCaMa- 191 046 - 사이트 02 BrCa 대조군 1.784 0.267 1.146 998.89 688.91 1.45 Yes
BrCaMa- 192 047 - 사이트 02 BrCa 대조군 1.742 0.413 1.202 842.13 1094.57 0.769 Yes
BrCaMa- 193 048 - 사이트 02 BrCa 대조군 1.872 0.309 1.217 1024.04 803.44 1.275 Yes
BrCaMa- 194 049 - 사이트 02 BrCa 대조군 1.616 0.257 1.046 891.87 666.17 1.339 Yes
BrCaMa- 195 050 - 사이트 02 BrCa 대조군 1.265 0.209 0.823 691.37 543.18 1.273 Yes
BrCaMa- 196 051 - 사이트 02 BrCa 대조군 1.601 0.358 1.096 790.13 944.54 0.837 Yes
BrCaMa- 197 052 - 사이트 02 BrCa 대조군 1.661 0.24 1.061 938.7 618.33 1.518 Yes
BrCaMa- 198 053 - 사이트 02 BrCa 대조군 1.546 0.272 1.015 830.31 709.67 1.17 Yes
BrCaMa- 199 054 - 사이트 02 BrCa 대조군 1.505 0.314 1.019 761.58 824.93 0.923 Yes
BrCaMa- 200 055 - 사이트 02 BrCa 대조군 1.939 0.309 1.256 1069.06 800.75 1.335 Yes
BrCaMa- 201 사이트 05-001 BrCa 1.077 0.083 0.645 675.655 201.895 3.347 Yes
BrCaMa- 202 사이트 05-002 BrCa 대조군 0.985 0.084 0.592 612.213 208.01 2.943 Yes
BrCaMa- 203 사이트 05-003 BrCa 0.858 0.079 0.52 527.805 196.073 2.692 Yes
BrCaMa- 204 사이트 05-004 BrCa 0.929 0.088 0.563 570.093 218.958 2.604 Yes
BrCaMa- 205 사이트 05-005 BrCa 0.82 0.072 0.494 507.638 177.965 2.852 Yes
BrCaMa- 206 사이트 05-006 BrCa 0.821 0.071 0.494 509.685 174.75 2.917 Yes
BrCaMa- 207 사이트 05-007 BrCa 0.993 0.085 0.599 615.535 210.445 2.925 Yes
BrCaMa- 208 사이트 05-008 BrCa 대조군 0.846 0.079 0.512 521.188 196.62 2.651 Yes
BrCaMa- 209 사이트 05-009 BrCa 대조군 0.534 0.059 0.327 320.603 150.523 2.13 Yes
BrCaMa- 210 사이트 05-010 BrCa 대조군 0.854 0.074 0.515 528.775 182.28 2.901 Yes
BrCaMa- 211 사이트 05-011 BrCa 대조군 0.806 0.079 0.492 490.5 198.583 2.47 Yes
BrCaMa- 212 사이트 05-012 BrCa 1.13 0.083 0.673 712.738 199.248 3.577 Yes
BrCaMa- 213 사이트 05-013 BrCa 대조군 1.005 0.085 0.605 623.435 210.09 2.967 Yes
BrCaMa- 214 사이트 05-014 BrCa 1.233 0.086 0.732 781.85 204.985 3.814 Yes
BrCaMa- 215 사이트 05-015 BrCa 대조군 1.081 0.093 0.655 667.788 227.38 2.937 Yes
BrCaMa- 216 사이트 05-016 BrCa 1.112 0.092 0.667 693.89 225.483 3.077 Yes
BrCaMa- 217 사이트 05-017 BrCa 대조군 0.973 0.082 0.585 605.285 201.03 3.011 Yes
BrCaMa- 218 사이트 05-018 BrCa 대조군 1.088 0.087 0.65 682.81 214.438 3.184 Yes
BrCaMa- 219 사이트 05-019 BrCa 대조군 1.018 0.082 0.609 637.258 202.665 3.144 Yes
BrCaMa- 220 사이트 05-020 BrCa 1.451 0.098 0.861 921.855 231.848 3.976 Yes
ISH- 1008 N/A BrCa 2.358 0.269 1.464 1398.15 680.87 2.053 Yes
MM- 5013 N/A BrCa 대조군 2.528 0.365 1.617 1426.84 939.04 1.519 Yes
PAH- 1004 N/A BrCa 2.06 0.312 1.334 1142.46 800.94 1.426 Yes
PAH- 1007 N/A BrCa 1.921 0.232 1.214 1115.05 582.42 1.915 Yes
모든 처리된 샘플의 후생적 프로파일링은 아웃라이어(outlier)에 대한 두 번째 품질 관리를 포함했다. 쉽먼트 122 (사이트(site) 2 배치(batch) 2 대조군)는 모든 다른 사이트 및 쉽먼트와 근본적으로 다른 분배 및 품질을 입증했다. 아웃라이어 대조군의 표준 실습에 따라, 사이트 2 배치 2 (쉽먼트 122)의 30개 샘플은 시험 개발에서 제외되었다.
EpiSwitch ™ 어레이 결과
Figure 112018109945797-pct00001
두 개 데이터 세트는 많은 중요한 프로브를 생성했다.
Figure 112018109945797-pct00002
어레이 1, BCa1 4185 주요 EpiSwitch™ 마커가 유방암 대비 건강한 대조군의 분석에서 확인되었다.
Figure 112018109945797-pct00003
어레이 2, BCa2 4856 주요 EpiSwitch™ 마커가 유방암 대비 대조군의 분석에서 확인되었다.
Figure 112018109945797-pct00004
그러나 2개 연구 사이에 2116 개의 주요 프로브에 대한 두 가지 분석 사이에 중복이 있었다(도 1 참조).
모든 데이터는 처음으로 취해졌으며 모든 포화된 프로브는 제거되었다. 이후, 채널(channel)사이에 데이터를 균등하게 정규화하였다. 각 데이터 세트에 대한 4 개의 복제본 모두를 함께 결합하고, 변동 계수를 결정하였다. 상기 2116개 프로브는 정규화된 상관관계 값을 사용하여 어레이에서 가장 많이 변경된 유전자의 순위를 매기도록 좁혀졌다. 농축 분석(enrichment analysis)은 랜덤 확률(random chance)보다 가장 차별적으로 발현된 유전자를 찾는 데 사용되었다. 결합된 BCa1 및 BCa2 어레이로부터의 138개의 마커가 모두 상이하게 상향 조절되거나 하향 조절된 발현을 나타냈다. 유방암과 건강한 대조군 사이를 계층화하기 위해, EpiSwitch™ PCR 분석으로 검증하기 위해 어레이 1의 41개 마커와 어레이 2의 39개 마커를 포함하는 상위 80개의 EpiSwitch™ 마커(참조 부록 I)를 사용했다.
EpiSwitch™ PCR 플랫폼 및 마커 검증
프라이머는 마이크로 어레이에서 확인된 마커로부터 Integrated DNA Technologies(IDT) 소프트웨어 (및 필요한 경우 Primer3web 버전 4.0.0 소프트웨어)를 사용하여 설계되었다. 각 프라이머 세트에 대해 프라이머 테스트를 수행하였다. 적절한 프라이머가 잠재적인 상호 작용을 연구할 수 있다는 것을 확실하게 하기 위해, 샘플의 서브세트를 풀링하여 각 세트가 테스트되었다. 상기 프라이머 테스트가 성공적이면, 프라이머 세트를 스크리닝에 사용하였다.
168개의 샘플이 사용되었다. 이러한 샘플을 2 세트로 나누었다: 118 명의 환자 샘플 (68 BrCa 및 50 대조군)을 마커 감소 및 모델 개발에 사용하였고, 나머지 50개 샘플(31 BrCa 및 19 대조군)을 초기 118명의 환자 세트로부터 개발된 최종 모델을 검증하기 위한 독립 코호트로 사용하였다. 사이트 2, 쉽먼트 122(배치 2로 정의됨)로부터의 30개 대조군 샘플은 품질 관리 절차에서 이상치인 것이 입증됨에 따라 최종 환자 세트에서 사용되지 않았다.
프라이머 스크린
본 테스트는 비-특이적 프라이머를 제거하고, 프라이머가 3C 형태 루핑(conformational looping)의 검출을 가능하게 하는지 여부를 결정하는데 사용되었다. 모든 추출 혈액 샘플을 1:2 - 1:64로 희석하였다. 초기 결과는 바이너리 형식으로 생성되었다: 즉 '1'- 예(yes), 밴드가 올바른 크기로 존재함, 또는 '0'- 아니요(no), 밴드가 올바른 크기로 존재하지 않음. EpiSwitchTM PCR에 의한 모든 판독은 양성 및 음성 대조군 존재하에서 양성 및 음성 대조군 검출 정확도가 > 95% 상태에서 수행되었다.
스크린 1
51개 프라이머 세트는 프라이머 테스트 단계를 성공적으로 통과하였고, 8 BrCa 및 8 대조군 혈액 샘플에서 테스트 하였다. 제1 스크린에서 상기 샘플은 상기 어레이에 사용된 것과 일치하였다.
어레이 1 및 추가 PCR 검증에 사용된 샘플
BrCa 샘플 ID 환자 ID 대조군 샘플 ID 환자 ID
BrCaMa050 039 사이트 1 BrCaMa057 046 사이트 1
BrCaMa051 040 사이트 1 BrCaMa058 047 사이트 1
BrCaMa060 049 사이트 1 BrCaMa055 044 사이트 1
BrCaMa061 050 사이트 1 BrCaMa056 045 사이트 1
BrCaMa062 051 사이트 1 BrCaMa096 004 사이트 2
BrCaMa064 053 사이트 1 BrCaMa097 005 사이트 2
BrCaMa089 023 사이트 2 BrCaMa043 004 사이트 4
BrCaMa041 003 사이트 4 BrCaMa045 006 사이트 4
스크린 2
분화(differentiation)를 나타내는 프라이머 세트를 추가적인 12 개의 BrCa 및 12 개의 대조군 혈액 샘플로 스크리닝 하였다. 1:2 내지 1:64 희석 시리즈를 사용하여 분석 민감도의 범위를 확인하였다. 사용된 20개의 샘플 모두를 표시하여 제공하기 위해 스크린 1과 2의 결과를 합하였다. 추가적으로 24개의 BrCa 및 24 개의 대조군과 마지막으로 나머지 샘플에 대해 테스트하였다.
스크린 3
이후, 최종 20 개의 BrCa 및 20 개의 대조군 샘플을 가장 유용한 3 개의 희석액을 사용하여 스크리닝하여, 각 프라이머 세트에 대한 분석을 위한 검출의 민감한 범위를 커버하였다. 총 13 개의 마커가 최종 20 개 샘플 스크린에 사용되었다. 스크린 3의 결과는 BrCa 및 대조군 모두에 사용된 100 개의 샘플을 모두 표시하여 제공하기 위해 90개 BrCa 및 90개 대조군 샘플과 함께 합하였다. 그런 다음 BrCa 환자를 대조군 샘플과 차별화하는 효능에 대해 테스트하였다. 최종 마커를 제공하기 위해 카이-제곱 검정(chi-square test)(Fisher′s exact)을 생성하였다.
최종 마커 및 프라이머 세트
프로브(PROBES) 아우터(OUTERS) 이너(INNERS)
MELK_9_36577630_36579243_36637050_36643005_RF PRMR-2/4 PRMR-1/3
ATM_11_108118137_108126372_108155279_108156687_RF PRMR-54/56 PRMR-53/55
CDC6_17_38421089_38423079_38467677_38474960_FR PRMR-90/92 PRMR-89/91
CDC6_17_38421089_38423079_38451196_38457050_FF PRMR-102/104 PRMR-101/103
SLC16A10_6_111441989_111447305_111492951_111498421_FR PRMR-114/80 PRMR-113/115
TSPYL5_8_98276431_98282736_98316421_98318720_FF PRMR-130/132 PRMR-129/131
MAP3K1_5_56102259_56110500_56140227_56144076_FF PRMR-162/164 PRMR-161/163
ME3_11_86300063_86304401_86420537_86426200_FR PRMR-174/176 PRMR-173/175
SRD5A1_5_6634973_6639025_6667775_6669711_RF PRMR-178/180 PRMR-177/179
VAV3_1_108148303_108158073_108220200_108227533_RF PRMR-186/188 PRMR-185/187
FOXC1_6_1577253_1581989_1604206_1605973_FR PRMR-198/200 PRMR-197/199
NF1_17_29477103_29483764_29651799_29657368_FF PRMR-262/264 PRMR-261/263
MSH3_5_80021913_80025030_80153948_80159012_RF PRMR-302/304 PRMR-301/303
3개 희석 인자, 39개 마커와 마커 감소 13개 프라이머 조합
마지막으로 선택된 13개 위치 및 39 개의 마커를 작업 분류 모델로 감소하기 위해, R 통계 언어를 사용하는 GLMNET 패키지가 사용되었다. GLMNET는 리지(ridge) 또는 라소 회기(lasso regression)(마커의 동일-직선성(co-linearity)을 생략함)를 허용하는 불리한(탄성-망 페널티) 회귀 모델링(penalized regression modelling)을 수행한다. 라소 회귀 분석을 이용한 다변량 로지스틱 회귀 분석을 환자 세트 1에서 수행하였다[도 3 참조].
유전자 마커 GLMNET
SRD5A1_5 PRMR.177.179_2 0.233358596
NF1_17 PRMR.261.263_4 0.145129097
TSPYL5_8 PRMR.129.131_2 0.04597074
ME3_11 PRMR.173.175_4 0.019318541
VAV3_1 PRMR.185.187_8 -0.008248717
ATM_11 PRMR.53.55_32 -0.029412806
MAP3K1_5 PRMR.161.163_8 -0.045528058
SLC16A10_6 PRMR.113.115_4 -0.0174300311
3 가지 희석액을 이용한 13개-마커 세트는 세트 1의 118 명의 환자를 사용하여 8개 마커 세트로 감소하였다; 상기 마커에 대한 GLMNET 계수는 상기 표에 나와 있다. 상위 4개 마커는 BrCa 표현형으로 트렌드(trend)를 나타내고, 파란색의 하위 4개 마커는 대조군 표현형으로 트렌드를 나타낸다.
로지스틱 회귀 분석
로지스틱 회귀 분석은 WEKA(Waikato to Environment for Knowledge Analysis) 소프트웨어 버전 3.6.12를 사용하여 수행되었다. 이 분석을 사용하여 민감성과 특이성의 분류 기능이 환자 세트 1 (118 명의 환자, 68 BrCa 및 50 대조군)에 대해 확립되었고 GLMNET 분석으로 8 개의 마커를 확인하였다.
95% 신뢰 구간(Confidence Interval, CI)
민감성
(Sensitivity)
85.71% 57.2%-98.2%
특이성
(Specificity)
80.00% 44.4%-97.2%
PPV 85.71% 57.2%-98.2%
NPV 80.00% 44.4%-97.2%
상기 표는 118명의 환자, 8 개 마커 모델에 대한 모델 테스트 통계를 나타낸다. 상기 분류는 80% 트레이닝(94개의 알려진 샘플) 및 20% 테스트(20개의 블라인드 샘플) 분석을 기반으로 하였다. 이 모델의 AUC는 0.832이다.
모델 검증
상기 8개 마커 로지스틱 모델은 환자 세트 2 (31 BrCa 및 19개 대조군)에서 테스트 되었으며, 이러한 환자들은 마커를 줄이기 위해 사용되지 않았고 독립적인 데이터 세트이다.
95% 신뢰 구간(Confidence Interval, CI)
민감성
(Sensitivity)
83.3% 35.9%-99.6%
특이성
(Specificity)
100.0% 39.8%-100.0%
PPV 100.0% 47.8%-100.0%
NPV 80.0% 28.4%-99.5%
상기 표는 독립적인 50명의 환자 세트의 8개 마커 모델에 대한 모델 테스트 통계를 나타낸다. 상기 분류는 80% 트레이닝(40 개의 알려진 샘플) 및 20% 테스트(10 개의 블라인드 샘플) 분석을 기반으로 하였다. 이 모델의 AUC는 0.98이다.
주성분 분석 (Principal Components Analysis, PCA)은 복잡한 데이터 세트를 단순화하기 위한 탐구적 다변량 통계적인 기술이다. n 변수에 대한 m 관측치가 주어지면, 상기 PCA의 목표는 r이 n보다 작은 경우, r 개의 새로운 변수를 찾아 데이터 행렬의 차원을 감소시키는 것이다. 용어로 쓰인 주성분들, r개의 새로운 변수들은 함께 원래의 n 변수에서 가능한 한 많은 차이를 설명하며, 서로 상관되지 않고 직교성(orthogonal)을 유지한다. 각 주성분은 원래 변수의 선형 조합이므로, 성분이 나타내는 것에 의미를 부여하는 것이 종종 가능하다. 주성분 분석은 다른 타입의 발현 데이터의 분석뿐만 아니라 아웃라이어 유전자 검색에서 마이크로어레이 데이터의 분석을 포함하는 광범위한 생물의학적 문제에 사용되어 왔다.
Patient Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
MM5013 -1.800071608 0.492729305 0.6019709 0.438989393 1.26872044
BrCaMa219 -0.785966577 0.47223154 1.51829263 -1.895977084 -3.11799252
BrCaMa218 0.173347221 1.548046183 -0.91822436 0.767768358 -0.14166967
BrCaMa217 0.802477895 1.191180105 0.33952978 -0.318075596 1.27316931
BrCaMa215 1.113161481 1.960102724 -0.36790426 1.04353295 -0.62147173
BrCaMa213 0.350909675 1.263048827 -0.49646041 0.70813229 0.19512773
BrCaMa211 -0.120178677 1.753308317 1.88817334 -2.596145659 -1.63044319
BrCaMa210 -0.89241577 0.371232864 -1.64136315 -0.663666676 -0.27700782
BrCaMa209 -0.137336365 0.779123564 -0.21079032 -0.593840188 1.75297137
BrCaMa208 0.595430617 0.127397803 -0.49637741 -0.378540735 -1.98291708
BrCaMa202 -0.894770738 3.078346899 1.37016687 1.491976975 0.74357301
BrCaMa135 1.076504256 0.322159869 0.51996917 0.657857571 -0.69418208
BrCaMa133 -0.130163964 1.068286761 -1.51280699 -0.328266016 -1.09360727
BrCaMa117 1.261218517 1.40847458 -0.1264967 -1.07870931 -0.49536775
BrCaMa116 0.809650296 1.480343302 -0.96248689 -0.052501424 -1.57340933
BrCaMa115 0.321404256 0.996418039 -0.6768168 -1.354473902 -0.01556569
BrCaMa114 0.624915441 1.476177461 -0.08223417 -0.258439528 0.93637191
BrCaMa113 1.224561292 -0.229468275 0.76137673 -1.464384689 -0.56807811
BrCaMa112 0.802477895 1.191180105 0.33952978 -0.318075596 1.27316931
BrCaMa111 -0.440847549 0.299364142 -0.80537296 -1.689874562 0.80103376
BrCaMa110 0.802477895 1.191180105 0.33952978 -0.318075596 1.27316931
BrCaMa109 -0.89241577 0.371232864 -1.64136315 -0.663666676 -0.27700782
BrCaMa108 -1.375844377 2.883584833 0.35382028 0.455578669 -0.54516199
BrCaMa107 0.624915441 1.476177461 -0.08223417 -0.258439528 0.93637191
BrCaMa106 0.350909675 1.263048827 -0.49646041 0.70813229 0.19512773
BrCaMa105 -3.181468802 0.837563041 2.61664094 -1.078446956 0.133645
BrCaMa104 -0.89241577 0.371232864 -1.64136315 -0.663666676 -0.27700782
BrCaMa103 1.838756062 1.019213766 0.64852532 0.993258231 -1.51078154
BrCaMa094 -0.137336365 0.779123564 -0.21079032 -0.593840188 1.75297137
BrCaMa093 0.321404256 0.996418039 -0.6768168 -1.354473902 -0.01556569
BrCaMa059 0.321404256 0.996418039 -0.6768168 -1.354473902 -0.01556569
BrCaMa058 -0.440847549 0.299364142 -0.80537296 -1.689874562 0.80103376
BrCaMa057 -0.89241577 0.371232864 -1.64136315 -0.663666676 -0.27700782
BrCaMa056 -4.427149215 2.652861113 4.48326822 -0.294602271 0.68209028
BrCaMa055 -1.822244743 0.644197879 1.20929708 -3.207310911 -0.33404168
BrCaMa046 0.595430617 0.127397803 -0.49637741 -0.378540735 -1.98291708
BrCaMa045 -0.588904585 0.850992286 -1.04678051 0.432367698 0.67492979
BrCaMa044 0.04739849 0.783289405 -1.09104305 -0.387902084 -0.75680988
BrCaMa043 -3.936548207 0.429672342 1.18606812 -1.148273444 -1.89633418
BrCaMa031 0.321404256 0.996418039 -0.6768168 -1.354473902 -0.01556569
BrCaMa030 -0.89241577 0.371232864 -1.64136315 -0.663666676 -0.27700782
BrCaMa029 0.183332507 2.233067739 2.48275597 -1.500111286 -0.67850559
BrCaMa028 0.173347221 1.548046183 -0.91822436 0.767768358 -0.14166967
BrCaMa015 0.809650296 1.480343302 -0.96248689 -0.052501424 -1.57340933
BrCaMa014 0.624915441 1.476177461 -0.08223417 -0.258439528 0.93637191
BrCaMa012 0.624915441 1.476177461 -0.08223417 -0.258439528 0.93637191
BrCaMa007 1.261218517 1.40847458 -0.1264967 -1.07870931 -0.49536775
BrCaMa006 0.321404256 0.996418039 -0.6768168 -1.354473902 -0.01556569
BrCaMa005 -0.440847549 0.299364142 -0.80537296 -1.689874562 0.80103376
BrCaMa002 -2.735068436 3.076949995 1.76116414 2.584442624 -0.07747531
PAH1010-BRCA 2.155416969 -0.944242691 1.21265768 -0.457038415 -1.12641136
PAH1007-BRCA 1.429822388 -0.003353733 0.19622809 -0.406763696 -0.23710155
PAH1004-BRCA 0.038439907 -0.343541552 -1.1900822 0.343679598 -0.83534107
ISH1008-BRCA 0.667570582 -0.70040763 0.06767194 -0.742164356 0.57949791
BrCaMa220 0.490008128 -0.415410274 -0.35409201 -0.682528288 0.24270051
BrCaMa212 1.703848748 -0.872373969 0.37666749 0.569169471 -2.20445294
BrCaMa207 0.341951092 0.13621787 -0.59549956 1.439713972 0.11659654
BrCaMa206 0.27343348 0.938758261 3.12354749 1.147076052 0.85377359
BrCaMa205 -0.723811899 -1.040595449 -1.31863835 0.008278938 -0.01874161
BrCaMa204 0.001782682 -1.981484407 -0.30220877 -0.041995781 -0.90805142
BrCaMa162 1.733333573 0.476405689 0.79081073 0.689270678 0.71483606
BrCaMa160 0.031267506 -0.632704749 0.11193447 0.078105426 2.01123757
BrCaMa159 1.429822388 -0.003353733 0.19622809 -0.406763696 -0.23710155
BrCaMa158 -0.420300714 -0.560836027 -0.72405572 1.104313312 0.93319599
BrCaMa157 0.971081767 -0.220648208 0.66225457 0.353870018 1.53143551
BrCaMa156 -2.590781534 -1.994913652 3.36121269 -1.552810435 -1.44933621
BrCaMa155 0.490008128 -0.415410274 -0.35409201 -0.682528288 0.24270051
BrCaMa154 -0.272243678 -1.112464171 -0.48264816 -1.017928948 1.05929997
BrCaMa153 2.155416969 -0.944242691 1.21265768 -0.457038415 -1.12641136
BrCaMa152 0.764034488 -1.28443051 -0.17365262 0.293404879 -1.72465088
BrCaMa151 -0.578109831 1.114890442 1.93429922 0.041680329 1.12794319
BrCaMa150 -0.272243678 -1.112464171 -0.48264816 -1.017928948 1.05929997
BrCaMa149 0.341951092 0.13621787 -0.59549956 1.439713972 0.11659654
BrCaMa148 -2.083035957 -0.847230287 0.08870551 2.137142893 0.44894507
BrCaMa146 -2.083035957 -0.847230287 0.08870551 2.137142893 0.44894507
BrCaMa145 -0.272243678 -1.112464171 -0.48264816 -1.017928948 1.05929997
BrCaMa144 -0.417627116 -1.376062704 1.65545519 2.362632767 -0.9201668
BrCaMa143 0.756862087 -1.573593707 1.12836406 0.027830707 1.12192776
BrCaMa142 -0.898700755 -1.57082477 0.63910861 1.326234461 -2.2089018
BrCaMa141 0.031267506 -0.632704749 0.11193447 0.078105426 2.01123757
BrCaMa131 -0.272243678 -1.112464171 -0.48264816 -1.017928948 1.05929997
BrCaMa126 -2.386547141 -1.326989709 -0.50587713 1.04110852 -0.50299254
BrCaMa125 -0.723811899 -1.040595449 -1.31863835 0.008278938 -0.01874161
BrCaMa124 -2.386547141 -1.326989709 -0.50587713 1.04110852 -0.50299254
BrCaMa123 1.733333573 0.476405689 0.79081073 0.689270678 0.71483606
BrCaMa122 1.696676347 -1.161537166 1.67868416 0.303595299 0.6421257
BrCaMa121 0.453350903 -2.053353129 0.53378142 -1.068203667 0.16999016
BrCaMa120 1.733333573 0.476405689 0.79081073 0.689270678 0.71483606
BrCaMa119 -0.272243678 -1.112464171 -0.48264816 -1.017928948 1.05929997
BrCaMa118 0.031267506 -0.632704749 0.11193447 0.078105426 2.01123757
BrCaMa091 0.453350903 -2.053353129 0.53378142 -1.068203667 0.16999016
BrCaMa090 0.667570582 -0.70040763 0.06767194 -0.742164356 0.57949791
BrCaMa089 -0.723811899 -1.040595449 -1.31863835 0.008278938 -0.01874161
BrCaMa088 -0.272243678 -1.112464171 -0.48264816 -1.017928948 1.05929997
BrCaMa087 1.519113893 -0.87653981 1.25692021 0.363231367 0.30532831
BrCaMa086 0.031267506 -0.632704749 0.11193447 0.078105426 2.01123757
BrCaMa085 0.031267506 -0.632704749 0.11193447 0.078105426 2.01123757
BrCaMa084 0.667570582 -0.70040763 0.06767194 -0.742164356 0.57949791
BrCaMa083 -0.928046291 -1.708519392 2.54845146 -2.585640016 -0.96508529
BrCaMa082 -1.624295336 -0.629935812 -0.37732097 1.37650918 -1.31959199
BrCaMa081 -2.386547141 -1.326989709 -0.50587713 1.04110852 -0.50299254
BrCaMa074 0.453350903 -2.053353129 0.53378142 -1.068203667 0.16999016
BrCaMa073 0.764034488 -1.28443051 -0.17365262 0.293404879 -1.72465088
BrCaMa072 0.341951092 0.13621787 -0.59549956 1.439713972 0.11659654
BrCaMa071 -3.767944336 -0.982155972 1.50879291 -0.47632783 -1.63806798
BrCaMa070 0.793519312 0.064349148 0.24049063 0.413506086 1.19463812
BrCaMa069 -0.869215931 -0.222045112 1.05325185 1.446335667 0.71038719
BrCaMa068 1.733333573 0.476405689 0.79081073 0.689270678 0.71483606
BrCaMa067 -1.624295336 -0.629935812 -0.37732097 1.37650918 -1.31959199
BrCaMa066 0.756862087 -1.573593707 1.12836406 0.027830707 1.12192776
BrCaMa042 -1.624295336 -0.629935812 -0.37732097 1.37650918 -1.31959199
BrCaMa041 -0.723811899 -1.040595449 -1.31863835 0.008278938 -0.01874161
BrCaMa040 -0.723811899 -1.040595449 -1.31863835 0.008278938 -0.01874161
BrCaMa039 0.038439907 -0.343541552 -1.1900822 0.343679598 -0.83534107
BrCaMa025 -0.272243678 -1.112464171 -0.48264816 -1.017928948 1.05929997
BrCaMa024 2.458928153 -0.464483269 1.80724031 0.638995959 -0.17447375
BrCaMa020 -2.083035957 -0.847230287 0.08870551 2.137142893 0.44894507
BrCaMa019 -0.272243678 -1.112464171 -0.48264816 -1.017928948 1.05929997
BrCaMa101 -0.166821189 -0.569656094 -0.62493357 -0.713941395 -1.16631763
BrCaMa138 0.173347221 1.548046183 -0.91822436 0.767768358 -0.14166967
BrCaMa016 0.321404256 0.996418039 -0.6768168 -1.354473902 -0.01556569
BrCaMa017 0.04739849 0.783289405 -1.09104305 -0.387902084 -0.75680988
BrCaMa018 -0.130163964 1.068286761 -1.51280699 -0.328266016 -1.09360727
BrCaMa021 -0.89241577 0.371232864 -1.64136315 -0.663666676 -0.27700782
BrCaMa022 0.173347221 1.548046183 -0.91822436 0.767768358 -0.14166967
BrCaMa023 0.04739849 0.783289405 -1.09104305 -0.387902084 -0.75680988
BrCaMa026 0.809650296 1.480343302 -0.96248689 -0.052501424 -1.57340933
BrCaMa027 0.624915441 1.476177461 -0.08223417 -0.258439528 0.93637191
BrCaMa095 -0.130163964 1.068286761 -1.51280699 -0.328266016 -1.09360727
BrCaMa096 0.284747031 -0.641524816 0.21105663 -1.740149281 -0.08827605
BrCaMa097 -3.349263206 1.828267955 1.87401555 0.126799705 0.86522812
BrCaMa098 -0.588904585 0.850992286 -1.04678051 0.432367698 0.67492979
BrCaMa099 -0.588904585 0.850992286 -1.04678051 0.432367698 0.67492979
BrCaMa100 1.113161481 1.960102724 -0.36790426 1.04353295 -0.62147173
BrCaMa102 0.321404256 0.996418039 -0.6768168 -1.354473902 -0.01556569
BrCaMa130 1.113161481 1.960102724 -0.36790426 1.04353295 -0.62147173
BrCaMa139 -0.440847549 0.299364142 -0.80537296 -1.689874562 0.80103376
BrCaMa036 2.007359933 -0.392614547 0.97125012 1.665203845 -1.25251533
BrCaMa080 -0.723811899 -1.040595449 -1.31863835 0.008278938 -0.01874161
BrCaMa032 2.458928153 -0.464483269 1.80724031 0.638995959 -0.17447375
BrCaMa050 -2.386547141 -1.326989709 -0.50587713 1.04110852 -0.50299254
BrCaMa051 0.216002362 -0.628538908 -0.76831825 0.28404353 -0.49854367
BrCaMa060 -0.723811899 -1.040595449 -1.31863835 0.008278938 -0.01874161
BrCaMa061 -0.861883648 0.19605425 1.84093442 -0.137358446 -0.68168151
BrCaMa062 0.941596942 -1.569427866 0.24811133 0.233768811 -1.38785348
BrCaMa063 0.756862087 -1.573593707 1.12836406 0.027830707 1.12192776
BrCaMa064 -0.420300714 -0.560836027 -0.72405572 1.104313312 0.93319599
BrCaMa065 2.155416969 -0.944242691 1.21265768 -0.457038415 -1.12641136
BrCaMa075 1.281765352 0.548274411 -0.04517946 1.715478564 -0.36320552
BrCaMa076 -1.143221697 -0.435173746 0.63902561 2.412907486 -0.03085699
BrCaMa077 0.305293867 -1.501724985 0.29237387 1.054038593 0.04388618
BrCaMa078 1.733333573 0.476405689 0.79081073 0.689270678 0.71483606
BrCaMa079 0.216002362 -0.628538908 -0.76831825 0.28404353 -0.49854367
BrCaMa127 -0.420300714 -0.560836027 -0.72405572 1.104313312 0.93319599
BrCaMa129 -0.723811899 -1.040595449 -1.31863835 0.008278938 -0.01874161
BrCaMa134 0.978254168 0.068514989 -0.6397621 0.61944419 -1.31514313
BrCaMa140 -0.723811899 -1.040595449 -1.31863835 0.008278938 -0.01874161
BrCaMa161 0.341951092 0.13621787 -0.59549956 1.439713972 0.11659654
BrCaMa163 2.458928153 -0.464483269 1.80724031 0.638995959 -0.17447375
BrCaMa164 -0.420300714 -0.560836027 -0.72405572 1.104313312 0.93319599
BrCaMa167 0.341951092 0.13621787 -0.59549956 1.439713972 0.11659654
BrCaMa168 2.458928153 -0.464483269 1.80724031 0.638995959 -0.17447375
BrCaMa169 -0.420300714 -0.560836027 -0.72405572 1.104313312 0.93319599
BrCaMa170 0.453350903 -2.053353129 0.53378142 -1.068203667 0.16999016
BrCaMa201 1.519113893 -0.87653981 1.25692021 0.363231367 0.30532831
BrCaMa203 -0.272243678 -1.112464171 -0.48264816 -1.017928948 1.05929997
BrCaMa214 0.031267506 -0.632704749 0.11193447 0.078105426 2.01123757
BrCaMa216 1.703848748 -0.872373969 0.37666749 0.569169471 -2.20445294
상기 표에서는 상기 분석에 사용된 168개의 모든 샘플, 프로젝트의 개발 단계(118명 환자) 및 검증 단계(50 명 환자)를 사용하여 8개 마커 BrCa 모델 검증된 시그니처에 대한 요인 분석 데이터(주성분 분석)를 나타낸다.
결론
품질 관리 절차를 통해 다른 모든 샘플의 다른 사이트 및 쉽먼트로부터의 프로파일 및 품질면에서 근본적으로 다른 샘플로서 쉽먼트 122 (사이트 2 대조군)를 확인하고 제외하였다. EpiSwitch™ 방법론에 의한 염색체 형태 분석 및 로지스틱 회귀 분석의 결과는 85.7%의 민감성, 80%의 특이성, 85.7 %의 PPV 및 80 % NPV의 교차-검증 결과로 유방암 환자 및 건강한 대조군의 118개 샘플을 계층화한 8 개의 바이오 마커 시그니처를 개발하였다. 50 개의 샘플에 대한 독립적인 코호트 검증은 바이오마커의 83.3% 민감성, 100% 특이성, 100% PPV 및 80% NPV를 나타냈다.
부록(Appendix) I: 리드 마커 목록(Leading marker List)
대조군 샘플로부터 유방암을 계층화한 EpiSwitch™ 기술을 통해 확인된 80개의 마커.
어레이 1
번호 프로브
마커(Marker) 1 MELK_9_36577630_36579243_36637050_36643005_RF
마커(Marker) 2 TPRG1_3_188933689_188940214_188962938_188970637_FF
마커(Marker) 3 LYPD6_2_150146782_150153111_150236512_150246806_RR
마커(Marker) 4 KCNE4_2_223978296_223985382_224015903_224024643_FR
마커(Marker) 5 SYT9_11_7410026_7412890_7469239_7478268_RF
마커(Marker) 6 NOS1AP_1_162209626_162215852_162277389_162286110_RF
마커(Marker) 7 STK32B_4_5251609_5261154_5459392_5462470_FF
마커(Marker) 8 CENPK_5_64812989_64817647_64878910_64881785_RF
마커(Marker) 9 ATM_11_108055477_108058111_108208085_108223747_FF
마커(Marker) 10 AR_X_66911452_66916150_66961257_66967450_FF
마커(Marker) 11 MAPT_17_43962855_43965625_44076167_44084076_FR
마커(Marker) 12 CCNG2_4_78068534_78075153_78309908_78315095_FR
마커(Marker) 13 ADCY1_7_45624230_45629168_45722424_45731328_FF
마커(Marker) 14 ATM_11_108118137_108126372_108155279_108156687_RF
마커(Marker) 15 ESR1_6_152307023_152319013_152333402_152336355_FR
마커(Marker) 16 FMNL2_2_153432680_153440869_153479856_153483982_FF
마커(Marker) 17 MAP3K1_5_56069013_56071773_56102259_56110500_RF
마커(Marker) 18 SKP2_5_36136526_36142109_36155505_36160932_FR
마커(Marker) 19 SLC16A10_6_111430971_111434623_111492951_111498421_RR
마커(Marker) 20 SLC16A10_6_111393624_111400094_111492951_111498421_RR
마커(Marker) 21 SLC16A10_6_111388697_111391406_111492951_111498421_FR
마커(Marker) 22 CDC6_17_38421089_38423079_38467677_38474960_FR
마커(Marker) 23 NOS1AP_1_162189941_162197873_162209626_162215852_FR
마커(Marker) 24 SOX11_2_5786050_5796562_5820335_5823500_RF
마커(Marker) 25 CDC6_17_38421089_38423079_38451196_38457050_FF
마커(Marker) 26 SLC16A10_6_111430971_111434623_111492951_111498421_FR
마커(Marker) 27 BLVRA_7_43784657_43787628_43835273_43842181_FR
마커(Marker) 28 SLC16A10_6_111441989_111447305_111492951_111498421_FR
마커(Marker) 29 MAP3K1_5_56102259_56110500_56137105_56140227_FR
마커(Marker) 30 NOS1AP_1_162189941_162197873_162354198_162360018_FR
마커(Marker) 31 SLC16A10_6_111438349_111441989_111492951_111498421_FR
마커(Marker) 32 TSPYL5_8_98276431_98282736_98316421_98318720_FF
마커(Marker) 33 PCM1_8_17764504_17769874_17830373_17837849_FR
마커(Marker) 34 CDC6_17_38421089_38423079_38457050_38462370_FR
마커(Marker) 35 NOS1AP_1_162247113_162253340_162264341_162270934_FR
마커(Marker) 36 TSPYL5_8_98276431_98282736_98295938_98301017_FR
마커(Marker) 37 ESR1_6_152082003_152085698_152307023_152319013_RF
마커(Marker) 38 BARD1_2_215635297_215642717_215688320_215695844_RF
마커(Marker) 39 ESR1_6_152082003_152085698_152307023_152319013_FF
마커(Marker) 40 MAP3K1_5_56102259_56110500_56140227_56144076_FF
마커(Marker) 41 SCUBE2_11_9094735_9101051_9144362_9152463_RF
어레이 2
마커(Marker) 42 SYBU_8_110644489_110652424_110667554_110675383_FR
마커(Marker) 43 ME3_11_86300063_86304401_86420537_86426200_FR
마커(Marker) 44 SRD5A1_5_6634973_6639025_6667775_6669711_RF
마커(Marker) 45 SYTL2_11_85446267_85449759_85489426_85497695_FF
마커(Marker) 46 VAV3_1_108148303_108158073_108220200_108227533_RF
마커(Marker) 47 FOXC1_6_1577253_1581989_1622941_1624186_FR
마커(Marker) 48 SYTL2_11_85458295_85462105_85489426_85497695_FF
마커(Marker) 49 FOXC1_6_1577253_1581989_1604206_1605973_FR
마커(Marker) 50 FOXC1_6_1577253_1581989_1616641_1619635_FF
마커(Marker) 51 FOXC1_6_1577253_1581989_1608642_1611166_FF
마커(Marker) 52 AR_X_66736338_66750729_66911452_66916150_FR
마커(Marker) 53 FOXC1_6_1577253_1581989_1608642_1611166_FR
마커(Marker) 54 FOXC1_6_1577253_1581989_1621017_1622239_FF
마커(Marker) 55 AR_X_66875649_66881776_66911452_66916150_RF
마커(Marker) 56 FOXC1_6_1577253_1581989_1606219_1607879_FR
마커(Marker) 57 FOXC1_6_1577253_1581989_1622941_1624186_FF
마커(Marker) 58 FOXC1_6_1577253_1581989_1612413_1614478_FF
마커(Marker) 59 FMNL2_2_153385935_153395520_153444403_153446929_FR
마커(Marker) 60 GFRA1_10_117851659_117860183_117872774_117878186_RR
마커(Marker) 61 FOXC1_6_1577253_1581989_1606219_1607879_FF
마커(Marker) 62 RERG_12_15275463_15281772_15426692_15434723_FF
마커(Marker) 63 MSH3_5_80104716_80118379_80153948_80159012_FF
마커(Marker) 64 GPR126_6_142730628_142735943_142754471_142757840_FR
마커(Marker) 65 NF1_17_29477103_29483764_29651799_29657368_FF
마커(Marker) 66 AR_X_66750729_66754087_66950367_66956132_FF
마커(Marker) 67 FMNL2_2_153328638_153335686_153385935_153395520_RF
마커(Marker) 68 GFRA1_10_117891959_117898614_117911689_117919592_RR
마커(Marker) 69 NOSTRIN_2_169646544_169651214_169732611_169738179_RF
마커(Marker) 70 ADCY1_7_45638428_45640651_45722424_45731328_FF
마커(Marker) 71 CCNG2_4_78068534_78075153_78338468_78342587_RR
마커(Marker) 72 TPRG1_3_188814108_188822963_188962938_188970637_FF
마커(Marker) 73 GFRA1_10_117891959_117898614_117944517_117949325_RR
마커(Marker) 74 DACH1_13_71994847_72006255_72288568_72291811_RR
마커(Marker) 75 MSH3_5_80021913_80025030_80153948_80159012_RF
마커(Marker) 76 NOSTRIN_2_169599544_169606207_169732611_169738179_RF
마커(Marker) 77 FMNL2_2_153193445_153196492_153385935_153395520_RF
마커(Marker) 78 TPRG1_3_188823929_188830326_188962938_188970637_RF
마커(Marker) 79 BMPR1A_10_88534921_88537932_88549709_88557473_RF
마커(Marker) 80 PTPRT_20_40761966_40770575_40995945_41003669_FR
Figure 112018109945797-pct00005
상기 표 9의 3 가지 섹션은 마커 세트 1에 대한 최종 8개 마커의 정보를 제공한다.
8개 마커에 대한 PCR 프라이머
프로브(Probe) PCR - 프라이머1 _ID PCR _ 프라이머1 PCR - 프라이머2 _ID PCR _ 프라이머2 GLMNET
17_29477103_29483764_29651799_29657368_FF PRMR-261 TGTAGTAGTTACCCTGTTGTTG PRMR-263 GCCTCACAGTGCTCTTATG 0.1451291
8_98276431_98282736_98316421_98318720_FF PRMR-129 GTGCTTTGTAAACCATGAAGTG PRMR-131 TCGTGGGCATATGACTGAG 0.0459707
5_6634973_6639025_6667775_6669711_RF PRMR-177 GGCATTGCTTTGCCTTATC PRMR-179 CAACTTCCTTGGGTGTAGAG 0.2333586
5_56102259_56110500_56140227_56144076_FF PRMR-161 CGCTATATGTGGTTCTGTACG PRMR- 163 CTTCTCTAAAGGGAGATTTGGG -0.0455281
1_108148303_108158073_108220200_108227533_RF PRMR-185 TGTTGAGCAAGATGGATAGC PRMR-187 ATATTCAGGATGGAACCCAAG -0.0082487
11_108118137_108126372_108155279_108156687_RF PRMR-53 TCCAGAGGTTATGGAATTTGAG PRMR-55 AAGAAACAGACTGGGCTTG -0.0294128
6_111441989_111447305_111492951_111498421_FR PRMR-113 ACTCAAATACTGCTCTACACTG PRMR-115 AAGGAAGTTAAGCCCTATGC -0.01743
11_86300063_86304401_86420537_86426200_FR PRMR-173 ACCCTCCTTCACTCACATAG PRMR-175 GCACCTAATCTACCTAACATCAC 0.0193185
실시예 2
OBC(Oxford BioDynamics)는 비-정상적인 유전자 발현 및 후생적 분야에서 새롭게 특허 받은 플랫폼 기술을 제공하는 의료 서비스 회사이다. 상기 특허 받은 EpiSwitch™ 플랫폼 기술은 후생적 조절 시그니처 변화를 감지한다. 상기 EpiSwitch™ 바이오마커 발견 플랫폼은 환경 단서(cues)를 후생 유전학 및 전사 기계에 통합하는 초기 조절 방법을 정의하는 염색체 형성 시그니처 (Chromosome Conformation Signatures, CCS)를 확인한다. 이와 같이, CCS는 유전자 조절의 주요 단계이다.
EpiSwitch™ 바이오마커 발견 플랫폼으로 분리 된 CCS는 다음과 같은 몇 가지 장점을 가지고 있다:
→엄격한 생화학 및 생리학적 안정성;
→바이너리(binary) 특성 및 판독;
→진핵 생물의 유전자 조절에서 주요 포지션.
유전자 좌위에서 특정 형태의 시그니처는 병리 또는 치료와 관련된 조절 후생적 제어 설정으로 인해 존재하거나 존재하지 않는다. CCS는 낮은 수준의 오프-비율(off-rates)을 가지며, 특정 표현형이나 병리를 나타낼 때, 새로운 표현형으로의 생리학적 신호 전달 또는 외부 개입의 결과로서 변화할 뿐이다. 또한, 이러한 사건의 측정은 바이너리(binary)이며, 이러한 판독은 다양한 수준의 DNA 메틸화, 히스톤 변형 및 대부분의 비-코딩 RNA의 연속체 판독과 완전히 대조적이다. 지금까지 사용된 대부분의 분자 바이오마커에 대한 연속체 판독은 데이터 분석에 어려움이 있었는데, 특정 바이오 마커에 대한 변화의 규모(magnitude)가 환자에 따라 트게 달라서, 환자의 계층화에 사용되는 분류 통계에 문제를 야기하였다. 이러한 분류 통계 및 추론 접근법은 크기가 없는 바이오 마커를 사용하는 것이 더 적합하며, EpiSwitch™ CCS 바이오마커가 잠재적인 진단, 예후 및 예측 바이오마커를 위한 훌륭한 자원임을 나타내는 표현형 차이의 ‘예 또는 아니오’ 바이너리 스코어만 제공한다.
OBD는 1차 및 2차 영향을 받은 조직에 대한 높은 일치도와 강력한 검증 결과로 모든 개발된 응용 분야에서 높은 수준으로 나타나는 EpiSwitch™ 마커를 지속적으로 관찰하였다. EpiSwitch™ 바이오마커 시그니처는 복잡한 질병 표현형의 계층화에서 높은 견고성과 민감성 및 특이성을 나타낸다. 상기 OBD 기술은 후생 유전학 분야에서 최신 돌파구(breakthrough)의 장점을 취하고, 후생적 바이오마커의 매우 유익한 부류로서, 염색체 형태 시그니처의 발견, 모니터링 및 평가를 위한 독특하며 유일한 산업-품질의 ISO 인증된 플랫폼을 제공한다.
상기 EpiSwitch™ 기술은 이상 및 반응 유전자 발현과 관련된 주요 질병에 매우 효과적인 스크리닝; 조기 발견; 동반 진단; 모니터링 및 예후 분석의 수단을 제곧한다. 상기 OBD 접근법의 가장 큰 장점은 비-침습적이며, 신속하며, 불안정한 단백질/RNA 분자보다는 염색체 시그니처의 일부로서 매우 안정된 DNA 기반 표적에 의존한다는 것이다.
기술 개요
CCS는 후생학적 관리를 위한 안정적인 조절 체계와 세포의 전체 게놈에 걸친 유전 정보에 접근한다. CCS의 변화는 결과가 명백한 이상으로 드러나기 오래전에 조절 및 유전자 발현 양상의 조기 변화를 반영한다. CCS를 간단하게 생각하면, DNA의 서로 다른 멀리 떨어져 있는 조절 부분을 각각 서로의 기능에 영향을 미칠 수 있도록 근접시키는 토폴로지 배열(topological arrangements)이다. 이러한 연결은 무작위로 수행되지는 않는다; 이는 강하게 조절되며 중요한 바이오마커 계층화 능력을 가진 높은 레벨의 조절 메커니즘인 것으로 잘 알려져 있다. 빠르게 발전하고 있는 응용 후생 유전학 분야에서, CCS는 대체적인 바이오마커 플랫폼에 비해 상당한 장점을 제공한다. 새로운 바이오 마커 실체로서, CCS의 발견, 모니터링 및 검증은 품질, 안정성, 민감성, 재현성, 비용 및 운영 시간에 대한 성능면에서 업계에서 만족하는 기술을 요구한다.
게놈에 걸쳐 CCS의 고차원 구조를 형성할 가능성이 있는 DNA는 모든 연관 계층화 리드 바이오마커를 확인하기 위한 테스트 코호트의 임상 샘플에서 EpiSwitch™ 어레이에 의해 직접 평가된다. EpiSwitch™ 어레이 스크리닝 후, 통계적으로 유의한 계층화 바이오마커 풀은 일반적으로 300 리드를 초과한다. 이후, 다수의 리드가 EpiSwitch™ CR로 변환된다. 계층화 바이오 마커(<15)의 최소한의 시그니처는 표준 검증을 받고, 확인되면 검증된 시그니처는 특정 병리를 가진 환자에서 후생적 조절의 조건부 바이오마커로 존재하거나 존재하지 않는 바이너리 CCS를 포함한다. 상기 OBD 기술은 후생 유전의 과학에서 최신 돌파구(breakthrough)의 장점을 취하고, 염색체 형태 시그니처의 발견, 모니터링 및 평가를 위한 유일의 고유한 산업-품질의 ISO 인증된 플랫폼을 제공한다.
EpiSwitch™ 분석
독점적인 임상 샘플의 생화학적 방법은 후생적 CCS 바이오마커를 EpiSwitch™ 어레이(Agilent CGH 어레이 플랫폼의 수정된 버전), EpiSwitch™ PCR 또는 DNA 시퀀서(sequencers), 즉 Roche 454, Nanopore Minion 등으로 읽혀지는 서열 기반 분석물로 빠르고 효과적(<4 시간)으로 변환한다.
EpiSwitch ™ 어레이 분석
상기 EpiSwitchTM 어레이 플랫폼은 처리량이 높고 다수의 유전자 좌위를 빠르게 스크리닝할 수 있기 때문에 마커를 식별하는 데 사용된다. 본 프로젝트에 사용된 상기 어레이는 Agilent 맞춤-CGH 어레이로서, OBD가 인실리코(in silico) 소프트웨어를 통해 식별된 마커를 조사할 수 있게 한다.
상기 프로젝트는 15K EpiSwitchTM 어레이를 사용하여 1 그룹(1 기(I), 2 기(II), 3 기(III) 및 4 기(IV))의 샘플을 가진 어레이를 사용하여 수행하였으나, 분석 범위를 증가시키기 위해 상기 샘플을 다른 인종과 공동으로 사용하여 상기 어레이에서 가져온 데이터의 폭을 증가시켰다. 그 대신에 두 개의 8x60k 어레이를 사용하여, 최대 56,964 개의 잠재적인 염색체 형태를 4번 반복하여 연구할 수 있으므로, 이 프로젝트에는 60k 어레이가 사용되었다. 이는 4번 복제본(four replicate)의 최대 14,000 개의 프로브에서 염색체 형태 시그니처를 관찰하는 데 사용할 수 있다. 2 개의 어레이는 8개의 풀된 건강 대조군 환자 샘플에 대한 개별적으로 테스트한 배경의 범위로부터 8 개의 II/III 기 유방암 환자 샘플을 사용하여 생성하였다. 각 샘플에 대해 EpiSwitch™ 템플릿을 준비하였다. 첫 번째 어레이는 OBD에 의해 구해진 아시아인 유방암 샘플에서 수행되었다. 상기 두 번째 어레이는 폴란드인 코호트와 독립적인 아시아인 샘플 코호트를 사용하였다. 아시아인 및 유럽인의 유방암은 ER+와 ER- 상태가 다를 수 있으며, 다른 서브타입과 후생적 프로파일의 우세함에 있어서도 차이가 있을 수 있다. 다수의 개체군에서 유사한 암에 대해 중복된 프로브가 발견되었다.
상기 분석의 주요한 결과는 다음과 같다:
Figure 112018109945797-pct00006
두 데이터 세트 모두 많은 주요 프로브를 생성했다.
Figure 112018109945797-pct00007
어레이 1, BrCa1 4185 주요 EpiSwitch™ 마커가 유방암과 건강한 대조군의 분석에서 확인되었다.
Figure 112018109945797-pct00008
어레이 2, BrCa2 4856 주요 EpiSwitch™ 마커가 유방암과 건강한 대조군의 분석에서 확인되었다.
Figure 112018109945797-pct00009
상기 2 건의 연구간에 일관된 2116 개의 주요 프로브에 대한 두 분석간에 중복이 있었다.
도 1은 BrCa1 (표 11)과 BrCa2 (표 12, 폴란드인 코호트 포함) 어레이의 주요 프로브 비교를 나타낸다. 상기 프로브는 p-값을 <0.05 으로 조정하였다.
원래 모든 데이터가 취해졌으며, 모든 포화된 프로브는 제거되었다. 채널 간의 데이터를 동등하게 하기 위해 표준화가 발생하였다. 각 데이터 세트에 대한 모든 4개의 복제본을 함께 결합하고 변동 계수를 결정하였다. 상기 2116개 프로브는 표준화된 상관관계 값을 사용하여 어레이에서 가장 많이 변경된 유전자의 순위를 매기도록 좁혀졌다. 농축 분석은 랜덤 확률(random chance)보다 가장 차별적으로 발현된 유전자를 찾는 데 사용되었다. 그래서 BrCa1과 BrCa2 어레이 결합을 통해 총 138개의 마커가 차별적인 상향-조절(up-regulated) 또는 하향-조절된(down-regulated) 발현을 나타내는 것으로 밝혀졌다. 상기 어레이에 사용된 샘플들은 연령, 어레이, 연령대가 33-68세, 어레이 2, 32-65 세에서 가능한 한 근접하게 일치했다.
BrCa 어레이 1에 사용된 샘플
샘플 ID 환자 ID 국적
(Ethnicity)
연령
(Age)
유형
(Type)
단계
(Stage)
병리
(Pathology)
ER PR HER
BrCaMa050 039 사이트 1 인도
(Indian)
46 IDC T3, N1, 0 IIIA + + -
BrCaMa051 040 사이트 1 말레이시아
(Malaysian)
47 IDC T3, N2, 0 IIIA N/A N/A N/A
BrCaMa060 049 사이트 1 중국
(Chinese)
68 IDC 4c, N2, 0 IIIB N/A N/A N/A
BrCaMa061 050 사이트 1 인도
(Indian)
59 IDC 4a, 0,0 IIIB N/A N/A N/A
BrCaMa062 051 사이트 1 말레이시아
(Malaysian)
33 IDC T3, 0, 0 IIB N/A N/A N/A
BrCaMa064 053 사이트 1 말레이시아
(Malaysian)
50 IDC 4c, N1,0 IIIB (-) (-) (-)
BrCaMa089 023 사이트 2 인도
(Indian)
66 IDC Ct4, N+, 0 IIIB (-) (-) +
BrCaMa041 003 사이트 4 인도
(Indian)
48 ILC T2 ,0, 0 III + + (-)
BrCa 어레이 2에 사용된 샘플
샘플 ID 환자 ID 국적 (Ethnicity) 연령 (Age) 유형
(Type)
단계
(Stage)
병리 (Pathology) ER PR HER
NG G Mi
ISH1008 24925/14 중국
(Chinese)
45 BC T3, X, X N/A N/A N/A
PAH1004 0491895 중국
(Chinese)
65 BC T2, N1,0 + + 2+
PAH1007 0488720 인도
(Indian)
55 BC T2,N1, 0 + + 2+
PAH1008 0494750 중국
(Chinese)
54 BC T2, N3, 1 + + (-)
10782 10782
유럽
(European)
49 ILC B5 - X 루미날 A + + (-)
10892 10892
유럽
(European)
62 IC NST B5b 2 2 3/10 + + +
11015 11015
유럽
(European)
32 IC NST B5 3 3 36/10 (-) (-) (-)
11081 11081
유럽
(European)
54 IC NST B5 3 X 네크로시스
(Necrosis)
(-) (-) +
스크린 1, EpiSwitch TM 마커 검증
EpiSwitch™ PCR 분석은 표준화된 조작 절차 프로토콜에 따라 숙련된 기술자가 수행할 수 있는 분자 생물학 테스트이다. 모든 프로토콜과 시약 제조는 작업의 품질과 프로토콜 전송 능력을 보장하기 위해 ISO 13485 및 9001 설명서에 따라 수행된다.
프라이머는 마이크로 어레이로부터 확인된 마커로부터 IDT(Integrated DNA Technologies) 소프트웨어(및 필요한 경우 Primer3web 버전 4.0.0 소프트웨어)를 사용하여 설계되었다. 샘플 품질 관리는 단일 추출된 샘플에서 MMP1 프라이머를 사용하여 수행되었다. 모든 샘플은 MMP1에 대해 양성 결과를 나타내며, 모든 샘플에 대해 EpiSwitch™ PCR을 수행했다. 모든 추출된 혈액 샘플을 1:2 내지 1:64로 희석하고 중첩된(nested) PCR을 수행하였다. 초기 결과는 바이너리 형식으로 생성하였다: 즉 '1'- 예, 밴드가 올바른 크기로 존재하거나 '0'- 아니요, 밴드가 올바른 크기로 존재하지 않는다.
통계 분석 후, 어레이 1의 41개 마커와 어레이 2의 39 개 마커를 포함하는 상위 80 개의 EpiSwitch™ 마커를 EpiSwitch™ PCR 분석으로 검증하여 유방암 샘플을 계층화하였다.
8개 BrCa 및 8개 대조군 샘플에 대한 스크리닝의 첫 번째 라운드 후에 마커는 51개로 감소하였고, 두 번째 라운드에서는 추가로 36개 BrCa 및 36개 대조군 샘플을 사용하여, BrCa 및 대조군 환자 사이를 계층화할 수 있는 13개 우수한 마커 (표 13)로 감소하였다.
Gliwice 샘플에서 PCR 평가에 사용되는 우수한 마커
프로브(PROBES) 아우터(OUTERS) 이너(INNERS)
MELK_9_36577630_36579243_36637050_36643005_RF OBD116-2/4 OBD116-1/3
ATM_11_108118137_108126372_108155279_108156687_RF OBD116-54/56 OBD116-53/55
CDC6_17_38421089_38423079_38467677_38474960_FR OBD116-90/92 OBD116-89/91
CDC6_17_38421089_38423079_38451196_38457050_FF OBD116-102/104 OBD116-101/103
SLC16A10_6_111441989_111447305_111492951_111498421_FR OBD116-114/80 OBD116-113/115
TSPYL5_8_98276431_98282736_98316421_98318720_FF OBD116-130/132 OBD116-129/131
MAP3K1_5_56102259_56110500_56140227_56144076_FF OBD116-162/164 OBD116-161/163
ME3_11_86300063_86304401_86420537_86426200_FR OBD116-174/176 OBD116-173/175
SRD5A1_5_6634973_6639025_6667775_6669711_RF OBD116-178/180 OBD116-177/179
VAV3_1_108148303_108158073_108220200_108227533_RF OBD116-186/188 OBD116-185/187
FOXC1_6_1577253_1581989_1604206_1605973_FR OBD116-198/200 OBD116-197/199
NF1_17_29477103_29483764_29651799_29657368_FF OBD116-262/264 OBD116-261/263
MSH3_5_80021913_80025030_80153948_80159012_RF OBD116-302/304 OBD116-301/303
스크린 2, Gliwice 샘플의 EpiSwitch TM PCR 검증
스크리닝은 1:2 내지 1:64 희석 시리즈를 사용하여 50 개의 Gliwice 샘플 및 22 개의 대조군 샘플에서 상기한 13 개의 우수한 마커를 사용하여 수행하였다. 바이너리 데이터 결과에 대해서는 부록(appendix)의 표 18을 참조한다. 스크리닝을 수행한 후, 상기 바이너리 결과에 대해 카이-제곱 검정 (Fisher 's exact)을 사용하여 대조군 샘플과 BrCa를 분별시키는 효능을 테스트하여, 최종 마커를 수득했다.
GLMNET과 Bayes 로지스틱 모델링 통계를 사용하여 13 개의 마커 결과를 평가하였다. 우수한 스코어를 가지는 10개의 마커(표 4)는 하이라이트되었다.
우수한 GLMNET 스코어를 나타내는 마커
마커 (Marker) 추정치
(Estimate)
표준 오차
(Std. Error)
z-값
(z_value)
Pr(>|z|) Glmnet _0.5
OBD116.301.303_2 3.592231 1.494287 2.404 0.0162 -0.266166
OBD116.185.187_16 2.135415 1.532293 1.394 0.1634 -0.032431
OBD116 .53.55_8 -1.78499 1.341226 -1.331 0.1832 0.1394873
OBD116 .161.163_64 3.616204 2.872291 1.259 0.208 -0.267241
OBD116.197.199_8 -1.87868 1.491999 -1.259 0.208 0.1215176
OBD116 .129.131_4 1.560365 1.479932 1.054 0.2917 0
OBD116.173.175_2 -1.39826 1.491721 -0.937 0.3486 0.0080034
OBD116.89.103_8 -1.24015 1.35114 -0.918 0.3587 0.0081371
OBD116 .177.179_8 -1.20884 1.323655 -0.913 0.3611 0
OBD116.113.87_4 1.615246 2.000497 0.807 0.4194 -0.051646
추가적인 통계 분석으로 상기 마커가 추가적으로 감소하였다; 66% 트레이닝 세트와 34% 테스트 세트가 있는 분류 랜덤 트리(classification random tree)를 사용하였고, 24개의 샘플이 사용되었다.
정확하게 분류된 경우는 19(79.1667%), 잘못 분류된 경우는 5(20.8333%)였으며, 이는 Kappa 통계치 0.5와 평균 절대 오차 0.2322를 나타낸다. 상기 평균 절대 오차는 0.4656이었고, 상대적인 절대 오차는 55.2934 %, 제곱근 오차는 108.4286%이다.
Figure 112018109945797-pct00010
최종 8개 마커는 GLMNET을 사용하여 제작하였다.
최종 8개 마커
마커 (Marker) 추정치
(Estimate)
표준 오차
(Std. Error)
z-값
(z_value)
Pr(>|z|) Glmnet _0.5
OBD116.301.303_2 3.592231 1.494287 2.404 0.0162 -0.266166
OBD116.185.187_16 2.135415 1.532293 1.394 0.1634 -0.032431
OBD116.53.55_8 -1.78499 1.341226 -1.331 0.1832 0.1394873
OBD116.197.199_8 -1.87868 1.491999 -1.259 0.208 0.1215176
OBD116.129.131_4 1.560365 1.479932 1.054 0.2917 0
OBD116.173.175_2 -1.39826 1.491721 -0.937 0.3486 0.0080034
OBD116.89.103_8 -1.24015 1.35114 -0.918 0.3587 0.0081371
OBD116 .177.179_8 -1.20884 1.323655 -0.913 0.3611 0
샘플의 독립적인 분류
최종 단계에서는 로지스틱 모델링과 5배 교차 검증을 사용하여 25개 샘플의 독립적인 코호트에서 상기 마커 계층화를 테스트하였다.
Figure 112018109945797-pct00011
이것은 독립적인 코호트 검증에서 0.903의 ROC 값을 갖는 83.6%의 민감도 및 91.0%의 특이성일 수 있는 선택된 마커에 기초한 분류자(classifier)를 나타낸다. 가장 높은 ROC가 1이고 최저가 0.5 인 것을 고려할 때, 이것은 상기 바이너리 분류자의 실행 능력이 높은 수준임을 의미한다.
결론
본 연구의 목적은 유방암 또는 유방암에 걸리기 쉬운 여성의 전혈에서 후생적 변화를 결정한 다음에 바이오 마커를 사용하여 진단용 계층화를 위한 것이다.
60K EpiSwitch™ 어레이는 대조군 환자 대비 유방암 환자의 진단과 관련하여 56964 개의 잠재적인 염색체 상호작용을 조사하기 위해 개발되었다.
2 개의 어레이로서 아시아인 BrCa와 대조군 환자 샘플을 가지고 있는 제1 어레이, 아시아인와 폴란드인 BrCa 샘플과 대조군을 모두 가지고 있는 제2 어레이가 생성하여, 2개 어레이 사이에 임의의 유사한 마커가 있는지를 알 수 있었다. 이룰 통해 궁극적으로 서로 다른 민족 그룹 사이에서 보다 많은 마커를 발견할 수 있게 될 것이다. 상기 어레이 4185 및 4856의 분석 후 중요한 프로브 2116 개가 중첩되는 것을 발견하였다. 프로브의 수정 표준화(Correction normalisation)가 수행되었고, 대조군 환자 대비 유방암의 진단을 결정하는 데 사용될 수 있는 138 개의 잠재적인 마커를 발견하였다. PCR 스크리닝에 사용된 상위 80 개 마커를 생산하기 위해 추가적으로 통계적인 감소를 수행하였다. 수차례의 스크리닝을 한 후, 각각 p-값이 >0.3인 스크리닝 능력이 견고한 13 개의 마커를 확인하였다. 상기 13개 마커를 사용하여 Memorial Cancer Center 및 Institute of Oncology, 및 Gliwice Branch(IOG)으로부터 50개 BrCa 샘플 및 22 개의 대조군 환자 샘플을 스크리닝하였다. 연속적인 희석 중첩된 PCR 스크리닝을 수행한 후, BrCa와 대조군을 구별할 수있는 마커를 결정하기 위해 바이너리 판독 값을 분석하여, 8개의 마커로 최종적으로 좁혀졌다(표 16 참조).
생성된 최종 마커
마커(Marker) 프로브(Probe)
OBD116.53.55_8 ATM_11_108118137_108126372_108155279_108156687_RF
OBD116.89.103_8 CDC6_17_38421089_38423079_38451196_38457050_FF
OBD116.129.131_4 TSPYL5_8_98276431_98282736_98316421_98318720_FF
OBD116.173.175_2 ME3_11_86300063_86304401_86420537_86426200_FR
OBD116.177.179_8 SRD5A1_5_6634973_6639025_6667775_6669711_RF
OBD116.185.187_16 VAV3_1_108148303_108158073_108220200_108227533_RF
OBD116.197.199_8 FOXC1_6_1577253_1581989_1604206_1605973_FR
OBD116.301.303_2 MSH3_5_80021913_80025030_80153948_80159012_RF
상기 분석의 최종 단계는 8개의 마커가 대조군 환자 대비 유방암 환자 진단에 사용될 수 있는지를 확인하는 단계이다. 마커가 샘플을 정확하게 예측할 수 있는지를 결정하기 위해 로지스틱 모델링을 실행하기 위한 25개의 샘플로 된 독립적인 서브 세트가 사용되었다. 상기 25개 샘플 중 상기 마커는 0.903의 ROC 값으로 83.6%의 민감성과 91.0%의 특이성을 나타냈다.
또한 EpiSwitch™ 스크린에서 발견된 마커는 암 진단에 있어서 흥미로운 특징을 나타낸다. ATM(Ataxia telangiectasia mutated kinase)은 DNA 손상 반응에 핵심적인 역할을 하는데, ATM 기능의 손실은 암 발생으로 이어질 수 있으며, 또한 지속적인 종양 성장에서 신호 전달 경로와 관련이 있다. ATM은 양성 유방암 세포주에서 HER2(인간 상피 세포 성장 인자 수용체 2(Human epidermal growth factor receptor 2))의 종양 형성을 촉진시킨다. ATM은 HSP90(열 쇼크 단백질)과 HER2와 함께 삼량체 화합물로 작용하며, 여러 종양에서 확인되었다. 유방암의 주요 위험은 CHEK2, PALB2 및 TP53과 관련이 있으며, 추가적으로 ATM의 돌연변이로 인한 중등도의 위험이 있다.
유전자 SLC16A10 (Solute carrier family 16(방향족 아미노산 수송체), 멤버 10)은 신장, 간 및 장에서 강하게 발현되는 것으로 알려진 방향족 아미노산을 선택적으로 수송하는 Na+ 독립적인 수송체 시스템인 시스템 T에 관여한다. 관련된 경로 중에는, 포도당 및 기타 당, 담즙염 및 유기산, 금속 이온 및 아민 화합물의 이동, 단백질 분해 및 흡수가 있다. 이 유전자와 관련된 GO 주석에는 수송체(transporter) 활동이 포함된다. 유니 포터(uniporter) TAT1 (Slc16a10)은 특정 멤브레인을 가로지르는 AAA의 농도의 균형을 유지시키는데 필요하다.
Vav3는 전립선암의 종양 발생에 중요한 역할을 하는 종양 유전자(oncogene)이며, 유방암에서도 발현되고 조절된다. Vav 단백질은 Rho 계열의 GTPase에 대한 구아닌 뉴클레오티드 교환 요소(guanine nucleotide exchange factors)이다. 이는 세포 신호 및 종양 형성에 관여한다. Vav3은 세포 성장 및 증식을 촉진시킨다. 유방암과 전립선암은 성장이 각각의 호르몬 수용체에 의해 매개되는 호르몬 독립적인 종양이다. Vav3는 유방암의 발병에서 후생적으로 조절된다.
MSH3(MutS homolog 3)는 대장암, 유방암, 전립선암, 방광암, 갑상선암, 난소암 및 식도암과 같은 여러 종류의 암과 관련이 있다. 불일치 회복 경로(Mismatch repair pathway)는 세포주기 조절, 아폽토시스(apoptosis) 및 DNA 손상과 관련되어 있다. 인간에는 7개의 불일치 회복 유전자가 있으며, MSH3 유전자에 대해 180개의 SNP가 보고되었다. MSH3 단백질 발현의 감소는 대장암과 관련이 있으며, 다형성 rs26279G는 유방암의 위험과 관련이 있다.
FOXC1(Forkhead box C1)은 배아 발생 과정에서 중배엽, 뇌 및 눈의 발달에 관여하는 전사 요인이며, 유방암과 같은 기저 세포 암에 대한 핵심 진단 마커가 될 수 있다. FOXC1 수치가 높아지면 폐암과 간세포 암종과 같은 암의 생존률이 낮아질 수 있음을 예측할 수 있다. FOXC1 단백질은 기저 세포에서만 독점적으로 발현된다. FOXC1은 Gli2 전사 요인의 직접적인 상호 작용을 통해 Hedgehog 신호 전달의 Smoothhead(SMO) - 독립적인 활성인자로 확인되었다.
이러한 결과는 고도의 신뢰성으로 대조군 샘플에 대비하여 유방암 환자 샘플을 계층화하는 데 도움이 될 수 있는 특이적 유전자 좌위의 3D 염색질 구조의 레벨에서 후생적 조절 완화로 모니터링되는, 매우 견고하고 특이적인 마커 세트를 나타낸다.
부록(Appendix) II
Maria Sklodowska-Curie 기념 암 센터 및 종양학 연구소, Gliwice Branch (IOG)의 BCa 샘플
샘플 No 환자의 진단 연령
(Patient’s age at Diagnosis)
(yrs)
임상 진단
(Clinical Diagnosis)
NG G IM Cat ER PR HER2
병리(Histopathology)
10692 47.75 암종 침윤
(carcinoma infiltrans)
3 3 IM: 21 유사분열상(mitotic figures)/10HPF B5 +++ +++ (-)
10693 66.91 침윤성 유관암
(Invasive ductal carcinoma)
3 3 IM: 41/10 HPF. 타입 루미날 B (HER 2 음성) B5b + +
10695 29.87 NST의 침윤성 암종
(Invasive carcinoma of NST)
3 3 IM: 25/10 HPF B5b + + +
10698 58.06 침윤성 암종 NST
(Invasive carcinoma NST)
2 3 IM: 26 유사분열상(mitotic figures) / 10 HPF 타입: 루미날 B ( HER-2 음성) B5 +++ (-) +
10715 49.85 침윤성 소엽암종
(carcinoma lobulare infiltrans)
2 2 IM: 3 유사분열상(mitotic figures) /10HPF. 타입: 루미날 A B5 +++ ++ +
10717 67.58 침윤성 소엽암종
(Invasive lobular carcinoma)
2 2 IM: 2/10 HPF +++ +++ (-)
10726 37.39 침윤성 암종 NST
(Invasive carcinoma NST)
3 3 IM 18/10 HPF. 단일 관(single canals)에서 DCIS NG2. 타입: 루미날 B (HER 2 양성) B5 ++ +++ +++
10731 43.03 침윤성 암종
(Invasive carcinoma)
3 3 IM: 20/10 HPF. 광범위한 괴사(Wide necrosis) B5 +++ (-) +++
10732 45.65 침윤성 소엽암종
(Invasive lobular carcinoma)
2 LCIS. 미세석회화가 있는 DCIS 코메도(comedo) 타입. 타입: 루미날 A B5 +++ +++ +
10752 62.68 침윤성 암종 NST
(Invasive carcinoma NST)
2 IM: 4/10 HPF B5 +++ +++ ++
10754 67.93 침윤성 유관암
(carcinoma ductale infiltrans)
2 3 IM: 39 유사분열상(mitotic figures) /10HPF 타입: 루미날 B (HER-2 음성) B5 +++ +++ +
10764 34.31 침윤성 암종 NST
(Invasive carcinoma NST)
3 IM: 18/10 HPF 삼중 음성 (유관(ductal)). B5b (-) (-) (-)
10775 50.36 침윤성 암종 NST
(Invasive carcinoma NST)
3 심각한 림프구가 미세 환경에서 침윤 IM: 45 유사분열상(mitotic figures)/ /10HPF 삼중 음성. B5 + (-) +
10782 49.09 침윤성 소엽암종
(Invasive lobular carcinoma)
X LCIS 확대(Widening)선종 부위(adenoma region)에서LCIS(선종(adonosis). 타입: 루미날 A B5 +++ +++ (-)
10791 63.86 침윤성 암종
(Invasive carcinoma)
3 2 침윤성 유관암(Invasive ductal carcinoma) 타입: 루미날 B (HER-2 음성). +++ +++ +
10794 33.94 침윤성 암종 NST 등의 침윤성 미세 유두 암종
(Invasive carcinoma NST et invasive micropapillary carcinoma)
2 3 IM: 34 유사분열상(mitotic figures)/10HPF B5 +++ + +++
10830 56.67 침윤성 유관암
(carcinoma ductale invasivum)
2 IM: 11/10HPF +++ +
10832 45.39 종양의 약 10%를 차지하는 인 시투(in situ)에서 관찰할 수 있는 관내 암종(Intraductal carcinoma) in situ (CDIS)) 2 2 혼합 유형의 검사 조직 생검: 약. 90% - 암 점막종(Carcinoma mucinosum); 10% - IM: 14/10HPF. +++ ++ +
10836 32.31 침윤성 유관암 NST
(Carcinoma ductale invasivum NST)
2 2 IM 9/10 HPF. +
10853 62.82 낮은 등급 DCIS를 가진 침윤성 암종
(Invasive carcinoma with low grade DCIS). NST
2 1 IM: 2/10 HPF. 타입: 루미날 B HER 2 음성) B5b +++ +++ (-)
10855 38.75 침윤성 암종 NST
(Invasive carcinoma NST)
3 3 IM:29 유사분열상(mitotic figures) /10HPF 타입: 루미날 B ( HER-2 음성) B5 +++ + (-)
10861 45.69 침윤성 암종 NST
(Invasive carcinoma NST)
2 2 IM: 6/10 HPF 타입: 루미날 B; (HER 2 양성). B5b +++ ++ +++
10865 63.80 침윤성 암종 NST
(Invasive carcinoma NST)
3 3 IM: 11/10 HPF. 삼중 음성 (관(ductal)). 타입: 기저-유사(basal-like) B5b (-) (-) (-)
10876 47.10 침윤성 암종 NST
(Invasive carcinoma NST)
3 3 IM: 37/10 HPF B5b +++ (-) (-)
10883 48.65 침윤성 암종 NST
(Invasive carcinoma NST)
3 3 IM: 31 유사분열상(mitotic figures) / 10HPF 미세환경(microenvironment)에서 심각한 림프구 침윤(Severe lymphocyte infiltrates). 타입: 루미날 B ( HER-2 음성) B5 +++ +++ (-)
10885 45.37 침윤성 암종 NST
(Invasive carcinoma NST)
3 3 IM 44/10 HPF B5b (-) (-) ++
10891 64.11 침윤성 암종
(Invasive carcinoma)
3 3 IM: 24/10 HPF. 미세환경에서 심각한 림프구 침윤. 삼중 음성(Triple negative) B5 (-) (-) (-)
10892 62.44 침윤성 암종 NST
(Invasive carcinoma NST)
2 2 IM: 3/10 HPF. 타입: 루미날 B (HER 2 음성). B5b +++ +++ +
10903 64.13 침윤성 소엽암종
(Invasive lobular carcinoma)
3 3 유사분열 활성(Mitotic activity): 16 유사분열상 / 10 hpf. 타입: 루미날 B (HER2 음성) B5 +++ +++ +
10915 48.03 침윤성 암종
(Invasive carcinoma)
2 2 IM: 1/10 HPF 타입: 루미날 B; HER 2 음성. B5 +++ +++ +
10942 46.33 침윤성 암종
(Invasive carcinoma)
3 3 IM: 58 유사분열상(mitotic figures) / 10 HPF 타입: 루미날 B ( HER-2 양성). B5 + + +++
10947 52.78 NST 3 3 IM: 34/10 HPF 타입: 루미날 B; HER 2 양성. B5 + (-) +++
10955 68.82 침윤성 암종 NST
(Invasive carcinoma NST)
2 2 IM: 3/10 HPF. 타입: 루미날 B (HER 2 음성). 침윤성 암종(Invasive carcinoma) B5b +++ + +
10963 65.42 침윤성 소엽암종(invasive lobular carcinoma) - 튜블로(tubulo)- 침윤성 소염(lobular variant) 2 2 IM: 4/10 HPF 소엽(lobular) 암종 및 유관(ductal) 암종으로 분화된 혼합 종양 B5 +++ (-) ++
11015 32.48 침윤성 암종 NST
(Invasive carcinoma NST)
3 3 IM:36/10 HPF B5 (-) (-) (-)
11035 59.62 침윤성 암종 NST
(Invasive carcinoma NST)
1 (diam. 2 mm). DCIS NG-2. DCIS B5 +++ + +
11036 47.37 침윤성 암종 NST
(Invasive carcinoma NST)
2 1 IM: 2/10 HPF. DCIS NG2. 타입: 루미날 B - HER 2 음성. B5 +++ +++ +
11053 63.00 침윤성 유관암
(carcinoma ductale infiltrans)
2 2 NG-2, G-2. DCIS NG-2, 괴사(necrosis)가 있는 크리브리폼 형(cribriform 타입). Cat: B5. B5
11059 39.45 침윤성 암종 NST
(Invasive carcinoma NST)
2 1 IM: 1/10 HPF. 종양 사이트 주위의 다중 미세석회화(Multiple microcalcifications). 타입: 루미날 A +++ +++ +
11081 54.28 침윤성 암종 NST
(Invasive carcinoma NST)
3 X 국소 괴사(focal necrosis)가 있는 DCIS B5 (-) (-) +++
11083 59.55 침윤성 암종 NST
(Invasive carcinoma NST)
3 2 IM: 16 유사분열상(mitotic figures) /10HPF DCIS NG-2 타입: 루미날 B +++ ++ ++
11097 36.19 침윤성 유관암
(Carcinoma ductale invasivum)
2 종양 직경(Tumour diameter) 1cm. 미세 환경에서 결합조직형성(Desmoplasia). +++ +++ ++
11099 44.00 침윤성 암종 NST
(Invasive carcinoma NST)
3 3 IM: 59 유사분열상(mitotic figures) / 10 HPF. 타입: 삼중 음성. B5 (-) (-) +
11122 60.62 침윤성 암종 NST
(Invasive carcinoma NST)
2 ( B2 ) et DCIS NG-2, 미세석회화(microcalcifications)가 있는 고체형(solid 타입). B5 +++ +
11136 57.50 침윤성 암종 NST
(Invasive carcinoma NST)
2 1 IM: 5 유사분열상(mitotic figures) / 10 HPF B5 +++ ++ ++
11153 43.38 침윤성 암종 NST
(Invasive carcinoma NST)
2 2 IM 6/10 HPF B5b +++ ++ +
11180 42.56 침윤성 암종 NST
(Invasive carcinoma NST)
3 2 pT1c NO(sn) IM 8/10 HPF +++ +++ (-)
11187 44.19 침윤성 암종
(Invasive carcinoma)
2 2 IM: 16/10 HPF. DCIS NG 2 크리브리폰 형(cribriform 타입). B5 +++ +++ (-)
11217 52.04 NST 분화의 침윤성 암종
(Invasive carcinoma of NST differentiation)
3 인덱스 mit. IM [/10HPF] : 14/10 (-) (-) (-)
11245 35.35 침윤성 암종 NST
(Invasive carcinoma NST)
3 3 IM: 13/10 HPF B5 +++ +++ ++
Figure 112018109945797-pct00012
상기 표에서, 더 어두운 색깔의 결과는 p-value > 0.3를 나타내고, 더 밝은 색깔의 결과는 최고의 희석액을 나타낸다.
실시예 3
실시예에 기재된 작업은 중합 효소 연쇄 반응(PCR) 및 qPCR(하기 표 19 참조)에 의해 타이핑된 13 개의 네스트 마커(nested markers)와 관계가 있다. 이러한 마커는 비-악성 개체로부터 유방암 환자를 구분하기 위해 개발되었다.
Figure 112018109945797-pct00013
qPCR 개발의 개요는 다음과 같다:
- 네스트 PCR 프라이머
- 단일-단계 SYBR PCR(온도 기울기 최적화)
- 겔 정제
- 형광 측정, 서열 분석, 상동성 및 게놈 매핑 체크
- 가수 분해 프로브 최적화
- 환자 샘플을 이용한 표준 곡선 테스트.
상기 작업은 소량 혈액 샘플을 사용하여 비-악성 물질로부터 유방암 환자를 차별화하는 데 사용할 수 있는 후생적 변화를 확인하는 것이다.
원래 테스트 평가 작업으로부터 얻은 혈액 샘플을 포함하는 아시아인 코호트의 혈액 샘플을 MIQE(Quantitative Real-Time PCR Experiments 발행을 위한 최소 정보) 지침에 따라 qPCR 프로브 분석을 검증하는 데 사용하였다.
각 마커 qPCR 프로브 및 개체 검출 분석은 품질 검출을 위해 다음과 같은 MIQE-호환 기준을 충족시키기 위한 대표적인 샘플 풀(4x4)에서 온도 구배를 통해 개발 및 테스트되었다:
1. 특이성: 예측된 PCR 증폭 산물을 시퀀싱으로 입증하였다.
2. 선형 표준 곡선 (R2> 0.98).
3. 효율(Efficiency, E), E> 90%.
4. 모든 분석과 함께 사용된 게놈 비-특정 교차 반응 컨트롤.
상기 요구 사항은 네스트 마커의 적어도 70% 이상이 상기에 기재된 4 가지 기준을 충족하는 분석 성능을 갖춘 가수 분해 프로브를 사용하여 검출하기 위해 개발된다는 것이다.
EpiSwitch TM qPCR 분석 개발 데이터
CCS 바이오 마커는 네스트 PCR에 의해 확인되었다. 모든 발달 PCR(development PCR)은 QIAgility를 사용하여 만들었다. 웰 당 10 ng의 3C 샘플 템플릿을 음성 대조군과 매치된 농도로 단일 단계 온도 구배 PCR 및 SYBR 기반 검출을 사용하여 스크리닝 하였다. 10 개의 상호 작용을 확인하였고 서열화하였다. 상기 서열 분석 데이터를 ENSEMBL에 제출하였고, ENSEMBL Blat 및 Needleman-Wunsch 알고리즘을 사용하여 각각 예측된 3C 상호 작용의 게놈 위치를 확인하였다. 상기 가수 분해 프로브는 각 확인된 상호 작용의 접합 부위를 위해 설계되었으며 온도 구배에 의해 최적화되었다. 모든 샘플은 안정적인 독립적 3C 상호 작용 (MMP1)에 대해 양성이었다. 모든 분석은 n = 8 환자 샘플(4 = 유방암, 4 = 비-악성), 표준 곡선 및 농도가 일치하는 음성 대조군으로 테스트하였다.
상기 개발 방법으로부터 얻은 프라이머 데이터는 원래 서열 분석 전기영동도(sequencing electropherogram)를 포함하며 각 qPCR 분석을 위한 명확하고 쉬운 체크 형식으로 제공된다. 상기 분석은 알파벳순으로 되어 있다. 프로브 온도 구배 최적화 동안 106 개의 카피에서 표준을 양성 대조군으로 사용하였다. 환자 샘플을 1-106 카피 사이의 곡선으로 테스트 하였다. 환자 스크리닝 동안 표준 곡선 분석에서 임의의 변화는 보고서에 기재된 각 분석에 대해 기록된다.
EpiSwitch TM qPCR 분석 요약
ATM_11_108118137_108126372_108155279_108156687_RF
ⅰ. 3C 템플릿은 단일 단계로 증폭하였다.
ⅱ. 랩 칩(Lap Chip) 이미지. 코멘트: 상기 앰플리콘(amplicon)은 파라포름알데히드 고정된 샘플(템플릿 10ng)에서만 볼 수 있다. 상기 단일-단계 PCR 생성물은 예상된 크기인 472bp이다.
ⅲ. 상기 샘플 PCR 생성물의 직접적인 서열 분석 후 ENSEMBL BLAT(도 1). 코멘트: 우수한 품질 서열 분석(정방향 및 역방향 프라이머)은 예측된 3C 상호작용과 100% 상동성을 갖는다.
ⅳ. 정량적 PCR 분석 표준의 성능. 상기 표준 곡선은 102-106 카피로부터 선형이다. R2=0.996.
ⅴ. 하나의 앰플리콘이 2배가 되어 2개의 앰플리콘이 된다(100% 효율). 분석 효율=91.7%(>90% MIQE 지침).
ⅵ.상기 분석은 상기 환자(n=8)와 서브 세트(C01-C12=유방암, D01-D12=비-악성) 사이의 극심한 카피수 차이(표 20)를 나타낸다. SQ=개시 수량(starting quantity), 20ng 템플릿에서의 카피. NaN= 0 카피.
샘플 PCR 생성물의 직접적인 서열 분석 후 ENSEMBL BLAT
본 PCR 생성물을 염색체 11q22.3에 서열화하고 매핑하였다. 2 개의 3C 단편을 Taq I(TCGA)에서 결찰시켰다. 서열 트레이스(trace)위에는 ENSEMBL BLAT 매핑 데이터(빨간색으로 표시된 서열 상동성)가 있다.

(Well)
형광
(Fluor)
표적
(Target)
구성요소
(Content)
샘플
(Sample)
Cq 개시 수량
(Starting Quantity, SQ)
C01 FAM 032B 20 ng Unkn 032B 20 ng 41.04 0.42
C02 FAM 032B 20 ng Unkn 032B 20 ng 39.89 0.89
C03 FAM 032B 20 ng Unkn 032B 20 ng 37.82 3.42
C04 FAM 063B 20 ng Unkn 063B 20 ng 37.92 3.19
C05 FAM 063B 20 ng Unkn 063B 20 ng 36.8 6.64
C06 FAM 063B 20 ng Unkn 063B 20 ng 36.78 6.72
C07 FAM 065A 20 ng Unkn 065A 20 ng 37.5 4.21
C08 FAM 065A 20 ng Unkn 065A 20 ng 37.23 5.01
C09 FAM 065A 20 ng Unkn 065A 20 ng 37.33 4.68
C10 FAM 124B 20 ng Unkn 124B 20 ng 37.21 5.07
C11 FAM 124B 20 ng Unkn 124B 20 ng 37.33 4.69
C12 FAM 124B 20 ng Unkn 124B 20 ng NaN NaN
D01 FAM 005B 20 ng Unkn 005B 20 ng 38.6 2.06
D02 FAM 005B 20 ng Unkn 005B 20 ng NaN NaN
D03 FAM 005B 20 ng Unkn 005B 20 ng 37.12 5.4
D04 FAM 007B 20 ng Unkn 007B 20 ng NaN NaN
D05 FAM 007B 20 ng Unkn 007B 20 ng NaN NaN
D06 FAM 007B 20 ng Unkn 007B 20 ng NaN NaN
D07 FAM 17B 20 ng Unkn 17B 20 ng 37.98 3.07
D09 FAM 17B 20 ng Unkn 17B 20 ng 38.63 2.01
D10 FAM 022B 20 ng Unkn 022B 20 ng NaN NaN
D11 FAM 022B 20 ng Unkn 022B 20 ng NaN NaN
D12 FAM 022B 20 ng Unkn 022B 20 ng NaN NaN
E07 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E08 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E09 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E10 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E11 FAM ATE Ext NTC ATE Ext NaN NaN
E12 FAM ATE Ext NTC ATE Ext NaN NaN
F01 FAM ATE Post-PCR NTC ATE Post-PCR NaN NaN
F02 FAM ATE Post-PCR NTC ATE Post-PCR NaN NaN
F03 FAM NTC Water NaN NaN
F04 FAM NTC Water NaN NaN = 0 카피
CDC6_17_38421089_38423079_38451196_38457050_FF
ⅰ. 3C 템플릿은 단일 단계로 증폭하였다.
ⅱ. 랩 칩(Lap Chip) 이미지. 코멘트: 상기 밴드는 파라포름알데히드 고정된 샘플(템플릿 10ng)에서만 볼 수 있다. 예상된 크기의 상기 단일-단계 PCR 생성물은 428bp이다.
ⅲ. 상기 샘플 PCR 생성물의 직접적인 서열 분석 후 ENSEMBL BLAT. 코멘트: 좋은 품질 서열 분석(정방향 및 역방향 프라이머)은 예측된 3C 상호작용과 100% 상동성을 갖는다.
ⅳ. 정량적 PCR 분석 표준의 성능. 상기 표준 곡선은 101-106 카피로부터 선형이다. R2=0.99.
ⅴ. 하나의 앰플리콘이 2배가 되어 2개의 앰플리콘이 된다(100% 효율). 분석 효율=90.7%(>90% MIQE 지침).
ⅵ. 상기 분석은 상기 환자(n=8)와 서브 세트(C01-C12=유방암, D01-D12=비-악성) 사이의 극심한 카피수 차이(표 2)를 나타낸다. SQ=개시 수량(starting quantity), 20ng 템플릿에서의 카피. NaN= 0 카피.

(Well)
형광
(Fluor)
표적
(Target)
구성요소
(Content)
샘플
(Sample)
Cq 개시 수량
(Starting Quantity, SQ)
C01 FAM 032B 20 ng Unkn 032B 20 ng 39.63 1.93
C02 FAM 032B 20 ng Unkn 032B 20 ng 38.14 5.05
C03 FAM 032B 20 ng Unkn 032B 20 ng 38.80 3.30
C04 FAM 063B 20 ng Unkn 063B 20 ng 37.18 9.40
C05 FAM 063B 20 ng Unkn 063B 20 ng 37.35 8.40
C06 FAM 063B 20 ng Unkn 063B 20 ng 37.41 8.10
C07 FAM 065A 20 ng Unkn 065A 20 ng 36.32 16.34
C08 FAM 065A 20 ng Unkn 065A 20 ng 36.36 15.92
C09 FAM 065A 20 ng Unkn 065A 20 ng 36.75 12.41
C10 FAM 124B 20 ng Unkn 124B 20 ng 34.76 44.71
C11 FAM 124B 20 ng Unkn 124B 20 ng NaN NaN
C12 FAM 124B 20 ng Unkn 124B 20 ng NaN NaN
D01 FAM 005B 20 ng Unkn 005B 20 ng 36.24 17.24
D02 FAM 005B 20 ng Unkn 005B 20 ng 36.14 18.42
D03 FAM 005B 20 ng Unkn 005B 20 ng 35.53 27.29
D04 FAM 007B 20 ng Unkn 007B 20 ng 36.57 13.97
D05 FAM 007B 20 ng Unkn 007B 20 ng 37.49 7.68
D06 FAM 007B 20 ng Unkn 007B 20 ng 36.60 13.68
D07 FAM 17B 20 ng Unkn 17B 20 ng 36.01 19.97
D08 FAM 17B 20 ng Unkn 17B 20 ng 37.43 8.01
D09 FAM 17B 20 ng Unkn 17B 20 ng 36.75 12.38
D10 FAM 022B 20 ng Unkn 022B 20 ng NaN NaN
D11 FAM 022B 20 ng Unkn 022B 20 ng 39.06 2.80
D12 FAM 022B 20 ng Unkn 022B 20 ng 36.75 12.41
E07 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E08 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E09 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E10 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E11 FAM ATE Ext NTC ATE Ext NaN NaN
E12 FAM ATE Ext NTC ATE Ext NaN NaN
F01 FAM ATE Post-PCR NTC ATE Post-PCR NaN NaN
F02 FAM ATE Post-PCR NTC ATE Post-PCR NaN NaN
F03 FAM NTC Water NaN NaN
F04 FAM NTC Water NaN NaN = 0 카피
FOXC1_6_1577253_1581989_1604206_1605973_FR
ⅰ. 3C 템플릿은 단일 단계로 증폭하였다.
ⅱ. 랩 칩(Lap Chip) 이미지. 코멘트: 상기 밴드는 파라포름알데히드 고정된 샘플(템플릿 10ng)에서만 볼 수 있다. 예상된 크기의 상기 단일-단계 PCR 생성물은 208bp이다.
ⅲ. 상기 샘플 PCR 생성물의 직접적인 서열 분석 후 ENSEMBL BLAT. 코멘트: 좋은 품질 서열 분석(정방향 및 역방향 프라이머)은 예측된 3C 상호작용과 100% 상동성을 갖는다.
ⅳ. 정량적 PCR 분석 표준의 성능. 상기 표준 곡선은 101-106 카피로부터 선형이다. R2=0.992.
ⅴ. 하나의 앰플리콘이 2배가 되어 2개의 앰플리콘이 된다(100% 효율). 분석 효율=101.6%(>90% MIQE 지침).
ⅵ. 상기 분석은 상기 환자(n=8)와 서브 세트(C01-C12=유방암, D01-D12=비-악성) 사이의 극심한 카피수 차이(표 21)를 나타낸다. SQ=개시 수량(starting quantity), 20ng 템플릿에서의 카피. NaN= 0 카피.
샘플 PCR 생성물의 직접 염기 서열 분석 후 ENSEMBL BLAT
FOXC1 웰 B7 208 bp 단일 단계 증폭(이너 프라이머)의 랩 칩 이미지. 이 PCR 생성물을 염색체 6p에 서열화하고 매핑 하였다.

(Well)
형광
(Fluor)
표적
(Target)
구성요소
(Content)
샘플
(Sample)
Cq 개시 수량
(Starting Quantity, SQ)
C01 FAM 032B 20 ng Unkn 032B 20 ng 36.16 3.05
C02 FAM 032B 20 ng Unkn 032B 20 ng NaN NaN
C03 FAM 032B 20 ng Unkn 032B 20 ng 35.80 3.92
C04 FAM 063B 20 ng Unkn 063B 20 ng 38.13 0.77
C05 FAM 063B 20 ng Unkn 063B 20 ng NaN NaN
C06 FAM 063B 20 ng Unkn 063B 20 ng 37.49 1.19
C07 FAM 065A 20 ng Unkn 065A 20 ng 33.48 19.86
C08 FAM 065A 20 ng Unkn 065A 20 ng 35.45 4.99
C09 FAM 065A 20 ng Unkn 065A 20 ng 37.30 1.36
C10 FAM 142 20 ng Unkn 142 20 ng 34.89 7.39
C11 FAM 142 20 ng Unkn 142 20 ng 34.05 13.35
C12 FAM 142 20 ng Unkn 142 20 ng NaN NaN
D01 FAM 005B 20 ng Unkn 005B 20 ng 34.05 13.38
D02 FAM 005B 20 ng Unkn 005B 20 ng 33.72 16.81
D03 FAM 005B 20 ng Unkn 005B 20 ng 33.52 19.37
D04 FAM 007B 20 ng Unkn 007B 20 ng 34.87 7.54
D05 FAM 007B 20 ng Unkn 007B 20 ng 35.17 6.08
D06 FAM 007B 20 ng Unkn 007B 20 ng 33.62 18.02
D07 FAM 17B 20 ng Unkn 17B 20 ng 33.57 18.72
D08 FAM 17B 20 ng Unkn 17B 20 ng 35.18 6.04
D09 FAM 17B 20 ng Unkn 17B 20 ng 34.50 9.71
D10 FAM 022B 20 ng Unkn 022B 20 ng 35.58 4.57
D11 FAM 022B 20 ng Unkn 022B 20 ng 33.97 14.13
D12 FAM 022B 20 ng Unkn 022B 20 ng 34.97 7.00
E07 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E08 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E09 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E10 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E11 FAM ATE Ext NTC ATE Ext NaN NaN
E12 FAM ATE Ext NTC ATE Ext NaN NaN
F01 FAM ATE Post-PCR NTC ATE Post-PCR NaN NaN
F02 FAM ATE Post-PCR NTC ATE Post-PCR NaN NaN
F03 FAM NTC Water NaN NaN
F04 FAM NTC Water NaN NaN = 0 카피
MAP3K1_5_56102259_56110500_56140227_56144076_FF
ⅰ. 3C 템플릿은 단일 단계로 증폭하였다.
ⅱ. 랩 칩(Lap Chip) 이미지. 코멘트: 상기 앰플리콘은 파라포름알데히드 고정된 샘플(템플릿 10ng)에서만 볼 수 있다. 예상된 크기의 상기 단일-단계 PCR 생성물은 495bp이다.
ⅲ. 상기 샘플 PCR 생성물의 직접적인 서열 분석 후 ENSEMBL BLAT. 코멘트: 좋은 품질 서열 분석(정방향 및 역방향 프라이머)은 예측된 3C 상호작용과 100% 상동성을 갖는다.
ⅳ. 정량적 PCR 분석 표준의 성능. 상기 표준 곡선은 102-106 카피로부터 선형이다. R2=0.999.
ⅴ. 하나의 앰플리콘이 2배가 되어 2개의 앰플리콘이 된다(100% 효율). 분석 효율=91.9%(>90% MIQE 지침).
ⅵ. 상기 환자(n=8)와 서브 세트(C01-C12=유방암, D01-D12=비-악성) 사이의 카피수 차이(표 22)를 나타낸다. SQ=개시 수량(starting quantity), 20ng 템플릿에서의 카피. NaN= 0 카피.
샘플 PCR 생성물의 직접 염기 서열 분석 후 ENSEMBL BLAT
이 PCR 생성물을 염색체 5q11.2에 서열화하고 매핑하였다.

(Well)
형광
(Fluor)
표적
(Target)
구성요소
(Content)
샘플
(Sample)
Cq 개시 수량
(Starting Quantity, SQ)
C01 FAM 032B 20 ng Unkn 032B 20 ng NaN NaN
C02 FAM 032B 20 ng Unkn 032B 20 ng 38.94 3.68
C03 FAM 032B 20 ng Unkn 032B 20 ng 40.24 1.58
C04 FAM 063B 20 ng Unkn 063B 20 ng 38.22 5.87
C05 FAM 063B 20 ng Unkn 063B 20 ng 37.85 7.48
C06 FAM 063B 20 ng Unkn 063B 20 ng 38.05 6.58
C07 FAM 065A 20 ng Unkn 065A 20 ng 38.01 6.75
C08 FAM 065A 20 ng Unkn 065A 20 ng 37.72 8.14
C09 FAM 065A 20 ng Unkn 065A 20 ng 39.02 3.50
C10 FAM 142 20 ng Unkn 124B 20 ng 37.40 10.02
C11 FAM 142 20 ng Unkn 124B 20 ng 38.74 4.19
C12 FAM 142 20 ng Unkn 124B 20 ng 39.94 1.92
D01 FAM 005B 20 ng Unkn 005B 20 ng 42.07 0.48
D02 FAM 005B 20 ng Unkn 005B 20 ng 37.03 12.77
D03 FAM 005B 20 ng Unkn 005B 20 ng 38.12 6.29
D04 FAM 007B 20 ng Unkn 007B 20 ng 39.94 1.92
D05 FAM 007B 20 ng Unkn 007B 20 ng 39.27 2.97
D06 FAM 007B 20 ng Unkn 007B 20 ng 37.04 12.66
D07 FAM 17B 20 ng Unkn 17B 20 ng 36.62 16.75
D08 FAM 17B 20 ng Unkn 17B 20 ng 38.11 6.33
D09 FAM 17B 20 ng Unkn 17B 20 ng 38.06 6.54
D10 FAM 022B 20 ng Unkn 022B 20 ng 37.38 10.18
D11 FAM 022B 20 ng Unkn 022B 20 ng 38.85 3.90
D12 FAM 022B 20 ng Unkn 022B 20 ng NaN NaN
E07 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E08 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E09 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E10 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E11 FAM ATE Ext NTC ATE Ext NaN NaN
E12 FAM ATE Ext NTC ATE Ext NaN NaN
F01 FAM ATE Post-PCR NTC ATE Post-PCR NaN NaN
F02 FAM ATE Post-PCR NTC ATE Post-PCR NaN NaN
F03 FAM NTC Water NaN NaN
F04 FAM NTC Water NaN NaN = 0 카피
ME3_11_86300063_86304401_86420537_86426200_FR
ⅰ. 3C 템플릿은 단일 단계로 증폭하였다.
ⅱ. 랩 칩(Lap Chip) 이미지. 코멘트: 상기 앰플리콘은 파라포름알데히드 고정된 샘플(템플릿 10ng)에서만 볼 수 있다. 예상된 크기의 상기 단일-단계 PCR 생성물은 291bp이다.
ⅲ. 상기 샘플 PCR 생성물의 직접적인 서열 분석 후 ENSEMBL BLAT. 코멘트: 좋은 품질 서열 분석(정방향 및 역방향 프라이머)은 예측된 3C 상호작용과 100% 상동성을 갖는다.
ⅳ. 정량적 PCR 분석 표준의 성능. 상기 표준 곡선은 102-106 카피로부터 선형이다. R2=0.998.
ⅴ. 하나의 앰플리콘이 2배가 되어 2개의 앰플리콘이 된다(100% 효율). 분석 효율=96.8%(>90% MIQE 지침).
ⅵ. 상기 분석은 상기 환자(n=8)와 서브 세트(C01-C12=유방암, D01-D12=비-악성) 사이의 차이(표 5)를 나타낸다. SQ=개시 수량(starting quantity), 20ng 템플릿에서의 카피. NaN= 0 카피.

(Well)
형광
(Fluor)
표적
(Target)
구성요소
(Content)
샘플
(Sample)
Cq 개시 수량
(Starting Quantity, SQ)
C01 FAM 032B 20 ng Unkn 032B 20 ng NaN NaN
C02 FAM 032B 20 ng Unkn 032B 20 ng NaN NaN
C03 FAM 032B 20 ng Unkn 032B 20 ng 40.29 0.63
C04 FAM 063B 20 ng Unkn 063B 20 ng 40.51 0.54
C05 FAM 063B 20 ng Unkn 063B 20 ng 41.88 0.21
C06 FAM 063B 20 ng Unkn 063B 20 ng 41.21 0.34
C07 FAM 065A 20 ng Unkn 065A 20 ng 40.75 0.46
C08 FAM 065A 20 ng Unkn 065A 20 ng 41.84 0.22
C09 FAM 065A 20 ng Unkn 065A 20 ng 41.59 0.26
C10 FAM 142 20 ng Unkn 142 20 ng NaN NaN
C11 FAM 142 20 ng Unkn 142 20 ng NaN NaN
C12 FAM 142 20 ng Unkn 142 20 ng NaN NaN
D01 FAM 005B 20 ng Unkn 005B 20 ng 42.62 0.13
D02 FAM 005B 20 ng Unkn 005B 20 ng 39.44 1.11
D03 FAM 005B 20 ng Unkn 005B 20 ng NaN NaN
D04 FAM 007B 20 ng Unkn 007B 20 ng NaN NaN
D05 FAM 007B 20 ng Unkn 007B 20 ng NaN NaN
D06 FAM 007B 20 ng Unkn 007B 20 ng 43.48 0.07
D07 FAM 17B 20 ng Unkn 17B 20 ng NaN NaN
D08 FAM 17B 20 ng Unkn 17B 20 ng 41.34 0.31
D09 FAM 17B 20 ng Unkn 17B 20 ng 40.22 0.66
D10 FAM 022B 20 ng Unkn 022B 20 ng NaN NaN
D11 FAM 022B 20 ng Unkn 022B 20 ng NaN NaN
D12 FAM 022B 20 ng Unkn 022B 20 ng NaN NaN
E07 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E08 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E09 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E10 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E11 FAM ATE Ext NTC ATE Ext NaN NaN
E12 FAM ATE Ext NTC ATE Ext NaN NaN
F01 FAM ATE Post-PCR NTC ATE Post-PCR NaN NaN
F02 FAM ATE Post-PCR NTC ATE Post-PCR NaN NaN = 0 카피
MELK_9_36577630_36579243_36637050_36643005_RF
ⅰ. 3C 템플릿은 단일 단계로 증폭하였다.
ⅱ. 랩 칩(Lap Chip) 이미지. 코멘트: 상기 앰플리콘은 파라포름알데히드 고정된 샘플(템플릿 10ng)에서만 볼 수 있다. 예상된 크기의 상기 단일-단계 PCR 생성물은 265bp이다.
ⅲ. 상기 샘플 PCR 생성물의 직접적인 서열 분석 후 ENSEMBL BLAT. 코멘트: 좋은 품질 서열 분석(정방향 및 역방향 프라이머)은 예측된 3C 상호작용과 100% 상동성을 갖는다.
ⅳ. 정량적 PCR 분석 표준의 성능. 상기 표준 곡선은 102-106 카피로부터 선형이다. R2=0.995.
ⅴ. 하나의 앰플리콘이 2배가 되어 2개의 앰플리콘이 된다(100% 효율). 분석 효율=91.3%(>90% MIQE 지침).
ⅵ. 상기 분석은 상기 환자(n=8)와 서브 세트(C01-C12=유방암, D01-D12=비-악성) 사이의 차이(표 24)를 나타낸다. SQ=개시 수량(starting quantity), 20ng 템플릿에서의 카피. NaN= 0 카피.
샘플 PCR 생성물의 직접 염기 서열 분석 후 ENSEMBL BLAT
이 PCR 생성물을 염색체 9p13.2에 서열화하고 매핑하였다.

(Well)
형광
(Fluor)
표적
(Target)
구성요소
(Content)
샘플
(Sample)
Cq 개시 수량
(Starting Quantity, SQ)
C01 FAM 032B 20 ng Unkn 032B 20 ng NaN NaN
C02 FAM 032B 20 ng Unkn 032B 20 ng 38.94 3.68
C03 FAM 032B 20 ng Unkn 032B 20 ng 40.24 1.58
C04 FAM 063B 20 ng Unkn 063B 20 ng 38.22 5.87
C05 FAM 063B 20 ng Unkn 063B 20 ng 37.85 7.48
C06 FAM 063B 20 ng Unkn 063B 20 ng 38.05 6.58
C07 FAM 065A 20 ng Unkn 065A 20 ng 38.01 6.75
C08 FAM 065A 20 ng Unkn 065A 20 ng 37.72 8.14
C09 FAM 065A 20 ng Unkn 065A 20 ng 39.02 3.5
C10 FAM 142 20 ng Unkn 124B 20 ng 37.4 10.02
C11 FAM 142 20 ng Unkn 124B 20 ng 38.74 4.19
C12 FAM 142 20 ng Unkn 124B 20 ng 39.94 1.92
D01 FAM 005B 20 ng Unkn 005B 20 ng 42.07 0.48
D02 FAM 005B 20 ng Unkn 005B 20 ng 37.03 12.77
D03 FAM 005B 20 ng Unkn 005B 20 ng 38.12 6.29
D04 FAM 007B 20 ng Unkn 007B 20 ng 39.94 1.92
D05 FAM 007B 20 ng Unkn 007B 20 ng 39.27 2.97
D06 FAM 007B 20 ng Unkn 007B 20 ng 37.04 12.66
D07 FAM 17B 20 ng Unkn 17B 20 ng 36.62 16.75
D08 FAM 17B 20 ng Unkn 17B 20 ng 38.11 6.33
D09 FAM 17B 20 ng Unkn 17B 20 ng 38.06 6.54
D10 FAM 022B 20 ng Unkn 022B 20 ng 37.38 10.18
D11 FAM 022B 20 ng Unkn 022B 20 ng 38.85 3.9
D12 FAM 022B 20 ng Unkn 022B 20 ng NaN NaN
E07 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E08 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E09 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E10 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E11 FAM ATE Ext NTC ATE Ext NaN NaN
E12 FAM ATE Ext NTC ATE Ext NaN NaN
F01 FAM ATE Post-PCR NTC ATE Post-PCR NaN NaN
F02 FAM ATE Post-PCR NTC ATE Post-PCR NaN NaN
F03 FAM NTC NaN NaN
F04 FAM NTC NaN NaN = 0 카피
MSH3_5_80021913_80025030_80153948_80159012_RF
ⅰ. 3C 템플릿은 단일 단계로 증폭하였다.
ⅱ. 랩 칩(Lap Chip) 이미지. 코멘트: 상기 앰플리콘은 파라포름알데히드 고정된 샘플(템플릿 10ng)에서만 볼 수 있다. 예상된 크기의 상기 단일-단계 PCR 생성물은 207bp이다.
ⅲ. 상기 샘플 PCR 생성물의 직접적인 서열 분석 후 ENSEMBL BLAT. 코멘트: 좋은 품질 서열 분석(정방향 및 역방향 프라이머)은 예측된 3C 상호작용과 100% 상동성을 갖는다.
ⅳ. 정량적 PCR 분석 표준의 성능. 상기 표준 곡선은 102-106 카피로부터 선형이다. R2=0.99.
ⅴ. 하나의 앰플리콘이 2배가 되어 2개의 앰플리콘이 된다(100% 효율). 분석 효율=97.1%(>90% MIQE 지침).
ⅵ. 상기 분석은 상기 환자(n=8)와 서브 세트(C01-C12=유방암, D01-D12=비-악성) 사이의 차이(표 25)를 나타낸다. SQ=개시 수량(starting quantity), 20ng 템플릿에서의 카피. NaN= 0 카피.
샘플 PCR 생성물의 직접 염기 서열 분석 후 ENSEMBL BLAT
이 PCR 생성물을 염색체 5q14.1에 서열화하고 매핑하였다.

(Well)
형광
(Fluor)
표적
(Target)
구성요소
(Content)
샘플
(Sample)
Cq 개시 수량
(Starting Quantity, SQ)
C01 FAM 032B 20 ng Unkn 032B 20 ng NaN NaN
C02 FAM 032B 20 ng Unkn 032B 20 ng NaN NaN
C03 FAM 032B 20 ng Unkn 032B 20 ng NaN NaN
C04 FAM 063B 20 ng Unkn 063B 20 ng NaN NaN
C05 FAM 063B 20 ng Unkn 063B 20 ng 38.99 7.08
C06 FAM 063B 20 ng Unkn 063B 20 ng NaN NaN
C07 FAM 065A 20 ng Unkn 065A 20 ng NaN NaN
C08 FAM 065A 20 ng Unkn 065A 20 ng NaN NaN
C09 FAM 065A 20 ng Unkn 065A 20 ng NaN NaN
C10 FAM 142 20 ng Unkn 142 20 ng NaN NaN
C11 FAM 142 20 ng Unkn 142 20 ng NaN NaN
C12 FAM 142 20 ng Unkn 142 20 ng 41.30 1.48
D01 FAM 005B 20 ng Unkn 005B 20 ng NaN NaN
D02 FAM 005B 20 ng Unkn 005B 20 ng NaN NaN
D03 FAM 005B 20 ng Unkn 005B 20 ng NaN NaN
D04 FAM 007B 20 ng Unkn 007B 20 ng NaN NaN
D05 FAM 007B 20 ng Unkn 007B 20 ng 41.01 1.80
D06 FAM 007B 20 ng Unkn 007B 20 ng NaN NaN
D07 FAM 17B 20 ng Unkn 17B 20 ng NaN NaN
D08 FAM 17B 20 ng Unkn 17B 20 ng NaN NaN
D09 FAM 17B 20 ng Unkn 17B 20 ng NaN NaN
D10 FAM 022B 20 ng Unkn 022B 20 ng 39.09 6.63
D11 FAM 022B 20 ng Unkn 022B 20 ng NaN NaN
D12 FAM 022B 20 ng Unkn 022B 20 ng NaN NaN
E07 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E08 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E09 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E10 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E11 FAM ATE Ext NTC ATE Ext NaN NaN
E12 FAM ATE Ext NTC ATE Ext NaN NaN
F01 FAM ATE Post PCR NTC ATE Post PCR NaN NaN
F02 FAM ATE Post PCR NTC ATE Post PCR NaN NaN
F03 FAM NTC NaN NaN
F04 FAM NTC NaN NaN = 0 카피
NF1_17_29477103_29483764_29651799_29657368_FF
ⅰ. 3C 템플릿은 단일 단계로 증폭하였다.
ⅱ. 랩 칩(Lap Chip) 이미지. 코멘트: 상기 앰플리콘은 파라포름알데히드 고정된 샘플(템플릿 10ng)에서만 볼 수 있다. 예상된 크기의 상기 단일-단계 PCR 생성물은 401bp이다.
ⅲ. 상기 샘플 PCR 생성물의 직접적인 서열 분석 후 ENSEMBL BLAT. 코멘트: 좋은 품질 서열 분석(정방향 및 역방향 프라이머)은 예측된 3C 상호작용과 100% 상동성을 갖는다.
ⅳ. 정량적 PCR 분석 표준의 성능. 상기 표준 곡선은 102-106 카피로부터 선형이다. R2=0.987.
ⅴ. 하나의 앰플리콘이 2배가 되어 2개의 앰플리콘이 된다(100% 효율). 분석 효율=99%(>90% MIQE 지침).
ⅵ. 상기 분석은 상기 환자(n=8)와 서브 세트(C01-C12=유방암, D01-D12=비-악성) 사이의 차이(표 26)를 나타낸다. SQ=개시 수량(starting quantity), 20ng 템플릿에서의 카피. NaN= 0 카피.

(Well)
형광
(Fluor)
표적
(Target)
구성요소
(Content)
샘플
(Sample)
Cq 개시 수량
(Starting Quantity, SQ)
C01 FAM 032B 20 ng Unkn 032B 20 ng NaN NaN
C02 FAM 032B 20 ng Unkn 032B 20 ng NaN NaN
C03 FAM 032B 20 ng Unkn 032B 20 ng 38.29 3.69
C04 FAM 063B 20 ng Unkn 063B 20 ng 38.94 2.36
C05 FAM 063B 20 ng Unkn 063B 20 ng 36.45 13.11
C06 FAM 063B 20 ng Unkn 063B 20 ng 39.37 1.76
C07 FAM 065A 20 ng Unkn 065A 20 ng 41.96 0.30
C08 FAM 065A 20 ng Unkn 065A 20 ng NaN NaN
C09 FAM 065A 20 ng Unkn 065A 20 ng 37.18 7.92
C10 FAM 142 20 ng Unkn 142 20 ng NaN NaN
C11 FAM 142 20 ng Unkn 142 20 ng NaN NaN
C12 FAM 142 20 ng Unkn 142 20 ng 41.77 0.34
D01 FAM 005B 20 ng Unkn 005B 20 ng 38.43 3.36
D02 FAM 005B 20 ng Unkn 005B 20 ng NaN NaN
D03 FAM 005B 20 ng Unkn 005B 20 ng NaN NaN
D04 FAM 007B 20 ng Unkn 007B 20 ng NaN NaN
D05 FAM 007B 20 ng Unkn 007B 20 ng 40.95 0.60
D06 FAM 007B 20 ng Unkn 007B 20 ng NaN NaN
D07 FAM 17B 20 ng Unkn 17B 20 ng 37.66 5.73
D08 FAM 17B 20 ng Unkn 17B 20 ng NaN NaN
D09 FAM 17B 20 ng Unkn 17B 20 ng NaN NaN
D10 FAM 022B 20 ng Unkn 022B 20 ng 38.33 3.59
D11 FAM 022B 20 ng Unkn 022B 20 ng NaN NaN
D12 FAM 022B 20 ng Unkn 022B 20 ng NaN NaN
E07 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E08 FAM Gen Neg Ctrl Neg Ctrl Gen Neg Ctrl NaN NaN
E09 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E10 FAM No fix 20 ng Neg Ctrl No fix 20 ng NaN NaN
E11 FAM ATE Ext NTC ATE Ext NaN NaN
E12 FAM ATE Ext NTC ATE Ext NaN NaN
F01 FAM ATE Post PCR NTC ATE Post PCR NaN NaN
F02 FAM ATE Post PCR NTC ATE Post PCR NaN NaN
F03 FAM NTC NaN NaN
F04 FAM NTC NaN NaN = 0 카피
SRD5A1_5_6634973_6639025_6667775_6669711_RF
ⅰ. 3C 템플릿은 단일 단계로 증폭하였다.
ⅱ. 랩 칩(Lap Chip) 이미지. 코멘트: 상기 앰플리콘은 파라포름알데히드 고정된 샘플(템플릿 10ng)에서만 볼 수 있다. 예상된 크기의 상기 단일-단계 PCR 생성물은 219bp이다.
ⅲ. 상기 샘플 PCR 생성물의 직접적인 서열 분석 후 ENSEMBL BLAT. 코멘트: 좋은 품질 서열 분석(정방향 및 역방향 프라이머)은 예측된 3C 상호작용과 100% 상동성을 갖는다.
ⅳ. 정량적 PCR 분석 표준의 성능. 상기 표준 곡선은 102-106 카피로부터 선형이다. R2=0.997.
ⅴ. 하나의 앰플리콘이 2배가 되어 2개의 앰플리콘이 된다(100% 효율). 분석 효율=95.5%(>90% MIQE 지침).
TSPYL5_8_98276431_98282736_98316421_98318720_FF
ⅰ. 3C 템플릿은 단일 단계로 증폭하였다.
ⅱ. 랩 칩(Lap Chip) 이미지. 코멘트: 상기 앰플리콘은 파라포름알데히드 고정된 샘플(템플릿 10ng)에서만 볼 수 있다. 예상된 크기의 상기 단일-단계 PCR 생성물은 507bp이다.
ⅲ. 상기 샘플 PCR 생성물의 직접적인 서열 분석 후 ENSEMBL BLAT. 코멘트: 좋은 품질 서열 분석(정방향 및 역방향 프라이머)은 예측된 3C 상호작용과 100% 상동성을 갖는다.
ⅳ. 정량적 PCR 분석 표준의 성능. 상기 표준 곡선은 102-106 카피로부터 선형이다. R2=0.998.
ⅴ. 하나의 앰플리콘이 2배가 되어 2개의 앰플리콘이 된다(100% 효율). 분석 효율=94.2%(>90% MIQE 지침).
결론
1. 상기 3C 마커 ATM, FOXC1 및 TSPYL1은 프라이머 두 세트 모두에 대해 단일-단계 생성물을 생산했다.
2. 유방암에서 ATM 카피 수가 증가하였다(n = 4, 표 1). 0.009037772의 p-값으로 C 열의 샘플(유방암 악성 후기)은 D 열의 샘플(비-악성 초기 단계)과 상이하다.
3. 유방암에서 CDC6_FF 카피 수가 감소하였다 (n = 4, 표 2).
4. 유방암에서 FOXC1_FR 카피 수가 감소하였다. p-값이 0.004112668으로 C 열은 D 열과 상이하다.
Figure 112018109945797-pct00014
>ATM_11_108118137_108126372_108155279_108156687_RF
밑줄 = 정방향, 이중 밑줄 = 역방향, 점선 밑줄 = Taq I.
AAGGGATAAGTAACCAAACTTGGTCAATATTAGATAAACTTCAAGGGACCTTTTTTTTTTTTAGTTTCCTAGTTATCTATATTGAACCAAGAAATGGAACAGCAAGTTCCTTAGTTGCTTAGGTGGACCTATTCAGAACTGGTTGTAAGTCTGCAGTCTGAAGGGAAATGGTGAGCAGAGGACTCCTTTCCCAAAGACAGCTGGAACAGAAATAGGCACTCCAGAGGTTATGGAATTTGAGAGAGATACTCAGCCTCTAGCCACTCCCATTCAATCTCCCAGCTTAGTCTTCTGAGCATTCTTAATCTTACTATTCTTTTCTTAATGTATTCAAACCAAAAGACAGCAATTTTTAGAGCCTGAATAGGTTTTGGAGGGAAAAGTAATTACGTTCAACTTCGACTGTATTCTACAAAGTGCTGGGATTACAGGCATGAGCCACCAAGCCCAGTCTGTTTCTTTTTTGCAATTAAGCTAGAGTTCACATAGCATAAAATTCACGATTTTGAGTTGTACATTTCAGTGGTTTTTAGTATTTTTACTATGTTGTACAACCATCATCACTAATTCTGGAAACTTTTTTTATTTTATTTTTATTTTTTTGAGATGGAGTCTTGCTCTGTCACCCAGGCTGGAGTGCAGTGGCACAATCTCCGCTCACTGCAACCTCCCTTTCCCGGGTTCAAGTGATTCTCCTGCATCAGCCTCCCGAGTAGCTGGGACTACAGGTGCCTGCCACCACGCCCAGCTAATTTTTGTTTTTTTAGTAGAGACTGGGTTTCACCATATTGGCCAGCCTA
Figure 112018109945797-pct00015
>CDC6_17_38421089_38423079_38451196_38457050_FF
AGGTAAGTTAAAGACCAAGAACTGGCATTGGTCTTAGTATCATGGGACCCTTTTGAGTAGTTTCAGTGGAGTGGTGGAGGGTGAAAGTGAAAGCTTAATTGGAGTGGGTTCAAGAATGCAGGAATAGGAGGAGAGAAATTGGAGATAGCAATATAGAAATCTCTTAAAGAGTTCGCTGTAAAGTCCAGGAGAGAGGGGTGAAGATAAGTGAAGTGATTGTTGGACGAAGATGTGGGGTTGAGAGTTGTTTTTTTCCCATCCCAAGATGGGAGACCTATTTGTATGCTGATGGAATGAGTAGCATGAAACTTAGGAGAGAGGGAAAAAATTGAATCAGAAGAGAGGGAACAGATTGCCTGAATAATGACCTGGAGGAGGCCAGAGAAAAGAGAATGTGATCGATTTCTAAAATACTGTGTGTGTGTATGTATGATGAGACAGATGATACTAAGTTTGAGCTAAAGGAAATTCAAGTATAGTCACATGGTGGCAAAGCAGAGGTTTTAAATCTCTAACCAGAGGCCAAAGGATGAGAGATAATGCTATTCTCTTAAGGATGTCAAAATAATGTGGGATGACTTGAAAAGTAGGGTTACCCTTTCTCTGGGCCAAATAGTGAGCTGTTTTGTCCTATGGAATGTAATTTAATGTCAGAGGAACAAAACCCACCTCATGAAAGGACCAGAGAACTACTGTATTTTTTTTTGGGACAGGATCTCTGTCACTCAGGCTGGAGTACAGTGGCACTATCATGGCTCACTGCAGCCTTGGCTTCCTGGGTTCAAGTGATCCTCCTGCCT
Figure 112018109945797-pct00016
>FOXC1_6_1577253_1581989_1604206_1605973_FR
CGCCGTCCCAGCAGCGCCCCATCTCACCAACTCCCACCTTCATGTGTGGCCGCCCACCTAGAGCCATGCCTGAAGCCACTGTCCCTGACCACAAAGCTTTTGGCTGATAGGAAGCATGACAGCACTGGGGCCCTACACTGGAAGCGGGACCGTCCAGAGAAGAAGACTGCGCACAGGGATCGGGAGCTGGGACACACGTTAGTCAAGGTGTACGAGGGAGGAATCACCGCCATGTGGAGCCACTACTCGGGGAGGACGTGGGCCACCCGGAGCTCAGTGACAGTACTCCCGGGAGTGTACATCGTTGGTAATGTCCACGACAGTGTCCCTGCCTGTGACCCAATAATTTCCCATCCAGGGACACACTTCACAGAAATGCACGCACAGGCACAACAGCATCGAAACCGGTTCTTTGGAGGCTCAGTTTTTGGTAATTAAGACTAAGGAGTGTTTAAAAAACAGAAGTACATTTTCCTGGAAACCAGCAGTCTTTATTTGCAACTTTTATTGGCAAACCTGGCTGCCAGTAAATACATTCCTTGGCATCTCCCACAATGTAATTCACTGGATGGAGCGGCCTTGCTTTTTCTGTAACGTGTACGTCAATTAAAAGGGCCGCCTGGAAGGAATGCGTAGCGGTGGCTGAAAGCCCCAGTCTCGGGTCACCTCCCTCCACTCCAGGAACAAAAGCGTCCGTGGTCTGTGCCTGGAAGTCTGAGAGGGTCTCCCCGATGGGGCTGTTCCCGCCCGGACCCTGAGGGATGAGAGTTGCAGCCTAGAAAACCAGGTGCCAGGCCCTG
Figure 112018109945797-pct00017
>MAP3K1_5_56102259_56110500_56140227_56144076_FF
AAACCAGCTGGAGGAAAGGAAAGGAAGGAAGAAATAAACGCAACACAGAAGTTCTCCTCAGTTGACAAAAGGTCAAAAATCATTAACGTGTAAATGTTGCTTTTTCCATCCCAAAGCACCTTCTCACGTAGAGTCCAGGGACTAGGAGGACTCACAACGCAGCGATGGGCAGCCAGGCCCTGCAGGAGTGGGGACAGAGGGAACCCGGCCGGTGGCCCGACCCTGCAGGGAAGAAGGACGTGCGGCGAGAAGCATCGGATTCGGGGAGGGCCGGGACCTGGCCGAGGGTGACATTACCGAGCACTTCCTGGCACAGCGCTGGTCCCCTCCCCAAACGCGCTATATGTGGTTCTGTACGGGACTGCCTTTCCCAAAGACAGCCAAGGAAAAACTAAAGATCGAAAGTTTTTATTACTTCCAAATTAGTAAATTTGTAACAATCATCAGGCAACTAACTATAATAAGAGGGAATTTACAAAAGACAGAGAGCTACTAGTCAGTATCAAATCATTCTTAAAAGTGGCAACTCTGTATCAATTTTTTTTTTGCAGTCAATTACCTTTGACTCAGTCTATAAAGTACATGCCCAAATCTCCCTTTAGAGAAGAAAAGTGAATCAAAAAGAAAAATGTATATTAACTGTACAGTTCTCCTATACTAAATGTTCTTACATGCTCAAAATGTATGAATATATTTAAAGCAACTGATCCTCTATTGAATACTGAATAAACTTGAAGGGATTTCTAAGTAAATTATTACTGGTAACTCAAACTCAGTGTGCTATAAATTTCAGACACCAC
Figure 112018109945797-pct00018
>ME3_11_86300063_86304401_86420537_86426200_FR
TAACCTTCCATAGGCCTCAGCTCCCTTATCTATTAACCTGGTGAAATGCAGACCCCTCTGCATGGGGTTACAAGGTTTCAGCATGACTGGGTATGAAAAGAGAACAAAGAAGCTTCCTGGAGATGACTGTGGCCTTGGCTCACTGCCAGGAAAATGACTCATTTCTGTATGCCAGGGTTATAGTTCACTGTTACCCTGACAAATGAATGTGGAAGACCCATGATTTCCTCCACCCTCCTTCACTCACATAGTAAAAGTTAGCTACTGCCTGCAACATACCAGGCACCGTACAACACGAAACTGTAGGCTCCCCCTCCAGGAAGTGACAATGTCATTCCTAACCTGTTGGAATTTTAACACCTGTCATAAAAGGATCTCATGATGCTTTGAATACTTTCTCGATACCTTATTATAAAATCAGCTTTGTGTTGAATGATTTTTCCCAGCTGTAGACTAATGTAAATGTTCTGAGCATGTTTAAGGTAGGCTAGTCTAAGCTGTGATGTTAGGTAGATTAGGTGCATTTAAATGCATTTTCAATGATATTTTAAATTTGCAGTGGGTTTATCAGGATGTTACTCCAAGATGCTCCTCCAAGGTGAGGGGCATCTGTGTTTTAGTCAGTGAAAATGTCTTGCAAAACTGAAGATAAAATAAATACAGTTAGTCACACTTCACTTGCACTATAAGAAATTCTAAAGAAAAATTCTTCAAATTGAAGGAATATAATAACATAAATTTATATCTACAGGAAGGAATAAAGAGCAAAGAAATGATAAACAAATCGCTTAAAGTGTTTA
Figure 112018109945797-pct00019
MELK_9_36577630_36579243_36637050_36643005_RF
AGTAGAGATGGGGTTTCACCATGCTGGCCAGGCCAGTCTCAAACTCCTGACCTCAGGTGATCTGCCCGCCCCAGCCTCCCAAAATGCTAGAATTACAGGTGTGAACTATTGTGCCCGGCATTGTACAACCGAACTTTAACAACAGTTGCTCAGATGATGATGGGGATAAAGAGTTGGGAAAGAGCACATCTTCTTGAAATGCTTGCTGGAATATGCTTACTTCTTAAAAGATTATAGAGAATATTGATTCTTCCCCAAGAAATTGACAGATTCATGTTTTACATAATGATATTTGATTGTATAAAGTAATTATGCTGATTTTAAAATGTGAAAACATTGAATATATTTGTAATTTTTTGTTAATAAAGTGCATAATTTTTTTTTGTAGTTTATTCACCTCGACTAGATTTTAATTTTTAATTTTTATTTATTTTTTTGAGACACAGCTTCGCTTGTTACCCAGGCTGGAGTGCAGTGGCATGATCTCGGCTCACCGCAACCTCTGCTTCCCGGGTTCAAGTGATTCTCCTGCCTCAGCCTCCCTAGTAGCTGGGATTACAGGCATGGGCCACCACGCCTGGCTAATTTTTTATATTTTTAGTAGAGACGGGGTTTCTCCATGTTGGTCAGGCTGGTCTTGAACTCCCGACCTCAGGTGATCCGCCTGCCTCAGCCTCCCAAAGTGCCGGGATTACAAGTGTGAGCCACTGCGCCTGGCTGTTTTTTATTTTTAGTAGAGACAAGGTCTTGCTATATTGTCCTGGCTTGTCTTGAACTCCAGGCCTCAAGCAATCCTCCTG
Figure 112018109945797-pct00020
MSH3_5_80021913_80025030_80153948_80159012_RF
TAACAAAAATAAACTTTAAAATGGTGGAGGTGAGTGGGGAAAAGTGAAACCTCTGCTTTACAGAATACCAACGAATAAATGTAGGAAGAATTTTTTAATCAACATTTAATAACGACTATAATAATAACTGATTCAGACAGCAATGATCAATAGATTATAAAACCTTTGGATGAAAGATTGTTGGAGAAAAGGATATTCATATATCTCAAAGTGTCATGCCACAGGTTATTTATTAATTACAAAGGGAAAAGGTATAGTGAAGAAATCTAGTGGGTACCCTCTTCAACCAGATAATCAAATTTGGCATCCCCAGTTATGTAAAACTGATATCACGTCCCACCTGATGTGATGCACTGGGAAGGACCCATCACCTACATATACATGGAATATTCCTGGTATCGAAATATTTTAGGTAATCATTATTTGTCTAATTCACATGTCCACAATCAGGCATTAATGTTTACTTTCATTTGTACCTCACATTCCTGCCAGTCCAGCTTATGTTAGGGTCCATTTTGTGGATGGTGAGGTGAATAGACATTTTCCCTCTTGGCATAAACTTGGCTTCACTCTAATCTTCATCCTACTCCATATGGAGGAAATTTATCTCTGTCACATGCTAGAGAGTGTTCATCATCAGCTCCCCATCACTGCTCCATTTAAGCATCAGTGTCTAGTTAGCATTTCCTTGCATCTAGGCATCAGTGTCTTGTTAGCATGTCTCTTTAATTTCATGATGCCTTGGTCAAATAAAGTGTCTGAGCGTGTATCCCACTTCTTTTTATTTTTTTCTGTAAGGT
Figure 112018109945797-pct00021
>NF1_17_29477103_29483764_29651799_29657368_FF
ACTTTCATTTTAATTTATTATTTCCCTTAGAAACATCTCCTATCTTTTGTGACCATGTCTCCTTTTCCAGTATGTTTCTTGAATTAGGATTTCATAGAGCTTTTGTGGCCTACACGAATTGACCACAGTAATCCATTACACATATTTTTCTTTAGCATCTTGTTTGAATTTACTTACGGTTGTCCCAGCCCTAAGTAGATGATAAAATATGATCTCATAGTCCTAAAATGTGGATTGATTTTTTTATGAAGATATGTGTTTTTTCTTCCTTCTGTAACCTGTGACAGATTCTGTAGTAGTTACCCTGTTGTTGAAACAGTTTTTCTCAAATACCAGTTTCATCAAATAATTCCACTGTTAAAAGCTCATAATTTCTTTCTTCTTCCCATTTTCTAAAATCGATTTTTAAATTAAAGGTACAAGTTAAGGCACACAGAAGATTATAGGCAGCTGACCTAGGAGAAAACACAAATGAAGTTGTTTTAAAACGTATTTTTCCTTATAGTTCCAAAATTTTTTCATAACATACAATTTGTGATTCTGTTACAAAGTATGATCAACTATTTTTAAATTTTATGATCAGTTAGAAATAAGATGTTATAATTCTACAGTAAAACCAAAATACCCCTTAATCATTTAGGGATTTTATAAAAAGGGACACACTTGATATAACCATAAGAGCACTGTGAGGCTCCTATGACAGAGGGGCGGGGTATAGGCTTTCCTAAAATACATCTCACTGAGACATAAAATATGAGAGGACTTATGGTCCTAATGTGGATCAATAGAAATTAAGTCAG
Figure 112018109945797-pct00022
>SRD5A1_5_6634973_6639025_6667775_6669711_RF
ACCACTTTTTAAGATTTATCCTGTTTGTTCTTTGTTGATTGAAACATAATAATTGTTAAAATTCTCTACAGCCTTCTTTTTCTTCCATAGCTAATCTTCCTTCTAATAGTTTTTGCTTTCTGTTTTGCTGTTGTTGCTTTGCAAAGCTTTCCCCTCATAGCCTGTACCTGTTATCAATATAAAATAATCTTCCTGTTGAATGCTTCATGACTTGAATTCTACTTTGATAAAAACATTGCCATACTGCTTTTTATCTTGATGAATTCATCTGGCATTGCTTTGCCTTATCATCTCATCTGGAGTTTTTAAATGCCATTTGTTTCAGTTGTCTTTAACAACATAATAAATAGACTTTGCCATTTAACAAGGTAGCTCAAATTCTTTTACTAATTGTTACATCGAAAGTTCAAAATTAAATTTTAAACGTTTTCATTCAGGCTCTGGAAAGCTTCACAGTTAAAAAGGATGTCTCTACACCCAAGGAAGTTGAACTCACTGGCTGTGTGACTATGGGCAGTTTACCCAACCTTTCTGATTTGGGGTCCCACCTTAAAACACTCACTTCCCAGAGAGACAGGAAGAACTCAGTGTGTGTTTATAAGCCTCTCTTCTTTCTCCTGGTGTCATGCATTCCAGCGAAGAGAAAGTACACAGCTCCACTACTTGGAACCAGTGTTGTACCCAGCACAGTTTTTGGTACCTGAGTTCCCTGAAAACCAGCACCTTACCCTGTAACTGGTGCAGTCTGTGTCCTCAGTGTGCTTTGATGACTTGCACTTTAAACAAGGGCAAGTCAACAT
Figure 112018109945797-pct00023
>TSPYL5_8_98276431_98282736_98316421_98318720_FF
TAAAGAAGTTTCACATTCATATGCCAACTCAGATTGATGGGCAGCAACTGGATAATCCGCTGTGCAGAAAGTTAAATACAGGTTCTGTGCAAAGAAGTGTCTAGATTCATAGTGCCAGACATCTGCCCTGGGCCACATGCTTACCGTCCCATGGATGGATGGAACTTGGAATCAGAAGACCCAAGTTTGAGTCCTGGCTCTACTACTTTTGTGATTTTGGTCATTTAACCTCTTTGAGCCTTCTTATGGCATAGTAGTTATAATCAAGATAATATAAGTGAATGTGCTTTGTAAACCATGAAGTGTTGGTCACACAGATGATAGCTACTGTCTTATATTTGTCAAACCTCAGCTGAGGACCAGGTTGACAGGATGGAGGAAGAGGAGGAATTCAAGACTCGAACTAAACAAAAAGGAGATGATCCTGGGTGGGCTTGACTTAATCAAGTGAAAGCCTTAAAAGCAAGAGTCTCCTGCTAGTCTAGGAAAAGCAAACAGCCCTGCTATGAATGGCCTATAGAAAGGGGCAGCCTCTAGGAGCATGGGCCTCAGTCATATGCCCACGAGGAACTGAATATTGCCAGCAACCATGTGAGCATGGAAGAGGACTCTAAGCCTCTGATGAGACCACAGCCCTGGCCAATGCTTTGATTGTGGCTCTGTGAGGCCTTGAACAAAGGACCAAGTATAGCTATGCCAGGACTTCTGAACCACGGGAATGGTGAGATAATAAATGTTTGGTGTTTTAAGCCACTAAGTTTGTGTTAATTTTTTATGCCGCAATAGAAAGCGAATACTAC
>CDC6_17_38421089_38423079_38467677_38474960_FR
AGGTAAGTTAAAGACCAAGAACTGGCATTGGTCTTAGTATCATGGGACCCTTTTGAGTAGTTTCAGTGGAGTGGTGGAGGGTGAAAGTGAAAGCTTAATTGGAGTGGGTTCAAGAATGCAGGAATAGGAGGAGAGAAATTGGAGATAGCAATATAGAAATCTCTTAAAGAGTTCGCTGTAAAGTCCAGGAGAGAGGGGTGAAGATAAGTGAAGTGATTGTTGGACGAAGATGTGGGGTTGAGAGTTGTTTTTTTCCCATCCCAAGATGGGAGACCTATTTGTATGCTGATGGAATGAGTAGCATGAAACTTAGGAGAGAGGGAAAAAATTGAATCAGAAGAGAGGGAACAGATTGCCTGAATAATGACCTGGAGGAGGCCAGAGAAAAGAGAATGTGATCGATGACCTTAATGTCAGTGTCACTGACTCTGACAAGGAGGAAAGGACAGCGATGAGCCAGGCTGACCCCCGCCACCCCATTCCCATAGCCCCACTTTCTTCTCTCTTCTTGTTCAGAAATGTTTCACTTTGCCTCATCTAGCCCCTTTGGCCAGTAGGTCACATCTGGGAGCTTCTGGGGGTGCCACATGTCTGCCTCAATCTGGGCTGTTTCCTCCCCTCCAAGATATTTCACTGTCTCTGGGCTGGGCGCCAGGACTCCTGGGTTTCCCTGCCTGTGGTGCAGGGCTCCCCTGCAGGGCTCCAGAGAGTCGCTTAGCTGGTTTCCTTCCTCCTTTGTGGGGAGGGCCTTCCCCTAGGGCTGGGAGGTGTCAGGAATCCCAGGTGGGACAGGGGTGGGG
>SLC16A10_6_111441989_111447305_111492951_111498421_FR
TTCAATTGCTATATAAAAAATGTAAAGTCTGTTTACTGCCTTAAACCTTCTGGTGTATTTTTATATAAAGTAACACCCTTAATTCTAACTTGGCCAACAGGTAGGATGGTATTATTATTATCTTCATTGTACAGATAAGGAAACTGAGGCTCAGATTGACTAGATCAAACAGGAGTTTTCTGGAAAACCTAGGACACAAGCCTAAATCTTTGAACTCAAATACTGCTCTACACTGAATTACAGTTATATACTGATTTCTGTTGTAAATTCTTAGAGAAGACAGACATAGAAATTAGTAACTTGAGTCAGTAGCGGCTTTGTTCAAACACAGGCACATGCATATTTTATGGTATATGTTTATATCTGTGTAATACTCATCATAAATGTCAGATTTATAATCGAGATCACAGTGAGCTGAGATTGCACCACTGCACTCCAGCCTGGGCAGCGGAGTGAGACCTTTTCTCAAAAAAAAAAAAAAAAAAAGGCAAAAAATTAAATTATTAGTATGGTAAAGTTTCGTTTGGACTTAATATGAAACTCATTTCTAGAAATGATGATCATTTGCATAGGGCTTAACTTCCTTTGCTAAGAAAATAGAGTAGTATACTAGGAGACTTCCAGAGCTGCATAGAGCTTCAGGGTCATCTACCAAGACAGACAATTTGTTGTCATCATCAGTGTTAAACTCTAAATTATTAAGTGCTTATGTGCCAGATACTGAAGTTTATATACACTTTCTCTAATCTTTAATAATTCTAGAAAGGTATGTGTTTGATCCATTTTCAAGATAAGAAAAC
>VAV3_1_108148303_108158073_108220200_108227533_RF
ATGAGGTTTTTTTCCAGCCTTCCTAAGGGCCTCAAAGTCATATCCAGCAGACTTGCAGGGTTCTCAGGTGAAAGCAAATTGGAGAAATTTTTAAAATGTAATTTTGGTTTTTACTCCAACTACTTTCAACATGGATTTGTAAAAGACTGCTAGGATCATTAAAATCAGCATTGAAGCTATGTTGAGCAAGATGGATAGCTGCACTAGAAAAGCTGTAACAAGAGTCATTGTGAATGAAAGGAAAATTTTGCTCTAGATTTGTTGGTAGCCAAGGCACAAAAATTGGAAGCATAATGAGTTACAGACTCATGTCTGATAATATGAAAGAACACTAATTTAAAGAAAAAATCTTTTCTGTCTGAAATTTTATAATTTAGAGGAACTCTATATAAACAACATCGAAACTTTGCTTCATGCACAAAATTTAAAATATTACATAAAATTACCTTCAGGCTTTGTGTATAAGATATATATAAAACATAAATAAATTTTGTGTTTACACTTGGGTTCCATCCTGAATATATCTCATGATGTTTATGCAAATATTCCAAAATCTGAAAAAATCTGAAATTCAAAACACTTCCGGTCCCAAGCATTTTGAATAAGGGATACTCAACCTATAGCTGCATTAATTGAATTAAGACAACCACATAATCTACCTGTTAATTTTCTCTGGAGCCTTTTCTTCTGAGCCCTCCACGCTCTTCTAATTGATACTGCTTGCTCTACTAAGCCTGTTGAATTACTGTAGTCCTGGGACTTCTCTTTGCTCCCCTTTCCTGGCTTCTATATCTCCCTCT
5'-FAM/BHQ1-3 '로 표지된 서열화된 상호 작용을 검출하기 위해, 이중 표지 가수 분해 프로브(dual label hydrolysis probe)를 사용하였다. 상기 프로브는 온도 구배가 최적화되었으며 3C 생성물의 검출을 완전히 구체화하는 3C 단편의 교차점(junction)을 걸쳐 있도록 설계되었다. 상기 qPCR 표준 곡선 (106 카피-1 카피)은 보고서 수치에 사용된 서열화된 생성물로부터 생성되었다.
3C 라이브러리 생성을 위한 내부 대조군으로서 MMP1 카피 테스트
사용된 상기 프라이머 세트 및 프로브는 하기 참조 서열에 나타내었다. Taq I 사이트를 강조 표시하였다. 상기 프로브는 두 단편의 교차점에 걸쳐 있으며, 66.4℃의 어닐링 온도(annealing temperature)에서 구체적이다.
GGGGAGTGGATGGGATAAGGTGGAATGTTGGGTGAACTAAAAGGCCTTTAAGGCCCCTCTGAAATCCAGCATCGAAGAGGGAAACTGCATCACAGTTGATGGAAGTCTGTTGGCCTCTTAACAAAGCTAATGCTTGCCCTTCTGGCTTAGCTTACATAAGAACCACAAGGAATCTTTGTTGAATTGTTTCTTTCAGATCATCGGGACAACTCTCCTTTTGATGGACCTGGAGGAAATCTTGCTCATGCTTTTCAACCAGGCCCA
MMP 1-4 2F 5’-GGGGAGTGGATGGGATAAGGTG-3’
MPP 1F 5’-TGGGCCTGGTTGAAAAGCAT -3’
MMP1F1b2 프로브 5’-FAM-ATCCAGCATCGAAGAGGGAAACTGCATCA-BHQ1-3’
상기 가수 분해 qPCR에 대한 정방향 및 역방향 프라이머 및 프로브 서열은 상기 표에 기재되어 있다.
내부 대조군 마커(internal control marker) MMP1로 3C 라이브러리 카피 수 테스트
MMP-1과의 3C 상호작용은 EpiSwitchTM 라이브러리의 내부 대조군으로 사용되었다.
이중 표지 5'FAM-BHQ1-3 ' 표지된 가수 분해 프로브를 서열화된 상호 작용을 검출하기 위해 사용되었다. 샘플 20 ng을 사용하여 스크리닝하고, 카피수를 기록하였다. 상기와 같이 264 bp 생성물을 정량화하였고, 모든 샘플을 3C 표적으로 스크리닝하기 전에 랩칩(LabChip)으로 실행하였다. 상기 표적을 각 실험에 대한 MMP1 비율로 나타내었다.
표준 곡선을 이용한 qPCR 스크리닝 및 3C 단편 카피 수의 추정
qPCR 템플릿을 20 ng의 3C 라이브러리 DNA로 조정하고, 정상 혈액으로부터 유도된 3C 라이브러리를 포함하는 농도-일치 음성 대조군(concentration-matched negative control)과 함께 사용하였다. 추가적인 음성 대조군으로는, 포름알데하이드-고정을 하지 않은 환자 물질, 소화되고 결찰된 라이브러리 물질 및 정상적인 게놈 DNA가 포함된다. 3C 상호 작용 MMP-1은 EpiSwitch™ 라이브러리 합성을 위한 내부 대조군으로 사용되었다.
HEX, 텍사스 레드(Texas Red) 및 FAM과 일치하는 ??처(quencher)를 사용하였다.
Figure 112018109945797-pct00024
<110> OXFORD BIODYNAMICS LIMITED <120> Detection of chromosome interaction relevant to breast cancer <130> IP18-0012 <150> GB 16 08000.4 <151> 2016-05-06 <150> PCT/GB 2017/051273 <151> 2017-05-08 <160> 119 <170> KoPatentIn 3.0 <210> 1 <211> 14 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (6)..(9) <223> "n is a, c, g, or t" for nucleic acid sequence <400> 1 ccgcgnggng gcag 14 <210> 2 <211> 60 <212> DNA <213> Homo sapiens <400> 2 atttctttct tcttcccatt ttctaaaatc gatttttaaa ttaaaggtac aagttaaggc 60 60 <210> 3 <211> 60 <212> DNA <213> Homo sapiens <400> 3 ggatggagga agaggaggaa ttcaagactc gaactaaaca aaaaggagat gatcctgggt 60 60 <210> 4 <211> 60 <212> DNA <213> Homo sapiens <400> 4 agctcaaatt cttttactaa ttgttacatc gaaagttcaa aattaaattt taaacgtttt 60 60 <210> 5 <211> 60 <212> DNA <213> Homo sapiens <400> 5 ccaaagacag ccaaggaaaa actaaagatc gaaagttttt attacttcca aattagtaaa 60 60 <210> 6 <211> 60 <212> DNA <213> Homo sapiens <400> 6 aatttagagg aactctatat aaacaacatc gaaactttgc ttcatgcaca aaatttaaaa 60 60 <210> 7 <211> 60 <212> DNA <213> Homo sapiens <400> 7 ttggagggaa aagtaattac gttcaacttc gactgtattc tacaaagtgc tgggattaca 60 60 <210> 8 <211> 60 <212> DNA <213> Homo sapiens <400> 8 atactcatca taaatgtcag atttataatc gagatcacag tgagctgaga ttgcaccact 60 60 <210> 9 <211> 60 <212> DNA <213> Homo sapiens <400> 9 aggatctcat gatgctttga atactttctc gataccttat tataaaatca gctttgtgtt 60 60 <210> 10 <211> 22 <212> DNA <213> Homo sapiens <400> 10 tgtagtagtt accctgttgt tg 22 <210> 11 <211> 19 <212> DNA <213> Homo sapiens <400> 11 gcctcacagt gctcttatg 19 <210> 12 <211> 22 <212> DNA <213> Homo sapiens <400> 12 gtgctttgta aaccatgaag tg 22 <210> 13 <211> 19 <212> DNA <213> Homo sapiens <400> 13 tcgtgggcat atgactgag 19 <210> 14 <211> 19 <212> DNA <213> Homo sapiens <400> 14 ggcattgctt tgccttatc 19 <210> 15 <211> 20 <212> DNA <213> Homo sapiens <400> 15 caacttcctt gggtgtagag 20 <210> 16 <211> 21 <212> DNA <213> Homo sapiens <400> 16 cgctatatgt ggttctgtac g 21 <210> 17 <211> 22 <212> DNA <213> Homo sapiens <400> 17 cttctctaaa gggagatttg gg 22 <210> 18 <211> 20 <212> DNA <213> Homo sapiens <400> 18 tgttgagcaa gatggatagc 20 <210> 19 <211> 21 <212> DNA <213> Homo sapiens <400> 19 atattcagga tggaacccaa g 21 <210> 20 <211> 22 <212> DNA <213> Homo sapiens <400> 20 tccagaggtt atggaatttg ag 22 <210> 21 <211> 19 <212> DNA <213> Homo sapiens <400> 21 aagaaacaga ctgggcttg 19 <210> 22 <211> 22 <212> DNA <213> Homo sapiens <400> 22 actcaaatac tgctctacac tg 22 <210> 23 <211> 20 <212> DNA <213> Homo sapiens <400> 23 aaggaagtta agccctatgc 20 <210> 24 <211> 20 <212> DNA <213> Homo sapiens <400> 24 accctccttc actcacatag 20 <210> 25 <211> 23 <212> DNA <213> Homo sapiens <400> 25 gcacctaatc tacctaacat cac 23 <210> 26 <211> 28 <212> DNA <213> Homo sapiens <400> 26 tacgttcaac ttcgactgta ttctacaa 28 <210> 27 <211> 21 <212> DNA <213> Homo sapiens <400> 27 gcaagttcct tagttgctta g 21 <210> 28 <211> 22 <212> DNA <213> Homo sapiens <400> 28 caaccatcat cactaattct gg 22 <210> 29 <211> 22 <212> DNA <213> Homo sapiens <400> 29 ccagaattag tgatgatggt tg 22 <210> 30 <211> 800 <212> DNA <213> Homo sapiens <400> 30 aagggataag taaccaaact tggtcaatat tagataaact tcaagggacc tttttttttt 60 ttagtttcct agttatctat attgaaccaa gaaatggaac agcaagttcc ttagttgctt 120 aggtggacct attcagaact ggttgtaagt ctgcagtctg aagggaaatg gtgagcagag 180 gactcctttc ccaaagacag ctggaacaga aataggcact ccagaggtta tggaatttga 240 gagagatact cagcctctag ccactcccat tcaatctccc agcttagtct tctgagcatt 300 cttaatctta ctattctttt cttaatgtat tcaaaccaaa agacagcaat ttttagagcc 360 tgaataggtt ttggagggaa aagtaattac gttcaacttc gactgtattc tacaaagtgc 420 tgggattaca ggcatgagcc accaagccca gtctgtttct tttttgcaat taagctagag 480 ttcacatagc ataaaattca cgattttgag ttgtacattt cagtggtttt tagtattttt 540 actatgttgt acaaccatca tcactaattc tggaaacttt ttttatttta tttttatttt 600 tttgagatgg agtcttgctc tgtcacccag gctggagtgc agtggcacaa tctccgctca 660 ctgcaacctc cctttcccgg gttcaagtga ttctcctgca tcagcctccc gagtagctgg 720 gactacaggt gcctgccacc acgcccagct aatttttgtt tttttagtag agactgggtt 780 tcaccatatt ggccagccta 800 <210> 31 <211> 30 <212> DNA <213> Homo sapiens <400> 31 aaagagaatg tgatcgattt ctaaaatact 30 <210> 32 <211> 22 <212> DNA <213> Homo sapiens <400> 32 gggttcaaga atgcaggaat ag 22 <210> 33 <211> 20 <212> DNA <213> Homo sapiens <400> 33 gtatagtcac atggtggcaa 20 <210> 34 <211> 20 <212> DNA <213> Homo sapiens <400> 34 ttgccaccat gtgactatac 20 <210> 35 <211> 800 <212> DNA <213> Homo sapiens <400> 35 aggtaagtta aagaccaaga actggcattg gtcttagtat catgggaccc ttttgagtag 60 tttcagtgga gtggtggagg gtgaaagtga aagcttaatt ggagtgggtt caagaatgca 120 ggaataggag gagagaaatt ggagatagca atatagaaat ctcttaaaga gttcgctgta 180 aagtccagga gagaggggtg aagataagtg aagtgattgt tggacgaaga tgtggggttg 240 agagttgttt ttttcccatc ccaagatggg agacctattt gtatgctgat ggaatgagta 300 gcatgaaact taggagagag ggaaaaaatt gaatcagaag agagggaaca gattgcctga 360 ataatgacct ggaggaggcc agagaaaaga gaatgtgatc gatttctaaa atactgtgtg 420 tgtgtatgta tgatgagaca gatgatacta agtttgagct aaaggaaatt caagtatagt 480 cacatggtgg caaagcagag gttttaaatc tctaaccaga ggccaaagga tgagagataa 540 tgctattctc ttaaggatgt caaaataatg tgggatgact tgaaaagtag ggttaccctt 600 tctctgggcc aaatagtgag ctgttttgtc ctatggaatg taatttaatg tcagaggaac 660 aaaacccacc tcatgaaagg accagagaac tactgtattt ttttttggga caggatctct 720 gtcactcagg ctggagtaca gtggcactat catggctcac tgcagccttg gcttcctggg 780 ttcaagtgat cctcctgcct 800 <210> 36 <211> 25 <212> DNA <213> Homo sapiens <400> 36 aaccggtttc gatgctgttg tgcct 25 <210> 37 <211> 19 <212> DNA <213> Homo sapiens <400> 37 gggacacacg ttagtcaag 19 <210> 38 <211> 18 <212> DNA <213> Homo sapiens <400> 38 ctggaaggaa tgcgtagc 18 <210> 39 <211> 18 <212> DNA <213> Homo sapiens <400> 39 gctacgcatt ccttccag 18 <210> 40 <211> 800 <212> DNA <213> Homo sapiens <400> 40 cgccgtccca gcagcgcccc atctcaccaa ctcccacctt catgtgtggc cgcccaccta 60 gagccatgcc tgaagccact gtccctgacc acaaagcttt tggctgatag gaagcatgac 120 agcactgggg ccctacactg gaagcgggac cgtccagaga agaagactgc gcacagggat 180 cgggagctgg gacacacgtt agtcaaggtg tacgagggag gaatcaccgc catgtggagc 240 cactactcgg ggaggacgtg ggccacccgg agctcagtga cagtactccc gggagtgtac 300 atcgttggta atgtccacga cagtgtccct gcctgtgacc caataatttc ccatccaggg 360 acacacttca cagaaatgca cgcacaggca caacagcatc gaaaccggtt ctttggaggc 420 tcagtttttg gtaattaaga ctaaggagtg tttaaaaaac agaagtacat tttcctggaa 480 accagcagtc tttatttgca acttttattg gcaaacctgg ctgccagtaa atacattcct 540 tggcatctcc cacaatgtaa ttcactggat ggagcggcct tgctttttct gtaacgtgta 600 cgtcaattaa aagggccgcc tggaaggaat gcgtagcggt ggctgaaagc cccagtctcg 660 ggtcacctcc ctccactcca ggaacaaaag cgtccgtggt ctgtgcctgg aagtctgaga 720 gggtctcccc gatggggctg ttcccgcccg gaccctgagg gatgagagtt gcagcctaga 780 aaaccaggtg ccaggccctg 800 <210> 41 <211> 31 <212> DNA <213> Homo sapiens <400> 41 aaaactaaag atcgaaagtt tttattactt c 31 <210> 42 <211> 20 <212> DNA <213> Homo sapiens <400> 42 gtgacattac cgagcacttc 20 <210> 43 <211> 21 <212> DNA <213> Homo sapiens <400> 43 gtaactcaaa ctcagtgtgc t 21 <210> 44 <211> 21 <212> DNA <213> Homo sapiens <400> 44 agcacactga gtttgagtta c 21 <210> 45 <211> 800 <212> DNA <213> Homo sapiens <400> 45 aaaccagctg gaggaaagga aaggaaggaa gaaataaacg caacacagaa gttctcctca 60 gttgacaaaa ggtcaaaaat cattaacgtg taaatgttgc tttttccatc ccaaagcacc 120 ttctcacgta gagtccaggg actaggagga ctcacaacgc agcgatgggc agccaggccc 180 tgcaggagtg gggacagagg gaacccggcc ggtggcccga ccctgcaggg aagaaggacg 240 tgcggcgaga agcatcggat tcggggaggg ccgggacctg gccgagggtg acattaccga 300 gcacttcctg gcacagcgct ggtcccctcc ccaaacgcgc tatatgtggt tctgtacggg 360 actgcctttc ccaaagacag ccaaggaaaa actaaagatc gaaagttttt attacttcca 420 aattagtaaa tttgtaacaa tcatcaggca actaactata ataagaggga atttacaaaa 480 gacagagagc tactagtcag tatcaaatca ttcttaaaag tggcaactct gtatcaattt 540 tttttttgca gtcaattacc tttgactcag tctataaagt acatgcccaa atctcccttt 600 agagaagaaa agtgaatcaa aaagaaaaat gtatattaac tgtacagttc tcctatacta 660 aatgttctta catgctcaaa atgtatgaat atatttaaag caactgatcc tctattgaat 720 actgaataaa cttgaaggga tttctaagta aattattact ggtaactcaa actcagtgtg 780 ctataaattt cagacaccac 800 <210> 46 <211> 29 <212> DNA <213> Homo sapiens <400> 46 aataaggtat cgagaaagta ttcaaagca 29 <210> 47 <211> 20 <212> DNA <213> Homo sapiens <400> 47 accctccttc actcacatag 20 <210> 48 <211> 23 <212> DNA <213> Homo sapiens <400> 48 gtgatgttag gtagattagg tgc 23 <210> 49 <211> 23 <212> DNA <213> Homo sapiens <400> 49 gcacctaatc tacctaacat cac 23 <210> 50 <211> 800 <212> DNA <213> Homo sapiens <400> 50 taaccttcca taggcctcag ctcccttatc tattaacctg gtgaaatgca gacccctctg 60 catggggtta caaggtttca gcatgactgg gtatgaaaag agaacaaaga agcttcctgg 120 agatgactgt ggccttggct cactgccagg aaaatgactc atttctgtat gccagggtta 180 tagttcactg ttaccctgac aaatgaatgt ggaagaccca tgatttcctc caccctcctt 240 cactcacata gtaaaagtta gctactgcct gcaacatacc aggcaccgta caacacgaaa 300 ctgtaggctc cccctccagg aagtgacaat gtcattccta acctgttgga attttaacac 360 ctgtcataaa aggatctcat gatgctttga atactttctc gataccttat tataaaatca 420 gctttgtgtt gaatgatttt tcccagctgt agactaatgt aaatgttctg agcatgttta 480 aggtaggcta gtctaagctg tgatgttagg tagattaggt gcatttaaat gcattttcaa 540 tgatatttta aatttgcagt gggtttatca ggatgttact ccaagatgct cctccaaggt 600 gaggggcatc tgtgttttag tcagtgaaaa tgtcttgcaa aactgaagat aaaataaata 660 cagttagtca cacttcactt gcactataag aaattctaaa gaaaaattct tcaaattgaa 720 ggaatataat aacataaatt tatatctaca ggaaggaata aagagcaaag aaatgataaa 780 caaatcgctt aaagtgttta 800 <210> 51 <211> 29 <212> DNA <213> Homo sapiens <400> 51 tgtagtttat tcacctcgac tagatttta 29 <210> 52 <211> 22 <212> DNA <213> Homo sapiens <400> 52 atgcttgctg gaatatgctt ac 22 <210> 53 <211> 20 <212> DNA <213> Homo sapiens <400> 53 cagcttcgct tgttacccag 20 <210> 54 <211> 20 <212> DNA <213> Homo sapiens <400> 54 ctgggtaaca agcgaagctg 20 <210> 55 <211> 800 <212> DNA <213> Homo sapiens <400> 55 agtagagatg gggtttcacc atgctggcca ggccagtctc aaactcctga cctcaggtga 60 tctgcccgcc ccagcctccc aaaatgctag aattacaggt gtgaactatt gtgcccggca 120 ttgtacaacc gaactttaac aacagttgct cagatgatga tggggataaa gagttgggaa 180 agagcacatc ttcttgaaat gcttgctgga atatgcttac ttcttaaaag attatagaga 240 atattgattc ttccccaaga aattgacaga ttcatgtttt acataatgat atttgattgt 300 ataaagtaat tatgctgatt ttaaaatgtg aaaacattga atatatttgt aattttttgt 360 taataaagtg cataattttt ttttgtagtt tattcacctc gactagattt taatttttaa 420 tttttattta tttttttgag acacagcttc gcttgttacc caggctggag tgcagtggca 480 tgatctcggc tcaccgcaac ctctgcttcc cgggttcaag tgattctcct gcctcagcct 540 ccctagtagc tgggattaca ggcatgggcc accacgcctg gctaattttt tatattttta 600 gtagagacgg ggtttctcca tgttggtcag gctggtcttg aactcccgac ctcaggtgat 660 ccgcctgcct cagcctccca aagtgccggg attacaagtg tgagccactg cgcctggctg 720 ttttttattt ttagtagaga caaggtcttg ctatattgtc ctggcttgtc ttgaactcca 780 ggcctcaagc aatcctcctg 800 <210> 56 <211> 30 <212> DNA <213> Homo sapiens <400> 56 attcctggta tcgaaatatt ttaggtaatc 30 <210> 57 <211> 21 <212> DNA <213> Homo sapiens <400> 57 aggacccatc acctacatat a 21 <210> 58 <211> 20 <212> DNA <213> Homo sapiens <400> 58 ctcttggcat aaacttggct 20 <210> 59 <211> 20 <212> DNA <213> Homo sapiens <400> 59 agccaagttt atgccaagag 20 <210> 60 <211> 800 <212> DNA <213> Homo sapiens <400> 60 taacaaaaat aaactttaaa atggtggagg tgagtgggga aaagtgaaac ctctgcttta 60 cagaatacca acgaataaat gtaggaagaa ttttttaatc aacatttaat aacgactata 120 ataataactg attcagacag caatgatcaa tagattataa aacctttgga tgaaagattg 180 ttggagaaaa ggatattcat atatctcaaa gtgtcatgcc acaggttatt tattaattac 240 aaagggaaaa ggtatagtga agaaatctag tgggtaccct cttcaaccag ataatcaaat 300 ttggcatccc cagttatgta aaactgatat cacgtcccac ctgatgtgat gcactgggaa 360 ggacccatca cctacatata catggaatat tcctggtatc gaaatatttt aggtaatcat 420 tatttgtcta attcacatgt ccacaatcag gcattaatgt ttactttcat ttgtacctca 480 cattcctgcc agtccagctt atgttagggt ccattttgtg gatggtgagg tgaatagaca 540 ttttccctct tggcataaac ttggcttcac tctaatcttc atcctactcc atatggagga 600 aatttatctc tgtcacatgc tagagagtgt tcatcatcag ctccccatca ctgctccatt 660 taagcatcag tgtctagtta gcatttcctt gcatctaggc atcagtgtct tgttagcatg 720 tctctttaat ttcatgatgc cttggtcaaa taaagtgtct gagcgtgtat cccacttctt 780 tttatttttt tctgtaaggt 800 <210> 61 <211> 32 <212> DNA <213> Homo sapiens <400> 61 aatttaaaaa tcgattttag aaaatgggaa ga 32 <210> 62 <211> 22 <212> DNA <213> Homo sapiens <400> 62 tgtagtagtt accctgttgt tg 22 <210> 63 <211> 19 <212> DNA <213> Homo sapiens <400> 63 cataagagca ctgtgaggc 19 <210> 64 <211> 19 <212> DNA <213> Homo sapiens <400> 64 gcctcacagt gctcttatg 19 <210> 65 <211> 800 <212> DNA <213> Homo sapiens <400> 65 actttcattt taatttatta tttcccttag aaacatctcc tatcttttgt gaccatgtct 60 ccttttccag tatgtttctt gaattaggat ttcatagagc ttttgtggcc tacacgaatt 120 gaccacagta atccattaca catatttttc tttagcatct tgtttgaatt tacttacggt 180 tgtcccagcc ctaagtagat gataaaatat gatctcatag tcctaaaatg tggattgatt 240 tttttatgaa gatatgtgtt ttttcttcct tctgtaacct gtgacagatt ctgtagtagt 300 taccctgttg ttgaaacagt ttttctcaaa taccagtttc atcaaataat tccactgtta 360 aaagctcata atttctttct tcttcccatt ttctaaaatc gatttttaaa ttaaaggtac 420 aagttaaggc acacagaaga ttataggcag ctgacctagg agaaaacaca aatgaagttg 480 ttttaaaacg tatttttcct tatagttcca aaattttttc ataacataca atttgtgatt 540 ctgttacaaa gtatgatcaa ctatttttaa attttatgat cagttagaaa taagatgtta 600 taattctaca gtaaaaccaa aatacccctt aatcatttag ggattttata aaaagggaca 660 cacttgatat aaccataaga gcactgtgag gctcctatga cagaggggcg gggtataggc 720 tttcctaaaa tacatctcac tgagacataa aatatgagag gacttatggt cctaatgtgg 780 atcaatagaa attaagtcag 800 <210> 66 <211> 27 <212> DNA <213> Homo sapiens <400> 66 tactaattgt tacatcgaaa gttcaaa 27 <210> 67 <211> 19 <212> DNA <213> Homo sapiens <400> 67 ggcattgctt tgccttatc 19 <210> 68 <211> 20 <212> DNA <213> Homo sapiens <400> 68 ctctacaccc aaggaagttg 20 <210> 69 <211> 20 <212> DNA <213> Homo sapiens <400> 69 caacttcctt gggtgtagag 20 <210> 70 <211> 800 <212> DNA <213> Homo sapiens <400> 70 accacttttt aagatttatc ctgtttgttc tttgttgatt gaaacataat aattgttaaa 60 attctctaca gccttctttt tcttccatag ctaatcttcc ttctaatagt ttttgctttc 120 tgttttgctg ttgttgcttt gcaaagcttt cccctcatag cctgtacctg ttatcaatat 180 aaaataatct tcctgttgaa tgcttcatga cttgaattct actttgataa aaacattgcc 240 atactgcttt ttatcttgat gaattcatct ggcattgctt tgccttatca tctcatctgg 300 agtttttaaa tgccatttgt ttcagttgtc tttaacaaca taataaatag actttgccat 360 ttaacaaggt agctcaaatt cttttactaa ttgttacatc gaaagttcaa aattaaattt 420 taaacgtttt cattcaggct ctggaaagct tcacagttaa aaaggatgtc tctacaccca 480 aggaagttga actcactggc tgtgtgacta tgggcagttt acccaacctt tctgatttgg 540 ggtcccacct taaaacactc acttcccaga gagacaggaa gaactcagtg tgtgtttata 600 agcctctctt ctttctcctg gtgtcatgca ttccagcgaa gagaaagtac acagctccac 660 tacttggaac cagtgttgta cccagcacag tttttggtac ctgagttccc tgaaaaccag 720 caccttaccc tgtaactggt gcagtctgtg tcctcagtgt gctttgatga cttgcacttt 780 aaacaagggc aagtcaacat 800 <210> 71 <211> 23 <212> DNA <213> Homo sapiens <400> 71 aggaattcaa gactcgaact aaa 23 <210> 72 <211> 20 <212> DNA <213> Homo sapiens <400> 72 ttgagtcctg gctctactac 20 <210> 73 <211> 22 <212> DNA <213> Homo sapiens <400> 73 gaacaaagga ccaagtatag ct 22 <210> 74 <211> 22 <212> DNA <213> Homo sapiens <400> 74 agctatactt ggtcctttgt tc 22 <210> 75 <211> 800 <212> DNA <213> Homo sapiens <400> 75 taaagaagtt tcacattcat atgccaactc agattgatgg gcagcaactg gataatccgc 60 tgtgcagaaa gttaaataca ggttctgtgc aaagaagtgt ctagattcat agtgccagac 120 atctgccctg ggccacatgc ttaccgtccc atggatggat ggaacttgga atcagaagac 180 ccaagtttga gtcctggctc tactactttt gtgattttgg tcatttaacc tctttgagcc 240 ttcttatggc atagtagtta taatcaagat aatataagtg aatgtgcttt gtaaaccatg 300 aagtgttggt cacacagatg atagctactg tcttatattt gtcaaacctc agctgaggac 360 caggttgaca ggatggagga agaggaggaa ttcaagactc gaactaaaca aaaaggagat 420 gatcctgggt gggcttgact taatcaagtg aaagccttaa aagcaagagt ctcctgctag 480 tctaggaaaa gcaaacagcc ctgctatgaa tggcctatag aaaggggcag cctctaggag 540 catgggcctc agtcatatgc ccacgaggaa ctgaatattg ccagcaacca tgtgagcatg 600 gaagaggact ctaagcctct gatgagacca cagccctggc caatgctttg attgtggctc 660 tgtgaggcct tgaacaaagg accaagtata gctatgccag gacttctgaa ccacgggaat 720 ggtgagataa taaatgtttg gtgttttaag ccactaagtt tgtgttaatt ttttatgccg 780 caatagaaag cgaatactac 800 <210> 76 <211> 800 <212> DNA <213> Homo sapiens <400> 76 aggtaagtta aagaccaaga actggcattg gtcttagtat catgggaccc ttttgagtag 60 tttcagtgga gtggtggagg gtgaaagtga aagcttaatt ggagtgggtt caagaatgca 120 ggaataggag gagagaaatt ggagatagca atatagaaat ctcttaaaga gttcgctgta 180 aagtccagga gagaggggtg aagataagtg aagtgattgt tggacgaaga tgtggggttg 240 agagttgttt ttttcccatc ccaagatggg agacctattt gtatgctgat ggaatgagta 300 gcatgaaact taggagagag ggaaaaaatt gaatcagaag agagggaaca gattgcctga 360 ataatgacct ggaggaggcc agagaaaaga gaatgtgatc gatgacctta atgtcagtgt 420 cactgactct gacaaggagg aaaggacagc gatgagccag gctgaccccc gccaccccat 480 tcccatagcc ccactttctt ctctcttctt gttcagaaat gtttcacttt gcctcatcta 540 gcccctttgg ccagtaggtc acatctggga gcttctgggg gtgccacatg tctgcctcaa 600 tctgggctgt ttcctcccct ccaagatatt tcactgtctc tgggctgggc gccaggactc 660 ctgggtttcc ctgcctgtgg tgcagggctc ccctgcaggg ctccagagag tcgcttagct 720 ggtttccttc ctcctttgtg gggagggcct tcccctaggg ctgggaggtg tcaggaatcc 780 caggtgggac aggggtgggg 800 <210> 77 <211> 800 <212> DNA <213> Homo sapiens <400> 77 ttcaattgct atataaaaaa tgtaaagtct gtttactgcc ttaaaccttc tggtgtattt 60 ttatataaag taacaccctt aattctaact tggccaacag gtaggatggt attattatta 120 tcttcattgt acagataagg aaactgaggc tcagattgac tagatcaaac aggagttttc 180 tggaaaacct aggacacaag cctaaatctt tgaactcaaa tactgctcta cactgaatta 240 cagttatata ctgatttctg ttgtaaattc ttagagaaga cagacataga aattagtaac 300 ttgagtcagt agcggctttg ttcaaacaca ggcacatgca tattttatgg tatatgttta 360 tatctgtgta atactcatca taaatgtcag atttataatc gagatcacag tgagctgaga 420 ttgcaccact gcactccagc ctgggcagcg gagtgagacc ttttctcaaa aaaaaaaaaa 480 aaaaaaggca aaaaattaaa ttattagtat ggtaaagttt cgtttggact taatatgaaa 540 ctcatttcta gaaatgatga tcatttgcat agggcttaac ttcctttgct aagaaaatag 600 agtagtatac taggagactt ccagagctgc atagagcttc agggtcatct accaagacag 660 acaatttgtt gtcatcatca gtgttaaact ctaaattatt aagtgcttat gtgccagata 720 ctgaagttta tatacacttt ctctaatctt taataattct agaaaggtat gtgtttgatc 780 cattttcaag ataagaaaac 800 <210> 78 <211> 800 <212> DNA <213> Homo sapiens <400> 78 atgaggtttt tttccagcct tcctaagggc ctcaaagtca tatccagcag acttgcaggg 60 ttctcaggtg aaagcaaatt ggagaaattt ttaaaatgta attttggttt ttactccaac 120 tactttcaac atggatttgt aaaagactgc taggatcatt aaaatcagca ttgaagctat 180 gttgagcaag atggatagct gcactagaaa agctgtaaca agagtcattg tgaatgaaag 240 gaaaattttg ctctagattt gttggtagcc aaggcacaaa aattggaagc ataatgagtt 300 acagactcat gtctgataat atgaaagaac actaatttaa agaaaaaatc ttttctgtct 360 gaaattttat aatttagagg aactctatat aaacaacatc gaaactttgc ttcatgcaca 420 aaatttaaaa tattacataa aattaccttc aggctttgtg tataagatat atataaaaca 480 taaataaatt ttgtgtttac acttgggttc catcctgaat atatctcatg atgtttatgc 540 aaatattcca aaatctgaaa aaatctgaaa ttcaaaacac ttccggtccc aagcattttg 600 aataagggat actcaaccta tagctgcatt aattgaatta agacaaccac ataatctacc 660 tgttaatttt ctctggagcc ttttcttctg agccctccac gctcttctaa ttgatactgc 720 ttgctctact aagcctgttg aattactgta gtcctgggac ttctctttgc tcccctttcc 780 tggcttctat atctccctct 800 <210> 79 <211> 264 <212> DNA <213> Homo sapiens <400> 79 ggggagtgga tgggataagg tggaatgttg ggtgaactaa aaggccttta aggcccctct 60 gaaatccagc atcgaagagg gaaactgcat cacagttgat ggaagtctgt tggcctctta 120 acaaagctaa tgcttgccct tctggcttag cttacataag aaccacaagg aatctttgtt 180 gaattgtttc tttcagatca tcgggacaac tctccttttg atggacctgg aggaaatctt 240 gctcatgctt ttcaaccagg ccca 264 <210> 80 <211> 22 <212> DNA <213> Homo sapiens <400> 80 ggggagtgga tgggataagg tg 22 <210> 81 <211> 20 <212> DNA <213> Homo sapiens <400> 81 tgggcctggt tgaaaagcat 20 <210> 82 <211> 29 <212> DNA <213> Homo sapiens <400> 82 atccagcatc gaagagggaa actgcatca 29 <210> 83 <211> 60 <212> DNA <213> Homo sapiens <400> 83 ttggagggaa aagtaattac gttcaacttc gactgtattc tacaaagtgc tgggattaca 60 60 <210> 84 <211> 60 <212> DNA <213> Homo sapiens <400> 84 ggaggaggcc agagaaaaga gaatgtgatc gatttctaaa atactgtgtg tgtgtatgta 60 60 <210> 85 <211> 60 <212> DNA <213> Homo sapiens <400> 85 ggatggagga agaggaggaa ttcaagactc gaactaaaca aaaaggagat gatcctgggt 60 60 <210> 86 <211> 60 <212> DNA <213> Homo sapiens <400> 86 aggatctcat gatgctttga atactttctc gataccttat tataaaatca gctttgtgtt 60 60 <210> 87 <211> 60 <212> DNA <213> Homo sapiens <400> 87 agctcaaatt cttttactaa ttgttacatc gaaagttcaa aattaaattt taaacgtttt 60 60 <210> 88 <211> 60 <212> DNA <213> Homo sapiens <400> 88 aatttagagg aactctatat aaacaacatc gaaactttgc ttcatgcaca aaatttaaaa 60 60 <210> 89 <211> 60 <212> DNA <213> Homo sapiens <400> 89 cagaaatgca cgcacaggca caacagcatc gaaaccggtt ctttggaggc tcagtttttg 60 60 <210> 90 <211> 60 <212> DNA <213> Homo sapiens <400> 90 cctacatata catggaatat tcctggtatc gaaatatttt aggtaatcat tatttgtcta 60 60 <210> 91 <211> 22 <212> DNA <213> Homo sapiens <400> 91 tccagaggtt atggaatttg ag 22 <210> 92 <211> 19 <212> DNA <213> Homo sapiens <400> 92 aagaaacaga ctgggcttg 19 <210> 93 <211> 21 <212> DNA <213> Homo sapiens <400> 93 gcatgaaact taggagagag g 21 <210> 94 <211> 20 <212> DNA <213> Homo sapiens <400> 94 ttgccaccat gtgactatac 20 <210> 95 <211> 22 <212> DNA <213> Homo sapiens <400> 95 gtgctttgta aaccatgaag tg 22 <210> 96 <211> 19 <212> DNA <213> Homo sapiens <400> 96 tcgtgggcat atgactgag 19 <210> 97 <211> 20 <212> DNA <213> Homo sapiens <400> 97 accctccttc actcacatag 20 <210> 98 <211> 23 <212> DNA <213> Homo sapiens <400> 98 gcacctaatc tacctaacat cac 23 <210> 99 <211> 19 <212> DNA <213> Homo sapiens <400> 99 ggcattgctt tgccttatc 19 <210> 100 <211> 20 <212> DNA <213> Homo sapiens <400> 100 caacttcctt gggtgtagag 20 <210> 101 <211> 20 <212> DNA <213> Homo sapiens <400> 101 tgttgagcaa gatggatagc 20 <210> 102 <211> 21 <212> DNA <213> Homo sapiens <400> 102 atattcagga tggaacccaa g 21 <210> 103 <211> 22 <212> DNA <213> Homo sapiens <400> 103 ggagtgtaca tcgttggtaa tg 22 <210> 104 <211> 22 <212> DNA <213> Homo sapiens <400> 104 gcaaataaag actgctggtt tc 22 <210> 105 <211> 22 <212> DNA <213> Homo sapiens <400> 105 aggacccatc acctacatat ac 22 <210> 106 <211> 20 <212> DNA <213> Homo sapiens <400> 106 agccaagttt atgccaagag 20 <210> 107 <211> 60 <212> DNA <213> Homo sapiens <400> 107 ttggagggaa aagtaattac gttcaacttc gactgtattc tacaaagtgc tgggattaca 60 60 <210> 108 <211> 60 <212> DNA <213> Homo sapiens <400> 108 ggaggaggcc agagaaaaga gaatgtgatc gatttctaaa atactgtgtg tgtgtatgta 60 60 <210> 109 <211> 60 <212> DNA <213> Homo sapiens <400> 109 ggaggaggcc agagaaaaga gaatgtgatc gatgacctta atgtcagtgt cactgactct 60 60 <210> 110 <211> 60 <212> DNA <213> Homo sapiens <400> 110 cagaaatgca cgcacaggca caacagcatc gaaaccggtt ctttggaggc tcagtttttg 60 60 <210> 111 <211> 60 <212> DNA <213> Homo sapiens <400> 111 ccaaagacag ccaaggaaaa actaaagatc gaaagttttt attacttcca aattagtaaa 60 60 <210> 112 <211> 60 <212> DNA <213> Homo sapiens <400> 112 aggatctcat gatgctttga atactttctc gataccttat tataaaatca gctttgtgtt 60 60 <210> 113 <211> 60 <212> DNA <213> Homo sapiens <400> 113 cataattttt ttttgtagtt tattcacctc gactagattt taatttttaa tttttattta 60 60 <210> 114 <211> 60 <212> DNA <213> Homo sapiens <400> 114 cctacatata catggaatat tcctggtatc gaaatatttt aggtaatcat tatttgtcta 60 60 <210> 115 <211> 60 <212> DNA <213> Homo sapiens <400> 115 atttctttct tcttcccatt ttctaaaatc gatttttaaa ttaaaggtac aagttaaggc 60 60 <210> 116 <211> 60 <212> DNA <213> Homo sapiens <400> 116 atactcatca taaatgtcag atttataatc gagatcacag tgagctgaga ttgcaccact 60 60 <210> 117 <211> 60 <212> DNA <213> Homo sapiens <400> 117 agctcaaatt cttttactaa ttgttacatc gaaagttcaa aattaaattt taaacgtttt 60 60 <210> 118 <211> 60 <212> DNA <213> Homo sapiens <400> 118 ggatggagga agaggaggaa ttcaagactc gaactaaaca aaaaggagat gatcctgggt 60 60 <210> 119 <211> 60 <212> DNA <213> Homo sapiens <400> 119 aatttagagg aactctatat aaacaacatc gaaactttgc ttcatgcaca aaatttaaaa 60 60

Claims (18)

  1. 인간 개체에서 유방암 진단을 결정하는데 유용한 정보를 제공하기 위해, 하기의 프로브 (마커 세트 3)에 의해 표시되는 모든 후생적(epigenetic) 염색체 상호 작용의 존재 또는 부존재 여부를 인간 개체로부터 분리된 샘플에서 검출하기 위한 방법 :
    프로브 (마커 세트 3) :
    - 5'-TTGGAGGGAAAAGTAATTACGTTCAACTTCGACTGTATTCTACAAAGTGCTGGGATTACA-3' (SEQ ID NO:107);
    - 5'-GGAGGAGGCCAGAGAAAAGAGAATGTGATCGATTTCTAAAATACTGTGTGTGTGTATGTA-3' (SEQ ID NO:108);
    - 5'-GGAGGAGGCCAGAGAAAAGAGAATGTGATCGATGACCTTAATGTCAGTGTCACTGACTCT-3' (SEQ ID NO:109);
    - 5'-CAGAAATGCACGCACAGGCACAACAGCATCGAAACCGGTTCTTTGGAGGCTCAGTTTTTG-3' (SEQ ID NO:110);
    - 5'-CCAAAGACAGCCAAGGAAAAACTAAAGATCGAAAGTTTTTATTACTTCCAAATTAGTAAA-3' (SEQ ID NO:111);
    - 5'-AGGATCTCATGATGCTTTGAATACTTTCTCGATACCTTATTATAAAATCAGCTTTGTGTT-3' (SEQ ID NO:112);
    - 5'-CATAATTTTTTTTTGTAGTTTATTCACCTCGACTAGATTTTAATTTTTAATTTTTATTTA-3' (SEQ ID NO:113);
    - 5'-CCTACATATACATGGAATATTCCTGGTATCGAAATATTTTAGGTAATCATTATTTGTCTA-3' (SEQ ID NO:114);
    - 5'-ATTTCTTTCTTCTTCCCATTTTCTAAAATCGATTTTTAAATTAAAGGTACAAGTTAAGGC-3' (SEQ ID NO:115);
    - 5'-ATACTCATCATAAATGTCAGATTTATAATCGAGATCACAGTGAGCTGAGATTGCACCACT-3' (SEQ ID NO:116);
    - 5'-AGCTCAAATTCTTTTACTAATTGTTACATCGAAAGTTCAAAATTAAATTTTAAACGTTTT-3' (SEQ ID NO:117);
    - 5'-GGATGGAGGAAGAGGAGGAATTCAAGACTCGAACTAAACAAAAAGGAGATGATCCTGGGT-3' (SEQ ID NO:118); 및
    - 5'-AATTTAGAGGAACTCTATATAAACAACATCGAAACTTTGCTTCATGCACAAAATTTAAAA-3' (SEQ ID NO:119).
  2. 제1항에 있어서, 상기 염색체 상호 작용의 존재 또는 부존재가 염색체 상호 작용의 부위에서 DNA 루프의 존재 또는 부존재를 검출함에 의해 결정되는 것을 특징으로 하는 방법.
  3. 제1항에 있어서, 상기 염색체 상호 작용의 존재 또는 부존재가 염색체 형태에서 모아지는 염색체의 말단 부위의 존재 또는 부존재를 검출함에 의해 결정되는 것을 특징으로 하는 방법.
  4. 제1항에 있어서, 상기 모든 염색체 상호 작용의 존재 또는 부존재가 다음을 포함하는 방법에 의해 결정되는 것을 특징으로 하는 방법 :
    (i) 염색체 상호 작용안에 모아진 염색체 부위의 시험관내(in vitro) 가교 결합으로 가교된 DNA를 생성하는 단계;
    (ii) 상기 가교된 DNA를 절단 또는 제한 소화 절단(restriction digestion cleavage)에 적용하는 단계;
    (iii) 상기 가교된 DNA를 결찰하여 결찰된 DNA를 형성하는 단계, 및
    (iv) 상기 결찰된 DNA의 존재 또는 부존재를 검출하여 상기 염색체 상호 작용을 검출하는 단계.
  5. 제4항에 있어서, 상기 결찰된 핵산의 검출이 PCR에 의해 수행되는 것을 특징으로 하는 방법.
  6. 제4항에 있어서, 상기 결찰된 DNA의 존재 또는 부존재를 검출하는 단계는 결찰된 생성물을 증폭할 수 있는 프라이머 및 PCR 반응 동안 결찰 부위에 결합하는 프로브를 사용하는 정량적 PCR (qPCR)에 의해 수행되고,
    상기 프로브는 염색체 상호 작용내 모아진 각각의 염색체 부위로부터의 서열에 상보적인 서열을 포함하는 것을 특징으로 하는 방법.
  7. 제6항에 있어서, 상기 프로브는 상기 프로브의 5' 말단에 공유 결합된 형광단(fluorophore)을 포함하는 것을 특징으로 하는 방법.
  8. 제6항에 있어서, 상기 프로브는 상기 프로브의 3' 말단에 공유결합된 ??쳐(quencher)를 포함하는 것을 특징으로 하는 방법.
  9. 제7항에 있어서, 상기 형광단이 HEX, Texas Red 및 FAM으로 이루어진 군에서 선택되는 것을 특징으로 하는 방법.
  10. 제6항에 있어서, 상기 프로브가 10 내지 40 개의 뉴클레오티드 염기의 핵산 서열을 포함하는 것을 특징으로 하는 방법.
  11. 제10항에 있어서, 상기 프로브가 20 내지 30 개의 뉴클레오티드 염기의 핵산 서열을 포함하는 것을 특징으로 하는 방법.
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
KR1020187032201A 2016-05-06 2017-05-08 유방암과 관련된 염색체 상호 작용의 검출 KR102453393B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1608000.4A GB201608000D0 (en) 2016-05-06 2016-05-06 Chromosome detection
GB1608000.4 2016-05-06
PCT/GB2017/051273 WO2017191477A1 (en) 2016-05-06 2017-05-08 Detection of chromosome interaction relevant to breast cancer

Publications (2)

Publication Number Publication Date
KR20190025814A KR20190025814A (ko) 2019-03-12
KR102453393B1 true KR102453393B1 (ko) 2022-10-11

Family

ID=56297311

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187032201A KR102453393B1 (ko) 2016-05-06 2017-05-08 유방암과 관련된 염색체 상호 작용의 검출

Country Status (13)

Country Link
US (1) US11746378B2 (ko)
EP (1) EP3452612B1 (ko)
JP (1) JP7005596B2 (ko)
KR (1) KR102453393B1 (ko)
CN (1) CN109661477B (ko)
AU (1) AU2017261442B2 (ko)
CA (1) CA3023156A1 (ko)
GB (1) GB201608000D0 (ko)
MY (1) MY195357A (ko)
PL (1) PL3452612T3 (ko)
SG (1) SG11201809413RA (ko)
WO (1) WO2017191477A1 (ko)
ZA (1) ZA201806917B (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3510152A4 (en) 2016-09-07 2020-04-29 Flagship Pioneering, Inc. METHODS AND COMPOSITIONS FOR MODULATING GENE EXPRESSION
PL3548633T3 (pl) 2016-12-01 2024-04-02 Oxford BioDynamics PLC Zastosowanie epigenetycznych interakcji chromosomów w diagnostyce nowotworów
ES2949801T3 (es) 2017-01-09 2023-10-03 Whitehead Inst Biomedical Res Métodos para alterar la expresión génica mediante la perturbación de multímeros de factores de transcripción que estructuran bucles reguladores
US20220180964A1 (en) * 2019-03-28 2022-06-09 Phase Genomics, Inc. Systems and methods for karyotyping by sequencing
US11987791B2 (en) 2019-09-23 2024-05-21 Omega Therapeutics, Inc. Compositions and methods for modulating hepatocyte nuclear factor 4-alpha (HNF4α) gene expression
CN111334508B (zh) * 2020-03-11 2022-04-15 潍坊医学院 一种抑制乳腺癌细胞的增殖侵袭转移的基因、表达载体
CN111798919B (zh) * 2020-06-24 2022-11-25 上海交通大学 一种肿瘤新抗原预测方法、预测装置及存储介质
CN113436741B (zh) * 2021-07-16 2023-02-28 四川大学华西医院 基于组织特异增强子区域dna甲基化的肺癌复发预测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009147386A1 (en) * 2008-06-02 2009-12-10 Oxford Biodynamics Limited Methods of detecting long range chromosomal interactions
US20100075861A1 (en) * 2005-07-04 2010-03-25 Erasmus University Medical Center Faculty of Medicine Department of Cell Biology and Genetics 4c

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0417740D0 (en) * 2004-08-10 2004-09-08 Uc3 Methods and kit for the prognosis of breast cancer
US20090299640A1 (en) 2005-11-23 2009-12-03 University Of Utah Research Foundation Methods and Compositions Involving Intrinsic Genes
GB0603251D0 (en) 2006-02-17 2006-03-29 Isis Innovation DNA conformation
HUE037359T2 (hu) 2010-07-09 2018-08-28 Cergentis B V A fontos V3-D genom-régió szekvenálási stratégiái
EP2710146A2 (en) 2011-05-18 2014-03-26 Life Technologies Corporation Chromosome conformation analysis
EP2780469A1 (en) 2011-11-18 2014-09-24 Vanderbilt University Markers of triple-negative breast cancer and uses thereof
JP6164689B2 (ja) * 2013-08-30 2017-07-19 国立大学法人大阪大学 乳癌術前化学療法に対する感受性の診断補助方法および判定装置
GB201320351D0 (en) * 2013-11-18 2014-01-01 Erasmus Universiteit Medisch Ct Method
AU2015230677A1 (en) 2014-03-11 2016-10-27 The Council Of The Queensland Institute Of Medical Research Determining cancer agressiveness, prognosis and responsiveness to treatment
JP2018518992A (ja) 2015-06-24 2018-07-19 オックスフォード バイオダイナミックス リミテッド 染色体相互作用の部位を用いた検出法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100075861A1 (en) * 2005-07-04 2010-03-25 Erasmus University Medical Center Faculty of Medicine Department of Cell Biology and Genetics 4c
WO2009147386A1 (en) * 2008-06-02 2009-12-10 Oxford Biodynamics Limited Methods of detecting long range chromosomal interactions

Also Published As

Publication number Publication date
CA3023156A1 (en) 2017-11-09
AU2017261442A1 (en) 2018-11-22
CN109661477B (zh) 2022-12-02
SG11201809413RA (en) 2018-11-29
CN109661477A (zh) 2019-04-19
EP3452612B1 (en) 2023-08-23
JP7005596B2 (ja) 2022-03-03
US20190241964A1 (en) 2019-08-08
PL3452612T3 (pl) 2023-12-11
WO2017191477A1 (en) 2017-11-09
EP3452612A1 (en) 2019-03-13
US11746378B2 (en) 2023-09-05
EP3452612C0 (en) 2023-08-23
AU2017261442B2 (en) 2020-05-21
GB201608000D0 (en) 2016-06-22
ZA201806917B (en) 2022-06-29
KR20190025814A (ko) 2019-03-12
MY195357A (en) 2023-01-16
JP2019521701A (ja) 2019-08-08

Similar Documents

Publication Publication Date Title
KR102453393B1 (ko) 유방암과 관련된 염색체 상호 작용의 검출
KR102622309B1 (ko) 염색체 상호작용의 검출
St. Jude Children's Research Hospital–Washington University Pediatric Cancer Genome Project Zhang Jinghui 1 Wu Gang 1 Miller Claudia P 2 Tatevossian Ruth G 3 Dalton James D 3 Tang Bo 3 Orisme Wilda 3 Punchihewa Chandanamali 3 Parker Matthew 1 Qaddoumi Ibrahim 4 Boop Fredrick A 5 Lu Charles 6 Kandoth Cyriac 6 Ding Li 7 Lee Ryan 3 Huether Robert 1 Chen Xiang 1 Hedlund Erin 1 Nagahawatte Panduka 1 Rusch Michael 1 Boggs Kristy 8 Cheng Jinjun 3 Becksfort Jared 1 Ma Jing 3 Song Guangchun 3 Li Yongjin 1 Wei Lei 3 Wang Jianmin 9 Shurtleff Sheila 3 Easton John 8 Zhao David 1 Fulton Robert S 6 Fulton Lucinda L 6 Dooling David J 6 Vadodaria Bhavin 8 Mulder Heather L 8 Tang Chunlao 1 Ochoa Kerri 6 Mullighan Charles G 3 Gajjar Amar 4 Kriwacki Richard 10 Sheer Denise 11 Gilbertson Richard J 2 Mardis Elaine R 6 Wilson Richard K 6 Downing James R 3 Baker Suzanne J 2 Ellison David W david. ellison@ stjude. org 3 bc Whole-genome sequencing identifies genetic alterations in pediatric low-grade gliomas
Jardin et al. Diffuse large B-cell lymphomas with CDKN2A deletion have a distinct gene expression signature and a poor prognosis under R-CHOP treatment: a GELA study
Bergametti et al. Mutations within the programmed cell death 10 gene cause cerebral cavernous malformations
WO2013035114A1 (en) Tp53 genetic variants predictive of cancer
CN109182521B (zh) circRNA作为甲状腺乳头状癌标志物的应用
CN102439174B (zh) 基于检测slc45a3-elk4融合转录子的用于诊断前列腺癌的组合物和方法
EP2107127A1 (en) In vitro diagnostic method for the diagnosis of somatic and ovarian cancers
Pagni et al. Non‐coding regulatory elements: Potential roles in disease and the case of epilepsy
Elli et al. Mosaicism for GNAS methylation defects associated with pseudohypoparathyroidism type 1B arose in early post-zygotic phases
KR20200081380A (ko) 유전적 조절
Guo et al. The polymorphic AluYb8 insertion in the MUTYH gene is associated with reduced type 1 protein expression and reduced mitochondrial DNA content
JP2023537215A (ja) 無細胞核酸についてのヌクレアーゼに関連する末端シグネチャ分析
Gustmann et al. Loss at chromosome arm 16q in retinoblastoma: confirmation of the association with diffuse vitreous seeding and refinement of the recurrently deleted region
WO2016014941A1 (en) Method to diagnose malignant melanoma in the domestic dog
CN107354197B (zh) 一种检测人类nras基因突变的试剂盒
Sun et al. Comparative study of candidate sex determination regions in snakeheads (Channa argus and C. maculata) and development of novel sex markers
EP3722444B1 (en) Method for determining rcc subtypes
EP2707497B1 (en) Detecting the brachyspina mutation
KR101378540B1 (ko) 비소세포 폐암 환자의 생존기간 연관된 brca1 유전자 하플로타입 마커 및 그의 용도
KR20160093328A (ko) 덤벨 구조의 올리고뉴클레오티드 및 이를 이용한 유전자 변이 검출 방법
US20210025001A1 (en) Methods for Detecting and Treating Idiopathic Pulmonary Fibrosis
Mucha et al. Identification of SNP markers for canine mammary gland tumours in females based on a genome-wide association study–preliminary results
Herreros‐Pomares et al. Proliferative verrucous and homogeneous Leukoplakias exhibit differential methylation patterns

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant