KR102346672B1 - 간 섬유화 위험도 예측용 마커 및 그를 이용하는 정보제공방법 - Google Patents
간 섬유화 위험도 예측용 마커 및 그를 이용하는 정보제공방법 Download PDFInfo
- Publication number
- KR102346672B1 KR102346672B1 KR1020200086344A KR20200086344A KR102346672B1 KR 102346672 B1 KR102346672 B1 KR 102346672B1 KR 1020200086344 A KR1020200086344 A KR 1020200086344A KR 20200086344 A KR20200086344 A KR 20200086344A KR 102346672 B1 KR102346672 B1 KR 102346672B1
- Authority
- KR
- South Korea
- Prior art keywords
- liver fibrosis
- gene
- risk
- predicting
- jak2
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6893—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/08—Hepato-biliairy disorders other than hepatitis
- G01N2800/085—Liver diseases, e.g. portal hypertension, fibrosis, cirrhosis, bilirubin
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/50—Determining the risk of developing a disease
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Genetics & Genomics (AREA)
- Biotechnology (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Zoology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Food Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 간 섬유화 위험도 예측용 마커 및 그를 이용하는 정보제공방법에 관한 것으로, 상세하게는, CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17 유전자 마커 조합을 이용한 회귀분석을 수행하여 간 섬유화 예측 점수를 구하고 간 섬유화 위험도에 대한 판별이 수행됨으로써, 높은 민감도 및 특이도로 간 섬유화 단계에 따른 위험도를 구분하여 예측할 수 있는 간 섬유화 위험도 예측용 마커 및 그를 이용하는 정보제공방법에 관한 것이다.
Description
본 발명은 간 섬유화의 진행단계 진단용 또는 간 섬유화 위험도 예측용 유전자 마커, 조성물 및 그를 이용한 정보제공방법에 관한 것이다.
간 섬유화(hepatic fibrosis)는 손상된 간 조직이 정상적인 간세포로 복구되지 않고 콜라겐과 같은 섬유 조직으로 변형된 상태를 말하며, 일반적으로 바이러스성, 알코올성, 약물 독성, 자가면역성 등 다양한 원인에 의한 간세포 손상에서 시작된다. 이러한 손상이 초기에 완치되지 못하고 만성화되면 손상된 간세포 주위로 모인 다양한 염증세포들이 분비하는 PDGF(platerlet-derived growth factor), TGF-β와 같은 인자들에 의해 간성상세포(hepatic stellate cell; HSC)가 활성화되고, 활성화된 간성상세포는 α-SMA(alpha smooth muscle actin)를 발현하는 증식성의 근섬유아세포(myofibroblast)로 분화되며, 분화된 근섬유아세포는 콜라겐(collagen), 엘라스틴(elastin)과 같은 다양한 세포외기질(extracellular matrix; ECM)을 분비하게 되면서 간 섬유화를 유도하게 된다. 또한, 최근 보고에 의하면 간 섬유화와 관련하여 새로운 기전인 상피세포의 중간엽세포로의 전환(epithelial mesenchymal transition, EMT)을 통하여서도 간 섬유화가 유발된다고 한다.
간 섬유화는 만성적인 간 손상에 수반되는 불가피한 간의 병리학적 결과로써, 생체 물질의 대사 또는 담즙분비 등 간의 고유 기능을 수행할 수 없는 섬유 조직으로 간이 대체된다는 점에서 간 기능의 저하가 필연적으로 나타난다. 간 섬유화는 가역적이고, 가느다란 소섬유(thin fibril)로 구성되며 결절(nodule) 형성이 없는 것으로 알려져 있어, 간의 손상 원인이 소실되면 정상으로 회복되는 것이 가능할 수 있다. 그러나, 섬유화 과정이 반복적으로 지속되면 ECM 간의 교환, 결합이 증가하여 굵은 소섬유(thick fibril) 및 재생성 결절이 생성되는 비가역적인 간경화 (liver cirrhosis)로 진행될 수 있다. 간 섬유화 정도가 만성적 간기능의 손상 정도를 반영하므로, 간 섬유화는 만성 간질환의 경중과 예후 예측에 있어 중요한 정보를 제공한다.
간 섬유화의 진행 단계를 판별하는 것은 간 섬유화에 대한 치료법을 결정하거나 또는 치료 후 예후 관찰에 있어 매우 중요하다. 섬유화는 간 전체에서 고르게 나타나는 변화가 아니기 때문에, 생검조직을 얻어 형태학적으로 관찰이 수행되는 조직검사는 조직검사가 수행되는 일부의 조직이 간 전체의 상황을 대표하지 못하는 위험성이 있다. 하지만 중요한 것은 간 생검조직에서 확인된 마커를 활용하여 혈청 마커를 개발해야 정확성을 높일 수 있다는 것이다. 간 연구와 관련된 학계를 주도하고 있는 스페인 바르셀로나 간암 연구회 (BCLC)의 Josep M. Llovet는 리뷰 논문을 통해 간암의 미래 치료전략 중 임상시험 디자인에 간암 생검을 통해 tissue biomarker 연구를 권장하는 최근 가이드라인을 추천하였다. 해당 가이드라인은 ‘EASL-EORTC Clinical Practice Guidelines: Management of Hepatocellular Carcinoma’(J Hepatol. 2012 Apr;56(4):908-43)이다. 이에 간편하면서도 정확도가 높은 혈청마커의 개발에 활용될 수 있으며, 종래 알려진 방법 보다 정확도가 우수한 간 섬유화 단계를 진단할 수 있는 진단 방법이 필요한 실정이다.
본 발명은 간 섬유화의 진행 정도를 특이적으로 판별, 진단 또는 검출 가능한 간 섬유화 진행 진단용 마커를 제공하는 것을 목적으로 한다.
또한, 상기 마커의 조합을 통한 통계학적 분석을 수행하고, 이를 기반으로 간 섬유화의 진행단계를 진단하여 간 섬유화의 위험도를 예측하는 정보제공방법을 제공하는 것을 다른 목적으로 한다.
또한, 상기 마커의 발현 수준을 측정하여 간 섬유화의 위험도를 예측하는 정보제공방법을 제공하는 것을 또 다른 목적으로 한다.
또한, 상기 마커의 발현 수준을 측정할 수 있는 간 섬유화 위험도 예측 또는 진단용 조성물을 제공하는 것을 또 다른 목적으로 한다.
본 발명의 일 측면에 따르면, CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17로 이루어진 군에서 선택되는 적어도 하나의 유전자를 포함하는, 간 섬유화 위험도 예측용 마커 조성물이 제공된다.
본 발명의 다른 측면에 따르면, CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17로 이루어지는 군에서 선택되는 적어도 2종의 유전자를 이용하여 유전자 조합을 결정하는 단계; 결정된 유전자 조합에 포함되는 유전자별 발현 수준을 측정하는 단계;
회귀분석을 통해 상기 유전자별로 발현 수준에 대한 회귀 계수 값을 구하는 단계; 및 상기 회귀 계수 값을 이용하여 간 섬유화 예측 점수를 구하는 단계;를 더 포함하는, 간 섬유화 위험도 예측을 위한 정보제공방법이 제공된다.
또한, 상기 유전자 조합에 대해 ROC 곡선을 통해 기준값을 구하고 상기 간 섬유화 예측 점수 및 상기 기준값을 비교하는 단계를 더 포함하되, 상기 간 섬유화 예측 점수가 상기 기준값보다 높으면 간 섬유화 위험도가 높은 것으로 판단이 이루어지고 상기 간 섬유화 예측 점수가 상기 기준값보다 낮으면 간 섬유화 위험도가 낮은 것으로 판단이 이루어질 수 있다.
또한, 상기 유전자 조합은 JAK2, MAP3K14 및 SOX17로 이루어진 군에서 선택되는 적어도 2종을 포함할 수 있다.
또한, 상기 유전자 조합은 CSF3R 및 MAP3K14를 포함할 수 있다.
또한, 상기 유전자 조합은 JAK2, MAPK8IP2 및 SOX17를 포함할 수 있다.
또한, 상기 유전자 조합은 SOX17를 포함하고 CSF3R, JAK2, MAP3K14 및 MAPK8IP2로 이루어지는 군에서 선택되는 적어도 3종의 유전자를 더 포함할 수 있다.
본 발명의 또 다른 측면에 따르면, CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17 유전자의 발현 수준을 측정하는 단계; 로지스틱 회귀분석을 통해 상기 유전자별로 발현 수준에 대한 회귀 계수 값을 구하는 단계; 및 상기 회귀 계수 값을 이용하여 간 섬유화 예측 점수를 구하는 단계;를 더 포함하는, 간 섬유화 위험도 예측을 위한 정보제공방법이 제공된다.
본 발명의 또 다른 측면에 따르면, CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17로 이루어진 군에서 선택되는 적어도 2종의 유전자의 mRNA 또는 상기 유전자에 의하여 암호화되는 단백질의 발현 수준을 측정하는 단계를 포함하는, 간 섬유화 위험도 예측을 위한 정보제공방법이 제공된다.
삭제
삭제
본 발명의 또 다른 측면에 따르면, CSF3R, JAK2, MAP3K14 및 MAPK8IP2로 이루어진 군에서 선택되는 적어도 하나 및, SOX17를 포함하는 유전자의 mRNA 또는 상기 유전자에 의하여 암호화되는 단백질의 발현 수준을 측정하는 단계를 포함하는, 간 섬유화 위험도 예측을 위한 정보제공방법이 제공된다.
본 발명의 또 다른 측면에 따르면, SF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17로 이루어진 군에서 선택되는 적어도 2종의 유전자의 mRNA 또는 상기 유전자에 의하여 암호화되는 단백질의 발현 수준을 측정하는 제제를 포함하는, 간 섬유화 위험도 예측용 조성물이 제공된다.
또한, 상기 mRNA의 발현 수준을 측정하는 제제는 유전자의 mRNA에 상보적으로 결합하는 센스 및 안티센스 프라이머, 또는 프로브일 수 있다.
또한, 상기 단백질의 발현 수준을 측정하는 제제는 상기 단백질에 특이적으로 결합하는 항체, 상호작용 단백질, 리간드, 올리고펩타이드, PNA(peptide nucleic acid), 나노입자 또는 압타머를 포함할 수 있다.
본 발명의 일 측면에 따른 정보제공방법에 의하면 높은 민감도 및 특이도로 간 섬유화 단계에 따른 위험도를 구분하여 예측할 수 있다. 이를 통하여, 간 섬유화의 진행 단계에 대한 정보를 높은 정확도로 얻을 수 있으며, 간 섬유화 진행 단계에 맞는 적절한 치료법을 적용하여 효과적으로 간 섬유화에 대한 치료가 이루어질 수 있다.
또한, 본 발명의 다른 측면에 따른 마커는 진행성 간 섬유화의 메커니즘을 연구하거나 치료제 개발을 위한 표적으로 활용되거나 치료효과 예측을 위한 모델 구축에 활용될 수 있다.
도 1은 본 발명의 일 실시예에 따른 정보제공방법의 전체 공정을 도시한 것,
도 2는 본 발명의 일 측면에 따른 마커의 mRNA 발현량을 간 섬유화 단계를 구분하여 확인한 것,
도 3은 본 발명의 일 측면에 따른 마커를 모두 포함하는 유전자 조합의 ROC 곡선.
도 2는 본 발명의 일 측면에 따른 마커의 mRNA 발현량을 간 섬유화 단계를 구분하여 확인한 것,
도 3은 본 발명의 일 측면에 따른 마커를 모두 포함하는 유전자 조합의 ROC 곡선.
본 발명은 간 섬유화의 진행단계에 기반하여 간 섬유화의 위험도를 예측할 수 있는 마커 및 그 이용에 관한 것이다.
이하, 본 발명에 대해 보다 상세히 설명한다.
본 발명에서 사용되는 용어 마커는 생물학적 현상의 존재와 정량적 또는 정성적으로 연관된 분자를 의미한다. 상기 마커는 현상의 선행 기작과 직접 또는 간접적으로 관련되는 유전자, RNA, 폴리뉴클레오타이드, 펩타이드, 단백질을 포함하는 유전자 산물; 관련 대사물들; 항체들 또는 항체 단편들과 같은 기타 확인용 분자들 모두를 포함할 수 있다.
본 발명에서 사용되는 용어 유전자 시그니처(gene signature)는 간 섬유화 위험도를 우수한 신뢰도로 예측할 수 있는 마커의 조합을 의미한다.
본 발명에서 사용되는 용어 간 섬유화 위험도는 간 섬유화 진행 단계에 따른 위험도 판단에 대한 정보를 포함한다. 간 섬유화 진행 단계에 기반하여 초기 또는 전기(early stage)인 경우 저위험군, 후기(late stage)인 경우 고위험군으로 구분될 수 있다. 여기에서, 간 섬유화 진행 단계는 METAVIR간 섬유화 단계 정의에 따른 1단계 또는 2단계인 경우 초기로, 3단계 또는 4단계인 경우 후기로 분류될 수 있다.
본 발명에서 사용되는 용어 역치 또는 기준값(Threshold)은 통계분석을 통하여 얻을 수 있으며, 환자가 주어진 병태에 대하여 질환이 있거나 없는 것으로 판단할 수 있는 수치로 이해될 수 있다. 이하에서는 기준값으로 기재하기로 한다. 일반적으로 진단적인 의미에서의 기준값은 집단(populations), 유병률, 및 임상적 성과와 같은 요인들에 의존하여 원하는 민감도 및 특이도를 달성하도록 설정될 수 있으며, 알고리즘 또는 전산화된 데이터 분석을 통해 계산되거나 확립될 수 있다. 기준값은 후술할 실시예에 기재된 것과 같은 임상적 연구를 통해 실험적으로 확립될 수도 있다. 사용된 질환 예측 모델에 의존하여, 최대의 민감도, 특이도 또는 최소 오차를 달성하도록 설정될 수 있다. 본 발명에 따른 일 실시예에서, 기준값은 최대의 민감도, 특이도, 정확도, 양성 예측도 및 음성 예측도를 달성하도록 설정된다.
본 발명에서 사용되는 용어 민감도(Sensitivity)는 간 섬유화 후기에 있는 사람을 고위험군으로 검출하는 능력을 의미하고, 특이도(Specificity)는 간 섬유화 초기에 잇는 사람을 저위험군으로 검출하는 능력을 의미하고, 정확도(Accuracy)는 간 섬유화 후기에 있는 사람을 고위험군으로 판단하고 간 섬유화 초기에 있는 사람을 저위험군으로 판단하는 확률을 의미하고, 양성 예측도(Positive Predictive Value)는 고위험군으로 나온 것 중에 실제 간 섬유화 후기에 있을 확률을 의미하며, 음성 예측도(Negative Predictive Value)는 저위험군으로 나온 것 중에 실제 간 섬유화 전기에 있을 확률을 의미하는 것으로 이해될 수 있다. 상기 민감도, 특이도, 정확도, 양성예측도 및 음성예측도는 하기 표 1의 값을 이용하여 계산될 수 있다. 표 1에서, 고위험군 및 저위험군은 ROC 곡선을 통해 얻어진 기준값(Threshold)을 기준으로 구분된다.
Advanced Stage (number) | Early Stage (number) |
계 (number) | |
고위험군 (number) | A (True Positive) | B (False Positive) | Total (Test Positive) |
저위험군 (number) | C (False Negative) | D (True Negative) | Total (Test Negative) |
Total (Advanced Stage) |
Total (Early Stage) |
Total |
상기 민감도는 상기 표 1의 값을 이용하여 A/(A+C)로 계산될 수 있다. 상기 특이도는 상기 표 1의 값을 이용하여 D/(B+D)로 계산될 수 있다. 상기 정확도는 상기 표 1의 값을 이용하여 A+D/(A+B+C+D)로 계산될 수 있다. 상기 양성 예측도는 상기 표 1의 값을 이용하여 A/(A+B)로 계산될 수 있다. 상기 음성 예측도는 상기 표 1의 값을 이용하여 D/(C+D)로 계산될 수 있다. 상기 표 1에서, Advanced Stage는 간 섬유화 진행도에 따른 후기를 의미하고, Early Stage는 간 섬유화 진행도에 따른 초기를 의미한다.
본 발명에서 질병에 대한 검사 또는 진단과 관련된 통계분석시 사용된 용어는 전술한 용어를 제외하면 회귀분석(Regression analysis) 및 ROC(Receiver Operation Characteristic) 곡선과 연관하여 본 기술분야에서 통상적으로 이해되는 의미로 해석될 수 있다.
본 발명에서 사용되는 용어 간 섬유화 예측 점수(Liver fibrosis prediction score)는 유전자 시그니처를 이용하여 간 섬유화의 위험도를 고위험군 또는 저위험군으로 구분하기 위한 값을 의미하며, 본 발명의 일 측면에 따른 유전자 시그니처의 ROC 곡선을 통해 구한 단변량 로지스틱 회귀분석(Univariate Logistic Regression Analysis)의 마커별 회귀 계수 값을 이용하여 계산될 수 있다.
본 발명의 일 측면에 따르면, 간 섬유화 위험도를 예측 또는 진단할 수 있는 마커 및 그를 포함하는 조성물이 제공된다.
본 발명의 일 측면에 따른 마커 및 그를 포함하는 유전자 시그니처는 통계분석을 통해 도출될 수 있다. 통계분석을 통해 본 발명의 일 측면에 따른 간 섬유화의 위험도 예측 또는 진단용 마커 및 그를 이용하여 본 발명의 다른 측면에 따른 정보제공방법을 수행하기 위한 유전자 조합에 대한 정보를 제공하는 방법에 대한 공정의 일 예를 도 1에 도시하였다. 도 1을 참조하면, nCounter Assay를 수행하여 발현 수준 또는 발현 패턴에 대한 발현 데이터(Expression Data)를 얻는 단계, 상관분석(Correlation Analysis)을 통해 간 섬유화 단계에 따라 발현이 다른 유전자(Differentially Expressed Genes)에 대한 정보를 얻는 단계, 유전자 콤보 분석(Combo Gene Analysis) 및 교차검증(Cross Validation)을 포함한 머신 러닝(Machine Learning)을 수행하여 최적 유전자 조합인 유전자 시그니처의 후보(Candidate of Gene Signatures)에 대한 정보를 얻는 단계 및 회귀분석(Univariate or Multivariate Regression Analysis)를 통해 유전자 시그니처를 확정하는 단계를 통하여 본 발명의 일 측면에 따른 마커 및 유전자 시그니처가 도출될 수 있다.
상기 nCounter Assay는 간 섬유화 및 그 진행 단계의 구분과 관련된 마커를 도출하기 위하여 수행될 수 있다. 상세하게는, 간 섬유화 질환이 없는 정상군, 간 섬유화의 위험도가 낮은 저위험군 및 간 섬유화의 위험도가 높은 고위험군을 구분하고 구별된 그룹별로 유전자의 발현 여부 또는 발현 수준을 확인하여 그룹별 유의미한 발현 차이가 있는 유전자를 도출하기 위하여 수행될 수 있다. 유전자의 발현 여부 또는 그 발현 수준은 상기 유전자로부터 전사되는 mRNA 또는 그에 의하여 암호화되는 단백질을 통해 측정될 수 있으며, 상기 mRNA 또는 단백질은 질환자 또는 검사를 원하는 대상자로부터 얻은 시료로부터 추출될 수 있다. 상기 시료는 상기 대상자로부터 유래되는 생물학적 시료로, 예를 들면, 간 조직 또는 간 조직 유래 세포일 수 있으나 이에 한정되는 것은 아니다. 상기 시료는 체외로 분리된 냉동(fresh-frozen) 생검 샘플 또는 포르말린-고정된 파라핀-포매된(formalin-fixed paraffin-embedded, FFPE) 생검 샘플에서 유래한 것일 수 있으나 이에 한정되는 것은 아니다. 상기 생검 샘플은 수술조직 또는 조직검사(biopsy) 유래 조직일 수 있다.
nCounter Assay는 유전자의 발현 차이를 빠르게 확인하기 위하여 선택된 바람직한 일 예시의 수단일 뿐 본 발명에서 유전자의 발현 차이를 확인하는 수단이 이에 한정되는 것은 아니다. 예를 들어, mRNA의 발현 여부 또는 발현 수준의 측정은 RT-PCR, 경쟁적 RT-PCR(competitive RT-PCR), 실시간 RT-PCR(real-time RT-PCR), 인-시투 혼성화(in-situ hybridization), RNase 보호 분석법(RNase protection assay), 노던 블랏 및 DNA 칩으로 이루어진 군에서 선택되는 적어도 하나의 방법을 통해 수행될 수 있으나 이에 한정되는 것은 아니다. 다른 예로, 단백질의 존재 여부의 확인 또는 그 발현 수준의 측정은 면역조직화학염색(immunohistochemistry stain), 웨스턴 블랏, ELISA(enzyme linked immunosorbent assay), 방사선면역분석(radioimmunoassay), 방사면역확산법(radioimmunodiffusion), 오우크테를로니(ouchterlony) 면역확산, 로케트(rocket) 면역전기영동, 면역침전 분석(immunoprecipitation assay), 보체 고정 분석법(complement fixation assay), FACS 및 단백질 칩(protein chip)으로 이루어진 군에서 선택되는 적어도 하나의 방법을 통해 수행될 수 있으나 이에 한정되는 것은 아니다.
유전자의 발현값을 얻은 후, 그에 대한 통계분석이 수행될 수 있다. 상기 통계분석을 통해 회귀 계수 및 기준값을 얻을 수 있으며, 상기 회귀 계수 및 기준값을 이용하여 간 섬유화 위험도를 예측 또는 진단할 수 있다.
상기 통계분석은 회귀분석을 통해 수행될 수 있다. 상기 회귀분석은 ROC 곡선을 통해 수행될 수 있다. 단변량(Univariable) 또는 다변량(Multivariable) 분석이 수행될 수 있으며, 전술한 방법을 통하여 도출된 본 발명의 일 측면에 따른 마커는 CSF3R(Colony Stimulating Factor 3 Receptor), JAK2(Janus Kinase 2), MAP3K14(Mitogen-Activated Protein Kinase Kinase Kinase 14), MAPK8IP2(Mitogen-Activated Protein Kinase 8 Interacting Protein 2) 및 SOX17(SRY-Box Transcription Factor 17)로 이루어진 군에서 선택되는 적어도 하나의 유전자를 포함한다. 유전자 시그니처는 상기 유전자를 포함하는 유전자 조합 중에서 AUC, 민감도 및 특이도가 우수한 유전자 조합이 선택될 수 있다. 상기 유전자 시그니처는 CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17로 이루어진 군에서 선택되는 적어도 2종의 유전자를 포함하도록 선택될 수 있으며, 바람직하게는 CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17를 포함하는 유전자 조합이 선택될 수 있다.
본 발명의 다른 측면에 따르면, 상기 마커를 활용하는 간 섬유화 위험도 예측 또는 진단을 위한 정보제공방법이 제공된다.
본 발명의 바람직한 일 예시에 따른 정보제공방법은 도출된 유전자 마커 CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17로 이루어지는 군에서 선택되는 적어도 2종의 유전자를 이용하여 유전자 조합을 결정하는 단계; 결정된 유전자 조합에 포함되는 유전자의 발현 수준을 측정하는 단계; 회귀분석을 통해 상기 유전자별로 각각의 회귀 계수 값을 구하는 단계; 상기 회귀 계수 값을 이용하여 간 섬유화 예측 점수를 구하는 단계; 상기 유전자를 모두 포함하는 유전자 조합에 대해 회귀분석을 통해 기준값을 구하는 단계; 및 상기 간 섬유화 예측 점수 및 상기 기준값을 비교하는 단계;를 포함하여 수행될 수 있다.
간 섬유화 위험도 예측의 신뢰도를 향상시키기 위하여, 도출된 유전자 마커를 단일로 이용하지 않고 도출된 유전자들 중 2종 이상을 포함하는 유전자 조합으로 이용하는 것이 좋다. 바람직하게는, 상기 유전자 조합은 JAK2, MAP3K14 및 SOX17로 이루어진 군에서 선택되는 적어도 2종을 포함하거나 CSF3R 및 MAP3K14를 포함하는 것이 좋다. 또는, JAK2, MAPK8IP2 및 SOX17를 포함하는 것이 좋다. 보다 바람직하게는, 상기 유전자 조합은 SOX17를 포함하고 CSF3R, JAK2, MAP3K14 및 MAPK8IP2로 이루어지는 군에서 선택되는 적어도 3종의 유전자를 더 포함하는 것이 좋다.
상기 유전자의 발현은 상기 유전자의 mRNA 또는 상기 유전자에 의하여 암호화되는 단백질의 발현을 이용하여 측정 또는 확인될 수 있다.
상기 회귀분석은 ROC 곡선을 이용하여 수행될 수 있다. 각 유전자별 회귀 계수 값은 단변량 로지스틱 회귀분석을 통해 얻어질 수 있다. 상기 기준값은 다변량 로지스틱 회귀분석을 통해 얻어질 수 있다. 상세하게는, 상기 기준값은 ROC 곡선을 이용한 다변량 로지스틱 회귀분석을 통해 얻어질 수 있다.
상기 간 섬유화 예측 점수가 상기 기준값보다 높으면 간 섬유화가 후기 진행단계에 있어 위험도가 높은 것으로 판단이 수행될 수 있다. 상기 간 섬유화 예측 점수가 상기 기준값보다 낮으면 간 섬유화가 초기 진행 단계에 있어 위험도가 낮은 것으로 판단이 수행될 수 있다.
본 발명의 다른 예시에 따른 정보제공방법은 CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17로 이루어진 군에서 선택되는 적어도 2종의 유전자의 mRNA 또는 상기 유전자에 의하여 암호화되는 단백질의 발현 수준을 측정하고, 측정된 mRNA 또는 단백질의 발현 수준을 비교하여 수행될 수 있다.
CSF3R, JAK2, MAP3K14 및 MAPK8IP2는 간 섬유화 초기와 후기를 비교하면, 간 섬유화 초기에 비하여 후기에서 그 발현 수준이 낮아진다. 이러한 발현 특성을 고려하여, 검사 대상에서 측정된 CSF3R, JAK2, MAP3K14 및 MAPK8IP2의 발현 수준이 높은 경우 간 섬유화 위험도가 낮은 것으로 예측하고, 측정된 발현 수준이 낮은 경우 간 섬유화 위험도가 높은 것으로 예측될 수 있다.
SOX17은 간 섬유화 초기에서보다 후기에서 그 발현 수준이 높아지는데, SOX17의 발현 수준이 높아질수록 간 섬유화 위험도는 높아지는 것으로 예측될 수 있다.
본 발명의 다른 측면에 따르면, 본 발명의 일 측면에 따른 마커를 이용한 간 섬유화 위험도 예측용 조성물이 제공된다.
상기 조성물은 SF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17로 이루어진 군에서 선택되는 적어도 하나, 바람직하게는, 적어도 2종의 유전자의 mRNA 또는 상기 유전자에 의하여 암호화되는 단백질의 발현 수준을 측정하는 제제를 포함할 수 있다.
상기 mRNA의 발현 수준을 측정하는 제제는 예를 들면 유전자의 mRNA에 상보적으로 결합하는 센스 및 안티센스 프라이머, 또는 프로브일 수 있으나 이에 한정되는 것은 아니다. 상기 단백질의 발현 수준을 측정하는 제제는 예를 들면 상기 단백질에 특이적으로 결합하는 항체, 상호작용 단백질, 리간드, 올리고펩타이드, PNA(peptide nucleic acid), 나노입자 또는 압타머를 포함할 수 있으나 이에 한정되는 것은 아니다.
이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시하나, 이들 실시예는 본 발명을 예시하는 것일 뿐 첨부된 특허청구범위를 제한하는 것이 아니며, 본 발명의 범주 및 기술사상 범위 내에서 실시예에 대한 다양한 변경 및 수정이 가능함은 당업자에게 있어서 명백한 것이며, 이러한 변형 및 수정이 첨부된 특허청구범위에 속하는 것도 당연한 것이다.
실시예
<검체 수집>
총 94명의 환자로부터 검체를 수집하였다. 체외로 분리된 냉동 (fresh-frozen) 생검 샘플 (수술조직) 을 실험을 위한 시료로 사용하였다. 시험 참여 전에 환자로부터 서면 동의를 받았으며, 아주대병원의 임상시험심사위원회의 승인 (승인번호: AJIRB-BMR-KSP-18-444)을 받았다. 수집된 검체를 간 섬유화 질환 단계에 따라 구분하면 정상 17개, 간 섬유화 1단계 12개, 2단계 12개, 3단계 25개 및 4단계 28개로, 간 섬유화 질환을 가진 검체는 총 77개였다. 간 섬유화의 단계는 METAVIR 간 섬유화 단계 정의에 따라 구분하였으며, 병리과 전문의에 의해 조직학적 분석으로 섬유화 정도가 평가되었다. 환자로부터 얻어진 데이터를 사용하여 환자의 특징 및 단변량 분석에서 유의성 있는 섬유화와 관련된 변수를 수집하였다.
<임상정보의 통계분석>
94명의 환자 중 간 섬유화 질환을 가진 77개 검체의 환자 임상정보를 단변수 로지스틱 회귀(Univariable Logistic Regression)법으로 분석하여 확인하였으며, 분석 결과는 하기 표 2에 나타냈다.
변수 (Variable) |
환자수 (n) |
coef | Odds Ratio | se(coef) | z | P-value | lower .95 | upper .95 |
연령 (<55세 vs ≥55세) |
77 | -0.0711 | 0.93 | 0.5097 | -0.139 | 0.8891 | 0.34 | 2.53 |
성별 (남성 vs 여성) |
77 | -0.3600 | 0.70 | 0.5878 | -0.612 | 0.5402 | 0.22 | 2.24 |
HBV (없음 vs 있음) |
74 | 1.7525 | 5.77 | 0.6048 | 2.898 | 0.0038 | 1.76 | 18.88 |
HCV (없음 vs 있음) |
73 | 15.7653 | 7027141.58 | 1696.7344 | 0.009 | 0.9926 | 0.00 | Inf |
AFP (<100ng/mL vs ≥100ng/mL) |
77 | 0.5008 | 1.65 | 0.4970 | 1.008 | 0.3140 | 0.62 | 4.37 |
표 2를 참조하면, 단변수 회귀분석 결과로 유전자 조합 외에 항목별로 분석한 결과, HBV(Hepatitis B) 존재유무에 따라 간 섬유화 저위험군과 고위험군에서 유의성 있게 상이한 것으로 나타났으며, HBV 또한 진행성 간 섬유화를 구분할 수 있는 것을 확인할 수 있다.
<RNA 추출>
RNeasy mini kit (Qiagen, Hilden, Germany)와 DNase I treatment (Qiagen, Hilden, Germany)를 사용하여, 수술 조직 (n=94)으로부터 총 RNA를 추출하였다 (표 1). 총 RNA integrity는 Bioanalyzer 2100 (Agilent Technologies, Santa Clara, CA, USA)을 사용하여 검증하였으며, 총 RNA 농도는 Nanodrop 2000 (Thermo Fisher scientific, Waltham, MS, USA)을 사용하여 측정하였다.
<유전자 발현 분석>
검체 유전자 발현은 nCounter MAX (Nanostring, Technologies, Seattle, WA, USA)를 이용한 nCounter PanCancer Pathway Panel (Nanostring Technologies, Seattle, WA)을 사용하여 수행하였다. 상기 패널(panel)은 40개의 컨트롤 유전자를 포함한 770개의 유전자를 분석하였으며, 각각의 반응은 15 ㎕ 앨리콧(aliquot) 중의 총 RNA 100 ng 및 리포터 및 캡쳐 프로브를 포함하였다. 데이터 (raw data)의 보정 (Quality control and normalization)은 nSolver Analysis Software v 4.0 (Nanostring Technologies, Seattle, WA, USA)을 사용하여 수행하였다. 분석된 770개 유전자 중 Endogenous 유전자가 730개, Housekeeping 유전자가 40개였으며, 이들 유전자는 nSolver 소프트웨어를 이용하여 표준화(Normalization) 작업이 진행되었다. 표준화를 위한 프로그램의 설정은 Positive Control Normalization에서 Geometric mean을 선택, Range 는 0.3-3으로 하고, CodeSet Content (Reference or Housekeeping) Normalization에서 Standard 로 하여, Codeset Content는 Endogenous 유전자들, Normalization Codes는 Housekeeping 유전자들을 선택하고, Geometric mean을 선택, Range는 0.1-10 으로 설정하였다.
전술한 설정으로 데이터 표준화 작업을 진행하고, 730개 유전자의 표준화된 발현량의 값을 구하였다.
집단의 표본 수가 작아 정규성을 만족하지 못하는 경우 서로 다른 두 집단의 차이를 분석하는 방법인 윌콕슨 순위합 검정(Wilcoxon rank sum test)을 사용하여 평가하였으며, p<0.05를 통계학적으로 유의한 것으로 간주하였다.
로지스틱 회귀 분석은 종속 변수와 독립 변수간의 관계를 구체적인 함수로 나타내어 향후 예측 모델에 사용하기 위한 분석으로 점수화할 수 있는 정량적 변수가 이분형 변수에 미치는 영향을 분석하는 분석 방법이며, p<0.05를 통계학적으로 유의한 것으로 간주하였다.
<간 섬유화 단계에 따른 발현량이 상이한 유전자의 확인>
간 섬유화 1단계 및 2단계를 간 섬유화 저위험군으로, 간 섬유화 3단계 및 4단계를 간 섬유화 고위험군으로 구분하고, 저위험군 및 고위험군 사이에서 유전자 발현에 차이가 있는 유전자를 확인하였다. 간 섬유화 환자 코호트(n=77)에서 저위험군(n=24)및 고위험군(n=53) 간의 상이한 유전자 발현을 분석한 결과, 730개 Endogenous 유전자 중에서 71개 유전자가 통계적으로 유의하게 상이하게 발현된 것으로 나타났다(P<0.05). 상세하게는, 71개 유전자 중 10개 유전자는 저위험군에서보다 고위험군에서 발현이 증가되고, 61개 유전자는 저위험군에서보다 고위험군에서 발현이 감소한 것으로 나타났다. 이 71개 유전자의 일부 통계분석 결과를 하기 표 3에 나타냈다.
SEQ | 유전자 (Gene) |
검체수 (n) |
Logistic Regression P-value | (FS1,2 vs 3,4) Wilcoxon P-value | Fold Change |
8 | SOX17 | 77 | 1.62E-03 | 4.61E-05 | 2.09 |
29 | JAK2 | 77 | 2.48E-04 | 8.55E-09 | -2.33 |
37 | CSF3R | 77 | 4.26E-05 | 1.14E-06 | -2.59 |
40 | MAPK8IP2 | 77 | 3.79E-04 | 5.68E-03 | -2.62 |
71 | MAP3K14 | 77 | 2.41E-03 | 1.26E-07 | -6.37 |
<통계적 조합 유전자 분석 수행>
간 섬유화 단계 진단을 위한 최적 유전자 조합을 찾기 위하여, 간 섬유화 진행 단계에 따라 발현에 차이가 있는 71개 유전자에 대하여 조합 통계분석을 수행하였다. 조합 통계분석은 Logistic Regression 조합 분석, ROC(Receiver Operation Characteristic) 조합 분석 및 Cross Validation 조합 분석(300회 교차분석)을 통해 수행하였다. 여기에서, 각 조합분석은 Single 내지 Combo10으로 하였으며, 이는 조합한 유전자의 수를 의미한다. 상세하게는, Single은 1개 유전자를, Combo10은 10개 유전자를 조합한 것을 의미한다.
본 연구에서의 모든 통계분석은 오픈 소스 통계 프로그램 환경 R 언어(open source statistical programming environment R language)(Version 3.4.3)을 사용하여 수행하였다. 트레이닝 코호트에서, 윌콕슨 순위합 검정(Wilcoxon rank sum test)을 통하여 상이하게 발현되는 유전자(DEGs)를 과발현 혹은 저발현된 것으로 분류하여(p <0.05 및 |폴드-변화(fold-change)| > 2), 저위험군(Fibrosis Stage 1,2)을 고위험군(Fibrosis Stage 3,4)과 비교하였다. DEGs를 추가로 단변량 로지스틱 회귀분석(univariate logistic regression)을 사용하여 선발(shortlist)하였다. 선발된 DEGs의 수를 조합하여 분석하였고, 유전자 조합(gene combinations)의 총 수는 하기 수학식 1을 사용하여 계산하였다.
상기 수학식 1에서, n은 선발된 DEGs 총 수이고, k는 조합하여 포함시킨 유전자의 수이다.
다변량 로지스틱 회귀분석(multivariate logistic regression analysis)를 수행하여 유전자 시그니쳐(gene signatures) 및 임상병리학적 특징의 관련성을 측정하였다(p<0.05). 최적 유전자 조합을 구하기 위해 민감도 및 특이도를 구하여 이용하였으며, 이외에, 정확도, 양성 예측도 및 음성 예측도를 함께 구하여 부가적으로 활용하였다.
최적 유전자 조합의 후보 유전자 시그니쳐는 p < 0.05, AUC > 0.800, 민감도(sensitivity) > 80% 및 특이도(specificity) > 80% 조건으로 구하고, k-fold 교차 검증에 의해 계층화하여 최적의 유전자 조합(gene combination)을 동정하였다. AUC가 0.800이하이거나 민감도 및 특이도가 80% 이하에 해당되는 경우에는 그를 활용한 질병의 진단 및 예측에 대한 신뢰도가 저하되는 문제가 있으므로, 우수한 진단 또는 예측을 수행할 수 있는 모델 구축을 위해 전술한 조건으로 최적 유전자 조합을 구하였다. 트레이닝 코호트는 2개의 폴드(트레이닝 세트 및 시험 세트)로 나누어 트레이닝 세트에서의 기준 값을 테스트 세트에 적용하여 결과를 확인하였으며, 트레이닝 세트와 시험 세트의 환자군은 무작위로 나누었고 이를 300회 반복하여 테스트하였다. 정확도는 시험 세트에 대하여 p <0.05를 근거하여 계산하였다.
후보 조합유전자 통계분석 결과, 민감도 92.45%, 특이도 91.67% 및 정확도 92.21%으로, 모든 항목에서 90% 이상의 수치를 만족하여 예측 정확도가 현저히 우수한 조합을 확인하였으며, 그 결과를 표 4에 나타냈다.
유전자조합 | 유전자수 | Logistic Regression Continuous P-value | ROC AUC |
Pre Vali- dation 정확도 |
Logistic Regression Discrete P-value | threshold | 민감도 | 특이도 | 정확도 | 양성 예측도 |
음성 예측도 |
CSF3R_JAK2_MAP3K14_MAPK8IP2_SOX17 | 5 | 5.80E-04 | 0.951 | 77.33 | 5.68E-08 | -8.436595 | 92.45 | 91.67 | 92.21 | 96.08 | 84.62 |
표 4를 참조하면, 조합 통계분석 결과 CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17 5개 유전자들을 조합하여 분석하였을 때 민감도, 특이도, 정확도, 예측도가 현저히 높게 나타남을 확인하였다. 또한 5개 유전자의 간 섬유화 단계별 유전자 발현의 분석 결과 통계적으로 유의하게 상이하게 발현되는 것을 확인하였다(p<0.05). 전술한 5개 유전자의 간 섬유화 단계별 발현량을 mRNA 레벨에서 확인한 결과는 도 2에 나타냈다.
도 2를 참조하여 간 섬유화 초기 및 후기에 있어서의 각 유전자별 발현의 변화를 살펴보면, CSF3R, JAK2, MAP3K14 및 MAPK8IP2 유전자는 간 섬유화 초기에서보다 후기에서 발현이 저감되는 것으로 나타나고, SOX17 유전자는 초기에서보다 후기에서 발현이 증가되는 것으로 나타났다. 이를 통하여, 전술한 5개 유전자의 발현이 간 섬유화 단계에 따라 상이하게 나타나는 것을 확인할 수 있다.
다음으로 CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17 5개 유전자들을 이용하여 Single 내지 Combo5 조합으로 총 31개 조합을 생성하여 유전자 조합별로 정확도, 민감도 및 특이도를 비교하였으며, 그 결과를 하기 표 5에 나타냈다. 하기 표 5의 유전자 조합에 있어서, C는 CSF3R, J는 JAK2, M3는 MAP3K14, M8은 MAPK8IP2, S는 SOX17을 약어로 표현한 것이다. 예를 들어, C-J는 CSF3R 및 JAK2의 유전자 조합을 의미한다. 또한, 하기 표 5에 있어서, YI(Youden Index)는 특이도와 민감도 합이 최대가 되는 위치를 찾아 ROC 커브에서 기준값(threshold)를 구하기 위한 것으로, 민감도와 특이도의 합에서 1을 빼는 계산식을 통하여 구하였다. 진단 또는 예측 모델의 평가에 있어서, 민감도와 특이도의 합이 높은 것이 바람직하며, YI는 유전자 조합을 적용한 모델의 우수성을 확인하기 위한 중요한 지표로 활용될 수 있다. ROC의 AUC(Area Under the Curve)는 전체적인 민감도와 특이도의 상관 관계를 보여줄 수 있는 성능 평가 기준으로, 모델의 정확도를 평가하기 위하여 참조하였다.
SEQ | 유전자 조합 | 유전자 수 | ROC AUC | 민감도 | 특이도 | 정확도 | YI |
1 | C-J-M3-M8-S | 5 | 0.951 | 92.45 | 91.67 | 92.21 | 0.8412 |
2 | J-M3-M8-S | 4 | 0.932 | 96.23 | 83.33 | 92.21 | 0.7956 |
3 | J-M8-S | 3 | 0.926 | 96.23 | 83.33 | 92.21 | 0.7956 |
4 | J-M3-S | 3 | 0.925 | 96.23 | 79.17 | 90.91 | 0.754 |
5 | C-J-M3-S | 4 | 0.932 | 92.45 | 83.33 | 89.61 | 0.7578 |
6 | J-S | 2 | 0.913 | 92.45 | 83.33 | 89.61 | 0.7578 |
7 | C-J | 2 | 0.892 | 98.11 | 70.83 | 89.61 | 0.6894 |
8 | C-J-S | 3 | 0.926 | 92.45 | 79.17 | 88.31 | 0.7162 |
9 | C-J-M8_S | 4 | 0.945 | 84.91 | 91.67 | 87.01 | 0.7658 |
10 | M3-M8-S | 3 | 0.894 | 90.57 | 79.17 | 87.01 | 0.6974 |
11 | C-J-M3 | 3 | 0.909 | 92.45 | 75 | 87.01 | 0.6745 |
12 | C-M3-M8 | 3 | 0.886 | 96.23 | 66.67 | 87.01 | 0.629 |
13 | C-M8 | 2 | 0.859 | 96.23 | 66.67 | 87.01 | 0.629 |
14 | C-M3-M8-S | 4 | 0.932 | 81.13 | 95.83 | 85.71 | 0.7696 |
15 | C-M3-S | 3 | 0.921 | 84.91 | 87.5 | 85.71 | 0.7241 |
16 | C-M3 | 2 | 0.887 | 86.79 | 83.33 | 85.71 | 0.7012 |
17 | C-J-M3-M8 | 4 | 0.91 | 90.57 | 75 | 85.71 | 0.6557 |
18 | C-M8-S | 3 | 0.927 | 84.97 | 83.33 | 84.42 | 0.6824 |
19 | J-M3 | 2 | 0.924 | 84.91 | 83.33 | 84.42 | 0.6824 |
20 | M3-S | 2 | 0.902 | 84.91 | 83.33 | 84.42 | 0.6824 |
21 | M8-S | 2 | 0.874 | 86.79 | 79.17 | 84.42 | 0.6596 |
22 | J-M3-M8 | 3 | 0.909 | 81.13 | 87.5 | 83.12 | 0.6863 |
23 | C-S | 2 | 0.906 | 75.47 | 91.67 | 80.52 | 0.6714 |
24 | C-J-M8 | 3 | 0.887 | 77.36 | 87.5 | 80.52 | 0.6486 |
25 | M3-M8 | 2 | 0.829 | 86.19 | 66.67 | 80.52 | 0.5346 |
26 | J-M8 | 2 | 0.885 | 64.15 | 95.83 | 74.03 | 0.5998 |
27 | S | 1 | 0.792 | 62.26 | 91.67 | 71.43 | 0.5393 |
28 | M8 | 1 | 0.698 | 79.25 | 25 | 62.34 | 0.0425 |
29 | J | 1 | 0.912 | 86.79 | 0 | 59.74 | -0.1321 |
30 | M3 | 1 | 0.878 | 86.79 | 0 | 59.74 | -0.1321 |
31 | C | 1 | 0.848 | 86.79 | 0 | 59.74 | -0.1321 |
상기 표 5를 참조하면, CSF3R, JAK2, MAP3K14, MAPK8IP2 또는 SOX17 5개 유전자를 단독으로 이용하는 경우(seq.27-31)에 비하여, 전술한 유전자군에서 적어도 2종 이상을 함께 이용하는 경우 AUC, 민감도, 특이도, 정확도 및 YI 값이 현저히 증가되는 것으로 나타났다. 민감도, 특이도 및 정확도>80.0 및 AUC>0.8를 만족하는 많은 우수한 유전자 조합이 확인되었으며, CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17 5개 유전자들을 모두 조합한 경우(seq.1) AUC 및 YI가 가장 우수한 것을 확인하였다.
<유전자 시그니처 후보의 통계분석을 통한 간 섬유화 예측 점수 도출>
선별된 CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17 5개 유전자 조합에 대해서 단변량 로지스틱 회귀분석(Univariate logistic regression)에서 구한 각 유전자별 회귀 계수(Logistic regression coeffieient) 값을 이용하여 간 섬유화 예측 점수(Liver fibrosis prediction score)를 구하였다. 각 유전자별 회귀 계수 값은 하기 표 6에 나타냈다.
SEQ | 유전자 | 회귀계수 |
1 | CSF3R | -0.007283 |
2 | JAK2 | -0.005178 |
3 | MAP3K14 | -0.002994 |
4 | MAPK8IP2 | -0.059009 |
5 | SOX17 | 0.027697 |
상기 표 6의 유전자별 회귀 계수를 이용한 간 섬유화 예측 점수는 (-0.007283)×CSF3R+(-0.005178)×JAK2+(-0.002994)×MAP3K14+(-0.059009)×MAPK8IP2+0.027697×SOX17의 수식을 통해 계산될 수 있다. 여기에서, 각 유전자는 간 섬유화 진행 정도를 확인하여 위험도를 예측하고자 하는 검사대상 시료에서의 각 유전자의 발현량을 의미하며, 이전 실험단계에서 nCounter assay를 통해 구한 유전자 발현 분석 값의 raw data를 nSolver 4.0 소프트웨어를 사용하여 표준화(Normalization) 작업이 진행된 값이다.
상기 5개 유전자 조합에 대한 ROC 곡선 분석을 통하여 구한 기준값을 활용하여 간 섬유화에 대한 초기 또는 후기 판단이 이루어질 수 있으며, 이를 통하여 간 섬유화 진행 정도에 따른 위험도가 판별되고 후기에 있는 진행성 간 섬유화에 대한 예측이 수행될 수 있다. 상기 기준값을 구하기 위하여 수행된 ROC 곡선 분석 결과는 도 3에 나타냈다.
ROC 곡선 분석을 통해 도출된 기준값(threshold)은 -8.436595인 것으로 확인되었다. 검사대상 시료의 간 섬유화 예측 점수가 상기 도출된 기준값을 초과하는 경우 고위험군, 상기 도출된 기준값보다 작거나 같은 경우 저위험군으로 판별되었으며, 고위험군에 대하여 진행성 간섬유화인 것으로 예측이 수행되었다.
상기 표 6의 회귀 계수 및 상기 도출된 기준값은 본 발명의 일 실시예에서 nCounter assay를 통해 얻은 유전자 발현 분석 값에 기반하여 얻어진 값이며, RNA 발현값을 얻기 위한 측정방법이 본 실시예와 상이하게 되어 얻어진 발현값의 수치가 달라지게 되는 경우에는 그를 통해 얻어지는 회귀 계수 및 기준값도 전술한 수치와 달라질 수 있음은 물론이다.
다변량 분석은 하나의 종속변수에 영향을 미치는 여러 위험인자들의 영향을 서로 보정하여 각 인자들이 실제로 미치는 영향의 정도를 하나의 모형으로 설명한 것으로 이때 얻어지는 Odds Ratio (영향을 미치는 정도)는 다른 변수들의 영향이 모두 보정된 상태의 Odds Ratio 가 된다.
최적의 유전자 조합인 CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17 5개 유전자 조합의 유전자 시그니처에 대하여 단변량 분석을 수행한 후 통계적으로 유의한 인자에 대해서 다변량 분석을 수행하였다. 상세하게는, 유전자 시그니처와 HBV 사이의 관련성을 평가하고 그 결과를 표 7 및 8에 나타냈다. 하기 표 7은 유전자 시그니처에 대한 단변량 분석 수행 결과이고, 하기 표 8은 유전자 시그니처 및 HBV에 대한 다변량 분석 수행 결과이다.
변수 | n | coef | Odds Ratio | se(coef) | z | P-value | lower .95 | upper .95 |
간 섬유화 예측 점수 (low vs high) |
77 | 4.9034 | 134.75 | 0.9033 | 5.429 | 5.68E-08 | 22.94 | 791.37 |
변수 | n | coef | Odds Ratio | se (coef) |
z | P-value | lower .95 | upper .95 |
간 섬유화 예측 점수 (low vs high) |
74 | 5.164 | 174.91 (19.03-1603.36) |
1.130 | 4.568 | 4.91E-06 | 19.08 | 1603.36 |
HBV | 2.444 | 11.52 (1.00-132.63) |
1.247 | 1.961 | 4.99E-02 | 1.00 | 132.63 |
표 7 및 8을 참조하면, 본 발명의 일 측면에 따라 도출된 유전자 시그니처 및 HBV는 진행성 간 섬유화에 대한 독립적인 예측이 수행 가능한 인자인 것으로 확인되었다. 또한, 유전자 시그니처만으로도 독립적으로 진행성 간 섬유화를 진단할 수 있는 것을 확인하였다.
Claims (15)
- SOX17 유전자를 포함하는, 간 섬유화 질환을 가진 질환자의 간 섬유화 위험도 예측용 마커 조성물.
- 제 1항에 있어서,
CSF3R, JAK2, MAP3K14 및 MAPK8IP2 로 이루어지는 군에서 선택되는 적어도 하나의 유전자를 더 포함하는, 간 섬유화 위험도 예측용 마커 조성물.
- CSF3R, JAK2, MAP3K14 및 MAPK8IP2로 이루어진 군에서 선택되는 적어도 하나 및, SOX17를 포함하는 유전자를 이용하여 유전자 조합을 결정하는 단계;
결정된 유전자 조합에 포함되는 유전자별 발현 수준을 측정하는 단계;
회귀분석을 통해 상기 유전자별로 발현 수준에 대한 회귀 계수 값을 구하는 단계; 및
상기 회귀 계수 값을 이용하여 간 섬유화 예측 점수를 구하는 단계; 를 더 포함하는, 간 섬유화 질환을 가진 질환자의 간 섬유화 위험도 예측을 위한 정보제공방법.
- 제 3항에 있어서,
상기 유전자 조합에 대해 ROC 곡선을 통해 기준값을 구하고 상기 간 섬유화 예측 점수 및 상기 기준값을 비교하는 단계를 더 포함하되,
상기 간 섬유화 예측 점수가 상기 기준값보다 높으면 간 섬유화 위험도가 높은 것으로 판단이 이루어지고 상기 간 섬유화 예측 점수가 상기 기준값보다 낮으면 간 섬유화 위험도가 낮은 것으로 판단이 이루어지는, 간 섬유화 위험도 예측을 위한 정보제공방법.
- 제 3항에 있어서,
상기 유전자 조합은 JAK2 및 MAP3K14 로 이루어진 군에서 선택되는 적어도 하나 및, SOX17를 포함하는, 간 섬유화 위험도 예측을 위한 정보제공방법.
- 제 3항에 있어서,
상기 유전자 조합은 JAK2, MAPK8IP2 및 SOX17를 포함하는, 간 섬유화 위험도 예측을 위한 정보제공방법.
- 제 3항에 있어서,
상기 유전자 조합은 SOX17를 포함하고 CSF3R, JAK2, MAP3K14 및 MAPK8IP2로 이루어지는 군에서 선택되는 적어도 3종의 유전자를 더 포함하는, 간 섬유화 위험도 예측을 위한 정보제공방법.
- CSF3R, JAK2, MAP3K14, MAPK8IP2 및 SOX17 유전자의 발현 수준을 측정하는 단계;
로지스틱 회귀분석을 통해 상기 유전자별로 발현 수준에 대한 회귀 계수 값을 구하는 단계; 및
상기 회귀 계수 값을 이용하여 간 섬유화 예측 점수를 구하는 단계;를 더 포함하는, 간 섬유화 질환을 가진 질환자의 간 섬유화 위험도 예측을 위한 정보제공방법.
- SOX17를 포함하는 유전자의 mRNA 또는 상기 유전자에 의하여 암호화되는 단백질의 발현 수준을 측정하는 단계를 포함하는, 간 섬유화 질환을 가진 질환자의 간 섬유화 위험도 예측을 위한 정보제공방법.
- 제 9항에 있어서,
CSF3R, JAK2, MAP3K14 및 MAPK8IP2로 이루어지는 군에서 선택되는 적어도 하나를 포함하는 유전자의 mRNA 또는 상기 유전자에 의하여 암호화되는 단백질의 발현 수준을 측정하는 단계를 더 포함하는, 간 섬유화 위험도 예측을 위한 정보제공방법.
- 삭제
- SOX17를 포함하는 유전자의 mRNA 또는 상기 유전자에 의하여 암호화되는 단백질의 발현 수준을 측정하는 제제를 포함하는, 간 섬유화 질환을 가진 질환자의 간 섬유화 위험도 예측용 조성물.
- 제 12항에 있어서,
CSF3R, JAK2, MAP3K14 및 MAPK8IP2로 이루어지는 군에서 선택되는 적어도 하나를 포함하는 유전자의 mRNA 또는 상기 유전자에 의하여 암호화되는 단백질의 발현 수준을 측정하는 제제를 더 포함하는, 조성물.
- 제 12항에 있어서,
상기 mRNA의 발현 수준을 측정하는 제제는 유전자의 mRNA에 상보적으로 결합하는 센스 및 안티센스 프라이머, 또는 프로브인 것을 특징으로 하는, 조성물.
- 제 12항에 있어서,
상기 단백질의 발현 수준을 측정하는 제제는 상기 단백질에 특이적으로 결합하는 항체, 상호작용 단백질, 리간드, 올리고펩타이드, PNA(peptide nucleic acid), 나노입자 또는 압타머를 포함하는 것을 특징으로 하는, 조성물.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200086344A KR102346672B1 (ko) | 2020-07-13 | 2020-07-13 | 간 섬유화 위험도 예측용 마커 및 그를 이용하는 정보제공방법 |
PCT/KR2020/018908 WO2022014804A1 (ko) | 2020-07-13 | 2020-12-22 | 간 섬유화 위험도 예측용 마커 및 그를 이용하는 정보제공방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200086344A KR102346672B1 (ko) | 2020-07-13 | 2020-07-13 | 간 섬유화 위험도 예측용 마커 및 그를 이용하는 정보제공방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102346672B1 true KR102346672B1 (ko) | 2021-12-31 |
Family
ID=79177490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200086344A KR102346672B1 (ko) | 2020-07-13 | 2020-07-13 | 간 섬유화 위험도 예측용 마커 및 그를 이용하는 정보제공방법 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR102346672B1 (ko) |
WO (1) | WO2022014804A1 (ko) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101018960B1 (ko) | 2009-02-23 | 2011-03-02 | 아주대학교산학협력단 | 유의성있는 간섬유화 진단을 위한 분석 방법 |
KR20150014579A (ko) * | 2013-07-29 | 2015-02-09 | 가톨릭대학교 산학협력단 | 간 섬유화 진단용 바이오마커 elk3 |
KR101671776B1 (ko) | 2014-03-26 | 2016-11-02 | 강원대학교산학협력단 | Asgr1 또는 자칼린을 이용한 간섬유화 또는 간경화 치료용 조성물 |
KR20170074034A (ko) * | 2015-12-21 | 2017-06-29 | 가톨릭대학교 산학협력단 | 간 섬유화 진단용 바이오마커 cxcl14 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080161203A1 (en) * | 2006-12-27 | 2008-07-03 | Su Chun-Lin | Markers identified for liver fibrosis and cirrhosis and the microarray panel thereof |
US20150004133A1 (en) * | 2013-06-07 | 2015-01-01 | The Regents Of The University Of California | Compositions And Methods For Treating Steatohepatitis, Liver Fibrosis, and Hepatocellular Carcinoma (HCC) |
KR102116178B1 (ko) * | 2017-05-10 | 2020-05-27 | 서울대학교산학협력단 | 간암 고위험군의 간암 발병 모니터링 또는 진단용 바이오마커 및 그 용도 |
-
2020
- 2020-07-13 KR KR1020200086344A patent/KR102346672B1/ko active IP Right Grant
- 2020-12-22 WO PCT/KR2020/018908 patent/WO2022014804A1/ko active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101018960B1 (ko) | 2009-02-23 | 2011-03-02 | 아주대학교산학협력단 | 유의성있는 간섬유화 진단을 위한 분석 방법 |
KR20150014579A (ko) * | 2013-07-29 | 2015-02-09 | 가톨릭대학교 산학협력단 | 간 섬유화 진단용 바이오마커 elk3 |
KR101671776B1 (ko) | 2014-03-26 | 2016-11-02 | 강원대학교산학협력단 | Asgr1 또는 자칼린을 이용한 간섬유화 또는 간경화 치료용 조성물 |
KR20170074034A (ko) * | 2015-12-21 | 2017-06-29 | 가톨릭대학교 산학협력단 | 간 섬유화 진단용 바이오마커 cxcl14 |
Non-Patent Citations (7)
Title |
---|
AJP Gastrointestinal and Liver Physiology (2019) 316:G25-G31 * |
FASEB Journal (2019) 33:9466-9475 * |
Hepatology (2014) 60:2065-2076 * |
Journal of Clinical and Translational Hepatology (2018) 6:317-325* * |
Journal of Hepatology (2006) 45:401-409 * |
PLoS ONE (2015) 10(6):e0131658 * |
Scientific Reports (2015) 5:8777 * |
Also Published As
Publication number | Publication date |
---|---|
WO2022014804A1 (ko) | 2022-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10494677B2 (en) | Predicting cancer outcome | |
US7666595B2 (en) | Biomarkers for predicting prostate cancer progression | |
Stearman et al. | Analysis of orthologous gene expression between human pulmonary adenocarcinoma and a carcinogen-induced murine model | |
JP6246845B2 (ja) | 遺伝子発現を用いた前立腺癌の予後を定量化する方法 | |
JP6049739B2 (ja) | 前立腺癌の分類のためのマーカー遺伝子 | |
JP2009509502A (ja) | 原発不明がんの原発巣を同定するための方法および材料 | |
US7514219B2 (en) | Method for distinguishing between head and neck squamous cell carcinoma and lung squamous cell carcinoma | |
US20150344962A1 (en) | Methods for evaluating breast cancer prognosis | |
KR102216645B1 (ko) | 폐암의 분자 아형 결정을 위한 바이오마커 패널 및 이의 용도 | |
US20140371081A1 (en) | Compositions for and Methods of Detecting, Diagnosing, and Prognosing Thymic Cancer | |
CN113430267B (zh) | 一种化疗相关基因表达特征在预测胰腺癌预后中的应用 | |
CN113039289A (zh) | 预测黑色素瘤转移和患者预后的基因特征 | |
CN113493829A (zh) | 生物标志物在肺动脉高压诊疗中的应用 | |
Langbein et al. | Protein profiling of bladder cancer using the 2D-PAGE and SELDI-TOF-MS technique | |
KR20180106889A (ko) | 삼중음성 유방암의 항암제에 대한 반응 및 예후 측정용 바이오마커 | |
KR102346672B1 (ko) | 간 섬유화 위험도 예측용 마커 및 그를 이용하는 정보제공방법 | |
CN113201590A (zh) | 用于评估肝细胞癌早期复发风险的lncRNA、评估方法及装置 | |
KR101054952B1 (ko) | 간암 진단 및 환자 생존기간 예측용 마커인 uqcrh, 그를 포함하는 키트 및 상기 마커를 이용한 간암 환자 생존기간 예측 | |
KR20220074827A (ko) | 통합전사체분석 기반 만성 간질환 진단용 dpysl2 바이오마커 및 이의 용도 | |
Li et al. | Tmem158 may serve as a diagnostic biomarker for anaplastic thyroid carcinoma: an integrated bioinformatic analysis | |
CN113444788B (zh) | 青光眼诊断产品及应用 | |
KR20210142237A (ko) | 삼중음성유방암 환자에서 재발 및 전이 예후를 예측하기 위한 분석방법 | |
EP2607494A1 (en) | Biomarkers for lung cancer risk assessment | |
CN118406766A (zh) | 预测ii期和iii期结直肠癌预后临床结果的生物标志物、引物组及检测试剂盒 | |
CN117305444A (zh) | 利用癌症中剪接异常的短外显子辅助癌症诊断和预后 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |