WO2012070776A2 - 만성 b형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법 - Google Patents

만성 b형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법 Download PDF

Info

Publication number
WO2012070776A2
WO2012070776A2 PCT/KR2011/007895 KR2011007895W WO2012070776A2 WO 2012070776 A2 WO2012070776 A2 WO 2012070776A2 KR 2011007895 W KR2011007895 W KR 2011007895W WO 2012070776 A2 WO2012070776 A2 WO 2012070776A2
Authority
WO
WIPO (PCT)
Prior art keywords
hepatocellular carcinoma
markers
predicting
risk
patients
Prior art date
Application number
PCT/KR2011/007895
Other languages
English (en)
French (fr)
Other versions
WO2012070776A9 (ko
Inventor
천지용
박영민
신수경
박선민
유왕돈
김수옥
홍선표
김석준
Original Assignee
(주)진매트릭스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)진매트릭스 filed Critical (주)진매트릭스
Publication of WO2012070776A2 publication Critical patent/WO2012070776A2/ko
Publication of WO2012070776A9 publication Critical patent/WO2012070776A9/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/706Specific hybridization probes for hepatitis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Definitions

  • the present invention relates to a method for analyzing and predicting the risk of developing hepatocellular carcinoma (HCC) in patients with chronic hepatitis B. More specifically, hepatocellular carcinoma from a group of patients with chronic hepatitis B disease and chronic hepatitis B disease Identify mutation differences in various HBV (Hepatitis B virus) genetic markers among patients who progressed, select a combination of genetic markers showing mutations showing statistically significant differences, and then mathematically process the selected genetic markers.
  • HBV Hepatitis B virus
  • the present invention relates to a method for analyzing and predicting the risk of developing hepatocellular carcinoma by assigning a weight to the risk of developing hepatocellular carcinoma and using a result calculated based on the presence or absence of weighted genetic marker mutations.
  • the present invention provides candidate hepatocytes on the X gene and precore / core genes of hepatitis B virus (HBV) between a group of patients with chronic hepatitis B disease and a group of patients with chronic hepatitis B disease. Identifying mutations in cancer predictive markers, selecting a combination of markers for predicting hepatocellular carcinoma showing mutations showing statistically significant differences, and then performing hepatocellular carcinoma through mathematical treatment for selected hepatocellular cancer predictive markers.
  • the present invention relates to a method for analyzing and predicting the risk of developing hepatocellular carcinoma using a result value calculated by the presence or absence of mutations of weighted hepatocellular carcinoma predictive markers.
  • the present invention as described above, the result calculated using markers for predicting hepatocellular carcinoma on the X gene and precore / core gene of hepatitis B virus (HBV) and, optionally, hepatocellular carcinoma Mathematical treatment on predictive clinical data weighted the risk of developing hepatocellular carcinoma and weighted hepatocytes calculated according to whether the weighted hepatocellular carcinoma predictive clinical data does not meet a predetermined cutoff value.
  • Cancer predictive clinical data relates to a method of analyzing and predicting the risk of developing hepatocellular carcinoma using the results calculated from the values themselves.
  • Liver cancer refers to a malignant tumor occurring in the liver.
  • liver cancer refers to hepatocellular carcinoma.
  • hepatocellular carcinoma accounts for more than 90% of all liver cancers. Therefore, in the present specification, for the convenience of description, liver cancer will be referred to and described as hepatocellular carcinoma.
  • the incidence of hepatocellular carcinoma in Korea is estimated to be 30.5 males and 7.6 females per 100,000 people every year.
  • the incidence of hepatocellular carcinoma in the middle-aged age of 40 to 60 years was 74.8 males and 15.6 females, the highest incidence in the world.
  • 22.9 patients died from hepatocellular carcinoma (29.9).
  • the second highest mortality rate see Social Indicators in Korea 2009).
  • hepatitis B virus (hereinafter also referred to as "HBV") is a major cause of hepatocellular carcinoma, and the risk of developing hepatocellular carcinoma in patients with chronic hepatitis B disease caused by HBV is 70-200 times higher than that of the general population. It is becoming. More than 50% of hepatocellular carcinomas worldwide and 70-80% of HBV endemic areas in the population are known to be associated with HBV infection. In the United States, about 50% of all hepatocellular carcinomas, and in Korea, about 75-78% of all hepatocellular carcinomas are known to be caused by HBV.
  • HBV chronic hepatitis
  • cirrhosis chronic hepatitis
  • hepatocellular carcinoma a malignant neoplasm originating from a wide range of diseases that lead to chronic hepatitis, cirrhosis, and hepatocellular carcinoma.
  • the prevalence of hepatocellular carcinoma among chronic HBV carriers is 400-700 in men (per 100,000 people per year) and 120-180 in women (per 100,000 people per year), more than four times higher than in women.
  • HBV-associated hepatocellular carcinoma is very poor, generally median survival of less than 16 months, 1-year survival rate of 36% -67%, and 5-year survival rate of 15% -26%.
  • Liver cirrhosis (LC) is the most important factor contributing to an increased risk of HCC in chronic HBV carriers. Persistent infection of mutated HBV plays a decisive role in the development of viral type B cirrhosis.
  • the frequently found HBV mutations include the precore / core promoter region (Basal core promoter (BCP)).
  • HBV mutations infected with chronic HBV carriers appear before cirrhosis occurs, and their combinations are very diverse and complex. Thus, the accumulation of variant HBVs containing these specific mutation combination patterns and the ongoing infection of these variant HBVs are believed to play an important role in the pathological mechanisms leading to liver cirrhosis (LC) in chronic HBV carriers.
  • BCP Basal core promoter
  • T1762 / A1764 mutations are particularly high in HBV genotype C2.
  • the BCP T1762 / A1764 mutation alone lowers the ability to discriminate as a hepatocellular carcinoma risk factor. do.
  • studies on the combination of mutations occurring in the pre-S, core promoter region (BCP 1762/1764 adjacent gene), C gene, and the like and their onset Risk assessment is required.
  • hepatocellular carcinoma is a disease with a poor prognosis
  • prevention and early detection are important, so far, rather than comprehensive analysis and evaluation of the risk of specific mutations and mutation combination patterns of infected HBV on the development of hepatocellular carcinoma.
  • the doctors stayed at the level that empirically judges the possibility of the disease.
  • clinical values for HBeAg and HBV DNA titers which represent the activity and proliferative activity of chronic hepatitis B disease, and AST / ALT values representing hepatic cell damage, are used.
  • Ultrasound and alpha-fetoprotein (alpha-fetoprotein, AFP) are mainly used to diagnose hepatocellular carcinoma.
  • the ultrasound is easy to use, but the sensitivity of the diagnosis for small hepatocellular carcinoma (less than 2cm) is about 30 to 70%, there is a problem that the accuracy of the diagnosis depends on the skill of the examiner.
  • the AFP test is the most widely used test or about 35% of small hepatocellular carcinoma and the AFP level is normal, and nonspecific cases such as exacerbation of hepatitis (liver cirrhosis) or active regeneration of hepatocytes (acute hepatitis recovery period) in addition to hepatocellular carcinoma Elevated AFP levels also appear, so it is difficult to diagnose hepatocellular carcinoma with serum AFP alone.
  • the existing methods such as ultrasound, CT or MRI and other imaging methods, and clinical methods using clinical empirical judgments are difficult to exclude subjective judgments of examiners and clinicians.
  • early diagnosis is limited because it can be diagnosed after the development of HCC.
  • the present invention has been made in view of the above-mentioned problems, and the X gene and precore / core of hepatitis B virus (HBV) between the group of patients with chronic hepatitis B disease and preliminary markers for predicting hepatocellular carcinoma of the hepatocellular carcinoma (precore / core) genes were identified, and the combination of markers for predicting hepatocellular carcinoma showing mutations showing statistically significant differences were selected.
  • HBV hepatitis B virus
  • the present invention as described above, the result calculated using the markers for predicting hepatocellular carcinoma on the X gene and precore / core gene of hepatitis B virus (HBV), and selectively predicts hepatocellular carcinoma Weighted hepatocellular carcinoma calculated according to whether or not the clinical data for weighting the hepatocellular carcinoma is weighted and the weighted hepatocellular carcinoma prediction clinical data does not meet a predetermined cutoff value through mathematical processing
  • the purpose of the present invention is to provide a method for analyzing and predicting the risk of developing hepatocellular carcinoma using the results calculated from the predictive clinical data values themselves.
  • the present invention aims to provide information necessary for optimal treatment for each patient by presenting the risk of developing hepatocellular carcinoma in a population of hepatitis carriers or liver disease patients using the methods of analyzing and predicting the risk of developing hepatocellular carcinoma described above. It is done.
  • the inventors have a very close relationship between the risk of developing cirrhosis and the risk of developing hepatocellular carcinoma, and the accurate measurement of biomarker of the risk or risk progression of these factors is clinically necessary for the treatment and management of chronic type B carriers.
  • cirrhosis among HBV genotype C2 accumulated among HBV genotype C2 because most Korean patients with chronic hepatitis B disease are infected with HBV genotype C2 (Ce).
  • HBV genotype C2 C2
  • Mathematical treatment negatively weights risk of developing HCC
  • the objective came to devise a way to mathematically calculate the risk of liver cancer.
  • Multivariate logistic regression analysis refers to mutations and clinical data of markers for predicting hepatocellular carcinoma in the dependent / non-occurrence of dependent variables and the HBV gene region of independent variables.
  • a statistical analysis method that analyzes relationships and establishes formulas for predicting dependent variables through independent variables, including SAS System version 9.1 (SAS Institute, Cary, NC, USA) and free software.
  • R-program R Development Core Team (2010) .R: A language and environment for statistical computing.R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http: // www. R-project.org.).
  • the present invention used a "stepwise regression analysis" method for multivariate logistic regression analysis, and a stepwise regression analysis means a method of finding the most suitable combination of variables among various independent variables.
  • the independent variables are selected in the order in which the coefficient of determination (R 2 ), which means the explanatory power of the independent variables, increases in order of increasing, so that the increase in the coefficient of determination (R 2 ) is not significant.
  • R 2 coefficient of determination
  • mutation of the marker for predicting hepatocellular carcinoma in the HBV gene region used in the specification of the present invention encompasses mutations in the X gene and the precore / core gene on the HBV gene, among others, G1613A. , C1653T, T1753V, A1762T, G1764A, A1846T, G1896A or G1899A markers.
  • the base sequence position is expressed based on the whole genome 3215 bp (NCBI Reference Sequence: NC_003977.1) of HBV of wild type genotype C.
  • each type of mutation that has a genotype different from that of the wild type is called a mutation, and when the mutation is expressed, it is expressed in the order of the wild type, the gene position, and the variant type. That is, in the case of the hepatocellular cancer prediction marker G1613A, the gene position is 1613 bp of the entire genome 3215-bp of genotype C HBV, and the wild type is G and the variant is A.
  • the wild type used in the specification of the present invention refers to the most common case of the genotype in the marker for predicting hepatocellular carcinoma in the HBV gene region. will be.
  • the clinical data for predicting hepatocellular carcinoma used in the specification of the present invention means a significant test findings, HBV virus level, etc. according to cirrhosis for each patient, for example, patients with chronic hepatitis B disease and chronic B Platelet count (cutoff value; ⁇ 145,000 / mm 3 ), INR (blood coagulation value) (cutoff value;> 1) selected through comparison of various clinical data values between patients with hepatocellular carcinoma in HCC. , AST / ALT (cutoff value;> 1.0), HBV DNA log value concentration [unit; cpm (copy per ml), cutoff value; And ⁇ 6]. If cutoff values are applied to these clinical data, the risk of developing hepatocellular carcinoma is reflected only if the clinical data satisfy the cutoff values.
  • liver disease was determined by combining clinical, biochemical and radiological findings.
  • Chronic hepatitis is defined as a HBV DNA log concentration of at least 10 5 cpm (copy / ml) and hepatitis levels (AST, ALT) of at least 60 IU / L among patients who are clinically HBsAg positive for at least 6 months.
  • Hepatocellular carcinoma was diagnosed in patients with hepatocellular carcinoma who showed characteristic findings on liver imaging by Liver Spiral CT.
  • HCC risk prediction (HRP) method used in the specification of the present invention for chronic hepatitis B patients is referred to as a formula derived through, for example, multivariate logistic regression analysis.
  • Markers for predicting hepatocellular carcinoma on the X and precore / core genes of hepatitis B virus (HBV) between patients with chronic hepatitis B disease and those with advanced hepatocellular carcinoma from chronic hepatitis B disease To identify mutational differences in the population, select combinations of genetic markers with statistically significant mutations, and then assign weighted and weighted risk factors for the development of hepatocellular carcinoma through mathematical treatment on the selected genetic markers.
  • HBV hepatitis B virus
  • Analyze and predict the risk of developing HCC using outcomes calculated by the presence of mutations in genetic markers Means firstly, and secondly selectively cuts the weighted clinical data for predicting hepatocellular carcinoma cancer by weighting the risk of developing hepatocellular carcinoma through mathematical treatment of the clinical data for predicting hepatocellular carcinoma.
  • step (b) selecting markers for predicting hepatocellular carcinoma showing mutations showing a statistically significant difference among the candidate hepatocyte cancer prediction markers identified in step (a);
  • step (c) assigning each of the selected hepatocellular carcinoma predictive markers a weight obtained through a mathematical process for the combination of the hepatocellular carcinoma predictive markers selected in step (b);
  • a method for analyzing and predicting the risk of developing hepatocellular carcinoma of a patient with chronic hepatitis B disease showed mutations of 3% or less in the hepatocellular carcinoma group among the candidate hepatocellular carcinoma markers. There was no mutation in the patient group and mutation in both groups, and the similar frequency was more than doubled in the hepatocellular carcinoma group than in patients with chronic hepatitis B disease, except for markers for predicting hepatocellular carcinoma. Based on the case, it is judged that the incidence and significant mutation of hepatocellular carcinoma and a candidate marker for predicting the hepatocellular carcinoma corresponding thereto is selected as the marker for the prediction of hepatocellular carcinoma.
  • the results of the chi-square test and Bayesian statistical analysis satisfy the conditions of OR> 2 and p ⁇ 0.05, respectively, based on the confidence interval (95% CI) and P value (P value) of OR (Odds ratio). It is good to select a marker for predicting hepatocellular carcinoma.
  • the selected markers for predicting hepatocellular carcinoma are included in the X gene and the precore / core gene on the HBV gene.
  • Markers for predicting hepatocellular carcinoma showing significant mutations in include G1613A, C1653T, T1753V, A1762T, G1764A, A1846T, G1896A and G1899A markers.
  • the markers for predicting hepatocellular carcinoma are expressed in the order of wild-type base, gene position, and mutant base, and the base position where mutation occurs is based on the whole genome 3215bp of NCB HBV of wild-type genotype C (NCBI Reference Sequence: NC_003977.1). It is displayed.
  • the combination of the markers for predicting hepatocellular carcinoma is G1613A, C1653T, T1753V, A1762T, G1764A, A1846T, G1896A, and G1899A markers. It may be a combination of at least three markers selected from the group consisting of.
  • the combination of markers for predicting hepatocellular carcinoma may be a combination of A1762T, T1753V, G1613A and C1653T markers, a combination of G1764A, T1753V, G1613A and C1653T markers, or a combination of G1764A, T1753V, C1653T and G1899A markers.
  • the risk of developing hepatocellular carcinoma is determined according to the calculation result according to Equation 1 below.
  • V is V1, V2 or V3;
  • V1 -3.5058 + 2.4961 ⁇ A1762T + 1.676 ⁇ T1753V + 0.9117 ⁇ G1613A + 0.9214 ⁇ C1653T;
  • V2 -3.6216 + 2.5405 ⁇ G1764A + 1.5751 ⁇ T1753V + 0.8847 ⁇ G1613A + 0.9529 ⁇ C1653T;
  • V3 ⁇ 3.5562 + 2.4317 ⁇ G1764A + 1.5895 ⁇ T1753V + 1.2222 ⁇ C1653T + 1.0057 ⁇ G1899A;
  • the marker for predicting hepatocellular carcinoma is a variant, the value of "1" is assigned to the independent variable of the marker for predicting hepatocellular carcinoma, multiplied by the weight, and the marker for predicting hepatocellular cancer is wild type. In the case of inserting a value of "0" into an independent variable of the marker for predicting the hepatocellular carcinoma.
  • another embodiment of the present invention also includes correction by clinical data values in the formula for predicting the risk of developing HCC by the combination and weighting of the HCC markers.
  • step (b) selecting markers for predicting hepatocellular carcinoma showing mutations showing a statistically significant difference among the candidate hepatocyte cancer prediction markers identified in step (a);
  • step (c) assigning each of the selected hepatocellular carcinoma predictive markers a weight obtained through a mathematical process for the combination of the hepatocellular carcinoma predictive markers selected in step (b);
  • step (e) assigning each of the selected hepatocellular carcinoma predictive clinical data weights obtained through mathematical processing to the combination of the hepatocellular carcinoma predictive clinical data selected in step (d);
  • step (h) a second result value calculated according to whether the weighted hepatocellular carcinoma prediction clinical data in step (e) does not satisfy a predetermined cutoff value or the number of weighted hepatocellular carcinoma prediction clinical data Obtaining a second result value calculated from the fields themselves;
  • the selected clinical data for predicting hepatocellular carcinoma include platelet count, INR (blood coagulation level), and albumin. Values, AST / ALT, HBV DNA log value concentration [unit; cpm (copy per ml)] and AFP levels.
  • the cutoff value is applied to the selected hepatocellular carcinoma predictive clinical data, only when the clinical data value satisfies the cutoff value, the risk of developing hepatocellular carcinoma is reflected, and the cutoff value of platelet count is ⁇ 145,000.
  • the cutoff value of / mm 3 , INR (blood coagulation value) is> 1
  • the cutoff value of AST / ALT is> 1.0
  • the cutoff value of HBV DNA log value concentration (cpm) may be ⁇ 6.
  • a method for analyzing and predicting the risk of developing hepatocellular carcinoma of a patient with chronic hepatitis B disease the combination of the clinical data for predicting hepatocellular carcinoma is platelet count, INR (blood coagulation level), albumin. Values, AST / ALT, HBV DNA log value concentration [unit; cpm (copy per ml)] and AFP levels.
  • the combination of clinical data for predicting hepatocellular carcinoma may be a combination of HBV DNA log value concentration, platelet count, INR (blood coagulation) and AST / ALT clinical data, platelet count, albumin level and AST / ALT clinical data. Or a combination of platelet count, albumin levels, AST / ALT and AFP numerical clinical data.
  • a method for analyzing and predicting the risk of developing hepatocellular carcinoma of a patient with chronic hepatitis B disease in step (i), is characterized in that the risk of developing hepatocellular carcinoma is determined according to the calculation result according to Equation 2 below. Should be:
  • Y is Y1, Y2, Y3, Y4, Y5, Y6, Y7, Y8 or Y9;
  • V1 -3.5058 + 2.4961 ⁇ A1762T + 1.676 ⁇ T1753V + 0.9117 ⁇ G1613A + 0.9214 ⁇ C1653T;
  • V2 -3.6216 + 2.5405 ⁇ G1764A + 1.5751 ⁇ T1753V + 0.8847 ⁇ G1613A + 0.9529 ⁇ C1653T;
  • V3 ⁇ 3.5562 + 2.4317 ⁇ G1764A + 1.5895 ⁇ T1753V + 1.2222 ⁇ C1653T + 1.0057 ⁇ G1899A;
  • L1 ⁇ 5.4174 + 1.7473 ⁇ HBV DNA log value concentration (cpm) + 2.597 ⁇ platelet count + 3.4715 ⁇ INR (blood coagulation level) + 2.9311 ⁇ AST / ALT;
  • the marker for predicting hepatocellular carcinoma is a variant, the value of "1" is assigned to the independent variable of the marker for predicting hepatocellular carcinoma, multiplied by the weight, and the marker for predicting hepatocellular cancer is wild type. In the case of assigning a value of "0" to the independent variable of the marker for predicting the hepatocellular carcinoma,
  • the value of "1" is substituted for the independent variable of the hepatocellular carcinoma prediction clinical data and multiplied by the weight to satisfy the cutoff value. If not, assign a value of "0" to the independent variable of the hepatocellular carcinoma prediction clinical data.
  • the weight is preferably 1 to 10 times based on the lowest weight.
  • the calculated risk result of HCC is 50% or more (prob> 0.5)
  • it is determined that the HCC risk is high and can be determined as a high risk group of HCC.
  • the present invention identifies mutational differences in genetic markers for predicting candidate hepatocellular carcinoma between a group of patients with chronic hepatitis B disease and a group of patients with advanced hepatocellular carcinoma from chronic hepatitis B disease, and shows mutations showing statistically significant differences.
  • the selected hepatocellular carcinoma cancer predictor genetic markers are weighted with risk of developing hepatocellular carcinoma, and according to the presence of mutations of the weighted hepatocellular carcinoma cancer predictor gene markers. Since the calculated result value is used, the early diagnosis of hepatocellular carcinoma can be objectively performed without the subjective judgment of the examiner and the clinician.
  • the risk of developing HCCV is predicted in advance according to the characteristics of the carrier or the patient in the chronic HBV carrier or the liver disease patient, thereby providing information necessary for optimal treatment for each patient and the individual patient's care.
  • guidance and treatment direction can be judged more efficiently.
  • the present invention has been proved to be linked to the progression of the liver disease stage of the patient can be very usefully applied to predict the progression of liver disease symptoms.
  • HBV X and precore gene sequences of a total of 167 HBV infected patients including the patient group were analyzed.
  • Sequences obtained by sequencing analysis for 73 hepatocellular carcinoma patients and 94 chronic hepatitis patients were divided into hepatocellular carcinoma patients and chronic hepatitis patients, and all frequencies of one or more mutations in the same location were displayed. Summarized by.
  • hepatocellular carcinoma Among the candidate hepatocellular carcinoma markers, mutations were less than 3% in the hepatocellular carcinoma patients, but no mutations were observed in the chronic hepatitis patients and in both patients. Hepatocellular carcinoma was considered insignificant and not significant and excluded from the markers for predicting hepatocellular carcinoma. Hepatocellular carcinoma patients were significantly more likely to have a higher incidence of mutations than those of chronic hepatitis patients. The markers for predicting hepatocellular carcinoma were classified.
  • the eight hepatocellular carcinoma predictive markers of Table 1 are defined as hepatocellular carcinoma predictive markers on the HBV gene, and the risk of developing hepatocellular carcinoma is analyzed and predicted using mutations in the hepatocellular carcinoma predictive markers.
  • Example 1 When simply combining eight markers for predicting hepatocyte cancer on the HBV gene selected in Example 1 may be defined by the following formula.
  • V G1613A + C1653T + T1753V + A1762T + G1764A + A1846T + G1896A + H1899A
  • the number of hepatocellular carcinoma prediction markers is 4 or less, it is classified as a low risk group, and if it is 5 or more, it is classified as a high risk group.
  • Sensitivity 47.1%, specificity 88.7%, PPV 75.0% NPV was 69.9%. That is, the simple combination of markers for predicting hepatocellular carcinoma on the HBV gene has a low sensitivity of 47.1%, which is the ratio of actual hepatocellular carcinoma patients, among hepatocellular carcinoma predictive patients.
  • the present invention calculates the risk of developing hepatocellular carcinoma by selecting a significant combination of markers for predicting hepatocellular carcinoma, and assigning a weight to the risk of developing hepatocellular carcinoma through mathematical treatment for the selected hepatocellular carcinoma prediction markers.
  • the method was devised as described below.
  • Example 3 Derivation of hepatocellular carcinoma onset formula through selection of markers for predicting hepatocellular carcinoma and multivariate logistic regression
  • Multivariate logistic regression analysis is used to solve the problem of low predictive power of the equation defined in Example 2, but is required independent variable through "stepwise regression analysis” method to select only statistically significant values. Only the markers for the prediction of hepatocellular carcinoma were selected and analyzed, and through this, three risk analysis and prediction methods were developed.
  • Example 3-1 Analysis and Prediction Method for Risk of Hepatocellular Carcinoma 1 (V1)
  • prediction model V1 weights obtained through mathematical processing (results of stepwise multivariate logistic regression analysis) were selected for the significant independent variables selected, and the following formula for the risk of hepatocellular carcinoma by reflecting the intercept values ( Hereinafter, referred to as "prediction model V1").
  • V1 -3.5058 + 2.4961 ⁇ A1762T + 1.676 ⁇ T1753V + 0.9117 ⁇ G1613A + 0.9214 ⁇ C1653T
  • prediction model V2 weights obtained through mathematical processing (results of stepwise multivariate logistic regression analysis) were selected for the significant independent variables selected, and the following formula for the risk of developing HCC by reflecting the intercept values ( Hereinafter referred to as "prediction model V2").
  • V2 -3.6216 + 2.5405 ⁇ G1764A + 1.5751 ⁇ T1753V + 0.8847 ⁇ G1613A + 0.9529 ⁇ C1653T
  • prediction model V3 weights obtained through mathematical processing (stepwise multivariate logistic regression analysis) were selected for the significant independent variables selected, and the following formula for the risk of developing HCC by reflecting the intercept values ( Hereinafter referred to as "prediction model V3").
  • V3 -3.5562 + 2.4317 ⁇ G1764A + 1.5895 ⁇ T1753V + 1.2222 ⁇ C1653T + 1.0057 ⁇ G1899A
  • the risk analysis and prediction method of the development of hepatocellular carcinoma is the most preferable three predictive models (V1, V2, V3) described above, but the present invention is not limited to these three predictive models and 8 Multivariate logistic regression for markers for predicting hepatocellular carcinoma can be included in all formulas for weighting.
  • the value of the weight (estimate) is preferably 1 to 10 times based on the lowest numerical value, and it is most preferable to use the values shown in Tables 2 to 4 above.
  • the present invention may change numerical values according to the ratio of the weights, and thus, the present invention is not necessarily limited to the values shown in Tables 2 to 4.
  • the representative clinical data with numerical variation can be selectively reflected in the method for analyzing and predicting the risk of developing hepatocellular carcinoma.
  • Example 5 Derivation of hepatocellular carcinogenesis prediction formula through multivariate logistic regression analysis for hepatocellular carcinoma-related predictive genetic markers and clinical data for hepatocellular carcinoma prediction
  • multivariate logistic regression analysis was used, except for the risk of disease outcome calculated using markers for predicting hepatocellular carcinoma on the hepatitis B virus gene and clinical data for predicting hepatocellular cancer.
  • Variable logistic regression analysis to weight the hepatocellular carcinoma risk and determine whether the weighted hepatocellular carcinoma predictive clinical data does not meet a predetermined cutoff value or weighted hepatocellular carcinoma.
  • the risk of developing hepatocellular carcinoma was predicted and analyzed using the risk of risk outcomes calculated from the predictive clinical data values themselves.
  • multivariate logistic regression analysis was also performed on the two calculated risk factors to establish three types of hepatocellular carcinoma risk analysis and prediction methods.
  • Value concentrations (cpm) are selected, and the weighted values obtained through mathematical processing (stepwise multivariate logistic regression analysis) are assigned to the significant independent variables thus selected, and the interstitial values are reflected as follows.
  • Hepatic cell cancer prediction markers were obtained (V1) and also clinical data values (L1).
  • V1 -3.5058 + 2.4961 ⁇ A1762T + 1.676 ⁇ T1753V + 0.9117 ⁇ G1613A + 0.9214 ⁇ C1653T
  • the formula of L1 weights the risk of hepatocellular carcinoma incidence through the mathematical processing (stepwise multivariate logistic regression analysis) on the clinical data for the prediction of hepatocellular carcinoma, If the values satisfy the cutoff value determined in Example 4, a value of "1" is assigned to the independent variable, and if the cutoff value is not satisfied, a value of "0" is assigned to calculate an onset risk. .
  • the formula of the L1 is a formula that is applied before or do not administer the antiviral agent, in the case of chronic hepatitis B patients are often administered an antiviral agent, in this case the formula of the L1 should be modified. do.
  • the formula of the L1 should be modified. do.
  • hepatocellular carcinoma through mathematical treatment (stepwise multivariate logistic regression analysis) on independent variables of platelet count, albumin level, and AST / ALT except HBV DNA log value concentration
  • Onset risk weighted and formula L2 modified as follows.
  • Each clinical data independent variable of the L2 formula is a formula for predicting and analyzing the risk of developing hepatocellular carcinoma by substituting the test result as an independent variable regardless of whether the clinical data value satisfies the cutoff value.
  • AFP levels are a marker of hepatocellular carcinoma, which plays a diagnostic role when AFP levels are very high, but hepatitis levels are close to normal (40 IU / L), but CT scans do not indicate hepatocellular carcinoma and chronic B
  • mild and moderately elevated AFP levels typically less than 400 ng / mL
  • the risk factors for the development of hepatocellular carcinoma are weighted by mathematical treatment (stepwise multivariate logistic regression analysis) on the independent variables of platelet count, albumin level, AST / ALT, and AFP. L3 was obtained.
  • Each clinical data independent variable of the L3 formula is a formula for predicting and analyzing the risk of developing hepatocellular carcinoma by substituting the test result as an independent variable regardless of whether the clinical data value satisfies the cutoff value.
  • the values of the sensitivity and specificity of the risk of developing HCC, positive predictive value (PPV) and NPV Negative predictive value, efficiency index, relative risk (RR) and odds ratio (OR) can be obtained.
  • prediction model Y1 the final formula (hereinafter referred to as "prediction model Y1") was obtained as follows.
  • the Y1 formula has a high sensitivity and specificity of 85% or more indicating the ability to predict the occurrence of HCC, and the present invention is very objective in predicting the onset of HCC from chronic hepatitis carriers or patients. You can see that this is a valid method.
  • prediction model Y2 the final formula (hereinafter referred to as "prediction model Y2”) was obtained as follows.
  • the Y2 formula is preferably used at the time of administration of an antiviral agent because the ability to predict the occurrence of hepatocellular carcinoma is lower than the combination of V1 and L1.
  • prediction model Y3 the final formula (hereinafter referred to as "prediction model Y3") was obtained as follows.
  • the Y3 formula when the probability of developing HCC is greater than 50% (risk cancer risk> 0.5), the frequency of the high risk group is compared and the sensitivity is 67.1%. , Specificity 88.7%, PPV 81.0% and NPV 78.9%. Therefore, the Y3 formula is preferably used only when the AFP level shows an abnormality because the ability to predict the occurrence of hepatocellular carcinoma is lower than the combination of V1 and L1.
  • V2 hepatocellular carcinoma markers
  • L1 clinical data values
  • V2 -3.6216 + 2.5405 ⁇ G1764A + 1.5751 ⁇ T1753V + 0.8847 ⁇ G1613A + 0.9529 ⁇ C1653T
  • the formula of L1 weights the risk of hepatocellular carcinoma incidence through the mathematical processing (stepwise multivariate logistic regression analysis) on the clinical data for the prediction of hepatocellular carcinoma, If the values satisfy the cutoff value determined in Example 4, a value of "1" is assigned to the independent variable, and if the cutoff value is not satisfied, a value of "0" is assigned to calculate an onset risk. .
  • the formula of the L1 is a formula that is applied before or do not administer the antiviral agent, in the case of chronic hepatitis B patients are often administered an antiviral agent, in this case the formula of the L1 should be modified. do.
  • the formula of the L1 should be modified. do.
  • hepatocellular carcinoma through mathematical treatment (stepwise multivariate logistic regression analysis) on independent variables of platelet count, albumin level, and AST / ALT except HBV DNA log value concentration
  • Onset risk weighted and formula L2 modified as follows.
  • Each clinical data independent variable of the L2 formula is a formula for predicting and analyzing the risk of developing hepatocellular carcinoma by substituting the test result as an independent variable regardless of whether the clinical data value satisfies the cutoff value.
  • AFP levels are a marker of hepatocellular carcinoma, which plays a diagnostic role when AFP levels are very high, but hepatitis levels are close to normal (40 IU / L), but CT scans do not indicate hepatocellular carcinoma and chronic B
  • mild and moderately elevated AFP levels typically less than 400 ng / mL
  • the risk factors for the development of hepatocellular carcinoma are weighted by mathematical treatment (stepwise multivariate logistic regression analysis) on the independent variables of platelet count, albumin level, AST / ALT, and AFP. L3 was obtained.
  • Each clinical data independent variable of the L3 formula is a formula for predicting and analyzing the risk of developing hepatocellular carcinoma by substituting the test result as an independent variable regardless of whether the clinical data value satisfies the cutoff value.
  • V2 The two formulas (V2), which include two factors (independent variables of markers for predicting hepatocellular carcinoma on the HBV gene and independent variables of clinical data), are obtained from a formula that is optimal for analyzing and predicting the risk of developing hepatocellular carcinoma.
  • L1; V2, L2; or V2, L3 was also subjected to multivariate logistic regression to obtain analysis results as shown in Tables 16 to 18 below.
  • prediction model Y4 the final formula (hereinafter referred to as "prediction model Y4") was obtained as follows.
  • the Y4 formula has a high sensitivity and specificity of 85% or more indicating the ability to predict the occurrence of HCC, and the present invention is very objective in predicting the onset of HCC from chronic hepatitis carriers or patients. You can see that this is a valid method.
  • prediction model Y5 the final formula (hereinafter referred to as "prediction model Y5") was obtained as follows.
  • the Y5 formula is preferably used only at the time of antiviral administration because the ability to predict the occurrence of hepatocellular carcinoma is lower than the combination of V2 and L1.
  • prediction model Y6 the final formula (hereinafter referred to as "prediction model Y6") was obtained as follows.
  • the Y6 formula when the risk of developing HCC is greater than 50% (risk cancer risk> 0.5), the high-risk group's incidence is compared. Sensitivity is 68.6%. , Specificity 88.7%, PPV 81.4% and NPV 79.6%. Therefore, the Y6 formula is preferably used only when the AFP level shows an abnormality because the ability to predict the occurrence of hepatocellular carcinoma is lower than the combination of V2 and L1.
  • V3 -3.5562 + 2.4317 ⁇ G1764A + 1.5895 ⁇ T1753V + 1.2222 ⁇ C1653T + 1.0057 ⁇ G1899A
  • the formula of L1 weights the risk of hepatocellular carcinoma incidence through the mathematical processing (stepwise multivariate logistic regression analysis) on the clinical data for the prediction of hepatocellular carcinoma, If the values satisfy the cutoff value determined in Example 4, a value of "1" is assigned to the independent variable, and if the cutoff value is not satisfied, a value of "0" is assigned to calculate an onset risk. .
  • the formula of the L1 is a formula that is applied before or do not administer the antiviral agent, in the case of chronic hepatitis B patients are often administered an antiviral agent, in this case the formula of the L1 should be modified. do.
  • the formula of the L1 should be modified. do.
  • hepatocellular carcinoma through mathematical treatment (stepwise multivariate logistic regression analysis) on independent variables of platelet count, albumin level, and AST / ALT except HBV DNA log value concentration
  • Onset risk weighted and formula L2 modified as follows.
  • Each clinical data independent variable of the L2 formula is a formula for predicting and analyzing the risk of developing hepatocellular carcinoma by substituting the test result as an independent variable regardless of whether the clinical data value satisfies the cutoff value.
  • AFP levels are a marker of hepatocellular carcinoma, which plays a diagnostic role when AFP levels are very high, but hepatitis levels are close to normal (40 IU / L), but CT scans do not indicate hepatocellular carcinoma and chronic B
  • mild and moderately elevated AFP levels typically less than 400 ng / mL
  • the risk factors for the development of hepatocellular carcinoma are weighted by mathematical treatment (stepwise multivariate logistic regression analysis) on the independent variables of platelet count, albumin level, AST / ALT, and AFP. L3 was obtained.
  • Each clinical data independent variable of the L3 formula is a formula for predicting and analyzing the risk of developing hepatocellular carcinoma by substituting the test result as an independent variable regardless of whether the clinical data value satisfies the cutoff value.
  • V3 which include two factors (independent variables of markers for predicting hepatocellular carcinoma on the HBV gene and independent variables of clinical data), are obtained from a formula for optimal analysis and prediction of the risk of developing hepatocellular carcinoma.
  • L1; V3, L2; or V3, L3 was also subjected to multivariate logistic regression analysis to obtain an analysis result as shown in Tables 23 to 25.
  • prediction model Y7 the final formula (hereinafter referred to as "prediction model Y7") was obtained as follows.
  • the probability of developing HCC is greater than 50% (risk cancer risk> 0.5)
  • the frequency of high risk group is compared.
  • Sensitivity is 88.6%.
  • prediction model Y8 a final formula (hereinafter referred to as "prediction model Y8") was obtained as follows.
  • the Y8 formula is preferably used only at the time of antiviral administration because the ability to predict the occurrence of hepatocellular carcinoma is lower than the combination of V3 and L1.
  • prediction model Y9 the final formula (hereinafter referred to as "prediction model Y9") was obtained as follows.
  • the Y9 formula is preferably used only when the AFP level shows an abnormality because the predictive ability of hepatocellular carcinoma is lower than the combination of V3 and L1.
  • the method for analyzing and predicting the risk of developing HCC is most preferable as described above with three methods of V1 + L1 combination, V2 + L1 combination, and V3 + L1 combination and L2 and L3.
  • the present invention is not limited to these prediction models, and may include all formulas for applying weights through multivariate logistic regression on eight hepatocellular carcinoma predictive markers and the aforementioned clinical data.
  • the value of the weight is preferably 1 to 10 times based on the lowest numerical value, and most preferably, the values shown in Tables 5 to 25 are used.
  • the present invention may change numerical values according to the ratio of the weights, and thus, the present invention is not necessarily limited to the values shown in Tables 5 to 25.
  • the present invention also includes correction by clinical data values in the formula for predicting the risk of developing HCC by the combination and weighting of the HCC markers.
  • HBsAg hepatitis B surface antigen
  • DNA of HBV was isolated from the blood of each of the selected patients using a QIAamp DNA Blood Mini Kit 250 (Qiagen 51106). Using this, the region (603-bp, 469-bp) containing all of the X gene region including the enhancer II / BCP region was amplified by two PCRs and the region containing all of the precore gene region (810- bp) was amplified by PCR, and then sequenced, respectively. The base sequence position was set to the whole genome 3215-bp (NCBI Reference Sequence: NC — 003977.1) of HBV of wild-type genotype C.
  • Primer pairs for primary PCR of the X gene region include a forward primer HBx-F1 primer (SEQ ID NO: 1) (5'-TGT TTT GCT CGC AGC TGG TCT G-3 '; sense nucleotides, bases 1291 to 1312 Base) and HBx-R1 primer (SEQ ID NO: 2) as the reverse primer (5'-AGC CAC CCA AGG CAC AGC TTG G-3 '; antisense nucleotides, corresponding to bases 1892 through 1893)
  • the primer pair for the secondary PCR of the X gene region was a forward primer, HBx-F2 primer (SEQ ID NO: 3) (5'-CAT GGC TGC TAG GCT GTG CTG-3 '; sense nucleotide, 1373 to 1393 to 1393 HBx-R2 primer (SEQ ID NO: 4) (5'-GAG ATG ATT AGG CAG AGG TGA AAA AG-3 '; antisense nucleotide, corresponding to bases 1820
  • Primer pairs for PCR of the precore gene region are forward primers as preC-F1 primer (SEQ ID NO: 5) (5'-GTG CAC TTC GCT TCA CCT CTG CAC-3 '; sense nucleotides, starting at base 1579) Corresponding to base 1602) and preC-R1 primer (SEQ ID NO: 6) as reverse primer (5'-AGG CGA GGG AGT TCT TCT TCT AGG -3 '; antisense nucleotide, corresponding to bases 2366 through 2389) was used.
  • the initial denature was performed at 94 ° C. for 5 minutes, and the reaction conditions of “30 seconds at 95 ° C., 30 seconds at 55 ° C. and 30 seconds at 72 ° C.” were repeatedly performed at 40 cycles. Final extension was performed at 72 ° C. for 5 minutes.
  • the secondary PCR condition of the X gene region the initial denature was performed at 94 ° C. for 5 minutes, and the reaction condition of “30 seconds at 95 ° C., 30 seconds at 55 ° C., 30 seconds at 72 ° C.” was carried out at 35 cycles ( cycle), and the final extension was performed at 72 ° C for 5 minutes.
  • the amplified PCR product was recovered using an Intron PCR clean-up kit, and a pair of primers for sequencing the PCR product of the X gene region as a forward primer was used as a HBx-S1 primer.
  • SEQ ID NO: 7 (5'-CGG CGC TGA ATC CCG CGG AC-3 '; sense nucleotide, corresponding to bases 1436 to 1455) and HBx-S2 primer (SEQ ID NO: 8) (5') as a reverse primer -TGA ACA TAC CAA TTT ATG CC-3 '; antisense nucleotides, corresponding to bases 1786 to 1805, were used, and the PCR product of the precore gene region was preC-F1 primer (SEQ ID NO: 5) and preC The nucleotide sequence was analyzed on both sides using -R1 primer (SEQ ID NO: 6).
  • Mutations were determined by analyzing the nucleotide sequences of the X gene and precore gene region of each sample. Sequencing was performed with an Applied Biosystems model 3100 DNA genetic analyzer, an automatic base sequencer, and the reaction was performed using a BigDye Terminator Cycle Sequencing Kit. It was. As the template DNA, 30 ng of the recovered PCR product was used, and the primer was a mixture of 3 pmol of primer in one direction in the bidirectional primer for the X gene or the precore gene, and the BigDye Terminator v3.1 RR. -100 mix) was added to 0.5 ⁇ l and sterile distilled water was added so that the final volume was 10 ⁇ l.
  • reaction conditions were repeated 25 cycles as “10 seconds at 96 ° C., 5 seconds at 50 ° C., 2 minutes at 60 ° C.”.
  • the risk of developing hepatocellular carcinoma for each patient is assigned by assigning a value of "1" or "0" to the expression of the predictive model V1, V2, or V3 according to the presence or absence of mutation for each patient of the hepatocellular carcinoma prediction markers on the HBV gene. Can be predicted.
  • the risk of developing HCC is estimated as 83%, 81%, and 84% of the risk of developing HCC as calculated by the predictive model V1, V2, or V3, respectively. It can be confirmed that the patient is very high, and therefore, special care is needed for future outbreaks.
  • the risk of developing HCC is estimated to be 50%, 91%, and 84%, respectively, by the prediction model V1, V2, or V3. Although it is a medium value, it seems that it is necessary to be careful to manage it as a high risk group by receiving high values from the predictive models V2 and V3. On the other hand, in case of patients 3 and 4, the probability of developing HCC is less than 50% in all of predictive models V1, V2, and V3, so that it can be determined that the risk of developing as a low risk group is low.
  • a value of "1" or "0" is assigned to the predictive models Y1, Y4, Alternatively, by substituting the formula of Y7, it is possible to predict the risk of developing HCC for each patient.
  • the risk of developing HCC is 92%, 94%, and 95%, as calculated by the predictive model Y1, Y4, or Y7, respectively. It can be confirmed that the patient is very high, and therefore, special care is needed for future outbreaks.
  • the risk of developing HCC is 29%, 86%, and 74%, respectively, as calculated by the predictive model Y1, Y4, or Y7. Although it is a low value of, it is considered that it is necessary to be careful to manage it as a high risk group by receiving high values in the prediction models Y4 and Y7. On the other hand, in case of patients 3 and 4, the probability of developing HCC is less than 50% in all of the predictive models Y1, Y4, and Y7, so that it can be determined that the risk of developing as a low risk group is low.

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • Computational Mathematics (AREA)
  • Public Health (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Epidemiology (AREA)
  • Algebra (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)

Abstract

본 발명은 만성 B형 간질환 환자군과 만성 B형 간질환으로부터 간세포암으로 진행된 환자군 사이에서 B형 간염 바이러스(HBV)의 X 유전자 및 프리코어/코어(precore/core) 유전자 상의 후보 간세포암 예측용 마커들에서의 돌연변이 차이를 확인하고, 통계학적으로 유의적인 차이를 보이는 돌연변이가 나타나는 간세포암 예측용 마커들의 조합을 선정한 후 선정된 간세포암 예측용 마커들에 대해 수학적 처리를 통해 간세포암 발병 위험도 가중치를 부여하며 가중치가 부여된 간세포암 예측용 마커들의 돌연변이들의 유무에 따라 산출된 결과값을 이용하여 간세포암 발병 위험도를 분석 및 예측하는 방법을 제공한다. 본 발명에 따르면 만성 HBV 보균자 내지 간질환 환자를 대상으로 보균자 내지 환자의 특성에 따라서 개별적으로 간세포암 발병 위험도를 사전에 예측함으로써 각 환자 별 최적치료에 필요한 정보를 제공하고 환자 개개인의 진료지침과 치료방향을 보다 효율적으로 판단할 수 있다.

Description

만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법
본 발명은 만성 B형 간질환 환자의 간세포암 (hepato celullar carcinoma, HCC) 발병 위험도를 분석 및 예측하는 방법에 관한 것으로서, 보다 상세하게는 만성 B형 간질환 환자군과 만성 B형 간질환으로부터 간세포암으로 진행된 환자군 사이에서 다양한 HBV (Hepatitis B virus) 유전자 마커들에서의 돌연변이 차이를 확인하고, 통계학적으로 유의적인 차이를 보이는 돌연변이가 나타나는 유전자 마커들의 조합을 선정한 후 선정된 유전자 마커들에 대해 수학적 처리를 통해 간세포암 발병 위험도 가중치를 부여하며 가중치가 부여된 유전자 마커들의 돌연변이들의 유무에 따라 산출된 결과값을 이용하여 간세포암 발병 위험도를 분석 및 예측하는 방법에 관한 것이다.
구체적으로, 본 발명은 만성 B형 간질환 환자군과 만성 B형 간질환으로부터 간세포암으로 진행된 환자군 사이에서 B형 간염 바이러스(HBV)의 X 유전자 및 프리코어/코어(precore/core) 유전자 상의 후보 간세포암 예측용 마커들에서의 돌연변이 차이를 확인하고, 통계학적으로 유의적인 차이를 보이는 돌연변이가 나타나는 간세포암 예측용 마커들의 조합을 선정한 후 선정된 간세포암 예측용 마커들에 대해 수학적 처리를 통해 간세포암 발병 위험도 가중치를 부여하며 가중치가 부여된 간세포암 예측용 마커들의 돌연변이들의 유무에 따라 산출된 결과값을 이용하여 간세포암 발병 위험도를 분석 및 예측하는 방법에 관한 것이다.
추가로, 본 발명은 전술한 바와 같이 B형 간염 바이러스(HBV)의 X 유전자 및 프리코어/코어(precore/core) 유전자 상의 간세포암 예측용 마커들을 이용하여 산출된 결과값과, 선택적으로 간세포암 예측용 임상 데이터들에 대해 수학적 처리를 통해 간세포암 발병 위험도 가중치를 부여하고 가중치가 부여된 간세포암 예측용 임상 데이터들이 미리 결정된 컷오프 값을 만족하지는 여부에 따라 산출된 결과값 또는 가중치가 부여된 간세포암 예측용 임상 데이터들 수치들 자체로부터 산출된 결과값을 이용하여 간세포암 발병 위험도를 분석 및 예측하는 방법에 관한 것이다.
간암은 간에 발생하는 악성종양을 말하는데, 일반적으로 간암이라 하면 대부분 간세포암을 뜻하고 우리 나라에서는 간세포암이 전체 간암의 90%이상을 차지한다. 따라서, 본 명세서에서는 설명의 편의를 위해 간암을 간세포암이라고 칭하고 설명하고자 한다. 우리나라의 간세포암 발생률은 10만명당 남자 30.5명, 여자 7.6명이 매년 발병이 된다고 추정된다. 특히 40~60세까지의 중장년기에서의 간세포암 발생률은 남자 74.8명, 여자 15.6명으로 세계에서 가장 높은 발병률을 보이고 있으며 2008년 기준 인구 10만 명당 22.9명이 간세포암으로 사망하여 폐암(29.9명) 다음으로 높은 사망률을 보인다(2009 한국의 사회지표 참조). 특히, B형 간염 바이러스(이하, "HBV"라고도 약칭함)는 간세포암의 주된 원인체로서, HBV에 의한 만성 B형 간질환 환자에서 간세포암이 발생될 위험성은 일반인보다 70~200배 높은 것으로 보고되고 있다. 이와 관련하여 전 세계적으로 발생되는 간세포암의 약 50% 이상과 인구 중에서 HBV 감염 비율이 높은 지역(HBV endemic area)에서 발생되는 간세포암의 70-80%는 HBV 감염과 연관되어 있는 것으로 알려져 있다. 미국의 경우에는 전체 간세포암의 약 50%, 그리고 우리나라의 경우에는 전체 간세포암의 약 75~78%가 HBV에 의해 유발된다고 알려져 있다. HBV의 감염은 통상적으로 만성 간염, 간경변, 간세포암으로 이행되는 다양한 임상질환을 일으켜 궁극적으로 사망률을 증가시킨다. 현재 전 세계적으로 약 350 만 명의 만성적인 HBV 보균자들이 간세포암 발생 위험에 노출되어 있다. 보균자가 아닌 대조군에 비해서 이들의 간세포암 발생 위험도 수준은 연구에 따라 조금씩 다르지만 5-49배에서 7-98배 정도로 매우 높게 나타난다. 만성 HBV 보균자(carrier)중 간세포암 유병율은 남자의 경우 400-700명(년간 100,000명 당)이고, 여자의 경우 120-180명(년간 100,000명 당)으로 남자가 여자보다 4배 이상 높다. HBV와 관련된 간세포암의 예후는 매우 나빠서, 일반적으로 중앙생존기간(median survival)이 16개월 미만이고, 진단 후 1년 생존율은 36%-67% 그리고 5년 생존율은 15%-26%로 알려져 있다. 만성 HBV 보균자에서 간세포암 발생 위험도 증가에 기여하는 가장 중요한 인자는 간경변증(Liver cirrhosis, LC)이다. B형 바이러스성 간경변증의 발생에는 돌연변이가 발생한 HBV의 지속적인 감염이 결정적인 역할을 하는데, 빈번하게 발견되는 HBV 돌연변이로는 프리코어/코어(precore/core) 촉진자(promoter) 영역[Basal core promoter (BCP)]의 변이 그리고 HBx 인핸서 II(HBx enhancer II)에 속하는 변이 등이 원인 돌연변이로 알려져 있고, 단독 돌연변이 보다는 복합 돌연변이 패턴이 간경변증 진전에 더 중요하게 연관되어 있으며 돌연변이의 조합 패턴은 HBV 유전자형 B(genotype B)와 유전자형 C(genotype C) 사이에서 서로 다르다고 알려져 있다.
만성 HBV 보균자에 감염된 HBV 돌연변이는 간경변증이 발생되기 전에 선행되어 나타나며, 이들의 조합은 매우 다양하고 복잡하다. 따라서, 이러한 특정 돌연변이 조합패턴을 포함하는 변종 HBV의 누적과 이러한 변이형 HBV의 지속적인 감염은 만성 HBV 보균자에서 간경변증(LC)으로 진행되는 병리학적 기전에 중요한 역할을 할 것으로 여겨지고 있다. 이러한 만성 HBV 보균자에 감염된 HBV 돌연변이 중 BCP(Basal core promoter) T1762/A1764 돌연변이는 특히 HBV 유전자형 C2(genotype C2)에서 빈도가 매우 높다. 그런데, 대부분의 보균자들이 HBV 유전자형 C2(genotype C2)가 감염되어 있는 특수한 상황에 있는 한국인의 경우에는 BCP T1762/A1764 돌연변이 만으로는 간세포암 위험인자로서의 변별능력이 상대적으로 저하되므로, 다른 돌연변이를 추가적으로 찾아야만 한다. 예를 들어, 프리-S(pre-S), 코어 프로모터(core promoter) 영역 (BCP 1762/1764 인접 유전자), C 유전자(C gene) 등에서 복합적으로 발생되는 돌연변이 조합 패턴에 대한 연구와 이들의 발병 위험도 평가가 필요한 것이다.
한편, 간세포암은 예후가 나쁜 질병이기 때문에 예방과 조기발견이 중요함에도 불구하고, 지금까지는 감염된 HBV의 특정 돌연변이와 돌연변이 조합 패턴이 간세포암 발병에 미치는 위험도에 대한 종합적인 분석 및 평가 보다는 임상 데이터 수치들을 활용하여 의사가 발병가능성을 경험적으로 판단하는 수준에 머물고 있었다. 일반적으로, 만성 B형 간질환의 활성도와 증식력을 나타내는 HBeAg과 HBV DNA 역가(titer), 간세포의 손상을 대표하는 AST/ALT 값에 대한 임상적 수치들이 활용되고 있으며, 그 밖에 이들 수치들에 의한 판단 오류를 줄이기 위해 간세포암 진단을 위한 검사로서 초음파검사와 알파태아단백(α-fetoprotein, AFP)의 혈중농도측정이 주로 시행되고 있다. 그러나, 초음파검사는 사용이 간편하나 소간세포암 (2cm 미만)에 대한 진단의 민감도가 약 30~70%로 검사자의 숙련도에 따라 진단의 정확도가 달라지는 문제가 있다. 또한, AFP 검사는 현재 가장 널리 사용되는 검사법이나 소간세포암 중 약 35%에서 AFP 수치는 정상이며, 간세포암 이외에 간염의 악화(간경변증) 또는 간세포의 활발한 재생시기 (급성간염 회복기) 등 비특이적인 경우에도 AFP 수치 상승은 나타나므로 단독 혈청 AFP 검사만으로는 간세포암을 진단하기는 어렵다. 또한, 기존의 초음파 검사법, CT나 MRI 등을 이용한 영상장비들을 이용한 검사법들과 임상 데이터 수치들을 의사의 경험적 판단에 의해 이용한 검사법들은 모두 검사에 있어서 검사자 및 임상의의 주관적 판단을 배제하기 어려운 문제점과, 간세포암 발병 후 진단이 가능하기 때문에 조기진단에 한계가 있다.
이와 관련하여 임상 데이터 수치들을 이용한 검사의 주관적 판단의 문제점을 감안하여 일부 종래기술에서는 환자의 조직병리학적 마커와, 혈액으로부터 얻어지는 혈액 마커들, 예컨대 혈장 및 혈청 마커 데이터인 임상적 수치데이터들에 대해 수학적 처리를 하여 객관적인 간경변으로의 진전을 확진하는 방법을 개시하고 있다(대한민국 공개특허 제10-2007-0026601호 등). 그러나, 이 방법은 근본적으로 간경변으로 질환이 이행된 환자들에 대한 임상적 수치데이터들을 이용하기 때문에 확진에는 유용하나 간세포암 조기 진단 및 위험도 예측은 불가능한 한계가 있었다. 따라서, 우리나라와 같이 바이러스성 간세포암 발병률이 높은 경우에는 간염 바이러스의 특성을 이용하여 간세포암 발생의 근본원인에 대한 고찰이 포함된 조기진단이 가능한 새로운 유전자 검사가 요구되는 실정이다.
본 발명은 상기 문제점을 해결하는데 그 목적이 있는 것으로서, 만성 B형 간질환 환자군과 만성 B형 간질환으로부터 간세포암으로 진행된 환자군 사이에서 B형 간염 바이러스(HBV)의 X 유전자 및 프리코어/코어(precore/core) 유전자 상의 후보 간세포암 예측용 마커들에서의 돌연변이 차이를 확인하고, 통계학적으로 유의적인 차이를 보이는 돌연변이가 나타나는 간세포암 예측용 마커들의 조합을 선정한 후 선정된 간세포암 예측용 마커들에 대해 수학적 처리를 통해 간세포암 발병 위험도 가중치를 부여하며 가중치가 부여된 간세포암 예측용 마커들의 돌연변이들의 유무에 따라 산출된 결과값을 이용하여 간세포암 발병 위험도를 분석 및 예측하는 방법을 제공하는데 그 목적이 있다.
또한, 본 발명은 전술한 바와 같이 B형 간염 바이러스(HBV)의 X 유전자 및 프리코어/코어(precore/core) 유전자 상의 간세포암 예측용 마커들을 이용하여 산출된 결과값과, 선택적으로 간세포암 예측용 임상 데이터들에 대해 수학적 처리를 통해 간세포암 발병 위험도 가중치를 부여하고 가중치가 부여된 간세포암 예측용 임상 데이터들이 미리 결정된 컷오프 값을 만족하지는 여부에 따라 산출된 결과값 또는 가중치가 부여된 간세포암 예측용 임상 데이터들 수치들 자체로부터 산출된 결과값을 이용하여 간세포암 발병 위험도를 분석 및 예측하는 방법을 제공하는데 그 목적이 있다.
궁극적으로, 본 발명은 전술한 간세포암 발병 위험도를 분석 및 예측하는 방법들을 이용하여 간염 보균자 내지는 간질환 환자 집단에서의 간세포암 발병 위험도를 제시하여 각 환자 별 최적치료에 필요한 정보를 제공하는 것을 목적으로 한다.
본 발명자들은 간경변증 진전 위험도와 간세포암 발병 위험도 사이에 매우 밀접한 연관성이 있으며 이들에 대한 위험도 혹은 위험도의 진전단계를 지표(biomarker)화 하여 정확하게 측정하는 것은 임상적으로 만성 B형 보균자들의 진료와 관리에 매우 중요한 도움을 줄 것으로 판단하고 예의 연구를 거듭한 결과, 한국인 만성 B형 간질환 환자는 거의 대부분 HBV 유전자형 C2(genotype C2)(Ce)에 감염되어 있기 때문에 HBV 유전자형 C2에 누적되는 돌연변이들 중에서도 간경변증(LC) 및 간세포암(HCC) 발병 위험도를 유의하게 증가시키는 돌연변이들의 조합을 결정하고 이러한 HBV 바이러스 돌연변이 조합 패턴의 누적적인 변화 및 이것과 연동되는 특정한 임상 데이터들의 조합 패턴을 확인한 후 이들에 대해 각각 수학적 처리에 의해 간세포암 발병 위험도 가중치를 부여하여 객관적으로 간세포암 발병 위험도를 수학적으로 산출하는 방법을 고안하기에 이르렀다.
특히, 본 발명자들은 간경변증(LC) 및 간세포암(HCC) 발병 위험도를 유의하게 증가시키는 돌연변이들로서 조기 진단적 가치가 높은 3가지 유전자 영역에서의 간세포암 예측용 마커들의 돌연변이 (X, BCP 1762/1764 및 주변 유전자, C-유전자 영역)와, 임상 데이터들[예를 들어, HBsAg 역가(titer), HBeAg 역가, HBV DNA 역가, 기타 간경변증 여부를 대변할 수 있는 간 기능 검사 항목들의 수치들] 그리고 이들 임상 데이터들의 채택여부를 반영하는 컷오프 값의 중요성에 주목하여 본 발명을 완성하게 되었다.
우선, 본 발명의 명세서에서 사용되는 용어를 설명하면 다음과 같다.
본 발명의 명세서에서 사용되는 다변수 로지스틱 회귀 분석(multivariate logistic regression analysis)이라 함은 종속변수인 발병/비발병과 독립변수인 HBV 유전자 영역에서의 간세포암 예측용 마커들의 돌연변이 및 임상 데이터들과의 관계를 분석하여, 독립변수를 통한 종속변수의 예측이 가능한 공식을 확립할 수 있도록 하는 통계 분석 방법을 의미하며, 이는 SAS System version 9.1 (SAS Institute, Cary, NC, USA) 및 무료 소프트웨어(free software)인 R-program (R Development Core Team (2010). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org.)을 이용하여 시행한다.
또한, 본 발명에서는 다변수 로지스틱 회귀 분석 시 "단계적 회귀 분석(stepwise regression analysis)" 방식을 사용하였으며, 단계적 회귀 분석이란 다양한 독립변수 중 가장 적합한 변수의 조합을 찾아내는 방식을 의미한다. 구체적으로는, 종속변수에 대한 독립변수의 설명력을 뜻하는 결정계수 (R2)가 가장 많이 증가되는 순서대로 독립변수를 선정하는 것으로 결정계수 (R2)의 증가가 크지 않게 될 때까지 비교하여 가장 적합한 독립변수들을 제시하는 방식을 의미한다.
또한, 본 발명의 명세서에서 사용되는 HBV 유전자 영역에서의 간세포암 예측용 마커의 돌연변이라 함은 HBV 유전자 상의 X 유전자 및 프리코어/코어(precore/core) 유전자 내 돌연변이를 포괄하는 것으로서, 그 중에서도 G1613A, C1653T, T1753V, A1762T, G1764A, A1846T, G1896A 또는 G1899A 마커의 돌연변이를 포함한다. 상기 염기서열 위치는 야생형 유전자형 C형의 HBV의 전체 게놈 3215bp (NCBI Reference Sequence: NC_003977.1)를 기준으로 표시한 것이다. 즉, 야생형의 유전자형과 다른 유전자형을 가지는 변이형 각각을 돌연변이라 하며, 돌연변이를 표현할 때에는 야생형, 유전자 위치, 변이형 순서로 표현한다. 즉, 간세포암 예측용 마커 G1613A의 경우에는 유전자 위치가 유전자형 C형의 HBV의 전체 게놈 3215-bp 중 1613번째 bp이며, 야생형은 G, 변이형은 A라는 의미이다. 또한, 본 발명의 명세서에서 사용되는 야생형이라 함은 HBV 유전자 영역에서의 간세포암 예측용 마커에 있어서 유전자형이 가장 일반적인 경우를 뜻하는 것이며, 반대되는 개념으로 야생형과 유전자형이 다른 경우를 변이형이라고 하는 것이다.
또한, 본 발명의 명세서에서 사용되는 간세포암 예측용 임상 데이터들이라 함은 각 환자 별로 간경변증에 따른 유의한 검사소견 수치, HBV 바이러스 수치 등을 의미하고, 예를 들어 만성 B형 간질환 환자와 만성 B형 간질환에서 간세포암으로 진행된 환자 간의 각종 임상 데이터 수치들의 비교를 통해서 선정된 혈소판수(platelet count) (컷오프 값; <145,000/mm3), INR(혈액응고수치)(컷오프 값; >1), AST/ALT (컷오프 값; >1.0), HBV DNA log 값 농도 [단위; cpm (copy per ml), 컷오프 값; < 6] 등을 들 수 있다. 이들 임상 데이터들에 대해 컷오프 값을 적용할 경우 해당 임상 데이터가 컷오프 값을 만족하는 경우에만 간세포암 발병 위험도 계산에 반영하게 된다.
본 발명에 있어서, 간질환의 정의 및 진단은 임상적, 생화학적, 방사선학적 검사 소견들을 종합하여 판단하였다. 만성 간염(CHB)은 임상적으로 6개월 이상 HBsAg 양성인 환자 중에서 HBV DNA log 값 농도가 105 cpm(copy/ml) 이상이고 간염수치(AST, ALT)가 60 IU/L 이상인 경우로 정의되며, 영상학과 전문의 판독에 의해 영상학적 검사(Liver spiral CT)에서 간세포암에 합당하는 특징적인 소견을 보이는 경우에는 간세포암으로 진단하였으며, 그렇지 않은 경우는 간생검을 통하여 진단하였다.
또한, 본 발명의 명세서에서 사용되는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법 (HCC risk prediction (HRP) method)이라 함은 예를 들어 다변수 로지스틱 회귀 분석을 통해 도출된 수식을 이용하되, 만성 B형 간질환 환자군과 만성 B형 간질환으로부터 간세포암으로 진행된 환자군 사이에서 B형 간염 바이러스(HBV)의 X 유전자 및 프리코어/코어(precore/core) 유전자 상의 간세포암 예측용 마커들에서의 돌연변이 차이를 확인하고, 통계학적으로 유의적인 차이를 보이는 돌연변이가 나타나는 유전자 마커들의 조합을 선정한 후 선정된 유전자 마커들에 대해 수학적 처리를 통해 간세포암 발병 위험도 가중치를 부여하며 가중치가 부여된 유전자 마커들의 돌연변이들의 유무에 따라 산출된 결과값을 이용하여 간세포암 발병 위험도를 분석 및 예측하는 방법을 1차적으로 의미하고, 2차적으로는 선택적으로 간세포암 예측용 임상 데이터들에 대해 수학적 처리를 통해 간세포암 발병 위험도 가중치를 부여하고 가중치가 부여된 간세포암 예측용 임상 데이터들이 미리 결정된 컷오프 값을 만족하지는 여부에 따라 산출된 결과값 또는 가중치가 부여된 간세포암 예측용 임상 데이터들 수치들 자체로부터 산출된 결과값을 상기 가중치가 부여된 유전자 마커들의 돌연변이들의 유무에 따라 산출된 결과값과 조합하여 간세포암 발병 위험도를 분석 및 예측하는 방법을 포함한다.
본 발명의 일실시예의 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법은,
(a) 만성 B형 간질환 환자군과, 만성 B형 간질환으로부터 간세포암으로 진행된 환자군 사이에서 B형 간염 바이러스(HBV)의 유전자 상에서의 후보 간세포암 예측용 마커들의 돌연변이 차이를 확인하는 단계와,
(b) 상기 (a) 단계에서 확인한 후보 간세포암 예측용 마커들 중에서 통계학적으로 유의적인 차이를 보이는 돌연변이가 나타나는 간세포암 예측용 마커들을 선정하는 단계와,
(c) 상기 (b) 단계에서 선정된 간세포암 예측용 마커들의 조합에 대해 수학적 처리를 통해 얻어진 가중치를 상기 선정된 간세포암 예측용 마커들 각각에 부여하는 단계와,
(d) 만성 B형 간질환 환자에서 채취한 시료로부터 B형 간염 바이러스(HBV)의 유전자의 염기서열을 분석하고, 분석된 염기서열에서 상기 선정된 간세포암 예측용 마커들의 돌연변이들의 유무를 판단하는 단계와,
(e) 상기 가중치가 부여된 선정된 간세포암 예측용 마커들의 돌연변이들의 유무에 따라 산출된 결과값에 기초하여 만성 B형 간질환 환자의 간세포암 발병 위험도를 결정하는 단계를 포함한다.
본 발명의 일실시예의 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법에 있어서, 후보 간세포암 예측용 마커들 중에서 간세포암 환자군에서 3% 이하로 돌연변이가 나타났으나 만성 B형 간질환 환자군에서는 돌연변이가 전혀 나타나지 않는 경우와 두 환자군에서 모두 돌연변이가 나타나며 그 빈도가 비슷한 경우는 간세포암 예측용 마커들에서 제외하고, 간세포암 환자군에서 만성 B형 간질환 환자군 보다 돌연변이 빈도가 두 배 이상 증가한 경우를 기준으로 간세포암 발병과 유의성이 있는 돌연변이로 판단하고 이에 해당하는 후보 간세포암 예측용 마커를 간세포암 예측용 마커로 선정한다. 바람직하기로는, 카이제곱검정 및 베이지안 통계분석을 실시한 결과, OR (Odds ratio)의 신뢰구간(95%CI)과 P 밸류(P value)를 기준으로 각각 OR > 2 및 p < 0.05의 조건을 만족하는 것을 간세포암 예측용 마커로 선정하는 것이 좋다.
본 발명의 일실시예의 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법에 있어서, 상기 선정된 간세포암 예측용 마커들은 HBV 유전자 상의 X 유전자 및 프리코어/코어(precore/core) 유전자 내에서 유의적인 돌연변이를 나타내는 간세포암 예측용 마커들로서, G1613A, C1653T, T1753V, A1762T, G1764A, A1846T, G1896A 및 G1899A 마커들을 포함한다. 상기 간세포암 예측용 마커들은 야생형 염기, 유전자 위치 및 변이형 염기 순서로 표시한 것으로서, 돌연변이가 나타나는 염기 위치는 야생형 유전자형 C형의 HBV의 전체 게놈 3215bp (NCBI Reference Sequence: NC_003977.1)를 기준으로 표시한 것이다.
본 발명의 일실시예의 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법에 있어서, 상기 간세포암 예측용 마커들의 조합은 G1613A, C1653T, T1753V, A1762T, G1764A, A1846T, G1896A 및 G1899A 마커들로 구성된 군으로부터 선택된 적어도 3개의 마커들의 조합일 수 있다. 예를 들어, 상기 간세포암 예측용 마커들의 조합은 A1762T, T1753V, G1613A 및 C1653T 마커들의 조합, G1764A, T1753V, G1613A 및 C1653T 마커들의 조합, 또는 G1764A, T1753V, C1653T 및 G1899A 마커들의 조합일 수 있다.
본 발명의 일실시예의 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법에 있어서, 상기 (e) 단계에서는 하기 수학식 1에 따른 계산결과에 따라 간세포암 발병 위험도를 결정하는 것을 특징으로 한다:
수학식 1
prob (간세포암 발병 위험도) = exp(V)/(1+exp(V));
상기 식에서 V는 V1, V2 또는 V3이고;
V1=-3.5058+2.4961×A1762T+1.676×T1753V+0.9117×G1613A+0.9214×C1653T;
V2=-3.6216+2.5405×G1764A+1.5751×T1753V+0.8847×G1613A+0.9529×C1653T;
V3=-3.5562+2.4317×G1764A+1.5895×T1753V+1.2222×C1653T+1.0057×G1899A이며;
상기 V1, V2 및 V3의 공식들에서 간세포암 예측용 마커가 변이형인 경우에는 해당 간세포암 예측용 마커의 독립변수에 "1"의 값을 대입하여 가중치와 곱셈을 하고 간세포암 예측용 마커가 야생형인 경우에는 해당 간세포암 예측용 마커의 독립변수에 "0"의 값을 대입한다.
한편, 간세포암 예측용 마커들의 조합과 가중치 부여에 의한 간세포암 발병 위험도 예측 외에 임상 데이터들의 조합과 가중치 부여에 의한 간세포암 발병 위험도 예측을 추가하는 것이 바람직하다. 따라서, 본 발명의 다른 실시예는 간세포암 예측용 마커들의 조합과 가중치 부여에 의한 간세포암 발병 위험도 예측식에 임상 데이터들 수치들에 의한 보정도 포함한다.
즉, 본 발명의 다른 일실시예의 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법은,
(a) 만성 B형 간질환 환자군과, 만성 B형 간질환으로부터 간세포암으로 진행된 환자군 사이에서 B형 간염 바이러스(HBV)의 유전자 상에서의 후보 간세포암 예측용 마커들의 돌연변이 차이를 확인하는 단계와,
(b) 상기 (a) 단계에서 확인한 후보 간세포암 예측용 마커들 중에서 통계학적으로 유의적인 차이를 보이는 돌연변이가 나타나는 간세포암 예측용 마커들을 선정하는 단계와,
(c) 상기 (b) 단계에서 선정된 간세포암 예측용 마커들의 조합에 대해 수학적 처리를 통해 얻어진 가중치를 상기 선정된 간세포암 예측용 마커들 각각에 부여하는 단계와,
(d) 만성 B형 간질환 환자군과, 만성 B형 간질환으로부터 간세포암으로 진행된 환자군 사이에서 간경변증에 따른 유의적인 수치적 차이를 나타내는 간세포암 예측용 임상 데이터들을 선정하는 단계와,
(e) 상기 (d) 단계에서 선정된 간세포암 예측용 임상 데이터들의 조합에 대해 수학적 처리를 통해 얻어진 가중치를 상기 선정된 간세포암 예측용 임상 데이터들 각각에 부여하는 단계와,
(f) 만성 B형 간질환 환자에서 채취한 시료로부터 B형 간염 바이러스(HBV)의 유전자의 염기서열을 분석하고, 분석된 염기서열에서 상기 선정된 간세포암 예측용 마커들의 돌연변이들의 유무를 판단하는 단계와,
(g) 상기 가중치가 부여된 선정된 간세포암 예측용 마커들의 돌연변이들의 유무에 따라 산출된 제1 결과값을 얻는 단계와,
(h) 상기 (e) 단계에서 가중치가 부여된 간세포암 예측용 임상 데이터들이 미리 결정된 컷오프 값을 만족하지는 여부에 따라 산출된 제2 결과값 또는 상기 가중치가 부여된 간세포암 예측용 임상 데이터들 수치들 자체로부터 산출된 제2 결과값을 얻는 단계와,
(i) 상기 가중치가 부여된 간세포암 예측용 마커들의 돌연변이들의 유무에 따라 산출된 제1 결과값과, 상기 가중치가 부여된 간세포암 예측용 임상 데이터들이 미리 결정된 컷오프 값을 만족하지는 여부에 따라 산출된 제2 결과값 또는 상기 가중치가 부여된 간세포암 예측용 임상 데이터들 수치들 자체로부터 산출된 제2 결과값을 조합한 후, 이들 조합된 제1 결과값과 제2 결과값에 대해 수학적 처리를 하여 얻어진 가중치를 상기 제1 결과값과 제2 결과값 각각에 부여하고 가중치가 부여된 상기 제1 결과값과 제2 결과값에 기초하여 만성 B형 간질환 환자의 간세포암 발병 위험도를 결정하는 단계를 포함한다.
본 발명의 다른 일실시예의 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법에 있어서, 상기 선정된 간세포암 예측용 임상 데이터들은 혈소판수(platelet count), INR(혈액응고수치), 알부민 수치, AST/ALT, HBV DNA log 값 농도 [단위; cpm (copy per ml)] 및 AFP 수치를 포함할 수 있다.
한편, 상기 선정된 간세포암 예측용 임상 데이터들에 대해 컷오프 값을 적용할 경우 해당 임상 데이터 수치가 컷오프 값을 만족하는 경우에만 간세포암 발병 위험도 계산에 반영하게 되는데, 혈소판수의 컷오프 값은 <145,000/mm3, INR(혈액응고수치)의 컷오프 값은 >1, AST/ALT의 컷오프 값은 >1.0, HBV DNA log 값 농도(cpm)의 컷오프 값은 < 6일 수 있다.
본 발명의 다른 일실시예의 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법에 있어서, 상기 간세포암 예측용 임상 데이터들의 조합은 혈소판수(platelet count), INR(혈액응고수치), 알부민 수치, AST/ALT, HBV DNA log 값 농도 [단위; cpm (copy per ml)] 및 AFP 수치로 구성된 군으로부터 선택된 적어도 3개의 임상데이터들의 조합일 수 있다. 예를 들어, 간세포암 예측용 임상 데이터들의 조합은 HBV DNA log 값 농도, 혈소판수, INR(혈액응고수치) 및 AST/ALT 임상데이터들의 조합, 혈소판수, 알부민 수치 및 AST/ALT 임상데이터들의 조합, 또는 혈소판수, 알부민수치, AST/ALT 및 AFP 수치 임상데이터들의 조합일 수 있다.
본 발명의 다른 일실시예의 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법에 있어서, 상기 (i) 단계에서는 하기 수학식 2에 따른 계산결과에 따라 간세포암 발병 위험도를 결정하는 것을 특징으로 한다:
수학식 2
prob (간세포암 발병 위험도) = exp(Y)/(1+exp(Y));
상기 식에서 Y는 Y1, Y2, Y3, Y4, Y5, Y6, Y7, Y8 또는 Y9이고;
Y1=0.3866+0.9855×V1+0.8382×L1; Y2=-0.3628+0.9415×V1+0.1585×L2;
Y3=-0.5648+0.8598×V1+0.2798×L3; Y4=0.3955+1.004×V2+0.8788×L1;
Y5=-0.3742+0.9516×V2+0.163×L2; Y6=-0.5864+0.8592×V2+0.2842×L3;
Y7=0.32+0.9924×V3+0.8951×L1; Y8=-0.3898+0.9793×V3+0.1696×L2;
Y9=-0.6357+0.9193×V3+0.2966×L3이며;
V1=-3.5058+2.4961×A1762T+1.676×T1753V+0.9117×G1613A+0.9214×C1653T;
V2=-3.6216+2.5405×G1764A+1.5751×T1753V+0.8847×G1613A+0.9529×C1653T;
V3=-3.5562+2.4317×G1764A+1.5895×T1753V+1.2222×C1653T+1.0057×G1899A이고;
L1=-5.4174+1.7473×HBV DNA log 값 농도(cpm)+2.597×혈소판수+3.4715×INR(혈액응고수치)+2.9311×AST/ALT;
L2= 9.6571-0.0102×혈소판수-2.9553×알부민 수치+3.2599×AST/ALT;
L3=8.0414-0.0211×혈소판수-2.1554×알부민수치+3.1704×AST/ALT+0.0108×AFP이며,
상기 V1, V2 및 V3의 공식들에서 간세포암 예측용 마커가 변이형인 경우에는 해당 간세포암 예측용 마커의 독립변수에 "1"의 값을 대입하여 가중치와 곱셈을 하고 간세포암 예측용 마커가 야생형인 경우에는 해당 간세포암 예측용 마커의 독립변수에 "0"의 값을 대입하고,
상기 L1의 공식에서 간세포암 예측용 임상 데이터들이 미리 결정된 컷오프 값을 만족하는 경우에는 해당 간세포암 예측용 임상 데이터의 독립변수에 "1"의 값을 대입하여 가중치와 곱셈을 하고 컷오프 값을 만족하지 않는 경우에는 해당 간세포암 예측용 임상 데이터의 독립변수에 "0"의 값을 대입하며,
상기 L2 및 L3의 공식에서는 간세포암 예측용 임상 데이터가 컷오프 값을 만족하는지 관계없이 검사수치 결과를 그대로 해당 간세포암 예측용 임상 데이터의 독립변수에 대입한다.
한편, 본 발명에 있어서, 상기 가중치는 가장 낮은 가중치를 기준으로 1~10 배까지가 바람직하다.
또한, 본 발명에서는 산출된 간세포암 발병 위험도 결과값이 50% 이상(prob > 0.5)인 경우에 간세포암 발병 위험이 크다고 판단하여 간세포암 발병 고위험군으로 판별할 수 있다.
본 발명은 만성 B형 간질환 환자군과 만성 B형 간질환으로부터 간세포암으로 진행된 환자군 사이에서 후보 간세포암 예측용 유전자 마커들에서의 돌연변이 차이를 확인하고, 통계학적으로 유의적인 차이를 보이는 돌연변이가 나타나는 간세포암 예측용 유전자 마커들의 조합을 선정한 후 선정된 간세포암 예측용 유전자 마커들에 대해 수학적 처리를 통해 간세포암 발병 위험도 가중치를 부여하며 가중치가 부여된 간세포암 예측용 유전자 마커들의 돌연변이들의 유무에 따라 산출된 결과값을 이용하기 때문에 검사자 및 임상의의 주관적 판단을 배제하면서 객관적으로 간세포암 조기진단이 가능한 장점이 있다.
구체적으로, 본 발명에 따르면 만성 HBV 보균자 내지 간질환 환자를 대상으로 보균자 내지 환자의 특성에 따라서 개별적으로 간세포암 발병 위험도를 사전에 예측함으로써 각 환자 별 최적치료에 필요한 정보를 제공하고 환자 개개인의 진료지침과 치료방향을 보다 효율적으로 판단할 수 있도록 하는 장점이 있다.
또한, 본 발명은 환자의 간질환 단계로의 진전과 연동하는 것으로 입증되어 간질환 증상의 진행 가능성을 예측하는 경우에도 매우 유용하게 응용될 수 있다.
이하, 본 발명을 실시예에 기초하여 보다 상세히 기술한다. 본 발명의 하기 실시예는 본 발명을 구체화하기 위한 것일 뿐 본 발명의 권리범위를 제한하거나 한정하는 것이 아님은 물론이다. 본 발명의 상세한 설명 및 실시예로부터 본 발명이 속하는 기술분야의 전문가가 용이하게 유추할 수 있는 것은 본 발명의 권리범위에 속하는 것으로 해석된다. 본 발명에 인용된 참고문헌은 본 발명에 참고로서 통합된다.
실시예
실시예 1: 간세포암 환자 및 만성 B형 간질환 환자의 X 유전자 및 프리코어(precore) 유전자 상의 간세포암 예측용 마커 분석
본 발명자들은 간세포암 발병과 연관된 X 유전자 및 프리코어(precore) 유전자 상의 간세포암 예측용 마커들에서의 돌연변이 양상을 분석하기 위하여, 만성 B형 간질환 환자군과 만성 B형 간질환에서 간세포암으로 진행된 환자군을 포함하는 총 167명 HBV 감염환자의 HBV X 및 프리코어(precore) 유전자 염기서열을 분석하였다. 간세포암 환자 73명과 만성간염 환자 94명에 대하여 시퀀싱 분석으로 확보한 염기서열을 간세포암 환자 군과 만성간염 환자 군으로 나누어 정렬한 다음, 같은 위치에 한 가지 이상의 돌연변이가 나타나는 경우를 모두 표시하여 빈도 별로 정리하였다.
정리된 후보 간세포암 예측용 마커들 중에서 간세포암 환자 군에서 3%이하로 변이가 나타났으나 만성간염 환자 군에서는 변이가 전혀 나타나지 않는 경우와 두 환자 군에서 모두 변이가 나타나며 그 빈도가 비슷한 경우는 간세포암 발병과 유의성이 없는 변이로 판단하여 간세포암 예측용 마커들에서 제외하였고, 간세포암 환자 군에서 만성간염 환자 군보다 변이 빈도가 두 배 이상 증가한 경우를 기준으로 간세포암 발병과 유의성이 있는 변이로 판단하였으며, 이에 해당하는 간세포암 예측용 마커들을 분류하였다. 이렇게 도출한 간세포암 예측용 마커들에 대해서 암 발병과의 연관성을 분석하기 위해 카이제곱검정 (Chi-Square Tests) 및 베이지안 통계분석 (Bayesian analysis)을 실시하였으며, 그 결과 OR (Odds ratio; 오즈비)의 신뢰구간(95%CI)과 P 밸류(P value)를 기준으로 각각 OR >2, p< 0.05의 조건을 충족하는 간세포암 예측용 마커들을 최종 선정하였다. 선정된 HBV X 유전자 및 프리코어 유전자에서의 간세포암 예측용 마커들은 G1613A, C1653T, T1753V, A1762T, G1764A, A1846T, G1896A, G1899A로서 하기 표 1(도출한 간세포암 예측용 마커들의 간세포암 발병 위험도(OR), P 밸류, 민감도, 특이도, PPV 및 NPV)에 나타내었다.
표 1
간세포암 예측용 마커 HCC (N=73) CH (N=94) OR (95%CI) P 밸류 민감도(%) (95%CI) 특이도(%) (95%CI) PPV,% (95%CI) NPV,% (95%CI)
G1613A
변이형 (A) 34 17 2.872 0.001 56.2 69.1 58.6 67
야생형 (G) 39 77 1.52-5.41 47.7-64.0 62.6-75.3 49.7-66.8 60.6-72.9
C1653T
변이형 (T) 42 22 4.434 0.000 57.5 76.6 65.6 69.9
야생형 (C) 31 72 2.29-8.60 49.3-64.9 70.2-82.3 56.2-74 64-75.1
T1753V
변이형 (A,C,G) 27 21 2.04 0.041 37 77.7 56.3 61.3
야생형 (T) 46 73 1.04-4.00 29.2-44.4 71.6-83.4 44.4-83.4 56.6-65.9
A1762T
변이형 (T) 69 60 9.775 0.000 94.5 36.2 53.5 89.5
야생형 (A) 4 34 3.41-27.86 88.2-97.8 31.3-38.7 49.9-55.3 77.4-95.7
G1764A
변이형 (A) 71 65 15.838 0.000 97.3 30.9 52.2 93.5
야생형 (G) 2 29 4.01-62.04 91.7-99.2 26.5-32.4 49.2-53.3 80.5-98.2
A1846T
변이형 (T) 33 19 3.257 0.001 45.2 79.8 635 65.2
야생형 (A) 40 75 1.65-6.41 37.2-52.4 73.6-85.4 52.3-73.5 60.2-69.8
G1896A
변이형 (A) 41 29 2.872 0.001 56.2 69.1 58.6 67
야생형 (G) 32 65 1.52-5.41 47.7-64.0 62.6-75.3 49.7-66.8 60.6-72.9
G1899A
변이형 (A) 22 9 4.074 0.001 30.1 90.4 71 62.5
야생형 (G) 51 85 1.77-9.37 23.4-35.4 85.2-94.5 55.2-83.3 58.9-65.3
본 발명에서는 상기 표 1의 8개의 간세포암 예측용 마커들을 HBV 유전자 상의 간세포암 예측용 마커로 정의하며, 이들 간세포암 예측용 마커들에서의 돌연변이를 이용하여 간세포암 발병 위험도를 분석 및 예측한다.
실시예 2 : 간세포암 발병 위험도 분석 및 예측 수식의 도출
실시예 1에서 선정된 HBV 유전자 상의 8개의 간세포암 예측용 마커들을 단순히 조합할 경우 다음과 같은 수식으로 정의될 수 있다.
V= G1613A+C1653T+T1753V+A1762T+G1764A+A1846T+G1896A+H1899A
상기 수식을 근거하여 간세포암 예측용 마커들의 개수가 4개 이하일 경우 저위험군으로 분류하고 5개 이상일 경우 고위험 군으로 분류한 결과 민감도(sensitivity) 47.1%, 특이도(specificity) 88.7%, PPV 75.0% 그리고 NPV 69.9%로 나타났다. 즉, HBV 유전자 상의 간세포암 예측용 마커들의 단순 조합으로는 간세포암 예측 환자 중에서 간세포암 실제 환자의 비율인 민감도가 47.1%로 낮은 문제점이 있음을 알 수 있다. 따라서, 본 발명은 이를 개선하기 위해 간세포암 예측용 마커들의 유의적인 조합을 선정한 후 선정된 간세포암 예측용 마커들에 대해 수학적 처리를 통해 간세포암 발병 위험도 가중치를 부여하여 간세포암 발병 위험도를 산출하는 방법을 후술하는 바와 같이 고안하였다.
실시예 3: 간세포암 관련 예측용 마커들의 선정 및 다변수 로지스틱 회귀 분석을 통한 간세포암 발병 예측 수식의 도출
실시예 2에서 정의된 수식의 낮은 예측력 문제를 해결하기 위해 다변수 로지스틱 회귀 분석을 이용하되, 통계적으로 유의한 값만을 선택하기 위해 "단계적 회귀 분석(stepwise regression analysis)" 방식을 통하여 필수적인 독립변수인 간세포암 예측용 마커들만을 선정하여 분석하였으며 이를 통해 3가지의 간세포암 발병 위험도 분석 및 예측방법을 수립하였다.
실시예 3-1: 간세포암 발병 위험도 분석 및 예측방법 1 (V1)
표 2 HBV 유전자 상의 간세포암 예측용 마커들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -3.5058 0.8014 19.1358 <.0001
A1762T 1 2.4961 0.809 9.5203 0.002
T1753V 1 1.676 0.482 12.0937 0.0005
G1613A 1 0.9117 0.4296 4.5034 0.0338
C1653T 1 0.9214 0.4057 5.1582 0.0231
상기 표 2에 나타난 바와 같이 선정된 유의한 독립변수들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 얻어진 가중치를 부여하고 절편값을 반영하여 간세포암 발병 위험도에 대한 다음과 같은 공식(이하, "예측 모델 V1"이라 함)을 만들었다.
V1=-3.5058+2.4961×A1762T+1.676×T1753V+0.9117×G1613A+0.9214×C1653T
prob (간세포암 발병 위험도) = exp(V1)/(1+exp(V1))
상기 공식을 바탕으로 간세포암 발병 확률이 50% 이상 (간세포암 발병 위험도 >0.5)인 경우를 간세포암 발병 고위험군으로 판정할 경우, 고위험군의 빈도를 비교 분석한 결과, 민감도(sensitivity) 61.4%, 특이도(specificity) 86.6%, PPV 76.8% 그리고 NPV 75.7%로 나타났다.
실시예 3-2: 간세포암 발병 위험도 분석 및 예측방법 2 (V2)
표 3 HBV 유전자 상의 간세포암 예측용 마커들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -3.6216 1.026 12.4586 0.0004
G1764A 1 2.5405 1.057 5.7773 0.0162
T1753V 1 1.5751 0.4711 11.1774 0.0008
G1613A 1 0.8847 0.4212 4.4105 0.0357
C1653T 1 0.9529 0.4004 5.6633 0.0173
상기 표 3에 나타난 바와 같이 선정된 유의한 독립변수들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 얻어진 가중치를 부여하고 절편값을 반영하여 간세포암 발병 위험도에 대한 다음과 같은 공식(이하, "예측 모델 V2"라 함)을 만들었다.
V2=-3.6216+2.5405×G1764A+1.5751×T1753V+0.8847×G1613A+0.9529×C1653T
prob (간세포암 발병 위험도) = exp(V2)/(1+exp(V2))
상기 공식을 바탕으로 간세포암 발병 확률이 50% 이상 (간세포암 발병 위험도 >0.5)인 경우를 간세포암 발병 고위험군으로 판정할 경우, 고위험군의 빈도를 비교 분석한 결과, 민감도(sensitivity) 62.9%, 특이도(specificity) 86.6%, PPV 77.2% 그리고 NPV 76.4%로 나타났다.
실시예 3-3: 간세포암 발병 위험도 분석 및 예측방법 3 (V3)
표 4 HBV 유전자 상의 간세포암 예측용 마커들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -3.5562 1.0241 12.0593 0.0005
G1764A 1 2.4317 1.0598 5.265 0.0218
T1753V 1 1.5895 0.4728 11.3037 0.0008
C1653T 1 1.2222 0.3874 9.9511 0.0016
G1899A 1 1.0057 0.4822 4.3493 0.037
상기 표 4에 나타난 바와 같이 선정된 유의한 독립변수들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 얻어진 가중치를 부여하고 절편값을 반영하여 간세포암 발병 위험도에 대한 다음과 같은 공식(이하, "예측 모델 V3"라 함)을 만들었다.
V3=-3.5562+2.4317×G1764A+1.5895×T1753V+1.2222×C1653T+1.0057×G1899A
prob (간세포암 발병 위험도) = exp(V3)/(1+exp(V3))
상기 공식을 바탕으로 간세포암 발병 확률이 50% 이상 (간세포암 발병 위험도 >0.5)인 경우를 간세포암 발병 고위험군으로 판정할 경우, 고위험군의 빈도를 비교 분석한 결과, 민감도(sensitivity) 78.6%, 특이도(specificity) 73.2%, PPV 67.9% 그리고 NPV 82.6%로 나타났다.
상기와 같은 결과들로부터 다변수 로지스틱 회귀분석을 통해 HBV 유전자 상의 간세포암 예측용 마커들에 대해 가중치를 두는 것으로 민감도(sensitivity)가 높아지는 것을 확인할 수 있었다.
또한, 본 발명에 있어서 간세포암 발병 위험도 분석 및 예측방법은 전술한 3가지의 예측 모델들(V1, V2, V3)이 가장 바람직하나, 본 발명은 이러한 3가지 예측 모델들에 한정되는 것이 아니며 8개의 간세포암 예측용 마커들에 대해 다변수 로지스틱 회귀분석을 통해 가중치를 적용하는 모든 공식을 포함할 수 있다. 그리고, 상기 예측 모델들에서 가중치(estimate)의 수치는 가장 낮은 수치 값을 기준으로 1~10배까지가 바람직하고, 특히 상기 표 2 내지 표 4에 제시된 값을 쓰는 것이 가장 바람직하다. 그러나, 본 발명은 상기 가중치들의 비율에 맞춰 수치 값을 변경할 수 있으므로 상기 표 2 내지 표 4에 제시된 값에 반드시 국한되지 않는 것임은 물론이다.
실시예 4: 간세포암 발병 위험도 연관 임상 데이터들 선정 및 임상 데이터들에 대한 컷오프 값의 결정
전술한 바와 같은 HBV 유전형 변이 양상에 더하여 간염과 간경화가 진행되면 수치변동이 있는 대표적인 임상 데이터를 간세포암 발병 위험도 분석 및 예측 방법에 선택적으로 반영시킬 수 있다.
다변수 로지스틱 회귀 분석을 하여 임상 데이터들을 분석한 결과, 다양한 임상 데이터 중 혈소판수(platelet count) (컷오프 값; <145,000/mm3), INR(혈액응고수치)(컷오프 값; >1), 알부민 수치, AST/ALT (컷오프 값; >1.0), HBV DNA log 값 농도 [단위; cpm (copy per ml), 컷오프 값; < 6], AFP 수치 등이 만성 B형 간질환 환자와 만성 B형 간질환에서 간세포암으로 진행된 환자 사이에서 유의적인 차이를 보임을 확인하고 이를 간세포암 발병 위험도 분석 및 예측 방법에 반영하였다.
실시예 5: 간세포암 관련 예측용 유전자 마커들 및 간세포암 예측용 임상 데이터들에 대한 다변수 로지스틱 회귀 분석을 통한 간세포암 발병 예측 수식의 도출
실시예 3에서와 같이 다변수 로지스틱 회귀 분석을 이용하되, B형 간염 바이러스 유전자 상의 간세포암 예측용 마커들을 이용하여 산출된 발병 위험도 결과값과, 간세포암 예측용 임상 데이터들에 대해 수학적 처리(다변수 로지스틱 회귀 분석 결과)를 통해 간세포암 발병 위험도 가중치를 부여하고 가중치가 부여된 간세포암 예측용 임상 데이터들이 미리 결정된 컷오프 값을 만족하지는 여부에 따라 산출된 발병 위험도 결과값 또는 가중치가 부여된 간세포암 예측용 임상 데이터들 수치들 자체로부터 산출된 발병 위험도 결과값을 이용하여 간세포암의 발병 위험도를 예측 및 분석하였다. 이 경우, 상기 2개의 산출된 발병 위험도 결과값들에 대해서도 다변수 로지스틱 회귀 분석을 수행하여 크게 3가지의 간세포암 발병 위험도 분석 및 예측방법을 수립하였다.
실시예 5-1: 간세포암 발병 위험도 분석 및 예측방법 1 (P1)
표 5 HBV 유전자 상의 간세포암 예측용 마커들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -3.5058 0.8014 19.1358 <.0001
A1762T 1 2.4961 0.809 9.5203 0.002
T1753V 1 1.676 0.482 12.0937 0.0005
G1613A 1 0.9117 0.4296 4.5034 0.0338
C1653T 1 0.9214 0.4057 5.1582 0.0231
표 6 임상 데이터들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -5.4174 1.1114 23.7604 <.0001
혈소판수 1 2.597 0.7142 13.2218 0.0003
INR 1 3.4715 0.8674 16.0184 <.0001
AST/ALT 1 2.9311 0.757 14.9914 0.0001
HBV DNA 1 1.7473 0.7697 5.1538 0.0232
상기 표 5 및 표 6에 나타난 바와 같이 단계적 방식을 통한 다변수 로지스틱 회귀 분석 후 독립변수들인 A1762T, T1753C/A, G1613A, C1653T, 혈소판수, INR(혈액응고수치), AST/ALT, HBV DNA log 값 농도(cpm)를 선정하고, 이와 같이 선정된 유의한 독립변수들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 얻어진 가중치를 부여하고 절편값을 반영하여 간세포암 발병 위험도를 아래와 같이 간세포암 예측용 마커들로부터 얻고(V1), 또한 임상 데이터 수치들로부터 얻었다(L1).
V1=-3.5058+2.4961×A1762T+1.676×T1753V+0.9117×G1613A+0.9214×C1653T
L1=-5.4174+1.7473×HBV DNA log 값 농도(cpm)+2.597×혈소판수+3.4715×INR(혈액응고수치)+2.9311×AST/ALT
한편, 상기 L1의 공식은 간세포암 예측용 임상 데이터들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 간세포암 발병 위험도 가중치를 부여하고 가중치가 부여된 간세포암 예측용 임상 데이터 독립변수들의 수치들이 실시예 4에서 미리 결정된 컷오프 값을 만족하는 경우에는 "1"의 값을 해당 독립변수에 부여하고 컷오프 값을 만족하지 않는 경우에는 "0"의 값을 부여하여 발병 위험도를 계산하는 공식이다.
표 7 항바이러스제 투여시의 임상 데이터들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 9.6571 3.0901 9.7666 0.0018
혈소판수 1 -0.0102 0.0045 5.1876 0.0227
알부민 수치 1 -2.9553 0.8031 13.5419 0.0002
AST/ALT 1 3.2599 0.8462 14.8427 0.0001
한편, 상기 L1의 공식은 항바이러스제 투여전이거나, 투여를 하지 않는 상황에서 적용되는 공식으로서, 만성 B형 간질환 환자의 경우 항바이러스제를 투여하는 경우가 많으므로 이 경우 상기 L1의 공식은 수정되어야 한다. 이때, 항 바이러스제 투여에 의한 영향을 배제하기 위하여, HBV DNA log 값 농도를 제외한 혈소판수, 알부민 수치, AST/ALT의 독립변수들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 간세포암 발병 위험도 가중치를 부여하고 다음과 같이 수정된 공식 L2를 얻었다.
L2 = 9.6571-0.0102×혈소판수-2.9553×알부민 수치+3.2599×AST/ALT
상기 L2 공식의 각각의 임상데이터 독립변수는 해당 임상 데이터 수치가 컷오프 값을 만족하는지 관계없이 검사수치 결과를 그대로 독립변수에 대입하여 간세포암의 발병 위험도를 예측 및 분석하는 공식이다.
표 8 AFP 이상 수치시의 임상 데이터들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 8.0414 3.648 4.8592 0.0275
혈소판수 1 -0.0211 0.00597 12.5143 0.0004
알부민 수치 1 -2.1554 0.9501 5.1467 0.0233
AST/ALT 1 3.1704 0.9241 11.77 0.0006
AFP 1 0.0108 0.00345 9.7869 0.0018
한편, AFP 수치 상승은 간세포암의 표지자로서 AFP 수치가 매우 높은 수치일 경우에는 진단적인 역할을 하지만, 간염 수치는 정상치(40IU/L)에 가까우나 CT 검사상 간세포암 소견이 없는 경우 및 만성 B형 간염소견이 심한 경우에 경도 및 중등도로 상승된 AFP 수치(일반적으로 400 ng/mL 미만)는 간세포암 고위험군으로 구분될 수 있다. 이러한 경우에 대응하기 위하여 혈소판수, 알부민 수치, AST/ALT, AFP의 독립변수들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 간세포암 발병 위험도 가중치를 부여하고 다음과 같이 수정된 공식 L3을 얻었다.
L3=8.0414-0.0211×혈소판수-2.1554×알부민수치+3.1704×AST/ALT+0.0108×AFP
상기 L3 공식의 각각의 임상데이터 독립변수는 해당 임상 데이터 수치가 컷오프 값을 만족하는지 관계없이 검사수치 결과를 그대로 독립변수에 대입하여 간세포암의 발병 위험도를 예측 및 분석하는 공식이다.
따라서, 전술한 L2 공식과 L3 공식을 이용하면 각 독립변수에 대해 각 환자의 검사시점의 고유 임상데이터 수치 값을 대입하여 간세포암 발병 위험도의 민감도, 특이도, PPV(positive predictive value), NPV(negative predictive value), 효율지수(efficiency), 상대위험도(relative risk; R.R.) 및 O.R.(odds ratio; 오즈비) 값을 구할 수 있다.
이하에서는 두 가지 요소(HBV 유전자 상의 간세포암 예측용 마커들의 독립변수들과 임상 데이터들의 독립변수들)를 포함하되 간세포암 발병 위험도 분석 및 예측 능력이 최적인 공식을 얻기 위해 앞에서 구한 2개의 공식(V1, L1; V1, L2; 또는 V1, L3)에 대해서도 다변수 로지스틱 회귀 분석을 수행하여 하기 표 9 내지 표 11과 같은 분석결과를 얻었다.
표 9 간세포암 예측용 유전자 마커들 (V1) 및 임상 데이터들 (L1)의 조합에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과 (Y1)
파라미터(Parameter) DF 가중치 표준오차 Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 0.3866 0.3125 1.5305 0.216
V1 1 0.9855 0.296 11.0869 0.0009
L1 1 0.8382 0.1423 34.7228 <.0001
상기 결과로부터 다음과 같이 최종적인 공식(이하, "예측 모델 Y1"이라 함)을 얻었다.
Y1=0.3866+0.9855×V1+0.8382×L1
prob (간세포암 발병 위험도) = exp(Y1)/(1+exp(Y1))
상기 Y1 공식을 바탕으로 간세포암 발병 위험도 확률이 50% 이상 (간세포암 발병 위험도 > 0.5)인 경우를 간세포암 발병 고위험군으로 판정할 경우, 고위험군의 빈도를 비교 분석한 결과, 민감도(sensitivity) 87.6%, 특이도(specificity) 93.8%, PPV 91.0% 그리고 NPV 91.0%로 나타났다. 따라서, 상기 Y1 공식은 간세포암 발병 예측 능력을 나타내는 민감도와 특이도 모두가 85% 이상으로 높다는 것을 알 수 있고, 본 발명은 만성 간염 보균자 내지는 환자로부터 간세포암으로의 발병을 예측하는데 있어서 매우 객관적이고 유효한 방법임을 확인할 수 있다.
표 10 간세포암 예측용 유전자 마커들 (V1) 및 임상 데이터들 (L2)의 조합에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과 (Y2)
파라미터(Parameter) DF 가중치 표준오차 Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -0.3628 0.222 2.6711 0.1022
V1 1 0.9415 0.1754 28.814 <.0001
L2 1 0.1585 0.0416 14.5153 0.0001
상기 결과로부터 다음과 같이 최종적인 공식(이하, "예측 모델 Y2"라 함)을 얻었다.
Y2=-0.3628+0.9415×V1+0.1585×L2
prob (간세포암 발병 위험도) = exp(Y2)/(1+exp(Y2))
상기 Y2 공식을 바탕으로 간세포암 발병 위험도 확률이 50% 이상 (간세포암 발병 위험도 > 0.5)인 경우를 간세포암 발병 고위험군으로 판정할 경우, 고위험군의 빈도를 비교 분석한 결과, 민감도(sensitivity) 61.4%, 특이도(specificity) 89.7%, PPV 81.1% 그리고 NPV 76.3%로 나타났다. 따라서, 상기 Y2 공식은 간세포암 발병 예측 능력이 V1 및 L1의 조합에 비해 낮으므로 항 바이러스제 투여 시에 한해서 사용하는 것이 바람직하다.
표 11 간세포암 예측용 유전자 마커들 (V1) 및 임상 데이터들 (L3)의 조합에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과 (Y3)
파라미터(Parameter) DF 가중치 표준오차 Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -0.5648 0.2416 5.4654 0.0194
V1 1 0.8598 0.1899 20.5084 <.0001
L3 1 0.2798 0.0581 23.2204 <.0001
상기 결과로부터 다음과 같이 최종적인 공식(이하, "예측 모델 Y3"라 함)을 얻었다.
Y3=-0.5648+0.8598×V1+0.2798×L3
prob (간세포암 발병 위험도) = exp(Y3)/(1+exp(Y3))
상기 Y3 공식을 바탕으로 간세포암 발병 위험도 확률이 50% 이상 (간세포암 발병 위험도 > 0.5)인 경우를 간세포암 발병 고위험군으로 판정할 경우, 고위험군의 빈도를 비교 분석한 결과, 민감도(sensitivity) 67.1%, 특이도(specificity) 88.7%, PPV 81.0% 그리고 NPV 78.9%로 나타났다. 따라서, 상기 Y3 공식은 간세포암 발병 예측 능력이 V1 및 L1의 조합에 비해 낮으므로 AFP 수치가 이상치를 나타낼 경우에 한해서 사용하는 것이 바람직하다.
실시예 5-2: 간세포암 발병 위험도 분석 및 예측방법 2 (P2)
표 12 HBV 유전자 상의 간세포암 예측용 마커들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -3.6216 1.026 12.4586 0.0004
G1764A 1 2.5405 1.057 5.7773 0.0162
T1753V 1 1.5751 0.4711 11.1774 0.0008
G1613A 1 0.8847 0.4212 4.4105 0.0357
C1653T 1 0.9529 0.4004 5.6633 0.0173
표 13 임상 데이터들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -5.4174 1.1114 23.7604 <.0001
혈소판수 1 2.597 0.7142 13.2218 0.0003
INR 1 3.4715 0.8674 16.0184 <.0001
AST/ALT 1 2.9311 0.757 14.9914 0.0001
HBV DNA 1 1.7473 0.7697 5.1538 0.0232
상기 표 12 및 표 13에 나타난 바와 같이, 단계적 방식을 통한 다변수 로지스틱 회귀 분석 후 독립변수들인 G1764A, T1753C/A, G1613A, C1653T, 혈소판수, INR(혈액응고수치), AST/ALT, HBV DNA log 값 농도(cpm)를 선정하고, 이와 같이 선정된 유의한 독립변수들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 얻어진 가중치를 부여하고 절편값을 반영하여 간세포암 발병 위험도를 아래와 같이 간세포암 예측용 마커들로부터 얻고(V2), 또한 임상 데이터 수치들로부터 얻었다(L1).
V2=-3.6216+2.5405×G1764A+1.5751×T1753V+0.8847×G1613A+0.9529×C1653T
L1=-5.4174+1.7473×HBV DNA log 값 농도(cpm)+2.597×혈소판수+3.4715×INR(혈액응고수치)+2.9311×AST/ALT
한편, 상기 L1의 공식은 간세포암 예측용 임상 데이터들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 간세포암 발병 위험도 가중치를 부여하고 가중치가 부여된 간세포암 예측용 임상 데이터 독립변수들의 수치들이 실시예 4에서 미리 결정된 컷오프 값을 만족하는 경우에는 "1"의 값을 해당 독립변수에 부여하고 컷오프 값을 만족하지 않는 경우에는 "0"의 값을 부여하여 발병 위험도를 계산하는 공식이다.
표 14 항바이러스제 투여시의 임상 데이터들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 9.6571 3.0901 9.7666 0.0018
혈소판수 1 -0.0102 0.0045 5.1876 0.0227
알부민 수치 1 -2.9553 0.8031 13.5419 0.0002
AST/ALT 1 3.2599 0.8462 14.8427 0.0001
한편, 상기 L1의 공식은 항바이러스제 투여전이거나, 투여를 하지 않는 상황에서 적용되는 공식으로서, 만성 B형 간질환 환자의 경우 항바이러스제를 투여하는 경우가 많으므로 이 경우 상기 L1의 공식은 수정되어야 한다. 이때, 항 바이러스제 투여에 의한 영향을 배제하기 위하여, HBV DNA log 값 농도를 제외한 혈소판수, 알부민 수치, AST/ALT의 독립변수들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 간세포암 발병 위험도 가중치를 부여하고 다음과 같이 수정된 공식 L2를 얻었다.
L2 = 9.6571-0.0102×혈소판수-2.9553×알부민 수치+3.2599×AST/ALT
상기 L2 공식의 각각의 임상데이터 독립변수는 해당 임상 데이터 수치가 컷오프 값을 만족하는지 관계없이 검사수치 결과를 그대로 독립변수에 대입하여 간세포암의 발병 위험도를 예측 및 분석하는 공식이다.
표 15 AFP 이상 수치시의 임상 데이터들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 8.0414 3.648 4.8592 0.0275
혈소판수 1 -0.0211 0.00597 12.5143 0.0004
알부민 수치 1 -2.1554 0.9501 5.1467 0.0233
AST/ALT 1 3.1704 0.9241 11.77 0.0006
AFP 1 0.0108 0.00345 9.7869 0.0018
한편, AFP 수치 상승은 간세포암의 표지자로서 AFP 수치가 매우 높은 수치일 경우에는 진단적인 역할을 하지만, 간염 수치는 정상치(40IU/L)에 가까우나 CT 검사상 간세포암 소견이 없는 경우 및 만성 B형 간염소견이 심한 경우에 경도 및 중등도로 상승된 AFP 수치(일반적으로 400 ng/mL 미만)는 간세포암 고위험군으로 구분될 수 있다. 이러한 경우에 대응하기 위하여 혈소판수, 알부민 수치, AST/ALT, AFP의 독립변수들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 간세포암 발병 위험도 가중치를 부여하고 다음과 같이 수정된 공식 L3을 얻었다.
L3=8.0414-0.0211×혈소판수-2.1554×알부민수치+3.1704×AST/ALT+0.0108×AFP
상기 L3 공식의 각각의 임상데이터 독립변수는 해당 임상 데이터 수치가 컷오프 값을 만족하는지 관계없이 검사수치 결과를 그대로 독립변수에 대입하여 간세포암의 발병 위험도를 예측 및 분석하는 공식이다.
이하에서는 두 가지 요소(HBV 유전자 상의 간세포암 예측용 마커들의 독립변수들과 임상 데이터들의 독립변수들)를 포함하되 간세포암 발병 위험도 분석 및 예측 능력이 최적인 공식을 얻기 앞에서 구한 2개의 공식(V2, L1; V2, L2; 또는 V2, L3)에 대해서도 다변수 로지스틱 회귀 분석을 수행하여 하기 표 16 내지 표 18과 같은 분석결과를 얻었다.
표 16 간세포암 예측용 유전자 마커들 (V2) 및 임상 데이터들 (L1)의 조합에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과 (Y4)
파라미터(Parameter) DF 가중치 표준오차 Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 0.3955 0.3147 1.5787 0.2089
V2 1 1.004 0.2892 12.0519 0.0005
L1 1 0.8788 0.1498 34.4154 <.0001
상기 결과로부터 다음과 같이 최종적인 공식(이하, "예측 모델 Y4"라 함)을 얻었다.
Y4=0.3955+1.004×V2+0.8788×L1
prob (간세포암 발병 위험도) = exp(Y4)/(1+exp(Y4))
상기 Y4 공식을 바탕으로 간세포암 발병 위험도 확률이 50% 이상 (간세포암 발병 위험도 > 0.5)인 경우를 간세포암 발병 고위험군으로 판정할 경우, 고위험군의 빈도를 비교 분석한 결과, 민감도(sensitivity) 87.1%, 특이도(specificity) 90.7%, PPV 87.1% 그리고 NPV 90.7%로 나타났다. 따라서, 상기 Y4 공식은 간세포암 발병 예측 능력을 나타내는 민감도와 특이도 모두가 85% 이상으로 높다는 것을 알 수 있고, 본 발명은 만성 간염 보균자 내지는 환자로부터 간세포암으로의 발병을 예측하는데 있어서 매우 객관적이고 유효한 방법임을 확인할 수 있다.
표 17 간세포암 예측용 유전자 마커들 (V2) 및 임상 데이터들 (L2)의 조합에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과 (Y5)
파라미터(Parameter) DF 가중치 표준오차 Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -0.3742 0.2199 2.8948 0.0889
V2 1 0.9516 0.1821 27.3206 <.0001
L2 1 0.163 0.0411 15.7107 <.0001
상기 결과로부터 다음과 같이 최종적인 공식(이하, "예측 모델 Y5"라 함)을 얻었다.
Y5=-0.3742+0.9516×V2+0.163×L2
prob (간세포암 발병 위험도) = exp(Y5)/(1+exp(Y5))
상기 Y5 공식을 바탕으로 간세포암 발병 위험도 확률이 50% 이상 (간세포암 발병 위험도 > 0.5)인 경우를 간세포암 발병 고위험군으로 판정할 경우, 고위험군의 빈도를 비교 분석한 결과, 민감도(sensitivity) 61.4%, 특이도(specificity) 90.7%, PPV 82.7% 그리고 NPV 76.5%로 나타났다. 따라서, 상기 Y5 공식은 간세포암 발병 예측 능력이 V2와 L1의 조합에 비해 낮으므로 항 바이러스제 투여 시에 한해서 사용하는 것이 바람직하다.
표 18 간세포암 예측용 유전자 마커들 (V2) 및 임상 데이터들 (L3)의 조합에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과 (Y6)
파라미터(Parameter) DF 가중치 표준오차 Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -0.5864 0.2408 5.9295 0.0149
V2 1 0.8592 0.1957 19.284 <.0001
L3 1 0.2842 0.058 24.0241 <.0001
상기 결과로부터 다음과 같이 최종적인 공식(이하, "예측 모델 Y6"라 함)을 얻었다.
Y6=-0.5864+0.8592×V2+0.2842×L3
prob (간세포암 발병 위험도) = exp(Y6)/(1+exp(Y6))
상기 Y6 공식을 바탕으로 간세포암 발병 위험도 확률이 50% 이상 (간세포암 발병 위험도 > 0.5)인 경우를 간세포암 발병 고위험군으로 판정할 경우, 고위험군의 빈도를 비교 분석한 결과, 민감도(sensitivity) 68.6%, 특이도(specificity) 88.7%, PPV 81.4% 그리고 NPV 79.6%로 나타났다. 따라서, 상기 Y6 공식은 간세포암 발병 예측 능력이 V2와 L1의 조합에 비해 낮으므로 AFP 수치가 이상치를 나타낼 경우에 한해서 사용하는 것이 바람직하다.
실시예 5-3: 간세포암 발병 위험도 분석 및 예측방법 3 (P3)
표 19 HBV 유전자 상의 간세포암 예측용 마커들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -3.5562 1.0241 12.0593 0.0005
G1764A 1 2.4317 1.0598 5.265 0.0218
T1753V 1 1.5895 0.4728 11.3037 0.0008
C1653T 1 1.2222 0.3874 9.9511 0.0016
G1899A 1 1.0057 0.4822 4.3493 0.037
표 20 임상 데이터들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -5.4174 1.1114 23.7604 <.0001
혈소판수 1 2.597 0.7142 13.2218 0.0003
INR 1 3.4715 0.8674 16.0184 <.0001
AST/ALT 1 2.9311 0.757 14.9914 0.0001
HBV DNA 1 1.7473 0.7697 5.1538 0.0232
상기 표 19 및 표 20에 나타난 바와 같이, 단계적 방식을 통한 다변수 로지스틱 회귀 분석 후 독립변수들인 G1764A, T1753C/A, C1653T, G1899A, 혈소판수, INR(혈액응고수치), AST/ALT, HBV DNA log 값 농도(cpm)를 선정하고, 이와 같이 선정된 유의한 독립변수들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 얻어진 가중치를 부여하고 절편값을 반영하여 간세포암 발병 위험도를 아래와 같이 간세포암 예측용 마커들로부터 얻고(V3), 또한 임상 데이터 수치들로부터 얻었다(L1).
V3=-3.5562+2.4317×G1764A+1.5895×T1753V+1.2222×C1653T+1.0057×G1899A
L1=-5.4174+1.7473×HBV DNA log 값 농도(cpm)+2.597×혈소판수+3.4715×INR(혈액응고수치)+2.9311×AST/ALT
한편, 상기 L1의 공식은 간세포암 예측용 임상 데이터들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 간세포암 발병 위험도 가중치를 부여하고 가중치가 부여된 간세포암 예측용 임상 데이터 독립변수들의 수치들이 실시예 4에서 미리 결정된 컷오프 값을 만족하는 경우에는 "1"의 값을 해당 독립변수에 부여하고 컷오프 값을 만족하지 않는 경우에는 "0"의 값을 부여하여 발병 위험도를 계산하는 공식이다.
표 21 항바이러스제 투여 시의 임상 데이터들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 9.6571 3.0901 9.7666 0.0018
혈소판수 1 -0.0102 0.0045 5.1876 0.0227
알부민 수치 1 -2.9553 0.8031 13.5419 0.0002
AST/ALT 1 3.2599 0.8462 14.8427 0.0001
한편, 상기 L1의 공식은 항바이러스제 투여전이거나, 투여를 하지 않는 상황에서 적용되는 공식으로서, 만성 B형 간질환 환자의 경우 항바이러스제를 투여하는 경우가 많으므로 이 경우 상기 L1의 공식은 수정되어야 한다. 이때, 항 바이러스제 투여에 의한 영향을 배제하기 위하여, HBV DNA log 값 농도를 제외한 혈소판수, 알부민 수치, AST/ALT의 독립변수들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 간세포암 발병 위험도 가중치를 부여하고 다음과 같이 수정된 공식 L2를 얻었다.
L2 = 9.6571-0.0102×혈소판수-2.9553×알부민 수치+3.2599×AST/ALT
상기 L2 공식의 각각의 임상데이터 독립변수는 해당 임상 데이터 수치가 컷오프 값을 만족하는지 관계없이 검사수치 결과를 그대로 독립변수에 대입하여 간세포암의 발병 위험도를 예측 및 분석하는 공식이다.
표 22 AFP 이상 수치시의 임상 데이터들에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과
파라미터(Parameter) DF 가중치(Estimate) 표준오차(Standard Error) Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 8.0414 3.648 4.8592 0.0275
혈소판수 1 -0.0211 0.00597 12.5143 0.0004
알부민 수치 1 -2.1554 0.9501 5.1467 0.0233
AST/ALT 1 3.1704 0.9241 11.77 0.0006
AFP 1 0.0108 0.00345 9.7869 0.0018
한편, AFP 수치 상승은 간세포암의 표지자로서 AFP 수치가 매우 높은 수치일 경우에는 진단적인 역할을 하지만, 간염 수치는 정상치(40IU/L)에 가까우나 CT 검사상 간세포암 소견이 없는 경우 및 만성 B형 간염소견이 심한 경우에 경도 및 중등도로 상승된 AFP 수치(일반적으로 400 ng/mL 미만)는 간세포암 고위험군으로 구분될 수 있다. 이러한 경우에 대응하기 위하여 혈소판수, 알부민 수치, AST/ALT, AFP의 독립변수들에 대해 수학적 처리(단계적 다변수 로지스틱 회귀 분석 결과)를 통해 간세포암 발병 위험도 가중치를 부여하고 다음과 같이 수정된 공식 L3을 얻었다.
L3=8.0414-0.0211×혈소판수-2.1554×알부민수치+3.1704×AST/ALT+0.0108×AFP
상기 L3 공식의 각각의 임상데이터 독립변수는 해당 임상 데이터 수치가 컷오프 값을 만족하는지 관계없이 검사수치 결과를 그대로 독립변수에 대입하여 간세포암의 발병 위험도를 예측 및 분석하는 공식이다.
이하에서는 두 가지 요소(HBV 유전자 상의 간세포암 예측용 마커들의 독립변수들과 임상 데이터들의 독립변수들)를 포함하되 간세포암 발병 위험도 분석 및 예측 능력이 최적인 공식을 얻기 앞에서 구한 2개의 공식(V3, L1; V3, L2; 또는 V3, L3)에 대해서도 다변수 로지스틱 회귀 분석을 수행하여 하기 표 23 내지 표 25와 같은 분석결과를 얻었다.
표 23 간세포암 예측용 유전자 마커들 (V3) 및 임상 데이터들 (L1)의 조합에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과 (Y7)
파라미터(Parameter) DF 가중치 표준오차 Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 0.32 0.3106 1.0613 0.3029
V3 1 0.9924 0.2806 12.5104 0.0004
L1 1 0.8951 0.1531 34.18 <.0001
상기 결과로부터 다음과 같이 최종적인 공식(이하, "예측 모델 Y7"이라 함)을 얻었다.
Y7=0.32+0.9924×V3+0.8951×L1
prob (간세포암 발병 위험도) = exp(Y7)/(1+exp(Y7))
상기 Y7 공식을 바탕으로 간세포암 발병 위험도 확률이 50% 이상 (간세포암 발병 위험도 > 0.5)인 경우를 간세포암 발병 고위험군으로 판정할 경우, 고위험군의 빈도를 비교 분석한 결과, 민감도(sensitivity) 88.6%, 특이도(specificity) 91.8%, PPV 88.6% 그리고 NPV 91.8%로 나타났다. 따라서, 상기 Y7 공식은 간세포암 발병 예측 능력을 나타내는 민감도와 특이도 모두가 85% 이상으로 높다는 것을 알 수 있고, 본 발명은 만성 간염 보균자 내지는 환자로부터 간세포암으로의 발병을 예측하는데 있어서 매우 객관적이고 유효한 방법임을 확인할 수 있다.
표 24 간세포암 예측용 유전자 마커들 (V3) 및 임상 데이터들 (L2)의 조합에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과 (Y8)
파라미터(Parameter) DF 가중치 표준오차 Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -0.3898 0.2213 3.1017 0.0782
V3 1 0.9793 0.1875 27.268 <.0001
L2 1 0.1696 0.0417 16.5296 <.0001
상기 결과로부터 다음과 같이 최종적인 공식(이하, "예측 모델 Y8"이라 함)을 얻었다.
Y8=-0.3898+0.9793×V3+0.1696×L2
prob (간세포암 발병 위험도) = exp(Y8)/(1+exp(Y8))
상기 Y8 공식을 바탕으로 간세포암 발병 위험도 확률이 50% 이상 (간세포암 발병 위험도 > 0.5)인 경우를 간세포암 발병 고위험군으로 판정할 경우, 고위험군의 빈도를 비교 분석한 결과, 민감도(sensitivity) 58.6%, 특이도(specificity) 90.7%, PPV 82.0% 그리고 NPV 75.2%로 나타났다. 따라서, 상기 Y8 공식은 간세포암 발병 예측 능력이 V3와 L1의 조합에 비해 낮으므로 항 바이러스제 투여 시에 한해서 사용하는 것이 바람직하다.
표 25 간세포암 예측용 유전자 마커들 (V3) 및 임상 데이터들 (L3)의 조합에 대한 단계적 회귀 분석 방식을 이용한 다변수 로지스틱 회귀 분석 결과 (Y9)
파라미터(Parameter) DF 가중치 표준오차 Wald Chi-Square Pr>ChiSq
절편(Intercept) 1 -0.6357 0.2456 6.7014 0.0096
V3 1 0.9193 0.203 20.5183 <.0001
L3 1 0.2966 0.0601 24.3574 <.0001
상기 결과로부터 다음과 같이 최종적인 공식(이하, "예측 모델 Y9"이라 함)을 얻었다.
Y9=-0.6357+0.9193×V3+0.2966×L3
prob (간세포암 발병 위험도) = exp(Y9)/(1+exp(Y9))
상기 Y9 공식을 바탕으로 간세포암 발병 위험도 확률이 50% 이상 (간세포암 발병 위험도 > 0.5)인 경우를 간세포암 발병 고위험군으로 판정할 경우, 고위험군의 빈도를 비교 분석한 결과, 민감도(sensitivity) 65.7%, 특이도(specificity) 88.7%, PPV 80.7% 그리고 NPV 78.2%로 나타났다. 따라서, 상기 Y9 공식은 간세포암 발병 예측 능력이 V3와 L1의 조합에 비해 낮으므로 AFP 수치가 이상치를 나타낼 경우에 한해서 사용하는 것이 바람직하다.
또한, 본 발명에 있어서 간세포암 발병 위험도 분석 및 예측방법은 전술한 바와 같이 V1+L1 조합, V2+L1 조합, V3+L1 조합의 세 가지 방법과 L2, L3를 이용한 보조방법이 가장 바람직하나, 본 발명은 이러한 예측 모델들에 한정되는 것이 아니며 8개의 간세포암 예측용 마커들 및 전술한 임상 데이터들에 대해 다변수 로지스틱 회귀분석을 통해 가중치를 적용하는 모든 공식을 포함할 수 있다. 그리고, 상기 예측 모델들에서 가중치(estimate)의 수치는 가장 낮은 수치 값을 기준으로 1~10배까지가 바람직하고, 특히 상기 표 5 내지 표 25에 제시된 값을 쓰는 것이 가장 바람직하다. 그러나, 본 발명은 상기 가중치들의 비율에 맞춰 수치 값을 변경할 수 있으므로 상기 표 5 내지 표 25에 제시된 값에 반드시 국한되지 않는 것임은 물론이다.
한편, 간세포암 예측용 마커들의 조합과 가중치 부여에 의한 간세포암 발병 위험도 예측 외에 임상 데이터들의 조합과 가중치 부여에 의한 간세포암 발병 위험도 예측을 추가하는 것이 바람직하다는 것을 알 수 있다. 따라서, 본 발명은 간세포암 예측용 마커들의 조합과 가중치 부여에 의한 간세포암 발병 위험도 예측식에 임상 데이터들 수치들에 의한 보정도 포함한다.
실시예 6: 본 발명의 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법을 이용한 각 환자 별 발병 위험도 분석 실험
1) 대상환자
간세포암 발병 위험도 분석 및 예측 방법의 타당성 분석을 위해 분당제생병원에서 HBsAg (hepatitis B surface antigen) 양성인 환자를 무작위로 추출하였고, HBV 감염 환자에 특이적인 간질환 증상 진행 여부를 보다 정확하게 조사하기 위하여 알코올성 간질환이 합병된 경우와 C형 간질환을 동반하는 환자는 배제하였다.
2) 임상 데이터 조사
상기 선정된 환자들에 대하여 혈액을 채취한 후 기본적인 혈청 생화학적 검사를 시행하였다. 첫 내원 시 HBsAg 양성인 경우, 항-HBs, e항원 (HBeAg), 항-HBe, HBV-DNA, 알파태아단백(alpha-fetopretein, AFP) 검사, CBC 및 LFT 검사를 하였고, 남은 혈액은 -80℃에서 냉동 보관하였다. 혈청 HBV DNA의 정량은 리얼타임(real-time) PCR(Applied Biosystems)을 이용하였으며, 이 검사의 HBV DNA log 값 농도의 검출한계는 500 cmp이다.
3) HBV X 유전자 및 프리코어(precore) 유전자 영역의 증폭
상기 선정된 환자들의 각각의 혈액으로부터 QIAamp DNA 블러드 미니 키트 250(QIAamp DNA Blood Mini Kit 250) (Qiagen 51106)을 이용하여 HBV의 DNA를 분리하였다. 이를 이용하여 인핸서 II/BCP 부위가 포함된 X 유전자 부위를 전부 포함하는 영역(603-bp, 469-bp)을 두 번의 PCR로 증폭하였고 프리코어(precore) 유전자 부위를 전부 포함하는 영역(810-bp)을 표적으로 하여 PCR로 증폭한 후, 각각 염기서열을 분석하였다. 염기서열 위치의 기준은 야생형 유전자형 C형의 HBV의 전체 게놈 3215-bp (NCBI Reference Sequence: NC_003977.1)으로 하였다.
X 유전자 부위의 1차 PCR을 위한 프라이머 쌍으로는 정방향 프라이머로서 HBx-F1 프라이머(서열번호 1) (5'-TGT TTT GCT CGC AGC TGG TCT G-3'; 센스 뉴클레오타이드, 1291번째 염기부터 1312번째 염기까지에 해당)와 역방향 프라이머로서 HBx-R1 프라이머(서열번호 2) (5'-AGC CAC CCA AGG CAC AGC TTG G-3'; 안티센스 뉴클레오타이드, 1872번째 염기부터 1893번째 염기까지에 해당)를 이용하였고, X 유전자 부위의 2차 PCR을 위한 프라이머 쌍으로는 정방향 프라이머로서 HBx-F2 프라이머(서열번호 3)(5'-CAT GGC TGC TAG GCT GTG CTG-3'; 센스 뉴클레오타이드, 1373번째 염기부터 1393번째 염기까지에 해당)와 역방향 프라이머로서 HBx-R2 프라이머(서열번호 4)(5'-GAG ATG ATT AGG CAG AGG TGA AAA AG-3'; 안티센스 뉴클레오타이드, 1820번째 염기부터 1845번째 염기까지에 해당)를 이용하였다.
프리코어(Precore) 유전자 부위의 PCR을 위한 프라이머 쌍으로는 정방향 프라이머로서 preC-F1 프라이머(서열번호 5)(5'-GTG CAC TTC GCT TCA CCT CTG CAC-3'; 센스 뉴클레오타이드, 1579번째 염기부터 1602번째 염기까지에 해당)와 역방향 프라이머로서 preC-R1 프라이머(서열번호 6)(5'-AGG CGA GGG AGT TCT TCT TCT AGG -3'; 안티센스 뉴클레오타이드, 2366번째 염기부터 2389번째 염기까지에 해당)를 이용하였다.
PCR 조건으로서, 최초 변성(denature)은 94℃에서 5분간 수행하였고, "95℃에서 30초, 55℃에서 30초, 72℃에서 30초"의 반응조건을 40사이클(cycle)로 반복 수행하였고, 최종 연장(final extension)은 72℃에서 5분간 수행하였다. X 유전자 부위의 2차 PCR 조건으로서, 최초 변성(denature)은 94℃에서 5분간 수행하였고, "95℃에서 30초, 55℃에서 30초, 72℃에서 30초"의 반응조건을 35사이클(cycle)로 반복 수행하였고, 최종 연장(final extension)은 72℃에서 5분간 수행하였다.
4) 시퀀싱(Sequencing)을 통한 HBV X 유전자 및 프리코어 유전자 부위의 간세포암 예측용 마커들 조사
증폭된 PCR 산물은 인트론 PCR 클린-업 키트(Intron PCR clean-up kit)를 이용하여 회수하였고, X 유전자 부위의 상기 PCR 산물에 대한 염기서열 분석을 위한 프라이머 쌍으로는 정방향 프라이머로서 HBx-S1 프라이머(서열번호 7)(5'-CGG CGC TGA ATC CCG CGG AC-3'; 센스 뉴클레오타이드, 1436번째 염기부터 1455번째 염기까지에 해당)와 역방향 프라이머로서 HBx-S2 프라이머(서열번호 8)(5'-TGA ACA TAC CAA TTT ATG CC-3'; 안티센스 뉴클레오타이드, 1786번째 염기부터 1805번째 염기까지에 해당)를 이용하였고, 프리코어 유전자 부위의 상기 PCR 산물은 preC-F1 프라이머(서열번호 5)와 preC-R1 프라이머(서열번호 6)를 이용하여 양쪽으로 염기서열을 분석하였다.
각 검체 당 X 유전자와 프리코어 유전자 부위의 염기서열을 분석하여 돌연변이 여부를 판단하였다. 염기서열 분석은 자동염기서열 분석장치인 어플라이드 바이오시스템즈 모델 3100 DNA 제네틱 애널라이저(Applied Biosystems model 3100 DNA genetic analyser)로 수행하였고, 반응은 빅다이 터미네이터 사이클 시퀀싱 키트(BigDye Terminator Cycle Sequencing Kit)를 이용하여 수행하였다. 주형 DNA로는 30ng의 회수된 PCR 산물을 사용하였고, 프라이머는 X 유전자 또는 프리코어 유전자에 대한 양방향 프라이머 중에 한쪽 방향의 프라이머 3 pmol을 빅다이 터미네이터 v3.1 RR-100 믹스(BigDye Terminator v3.1 RR-100 mix) 0.5㎕에 첨가하고 멸균증류수를 추가하여 최종 부피가 10㎕가 되도록 하여 반응을 수행하였다. 반응 조건은 "96℃에서 10초, 50℃에서 5초, 60℃에서 2분"으로서 25 사이클을 반복 수행하였다. 이와 같은 방법으로 분석된 염기서열을 사용하여 총 8개의 간세포암 예측용 마커들인 G1613A, C1653T, T1753V, A1762T, G1764A, A1846T, G1896A, G1899A 마커들의 돌연변이 여부에 대하여 조사하였다.
5) HBV 유전자 상의 간세포암 예측용 마커들을 이용한 간세포암 발병 위험도 예측 방법에 따른 각 환자 별 발병 위험도 분석 및 예측
상기 4)에서 조사한 HBV 유전자 상의 간세포암 예측용 마커들에 대한 각 환자 별 돌연변이의 유무, 간세포암 발병 위험도 등은 하기 표 26(간세포암 예측용 마커들에 대한 각 환자 별 돌연변이의 유무와 각 환자 별 발병 위험도 예측치)에 나타낸 바와 같다.
표 26
환자 1
유전자 G1613A C1653T T1753V A1762T G1764A A1846T G1896A G1899A
염기서열 G CT TC T A A G G
간세포암마커 유무 O O O O
예측모델  예측모델V1   예측모델V2 예측모델V3
간세포암발병 예측치 0.83 0.81 0.84
환자 2
유전자 G1613A C1653T T1753V A1762T G1764A A1846T G1896A G1899A
염기서열 GA CT TC A A T A G
간세포암마커 유무 O O O O O O
예측모델   예측모델V1   예측모델V2 예측모델V3
간세포암발병 예측치 0.50 0.91 0.84
환자 3
유전자 G1613A C1653T T1753V A1762T G1764A A1846T G1896A G1899A
염기서열 G C T T A T G A
간세포암마커 유무 O O O O
예측모델   예측모델V1   예측모델V2 예측모델V3
간세포암발병 예측치 0.27 0.25 0.47
환자 4
유전자 G1613A C1653T T1753V A1762T G1764A A1846T G1896A G1899A
염기서열 G C T A G A A G
간세포암마커 유무 O
예측모델   예측모델V1   예측모델V2 예측모델V3
간세포암발병 예측치  0.03    0.03   0.03
상기 HBV 유전자 상의 간세포암 예측용 마커들의 각 환자별 돌연변이 유무에 따라 "1" 또는 "0"을 값을 부여하고 이를 예측모델 V1, V2, 또는 V3의 수식에 대입하면 각 환자 별 간세포암 발병 위험도를 예측할 수가 있다.
예를 들어 상기 표 26의 환자 1의 경우, 예측모델 V1, V2, 또는 V3 수식에 의해 계산하면 각각 간세포암 발병 위험도 확률이 83%, 81%, 84%로 계산되어 고위험군으로서 간세포암 발병 위험도가 매우 높은 환자임을 확인할 수 있으며, 따라서 향후 발병에 대비하여 특별 관리가 필요하다고 할 수 있다.
마찬가지로 환자 2의 경우, 예측모델 V1, V2, 또는 V3 수식에 의해 계산하면 각각 간세포암 발병 위험도 확률이 50%, 91%, 84%로 계산되어 예측모델 V1에서는 간세포암 발병 위험도 확률이 50%로 중간값이지만, 예측모델 V2 및 V3에서 높은 값을 받아 역시 고위험군으로서 주의해서 관리할 필요성이 있다고 보여진다. 반면에, 환자 3과 환자 4의 경우는 간세포암 발병 위험도 확률이 예측모델 V1, V2, 및 V3 모두에서 50% 미만의 낮은 값을 받아 저위험군으로서 발병위험이 적은 것으로 판정할 수가 있다.
6) HBV 유전자 상의 간세포암 예측용 마커들 및 임상 데이터들을 이용한 간세포암 발병 위험도 예측 방법에 따른 각 환자 별 발병 위험도 분석 및 예측
상기 4)에서 조사한 HBV 유전자 상의 간세포암 예측용 마커들에 대한 각 환자 별 돌연변이의 유무, 임상 데이터들 수치들, 간세포암 발병 위험도 등은 하기 표 27(간세포암 예측용 마커들에 대한 각 환자 별 돌연변이의 유무, 각 환자 별 임상 데이터들과 각 환자 별 발병 위험도 예측치)에 나타낸 바와 같다.
표 27
환자 1
유전자 G1613A C1653T T1753V A1762T G1764A A1846T G1896A G1899A
염기서열 G CT TC T A A G G
간세포암 마커 유무 O O O O
임상데이터     age sex 혈소판수 INR AST/ALT HBV DNA
Data     44 m 164 1.17 2.64 1.10E+06
간세포암 마커 유무     O O
예측모델  예측모델Y1   예측모델Y4 예측모델Y7
간세포암 발병 예측치 0.92 0.94 0.95
환자 2
유전자 G1613A C1653T T1753V A1762T G1764A A1846T G1896A G1899A
염기서열 GA CT TC A A T A G
간세포암 마커 유무 O O O O O O
임상데이터 age sex 혈소판수 INR AST/ALT HBV DNA
Data 49 m 112 0.99 0.88 3.04E+05
간세포암 마커 유무 O O
예측모델   예측모델Y1   예측모델Y4 예측모델Y7
간세포암 발병 예측치 0.29 0.86 0.74
환자 3
유전자 G1613A C1653T T1753V A1762T G1764A A1846T G1896A G1899A
염기서열 G C T T A T G A
간세포암 마커 유무 O O O O
임상데이터 age sex 혈소판수 INR AST/ALT HBV DNA
Data 34 f 229 1 1.40 1.93E+05
간세포암 마커 유무 O O
예측모델   예측모델Y1   예측모델Y4 예측모델Y7
간세포암 발병 예측치 0.17 0.21 0.39
환자 4
유전자 G1613A C1653T T1753V A1762T G1764A A1846T G1896A G1899A
염기서열 G C T A G A A G
간세포암 마커 유무 O
임상데이터 age sex 혈소판수 INR AST/ALT HBV DNA
Data 30 f 209 1 0.44 9.71E+06
간세포암 마커 유무
예측모델   예측모델Y1   예측모델Y4 예측모델Y7
간세포암 발병 예측치 0.00 0.00 0.00
상기 HBV 유전자 상의 간세포암 예측용 마커들의 각 환자별 돌연변이 유무 그리고 각 환자별 임상 데이터 수치가 컷오프 값을 만족하는지 여부에 따라 "1" 또는 "0"을 값을 부여하고 이를 예측모델 Y1, Y4, 또는 Y7의 수식에 대입하면 각 환자 별 간세포암 발병 위험도를 예측할 수가 있다.
예를 들어 상기 표 27의 환자 1의 경우, 예측모델 Y1, Y4, 또는 Y7 수식에 의해 계산하면 각각 간세포암 발병 위험도 확률이 92%, 94%, 95%로 계산되어 고위험군으로서 간세포암 발병 위험도가 매우 높은 환자임을 확인할 수 있으며, 따라서 향후 발병에 대비하여 특별 관리가 필요하다고 할 수 있다.
마찬가지로 환자 2의 경우, 예측모델 Y1, Y4, 또는 Y7 수식에 의해 계산하면 각각 간세포암 발병 위험도 확률이 29%, 86%, 74%로 계산되어 예측모델 Y1에서는 간세포암 발병 위험도 확률이 50% 미만의 낮은 값이지만, 예측모델 Y4 및 Y7에서 높은 값을 받아 역시 고위험군으로서 주의해서 관리할 필요성이 있다고 보여진다. 반면에, 환자 3과 환자 4의 경우는 간세포암 발병 위험도 확률이 예측모델 Y1, Y4, 및 Y7 모두에서 50% 미만의 낮은 값을 받아 저위험군으로서 발병위험이 적은 것으로 판정할 수가 있다.
이상 본 발명을 상기 실시예를 들어 설명하였으나, 본 발명은 이에 제한되는 것이 아니다. 당업자라면 본 발명의 취지 및 범위를 벗어나지 않고 수정, 변경을 할 수 있으며 이러한 수정과 변경 또한 본 발명에 속하는 것임을 알 수 있을 것이다.

Claims (14)

  1. (a) 만성 B형 간질환 환자군과, 만성 B형 간질환으로부터 간세포암으로 진행된 환자군 사이에서 B형 간염 바이러스(HBV)의 유전자 상에서의 후보 간세포암 예측용 마커들의 돌연변이 차이를 확인하는 단계와,
    (b) 상기 (a) 단계에서 확인한 후보 간세포암 예측용 마커들 중에서 통계학적으로 유의적인 차이를 보이는 돌연변이가 나타나는 간세포암 예측용 마커들을 선정하는 단계와,
    (c) 상기 (b) 단계에서 선정된 간세포암 예측용 마커들의 조합에 대해 수학적 처리를 통해 얻어진 가중치를 상기 선정된 간세포암 예측용 마커들 각각에 부여하는 단계와,
    (d) 만성 B형 간질환 환자에서 채취한 시료로부터 B형 간염 바이러스(HBV)의 유전자의 염기서열을 분석하고, 분석된 염기서열에서 상기 선정된 간세포암 예측용 마커들의 돌연변이들의 유무를 판단하는 단계와,
    (e) 상기 가중치가 부여된 선정된 간세포암 예측용 마커들의 돌연변이들의 유무에 따라 산출된 결과값에 기초하여 만성 B형 간질환 환자의 간세포암 발병 위험도를 결정하는 단계를 포함하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법.
  2. 제1항에 있어서,
    상기 후보 간세포암 예측용 마커들 중에서 간세포암 환자군에서 3% 이하로 돌연변이가 나타났으나 만성 B형 간질환 환자군에서는 돌연변이가 전혀 나타나지 않는 경우와 두 환자군에서 모두 돌연변이가 나타나며 그 빈도가 비슷한 경우는 간세포암 예측용 마커들에서 제외하고, 간세포암 환자군에서 만성 B형 간질환 환자군 보다 돌연변이 빈도가 두 배 이상 증가한 경우를 기준으로 간세포암 발병과 유의성이 있는 돌연변이로 판단하고 이에 해당하는 후보 간세포암 예측용 마커를 간세포암 예측용 마커로 선정하는 것을 특징으로 하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법.
  3. 제2항에 있어서,
    카이제곱검정 및 베이지안 통계분석을 실시한 결과, OR (Odds ratio)의 신뢰구간(95%CI)과 P 밸류(P value)를 기준으로 각각 OR > 2 및 p < 0.05의 조건을 만족하는 것을 간세포암 예측용 마커로 선정하는 것을 특징으로 하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 선정된 간세포암 예측용 마커들은 HBV 유전자 상의 X 유전자 및 프리코어/코어(precore/core) 유전자 내에서 유의적인 돌연변이를 나타내는 간세포암 예측용 마커들로서 G1613A, C1653T, T1753V, A1762T, G1764A, A1846T, G1896A 및 G1899A 마커들을 포함하고, 상기 간세포암 예측용 마커들은 야생형 염기, 유전자 위치 및 변이형 염기 순서로 표시한 것으로서, 돌연변이가 나타나는 염기 위치는 야생형 유전자형 C형의 HBV의 전체 게놈 3215bp (NCBI Reference Sequence: NC_003977.1)를 기준으로 표시한 것을 특징으로 하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법.
  5. 제4항에 있어서,
    상기 간세포암 예측용 마커들의 조합은 G1613A, C1653T, T1753V, A1762T, G1764A, A1846T, G1896A 및 G1899A 마커들로 구성된 군으로부터 선택된 적어도 3개의 마커들의 조합인 것을 특징으로 하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법.
  6. 제5항에 있어서,
    상기 간세포암 예측용 마커들의 조합은 A1762T, T1753V, G1613A 및 C1653T 마커들의 조합, G1764A, T1753V, G1613A 및 C1653T 마커들의 조합, 또는 G1764A, T1753V, C1653T 및 G1899A 마커들의 조합인 것을 특징으로 하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법.
  7. 제4항에 있어서,
    상기 (e) 단계에서는 하기 수학식 1에 따른 계산결과에 따라 간세포암 발병 위험도를 결정하는 것을 특징으로 하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법:
    수학식 1
    prob (간세포암 발병 위험도) = exp(V)/(1+exp(V));
    상기 식에서 V는 V1, V2 또는 V3이고;
    V1=-3.5058+2.4961×A1762T+1.676×T1753V+0.9117×G1613A+0.9214×C1653T;
    V2=-3.6216+2.5405×G1764A+1.5751×T1753V+0.8847×G1613A+0.9529×C1653T;
    V3=-3.5562+2.4317×G1764A+1.5895×T1753V+1.2222×C1653T+1.0057×G1899A이며;
    상기 V1, V2 및 V3의 공식들에서 간세포암 예측용 마커가 변이형인 경우에는 해당 간세포암 예측용 마커의 독립변수에 "1"의 값을 대입하여 가중치와 곱셈을 하고 간세포암 예측용 마커가 야생형인 경우에는 해당 간세포암 예측용 마커의 독립변수에 "0"의 값을 대입한다.
  8. (a) 만성 B형 간질환 환자군과, 만성 B형 간질환으로부터 간세포암으로 진행된 환자군 사이에서 B형 간염 바이러스(HBV)의 유전자 상에서의 후보 간세포암 예측용 마커들의 돌연변이 차이를 확인하는 단계와,
    (b) 상기 (a) 단계에서 확인한 후보 간세포암 예측용 마커들 중에서 통계학적으로 유의적인 차이를 보이는 돌연변이가 나타나는 간세포암 예측용 마커들을 선정하는 단계와,
    (c) 상기 (b) 단계에서 선정된 간세포암 예측용 마커들의 조합에 대해 수학적 처리를 통해 얻어진 가중치를 상기 선정된 간세포암 예측용 마커들 각각에 부여하는 단계와,
    (d) 만성 B형 간질환 환자군과, 만성 B형 간질환으로부터 간세포암으로 진행된 환자군 사이에서 간경변증에 따른 유의적인 수치적 차이를 나타내는 간세포암 예측용 임상 데이터들을 선정하는 단계와,
    (e) 상기 (d) 단계에서 선정된 간세포암 예측용 임상 데이터들의 조합에 대해 수학적 처리를 통해 얻어진 가중치를 상기 선정된 간세포암 예측용 임상 데이터들 각각에 부여하는 단계와,
    (f) 만성 B형 간질환 환자에서 채취한 시료로부터 B형 간염 바이러스(HBV)의 유전자의 염기서열을 분석하고, 분석된 염기서열에서 상기 선정된 간세포암 예측용 마커들의 돌연변이들의 유무를 판단하는 단계와,
    (g) 상기 가중치가 부여된 선정된 간세포암 예측용 마커들의 돌연변이들의 유무에 따라 산출된 제1 결과값을 얻는 단계와,
    (h) 상기 (e) 단계에서 가중치가 부여된 간세포암 예측용 임상 데이터들이 미리 결정된 컷오프 값을 만족하지는 여부에 따라 산출된 제2 결과값 또는 상기 가중치가 부여된 간세포암 예측용 임상 데이터들 수치들 자체로부터 산출된 제2 결과값을 얻는 단계와,
    (i) 상기 가중치가 부여된 간세포암 예측용 마커들의 돌연변이들의 유무에 따라 산출된 제1 결과값과, 상기 가중치가 부여된 간세포암 예측용 임상 데이터들이 미리 결정된 컷오프 값을 만족하지는 여부에 따라 산출된 제2 결과값 또는 상기 가중치가 부여된 간세포암 예측용 임상 데이터들 수치들 자체로부터 산출된 제2 결과값을 조합한 후, 이들 조합된 제1 결과값과 제2 결과값에 대해 수학적 처리를 하여 얻어진 가중치를 상기 제1 결과값과 제2 결과값 각각에 부여하고 가중치가 부여된 상기 제1 결과값과 제2 결과값에 기초하여 만성 B형 간질환 환자의 간세포암 발병 위험도를 결정하는 단계를 포함하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법.
  9. 제8항에 있어서,
    상기 선정된 간세포암 예측용 임상 데이터들은 혈소판수(platelet count), INR(혈액응고수치), 알부민 수치, AST/ALT, HBV DNA log 값 농도 [단위; cpm (copy per ml)] 및 AFP 수치를 포함하고, 상기 선정된 간세포암 예측용 마커들은 HBV 유전자 상의 X 유전자 및 프리코어/코어(precore/core) 유전자 내에서 유의적인 돌연변이를 나타내는 간세포암 예측용 마커들로서 G1613A, C1653T, T1753V, A1762T, G1764A, A1846T, G1896A 및 G1899A 마커들을 포함하며, 상기 간세포암 예측용 마커들은 야생형 염기, 유전자 위치 및 변이형 염기 순서로 표시한 것으로서, 돌연변이가 나타나는 염기 위치는 야생형 유전자형 C형의 HBV의 전체 게놈 3215bp (NCBI Reference Sequence: NC_003977.1)를 기준으로 표시한 것을 특징으로 하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법.
  10. 제9항에 있어서,
    상기 간세포암 예측용 임상 데이터들의 조합은 혈소판수(platelet count), INR(혈액응고수치), 알부민 수치, AST/ALT, HBV DNA log 값 농도 [단위; cpm (copy per ml)] 및 AFP 수치로 구성된 군으로부터 선택된 적어도 3개의 임상데이터들의 조합이고, 상기 간세포암 예측용 마커들의 조합은 G1613A, C1653T, T1753V, A1762T, G1764A, A1846T, G1896A 및 G1899A 마커들로 구성된 군으로부터 선택된 적어도 3개의 마커들의 조합인 것을 특징으로 하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법.
  11. 제10항에 있어서,
    상기 간세포암 예측용 임상 데이터들의 조합은 HBV DNA log 값 농도, 혈소판수, INR(혈액응고수치) 및 AST/ALT 임상데이터들의 조합, 혈소판수, 알부민 수치 및 AST/ALT 임상데이터들의 조합, 또는 혈소판수, 알부민수치, AST/ALT 및 AFP 수치 임상데이터들의 조합이고, 상기 간세포암 예측용 마커들의 조합은 A1762T, T1753V, G1613A 및 C1653T 마커들의 조합, G1764A, T1753V, G1613A 및 C1653T 마커들의 조합, 또는 G1764A, T1753V, C1653T 및 G1899A 마커들의 조합인 것을 특징으로 하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법.
  12. 제9항에 있어서,
    상기 (i) 단계에서는 하기 수학식 2에 따른 계산결과에 따라 간세포암 발병 위험도를 결정하는 것을 특징으로 하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법:
    수학식 2
    prob (간세포암 발병 위험도) = exp(Y)/(1+exp(Y));
    상기 식에서 Y는 Y1, Y2, Y3, Y4, Y5, Y6, Y7, Y8 또는 Y9이고;
    Y1=0.3866+0.9855×V1+0.8382×L1; Y2=-0.3628+0.9415×V1+0.1585×L2;
    Y3=-0.5648+0.8598×V1+0.2798×L3; Y4=0.3955+1.004×V2+0.8788×L1;
    Y5=-0.3742+0.9516×V2+0.163×L2; Y6=-0.5864+0.8592×V2+0.2842×L3;
    Y7=0.32+0.9924×V3+0.8951×L1; Y8=-0.3898+0.9793×V3+0.1696×L2;
    Y9=-0.6357+0.9193×V3+0.2966×L3이며;
    V1=-3.5058+2.4961×A1762T+1.676×T1753V+0.9117×G1613A+0.9214×C1653T;
    V2=-3.6216+2.5405×G1764A+1.5751×T1753V+0.8847×G1613A+0.9529×C1653T;
    V3=-3.5562+2.4317×G1764A+1.5895×T1753V+1.2222×C1653T+1.0057×G1899A이고;
    L1=-5.4174+1.7473×HBV DNA log 값 농도(cpm)+2.597×혈소판수+3.4715×INR(혈액응고수치)+2.9311×AST/ALT;
    L2= 9.6571-0.0102×혈소판수-2.9553×알부민 수치+3.2599×AST/ALT;
    L3=8.0414-0.0211×혈소판수-2.1554×알부민수치+3.1704×AST/ALT+0.0108×AFP이며,
    상기 V1, V2 및 V3의 공식들에서 간세포암 예측용 마커가 변이형인 경우에는 해당 간세포암 예측용 마커의 독립변수에 "1"의 값을 대입하여 가중치와 곱셈을 하고 간세포암 예측용 마커가 야생형인 경우에는 해당 간세포암 예측용 마커의 독립변수에 "0"의 값을 대입하고,
    상기 L1의 공식에서 간세포암 예측용 임상 데이터들이 미리 결정된 컷오프 값을 만족하는 경우에는 해당 간세포암 예측용 임상 데이터의 독립변수에 "1"의 값을 대입하여 가중치와 곱셈을 하고 컷오프 값을 만족하지 않는 경우에는 해당 간세포암 예측용 임상 데이터의 독립변수에 "0"의 값을 대입하며,
    상기 L2 및 L3의 공식에서는 간세포암 예측용 임상 데이터가 컷오프 값을 만족하는지 관계없이 검사수치 결과를 그대로 해당 간세포암 예측용 임상 데이터의 독립변수에 대입한다.
  13. 제12항에 있어서,
    상기 간세포암 예측용 임상 데이터들 중 혈소판수의 컷오프 값은 <145,000/mm3, INR(혈액응고수치)의 컷오프 값은 >1, AST/ALT의 컷오프 값은 >1.0, HBV DNA log 값 농도(cpm)의 컷오프 값은 < 6인 것을 특징으로 하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법.
  14. 제1항 또는 제8항에 있어서,
    상기 가중치는 가장 낮은 가중치를 기준으로 1~10배까지인 것을 특징으로 하는 만성 B형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법.
PCT/KR2011/007895 2010-11-23 2011-10-21 만성 b형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법 WO2012070776A2 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2010-0116880 2010-11-23
KR1020100116880A KR101268902B1 (ko) 2010-11-23 2010-11-23 만성 b형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법

Publications (2)

Publication Number Publication Date
WO2012070776A2 true WO2012070776A2 (ko) 2012-05-31
WO2012070776A9 WO2012070776A9 (ko) 2012-08-23

Family

ID=46146235

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2011/007895 WO2012070776A2 (ko) 2010-11-23 2011-10-21 만성 b형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법

Country Status (2)

Country Link
KR (1) KR101268902B1 (ko)
WO (1) WO2012070776A2 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015150495A1 (en) * 2014-04-01 2015-10-08 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods for assessing whether a patient suffering from chronic hepatitis b infection is associated with moderate or advanced fibrosis
CN108315413A (zh) * 2017-12-31 2018-07-24 郑州大学第附属医院 一种人肝癌标志物及其用途
CN110184350A (zh) * 2019-05-29 2019-08-30 阿吉安(福州)基因医学检验实验室有限公司 用于预测乙肝患者肝癌易感性的引物、探针及试剂盒
CN111613324A (zh) * 2020-05-15 2020-09-01 高春芳 一种机器学习模型高通量分析乙型肝炎病毒基因组rt/s区序列特征预测肝癌风险的方法
CN112626277A (zh) * 2021-01-18 2021-04-09 中国人民解放军海军军医大学 乙型肝炎病毒突变位点t176c在制备预测肝癌复发的试剂盒中的应用
CN116167462A (zh) * 2023-04-23 2023-05-26 南方医科大学南方医院 肝细胞癌预测模型构建方法、肝细胞癌预测方法及装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015050921A1 (en) * 2013-10-01 2015-04-09 The Regents Of The University Of Michigan Algorithms to identify patients with hepatocellular carcinoma
WO2021091288A1 (ko) * 2019-11-06 2021-05-14 서울대학교병원 기계 학습 모델을 이용한 간세포암 예측 방법 및 시스템
KR102647669B1 (ko) 2020-07-31 2024-03-14 고려대학교 산학협력단 Mr 기반의 비알코올 지방간염 진단을 위한 정보제공방법

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015150495A1 (en) * 2014-04-01 2015-10-08 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods for assessing whether a patient suffering from chronic hepatitis b infection is associated with moderate or advanced fibrosis
CN108315413A (zh) * 2017-12-31 2018-07-24 郑州大学第附属医院 一种人肝癌标志物及其用途
CN110184350A (zh) * 2019-05-29 2019-08-30 阿吉安(福州)基因医学检验实验室有限公司 用于预测乙肝患者肝癌易感性的引物、探针及试剂盒
CN111613324A (zh) * 2020-05-15 2020-09-01 高春芳 一种机器学习模型高通量分析乙型肝炎病毒基因组rt/s区序列特征预测肝癌风险的方法
CN112626277A (zh) * 2021-01-18 2021-04-09 中国人民解放军海军军医大学 乙型肝炎病毒突变位点t176c在制备预测肝癌复发的试剂盒中的应用
CN112626277B (zh) * 2021-01-18 2022-09-02 中国人民解放军海军军医大学 乙型肝炎病毒突变位点t176c在制备预测肝癌复发的试剂盒中的应用
CN116167462A (zh) * 2023-04-23 2023-05-26 南方医科大学南方医院 肝细胞癌预测模型构建方法、肝细胞癌预测方法及装置
CN116167462B (zh) * 2023-04-23 2023-08-15 南方医科大学南方医院 肝细胞癌预测模型构建方法、肝细胞癌预测方法及装置

Also Published As

Publication number Publication date
KR20120055252A (ko) 2012-05-31
KR101268902B1 (ko) 2013-05-29
WO2012070776A9 (ko) 2012-08-23

Similar Documents

Publication Publication Date Title
WO2012070776A2 (ko) 만성 b형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법
WO2012081898A2 (ko) 위암의 예후 예측용 마커 및 이를 이용하는 위암의 예후 예측 방법
Al‐Qahtani et al. Toll‐like receptor 3 polymorphism and its association with hepatitis B virus infection in Saudi Arabian patients
Moudi et al. Association between IL-10 gene promoter polymorphisms (-592 A/C,-819 T/C,-1082 A/G) and susceptibility to HBV infection in an Iranian population
WO2019199105A1 (ko) 알츠하이머성 치매가 발병될 가능성 평가방법
Chan et al. Positional expression profiling indicates candidate genes in deletion hotspots of hepatocellular carcinoma
Wang et al. Association between APOC3 polymorphisms and non-alcoholic fatty liver disease risk: a meta-analysis
WO2017086675A1 (ko) 대사 이상 질환 진단 장치 및 그 방법
WO2017082655A1 (ko) 항암 치료 내성 판단 방법 및 상기 방법에 사용되는 조성물
WO2022097844A1 (ko) 유전자 복제수 변이 정보를 이용하여 췌장암 환자의 생존 예후를 예측하는 방법
WO2023234659A1 (ko) 퇴행성 턱관절염의 진단 또는 예후 예측용 유전자 마커 및 이의 용도
Talaat et al. Genetic polymorphism in toll-like receptor 3 and interferon regulatory factor 3 in hepatitis C virus-infected patients: correlation with liver cirrhosis
WO2012141445A2 (ko) 만성 b형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법
Baghi et al. Impact of the IL-10 promoter gene polymorphisms in the severity of chronic hepatitis B infection
WO2015167087A1 (ko) Dna 복제수 변이를 이용한 강직성 척추염 발병 위험도 예측 방법
WO2022119327A1 (ko) 선천적 대사질환 위험도 점수를 이용한 심뇌혈관질환의 위험도 측정 방법
WO2018021636A1 (ko) 휴먼 하플로타이핑 시스템 및 방법
WO2022220527A1 (ko) 피부색 판단용 유전자 다형성 마커 및 이의 용도
WO2023106680A1 (ko) 비타민 c를 포함하는 처방의 피부 밝기 변화 예측 방법 및 시스템
WO2020130467A2 (ko) Cd8+ 메모리 t 세포 매개성 질환의 예방 또는 치료용 약학 조성물
Kafeero et al. Host genetic factors associated with hepatitis B virus infection and progression to chronic disease: A systematic review and Meta analysis
WO2023204522A1 (ko) 심근경색과 연관된 유전자 다형성 및 그의 용도
WO2023204381A1 (ko) 유럽-동아시아인 데이터 기반 알츠하이머병 치매의 발병 위험군 또는 조기 증상 발현 위험군, 기억상실형 경도인지장애의 발병 위험군 및/또는 아밀로이드β 침착에 대한 PET 양성 위험군을 예측하기 위한 정보를 제공하는 방법
US20140134600A1 (en) Biomarkers associated with development of hepatocellular carcinoma in patients with hepatitis b virus infection, and method for detection thereof
WO2024090805A1 (ko) 폐암 진단용 메틸화 마커 및 이의 조합

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11843898

Country of ref document: EP

Kind code of ref document: A2

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11843898

Country of ref document: EP

Kind code of ref document: A2