WO2016140432A2 - 생체나이를 이용한 잔여 수명 예측방법 - Google Patents

생체나이를 이용한 잔여 수명 예측방법 Download PDF

Info

Publication number
WO2016140432A2
WO2016140432A2 PCT/KR2016/000353 KR2016000353W WO2016140432A2 WO 2016140432 A2 WO2016140432 A2 WO 2016140432A2 KR 2016000353 W KR2016000353 W KR 2016000353W WO 2016140432 A2 WO2016140432 A2 WO 2016140432A2
Authority
WO
WIPO (PCT)
Prior art keywords
age
value
examination
equation
survival
Prior art date
Application number
PCT/KR2016/000353
Other languages
English (en)
French (fr)
Inventor
유진호
김양석
Original Assignee
주식회사 바이오에이지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 바이오에이지 filed Critical 주식회사 바이오에이지
Priority to CN201680020966.9A priority Critical patent/CN108475542A/zh
Priority to JP2017546614A priority patent/JP6640868B2/ja
Publication of WO2016140432A2 publication Critical patent/WO2016140432A2/ko
Priority to HK18115784.8A priority patent/HK1256728A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data

Definitions

  • the present invention relates to a method for measuring the remaining life of a person using a living age and a survival probability, and more particularly, a method for predicting survival probability using a living age measured through a biological age measurement algorithm reflecting a result of a health examination. It relates to a method of predicting the remaining life using the survival probability predicted by the method.
  • liver cancer prediction system for early diagnosis of liver cancer and its control method
  • a technology for predicting and treating cancer there is a technology for predicting and treating cancer, and it is a relative risk of liver cancer occurrence estimation and estimation of liver cancer incidence by individual.
  • a method for predicting liver cancer for early diagnosis of liver cancer, and a control method thereof which classify the liver cancer risk group by classifying the liver cancer incidence rate and the relative risk of liver cancer occurrence.
  • Techniques include general patient information, ultrasound follow-up information, findings at initial patient registration, and liver cancer diagnosis.
  • Hepatocarcinoma is generated by storing clinical information and risk group information including information on findings in the database and calculating the regression coefficient, which is a contribution corresponding to each risk factor, based on the stored clinical information and risk group information, and measuring the risk of liver cancer.
  • Liver cancer occurrence can be prevented according to the prediction, and the classification of the liver cancer risk group is carried out through the liver cancer incidence rate and the relative risk of liver cancer occurrence, thereby establishing the basis of a customized liver cancer prediction model.
  • the patient's doctor can continuously monitor the patient's risk by receiving liver cancer prediction results in the form of a short message through a mobile communication terminal or through an e-mail, and can take immediate action in the event of a risk situation. There was something about technology.
  • the conventional predictive technologies are medically predicted for a specific disease and based on the predicted information, and most of them are unable to measure how the lifespan of a human is changed according to the current state of health.
  • the present inventors confirmed that the remaining life can be reliably predicted when the remaining life prediction is performed using a large-scale database that examines the age of the living body and the lifespan of Koreans. It was completed.
  • An object of the present invention is to provide a method for measuring the survival probability using the biological age measured based on the data obtained from the health examination.
  • Another object of the present invention to provide a method for measuring the remaining life, using the age and survival probability measured by the above method.
  • the present invention provides a method for predicting survival probability using the age of the living body and the following equation (1) using the screening test results:
  • Equation (1) S0 (t) is the probability of survival after t years from the time of survival on the National Statistical Office data, D is the age of living body-birth, is the mean of D, and a is the survival probability of D. Influence, (t), represents the probability of survival until t years after being calibrated using living body age.
  • the present invention also shows that the x-axis value corresponding to the survival probability value of the examinee of the y-axis in the graph created with the expected life expectancy (ER) on the x-axis and the y-axis as the T-year later from the date of receiving the examiner's examination. It provides a remaining life prediction method characterized in that the remaining life remaining.
  • ER expected life expectancy
  • Figure 1 shows a schematic representation of the remaining life prediction method according to the present invention.
  • Figure 2 shows the average survival probability until T years after birth age according to the 2013 statistical data.
  • FIG. 3 is a graph of survival probability of life expectancy by age of average Koreans according to the 2013 Statistics Office data.
  • birth age refers to the number of years to survive until the day of the health check on the basis of the birth date
  • bio age refers to the health check item as an input value after applying a statistical algorithm The age that reflects the individual's health status.
  • T-year survival probability refers to the probability of surviving up to the next year on the basis of the day of the health screening
  • ER Exected life expectancy
  • EL Expected Life
  • CA age of birth
  • ER life expectancy
  • the "survival probability graph to life expectancy (SP2ER)" is a graph (expected life expectancy (ER) on the x-axis, the y-axis survival probability (SP) after T years (segmented by age, age, statistics office announcement) Say.
  • SPBA probability of survival after T years based on living age
  • CA age of birth
  • BA bio age
  • SP T-year survival probability
  • life survival probability graph based on life age (BA) (SP2ERBA) is the life expectancy of life (ER) on the x-axis
  • T-year survival probability (SPBA) based on the biological age (BA) on the y-axis Refers to the graph (divided by gender and age).
  • the "residual life (RL)" is a life expectancy calculated by using the survival probability graph (SP2ERBA) up to the life expectancy based on life expectancy (SP2ER) and life expectancy (BA2) based on age (BA) The number of years left to survive.
  • SP2ERBA survival probability graph
  • BA2 life expectancy
  • the present invention relates to a method for measuring the survival probability using the age of living body using the test results and the following equation (1):
  • Equation (1) S0 (t) is the probability of survival after t years from the time of survival on the National Statistical Office data, D is the age of living body-birth, is the mean of D, and a is the survival probability of D. Influence, (t), represents the probability of survival until t years after being calibrated using living body age.
  • a is automatically calculated using Cox proportional hazards model algorithm using survival data as an input value, and a common statistical analysis such as SPSS, SAS, and R package is performed. It can be implemented by running commercial or free company analysis software.
  • Survival data refers to data that have information on whether or not they have died or survived when observed to a specific point in time for each subject who has undergone health examination.
  • the a value and the value in the formula (1) according to the present invention may have a value as shown in Table 1 depending on the age, but is not limited thereto.
  • the biological age may be characterized by the following formula (2) ⁇ (3):
  • preBA is the age of the causal body before correction by Eq. (3)
  • BA is the age of the body after calibration based on the age of the caustic body (preBA)
  • xj is the screening value of the subject's jth examination item
  • Is the mean value in the sample of the jth check item
  • sd (xj) is the standard deviation in the sample of the jth check item
  • ⁇ ij is the i factor value of the jth check item, which can explain the actual age of each sample.
  • m is the number of factors obtained as a result of performing the principal component analysis
  • Pi is the weight of the i factor value given to the preBA calculation
  • y is the birth age of each individual
  • sd (y) is the standard deviation of y
  • the Bij may be a value calculated by inputting two or more variables (Xj) measured through a checkup examination into the principal component analysis statistical algorithm using the SPSS, SAS, and R pack age programs.
  • m represents the number of principal component factors, which are automatically determined when the eigen value is set to 1 when the principal component analysis algorithm is executed.
  • the measurement of the age of the living body may use the method described in Korean Patent Publication No. 2014-0126229.
  • x is waist circumference (WC), hard working skill (FEV1) for 1 second, liver enzyme (G-GTP), urea nitrogen (BUN), high lipoprotein (HDL), low protein (LDL), triglyceride (TG), fasting blood sugar (FBS), body fat percentage (FBR), muscle percentage (BMR), albumin-globulin ratio (AGR) and systolic blood pressure (SBP) Results
  • waist circumference (WC), systolic blood pressure (SBP), liver enzymes (G-GTP), high-lipoprotein (HDL), triglycerides (TG), fasting blood sugar (FBS), hemoglobin (Hemoglobin), low-protein ( LDL), body mass index (BMI) and pulse pressure (PP) may be characterized in that the result of the health check item selected from the group consisting of.
  • x is waist circumference (WC), hard work ability (FEV1), gamma-GTP) G-GTP), urea nitrogen (BUN), high fat protein (HDL), and jersey for 1 second.
  • LDL Protein
  • triglyceride TG
  • FBS fasting blood sugar
  • FBR body fat percentage
  • BMR muscle percentage
  • AGR albumin-globulin ratio
  • DBP diastolic blood pressure
  • ESR erythrocyte sedimentation rate
  • body mass BMI
  • PP pulse pressure
  • One or more samples, which are existing examination data, may be input to the bio-age prediction model used in the present invention. All samples may be input to the biometric calculation model regardless of whether the sample includes a checkpoint value of a variable (check item) included in the biometric calculation model, but the checkpoint value of the variable included in the biometric calculation model It is preferable that only samples including all of them be input. For example, only the samples having both the BMI check value, the spirometry test value, and the one second check value are input to the first biometric calculation model, and the BMI check value, the spirometry check value, and the PSA check are input to the second biometric calculation model. Only samples with all values can be entered.
  • a principal component analysis may be performed on the input data.
  • one or more factors capable of describing the data input to the biometric calculation model may be obtained.
  • the number of factors obtained may be less than the number of variables of the biometric model.
  • the number of factors is m
  • the number of variables of the biometric model is n.
  • the i-th factor values included in the j-th variable values of each sample input to the bio- age calculation model mean a degree that can explain the actual age.
  • the weight Bij can be calculated.
  • the Bij value is calculated through the principal component analysis method known in general statistical analysis. In other words, Bij is a factor loading matrix for each variable that is automatically calculated when the principal component analysis process is performed.
  • the weight component Pi which the i-th factor value gives to the calculation of the biological age, may also be calculated through the principal component analysis.
  • a method for calculating the weight Pi will be described.
  • the weight Pi may be calculated using a coefficient of determination (R2) between a factor score of each sample calculated from the principal component analysis and a real age.
  • R2 coefficient of determination
  • the calculation method of the weight Pi using the determination coefficient is as follows.
  • factor scores for each factor of each sample used in the analysis are calculated through principal component analysis. For example, if there are 100 samples and m factors, 100 factor scores will be calculated for each m factor.
  • the factor score for each factor and the actual age of each sample are regressed to determine m decision coefficients ( Calculate. If the sum of the m decision coefficients is S, the weight Pi given by the i-th factor to the calculation of the biological age can be calculated using Equation 1 below.
  • the weight Pi may be calculated using an eigen value for each factor calculated as a result of the principal component analysis. In this case, the weight Pi may be calculated using Equation 2 below.
  • Equation 2 ei is the eigen value of the factor i, m is the number of factors.
  • a bio age calculation equation based on the bio age calculation model may be generated using the factor.
  • the living body age may be calculated according to Equation 3 based on Equation (2).
  • xj is the screening value of the jth screening item of the subject
  • Is the mean value in the sample of the jth check item
  • sd (xj) is the standard deviation in the sample of the jth check item
  • Bij is the i-th factor value of the jth check item in the principal component analysis.
  • M is the number of factors obtained as a result of performing the principal component analysis
  • Pi is the weight of the i th factor value for the calculation of BA
  • BA is the age of the living body
  • preBA and preBA ' is the age of the progeny
  • xj is the number of examination of the jth examination item of the examinee
  • Is the mean value in the sample of the jth check item
  • sd (xj) is the standard deviation in the sample of the jth check item
  • Bij is the result of the principal component analysis and the i factor value of the jth check item can explain the actual age of each sample.
  • m is the number of factors obtained as a result of the principal component analysis
  • Pi is the weight of the i factor value given to the preBA calculation
  • y is the birth age (CA) of each individual
  • sd (y) is the standard deviation of y
  • the y mean is the mean of the actual age of all the samples
  • the sd (y) may be a standard deviation of the actual age of all the samples
  • the average is the mean of the actual age of all the samples having a valid value of the numerical data of all the screening items included in the biometric model
  • the sd (y) is all of the included in the biometric model It may also be the standard deviation of the actual age of all samples that have the numerical value of the screening item as a valid value.
  • the sample data is input to the biological age calculation model and subjected to principal component analysis on the input data, one or more factors may be obtained, and the biological age calculation formula may be obtained using the principal component analysis result and the factors.
  • the biological age calculation formula may be obtained using the principal component analysis result and the factors.
  • the step forward selection method will be described. It is assumed that the original set includes five screening items, BMI, spirometry, one second, albumin, and PSA, as elements.
  • a test model is created that contains one variable.
  • samples including the values of the corresponding variables that is, the check values of the corresponding examination items, are input to the generated test model, and the factors obtained by performing the principal component analysis on the input samples are obtained.
  • the biometric age calculation is generated using the analysis results.
  • variables newly added to the test model will be described as test screening items.
  • biometric age of each sample is calculated by inputting the inputted samples to the biometric calculation formula.
  • a simple regression equation BA a + by is generated by regression analysis of the distribution of samples.
  • Decision coefficient values for each examination items obtained as a result of the first step are displayed.
  • the lung capacity with the highest value will be selected.
  • the spirometry value is included in the bioage calculation model.
  • the spirometry item has been added to the biometric model and thus removed from the original set.
  • a second screening item to be included in the biometric model is selected.
  • the test model of the second stage is a model having a total of two variables, including one of the spirometry screening item and one of the other screening items. Therefore, in the second stage, a total of four tests will be conducted: (spiracity, BMI), (spiracity, one second), (spiracity, albumin), and (spiracity, PSA).
  • samples including the values of the corresponding variables that is, the examination values of the corresponding examination items
  • the factors are obtained by performing principal component analysis on the input samples.
  • the results are used to generate biometric calculations.
  • BMI the screening item with the largest increase
  • the BMI value is included in the bioage calculation model together with the spirometry value. Since the BMI check item has been added to the biometric model, it is removed from the original set.
  • a third screening item to be included in the biometric model is selected.
  • the test model of the third stage is a model having a total of three variables, including one of the spirometry screening item, the BMI and other screening items.
  • the second stage three tests will be performed: (spiracity, BMI, one second), (spiracity, BMI, albumin), (spiracity, BMI, PSA).
  • the third stage also proceeds with the second stage and remarks. Since the determination coefficient value of one second amount is the only increase value compared to the existing determination coefficient value of 0.5, one second amount is selected as the third screening item included in the biological age calculation model. One second is removed from the original set.
  • a third screening item to be included in the biometric model is selected.
  • Both of the remaining screening items are producing biometric calculations with decision coefficients lower than the previous 0.6 coefficient.
  • the step forward progression step ends.
  • the biometric calculation model at the end of the step-by-step forward progress step is determined as a biometric calculation model to be applied to the received medical examination data.
  • the biometric age of the examinee may be calculated by inputting the received examination data into a biometric calculation formula according to the determined biometric model.
  • the examination data by adding the examination data to the sample data, it can be used as a sample for the next examinee.
  • Step forward selection step is a step of adding at least a part of the screening items to be included in the biological age calculation model from the screening items included in the examination data of the examinee one by one.
  • the determination coefficient may continue to increase as the step forward selection step proceeds, so that all the check items included in the examinee's examination data may be included in the biometric calculation model.
  • the sample input to the test model in the step-by-step selection step may be limited to the sample having the image information similar to the examinee of the received examination data.
  • the sample input to the test model may be the same as the sex of the examinee, and may be limited to having a real age in a predetermined range based on the actual age of the examinee.
  • stepwise forward selection step additional selection criteria may be used, as well as whether the coefficient of determination is increased as much as possible compared to that of the existing test model.
  • the test examination item when the number of samples having numerical data of the test examination item is less than a predetermined threshold value, the test examination item may be excluded. According to another embodiment, when the number of samples having all the check values of the check items included in the test model is less than a predetermined threshold value, the test check items may be excluded. This is because when the number of samples is less than the above threshold value, it is difficult to give reliability as statistical data.
  • the test examination item in which at least one of the examination items included in the test model and the correlation coefficient R exceed a predetermined threshold may be excluded from the test examination item. This is to prevent adverse effects that the influence of the existing examination items on the test model is reduced when the examination items having a high correlation with the examination items already included in the test model are included in the test model.
  • a test model includes a high correlation test item, a singularity phenomenon occurs during a matrix operation performed in the principal component analysis process, thereby preventing an eigen value from being properly calculated.
  • the correlation coefficient may be calculated using sample data having a check value of all the check items included in the test model.
  • the survival probability (statistics agency data) from the current survival time to t years later may use, for example, the life expectancy table of Table 2 and FIG. 2.
  • survival probability according to age in one embodiment of the present invention is shown in Table 3.
  • the present invention provides a survival probability up to T years after the life expectancy (ER) on the x-axis, the age of the y-axis and the survival probability using the equation (1).
  • the residual life measurement method is characterized in that the value of the x-axis corresponding to the survival probability value of the y-axis is set as the remaining life remaining from the date of receiving the examination.
  • the method for predicting remaining life uses a sex, age data, a health examination data, and a bioage age calculation algorithm (Equations (2) to (3)) to measure an individual's living age.
  • the x-axis life expectancy (ER) is measured by the method described above
  • the probability of survival after t years is calculated using a graph showing the t-year survival probability.
  • the survival probability value for each age based on the 2013 statistics office data was used (see Table 2 and FIG. 4).
  • the present invention is not limited thereto. It will be apparent to those skilled in the art that the accuracy can be improved.
  • the remaining life prediction method according to the present invention will be described through specific examples.
  • the average life expectancy of a Korean 50-year-old man (birth age 50) is 30.57 years (see Table 1).
  • the survival probability of these 50-year-old men is about 0.5595 (see Table 2).
  • the position of the survival probability value on the y axis is By setting an imaginary line parallel to the x-axis, the x-axis value of the point meeting the survival probability graph of the 50-year-old male is the remaining life according to the present invention (Fig. 4).
  • D life expectancy
  • the remaining life was measured by dividing 10,000 Korean male and female by age using the method of measuring the remaining life of the present invention, and the results are shown in FIGS. 7 and 8, respectively.

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

생체나이를 이용한 잔여 수명 예측방법
본 발명은 생체나이와 생존확률을 이용하여, 사람의 잔여수명을 측정하는 방법에 관한 것으로, 더욱 자세하게는 건강검진 결과를 반영하는 생체나이 측정알고리즘을 통해 측정된 생체나이를 이용한 생존확률 예측방법 및 상기 방법으로 예측된 생존확률을 이용하여 잔여수명을 예측하는 방법에 관한 것이다.
최근 사람의 질병 원인에 대한 많은 연구가 이루어지고 있음에도 불구하고 대부분이 흥미위주의 일회성 정보로 취급되고 있어서, 질병예방에는 별다른 효용이 없는 것이 사실이며, 이에 따른 대표적인 종래의 기술은 각 의료분야별로 질병을 예측하고 치료하는 기술이 있는 바, 특허출원번호 제2003-0067652호인 간암조기진단을 위한 간암 예측시스템 및 그 제어방법에 관한 기술로써, 개인별로 간암발생률의 추정과 간암발생의 상대적 위험(Relative risk)을 구하고, 각 개인별로 구한 간암발생률과 간암발생의 상대적 위험을 통해 간암발생위험군에 관한 계층화의 분류(Classify)를 수행하는 간암조기진단을 위한 간암 예측시스템 및 그 제어방법에 관한 기술이고, 상기 기술은 환자의 일반적인 정보, 초음파 시행에 따른 정보, 환자 최초등록시 소견과, 간암진단 시 소견에 관한 정보를 포함하는 임상정보 및 위험군 정보를 데이터베이스에 저장하고, 저장된 임상정보와 위험군 정보를 기반으로 각 위험요인에 해당하는 기여도인 회귀계수를 산출하여 간암발생 위험도를 측정함으로써, 간암발생 예측에 따른 개인별 간암발생을 예방할 수 있으며, 각 개인별로 구한 간암발생률과 간암발생의 상대적 위험을 통해 간암발생위험군에 관한 계층화의 분류를 수행함으로써, 맞춤형 간암발생예측모형의 기반을 구축하는 등의 효과가 있으며, 환자의 주치의는 간암 예측 결과를 이동통신단말을 통해 단문메시지 형태로 수신하거나 전자메일을 통해 수신함으로써 환자의 위험률을 지속적으로 모니터링할 수 있으며, 위험상황 발생시 즉각적으로 조치할 수 있는 효과가 있는 기술에 관한 것이 있었다.
상기와 같이 종래의 예측기술은 의학적으로 특정질병에 대하여 예측하고, 예측된 정보를 기반으로 치료하는 기술들이 대부분으로, 현재 건강상태에 따라 인간의 수명이 어떻게 변화되는지를 측정할 수는 없었다.
이에, 본 발명자들은 검강검진에서 얻어지는 데이터를 통하여 측정한 생체나이와 한국인의 수명을 조사한 대규모 데이터베이스를 이용하여 잔여수명 예측을 수행하는 경우, 신뢰성 있게 잔여수명을 예측할 수 있다는 것을 확인하고, 본 발명을 완성하게 되었다.
발명의 요약
본 발명의 목적은 건강검진에서 얻어지는 데이터를 기반으로 측정된 생체나이를 이용한 생존확률의 측정방법을 제공하는데 있다.
본 발명의 또 다른 목적은 상기 방법으로 측정된 생체나이와 생존확률을 이용하여, 잔여수명을 측정하는 방법을 제공하는데 있다.
상기 목적을 달성하기 위하여, 본 발명은 검강검진 결과를 이용하여 측정된 생체나이와 하기 식(1)를 이용한 생존확률의 예측방법을 제공한다:
식(1)
Figure PCTKR2016000353-appb-I000001
상기 식 (1)에서, S0(t)는 통계청 자료 상의 현재 생존해 있는 시점에서부터 t년 후의 생존확률이고, D는 생체나이-출생나이이며, 는 D의 평균, a는 D가 생존확률에 미치는 영향력, (t)는 생체나이를 이용하여 보정계산된 t년 후까지 생존확률을 나타낸다.
본 발명은 또한, x 축을 기대여명(ER), y 축을 T년 후까지 생존확률로 하여, 작성한 그래프에서, y축의 피검자의 생존확률 값에 대응하는 x 축의 값을 피검자의 검강검진을 받은 날로부터 남은 잔여수명으로 하는 것을 특징으로 하는 잔여수명 예측방법을 제공한다.
도 1은 본 발명에 따른 잔여수명 예측방법을 도식화하여 나타낸 것이다.
도 2는 2013년 통계청 자료에 따른 출생나이 기준 T년 후까지 평균 생존확률을 나타낸 것이다.
도 3은 2013년 통계청 자료에 따른 평균 한국인의 연령별 기대 여명까지 생존확률 그래프이다.
도 4는 본 발명에 따른 잔여수명 측정방법으로 측정된 50세 남성(D=생체나이-출생나이=0)의 생존확률그래프이다.
도 5는 본 발명에 따른 잔여수명 측정방법으로 측정된 50세 남성(D=생체나이-출생나이=5)의 생존확률그래프이다.
도 6은 본 발명에 따른 잔여수명 측정방법으로 측정된 50세 남성(D=생체나이-출생나이=-5)의 생존확률그래프이다.
도 7은 10,000명의 한국인 남자를 대상으로 본 발명에 따라 추정된 기대 수명 분포를 나타낸 그래프이다.
도 8은 10,000명의 한국인 여자를 대상으로 본 발명에 따라 추정된 기대 수명 분포를 나타낸 그래프이다.
발명의 상세한 설명 및 구체적인 구현예
다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술 분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로, 본 명세서에서 사용된 명명법은 본 기술 분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.
본 발명에서 "출생나이(CA)"는 태어난 날을 기준으로 해서 건강 검진을 받은 날까지 생존한 년수를 말하며, "생체나이(BA)"는 건강 검진 항목을 입력 값으로 하여 통계 알고리즘을 적용 후 계산한 개인의 건강 상태를 반영한 나이를 말한다.
본 발명에서, "T년 생존확률(SP)"은 건강 검진을 받은 날을 기준으로 하여 향후 년 까지 생존할 확률을 말하고, "기대여명 (ER)"은 건강 검진을 받은 날을 기준으로 하여 향후 생존할 수 있을 년 수를 말하며, "기대수명 (EL)"은 건강 검진을 받았을 때의 출생 나이(CA)+ 기대여명(ER)을 말한다.
본 발명에서, "기대 여명까지 생존 확률 그래프 (SP2ER)"는 x축을 기대 여명(ER), y축을 T년 후의 생존 확률(SP)로 설정한 그래프(성별, 연령별로 구분됨, 통계청 발표자료)를 말한다.
본 발명에서, "생체나이를 기반으로 한 T년 후의 생존확률 (SPBA)"은 건강 검진을 받은 날 계산된 출생나이(CA)와 생체나이(BA)와 T년 생존확률(SP)을 이용하여 계산된 생존 확률생체 생존확률을 말한다.
본 발명에서, "생체나이(BA)를 기반으로 한 기대 여명까지 생존 확률 그래프 (SP2ERBA)"는 x축을 기대여명(ER), y축을 생체나이(BA)를 기반으로 한 T년 생존확률(SPBA)로 설정한 그래프(성별, 연령별로구별됨)를 말한다.
본 발명에서, "잔여수명(RL)"은 기대 여명까지 생존 확률 그래프(SP2ER)과 생체나이(BA)를 기반으로 한 기대 여명까지 생존 확률 그래프(SP2ERBA) 를 이용하여 계산된 건강검진을 받은 날로부터 남은 생존년수를 말한다.
일관점에서, 본 발명은 검강검진 결과를 이용하여 측정된 생체나이와 하기 식(1)를 이용한 생존확률의 측정방법에 관한 것이다:
식(1)
Figure PCTKR2016000353-appb-I000002
상기 식 (1)에서, S0(t)는 통계청 자료 상의 현재 생존해 있는 시점에서부터 t년 후의 생존확률이고, D는 생체나이-출생나이이며, 는 D의 평균, a는 D가 생존확률에 미치는 영향력, (t)는 생체나이를 이용하여 보정계산된 t년 후까지 생존확률을 나타낸다.
상기 식(1) 에서 S0(t) 는 통계청에서 각 연도마다 남녀별로 제공하는 생존확률 값으로, 통계청 홈페이지를 통해 확인할 수 있다(http://kosis.kr/statHtml/statHtml.do?orgId=101&tblId=DT_1B42&vw_cd=MT_ZTITLE&list_ id=A5&seqNo=&lang_mode=ko&language=kor&obj_var_id=&itm_id=&conn_path=E1#).
식(1)에서 a는 생존자료를 입력값으로 이용하여 콕스 비례 위험 모형(cox proportional hazards model) 알고리즘을 이용하여 자동으로 산출되어 나오는 값으로, SPSS 나 SAS, R package 등과 같은 통상적인 통계 분석을 위한 상용 또는 무료 사 분석 소프트웨어를 실행시켜 구현할 수 있다. 여기서 생존 자료라 함은 건강검진을 받은 피검자 개개인을 대상으로 하여 이후 특정한 시점까지 관측했을 때 사망 또는 생존했는지에 대한 정보가 있는 자료를 의미한다.
바람직한 일 양태로서, 본 발명에 따른 식 (1)에서의 a 값 및 값은 연령에 따라 표 1과 같은 값을 가질 수 있지만, 이에 한정되는 것은 아니다.
Figure PCTKR2016000353-appb-T000001
본 발명에 있어서, 상기 생체나이는 하기 식 (2)~(3)에 의하여 측정되는 것을 특징으로 할 수 있다:
식(2)
Figure PCTKR2016000353-appb-I000003
식(3)
Figure PCTKR2016000353-appb-I000004
x여기서, preBA는 식 (3)으로 보정하기 전의 가생체나이이고, BA는 가생체나이(preBA)를 기반으로 보정한 후의 생체나이이며, xj는 피검진자의 j번째 검진 항목의 검진 수치,
Figure PCTKR2016000353-appb-I000005
는 j번째 검진 항목의 샘플 내 평균값, sd(xj)는 j번째 검진 항목의 샘플 내 표준 편차, βij는 주성분 분석 결과 j번째 검진 항목의 i번째 요인값이 각 샘플의 실제 나이를 설명할 수 있는 정도, m은 주성분 분석의 수행결과 얻어진 요인 개수, Pi는 i번째 요인 값이 preBA 계산에 주는 가중치, y는 각 개체의 출생나이(CA)이며, 는 생체나이(BA) 모델 구축에 사용되는 모든 개체의 출생나이(CA)의 평균, sd(y)는 y의 표준 편차이고,
Figure PCTKR2016000353-appb-I000006
는 각 샘플에 대하여 실제 나이 및 preBA를 회귀 분석한 결과 생성된 회귀식
Figure PCTKR2016000353-appb-I000007
를 구성하는 계수이다.
본 발명에 있어서, 상기 Bij는 검강검진을 통해 측정된 2개 이상의 변수 (Xj)를 SPSS, SAS 및 R pack age 프로그램을 이용하여 주성분분석 통계알고리즘에 입력하여 산출되는 값인 것을 특징으로 할 수 있으며, m은 주성분 요인수를 나타내는 데, 주성분 분석 알고리즘 실행 시 고유치(eigen value)를 1로 설정했을 때 자동으로 결정되어 나오는 값이다.
본 발명의 일 양태에서, 생체나이 측정은 대한민국 특허공개 2014-0126229에 기재된 방법을 사용할 수 있다.
본 발명에 있어서, 피검자가 남자일 경우, x는 허리둘레(WC), 1초간 노력성 기량(FEV1), 간효소(G-GTP), 요소질소(BUN), 고지단백(HDL), 저지단백(LDL), 중성지방(TG), 공복혈당(FBS), 체지방률(FBR), 근육률(BMR), 알부민-글로불린 비율(AGR) 및 수축기혈압(SBP)으로 구성된 군에서 선택되는 건강검진 항목의 결과수치이거나, 허리둘레(WC), 수축기혈압(SBP), 간효소(G-GTP), 고지단백(HDL), 중성지방(TG), 공복혈당(FBS), 헤모글로빈(Hemoglobin), 저지단백(LDL), 체질량지수(BMI) 및 맥압(PP)으로 구성된 군에서 선택되는 건강검진 항목의 결과수치인 것을 특징으로 할 수 있다.
본 발명에 있어서, 피검자가 여자일 경우, x는 허리둘레(WC), 1초간 노력성 기량(FEV1), 감마-GTP)G-GTP), 요소질소(BUN), 고지단백(HDL), 저지단백(LDL), 중성지방(TG), 공복혈당(FBS), 체지방률(FBR), 근육률(BMR), 알부민-글로불린 비율(AGR), 이완기혈압(DBP), 적혈구침강속도(ESR) 및 체질량지소(BMI)로 구성된 군에서 선택되는 건강검진 항목의 결과수치이거나, 허리둘레(WC), 이완기혈압(DBP), 간효소(AST), 고지단백(HDL), 중성지방(TG), 공복혈당(FBS), 헤모글로빈(Hemoglobin), 저지단백(LDL), 체질량지수(BMI) 및 맥압(PP)으로 구성된 군에서 선택되는 건강검진 항목의 결과수치인 것을 특징으로 할 수 있다.
본 발명에서 사용되는 생체나이 예측 모델에는 기존의 검진 데이터인 하나 이상의 샘플이 입력될 수 있다. 상기 생체나이 연산모델에는 생체나이 연산 모델에 포함된 변수(검진 항목)의 검진 수치를 포함하는 샘플인지 여부와 무관하게, 모든 샘플이 입력될 수도 있으나, 생체나이 연산 모델에 포함된 변수의 검진 수치를 모두 포함하는 샘플들만 입력되는 것이 바람직하다. 예를 들어, 상기 제1 생체나이 연산 모델에는 BMI 검진 수치, 폐활량 검진 수치 및 일초량 검진 수치를 모두 가지는 샘플들만 입력되고, 상기 제2 생체나이 연산 모델에는 BMI 검진 수치, 폐활량 검진 수치 및 PSA 검진 수치를 모두 가지는 샘플들만 입력될 수 있다.
상기 생체나이 연산 모델에 하나 이상의 샘플이 입력된 후에는, 입력된 데이터에 대한 주성분 분석(Principal Component Analysis)이 수행될 수 있다. 상기 주성분 분석의 결과, 상기 생체나이 연산 모델에 입력된 데이터를 설명할 수 있는 하나 이상의 요인(factor)을 얻을 수 있다. 상기 얻어진 요인의 개수는 상기 생체나이 연산 모델의 변수 개수 보다 적을 수 있다. 이하, 상기 요인의 개수는 m으로, 상기 생체나이 연산 모델의 변수 개수는 n으로 기재한다.
본 발명의 일 실시예에 따르면, 상기 주성분 분석을 통하여, 상기 생체나이 연산 모델에 입력된 각 샘플의 j번째 변수값들에 포함되어 있는 i번째 요인 값들이 실제 나이를 설명할 수 있는 정도를 의미하는 가중치(Bij)가 연산될 수 있다. Bij값은 일반적인 통계분석에서 알려진 주성분 분석(principal component analysis) 방법을 통해 산출되는 값이다. 즉, Bij는 주성분 분석 프로세스를 수행하면 자동으로 계산 되는 각 변수별 요인 적재행렬(factor loading matrix)이다.
본 발명의 일 실시예에 따르면, 상기 주성분 분석을 통하여, i번째 요인 값이 생체나이 계산에 주는 가중치(Pi )도 연산될 수 있다. 이하, 가중치(Pi)를 연산하는 방법을 설명한다.
가중치(Pi)는 주성분 분석 결과 계산된 각 샘플의 요인(factor)별 요인점수(factor score)와 실제 나이 사이의 결정 계수(coefficient of determination, R2) 를 이용하여 연산될 수 있다. 상기 결정 계수를 이용한 가중치(Pi )의 연산 방법은 아래와 같다.
먼저, 주성분 분석을 통해 분석에 사용된 각 샘플의 요인 별 요인점수를 연산한다. 예를 들어, 샘플이 100명이고 요인이 m개 라고 한다면 m개 요인 별로 각각 100개의 요인 점수가 계산될 것이다.
다음으로, 각 요인별 요인점수와 각 샘플의 실제 나이를 회귀 분석 하여 결정 계수를 m개(
Figure PCTKR2016000353-appb-I000008
) 계산 한다. 이 m개의 결정 계수의 합을 S 라고 하면, i번째 요인이 생체나이 계산에 주는 가중치(Pi )는 아래의 수학식 1을 이용하여 연산될 수 있다.
수학식 1
Figure PCTKR2016000353-appb-I000009
가중치(Pi)는 주성분 분석 결과 연산된 각 요인 별 고유치(eigen value)를 이용하여 연산될 수도 있다. 이 때, 가중치(Pi)는 아래의 수학식 2를 이용하여 연산될 수 있다.
수학식 2
Figure PCTKR2016000353-appb-I000010
상기 수학식 2에서 ei는 요인 i의 고유치(eigen value)이고, m은 요인의 개수이다.
상기 주성분 분석이 완료되면, 상기 요인을 이용하여 상기 생체나이 연산 모델에 따른 생체나이 산출식이 생성될 수 있다.
일 실시예에 따르면, 상기 생체나이는 식(2)에 기반하여 수학식 3에 따라 산출될 수 있다.
식(2)
Figure PCTKR2016000353-appb-I000011
(여기서, preBA는 가생체나이, xj는 피검진자의 j번째 검진 항목의 검진 수치,
Figure PCTKR2016000353-appb-I000012
는 j번째 검진 항목의 샘플 내 평균값, sd(xj)는 j번째 검진 항목의 샘 플 내 표준 편차, Bij는 주성분 분석 결과 j번째 검진 항목의 i번째 요인값이 각 샘플의 실제 나이를 설명할 수 있는 정도, m은 주성분 분석의 수행결과 얻어진 요인 개수, Pi는 i번째 요인 값이 BA 계산에 주는 가중치)
수학식 3
Figure PCTKR2016000353-appb-I000013
(상기 수학식 3에서 BA는 생체나이, preBA 및 preBA'는 가생체나이, xj는 피검진자의 j번째 검진 항목의 검진 수치,
Figure PCTKR2016000353-appb-I000014
는 j번째 검진 항목의 샘플 내 평균값, sd(xj)는 j번째 검진 항목의 샘플 내 표준 편차, Bij는 주성분 분석 결과 j번째 검진 항목의 i번째 요인값이 각 샘플의 실제 나이를 설명할 수 있는 정도, m은 주성분 분석의 수행결과 얻어진 요인 개수, Pi는 i번째 요인 값이 preBA 계산에 주는 가중치, y는 각 개체의 출생나이(CA)이며,
Figure PCTKR2016000353-appb-I000015
는 생체나이(BA) 모델 구축에 사용되는 모든 개체의 출생나이(CA)의 평균, sd(y)는 y의 표준 편차,
Figure PCTKR2016000353-appb-I000016
Figure PCTKR2016000353-appb-I000017
는 각 샘플에 대하여 실제 나이 및 preBA를 회귀 분석한 결과 생성된 회귀식
Figure PCTKR2016000353-appb-I000018
를 구성하는 계수)
상기 수학식 3에서, 일 실시예에 따르면, 상기 y평균은 모든 샘플의 실제 나이에 대한 평균이고, 상기 sd(y)는 모든 샘플의 실제 나이에 대한 표준 편차일 수 있으나, 다른 실시예에 따르면, 상기 y평균은 상기 생체나이 연산 모델에 포함된 모든 검진 항목의 수치 데이터를 유효한 값으로 가지고 있는 모든 샘플의 실제 나이에 대한 평균이고, 상기 sd(y)는 상기 생체나이 연산 모델에 포함된 모든 검진 항목의 수치 데이터를 유효한 값으로 가지고 있는 모든 샘플의 실제 나이에 대한 표준 편차일 수도 있다.
정리하면, 상기 생체나이 연산 모델에 샘플 데이터를 입력하고, 입력된 데이터에 대한 주성분 분석을 거치면 하나 이상의 요인이 얻어지고, 상기 주성분 분석 결과 및 상기 요인을 이용하여 생체나이 산출식을 얻을 수 있다. 상기 생체나이 산출식의 예시는 식 (2) 또는 수학식 3을 참조할 수 있다.
상기 생체나이 연산 모델에, 이번의 피검진자 검진 결과 데이터에 포함된 검진 항목을 변수로서 하나씩 추가해나가면서, 최적의 결과를 도출하는 생체나이 연산 모델을 구성하는 변수 집합을 찾는 과정으로 이해할 수 있다. 즉, 처음에는 비어 있는 상기 생체나이 연산 모델에 상기 원본 집합의 검진 항목 중 최선의 하나를 선정하여, 선정된 검진 항목을 변수로서 추가하는 것을 반복하는, 소위 단계별 전진 선택 방법을 이용한다.
이하, 상기 단계별 전진 선택 방법에 대하여 설명한다. 원본 집합에 BMI, 폐활량, 일초량, 알부민(Albumin), PSA의 총 5가지 검진 항목이 원소로서 포함된 것을 전제로 한다.
첫번째 단계로, 하나의 변수를 포함하는 테스트 모델이 생성된다. 다음으로, 생성된 테스트 모델에 해당 변수의 값, 즉 해당 검진 항목의 검진 [0075] 수치를 포함하는 샘플들이 입력되며, 입력된 샘플들에 대하여 주성분 분석을 수행하여 요인을 얻고, 얻어진 요인 및 주성분 분석 결과를 이용하여 생체나이 산출식을 생성한다. 이하, 상기 테스트 모델에 새로 추가되는 변수를 테스트 검진 항목으로 기재한다. 다음으로, 상기 입력된 샘플들 각각을 상기 생체나이 산출식에 입력하여 각 샘플의 생체나이를 연산한다.
다음으로, 샘플들의 상기 분포에 대한 회귀 분석을 통하여 단순 회귀식 BA = a + by를 생성한다. 그 결과, 샘플들의 회귀선(
Figure PCTKR2016000353-appb-I000019
)과 실제 나이(BA = y) 와의 결정 계수(R2)을 구할 수 있다. 첫번째 단계의 결과 얻어진 각 검진항목 별 결정 계수 값이 표시되어 있다. 첫번째 단계의 결과, 가장 큰 값을 가지는 폐활량이 선택될 것이다. 이는, 폐활량 검진 수치는 생체나이 연산 모델에 포함되는 것을 의미한다. 폐활량 검진 항목은 상기 생체나이 연산 모델에 추가되었으므로, 상기 원본 집합에서 제거된다. 두번째로 상기 생체나이 연산 모델에 포함될 두번째 검진항목이 선택된다. 두번째 단계의 테스트 모델은 상기 폐활량 검진 항목 및 그 밖의 검진 항목 중 하나를 포함하는, 총 2개의 변수를 가지는 모델이다. 따라서, 두번째 단계에서는 (폐활량, BMI), (폐활량, 일초량), (폐활량, 알부민), (폐활량, PSA) 총 4번의 테스트가 진행될 것이다.
다음으로, 생성된 생체나이 연산 모델에 해당 변수의 값, 즉 해당 검진 항목의 검진 수치를 포함하는 샘플들이 입력되며, 입력된 샘플들에 대하여 주성분 분석을 수행하여 요인을 얻고, 얻어진 요인 및 주성분 분석 결과를 이용하여 생체나이 산출식을 생성한다.
다음으로, 상기 입력된 샘플들 각각을 상기 생체나이 산출식에 입력하여 각 샘플의 생체나이를 연산하고, 샘플들의 상기 분포에 대한 회귀 분석을 통하여 단순 회귀식
Figure PCTKR2016000353-appb-I000020
를 생성한다. 그 결과, 샘플들의 회귀선 (
Figure PCTKR2016000353-appb-I000021
)과 실제 나이(BA = y) 와의 결정 계수(R2)를 구할 수 있다.
두번째 단계의 결과, 기존의 결정 계수인 0.4보다 모델의 결정 계수 값을 증가 시키는 것 중, 증가량이 가장 큰 검진 항목인, BMI가 선정될 것이다. 이는, BMI 수치가 폐활량 수치와 함께 생체나이 연산 모델에 포함되는 것을 의미한다. BMI 검진항목은 상기 생체나이 연산 모델에 추가되었으므로, 상기 원본 집합에서 제거된다. 세번째로 상기 생체나이 연산 모델에 포함될 세번째 검진항목이 선택된다. 세번째 단계의 테스트 모델은 상기 폐활량 검진 항목, BMI 및 그 밖의 검진 항목 중 하나를 포함하는, 총 3개의 변수를 가지는 모델이다. 따라서, 두번째 단계에서는 (폐활량, BMI, 일초량), (폐활량, BMI, 알부민), (폐활량, BMI, PSA) 총 3번의 테스트가 진행될 것이다. 세번째 단계 역시 두번째 단계와 유사항 반식으로 진행된다. 일초량의 결정 계수 값이 기존의 결정 계수 값인 0.5에 비하여 유일하게 증가하는 값이므로, 일초량이 상기 생체나이 연산 모델에 포함되는 3번째 검진 항목으로 선정된다. 일초량은 상기 원본 집합에서 제거된다.
네번째로 상기 생체나이 연산 모델에 포함될 세번째 검진항목이 선택된다.
남은 두개의 검진 항목 모두, 기존의 결정 계수 값인 0.6 보다 낮은 결정 계수를 가지는 생체나이 연산을 만들고 있다. 네번째 단계까지 진행한 결과, 원본 집합에서 더 이상 추가될 검진 항목이 존재하지 않는 상황이다. 따라서, 네번째 단계에서 상기 단계별 전진 진행 단계는 종료된다. 그 결과, 이번 피검진자에 대한 생체나이 연산 모델에는 5개의 검진 항목 중, BMI, 폐활량, 일초량 총 3개만 변수로 포함되는 것이 바람직하다. 상기 단계별 전진 진행 단계가 종료되는 시점에서의 상기 생체나이 연산 모델이 상기 수신된 검진 데이터에 대하여 적용될 생체나이 연산 모델로 확정된다.
다음으로, 상기 수신된 검진 데이터를 상기 확정된 생체나이 연산 모델에 따른 생체나이 산출식에 입력하여 피검진자의 생체나이를 연산할 수 있다.
일 실시예에 따르면, 상기 검진 데이터를 상기 샘플 데이터에 추가함으로써, 다음 피검진자를 위한 샘플로 활용할 수 있다.
본 발명에 따른 단계별 전진 선택 단계는 피검진자의 검진 데이터에 포함된 검진 항목 중에서 생체나이 연산 모델에 포함될 적어도 일부의 검진 항목을 하나씩 추가하는 과정이다. 데이터에 따라, 단계별 전진 선택 단계를 진행할수록 상기 결정 계수 값이 계속 증가하는 경우도 존재할 수 있으므로, 피검진자의 검진 데이터에 포함된 검진 항목 모두가 상기 생체나이 연산 모델에 포함되는 경우도 발생 할 수 있음은 물론이다.
한편, 피검진자의 검진 데이터와 유사한 패턴을 보일 수 있는 샘플을 이용하는 것이 보다 정확한 생체나이 연산 모델을 생성하는데 유리할 것이다. 따라서, 상기 단계별 전진 선택 단계에서 상기 테스트 모델에 입력되는 샘플은 상기 수신된 검진 데이터의 피검진자와 유사한 신상 정보를 가지는 샘플으로 제한될 수 있다. 예를 들어, 상기 테스트 모델에 입력되는 샘플은 상기 피검진자의 성별와 동일하고, 상기 피검진자의 실제 나이를 기준으로 기 지정된 범위의 실제 나이를 가지는 것으로 제한될 수 있다.
상기 단계별 전진 선택 단계에서, 상기 결정 계수를 기존의 테스트 모델의 그것에 비하여 최대한 증가시키는 지 여부뿐만 아니라, 추가적인 선택 기준이 사용될 수 있다.
일 실시예에 따르면, 상기 테스트 검진 항목의 수치 데이터를 가지는 샘플의 수가 기지정된 한계치 이하인 경우 상기 테스트 검진 항목에서 제외 될 수 있다. 다른 실시예에 따르면, 상기 테스트 모델에 포함된 검진 항목의 검진 수치를 모두 가지는 샘플의 수가 기지정된 한계치 이하인 경우 상기 테스트 검진 항목에서 제외 될 수 있다. 샘플의 개수가 상기 한계치 미만인 경우, 통계 데이터로서의 신뢰도를 부여하기 어렵기 때문이다.
또한, 일 실시예에 따르면, 상기 테스트 모델에 포함된 검진 항목 중 적어도 하나와 상관 계수(R)가 기 지정된 한계치를 초과하는 상기 테스트 검진 항목은 상기 테스트 검진 항목에서 제외 될 수 있다. 이는, 테스트 모델에 이미 포함된 검진 항목과 상관 관계가 높은 검진 항목이 새로이 테스트 모델에 포함되게 되면, 기존의 검진 항목이 테스트 모델에서 차지하는 영향력이 감소하는 역효과를 방지하기 위함이다. 또한, 테스트 모델에 상관 관계가 높은 검진 항목들이 포함되는 경우, 주성분 분석 과정에서 수행하는 행렬 연산 과정 중 singularity 현상이 발생되어 고유치(eigen value)가 제대로 연산되지 않는 문제를 방지하기 위함이기도 하다.
상기 상관 계수 연산의 정확성을 위하여, 상기 상관 계수는 상기 테스트 모델에 포함된 전체 검진 항목의 검진 수치를 가지는 샘플 데이터를 이용하여 산출될 수 있다.
본 발명의 일 양태에서, 상기 현재 생존해 있는 시점에서부터 t년 후까지 생존확률(통계청 자료)는 예를 들어 표 2의 기대여명표 및 도 2를 사용할 수 있다.
또한 본 발명의 일양태에서의 연령별 생존확률을 표 3에 나타내었다.
Figure PCTKR2016000353-appb-T000002
Figure PCTKR2016000353-appb-I000022
Figure PCTKR2016000353-appb-T000003
Figure PCTKR2016000353-appb-I000023
Figure PCTKR2016000353-appb-I000024
Figure PCTKR2016000353-appb-I000025
Figure PCTKR2016000353-appb-I000026
Figure PCTKR2016000353-appb-I000027
Figure PCTKR2016000353-appb-I000028
Figure PCTKR2016000353-appb-I000029
Figure PCTKR2016000353-appb-I000030
Figure PCTKR2016000353-appb-I000031
Figure PCTKR2016000353-appb-I000032
Figure PCTKR2016000353-appb-I000033
Figure PCTKR2016000353-appb-I000034
Figure PCTKR2016000353-appb-I000035
Figure PCTKR2016000353-appb-I000036
Figure PCTKR2016000353-appb-I000037
Figure PCTKR2016000353-appb-I000038
Figure PCTKR2016000353-appb-I000039
Figure PCTKR2016000353-appb-I000040
Figure PCTKR2016000353-appb-I000041
Figure PCTKR2016000353-appb-I000042
Figure PCTKR2016000353-appb-I000043
Figure PCTKR2016000353-appb-I000044
Figure PCTKR2016000353-appb-I000045
Figure PCTKR2016000353-appb-I000046
Figure PCTKR2016000353-appb-I000047
Figure PCTKR2016000353-appb-I000048
Figure PCTKR2016000353-appb-I000049
Figure PCTKR2016000353-appb-I000050
다른 관점에서, 본 발명은 x 축을 기대여명(ER), y 축을 상기 검강검진 결과를 이용하여 측정된 생체나이와 식(1)를 이용한 생존확률의 측정방법으로 측정된 T년 후까지 생존확률로 하여, 작성한 그래프에서, y축의 생존확률 값에 대응하는 x 축의 값을 검강검진을 받은 날로부터 남은 잔여수명으로 하는 것을 특징으로 하는 잔여수명 측정방법에 관한 것이다.
본 발명의 잔여수명 예측방법은 도 1에 나타낸 바와 같이, 측정대상의 성별,연령자료와 건강검진 자료와 생체나이 계산 알고리즘(식(2)~(3))을 이용하여, 개인의 생체나이를 계산하고, 상기 생체나이와 식(1)을 이용하여 연령별 t년 후 생존확률을 계산한 후, x 축을 기대여명(ER), y 축을 상기 방법으로 측정한 t년 후 생존확률로 하고, 상기 방법으로 측정된 t년 생존확률을 나타낸 그래프를 이용하여 성별 연령별 잔여수명을 계산하는 것이다.
본 발명의 잔여수명 계산 시스템에서는 2013년 통계청 자료를 기반으로한 연령별 생존확률 값을 사용하였지만 (표 2 및 도 4 참조), 이에 한정되는 것은 아니며 매년 또는 일정 기간 마다 통계청에서 새로이 발표되는 값을 이용하여 정확도를 제고할 수 있음은 통상의 기술자에게는 자명한 것이다.
구체적인 예를 통해 본 발명에 따른 잔여수명 예측방법을 설명한다. 한국인 50세 남성(출생나이 50세)의 평균 잔여수명은 30.57세(표 1 참조)로 나타났는데 이러한 50세 남성의 생존확률은 약 0.5595(표 2 참조)이다.
이후 x 축을 기대여명(ER), y 축을 상기 방법으로 측정한 t년 후 생존확률로 하고, 상기 방법으로 측정된 t년 생존확률을 나타낸 그래프에서, y축에서 이 생존확률 값의 위치를 잡고 여기서부터 x 축에 평행한 가상선을 설정하여, 50세 남성의 생존 확률 그래프와 만나는 점의 x 축 값이 바로 본 발명에 따른 잔여수명이 되는 것이다(도 4).
만약, 한국인 50세 남성 중 생체나이가 출생나이보다 5세 더 많은 (D=생체나이-출생나이=5) 사람의 잔여수명을 생존확률 그래프를 이용하여 측정한다면, 잔여수명이 30.5세보다 현저히 낮은 것을 확인할 수 있었다(도 5).
또한, 한국인 50세 남성 중 생체나이가 출생나이보다 5세 더 적은 (D=생체나이-출생나이=-5)사람의 잔여수명을 생존확률 그래프를 이용하여 측정한 결과, 잔여수명이 30.5세보다 현저히 높은 것을 확인할 수 있었다(도 6).
하나의 구체예에서, 본 발명에 따른 잔여수명 예측 방법을 이용하여 산출한 결과, 출생나이 50세인 남자의 기대수명을 확인한 결과, D(생체나이 - 출생나이)가 -4.5 세 일 때, 기대수명은 91.9세이었으며, D=0세 일 때 80.8세 (한국인 평균)이었으며, D=4.5세 일 때 69.3세였다.
또 다른 양태에서, 출생 나이 50세인 여자의 기대 수명을 확인한 결과, D = -4.3 세 일 때 94.3세였고, D = 0세 일 때 86.3세 (한국인 평균)이 었으며, D= 4.2세 일 때 79.1세였다.
본 발명의 다른 양태에서는 본 발명의 잔여수명 측정방법을 이용하여 한국인 남/여의 10,000명을 연령별로 나누어 잔여수명을 측정하였으며, 그 결과를 각각 도 7 및 도 8에 나타내었다.
이상으로 본 발명 내용의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적 기술은 단지 바람직한 실시 양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.
본 발명에 따르면, 기존의 생체나이를 고려하지 않은 잔여수명 예측 방법에 비해 훨씬 정확하게 잔여수명을 예측할 수 있다.

Claims (8)

  1. 검강검진 결과를 이용하여 측정된 생체나이와 하기 식(1)를 이용한 생존확률의 측정방법;
    식(1)
    Figure PCTKR2016000353-appb-I000051
    상기 식 (1)에서, S0(t)는 통계청 자료 상의 현재 생존해 있는 시점에서부터 t년 후의 생존확률이고, D는 생체나이-출생나이이며, 는 D의 평균, a는 D가 생존확률에 미치는 영향력, (t)는 생체나이를 이용하여 보정계산된 t년 후까지 생존확률을 나타냄.
  2. 제1항에 있어서, 상기 생체나이는 하기 식 (2)~(3)에 의하여 측정되는 것을 특징으로 하는 방법:
    식(2)
    Figure PCTKR2016000353-appb-I000052
    식(3)
    Figure PCTKR2016000353-appb-I000053
    여기서, preBA는 식 (3)으로 보정하기전의 가생체나이이고, BA는 가생체나이(preBA)를 식(3)으로 보정한 후 의 생체나이이며, xj는 피검진자의 j번째 검진 항목의 검진 수치,
    Figure PCTKR2016000353-appb-I000054
    는 j번째 검진 항목의 샘플 내 평균값, sd(xj)는 j번째 검진 항목의 샘 플 내 표준 편차, Bij는 주성분 분석 결과 j번째 검진 항목의 i번째 요인값이 각 샘플의 실제 나이를 설명할 수 있는 정도, m은 주성분 분석의 수행결과 얻어진 요인 개수, Pi는 i번째 요인 값이 preBA 계산에 주는 가중치, y는 각 개체의 출생나이(CA)이며,
    Figure PCTKR2016000353-appb-I000055
    는 생체나이(BA) 모델 구축에 사용되는 모든 개체의 출생나이(C A)의 평균, sd(y)는 y의 표준 편차이고,
    Figure PCTKR2016000353-appb-I000056
    는 각 샘플에 대하여 실제 나이 및 preBA를 회귀 분석한 결과 생성된 회귀식
    Figure PCTKR2016000353-appb-I000057
    를 구성하는 계수임.
  3. 제2항에 있어서, Bij는 검강검진을 통해 측정된 2개 이상의 변수 (Xj)를 입력값으로 하여 주성분 분석 통계알고리즘을 통해 산출되는 값인 것을 특징으로 하는 방법.
  4. 제2항에 있어서, 피검자가 남자일 경우, x는 허리둘레(WC), 1초 간 노력성 기량(FEV1), 간효소(G-GTP), 요소질소(BUN), 고지단백(HDL), 저지단백(LDL), 중성지방(TG), 공복 혈당(FBS), 체지방률(FBR), 근육률(BMR), 알부민-글로불린 비율(AGR) 및 수축기혈압(SBP)으로 구성된 군에서 선택되는 건강검진 항목의 결과수치인 것을 특징으로 하는 방법.
  5. 제2항에 있어서, 피검자가 남자일 경우, x는 허리둘레(WC), 수축기혈압(SBP), 간효소(G-GTP), 고지단백(HDL), 중성지방(TG), 공복혈당(FBS), 헤모글로빈(Hemoglobin), 저지단백(LDL), 체질량지수(BMI) 및 맥압(PP)으로 구성된 군에서 선택되는 건강검진 항목의 결과수치인 것을 특징으로 하는 방법.
  6. 제2항에 있어서, 피검자 가 여자일 경우, x는 허리둘레(WC), 1초간 노력성 기량(FEV1), 감마-GTP)G-GTP), 요소질소(BUN), 고지단백(HDL), 저지단백(LDL), 중성지방(TG), 공복혈당(FBS), 체지방률(FBR), 근육률(BMR), 알부민-글로불린 비율(A GR), 이완기혈압(DBP), 적혈구침강속도(ESR) 및 체질량지소(BMI)로 구성된 군에서 선택되는 건강검진 항목의 결과수치인 것을 특징으로 하는 방법.
  7. 제2항에 있어서, 피검자가 여자일 경우, x는 허리둘레(WC), 이완기혈압(DBP), 간효소(AST), 고지단백(HDL), 중성지방(TG), 공복혈당(FBS), 헤모글로빈(Hemoglobin), 저지단백(LDL), 체질량지수(BMI) 및 맥압(PP)으로 구성된 군에서 선택되는 건강검진 항목의 결과수치인 것을 특징으로 하는 방법.
  8. x 축을 기대여명(ER), y 축을 제1항 내지 제7항 중 어느 한 항의 방법으로 측정된 t년 후 까지 생존확률로 하여 작성한 그래프에서, y축의 피검자의 생존확률 값에 대응하는 x 축의 값을 피검자의 검강검진을 받은 날로부터 남은 잔여수명으로 하는 것을 특징으로 하는 잔여수명 측정방법.
PCT/KR2016/000353 2015-03-04 2016-01-13 생체나이를 이용한 잔여 수명 예측방법 WO2016140432A2 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201680020966.9A CN108475542A (zh) 2015-03-04 2016-01-13 通过使用生物年龄预测剩余寿命的方法
JP2017546614A JP6640868B2 (ja) 2015-03-04 2016-01-13 生体年齢を利用した残余寿命の予測方法
HK18115784.8A HK1256728A1 (zh) 2015-03-04 2018-12-10 通過使用生物年齡預測剩餘壽命的方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2015-0030331 2015-03-04
KR1020150030331A KR101669526B1 (ko) 2015-03-04 2015-03-04 생체나이를 이용한 잔여 수명 예측방법

Publications (1)

Publication Number Publication Date
WO2016140432A2 true WO2016140432A2 (ko) 2016-09-09

Family

ID=56848379

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2016/000353 WO2016140432A2 (ko) 2015-03-04 2016-01-13 생체나이를 이용한 잔여 수명 예측방법

Country Status (5)

Country Link
JP (1) JP6640868B2 (ko)
KR (1) KR101669526B1 (ko)
CN (1) CN108475542A (ko)
HK (1) HK1256728A1 (ko)
WO (1) WO2016140432A2 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108847284A (zh) * 2018-05-02 2018-11-20 莱博生物科技股份有限公司 人体生物年龄测算装置及系统
CN110392740A (zh) * 2017-01-25 2019-10-29 深圳华大生命科学研究院 确定人群样本生物指标集、预测生物学年龄的方法及其应用
CN115274098A (zh) * 2022-08-19 2022-11-01 北京咯咯网络科技有限公司 一种基于骨龄与身高来预测身高的智能系统

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102106428B1 (ko) * 2018-02-19 2020-05-06 주식회사 셀바스에이아이 건강나이 예측 방법
KR102189233B1 (ko) * 2018-05-17 2020-12-09 재단법인차세대융합기술연구원 생활 나이를 제공하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체
CN110277151A (zh) * 2019-06-11 2019-09-24 浙江大学 基于常规体检指标的人体生理年龄分析方法、系统及模型
JP7277351B2 (ja) * 2019-12-23 2023-05-18 Tvs Regza株式会社 視聴履歴解析装置および視聴履歴解析装置プログラム
CN111243738B (zh) * 2019-12-31 2023-04-25 东软集团股份有限公司 生存分析模型的构建、生存率的预测方法、装置及设备
JP6901169B1 (ja) * 2020-02-25 2021-07-14 日新ビジネス開発株式会社 年齢学習装置、年齢推定装置、年齢学習方法及び年齢学習プログラム
KR102418342B1 (ko) * 2021-08-13 2022-07-08 주식회사 유투메드텍 식이정보를 이용한 혈당변화 예측 장치 및 그 방법
KR102371440B1 (ko) * 2021-08-28 2022-03-07 유진바이오소프트 주식회사 개인 맞춤 생체나이 예측 모형 생성 방법 및 시스템
KR20230114081A (ko) 2022-01-24 2023-08-01 주식회사 에비드넷 건강변화량을 활용한 건강나이 및 건강점수 산출방법
KR20240012704A (ko) 2022-07-21 2024-01-30 주식회사 로그미 건강나이를 예측하는 장치 및 방법

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4062910B2 (ja) * 2001-11-29 2008-03-19 株式会社日立製作所 健康管理支援方法及び装置と健康余命予測データ生成方法及び装置
KR100673309B1 (ko) * 2005-04-25 2007-01-24 김건형 잔여수명 예측시스템 및 그 예측서버 제어방법
KR20060131154A (ko) * 2005-06-15 2006-12-20 주식회사 리얼 에이지 생체 연령 측정 장치 및 그 서비스 방법
JP4619219B2 (ja) * 2005-07-19 2011-01-26 株式会社エヌ・ティ・ティ・データ 被験者選定装置
JP5231835B2 (ja) * 2008-02-22 2013-07-10 株式会社東芝 健康指導支援システム
US8409104B2 (en) * 2008-05-02 2013-04-02 Conopco Inc. Heart age assessment
JP5185785B2 (ja) * 2008-11-19 2013-04-17 オムロンヘルスケア株式会社 健康状態判断装置
EP2781602A1 (en) * 2013-03-21 2014-09-24 Universität Konstanz Method for the determination of biological age in human beings
KR101603308B1 (ko) * 2013-11-20 2016-03-14 주식회사 바이오에이지 생체 나이 연산 모델 생성 방법 및 시스템과, 그 생체 나이 연산 방법 및 시스템

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110392740A (zh) * 2017-01-25 2019-10-29 深圳华大生命科学研究院 确定人群样本生物指标集、预测生物学年龄的方法及其应用
CN108847284A (zh) * 2018-05-02 2018-11-20 莱博生物科技股份有限公司 人体生物年龄测算装置及系统
CN108847284B (zh) * 2018-05-02 2021-03-23 莱博生物科技股份有限公司 人体生物年龄测算装置及系统
CN115274098A (zh) * 2022-08-19 2022-11-01 北京咯咯网络科技有限公司 一种基于骨龄与身高来预测身高的智能系统
CN115274098B (zh) * 2022-08-19 2023-04-07 北京咯咯网络科技有限公司 一种基于骨龄与身高来预测身高的智能系统

Also Published As

Publication number Publication date
CN108475542A (zh) 2018-08-31
HK1256728A1 (zh) 2019-10-04
JP6640868B2 (ja) 2020-02-05
KR20160107508A (ko) 2016-09-19
KR101669526B1 (ko) 2016-10-26
JP2018512659A (ja) 2018-05-17

Similar Documents

Publication Publication Date Title
WO2016140432A2 (ko) 생체나이를 이용한 잔여 수명 예측방법
WO2019168334A1 (ko) 기계 학습을 통한 치매 예측용 데이터 처리 장치 및 그 방법, 이를 수록한 기록 매체
WO2018124854A1 (ko) 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법
WO2020242239A1 (ko) 앙상블 학습 알고리즘을 이용한 인공지능 기반 진단 보조 시스템
WO2018208044A1 (ko) 개인 맞춤형 피부 관리 가이드 정보 제공 방법 및 장치
WO2016068391A1 (ko) 환자 개인 특성에 대한 분석 방법 및 그 장치
WO2020078058A1 (zh) 医疗数据异常识别方法、装置、终端及存储介质
WO2023163248A1 (ko) 인공지능 기반의 식재료 매칭 서버, 방법 및 프로그램
WO2020159136A1 (ko) 요속과 잔뇨를 동시에 측정함으로써 배뇨 장애를 진단하기 위한 방법 및 장치
Constans et al. Comparison of four clinical prediction scores for the diagnosis of lower limb deep venous thrombosis in outpatients
WO2018105995A2 (ko) 빅데이터를 활용한 건강정보 예측 장치 및 방법
WO2020130238A1 (ko) 사망 위험도의 예측 방법 및 이를 이용한 디바이스
WO2021101105A2 (ko) 의료 전문 자료의 과목 분류 시스템 및 방법
WO2019107804A1 (ko) 약물의 구조 정보를 이용한 약물-약물 또는 약물-음식 상호작용 예측 방법
WO2019039808A1 (ko) 저혈당 예측 장치, 방법 및 프로그램과, 저혈당 예측 모델 생성 장치, 방법 및 프로그램
WO2021210838A1 (ko) 다양한 오믹스 데이터 분석에 기초한 생체나이 예측방법 및 시스템
Gabr et al. The UK national ligament registry report 2015
Cone et al. Biomechanical function and size of the anteromedial and posterolateral bundles of the ACL change differently with skeletal growth in the pig model
WO2011136491A2 (ko) 용어체계 기반의 데이터 개체 정의지원 시스템
WO2022220649A1 (ko) 심전도 이미지에 기반한 환자 평가 시스템 및 방법
WO2021177771A1 (ko) 의료 영상으로부터 바이오마커 발현을 예측하는 방법 및 시스템
WO2022075794A1 (ko) 개인 피부 타입 결정 방법 및 이에 기반한 맞춤형 화장품 제공 방법 및 시스템
EP4327335A1 (en) Self-sampling management electronic device, self-sampling management method, and computer readable medium storing program to perform the method
Bharara et al. Applications of angiosome classification model for monitoring disease progression in the diabetic feet
Hu et al. COVID-19: women with diabetes and hypertension during pregnancy

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16759068

Country of ref document: EP

Kind code of ref document: A2

ENP Entry into the national phase

Ref document number: 2017546614

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16759068

Country of ref document: EP

Kind code of ref document: A2