WO2016140432A2

WO2016140432A2 - 생체나이를 이용한 잔여 수명 예측방법

Info

Publication number: WO2016140432A2
Application number: PCT/KR2016/000353
Authority: WO
Inventors: 유진호; 김양석
Original assignee: 주식회사 바이오에이지
Priority date: 2015-03-04
Filing date: 2016-01-13
Publication date: 2016-09-09
Also published as: CN108475542A; HK1256728A1; JP6640868B2; KR20160107508A; KR101669526B1; JP2018512659A

Description

생체나이를 이용한 잔여 수명 예측방법

본 발명은 생체나이와 생존확률을 이용하여, 사람의 잔여수명을 측정하는 방법에 관한 것으로, 더욱 자세하게는 건강검진 결과를 반영하는 생체나이 측정알고리즘을 통해 측정된 생체나이를 이용한 생존확률 예측방법 및 상기 방법으로 예측된 생존확률을 이용하여 잔여수명을 예측하는 방법에 관한 것이다.

최근 사람의 질병 원인에 대한 많은 연구가 이루어지고 있음에도 불구하고 대부분이 흥미위주의 일회성 정보로 취급되고 있어서, 질병예방에는 별다른 효용이 없는 것이 사실이며, 이에 따른 대표적인 종래의 기술은 각 의료분야별로 질병을 예측하고 치료하는 기술이 있는 바, 특허출원번호 제2003-0067652호인 간암조기진단을 위한 간암 예측시스템 및 그 제어방법에 관한 기술로써, 개인별로 간암발생률의 추정과 간암발생의 상대적 위험(Relative risk)을 구하고, 각 개인별로 구한 간암발생률과 간암발생의 상대적 위험을 통해 간암발생위험군에 관한 계층화의 분류(Classify)를 수행하는 간암조기진단을 위한 간암 예측시스템 및 그 제어방법에 관한 기술이고, 상기 기술은 환자의 일반적인 정보, 초음파 시행에 따른 정보, 환자 최초등록시 소견과, 간암진단 시 소견에 관한 정보를 포함하는 임상정보 및 위험군 정보를 데이터베이스에 저장하고, 저장된 임상정보와 위험군 정보를 기반으로 각 위험요인에 해당하는 기여도인 회귀계수를 산출하여 간암발생 위험도를 측정함으로써, 간암발생 예측에 따른 개인별 간암발생을 예방할 수 있으며, 각 개인별로 구한 간암발생률과 간암발생의 상대적 위험을 통해 간암발생위험군에 관한 계층화의 분류를 수행함으로써, 맞춤형 간암발생예측모형의 기반을 구축하는 등의 효과가 있으며, 환자의 주치의는 간암 예측 결과를 이동통신단말을 통해 단문메시지 형태로 수신하거나 전자메일을 통해 수신함으로써 환자의 위험률을 지속적으로 모니터링할 수 있으며, 위험상황 발생시 즉각적으로 조치할 수 있는 효과가 있는 기술에 관한 것이 있었다.

상기와 같이 종래의 예측기술은 의학적으로 특정질병에 대하여 예측하고, 예측된 정보를 기반으로 치료하는 기술들이 대부분으로, 현재 건강상태에 따라 인간의 수명이 어떻게 변화되는지를 측정할 수는 없었다.

이에, 본 발명자들은 검강검진에서 얻어지는 데이터를 통하여 측정한 생체나이와 한국인의 수명을 조사한 대규모 데이터베이스를 이용하여 잔여수명 예측을 수행하는 경우, 신뢰성 있게 잔여수명을 예측할 수 있다는 것을 확인하고, 본 발명을 완성하게 되었다.

발명의 요약

본 발명의 목적은 건강검진에서 얻어지는 데이터를 기반으로 측정된 생체나이를 이용한 생존확률의 측정방법을 제공하는데 있다.

본 발명의 또 다른 목적은 상기 방법으로 측정된 생체나이와 생존확률을 이용하여, 잔여수명을 측정하는 방법을 제공하는데 있다.

상기 목적을 달성하기 위하여, 본 발명은 검강검진 결과를 이용하여 측정된 생체나이와 하기 식(1)를 이용한 생존확률의 예측방법을 제공한다:

식(1)

상기 식 (1)에서, S0(t)는 통계청 자료 상의 현재 생존해 있는 시점에서부터 t년 후의 생존확률이고, D는 생체나이-출생나이이며, 는 D의 평균, a는 D가 생존확률에 미치는 영향력, (t)는 생체나이를 이용하여 보정계산된 t년 후까지 생존확률을 나타낸다.

본 발명은 또한, x 축을 기대여명(ER), y 축을 T년 후까지 생존확률로 하여, 작성한 그래프에서, y축의 피검자의 생존확률 값에 대응하는 x 축의 값을 피검자의 검강검진을 받은 날로부터 남은 잔여수명으로 하는 것을 특징으로 하는 잔여수명 예측방법을 제공한다.

도 1은 본 발명에 따른 잔여수명 예측방법을 도식화하여 나타낸 것이다.

도 2는 2013년 통계청 자료에 따른 출생나이 기준 T년 후까지 평균 생존확률을 나타낸 것이다.

도 3은 2013년 통계청 자료에 따른 평균 한국인의 연령별 기대 여명까지 생존확률 그래프이다.

도 4는 본 발명에 따른 잔여수명 측정방법으로 측정된 50세 남성(D=생체나이-출생나이=0)의 생존확률그래프이다.

도 5는 본 발명에 따른 잔여수명 측정방법으로 측정된 50세 남성(D=생체나이-출생나이=5)의 생존확률그래프이다.

도 6은 본 발명에 따른 잔여수명 측정방법으로 측정된 50세 남성(D=생체나이-출생나이=-5)의 생존확률그래프이다.

도 7은 10,000명의 한국인 남자를 대상으로 본 발명에 따라 추정된 기대 수명 분포를 나타낸 그래프이다.

도 8은 10,000명의 한국인 여자를 대상으로 본 발명에 따라 추정된 기대 수명 분포를 나타낸 그래프이다.

발명의 상세한 설명 및 구체적인 구현예

다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술 분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로, 본 명세서에서 사용된 명명법은 본 기술 분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.

본 발명에서 "출생나이(CA)"는 태어난 날을 기준으로 해서 건강 검진을 받은 날까지 생존한 년수를 말하며, "생체나이(BA)"는 건강 검진 항목을 입력 값으로 하여 통계 알고리즘을 적용 후 계산한 개인의 건강 상태를 반영한 나이를 말한다.

본 발명에서, "T년 생존확률(SP)"은 건강 검진을 받은 날을 기준으로 하여 향후 년 까지 생존할 확률을 말하고, "기대여명 (ER)"은 건강 검진을 받은 날을 기준으로 하여 향후 생존할 수 있을 년 수를 말하며, "기대수명 (EL)"은 건강 검진을 받았을 때의 출생 나이(CA)+ 기대여명(ER)을 말한다.

본 발명에서, "기대 여명까지 생존 확률 그래프 (SP2ER)"는 x축을 기대 여명(ER), y축을 T년 후의 생존 확률(SP)로 설정한 그래프(성별, 연령별로 구분됨, 통계청 발표자료)를 말한다.

본 발명에서, "생체나이를 기반으로 한 T년 후의 생존확률 (SPBA)"은 건강 검진을 받은 날 계산된 출생나이(CA)와 생체나이(BA)와 T년 생존확률(SP)을 이용하여 계산된 생존 확률생체 생존확률을 말한다.

본 발명에서, "생체나이(BA)를 기반으로 한 기대 여명까지 생존 확률 그래프 (SP2ERBA)"는 x축을 기대여명(ER), y축을 생체나이(BA)를 기반으로 한 T년 생존확률(SPBA)로 설정한 그래프(성별, 연령별로구별됨)를 말한다.

본 발명에서, "잔여수명(RL)"은 기대 여명까지 생존 확률 그래프(SP2ER)과 생체나이(BA)를 기반으로 한 기대 여명까지 생존 확률 그래프(SP2ERBA) 를 이용하여 계산된 건강검진을 받은 날로부터 남은 생존년수를 말한다.

일관점에서, 본 발명은 검강검진 결과를 이용하여 측정된 생체나이와 하기 식(1)를 이용한 생존확률의 측정방법에 관한 것이다:

식(1)

상기 식(1) 에서 S0(t) 는 통계청에서 각 연도마다 남녀별로 제공하는 생존확률 값으로, 통계청 홈페이지를 통해 확인할 수 있다(http://kosis.kr/statHtml/statHtml.do?orgId=101&tblId=DT_1B42&vw_cd=MT_ZTITLE&list_ id=A5&seqNo=&lang_mode=ko&language=kor&obj_var_id=&itm_id=&conn_path=E1#).

식(1)에서 a는 생존자료를 입력값으로 이용하여 콕스 비례 위험 모형(cox proportional hazards model) 알고리즘을 이용하여 자동으로 산출되어 나오는 값으로, SPSS 나 SAS, R package 등과 같은 통상적인 통계 분석을 위한 상용 또는 무료 사 분석 소프트웨어를 실행시켜 구현할 수 있다. 여기서 생존 자료라 함은 건강검진을 받은 피검자 개개인을 대상으로 하여 이후 특정한 시점까지 관측했을 때 사망 또는 생존했는지에 대한 정보가 있는 자료를 의미한다.

바람직한 일 양태로서, 본 발명에 따른 식 (1)에서의 a 값 및 값은 연령에 따라 표 1과 같은 값을 가질 수 있지만, 이에 한정되는 것은 아니다.

본 발명에 있어서, 상기 생체나이는 하기 식 (2)~(3)에 의하여 측정되는 것을 특징으로 할 수 있다:

식(2)

식(3)

x여기서, preBA는 식 (3)으로 보정하기 전의 가생체나이이고, BA는 가생체나이(preBA)를 기반으로 보정한 후의 생체나이이며, xj는 피검진자의 j번째 검진 항목의 검진 수치,

는 j번째 검진 항목의 샘플 내 평균값, sd(xj)는 j번째 검진 항목의 샘플 내 표준 편차, βij는 주성분 분석 결과 j번째 검진 항목의 i번째 요인값이 각 샘플의 실제 나이를 설명할 수 있는 정도, m은 주성분 분석의 수행결과 얻어진 요인 개수, Pi는 i번째 요인 값이 preBA 계산에 주는 가중치, y는 각 개체의 출생나이(CA)이며, 는 생체나이(BA) 모델 구축에 사용되는 모든 개체의 출생나이(CA)의 평균, sd(y)는 y의 표준 편차이고,

는 각 샘플에 대하여 실제 나이 및 preBA를 회귀 분석한 결과 생성된 회귀식

를 구성하는 계수이다.

본 발명에 있어서, 상기 Bij는 검강검진을 통해 측정된 2개 이상의 변수 (Xj)를 SPSS, SAS 및 R pack age 프로그램을 이용하여 주성분분석 통계알고리즘에 입력하여 산출되는 값인 것을 특징으로 할 수 있으며, m은 주성분 요인수를 나타내는 데, 주성분 분석 알고리즘 실행 시 고유치(eigen value)를 1로 설정했을 때 자동으로 결정되어 나오는 값이다.

본 발명의 일 양태에서, 생체나이 측정은 대한민국 특허공개 2014-0126229에 기재된 방법을 사용할 수 있다.

본 발명에 있어서, 피검자가 남자일 경우, x는 허리둘레(WC), 1초간 노력성 기량(FEV1), 간효소(G-GTP), 요소질소(BUN), 고지단백(HDL), 저지단백(LDL), 중성지방(TG), 공복혈당(FBS), 체지방률(FBR), 근육률(BMR), 알부민-글로불린 비율(AGR) 및 수축기혈압(SBP)으로 구성된 군에서 선택되는 건강검진 항목의 결과수치이거나, 허리둘레(WC), 수축기혈압(SBP), 간효소(G-GTP), 고지단백(HDL), 중성지방(TG), 공복혈당(FBS), 헤모글로빈(Hemoglobin), 저지단백(LDL), 체질량지수(BMI) 및 맥압(PP)으로 구성된 군에서 선택되는 건강검진 항목의 결과수치인 것을 특징으로 할 수 있다.

본 발명에 있어서, 피검자가 여자일 경우, x는 허리둘레(WC), 1초간 노력성 기량(FEV1), 감마-GTP)G-GTP), 요소질소(BUN), 고지단백(HDL), 저지단백(LDL), 중성지방(TG), 공복혈당(FBS), 체지방률(FBR), 근육률(BMR), 알부민-글로불린 비율(AGR), 이완기혈압(DBP), 적혈구침강속도(ESR) 및 체질량지소(BMI)로 구성된 군에서 선택되는 건강검진 항목의 결과수치이거나, 허리둘레(WC), 이완기혈압(DBP), 간효소(AST), 고지단백(HDL), 중성지방(TG), 공복혈당(FBS), 헤모글로빈(Hemoglobin), 저지단백(LDL), 체질량지수(BMI) 및 맥압(PP)으로 구성된 군에서 선택되는 건강검진 항목의 결과수치인 것을 특징으로 할 수 있다.

본 발명에서 사용되는 생체나이 예측 모델에는 기존의 검진 데이터인 하나 이상의 샘플이 입력될 수 있다. 상기 생체나이 연산모델에는 생체나이 연산 모델에 포함된 변수(검진 항목)의 검진 수치를 포함하는 샘플인지 여부와 무관하게, 모든 샘플이 입력될 수도 있으나, 생체나이 연산 모델에 포함된 변수의 검진 수치를 모두 포함하는 샘플들만 입력되는 것이 바람직하다. 예를 들어, 상기 제1 생체나이 연산 모델에는 BMI 검진 수치, 폐활량 검진 수치 및 일초량 검진 수치를 모두 가지는 샘플들만 입력되고, 상기 제2 생체나이 연산 모델에는 BMI 검진 수치, 폐활량 검진 수치 및 PSA 검진 수치를 모두 가지는 샘플들만 입력될 수 있다.

상기 생체나이 연산 모델에 하나 이상의 샘플이 입력된 후에는, 입력된 데이터에 대한 주성분 분석(Principal Component Analysis)이 수행될 수 있다. 상기 주성분 분석의 결과, 상기 생체나이 연산 모델에 입력된 데이터를 설명할 수 있는 하나 이상의 요인(factor)을 얻을 수 있다. 상기 얻어진 요인의 개수는 상기 생체나이 연산 모델의 변수 개수 보다 적을 수 있다. 이하, 상기 요인의 개수는 m으로, 상기 생체나이 연산 모델의 변수 개수는 n으로 기재한다.

본 발명의 일 실시예에 따르면, 상기 주성분 분석을 통하여, 상기 생체나이 연산 모델에 입력된 각 샘플의 j번째 변수값들에 포함되어 있는 i번째 요인 값들이 실제 나이를 설명할 수 있는 정도를 의미하는 가중치(Bij)가 연산될 수 있다. Bij값은 일반적인 통계분석에서 알려진 주성분 분석(principal component analysis) 방법을 통해 산출되는 값이다. 즉, Bij는 주성분 분석 프로세스를 수행하면 자동으로 계산 되는 각 변수별 요인 적재행렬(factor loading matrix)이다.

본 발명의 일 실시예에 따르면, 상기 주성분 분석을 통하여, i번째 요인 값이 생체나이 계산에 주는 가중치(Pi )도 연산될 수 있다. 이하, 가중치(Pi)를 연산하는 방법을 설명한다.

가중치(Pi)는 주성분 분석 결과 계산된 각 샘플의 요인(factor)별 요인점수(factor score)와 실제 나이 사이의 결정 계수(coefficient of determination, R2) 를 이용하여 연산될 수 있다. 상기 결정 계수를 이용한 가중치(Pi )의 연산 방법은 아래와 같다.

먼저, 주성분 분석을 통해 분석에 사용된 각 샘플의 요인 별 요인점수를 연산한다. 예를 들어, 샘플이 100명이고 요인이 m개 라고 한다면 m개 요인 별로 각각 100개의 요인 점수가 계산될 것이다.

다음으로, 각 요인별 요인점수와 각 샘플의 실제 나이를 회귀 분석 하여 결정 계수를 m개(

) 계산 한다. 이 m개의 결정 계수의 합을 S 라고 하면, i번째 요인이 생체나이 계산에 주는 가중치(Pi )는 아래의 수학식 1을 이용하여 연산될 수 있다.

수학식 1

가중치(Pi)는 주성분 분석 결과 연산된 각 요인 별 고유치(eigen value)를 이용하여 연산될 수도 있다. 이 때, 가중치(Pi)는 아래의 수학식 2를 이용하여 연산될 수 있다.

수학식 2

상기 수학식 2에서 ei는 요인 i의 고유치(eigen value)이고, m은 요인의 개수이다.

상기 주성분 분석이 완료되면, 상기 요인을 이용하여 상기 생체나이 연산 모델에 따른 생체나이 산출식이 생성될 수 있다.

일 실시예에 따르면, 상기 생체나이는 식(2)에 기반하여 수학식 3에 따라 산출될 수 있다.

식(2)

(여기서, preBA는 가생체나이, xj는 피검진자의 j번째 검진 항목의 검진 수치,

는 j번째 검진 항목의 샘플 내 평균값, sd(xj)는 j번째 검진 항목의 샘 플 내 표준 편차, Bij는 주성분 분석 결과 j번째 검진 항목의 i번째 요인값이 각 샘플의 실제 나이를 설명할 수 있는 정도, m은 주성분 분석의 수행결과 얻어진 요인 개수, Pi는 i번째 요인 값이 BA 계산에 주는 가중치)

수학식 3

(상기 수학식 3에서 BA는 생체나이, preBA 및 preBA'는 가생체나이, xj는 피검진자의 j번째 검진 항목의 검진 수치,

는 j번째 검진 항목의 샘플 내 평균값, sd(xj)는 j번째 검진 항목의 샘플 내 표준 편차, Bij는 주성분 분석 결과 j번째 검진 항목의 i번째 요인값이 각 샘플의 실제 나이를 설명할 수 있는 정도, m은 주성분 분석의 수행결과 얻어진 요인 개수, Pi는 i번째 요인 값이 preBA 계산에 주는 가중치, y는 각 개체의 출생나이(CA)이며,

는 생체나이(BA) 모델 구축에 사용되는 모든 개체의 출생나이(CA)의 평균, sd(y)는 y의 표준 편차,

및

를 구성하는 계수)

상기 수학식 3에서, 일 실시예에 따르면, 상기 y평균은 모든 샘플의 실제 나이에 대한 평균이고, 상기 sd(y)는 모든 샘플의 실제 나이에 대한 표준 편차일 수 있으나, 다른 실시예에 따르면, 상기 y평균은 상기 생체나이 연산 모델에 포함된 모든 검진 항목의 수치 데이터를 유효한 값으로 가지고 있는 모든 샘플의 실제 나이에 대한 평균이고, 상기 sd(y)는 상기 생체나이 연산 모델에 포함된 모든 검진 항목의 수치 데이터를 유효한 값으로 가지고 있는 모든 샘플의 실제 나이에 대한 표준 편차일 수도 있다.

정리하면, 상기 생체나이 연산 모델에 샘플 데이터를 입력하고, 입력된 데이터에 대한 주성분 분석을 거치면 하나 이상의 요인이 얻어지고, 상기 주성분 분석 결과 및 상기 요인을 이용하여 생체나이 산출식을 얻을 수 있다. 상기 생체나이 산출식의 예시는 식 (2) 또는 수학식 3을 참조할 수 있다.

상기 생체나이 연산 모델에, 이번의 피검진자 검진 결과 데이터에 포함된 검진 항목을 변수로서 하나씩 추가해나가면서, 최적의 결과를 도출하는 생체나이 연산 모델을 구성하는 변수 집합을 찾는 과정으로 이해할 수 있다. 즉, 처음에는 비어 있는 상기 생체나이 연산 모델에 상기 원본 집합의 검진 항목 중 최선의 하나를 선정하여, 선정된 검진 항목을 변수로서 추가하는 것을 반복하는, 소위 단계별 전진 선택 방법을 이용한다.

이하, 상기 단계별 전진 선택 방법에 대하여 설명한다. 원본 집합에 BMI, 폐활량, 일초량, 알부민(Albumin), PSA의 총 5가지 검진 항목이 원소로서 포함된 것을 전제로 한다.

첫번째 단계로, 하나의 변수를 포함하는 테스트 모델이 생성된다. 다음으로, 생성된 테스트 모델에 해당 변수의 값, 즉 해당 검진 항목의 검진 [0075] 수치를 포함하는 샘플들이 입력되며, 입력된 샘플들에 대하여 주성분 분석을 수행하여 요인을 얻고, 얻어진 요인 및 주성분 분석 결과를 이용하여 생체나이 산출식을 생성한다. 이하, 상기 테스트 모델에 새로 추가되는 변수를 테스트 검진 항목으로 기재한다. 다음으로, 상기 입력된 샘플들 각각을 상기 생체나이 산출식에 입력하여 각 샘플의 생체나이를 연산한다.

다음으로, 샘플들의 상기 분포에 대한 회귀 분석을 통하여 단순 회귀식 BA = a + by를 생성한다. 그 결과, 샘플들의 회귀선(

)과 실제 나이(BA = y) 와의 결정 계수(R2)을 구할 수 있다. 첫번째 단계의 결과 얻어진 각 검진항목 별 결정 계수 값이 표시되어 있다. 첫번째 단계의 결과, 가장 큰 값을 가지는 폐활량이 선택될 것이다. 이는, 폐활량 검진 수치는 생체나이 연산 모델에 포함되는 것을 의미한다. 폐활량 검진 항목은 상기 생체나이 연산 모델에 추가되었으므로, 상기 원본 집합에서 제거된다. 두번째로 상기 생체나이 연산 모델에 포함될 두번째 검진항목이 선택된다. 두번째 단계의 테스트 모델은 상기 폐활량 검진 항목 및 그 밖의 검진 항목 중 하나를 포함하는, 총 2개의 변수를 가지는 모델이다. 따라서, 두번째 단계에서는 (폐활량, BMI), (폐활량, 일초량), (폐활량, 알부민), (폐활량, PSA) 총 4번의 테스트가 진행될 것이다.

다음으로, 생성된 생체나이 연산 모델에 해당 변수의 값, 즉 해당 검진 항목의 검진 수치를 포함하는 샘플들이 입력되며, 입력된 샘플들에 대하여 주성분 분석을 수행하여 요인을 얻고, 얻어진 요인 및 주성분 분석 결과를 이용하여 생체나이 산출식을 생성한다.

다음으로, 상기 입력된 샘플들 각각을 상기 생체나이 산출식에 입력하여 각 샘플의 생체나이를 연산하고, 샘플들의 상기 분포에 대한 회귀 분석을 통하여 단순 회귀식

를 생성한다. 그 결과, 샘플들의 회귀선 (

)과 실제 나이(BA = y) 와의 결정 계수(R2)를 구할 수 있다.

두번째 단계의 결과, 기존의 결정 계수인 0.4보다 모델의 결정 계수 값을 증가 시키는 것 중, 증가량이 가장 큰 검진 항목인, BMI가 선정될 것이다. 이는, BMI 수치가 폐활량 수치와 함께 생체나이 연산 모델에 포함되는 것을 의미한다. BMI 검진항목은 상기 생체나이 연산 모델에 추가되었으므로, 상기 원본 집합에서 제거된다. 세번째로 상기 생체나이 연산 모델에 포함될 세번째 검진항목이 선택된다. 세번째 단계의 테스트 모델은 상기 폐활량 검진 항목, BMI 및 그 밖의 검진 항목 중 하나를 포함하는, 총 3개의 변수를 가지는 모델이다. 따라서, 두번째 단계에서는 (폐활량, BMI, 일초량), (폐활량, BMI, 알부민), (폐활량, BMI, PSA) 총 3번의 테스트가 진행될 것이다. 세번째 단계 역시 두번째 단계와 유사항 반식으로 진행된다. 일초량의 결정 계수 값이 기존의 결정 계수 값인 0.5에 비하여 유일하게 증가하는 값이므로, 일초량이 상기 생체나이 연산 모델에 포함되는 3번째 검진 항목으로 선정된다. 일초량은 상기 원본 집합에서 제거된다.

네번째로 상기 생체나이 연산 모델에 포함될 세번째 검진항목이 선택된다.

남은 두개의 검진 항목 모두, 기존의 결정 계수 값인 0.6 보다 낮은 결정 계수를 가지는 생체나이 연산을 만들고 있다. 네번째 단계까지 진행한 결과, 원본 집합에서 더 이상 추가될 검진 항목이 존재하지 않는 상황이다. 따라서, 네번째 단계에서 상기 단계별 전진 진행 단계는 종료된다. 그 결과, 이번 피검진자에 대한 생체나이 연산 모델에는 5개의 검진 항목 중, BMI, 폐활량, 일초량 총 3개만 변수로 포함되는 것이 바람직하다. 상기 단계별 전진 진행 단계가 종료되는 시점에서의 상기 생체나이 연산 모델이 상기 수신된 검진 데이터에 대하여 적용될 생체나이 연산 모델로 확정된다.

다음으로, 상기 수신된 검진 데이터를 상기 확정된 생체나이 연산 모델에 따른 생체나이 산출식에 입력하여 피검진자의 생체나이를 연산할 수 있다.

일 실시예에 따르면, 상기 검진 데이터를 상기 샘플 데이터에 추가함으로써, 다음 피검진자를 위한 샘플로 활용할 수 있다.

본 발명에 따른 단계별 전진 선택 단계는 피검진자의 검진 데이터에 포함된 검진 항목 중에서 생체나이 연산 모델에 포함될 적어도 일부의 검진 항목을 하나씩 추가하는 과정이다. 데이터에 따라, 단계별 전진 선택 단계를 진행할수록 상기 결정 계수 값이 계속 증가하는 경우도 존재할 수 있으므로, 피검진자의 검진 데이터에 포함된 검진 항목 모두가 상기 생체나이 연산 모델에 포함되는 경우도 발생 할 수 있음은 물론이다.

한편, 피검진자의 검진 데이터와 유사한 패턴을 보일 수 있는 샘플을 이용하는 것이 보다 정확한 생체나이 연산 모델을 생성하는데 유리할 것이다. 따라서, 상기 단계별 전진 선택 단계에서 상기 테스트 모델에 입력되는 샘플은 상기 수신된 검진 데이터의 피검진자와 유사한 신상 정보를 가지는 샘플으로 제한될 수 있다. 예를 들어, 상기 테스트 모델에 입력되는 샘플은 상기 피검진자의 성별와 동일하고, 상기 피검진자의 실제 나이를 기준으로 기 지정된 범위의 실제 나이를 가지는 것으로 제한될 수 있다.

상기 단계별 전진 선택 단계에서, 상기 결정 계수를 기존의 테스트 모델의 그것에 비하여 최대한 증가시키는 지 여부뿐만 아니라, 추가적인 선택 기준이 사용될 수 있다.

일 실시예에 따르면, 상기 테스트 검진 항목의 수치 데이터를 가지는 샘플의 수가 기지정된 한계치 이하인 경우 상기 테스트 검진 항목에서 제외 될 수 있다. 다른 실시예에 따르면, 상기 테스트 모델에 포함된 검진 항목의 검진 수치를 모두 가지는 샘플의 수가 기지정된 한계치 이하인 경우 상기 테스트 검진 항목에서 제외 될 수 있다. 샘플의 개수가 상기 한계치 미만인 경우, 통계 데이터로서의 신뢰도를 부여하기 어렵기 때문이다.

또한, 일 실시예에 따르면, 상기 테스트 모델에 포함된 검진 항목 중 적어도 하나와 상관 계수(R)가 기 지정된 한계치를 초과하는 상기 테스트 검진 항목은 상기 테스트 검진 항목에서 제외 될 수 있다. 이는, 테스트 모델에 이미 포함된 검진 항목과 상관 관계가 높은 검진 항목이 새로이 테스트 모델에 포함되게 되면, 기존의 검진 항목이 테스트 모델에서 차지하는 영향력이 감소하는 역효과를 방지하기 위함이다. 또한, 테스트 모델에 상관 관계가 높은 검진 항목들이 포함되는 경우, 주성분 분석 과정에서 수행하는 행렬 연산 과정 중 singularity 현상이 발생되어 고유치(eigen value)가 제대로 연산되지 않는 문제를 방지하기 위함이기도 하다.

상기 상관 계수 연산의 정확성을 위하여, 상기 상관 계수는 상기 테스트 모델에 포함된 전체 검진 항목의 검진 수치를 가지는 샘플 데이터를 이용하여 산출될 수 있다.

본 발명의 일 양태에서, 상기 현재 생존해 있는 시점에서부터 t년 후까지 생존확률(통계청 자료)는 예를 들어 표 2의 기대여명표 및 도 2를 사용할 수 있다.

또한 본 발명의 일양태에서의 연령별 생존확률을 표 3에 나타내었다.

다른 관점에서, 본 발명은 x 축을 기대여명(ER), y 축을 상기 검강검진 결과를 이용하여 측정된 생체나이와 식(1)를 이용한 생존확률의 측정방법으로 측정된 T년 후까지 생존확률로 하여, 작성한 그래프에서, y축의 생존확률 값에 대응하는 x 축의 값을 검강검진을 받은 날로부터 남은 잔여수명으로 하는 것을 특징으로 하는 잔여수명 측정방법에 관한 것이다.

본 발명의 잔여수명 예측방법은 도 1에 나타낸 바와 같이, 측정대상의 성별,연령자료와 건강검진 자료와 생체나이 계산 알고리즘(식(2)~(3))을 이용하여, 개인의 생체나이를 계산하고, 상기 생체나이와 식(1)을 이용하여 연령별 t년 후 생존확률을 계산한 후, x 축을 기대여명(ER), y 축을 상기 방법으로 측정한 t년 후 생존확률로 하고, 상기 방법으로 측정된 t년 생존확률을 나타낸 그래프를 이용하여 성별 연령별 잔여수명을 계산하는 것이다.

본 발명의 잔여수명 계산 시스템에서는 2013년 통계청 자료를 기반으로한 연령별 생존확률 값을 사용하였지만 (표 2 및 도 4 참조), 이에 한정되는 것은 아니며 매년 또는 일정 기간 마다 통계청에서 새로이 발표되는 값을 이용하여 정확도를 제고할 수 있음은 통상의 기술자에게는 자명한 것이다.

구체적인 예를 통해 본 발명에 따른 잔여수명 예측방법을 설명한다. 한국인 50세 남성(출생나이 50세)의 평균 잔여수명은 30.57세(표 1 참조)로 나타났는데 이러한 50세 남성의 생존확률은 약 0.5595(표 2 참조)이다.

이후 x 축을 기대여명(ER), y 축을 상기 방법으로 측정한 t년 후 생존확률로 하고, 상기 방법으로 측정된 t년 생존확률을 나타낸 그래프에서, y축에서 이 생존확률 값의 위치를 잡고 여기서부터 x 축에 평행한 가상선을 설정하여, 50세 남성의 생존 확률 그래프와 만나는 점의 x 축 값이 바로 본 발명에 따른 잔여수명이 되는 것이다(도 4).

만약, 한국인 50세 남성 중 생체나이가 출생나이보다 5세 더 많은 (D=생체나이-출생나이=5) 사람의 잔여수명을 생존확률 그래프를 이용하여 측정한다면, 잔여수명이 30.5세보다 현저히 낮은 것을 확인할 수 있었다(도 5).

또한, 한국인 50세 남성 중 생체나이가 출생나이보다 5세 더 적은 (D=생체나이-출생나이=-5)사람의 잔여수명을 생존확률 그래프를 이용하여 측정한 결과, 잔여수명이 30.5세보다 현저히 높은 것을 확인할 수 있었다(도 6).

하나의 구체예에서, 본 발명에 따른 잔여수명 예측 방법을 이용하여 산출한 결과, 출생나이 50세인 남자의 기대수명을 확인한 결과, D(생체나이 - 출생나이)가 -4.5 세 일 때, 기대수명은 91.9세이었으며, D=0세 일 때 80.8세 (한국인 평균)이었으며, D=4.5세 일 때 69.3세였다.

또 다른 양태에서, 출생 나이 50세인 여자의 기대 수명을 확인한 결과, D = -4.3 세 일 때 94.3세였고, D = 0세 일 때 86.3세 (한국인 평균)이 었으며, D= 4.2세 일 때 79.1세였다.

본 발명의 다른 양태에서는 본 발명의 잔여수명 측정방법을 이용하여 한국인 남/여의 10,000명을 연령별로 나누어 잔여수명을 측정하였으며, 그 결과를 각각 도 7 및 도 8에 나타내었다.

이상으로 본 발명 내용의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적 기술은 단지 바람직한 실시 양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.

본 발명에 따르면, 기존의 생체나이를 고려하지 않은 잔여수명 예측 방법에 비해 훨씬 정확하게 잔여수명을 예측할 수 있다.

Claims

검강검진 결과를 이용하여 측정된 생체나이와 하기 식(1)를 이용한 생존확률의 측정방법;

식(1)

상기 식 (1)에서, S0(t)는 통계청 자료 상의 현재 생존해 있는 시점에서부터 t년 후의 생존확률이고, D는 생체나이-출생나이이며, 는 D의 평균, a는 D가 생존확률에 미치는 영향력, (t)는 생체나이를 이용하여 보정계산된 t년 후까지 생존확률을 나타냄.
제1항에 있어서, 상기 생체나이는 하기 식 (2)~(3)에 의하여 측정되는 것을 특징으로 하는 방법:

식(2)

식(3)

여기서, preBA는 식 (3)으로 보정하기전의 가생체나이이고, BA는 가생체나이(preBA)를 식(3)으로 보정한 후 의 생체나이이며, xj는 피검진자의 j번째 검진 항목의 검진 수치,
는 j번째 검진 항목의 샘플 내 평균값, sd(xj)는 j번째 검진 항목의 샘 플 내 표준 편차, Bij는 주성분 분석 결과 j번째 검진 항목의 i번째 요인값이 각 샘플의 실제 나이를 설명할 수 있는 정도, m은 주성분 분석의 수행결과 얻어진 요인 개수, Pi는 i번째 요인 값이 preBA 계산에 주는 가중치, y는 각 개체의 출생나이(CA)이며,
는 생체나이(BA) 모델 구축에 사용되는 모든 개체의 출생나이(C A)의 평균, sd(y)는 y의 표준 편차이고,
는 각 샘플에 대하여 실제 나이 및 preBA를 회귀 분석한 결과 생성된 회귀식
를 구성하는 계수임.
제2항에 있어서, Bij는 검강검진을 통해 측정된 2개 이상의 변수 (Xj)를 입력값으로 하여 주성분 분석 통계알고리즘을 통해 산출되는 값인 것을 특징으로 하는 방법.
제2항에 있어서, 피검자가 남자일 경우, x는 허리둘레(WC), 1초 간 노력성 기량(FEV1), 간효소(G-GTP), 요소질소(BUN), 고지단백(HDL), 저지단백(LDL), 중성지방(TG), 공복 혈당(FBS), 체지방률(FBR), 근육률(BMR), 알부민-글로불린 비율(AGR) 및 수축기혈압(SBP)으로 구성된 군에서 선택되는 건강검진 항목의 결과수치인 것을 특징으로 하는 방법.
제2항에 있어서, 피검자가 남자일 경우, x는 허리둘레(WC), 수축기혈압(SBP), 간효소(G-GTP), 고지단백(HDL), 중성지방(TG), 공복혈당(FBS), 헤모글로빈(Hemoglobin), 저지단백(LDL), 체질량지수(BMI) 및 맥압(PP)으로 구성된 군에서 선택되는 건강검진 항목의 결과수치인 것을 특징으로 하는 방법.
제2항에 있어서, 피검자 가 여자일 경우, x는 허리둘레(WC), 1초간 노력성 기량(FEV1), 감마-GTP)G-GTP), 요소질소(BUN), 고지단백(HDL), 저지단백(LDL), 중성지방(TG), 공복혈당(FBS), 체지방률(FBR), 근육률(BMR), 알부민-글로불린 비율(A GR), 이완기혈압(DBP), 적혈구침강속도(ESR) 및 체질량지소(BMI)로 구성된 군에서 선택되는 건강검진 항목의 결과수치인 것을 특징으로 하는 방법.
제2항에 있어서, 피검자가 여자일 경우, x는 허리둘레(WC), 이완기혈압(DBP), 간효소(AST), 고지단백(HDL), 중성지방(TG), 공복혈당(FBS), 헤모글로빈(Hemoglobin), 저지단백(LDL), 체질량지수(BMI) 및 맥압(PP)으로 구성된 군에서 선택되는 건강검진 항목의 결과수치인 것을 특징으로 하는 방법.
x 축을 기대여명(ER), y 축을 제1항 내지 제7항 중 어느 한 항의 방법으로 측정된 t년 후 까지 생존확률로 하여 작성한 그래프에서, y축의 피검자의 생존확률 값에 대응하는 x 축의 값을 피검자의 검강검진을 받은 날로부터 남은 잔여수명으로 하는 것을 특징으로 하는 잔여수명 측정방법.