KR20240012704A - 건강나이를 예측하는 장치 및 방법 - Google Patents

건강나이를 예측하는 장치 및 방법 Download PDF

Info

Publication number
KR20240012704A
KR20240012704A KR1020220090019A KR20220090019A KR20240012704A KR 20240012704 A KR20240012704 A KR 20240012704A KR 1020220090019 A KR1020220090019 A KR 1020220090019A KR 20220090019 A KR20220090019 A KR 20220090019A KR 20240012704 A KR20240012704 A KR 20240012704A
Authority
KR
South Korea
Prior art keywords
nutrient intake
model
factor
intake factor
age
Prior art date
Application number
KR1020220090019A
Other languages
English (en)
Inventor
권오란
김혜숙
김유진
황지영
Original Assignee
주식회사 로그미
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 로그미 filed Critical 주식회사 로그미
Priority to KR1020220090019A priority Critical patent/KR20240012704A/ko
Publication of KR20240012704A publication Critical patent/KR20240012704A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Abstract

본 발명의 일 실시예에 따르면, 건강나이 예측 모델에 여러 영역의 혈중 마커를 반영하면서도 각 마커 별 중요도를 반영한 산화 스트레스 점수 및 대사 스트레스 점수를 활용하여 개체에 존재하는 오차를 상쇄하고 더 정확한 나이예측이 가능하며, 통합적으로 예측된 건강나이(피검자의 현재 노화정도)에 대하여 산화 스트레스와 대사 스트레스의 영향력을 해석할 수 있다.

Description

건강나이를 예측하는 장치 및 방법{AN APPARATUS AND A METHOD FOR PREDICTING BIOLOGICAL AGE}
본원은 건강나이를 예측하는 장치 및 방법에 관한 것이다.
활성산소는 정상적인 대사과정에서 부수적으로 생성되는 물질으로, 일반적으로 인간이 호흡하여 마시게 되는 산소의 약 2%가 활성산소로 전환되는 것으로 알려져 있다. 활성산소는 몸 안에서 해독작용과 면역작용 등 중요한 역할도 하고 있으나, 필요 이상의 활성산소가 몸 안에 축적되면 오히려 정상 생체조직을 공격하여 세포에 손상을 초래하기도 한다. 산화 스트레스는 이처럼 체내 활성산소가 많아지면서 생체의 산화 균형이 무너져 유해산소 생성이 급증하는 상태를 의미한다. 이럴 경우 체내 장기의 기능이 떨어지고 면역 체계가 무너져 노화가 가속되는 것은 물론 대사 스트레스, 고혈압 등 만성질환의 발생 위험도 높아진다. 아울러, 많이 먹고 잘 쓰지 않은 영양분은 체내에 축적되어 고혈당, 고지질, 저산소증, 염증 등의 대사 스트레스로 나타난다. 이러한 대사 스트레스 또한 세포 내 신호전달계, 세포 소기관(소포체, 미토콘드리아 등)의 기능에 문제를 일으킬 수 있고, 당뇨나 암 등의 대사성 질환으로 이어질 수 있다.
건강나이란 출생나이(주민등록상의 나이)가 아닌 현재 자신의 생리/기능적 건강상태 및 노화정도를 나타내는 생물학적 나이이다. 노화가 하나의 질병이라면 무엇보다도 노화를 객관적으로 정확하게 진단하는 것이 선행되어야 한다. 개인마다 노화의 시작과 속도가 다르고, 인체의 거의 모든 곳에서 일어나기 때문에 가능하면 다양한 생체표지자(biomarker)를 측정하여 간접적으로 평가할 수밖에 없다.
그동안 건강나이를 예측하기 위해 다음과 같이 많은 노력이 이루어졌다.
등록특허 제10-2371440호는 건강 검진 데이터를 기반으로 연령별 출생 나이에 대한 초과 나이를 구하여 개인별 건강나이를 예측할 수 있는 모델을 생성하기 위한 개인 맞춤 건강나이 예측 모형 생성 방법 및 그 시스템에 관한 발명을 제공한다. 등록특허 제10-2106428호는 학습용 상태 정보 및 학습용 기대여명 정보를 포함하는 기대여명 학습 데이터를 통해 딥러닝을 수행하여 기대여명 예측 모델을 생선하는 방법을 제공한다. 등록특허 제10-1328643호는 다수의 축적된 통계 자료를 이용하여, 특정 검진 항목에 대한 현재의 검진 수치를 제공한 피검진자의 장래의 검진 수치를 예측하는 장치를 제공한다. 등록특허 제10-1669526호는 건강검진에서 얻어지는 데이터를 기반으로 측정된 건강나이를 이용한 생존확률의 측정방법을 제공한다. 공개특허 제10-2021-0127478호는 다양한 오믹스 데이터 분석에 기초한 건강나이 예측방법 및 시스템을 제공한다.
노화를 객관적으로 평가하는 여러 가지 방법이 개발되었지만 생화학적, 호르몬 검사와 같은 개별 검사만을 통해 생체 나이 측정법이 이루어지고 있다. 선행기술들은 대부분 샘플로부터 얻은 데이터를 머신러닝모델에 적용되는 수학식을 제공하는 등 분석과정에 더 중점을 두었다. 산화 스트레스와 대사 스트레스는 만성질환의 발병에 있어서 복합적으로 영향을 미친다. 이에 따라 산화 스트레스와 대사 스트레스을 종합적으로 고려한 생체 나이 개발이 필요한 실정이다.
등록특허 제10-2371440호
등록특허 제10-2106428호
등록특허 제10-1328643호
등록특허 제10-1669526호
공개특허 제10-2021-0127478호
본 발명은 개체로부터 얻은 데이터를 산화 스트레스와 대사 스트레스 수준을 평가하는 수식을 사용하여 관련 점수를 산출하고, 이를 분석 모델에 사용함으로써 정확한 건강나이 예측이 가능한 방법을 제공하고자 한다.
본원은 상기 과제를 해결하기 위한 제1측면으로서
개체의 건강나이를 예측하는 방법에 있어서 신체활동량, EQ5D, 포화지방 영양소 섭취인자, 오메가-6지방산 영양소 섭취인자, 콜레스테롤 영양소 섭취인자, 칼슘 영양소 섭취인자, 철분 영양소 섭취인자, 칼륨 영양소 섭취인자, 티아민 영양소 섭취인자, 나이아신 영양소 섭취인자 및 레티놀 영양소 섭취인자로 이루어진 평가인자 군을 기반으로 산화 스트레스 점수(X1)를 산출하는 단계,
신체활동량, EQ5D, 총에너지섭취량, 수분 섭취량, 단백질 영양소 섭취인자, 포화지방 영양소 섭취인자, 불포화지방산 영양소 섭취인자, 오메가-3 지방산 영양소 섭취인자, 식이섬유 영양소 섭취인자, 콜레스테롤 영양소 섭취인자, 칼슘 영양소 섭취인자, 칼륨 영양소 섭취인자, 리보플라민 영양소 섭취인자, 비타민C 영양소 섭취인자, 카로티노이드 영양소 섭취인자 및 레티놀 영양소 섭취인자로 이루어진 평가인자 군을 기반으로 대사 스트레스 점수(X2)를 산출하는 단계 및
산출된 산화 스트레스 점수 및 대사 스트레스 점수를 미리 학습된 머신러닝 모델에 입력하여 개체의 건강나이를 예측하는 단계를 포함하는 방법을 제공한다.
본원의 제2측면은 건강나이를 예측하는 장치에 있어서,
신체활동량, EQ5D, 포화지방 영양소 섭취인자, 오메가-6지방산 영양소 섭취인자, 콜레스테롤 영양소 섭취인자, 칼슘 영양소 섭취인자, 철분 영양소 섭취인자, 칼륨 영양소 섭취인자, 티아민 영양소 섭취인자, 나이아신 영양소 섭취인자 및 레티놀 영양소 섭취인자로 이루어진 평가인자 군을 기반으로 산화 스트레스 점수(X1)를 산출하고, 신체활동량, EQ5D, 총에너지섭취량, 수분 섭취량, 단백질 영양소 섭취인자, 포화지방 영양소 섭취인자, 불포화지방산 영양소 섭취인자, 오메가-3 지방산 영양소 섭취인자, 식이섬유 영양소 섭취인자, 콜레스테롤 영양소 섭취인자, 칼슘 영양소 섭취인자, 칼륨 영양소 섭취인자, 리보플라민 영양소 섭취인자, 비타민C 영양소 섭취인자, 카로티노이드 영양소 섭취인자 및 레티놀 영양소 섭취인자로 이루어진 평가인자 군을 기반으로 대사 스트레스 점수(X2)를 산출하는 산출부 및
산출부에서 산출한 산화 스트레스 점수(X1) 및 대사 스트레스 점수(X2)를 미리 학습된 머신러닝 모델에 입력하여 개체의 건강나이를 예측하는 예측부를 포함하는 장치를 제공한다.
상기한 과제의 해결 수단은 일 예시에 불과하며 통상의 기술자가 이해할 수 있는 범위의 본원 기술적 사상을 포함하는 수단은 모두 포함하는 것으로 해석되어야 한다.
본 발명의 일 실시예에 따르면, 건강나이 예측 모델에 여러 영역의 혈중 마커를 반영하면서도 각 마커 별 중요도를 반영한 산화 스트레스 점수 및 대사 스트레스 점수를 활용하여 개체에 존재하는 오차를 상쇄하고 더 정확한 나이예측이 가능하며, 통합적으로 예측된 건강나이(피검자의 현재 노화정도)에 대하여 산화 스트레스와 대사 스트레스의 영향력을 해석할 수 있다.
도 1은 본원에 따른 방법의 순서도를 나타낸 도면이다.
도 2는 본원에 따른 방법에서 신축망 정규화 선형회귀분석의 정확도를 향상시키기 위해 회귀선의 오류를 최소화하는 것을 설명하기 위한 도면이다.
도 3은 실시예 2에 따라 분석 가능한 전체 데이터셋을 이용하여 모델 성능을 평가하는 과정을 나타낸 도면이다.
도 4는 실시예 2에 따라 분석 가능한 전체 데이터셋 중 개발 데이터셋(training set)의 결정계수(R2)와 RMSE를 도출 및 예측된 건강나이와 실제나이 사이의 상관성을 분석한 결과를 나타낸 도면이다.
도 5a는 실시예 3에 따라, 실시예 2에서 검증 데이터셋(test set)의 예측능력을 검증한 것을 나타낸 것으로 건강나이와 실제나이의 연관성을 나타낸 도면이다.
도 5b는 실시예 3에 따라, 실시예 2에서 검증 데이터셋(test set)의 예측능력을 검증한 것을 나타낸 것으로 건강나이와 실제나이의 차이 및 실제나이 사이의 연관성을 나타낸 도면이다.
도 6은 실시예 3에 따라 각 연령별로 개발과 검증 데이터셋에서 중앙값, 평균값, 평균절대편차, RMSE를 확인한 결과를 나타낸 도면이다.
아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본원을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
본원 명세서 전체에서, 어떤 부재가 다른 부재 "상에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.
본원 명세서 전체에서, 어떤 부분이 어떤 구성 요소를 "포함" 한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
본원 명세서 전체에서 사용하는 정도의 용어 "약", "실질적으로" 등은 언급된 의미에 고유한 제조 및 물질 허용오차가 제시될 때 그 수치에서 또는 그 수치에 근접한 의미로 사용되고, 본원의 이해를 돕기 위해 정확하거나 절대적인 수치가 언급된 개시 내용을 비양심적인 침해자가 부당하게 이용하는 것을 방지하기 위해 사용된다. 본원 명세서 전체에서 사용하는 정도의 용어 "~(하는) 단계" 또는 "~의 단계"는 "~ 를 위한 단계"를 의미하지 않는다.
본원 명세서 전체에서, 마쿠시 형식의 표현에 포함된 "이들의 조합(들)"의 용어는 마쿠시 형식의 표현에 기재된 구성 요소들로 이루어진 군에서 선택되는 하나 이상의 혼합 또는 조합을 의미하는 것으로서, 상기 구성 요소들로 이루어진 군에서 선택되는 하나 이상을 포함하는 것을 의미한다.
본원 명세서 전체에서, "A 및/또는 B"의 기재는 "A 또는 B, 또는 A 및 B"를 의미한다.
본원 명세서 전체에서, "부(部)"란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1개의 유닛이 2개 이상의 하드웨어를 이용하여 실현되어도 되고, 2개 이상의 유닛이 1개의 하드웨어에 의해 실현되어도 된다.
본원 명세서 전체에서 "건강나이"란, 출생나이(주민등록상의 나이)가 아닌 개체의 현재 생리 또는 기능적 건강상태 및 노화정도를 나타내는 생물학적 나이를 의미한다. 본원은 개체의 산화 스트레스 및 대사 스트레스를 고려하여 개체의 건강나이를 예측하는 방법을 제시한다.
본원 명세서 전체에서 "산화 스트레스"란, 정상적인 대사과정에서 발생하는 활성산소(Reactive oxygen; ROS) 또는 활성산소종이 필요 이상으로 체내에 축적되어 개체에 영향을 미치는 것을 의미한다. 대표적인 활성산소로 산소이온 및 과산화수소가 있으며, 산화 스트레스가 높아지면 체내 장기의 기능이 떨어지고 면역 체계가 무너져 노화가 가속될 뿐만 아니라 대사 스트레스, 고혈압 등 만성질환의 발생 위험도 높아질 수 있다. 본원은 산화 스트레스를 개체별로 수치화하여 건강나이 예측 시 활용할 수 있는 방법을 제시한다.
본원 명세서 전체에서 "대사 스트레스"란. 개체의 생활습관 등 건강에 영향을 미쳐 질병을 일으킬 수 있는 요인을 의미한다. 대사 스트레스가 높을수록 건강과 관련된 여러 증후군에 걸릴 확률이 높아질 수 있다.
본원 명세서 전체에서 "개체"란, 건강나이를 측정하고자 하는 생물체를 의미하며, 인종에 상관없이 '인간'일 수 있다. 실시예의 개체는 주로 한국인을 대상으로 했으나 반드시 한국인에 제한되지 않는다.
본원 명세서 전체에서 "신축망 정규화 선형회귀분석"이란 둘 이상의 독립변수를 이용하여 종속변수를 예측하는 모델을 만들어주는 기법으로써, 다양한 독립변수에 의한 종속변수의 연관성을 설명해주는 방법 중 하나를 의미한다. 이 분석은 정규화 선형회귀의 일종으로 선형회귀 계수에 대한 제약 조건을 추가하여 모델이 과도하게 최적하게 된 상황을 막는 방법이다.
이하, 첨부된 도면을 참조하여 본원의 구현예 및 실시예를 상세히 설명한다. 그러나, 본원이 이러한 구현예 및 실시예와 도면에 제한되지 않을 수 있다.
도 1은 본원의 일 구현예에 따른 건강나이를 예측하는 순서도이다. 본원에 따른 건강나이를 예측하는 방법은
산화 스트레스 점수를 산출하는 단계, 대사 스트레스 점수를 산출하는 단계, 산출한 산화 스트레스 점수 및 대사 스트레스 점수를 미리 학습된 머신러닝 모델에 입력하여 개체의 건강나이를 예측하는 단계를 포함할 수 있다. 또한 개체의 평가인자를 포함하는 데이터를 입력하는 단계 또는 개체의 예측 생체나이를 출력하는 단계를 추가로 포함할 수 있다.
산화 스트레스 점수(X1)는 하기 식 1-1을 이용하여 산출될 수 있다.
X1 = (23.3553)+(-0.0035)*Physical activity+(0.8075)*EQ5D index+(-0.0042)*Saturated fat intake+(-0.0046)*'n-6' intake+(0.0001)*Cholesterol intake+(0.0003)*Calcium intake+(0.0005)*Iron intake+(0.0000004)*Potassium intake+(0.0001)*Retinol intake+(0.094)*Thiamine intake+(0.0031)*Niacin intake
<식 1-1>
산화 스트레스 점수(X1)는 또한 인자를 추가하여 하기 식 1-2를 이용하여 더욱 구체적으로 산출될 수 있다.
X1 = (23.3553)+(-0.1035)*Age + (-0.4482)*Sex+ (-0.0378)*SBP+(-0.0368)*DBP +(-0.0416)*Waist+(-0.1005)*BMI+(-0.0402)*Glucose+(-0.6069)*HBA1c+(0.0062)*LDL-C+(0.0297)*HDL-C+(-0.0107)*Triglycerides+(-0.00002)*GOT+(-0.0196)*GPT+(0.0001)*WBC +(0.1086)*RBC+(-0.0013)*Platelet+(-0.0035)*Physical activity+(0.8075)*EQ5D index+(-0.0042)*Saturated fat intake+(-0.0046)*'n-6' intake+(0.0001)*Cholesterol intake+(0.0003)*Calcium intake+(0.0005)*Iron intake+(0.0000004)*Potassium intake+(0.0001)*Retinol intake+(0.094)*Thiamine intake+(0.0031)*Niacin intake
<식 1-2>
상기 식 1-1 및 식 1-2는 산화 스트레스 점수 산정에 사용되는 각 마커의 추정량을 고려하여 가중치가 부여된 것이다. 산화 스트레스 점수가 높을 경우 대상의 건강 위험도가 낮은 것을 의미한다. 사용된 마커는 다음과 같다:
Age는 '개체의 만 연령'으로서 단위는 세
Sex는 '개체의 성별'로 남성이면 '1', 여성이면 '2'
SBP(systolic blood pressure)와 DBP(diastolic blood pressure)는 각각 '수축기혈압', '이완기혈압'으로 단위는 'mmHg'
Waist는 '허리둘레'로 단위는 'cm'
BMI(body mass index)는 '체질량지수'로 체중(kg)을 키(m)의 제곱으로 나눈 것이며 단위는 'kg/m2'
Glucose는 '개체의 공복혈당'으로 단위는 'mmol/L'
HbA1c는 '혈중 당화혈색소 농도'로 단위는 '%'
LDL-C(low-density lipoprotein-cholesterol)와 HLD-C(high-density lipoprotein-cholesterol)는 각각 '저밀도 콜레스테롤', '고밀도 콜레스테롤'로 단위는 'mg/dL'
Triglycerides는 '혈중 중성지방'으로 단위는 'mg/dL'
GOT(glutamic oxaloacetic transaminase)와 GPT(glutamic pyruvic transaminase)는 각각 '아스파르테이트 아미노전달효소', '알라닌 아미노전달효소'로 단위는 'IU/L'
WBC(white blood cell)는 '개체의 전혈 검체에서 측정된 백혈구 수'로서 단위는 'x103/㎕'
RBC(red blood cell)는 '개체의 전혈 검체에서 측정된 적혈구 수'로서 단위는 'x106/㎕'
Platelet은 '개체의 전혈 검체에서 측정된 혈소판 수'로서 단위는 'x103/㎕'
Physical activity(신체활동량)는 MET(Metabolic equivalent of task)으로 표현되며, 이는 국제신체활동설문지(Global Physical Activity Questionnaire, GPAQ)를 바탕으로 신진대사 해당치(MET; metabolic equivalent of task)를 정량화한 수치로 단위는 METs-hr/week
EQ5D(euroqol 5d dimension)는 건강관련 삶의 질 측정 설문지를 바탕으로 계산한 값으로 단위는 'index'
영양소 섭취인자 'Saturated fat', 'n-6'는 각각 '포화지방', '오메가-6 지방산'으로 단위는 모두 'g/day'
영양소 섭취인자 'Cholesterol', 'Calcium', 'Iron', 'Potassium', 'Thiamine', 'Niacin'은 각각 '콜레스테롤', '칼슘', '철분', '칼륨', '티아민', '나이아신'으로 단위는 모두 'mg/day'
영양소 섭취인자 'Retinol'은 '레티놀'로 단위는 '㎍/day'
대사 스트레스 점수(X2)는 하기 식 2-1를 이용하여 산출될 수 있다.
X2 = (32.2971) + (0.0131)*Physical activity + (0.2746)*EQ5D index + (-0.0001)*Total energy intake + (0.00002)*Water intake + (0.0001)*Protein intake + (-0.0037)*Saturated fat intake + (0.0052)*PUFA intake + (0.0284)*'n-3' intake + (0.0003)*Cholesterol intake + (0.0058)*Fiber intake + (0.0007)*Calcium intake + (-0.00001)*Potassium intake + (-0.00001)*Carotenoid intake + (0.00004)*Retinol intake + (-0.0946)*Riboflavin intake + (-0.0003)*Vitamin C intake
<식 2-1>
대사 스트레스 점수(X2)는 또한 인자를 추가하여 하기 식 2-2를 이용하여 더욱 구체적으로 산출될 수 있다.
X2 = (32.2971)+(-0.0728)*Age(years) + (-0.0157)*Sex + (-0.6564)*BMI + (-1.9892)*HBA1c + (-0.0301)*Total cholesterol + (0.0313)*LDL-C + (0.0123)*GOT + (-0.034)*GPT + (-0.3623)*Hemoglobin + (0.0398)*Hematocrit + (0.0560)*BUN + (0.9197)*Creatinine + (-0.1998)*WBC + (-0.1242)*RBC + (-0.003)*Platelet + (-0.064)*hs-CRP + (-0.0158)*Pack-year + (0.0068)*Sleeping hour + (0.0131)*Physical activity + (-0.0028)*Alcohol intake + (0.2746)*EQ5D index + (-0.0001)*Total energy intake + (0.00002)*Water intake + (0.0001)*Protein intake + (-0.0037)*Saturated fat intake + (0.0052)*PUFA intake + (0.0284)*'n-3' intake + (0.0003)*Cholesterol intake + (0.0058)*Fiber intake + (0.0007)*Calcium intake + (-0.00001)*Potassium intake + (-0.00001)*Carotenoid intake + (0.00004)*Retinol intake + (-0.0946)*Riboflavin intake + (-0.0003)*Vitamin C intake
<식 2-2>
상기 식 2-1 및 식 2-2는 대사 스트레스 점수 산정에 사용되는 각 마커의 추정량을 고려하여 가중치가 부여된 것이다. 대사 스트레스 점수가 높을 경우 대상의 건강 위험도가 낮은 것을 의미한다. 사용된 마커는 다음과 같다:
Age는 '개체의 만 연령'으로서 단위는 '세'
Sex는 '개체의 성별'로 남성이면 '1', 여성이면 '2'
BMI(body mass index)는 '체질량지수'로 체중(kg)을 키(m)의 제곱으로 나눈 것이며 단위는 'kg/m2'
HbA1c는 '혈중 당화혈색소 농도'로 단위는 '%'
Total cholesterol은 '혈중 콜레스테롤 농도'로 단위는 'mg/dL'
LDL-C(low-density lipoprotein-cholesterol)는 '저밀도 콜레스테롤'로 단위는 'mg/dL'
GOT(glutamic oxaloacetic transaminase)와 GPT(glutamic pyruvic transaminase)는 각각 '아스파르테이트 아미노전달효소', '알라닌 아미노전달효소'로 단위는 'IU/L'
Hemoglobin은 '혈중 헤모글로빈 농도'로 단위는 'g/dL'
Hematocrit은 '혈중 헤마토크릿 농도'로 단위는 '%'
BUN(blood urea nitogen), Creatinine은 '혈중 요소질소', '크레아티닌 농도'로서 단위는 'mg/dL'
WBC(white blood cell)는 '개체의 전혈 검체에서 측정된 백혈구 수'로서 단위는 'x103/㎕'
RBC(red blood cell)는 '개체의 전혈 검체에서 측정된 적혈구 수'로서 단위는 'x106/㎕'
Platelet은 '개체의 전혈 검체에서 측정된 혈소판 수'로서 단위는 'x103/㎕'
hs-CRP는 '고감도C반응단백질'로서 단위는 'mg/dL'
Pack-year는 하루 평균 흡연량(단위: 갑)에 흡연 기간(단위: 년)을 곱한 것
Sleeping hour는 '하루 평균 수면시간'으로 단위는 'hr/day'
Alcohol intake는 '하루 평균 음주량'으로 단위는 'g/day'
Physical activity(신체활동량)는 MET(Metabolic equivalent of task)으로 표현되며, 이는 국제신체활동설문지(Global Physical Activity Questionnaire, GPAQ)를 바탕으로 신진대사 해당치(MET; metabolic equivalent of task)를 정량화한 수치로 단위는 METs-hr/week
EQ5D는 건강관련 삶의 질 측정 설문지를 바탕으로 계산한 값으로 단위는 'index'
영양소 섭취인자 'Total energy', 'Water', 'Protein', 'Saturated' 'fat', 'PUFA(polyunsaturated fatty acid', 'n-3', 'Fiber'는 각각 '총에너지섭취량', '수분', '단백질', '포화지방', '불포화지방산', '오메가-3 지방산', '식이섬유'로서 단위는 모두 'g/day'
영양소 섭취인자 'Cholesterol', 'Calcium', 'Potassium', 'Riboflavin', 'Vitamin C'는 '콜레스테롤', '칼슘', '칼륨', '리보플라빈', '비타민C'로 단위는 모두 'mg/day'
영양소 섭취인자 'Carotenoid', 'Retinol'은 '카로티노이드', '레티놀'로 단위는 모두 '㎍/day'
식 1-1, 식 1-2, 식 2-1, 식 2-2는 계산식의 예시에 불과하며, 각 요인 및 추정량(예를 들어, (-0.0035)*Physical activity의 경우 요인은 신체활동량(Physical activity), 추정량은 (-0.0035) 임. 이하 같음)이 계산 시 항상 같이 사용되어야 함을 의미하지 않는다. 식 1-2를 예로 들자면, X1 계산식은 X1 = (23.3553)+(-0.1035)*Age+(-0.4482)*Sex일 수도 있고, X1 = (23.3553)+(-0.0416)*Waist+(-0.1005)*BMI+(-0.0402)*Glucose+(-0.6069)*HBA1c+(0.0062)*LDL-C+(0.0297)*HDL-C+(-0.0107)*Triglycerides+(-0.00002)*GOT+(-0.0196)*GPT+(0.0001)*WBC일 수도 있는 등, 각 요인 및 추정량이 계산 식에 포함될 수도 있고 포함되지 않을 수도 있다.
즉, 산화 스트레스 점수(X1)는 개체의 만 연령, 성별, 수축기혈압, 이완기혈압, 허리둘레, 체질량지수, 공복혈당, 혈중 당화혈색소 농도, 저밀도 콜레스테롤, 고밀도 콜레스테롤, 혈중 중성지방, 아스파르테이트 아미노전달효소, 알라닌아미노전달효소, 전혈 검체에서 측정된 백혈구 수, 전혈 검체에서 측정된 적혈구 수, 전혈 검체에서 측정된 혈소판 수, 신체활동량, EQ5D, 포화지방 영양소 섭취인자, 오메가-6지방산 영양소 섭취인자, 콜레스테롤 영양소 섭취인자, 칼슘 영양소 섭취인자, 철분 영양소 섭취인자, 칼륨 영양소 섭취인자, 티아민 영양소 섭취인자, 나이아신 영양소 섭취인자, 레티놀 영양소 섭취인자로 이루어진 평가인자 군 중 어느 하나 이상을 기반으로 산출될 수 있다. 가장 바람직한 계산식은 식 1-1 또는 식 1-2이나 이에 제한되지 않는다.
대사 스트레스 점수(X2)는 개체의 만 연령, 성별, 체질량지수, 혈중 당화혈색소 농도, 혈중 콜레스테롤 농도, 저밀도 콜레스테롤, 아스파르테이트 아미노전달효소, 알라닌 아미노전달효소, 혈중 헤모글로빈 농도, 혈중 헤마토크릿 농도, 혈중 요소질소, 크레아티닌 농도, 전혈 검체에서 측정된 백혈구 수, 전혈 검체에서 측정된 적혈구 수, 전혈 검체에서 측정된 혈소판 수, 고감도C반응단백질, Pack-year, 하루 평균 수면시간, 하루 평균 음주량, EQ5D, 총에너지섭취량/수분 섭취량, 단백질 영양소 섭취인자, 포화지방 영양소 섭취인자, 불포화지방산 영양소 섭취인자, 오메가-3 지방산 영양소 섭취인자, 식이섬유 영양소 섭취인자, 콜레스테롤 영양소 섭취인자, 칼슘 영양소 섭취인자, 칼륨 영양소 섭취인자, 리보플라민 영양소 섭취인자, 비타민C 영양소 섭취인자, 카로티노이드 영양소 섭취인자, 레티놀 영양소 섭취인자로 이루어진 평가인자 군 중 어느 하나 이상을 기반으로 산출될 수 있다. 가장 바람직한 계산식은 식 2-1 또는 식 2-2이나 이에 제한되지 않는다.
위에서 산정한 산화 스트레스 점수 및 대사 스트레스 점수를 미리 학습된 머신러닝모델에 사용함으로써 정확한 건강나이 예측이 가능하다. 여기서 머신러닝모델은 신축망 정규화 선형회귀분석(Elastic-Net Regularized Generalized Linear Model) 모델, 나이브베이즈 분류(Naive Bayes Classification) 모델, 로지스틱 회귀(Logistic Regression) 모델, 의사결정나무(Decision tree) 모델, 랜덤포레스트(Random forest) 모델, 부스팅(Boosting) 모델, 퍼셉트론(Perceptron) 모델, 서포트 벡터 머신(Support Vector Machine) 모델 및 이차판별분석(Quadratic classifiers) 모델로 이루어진 군에서 선택되는 어느 하나 이상을 포함할 수 있으나 이에 제한되지 않는다.
특히 신축망 정규화 선형회귀분석(Elastic-Net Regularized Generalized Linear Model) 모델을 사용하는 경우 두 점수 X1 및 X2를 각각 독립변수로, 개체의 예측 건강나이를 종속변수로 사용함으로써 건강나이에 미치는 산화 스트레스의 연관성 및 대사 스트레스의 연관성을 평가할 수 있다.
본원에 따른 방법에서 신축망 정규화 선형회귀분석모델은 식 3을 사용하여 개체의 건강나이(Y)를 계산할 수 있다. 식 3을 사용하면 건강나이 예측 정확도를 높이고 더욱 일반화된 모델을 생성하기 위해 회귀선의 오류를 최소화할 수 있다.
Y = A* X1 + B* X2 + C*Chronological age + D
<식 3>
여기서,
A는 (-1) 이상 0 이하의 실수,
B는 0이상 1이하의 실수,
C는 0이상 1이하의 실수,
D는 실수,
Chronological age는 각 개체의 실제 주민등록상 나이이다.
더욱 구체적으로, 식 3은 아래와 같은 식일 수 있다.
Y = (99.9063692)+(-1.2833514)*X1 + (0.3212085)*X2 + (0.580599)*'Chronological age'
여기서,
Chronological age는 각 개체의 실제 주민등록상 나이이다.
회귀선의 오류를 최소화한다는 것은 Y=X 조건을 충족하는, 45도 각도로 원점을 통과하는 선을 중심으로 대상을 그룹화하는 것이다. 표본과 회귀선과의 수직거리를 유지하면서, 모델의 선형 상관관계를 높이는 방법을 사용하였다 (Ageing and Longevity 2021, 2(1), 26-31). (도 2 참조)
회귀모델의 평가지표는 제곱근-평균-제곱 오차(root-mean-square error; RMSE)로 검증할 수 있다. 이는 회귀 선의 표준오차(standard error of estimation)이라고도 불리며, RMSE가 작을수록 설명력이 높다는 것을 의미한다. 결정계수(R2; R-square)는 추정한 선형 모델이 주어진 자료에 적합한 정도를 판단하는 척도이다. 결정계수가 높을수록 독립변수가 종속변수를 많이 설명한다는 것을 뜻한다.
또한 본원은 건강나이를 예측하는 장치에 있어서,
신체활동량, EQ5D, 포화지방 영양소 섭취인자, 오메가-6지방산 영양소 섭취인자, 콜레스테롤 영양소 섭취인자, 칼슘 영양소 섭취인자, 철분 영양소 섭취인자, 칼륨 영양소 섭취인자, 티아민 영양소 섭취인자, 나이아신 영양소 섭취인자, 레티놀 영양소 섭취인자로 이루어진 평가인자 군을 기반으로 산화 스트레스 점수(X1)를 산출하고, 신체활동량, EQ5D, 총에너지섭취량, 수분 섭취량, 단백질 영양소 섭취인자, 포화지방 영양소 섭취인자, 불포화지방산 영양소 섭취인자, 오메가-3 지방산 영양소 섭취인자, 식이섬유 영양소 섭취인자, 콜레스테롤 영양소 섭취인자, 칼슘 영양소 섭취인자, 칼륨 영양소 섭취인자, 리보플라민 영양소 섭취인자, 비타민C 영양소 섭취인자, 카로티노이드 영양소 섭취인자, 레티놀 영양소 섭취인자로 이루어진 평가인자 군을 기반으로 대사 스트레스 점수(X2)를 산출하는 산출부(720) 및 산출부(720)에서 산출한 산화 스트레스 점수(X1) 및 대사 스트레스 점수(X2)를 미리 학습된 머신러닝 모델에 입력하여 개체의 건강나이를 예측하는 예측부(730)를 포함하는 장치를 제공한다. 상기 장치는 개체의 평가인자를 포함하는 데이터를 입력하는 입력부(710) 또는 개체의 예측 건강나이를 출력하는 출력부(740)를 추가로 포함할 수 있다. 본원 장치에 있어서 위 건강나이를 예측하는 방법과 공통되는 부분은 모두 동일하게 적용될 수 있다.
실시예 1. 산화 스트레스 및 대사 스트레스 모델을 통한 점수 산출
실시예를 통해 실제 개체 데이터를 사용하여 본원에 따른 식 1-1, 식 1-2, 식 2-1 및 식 2-2을 도출한 과정을 설명한다.
1) 모집단 설정
제6기(2015년)와 제7기(2016-2018년) 국민건강영양조사 대상자 중 만 20세 이상이면서 건강 설문 조사, 검진조사, 영양조사에 모두 참여한 자 31,649명을 대상으로 하였다. 그 중 만 20세 미만, 임신부 및 수유부, 조사 결과가 누락된 사람, 일일 에너지 섭취량이 500kcal 미만이거나 5,000kcal 이상인 사람 및 기타 질환자는 분석 대상자에서 제외하였다.
산화 스트레스 질환군은 당뇨, 이상지지질혈증, 고혈압, 심근경색, 협심증, 뇌졸중, 황반변성, 백내장, 녹내장, 당뇨망막병증, 망막전막, 간경변증가진 사람들로 분류하였다.
대사 스트레스 질환군은 아래의 5가지 대사 위험인자중 세 개 이상을 가진 사람들로 분류하였다.
혈압: 130 mmHg/85 mmHg 이상;
중성지방: 150 mg/dL 이상;
공복혈당: 100 mg/dL이상;
허리둘레: 남자 90 cm 이상, 여자 85 cm 이상;
HDL 콜레스테롤: 남자 40 mg/dL 미만, 여자 50 mg/dL 이하
위 두 군에 대한 대조집단으로서 설정된 건강군은 상기 산화 스트레스 질환 및 건강위험요인을 모두 가지지 않는 사람이다.
예측 능력 검증을 위하여 선정된 전체 데이터를 개발 데이터셋(70%), 검증데이터셋(30%)로 임의로 구분한 다음, 개발 데이터셋에서 모델을 개발하고, 검증 데이터셋에서 개발된 모델의 성능을 평가하였다.
2) 산화 및 대사 스트레스 점수 산출을 위한 인자 선택
산화 스트레스 관련 변수는 총 52개의 인자들 (연별, 성별, 수축기혈압, 이완기혈압, 허리둘레, 체질량지수, 공복 혈당, 당화혈색소, 총 콜레스테롤, 저밀도지질단백질 콜레스테롤, 고밀도지질단백질 콜레스테롤, 혈중 중성지방, 간기능 효소(알라닌 아미노전이효소, 아스파르테이트 아미노전이효소), 헤모글로빈, 헤마토크릿, 혈액요소질소, 혈청 크레아티닌, 백혈구 수, 적혈구 수, 혈소판 수, 고감도 C-반응단백, 흡연량, 수면시간, 활동량, 음주량, 삶의 질, 영양소섭취량(에너지, 수분, 단백질, 지방, 포화지방, 단순불포화지방산, 고도불포화지방산, 오메가3, 오메가6, 콜레스테롤, 탄수화물, 식이섬유, 칼슘, 인, 철, 나트륨, 칼륨, 카로티노이드, 레티놀, 티아민, 리보플라빈, 나이아신, 비타민C)이 선별되었다.
대사 스트레스 관련 변수는 총 46개의 인자들 (연령, 성별, 체질량지수, 당화혈색소, 총 콜레스테롤, 저밀도지질단백질, 간기능 효소(알라닌 아미노전이효소, 아스파르테이트 아미노전이효소), 헤모글로빈, 헤마토크릿, 혈액요소질소, 혈청 크레아티닌, 백혈구 수, 적혈구 수, 혈소판 수, 고감도 C-반응단백, 흡연량, 수면시간, 활동량, 음주량, 삶의 질, 영양소섭취량(에너지, 수분, 단백질, 지방, 포화지방, 단순불포화지방산, 고도불포화지방산, 오메가3, 오메가6, 콜레스테롤, 탄수화물, 식이섬유, 칼슘, 인, 철, 나트륨, 칼륨, 카로티노이드, 레티놀, 티아민, 리보플라빈, 나이아신, 비타민C)이 선별되었다.
선형회귀 계수(weight)에 대한 가중치들의 제곱합(squared sum of weights)을 최소화하는 능형회귀(ridge regression) 모형과 회귀 계수에 대한 가중치의 절대값의 합을 최소화하는 라소회귀(Least Absolute Shrinkage Selector Operator; LASSO) 모형 방식을 결합한 신축망(elastic net-regularization) 회귀분석을 이용하여 산화와 대사 스트레스와 관련 있는 변수를 최종 선정하였다.
3) 선정 인자에 대한 추정량 부여
상기 선정된 인자와 각 인자의 추정량(parameter estimate)을 고려하여 아래와 같이 산화 스트레스 및 대사 스트레스에 대한 평가 식 1-1, 식 1-2, 식 2-1 및 식 2-2를 최종 도출하였다.
구체적으로, 범주형 변수(산화 스트레스 혹은 대사 스트레스 위험 여부)로 이루어진 종속변수와 위 과정을 통해 선정된 독립변수를 선형으로 결합한 일반화 선형모형(generalized linear model)을 거쳐 산화 스트레스 및 대사 스트레스 평가모델로서 식 1-1, 식 1-2, 식 2-1 및 식 2-2를 도출하였다.
실시예 2. 건강나이 모델 확립을 위한 신축망 정규화 선형회귀분석
실시예 1에서 산출된 산화 스트레스 및 대사 스트레스 점수를 이용하여 신축망 정규화 선형회귀분석 (Elastic-Net Regularized Generalized Linear Model)을 수행하였다.
측정한 산화 스트레스와 대사 스트레스 점수 각각을 독립변수(X)로 설정하고, 종속변수(Y)는 건강나이로 설정하여 예측을 진행했다. 예측 결과에서 실제나이와 비교하였을 때 건강나이가 100살 이상인 13명을 이상치(outlier)로 분류하여 데이터셋에서 제외하였다.
최종적으로 8,993명이 분석 가능한 전체 데이터셋으로 확인되었다. 건강나이 개발과 예측 능력 검증을 위하여 전체 데이터를 개발 데이터셋 (training set; 전체 데이터의 70%), 검증 데이터셋 (test set; 전체 데이터의 30%)로 임의로 구분한 다음, 개발 데이터셋에서 모델을 개발하고, 검증 데이터셋에서 모델의 성능을 평가하였다. (도 3 참조)
개발 데이터셋을 대상으로 정확도를 높이고 더욱 일반화된 모델을 생성하기 위해 10-fold 교차검증한(cross validation) 신축망 정규화 선형회귀분석을 진행하였다.
그 다음, 계산된 y절편에 해당하는 상수(constant)값과 계수(coefficient)값을 이용하여 회귀선의 오류를 최소화하는 식 3을 최종 도출하였다.
개발 데이터셋(training set)에서는 R2 값이 0.8331, RMSE값이 6.8839로 도출되었다. 또한 예측된 건강나이와 실제나이의 상관성(Correlation)은 0.9127로 나타났다 (도 4 참조).
실시예 3. 건강나이 모델의 성능 평가
검증 데이터셋의 R2 값은 0.7992, RMSE값이 6.8787로 도출되었다. 실제나이와의 연관성은 0.8912로 나타나 본 발명에 따른 건강나이 모델 측정 방법은 우수한 예측 성능을 보인다는 것을 알 수 있었다. (도 5a 참조) 또한 예측된 건강나이에서 실제나이를 뺀 값과 실제나이와의 상관관계는 -0.0081로, 유의하지 않음을 알 수 있었다. 이는 모델이 건강나이 예측에 적합하다는 것을 의미한다. (도 5b 참조)
그 다음, 각 연령별로 개발 데이터셋과 검증 데이터셋에서 중앙값, 평균값, 평균절대편차, RMSE를 확인하였다. 여기서 평균절대편차(mean absolute deviation; MAD)는 절대편차들을 모두 합한 후 평균을 낸 수치로서 측정 값들이 평균에서 얼마나 퍼져 있는지를 나타내는 척도 중 하나이며 모델의 설명력을 추가로 확인할 수 있다. 검증 데이터셋에서 검증한 결과, 개발 데이터셋의 값과 큰 차이를 보이지 않았으며 비슷한 MAD와 RMSE 값을 확인할 수 있어 개발된 모델의 정확성을 알 수 있었다. 이 두 값은 일반 다중선형회귀 모델과 비교했을 때 약 4 ~ 5년 더 줄어들었고, 이것은 오차가 낮아진 것을 의미하며 모델의 예측력이 높아진 것을 뒷받침해준다. (도 6 참조)
따라서, 본 발명에 따른 건강나이 예측방법은 개인의 산화 스트레스와 대사 스트레스의 요소를 고려하여 평가할 수 있어 보다 정확하게 개인의 건강나이를 진단할 수 있을 뿐 아니라 개인 맞춤형 건강관리 서비스 도구로도 유용하게 이용될 수 있다.
7: 건강나이예측 장치
710: 입력부
720: 산출부
730: 예측부
740: 출력부

Claims (16)

  1. 개체의 건강나이를 예측하는 방법에 있어서,
    신체활동량, EQ5D, 포화지방 영양소 섭취인자, 오메가-6지방산 영양소 섭취인자, 콜레스테롤 영양소 섭취인자, 칼슘 영양소 섭취인자, 철분 영양소 섭취인자, 칼륨 영양소 섭취인자, 티아민 영양소 섭취인자, 나이아신 영양소 섭취인자 및 레티놀 영양소 섭취인자로 이루어진 평가인자 군을 기반으로 산화 스트레스 점수(X1)를 산출하는 단계;
    신체활동량, EQ5D, 총에너지섭취량, 수분 섭취량, 단백질 영양소 섭취인자, 포화지방 영양소 섭취인자, 불포화지방산 영양소 섭취인자, 오메가-3 지방산 영양소 섭취인자, 식이섬유 영양소 섭취인자, 콜레스테롤 영양소 섭취인자, 칼슘 영양소 섭취인자, 칼륨 영양소 섭취인자, 리보플라민 영양소 섭취인자, 비타민C 영양소 섭취인자, 카로티노이드 영양소 섭취인자 및 레티놀 영양소 섭취인자로 이루어진 평가인자 군을 기반으로 대사 스트레스 점수(X2)를 산출하는 단계; 및
    산출된 산화 스트레스 점수 및 대사 스트레스 점수를 미리 학습된 머신러닝 모델에 입력하여 개체의 건강나이를 예측하는 단계를 포함하는 방법.
  2. 제1항에 있어서,
    상기 산화 스트레스 점수(X1)를 산출하는 단계의 평가인자 군은 개체의 만 연령, 성별, 수축기혈압, 이완기혈압, 허리둘레, 체질량지수, 공복혈당, 혈중 당화혈색소 농도, 저밀도 콜레스테롤, 고밀도 콜레스테롤, 혈중 중성지방, 아스파르테이트 아미노전달효소, 알라닌아미노전달효소, 전혈 검체에서 측정된 백혈구 수, 전혈 검체에서 측정된 적혈구 수 및 전혈 검체에서 측정된 혈소판 수로 이루어진 군에서 선택되는 어느 하나 이상을 추가로 포함하는 방법.
  3. 제1항에 있어서,
    상기 대사 스트레스 점수(X2)를 산출하는 단계의 평가인자 군은 개체의 만 연령, 성별, 체질량지수, 혈중 당화혈색소 농도, 혈중 콜레스테롤 농도, 저밀도 콜레스테롤, 아스파르테이트 아미노전달효소, 알라닌 아미노전달효소, 혈중 헤모글로빈 농도, 혈중 헤마토크릿 농도, 혈중 요소질소, 크레아티닌 농도, 전혈 검체에서 측정된 백혈구 수, 전혈 검체에서 측정된 적혈구 수, 전혈 검체에서 측정된 혈소판 수, 고감도C반응단백질, Pack-year, 하루 평균 수면시간 및 하루 평균 음주량으로 이루어진 군에서 선택되는 어느 하나 이상을 추가로 포함하는 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 미리 학습된 머신러닝모델은 나이브베이즈 분류(Naive Bayes Classification) 모델, 로지스틱 회귀(Logistic Regression) 모델, 의사결정나무(Decision tree) 모델, 랜덤포레스트(Random forest) 모델, 부스팅(Boosting) 모델, 퍼셉트론(Perceptron) 모델, 서포트 벡터 머신(Support Vector Machine) 모델 및 이차판별분석(Quadratic classifiers) 모델로 이루어진 군에서 선택되는 어느 하나 이상인 것인 방법.
  5. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 미리 학습된 머신러닝모델은 신축망 정규화 선형회귀분석(Elastic-Net Regularized Generalized Linear Model) 모델인 것인 방법.
  6. 제5항에 있어서,
    상기 신축망 정규화 선형회귀분석(Elastic-Net Regularized Generalized Linear Model) 모델은
    상기 산화 스트레스 점수(X1) 및 상기 대사 스트레스 점수(X2)를 독립변수로,
    개체의 예측 건강나이(Y)를 종속변수로 설정하는 것인 방법.
  7. 제6항에 있어서,
    상기 모델은 식 3을 사용하여 개체의 건강나이(Y)를 계산하는 것인 방법.
    Y = A* X1 + B* X2 + C*'Chronological age' + D
    <식 3>
    여기서,
    A는 (-1) 이상 0 이하의 실수,
    B는 0이상 1이하의 실수,
    C는 0이상 1이하의 실수,
    D는 실수,
    Chronological age는 개체의 실제 주민등록상 나이
  8. 제7항에 있어서,
    상기 식 3의 A는 (-1.2833514), B는 (0.3212085), C는 (0.580599) 및 D는 (99.9063692)인 것인 방법.
  9. 건강나이를 예측하는 장치에 있어서,
    신체활동량, EQ5D, 포화지방 영양소 섭취인자, 오메가-6지방산 영양소 섭취인자, 콜레스테롤 영양소 섭취인자, 칼슘 영양소 섭취인자, 철분 영양소 섭취인자, 칼륨 영양소 섭취인자, 티아민 영양소 섭취인자, 나이아신 영양소 섭취인자 및 레티놀 영양소 섭취인자로 이루어진 평가인자 군을 기반으로 산화 스트레스 점수(X1)를 산출하고, 신체활동량, EQ5D, 총에너지섭취량, 수분 섭취량, 단백질 영양소 섭취인자, 포화지방 영양소 섭취인자, 불포화지방산 영양소 섭취인자, 오메가-3 지방산 영양소 섭취인자, 식이섬유 영양소 섭취인자, 콜레스테롤 영양소 섭취인자, 칼슘 영양소 섭취인자, 칼륨 영양소 섭취인자, 리보플라민 영양소 섭취인자, 비타민C 영양소 섭취인자, 카로티노이드 영양소 섭취인자 및 레티놀 영양소 섭취인자로 이루어진 평가인자 군을 기반으로 대사 스트레스 점수(X2)를 산출하는 산출부; 및
    산출부에서 산출한 산화 스트레스 점수(X1) 및 대사 스트레스 점수(X2)를 미리 학습된 머신러닝 모델에 입력하여 개체의 건강나이를 예측하는 예측부를 포함하는 장치.
  10. 제9항에 있어서,
    상기 산화 스트레스 점수(X1) 산출에 사용되는 평가인자 군은 개체의 만 연령, 성별, 수축기혈압, 이완기혈압, 허리둘레, 체질량지수, 공복혈당, 혈중 당화혈색소 농도, 저밀도 콜레스테롤, 고밀도 콜레스테롤, 혈중 중성지방, 아스파르테이트 아미노전달효소, 알라닌아미노전달효소, 전혈 검체에서 측정된 백혈구 수, 전혈 검체에서 측정된 적혈구 수 및 전혈 검체에서 측정된 혈소판 수로 이루어진 군에서 선택되는 어느 하나 이상을 추가로 포함하는 장치.
  11. 제9항에 있어서,
    상기 대사 스트레스 점수(X2) 산출에 사용되는 평가인자 군은 개체의 만 연령, 성별, 체질량지수, 혈중 당화혈색소 농도, 혈중 콜레스테롤 농도, 저밀도 콜레스테롤, 아스파르테이트 아미노전달효소, 알라닌 아미노전달효소, 혈중 헤모글로빈 농도, 혈중 헤마토크릿 농도, 혈중 요소질소, 크레아티닌 농도, 전혈 검체에서 측정된 백혈구 수, 전혈 검체에서 측정된 적혈구 수, 전혈 검체에서 측정된 혈소판 수, 고감도C반응단백질, Pack-year, 하루 평균 수면시간 및 하루 평균 음주량으로 이루어진 군에서 선택되는 어느 하나 이상을 추가로 포함하는 장치.
  12. 제9 내지 제11항 중 어느 한 항에 있어서,
    상기 미리 학습된 머신러닝모델은 나이브베이즈 분류(Naive Bayes Classification) 모델, 로지스틱 회귀(Logistic Regression) 모델, 의사결정나무(Decision tree) 모델, 랜덤포레스트(Random forest) 모델, 부스팅(Boosting) 모델, 퍼셉트론(Perceptron) 모델, 서포트 벡터 머신(Support Vector Machine) 모델 및 이차판별분석(Quadratic classifiers) 모델로 이루어진 군에서 선택되는 어느 하나 이상인 것인 장치.
  13. 제9항 내지 제11항 중 어느 한 항에 있어서,
    상기 미리 학습된 머신러닝모델은 신축망 정규화 선형회귀분석(Elastic-Net Regularized Generalized Linear Model) 모델인 것인 장치.
  14. 제13항에 있어서,
    상기 신축망 정규화 선형회귀분석(Elastic-Net Regularized Generalized Linear Model) 모델은
    상기 산화 스트레스 점수(X1) 및 상기 대사 스트레스 점수(X2)를 독립변수로,
    개체의 예측 건강나이(Y)를 종속변수로 설정하는 것인 장치.
  15. 제14항에 있어서,
    상기 신축망 정규화 선형회귀분석(Elastic-Net Regularized Generalized Linear Model) 모델은 식 3을 이용하여 개체의 건강나이(Y)를 계산할 수 있는 것인 장치.
    Y = A* X1 + B* X2 + C*'Chronological age' + D
    <식 3>
    여기서,
    A는 (-1) 이상 0 이하의 실수,
    B는 0이상 1이하의 실수,
    C는 0이상 1이하의 실수,
    D는 실수,
    Chronological age는 각 개체의 실제 주민등록상 나이
  16. 제15항에 있어서,
    상기 식 3의 A는 (-1.2833514), B는 (0.3212085), C는 (0.580599) 및 D는 (99.9063692)인 것인 장치.
KR1020220090019A 2022-07-21 2022-07-21 건강나이를 예측하는 장치 및 방법 KR20240012704A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220090019A KR20240012704A (ko) 2022-07-21 2022-07-21 건강나이를 예측하는 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220090019A KR20240012704A (ko) 2022-07-21 2022-07-21 건강나이를 예측하는 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20240012704A true KR20240012704A (ko) 2024-01-30

Family

ID=89715450

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220090019A KR20240012704A (ko) 2022-07-21 2022-07-21 건강나이를 예측하는 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20240012704A (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101328643B1 (ko) 2013-04-22 2013-11-20 주식회사 바이오에이지 생체 나이 예측 장치 및 방법
KR101669526B1 (ko) 2015-03-04 2016-10-26 주식회사 바이오에이지 생체나이를 이용한 잔여 수명 예측방법
KR102106428B1 (ko) 2018-02-19 2020-05-06 주식회사 셀바스에이아이 건강나이 예측 방법
KR20210127478A (ko) 2020-04-14 2021-10-22 주식회사 클리노믹스 다양한 오믹스 데이터 분석에 기초한 생체나이 예측방법 및 시스템
KR102371440B1 (ko) 2021-08-28 2022-03-07 유진바이오소프트 주식회사 개인 맞춤 생체나이 예측 모형 생성 방법 및 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101328643B1 (ko) 2013-04-22 2013-11-20 주식회사 바이오에이지 생체 나이 예측 장치 및 방법
KR101669526B1 (ko) 2015-03-04 2016-10-26 주식회사 바이오에이지 생체나이를 이용한 잔여 수명 예측방법
KR102106428B1 (ko) 2018-02-19 2020-05-06 주식회사 셀바스에이아이 건강나이 예측 방법
KR20210127478A (ko) 2020-04-14 2021-10-22 주식회사 클리노믹스 다양한 오믹스 데이터 분석에 기초한 생체나이 예측방법 및 시스템
KR102371440B1 (ko) 2021-08-28 2022-03-07 유진바이오소프트 주식회사 개인 맞춤 생체나이 예측 모형 생성 방법 및 시스템

Similar Documents

Publication Publication Date Title
Bingham Biomarkers in nutritional epidemiology
AU2008279778B2 (en) Method for Determining Insulin Sensitivity with Biomarkers
Colacino et al. Dietary antioxidant and anti-inflammatory intake modifies the effect of cadmium exposure on markers of systemic inflammation and oxidative stress
Haghighatdoost et al. Association of dietary acid load with cardiovascular disease risk factors in patients with diabetic nephropathy
Nash et al. Stable Nitrogen and Carbon Isotope Ratios Indicate Traditional and Market Food Intake in an Indigenous Circumpolar Population3
Van Dam et al. Biochemical indicators of dietary intake
Psota et al. Associations between eating competence and cardiovascular disease biomarkers
Paynter et al. Prediction of incident hypertension risk in women with currently normal blood pressure
Moludi et al. The relationship between Dietary Inflammatory Index and disease severity and inflammatory status: A case–control study of COVID-19 patients
Arbeev et al. Genetic model for longitudinal studies of aging, health, and longevity and its potential application to incomplete data
Rafiq et al. Sources of variation in food-related metabolites during pregnancy
Fallah-Fini et al. Trends in energy imbalance gap and body weight status in the Japanese adult population: a system dynamics approach
Wong et al. Prediction of mortality and hospitalization risk using nutritional indicators and their changes over time in a large prevalent hemodialysis cohort
KR20240012704A (ko) 건강나이를 예측하는 장치 및 방법
KR20210001959A (ko) 위암의 다층 다요인 패널과 Computational biological network modeling을 통한 위암 발암에 대한 에티옴 모형
WO2014143080A1 (en) Methods for generating personalized dietary guidance using fatty acids for purposes of reducing risk of pathology
KR102177291B1 (ko) 산화적 스트레스 수준을 측정하는 방법
JP7281633B2 (ja) 平均赤血球年齢を決定する方法
Drew Challenges of the heterogeneous nutrition response: interpreting the group mean
O’Gorman et al. Exploring the links between diet and health in an Irish cohort: a lipidomic approach
KR102383788B1 (ko) 신체적 스트레스 상태를 평가하는 방법
Jungert et al. Intra-individual variation and reliability of biomarkers of the antioxidant defense system by considering dietary and lifestyle factors in premenopausal women
Laoudi et al. Increased levels of stress, anxiety and depression among patients with CD and UC
Rakhshani The relationship of micronutrients intake and anthropometric indexes with high-sensitivity C-Reactive protein (hs-CRP) in the elderly living in nursing home, Sabzevar, Iran
Medina-Torne et al. Dietary factors associated with adiponectin in Filipino-American women