KR20200135444A - 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법들 및 컴퓨터-구현 방법 - Google Patents

만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법들 및 컴퓨터-구현 방법 Download PDF

Info

Publication number
KR20200135444A
KR20200135444A KR1020207030180A KR20207030180A KR20200135444A KR 20200135444 A KR20200135444 A KR 20200135444A KR 1020207030180 A KR1020207030180 A KR 1020207030180A KR 20207030180 A KR20207030180 A KR 20207030180A KR 20200135444 A KR20200135444 A KR 20200135444A
Authority
KR
South Korea
Prior art keywords
subject
sample level
risk
albumin
creatinine
Prior art date
Application number
KR1020207030180A
Other languages
English (en)
Inventor
알렉산더 뷔써
토니 후쉬토
볼프강 페트리히
슈테판 라비차
베른트 슈나이딩거
Original Assignee
에프. 호프만-라 로슈 아게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP18163573.1A external-priority patent/EP3543702B1/en
Application filed by 에프. 호프만-라 로슈 아게 filed Critical 에프. 호프만-라 로슈 아게
Publication of KR20200135444A publication Critical patent/KR20200135444A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/34Genitourinary disorders
    • G01N2800/347Renal failures; Glomerular diseases; Tubulointerstitial diseases, e.g. nephritic syndrome, glomerulonephritis; Renovascular diseases, e.g. renal artery occlusion, nephropathy
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/54Determining the risk of relapse
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Hematology (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Immunology (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Cell Biology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Microbiology (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)

Abstract

본 개시는 만성 신장 질환 (CKD) 의 위험에 대해 피험자를 스크리닝하기 위한 방법에 관한 것이고, 그 방법은: 피험자에 대한 복수의 마커 파라미터들을 나타내는 마커 데이터를 수신하는 단계로서, 이러한 복수의 마커 파라미터들은, 측정 기간 동안 피험자에 대해, 연령 값, 크레아티닌의 샘플 레벨, 및 알부민의 샘플 레벨을 나타내는, 상기 마커 데이터를 수신하는 단계; 및, 복수의 마커 파라미터들로부터 피험자에 대한 앓고 있는 CKD 의 위험을 나타내는 위험 인자를 결정하는 단계를 포함하고, 여기서, 상기 결정하는 단계는: 알부민의 샘플 레벨보다 더 높게 연령 값에 가중치를 부여하는 단계, 및, 알부민의 샘플 레벨보다 더 높게 크레아티닌의 샘플 레벨에 가중치를 부여하는 단계를 포함한다. 추가로, 만성 신장 질환 (CKD) 의 위험에 대해 피험자를 스크리닝하기 위한 컴퓨터-구현 방법 및 피험자를 스크리닝하기 위한 방법이 제공된다.

Description

만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법들 및 컴퓨터-구현 방법
본 발명은 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법 및 컴퓨터-구현 방법에 관한 것이다.
배경
만성 신장 질환 (chronic kidney disease; CKD) 에서, 사구체 여과율의 감소 및/또는 단백뇨로 시작하여 말기 신장 질환으로 진행하면서 신장 기능은 점차적으로 소실된다. 결과로서, 투석 또는 신장 이식이 필요하게 될 수도 있다 (Unger, J., Schwartz, Z., Diabetes Management in Primary Care, 2nd edition. Lippincott Williams & Wilkens, Philadelphia, USA, 2013 참조). CKD 는 2013년에 7% 의 조정된 유병률로 심각한 문제이다 (Glassock, R.J. 외, The global burden of chronic kidney disease: estimates, variability and pitfalls, Nat Rev Nephrol 13, 104-114, 2017). CKD 의 조기 인식은 진행을 늦추고, 합병증들을 방지하며, 심혈관 관련 결과들을 줄일 수 있을 것이다 (Platinga, L.C. 외, Awareness of chronic kidney disease among patients and providers, Adv Chronic Kidney Dis 17, 225-236, 2010). CKD 는 당뇨병의 미세혈관 장기 합병증일 수도 있다 (Fioretto, P. 외, Residual microvascular risk in diabetes: unmet needs and future directions, Nat Rev Endocrinol 6, 19-25, 2010).
당뇨병 환자들의 CKD 위험 예측을 위한 알고리즘들은, 예를 들어, Dunkler 등 (Dunkler, D. 외, Risk Prediction for Early CKD in Type 2 Diabetes, Clin J Am Soc Nephrol 10, 1371-1379, 2015), Vergouwe 등 (Vergouwe, Y. 외, Progression to microalbuminuria in type 1 diabetes: development and validation of a prediction rule, Diabetologia 53, 254-262, 2010), Keane 등 (Keane, W.F. 외, Risk Scores for Predicting Outcomes in Patients with Type 2 Diabetes and Nephropathy: The RENAAL Study, Clin J Am Soc Nephrol 1, 761-767, 2006) 및 Jardine 등 (Jardine, M.J. 외, Prediction of Kidney-Related Outcomes in Patients With Type 2 Diabetes, Am J Kidney Dis. 60, 770-778, 2012) 에 의해 발표되었다. 이러한 발표된 알고리즘들은 주요 임상 연구들에서 얻은 데이터로부터 도출된다.
CKD 의 위험 예측을 위한 추가적인 모델들은, 예를 들어, Adler Perotte 등 (Adler Perotte 외:"Risk prediction for chronic kidney disease progression using heterogeneous electronic health record data and time series analysis", Journal of the American Medical Informatics Association, vol. 22, no. 4, 20 April 2015 (2015-04-20), pages 872-880), Paolo Fraccaro 등 (Paolo Fraccaro 외: "An external validation of models to predict the onset of chronic kidney disease using population-based electronic health records from Salford, UK", BMC Medicine, vol. 14, no. 1, 12 July 2016 (2016-07-12)), 및 Justin B. Echouffo-Tcheugui 등 (Justin B. Echouffo-Tcheugui 외: "Risk Models to Predict Chronic Kidney Disease and Its Progression: A Systematic Review", Plos Medicine, vol. 9, no. 11, 20 November 2012 (2012-11-20), page e1001344) 에 의해 기술되었다.
이러한 임상 데이터에 기초한 예측 모델들은 사전 선택된 모집단, 교차 검사 및 검증된 임상 데이터 항목들 및 종종 좁은 관찰 타임 윈도우로 이상적인 설정을 나타낸다. 따라서, 결과들은, 임상 연구들로부터 추론될 때 실제 모집단에 대해 효능 및 효과 측면에서 최적의 경로들을 반드시 나타내지는 않는다. 또한, 대부분의 문헌은 당뇨병성 콩팥병증 또는 CKD 의 진행에 초점을 맞추고, 따라서, 이러한 당뇨병 합병증의 초기 단계를 놓치고 있다. 마지막으로, 환자들은 통상적으로 각각의 피처들 (features) 의 전체 세트에 기초하여 선택된다.
요약
실제 데이터 (real world data; RWD) 에 기초하여 CKD 에 대한 조기 위험 평가를 가능하게 하는, 만성 신장 질환 위험에 대해 피험자 (subject) 를 스크리닝 (screening) 하기 위한 향상된 방법들을 제공하는 것이 목적이다.
이를 해결하기 위해, 독립 청구항들 1 및 15 에 따른, 만성 신장 질환 (CKD) 의 위험성에 대해 피험자를 스크리닝하기 위한 방법들이 제공된다. 추가로, 독립 청구항 14 에 따른 컴퓨터-구현 방법 (computer-implemented method) 이 제공된다. 종속 청구항들에서 추가적인 실시형태들이 개시된다.
일 양태에 따르면, 만성 신장 질환 (CKD) 의 위험에 대해 피험자를 스크리닝하기 위한 방법이 제공된다. 그 방법은, 피험자에 대한 복수의 마커 파라미터들을 나타내는 마커 데이터 (marker data) 를 수신하는 단계로서, 이러한 복수의 마커 파라미터들은, 측정 기간 (measurement period) 동안 피험자에 대해, 연령 값, 크레아티닌 (creatinine) 의 샘플 레벨, 및 알부민 (albumin) 의 샘플 레벨을 나타내는, 상기 마커 데이터를 수신하는 단계; 및, 복수의 마커 파라미터들로부터 피험자에 대한 앓고 있는 CKD 의 위험을 나타내는 위험 인자 (risk factor) 를 결정하는 단계를 포함한다. 그 결정하는 단계는, 알부민의 샘플 레벨보다 더 높게 연령 값에 가중치를 부여 (weighting) 하는 단계, 및, 알부민의 샘플 레벨보다 더 높게 크레아티닌의 샘플 레벨에 가중치를 부여하는 단계를 포함한다.
다른 양태에 따르면, 데이터 프로세싱 시스템에서 만성 신장 질환 (CKD) 의 위험에 대해 피험자를 스크리닝하기 위한 컴퓨터-구현 방법이 제공되고, 그 데이터 프로세싱 시스템은 프로세서 및 프로그램을 저장하는 비일시적 메모리를 가지고, 그 프로그램은 프로세서로 하여금:
- 피험자에 대한 복수의 마커 파라미터들을 나타내는 마커 데이터를 수신하는 것으로서, 이러한 복수의 마커 파라미터들은, 측정 기간 동안 피험자에 대해, 연령 값, 알부민의 샘플 레벨, 및 크레아티닌의 샘플 레벨을 나타내는, 상기 마커 데이터를 수신하는 것; 및
- 그 복수의 마커 파라미터들로부터 피험자에 대한 앓고 있는 CKD 의 위험을 나타내는 위험 인자를 결정하는 것을 실행하게 하고,
상기 결정하는 것은,
- 알부민의 샘플 레벨보다 더 높게 연령 값에 가중치를 부여하는 것, 및
- 알부민의 샘플 레벨보다 더 높게 크레아티닌의 샘플 레벨에 가중치를 부여하는 것을 포함한다.
추가적인 양태에 따르면, 만성 신장 질환 (CKD) 의 위험에 대해 피험자를 스크리닝하기 위한 방법이 제공된다. 그 방법은, 복수의 마커 파라미터들을 나타내는 마커 데이터를 수신하는 단계로서, 이러한 복수의 마커 파라미터들은, 피험자에 대한 연령 값, 측정 기간 동안의 크레아티닌의 샘플 레벨, 및, 측정 기간 동안의 알부민의 샘플 레벨을 나타내는, 상기 마커 데이터를 수신하는 단계; 및, 복수의 마커 파라미터들로부터 피험자에 대한 앓고 있는 CKD 의 위험을 나타내는 위험 인자를 결정하는 단계를 포함한다. 그 결정하는 단계는, 알부민의 샘플 레벨보다 더 높게 연령 값에 가중치를 부여하는 단계, 및, 알부민의 샘플 레벨보다 더 높게 크레아티닌의 샘플 레벨에 가중치를 부여하는 단계를 포함한다. 크레아티닌의 샘플 레벨 및 알부민의 샘플 레벨 중 적어도 하나는, 피험자들의 참조 그룹의 각각의 피험자의 각각의 측정 기간에 대해, 피험자를 포함하지 않는 피험자들의 참조 그룹에 대한 샘플 레벨들의 일반화된 값을 나타낸다.
이러한 방엉과 관련하여, 피험자들의 참조 그룹의 각각의 피험자에 대해, 측정 기간은 2년으로 제한될 수도 있고, 피험자들의 참조 그룹의 각각의 피험자의 당뇨병 진단으로 종료할 수도 있다.
마커 데이터에 대해, 위험 값을 결정하기 이전에 이상 값들 (outlier values) 의 스크리닝 또는 결정이 수행될 수도 있다. (예컨대, 값이 그 값에 대해 허용되는 특정 범위를 초과하는지 여부를 체크함으로써) 이상값을 결정하는 경우에, 그 값은 (예상되는) 표준 편차 내의 값에 의해서 또는 그 피처에 대한 특정 허용가능한 범위의 상위 또는 하위 제한에 의해서 대체될 수도 있다. 예를 들어, 데이터를 수집하는 과정에서의 실수로, 사람이 입력하는 데이터에 의해 값에 잘못된 소수점 자리가 제공될 수도 있다. 이러한 명백하게 잘못된 값은, 예컨대, 피처 값이 그 피처에 대한 특정 허용가능한 범위의 상한보다 더 높은 경우에, 그 값은 예측 공식에서 그것을 사용하기 전에 그 범위의 상한에 의해 대체될 수 있는 등으로, 정정될 수 있다. 피처 값이 그 피처에 대한 특정 허용가능한 범위의 하한보다 더 낮은 경우에, 그 값은 예측 공식에서 그것을 사용하기 전에 그 범위의 하한에 의해 대체될 수 있다.
마커 데이터에 대해, 위험 값을 결정하기 이전에 누락된 데이터 또는 값들의 스크리닝 또는 결정이 수행될 수도 있다. 누락된 데이터는 코호트 (cohort) 의 평균 값으로 대체될 수도 있다.
상기 조치들 중 하나 또는 양자 모두는 위험 인자를 결정하기 위한 향상된 마커 데이터를 제공하기 위해 적용될 수도 있다.
피험자를 포함하지 않는 피험자들의 참조 그룹에 대한 샘플 레벨들의 일반화된 값은, 예를 들어, 피험자들의 참조 그룹의 각각의 피험자의 각각의 측정 기간 동안 복수의 샘플 레벨들에 대해 결정된 최대 값, 최소 값, 평균 값, 중간 값, 또는 기울기일 수도 있다. 피험자들의 참조 그룹의 피험자들은 당뇨병 환자들일 수도 있다. 예를 들어, 피험자들의 참조 그룹의 모든 피험자들은 당뇨병 환자들일 수도 있다.
마커 파라미터들은, 예를 들어, (임상 데이터와는 달리) 데이터의 완전성 (completeness) 또는 정확도 (veracity) 에 관해 제한되지 않는 실제 데이터를 나타내는 것일 수도 있다.
측정 기간 동안의 피험자에 대한 연령 값은 측정 기간의 종료 시의 피험자에 대한 연령 값일 수도 있다.
본 개시의 의미 내에서, 제 2 값 또는 샘플 레벨보다 더 높게 제 1 값 또는 샘플 레벨에 가중치를 부여한다는 것은, 제 1 값 또는 샘플 레벨에서의 상대적인 변화 (예를 들어 제 1 값에서의 10% 의 변화) 가, 제 2 값 또는 샘플 레벨에서의 동일한 상대적인 변화 (상기 예에서, 제 2 값에서의 10% 의 변화) 보다 더 많이 식의 결과 (예를 들어 위험 인자) 에 영향을 미치는 방식으로, 위험 인자를 결정하기 위한 식과 같은 식에서 제 1 값 또는 샘플 레벨 및 제 2 값 또는 샘플 레벨이 사용된다는 것을 의미한다. 예를 들어, 가중치를 부여한다는 것은 제 1 값 또는 샘플 레벨 및 제 2 값 또는 샘플 레벨을 적절한 각각의 상수들로 곱하는 것을 포함할 수도 있다. 예상되는 제 1 값 또는 샘플 레벨 및 제 2 값 또는 샘플 레벨 및 그것들의 각각의 단위들에 의존하여, 제 2 값 또는 샘플 레벨보다 더 높게 제 1 값 또는 샘플 레벨에 가중치를 부여하는 것은, 제 1 값 또는 샘플 레벨을 제 2 값 또는 샘플 레벨보다 더 높거나 더 작은 상수로 곱하는 것을 포함할 수도 있다.
방법은, 피험자에 대해, 크레아티닌의 혈액 샘플 레벨을 나타내는 복수의 마커 파라미터들을 추가로 포함할 수도 있다. 따라서, 소변에서의 농도로서 크레아티닌의 샘플 레벨을 요구하는 것이 회피될 수도 잇다. 복수의 마커 파라미터들은, 피험자에 대해, 복수의 크레아티닌의 혈액 샘플 레벨들로부터 선택된 크레아티닌의 선택된 혈액 샘플 레벨을 나타낼 수도 있다. 예를 들어, 크레아티닌의 선택된 혈액 샘플 레벨은 복수의 크레아티닌의 혈액 샘플 레벨들로부터의 최대 값일 수도 있다. 대안적으로 또는 추가적으로, 복수의 마커 파라미터들은, 피험자에 대해, 복수의 크레아티닌의 혈액 샘플 레벨들로부터 계산된 크레아티닌의 계산된 혈액 샘플 레벨을 나타낼 수도 있다. 예를 들어, 크레아티닌의 계산된 혈액 샘플 레벨은, 평균 값과 같이, 복수의 크레아티닌의 혈액 샘플 레벨들로부터 계산된 통계 값일 수도 있다.
크레아티닌의 샘플 레벨은 (혈액의 데시리터 당 크레아티닌의 밀리그램과 같이) mg/dl 의 단위로 제공될 수도 있다.
방법은, 피험자에 대해, 알부민의 혈액 샘플 레벨을 나타내는 복수의 마커 파라미터들을 추가로 포함할 수도 있다. 따라서, 소변에서의 농도로서 알부민의 샘플 레벨을 요구하는 것이 회피될 수도 잇다. 복수의 마커 파라미터들은, 피험자에 대해, 복수의 알부민의 혈액 샘플 레벨들로부터 선택된 알부민의 선택된 혈액 샘플 레벨을 나타낼 수도 있다. 예를 들어, 알부민의 선택된 혈액 샘플 레벨은 복수의 알부민의 혈액 샘플 레벨들로부터의 최소 값일 수도 있다. 대안적으로 또는 추가적으로, 복수의 마커 파라미터들은, 피험자에 대해, 복수의 알부민의 혈액 샘플 레벨들로부터 계산된 알부민의 계산된 혈액 샘플 레벨을 나타낼 수도 있다. 예를 들어, 알부민의 계산된 혈액 샘플 레벨은, 평균 값과 같이, 복수의 알부민의 혈액 샘플 레벨들로부터 계산된 통계 값일 수도 있다.
알부민의 샘플 레벨은 (혈액의 데시리터 당 알부민의 그램과 같이) g/dl 의 단위로 제공될 수도 있다.
피험자는 당뇨병 환자일 수도 있다. 그에 의해, 당뇨병 환자에서의 만성 신장 질환의 위험이 스크리닝될 수도 있다.
대안적으로, 복수의 마커 파라미터들의 모두는 당뇨병 진단이 이용가능하지 않은 피험자에 대한 것일 수도 있다. 예를 들어, 피험자는 당뇨병 환자가 될 위험에 처해 있을 수도 있다. 그에 의해, 당뇨병으로 진단되지 않은 피험자, 예를 들어, 당뇨병 환자가 될 위험에 처한 피험자에서의 만성 신장 질환의 위험이 스크리닝될 수도 있다. 수신하는 것은, 당뇨병 진단이 이용가능하지 않은 피험자에 대해 복수의 마커 파라미터들을 나타내는 마커 데이터를 수신하는 것을 포함할 수도 있다.
측정 주기는 2년으로 제한될 수도 있다. 그에 의해, 측정 기간의 종료로부터 향후에 피험자에 대한 앓고 있는 CKD 의 위험을 나타내는 위험 인자와 함께 최대 2 년의 기간 내에 수집된 물질들의 값들 및/또는 샘플 레벨들이 제공될 수도 있다.
피험자는 측정 기간의 종료시까지 당뇨병으로 진단되지 않았을 수도 있다. 예를 들어, CKD 의 위험은 최근에 당뇨병으로 진단된 피험자에서 스크리닝될 수도 있고, 마커 데이터는 완전히 피험자에 대한 당뇨병 진단 전에 놓이는 측정 기간 동안 피험자에 대한 복수의 마커 파라미터들을 나타낼 수도 있다. 대안적으로, CKD 의 위험은 전혀 당뇨병으로 진단되지 않은 피험자에 대해 스크리닝될 수도 있고, 마커 데이터는 따라서, 피험자가 당뇨병으로 진단되지 않은 측정 기간 동안 피험자에 대한 복수의 마커 파라미터들을 나타낼 수도 있다.
측정 기간은, 적어도 부분적으로, 피험자에 대한 당뇨병 진단 후에 놓일 수도 있다. 예를 들어, 측정 기간의 최대 20%, 바람직하게는 측정 기간의 최대 10% 는 피험자가 당뇨병으로 진단되었던 시간 후에 놓일 수도 있다. 예를 들어, 피험자는 2년 미만 동안 당뇨병으로 진단된 당뇨병 환자일 수도 있고, 마커 데이터는, 복수의 마커 파라미터들의 일부가 환자에 대한 당뇨병 진단 전의 기간에 대한 것이고 복수의 마커 파라미터들의 일부가 환자에 대한 당뇨병 진단 후의 기간에 대한 것이도록, 위험 인자를 결정하기 바로 전에 또는 짧은 기간 전에 종료하는, 2년의 측정 기간과 같은, 측정 기간 동안 환자에 대한 복수의 마커 파라미터들을 나타낼 수도 있다.
측정 기간은 당뇨병 환자에 대한 당뇨병 진단 후에 완전히 놓일 수도 있다. 예를 들어, 피험자는 2년보다 많은 기간 동안 당뇨병으로 진단된 당뇨병 환자일 수도 있고, 마커 데이터는, 위험 인자를 결정하기 바로 전에 또는 짧은 기간 전에 종료하는, 2년의 측정 기간과 같은, 측정 기간 동안 환자에 대한 복수의 마커 파라미터들을 나타낼 수도 있다.
위험 인자는 측정 기간의 종료로부터 3년의 예측 기간 내에서 피험자에 대한 앓고 있는 CKD 의 위험을 나타낼 수도 있다. 위험 인자는 마지막 값 및/또는 샘플 레벨이 결정된 시간으로부터 3년 내에 CKD 가 발병할 피험자에 대한 확률일 수도 있다. 대안적으로, 위험 인자는 측정 기간의 종료로부터 3년 미만의 기간, 예를 들어 2 년의 기간 내에 피험자에 대한 앓고 있는 CKD 의 위험을 나타낼 수도 있다. 추가적인 대안으로서, 위험 인자는 측정 기간의 종료로부터 3년보다 많은 기간 내에 피험자에 대한 앓고 있는 CKD 의 위험을 나타낼 수도 있다.
결정하는 것은, 크레아티닌의 샘플 레벨 보다 더 높게 연령에 가중치를 부여하는 것을 더 포함할 수도 있다.
전술한 바에 따르면, 마커 파라미터들은 연령 값, 크레아티닌의 샘플 레벨 및 알부민의 샘플 레벨을 포함하고, 그에 의해, 앓고 있는 CKD 의 위험을 나타내는 위험 인자를 계산하기 위한 간단한 방법을 제공한다. 추가적인 실시형태들에서, 이하에서 보다 자세히 전개되는 바와 같이, 추정된 사구체 여과율 (glomerular filtration rate) 의 샘플 레벨, 체질량 지수, 글루코오스 (glucose) 의 샘플 레벨 및 HbA1c의 샘플 레벨 중 적어도 하나를 포함하는 추가적인 마커 파라미터들이 위험 계산에 선택적으로 포함될 수도 있다.
수신하는 것은, 6.5% 미만의 HbA1c 의 샘플 레벨을 갖는 피험자에 대한 복수의 마커 파라미터들을 나타내는 마커 데이터를 수신하는 것을 포함할 수도 있다. HbA1C 는 당화된 헤모글로빈 A1의 C-프랙션이다. HbA1c 의 샘플 레벨은 (혈액에서의 퍼센티지와 같이) % 의 단위로 제공될 수도 있다. 대안적으로, HbA1c 의 샘플 레벨은 (혈액에서의 mol 당 HbA1c 의 mmol 과 같이) mmol/mol 의 단위로 제공될 수도 있다.
방법은 추가로, 피험자에 대해, 사구체 여과율의 샘플 레벨을 나타내는 복수의 마커 파라미터들, 및 결정함에 있어서, 사구체 여과율의 샘플 레벨보다 더 높게 연령 값, 알부민의 샘플 레벨, 및 크레아티닌의 샘플 레벨의 각각에 가중치를 부여하는 것을 포함할 수도 있다.
복수의 마커 파라미터들은, 피험자에 대해, 복수의 사구체 여과율들로부터 선택된, 선택된 사구체 여과율을 나타낼 수도 있다. 예를 들어, 선택된 사구체 여과율은 복수의 사구체 여과율 중 최소 값일 수도 있다. 대안적으로 또는 추가적으로, 복수의 마커 파라미터들은, 피험자에 대해, 복수의 사구체 여과율들로부터 계산된, 계산된 사구체 여과율을 나타낼 수도 있다. 예를 들어, 계산된 사구체 여과율은, 평균 값과 같이, 복수의 사구체 여과율들로부터 계산된 통계 값일 수도 있다.
사구체 여과율은, 신장을 통한 여과된 유체의 유량 (flow rate) 을 나타내는 것으로 당해 기술분야에서 알려져 있고, 신장 기능을 추정하기 위한 중요한 지표이다. 사구체 여과율은 신장 질환으로 인해 감소할 수도 있다. 실시형태들에서, 사구체 여과율은 당해 기술분야에서 알려진 바와 같이, MDRD (Modification of Diet in Renal Disease) 공식을 이용하여 추정될 수도 있다. 예를 들어, 4 가지 변수들을 사용하는 MDRD 공식은 사구체 여과율을 추정하기 위해 피험자의 연령, 성별, 민족성 및 혈청 크레아티닌에 의존한다. 대안적인 실시형태들에서, 사구체 여과율은 당해 기술분야에서 알려진 바와 같이 CKD-EPI (Chronic Kidney Disease Epidemiology Collaboration) 공식을 이용하여 추정될 수도 있다. CKD-EPI 공식은 사구체 여과율을 추정하기 위해 피험자의 연령, 성별, 민족성 및 혈청 크레아티닌에 의존한다. 추가적인 실시형태들에서, 사구체 여과율은 다른 방법들을 이용하여 추정될 수도 있거나 직접적으로 결정될 수도 있다. 샘플 사구체 여과율은 ml/min/1.73m² (1.73 제곱미터의 체표면적 당 분 당 밀리리터) 의 단위로 제공될 수도 있다.
위험 인자 (P’CKD) 는 다음 식에 따라 결정될 수도 있다:
Figure pct00001
여기서, P`CKD _ Pred
P`CKD _ Pred = c`CKD1 · age + c`CKD2 · creatinine + c`CKD3 · albumin + c`CKD4 ,
으로서 계산될 수도 있고, 여기서, age 는 피험자의 연령이고, creatinine 은 피험자에 대한 크레아티닌의 샘플 레벨이며, albumin 은 피험자에 대한 알부민의 샘플 레벨이고, 그리고, c`CKD1, c`CKD2, c`CKD3, 및 c`CKD4 는 상수들이다.
대안에서, 위험 인자 (PCKD) 는 다음 식에 따라 결정될 수도 있다:
Figure pct00002
여기서, PCKD _ Pred
PCKD _ Pred = cCKD1 · age + cCKD2 · creatinine + cCKD3 · albumin + cCKD4
으로서 계산될 수도 있고,
PDeath _ Pred
PDeath _ Pred = cDeath1 · age + cDeath2 · creatinine + cDeath3 · albumin + cDeath4,
으로서 계산될 수도 있으며, 여기서, age 는 피험자의 연령이고, creatinine 은 피험자에 대한 크레아티닌의 샘플 레벨이며, albumin 은 피험자에 대한 알부민의 샘플 레벨이고, 그리고, cCKD1, cCKD2, cCKD3, cCKD4, cDeath1, cDeath2, cDeath3 및 cDeath4 는 상수들이다. 이러한 공식은 RWD 분석으로부터 밝혀진 사망 예측이 존재하는 경우에 적용될 수도 있다. 그렇지 않은 경우에, 사망 예측과 관련된 상수들은 위에서 설명된 바와 같이 생략될 수도 있다.
크레아티닌의 샘플 레벨은 크레아티닌의 복수의 샘플 레벨들 중에서의 크레아티닌의 샘플 레벨일 수도 있다. 알부민의 샘플 레벨은 알부민의 복수의 샘플 레벨들 중에서의 알부민의 샘플 레벨일 수도 있다. 크레아티닌의 샘플 레벨 및/또는 알부민의 샘플 레벨은, 최대 샘플 레벨, 최소 샘플 레벨, 평균 샘플 레벨 및/또는 샘플 레벨들의 중간치와 같이, 크레아티닌 및/또는 알부민의 각기의 복수의 샘플 레벨들로부터의 대표적인 샘플 레벨일 수도 있다. 예시적인 실시형태에서, 크레아티닌은 피험자에 대한 크레아티닌의 복수의 샘플 레벨들로부터의 크레아티닌의 최대 샘플 레벨이고, 알부민은 피험자에 대한 알부민의 복수의 샘플 레벨들로부터의 알부민의 최소 샘플 레벨이다.
상수들 c`CKD1, c`CKD2, c`CKD3, 및 c`CKD4 은 모델 특정적 상수들일 수도 있다. 실시형태들에서, 상수들 c`CKD1, c`CKD2, 및 c`CKD3 은 각각의 마커 파라미터와 연관된 인자들을 가중하는 (weighting) 상수일 수도 있다.
상수들 cCKD1, cCKD2, cCKD3, 및 cCKD4, 및 cDeath1, cDeath2, cDeath3, 및 cDeath4 은 모델 특정적 상수들일 수도 있다. 실시형태들에서, 상수들 cCKD1, cCKD2, 및 cCKD3, 및 cDeath1, cDeath2 및 cDeath3 은 각각의 마커 파라미터와 연관된 인자들을 가중하는 상수일 수도 있다.
예를 들어, 상수들은 다음과 같을 수도 있다.
cCKD1: 0.02739 /year;
cCKD2: 1.387 dl/mg;
cCKD3: - 0.3356 dl/g; 및
cCKD4: - 3.1925.
cDeath1: 0.06103 /year;
cDeath2: 0.8194 dl/mg;
cDeath3: - 0.9336 dl/g; 및
cDeath4: - 3.3325.
실시형태들에서, 상수들의 각각 또는 임의의 것은 이러한 각각의 값 주위로 +/- 30% 의 범위로부터, 바람직하게는 +/- 20% 의 범위로부터, 그리고 보다 바람직하게는 +/- 10% 의 범위로부터 선택될 수도 있다.
위험 인자 (P`’CKD) 는 다음 식에 따라 결정될 수도 있다:
Figure pct00003
여기서, P`’CKD_ Pred
P`’CKD_ Pred = c`’CKD1 · age + c`’CKD2 · creatinine + c`’CKD3 · albumin + c`’CKD4 + c`’CKD5 · eGFR.
으로서 계산될 수도 있고, 여기서, age 는 피험자의 연령이고, creatinine 은 피험자에 대한 크레아티닌의 샘플 레벨이며, albumin 은 피험자에 대한 알부민의 샘플 레벨이고, eGFR 은 피험자에 대한 추정된 사구체 여과율의 샘플 레벨이며, 그리고, c`’CKD1, c`’CKD2, c`’CKD3, c`’CKD4, 및 c`’CKD5 는 상수들이다.
다른 예에서, 위험 인자 (P’CKD) 는 다음 식에 따라 결정될 수도 있다:
Figure pct00004
여기서, P’CKD_ Pred
P’CKD_ Pred = c’CKD1 · age + c’CKD2 · creatinine + c’CKD3 · albumin + c’CKD4
+ c’CKD5 · eGFR,
으로서 계산될 수도 있고,
P’Death_ Pred
P’Death_ Pred = c’Death1 · age + c’Death2 · creatinine + c’Death3 · albumin + c’Death4 + c’Death5 · eGFR ,
으로서 계산될 수도 있으며, 여기서, age 는 피험자의 연령이고, creatinine 은 피험자에 대한 크레아티닌의 샘플 레벨이며, albumin 은 피험자에 대한 알부민의 샘플 레벨이고, eGFR 은 피험자에 대한 추정된 사구체 여과율의 샘플 레벨이며, 그리고, c’CKD1, c’CKD2, c’CKD3, c’CKD4, c’CKD5, c’Death1, c’Death2, c’Death3, c’Death4 및 c’Death5 는 상수들이다. 이러한 공식은 RWD 분석으로부터 밝혀진 사망 예측이 존재하는 경우에 적용될 수도 있다. 그렇지 않은 경우에, 사망 예측과 관련된 상수들은 위에서 설명된 바와 같이 생략될 수도 있다.
크레아티닌의 샘플 레벨은 크레아티닌의 복수의 샘플 레벨들 중에서의 크레아티닌의 샘플 레벨일 수도 있다. 알부민의 샘플 레벨은 알부민의 복수의 샘플 레벨들 중에서의 알부민의 샘플 레벨일 수도 있다.
추정된 사구체 여과율과 관련하여, 그것은 피험자에 대해 이용가능한 복수의 레벨들로부터의 추정된 사구체 여과율일 수도 있다.
크레아티닌의 샘플 레벨, 알부민의 샘플 레벨 및/또는 추정된 사구체 여과율의 샘플 레벨은, 최대 샘플 레벨, 최소 샘플 레벨, 평균 샘플 레벨 및/또는 샘플 레벨들의 중간치와 같이, 크레아티닌, 알부민 및/또는 추정된 사구체 여과율의 각기의 복수의 샘플 레벨들로부터의 대표적인 샘플 레벨일 수도 있다. 예시적인 실시형태에서, creatinine 은 피험자에 대한 크레아티닌의 복수의 샘플 레벨들로부터의 크레아티닌의 최대 샘플 레벨이고, albumin 은 피험자에 대한 알부민의 복수의 샘플 레벨들로부터의 알부민의 최소 샘플 레벨이며, eGFR 은 피험자에 대한 추정된 사구체 여과율의 복수의 샘플 레벨들로부터의 추정된 사구체 여과율의 최소 샘플 레벨이다.
상수들 c`’CKD1, c`’CKD2, c`’CKD3, c`’CKD4 및 c`’CKD5 은 모델 특정적 상수들일 수도 있다. 실시형태들에서, 상수들 c`’CKD1, c`’CKD2, 및 c`’CKD3 및 c`’CKD5 은 각각의 마커 파라미터와 연관된 인자들을 가중하는 상수일 수도 있다.
상수들 c’CKD1, c’CKD2, c’CKD3, c’CKD4, 및 c’CKD5 , 및 c’Death1, c’Death2, c’Death3, c’Death4 및 c’Death5 은 모델 특정적 상수들일 수도 있다. 실시형태들에서, 상수들 c’CKD1, c’CKD2, c’CKD3, 및 c’CKD5, 및 c’Death1, c’Death2, c’Death3, 및 c’Death5 은 각각의 마커 파라미터와 연관된 인자들을 가중하는 상수일 수도 있다.
이러한 실시형태에서, 예를 들어, 상수들은 다음과 같을 수도 있다.
c'CKD1: 0.02739 /year;
c’CKD2: 1.387 dl/mg;
c’CKD3: - 0.3356 dl/g;
c’CKD4: - 1.3013; 및
c’CKD5: - 0.02843 min·1.73m²/ml.
c’Death1: 0.06103 /year;
c’Death2: 0.8194 dl/mg;
c’Death3: - 0.9336 dl/g;
c’Death4: - 4.4328; 및
c’Death5: 0.01654 min·1.73m²/ml.
실시형태들에서, 상수들의 각각 또는 임의의 것은 이러한 각각의 값 주위로 +/- 30% 의 범위로부터, 바람직하게는 +/- 20% 의 범위로부터, 그리고 보다 바람직하게는 +/- 10% 의 범위로부터 선택될 수도 있다.
추가적인 실시형태들에서, 위험 인자 (P`’’CKD) 는 다음 식에 따라 결정될 수도 있다:
Figure pct00005
여기서, P`’’CKD_ Pred
P’’CKD_ Pred = c`’’CKD1 · age + c`’’CKD2 · creatinine + c`’’CKD3 · albumin + c`’’CKD4 + c`’’CKD5 · eGFR + c`’’CKD6 · BMI + c`’’CKD7 · Glucose + c`’’CKD8 · HbA1c.
으로서 계산될 수도 있고, 여기서, age 는 피험자의 연령이고, creatinine 은 피험자에 대한 크레아티닌의 샘플 레벨이고, albumin 은 피험자에 대한 알부민의 샘플 레벨이며, eGFR 은 피험자에 대한 추정된 사구체 여과율의 샘플 레벨이고, BMI 는 피험자에 대한 체질량 지수 (Body Mass Index; BMI) 의 값이고, Glucose 는 피험자에 대한 글루코오스의 샘플 레벨이며, HbA1c 는 피험자에 대한 당화된 헤모글로빈 A1 의 C-프랙션의 샘플 레벨이고, 그리고, c`’’CKD1, c`’’CKD2, c`’’CKD3, c`’’CKD4, c`’’CKD5, c`’’CKD6, c`’’CKD7, 및 c`’’CKD8 은 상수들이다. BMI 는 kg/m² (제곱미터 당 킬로그램) 의 단위로 제공될 수도 있고, 당해 기술분야에서 알려진 바와 같이 결정된다. 글루코오스의 최소 샘플 레벨은 (혈액의 데시리터 당 글루코오스의 밀리그램과 같이) mg/dl 의 단위로 제공될 수도 있다.
다른 예에서, 위험 인자 (P''CKD) 는 다음 식에 따라 결정될 수도 있다:
Figure pct00006
여기서, P’’CKD_ Pred
P’’CKD_ Pred = c’’CKD1 · age + c’’CKD2 · creatinine + c’’CKD3 · albumin + c’’CKD4 + c’’CKD5 · eGFR + c’’CKD6 · BMI + c’’CKD7 · Glucose + c’’CKD8 · HbA1c,
으로서 계산될 수도 있고,
P’’Death_ Pred
P’’Death_ Pred = c’’Death1 · age + c’’Death2 · creatinine + c’’Death3 · albumin + c’’Death4 + c’’Death5 · eGFR+ c’’Death6 · BMI+ c’’Death7 · Glucose+ c’’Death8 · HbA1c,
으로서 계산될 수도 있고, 여기서, age 는 피험자의 연령이고, creatinine 은 피험자에 대한 크레아티닌의 샘플 레벨이고, albumin 은 피험자에 대한 알부민의 샘플 레벨이며, eGFR 은 피험자에 대한 추정된 사구체 여과율의 샘플 레벨이고, BMI 는 피험자에 대한 체질량 지수 (BMI) 의 값이고, Glucose 는 피험자에 대한 글루코오스의 샘플 레벨이며, HbA1c 는 피험자에 대한 당화된 헤모글로빈 A1 의 C-프랙션의 샘플 레벨이고, 그리고, c’’CKD1, c’’CKD2, c’’CKD3, c’’CKD4, c’’CKD5, c’’CKD6, c’’CKD7, c’’CKD8, c’’Death1, c’’Death2, c’’Death3, c’’Death4, c’’Death5, c’’Death6, c’’Death7 및 c’’Death8 은 상수들이다. BMI 는 kg/m² (제곱미터 당 킬로그램) 의 단위로 제공될 수도 있고, 당해 기술분야에서 알려진 바와 같이 결정된다. 글루코오스의 최소 샘플 레벨은 (혈액의 데시리터 당 글루코오스의 밀리그램과 같이) mg/dl 의 단위로 제공될 수도 있다. 이러한 공식은 RWD 분석으로부터 밝혀진 사망 예측이 존재하는 경우에 적용될 수도 있다. 그렇지 않은 경우에, 사망 예측과 관련된 상수들은 위에서 설명된 바와 같이 생략될 수도 있다.
실시형태들에서, 상수들의 각각 또는 임의의 것은 이러한 각각의 값 주위로 +/- 30% 의 범위로부터, 바람직하게는 +/- 20% 의 범위로부터, 그리고 보다 바람직하게는 +/- 10% 의 범위로부터 선택될 수도 있다.
크레아티닌의 샘플 레벨은 피험자에 대한 크레아티닌의 복수의 샘플 레벨들로부터의 크레아티닌의 샘플 레벨일 수도 있고, 알부민의 샘플 레벨은 피험자에 대한 알부민의 복수의 샘플 레벨들로부터의 알부민의 샘플 레벨일 수도 있으며, 추정된 사구체 여과율의 샘플 레벨은 피험자에 대한 추정된 사구체 여과율의 복수의 샘플 레벨들로부터의 추정된 사구체 여과율의 샘플 레벨일 수도 있고, 체질량 지수 (BMI) 의 값은 피험자에 대한 BMI 의 복수의 값들로부터의 BMI 의 값일 수도 있고, 글루코오스의 샘플 레벨은 피험자에 대한 글루코오스의 복수의 샘플 레벨들로부터의 글루코오스의 샘플 레벨일 수도 있으며, 및/또는, 당화된 헤모글로빈 A1 의 C-프랙션의 샘플 레벨은 피험자에 대한 당화된 헤모글로빈 A1 의 C-프랙션의 복수의 샘플 레벨들로부터의 당화된 헤모글로빈 A1 의 C-프랙션의 샘플 레벨일 수도 있다.
크레아티닌의 샘플 레벨, 알부민의 샘플 레벨, 추정된 사구체 여과율의 샘플 레벨, 체질량 지수의 값, 글루코오스의 샘플 레벨, 및/또는 당화된 헤모글로빈 A1 의 C-프랙션의 샘플 레벨은, 크레아티닌, 알부민, 추정된 사구체 여과율, 체질량 지수, 글루코오스, 및/또는 당화된 헤모글로빈 A1 의 C-프랙션의 각기의 복수의 샘플 레벨들로부터의 대표적인 샘플 레벨, 예컨대, 최대 샘플 레벨, 최소 샘플 레벨, 평균 샘플 레벨 및/또는 샘플 레벨들의 중간값일 수도 있다. 예시적인 실시형태에서, creatinine 은 피험자에 대한 크레아티닌의 복수의 샘플 레벨들로부터의 크레아티닌의 최대 샘플 레벨이고, albumin 은 피험자에 대한 알부민의 복수의 샘플 레벨들로부터의 알부민의 최소 샘플 레벨이며, eGFR 은 피험자에 대한 추정된 사구체 여과율의 복수의 샘플 레벨들로부터의 추정된 사구체 여과율의 최소 샘플 레벨이다. BMI 는 피험자에 대한 BMI 의 복수의 값들로부터의 체질량 지수 (BMI) 의 최소 값이고, Glucose 는 피험자에 대한 글루코오스의 복수의 샘플 레벨들로부터의 글루코오스의 최소 샘플 레벨이며, HbA 는 피험자에 대한 당화된 헤모글로빈 A1 의 C-프랙션의 복수의 샘플 레벨들로부터의 당화된 헤모글로빈 A1 의 C-프랙션의 평균 샘플 레벨이다.
상수들 c`’’CKD1, c`’’CKD2, c`’’CKD3, c`’’CKD4, c`’’CKD5, c`’’CKD6, c`’’CKD7, 및 c`’’CKD8 은 모델 특정적 상수들일 수도 있다. 실시형태들에서, 상수들 c`’’CKD1, c`’’CKD2, c`’’CKD3, c`’’CKD5, c`’’CKD6, c`’’CKD7, 및 c`’’CKD8 은 각각의 마커 파라미터와 연관된 인자들을 가중하는 상수일 수도 있다.
상수들 c’’CKD1, c’’CKD2, c’’CKD3, c’’CKD4, c’’CKD5, c’’CKD6, c’’CKD7, 및 c’’CKD8, 및 c’’Death1, c’’Death2, c’’Death3, c’’Death4, c’’Death5, c’’Death6, c’’Death7 및 c’’Death8 은 모델 특정적 상수들일 수도 있다. 실시형태들에서, 상수들 c’’CKD1, c’’CKD2, c’’CKD3, c’’CKD5, c’’CKD6, c’’CKD7, 및 c’’CKD8, 및 c’’Death1, c’’Death2, c’’Death3, c’’Death4, c’’Death5, c’’Death6, c’’Death7 및 c’’Death8 은 각각의 마커 파라미터와 연관된 인자들을 가중하는 상수일 수도 있다.
이러한 실시형태에서, 예를 들어, 상수들은 다음과 같을 수도 있다.
c'’CKD1: 0.02739 /year;
c’’CKD2: 1.387 dl/mg;
c’’CKD3: - 0.3356 dl/g;
c’’CKD4: - 2.409;
c’’CKD5: - 0.02843 min·1.73m²/ml;
c’’CKD6: 0.01128 m²/kg;
c’’CKD7: 0.0004946 dl/mg; 및
c’’CKD8: 0.0893 /%.
c’’Death1: 0.06103 /year;
c’’Death2: 0.8194 dl/mg;
c’’Death3: - 0.9336 dl/g;
c’’Death4: - 4.557;
c’’Death5: 0.01654 min·1.73m²/ml;
c’’Death6: - 0.0101 m²/kg;
c’’Death7: 0.0009107 dl/mg; 및
c’’Death8: 0.04368 /%.
실시형태들에서, 상수들의 각각 또는 임의의 것은 이러한 각각의 값 주위로 +/- 30% 의 범위로부터, 바람직하게는 +/- 20% 의 범위로부터, 그리고 보다 바람직하게는 +/- 10% 의 범위로부터 선택될 수도 있다.
실시형태들에서, creatinine, albumin, eGFR, BMI, Glucose 및 HbA 의 모두 또는 임의의 것에 대해, 일반화된 값들 (creatininegen, albumingen, eGFRgen, BMIgen, Glucosegen, HbAgen) 은 피험자에 대한 값들 대신에 사용될 수도 있다. 예를 들어, 일반 모집단 (general population) 에 대한 평균 값들 또는 관련 하위-모집단 (sub-population) 에 대한 평균 값들이 사용될 수도 있다. 일반화된 값들로서, 각각의 모집단 멤버들에 대한 각기의 복수의 값들로부터의 대표적인 값들의 평균 값, 예를 들어, 각기의 최대 값, 각기의 최소 값, 각기의 평균 값 및/또는 각기의 값들의 중간치가 사용될 수도 있다.
이러한 실시형태들에서, 예를 들어, 일반화된 값들은 다음과 같을 수도 있다.
creatininegen: 1.055 mg/dl;
albumingen: 3.835 g/dl;
eGFRgen: 66.523 ml/min/1.73m²;
BMIgen: 32.295 kg/m²;
Glucosegen: 129.691 mg/dl; 및
HbAgen: 7.607%.
실시형태들에서, 일반화된 값들의 각각 또는 임의의 것은 이러한 각각의 값 주위로 +/- 30% 의 범위로부터, 바람직하게는 +/- 20% 의 범위로부터, 그리고 보다 바람직하게는 +/- 10% 의 범위로부터 선택될 수도 있다.
방법은 추가로, 피험자 값 추천 (subject value recommendation) 을 결정하는 것 및 그 피험자 값 추천을 나타내는 추천 출력을 제공하는 것을 포함할 수도 있다. 피험자 값 추천을 결정하는 것은, 마커 파라미터들의 가중치에 기초하여, 제 1 마커 파라미터에 대해 일반화된 값이 수신되었었고 일반화된 값이 수신되었었던 제 2 마커 파라미터보다 더 높게 가중되는 그 제 1 마커 파라미터를 결정하는 것, 및, 피험자에 대해 그 제 1 마커 파라미터에 대한 값을 획득하기 위한 추천이 될 피험자 값 추천을 결정하는 것을 포함할 수도 있다. 추천 출력은, 피험자에 대해 제 1 마커 파라미터에 대한 값을 획득하고 CKD 의 위험에 대해 피험자를 스크리닝하기 위한 방법을 재수행하기 이한 지시를 나타낼 수도 있고, 피험자에 대해 제 1 마커 파라미터에 대한 값을 포함하는 마커 데이터를 제공한다.
방법은, 피험자 값 추천을 결정하는 것, 및, 위험 인자의 정확도의 값이 정확도 임계치 미만이라고 결정되는 경우에 피험자 값 추천을 나타내는 추천 출력을 제공하는 것만을 포함할 수도 있다. 위험 인자의 정확도의 값은 어느 마커 파라미터들에 대해 일반화된 값들이 사용되는지에 기초하여 결정될 수도 있다. 실시형태들에서, 위험 인자의 정확도의 값은, 위험 인자를 결정할 때 일반화된 값들이 사용되는 마커 파라미터들의 전부 또는 임의의 것에 대해 피험자에 대한 값들을 사용하여 결정되는 참조 위험 인자에 대해 비교하여 결정될 수도 있다.
본 개시의 의미 내에서, CKD 의 위험에 대해 피험자를 스크리닝하는 것은, CKD 가 발병할 또는 CKD 를 가질 위험이 있는 피험자를 식별하는 것을 의미한다.
본 개시의 의미 에서의 샘플 레벨은, 피험자의 체액의 샘플에서의, 크레아티닌 또는 알부민과 같은 물질의 레벨이다. 샘플 레벨들은 동일하거나 상이한 샘플들에서 결정될 수도 있다. 대안적으로 또는 추가적으로, 샘플 레벨들을 결정하기 위해, 동일하거나 상이한 샘플들에서 측정들이 수행될 수도 있다. 예를 들어, 물질의 샘플 레벨은, 예를 들어 평균 값을 결정함으로써, 동일 샘플에서의 동일 물질의 복수의 측정치들로부터 결정될 수도 있다. 다른 예에서, 동일 물질의 복수의 샘플 레벨들 중 적어도 하나는 제 1 샘플에서 결정될 수도 있고, 동일 물질의 복수의 샘플 레벨들 중 적어도 다른 하나는 제 2 샘플에서 결정될 수도 있다. 제 1 물질의 샘플 레벨 및 제 2 물질의 샘플 레벨은 동일 샘플에서 결정될 수도 있다. 대안적으로, 제 1 물질의 샘플 레벨은 제 1 샘플에서 결정될 수도 있고, 제 2 물질의 샘플 레벨은 제 2 샘플에서 결정될 수도 있다.
컴퓨팅 디바이스 또는 시스템의 프로세스에 의해 실행가능한 프로그램 코드를 포함하는 컴퓨터 판독가능 매체를 포함하는 컴퓨터 프로그램 제품이 제공될 수도 있고, 그 프로그램 코드는, 실행될 때, 그 컴퓨팅 디바이스 또는 시스템으로 하여금, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 컴퓨터-구현 방법을 수행하게 한다.
만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 추가적인 방법, 컴퓨터 프로그램 제품, 및 컴퓨터-구현 방법과 관련하여, 상술된 대안적인 실시형태들이 준용해서 적용될 수도 있다.
컴퓨터-구현 방법에서, 알부민의 샘플 레벨은 체액 샘플에서의 알부민의 샘플 레벨일 수도 있고, 크레아티닌의 샘플 레벨은 다른 체액에서의 크레아티닌의 샘플 레벨일 수도 있다.
컴퓨터-구현 방법에서, 프로그램은 추가로, 프로세서로 하여금, 위험 인자를 나타내는 출력 데이터를 생성하는 것 및 그 출력 데이터를 데이터 프로세싱 시스템의 출력 디바이스에 출력하는 것을 실행하게 할 수도 있다. 출력 디바이스는, 출력 데이터를 출력하기에 적합한 임의의 디바이스, 예를 들어, 모니터와 같이 데이터 프로세싱 시스템의 디스플레이 디바이스, 및/또는, 유선 및/또는 무선 데이터 송신을 위해 송신하기 위한 송신기 디바이스일 수도 있다. 출력 데이터는 사용자, 예를 들어, 의사에게 출력될 수도 있다. 출력 데이터는 데이터 프로세싱 시스템의 디스플레이를 통해 출력될 수도 있다.
데이터 프로세싱 시스템은 복수의 데이터 프로세싱 디바이스들을 포함할 수도 있고, 각각의 데이터 프로세싱 디바이스는 프로세서 및 메모리를 갖는다. 마커 데이터는 제 1 데이터 프로세싱 디바이스에서 제공될 수도 있다. 예를 들어, 마커 데이터는 입력 디바이스를 통한 사용자 입력에 의해서 및/또는 데이터 전송에 의해서 제 1 데이터 프로세싱 디바이스에서 수신될 수도 있다. 마커 데이터는 제 1 데이터 프로세싱 디바이스로부터, 그 제 1 데이터 프로세싱 디바이스에 대해 원격으로 위치될 수도 있는 제 2 데이터 프로세싱 디바이스로 전송될 수도 있다. 마커 데이터는 제 2 데이터 프로세싱 디바이스에서 수신될 수도 있고, 위험 인자가 그 다음에 그 제 2 데이터 프로세싱 디바이스에서 결정될 수도 있다. 위험 인자를 나타내는 결과 데이터는 그 제 2 데이터 프로세싱 디바이스로부터 제 1 데이터 프로세싱 디바이스로 또는, 대안적으로 또는 추가적으로, 제 3 데이터 프로세싱 디바이스로 전송될 수도 있다. 결과 데이터는 그 다음에 그 제 1 및/또는 제 3 데이터 프로세싱 디바이스에서 저장될 수도 있고, 및/또는, 그 제 1 및/또는 제 3 데이터 프로세싱 디바이스의 출력 디바이스를 통해 출력될 수도 있다.
제 1 데이터 프로세싱 디바이스 및/또는 제 3 데이터 프로세싱 디바이스는 클라이언트 컴퓨터와 같은 로컬 디바이스일 수도 있고, 제 2 데이터 프로세싱 디바이스는 원격 서버와 같은 원격 디바이스일 수도 있다.
대안적으로, 적어도 제 1 데이터 프로세싱 디바이스 및 제 2 데이터 프로세싱 디바이스의 기능성은 동일한 데이터 프로세싱 디바이스, 예를 들어, 의사의 사무실에서의 컴퓨터와 같은 컴퓨터에서 제공될 수도 있다. 컴퓨터-구현 방법의 모든 단계들은 동일한 데이터-프로세싱 디바이스에서 실행될 수도 있다.
추가적인 실시형태들의 설명
이어서, 추가적인 실시형태들이 예시적인 방식으로 설명된다. 도면들에서:
도 1 은 예시적인 교육 트레이닝 세트, 검증 세트 및 추가적인 검증 세트에서의 연령의 분포를 나타낸다.
도 2 는 예시적인 교육 트레이닝 세트, 검증 세트 및 추가적인 검증 세트에서의 HbA1C 의 분포를 나타낸다.
도 3 은 CKD 를 예측하기 위한 알고리즘들의 비교를 나타낸다.
도 4 는 서브코호트들을 이용하여 CKD 를 예측하기 위한 알고리즘들의 비교를 나타낸다.
도 5 는 CKD 를 예측하기 위한 알고리즘들의 다른 비교를 나타낸다.
도 6 은 CKD 를 예측하기 위한 알고리즘들의 추가적인 비교를 나타낸다.
일반적으로, CKD 의 위험에 대해 피험자를 스크리닝하기 위한 방법의 실시형태들의 임의의 것에서, creatininemax 는 피험자에 대한 크레아티닌의 복수의 샘플 레벨들로부터의 크레아티닌의 최대 샘플 레벨일 수도 있고, albuminmin 은 피험자에 대한 알부민의 복수의 샘플 레벨들로부터의 알부민의 최소 샘플 레벨일 수도 있으며, eGFRmin 은 피험자에 대한 추정된 사구체 여과율의 복수의 샘플 레벨들로부터의 추정된 사구체 여과율의 최소 샘플 레벨일 수도 있고, BMImin 은 피험자에 대한 BMI 의 복수의 값들로부터의 체질량 지수 (BMI) 의 최소 값일 수도 있고, Glucosemin 은 피험자에 대한 글루코오스의 복수의 샘플 레벨들로부터의 글루코오스의 최소 샘플 레벨일 수도 있으며, HbAmean 는 피험자에 대한 당화된 헤모글로빈 A1 의 C-프랙션의 복수의 샘플 레벨들로부터의 당화된 헤모글로빈 A1 의 C-프랙션의 평균 샘플 레벨일 수도 있다. 이러한 값들 및/또는 샘플 레벨들은 피험자에 대한 파일 상에 이미 있는 값들 및/또는 샘플 레벨들로부터 결정될 수도 있다. 대안적으로 또는 추가로, 값들 및/또는 샘플 레벨들은 CKD 의 위험에 대해 피험자를 스크리닝하기 위한 방법에 있어서의 사용을 위해 구체적으로 피험자에 대해 결정될 수도 있다. 값들 및/또는 샘플 레벨들은 실제 데이터일 수도 있다, 즉, 임상 데이터와는 달리, 그것들은 예를 들어 데이터의 완전성 또는 정확도에 관해 제한되지 않을 수도 있다.
CKD 의 위험에 대해 피험자를 스크리닝하기 위한 방법에서, creatininemax 는 mg/dl 의 단위로 표현될 수도 있고, albuminmin 은 g/dl 의 단위로 표현될 수도 있으며, eGFRmin 은 ml/min/1.73m² 의 단위로 표현될 수도 있고, BMImin 은 kg/m² 의 단위로 표현될 수도 있으며, Glucosemin 은 mg/dl 의 단위로 표현될 수도 있고, 그리고, HbAmean 은 % 의 단위로 표현될 수도 있다. 사구체 여과율은 당해 기술분야에서 알려진 바와 같이, MDRD 공식을 이용하여 추정될 수도 있다. 대안적으로, 사구체 여과율은 당해 기술분야에서 알려진 바와 같이 CKD-EPI 공식을 이용하여 추정될 수도 있다.
마커 데이터는 당뇨병을 앓고 있는 피험자에 대해 수신될 수도 있다. 대안에서, 피험자는 당뇨병을 앓고 있지 않지만, 미래에 당뇨병을 앓을 위험에 처했을 수도 있다. 마커 데이터는 피험자에 대한 마커 파라미터들 age, creatininemax 및 albuminmin 을 나타낸다. 파라미터 "age" 는 피험자의 연령을 나타낸다. 파라미터 “creatininemax” 는 피험자에 대한 파일 상의 그리고 혈액 샘플들로부터 이전 2년에 걸쳐 수집된 크레아티닌의 복수의 샘플 레벨들로부터의 크레아티닌의 최대 샘플 레벨을 나타낸다. 파라미터 “albuminmin” 는 피험자에 대한 파일 상의 그리고 혈액 샘플들로부터 이전 2년에 걸쳐 수집된 알부민의 복수의 샘플 레벨들로부터의 알부민의 최소 샘플 레벨을 나타낸다.
이 실시형태에 따르면, 마커 데이터는 피험자에 대한 마커 파라미터들 age, creatininemax 및 albuminmin 에 대해 나타내고, 그에 의해, 피험자에 대한 앓고 있는 CKD 의 위험을 나타내는 위험 인자를 계산하기 위한 단순화된 방법을 제공한다. 추가적인 실시형태들에서, 이하에서 보다 자세히 설명되는 바와 같이, 피험자에 대한 마커 파라미터들 eGFRmin, BMImin, Glucosemin 및 HbAmean 중 적어도 하나에 대해 나타내는 추가적인 마커 데이터가 위험 인자에 대한 보다 정확한 계산을 제공하기 위해 계산에 포함될 수도 있다.
일례에서, 피험자에 대한 앓고 있는 CKD 의 위험을 나타내는 위험 인자는 다음 식들에 따라 복수의 마커 파라미터들로부터 결정된다:
Figure pct00007
PCKD _ Pred = 0.02739 · age / year + 1.387 · creatininemax · dl / mg - 0.3356 · albuminmin · dl/g - 3.1925
PDeath _ Pred = 0.06103 · age / year + 0.8194 · creatininemax · dl / mg - 0.9336 · albuminmin · dl / g - 3.3325
그에 의해, 연령 값은 알부민의 샘플 레벨보다 더 높게 가중되고, 크레아티닌의 샘플 레벨은 알부민의 샘플 레벨보다 더 높게 가중된다.
마커 데이터는 당뇨병을 앓고 있는 피험자에 대해 수신될 수도 있다. 대안에서, 피험자는 당뇨병을 앓고 있지 않지만, 미래에 당뇨병을 앓을 위험에 처했을 수도 있다. 마커 데이터는 피험자에 대한 마커 파라미터들 age, creatininemax, albuminmin 및 eGFRmin 을 나타낸다. 파라미터 "age" 는 피험자의 연령을 나타낸다. 파라미터 “creatininemax” 는 피험자에 대한 파일 상의 그리고 혈액 샘플들로부터 이전 2년에 걸쳐 수집된 크레아티닌의 복수의 샘플 레벨들로부터의 크레아티닌의 최대 샘플 레벨을 나타낸다. 파라미터 “albuminmin” 는 피험자에 대한 파일 상의 그리고 혈액 샘플들로부터 이전 2년에 걸쳐 수집된 알부민의 복수의 샘플 레벨들로부터의 알부민의 최소 샘플 레벨을 나타낸다. 파라미터 “eGFRmin” 은 피험자에 대한 파일 상의 그리고 이전 2년에 걸쳐 수집된 추정된 사구체 여과율의 복수의 샘플 레벨들로부터의 추정된 사구체 여과율의 최소 샘플 레벨을 나타낸다.
일례에서, 피험자에 대한 앓고 있는 CKD 의 위험을 나타내는 위험 인자는 다음의 식들에 따라 복수의 마커 파라미터들로부터 결정된다:
Figure pct00008
PCKD _ Pred = 0.02739 · age / year + 1.387 · creatininemax · dl/mg - 0.3356 · albuminmin · dl/g - 0.02843 · eGFRmin · min·1.73m²/ml - 1.3013
PDeath _ Pred = 0.06103 · age / year + 0.8194 · creatininemax · dl/mg - 0.9336 · albuminmin · dl/g + 0.01654 · eGFRmin · min·1.73m²/ml - 4.4328
그에 의해, 연령 값은 알부민의 샘플 레벨보다 더 높게 가중되고, 크레아티닌의 샘플 레벨은 알부민의 샘플 레벨 보다 더 높게 가중되며, 연령 값, 알부민의 샘플 레벨, 및 크레아티닌의 샘플 레벨의 각각은 사구체 여과율의 샘플 레벨보다 더 높게 가중된다.
마커 데이터는 당뇨병을 앓고 있는 피험자에 대해 수신될 수도 있다. 대안에서, 피험자는 당뇨병을 앓고 있지 않지만, 미래에 당뇨병을 앓을 위험에 처했을 수도 있다. 마커 데이터는 피험자에 대한 마커 파라미터들 age, creatininemax, albuminmin, eGFRmin, BMImin, Glucosemin 및 HbAmean 을 나타낸다. 파라미터 "age" 는 피험자의 연령을 나타낸다. 파라미터 “creatininemax” 는 피험자에 대한 파일 상의 그리고 혈액 샘플들로부터 이전 2년에 걸쳐 수집된 크레아티닌의 복수의 샘플 레벨들로부터의 크레아티닌의 최대 샘플 레벨을 나타낸다. 파라미터 “albuminmin” 는 피험자에 대한 파일 상의 그리고 혈액 샘플들로부터 이전 2년에 걸쳐 수집된 알부민의 복수의 샘플 레벨들로부터의 알부민의 최소 샘플 레벨을 나타낸다. 파라미터 “eGFRmin” 은 피험자에 대한 파일 상의 그리고 이전 2년에 걸쳐 수집된 추정된 사구체 여과율의 복수의 샘플 레벨들로부터의 추정된 사구체 여과율의 최소 샘플 레벨을 나타낸다. 파라미터 “BMImin” 은 피험자에 대한 파일 상의 그리고 이전 2년에 걸쳐 수집된 체질량 지수에 대한 복수의 값들로부터의 체질량 지수에 대한 최소 값을 나타낸다. 파라미터 “Glucosemin” 은 피험자에 대한 파일 상의 그리고 이전 2년에 걸쳐 수집된 혈액 글루코오스의 복수의 샘플 레벨들로부터의 혈액 글루코오스의 최소 샘플 레벨을 나타낸다. 파라미터 “HbAmean” 은 피험자에 대한 파일 상의 그리고 이전 2년에 걸쳐 수집된 당화된 헤모글로빈 A1 의 C-프랙션의 복수의 샘플 레벨들로부터의 당화된 헤모글로빈 A1 의 C-프랙션의 평균 샘플 레벨을 나타낸다.
피험자에 대한 앓고 있는 CKD 의 위험을 나타내는 위험 인자는 다음 식들에 따라 복수의 마커 파라미터들로부터 결정된다:
Figure pct00009
PCKD _ Pred = 0.02739 · age / year + 1.387 · creatininemax · dl/mg - 0.3356 · albuminmin · dl/g - 0.02843 · eGFRmin · min·1.73m²/ml + 0.01128 · BMImin + 0.0004946 · Glucosemin · dl/mg + 0.0893 · HbAmean /% - 2.409
PDeath _ Pred = 0.06103 · age / year + 0.8194 · creatininemax · dl/mg - 0.9336 · albuminmin · dl/g + 0.01654 · eGFRmin · min·1.73m²/ml - 0.0101 · BMImin + 0.0009107· Glucosemin · dl/mg + 0.04368 · HbAmean /% - 4.557
그에 의해, 연령 값은 알부민의 샘플 레벨보다 더 높게 가중되고, 연령 값은 크레아티닌의 샘플 레벨보다 더 높게 가중되고, 크레아티닌의 샘플 레벨은 알부민의 샘플 레벨 보다 더 높게 가중되며, 연령 값, 알부민의 샘플 레벨, 및 크레아티닌의 샘플 레벨의 각각은 사구체 여과율의 샘플 레벨보다 더 높게 가중된다. 추가로, 연령 값, 알부민의 샘플 레벨, 크레아티닌의 샘플 레벨 및 사구체 여과율의 샘플 레벨의 각각은 체질량 지수의 값, 혈액 글루코오스의 샘플 레벨 및 당화된 헤모글로빈 A1 의 C-프랙션의 샘플 레벨의 각각보다 더 높게 가중된다.
CKD 의 위험에 대해 피험자를 스크리닝하기 위한 방법에서, PCKD _ Pred 및/또는 PDeath_Pred 를 결정함에 있어서 피험자에 대한 값들 및/또는 샘플 레벨들과 곱해질 값들의 전부 또는 임의의 것은 다음과 같이 결정될 수도 있다.
예를 들어 데이터베이스에서 표현된 5천 5백만보다 더 많은 사람 중에서 당뇨병 (타입 1 및 2) 을 가진 417,912 사람으로부터의 전자 건강 기록 (EHR) 데이터를 이용하는 알고리즘이 교시된다. 데이터는 당뇨병의 초기 진단 2년 전부터 시작하여 이 진단 후 3년까지 지속되는 타임 윈도우에 대해 취출된다. 데이터는 실제 데이터 (RWD) 로서 간주될 수 있고, 예를 들어 완전성 또는 정확도에 대한 아무런 일반적인 제한들도 적용되지 않는다. 누락된 데이터는 피처 선택 및 알고리즘 교육 전에 코호트의 평균 값으로 대체된다. 로지스틱 회귀 (logistic regression) 는 딥 러닝과 같은 블랙 박스 접근법보다는 교육 (teaching) 을 위해 선택된다. 이것은 데이터-도출된 분석의 의학적 해석을 허용할 수도 있다. 교육 후에, 동일한 데이터베이스 내의 104,504 추가의 개인들로부터 발생한 데이터의 독립적 샘플 세트가 독립적 검증 (independent validation) 을 위해 사용된다. 또한, 그 알고리즘은, 예를 들어 추가의 데이터베이스에 포함된 타입-2 당뇨병을 가진 82,912 명의 사람들로부터의 데이터에 적용된다.
검증 결과들의 분석에서 CKD 참조 진단 및 트레이닝을 위한 타겟 변수들로서 ICD 코드들이 사용될 수도 있다. 타겟 피처 "CKD" 의 정의는 데이터베이스들에서의 각각의 ICD 코드들의 발생에만 기초할 수도 있다. 데이터 세트의 RWD 특성을 유지하기 위해서, 데이터베이스들에 대해 아무런 추가나 변경도 이루어지지 않을 수도 있다. 이러한 ICD 코드들은 ICD-9 코드들 및 ICD-10 코드들, 예를 들어, 다음과 같은 ICD 코드들을 포함할 수도 있다: 250.40, 250.41, 250.42, 250.43, 585.1, 585.2, 585.3, 585.4, 585.5, 585.6, 585.9, 403.00, 403.01, 403.11, 403.90, 403.91, 404.0, 404.00, 404.01, 404.02, 404.03, 404.1, 404.10, 404.11, 404.12, 404.13, 404.9, 404.90, 404.91, 404.92, 404.93, 581.81, 581.9, 583.89, 588.9, E10.2, E10.21, E10.22, E10.29, E11.2, E11.21, E11.22, E11.29, N17.0, N17.1, N17.2, N17.8, N17.9, N18.1, N18.2, N18.3, N18.4, N18.5, N18.6, N18.9, N19, I12.0, I12.9, I13, I13.0, I13.1, I13.10, I13.11, I13.2, N04.9, N05.8, N08 및/또는 N25.9.
ICD-9 코드들 250.40, 403.90, 585.3, 585.9 은 데이터 세트의 각각의 타임 윈도우들에서 가장 풍부한 진단일 수도 있고, 그것들은 데이터 세트들의 각각 내의 경우들의 5% 초과로 발생한다.
CKD 의 위험에 대해 피험자를 스크리닝하기 위한 추가적인 방법에서, PCKD _ Pred 및/또는 PDeath _ Pred 를 결정함에 있어서 피험자에 대한 값들 및/또는 샘플 레벨들과 곱해질 값들의 전부 또는 임의의 것은 다음과 같이 결정될 수도 있다.
CKD 에 대한 조기 위험 평가를 가능하게 하기 위해서, EHR 데이터가, 수천 개의 개인별 피처들을 가진 5천 5백만명 이상의 환자들로부터 발생된 종단 데이터를 포함하는 데이터베이스에서 추출된다. 조사를 위해 데이터베이스로부터 추출된 데이터는 당뇨병으로 새롭게 진단된 522,416 명의 사람들로부터 발생한다. 데이터는 당뇨병의 초기 진단 2년 전부터 시작하여 이 진단 후 3년까지 지속되는 타임 윈도우에 대해 취출된다. 이전의 신장 기능장애를 가진 사람은 CKD 의 나중의 발병에 대한 편견없는 위험 평가를 수행하기 위해서 배제된다. 당뇨병 진단에 대한 가이드라인들에 따라, 당뇨병 진단 및 치료에 중요한 임상 실험 파라미터인 헤모글로빈 (HbA1C)의 β-N-1-디옥시프룩토실 성분의 농도는 당뇨병의 초기 진단의 적어도 1 회 전에 (또는 당뇨병의 초기 진단 후 7일 내에) 결정되었을 것이 요구된다. 데이터베이스로부터 선택된 데이터는, 데이터의 완전성 또는 정확도에 대한 아무런 추가적인 제한들도 적용되지 않기 때문에, RWD 로서 간주될 수 있다. RWD 의 사용으로부터 발생하는 이들 도전과제들에 대처하기 위해서, 다음과 같은 접근법이 구현될 수도 있다:
1. 데이터베이스로부터 선택된 데이터는 무작위로 교육 세트 (417,912 명) 및 검증 세트 (104,504 명) 로 분할된다.
2. 피처들은 교육 세트 내에서 데이터-도출된 상관 분석에 기초하여 선택되고, 개념적 (특히 의학적) 관련성에 대해 크로스-체크된다.
3. 누락된 값들은 데이터세트의 평균 값으로 대체된다. 선택적으로, 이상 값들의 스크리닝 또는 결정이 교육 이전에 수행되었다. 이상치를 결정하는 경우에, 그 값은 적절한 값으로 대체되었다 (피처 값이 그 피처에 대한 특정 허용가능한 범위의 상한보다 더 높은 경우에, 그 값은 예측 공식에서 그것을 사용하기 전에 그 범위의 상한에 의해 대체될 수 있다. 피처 값이 그 피처에 대한 특정 허용가능한 범위의 하한보다 더 낮은 경우에, 그 값은 예측 공식에서 그것을 사용하기 전에 그 범위의 하한에 의해 대체될 수 있다.).
4. 위험 예측자는 이 RWD 의 교육 세트에서 배타적으로 교육된다.
5. 교육이 완료된 후에, 알고리즘의 품질을 평가하기 위해 알고리즘에 검증 세트가 적용된다. 알고리즘의 아무런 추가적인 재조정도 수행되지 않는다.
6. 또한 추가의 데이터베이스에서 표현된 82,912 명의 사람들로부터의 RWD 가 추가의, 독립적인 검증 세트에서 사용된다.
(IBM Explorys 데이터베이스로부터의) 예시적인 교육 트레이닝 세트 (Kaelber, D.C. 외, Patient characteristics associated with venous thromboembolic events: a cohort study using pooled electronic health record data, J Am Med Inform Assoc 19, 965-972, 2012 참조), (IBM Explorys 데이터베이스로부터의) 검증 세트 및 (INPC (Indiana Network for Patient Care) 로부터의) 추가의 검증 세트 (McDonald, C. J. 외, The Indiana Network for Patient Care: a working local health information infrastructure, Health Affairs 24, 1214-1220, 2005 참조) 의 분석이 수행되었다. 교육에서 로지스틱 회귀가 적용되었다.
교육 및 검증 세트들에서, 사람들의 50.7%, 50.9% 및 51.7% 가 각각 여성이다. 각 모집단의 중간 연령은 각각 60세, 60세, 및 59세이다. HbA1C 의 중간 농도는 각각 6.8%, 6.8%, 및 6.6% 이다. 연령 및 HbA1C 의 분포들은 도 1 및 도 2 에서 각각 도시된다.
특정 실시형태들에서, 피처 선택을 위해, 거의 300 피처들이 의학적 및 데이터-도출된 기준들에 기초하여 초기에 선택된다. 이 피처 세트는 그 다음에 다수의 단계들에서 추려진다. 코호트에서 환자들의 절반 미만에 대해 정의되는 관찰적 피처들은 연속적 피처들의 이상치들처럼 제거된다. 단일 범주에서 ≥ 99 %의 발생이있는 범주형 피처들과 ≤ 0.001 % 의 표준 편차를 갖는 연속적 피처들은 고려되지 않는다. 마지막으로, Pearson 의 카이 제곱 계수 χ2 > 0.95 에 의해 정량화된 일변량 분석에서 CKD 진단과 이미 상관 관계를 보인 피처들만 유지된다. 예측적 분석을 위해, 순방향 선택에 기초한 로지스틱 회귀 모델 (Bursac, Z. 외, Purposeful selection of variables in logistic regression, Source code for biology and medicine 3, 17, 2008; 및 Hosmer Jr., D.W. 외, Applied logistic regression, Vol. 398, John Wiley & Sons, 2013 참조) 이 교육 세트에 대해 트레이닝되고, 그 사람의 연령, 체질량 지수, 사구체 여과율 및 글루코오스, 알부민, 및 크레아티닌의 농도들을 가장 두드러진 파라미터들로서 전달한다. 예를 들어 딥 러닝에 기초한 "블랙 박스 (black box)" 접근법에 반해, 이들 피처들의 의학적 관령성의 평가가 임상적 적용가능성을 보장하기 위해 수행될 수행될 수도 있다. HbA1C 가 현재 최첨단 방법들을 반영하기 위해 상위-7 피처 리스트에 추가될 수도 있다. 알고리즘들의 교육은 상관에 기초할 수도 있지만, 어떠한 인과관계도 추론하지 않을 수도 있다. 교육 후에, 2 개의 독립적인 데이터세트들, 즉, 검증 세트들에 알고리즘이 적용된다.
검증 결과들의 분석에서 CKD 참조 진단 및 트레이닝을 위한 타겟 변수들로서 ICD 코드들이 사용될 수도 있다. 타겟 피처 "CKD" 의 정의는 데이터베이스들에서의 각각의 ICD 코드들의 발생에만 기초할 수도 있다. 데이터 세트의 RWD 특성을 유지하기 위해서, 데이터베이스들에 대해 아무런 추가나 변경도 이루어지지 않을 수도 있다. 이러한 ICD 코드들은 ICD-9 코드들 및 ICD-10 코드들, 예를 들어, 다음과 같은 ICD 코드들을 포함할 수도 있다: 250.40, 250.41, 250.42, 250.43, 585.1, 585.2, 585.3, 585.4, 585.5, 585.6, 585.9, 403.00, 403.01, 403.11, 403.90, 403.91, 404.0, 404.00, 404.01, 404.02, 404.03, 404.1, 404.10, 404.11, 404.12, 404.13, 404.9, 404.90, 404.91, 404.92, 404.93, 581.81, 581.9, 583.89, 588.9, E10.2, E10.21, E10.22, E10.29, E11.2, E11.21, E11.22, E11.29, N17.0, N17.1, N17.2, N17.8, N17.9, N18.1, N18.2, N18.3, N18.4, N18.5, N18.6, N18.9, N19, I12.0, I12.9, I13, I13.0, I13.1, I13.10, I13.11, I13.2, N04.9, N05.8, N08 및/또는 N25.9.
일 실시형태에서, ICD-9 코드들 250.40, 403.90, 585.3, 585.9 은 데이터 세트의 각각의 타임 윈도우들에서 가장 많은 진단일 수도 있고, 그것들은 데이터 세트들의 각각 내의 경우들의 5% 초과로 발생한다.
이어서, 실험적 데이터가 논의된다.
임상적 마커들 및 머신 러닝 알고리즘들의 품질을 측정하기 위해 수신기 동작 특성 (receiver operating characteristic) 하의 면적 (Swets, J.A., Measuring the accuracy of diagnostic systems, Science 240, 1285-1293, 1988 비교) 곡선 (AUC) 이 자주 사용된다 (Bradley, A.P., The use of the area under the ROC curve in the evaluation of machine learning algorithms, Pattern Recognition 30, 1145-1159, 1997 참조). 완벽한 마커는 AUC=1.0 을 달성할 것인 반면에, 동전 던지기는 AUC=0.5 의 결과를 초래할 것이다. 7 가지 가장 유망한 피처들을 이용하여 본 개시에 따라 (Explorys 에 기초하여) 모델을 교육한 후에, 예측 알고리즘의 AUC 는, 전체 독립적 검증 데이터에 적용될 때 0.7937 (0.790 … 0.797) 에 달했다 (Explorys: 0.761, INPC: 0.831).
상위-10 및 상위-12 피처들이 각각 평가를 위해 사용된 경우, AUC 는 0.7939 및 0.7967 로 증가하였다. 다시, 단순한 HbA1C 모델 (The Diabetes Control and Complications Trial Research Group. The effect of intensive treatment of diabetes on the development and progression of long-term complications in insulin-dependent diabetes mellitus, N Engl J Med 329, 977-986, 1993 참조) 은 동일한 데이터세트들에 대해 0.483 (0.477 … 0.489) 를 산출하였다. 본 개시에 따른 알고리즘은 따라서, 당뇨병으로 새롭게 진단된 사람에 대해서만 HbA1C 를 이용하는 위험 예측자들을 능가한다.
추가적인 분석에서, 본 개시에 따른 알고리즘은 ONTARGET, ORIGIN, RENAAL 및 ADVANCE 연구들과 같은 주요 임상 연구들로부터 소싱된 데이터로부터 도출된 발표된 알고리즘들에 대해 비교되었다 (비교, Dunkler, D. 외, Risk Prediction for Early CKD in Type 2 Diabetes, Clin J Am Soc Nephrol 10, 1371-1379, 2015; Vergouwe, Y. 외, Progression to microalbuminuria in type 1 diabetes: development and validation of a prediction rule, Diabetologia 53, 254-262, 2010; Keane, W.F. 외, Risk Scores for Predicting Outcomes in Patients with Type 2 Diabetes and Nephropathy: The RENAAL Study, Clin J Am Soc Nephrol 1, 761-767, 2006; 및 Jardine, M.J. 외, Prediction of Kidney-Related Outcomes in Patients With Type 2 Diabetes, Am J Kidney Dis. 60, 770-778, 2012). 도 3 에서 도시된 바와 같이, 본 개시에 따른 알고리즘은 모든 RWD 코호트들에 대해 이들 알고리즘들의 각각을 능가하였다. 이러한 발견은 일상적인 세팅들에서 적용가능성 및 관련성의 면에서 중요하지만, 발표된 알고리즘들의 유효성은 대응하는 임상적 연구들의 포함 및 배제 기준들에 제한된다고 주장될 수도 있다. 따라서, IBM Explorys 및 INPC 데이터베이스들의 서브코호트들이 이들 연구들의 선택 기준들에 따라 형성되었고, 본 개시에 따른 알고리즘은 (임의의 재트레이닝 없이) 이들 서브코호트들에 대해서만 그 문헌의 알고리즘들에 대해 벤치마킹되었다. 발표된 알고리즘들의 AUC들은 예상된 바와 같이 모든 특정 서브코호트들에 대해 증가하였지만, 본 개시에 따른 RWD-트레이닝된 모델의 우월성이 우세했다 (도 4). 하지만, 서브코호트들에 대한 포함 및 배제 기준들은, 임상 연구들은 데이터베이스에서 이용가능하지 않은 일부 정보 (예컨대, 허리-대-엉덩이 비율) 를 요구하기 때문에, 본 RWD 세트에 대해 모든 경우들에서 정확하게 충족될 수 없을 것이다. 또한, 합병증 발생 타임 윈도우의 선택에서 차이들이 존재하였다. 그럼에도 불구하고, 본 개시에 따른 알고리즘으로의 분류를 위해 우선시되었던 피처들은 문헌에서 보고되었던 것들과 유사하고, 따라서, 그 알고리즘의 유효성을 더 강화한다.
RWD 의 사용 특히 본 개시에 다른 알고리즘에 대한 트레이닝 세트에서의 불완전하거나 잘못된 데이터의 포함은 임상 연구 기반 알고리즘들에 비해 주요 차이를 구성한다. 누락된 데이터의 대치 (imputation) 는 RWD 코호트들에서의 예측적 분석론의 통상적인 예를 제공하는 반면에, 임상 연구 세팅에서 대치는 상상할 수 없을 것이다. 대치의 역할을 추가로 밝히기 위해, 본 개시에 따른 알고리즘은 완전한 세트의 정보 (즉, 아무런 대치도 필요하지 않음) 를 제공하는 개인들만을 표현하는 RWD 에 적용되었다. 이 경우에, AUC들은 전체 RWD 세트에 대해 이전 값들에 대해 비견할만하게 유지되었다, 즉, Explorys 교육 트레이닝 세트, Explorys 검증 세트, 및 INPC 검증 세트 각각에 대해 0.792 (0.787…0.797), 0.791 (0.780…0.801), 및 0.809 (0.769… 0.846) 이었다. 추가적 분석은, 이전의 알고리즘들이 테스트되었을 때 대치된 데이터의 증가하는 프랙션 (fraction) 으로 분류 정확도의 급속한 손실을 드러낸 반면, 본 개시에 따른 알고리즘은 심지어 대치된 데이터의 더 높은 비율들에 대해서도 훨씬 더 높은 안정성을 달성하였다 (도 5). 적어도 본 예에서, RWD 를 이용하는 예측적 분석 알고리즘들의 교육 트레이닝은 임상적 시험 데이터에 비해 동등하거나 심지어 향상된 정확도를 달성할 수 있을 것이지라고 결론지을 수 있지만, 이들 결론들이 일반화될 수 있기 전에 추가적인 데이터세트들에 대한 추가의 테스팅이 필요할 것이다.
요컨대, CKD 에 대한 예측 알고리즘은, 임상 연구 데이터보다는 RWD 에 대해 트레이닝되는 경우에, 당뇨병으로 새롭게 진단된 개인들에서 현저하게 더 양호하게 수행되었음이 입증되었다. 이러한 진술은, 본 개시에 따른 알고리즘이 대응하는 임상 연구들에 의해 정의된 바와 같이 특정 서브코호트들 및 전체 RWD 코호트에 대해 적용되었을 때 참으로 유지되었다. 그 결과들은 임상적 세팅에서 적용될 수 있는 고품질 예측 모델들을 향한 경로를 지원하여, 개인화된 그리고 결과 기반 의료를 향한 진전을 가능하게 한다.
CKD 의 위험에 대해 피험자를 스크리닝하기 위한 그리고 CKD 발병의 높은 위험에 처한 그 사람들을 식별하기 위한 방법의 퍼포먼스 (performance) 는 민감도 (올바르게 예측된 고위험 환자들의 비율) 및 특이성 (올바르게 할당된 낮은 위험 환자들의 비율) 에 따라 판단 될 수도 있다. 하지만, 이들 수치들 중 어느 일방은 고 위험과 저 위험 사이의 임계치를 단순히 변경함으로써 타방의 희생으로 향상될 수 있다. 그리하여, 민감도 및 특이성의 데이터 쌍들은 소위 수신기 동작 특성 (receiver operating characteristic; ROC) 곡선의 형태로 나타내어질 수도 있고 (Swets, J.A., Measuring the accuracy of diagnostic systems, Science 240, 1285-1293, 1988 참조), 이 곡선에서, 민감도는 (잘못 할당된 고 위험 사람들의 함수에 대응하는) 1-특이성의 함수로서 플롯팅된다. 본 개시에 따른 위험 모델의 ROC 곡선이, HbA1C 에만 기초한 모델에 대한 대응하는 ROC 곡선들과 함께 도 6 에서 Explorys 트레이닝 세트, Explorys 검증 세트 및 INPC 검증 세트에 대해 도시된다.
완벽한 분류자에 대해, ROC 곡선은 상위 좌측 코너에 도달한다. 사실, 이 코너에 가장 가까운 데이터 쌍에 대응하는 임계치는 "최적 임계치 (optimal threshold)" 라고 불린다. 높은 민감도를 목표로 할 때, 예를 들어 90% 의 민감도를 보장하기 위해 대안적인 임계치가 선택될 수도 있다. 대응하는 결과들이 포지티브 예측 값 (positive predictive value; PPV) 및 네거티브 예측 값 (negative predictive value; NPV) 과 함께 이하의 표에서 요약된다. 생물정보학 분야로부터의 유사한 측정치들 - 즉, 정확성 및 F-스코어 (Van Rijsbergen, C.J., Information Retrieval, Butterworth-Heinemann Newton, MA, USA, 1979) - 이 표 2 에서의 예들의 리스트를 보완한다.
표 2
코호트 민감도 특이성 PPV NPV 정확성 F-측정
a) HbA1c Explorys
(교육)
53.5 55.1 11.7 91.4 55.0 19.2
Explorys (검증) 54.4 55.2 11.9 91.6 55.1 19.5
INPC (검증) 37.5 61.5 11.3 88.2 58.7 17.4
b) 본 모델 Explorys
(교육)
68.2 72.6 21.7 95.4 72.1 32.9
Explorys (검증) 68.3 72.4 21.6 95.3 72.0 32.8
INPC (검증) 79.3 71.2 26.6 96.3 72.2 39.8
c) 본 모델* Explorys
(교육)
(90.0) 35.0 13.3 96.9 40.5 23.2
Explorys (검증) 90.0 34.9 13.3 96.9 40.4 23.2
INPC (검증) 95.3 27.6 14.7 97.8 35.5 25.5
INPC 데이터에 각각 적용된, 본 개시에 따른 감소된 알고리즘 (피험자에 대한 age, creatininemax 및 albuminmin, 나머지 값들/샘플 레벨들에 대한 모집단 평균 값들) 에 대한 본 개시에 따른 전체 알고리즘 (피험자에 대한 7 가지 값들/샘플 레벨들, 대체된 누락 값들/샘플 레벨들) 의 비교 평가는 전체 알고리즘에 대해 0.831 의 AUC (신뢰 구간 0.827 내지 0.836) 및 감소된 알고리즘에 대해 0.823 의 AUC (신뢰 구간 0.818 내지 0.827) 을 초래하였다. 따라서, 감소된 알고리즘으로도, 유용한 예측들이 달성될 수도 있다.

Claims (15)

  1. 만성 신장 질환 (CKD) 의 위험에 대해 피험자를 스크리닝하기 위한 방법으로서,
    - 피험자에 대한 복수의 마커 파라미터들을 나타내는 마커 데이터를 수신하는 단계로서, 이러한 복수의 마커 파라미터들은, 측정 기간 동안 상기 피험자에 대해, 연령 값, 크레아티닌의 샘플 레벨, 및 알부민의 샘플 레벨을 나타내는, 상기 마커 데이터를 수신하는 단계; 및
    - 상기 복수의 마커 파라미터들로부터 상기 피험자에 대한 앓고 있는 CKD 의 위험을 나타내는 위험 인자를 결정하는 단계를 포함하고,
    상기 결정하는 단계는,
    - 상기 알부민의 샘플 레벨보다 더 높게 상기 연령 값에 가중치를 부여하는 단계, 및
    - 상기 알부민의 샘플 레벨보다 더 높게 상기 크레아티닌의 샘플 레벨에 가중치를 부여하는 단계를 포함하는, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
  2. 제 1 항에 있어서,
    상기 복수의 마커 파라미터들이, 상기 피험자에 대해, 상기 크레아티닌의 혈액 샘플 레벨을 나타내는 것을 더 포함하는, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 복수의 마커 파라미터들이, 상기 피험자에 대해, 상기 알부민의 혈액 샘플 레벨을 나타내는 것을 더 포함하는, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 피험자는 당뇨병 환자인, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    상기 측정 기간은 2 년으로 제한되는, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    상기 피험자는 상기 측정 기간의 종료시까지 당뇨병으로 진단되지 않은, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
  7. 제 4 항 또는 제 5 항에 있어서,
    상기 측정 기간은 상기 피험자에 대한 당뇨병 진단 후의 기간에 적어도 부분적으로 놓이는, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
    상기 위험 인자는 상기 측정 기간의 종료로부터 3 년의 예측 기간 내에서 상기 피험자에 대한 앓고 있는 CKD 의 위험을 나타내는, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
  9. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 결정하는 단계는, 상기 크레아티닌의 샘플 레벨보다 더 높게 상기 연령에 가중치를 부여하는 단계를 더 포함하는, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
  10. 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
    상기 수신하는 단계는, 6.5% 미만의 HbA1c 의 샘플 레벨을 갖는 피험자에 대한 복수의 마커 파라미터들을 나타내는 마커 데이터를 수신하는 단계를 포함하는, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
  11. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    - 상기 복수의 마커 파라미터들이, 상기 피험자에 대해, 사구체 여과율의 샘플 레벨을 나타내는 것; 및
    - 상기 결정하는 단계에서, 사구체 여과율의 상기 샘플 레벨보다 더 높게 상기 연령 값, 상기 알부민의 샘플 레벨, 및 상기 크레아티닌의 샘플 레벨의 각각에 가중치를 부여하는 단계를 더 포함하는, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
  12. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 위험 인자는 식
    Figure pct00010

    에 따라 결정되고, 여기서,
    - PCKD 는 상기 위험 인자이고;
    - PCKD _ Pred = cCKD1 · age + cCKD2 · creatinine + cCKD3 · albumin + cCKD4 ;
    - age 는 상기 피험자의 연령이고;
    - creatinine 은 상기 피험자에 대한 크레아티닌의 샘플 레벨이고;
    - albumin 은 상기 피험자에 대한 알부민의 샘플 레벨이며; 그리고
    - cCKD1, cCKD2, cCKD3, 및 cCKD4 는 상수들인, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
  13. 제 1 항 내지 제 11 항 중 어느 한 항에 있어서,
    상기 위험 인자는 식
    Figure pct00011

    에 따라 결정되고, 여기서,
    - P'CKD 는 상기 위험 인자이고;
    - P’CKD_ Pred = c’CKD1 · age + c’CKD2 · creatinine + c’CKD3 · albumin + c’CKD4 + c’CKD5 · eGFR ;
    - age 는 상기 피험자의 연령이며;
    - creatinine 은 상기 피험자에 대한 크레아티닌의 샘플 레벨이고;
    - albumin 은 상기 피험자에 대한 알부민의 샘플 레벨이며;
    - eGFR 은 상기 피험자에 대한 추정된 사구체 여과율의 샘플 레벨이고; 그리고
    - c’CKD1, c’CKD2, c’CKD3, c’CKD4, 및 c’CKD5 는 상수들인, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
  14. 프로그램을 저장하는 비일시적 메모리 및 프로세서를 갖는 데이터 프로세싱 시스템에서 만성 신장 질환 (CKD) 의 위험에 대해 피험자를 스크리닝하기 위한 컴퓨터-구현 방법으로서,
    상기 프로그램은 상기 프로세서로 하여금:
    - 피험자에 대한 복수의 마커 파라미터들을 나타내는 마커 데이터를 수신하는 것으로서, 이러한 복수의 마커 파라미터들은, 측정 기간 동안 상기 피험자에 대해, 연령 값, 알부민의 샘플 레벨, 및 크레아티닌의 샘플 레벨을 나타내는, 상기 마커 데이터를 수신하는 것
    - 상기 복수의 마커 파라미터들로부터 상기 피험자에 대한 앓고 있는 CKD 의 위험을 나타내는 위험 인자를 결정하는 것
    을 실행하게 하고,
    상기 결정하는 것은,
    - 상기 알부민의 샘플 레벨보다 더 높게 상기 연령 값에 가중치를 부여하는 것, 및
    - 상기 알부민의 샘플 레벨보다 더 높게 상기 크레아티닌의 샘플 레벨에 가중치를 부여하는 것을 포함하는, 데이터 프로세싱 시스템에서 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 컴퓨터-구현 방법.
  15. 만성 신장 질환 (CKD) 의 위험에 대해 피험자를 스크리닝하기 위한 방법으로서,
    - 복수의 마커 파라미터들을 나타내는 마커 데이터를 수신하는 단계로서, 이러한 복수의 마커 파라미터들은,
    - 상기 피험자에 대한 연령 값,
    - 측정 기간 동안의 크레아티닌의 샘플 레벨, 및
    - 측정 기간 동안의 알부민의 샘플 레벨
    을 나타내는, 상기 마커 데이터를 수신하는 단계; 및
    - 상기 복수의 마커 파라미터들로부터 상기 피험자에 대한 앓고 있는 CKD 의 위험을 나타내는 위험 인자를 결정하는 단계를 포함하고,
    상기 결정하는 단계는,
    - 상기 알부민의 샘플 레벨보다 더 높게 상기 연령 값에 가중치를 부여하는 단계, 및
    - 상기 알부민의 샘플 레벨보다 더 높게 상기 크레아티닌의 샘플 레벨에 가중치를 부여하는 단계를 포함하고,
    상기 크레아티닌의 샘플 레벨 및 상기 알부민의 샘플 레벨 중 적어도 하나는, 피험자들의 참조 그룹의 각각의 피험자의 각각의 측정 기간에 대해, 상기 피험자를 포함하지 않는 피험자들의 참조 그룹에 대한 샘플 레벨들의 일반화된 값을 나타내는, 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법.
KR1020207030180A 2018-03-23 2019-03-22 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법들 및 컴퓨터-구현 방법 KR20200135444A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP18163573.1 2018-03-23
EP18163573.1A EP3543702B1 (en) 2018-03-23 2018-03-23 Methods for screening a subject for the risk of chronic kidney disease and computer-implemented method
EP19150615.3 2019-01-07
EP19150615 2019-01-07
PCT/EP2019/057297 WO2019180232A1 (en) 2018-03-23 2019-03-22 Methods for screening a subject for the risk of chronic kidney disease and computer-implemented method

Publications (1)

Publication Number Publication Date
KR20200135444A true KR20200135444A (ko) 2020-12-02

Family

ID=65802112

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207030180A KR20200135444A (ko) 2018-03-23 2019-03-22 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법들 및 컴퓨터-구현 방법

Country Status (10)

Country Link
US (1) US20210118570A1 (ko)
EP (1) EP3769086A1 (ko)
KR (1) KR20200135444A (ko)
CN (1) CN112105933A (ko)
AU (1) AU2019238388A1 (ko)
BR (1) BR112020019087A2 (ko)
CA (1) CA3094294A1 (ko)
MX (1) MX2020009705A (ko)
RU (1) RU2020134037A (ko)
WO (1) WO2019180232A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4060347A1 (en) * 2021-03-15 2022-09-21 F. Hoffmann-La Roche AG Method for screening a subject for the risk of chronic kidney disease and computer-implemented method
CN115148375B (zh) * 2022-08-31 2022-11-15 之江实验室 一种高通量真实世界药物有效性与安全性评价方法及系统
CN117711619A (zh) * 2023-12-15 2024-03-15 南方医科大学南方医院 一种糖尿病患者慢性肾脏病发生风险预测系统及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201214440D0 (en) * 2012-08-13 2012-09-26 Randox Lab Ltd Kidney disease biomarker
EP2746770A1 (en) * 2012-12-21 2014-06-25 Stembios Technologies, Inc. Method for evaluating effect of action on subject based on stem celldynamics
GB201404789D0 (en) * 2014-03-18 2014-04-30 Univ Dundee Biomarkers
WO2016170023A1 (en) * 2015-04-24 2016-10-27 Sphingotec Gmbh A method for predicting the risk of incidence of chronic kidney disease

Also Published As

Publication number Publication date
AU2019238388A1 (en) 2020-10-15
BR112020019087A2 (pt) 2020-12-29
US20210118570A1 (en) 2021-04-22
WO2019180232A1 (en) 2019-09-26
MX2020009705A (es) 2020-10-07
RU2020134037A (ru) 2022-04-26
EP3769086A1 (en) 2021-01-27
CN112105933A (zh) 2020-12-18
CA3094294A1 (en) 2019-09-26

Similar Documents

Publication Publication Date Title
England et al. Validation of the rheumatic disease comorbidity index
Moons et al. Transparent Reporting of a multivariable prediction model for Individual Prognosis or Diagnosis (TRIPOD): explanation and elaboration
Rubin et al. Development and validation of a novel tool to predict hospital readmission risk among patients with diabetes
Bentley et al. Functional status, life-space mobility, and quality of life: a longitudinal mediation analysis
US11404166B2 (en) Systems and methods for mining of medical data
Smith Nature and causes of trends in male diabetes prevalence, undiagnosed diabetes, and the socioeconomic status health gradient
Hayes et al. Illness severity scores in veterinary medicine: what can we learn?
Stones et al. Clinical risk assessment tools in anaesthesia
KR20200135444A (ko) 만성 신장 질환의 위험에 대해 피험자를 스크리닝하기 위한 방법들 및 컴퓨터-구현 방법
US20230080350A1 (en) Methods and Apparatus for Diagnosis of Progressive Kidney Function Decline Using a Machine Learning Model
Mashayekhi et al. Evaluating the performance of the Framingham Diabetes Risk Scoring Model in Canadian electronic medical records
Wang et al. Can we predict which COVID‐19 patients will need transfer to intensive care within 24 hours of floor admission?
Parker et al. Are self-reported telemonitored blood pressure readings affected by end-digit preference: a prospective cohort study in Scotland
EP3543702B1 (en) Methods for screening a subject for the risk of chronic kidney disease and computer-implemented method
Kengne et al. Risk predictive modelling for diabetes and cardiovascular disease
US20150220698A1 (en) Systems and methods for determining secondary hyperparathyroidism risk factors
WO2018148581A1 (en) Therapeutic intervention methods, devices, and systems
Tripepi et al. Reappraisal in two European cohorts of the prognostic power of left ventricular mass index in chronic kidney failure
Mansour et al. A novel chronic kidney disease phenotyping algorithm using combined electronic health record and claims data
Mangelis et al. African Caribbean ethnicity is an independent predictor of significant decline in kidney function in people with type 1 diabetes
Clench-Aas et al. Methodological development and evaluation of 30-day mortality as quality indicator for Norwegian hospitals
Zhou et al. A novel laboratory-based model to predict the presence of obstructive coronary artery disease comparison to coronary artery disease consortium 1/2 score, duke clinical score and diamond-forrester score in china
EP4060347A1 (en) Method for screening a subject for the risk of chronic kidney disease and computer-implemented method
Riley et al. IPD Meta‐Analysis for Clinical Prediction Model Research
Chen et al. Relationship between Hospital 30‐Day Mortality Rates for Heart Failure and Patterns of Early Inpatient Comfort Care

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal