KR20200105374A - 각 유전 변이 정보에 개별적인 가중치를 부여한 전립선암 유전위험점수 산출장치, 산출방법 및 이의 기록매체 - Google Patents

각 유전 변이 정보에 개별적인 가중치를 부여한 전립선암 유전위험점수 산출장치, 산출방법 및 이의 기록매체 Download PDF

Info

Publication number
KR20200105374A
KR20200105374A KR1020190126465A KR20190126465A KR20200105374A KR 20200105374 A KR20200105374 A KR 20200105374A KR 1020190126465 A KR1020190126465 A KR 1020190126465A KR 20190126465 A KR20190126465 A KR 20190126465A KR 20200105374 A KR20200105374 A KR 20200105374A
Authority
KR
South Korea
Prior art keywords
genetic
risk
risk score
subject
prostate cancer
Prior art date
Application number
KR1020190126465A
Other languages
English (en)
Other versions
KR102371655B1 (ko
Inventor
김은애
우은진
Original Assignee
주식회사 프로카젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020190024388A external-priority patent/KR102068667B1/ko
Application filed by 주식회사 프로카젠 filed Critical 주식회사 프로카젠
Priority to KR1020190126465A priority Critical patent/KR102371655B1/ko
Publication of KR20200105374A publication Critical patent/KR20200105374A/ko
Application granted granted Critical
Publication of KR102371655B1 publication Critical patent/KR102371655B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Abstract

본 발명은 유전정보를 이용하여 전립선암의 위험점수를 산출하기 위한 산출장치, 산출방법 및 이의 기록매체에 관한 것이다. 본 발명의 일 실시 예에 따른 전립선 암 위험도 산출 방법은 피험자의 유전 정보를 입력 받는 단계, 가중치 위험도 모델을 이용하여 유전 정보에 대한 유전위험 점수를 산출하는 단계, 유전위험 점수가 속하는 위험 그룹을 식별하는 단계 및 유전 정보에 대한 유전위험 점수가 속하는 위험 그룹이 고위험 그룹인 경우, 피험자를 집중관리 대상자로 설정하는 단계를 포함한다.

Description

각 유전 변이 정보에 개별적인 가중치를 부여한 전립선암 유전위험점수 산출장치, 산출방법 및 이의 기록매체{Device, Method of Calculating Prostate Cancer Genetic Risk Score Based on Individual Weights for each Genetic Variation and Recording Medium thereof}
본 발명은 유전정보를 이용하여 전립선암의 위험점수를 산출하기 위한 산출장치, 산출방법 및 이의 기록매체에 관한 것이다.
전립선암은 한국에서 남성 암 유병률 3위 및 발병률 4위인 암종으로 남성 사망의 주된 원인이 되고 있다. 이에 종래에는 전립선암을 예측하기 위해 유전정보를 이용하는 등의 연구가 진행되어왔다.
한편, 전립선암의 발병율과 그로 인한 사망율은 전세계적으로 큰 차이를 나타내는데, 미국과 유럽 남성의 발병율이 높고, 특히 아프리카계 미국인의 사망율이 가장 높게 나타나는 반면에, 아시아인의 발병율과 사망율은 상대적으로 낮은 편이다. 이러한 인종적 차이는 전립선암 발병이 환경적 차이뿐만 아니라 유전적 이질성(heterogeneity)에 기인할 가능성을 시사한다. 따라서 유전적 이질성에 의한 인종 간의 차이를 반영하여 전립선암 발병의 위험성을 판단할 필요성이 대두된다.
또한 종래의 전립선암 진단은 진단 당시의 암 위험 여부를 안내해주는 것이 그치기 때문에, 피험자 별로 효율적인 관리 및 모니터링이 불가능하다.
본 발명은 상술한 필요성에 따른 것으로, 유전 정보를 이용한 인종 별 전립선암을 예측하기 위해 유전위험도 점수를 산출하는 장치, 방법 및 기록매체를 제공하는 것을 목적으로 한다.
또한 본 발명은 전립선암 발생에 유의미한 영향을 주는 대표 유전 변이들에 대해 상이한 가중치를 부여하여 정확한 유전위험도 점수를 산출하는 장치, 방법 및 기록매체를 제공하는 것을 목적으로 한다.
또한 본 발명은 순차적인 전립선암 위험 정도를 진단하여 효율적인 피험자 관리를 제공하는 장치, 방법 및 기록매체를 제공하는 것을 목적으로 한다.
그러나 이러한 과제는 예시적인 것으로, 이에 의해 본 발명의 범위가 한정되는 것은 아니다.
본 발명의 일 실시 예에 따른 전립선 암 위험도 산출 방법은 피험자의 유전 정보를 입력받는 단계; 가중치 위험도 모델을 이용하여 상기 유전 정보에 대한 유전위험 점수를 산출하는 단계; 상기 유전위험 점수가 속하는 위험 그룹을 식별하는 단계; 및 상기 유전 정보에 대한 유전위험 점수가 속하는 위험 그룹이 고위험 그룹인 경우, 상기 피험자를 집중관리 대상자로 설정하는 단계;를 포함할 수 있다.
또한, 상기 유전위험 점수를 산출하는 단계는 상기 유전 정보에 대응되는 가중치 위험도 모델을 통해 산출하는 것을 특징으로 할 수 있다.
또한, 상기 가중치 위험도 모델은 4개 SNP(단일염기다형성) 마커 또는 6개 SNP 마커를 이용하는 것을 특징으로 할 수 있다..
한편, 본 발명의 일 실시예에 따른 기록매체는 상기 전립선 암 위험도 산출 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체일 수 있다.
전술한 것 외의 다른 측면, 특징, 이점은 이하의 발명을 실시하기 위한 구체적인 내용, 청구범위 및 도면으로부터 명확해질 것이다.
상기한 바와 같이 이루어진 본 발명의 일 실시예에 따르면, 인종 별로 상이한 가중치 모델을 적용함으로써 피험자 인종 특이성을 반영한 전립선암 위험점수를 산출할 수 있다.
특히, 본 발명의 일 실시예에 따르면, 유전 정보 중 특정 유전변이에 대하여 가중치를 부여함으로써 정밀한 위험도를 산출할 수 있다.
물론 이러한 효과에 의해 본 발명의 범위가 한정되는 것은 아니다.
도 1은 본 발명의 일 실시예예 따른 전립선암 유전위험점수 산출 시스템을 설명하기 위한 시스템도이다.
도 2는 본 발명의 일 실시예에 따른 산출장치의 구성요소를 설명하기 위한 블록도이다.
도 3은 본 발명의 일 실시예에 따른 유전위험 점수를 산출하는 방법을 설명하기 위한 흐름도이다.
도 4는 발견(discovery) GWAS(Genome Wide Association Study) 단계에서의 맨하탄 플롯(Manhattan plots)의 총괄자료를 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 유전위험 점수 계산에 포함되는 후보 유전변이 목록을 도시한 도면이다.
도 6a 및 도 6b는 본 발명의 일 실시예에 따른 유전변이의 개수에 따른 예측력을 비교하기 위한 ROC(Receiver Operating Characteristic) 곡선을 도시한 도면이다.
도 7a 내지 7g는 본 발명의 일 실시예에 따른 가중치를 부여한 모델(weighted model)의 유전변이 개수에 따른 GRS(Generic Risk Score) 분포를 설명하기 위한 도면이다.
도 8a 내지 8g는 본 발명의 일 실시예에 따른 가중치를 부여하지 않은 모델(non-weighted model)의 유전변이 개수에 따른 유전위험 점수(Genetic risk score, GRS)분포를 설명하기 위한 도면이다.
도 9는 본 발명의 일 실시예에 따른 GRS 그룹별 전립선암에 대한 교차비를 설명하기 위한 도면이다.
도 10은 본 발명의 일 실시예에 따른 GRS 그룹 중·고위험군 그룹에서의 교차비를 설명하기 위한 도면이다.
도 11은 본 발명의 일 실시예에 따른 상이한 인구집단의 가중위험점수 비교를 위해 포함되는 유전변이를 설명하기 위한 도면이다.
도 12a 및 12b는 본 발명의 일 실시예에 따른 가중치 위험도 모델을 유럽인 데이터 및 한국인 데이터에 적용하였을 때의 GRS 분포를 도시한 도면이다.
도 13a 및 13b는 본 발명의 일 실시예에 따른 가중치 위험도 모델을 유럽인 데이터 및 한국인 데이터에 적용하였을 때의 ROC 곡선을 도시한 도면이다.
도 14a 및 14b는 본 발명의 일 실시예에 따른 유전위험 점수 그룹을 설명하기 위한 도면이다.
이하, 본 개시의 다양한 실시예가 첨부된 도면과 연관되어 기재된다. 본 개시의 다양한 실시예는 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들이 도면에 예시되고 관련된 상세한 설명이 기재되어 있다. 그러나 이는 본 개시의 다양한 실시예를 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 개시의 다양한 실시예의 사상 및 기술 범위에 포함되는 모든 변경 및/또는 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용되었다.
본 개시의 다양한 실시예에서 사용될 수 있는 "포함한다." 또는 "포함할 수 있다." 등의 표현은 개시(disclosure)된 해당 기능, 동작 또는 구성요소 등의 존재를 가리키며, 추가적인 하나 이상의 기능, 동작 또는 구성요소 등을 제한하지 않는다. 또한, 본 개시의 다양한 실시예에서, "포함하다." 또는 "가지다." 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 개시의 다양한 실시예에서 "또는" 등의 표현은 함께 나열된 단어들의 어떠한, 그리고 모든 조합을 포함한다. 예를 들어, "A 또는 B"는, A를 포함할 수도, B를 포함할 수도, 또는 A 와 B 모두를 포함할 수도 있다.
본 개시의 다양한 실시예에서 사용된 "제1", "제2", "첫째", 또는 "둘째" 등의 표현들은 다양한 실시예들의 다양한 구성요소들을 수식할 수 있지만, 해당 구성요소들을 한정하지 않는다. 예를 들어, 상기 표현들은 해당 구성요소들의 순서 및/또는 중요도 등을 한정하지 않는다. 상기 표현들은 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 수 있다. 예를 들어, 제1 사용자 기기와 제2 사용자 기기는 모두 사용자 기기이며, 서로 다른 사용자 기기를 나타낸다. 예를 들어, 본 개시의 다양한 실시예의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 새로운 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 새로운 다른 구성요소가 존재하지 않는 것으로 이해될 수 있어야 할 것이다.
본 개시의 실시 예에서 "모듈", "유닛", "부(part)" 등과 같은 용어는 적어도 하나의 기능이나 동작을 수행하는 구성요소를 지칭하기 위한 용어이며, 이러한 구성요소는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 "모듈", "유닛", "부(part)" 등은 각각이 개별적인 특정한 하드웨어로 구현될 필요가 있는 경우를 제외하고는, 적어도 하나의 모듈이나 칩으로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다.
본 개시의 다양한 실시예에서 사용한 용어는 단지 특정일 실시예를 설명하기 위해 사용된 것으로, 본 개시의 다양한 실시예를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 개시의 다양한 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.
일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 개시의 다양한 실시예에서 명백하게 정의되지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하에서, 첨부된 도면을 이용하여 본 발명의 다양한 실시 예들에 대하여 구체적으로 설명한다.
도 1은 본 발명의 일 실시예예 따른 전립선암 유전위험점수 산출 시스템을 설명하기 위한 시스템도이다.
도 1을 참조하면, 산출 시스템은 위험점수 산출장치(100, 이하 산출장치), 서버(200), 단말기(301) 및 외부 기관(302)을 포함할 수 있다.
산출장치(100)는 데스크 탑 컴퓨터일 수 있으나, 이에 한정하지 않으며 유전 정보를 통해 전립선암 발병에 대한 위험점수를 산출하기 위한 방법을 수행하기 위한 프로그램을 실행시킬 수 있는 모든 종류의 전자장치일 수 있다.
사용자 단말기(301)는 유무선 통신 환경에서 데이터를 송수신할 수 있는 통신 단말기를 의미한다. 여기서, 사용자 단말기(301)는 사용자의 퍼스널 컴퓨터 일 수도 있고, 사용자의 휴대용 단말기일 수도 있다. 사용자는 피험자일 수 있고, 피험자는 직접 유전 정보를 입력하여 서버(200)로 전송할 수 있다.
도 1에서는 사용자 단말기(301)는 휴대용 단말기가 스마트폰으로 도시되었지만 본 발명의 사상은 이에 제한되지 아니하며 상술한 바와 같이 통신망과 연결이 가능한 프로그램이 탑재되거나 통신 모듈과 연결된 모든 종류의 전자기기를 포함할 수 있다. 구체적으로 사용자 단말기(301)는 컴퓨터(예를 들면, 데스크톱, 랩톱, 태블릿 등), 미디어 컴퓨팅 플랫폼(예를 들면, 케이블, 위성 셋톱박스, 디지털 비디오 레코더), 핸드헬드 컴퓨팅 디바이스(예를 들면, PDA, 이메일 클라이언트 등), 핸드폰의 임의의 형태 또는 다른 종류의 컴퓨팅 또는 커뮤니케이션 플랫폼의 임의의 형태를 포함할 수 있으나, 본 발명이 이에 한정되는 것은 아니다.
도 1에는 사용자 단말기(301)이 각각 단수로 도시되어 있으나, 본 발명의 일 실시예에 따르면 복수개의 사용자 단말기들이 직접 산출장치(100) 및 서버(200)와 연결될 수 있다.
기관(302)은 복수의 피험자의 유전 정보를 획득한 병원 및 공공기관일 수 있다. 기관(302)은 서버(200)로 복수의 피험자의 유전 정보에 대한 데이터베이스를 전송할 수 있고, 서버(200)는 수신한 데이터베이스를 바탕으로 전립선암 유전 위험 점수 산출을 위한 가중치 모델을 결정할 수 있다.
산출장치(100)는 피험자의 유전 정보를 입력받고, 가중치 위험도 모델을 이용하여 피험자의 전립선 암 위험도 점수를 산출하는 장치일 수 있다. 본 발명의 일 실시예에 따르면 산출장치(100)는 피험자의 인종 정보를 획득하고, 인종 정보에 대응하는 가중치 위험도 모델을 결정하여 유전위험 점수를 산출할 수 있다. 이때 인종 정보는 사용자에 의해 산출장치(100)에 입력된 것일 수 있으나, 이에 한정하지 않으며, 사용자에 의해 사용자 단말기(301)에 입력된 것일 수 있다.
본 발명의 또 다른 실시예에 따르면, 산출장치(100)는 유전 정보에 포함된 염기서열의 특정 SNP(단일염기다형성)를 확인할 수 있다. 이때, 특정 SNP는 rs16901979, rs1512268, rs4430796 및 rs2735739를 포함하는 것일 수 있다.
본 발명의 또 다른 실시예에 따르면, 산출장치(100)는 피험자의 제1 유전 정보를 입력받고, 이에 대응하는 제1 가중치 위험도 모델을 이용하여 제1 유전 정보에 대한 제1 유전위험 점수를 산출할 수 있다.
산출장치(100)는 복수의 유전위험 점수 그룹 중 제1 유전위험 점수가 속하는 그룹을 판단하고 제1 유전위험 점수가 고위험 그룹으로 판단되면, 제2 가중치 위험도 모델을 이용해 제2 유전위험 점수를 산출할 수 있다. 반면, 제1 유전위험 점수가 저위험 그룹으로 판단되면, 제1 유전위험 점수를 제1 유전 정보에 대한 유전위험 점수로 결정할 수 있다.
이때, 복수의 유전위험 점수 그룹은 기설정된 GRS 분포에 따른 그룹일 수 있다. 예를 들면, 복수의 피험자에 대한 데이터베이스를 바탕으로 기산출된 GRS 점수를 기초로 고위험 그룹, 중위험 그룹, 저위험 그룹으로 분류된 것일 수 있으나 이에 한정하지 않는다.
제1 가중치 위험도 모델은 피험자의 인종 정보를 고려하여 결정된 가중치 위험도 모델일 수 있다. 제2 가중치 위험도 모델은 인종 정보 및 피험자의 생활 정보를 고려하여 결정된 가중치 모델일 수 있다. 다만, 피험자의 인종 정보 및/또는 생활 정보는 일 예에 불과하고, 피험자에 대한 다양한 정보를 이용하여 가중치 모델을 결정할 수 있다.
또한, 피험자에 대한 정보를 통한 가중치 위험도 모델의 결정은 일 실시예에 불과하고, 제1 가중치 위험도 모델 및 제2 가중치 위험도 모델을 결정하는 기준은 다양할 수 있다. 예를 들면, 제1 가중치 위험도 모델은 표준화된 가중치 위험도 모델로써, 5개의 SNP 마커를 이용한 것이고, 제2 가중치 위험도 모델은 4개의 SNP 마커를 이용하여 더 고성능의 모델일 수 있다.
상술한 실시예를 통해, 1차적으로 피험자에 대한 유전위험도를 진단하고, 필요에 따라 더욱 정밀한 유전위험 진단을 수행할 수 있다.
본 발명의 또 다른 실시예에 따르면, 산출장치(100)는 제1 유전 정보보다 후행하는 시점의 피험자의 제2 유전 정보를 입력받는 경우, 제2 유전 정보에 대한 유전위험 점수가 속하는 그룹이 제1 유전 정보에 대한 유전위험 점수에 비해 고위험 그룹으로 변경되는 경우, 피험자를 집중관리 대상자로 설정할 수 있다.
즉, 피험자의 전립선암에 대한 위험점수가 증가하는 경우, 피험자를 집중관리 대상자로 설정하고 가이드라인을 제시할 수 있다는 효과가 있다. 구체적으로 피험자가 집중관리 대상자로 설정되는 경우, 산출장치(100)는 피험자의 생활 습관, 식습관 등에 대한 가이드라인을 제공하고, 차기 전립선암 검사 일정에 대해 안내할 수 있다.
또한, 본 발명의 일 실시예에 따르면 산출장치(100)는 위험점수 증가 정도에 따라 집중관리 대상자 등급을 결정할 수 있다. 예를 들어, 위험점수의 등급이 4단계인 경우, 1단계만큼 고위험 그룹으로 변경된 경우, 하급 집중관리 대상자로 결정하고, 2단계 이상만큼 고위험 그룹으로 변경되는 피험자를 상급 집중관리 대상자로 결정할 수 있으나, 이는 일 예에 불과하며, 위험점수의 등급 및 집중관리 대상자의 등급은 다양할 수 있다.
한편, 상술한 예에 따른 산출장치(100)는 상급 집중관리 대상자에 결정된 피험자에 대하여 추가적인 가이딩을 제공할 수 있다. 예를 들어, 산출장치(100)는 상급 집중관리 대상자의 연락처 정보 등과 같은 개인정보를 이용하여 피험자에게 주기적인 검사 안내 문자 또는 검사 안내 메일을 전송할 수 있다.
한편, 가중치 위험도 모델은 서버(200)로부터 수신한 것일 수 있다. 즉, 서버(200)는 단말기(301) 및 외부 기관(302)으로부터 수신한 데이터베이스를 바탕으로 전립선암을 예측하기 위한 가중치 위험도 모델을 결정할 수 있고, 이를 산출장치(100)로 전송할 수 있다.
구체적으로 서버(200)는 전립선암 관련 유전변이 탐색할 수 있다. 구체적으로 서버(200)는 60,276개의 유전변이에 대해 Discovery set 에서 전립선암 환자(998명)-정상 대조군(2,641명) 비교할 수 있다. 또한, 서버(200)는 재현(Replication)을 위한 유전 변이 17개를 추출할 수 있다. 서버(200)는 데이터베이스 및 유전 변이를 기초로 가중치 위험도 모델을 결정할 수 있다.
본 발명의 일 실시예예 따르면, 서버(200)는 17개의 변이 중에서 9개의 대표 변이로 추출하여 새로운 독립적인 자료원(replication set: 전립선암 환자 (514명) + 정상 대조군 (548명))으로 가중유전위험점수를 계산할 수 있다. 이때, 서버(200)는 특정 유전 변이를 통해 전립선암과 관련된 유전위험점수를 산출할 수 있다. 이때, 대표 변이를 추출하는 과정에 있어서, 인종 별로 구분된 유전 변이가 고려될 수 있다.
서버(200)는 유전 변이의 발생 횟수에 가중치를 부여할 수 있으나, 이에 한정하지 않는다. 본 발명의 일 실시예에 따르면, 서버(200)는 유전 변이의 중요도(또는 질병에 기여하는 정도)에 따라 가중치를 부여할 수 있다. 즉, 서버(200)는 유전 변이와의 연관성 정도를 나타내는 교차비에 로그(logarithm)를 취한 값을 가중치로 사용할 수 있다.
본 발명의 일 실시예에 따르면, 서버(200)는 인공지능 모델을 이용하여 가중치 위험도 모델을 학습시킬 수 있다. 이때 인공지능 모델은 CNN, RNN, BNN 등을 포함하는 다양한 딥러닝 알고리즘일 수 있으나, 이에 한정하지 않는다.
또한, 상기 가중치 위험도 모델은 상기 유전 정보에 포함된 각각의 SNP에 대해 위험대립 유전자(risk allele)의 개수에 따라, 동형 비-위험성 대립유전자(homozygous of non-risk alleles)는 0, 이형 대립유전자(heterozygous of alleles)는 1, 동형 위험성 대립유전자(homozygous of the risk alleles)는 2의 세부 점수를 부여하고, 세부 점수에 대하여 SNP 각각에 대응하는 가중치를 부여하는 모델일 수 있으나, 이에 한정하지 않는다. 이에 대하여 추후 상세히 설명하기로 한다.
본 발명의 일 실시예에 따른 산출장치(100)는 계산기와 같은 형태로 구현될 수 있다. 즉, 산출장치(100)는 유전 변이와 관련된 유전 정보 값을 입력받고, 입력된 값들로부터 산출된 전립선암 위험도 및/또는 가이드라인 등을 디스플레이를 통해 출력할 수 있다.
본 발명의 일 실시예에 따른 산출장치(100)는 전립선암과 관련된 유전 변이 종류를 변경할 수 있다. 산출장치(100)는 사용자 정보, 예를 들면 나이, 성별, 인종 등에 대한 정보에 따라서 가중치 모델에 반영할 유전 변이 종류를 변경할 수 있다.
이때, 산출장치(100)는 서버(200)와 연동하여 서버(200)에서 설정된 다양한 가중치 모델 중 사용자 정보에 대응되는 가중치 모델을 결정할 수 있다. 예를 들면, 산출장치(100)는 입력된 피험자의 인종이 유럽인이라고 판단하면, 서버(200)로부터 유럽인에 대응되는 유전 변이에 가중치를 부여한 가중치 모델을 수신하고, 피험자의 전립선암 위험점수를 산출할 수 있다.
본 발명의 또 다른 실시예에 따른 산출장치(100)는 사용자 또는 피험자의 신체 정보, 생활 정보와 전립선암 위험 점수 사이의 관계를 추론하여 가중치 모델을 설정할 수 있다. 예를 들면, 산출장치(100)는 피험자가 흡연자인 경우, 해당 생활 정보에 대응되는 유전 변이에 가중치를 부여한 가중치 모델을 이용하여 전립선암의 위험점수를 계산할 수 있다. 이 경우에도 산출장치(100)는 서버(200)와 연동하여 다양한 가중치 모델을 사용할 수 있다.
도 2는 본 발명의 일 실시예에 따른 산출장치의 구성요소를 설명하기 위한 블록도이다.
도 2를 참조하면, 산출장치(100)는 통신부(110), 입력부(120), 메모리(130), 디스플레이(140) 및 프로세서(150)를 포함할 수 있다.
통신부(110)는 서버(200), 사용자 단말기(301) 및 기관(302)을 비롯한 외부기관 및 장치와 데이터를 송수신하기 위한 구성이다. 통신부(100)는 블루투스 통신부, BLE(Bluetooth Low Energy) 통신부, 근거리 무선 통신부(Near Field Communication unit), WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association) 통신부, WFD(Wi-Fi Direct) 통신부, UWB(ultra wideband) 통신부, Ant+ 통신부 등의 근거리 통신부, 이동통신망을 포함할 수 있다.
입력부(120)는 산출장치(100)에 다양한 정보를 입력하기 위한 사용자 인터페이스를 포함할 수 있다. 이때, 산출장치(100)에 입력되는 다양한 정보는 피험자의 유전 정보, 피험자의 나이, 성별, 인종 등에 대한 정보, 피험자의 생활 습관 정보 등을 포함할 수 있으나, 이에 한정되지 않는다.
메모리(130)는 프로세서(150)의 처리 또는 제어를 위한 프로그램 등 산출장치(100) 전반의 동작을 위한 다양한 데이터를 저장할 수 있다. 메모리(130)는 산출장치(100)에서 구동되는 다수의 응용 프로그램(application program 또는 애플리케이션(application)), 산출장치(100)의 동작을 위한 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 무선 통신을 통해 외부 서버로부터 다운로드 될 수 있다. 또한, 이러한 응용 프로그램 중 적어도 일부는, 산출장치(100)의 기본적인 기능을 위하여 출고 당시부터 산출장치(100) 상에 존재할 수 있다. 응용 프로그램은, 메모리(130)에 저장되고, 프로세서(150)에 의하여 산출장치(100)의 동작(또는 기능)을 수행하도록 구동될 수 있다.
디스플레이(140)는 산출장치(100)가 가중치 위험도 모델을 통해 산출한 피험자의 전립선암 위험도 점수를 디스플레이할 수 있다. 본 발명의 일 실시예에 따르면 디스플레이(140)는 입력부(120)를 통해 입력된 정보들로부터 산출된 전립선암 위험도 점수를 표시할 수 있고, 이를 통해 피험자의 생활 습관에 대한 가이드라인 등을 디스플레이를 통해 출력할 수 있다.
디스플레이(140)는 다양한 형태의 디스플레이 패널로 구현될 수 있다. 예로, 디스플레이 패널은 LCD(Liquid Crystal Display), OLED(Organic Light Emitting Diodes), AM-OLED(Active-Matrix Organic Light-Emitting Diode), LcoS(Liquid Crystal on Silicon) 또는 DLP(Digital Light Processing) 등과 같은 다양한 디스플레이 기술로 구현될 수 있다. 또한, 디스플레이(140)는 플렉서블 디스플레이(flexible display)의 형태로 디스플레이 장치(140)의 전면 영역 및, 측면 영역 및 후면 영역 중 적어도 하나에 결합될 수도 있다.
디스플레이(140)는 레이어 구조의 터치 스크린으로 구현될 수 있다. 터치 스크린은 디스플레이 기능뿐만 아니라 터치 입력 위치, 터치된 면적뿐만 아니라 터치 입력 압력까지도 검출하는 기능을 가질 수 있고, 또한 실질적인 터치(real-touch)뿐만 아니라 근접 터치(proximity touch)도 검출하는 기능을 가질 수 있다.
프로세서(150)는 산출장치(100)를 전반적으로 제어하기 위한 구성이다. 구체적으로, 프로세서(150)는 산출장치(100)의 메모리(130)에 저장된 각종 프로그램을 이용하여 산출장치(100)의 전반적인 동작을 제어한다. 예를 들어, 프로세서(150)는 CPU, 램(RAM), 롬(ROM), 시스템 버스를 포함할 수 있다. 여기서, 롬은 시스템 부팅을 위한 명령어 세트가 저장되는 구성이고, CPU는 롬에 저장된 명령어에 따라 산출장치(100)의 메모리에 저장된 운영체제를 램에 복사하고, O/S를 실행시켜 시스템을 부팅시킨다. 부팅이 완료되면, CPU는 메모리(130)에 저장된 각종 애플리케이션을 램에 복사하고, 실행시켜 각종 동작을 수행할 수 있다. 이상에서는 프로세서(150)가 하나의 CPU만을 포함하는 것으로 설명하였지만, 구현 시에는 복수의 CPU(또는 DSP, SoC 등)으로 구현될 수 있다.
본 발명의 일 실시 예에 따라, 프로세서(150)는 디지털 신호를 처리하는 디지털 시그널 프로세서(digital signal processor(DSP), 마이크로 프로세서(microprocessor), TCON(Time controller)으로 구현될 수 있다. 다만, 이에 한정되는 것은 아니며, 중앙처리장치(central processing unit(CPU)), MCU(Micro Controller Unit), MPU(micro processing unit), 컨트롤러(controller), 어플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)), ARM 프로세서 중 하나 또는 그 이상을 포함하거나, 해당 용어로 정의될 수 있다. 또한, 프로세서(150)는 프로세싱 알고리즘이 내장된 SoC(System on Chip), LSI(large scale integration)로 구현될 수도 있고, FPGA(Field Programmable gate array) 형태로 구현될 수도 있다.
본 발명의 일 실시예에 따르면 프로세서(150)는 유전위험점수 산출부(151) 및 위험도 등급 결정부(152)를 포함할 수 있다.
유전위험점수 산출부(151)는 입력된 피험자에 대한 정보를 통해 피험자의 유전위험 점수를 산출하기 위한 구성이며, 위험도 등급 결정부(152)는 피험자의 가중치 위험도 모델을 통한 위험점수의 등급을 결정하기 위한 구성이다.
유전위험점수 산출부(151) 및 위험도 등급 결정부(152) 각각은 컴퓨팅 장치상에서 프로그램을 실행하기 위해 필요한 프로세서(150) 등에 의해 각각 구현될 수 있다. 이처럼 유전위험점수 산출부(151) 및 위험도 등급 결정부(152)는 물리적으로 독립된 각각의 구성에 의해 구현될 수도 있고, 하나의 프로세서 내에서 기능적으로 구분되는 형태로 구현될 수도 있다
한편, 도 1 및 도 2에서는 서버(200)는 산출장치(100)와 별도의 구성으로 구현된 것을 도시하였으나, 본 발명의 일 실시예에 따르면 서버(200)는 산출장치(100)와 하나의 구성으로 구현될 수 있다.
예를 들어, 서버(200)에서 실행되는 일련의 프로세스는 산출장치(100)에서 실행될 수 있다. 즉, 산출장치(100)는 병원(301), 사용자 단말기(302) 등으로부터 직접 데이터를 수신하고, 데이터를 바탕으로 피험자 정보에 대응하도록 가중치를 상이하게 적용하는 가중치 위험도 모델을 결정할 수 있다.
이하에서는 설명의 편의를 위해, 서버(200)에서 수행되는 모든 프로세스가 산출장치(100)에서 수행되는 실시예를 전제로 설명하기로 한다.
도 3은 본 발명의 일 실시예에 따른 유전위험 점수를 산출하는 방법을 설명하기 위한 흐름도이다.
산출장치(100)는 피험자에 대한 유전 정보를 입력 받을 수 있다(S300). 이때, 유전 정보는 전립선암과 관련된 단일염기다형성(SNP) 및 SNP를 포함하는 연속적인 염기서열을 포함할 수 있다. 또한, 유전 정보는 피험자에 대한 인종 정보, 생활 습관 정보 등 다양한 정보를 포함할 수 있다.
산출장치(100)는 피험자의 유전 정보를 바탕으로 제1 가중치 위험도 모델을 결정할 수 있다. 이때, 산출장치(100)는 인종 간의 유전자 비율 차이를 비교하여 그에 대응하는 제1 가중치 위험도 모델을 결정할 수 있다. 예를 들어, 피험자의 인종 정보가 유럽인인 경우, 산출장치(100)는 유럽인 전립선암 위험도와 관련성이 높은 특정 유전 변이에 가중치를 부여한 제1 가중치 위험도 모델을 결정할 수 있다. 인종 간의 유전자 비율 비교는 2010년 사이언스지에 공지된 논문 'A Draft Sequence of the Neandertal Genome'의 방법을 이용할 수 있으나, 이에 한정하지 않는다.
산출장치(100)는 제1 가중치 위험도 모델을 통해 제1 유전위험 점수를 산출할 수 있다(S310). 한편, 산출장치(100)는 산출된 제1 유전위험 점수가 고위험군 그룹인지 여부를 판단할 수 있다(S320). 판단 결과, 제1 유전위험 점수가 고위험군이 아닌 경우(S320-N), 해당 점수를 최종 유전위험 점수로 결정할 수 있다.
다만, 판단 결과 제1 유전위험 점수가 고위험군인 경우(S320-Y), 산출장치(100)는 제2 가중치 위험도 모델을 결정하여 제2 유전위험 점수를 산출할 수 있다(S340). 구체적으로, 산출장치(100)는 피험자에 대한 추가적인 정보를 통해 제2 가중치 위험도 모델을 결정할 수 있다. 예를 들어, 피험자가 유럽인에 고령자라는 정보를 통해, 산출장치(100)는 유럽인뿐만 아니라 고령자의 전립선 암 위험도와 관련성이 높은 특정 유전 변이에 가중치를 부여한 제2 가중치 위험도 모델을 결정할 수 있다.
이후, 산출장치(100)는 제2 가중치 위험도 모델을 통한 제2 유전위험 점수를 최종유전위험 점수로 결정할 수 있다(S330).
본 발명의 일 실시예에 따르면, 산출장치(100)는 산출된 유전위험 점수를 ROC(Receiver Operating Characteristics)를 통해 검증하고, 상기 검증 결과, 기설정된 AUC(Area under the curve) 값을 초과하는 유전위험 점수를 상기 유전위험 점수로 결정할 수 있다.
도 4는 발견(discovery) GWAS(Genome Wide Association Study) 단계에서의 맨하탄 플롯(Manhattan plots)의 총괄자료를 도시한 도면이다.
GWAS는 일반적으로 Case (관심 형질을 가진 집단, 환자군) 와 Control (형질을 갖지 않는 집단, 정상군)의 두 집단의 유전 정보를 얻은 후에 서로 비교하여, case에서 더 많은 빈도를 갖는, 즉 연관성을 가진 유전자를 찾기 위한 단계이다. 즉 GWAS는 인과 관계를 찾는 것이 아니라 우연히 연관되어 나타나는 유전자들의 후보를 찾는 과정이다. 따라서 일반적으로 연구는 GWAS를 통한 후보 유전자 탐색, 그리고 이후에 더 많은 환자군에서 확인 (replication cohort) 또는 실험에서 생물학적 입증의 결과를 거쳐 최종적으로 유전자-형질의 관계를 밝히는 과정으로 진행된다.
연관불균형(LD, Linkage Disequilibrium)은 유전형의 재배열 과정에서 서로 거리가 가까운 유전자끼리 유전형이 섞이지 않고 모자이크 패턴으로 함께 이동하게 되며, LD block을 형성하는 것이다. 같은 LD block에 포함된 위치에 대해서는 연관성 분석을 하게 되면, 비슷한 연관성의 강도 및 통계적 유의수준 (p값)을 보인다. 이는 도 4와 같이 GWAS에 흔히 이용되는 맨하탄 플롯(Manhattan plot)에서 시그널이 주위에서 모두 높게 나오는 이유가 된다.
도 5는 본 발명의 일 실시예에 따른 유전위험 점수 계산에 포함되는 후보 유전변이 목록을 도시한 도면이다.
산출장치(100)는 전립선암과 관련된 주요 SNP 유전 변이 9개를 추출할 수 있다. 도 5를 참조하면, 주요 유전변이 SNP는 rs1456315, rs7837688, rs1512268, rs7501939, rs2735839, rs339331, rs2016588, rs11147922, rs57006764인 것을 확인할 수 있다.
본 발명의 일 실시예에 따른 가중치 위험도 모델은 각각의 SNP에 전립선암과 관련된 교차비(OR)를 기준으로 가중치를 부여할 수 있다. 예를 들면, SNP 중 rs1456315의 전립선암에 대한 교차비는 1.797이므로, rs1456315에 대하여 가중치(weight)로 log(OR)의 결과인 0.586을 부여할 수 있다.
상술한 가중치를 바탕으로 본 발명의 일 실시예에 따른 9개의 유전 변이를 고려한GRS(genetic risk score)는 아래의 식과 같을 수 있다.
wGRS(weighted genetic risk score) =
Figure pat00001
이때, X1 내지 X9는 각각의 SNP(rs1456315, rs7837688, rs1512268, rs7501939, rs2735839, rs339331, rs2016588, rs11147922, rs57006764)에 대한 위험 대립유전자의 개수에 대응한다. 구체적으로, 산출장치(100)는 유전 정보에 포함된 각각의 SNP에 대해 위험대립 유전자(risk allele)의 개수에 따라, 동형 비-위험성 대립유전자(homozygous of non-risk alleles)는 Xn = 0, 이형 대립유전자(heterozygous of alleles)는 Xn = 1, 동형 위험성 대립유전자(homozygous of the risk alleles)는 Xn = 2의 세부 점수를 부여할 수 있다. 즉, 가중치 위험도 모델은 각각의 대립유전자 수에 비례하는 가중치를 부여하도록 설정될 수 있다.
다만, 이는 일 실시예에 불과하고, 본 발명의 산출장치(100)는 다양한 유전 변이 개수로 GRS 식을 결정할 수 있다. 예를 들어, 상술한 가중치 모델은 9개의 유전 변이 모두에 대한 GRS인 반면, 산출장치(100)는 피험자의 정보에 따라 관련성이 높은 최적의 SNP의 조합에 따라 GRS 식을 결정할 수 있다.
예를 들어, 산출장치(100)는 피험자의 인종 정보에 대응하는 SNP 마커 세트만을 이용하여 가중치를 부여할 수 있고, 피험자의 생활 습관 정보에 대응하는 SNP 마커 세트만을 이용하여 가중치를 부여할 수 있다.
상술한 최적의 SNP 마커 세트는 데이터베이스를 이용하여 인공지능 모델을 통해 결정될 수 있으나, 이는 일 예에 불과하고 다양한 방법을 통해 결정된 것일 수 있다.
도 6a 및 도 6b는 본 발명의 일 실시예에 따른 유전변이의 개수에 따른 예측력을 비교하기 위한 ROC(Receiver Operating Characteristic) 곡선을 도시한 도면이다.
ROC (Receiver Operating Characteristics) 곡선은 예측 성능을 평가하기 위하여 시각화한 도표이다. 예측 성능은 곡선 아래의 면적 (Area under the curve, AUC) 으로 평가한다. ROC 는 각 평가 기준 (threshold) 에 따른 특이도 (specificity) 와 민감도 (sensitivity) 를 각각 X, Y 좌표로 나타내어 선으로 연결하여 나타낸다.
이때, 특이도는 질병이 없는 환자를 질병이 없다고 예측할 비율, 민감도는 질병이 있을 때 있다고 예측할 확률로 정의되며, 두 지표는 서로 트레이드 오프(trade-off) 관계를 보인다. 곡선의 X, Y 좌표는 (0,0) 에서 (1,1) 까지의 값을 가지며, 예측력이 좋을수록 AUC 값은 1에 가까운 값을 가진다.
본 발명의 일 실시예에 따르면, 산출장치(100)는 ROC를 유전위험점수의 기준 (threshold) 에 따라 민감도와 특이도가 어떻게 달라지는지 시각화할 수 있고, 곡선의 AUC를 산출하여 모형의 성능을 평가할 수 있다. 또한, 본 발명의 산출장치(100)는 통계적 유의 수준에 따라 포함된 유전 변이의 개수에 따라 전립선암 환자군과 정상군을 얼마나 잘 구분하는지를 각각 나타내어 비교할 수 있다.
도 6a를 참조하면 가중치 위험도 모델은 유전변이의 개수가 4개와 6개일 때 AUC가 가장 큰 값 (0.680) 을 가지면서 가장 높은 예측 성능을 보인다. 또한, 도 6b를 참조하면, 가중치 위험도 모델은 포함된 유전변이의 개수가 5개와 9개일 때 0.679 로 두번째로 높은 예측 성능을 보인다.
도 7a 내지 7g는 본 발명의 일 실시예에 따른 가중치를 부여한 모델(weighted model)의 유전변이 개수에 따른 GRS(Generic Risk Score) 분포를 설명하기 위한 도면이다.
도 7a는 본 발명의 일 실시예에 따른 p 값(통계적 유의성)에 따른 상위 SNP의 개수 별 GRS 및 AUC를 도시한 표이다.
도 7b 내지 7g는 각각 SNP 마커가 4개인 경우부터 9개인 경우까지 순차적으로 case(관심 형질을 가진 집단, 환자군)과 control(관심 형질을 가지지 않은 집단, 정상군)에 대한 GRS 분포를 도시한 그래프이다.
도 7a 내지 7g를 참조하면, 마커가 4개 및 6개인 경우 큰 GRS 값을 가지며, 높은 정확도를 가진다.
도 8a 내지 8g는 본 발명의 일 실시예에 따른 가중치를 부여하지 않은 모델(non-weighted model)의 유전변이 개수에 따른 GRS(Generic Risk Score) 분포를 설명하기 위한 도면이다.
도 8a는 본 발명의 일 실시예에 따른 p 값(통계적 유의성)에 따른 상위 SNP의 개수 별 GRS 및 AUC를 도시한 표이다.
도 8b 내지 8g는 각각 SNP 마커가 4개인 경우부터 9개인 경우까지 순차적으로 case(관심 형질을 가진 집단, 환자군)과 control(관심 형질을 가지지 않은 집단, 정상군)에 대한 GRS 분포를 도시한 그래프이다.
도 7a 내지 8g를 참조하면, 가중치를 부여한 위험도 모델의 경우에서 모든 마커 개수 유형에서 높은 GRS 값을 가지며, 높은 정확도를 가진다는 것을 확인할 수 있다.
도 9는 본 발명의 일 실시예에 따른 GRS 그룹별 전립선암에 대한 교차비를 설명하기 위한 도면이다.
교차비는 입력변수(독립변수 또는 설명변수)가 종속변수에 대한 인과관계를 파악하기 위한 것으로, 입력변수와 종속변수 사이에서 계산된 값이 1을 넘으면 양(positive)의 연관성을 나타내고, 계산된 값이 1보다 낮으면 음(negative)의 연관성을 나타내는 지표이다.
즉, 특정 대립유전자를 가지고 있는 사람들에서의 질병 여부에 대한 비(odds) 와 그 대립유전자가 없는 사람들이 가지는 질병에 대한 여부의 비 (ratio) 및 특정 대립유전자를 가진 그룹과 그렇지 않은 그룹의 질병의 위험도를 비교하기 위함이다.
Prostate cancer group (Cases) Healthy controls
Risk allele A B
Protective allele C D
Odds Ratio =
Figure pat00002
도 9의 x축은 본 발명의 일 실시예에 따른 도 7b 내지 7g의 GRS 분포에서 GRS를 상위로부터 도수분포로 4분위 수(Quartile)로 그룹화하여 배열한 것이고, y축은 각각의 GRS 그룹 별 전립선암에 대한 교차비에 대한 것이다.
도 9를 참조하면, Q4(4분위 수의 가장 상위 그룹)은 GRS 범위가 0.26~0.45이며, 교차비(OR, Odds Ratio)가 6으로 전립선암에 대하여 큰 연관성을 가진다. 이외의 그룹으로 Q3는 GRS 범위 0.19~0.26 및 교차비 3.1, Q2는 GRS 범위 0.12~0.19 및 교차비 1.72, Q1은 GRS 범위 0-0.12를 보이며, 다른 그룹과의 연관성 비교를 위한 참조 그룹으로써 교차비 1을 보인다.
도 10은 본 발명의 일 실시예에 따른 GRS 그룹 중·고위험군 그룹에서의 교차비를 설명하기 위한 도면이다. 도 10을 참조하면, Q4 그룹 안에서도 GRS cut-off가 0.35인 top 2.5% 인 경우의 교차비가 4.65로 가장 큰 것으로 나타난다.
도 11은 본 발명의 일 실시예에 따른 상이한 인구집단의 가중위험점수 비교를 위해 포함되는 유전변이를 설명하기 위한 도면이다.
본 분석에서 포함된 SNP들과 가장 많은 수의 SNP (N=4) 가 겹치는 Xu, Jianfeng, et al. "Genome-wide association study in Chinese men identifies two new prostate cancer risk loci at 9q31. 2 and 19q13. 4." Nature genetics 44.11 (2012): 1231. 문헌의 결과 (Supplementary Table 2) 중 유럽인종의 OR 값을 참조한 것이다.
도 11을 참조하면, 특히 대립유전자(risk allele) A의 SNP rs4430796의 경우, 한국인(KOR)에 GRS는 0.292고 유럽인(EUR)에 대한 GRS는 0.086으로 크게 차이남을 알 수 있다.
예를 들어 산출장치(100)는 피험자의 인종 정보가 한국인으로 판단한 경우, rs16901979, rs1512268, rs4430796 및 rs2735839과 같은 SNP를 가중치 모델에 포함하여 위험도를 계산할 수 있다.
도 12a 및 12b는 본 발명의 일 실시예에 따른 가중치 위험도 모델을 유럽인 데이터 및 한국인 데이터에 적용하였을 때의 GRS 분포를 도시한 도면이다.
도 12a는 유럽인 데이터에서 도출된 가중치를 적용하였을 때의 GRS 분포를 나타내고, 도 12b는 한국인 데이터에서 도출된 가중치를 적용하였을 때의 GRS 분포를 나타낸다.
도 12a를 참조하면, rs1512268, rs4430796 및 rs2735839과 같은 SNP를 포함한 가중치 모델에 유럽인 데이터가 적용된 결과 control과 case 모두 낮은 GRS를 보인다. 반면, 한국인 데이터가 적용되면 도 12b에서와 같이 상대적으로 높은 GRS 분포를 보인다.
도 13a 및 13b는 본 발명의 일 실시예에 따른 가중치 위험도 모델을 유럽인 데이터 및 한국인 데이터에 적용하였을 때의 ROC 곡선을 도시한 도면이다.
구체적으로 도 13a는 유럽인 데이터에서 도출된 가중치를 적용하였을 때의 ROC를 나타내고, 도 13b는 한국인 데이터에서 도출된 가중치를 적용하였을 때의 ROC를 나타낸다.
도 12a 및 12b와 마찬가지로, 한국인 데이터의 경우 AUC가 0.604로 유럽인 데이터의 AUC 0.591에 비해 더 높은 성능을 보인다. 즉, 인종 별로 상이한 가중치 모델을 사용하여야 할 필요성이 있음을 알 수 있다.
이에, 본 발명의 산출장치(100)는 인종 별 가중치 위험도 모델을 상이하게 변경함으로써, 높은 정확도의 위험점수를 산출할 수 있다.
도 14a 및 14b는 본 발명의 일 실시예에 따른 유전위험 점수 그룹을 설명하기 위한 도면이다.
도 14a는 x축은 GRS 분포에서 GRS를 상위로부터 도수분포로 5분위 수(Quintile)로 그룹화하여 배열한 것이고, y축은 case(환자군) 및 control(정상군)에 대한 수를 나타낸다.
도 14b는 x축은 GRS 분포에서 GRS를 상위로부터 도수분포로 4분위 수(Quartile)로 그룹화하여 배열한 것이고, y축은 case(환자군) 및 control(정상군)에 대한 수를 나타낸다.
즉, 본 발명의 산출장치(100)는 실시예에 따라서 GRS를 기준으로 4분위 또는 5분위 등 다양하게 그룹화할 수 있다. 산출장치(100)는 가중치 위험도 모델을 통해 피험자에 대한 유전위험 점수를 산출하면 해당 점수가 어느 그룹에 속하는지 판단할 수 있다.
본 발명의 일 실시예에 따르면, 산출장치(100)는 제1 유전 정보보다 후행하는 시점의 피험자의 제2 유전 정보를 입력받을 수 있다. 이 경우 제2 유전 정보에 대한 유전위험 점수가 속하는 그룹이 제1 유전 정보에 대한 유전위험 점수에 비해 고위험 그룹으로 변경되는 경우, 산출장치(100)는 해당 피험자를 집중관리 대상자로 설정할 수 있다. 산출장치(100)는 집중관리 대상자로 설정된 피험자에게 생활 습관 개선, 주기적인 전립선암 진단 제안 등 다양한 가이드라인을 제시할 수 있다.
본 발명의 또 다른 실시예에 따르면, 제2 유전 정보보다 후행하는 제3 유전 정보에 대한 유전위험 점수가 저위험 그룹으로 변경되는 경우, 산출장치(100)는 해당 피험자를 집중관리 대상자에서 해제할 수 있다.
한편, 상술한 본 발명의 다양한 실시 예들에 따른 방법들은, 기존 전자 장치에 설치 가능한 어플리케이션 형태로 구현될 수 있다.
또한, 상술한 본 발명의 다양한 실시 예들에 따른 방법들은, 기존 전자 장치에 대한 소프트웨어 업그레이드, 또는 하드웨어 업그레이드만으로도 구현될 수 있다.
또한, 상술한 본 발명의 다양한 실시예들은 전자 장치에 구비된 임베디드 서버, 또는 전자장치의 외부 서버를 통해 수행되는 것도 가능하다.
한편, 본 발명의 일 실시예에 따르면, 이상에서 설명된 다양한 실시예들은 소프트웨어(software), 하드웨어(hardware) 또는 이들의 조합을 이용하여 컴퓨터(computer) 또는 이와 유사한 장치로 읽을 수 있는 기록매체(computer readable recording medium)에 저장된 명령어를 포함하는 소프트웨어로 구현될 수 있다. 일부 경우에 있어 본 명세서에서 설명되는 실시예들이 프로세서 자체로 구현될 수 있다. 소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시 예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 동작을 수행할 수 있다.
한편, 컴퓨터(computer) 또는 이와 유사한 장치는, 저장 매체로부터 저장된 명령어를 호출하고, 호출된 명령어에 따라 동작할 수 있는 장치로서, 개시된 실시 예들에 따른 장치를 포함할 수 있다. 상기 명령이 프로세서에 의해 실행될 경우, 프로세서가 직접, 또는 상기 프로세서의 제어 하에 다른 구성요소들을 이용하여 상기 명령에 해당하는 기능을 수행할 수 있다. 명령은 컴파일러 또는 인터프리터에 의해 생성 또는 실행되는 코드를 포함할 수 있다.
기기로 읽을 수 있는 기록매체는, 비일시적 기록매체(non-transitory computer readable recording medium)의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장매체가 신호(signal)를 포함하지 않으며 실재(tangible)한다는 것을 의미할 뿐 데이터가 저장매체에 반영구적 또는 임시적으로 저장 됨을 구분하지 않는다. 이때 비일시적 컴퓨터 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 비일시적 컴퓨터 판독 가능 매체의 구체적인 예로는, CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등이 있을 수 있다.
이와 같이 본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 당해 기술분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 다른 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 청구범위의 기술적 사상에 의하여 정해져야 할 것이다.
100: 위험점수 산출장치
110: 통신부
120: 입력부
130: 메모리
140: 디스플레이
150: 프로세서
151: 유전위험점수 산출부
152: 위험도 등급 결정부
200: 서버
301: 사용자 단말기
302: 기관

Claims (1)

  1. 전립선암 위험도 산출방법에 있어서,
    피험자의 유전 정보를 입력받는 단계;
    가중치 위험도 모델을 이용하여 상기 유전 정보에 대한 유전위험 점수를 산출하는 단계;
    상기 유전위험 점수가 속하는 위험 그룹을 식별하는 단계; 및
    상기 유전 정보에 대한 유전위험 점수가 속하는 위험 그룹이 고위험 그룹인 경우, 상기 피험자를 집중관리 대상자로 설정하는 단계;를 포함하는 위험도 산출방법.
KR1020190126465A 2019-02-28 2019-10-11 각 유전 변이 정보에 개별적인 가중치를 부여한 전립선암 유전위험점수 산출장치, 산출방법 및 이의 기록매체 KR102371655B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190126465A KR102371655B1 (ko) 2019-02-28 2019-10-11 각 유전 변이 정보에 개별적인 가중치를 부여한 전립선암 유전위험점수 산출장치, 산출방법 및 이의 기록매체

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190024388A KR102068667B1 (ko) 2019-02-28 2019-02-28 전립선암 유전위험점수 산출장치, 산출방법 및 이의 기록매체
KR1020190126465A KR102371655B1 (ko) 2019-02-28 2019-10-11 각 유전 변이 정보에 개별적인 가중치를 부여한 전립선암 유전위험점수 산출장치, 산출방법 및 이의 기록매체

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020190024388A Division KR102068667B1 (ko) 2019-02-28 2019-02-28 전립선암 유전위험점수 산출장치, 산출방법 및 이의 기록매체

Publications (2)

Publication Number Publication Date
KR20200105374A true KR20200105374A (ko) 2020-09-07
KR102371655B1 KR102371655B1 (ko) 2022-03-08

Family

ID=80812175

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190126465A KR102371655B1 (ko) 2019-02-28 2019-10-11 각 유전 변이 정보에 개별적인 가중치를 부여한 전립선암 유전위험점수 산출장치, 산출방법 및 이의 기록매체

Country Status (1)

Country Link
KR (1) KR102371655B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240018127A (ko) 2022-08-02 2024-02-13 문태곤 토양 측정 결과 해설 기능을 갖는 시스템

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010520745A (ja) * 2007-02-07 2010-06-17 デコード・ジェネティクス・イーエイチエフ 前立腺癌のリスクに寄与する遺伝子変異体
KR20150110477A (ko) * 2012-11-20 2015-10-02 파디아 에이비 공격적인 전립선 암의 존재 또는 부존재를 나타내는 방법
KR20170113239A (ko) * 2016-03-24 2017-10-12 서울대학교산학협력단 전립선암과 관련된 단일염기다형성 및 이를 이용한 유전 위험도 점수의 개발
KR20170134203A (ko) * 2016-05-27 2017-12-06 (주) 메디젠휴먼케어 Snp를 이용한 질병 관련 유전체 분석 시스템 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010520745A (ja) * 2007-02-07 2010-06-17 デコード・ジェネティクス・イーエイチエフ 前立腺癌のリスクに寄与する遺伝子変異体
KR20150110477A (ko) * 2012-11-20 2015-10-02 파디아 에이비 공격적인 전립선 암의 존재 또는 부존재를 나타내는 방법
KR20170113239A (ko) * 2016-03-24 2017-10-12 서울대학교산학협력단 전립선암과 관련된 단일염기다형성 및 이를 이용한 유전 위험도 점수의 개발
KR20170134203A (ko) * 2016-05-27 2017-12-06 (주) 메디젠휴먼케어 Snp를 이용한 질병 관련 유전체 분석 시스템 및 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240018127A (ko) 2022-08-02 2024-02-13 문태곤 토양 측정 결과 해설 기능을 갖는 시스템

Also Published As

Publication number Publication date
KR102371655B1 (ko) 2022-03-08

Similar Documents

Publication Publication Date Title
Capriotti et al. Improving the prediction of disease-related variants using protein three-dimensional structure
Wu et al. Development and validation of a 32-gene prognostic index for prostate cancer progression
CN110993104B (zh) 肿瘤患者生存期预测系统
Schmid et al. A comparison of estimators to evaluate the discriminatory power of time‐to‐event models
Van Belle et al. A mathematical model for interpretable clinical decision support with applications in gynecology
So et al. A unifying framework for evaluating the predictive power of genetic variants based on the level of heritability explained
El-Solh et al. Comparison of in-hospital mortality risk prediction models from COVID-19
US20200251193A1 (en) System and method for integrating genotypic information and phenotypic measurements for precision health assessments
Huang et al. Identifying optimal biomarker combinations for treatment selection via a robust kernel method
Schmid et al. On the validity of time-dependent AUC estimators
Zhang et al. External validation of the prestroke independence, sex, age, national institutes of health stroke scale score for predicting pneumonia after stroke using data from the china national stroke registry
CN112735592A (zh) 肺癌预后模型的构建方法及应用方法、电子设备
US11126695B2 (en) Polymer design device, polymer design method, and non-transitory recording medium
KR102371655B1 (ko) 각 유전 변이 정보에 개별적인 가중치를 부여한 전립선암 유전위험점수 산출장치, 산출방법 및 이의 기록매체
Phan et al. omniBiomarker: a web-based application for knowledge-driven biomarker identification
Larcher et al. Prediction of competing mortality for decision-making between surgery or observation in elderly patients with T1 kidney cancer
KR102068667B1 (ko) 전립선암 유전위험점수 산출장치, 산출방법 및 이의 기록매체
KR102371654B1 (ko) 유전 변이의 개수에 따른 예측력을 고려한 전립선암 유전위험점수 산출장치, 산출방법 및 이의 기록매체
KR102068666B1 (ko) 인종 별 전립선암 유전위험점수 산출장치, 산출방법 및 이의 기록매체
KR20210046220A (ko) 전립선암 유전자 바이오마커의 검출을 위한 시약 및 키트
KR20210046221A (ko) 혈중 전립선 특이 항원치와 유전자 마커를 이용한 전립선암 선별 방법 및 장치
KR102102848B1 (ko) 전립선암 위험점수 산출기, 상기 산출기의 동작 방법
KR20220097276A (ko) 전립선암 유전 위험점수 산출장치, 산출방법 및 이의 기록매체
Syed et al. Toolkit to compute time-based Elixhauser comorbidity indices and extension to common data models
Esteban et al. A step-by-step algorithm for combining diagnostic tests

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant