KR20220097276A - Prostate Cancer Genetic Risk Score Calculating Device, Calculating Method and Recording Medium thereof - Google Patents

Prostate Cancer Genetic Risk Score Calculating Device, Calculating Method and Recording Medium thereof Download PDF

Info

Publication number
KR20220097276A
KR20220097276A KR1020210189135A KR20210189135A KR20220097276A KR 20220097276 A KR20220097276 A KR 20220097276A KR 1020210189135 A KR1020210189135 A KR 1020210189135A KR 20210189135 A KR20210189135 A KR 20210189135A KR 20220097276 A KR20220097276 A KR 20220097276A
Authority
KR
South Korea
Prior art keywords
weight
risk score
prostate cancer
genetic
risk
Prior art date
Application number
KR1020210189135A
Other languages
Korean (ko)
Inventor
김은애
우은진
변석수
Original Assignee
주식회사 프로카젠
서울대학교병원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 프로카젠, 서울대학교병원 filed Critical 주식회사 프로카젠
Publication of KR20220097276A publication Critical patent/KR20220097276A/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Evolutionary Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Organic Chemistry (AREA)
  • Epidemiology (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Databases & Information Systems (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Artificial Intelligence (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Bioethics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Primary Health Care (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)

Abstract

One embodiment of the present invention relates to a prostate cancer risk score calculation method of a prostate cancer risk score calculation device including an input unit and a processor. The risk score calculation method comprises the steps of: receiving genetic information of a test subject by the input unit; determining, by the processor, a single nucleotide polymorphism (SNP) marker set using SNPs included in the genetic information; determining, by the processor, a weight for each SNP marker included in the SNP marker set, and determining a weight risk model on the basis of the weight; and calculating, by the processor, a prostate cancer genetic risk score by using the weight risk model. The weight of each SNP marker is a value taking a natural logarithm (ln) of the relative risk of prostate cancer for each SNP marker. A precise risk score can be calculated.

Description

전립선암 유전 위험점수 산출장치, 산출방법 및 이의 기록매체{Prostate Cancer Genetic Risk Score Calculating Device, Calculating Method and Recording Medium thereof}Prostate Cancer Genetic Risk Score Calculating Device, Calculating Method and Recording Medium thereof

본 발명은 유전 정보를 이용하여 전립선암의 위험점수를 산출하기 위한 산출장치, 산출방법 및 이의 기록매체에 관한 것이다.The present invention relates to a calculation device, calculation method, and a recording medium thereof for calculating a risk score for prostate cancer using genetic information.

전립선암은 한국에서 남성 암 유병율 3위 및 발병율 4위인 암종으로 남성 사망의 주된 원인이 되고 있다. 이에 종래에는 전립선암을 예측하기 위해 유전 정보를 이용하는 등의 연구가 진행되어 왔다.Prostate cancer is the third most common and fourth most common cancer in men in Korea, and is the leading cause of death in men. Accordingly, studies such as using genetic information to predict prostate cancer have been conducted in the prior art.

한편, 전립선암의 발병율과 그로 인한 사망율은 전세계적으로 큰 차이를 나타내는데, 미국과 유럽 남성의 발병율이 높고, 특히 아프리카계 미국인의 사망율이 가장 높게 나타나는 반면에, 아시아인의 발병율과 사망율은 상대적으로 낮은 편이다. 이러한 인종적 차이는 전립선암 발병이 환경적 차이뿐만 아니라 유전적 이질성(heterogeneity)에 기인할 가능성을 시사한다. 따라서 유전적 이질성에 의한 인종 간의 차이를 반영하여 전립선암 발병의 위험성을 판단할 필요성이 대두된다. On the other hand, the incidence and mortality rates of prostate cancer vary widely worldwide. Men in the United States and Europe have the highest incidence rates, and African Americans have the highest mortality rates, whereas the incidence and mortality rates in Asians are relatively high. It is low. These racial differences suggest that the incidence of prostate cancer is likely due to genetic heterogeneity as well as environmental differences. Therefore, there is a need to determine the risk of prostate cancer by reflecting racial differences due to genetic heterogeneity.

또한 종래의 전립선암 진단은 진단 당시의 암 위험 여부를 안내해주는 것에 그치기 때문에, 피험자 별로 효율적인 관리 및 모니터링이 불가능하다.In addition, since the conventional diagnosis of prostate cancer only guides the risk of cancer at the time of diagnosis, it is impossible to efficiently manage and monitor each subject.

본 발명은 전술한 문제 및 그 외의 문제를 해결하는 것을 목적으로 한다.An object of the present invention is to solve the above and other problems.

본 발명은 전립선암 발생에 유의미한 영향을 주는 유전 변이들에 대해 상이한 가중치를 부여하여 유전 위험점수를 산출하는 장치, 방법 및 기록매체를 제공하는 것을 목적으로 한다.An object of the present invention is to provide an apparatus, method, and recording medium for calculating a genetic risk score by assigning different weights to genetic mutations that have a significant effect on the occurrence of prostate cancer.

또한 본 발명은 유전 정보를 이용한 인종 별 전립선암을 예측하기 위해 유전 위험점수를 산출하는 장치, 방법 및 기록매체를 제공하는 것을 목적으로 한다.Another object of the present invention is to provide an apparatus, method, and recording medium for calculating a genetic risk score in order to predict prostate cancer by race using genetic information.

또한 본 발명은 피험자의 전립선암 위험등급을 판단하여 효율적인 피험자 관리를 제공하는 장치, 방법 및 기록 매체를 제공하는 것을 목적으로 한다.Another object of the present invention is to provide an apparatus, method, and recording medium for providing efficient subject management by determining a subject's prostate cancer risk level.

그러나 이러한 과제는 예시적인 것으로, 이에 의해 본 발명의 범위가 한정되는 것은 아니다.However, these problems are exemplary, and the scope of the present invention is not limited thereto.

본 발명의 일 실시예에 따른 전립선암 유전 위험점수 산출방법은 입력부 및 프로세서를 포함하는 전립선암 유전 위험점수 산출장치에 의해서 수행된다. 전립선암 유전 위험점수 산출방법은 상기 입력부에 의해, 피험자의 유전 정보를 입력받는 단계; 상기 프로세서에 의해, 상기 유전 정보에 포함된 SNP(single nucleotide polymorphism, 단일염기다형성)를 이용하여 SNP 마커 세트를 결정하는 단계; 상기 프로세서에 의해, 상기 SNP 마커 세트에 포함된 SNP 마커 각각에 대하여 가중치를 결정하고, 상기 가중치를 기초로 가중치 위험도 모델을 결정하는 단계; 및 상기 프로세서에 의해, 상기 가중치 위험도 모델을 이용하여 전립선암 유전 위험점수를 산출하는 단계를 포함하며, SNP 마커의 가중치는 SNP 마커 각각의 전립선암 발병 확률에 대한 오즈비 (odds ratio, OR)에 자연 로그(ln)를 취한 값인 것을 특징으로 한다.The prostate cancer genetic risk score calculation method according to an embodiment of the present invention is performed by a prostate cancer genetic risk score calculation device including an input unit and a processor. The prostate cancer genetic risk score calculation method includes: receiving, by the input unit, genetic information of a subject; determining, by the processor, a set of SNP markers using single nucleotide polymorphism (SNP) included in the genetic information; determining, by the processor, a weight for each SNP marker included in the SNP marker set, and determining a weighted risk model based on the weight; and calculating, by the processor, a prostate cancer genetic risk score using the weighted risk model, wherein the weight of the SNP marker is an odds ratio (OR) for the prostate cancer incidence probability of each SNP marker. It is characterized in that it is a value obtained by taking the natural logarithm (ln).

또한, 상기 유전 위험점수를 산출하는 단계는 상기 유전 정보에 대응되는 가중치 위험도 모델을 통해 산출하는 것을 특징으로 할 수 있다.In addition, the calculating of the genetic risk score may be characterized in that it is calculated through a weighted risk model corresponding to the genetic information.

또한, 상기 가중치 위험도 모델은 27개 SNP(단일염기다형성) 마커의 조합을 이용하는 것을 특징으로 할 수 있다.In addition, the weighted risk model may be characterized by using a combination of 27 SNP (single nucleotide polymorphism) markers.

한편, 본 발명의 일 실시예에 따른 기록매체는 상기 전립선암 위험점수 산출 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체일 수 있다.Meanwhile, the recording medium according to an embodiment of the present invention may be a computer-readable recording medium in which a program for executing the method for calculating the prostate cancer risk score is recorded.

전술한 것 외의 다른 측면, 특징, 이점은 이하의 발명을 실시하기 위한 구체적인 내용, 청구범위 및 도면으로부터 명확해질 것이다. Other aspects, features and advantages other than those described above will become apparent from the following detailed description, claims and drawings for carrying out the invention.

상기한 바와 같이 이루어진 본 발명의 일 실시예에 따르면, 유전 정보 중 특정 유전 변이에 대하여 가중치를 부여함으로써 정밀한 위험점수를 산출할 수 있다.According to an embodiment of the present invention made as described above, it is possible to calculate a precise risk score by assigning a weight to a specific genetic variation among genetic information.

특히, 본 발명의 일 실시예에 따르면, 인종 별로 상이한 가중치 위험도 모델을 적용함으로써 피험자 인종 특이성을 반영한 전립선암 위험점수를 산출할 수 있다.In particular, according to an embodiment of the present invention, a prostate cancer risk score reflecting the subject's racial specificity may be calculated by applying different weighted risk models for each race.

물론 이러한 효과에 의해 본 발명의 범위가 한정되는 것은 아니다.Of course, the scope of the present invention is not limited by these effects.

도 1은 본 발명의 일 실시예에 따른 전립선암 유전 위험점수 산출 시스템도이다.
도 2는 본 발명의 일 실시예에 따른 산출장치의 블록도이다.
도 3은 본 발명의 일 실시예에 따른 유전 위험점수를 산출하는 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 다중유전 위험점수를 산출하는 방법을 설명하기 위한 흐름도이다.
도 5은 본 발명의 일 실시예에 따른 유전 위험점수 계산에 포함되는 후보 유전 변이 목록을 도시한 도면이다.
도 6는 본 발명의 일 실시예에 따른 유전변이의 개수에 따른 예측력을 비교하기 위한 ROC(Receiver Operating Characteristic) 곡선을 도시한 도면이다.
도 7는 본 발명의 일 실시예에 따른 가중치를 부여한 모델(weighted model)의 유전변이 개수에 따른 GRS 분포를 설명하기 위한 도면이다.
1 is a diagram of a prostate cancer genetic risk score calculation system according to an embodiment of the present invention.
2 is a block diagram of a calculation device according to an embodiment of the present invention.
3 is a flowchart of calculating a genetic risk score according to an embodiment of the present invention.
4 is a flowchart illustrating a method of calculating a multiple genetic risk score according to an embodiment of the present invention.
5 is a diagram illustrating a list of candidate genetic mutations included in the genetic risk score calculation according to an embodiment of the present invention.
6 is a diagram illustrating a receiver operating characteristic (ROC) curve for comparing predictive power according to the number of genetic variations according to an embodiment of the present invention.
7 is a diagram for explaining a GRS distribution according to the number of genetic variations of a weighted model according to an embodiment of the present invention.

이하, 본 개시의 다양한 실시예가 첨부된 도면과 연관되어 기재된다. 본 개시의 다양한 실시예는 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들이 도면에 예시되고 관련된 상세한 설명이 기재되어 있다. 그러나 이는 본 개시의 다양한 실시예를 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 개시의 다양한 실시예의 사상 및 기술 범위에 포함되는 모든 변경 및/또는 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용되었다.Hereinafter, various embodiments of the present disclosure are described in connection with the accompanying drawings. Various embodiments of the present disclosure are capable of various changes and may have various embodiments, specific embodiments are illustrated in the drawings and the related detailed description is described. However, this is not intended to limit the various embodiments of the present disclosure to specific embodiments, and should be understood to include all modifications and/or equivalents or substitutes included in the spirit and scope of the various embodiments of the present disclosure. In connection with the description of the drawings, like reference numerals have been used for like elements.

본 개시의 다양한 실시예에서 사용될 수 있는 "포함한다." 또는 "포함할 수 있다." 등의 표현은 개시 (disclosure)된 해당 기능, 동작 또는 구성요소 등의 존재를 가리키며, 추가적인 하나 이상의 기능, 동작 또는 구성요소 등을 제한하지 않는다. 또한, 본 개시의 다양한 실시예에서, "포함하다." 또는 "가지다." 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.“Includes,” which can be used in various embodiments of the present disclosure. or "may include." The expression “etc” indicates the existence of the disclosed function, operation, or component, and does not limit one or more additional functions, operations, or components. Also, in various embodiments of the present disclosure, "includes." Or "have." The term such as is intended to designate that there is a feature, number, step, operation, component, part, or combination thereof described in the specification, but one or more other features or number, step, operation, component, part or It should be understood that it does not preclude the possibility of the existence or addition of combinations thereof.

본 개시의 다양한 실시예에서 "또는" 등의 표현은 함께 나열된 단어들의 어떠한, 그리고 모든 조합을 포함한다. 예를 들어, "A 또는 B"는, A를 포함할 수도, B를 포함할 수도, 또는 A 와 B 모두를 포함할 수도 있다.In various embodiments of the present disclosure, expressions such as “or” include any and all combinations of words listed together. For example, "A or B" may include A, may include B, or may include both A and B.

본 개시의 다양한 실시예에서 사용된 "제1", "제2", "첫째", 또는 "둘째" 등의 표현들은 다양한 실시예들의 다 양한 구성요소들을 수식할 수 있지만, 해당 구성요소들을 한정하지 않는다. 예를 들어, 상기 표현들은 해당 구 성요소들의 순서 및/또는 중요도 등을 한정하지 않는다. 상기 표현들은 한 구성요소를 다른 구성요소와 구분하 기 위해 사용될 수 있다. 예를 들어, 제1 사용자 기기와 제2 사용자 기기는 모두 사용자 기기이며, 서로 다른 사용자 기기를 나타낸다. 예를 들어, 본 개시의 다양한 실시예의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. Expressions such as “first”, “second”, “first”, or “second” used in various embodiments of the present disclosure may modify various components of various embodiments, but limit the components I never do that. For example, the above expressions do not limit the order and/or importance of the corresponding components. The above expressions may be used to distinguish one component from another. For example, both the first user device and the second user device are user devices, and represent different user devices. For example, without departing from the scope of the various embodiments of the present disclosure, a first component may be referred to as a second component, and similarly, a second component may also be referred to as a first component.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소 가 상기 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 새로운 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 상기 어떤 구성 요소와 상기 다른 구성요소 사이에 새로운 다른 구성요소가 존재하지 않는 것으로 이해될 수 있어야 할 것이다.When an element is referred to as being “connected” or “connected” to another element, the element is directly connected to or may be connected to the other element, but the element and It should be understood that other new components may exist between the other components. On the other hand, when an element is referred to as being "directly connected" or "directly connected" to another element, it will be understood that no new element exists between the element and the other element. should be able to

본 개시의 실시예에서 "모듈", "유닛", "부(part)" 등과 같은 용어는 적어도 하나의 기능이나 동작을 수행하는 구성요소를 지칭하기 위한 용어이며, 이러한 구성요소는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 "모듈", "유닛", "부(part)" 등은 각각이 개별적인 특정한 하드웨어로 구현될 필요가 있는 경우를 제외하고는, 적어도 하나의 모듈이나 칩으로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다.In the embodiment of the present disclosure, terms such as “module”, “unit”, “part”, etc. are terms for designating a component that performs at least one function or operation, and such component is hardware or software. It may be implemented or implemented as a combination of hardware and software. In addition, a plurality of "modules", "units", "parts", etc. are integrated into at least one module or chip, except when each needs to be implemented in individual specific hardware, and thus at least one processor. can be implemented as

본 개시의 다양한 실시예에서 사용한 용어는 단지 특정일 실시예를 설명하기 위해 사용된 것으로, 본 개시의 다양한 실시예를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.Terms used in various embodiments of the present disclosure are only used to describe one specific embodiment, and are not intended to limit the various embodiments of the present disclosure. The singular expression includes the plural expression unless the context clearly dictates otherwise.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 개시의 다양한 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which various embodiments of the present disclosure pertain.

일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 개시의 다양한 실시예에서 명백하게 정의되지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Terms such as those defined in a commonly used dictionary should be interpreted as having a meaning consistent with the meaning in the context of the related art, and unless explicitly defined in various embodiments of the present disclosure, ideal or excessively formal terms not interpreted as meaning

이하에서, 첨부된 도면을 이용하여 본 발명의 다양한 실시예들에 대하여 구체적으로 설명한다.Hereinafter, various embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 전립선암 유전 위험점수 산출 시스템도이다.1 is a diagram of a prostate cancer genetic risk score calculation system according to an embodiment of the present invention.

도 1을 참조하면, 전립선암 유전 위험점수 산출 시스템은 위험점수 산출장치(100, 이하 산출장치), 서버(200), 사용자 단말기(301) 및 외부 기관의 전자 장치(302)을 포함할 수 있다.Referring to FIG. 1 , the prostate cancer genetic risk score calculation system may include a risk score calculation device 100 (hereinafter referred to as calculation device), a server 200 , a user terminal 301 , and an electronic device 302 of an external organ. .

산출장치(100)는 데스크탑 컴퓨터나 서버일 수 있으나, 이에 한정하지 않으며 유전 정보를 이용해 전립선암 발병에 대한 위험점수(또는, 위험도)를 산출하기 위한 방법을 수행하기 위한 프로그램을 실행시킬 수 있는 모든 종류의 전자장치일 수 있다.The calculation device 100 may be a desktop computer or a server, but is not limited thereto, and any program capable of executing a program for performing a method for calculating a risk score (or risk) for the onset of prostate cancer using genetic information is not limited thereto. It may be any kind of electronic device.

사용자 단말기(301)는 유무선 통신 환경에서 데이터를 송수신할 수 있는 통신 단말기를 의미한다. 여기서, 사용자 단말기(301)는 사용자의 퍼스널 컴퓨터 일 수도 있고, 사용자의 휴대용 단말기일 수도 있다. 사용자는 피험자일 수 있고, 피험자는 직접 유전 정보를 입력하여 서버(200)로 전송할 수 있다.The user terminal 301 refers to a communication terminal capable of transmitting and receiving data in a wired/wireless communication environment. Here, the user terminal 301 may be a user's personal computer or a user's portable terminal. The user may be a subject, and the subject may directly input genetic information and transmit it to the server 200 .

도 1에서 사용자 단말기(301)는 휴대용 단말기가 스마트폰으로 도시되었지만 본 발명의 사상은 이에 제한되지 아니하며 상술한 바와 같이 통신망과 연결이 가능한 프로그램이 탑재되거나 통신 모듈과 연결된 모든 종류의 전자기기를 포함할 수 있다. 구체적으로 사용자 단말기(301)는 컴퓨터(예를 들면, 데스크톱, 랩톱, 태블릿 등), 미디어 컴퓨팅 플랫폼(예를 들면, 케이블, 위성 셋톱박스, 디지털 비디오 레코더), 핸드헬드 컴퓨팅 디바이스 (예를 들면, PDA, 이메일 클라이언트 등), 핸드폰의 임의의 형태 또는 다른 종류의 컴퓨팅 또는 커뮤니케이션 플랫폼의 임의의 형태를 포함할 수 있으나, 본 발명이 이에 한정되는 것은 아니다.In FIG. 1, the user terminal 301 is illustrated as a mobile terminal as a smart phone, but the inventive concept is not limited thereto. As described above, a program capable of connecting to a communication network is loaded or includes all kinds of electronic devices connected to a communication module. can do. Specifically, the user terminal 301 is a computer (eg, desktop, laptop, tablet, etc.), a media computing platform (eg, cable, satellite set-top box, digital video recorder), a handheld computing device (eg, PDA, e-mail client, etc.), any form of mobile phone, or any other type of computing or communication platform, but the present invention is not limited thereto.

도 1에는 사용자 단말기(301)가 단수로 도시되어 있으나, 본 발명의 일 실시예에 따르면 사용자 단말기(301)는 복수일 수 있고, 복수개의 사용자 단말기들이 직접 외부 기관의 전자 장치(302)에 연결될 수 있다.Although the user terminal 301 is illustrated in the singular in FIG. 1 , according to an embodiment of the present invention, the number of user terminals 301 may be plural, and the plurality of user terminals may be directly connected to the electronic device 302 of an external organization. have.

외부 기관의 전자 장치(302)는 복수의 피험자의 유전 정보를 획득한 의료기관 및 공공기관에 설치된 또는 의료기관 및 공공기관에 의해 관리되는 전자 장치(또는, 서버)일 수 있다. 외부 기관의 전자 장치(302)는 서버(200)로 복수의 피험자의 유전 정보에 대한 데이터를 전송할 수 있고, 서버(200)는 수신한 데이터를 바탕으로 전립선암 유전 위험점수 산출을 위한 가중치 위험도 모델을 결정할 수 있다.The electronic device 302 of the external institution may be an electronic device (or server) installed in or managed by a medical institution or a public institution that has obtained genetic information of a plurality of subjects. The electronic device 302 of the external organ may transmit data on the genetic information of a plurality of subjects to the server 200, and the server 200 is a weighted risk model for calculating a prostate cancer genetic risk score based on the received data. can be decided

산출장치(100)는 피험자의 유전 정보를 입력받고, 가중치 위험도 모델을 이용하여 피험자의 전립선암 위험점수를 산출하는 장치일 수 있다. 본 발명의 일 실시예에 따르면 산출장치(100)는 피험자의 인종 정보를 획득하고, 인종 정보에 대응하는 가중치 위험도 모델을 결정하여 유전 위험점수를 산출할 수 있다. The calculator 100 may be a device that receives genetic information of a subject and calculates a prostate cancer risk score of the subject by using a weighted risk model. According to an embodiment of the present invention, the calculator 100 may obtain the subject's race information, determine a weighted risk model corresponding to the race information, and calculate the genetic risk score.

본 발명의 또 다른 실시예에 따르면, 산출장치(100)는 유전 정보에 포함된 염기서열의 특정 SNP(단일염기다형성)를 확인할 수 있다. 이때, 특정 SNP는 rs72725879, rs4242384, rs11263763, rs339331, rs1512268, rs11125927, rs140783917, rs7489409, rs10896449, rs7463326, rs8023793, rs2659124, rs10993994, rs77167534, rs7591218, rs1983891, rs2242652, rs11817544, rs10505477, rs817872, rs56159348, rs4711748, rs2238776, rs6955627, rs2660753, rs1283104 및 rs7153648중 어느 하나 이상을 포함하는 것일 수 있다.According to another embodiment of the present invention, the calculator 100 may identify a specific SNP (single nucleotide polymorphism) of a nucleotide sequence included in the genetic information. 이때, 특정 SNP는 rs72725879, rs4242384, rs11263763, rs339331, rs1512268, rs11125927, rs140783917, rs7489409, rs10896449, rs7463326, rs8023793, rs2659124, rs10993994, rs77167534, rs7591218, rs1983891, rs2242652, rs11817544, rs10505477, rs817872, rs56159348, rs4711748, rs2238776 , may include any one or more of rs6955627, rs2660753, rs1283104, and rs7153648.

한편, 가중치 위험도 모델은 서버(200)로부터 수신한 것일 수 있다. 즉, 서버(200)는 전립선암을 예측하기 위한 가중치 위험도 모델을 결정할 수 있고, 이를 산출장치(100)로 전송할 수 있다.Meanwhile, the weighted risk model may be received from the server 200 . That is, the server 200 may determine a weighted risk model for predicting prostate cancer, and transmit it to the calculator 100 .

구체적으로 서버(200)는 전립선암 관련 유전 변이를 탐색할 수 있다. 서버(200)는 4,724,872개의 유전 변이에 대해 Discovery set에서 2,702 명의 글리슨 점수 (Gleason score, GS) 7점 (3+4점) 이상의 전립선암 환자- 7,485 명의 정상 대조군을 비교할 수 있다. 또한, 서버(200)는 재현(Replication)을 위한 유전 변이 상기 27개의 SNP 중 적어도 1개 이상을 추출할 수 있다. 서버(200)는 유전 정보에 대한 데이터 및 유전 변이를 기초로 가중치 위험도 모델을 결정할 수 있다.Specifically, the server 200 may search for prostate cancer-related genetic mutations. The server 200 can compare 2,702 Gleason score (GS) 7 (3+4 points) or more prostate cancer patients - 7,485 normal controls in the discovery set for 4,724,872 genetic variations. In addition, the server 200 may extract at least one or more of the 27 genetic mutations for replication. The server 200 may determine a weighted risk model based on data on genetic information and genetic variation.

본 발명의 일 실시예에 따르면, 서버(200)는 27개의 변이를 마커 세트로 추출하여 새로운 독립적인 자료원(replication set: 전립선암 환자 (311명) + 정상 대조군 (822명))으로 가중유전 위험점수를 획득할 수 있고, 이로부터 가중치 위험도 모델을 결정할 수 있다. 이때, 서버(200)는 특정 유전 변이를 통해 전립선암과 관련된 유전 위험점수를 산출할 수 있다. 이때, 대표변이를 추출하는 과정에 있어서, 인종 별로 구분된 유전 변이가 고려될 수 있다.According to an embodiment of the present invention, the server 200 extracts 27 mutations as a marker set and provides a new independent data source (replication set: prostate cancer patients (311 patients) + normal controls (822 people)) weighted genetic risk. Scores can be obtained, from which a weighted risk model can be determined. In this case, the server 200 may calculate a genetic risk score related to prostate cancer through a specific genetic mutation. In this case, in the process of extracting the representative variation, the genetic variation divided by race may be considered.

서버(200)는 유전 변이의 발생 횟수에 가중치를 부여할 수 있으나, 이에 한정하지 않는다. 본 발명의 일 실시예에 따르면, 서버(200)는 유전 변이의 중요도(또는 질병에 기여하는 정도)에 따라 가중치를 부여할 수 있다. 예를 들어, 서버(200)는 유전 변이와의 연관성 정도를 나타내는 오즈비에 자연 로그(ln)를 취한 값을 가중치로 사용할 수 있다.The server 200 may give weight to the number of occurrences of the genetic mutation, but is not limited thereto. According to an embodiment of the present invention, the server 200 may assign weights according to the importance (or degree of contribution to disease) of the genetic mutation. For example, the server 200 may use a value obtained by taking a natural logarithm (ln) of an odds ratio indicating a degree of association with a genetic variation as a weight.

본 발명의 일 실시예에 따르면, 서버(200)는 인공지능 모델을 이용하여 결정하기 위한 가중치 위험도 모델을 학습시킬 수 있다. 이때 인공지능 모델은 CNN(Convolution Neural Network), RNN(Recurrent Neural Network), DNN(Deep Neural Network) 등을 포함하는 다양한 딥러닝 알고리즘일 수 있으나, 이에 한정하지 않는다.According to an embodiment of the present invention, the server 200 may train a weighted risk model for determining using an artificial intelligence model. At this time, the artificial intelligence model may be various deep learning algorithms including, but not limited to, a Convolution Neural Network (CNN), a Recurrent Neural Network (RNN), and a Deep Neural Network (DNN).

또한, 가중치 위험도 모델은 각각의 피험자에 대해 전립선암과 관련된 SNP 들의 위험 대립 유전자의 수를 더하되, 각 SNP의 전립선암에 대한 기여도에 따라 가중치를 부여하여 위험점수를 계산할 수 있다. 인간은 상동 염색체를 가지므로, 각각의 피험자는 각 SNP에 대한 위험 대립 유전자는 0개, 1개, 또는 2개를 가질 수 있다. 이에 대하여 추후 상세히 설명하기로 한다.In addition, the weighted risk model can calculate a risk score by adding the number of risk alleles of SNPs related to prostate cancer for each subject, and assigning weights according to the contribution of each SNP to prostate cancer. Since humans have homologous chromosomes, each subject can have 0, 1, or 2 risk alleles for each SNP. This will be described in detail later.

본 발명의 일 실시예에 따른 산출장치(100)는 계산기와 같은 형태로 구현될 수 있다. 즉, 산출장치(100)는 유전 변이와 관련된 유전 정보 값을 입력 받고, 입력된 값들로부터 산출된 전립선암 위험점수 및/또는 가이드라인 등을 디스플레이를 통해 출력할 수 있다.The calculator 100 according to an embodiment of the present invention may be implemented in the form of a calculator. That is, the calculator 100 may receive a genetic information value related to a genetic mutation, and may output a prostate cancer risk score and/or guideline calculated from the input values through a display.

본 발명의 일 실시예에 따른 산출장치(100)는 전립선암과 관련된 유전 변이 종류를 변경할 수 있다. 산출장치(100)는 사용자 정보, 예를 들면 나이, 성별, 인종 등에 대한 정보에 기초해 가중치 위험도 모델에 반영할 유전 변이 종류를 변경할 수 있다.The calculator 100 according to an embodiment of the present invention may change the type of genetic mutation associated with prostate cancer. The calculator 100 may change the type of genetic mutation to be reflected in the weighted risk model based on user information, for example, information on age, gender, race, and the like.

이때, 산출장치(100)는 서버(200)와 연동하여 서버(200)에서 설정된 다양한 가중치 위험도 모델 중 사용자 정보에 대응되는 가중치 위험도 모델을 결정할 수 있다. 예를 들면, 산출장치(100)는 입력된 피험자의 인종이 유럽인이라고 판단하면, 서버(200)로부터 유럽인에 대응되는 유전 변이에 가중치를 부여한 가중치 위험도 모델을 수신하고, 피험자의 전립선암 위험점수를 산출할 수 있다.In this case, the calculator 100 may determine a weighted risk model corresponding to user information from among various weighted risk models set in the server 200 in conjunction with the server 200 . For example, if it is determined that the input subject's race is European, the calculator 100 receives a weighted risk model in which weights are given to genetic variations corresponding to Europeans from the server 200, and calculates the subject's prostate cancer risk score. can be calculated.

본 발명의 또 다른 실시예에 따른 산출장치(100)는 사용자 또는 피험자의 신체 정보, 나이 정보, 생활 정보와 전립선암 위험 점수 사이의 관계를 추론하여 가중치 위험도 모델을 설정할 수 있다. 예를 들면, 산출장치(100)는 피험자가 흡연자인 경우, 해당 생활 정보에 대응되는 유전 변이에 가중치를 부여한 가중치 위험도 모델을 이용하여 전립선암의 위험점수를 계산할 수 있다. 이 경우에도 산출장치(100)는 서버(200)와 연동하여 다양한 가중치 위험도 모델을 사용할 수 있다.The calculator 100 according to another embodiment of the present invention may set a weighted risk model by inferring a relationship between the user's or subject's body information, age information, life information, and a prostate cancer risk score. For example, when the subject is a smoker, the calculator 100 may calculate a risk score for prostate cancer using a weighted risk model in which a weight is assigned to a genetic variation corresponding to the living information. Even in this case, the calculator 100 may use various weighted risk models in conjunction with the server 200 .

본 발명의 또 다른 실시예에 따르면, 산출장치(100)는 피험자의 유전 정보를 입력받고, 이에 대응하는 가중치 위험도 모델을 이용하여 유전 정보에 대한 유전 위험점수를 산출할 수 있다. 산출장치(100)는 산출된 유전 위험점수에 기초해 위험점수 그룹을 분류할 수 있다. 산출장치(100)는 유전 위험점수로 임계값을 결정하고, 임계값을 기준으로 위험점수 그룹(예: 고위험 그룹, 중위험 그룹, 저위험 그룹)으로 분류할 수 있다. 예를 들어, 산출장치(100)는 상위 5%에 해당하는 유전 위험점수를 임계값으로 결정해 고위험 그룹으로 분류할 수 있다. 다른 예로, 산출장치(100)는 민감도와 특이도가 가장 높을 때, 즉, 가장 최적의 성능을 보일 때의 유전 위험점수를 임계값으로 결정해 임계값 이상일 경우 중위험 그룹으로 분류하고, 임계값 미만이면 저위험 그룹으로 분류할 수 있다. According to another embodiment of the present invention, the calculator 100 may receive genetic information of a subject and calculate a genetic risk score for the genetic information by using a weighted risk model corresponding thereto. The calculator 100 may classify the risk score group based on the calculated genetic risk score. The calculator 100 may determine a threshold value based on the genetic risk score, and classify the threshold into a risk score group (eg, a high risk group, a medium risk group, a low risk group) based on the threshold value. For example, the calculator 100 may determine the genetic risk score corresponding to the top 5% as a threshold value and classify it as a high risk group. As another example, the calculator 100 determines the genetic risk score when the sensitivity and specificity are the highest, that is, when the most optimal performance is shown as a threshold value, and classifies it as a medium risk group when the threshold value is higher than the threshold value. If it is less than that, it can be classified as a low-risk group.

본 발명의 다른 실시예에 따르면, 산출장치(100)는 GRS 분포에 기초해 위험점수 그룹을 분류할 수 있다. 산출장치(100)는 복수의 피험자에 대한 데이터를 바탕으로 기산출된 GRS 점수를 기초로 고위험 그룹, 중위험 그룹, 저위험 그룹으로 분류할 수 있으나 이에 한정되는 것은 아니다.According to another embodiment of the present invention, the calculator 100 may classify the risk score group based on the GRS distribution. The calculator 100 may classify the high-risk group, the medium-risk group, and the low-risk group based on the GRS score previously calculated based on the data of the plurality of subjects, but is not limited thereto.

가중치 위험도 모델은 피험자의 인종 정보를 고려하여 결정된 가중치 위험도 모델일 수 있다. 또는, 가중치 위험도 모델은 인종 정보 및 피험자의 생활 정보를 고려하여 결정된 가중치 위험도 모델일 수 있다. 다만 피험자의 인종 정보 및/또는 생활 정보는 일 예에 불과하고, 산출장치(100)는 피험자에 대한 다양한 정보를 이용하여 가중치 위험도 모델을 결정할 수 있다.The weighted risk model may be a weighted risk model determined in consideration of the subject's race information. Alternatively, the weighted risk model may be a weighted risk model determined in consideration of race information and living information of a subject. However, race information and/or living information of the subject are only examples, and the calculation device 100 may determine a weighted risk model using various pieces of information about the subject.

또한 피험자에 대한 정보를 이용한 가중치 위험도 모델의 결정은 일 실시예에 불과하고, 가중치 위험도 모델을 결정하는 기준은 다양할 수 있다.In addition, the determination of the weighted risk model using information about the subject is only an example, and the criteria for determining the weighted risk model may vary.

상술한 실시예를 통해, 1차적으로 피험자에 대한 유전 위험점수를 예측하고, 필요에 따라 더욱 정밀한 유전 위험 예측을 수행할 수 있다.Through the above-described embodiment, it is possible to primarily predict a genetic risk score for a subject, and perform more precise genetic risk prediction if necessary.

본 발명의 또 다른 실시예에 따르면, 산출장치(100)는 유전 정보에 대한 유전 위험 점수가 고위험 그룹으로 변경되는 경우, 피험자를 집중관리 대상자로 설정할 수 있다.According to another embodiment of the present invention, when the genetic risk score for genetic information is changed to a high risk group, the calculator 100 may set the subject as a subject for intensive management.

본 발명에 따르면, 피험자의 전립선암에 대한 위험점수가 증가하는 경우, 피험자를 집중관리 대상자로 설정하고 가이드라인을 제시할 수 있다는 효과가 있다. 구체적으로 피험자가 집중관리 대상자로 설정되는 경우, 산출장치(100)는 피험자의 생활 습관, 식습관 등에 대한 가이드라인을 제공하고, 차기 전립선암 검사 일정에 대해 안내할 수 있다.According to the present invention, when the risk score for prostate cancer of the subject increases, there is an effect that the subject can be set as a subject for intensive care and guidelines can be presented. Specifically, when the subject is set as the subject of intensive management, the calculator 100 may provide guidelines for the subject's lifestyle, eating habits, etc., and guide the next prostate cancer examination schedule.

또한, 본 발명의 일 실시예에 따르면 산출장치(100)는 위험점수 증가 정도에 따라 집중관리 대상자 등급을 결정할 수 있다. 예를 들어, 유전 위험점수에 따른 전립선암 발병에 대한 중위험군 경우, 환경-유전 위험점수 산출 결과 저위험 그룹으로 변경된 경우, 하급 집중 관리 대상자로 결정하고, 고위험 그룹으로 변경되는 피험자를 상급 집중관리 대상자로 결정할 수 있으나, 이는 일 예에 불과하며, 위험점수의 등급 및 집중관리 대상자의 등급은 다양할 수 있다.In addition, according to an embodiment of the present invention, the calculator 100 may determine the intensive management target grade according to the degree of increase in the risk score. For example, in the case of a medium-risk group for prostate cancer according to the genetic risk score, if the environmental-genetic risk score is changed to a low-risk group, the lower-level intensive care target is determined, and the subject who is changed to the high-risk group is intensively managed It can be determined as a target, but this is only an example, and the grade of the risk score and the grade of the subject for intensive management may vary.

한편, 상술한 예에 따른 산출장치(100)는 상급 집중관리 대상자에 결정된 피험자에 대하여 추가적인 가이딩을 제공할 수 있다. 예를 들어, 산출장치(100)는 상급 집중관리 대상자의 연락처 정보 등과 같은 개인정보를 이용하여 피험자에게 주기적인 검사 안내 문자 또는 검사 안내 메일을 전송할 수 있다.On the other hand, the calculation device 100 according to the above-described example may provide additional guiding for the subject determined to be a subject for senior intensive management. For example, the calculator 100 may transmit a periodic test guide text or test guide mail to the subject by using personal information such as contact information of the higher-level centralized management target.

가중치 위험도 모델은 각각의 피험자에 대해 전립선암과 관련된 SNP 들의 위험 대립 유전자(risk allele)의 수를 합하며, 이때 각각의 SNP에 대해 위험 대립 유전자 개수에 따라 0, 1 또는 2의 세부 점수를 부여하고, 각 SNP 별로 전립선암에 대한 기여도에 따라 가중치를 부여하는 모델일 수 있으나, 이에 한정하지 않는다. 이에 대하여 추후 상세히 설명하기로 한다.The weighted risk model sums the number of risk alleles of SNPs related to prostate cancer for each subject, and gives each SNP a sub-score of 0, 1, or 2 depending on the number of risk alleles. and may be a model in which weights are assigned according to the contribution to prostate cancer for each SNP, but the present invention is not limited thereto. This will be described in detail later.

본 발명의 일 실시예에 따른 산출장치(100)는 계산기와 같은 형태로 구현될 수 있다. 즉, 산출장치(100)는 유전 변이와 관련된 유전 정보 값을 입력 받고, 입력된 값들로부터 산출된 전립선암 위험등급 및/또는 가이드 라인 등을 디스플레이를 통해 출력할 수 있다.The calculator 100 according to an embodiment of the present invention may be implemented in the form of a calculator. That is, the calculator 100 may receive a genetic information value related to the genetic mutation, and output the prostate cancer risk grade and/or guideline calculated from the input values through the display.

도 2는 본 발명의 일 실시예에 따른 산출장치의 블록도이다.2 is a block diagram of a calculation device according to an embodiment of the present invention.

도 2를 참조하면, 산출장치(100)는 통신부(110), 입력부(120), 메모리(130), 디스플레이(140) 및 프로세서(150)를 포함할 수 있다.Referring to FIG. 2 , the calculator 100 may include a communication unit 110 , an input unit 120 , a memory 130 , a display 140 , and a processor 150 .

통신부(110)는 서버(200), 사용자 단말기(301) 및/또는 외부 기관의 전자 장치(302)와 데이터를 송수신하기 위한 구성이다. 통신부(100)는 블루투스 통신부, BLE(Bluetooth Low Energy) 통신부, 근거리 무선 통신부(Near Field Communication unit), WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association) 통신부, WFD(Wi-Fi Direct) 통신부, UWB(ultrawideband) 통신부, Ant+ 통신부 등의 근거리 통신부, 이동통신 망 통신부 중 적어도 일부를 포함할 수 있다.The communication unit 110 is configured to transmit/receive data to and from the server 200 , the user terminal 301 , and/or the electronic device 302 of an external organization. The communication unit 100 includes a Bluetooth communication unit, a BLE (Bluetooth Low Energy) communication unit, a near field communication unit, a WLAN (Wi-Fi) communication unit, a Zigbee communication unit, an infrared (IrDA, infrared Data Association) communication unit, a WFD ( It may include at least a part of a Wi-Fi Direct) communication unit, an ultrawideband (UWB) communication unit, a short-distance communication unit such as an Ant+ communication unit, and a mobile communication network communication unit.

입력부(120)는 산출장치(100)에 다양한 정보를 입력하기 위한 사용자 인터페이스를 포함할 수 있다. 이때, 산출 장치(100)에 입력되는 다양한 정보는 피험자의 유전 정보, 피험자의 나이, 성별, 인종 등에 대한 정보, 피험자의 생활 습관 정보 등을 포함할 수 있으나, 이에 한정되지 않는다.The input unit 120 may include a user interface for inputting various types of information into the calculation device 100 . In this case, the various information input to the calculation device 100 may include, but is not limited to, genetic information of the subject, information on the age, sex, race, etc. of the subject, and lifestyle information of the subject.

메모리(130)는 프로세서(150)의 처리 또는 제어를 위한 프로그램 등 산출장치(100) 전반의 동작을 위한 다양한 데이터를 저장할 수 있다. 메모리(130)는 산출장치(100)에서 구동되는 다수의 응용 프로그램(application program 또는 애플리케이션(application)), 산출장치(100)의 동작을 위한 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 무선 통신을 통해 외부 서버로부터 다운로드 될 수 있다. 또한 이러한 응용 프로그램 중 적어도 일부는, 산출장치(100)의 기본적인 기능을 위하여 출고 당시부터 산출장치(100) 상에 존재할 수 있다. 응용 프로그램은, 메모리(130)에 저장되고, 프로세서(150)에 의하여 산출장치(100)의 동작(또는 기능)을 수행하도록 구동될 수 있다.The memory 130 may store various data for the overall operation of the calculation device 100 , such as a program for processing or controlling the processor 150 . The memory 130 may store a plurality of application programs (or applications) driven by the calculation device 100 , data for operation of the calculation device 100 , and commands. At least some of these application programs may be downloaded from an external server through wireless communication. Also, at least some of these application programs may exist on the calculation device 100 from the time of shipment for a basic function of the calculation device 100 . The application program is stored in the memory 130 and may be driven by the processor 150 to perform an operation (or function) of the calculation device 100 .

디스플레이(140)는 산출장치(100)가 가중치 위험도 모델을 통해 산출한 피험자의 전립선암 위험점수를 디스플레이할 수 있다. 본 발명의 일 실시예에 따르면 디스플레이(140)는 입력부(120)를 통해 입력된 정보들로부터 산출된 전립선암 위험점수를 표시할 수 있고, 이를 통해 피험자의 생활 습관에 대한 가이드 라인 등을 디스플레이를 통해 출력할 수 있다. The display 140 may display the prostate cancer risk score of the subject calculated by the calculator 100 through the weighted risk model. According to an embodiment of the present invention, the display 140 may display the prostate cancer risk score calculated from the information input through the input unit 120, and through this, a guideline for the subject's lifestyle, etc. can be displayed on the display. can be output through

디스플레이(140)는 다양한 형태의 디스플레이 패널로 구현될 수 있다. 예로, 디스플레이 패널은 LCD(Liquid Crystal Display), OLED(Organic Light Emitting Diodes), AM-OLED(Active-Matrix Organic Light-Emitting Diode), LcoS(Liquid Crystal on Silicon) 또는 DLP(Digital Light Processing) 등과 같은 다양한 디스플레이 기술로 구현될 수 있다. 또한, 디스플레이(140)는 플렉서블 디스플레이(flexible display)의 형태로 디스플레이 장치(140)의 전면 영역 및, 측면 영역 및 후면 영역 중 적어도 하나에 결합될 수도 있다.The display 140 may be implemented with various types of display panels. For example, the display panel is a liquid crystal display (LCD), organic light emitting diode (OLED), active-matrix organic light-emitting diode (AM-OLED), liquid crystal on silicon (LcoS), digital light processing (DLP), etc. It can be implemented with various display technologies. Also, the display 140 may be coupled to at least one of a front area, a side area, and a rear area of the display apparatus 140 in the form of a flexible display.

디스플레이(140)는 레이어 구조의 터치 스크린으로 구현될 수 있다. 터치 스크린은 디스플레이 기능뿐만 아니라 터치 입력 위치, 터치된 면적뿐만 아니라 터치 입력 압력까지도 검출하는 기능을 가질 수 있고, 또한 실질적인 터치(real-touch)뿐만 아니라 근접 터치(proximity touch)도 검출하는 기능을 가질 수 있다.The display 140 may be implemented as a touch screen having a layer structure. The touch screen may have a function of detecting not only a display function but also a touch input position and a touched area, as well as a touch input pressure, and also has a function of detecting a proximity touch as well as a real-touch. can

프로세서(150)는 산출장치(100)를 전반적으로 제어하기 위한 구성이다. 구체적으로, 프로세서(150)는 산출장치(100)의 메모리(130)에 저장된 각종 프로그램을 이용하여 산출장치(100)의 전반적인 동작을 제어한다. 예를 들어, 프로세서(150)는 CPU, 램(RAM), 롬(ROM), 시스템 버스를 포함할 수 있다. 여기서, 롬은 시스템 부팅을 위한 명령어 세트가 저장되는 구성이고, CPU는 롬에 저장된 명령어에 따라 산출장치(100)의 메모리에 저장된 운영체제를 램에 복사하고, O/S를 실행시켜 시스템을 부팅시킨다. 부팅이 완료되면, CPU는 메모리(130)에 저장된 각종 애플리케이션을 램에 복사하고, 실행시켜 각종 동작을 수행할 수 있다. 이상에서는 프로세서(150)가 하나의 CPU 만을 포함하는 것으로 설명하였지만, 구현 시에는 복수의 CPU(또는 DSP, SoC 등)으로 구현될 수 있다.The processor 150 is a configuration for controlling the calculation device 100 as a whole. Specifically, the processor 150 controls the overall operation of the calculation device 100 by using various programs stored in the memory 130 of the calculation device 100 . For example, the processor 150 may include a CPU, a RAM, a ROM, and a system bus. Here, the ROM is a configuration in which an instruction set for system booting is stored, and the CPU copies the operating system stored in the memory of the calculation device 100 to the RAM according to the instructions stored in the ROM, and executes O/S to boot the system. . Upon completion of booting, the CPU may perform various operations by copying various applications stored in the memory 130 to the RAM and executing them. Although it has been described above that the processor 150 includes only one CPU, it may be implemented with a plurality of CPUs (or DSPs, SoCs, etc.).

본 발명의 일 실시예에 따라, 프로세서(150)는 디지털 신호를 처리하는 디지털 시그널 프로세서(digital signal processor(DSP), 마이크로 프로세서(microprocessor), TCON(Time controller)으로 구현될 수 있다. 다만, 이에 한정되는 것은 아니며, 중앙처리장치(central processing unit(CPU)), MCU(Micro Controller Unit), MPU(micro processing unit), 컨트롤러(controller), 어플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)), ARM 프로세서 중 하나 또는 그 이상을 포함하거나, 해당 용어로 정의될 수 있다. 또한, 프로세서(150)는 프로세싱 알고리즘이 내장된 SoC(System on Chip), LSI(large scale integration)로 구현될 수도 있고, FPGA(Field Programmable gate array) 형태로 구현될 수도 있다.According to an embodiment of the present invention, the processor 150 may be implemented as a digital signal processor (DSP), a microprocessor, or a time controller (TCON) for processing a digital signal. Without limitation, a central processing unit (CPU), a micro controller unit (MCU), a micro processing unit (MPU), a controller, an application processor (AP), or a communication processor ( communication processor (CP)), may include one or more of an ARM processor, or may be defined by a corresponding term In addition, the processor 150 may include a system on chip (SoC), large scale integration (LSI) in which a processing algorithm is embedded. ) or implemented in the form of a field programmable gate array (FPGA).

본 발명의 일 실시예에 따르면 프로세서(150)는 유전 위험점수 산출부(151) 및 위험등급 결정부(152)를 포함할 수 있다.According to an embodiment of the present invention, the processor 150 may include a genetic risk score calculator 151 and a risk level determiner 152 .

유전 위험점수 산출부(151)는 입력된 피험자에 대한 정보를 이용해 피험자의 유전 위험점수를 산출하기 위한 구성이다.The genetic risk score calculating unit 151 is configured to calculate the genetic risk score of the subject by using the input information about the subject.

유전 위험점수 산출부(151)는 인종 정보 획득부(미도시) 및 가중치 위험도 모델 결정부(미도시)를 구비할 수 있다. The genetic risk score calculating unit 151 may include a race information obtaining unit (not shown) and a weight risk model determining unit (not shown).

인종 정보 획득부는 입력된 피험자의 인종 정보를 획득하기 위한 구성이다. 이때, 메모리(130)에 저장된 데이터베이스에서 인종 정보를 획득할 수 있고, 통신부(110)를 통해 서버(200)로부터 인종 정보를 수신하여 획득할 수 있다.The race information obtaining unit is configured to obtain the inputted subject's race information. In this case, race information may be acquired from the database stored in the memory 130 , and race information may be received and obtained from the server 200 through the communication unit 110 .

가중치 위험도 모델 결정부는 피험자의 인종 정보에 대응하는 가중치 위험도 모델을 결정하기 위한 구성이다. 유전 위험점수 산출부는 결정된 가중치 위험도 모델을 이용해 유전 위험점수를 산출한다.The weighted risk model determining unit is configured to determine the weighted risk model corresponding to the subject's race information. The genetic risk score calculator calculates the genetic risk score using the determined weighted risk model.

위험등급 결정부(152)는 피험자의 가중치 위험도 모델을 이용해 위험점수의 등급을 결정하기 위한 구성이다.The risk grade determining unit 152 is configured to determine the grade of the risk score by using the subject's weighted risk model.

유전 위험점수 산출부(151) 및 위험등급 결정부(152) 각각은 컴퓨팅 장치 상에서 프로그램을 실행하기 위해 필요한 프로세서(150) 등에 의해 각각 구현될 수 있다. 이처럼 유전 위험점수 산출부(151) 및 위험등급 결 정부(152)는 물리적으로 독립된 각각의 구성에 의해 구현될 수도 있고, 하나의 프로세서 내에서 기능적으로 구분되는 형태로 구현될 수도 있다.Each of the genetic risk score calculator 151 and the risk grade determiner 152 may be implemented by the processor 150 or the like required to execute a program on the computing device. As such, the genetic risk score calculating unit 151 and the risk grade determining unit 152 may be implemented by physically independent components, or may be implemented in a functionally separate form within one processor.

한편, 도 1 및 도 2에서는 서버(200)는 산출장치(100)와 별도의 구성으로 구현된 것을 도시하였으나, 본 발명의 일 실시예에 따르면 서버(200)는 산출장치(100)와 하나의 구성으로 구현될 수 있다. 또한, 외부 기관의 전자 장치(301)가 서버(200) 및 산출장치(100)의 기능을 수행할 수도 있다.Meanwhile, in FIGS. 1 and 2 , it is illustrated that the server 200 is implemented as a configuration separate from the calculation device 100 , but according to an embodiment of the present invention, the server 200 is configured with the calculation device 100 and one It can be implemented as a configuration. Also, the electronic device 301 of an external organization may perform the functions of the server 200 and the calculation device 100 .

예를 들어, 서버(200)에서 실행되는 일련의 프로세스는 산출장치(100)에서 실행될 수 있다. 즉, 산출장치(100)는 외부 기관의 전자 장치(302), 사용자 단말기(301) 등으로부터 직접 데이터를 수신하고, 데이터를 바탕으로 피험자 정보에 대응하도록 가중치를 상이하게 적용하는 가중치 위험도 모델을 결정할 수 있다.For example, a series of processes executed in the server 200 may be executed in the calculation device 100 . That is, the calculator 100 receives data directly from the electronic device 302 of an external institution, the user terminal 301, etc., and determines a weight risk model that applies different weights to correspond to subject information based on the data. can

이하에서는 설명의 편의를 위해, 서버(200)에서 수행되는 모든 프로세스가 산출장치(100)에서 수행되는 실시예를 전제로 설명하기로 한다.Hereinafter, for convenience of description, an embodiment in which all processes performed in the server 200 are performed in the calculation device 100 will be described.

도 3은 본 발명의 일 실시예에 따른 유전 위험점수를 산출하는 흐름도이다.3 is a flowchart of calculating a genetic risk score according to an embodiment of the present invention.

산출장치(100)는 피험자에 대한 유전 정보를 입력 받을 수 있다(S300). 이때, 유전 정보는 전립선암과 관련된 단일염기다형성(SNP) 및 SNP를 포함하는 연속적인 염기서열을 포함할 수 있다. The calculator 100 may receive genetic information about the subject ( S300 ). In this case, the genetic information may include a single nucleotide polymorphism (SNP) associated with prostate cancer and a continuous nucleotide sequence including the SNP.

산출장치(100)는 피험자에 대한 인종 정보를 획득할 수 있다(S310). 이때, 인종 정보는 사용자가 직접 산출장치(100)에 입력한 것일 수 있다.The calculator 100 may obtain race information about the subject ( S310 ). In this case, the race information may be directly input by the user into the calculation device 100 .

산출장치(100)는 획득한 인종 정보에 대응하는 가중치 위험도 모델을 결정할 수 있다(S320). 예를 들어, 획득한 피험자의 인종 정보가 유럽인인 경우, 산출장치(100)는 유럽인 전립선암 위험점수와 관련성이 높은 특정 유전 변이에 가중치를 부여한 산출 모델을 가중치 위험도 모델로 결정할 수 있다.The calculator 100 may determine a weighted risk model corresponding to the acquired race information ( S320 ). For example, when the acquired subject's race information is European, the calculator 100 may determine a calculation model in which a weight is assigned to a specific genetic mutation highly related to a European prostate cancer risk score as a weighted risk model.

산출장치(100)는 인종 정보에 대응하는 가중치 위험도 모델을 통해서 유전 위험점수를 산출할 수 있다(S330). 본 발명의 일 실시예에 따르면, 산출장치(100)는 산출된 유전 위험점수를 ROC(Receiver Operating Characteristics)를 통해 검증하고, 검증 결과, AUC(Area under the curve) 값이 가장 높은 가중치 위험도 모델을 최종 가중치 위험도 모델로 결정할 수 있다.The calculator 100 may calculate a genetic risk score through a weighted risk model corresponding to race information ( S330 ). According to an embodiment of the present invention, the calculator 100 verifies the calculated genetic risk score through Receiver Operating Characteristics (ROC), and as a result of the verification, selects a weighted risk model having the highest Area under the curve (AUC) value. It can be determined by the final weighted risk model.

한편, 산출장치(100)는 피험자의 유전 정보를 바탕으로 가중치 위험도 모델을 결정할 수 있다. 이때, 산출장치(100)는 인종간의 유전자 비율 차이를 비교하여 그에 대응하는 가중치 위험도 모델을 결정할 수 있다. 예를 들어, 피험자의 인종 정보가 유럽인인 경우, 산출장치(100)는 유럽인 전립선암 위험도와 관련성이 높은 특정 유전 변이에 가중치를 부여한 가중치 위험도 모델을 결정할 수 있다. 인종간의 유전자 비율 비교는 2010년 사이언스지에 공지된 논문 'A Draft Sequence of the Neandertal Genome'의 방법을 이용할 수 있으나, 이에 한정하지 않는다.Meanwhile, the calculator 100 may determine a weighted risk model based on the subject's genetic information. In this case, the calculator 100 may determine a weighted risk model corresponding thereto by comparing the difference in the genetic ratio between races. For example, when the subject's race information is European, the calculator 100 may determine a weighted risk model in which weights are given to specific genetic mutations highly related to European prostate cancer risk. To compare the gene ratio between races, the method of 'A Draft Sequence of the Neandertal Genome' published in Science in 2010 may be used, but is not limited thereto.

산출장치(100)는 가중치 위험도 모델을 통해 유전 위험점수를 산출할 수 있다. 그리고, 산출장치(100)는 산출된 유전 위험점수가 고위험 그룹에 포함되는지 여부를 판단할 수 있다. The calculator 100 may calculate the genetic risk score through the weighted risk model. In addition, the calculator 100 may determine whether the calculated genetic risk score is included in the high risk group.

도 4는 본 발명의 일 실시예에 따른 다중유전 위험점수를 산출하는 방법을 설명하기 위한 흐름도이다.4 is a flowchart illustrating a method of calculating a multiple genetic risk score according to an embodiment of the present invention.

산출장치(100)는 입력부(120)에 의해 피험자의 유전 정보를 입력받고, 프로세서(150)에 의해 상기 유전 정보에 포함된 SNP(단일염기다형성)를 이용하여 SNP 마커 세트를 결정한다(S410).The calculation device 100 receives the genetic information of the subject by the input unit 120, and determines the SNP marker set by using the SNP (single nucleotide polymorphism) included in the genetic information by the processor 150 (S410) .

SNP 마커 세트는, rs72725879, rs4242384, rs11263763, rs339331, rs1512268, rs11125927, rs140783917, rs7489409, rs10896449, rs7463326, rs8023793, rs2659124, rs10993994, rs77167534, rs7591218, rs1983891, rs2242652, rs11817544, rs10505477, rs817872, rs56159348, rs4711748, rs2238776, rs6955627, rs2660753, rs1283104 및 rs7153648중 적어도 하나를 포함한다. SNP 마커 세트는 상술한 총 27개의 마커 세트들의 조합으로 이루어질 수 있으며, 최대 27개를 포함할 수 있다.SNP 마커 세트는, rs72725879, rs4242384, rs11263763, rs339331, rs1512268, rs11125927, rs140783917, rs7489409, rs10896449, rs7463326, rs8023793, rs2659124, rs10993994, rs77167534, rs7591218, rs1983891, rs2242652, rs11817544, rs10505477, rs817872, rs56159348, rs4711748, rs2238776 , rs6955627, rs2660753, rs1283104 and rs7153648. The SNP marker set may consist of a combination of the above-described 27 marker sets in total, and may include a maximum of 27 marker sets.

산출장치(100)는 상기 SNP 마커 세트에 대한 가중치를 결정한다(S430). 산출장치(100)는 상기 SNP 마커 세트에 포함된 SNP 마커 각각에 대하여 가중치를 결정할 수 있다.The calculator 100 determines a weight for the SNP marker set (S430). The calculator 100 may determine a weight for each SNP marker included in the SNP marker set.

SNP 마커의 가중치는 SNP 마커 각각의 전립선암 발병 확률에 대한 오즈비 (odds ratio, OR)에 자연 로그(ln)를 취한 값이다. The weight of the SNP marker is a value obtained by taking the natural logarithm (ln) of the odds ratio (OR) of the prostate cancer incidence probability of each SNP marker.

바람직하게, rs72725879의 가중치는 0.445 ~ 0.589, rs4242384의 가중치는 0.487 ~ 0.645, rs11263763의 가중치는 0.284 ~ 0.431, rs339331의 가중치는 0.188 ~ 0.323, rs1512268의 가중치는 0.178 ~ 0.31, rs11125927의 가중치는 0.153 ~ 0.29, rs140783917의 가중치는 0.201 ~ 0.381, rs7489409의 가중치는 0.13 ~ 0.256, rs10896449의 가중치는 0.226 ~ 0.454, rs7463326의 가중치는 0.153 ~ 0.324, rs8023793의 가중치는 0.111 ~ 0.244, rs2659124의 가중치는 0.103 ~ 0.233, rs10993994의 가중치는 0.087 ~ 0.211, rs77167534의 가중치는 0.106 ~ 0.26, rs7591218의 가중치는 0.092 ~ 0.234, rs1983891의 가중치는 0.08 ~ 0.209, rs2242652의 가중치는 0.098 ~ 0.262, rs11817544의 가중치는 0.096 ~ 0.259, rs10505477의 가중치는 0.067 ~ 0.193, rs817872의 가중치는 0.068 ~ 0.2, rs56159348의 가중치는 0.089 ~ 0.269, rs4711748의 가중치는 0.055 ~ 0.18, rs2238776의 가중치는 0.055 ~ 0.181, rs6955627의 가중치는 0.06 ~ 0.198, rs2660753의 가중치는 0.058 ~ 0.196, rs1283104의 가중치는 0.05 ~ 0.176 및 rs7153648의 가중치는 0.06 ~ 0.218일 수 있다.Preferably, the weight of rs72725879 is between 0.445 and 0.589, the weight of rs4242384 is between 0.487 and 0.645, the weight of rs11263763 is between 0.284 and 0.431, the weight of rs339331 is between 0.188 and 0.323, the weight of rs1512268 is between 0.178 and 0.31, and the weight of rs11125927 is between 0.153 and 0.29. , rs140783917 has a weight of 0.201~0.381, rs7489409 has a weight of 0.13~0.256, rs10896449 has a weight of 0.226~0.454, rs7463326 has a weight of 0.153~0.324, rs8023793 has a weight of 0.111~0.244, rs2659124 has a weight of 0.103~0.233, rs10993994 has a weight of 0.087 to 0.211, rs77167534 is 0.106 to 0.26, rs7591218 is 0.092 to 0.234, rs1983891 is 0.08 to 0.209, rs2242652 is 0.098 to 0.262, rs11817544 is 0.096 to 0.259, rs10505477 is 0.067 ~ 0.193, rs817872 has a weight of 0.068 ~ 0.2, rs56159348 has a weight of 0.089 ~ 0.269, rs4711748 has a weight of 0.055 ~ 0.18, rs2238776 has a weight of 0.055 ~ 0.181, rs6955627 has a weight of 0.06 ~ 0.198, rs2660753 has a weight of 0.058 ~ 0.196, the weight of rs1283104 may be 0.05 ~ 0.176, and the weight of rs7153648 may be 0.06 ~ 0.218.

더욱 바람직하게, rs72725879의 가중치는 0.517, rs4242384의 가중치는 0.566, rs11263763의 가중치는 0.357, rs339331의 가중치는 0.255, rs1512268의 가중치는 0.244, rs11125927의 가중치는 0.221, rs140783917의 가중치는 0.291, rs7489409의 가중치는 0.193, rs10896449의 가중치는 0.339, rs7463326의 가중치는 0.239, rs8023793의 가중치는 0.178, rs2659124의 가중치는 0.168, rs10993994의 가중치는 0.149, rs77167534의 가중치는 0.183, rs7591218의 가중치는 0.163, rs1983891의 가중치는 0.144, rs2242652의 가중치는 0.18, rs11817544의 가중치는 0.177, rs10505477의 가중치는 0.13, rs817872의 가중치는 0.134, rs56159348의 가중치는 0.179, rs4711748의 가중치는 0.118, rs2238776의 가중치는 0.118, rs6955627의 가중치는 0.129, rs2660753의 가중치는 0.127, rs1283104의 가중치는 0.112 및 rs7153648의 가중치는 0.139일 수 있다. More preferably, the weight of rs72725879 is 0.517, the weight of rs4242384 is 0.566, the weight of rs11263763 is 0.357, the weight of rs339331 is 0.255, the weight of rs1512268 is 0.244, the weight of rs11125927 is 0.221, the weight of rs140783917 is 0.291, the weight of rs7489409 is 0.193, rs10896449 has a weight of 0.339, rs7463326 has a weight of 0.239, rs8023793 has a weight of 0.178, rs2659124 has a weight of 0.168, rs10993994 has a weight of 0.149, rs77167534 has a weight of 0.183, rs7591218 has a weight of 0.163, rs1983891 has a weight of 0.144, rs2242652 has a weight of 0.18, rs11817544 has a weight of 0.177, rs10505477 has a weight of 0.13, rs817872 has a weight of 0.134, rs56159348 has a weight of 0.179, rs4711748 has a weight of 0.118, rs2238776 has a weight of 0.118, rs6955627 has a weight of 0.129, a weight of rs2660753 is The weight may be 0.127, the weight of rs1283104 may be 0.112, and the weight of rs7153648 may be 0.139.

일 예를 들어, 도 5을 참조하면, SNP 마커 rs4242384의 오즈비(OR)는 1.761이고, 이것에 자연로그를 취한 값인 가중치는 0.566에 해당할 수 있다. For example, referring to FIG. 5 , the odds ratio (OR) of the SNP marker rs4242384 is 1.761, and the weight, which is a value obtained by taking the natural logarithm of this, may correspond to 0.566.

산출장치(100)는 가중치를 이용하여 다중유전 위험점수를 산출한다(S450).The calculator 100 calculates a multiple genetic risk score using the weight (S450).

다중유전 위험점수는 SNP 마커 세트의 각각 마커의 위험대립 유전자의 수에 가중치를 곱한 값들의 평균이다. The multiple genetic risk score is the average of values multiplied by the number of risk alleles of each marker in the SNP marker set.

예를 들어, SNP 마커 세트에 rs4242384와 rs72725879가 포함되는 경우, rs4242384의 위험대립 유전자의 수에 rs4242384의 가중치 0.566)를 곱한 값과, rs72725879의 위험대립 유전자의 수에 rs72725879의 가중치(0.517)를 곱한 값의 평균값이 다중유전 위험점수일 수 있다. For example, if the SNP marker set includes rs4242384 and rs72725879, the number of risk alleles of rs4242384 multiplied by the weight of rs4242384 (0.566) and the number of risk alleles of rs72725879 multiplied by the weight of rs72725879 (0.517). The average value of the values may be a multiple genetic risk score.

도 5은 본 발명의 일 실시예에 따른 유전 위험점수 계산에 포함되는 후보 유전 변이 목록을 도시한 도면이다.5 is a diagram illustrating a list of candidate genetic mutations included in the genetic risk score calculation according to an embodiment of the present invention.

서버(200)는 GWAS을 통해 전립선암과 연관된 유전 변이들을 도출할 수 있다. 예를 들어, 2,702 명의 글리슨점수 (Gleason score, GS) 7점 (3+4점) 이상의 전립선암 환자 및 7,486 명의 정상 대조군으로부터 로지스틱 회귀 분석 모형에 연령을 추가하여 분석할 수 있다. GWAS(genome-wide association study, 전장유전체연관분석)는 일반적으로 Case(관심 형질을 가진 집단, 환자군)와 Control (형질을 갖지 않는 집단, 정상군)의 두 집단의 유전 정보를 얻은 후에 서로 비교하여, case에서 더 많은 빈도를 갖는, 즉 연관성을 가진 SNP 마커를 발굴하기 위한 단계이다. GWAS 분석 결과, 통계적 유의성(p) < 1x10-3 을 보인 유전 변이들을 대상으로 각 linkage disequilibrium block (LD 블록) 내에 있는 SNP들 중에 대표 SNP들을 하나씩 추출하고, 그 결과 27개의 전립선암 관련 SNP들을 최종적으로 추출할 수 있다. 연관불균형(LD, Linkage Disequilibrium)은 유전형의 재배열 과정에서 서로 거리가 가까운 유전자끼리 유전형이 섞이지 않고 모자이크 패턴으로 함께 이동하게 되며, LD block을 형성하는 것이다. 같은 LD block에 포함된 위치에 대해서는 연관성 분석을 하게 되면, 비슷한 연관성의 강도 및 통계적 유의수준 (p값)을 보인다.The server 200 may derive genetic mutations associated with prostate cancer through the GWAS. For example, it can be analyzed by adding age to the logistic regression model from 2,702 prostate cancer patients with a Gleason score (GS) of 7 points (3+4 points) and 7,486 normal controls. GWAS (genome-wide association study) generally compares the genetic information of two groups, Case (group with the trait of interest, patient group) and Control (group without trait, normal group), and compares them with each other. , it is a step to discover SNP markers with more frequency, ie, association, in the case. As a result of GWAS analysis, one representative SNP was extracted from among the SNPs in each linkage disequilibrium block (LD block) for genetic mutations with statistical significance (p) < 1x10 -3 , and as a result, 27 prostate cancer-related SNPs were finally obtained. can be extracted with In linkage disequilibrium (LD), genotypes that are close to each other do not mix with each other in the process of rearrangement of genotypes, but move together in a mosaic pattern, forming an LD block. When association analysis is performed on positions included in the same LD block, similar association strength and statistical significance (p-value) are shown.

결론적으로, 서버(200)는 전립선암과 관련된 주요 SNP 유전 변이 27개를 추출할 수 있다. 도 5를 참조하면, 주요 유전 변이 SNP는 rs72725879, rs4242384, rs11263763, rs339331, rs1512268, rs11125927, rs140783917, rs7489409, rs10896449, rs7463326, rs8023793, rs2659124, rs10993994, rs77167534, rs7591218, rs1983891, rs2242652, rs11817544, rs10505477, rs817872, rs56159348, rs4711748, rs2238776, rs6955627, rs2660753, rs1283104 및 rs7153648 인 것을 확인할 수 있다.In conclusion, the server 200 can extract 27 major SNP genetic mutations related to prostate cancer. Referring to FIG. 5 , the major genetic variant SNPs are rs72725879, rs4242384, rs11263763, rs339331, rs1512268, rs11125927, rs140783917, rs7489409, rs10896449, rs7463326, rs8023793, rs26591124, rs77447754 , rs727847754 rs19759124, rs2247899399. , rs56159348, rs4711748, rs2238776, rs6955627, rs2660753, rs1283104 and rs7153648 can be confirmed.

본 발명의 일 실시예에 따른 가중치 위험도 모델은 각각의 SNP에 전립선암과 관련된 오즈비(OR)를 기준으로 가중치를 부여할 수 있다. 예를 들면, SNP 중 rs4242384의 전립선암에 대한 오즈비는 1.761이므로, rs4242384에 대하여 가중치(weight)로 ln(OR)의 결과인 0.566을 부여할 수 있다.In the weighted risk model according to an embodiment of the present invention, weights may be assigned to each SNP based on an odds ratio (OR) related to prostate cancer. For example, since the odds ratio of rs4242384 for prostate cancer among SNPs is 1.761, 0.566, which is the result of ln(OR), can be given as a weight to rs4242384.

상술한 가중치를 바탕으로 본 발명의 일 실시예에 따른 27개의 SNP 마커를 고려한 GRS(genetic risk score)는 아래의 식과 같을 수 있다.A genetic risk score (GRS) in consideration of 27 SNP markers according to an embodiment of the present invention based on the above-described weights may be as follows.

wGRS(weighted genetic risk score)=(0.517*X1+0.566*X2+…+0.139*X27)/(27*2)wGRS(weighted genetic risk score)=(0.517*X1+0.566*X2+…+0.139*X27)/(27*2)

이때, X1 내지 X27는 각각의 SNP 마커(rs72725879, rs4242384, rs11263763, rs339331, rs1512268, rs11125927, rs140783917, rs7489409, rs10896449, rs7463326, rs8023793, rs2659124, rs10993994, rs77167534, rs7591218, rs1983891, rs2242652, rs11817544, rs10505477, rs817872, rs56159348, rs4711748, rs2238776, rs6955627, rs2660753, rs1283104, rs7153648, rs12500426, rs6545977 및 rs56103503)에 대한 위험 대립유전자의 개수에 대응한다. 구체적으로, 서버(200)는 유전 정보에 포함된 각각의 SNP에 대해 위험대립 유전자(risk allele)의 개수에 따라, 0개 (Xn = 0), 1개 (Xn = 1), 또는 2개 (Xn = 2)의 세부 점수를 부여할 수 있다. 즉, 가중치 위험도 모델은 각각의 대립유전자 수에 비례하는 가중치를 부여하도록 설정될 수 있다.At this time, X1 to X27 are each of the SNP markers (rs72725879, rs4242384, rs11263763, rs339331, rs1512268, rs11125927, rs140783917, rs7489409, rs10896449, rs7463326, rs8023793, rs26549124, rs77167393, rs175759124, rs22787167534, rs1759124, rs22787443994, rs1512268, rs10993994 , rs56159348, rs4711748, rs2238776, rs6955627, rs2660753, rs1283104, rs7153648, rs12500426, rs6545977 and rs56103503). Specifically, the server 200 is 0 (Xn = 0), 1 (Xn = 1), or 2 ( A detailed score of Xn = 2) can be given. That is, the weighted risk model can be set to give a weight proportional to the number of each allele.

나아가, 서버(200)는 PRS(Polygenic risk score, 다중유전위험점수)를 계산할 수 있다. 서버(200)는 총 27개의 변이들의 조합들에 대한 전립선암의 오즈비(odds ratio, OR)에 자연 로그(ln)를 취한 값을 각 변이들의 가중치로 선정한다. 개개인의 PRS는 각각의 유전 변이에 대하여 위험대립 유전자의 수(0~2개)에 가중치로 ln(OR)을 곱한 값을 합산한 다음 산출에 포함된 유전 변이의 총 개수로 나눈 값이다. 다시 말해, SNP 마커 각각에 대하여 위험대립 유전자의 수에 가중치를 곱한 값들의 평균으로 PRS를 산출할 수 있다.Furthermore, the server 200 may calculate a polygenic risk score (PRS). The server 200 selects a value obtained by taking the natural logarithm (ln) of an odds ratio (OR) of prostate cancer for a total of 27 combinations of variants as a weight of each variant. Individual PRS is the sum of the number of risk alleles (0 to 2) multiplied by ln(OR) as a weight for each genetic mutation, and then divided by the total number of genetic mutations included in the calculation. In other words, for each SNP marker, the PRS can be calculated as the average of values obtained by multiplying the number of risk alleles by a weight.

Figure pat00001
,
Figure pat00001
,

Figure pat00002
= ln(OR)
Figure pat00002
= ln(OR)

여기서, Xij는 위험 대립유전자의 수(number of risk alleles for the jth variant (0,1 or 2) of ith individual),

Figure pat00003
는 가중치(weighting) for the jth variant), n은 PRS를 산출하기 위한 총 대립유전자 수(총 SNP 마커 개수의 2배)이다.where X ij is the number of risk alleles for the j th variant (0,1 or 2) of i th individual,
Figure pat00003
is weighting for the j th variant), and n is the total number of alleles (twice the total number of SNP markers) for calculating PRS.

다만 이는 일 실시예에 불과하고, 본 발명의 서버(200)는 다양한 유전 변이 개수로 GRS 식을 결정할 수 있다. 예를 들어, 상술한 가중치 위험도 모델은 27개의 유전 변이 모두에 대한 GRS인 반면, 서버(200)는 피험자의 정보에 따라 관련성이 높은 최적의 SNP의 조합에 따라 GRS 식을 결정할 수 있다.However, this is only an embodiment, and the server 200 of the present invention may determine the GRS expression based on the number of various genetic mutations. For example, while the above-described weighted risk model is a GRS for all 27 genetic mutations, the server 200 may determine the GRS expression according to the optimal combination of highly relevant SNPs according to the subject's information.

예를 들어, 서버(200)는 피험자의 인종 정보에 대응하는 SNP 마커 세트만을 이용하여 가중치를 부여할 수 있고, 피험자의 생활 습관 정보에 대응하는 SNP 마커 세트만을 이용하여 가중치를 부여할 수 있다. 또는, 서버(200)는 피험자의 인종 정보 및 생활 습관 정보에 대응하는 SNP 마커 세트 모두를 이용하여 가중치를 부여할 수 있다.For example, the server 200 may assign weights using only the SNP marker set corresponding to the subject's race information, and may assign weights using only the SNP marker set corresponding to the subject's lifestyle information. Alternatively, the server 200 may assign weights using all of the SNP marker sets corresponding to the subject's race information and lifestyle information.

상술한 최적의 SNP 마커 세트는 데이터베이스를 이용하여 인공지능 모델을 통해 결정될 수 있으나, 이는 일 예에 불과하고 다양한 방법을 통해 결정된 것일 수 있다.The above-described optimal SNP marker set may be determined through an artificial intelligence model using a database, but this is only an example and may be determined through various methods.

도 6은 본 발명의 일 실시예에 따른 유전 변이의 개수에 따른 예측력을 비교하기 위한 ROC(Receiver Operating Characteristic) 곡선을 도시한 도면이다.6 is a diagram illustrating a receiver operating characteristic (ROC) curve for comparing predictive power according to the number of genetic variations according to an embodiment of the present invention.

ROC 곡선은 예측 성능을 평가하기 위하여 시각화한 도표이다. 예측 성능은 곡선 아래의 면적 (Area under the curve, AUC)으로 평가한다. ROC는 각 평가 기준(threshold)에 따른 특이도(specificity) 와 민감도(sensitivity)를 각각 X, Y 좌표로 나타내어 선으로 연결하여 나타낸다.The ROC curve is a graph visualized to evaluate the prediction performance. Prediction performance is evaluated by Area under the curve (AUC). ROC represents specificity and sensitivity according to each evaluation criterion in X and Y coordinates, respectively, and is connected with a line.

이때, 특이도는 질병이 없는 환자를 질병이 없다고 예측할 비율, 민감도는 질병이 있을 때 있다고 예측할 확률로 정의되며, 두 지표는 서로 트레이드 오프(trade-off) 관계를 보인다. 곡선의 X, Y 좌표는 (0,0)에서 (1,1) 까지의 값을 가지며, 예측력이 좋을수록 AUC 값은 1에 가까운 값을 가진다.In this case, specificity is defined as the ratio of predicting disease-free patients without disease, and sensitivity is defined as the probability of predicting the presence of disease when the two indicators have a trade-off relationship with each other. The X, Y coordinates of the curve have values from (0,0) to (1,1), and the better the predictive power, the closer the AUC value is to 1.

본 발명의 일 실시예에 따르면, 산출장치(100)는 ROC를 유전 위험점수의 기준(threshold)에 따라 민감도와 특이도가 어떻게 달라지는지 시각화할 수 있고, 곡선의 AUC를 산출하여 모형의 성능을 평가할 수 있다. 또한, 본 발명의 산출장치(100)는 통계적 유의 수준에 따라 포함된 유전 변이의 개수에 따라 전립선암 환자군과 정상군을 얼마나 잘 구분하는지를 각각 나타내어 비교할 수 있다.According to an embodiment of the present invention, the calculator 100 can visualize how the sensitivity and specificity of the ROC change according to the threshold of the genetic risk score, and calculate the AUC of the curve to evaluate the model's performance. can be evaluated In addition, the calculating device 100 of the present invention may indicate and compare how well the prostate cancer patient group and the normal group are distinguished according to the number of genetic mutations included according to the statistical significance level.

한편, 전립선암 환자 및 정상 대조군으로 구성된 독립적인 데이터 세트에 가중치 위험도 모델을 적용한 결과, PRS의 전립선암 위험점수에 대한 예측 성능은 AUC 0.698로 나타났다.On the other hand, as a result of applying a weighted risk model to an independent data set consisting of prostate cancer patients and normal controls, the predictive performance of PRS on the prostate cancer risk score was AUC 0.698.

도 7은 본 발명의 일 실시예에 따른 가중치를 부여한 모델(weighted model)의 GRS 분포를 설명하기 위한 도면이다.7 is a diagram for explaining a GRS distribution of a weighted model according to an embodiment of the present invention.

본 발명의 산출장치(100)는 예를 들어 GRS를 기준으로 4분위 또는 5분위 등 다양하게 그룹화할 수 있다. 산출장치(100)는 가중치 위험도 모델을 이용해 피험자에 대한 유전 위험점수를 산출하면 해당 유전 위험점수가 어느 그룹에 속하는지 판단할 수 있다.The calculator 100 according to the present invention may variously group the quartiles or quintiles based on the GRS. The calculator 100 may determine which group the genetic risk score belongs to when calculating the genetic risk score for the subject using the weighted risk model.

본 발명의 일 실시예에 따르면, 산출장치(100)는 유전 위험점수가 고위험 그룹으로 판단되는 경우, 산출장치(100)는 해당 피험자를 집중관리 대상자로 설정할 수 있다. 산출장치(100)는 집중관리 대상자로 설정된 피험자에게 생활 습관 개선, 주기적인 전립선암 진단 제안 등 다양한 가이드라인을 제시할 수 있다.According to an embodiment of the present invention, when it is determined that the genetic risk score is a high-risk group, the calculator 100 may set the subject as a subject for intensive management. The calculator 100 may present various guidelines, such as lifestyle improvement, periodic prostate cancer diagnosis, and the like to a subject set as a subject for intensive management.

본 발명의 또 다른 실시예에 따르면, 산출장치(100)는 유전 위험점수가 저위험 그룹으로 판단되는 경우, 해당 피험자를 집중관리 대상자에서 해제할 수 있다.According to another embodiment of the present invention, when it is determined that the genetic risk score is a low risk group, the calculator 100 may release the subject from the intensive management target.

한편, 상술한 본 발명의 다양한 실시예들에 따른 방법들은, 기존 전자 장치에 설치 가능한 어플리케이션 형태로 구현될 수 있다.Meanwhile, the above-described methods according to various embodiments of the present invention may be implemented in the form of an application that can be installed in an existing electronic device.

또한, 상술한 본 발명의 다양한 실시예들에 따른 방법들은, 기존 전자 장치에 대한 소프트웨어 업그레이드, 또는 하드웨어 업그레이드 만으로도 구현될 수 있다.In addition, the above-described methods according to various embodiments of the present invention may be implemented only by upgrading software or hardware of an existing electronic device.

또한, 상술한 본 발명의 다양한 실시예들은 전자 장치에 구비된 임베디드 서버, 또는 전자 장치의 외부 서버를 통해 수행되는 것도 가능하다.In addition, various embodiments of the present invention described above may be performed through an embedded server provided in the electronic device or an external server of the electronic device.

한편, 본 발명의 일 실시예에 따르면, 이상에서 설명된 다양한 실시예들은 소프트웨어(software), 하드웨어 (hardware) 또는 이들의 조합을 이용하여 컴퓨터(computer) 또는 이와 유사한 장치로 읽을 수 있는 기록매체 (computer readable recording medium)에 저장된 명령어를 포함하는 소프트웨어로 구현될 수 있다. 일부 경우에 있어 본 명세서에서 설명되는 실시예들이 프로세서 자체로 구현될 수 있다. 소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 동작을 수행할 수 있다.On the other hand, according to an embodiment of the present invention, the various embodiments described above are a recording medium (readable by a computer or a similar device) using software, hardware, or a combination thereof. It may be implemented as software including instructions stored in a computer readable recording medium). In some cases, the embodiments described herein may be implemented by the processor itself. According to the software implementation, embodiments such as the procedures and functions described in this specification may be implemented as separate software modules. Each of the software modules may perform one or more functions and operations described herein.

한편, 컴퓨터(computer) 또는 이와 유사한 장치는, 저장 매체로부터 저장된 명령어를 호출하고, 호출된 명령어에 따라 동작할 수 있는 장치로서, 개시된 실시예들에 따른 장치를 포함할 수 있다. 명령이 프로세서에 의해 실행될 경우, 프로세서가 직접, 또는 프로세서의 제어 하에 다른 구성요소들을 이용하여 명령에 해당하는 기능을 수행할 수 있다. 명령은 컴파일러 또는 인터프리터에 의해 생성 또는 실행되는 코드를 포함할 수 있다.On the other hand, a computer or a similar device is a device capable of calling a stored instruction from a storage medium and operating according to the called instruction, and may include the apparatus according to the disclosed embodiments. When the instruction is executed by the processor, the processor may perform a function corresponding to the instruction by using other components directly or under the control of the processor. Instructions may include code generated or executed by a compiler or interpreter.

기기로 읽을 수 있는 기록매체는, 비일시적 기록매체(non-transitory computer readable recording medium)의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장매체가 신호(signal)를 포함하지 않으며 실재(tangible)한다는 것을 의미할 뿐 데이터가 저장매체에 반영구적 또는 임시적으로 저장됨을 구분하지 않는다. 이때 비일시적 컴퓨터 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 비일시적 컴퓨터 판독 가능 매체의 구체적인 예로는, CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등이 있을 수 있다.The device-readable recording medium may be provided in the form of a non-transitory computer readable recording medium. Here, 'non-transitory' means that the storage medium does not include a signal and is tangible, and does not distinguish that data is semi-permanently or temporarily stored in the storage medium. In this case, the non-transitory computer-readable medium refers to a medium that stores data semi-permanently, rather than a medium that stores data for a short moment, such as a register, cache, memory, etc., and can be read by a device. Specific examples of the non-transitory computer-readable medium may include a CD, DVD, hard disk, Blu-ray disk, USB, memory card, ROM, and the like.

전술한 본 발명은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드(또는, 애플리케이션이나 소프트웨어)로서 구현하는 것이 가능하다. The present invention described above can be implemented as computer-readable code (or application or software) on a medium in which a program is recorded.

컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 컴퓨터는 프로세서 또는 제어부를 포함할 수도 있다. 따라서, 상술한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.The computer-readable medium includes all types of recording devices in which data readable by a computer system is stored. Examples of computer-readable media include Hard Disk Drive (HDD), Solid State Disk (SSD), Silicon Disk Drive (SDD), ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, etc. There is also a carrier wave (eg, transmission over the Internet) that is implemented in the form of. In addition, the computer may include a processor or a control unit. Accordingly, the above description should not be construed as restrictive in all respects but as exemplary. The scope of the present invention should be determined by a reasonable interpretation of the appended claims, and all modifications within the equivalent scope of the present invention are included in the scope of the present invention.

이와 같이 본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 당해 기술분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 다른 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 청구범위의 기술적 사상에 의하여 정해져야 할 것이다.As such, the present invention has been described with reference to the embodiments shown in the drawings, which are merely exemplary, and those skilled in the art will understand that various modifications and equivalent other embodiments are possible therefrom. . Therefore, the true technical protection scope of the present invention should be determined by the technical spirit of the appended claims.

Claims (11)

입력부 및 프로세서를 포함하는 전립선암 위험점수 산출장치의 위험점수 산출방법에 있어서,
상기 입력부에 의해, 피험자의 유전 정보를 입력받는 단계;
상기 프로세서에 의해, 상기 유전 정보에 포함된 SNP(단일염기다형성)를 이용하여 SNP 마커 세트를 결정하는 단계;
상기 프로세서에 의해, 상기 SNP 마커 세트에 포함된 SNP 마커 각각에 대하여 가중치를 결정하고, 상기 가중치를 기초로 가중치 위험도 모델을 결정하는 단계; 및
상기 프로세서에 의해, 상기 가중치 위험도 모델을 이용하여 전립선암 유전 위험점수를 산출하는 단계를 포함하며,
상기 SNP 마커 각각의 가중치는 SNP 마커 각각에 대한 전립선암의 발병 확률에 대한 오즈비(odds ratio, OR)에 자연 로그(ln)를 취한 값인 것을 특징으로 하는 위험점수 산출방법.
In the risk score calculation method of the prostate cancer risk score calculation device including an input unit and a processor,
receiving, by the input unit, genetic information of a subject;
determining, by the processor, a set of SNP markers using SNP (single nucleotide polymorphism) included in the genetic information;
determining, by the processor, a weight for each SNP marker included in the SNP marker set, and determining a weighted risk model based on the weight; and
Comprising, by the processor, calculating a prostate cancer genetic risk score using the weighted risk model,
The weight of each of the SNP markers is a value obtained by taking a natural logarithm (ln) of an odds ratio (OR) of the probability of occurrence of prostate cancer for each of the SNP markers.
제1항에 있어서,
상기 전립선암 유전 위험점수는,
SNP 마커 각각에 대하여 위험대립 유전자의 수에 가중치를 곱한 값의 평균인 것을 특징으로 하는 위험점수 산출방법.
According to claim 1,
The prostate cancer genetic risk score is,
A risk score calculation method, characterized in that it is an average of a value obtained by multiplying the number of risk alleles for each SNP marker by a weight.
제2항에 있어서,
상기 SNP 마커 세트에는 rs72725879, rs4242384, rs11263763, rs339331, rs1512268, rs11125927, rs140783917, rs7489409, rs10896449, rs7463326, rs8023793, rs2659124, rs10993994, rs77167534, rs7591218, rs1983891, rs2242652, rs11817544, rs10505477, rs817872, rs56159348, rs4711748, rs2238776, rs6955627, rs2660753, rs1283104 및 rs7153648로 이루어진 군으로부터 적어도 하나가 포함되는 것을 특징으로 하는 위험점수 산출방법.
3. The method of claim 2,
상기 SNP 마커 세트에는 rs72725879, rs4242384, rs11263763, rs339331, rs1512268, rs11125927, rs140783917, rs7489409, rs10896449, rs7463326, rs8023793, rs2659124, rs10993994, rs77167534, rs7591218, rs1983891, rs2242652, rs11817544, rs10505477, rs817872, rs56159348, rs4711748, rs2238776 , rs6955627, rs2660753, rs1283104 and rs7153648 risk score calculation method, characterized in that at least one is included from the group consisting of.
제3항에 있어서,
rs72725879의 가중치는 0.445 ~ 0.589, rs4242384의 가중치는 0.487 ~ 0.645, rs11263763의 가중치는 0.284 ~ 0.431, rs339331의 가중치는 0.188 ~ 0.323, rs1512268의 가중치는 0.178 ~ 0.31, rs11125927의 가중치는 0.153 ~ 0.29, rs140783917의 가중치는 0.201 ~ 0.381, rs7489409의 가중치는 0.13 ~ 0.256, rs10896449의 가중치는 0.226 ~ 0.454, rs7463326의 가중치는 0.153 ~ 0.324, rs8023793의 가중치는 0.111 ~ 0.244, rs2659124의 가중치는 0.103 ~ 0.233, rs10993994의 가중치는 0.087 ~ 0.211, rs77167534의 가중치는 0.106 ~ 0.26, rs7591218의 가중치는 0.092 ~ 0.234, rs1983891의 가중치는 0.08 ~ 0.209, rs2242652의 가중치는 0.098 ~ 0.262, rs11817544의 가중치는 0.096 ~ 0.259, rs10505477의 가중치는 0.067 ~ 0.193, rs817872의 가중치는 0.068 ~ 0.2, rs56159348의 가중치는 0.089 ~ 0.269, rs4711748의 가중치는 0.055 ~ 0.18, rs2238776의 가중치는 0.055 ~ 0.181, rs6955627의 가중치는 0.06 ~ 0.198, rs2660753의 가중치는 0.058 ~ 0.196, rs1283104의 가중치는 0.05 ~ 0.176 및 rs7153648의 가중치는 0.06 ~ 0.218인 것을 특징으로 하는 위험점수 산출방법.
4. The method of claim 3,
rs72725879 weights from 0.445 to 0.589, rs4242384 weights from 0.487 to 0.645, rs11263763 weights from 0.284 to 0.431, rs339331 weights from 0.188 to 0.323, rs1512268 weights from 0.178 to 0.31, rs11125927 weights from 0.153 to 0.29, rs140783917 weights from The weight is 0.201 to 0.381, the weight of rs7489409 is 0.13 to 0.256, the weight of rs10896449 is 0.226 to 0.454, the weight of rs7463326 is 0.153 to 0.324, the weight of rs8023793 is 0.111 to 0.244, the weight of rs2659124 is 0.103 to 0.233, the weight of rs10993994 is 0.087 ~ 0.211, rs77167534 has a weight of 0.106 ~ 0.26, rs7591218 has a weight of 0.092 ~ 0.234, rs1983891 has a weight of 0.08 ~ 0.209, rs2242652 has a weight of 0.098 ~ 0.262, rs11817544 has a weight of 0.096 ~ 0.259, rs10505477 has a weight of 0.067 ~ 0.193, rs817872 has a weight of 0.068 ~ 0.2, rs56159348 has a weight of 0.089 ~ 0.269, rs4711748 has a weight of 0.055 ~ 0.18, rs2238776 has a weight of 0.055 ~ 0.181, rs6955627 has a weight of 0.06 ~ 0.198, rs2660753 has a weight of 0.058 ~ 0.196, The risk score calculation method, characterized in that the weight of rs1283104 is 0.05 ~ 0.176 and the weight of rs7153648 is 0.06 ~ 0.218.
제4항에 있어서,
rs72725879의 가중치는 0.517, rs4242384의 가중치는 0.566, rs11263763의 가중치는 0.357, rs339331의 가중치는 0.255, rs1512268의 가중치는 0.244, rs11125927의 가중치는 0.221, rs140783917의 가중치는 0.291, rs7489409의 가중치는 0.193, rs10896449의 가중치는 0.339, rs7463326의 가중치는 0.239, rs8023793의 가중치는 0.178, rs2659124의 가중치는 0.168, rs10993994의 가중치는 0.149, rs77167534의 가중치는 0.183, rs7591218의 가중치는 0.163, rs1983891의 가중치는 0.144, rs2242652의 가중치는 0.18, rs11817544의 가중치는 0.177, rs10505477의 가중치는 0.13, rs817872의 가중치는 0.134, rs56159348의 가중치는 0.179, rs4711748의 가중치는 0.118, rs2238776의 가중치는 0.118, rs6955627의 가중치는 0.129, rs2660753의 가중치는 0.127, rs1283104의 가중치는 0.112 및 rs7153648의 가중치는 0.139인 것을 특징으로 하는 위험점수 산출방법.
5. The method of claim 4,
rs72725879 weight is 0.517, rs4242384 weight is 0.566, rs11263763 weight is 0.357, rs339331 weight is 0.255, rs1512268 weight is 0.244, rs11125927 weight is 0.221, rs140783917 weight is 0.291, rs7489409 weight is 0.193, rs10896449 The weight is 0.339, the weight of rs7463326 is 0.239, the weight of rs8023793 is 0.178, the weight of rs2659124 is 0.168, the weight of rs10993994 is 0.149, the weight of rs77167534 is 0.183, the weight of rs7591218 is 0.163, the weight of rs1983891 is 0.144, the weight of rs2242652 is 0.18, rs11817544 has a weight of 0.177, rs10505477 has a weight of 0.13, rs817872 has a weight of 0.134, rs56159348 has a weight of 0.179, rs4711748 has a weight of 0.118, rs2238776 has a weight of 0.118, rs6955627 has a weight of 0.129, rs2660753 has a weight of 0.127, The risk score calculation method, characterized in that the weight of rs1283104 is 0.112 and the weight of rs7153648 is 0.139.
피험자의 유전 정보를 입력받는 입력부; 및
상기 유전 정보에 포함된 SNP(단일염기다형성)를 이용하여 SNP 마커 세트를 결정하고, 상기 SNP 마커 세트에 포함된 SNP 마커 각각에 대하여 가중치를 결정하고, 상기 가중치를 기초로 가중치 위험도 모델을 결정하고, 상기 가중치 위험도 모델을 이용하여 전립선암 유전 위험점수를 산출하는 프로세서를 포함하고,
상기 SNP 마커 각각의 가중치는 SNP 마커 각각에 대한 전립선암의 발병 확률에 대한 오즈비(odds ratio, OR)에 자연 로그(ln)를 취한 값인 것을 특징으로 하는, 위험점수 산출장치.
an input unit for receiving genetic information of a subject; and
Determine a SNP marker set using the SNP (single nucleotide polymorphism) included in the genetic information, determine a weight for each SNP marker included in the SNP marker set, and determine a weighted risk model based on the weight, , A processor for calculating a prostate cancer genetic risk score using the weighted risk model,
The weight of each SNP marker is a value obtained by taking a natural logarithm (ln) of an odds ratio (OR) of the probability of occurrence of prostate cancer for each of the SNP markers.
제6항에 있어서,
상기 전립선암 유전 위험점수는,
SNP 마커 각각에 대하여 위험대립 유전자의 수에 가중치를 곱한 값의 평균인 것을 특징으로 하는 위험점수 산출장치.
7. The method of claim 6,
The prostate cancer genetic risk score is,
A risk score calculation device, characterized in that it is an average of a value obtained by multiplying the number of risk alleles for each SNP marker by a weight.
제7항에 있어서,
상기 SNP 마커 세트에는 rs72725879, rs4242384, rs11263763, rs339331, rs1512268, rs11125927, rs140783917, rs7489409, rs10896449, rs7463326, rs8023793, rs2659124, rs10993994, rs77167534, rs7591218, rs1983891, rs2242652, rs11817544, rs10505477, rs817872, rs56159348, rs4711748, rs2238776, rs6955627, rs2660753, rs1283104 및 rs7153648로 이루어진 군으로부터 적어도 하나가 포함되는 것을 특징으로 하는 위험점수 산출장치.
8. The method of claim 7,
상기 SNP 마커 세트에는 rs72725879, rs4242384, rs11263763, rs339331, rs1512268, rs11125927, rs140783917, rs7489409, rs10896449, rs7463326, rs8023793, rs2659124, rs10993994, rs77167534, rs7591218, rs1983891, rs2242652, rs11817544, rs10505477, rs817872, rs56159348, rs4711748, rs2238776 , rs6955627, rs2660753, rs1283104 and at least one from the group consisting of rs7153648 risk score calculation device, characterized in that included.
제8항에 있어서,
rs72725879의 가중치는 0.445 ~ 0.589, rs4242384의 가중치는 0.487 ~ 0.645, rs11263763의 가중치는 0.284 ~ 0.431, rs339331의 가중치는 0.188 ~ 0.323, rs1512268의 가중치는 0.178 ~ 0.31, rs11125927의 가중치는 0.153 ~ 0.29, rs140783917의 가중치는 0.201 ~ 0.381, rs7489409의 가중치는 0.13 ~ 0.256, rs10896449의 가중치는 0.226 ~ 0.454, rs7463326의 가중치는 0.153 ~ 0.324, rs8023793의 가중치는 0.111 ~ 0.244, rs2659124의 가중치는 0.103 ~ 0.233, rs10993994의 가중치는 0.087 ~ 0.211, rs77167534의 가중치는 0.106 ~ 0.26, rs7591218의 가중치는 0.092 ~ 0.234, rs1983891의 가중치는 0.08 ~ 0.209, rs2242652의 가중치는 0.098 ~ 0.262, rs11817544의 가중치는 0.096 ~ 0.259, rs10505477의 가중치는 0.067 ~ 0.193, rs817872의 가중치는 0.068 ~ 0.2, rs56159348의 가중치는 0.089 ~ 0.269, rs4711748의 가중치는 0.055 ~ 0.18, rs2238776의 가중치는 0.055 ~ 0.181, rs6955627의 가중치는 0.06 ~ 0.198, rs2660753의 가중치는 0.058 ~ 0.196, rs1283104의 가중치는 0.05 ~ 0.176 및 rs7153648의 가중치는 0.06 ~ 0.218인 것을 특징으로 하는 위험점수 산출장치.
9. The method of claim 8,
rs72725879 weights from 0.445 to 0.589, rs4242384 weights from 0.487 to 0.645, rs11263763 weights from 0.284 to 0.431, rs339331 weights from 0.188 to 0.323, rs1512268 weights from 0.178 to 0.31, rs11125927 weights from 0.153 to 0.29, rs140783917 weights from The weight is 0.201 to 0.381, the weight of rs7489409 is 0.13 to 0.256, the weight of rs10896449 is 0.226 to 0.454, the weight of rs7463326 is 0.153 to 0.324, the weight of rs8023793 is 0.111 to 0.244, the weight of rs2659124 is 0.103 to 0.233, the weight of rs10993994 is 0.087 ~ 0.211, rs77167534 has a weight of 0.106 ~ 0.26, rs7591218 has a weight of 0.092 ~ 0.234, rs1983891 has a weight of 0.08 ~ 0.209, rs2242652 has a weight of 0.098 ~ 0.262, rs11817544 has a weight of 0.096 ~ 0.259, rs10505477 has a weight of 0.067 ~ 0.193, rs817872 has a weight of 0.068 ~ 0.2, rs56159348 has a weight of 0.089 ~ 0.269, rs4711748 has a weight of 0.055 ~ 0.18, rs2238776 has a weight of 0.055 ~ 0.181, rs6955627 has a weight of 0.06 ~ 0.198, rs2660753 has a weight of 0.058 ~ 0.196, The weight of rs1283104 is 0.05 to 0.176 and the weight of rs7153648 is 0.06 to 0.218.
제9항에 있어서,
rs72725879의 가중치는 0.517, rs4242384의 가중치는 0.566, rs11263763의 가중치는 0.357, rs339331의 가중치는 0.255, rs1512268의 가중치는 0.244, rs11125927의 가중치는 0.221, rs140783917의 가중치는 0.291, rs7489409의 가중치는 0.193, rs10896449의 가중치는 0.339, rs7463326의 가중치는 0.239, rs8023793의 가중치는 0.178, rs2659124의 가중치는 0.168, rs10993994의 가중치는 0.149, rs77167534의 가중치는 0.183, rs7591218의 가중치는 0.163, rs1983891의 가중치는 0.144, rs2242652의 가중치는 0.18, rs11817544의 가중치는 0.177, rs10505477의 가중치는 0.13, rs817872의 가중치는 0.134, rs56159348의 가중치는 0.179, rs4711748의 가중치는 0.118, rs2238776의 가중치는 0.118, rs6955627의 가중치는 0.129, rs2660753의 가중치는 0.127, rs1283104의 가중치는 0.112 및 rs7153648의 가중치는 0.139인 것을 특징으로 하는 위험점수 산출장치.
10. The method of claim 9,
rs72725879 weight is 0.517, rs4242384 weight is 0.566, rs11263763 weight is 0.357, rs339331 weight is 0.255, rs1512268 weight is 0.244, rs11125927 weight is 0.221, rs140783917 weight is 0.291, rs7489409 weight is 0.193, rs10896449 The weight is 0.339, the weight of rs7463326 is 0.239, the weight of rs8023793 is 0.178, the weight of rs2659124 is 0.168, the weight of rs10993994 is 0.149, the weight of rs77167534 is 0.183, the weight of rs7591218 is 0.163, the weight of rs1983891 is 0.144, the weight of rs2242652 is 0.18, rs11817544 has a weight of 0.177, rs10505477 has a weight of 0.13, rs817872 has a weight of 0.134, rs56159348 has a weight of 0.179, rs4711748 has a weight of 0.118, rs2238776 has a weight of 0.118, rs6955627 has a weight of 0.129, rs2660753 has a weight of 0.127, The risk score calculation device, characterized in that the weight of rs1283104 is 0.112 and the weight of rs7153648 is 0.139.
피험자의 유전 정보를 입력받는 단계;
상기 유전 정보에 포함된 SNP(단일염기다형성)를 이용하여 SNP 마커 세트를 결정하는 단계;
상기 SNP 마커 세트에 포함된 SNP 마커 각각에 대하여 가중치를 결정하고, 상기 가중치를 기초로 가중치 위험도 모델을 결정하는 단계; 및
상기 가중치 위험도 모델을 이용하여 전립선암 유전 위험점수를 산출하는 단계를 포함하며,
상기 SNP 마커 각각의 가중치는 SNP 마커 각각에 대한 전립선암의 발병 확률에 대한 오즈비(odds ratio, OR)에 자연 로그(ln)를 취한 값인 것을 특징으로 하는 위험점수 산출방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
receiving the genetic information of the subject;
determining a SNP marker set using the SNP (single nucleotide polymorphism) included in the genetic information;
determining a weight for each SNP marker included in the SNP marker set, and determining a weighted risk model based on the weight; and
Calculating a prostate cancer genetic risk score using the weighted risk model,
The weight of each of the SNP markers is a value obtained by taking the natural logarithm (ln) of the odds ratio (OR) of the probability of occurrence of prostate cancer for each SNP marker. A program for executing a risk score calculation method A computer-readable recording medium that has been recorded.
KR1020210189135A 2020-12-31 2021-12-28 Prostate Cancer Genetic Risk Score Calculating Device, Calculating Method and Recording Medium thereof KR20220097276A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020200188719 2020-12-31
KR20200188719 2020-12-31

Publications (1)

Publication Number Publication Date
KR20220097276A true KR20220097276A (en) 2022-07-07

Family

ID=82398773

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210189135A KR20220097276A (en) 2020-12-31 2021-12-28 Prostate Cancer Genetic Risk Score Calculating Device, Calculating Method and Recording Medium thereof

Country Status (1)

Country Link
KR (1) KR20220097276A (en)

Similar Documents

Publication Publication Date Title
Li et al. Electronic health records and polygenic risk scores for predicting disease risk
US20210375392A1 (en) Machine learning platform for generating risk models
CN110993104B (en) Tumor patient lifetime prediction system
Van Belle et al. A mathematical model for interpretable clinical decision support with applications in gynecology
Huang et al. Identifying optimal biomarker combinations for treatment selection via a robust kernel method
US20200251193A1 (en) System and method for integrating genotypic information and phenotypic measurements for precision health assessments
US10665347B2 (en) Methods for predicting prognosis
Laimighofer et al. Unbiased prediction and feature selection in high-dimensional survival regression
CN112735592A (en) Construction method and application method of lung cancer prognosis model and electronic equipment
US11126695B2 (en) Polymer design device, polymer design method, and non-transitory recording medium
Phan et al. omniBiomarker: a web-based application for knowledge-driven biomarker identification
KR102371655B1 (en) Device, Method of Calculating Prostate Cancer Genetic Risk Score Based on Individual Weights for each Genetic Variation and Recording Medium thereof
Dudbridge Criteria for evaluating risk prediction of multiple outcomes
KR20220097276A (en) Prostate Cancer Genetic Risk Score Calculating Device, Calculating Method and Recording Medium thereof
KR102102848B1 (en) Prostate cancer risk score calculator, and method of the above calculator
US20220285032A1 (en) Determining Prognosis and Treatment based on Clinical-Pathologic Factors and Continuous Multigene-Expression Profile Scores
KR102068667B1 (en) Prostate Cancer Genetic Risk Score Calculating Device, Calculating Method and Recording Medium thereof
KR102371654B1 (en) Device, Calculating Method of Calculating Ethnic-specific Prostate Cancer Genetic Risk Score Considering the Predictive Power According to the Number of Genetic Variations and Recording Medium thereof
CA3220786A1 (en) Diagnostic data feedback loop and methods of use thereof
KR102068666B1 (en) Ethnic-specific Prostate Cancer Genetic Risk Score Calculating Device, Calculating Method and Recording Medium thereof
KR102303272B1 (en) System for predictting a direction of prostate cancer risk
Guazzo et al. Baseline machine learning approaches to predict multiple sclerosis disease progression
KR20210046221A (en) Method And Device Of Screening Prostate Cancer Using Blood Prostate Specific Antigen And Genetic Marker
KR20210046220A (en) Reagent and Kit for the Detection of Prostate Cancer Gene Biomarkers
KR20220007228A (en) Method for predicting risk for developing dementia in parkinson&#39;s disease and device using the same