KR20210053064A - Method and system for predicting colon cancer related information according to the degree of risk factor of lifestyle information. - Google Patents
Method and system for predicting colon cancer related information according to the degree of risk factor of lifestyle information. Download PDFInfo
- Publication number
- KR20210053064A KR20210053064A KR1020190138889A KR20190138889A KR20210053064A KR 20210053064 A KR20210053064 A KR 20210053064A KR 1020190138889 A KR1020190138889 A KR 1020190138889A KR 20190138889 A KR20190138889 A KR 20190138889A KR 20210053064 A KR20210053064 A KR 20210053064A
- Authority
- KR
- South Korea
- Prior art keywords
- information
- polyp
- deriving
- learning
- lifestyle
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Abstract
Description
본 발명은 생활습관정보에 기초한 대장암 관련 정보 예측 방법 및 시스템에 관한 것으로서, 더욱 상세하게는 건강검진결과를 통해 얻는 사람들의 생활습관에 대한 데이터를 학습하여 대장용종 및 대장암가능성과 같은 대장암 관련정보를 도출하여 제공함으로써, 사용자는 특정 생활습관에 대한 대장암 관련 정보를 통해 해당 생활습관에 따른 대장암의 발병을 예측해볼 수 있는 지표로서 활용할 수 있는, 생활습관정보에 기초한 대장암 관련 정보 예측 방법 및 시스템에 관한 것이다.The present invention relates to a method and system for predicting colon cancer-related information based on lifestyle information, and more particularly, by learning data on lifestyles of people obtained through health examination results, colon cancer such as colon polyps and colon cancer potential. By deriving and providing relevant information, the user can use information related to colon cancer based on lifestyle information, which can be used as an index to predict the onset of colon cancer according to the corresponding lifestyle through information related to colon cancer for a specific lifestyle. It relates to a prediction method and system.
대장암은 결장과 직장에 생기는 악성종양을 말하며, 최근 전 세계적으로 대장암 발생이 급속히 증가하고 있다. 그 중 우리나라의 대장암 발생률은 2012년 10만명당 51.7건으로 전체 발생 암 중 3위를 차지하고 있다. 최근 국내 대장암 발생률이 증가함에 따라 대장암 조기 검진에 대한 관심이 증가되면서 대장내시경 및 용종절제술이 활발하게 시행되고 있다. 대장에서 발생하는 선종성 용종은 암의 전구 병변으로 알려져 있으며, 이러한 용종을 제거함으로써, 대장암 발병률을 줄일 수 있는 것으로 보고되고 있다. 국립암센터에서는 현재 매년 8,000건 이상의 진단 및 치료대장내시경을 시행하고 있으며 이는 향후 환자들의 수요에 의해 더욱 증가될 것으로 예측되고 있다. 대장암은 30대까지는 발생률이 낮지만 40대 이후부터 발생률이 증가하기 시작하고 50대부터는 발생률이 큰 증가세를 보이는 것으로 나타난다. 또한 여자보다 남자에게서 발생률이 더 높게 나타나며 이와 같이 대장암의 경우 타 암과 비교하여 암 발생에 대한 위험 인자들이 비교적 뚜렷하게 밝혀져 있어 암의 예방에 초점을 맞춘 많은 연구들이 선행 되어져 왔다.Colorectal cancer refers to a malignant tumor that occurs in the colon and rectum, and the incidence of colorectal cancer is rapidly increasing worldwide. Among them, the incidence rate of colon cancer in Korea was 51.7 cases per 100,000 people in 2012, ranking 3rd among all cancers. As the incidence of colon cancer in Korea has recently increased, interest in early colon cancer screening has increased, and colonoscopy and polypectomy are being actively performed. Adenomatous polyps occurring in the large intestine are known as precursor lesions of cancer, and it has been reported that by removing these polyps, the incidence of colon cancer can be reduced. The National Cancer Center currently performs more than 8,000 diagnosis and treatment colonoscopy every year, which is expected to increase further due to the demand of patients in the future. The incidence rate of colorectal cancer is low until the 30s, but the incidence rate starts to increase after the 40s, and the incidence rate increases significantly from the 50s. In addition, the incidence rate is higher in men than in women, and in the case of colorectal cancer, the risk factors for cancer incidence are relatively clear compared to other cancers, so many studies focusing on the prevention of cancer have been preceded.
이에 기초하여 개개인의 특성 및 생활습관에 따라, 대장용종 및 대장암에 대한 가능성을 도출하여 대장암을 예측할 수 있는 지표를 제공해줄 수 있는 기술이 필요하나 이러한 종래 기술은 전무하다.Based on this, there is a need for a technology capable of providing an index for predicting colorectal cancer by deriving the potential for colorectal polyps and colorectal cancer according to individual characteristics and lifestyles, but such a conventional technology is absent.
본 발명은 건강검진결과를 통해 얻는 사람들의 생활습관에 대한 데이터를 학습하여 대장용종의 발현가능성 및 대장암 발현가능성과 같은 대장암 관련 정보를 도출하여 제공함으로써, 대장암 관련 정보에 따라 개개인의 진단검사 진행방향을 제시할 수 있도록 하는, 생활습관 정보에 기초한 대장암 관련 정보 예측 방법 및 시스템을 제공하는 것을 목적으로 한다.The present invention provides information related to colon cancer such as the possibility of expression of colon polyps and the possibility of colon cancer by learning data on the lifestyles of people obtained through the results of health checkups, thereby diagnosing individuals according to the information related to colon cancer. The purpose of this study is to provide a method and system for predicting colorectal cancer-related information based on lifestyle information, which enables the direction of the examination to be presented.
상기와 같은 과제를 해결하기 위하여 본 발명은, 서버시스템에 의하여 수행되는, 생활습관정보의 위험요인 정도에 따라 대장암 관련 정보를 예측 방법으로서, 학습대상의 복수의 항목에 대한 생활습관정보, 대장내시경 결과정보, 및 조직검사 결과정보를 포함하는 학습정보를 수신하는 학습정보수신단계; 특정 생활습관정보를 갖는 1 이상의 학습대상의 대장내시경 결과정보, 및 조직검사 결과정보를 클러스터링하고, 클러스터링된 정보에 기초하여 특정 생활습관정보를 가진 그룹에 대한 용종가능성, 및 대장암가능성을 도출하는 가능성도출단계; 복수의 상기 특정 생활습관정보를 가진 그룹의 상기 용종가능성, 및 상기 대장암가능성에 대한 예측데이터셋을 도출하는 예측데이터셋도출단계; 및 입력된 입력생활습관정보에 대하여, 상기 예측데이터셋에 기초하여 기설정된 기준에 부합하는 유사그룹예측데이터를 도출하고, 상기 유사그룹예측데이터에 기초하여 해당 입력생활습관정보를 가진 사람의 용종가능성 및 대장암가능성에 대한 결과를 도출하는 예측결과도출단계;를 포함하는, 대장암 관련 정보 예측 방법을 제공한다.In order to solve the above problems, the present invention is a method of predicting colorectal cancer-related information according to the degree of risk factor of lifestyle information, performed by a server system, A learning information receiving step of receiving learning information including endoscope result information and tissue examination result information; Clustering colonoscopy result information and biopsy result information of one or more subjects with specific lifestyle information, and deriving polyp potential and colon cancer potential for groups with specific lifestyle information based on the clustered information. The step of finding the possibility; A prediction data set deriving step of deriving a prediction data set for the polyp possibility and the colorectal cancer possibility of the group having the plurality of specific lifestyle information; And, for the input lifestyle information, derive similar group prediction data that meets a preset criterion based on the prediction data set, and polypability of a person having the input lifestyle information based on the similar group prediction data. And it provides a method for predicting information related to colon cancer containing;
본 발명의 일 실시예에서는, 상기 가능성도출단계는, 상기 학습대상의 상기 대장내시경 결과정보 및 상기 조직검사 결과정보로부터 대장용종에 관련된 키워드를 추출하여 상기 학습대상의 용종위치, 용종크기 및 용종종류 중 1 이상을 포함하는 용종데이터를 도출하는 단계; 상기 용종위치, 용종크기 및 용종종류 중 1 이상에 의하여 상기 학습대상의 용종보유여부를 판별하고, 동일한 상기 특정 생활습관정보를 갖는 2 이상의 학습대상의 상기 용종보유여부에 기초하여 상기 특정 생활습관정보에 대한 상기 용종가능성을 도출하는 단계; 및 동일한 상기 특정 생활습관정보를 갖는 2 이상의 학습대상의 상기 용종크기 및 용종종류에 대한 정보, 및 기설정된 매핑테이블에 따라 상기 특정 생활습관정보에 대한 상기 대장암가능성을 도출하는 단계;를 포함할 수 있다.In an embodiment of the present invention, in the step of deriving the likelihood, a keyword related to a colon polyp is extracted from the colonoscopy result information and the biopsy result information of the learning target, and the polyp location, polyp size, and polyp type of the learning target. Deriving polyp data including one or more of them; The specific lifestyle information is determined based on whether or not the learning target has polyps based on at least one of the polyp location, polyp size, and polyp type, and based on whether or not the polyps of two or more learning targets having the same specific lifestyle information have the polyp. Deriving the polyp possibility for; And deriving the likelihood of colon cancer for the specific lifestyle information according to information on the polyp size and polyp type of two or more learning targets having the same specific lifestyle information, and a preset mapping table. I can.
본 발명의 일 실시예에서는, 상기 입력생활습관정보 및 상기 예측데이터셋에 포함된 생활습관정보는 복수의 세부카테고리정보를 포함하고, 상기 예측결과도출단계는, 상기 유사그룹예측데이터를 도출하는 단계;를 포함하고, 상기 유사그룹예측데이터를 도출하는 단계는, 상기 유사도가 기설정된 기준을 부합하는 예측데이터가 없는 경우에, 상기 입력생활습관정보의 복수의 세부카테고리정보의 일부를 기설정된 기준에 따라 제외하고, 변경된 세부카테고리정보의 항목을 기준으로 상기 유사도를 다시 도출하여 유사그룹예측데이터를 도출할 수 있다.In an embodiment of the present invention, the input lifestyle information and lifestyle information included in the prediction data set include a plurality of detailed category information, and the step of deriving the prediction result includes deriving the similar group prediction data. Including ;, the step of deriving the similar group prediction data includes, in the case where there is no prediction data matching a preset criterion of the similarity, some of the plurality of detailed category information of the input lifestyle information is converted to a preset criterion. Except accordingly, similar group prediction data may be derived by deriving the similarity again based on the item of the changed detailed category information.
본 발명의 일 실시예에서는, 상기 입력생활습관정보는, 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력 중 1 이상을 포함하고, 상기 유사그룹예측데이터를 도출하는 단계는, 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력에 대한 제1유사도가 기설정된 기준을 부합하는지 여부를 판별하고, 상기 제1유사도가 기설정된 기준에 부합하지 않는 경우, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력에 대한 제2유사도가 기설정된 기준을 부합하는지 여부를 판별하고, 상기 제2유사도가 기설정된 기준에 부합하지 않는 경우, BMI, 흡연습관, 음주습관 및 개인병력에 대한 제3유사도가 기설정된 기준을 부합하는지 여부를 판별하여, 상기 유사그룹예측데이터를 도출할 수 있다.In an embodiment of the present invention, the input lifestyle information includes at least one of age, gender, BMI, exercise habit, drinking habit, smoking habit, family medical history, and personal medical history, and to derive the similar group prediction data. In the step, it is determined whether the first similarity for age, sex, BMI, exercise habit, drinking habit, smoking habit, family medical history and personal medical history meets a preset criterion, and the first similarity meets a preset standard. If not, it is determined whether the second similarity degree for BMI, exercise habits, drinking habits, smoking habits, family medical history and personal medical history meets the preset criteria, and the second similarity degree does not meet the preset criteria. , BMI, smoking habits, drinking habits and personal medical history by determining whether or not the third similarity meets a predetermined criterion, it is possible to derive the similar group prediction data.
상기와 같은 과제를 해결하기 위하여, 본 발명의 일 실시예는, 생활습관정보의 위험요인 정도에 따라 대장암 관련 정보를 예측하는 방법을 수행하는 서버시스템으로서, 학습대상의 복수의 항목에 대한 생활습관정보, 대장내시경 결과정보, 및 조직검사 결과정보를 포함하는 학습정보를 수신하는 학습정보수신부; 특정 생활습관정보를 갖는 1 이상의 학습대상의 대장내시경 결과정보, 및 조직검사 결과정보를 클러스터링하고, 클러스터링된 정보에 기초하여 특정 생활습관정보를 가진 그룹에 대한 용종가능성, 및 대장암가능성을 도출하는 가능성도출부; 복수의 상기 특정 생활습관정보를 가진 그룹의 상기 용종가능성, 및 상기 대장암가능성에 대한 예측데이터셋을 도출하는 예측데이터셋도출부; 및 입력된 입력생활습관정보에 대하여, 상기 예측데이터셋에 기초하여 기설정된 기준에 부합하는 유사그룹예측데이터를 도출하고, 상기 유사그룹예측데이터에 기초하여 해당 입력생활습관정보를 가진 사람의 용종가능성 및 대장암가능성에 대한 결과를 도출하는 예측결과도출부;를 포함하는, 서버시스템을 제공한다.In order to solve the above problems, an embodiment of the present invention is a server system that performs a method of predicting colorectal cancer-related information according to the degree of risk factors of lifestyle information, Learning information receiving unit for receiving learning information including habit information, colonoscopy result information, and tissue examination result information; Clustering colonoscopy result information and biopsy result information of one or more subjects with specific lifestyle information, and deriving polyp potential and colon cancer potential for groups with specific lifestyle information based on the clustered information. Possibility-derived department; A prediction data set derivation unit for deriving a prediction data set for the polyp possibility and the colorectal cancer possibility of a group having a plurality of the specific lifestyle information; And, for the input lifestyle information, derive similar group prediction data that meets a preset criterion based on the prediction data set, and polypability of a person having the input lifestyle information based on the similar group prediction data. And it provides a server system that includes; and a prediction result derivation unit for deriving a result of the possibility of colon cancer.
본 발명의 일 실시예에 따르면, 생활습관정보를 수신하여 생활습관정보로부터 도출된 대장용종의 및 대장암의 가능성을 제공함으로써, 대장암 진단 선별검사 기준을 제시할 수 있는 효과를 발휘할 수 있다.According to an embodiment of the present invention, by receiving the lifestyle information and providing the possibility of colon polyp and colon cancer derived from the lifestyle information, it is possible to exert the effect of presenting the colon cancer diagnostic screening criteria.
본 발명의 일 실시예에 따르면, 다양한 학습대상의 생활습관정보, 대장내시경 결과정보 및 조직검사 결과정보를 학습한 결과를 바탕으로 대장암 관련 정보를 제공함으로써, 사용자는 제공받은 가능성 지표를 통해 대장의 건강상태를 객관적 지표로 확인할 수 있는 효과를 발휘할 수 있다.According to an embodiment of the present invention, by providing information related to colon cancer based on the result of learning lifestyle information, colonoscopy result information, and biopsy result information of various subjects, the user can It can exert the effect of being able to check the health status of the patient with an objective indicator.
본 발명의 일 실시예에 따르면, 학습한 데이터 중 대장암 관련 정보를 예측하기 위한 생활습관정보와 유사한 데이터가 없는 경우, 생활습관정보의 세부카테고리정보를 기설정된 기준에 따라 제외하여 유사한 데이터를 필터링함으로써, 대장용종 및 대장암 가능성을 도출하여 제공할 수 있는 효과를 발휘할 수 있다.According to an embodiment of the present invention, when there is no data similar to lifestyle information for predicting colorectal cancer-related information among the learned data, detailed category information of lifestyle information is excluded according to a preset criterion, and similar data is filtered. By doing so, it is possible to exert the effects that can be provided by deriving the possibility of colon polyps and colon cancer.
본 발명의 일 실시예에 따르면, 학습정보에 기초하여 도출한 용종크기 및 용종종류에 따라 매핑테이블에 기초하여 각각의 학습대상의 대장암 가능성을 도출하고, 각각의 학습대상의 대장암 가능성에 기초하여 특정 생활습관정보에 대한 대장암가능성을 도출함으로써, 보다 분석적으로 정확한 가능성을 도출하여 제공할 수 있는 효과를 발휘할 수 있다.According to an embodiment of the present invention, the colorectal cancer potential of each learning object is derived based on the mapping table according to the polyp size and polyp type derived based on the learning information, and based on the colorectal cancer possibility of each learning object. Thus, by deriving the possibility of colorectal cancer for specific lifestyle information, it is possible to exert the effect of deriving and providing more analytically accurate possibilities.
본 발명의 일 실시예에 따르면, 일부 데이터가 수신되지 않은 경우에도, 과거의 수집한 학습정보에 기초하여 데이터를 보완함으로써, 데이터로부터 도출한 대장암 관련 정보의 데이터 신뢰성을 향상시킬 수 있는 효과를 발휘할 수 있다.According to an embodiment of the present invention, even when some data is not received, data is supplemented based on previously collected learning information, thereby improving the data reliability of colorectal cancer-related information derived from the data. Can be exerted.
도 1은 본 발명의 일 실시예에 따른 생활습관정보에 기초한 대장암 관련 정보 예측 방법에 따른 서버시스템의 동작을 개략적으로 도시한다.
도 2는 본 발명의 일 실시예에 따른 서버시스템의 내부 구성을 개략적으로 도시한다.
도 3은 본 발명의 일 실시예에 따른 가능성도출부에 의하여 처리되는 학습정보의 형태를 개략적으로 도시한다.
도 4는 본 발명의 일 실시예에 따른 생활습관정보를 분류하는 기준을 개략적으로 도시한다.
도 5는 본 발명의 일 실시예에 따른 가능성도출부에 의하여 도출되는 정보의 처리과정을 개략적으로 도시한다.
도 6은 본 발명의 일 실시예에 따른 가능성도출부에 의하여 학습대상의 대장암가능성을 도출하는데 기초가 되는 기설정된 매핑테이블을 개략적으로 도시한다.
도 7은 본 발명의 일 실시예에 따른 가능성도출부 및 예측데이터셋도출부에 의하여 도출되는 데이터의 형태를 개략적으로 도시한다.
도 8은 본 발명의 일 실시예에 따른 예측결과도출부의 수행 단계를 개략적으로 도시한다.
도 9는 본 발명의 일 실시예에 따른 예측결과도출부에 의하여 생활습관정보의 세부카테고리항목을 제외하는 기준을 개략적으로 도시한다.
도 10은 본 발명의 일 실시예에 따른 예측결과도출부에 의하여 도출되는 도출되는 정보의 처리과정을 개략적으로 도시한다.
도 11은 본 발명의 일 실시예에 따른 컴퓨팅장치의 구성을 개략적으로 도시한다.1 schematically illustrates an operation of a server system according to a method for predicting information related to colon cancer based on lifestyle information according to an embodiment of the present invention.
2 schematically shows the internal configuration of a server system according to an embodiment of the present invention.
3 schematically shows a form of learning information processed by a possibility finding unit according to an embodiment of the present invention.
4 schematically shows the criteria for classifying lifestyle information according to an embodiment of the present invention.
5 schematically shows a process of processing information derived by a possibility derivation unit according to an embodiment of the present invention.
6 schematically shows a preset mapping table that is a basis for deriving the likelihood of colorectal cancer of a learning target by the likelihood derivation unit according to an embodiment of the present invention.
7 schematically shows the types of data derived by the possibility deriving unit and the predictive data set deriving unit according to an embodiment of the present invention.
8 schematically illustrates a step of performing a prediction result derivation unit according to an embodiment of the present invention.
9 schematically shows a criterion for excluding detailed category items of lifestyle information by a prediction result derivation unit according to an embodiment of the present invention.
10 schematically illustrates a process of processing derived information derived by a prediction result derivation unit according to an embodiment of the present invention.
11 schematically illustrates a configuration of a computing device according to an embodiment of the present invention.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art can easily implement the present invention. However, the present invention may be implemented in various different forms and is not limited to the embodiments described herein. In the drawings, parts irrelevant to the description are omitted in order to clearly describe the present invention, and similar reference numerals are attached to similar parts throughout the specification.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.Throughout the specification, when a part is said to be "connected" with another part, this includes not only "directly connected" but also "electrically connected" with another element interposed therebetween. . In addition, when a part "includes" a certain component, it means that other components may be further included rather than excluding other components unless specifically stated to the contrary.
또한, 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.In addition, terms including ordinal numbers such as first and second may be used to describe various elements, but the elements are not limited by the terms. The above terms are used only for the purpose of distinguishing one component from another component. For example, without departing from the scope of the present invention, a first element may be referred to as a second element, and similarly, a second element may be referred to as a first element. The term and/or includes a combination of a plurality of related listed items or any of a plurality of related listed items.
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. 한편, '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, '~부'는 어드레싱 할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.In the present specification, the term "unit" includes a unit realized by hardware, a unit realized by software, and a unit realized using both. Further, one unit may be realized by using two or more hardware, or two or more units may be realized by one piece of hardware. Meanwhile,'~ unit' is not meant to be limited to software or hardware, and'~ unit' may be configured to be in an addressable storage medium or configured to reproduce one or more processors. Thus, as an example,'~ unit' refers to components such as software components, object-oriented software components, class components, and task components, processes, functions, properties, and procedures. , Subroutines, segments of program code, drivers, firmware, microcode, circuits, data, databases, data structures, tables, arrays and variables. Components and functions provided in the'~ units' may be combined into a smaller number of elements and'~ units', or may be further separated into additional elements and'~ units'. In addition, components and'~ units' may be implemented to play one or more CPUs in a device or a security multimedia card.
이하에서 언급되는 "사용자 단말"은 네트워크를 통해 서버나 타 단말에 접속할 수 있는 컴퓨터나 휴대용 단말기로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop) 등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신장치로서, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말 등과 같은 모든 종류의 핸드헬드 (Handheld) 기반의 무선 통신 장치를 포함할 수 있다. 또한, "네트워크"는 근거리 통신망(Local Area Network;LAN), 광역 통신망(Wide Area Network; WAN) 또는 부가가치 통신망(Value Added Network; VAN) 등과 같은 유선네트워크나 이동 통신망(mobile radio communication network) 또는 위성 통신망 등과 같은 모든 종류의 무선 네트워크로 구현될 수 있다.The "user terminal" mentioned below may be implemented as a computer or portable terminal that can access a server or other terminal through a network. Here, the computer includes, for example, a notebook equipped with a web browser, a desktop, a laptop, and the like, and the portable terminal is, for example, a wireless communication device that guarantees portability and mobility. , PCS (Personal Communication System), GSM (Global System for Mobile communications), PDC (Personal Digital Cellular), PHS (Personal Handyphone System), PDA (Personal Digital Assistant), IMT (International Mobile Telecommunication)-2000, CDMA (Code Division Multiple Access)-2000, W-CDMA (W-Code Division Multiple Access), Wibro (Wireless Broadband Internet) terminal, etc. may include all kinds of handheld-based wireless communication devices. In addition, the "network" refers to a wired network such as a local area network (LAN), a wide area network (WAN), or a value added network (VAN), or a mobile radio communication network or satellite. It can be implemented with any type of wireless network such as a communication network.
도 1은 본 발명의 일 실시예에 따른 생활습관정보에 기초한 대장암 관련 정보 예측 방법에 따른 서버시스템의 동작을 개략적으로 도시한다.1 schematically illustrates an operation of a server system according to a method for predicting information related to colon cancer based on lifestyle information according to an embodiment of the present invention.
도 1에 도시된 서버시스템(1000)에서는, 건강검진결과를 통해 얻는 사람들의 생활습관에 대한 데이터를 학습하여 생활습관에 따른 대장용종 및 대장암의 가능성과 같은 대장암 관련정보를 도출하여 제공함으로써, 사용자는 특정 생활습관에 대한 대장암 관련 정보를 통해 해당 생활습관에 따른 대장암의 발병을 예측해볼 수 있는 지표로서 활용할 수 있다. 바람직하게는, 복수의 세부카테고리정보를 포함하는 생활습관정보는, 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력 중 1 이상을 포함한다. 생활습관정보는 건강검진문답과 같은 건강검진정보를 수신하여 상기 세부카테고리정보의 항목과 관련된 키워드에 기초하여 수신한 건강검진정보로부터 도출하거나, 혹은 상기 세부카테고리정보의 항목별 정보의 입력을 직관적으로 수신할 수 있다. 본 발명의 서버시스템(1000)은 이러한 생활습관정보 및 대장내시경 결과정보 및 조직검사 결과정보를 포함하는 학습정보(1510)를 수신하여 학습정보(1510)를 학습하여 용종가능성 및 대장암가능성을 도출하고, 특정 생활습관정보에 대한 용종가능성 및 대장암가능성을 도출한다. 이후, 도출된 용종가능성 및 대장암가능성에 기초하여 대장암관련결과정보(1530)를 도출할 수 있고, 입력된 생활습관정보에 기초하여 입력된 생활습관정보를 가진 사람의 도출된 대장암관련결과정보(1530)를 도출할 수 있다.In the
도 1에 도시된 서버시스템(1000)은 수신한 학습정보(1510)를 수신하고 대장암 관련 정보를 도출하는 프로세서 및 상기 프로세서에서 수행 가능한 명령들을 저장하는 1 이상의 메모리를 포함한다. 상기 프로세서는 학습정보수신부(1100), 가능성도출부(1200), 예측데이터셋도출부(1300) 및 예측결과도출부(1400)를 포함한다.The
이하에서는, 보다 구체적인 상기 학습정보수신부(1100), 가능성도출부(1200), 예측데이터셋도출부(1300) 및 예측결과도출부(1400)의 동작에 대해서 자세하게 설명하도록 한다.Hereinafter, more specific operations of the learning
도 2는 본 발명의 일 실시예에 따른 서버시스템(1000)의 내부 구성을 개략적으로 도시한다.2 schematically shows the internal configuration of the
본 발명의 서버시스템(1000)은 생활습관정보에 기초한 대장암 관련 정보 예측 방법을 수행할 수 있다. 개략적으로, 건강검진결과를 통해 얻는 사람들의 생활습관에 대한 데이터를 학습하여 생활습관에 따른 대장용종 및 대장암의 가능성과 같은 대장암 관련정보를 도출하여 제공한다. 상기 서버시스템(1000)은 학습정보수신부(1100), 가능성도출부(1200), 예측데이터셋도출부(1300) 및 예측결과도출부(1400)를 포함할 수 있다.The
상기 학습정보수신부(1100)는, 학습대상의 복수의 항목에 대한 생활습관정보, 대장내시경 결과정보, 및 조직검사 결과정보를 수신한다. 구체적으로, 학습대상의 생활습관정보는, 예를 들어 건강검진정보와 같이 학습대상들의 생활습관에 관한 정보가 포함된 정보로부터 수신할 수 있다. 바람직하게는 생활습관정보는, 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력 중 1 이상을 포함할 수 있다. 상기 대장내시경 결과정보는 예를 들어, 대장내시경 진단서와 같은 대장내시경을 통해 진단을 수행하고 진단결과를 보유하고 있는 학습대상의 대장내시경 결과에 대한 정보를 의미한다. 조직검사 결과정보는, 예를 들어, 조직검사 결과보고서와 같이, 조직검사를 수행하고 조직검사결과를 보유하고 있는 학습대상의 조직검사 결과에 대한 정보를 의미한다.The learning
상기 가능성도출부(1200)는, 특정 생활습관정보를 갖는 1 이상의 학습대상의 대장내시경 결과정보, 및 조직검사 결과정보를 클러스터링하고, 클러스터링된 정보에 기초하여 특정 생활습관정보를 가진 그룹에 대한 용종가능성, 및 대장암가능성을 도출한다. 구체적으로, 우선 복수의 학습대상 중 동일한 특정 생활습관정보를 갖는 1 이상의 학습대상의 대장내시경 결과정보 및 조직검사 결과정보를 클러스터링 한다. 이후, 클러스터링된 정보에 기초하여 학습대상의 용종보유여부를 판별하고, 동일한 특정 생활습관정보를 갖는 복수의 학습대상의 용종보유여부에 기초하여 특정 생활습관정보를 가진 그룹에 대한 용종가능성을 도출한다. 또한, 클러스터링된 정보 및 기설정된 매핑테이블에 기초하여 특정 생활습관정보를 가진 그룹에 대한 대장암가능성을 도출한다. 가능성도출부(1200)는, 복수의 특정 생활습관정보에 대하여 상술한 바와 같은 과정을 반복하여, 학습대상 전체의 각각의 특정 생활습관정보를 가진 그룹별 용종가능성 및 대장암가능성을 도출한다.The
상기 예측데이터셋도출부(1300)는, 복수의 특정 생활습관정보를 가진 그룹의 용종가능성 및 대장암가능성에 대한 예측데이터셋(1520)을 도출한다. 가능성도출부(1200)에 의하여 특정 생활습관정보를 갖는 그룹별 용종가능성 및 대장암가능성이 도출된 후에 상기 예측데이터셋도출부(1300)는, 복수의 세부카테고리정보를 포함하는 상기 생활습관정보, 상기 용종가능성, 및 상기 대장암가능성을 포함하는 예측데이터셋(1520)을 도출한다. 바람직하게는 상기 생활습관정보는 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력 중 1 이상을 포함한다.The predicted data
이후, 예측결과도출부(1400)는, 입력된 입력생활습관정보에 대하여, 예측데이터셋도출부(1300)가 도출한 예측데이터셋(1520)에 기초하여 해당 입력생활습관정보를 가진 사람의 용종가능성 및 대장암가능성에 대한 결과를 도출한다. 구체적으로, 예측결과도출부(1400)는, 수신한 입력생활습관정보 및 상기 예측데이터셋(1520)에 포함된 생활습관정보를 매칭하고, 각각의 생활습관정보의 세부카테고리정보들이 매칭되는 정도에 따라 매칭정도가 높은 세부예측데이터셋에 기초하여 입력생활습관정보를 가진 사람의 용종가능성 및 대장암가능성을 도출할 수 있다.Thereafter, the prediction result derivation unit 1400, based on the predicted
한편, 상기 서버시스템(1000)의 DB(1500)에는 학습대상의 복수의 항목에 대한 생활습관정보, 대장내시경 결과정보 및 조직검사 결과정보를 포함하는 학습정보(1510), 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력 중 1 이상을 포함하는 생활습관정보, 상기 용종가능성 및 대장암가능성을 포함하는 예측데이터셋(1520), 입력생활습관정보를 가진 사람의 용종가능성 및 대장암가능성을 포함하는 대장암관련결과정보(1530)가 저장되어 있을 수 있다.On the other hand, in the
도 2에 도시된 서버시스템(1000)은 도시된 구성요소 외의 다른 요소들을 더 포함할 수 있으나, 편의상 본 발명의 실시예들에 따른 생활습관정보에 기초한 대장암 관련 정보 예측 방법과 관련된 구성요소들만을 표시하였다.The
도 3은 본 발명의 일 실시예에 따른 가능성도출부(1200)에 의하여 처리되는 학습정보(1510)의 형태를 개략적으로 도시한다.3 schematically shows the form of the
본 발명의 서버시스템(1000)에 포함되는 학습정보수신부(1100)가 수신하는 학습정보(1510)는 학습대상의 복수의 항목에 대한 생활습관정보, 대장내시경 결과정보 및 조직검사 결과정보를 포함한다. 이후, 수신한 학습정보(1510)는 가능성도출부(1200)에 의하여 가공될 수 있다. 구체적으로, 도 3의 (a)는 생활습관정보를, 도 3의 (b)는 대장내시경 결과정보를, 도 3의 (c)는 조직검사 결과정보를 개략적으로 도시한다. 생활습관정보는 예를 들어, 도 3의 (a)에 도시된 바와 같은 학습대상의 건감검진 설문지와 같은 건강검진정보가 수신되면 가능성도출부(1200)는, 수신한 건강검진 설문지에 기초하여 건강검진 설문이미지에 포함되는 생활습관정보를 도출할 수 있다. 혹은, 이미 건강검진 설문을 통해 외부에서 전처리된 복수의 세부카테고리정보에 대한 생활습관정보를 직접적으로 수신할 수도 있다. 한편, 상기 대장내시경 결과정보는 예를 들어, 대장내시경 진단서와 같은 대장내시경을 통해 진단을 수행하고 진단결과를 보유하고 있는 학습대상의 대장내시경 결과에 대한 정보를 의미한다. 대장내시경 결과정보는 가능성도출부(1200)에 의하여 클러스터링 되어 도 3의 (b)에 도시된 바와 같이 대장내시경 결과정보로부터 용종위치(도 3에서 Pericolica area) 및 용종크기(도 3에서 3cm)를 도출할 수 있다. 또한, 조직검사 결과정보는 예를 들어, 조직검사 결과보고서와 같이 조직검사를 수행하여 대장 내 조직에 대한 검사결과를 보유하고 있는 학습대상의 조직검사 결과에 대한 정보를 의미한다. 조직검사 결과정보 또한, 도 3의 (c)에 도시된 바와 같이 가능성도출부(1200)에 의하여 조직검사 결과정보로부터 용종종류(도 3에서 adenoma)가 도출될 수 있다. 이와 같이 가능성도출부(1200)는, 학습정보(1510)가 수신되는 경우, 학습정보(1510)로부터 대장용종에 관련된 키워드를 추출하여 상기 학습대상의 용종크기, 용종위치, 및 용종종류를 포함하는 용종데이터를 도출하는 단계를 수행한다.The learning
도 4는 본 발명의 일 실시예에 따른 생활습관정보를 분류하는 기준을 개략적으로 도시한다.4 schematically shows the criteria for classifying lifestyle information according to an embodiment of the present invention.
본 발명의 서버시스템(1000)은 수신한 생활습관정보를 각각의 세부카테고리정보들의 기설정된 기준에 따라 분류할 수 있다. 상기 생활습관정보가 분류되는 기준은 도 4에 도시된 바와 같이 분류될 수 있다. 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력 중 1 이상을 포함하는 생활습관정보는 각각의 세부카테고리에 따라 도 4에 도시된 바와 같은 기설정된 기준으로 분류되어 항목별지수가 부여되어 인식될 수 있다. 예를 들어, 세부카테고리 중 성별의 경우, 여성은 00의 성별항목지수를 부여하고, 남성은 01의 성별항목지수를 부여할 수 있다. 또한, 도 4에 도시된 바와 같이 음주습관 혹은 흡연습관과 같은 개개인의 습관의 정도의 차이가 클 수 있는 세부카테고리 항목에 대해서는 도 4에 도시된 바와 같이 예를 들어, 흡연기간 * 하루평균흡연량과 같은 기준으로 세부카테고리항목에 대한 정도를 수치로 환산하여 수치가 기설정된 기준을 충족하는지 여부에 따라 흡연항목지수를 부여하는 방법으로 항목별지수를 도출할 수 있다. 도출된 항목별지수에 따라 생활습관정보를 인식할 수 있고, 각각 세부카테고리별로 도출된 항목별지수에 기초하여 생활습관정보를 하나의 아이디(예를 들어, 30-01-00-00-10-10-01-01)로 도출할 수도 있다. 이와 같은 방식으로 생활습관정보를 분류함으로써, 복수의 학습대상의 정보를 객관적으로 분류할 수 있는 효과를 발휘할 수 있다.The
도 5는 본 발명의 일 실시예에 따른 가능성도출부(1200)에 의하여 도출되는 정보의 처리과정을 개략적으로 도시하고, 도 6은 가능성도출부(1200)에 의하여 학습대상의 대장암가능성을 도출하는데 기초가 되는 기설정된 매핑테이블을 개략적으로 도시한다.5 schematically shows a process of processing information derived by the
본 발명의 상기 가능성도출부(1200)는, 상기 학습대상의 상기 대장내시경 결과정보 및 상기 조직검사 결과정보로부터 대장용종에 관련된 키워드를 추출하여 상기 학습대상의 용종크기, 용종위치 및 용종종류 중 1 이상을 포함하는 용종데이터를 도출하는 단계(S100); 상기 용종크기, 용종위치 및 용종종류 중 1 이상에 의하여 상기 학습대상의 용종보유여부를 판별하고, 동일한 상기 특정 생활습관정보를 갖는 2 이상의 학습대상의 상기 용종보유여부에 기초하여 상기 특정 생활습관정보에 대한 상기 용종가능성을 도출하는 단계(S110); 및 동일한 상기 특정 생활습관정보를 갖는 2 이상의 학습대상의 상기 용종크기 및 용종종류에 대한 정보, 및 기설정된 매핑테이블에 따라 상기 특정 생활습관정보에 대한 상기 대장암가능성을 도출하는 단계;(S120)를 수행한다.The
구체적으로 S100단계에서는, 가능성도출부(1200)는 학습대상의 대장내시경 결과정보 및 조직검사 결과정보로부터 대장용종에 관련된 키워드를 추출하여 상기 학습대상의 용종크기, 용종위치 및 용종종류 중 1 이상을 포함하는 용종데이터를 도출할 수 있다. 상기 도 3의 설명에서 상술한 바와 같이 가능성도출부(1200)는 용종위치, 용종크기 및 용종종류 중 1 이상을 포함하는 용종데이터를 도출한다. 도 5의 (a)는 가능성도출부(1200)에 의하여 용종데이터가 도출된 특정 생활습관정보를 갖는 1 이상의 학습대상의 학습정보(1510)를 도시한다. 상기 도 4의 기준에 따라 복수의 세부카테고리정보를 포함하는 생활습관정보는 항목별지수로 나타나고 각각의 학습대상의 대장내시경 결과정보 및 조직검사 결과정보에 따른 용종위치, 용종크기 및 용종종류가 도시되어 있다. 학습정보#1 및 학습정보#4의 경우, 해당 학습대상의 대장내시경 검사결과 및 조직검사 결과정보에서 대장용종에 관련된 키워드가 추출되지 않았음을 나타내고, 이는 해당 학습대상의 대장에서 용종이 발견되지 않았음을 의미한다.Specifically, in step S100, the
이후, S110단계에서는, 가능성도출부(1200)는 상기 용종위치, 용종크기 및 용종종류 중 1 이상에 의하여 상기 학습대상의 용종보유여부를 판별한다. 도 5의 (b)에 도시된 바에 따르면, 학습대상#1 및 학습대상#4의 경우, 상술한 바와 같이 해당 학습대상의 학습정보(1510)에서 대장내시경 검사결과 및 조직검사 결과정보에서 대장용종에 관련된 키워드가 추출되지 않았음에 기초하여 용종데이터가 도출되지 않았음이 도시된다. 이와 같이, 상기 용종위치, 용종크기, 및 용종종류 중 1 이상을 포함하는 용종데이터의 도출여부에 따라 학습대상의 용종보유여부를 판별할 수 있다. 상기 용종위치, 용종크기, 및 용종종류 중 1 이상이 도출된 경우, 용종을 보유한 것으로 판별하고, 상기 용종위치, 용종크기, 및 용종종류 중 1 이상이 도출되지 않은 경우, 용종을 보유하지 않은 것으로 판별한다.Thereafter, in step S110, the
동일한 특정 생활습관정보를 갖는 복수의 학습대상의 용종보유여부가 판별된 후에, 상기 가능성도출부(1200)는 해당 특정 생활습관정보를 갖는 2 이상의 학습대상의 상기 용종보유여부에 기초하여 상기 특정 생활습관정보에 대한 용종가능성을 도출할 수 있다. 본 발명의 일 실시예에서는, 도 5의 (b)에 도시된 바에 따르면, 나이-성별-BMI-운동습관-음주습관-흡연습관-가족병력-개인병력을 나타내는 생활습관정보가 30-01-00-00-10-10-01-01으로 동일한 특정 생활정보를 가진 5명의 학습대상이 도시되어 있다. 이 중에 학습대상#1 및 학습대상#4 2명은 용종을 보유하고 있지 않고, 학습대상#2, 학습대상#3 및 학습대상#5 3명은 용종을 보유하고 있음이 도시된다. 이에 기초하여 하기의 도출식 1에 따라 용종가능성이 도출될 수 있다.After determining whether a plurality of learning targets having the same specific lifestyle information have polyps, the
[도출식 1][Draw Expression 1]
용종을 보유한 특정 생활습관정보를 갖는 학습대상의 수 / 특정 생활습관정보를 갖는 전체 학습대상의 수 *100 (%)Number of learning subjects with specific lifestyle information with polyps / Total number of learning subjects with specific lifestyle information *100 (%)
도 5의 (b)에 도시된 일 예를 도출식 1에 적용하면, 도출식 1 = 3/5 *100 = 60%의 용종가능성이 도출된다. 따라서, 상기 생활습관정보 30-01-00-00-10-10-01-01를 갖는 학습대상의 용종가능성은 도 5의 (c)에 도시된 바와 같이 60%로 도출된다.If the example shown in (b) of FIG. 5 is applied to the
이와 같은 방식으로, 가능성도출부(1200)는 특정 생활습관정보에 대한 용종가능성을 도출할 수 있다.In this way, the
이후, 가능성도출부(1200)가 수행하는 상기 특정 생활습관정보에 대한 대장암가능성을 도출하는 단계(S120)는, 특정 생활습관정보를 갖는 2 이상의 학습대상의 상기 용종크기 및 용종종류에 대한 정보 및 기설정된 매핑테이블에 따라 학습대상별 대장암가능성을 도출하는 단계(S120-1); 및 각각의 상기 학습대상별 대장암가능성에 기초하여 상기 특정 생활습관정보에 대한 대장암가능성을 도출하는 단계;(S120-2)를 포함한다.Thereafter, the step (S120) of deriving the likelihood of colon cancer for the specific lifestyle information performed by the likelihood extraction unit 1200 (S120) includes information on the polyp size and polyp type of two or more learning targets having specific lifestyle information. And deriving the likelihood of colorectal cancer for each learning target according to a preset mapping table (S120-1). And deriving a colorectal cancer possibility for the specific lifestyle information based on the colorectal cancer possibility for each learning target; (S120-2).
구체적으로, S120-1단계에서는, 가능성도출부(1200)는 도 6과 같은 기설정된 매핑테이블을 통해 특정 생활습관정보를 갖는 각각의 학습정보(1510)별 대장암가능성을 도출한다. 도 5 및 도 6에 도시된 바와 같이 매핑테이블은 용종크기 및 용종종류에 따라 대장암가능성을 도출하는 기준이 된다. 도 5의 (b)에 따르면 학습정보#2의 용종크기는 4로, 용종종류는 융모상선종으로 도시되어 있다. 이에 기초하여 도 6의 매핑테이블의 기준에서 용종종류는 융모상선종이며, 3 내지 6cm 미만의 용종크기에 해당하므로 도 5의 (b)에 도시된 바와 동일하게 대장암가능성을 25%로 도출할 수 있다. 마찬가지로, 학습정보#3 및 학습정보(1510) #5의 경우에도, 도 6의 매핑테이블에 따라 각각의 학습정보(1510)별 대장암가능성이 도출되었음이 도시된다. 이와 같이, 가능성도출부(1200)는 특정 생활습관정보를 갖는 2 이상의 학습대상의 상기 용종크기 및 용종종류에 대한 정보 및 기설정된 매핑테이블에 따라 각각의 학습대상별 대장암가능성을 도출한다.Specifically, in step S120-1, the
이후, S120-2단계에서는, 각각의 상기 학습대상별 대장암가능성에 기초하여 상기 특정 생활습관정보에 대한 대장암가능성을 도출한다. 가능성도출부(1200)는 특정 생활습관정보를 갖는 2 이상의 학습대상별 대장암가능성에 기초하여 하기의 도출식 2에 따라 특정생활습관정보에 대한 대장암가능성이 도출될 수 있다.Thereafter, in step S120-2, the likelihood of colon cancer for the specific lifestyle information is derived based on the likelihood of colon cancer for each learning target. The
[도출식 2][Draw Expression 2]
상기 도출식 2 에서는, N은 특정 생활습관정보를 갖는 학습대상의 전체 수를 의미한다. In the
도 5의 (b)에 도시된 예를 도출식 2에 적용하면, 도출식 2 = ((25 + 80 + 2)/5) = 21.4%의 특정생활정보에 대한 대장암가능성이 도출된다. 따라서, 상기 생활습관정보 30-01-00-00-10-10-01-01에 대한 대장암가능성은 도 5의 (c)에 도시된 바와 같이 21.4%로 도출된다.If the example shown in (b) of FIG. 5 is applied to the
이와 같은 방식으로, 가능성도출부(1200)는 특정 생활습관정보에 대한 대장암가능성을 도출할 수 있다.In this way, the
도 7은 본 발명의 일 실시예에 따른 가능성도출부(1200) 및 예측데이터셋도출부(1300)에 의하여 도출되는 데이터의 형태를 개략적으로 도시한다.7 schematically shows the types of data derived by the
상술한 바와 같이 가능성도출부(1200)는 생활습관정보, 대장내시경 결과정보 및 조직검사 결과정보에 기초하여 학습대상의 용종위치, 용종크기 및 용종종류 중 1 이상을 포함하는 용종데이터를 도출하고, 특정 생활습관정보에 대한 용종가능성 및 대장암가능성을 도출한다. 도 7의 (a)는 가능성도출부(1200)에 의하여 상기 용종위치, 용종크기 및 용종종류 중 1 이상을 포함하는 용종데이터가 포함된 학습정보(1510)의 일 예의 형태를 도시한다. 용종데이터에 대한 값이 있는 경우, 해당 학습정보(1510)를 갖는 학습대상은 용종을 보유한 것이고, 용종데이터에 대한 값이 없는 경우, 해당 학습정보(1510)를 갖는 학습대상은 용종을 보유하지 않은 것으로 판별할 수 있다.As described above, the
한편, 상기 가능성도출부(1200)는, 상기 학습대상의 학습정보(1510)에 조직검사 결과정보가 없는 경우에는, 과거에 수집된 학습정보(1510) 중 상기 학습정보수신부(1100)에서 수신된 상기 학습대상의 상기 생활습관정보와 생활습관정보가 동일하고, 상기 대장내시경 결과정보가 기설정된 기준 내에서 유사하고, 조직검사 결과정보가 존재하는 과거의 수집된 학습정보(1510)에 기초하여, 상기 학습정보수신부(1100)에서 수신된 학습정보(1510)에 대한 대장암가능성을 도출한다. 구체적으로 도 7의 (a)에 도시된 바에 따르면, 학습정보(1510) #1은 용종위치 및 용종사이즈에 대한 값은 존재하지만 용종종류에 대한 값은 존재하지 않는 것이 도시되어 있다. 이는 조직검사 결과정보가 수신되지 않았음을 의미한다. 이와 같이 본 발명의 일 실시예에서는, 서버시스템(1000)이 수신한 학습대상의 학습정보(1510)에 조직검사 결과정보가 없는 경우가 있을 수 있다. 이와 같은 경우에 가능성도출부(1200)는, 과거에 수집한 학습정보(1510) 중 수신된 조직검사 결과정보가 없는 학습대상의 학습정보(1510)와 동일한 생활습관정보를 가지는 학습정보(1510)를 필터링한다. 이후, 동일한 생활습관정보를 가진 1 이상의 학습정보(1510)의 용종위치 및 용종크기와 수신한 학습정보(1510)에 포함된 용종위치 및 용종크기를 비교하여 기설정된 기준 내에서 유사한 학습정보(1510)를 필터링한다. 도 7의 (a) 및 (b)에 따르면 용종종류에 대한 값이 없는 학습정보#1와 동일한 생활습관정보 40-00-00-00-10-10-01-01를 갖는 복수의 학습대상의 학습정보(1510)가 도시되고, 각각의 학습정보(1510)의 용종위치 및 용종크기를 비교했을 때, 학습정보#1 및 학습정보#5의 용종위치 및 용종크기가 R 및 4로서 동일함이 도시되어 있다. 이에 따라 가능성도출부(1200)는, 학습정보#1의 용종종류를 학습정보#5와 동일한 용종종류 Type4로 도출한다. 바람직하게는, 과거에 수집한 동일한 생활습관정보를 갖는 1 이상의 학습대상의 학습정보(1510) 중 상기 대장내시경 결과정보로부터 도출된 용종위치 및 용종크기가 동일한 학습정보(1510)가 존재하는 경우, 해당 학습정보(1510)의 용종종류를 학습정보수신부(1100)에서 수신한 학습정보(1510)의 용종종류로 도출하고, 상기 용종위치 및 용종크기가 동일한 학습정보(1510)가 존재하지 않는 경우, 용종위치가 동일하고, 용종크기가 기설정된 범위내에 해당하는 학습정보(1510)의 용종종류를 수신한 학습정보수신부(1100)에서 수신한 학습정보(1510)의 용종종류로 도출할 수 있다.On the other hand, the
이와 같은 방식으로 가능성도출부(1200)는, 조직검사 결과정보가 없는 경우의 학습정보(1510)를 과거의 수집된 학습정보(1510)에 기초하여 조직검사 결과정보에 대한 정보를 모두 도출하고, 이후, 상기 도 5 및 6에서 설명한 방법을 통해 학습정보(1510)수신단계에서 수신된 학습정보(1510)에 대한 대장암가능성을 도출하고, 해당하는 특정 생활습관정보에 대한 대장암가능성을 도출한다.In this way, the
이와 같은 방식으로 가능성도출부(1200)는, 학습정보(1510)를 모두 수신하지 못한 경우에도 일부 학습정보(1510)에 기초하여 해당 학습정보(1510)를 보완하여 데이터 신뢰성을 향상시킬 수 있는 효과를 발휘할 수 있다.In this way, even if all the
한편, 예측데이터셋도출부(1300)는, 상기 가능성도출부(1200)가 도출한 특정 생활습관정보에 대한 용종가능성 및 대장암가능성에 기초하여 복수의 상기 특정 생활습관정보를 가진 그룹의 용종가능성 및 대장암가능성에 대한 예측데이터셋(1520)을 도출한다. 예측데이터셋(1520)은, 복수의 세부카테고리를 포함하는 생활습관정보, 상기 용종가능성, 상기 대장암가능성을 포함하고, 상기 생활습관정보는, 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력을 포함한다. 가능성도출부(1200)가 도출한 특정 생활습관정보에 대한 용종가능성 및 대장암가능성은 도 7의 (c)에 도시된 바와 같이 생활습관정보 40-00-00-00-10-10-01-01에 대한 용종가능성 A1, 및 대장암가능성B1을 도출하고, 예측데이터셋도출부(1300)는, 도 7의 (d)에 도시된 바와 같이 전체 학습정보(1510)를 복수의 상기 특정생활습관정보를 가진 그룹별 생활습관정보, 생활습관정보에 대한 용종가능성, 및 대장암가능성을 포함하는 예측데이터셋(1520)을 도출한다. 이와 같이 도출된 예측데이터셋(1520)에 기초하여 후술하는 예측결과도출부(1400)는 입력된 입력생활습관정보에 대한 용종가능성 및 대장암가능성을 예측할 수 있다.On the other hand, the predicted data
도 8은 본 발명의 일 실시예에 따른 예측결과도출부(1400)의 수행 단계를 개략적으로 도시하고, 도 9는 본 발명의 일 실시예에 따른 예측결과도출부(1400)에 의하여 생활습관정보의 세부카테고리항목을 제외하는 기준을 개략적으로 도시한다.8 schematically shows the steps of performing the prediction result derivation unit 1400 according to an embodiment of the present invention, and Fig. 9 is a lifestyle information by the prediction result derivation unit 1400 according to an embodiment of the present invention. The criteria for excluding subcategory items of are schematically shown.
본 발명의 예측결과도출부(1400)는, 입력된 입력생활습관정보에 대하여, 상기 예측데이터셋도출부(1300)로부터 도출된 예측데이터셋(1520)에 기초하여 해당 입력생활습관정보를 가진 사람의 용종가능성 및 대장암가능성에 대한 결과를 도출할 수 있다. 구체적으로, 상기 예측결과도출부(1400)는, 상기 입력생활습관정보 및 상기 예측데이터셋(1520)에 포함된 생활습관정보의 매칭정도에 따라 유사도를 도출하고, 상기 유사도가 기설정된 기준을 부합하는지 여부를 판별하여 유사그룹예측데이터를 도출하는 단계(S1000 내지 S1300); 및 상기 유사그룹예측데이터에 기초하여 상기 입력생활습관정보를 가진 사람의 용종가능성 및 대장암가능성을 도출하는 단계(S1400);를 수행한다.The prediction result deriving unit 1400 of the present invention is a person who has the input lifestyle information based on the predicted
S1000단계에서는, 입력된 입력생활습관정보 및 예측데이터셋(1520)에 포함된 생활습관정보의 매칭정도에 따라 유사도를 도출한다. 입력된 입력생활습관정보와 상기 예측데이터셋(1520)도출단계에서 도출된 예측데이터셋(1520)의 생활습관정보를 매칭하여 생활습관정보의 세부카테고리에 따른 매칭여부를 판별하고, 매칭여부에 따라 유사도를 도출할 수 있다. 생활습관정보에 포함되는 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력 각각의 카테고리의 매칭여부를 판별한 후 매칭여부에 따라 유사도를 도출한다. 유사도를 도출하는 식은 하기 도출식 3에 나타낸다. In step S1000, the degree of similarity is derived according to the matching degree of the inputted lifestyle information and lifestyle information included in the
[도출식 3][Draw Expression 3]
(매칭된 생활습관정보의 세부카테고리 항목의 수 / 전체 세부카테고리 항목의 수)*100(Number of subcategory items in matched lifestyle information / Total subcategory items)*100
상기 예측결과도출부(1400)가 유사도를 도출하는 일 예는 다음과 같다.An example in which the prediction result deriving unit 1400 derives the degree of similarity is as follows.
[예 1][Example 1]
입력생활습관정보 : 30-01-00-00-10-10-01-01Input lifestyle information: 30-01-00-00-10-10-01-01
세부예측데이터셋 생활습관정보 : 50-00-01-00-12-10-01-01Detailed prediction data set lifestyle information: 50-00-01-00-12-10-01-01
매칭여부 :X-X-X-O-X-O-O-OMatching :X-X-X-O-X-O-O-O
상기 일 예를 도출식 3의 적용하면 (4/8)*100 = 40%의 유사도를 도출할 수 있다. 이와 같은 방식으로 예측결과도출부(1400)는 입력생활습관정보 및 예측데이터셋(1520)의 유사도를 도출한다.If the above example is applied to the
이후 S1100단계에서는, S1000단계에서 도출된 유사도가 기설정된 기준에 부합하는지 여부를 판별한다. 예를 들어, 상기 기설정된 기준이 도출된 유사도가 80% 이상인 경우라고 가정할 때, 본 발명의 일 실시예에서는 생활습관정보의 세부카테고리 항목의 수는 8이므로, 7 이상의 항목의 생활습관정보가 동일한 경우에 80%이상의 유사도가 도출될 수 있다. 이에 따라, 예측결과도출부(1400)는 예측데이터셋(1520) 중 80% 이상의 유사도가 도출된 세부예측데이터셋을 판별한다. 이후, 유사도가 기설정된 기준에 부합하는 세부예측데이터셋이 있는 경우 S1200단계를 수행하고, 유사도가 기설정된 기준에 부합하는 세부예측데이터셋이 없는 경우, S1300단계를 수행한다.Thereafter, in step S1100, it is determined whether the degree of similarity derived in step S1000 meets a preset criterion. For example, assuming that the similarity from which the predetermined criterion is derived is 80% or more, in an embodiment of the present invention, the number of detailed category items of the lifestyle information is 8, so that the lifestyle information of the 7 or more items is In the same case, a similarity of 80% or more can be derived. Accordingly, the prediction result derivation unit 1400 determines a detailed prediction data set from which a similarity of 80% or more is derived among the
S1200단계는, 상기 유사도가 기설정된 기준에 부합하는 세부예측데이터셋이 있는 경우, 예측결과도출부(1400)가 수행하는 단계로서, S1200단계에서는, 예측데이터셋(1520) 중 유사도가 기설정된 기준을 부합하는 1 이상의 세부예측데이터셋을 유사그룹예측데이터로 도출한다.Step S1200 is a step performed by the prediction result derivation unit 1400 when there is a detailed prediction data set that satisfies a preset criterion of the similarity. In step S1200, a criterion with a preset similarity of the
한편, S1300단계는, 상기 유사도가 기설정된 기준에 부합하는 세부예측데이터셋이 없는 경우, 예측결과도출부(1400)가 수행하는 단계로서, S1300단계에서는, 입력생활습관정보의 복수의 세부카테고리정보의 일부를 기설정된 기준에 따라 제외한다. 도 9에 도시된 바에 따르면, 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력에 따른 8개의 세부카테고리정보의 항목의 매칭정도에 따라 도출된 유사도가 기설정된 기준에 부합하는 세부예측데이터셋이 없는 경우, 생활습관정보의 복수의 세부카테고리정보 중 나이 및 성별을 제외하여 BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력에 따른 6개의 세부카테고리정보를 기준으로 한다. 이와 같이 예측결과도출부(1400)는 도 9에 도시된 바와 같은 기설정된 기준에 따라 복수의 세부카테고리정보의 일부를 제외할 수 있다. 바람직하게는, 상기 입력생활습관정보는, 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력 중 1 이상을 포함하고, 상기 유사그룹예측데이터로 도출하는 단계는, 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력에 대한 제1유사도가 기설정된 기준을 부합하는지 여부를 판별하고, 상기 제1유사도가 기설정된 기준에 부합하지 않는 경우, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력에 대한 제2유사도가 기설정된 기준을 부합하는지 여부를 판별하고, 상기 제2유사도가 기설정된 기준에 부합하지 않는 경우, BMI, 흡연습관, 음주습관 및 개인병력에 대한 제3유사도가 기설정된 기준을 부합하는지 여부를 판별하여, 상기 유사그룹예측데이터를 도출한다.On the other hand, step S1300 is a step performed by the prediction result derivation unit 1400 when there is no detailed prediction data set that meets the predetermined criterion with the degree of similarity. In step S1300, a plurality of detailed category information of the input lifestyle information A part of is excluded according to the preset criteria. As shown in FIG. 9, the degree of similarity derived according to the matching degree of items of eight detailed category information according to age, gender, BMI, exercise habit, drinking habit, smoking habit, family medical history, and personal medical history is based on a preset criterion. If there is no matching detailed prediction data set, 6 detailed category information according to BMI, exercise habit, drinking habit, smoking habit, family medical history and personal medical history, excluding age and gender among the multiple detailed category information of lifestyle information. It is a standard. In this way, the prediction result derivation unit 1400 may exclude some of the plurality of detailed category information according to a preset criterion as illustrated in FIG. 9. Preferably, the input lifestyle information includes at least one of age, gender, BMI, exercise habit, drinking habit, smoking habit, family medical history and personal medical history, and the step of deriving the similar group prediction data includes age , Gender, BMI, exercise habit, drinking habit, smoking habit, family medical history and personal medical history to determine whether the first similarity meets a preset criterion, and if the first similarity does not meet the preset criteria, Determine whether the second similarity for BMI, exercise habits, drinking habits, smoking habits, family medical history and personal medical history meets the preset criteria, and if the second similarity does not meet the preset criteria, BMI, smoking It is determined whether the third similarity degree for habit, drinking habit, and personal medical history meets a preset criterion to derive the similar group prediction data.
이와 같이 입력생활습관정보 및 예측데이터셋(1520)과 매칭하는 복수의 세부카테고리정보의 일부를 제외한 후, 예측결과도출부(1400)는, 다시 상기 S1000 내지 S1200단계를 수행하여, 상기 유사도가 기설정된 기준을 부합하는 1 이상의 세부예측데이터셋을 유사그룹예측데이터로 도출할 수 있다.After excluding some of the plurality of detailed category information matching the input lifestyle information and the
S1400단계에서는, 상기 S1000 내지 S1300단계의 수행을 통해 유사그룹예측데이터를 도출한 예측결과도출부(1400)는, 상기 유사그룹예측데이터에 기초하여 입력생활습관정보를 가진 사람의 용종가능성 및 대장암가능성을 도출한다.In step S1400, the prediction result derivation unit 1400 derived from the similar group prediction data through the execution of the steps S1000 to S1300, the polyp possibility and colorectal cancer of a person with input lifestyle information based on the similar group prediction data. Derive the possibility.
본 발명의 일 실시예에서, 입력된 입력생활습관정보가 도 10의 (a)와 같은 정보가 입력된 경우, 예측결과도출부(1400)는 상기 S1000 내지 S1300단계의 수행을 통해 도 10의 (b)와 같은 세부예측데이터셋을 유사그룹예측데이터로 도출할 수 있다. 도 10의 (b)에 도시된 세부예측데이터셋의 생활습관정보는 입력생활습관정보와 동일한 20-00-00-00-10-10-01-01를 포함하고 있음이 도시되어 있다. 예측결과도출부(1400)는 이와 같은 유사그룹예측데이터를 도출한 후, 20-00-00-00-10-10-01-01에 해당하는 특정 생활습관정보에 대한 유사그룹예측데이터에 기초하여 20-00-00-00-10-10-01-01에 해당하는 입력생활습관정보를 가진 사람의 용종가능성 및 대장암가능성을 도출한다. 이에 따라 도 10의 (c)는, 20-00-00-00-10-10-01-01에 해당하는 특정 생활습관정보에 대한 유사그룹예측데이터의 용종가능성 값인 A1 및 대장암가능성 B2가 20-00-00-00-10-10-01-01에 해당하는 입력생활습관정보를 가진 사람의 용종가능성의 값이 A1 및 대장암가능성의 값이 B2로 도출된 것이 도시된다.In an embodiment of the present invention, when the inputted lifestyle information is input as shown in FIG. 10A, the prediction result derivation unit 1400 performs the steps S1000 to S1300. The detailed prediction data set as shown in b) can be derived as similar group prediction data. It is shown that the lifestyle information of the detailed prediction data set shown in (b) of FIG. 10 includes the same 20-00-00-00-10-10-01-01 as the input lifestyle information. The prediction result derivation unit 1400 derives the similar group prediction data, and then based on the similar group prediction data for specific lifestyle information corresponding to 20-00-00-00-10-10-01-01. It derives the polyp potential and colorectal cancer potential of a person with input lifestyle information corresponding to 20-00-00-00-10-10-01-01. Accordingly, (c) of FIG. 10 shows that A1 and colorectal cancer probability B2, which is the polyp probability value of the similar group prediction data for the specific lifestyle information corresponding to 20-00-00-00-10-10-01-01, are 20. It is shown that the polyp potential value of a person with the input lifestyle information corresponding to -00-00-00-10-10-01-01 is derived as A1 and the colorectal cancer probability value is derived as B2.
도 10의 (b)는 상술한 설명과 같이 생활습관정보의 모든 세부카테고리정보의 항목이 입력생활습관정보와 일치하는 경우를 설명하였지만 본 발명의 일 실시예에서는, 입력된 입력생활습관정보와 예측데이터셋(1520)의 생활습관정보의 세부카테고리정보의 항목이 모두 일치하지 않는 경우가 있을 수 있다. 도 10의 (c)는 세부카테고리정보의 항목이 모두 일치하는 세부예측데이터셋이 없는 경우에 기설정된 기준에 따라 도출된 유사그룹예측데이터를 도시한다. 도 10의 (c)에 도시된 바에 따르면 20-00-00-00-10-10-01-01과 매칭정도에 따라 유사도가 기설정된 기준에 부합하는 유사그룹예측데이터로서 5개의 세부예측데이터셋이 도출되었다. 세부예측데이터셋#1의 경우, 성별을 제외한 나머지 카테고리정보의 항목이 동일하고, 세부예측데이터셋#2의 경우, 나이를 제외한 나머지 카테고리 정보의 항목이 동일하고, 나머지 세부예측데이터셋#3,#4 및 #5의 경우에도 각각 음주습관, 흡연습관 및 BMI를 제외한 나머지 카테고리정보의 항목이 동일한 것이 도시된다. 이 경우, 예측결과도출부(1400)는, 20-00-00-00-10-10-01-01에 해당하는 특정 생활습관정보에 대한 유사그룹예측데이터에 기초하여 20-00-00-00-10-10-01-01에 해당하는 입력생활습관정보를 가진 사람의 용종가능성 및 대장암가능성을 도출한다. 이에 따라 도 10의 (e)는, 20-00-00-00-10-10-01-01에 해당하는 특정 생활습관정보에 대한 유사그룹예측데이터인 5개의 세부예측데이터셋의 용종가능성 및 대장암가능성 값의 평균값인 A1+A2+A3+A4+A5/5 및 B1+B2+B3+B4+B5/5가 20-00-00-00-10-10-01-01에 해당하는 입력생활습관정보를 가진 사람의 용종가능성 값이 A1+A2+A3+A4+A5/5 및 대장암가능성 값이 B1+B2+B3+B4+B5/5로 도출된 것이 도시된다.10B illustrates the case where all the detailed category information items of the lifestyle information match the input lifestyle information as described above, but in an embodiment of the present invention, the input lifestyle information and prediction There may be a case where all items of the detailed category information of the lifestyle information of the
바람직하게는, 입력생활습관정보를 가진 사람의 용종가능성 및 대장암가능성은 하기의 도출식 4 및 도출식5에 기초하여 도출할 수 있다.Preferably, the polyp possibility and colon cancer possibility of a person with the input lifestyle information can be derived based on the following
[도출식 4][Draw Expression 4]
[도출식 5][Draw Expression 5]
바람직하게는, 예측결과도출부(1400)가 수행하는, 유사그룹예측데이터를 도출하는 단계는, 상기 유사도가 기설정된 기준을 부합하면서, 상기 입력생활습관정보의 복수의 세부카테고리정보의 항목이 모두 일치하는 세부예측데이터셋이 있는 경우에, 해당 세부예측데이터셋만을 상기 유사그룹예측데이터로 도출하고, 상기 유사도가 기설정된 기준을 부합하면서, 상기 입력생활습관정보의 복수의 세부카테고리정보의 항목이 모두 일치하는 세부예측데이터셋은 없는 경우에, 도출된 1 이상의 세부예측데이터셋을 상기 유사그룹예측데이터로 도출한다.Preferably, the step of deriving similar group prediction data performed by the prediction result derivation unit 1400 includes all items of a plurality of detailed category information of the input lifestyle information while meeting a predetermined criterion with the degree of similarity. When there is a matching detailed prediction data set, only the detailed prediction data set is derived as the similar group prediction data, and while the similarity meets a preset criterion, items of a plurality of detailed category information of the input lifestyle information are When there is no detailed prediction data set that all match, one or more derived detailed prediction data sets are derived as the similar group prediction data.
이와 같은 방식으로, 예측결과도출부(1400)는 학습정보(1510)를 학습하여 도출된 예측데이터셋(1520)에 기초하여 입력생활습관정보를 갖는 사람의 용종가능성 및 대장암가능성을 도출할 수 있다.In this way, the prediction result derivation unit 1400 can derive the polyp potential and colorectal cancer potential of a person having the input lifestyle information based on the predicted
도 11은 본 발명의 일 실시예에 따른 컴퓨팅장치의 내부 구성을 개략적으로 도시한다.11 schematically illustrates an internal configuration of a computing device according to an embodiment of the present invention.
상기 도 1에 따른 대장암 관련 정보 예측 방법을 수행하는 서버시스템(1000)은 도 13에서 도시되는 컴퓨팅장치의 1 이상의 모듈을 포함할 수 있다.The
도 11에 도시한 바와 같이, 컴퓨팅장치(11000)은 적어도 하나의 프로세서(processor)(11100), 메모리(memory)(11200), 주변장치 인터페이스(peripheral interface)(11300), 입/출력 서브시스템(I/Osubsystem)(11400), 전력 회로(11500) 및 통신 회로(11600)를 적어도 포함할 수 있다. 이때, 컴퓨팅장치(11000)는 상기 얼굴의 비대칭 특성정보를 도출하는 시스템(1000)을 포함하거나, 상기 입/출력 서브시스템(11400)에 의하여 서버시스템(1000)에 연결될 수 있다.11, the
메모리(11200)는, 일례로 고속 랜덤 액세스 메모리(high-speed random access memory), 자기 디스크, 에스램(SRAM), 디램(DRAM), 롬(ROM), 플래시 메모리 또는 비휘발성 메모리를 포함할 수 있다. 메모리(11200)는 컴퓨팅장치(11000)의 동작에 필요한 소프트웨어 모듈, 명령어 집합 또는 그밖에 다양한 데이터를 포함할 수 있다.The
이때, 프로세서(11100)나 주변장치 인터페이스(11300) 등의 다른 컴포넌트에서 메모리(11200)에 액세스하는 것은 프로세서(11100)에 의해 제어될 수 있다. 상기 프로세서(11100)은 단일 혹은 복수로 구성될 수 있고, 연산처리속도 향상을 위하여 GPU 및 TPU 형태의 프로세서를 포함할 수 있다.In this case, access to the
주변장치 인터페이스(11300)는 컴퓨팅장치(11000)의 입력 및/또는 출력 주변장치를 프로세서(11100) 및 메모리 (11200)에 결합시킬 수 있다. 프로세서(11100)는 메모리(11200)에 저장된 소프트웨어 모듈 또는 명령어 집합을 실행하여 컴퓨팅장치(11000)을 위한 다양한 기능을 수행하고 데이터를 처리할 수 있다.The
입/출력 서브시스템(11400)은 다양한 입/출력 주변장치들을 주변장치 인터페이스(11300)에 결합시킬 수 있다. 예를 들어, 입/출력 서브시스템(11400)은 모니터나 키보드, 마우스, 프린터 또는 필요에 따라 터치스크린이나 센서등의 주변장치를 주변장치 인터페이스(11300)에 결합시키기 위한 컨트롤러를 포함할 수 있다. 다른 측면에 따르면, 입/출력 주변장치들은 입/출력 서브시스템(11400)을 거치지 않고 주변장치 인터페이스(11300)에 결합될 수도 있다.The input/output subsystem 11400 may couple various input/output peripherals to the
전력 회로(11500)는 단말기의 컴포넌트의 전부 또는 일부로 전력을 공급할 수 있다. 예를 들어 전력 회로(11500)는 전력 관리 시스템, 배터리나 교류(AC) 등과 같은 하나 이상의 전원, 충전 시스템, 전력 실패 감지 회로(power failure detection circuit), 전력 변환기나 인버터, 전력 상태 표시자 또는 전력 생성, 관리, 분배를 위한 임의의 다른 컴포넌트들을 포함할 수 있다.The
통신 회로(11600)는 적어도 하나의 외부 포트를 이용하여 다른 컴퓨팅장치와 통신을 가능하게 할 수 있다.The
또는 상술한 바와 같이 필요에 따라 통신 회로(11600)는 RF 회로를 포함하여 전자기 신호(electromagnetic signal)라고도 알려진 RF 신호를 송수신함으로써, 다른 컴퓨팅장치와 통신을 가능하게 할 수도 있다.Alternatively, as described above, if necessary, the
이러한 도 11의 실시예는, 컴퓨팅장치(11000)의 일례일 뿐이고, 컴퓨팅장치(11000)은 도 11에 도시된 일부 컴포넌트가 생략되거나, 도 11에 도시되지 않은 추가의 컴포넌트를 더 구비하거나, 2개 이상의 컴포넌트를 결합시키는 구성 또는 배치를 가질 수 있다. 예를 들어, 모바일 환경의 통신 단말을 위한 컴퓨팅장치는 도 11에 도시된 컴포넌트들 외에도, 터치스크린이나 센서 등을 더 포함할 수도 있으며, 통신 회로(1160)에 다양한 통신방식(WiFi, 3G, LTE, Bluetooth, NFC, Zigbee 등)의 RF 통신을 위한 회로가 포함될 수도 있다. 컴퓨팅장치(11000)에 포함 가능한 컴포넌트들은 하나 이상의 신호 처리 또는 어플리케이션에 특화된 집적 회로를 포함하는 하드웨어, 소프트웨어, 또는 하드웨어 및 소프트웨어 양자의 조합으로 구현될 수 있다.The embodiment of FIG. 11 is only an example of the
본 발명의 실시예에 따른 방법들은 다양한 컴퓨팅장치를 통하여 수행될 수 있는 프로그램 명령(instruction) 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 특히, 본 실시예에 따른 프로그램은 PC 기반의 프로그램 또는 모바일 단말 전용의 어플리케이션으로 구성될 수 있다. 본 발명이 적용되는 어플리케이션은 파일 배포 시스템이 제공하는 파일을 통해 이용자 단말에 설치될 수 있다. 일 예로, 파일 배포 시스템은 이용자 단말이기의 요청에 따라 상기 파일을 전송하는 파일 전송부(미도시)를 포함할 수 있다.Methods according to an embodiment of the present invention may be implemented in the form of program instructions that can be executed through various computing devices and recorded in a computer-readable medium. In particular, the program according to the present embodiment may be configured as a PC-based program or an application dedicated to a mobile terminal. An application to which the present invention is applied may be installed in a user terminal through a file provided by the file distribution system. As an example, the file distribution system may include a file transmission unit (not shown) that transmits the file according to the request of the user terminal.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The apparatus described above may be implemented as a hardware component, a software component, and/or a combination of a hardware component and a software component. For example, the devices and components described in the embodiments are, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA). , A programmable logic unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions, such as one or more general purpose computers or special purpose computers. The processing device may execute an operating system (OS) and one or more software applications executed on the operating system. Further, the processing device may access, store, manipulate, process, and generate data in response to the execution of software. For the convenience of understanding, although it is sometimes described that one processing device is used, one of ordinary skill in the art, the processing device is a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that it may include. For example, the processing device may include a plurality of processors or one processor and one controller. In addition, other processing configurations are possible, such as a parallel processor.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로 (collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨팅장치 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instruction, or a combination of one or more of these, configuring the processing unit to operate as desired or processed independently or collectively. You can command the device. Software and/or data may be interpreted by a processing device or to provide instructions or data to a processing device, of any type of machine, component, physical device, virtual equipment, computer storage medium or device. , Or may be permanently or temporarily embodyed in a transmitted signal wave. The software may be distributed over networked computing devices, and may be stored or executed in a distributed manner. Software and data may be stored on one or more computer-readable recording media.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the embodiment, or may be known and usable to those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. -A hardware device specially configured to store and execute program instructions such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine language codes such as those produced by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operation of the embodiment, and vice versa.
본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수 있다.Although the methods and systems of the present invention have been described in connection with specific embodiments, some or all of their components or operations may be implemented using a computer system having a general-purpose hardware architecture.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.The above description of the present invention is for illustrative purposes only, and those of ordinary skill in the art to which the present invention pertains will be able to understand that other specific forms can be easily modified without changing the technical spirit or essential features of the present invention. will be. Therefore, it should be understood that the embodiments described above are illustrative in all respects and are not limiting. For example, each component described as a single type may be implemented in a distributed manner, and similarly, components described as being distributed may also be implemented in a combined form.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is indicated by the claims to be described later rather than the detailed description, and all changes or modified forms derived from the meaning and scope of the claims and their equivalent concepts should be construed as being included in the scope of the present invention. do.
Claims (5)
학습대상의 복수의 항목에 대한 생활습관정보, 대장내시경 결과정보, 및 조직검사 결과정보를 포함하는 학습정보를 수신하는 학습정보수신단계;
특정 생활습관정보를 갖는 1 이상의 학습대상의 대장내시경 결과정보, 및 조직검사 결과정보를 클러스터링하고, 클러스터링된 정보에 기초하여 특정 생활습관정보를 가진 그룹에 대한 용종가능성, 및 대장암가능성을 도출하는 가능성도출단계;
복수의 상기 특정 생활습관정보를 가진 그룹의 상기 용종가능성, 및 상기 대장암가능성에 대한 예측데이터셋을 도출하는 예측데이터셋도출단계; 및
입력된 입력생활습관정보에 대하여, 상기 예측데이터셋에 기초하여 기설정된 기준에 부합하는 유사그룹예측데이터를 도출하고, 상기 유사그룹예측데이터에 기초하여 해당 입력생활습관정보를 가진 사람의 용종가능성 및 대장암가능성에 대한 결과를 도출하는 예측결과도출단계;를 포함하는, 대장암 관련 정보 예측 방법.
As a method of predicting colorectal cancer-related information according to the degree of risk factors of lifestyle information performed by the server system,
A learning information receiving step of receiving learning information including lifestyle information, colonoscopy result information, and tissue examination result information for a plurality of items of the learning subject;
Clustering colonoscopy result information and biopsy result information of one or more subjects with specific lifestyle information, and deriving polyp potential and colon cancer potential for groups with specific lifestyle information based on the clustered information. The step of finding the possibility;
A prediction data set deriving step of deriving a prediction data set for the polyp possibility and the colorectal cancer possibility of the group having the plurality of specific lifestyle information; And
With respect to the input lifestyle information, similar group prediction data that meets a preset criterion is derived based on the prediction data set, and the polypability of a person with the input lifestyle information based on the similar group prediction data, and Comprising, a method for predicting information related to colon cancer, including; a step of deriving a prediction result for deriving a result of the possibility of colon cancer.
상기 가능성도출단계는,
상기 학습대상의 상기 대장내시경 결과정보 및 상기 조직검사 결과정보로부터 대장용종에 관련된 키워드를 추출하여 상기 학습대상의 용종크기, 용종위치 및 용종종류 중 1 이상을 포함하는 용종데이터를 도출하는 단계;
상기 용종크기, 용종위치 및 용종종류 중 1 이상에 의하여 상기 학습대상의 용종보유여부를 판별하고, 동일한 상기 특정 생활습관정보를 갖는 2 이상의 학습대상의 상기 용종보유여부에 기초하여 상기 특정 생활습관정보에 대한 상기 용종가능성을 도출하는 단계; 및
동일한 상기 특정 생활습관정보를 갖는 2 이상의 학습대상의 상기 용종크기 및 용종종류에 대한 정보, 및 기설정된 매핑테이블에 따라 상기 특정 생활습관정보에 대한 상기 대장암가능성을 도출하는 단계;를 포함하는 대장암 관련 정보 예측 방법.
The method according to claim 1,
The step of deriving the possibility,
Extracting a keyword related to a colon polyp from the colonoscopy result information and the biopsy result information of the learning subject, and deriving polyp data including at least one of the polyp size, the polyp location, and the polyp type of the learning subject;
The specific lifestyle information is determined based on whether or not the learning target has a polyp based on at least one of the polyp size, polyp location, and type of polyp, and based on whether or not the polyp of two or more learning targets having the same specific lifestyle information has the polyp. Deriving the polyp possibility for; And
The large intestine comprising: deriving the likelihood of colon cancer for the specific lifestyle information according to information on the polyp size and polyp type of two or more learning targets having the same specific lifestyle information, and a preset mapping table. How to predict cancer-related information.
상기 입력생활습관정보 및 상기 예측데이터셋에 포함된 생활습관정보는 복수의 세부카테고리정보를 포함하고,
상기 예측결과도출단계는, 상기 유사그룹예측데이터를 도출하는 단계;를 포함하고,
상기 유사그룹예측데이터를 도출하는 단계는,
상기 입력생활습관정보 및 상기 예측데이터셋에 포함된 생활습관정보의 유사도가 기설정된 기준을 부합하는 세부예측데이터셋이 없는 경우에,
상기 입력생활습관정보의 복수의 세부카테고리정보의 일부를 기설정된 기준에 따라 제외하고, 변경된 세부카테고리정보의 항목을 기준으로 상기 유사도를 다시 도출하여 유사그룹예측데이터를 도출하는, 대장암 관련 정보 예측 방법.
The method according to claim 2,
The input lifestyle information and lifestyle information included in the prediction data set include a plurality of detailed category information,
The step of deriving the prediction result includes: deriving the similar group prediction data,
The step of deriving the similar group prediction data,
When there is no detailed prediction data set that satisfies a preset criterion, the similarity between the input lifestyle information and the lifestyle information included in the prediction data set is not present,
Prediction of colorectal cancer-related information by excluding some of the plurality of detailed category information of the input lifestyle information according to a preset criterion, and deriving the similarity level again based on the item of the changed detailed category information to derive similar group prediction data Way.
상기 입력생활습관정보는, 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력 중 1 이상을 포함하고,
상기 유사그룹예측데이터를 도출하는 단계는, 나이, 성별, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력에 대한 제1유사도가 기설정된 기준을 부합하는지 여부를 판별하고, 상기 제1유사도가 기설정된 기준에 부합하지 않는 경우, BMI, 운동습관, 음주습관, 흡연습관, 가족병력 및 개인병력에 대한 제2유사도가 기설정된 기준을 부합하는지 여부를 판별하고, 상기 제2유사도가 기설정된 기준에 부합하지 않는 경우, BMI, 흡연습관, 음주습관 및 개인병력에 대한 제3유사도가 기설정된 기준을 부합하는지 여부를 판별하여, 상기 유사그룹예측데이터를 도출하는, 대장암 관련 정보 예측 방법.
The method of claim 3,
The input lifestyle information includes at least one of age, gender, BMI, exercise habit, drinking habit, smoking habit, family medical history, and personal medical history,
In the step of deriving the similar group prediction data, it is determined whether a first similarity degree for age, gender, BMI, exercise habit, drinking habit, smoking habit, family medical history and personal medical history meets a preset criterion, and the first 1 If the similarity does not meet the preset criteria, it is determined whether the second similarity for BMI, exercise habits, drinking habits, smoking habits, family medical history and personal medical history meets the preset criteria, and the second similarity is In the case of not meeting the preset criteria, it is determined whether the third similarity for BMI, smoking habits, drinking habits, and personal medical history meets the preset criteria to derive the similar group prediction data, predicting colorectal cancer-related information. Way.
학습대상의 복수의 항목에 대한 생활습관정보, 대장내시경 결과정보, 및 조직검사 결과정보를 포함하는 학습정보를 수신하는 학습정보수신부;
특정 생활습관정보를 갖는 1 이상의 학습대상의 대장내시경 결과정보, 및 조직검사 결과정보를 클러스터링하고, 클러스터링된 정보에 기초하여 특정 생활습관정보를 가진 그룹에 대한 용종가능성, 및 대장암가능성을 도출하는 가능성도출부;
복수의 상기 특정 생활습관정보를 가진 그룹의 상기 용종가능성, 및 상기 대장암가능성에 대한 예측데이터셋을 도출하는 예측데이터셋도출부; 및
입력된 입력생활습관정보에 대하여, 상기 예측데이터셋에 기초하여 기설정된 기준에 부합하는 유사그룹예측데이터를 도출하고, 상기 유사그룹예측데이터에 기초하여 해당 입력생활습관정보를 가진 사람의 용종가능성 및 대장암가능성에 대한 결과를 도출하는 예측결과도출부;를 포함하는, 서버시스템.
As a server system that performs a method of predicting information related to colon cancer according to the degree of risk factors of lifestyle information,
A learning information receiving unit for receiving learning information including lifestyle information, colonoscopy result information, and tissue examination result information for a plurality of items of the learning subject;
Clustering colonoscopy result information and biopsy result information of one or more subjects with specific lifestyle information, and deriving polyp potential and colon cancer potential for groups with specific lifestyle information based on the clustered information. Possibility-derived department;
A prediction data set deriving unit for deriving a prediction data set for the polyp possibility and the colorectal cancer possibility of a group having a plurality of the specific lifestyle information; And
For the input lifestyle information, similar group prediction data that meets a preset criterion is derived based on the prediction data set, and the polypability of a person with the input lifestyle information based on the similar group prediction data, and Containing, a server system; a prediction result derivation unit for deriving a result of the possibility of colon cancer.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190138889A KR102367565B1 (en) | 2019-11-01 | 2019-11-01 | Method and system for predicting colon cancer related information according to the degree of risk factor of lifestyle information. |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190138889A KR102367565B1 (en) | 2019-11-01 | 2019-11-01 | Method and system for predicting colon cancer related information according to the degree of risk factor of lifestyle information. |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210053064A true KR20210053064A (en) | 2021-05-11 |
KR102367565B1 KR102367565B1 (en) | 2022-02-28 |
Family
ID=75914994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190138889A KR102367565B1 (en) | 2019-11-01 | 2019-11-01 | Method and system for predicting colon cancer related information according to the degree of risk factor of lifestyle information. |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102367565B1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102405900B1 (en) * | 2021-10-12 | 2022-06-08 | 주식회사 바스젠바이오 | disease onset information generating apparatus through disease-related factor analysis based on time variability and method therefor |
KR20220109529A (en) * | 2021-01-28 | 2022-08-05 | 주식회사 피씨티 | Method and system for predicting high risk adenoma related information based on plural of machine-leaned model |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160043777A (en) * | 2014-10-14 | 2016-04-22 | 삼성에스디에스 주식회사 | Method and apparatus for disease occurrence prediction |
JP2018113042A (en) * | 2017-01-12 | 2018-07-19 | 株式会社AncientTree | Device for predicting, recording and comparing inspection data |
-
2019
- 2019-11-01 KR KR1020190138889A patent/KR102367565B1/en active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160043777A (en) * | 2014-10-14 | 2016-04-22 | 삼성에스디에스 주식회사 | Method and apparatus for disease occurrence prediction |
JP2018113042A (en) * | 2017-01-12 | 2018-07-19 | 株式会社AncientTree | Device for predicting, recording and comparing inspection data |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220109529A (en) * | 2021-01-28 | 2022-08-05 | 주식회사 피씨티 | Method and system for predicting high risk adenoma related information based on plural of machine-leaned model |
KR102405900B1 (en) * | 2021-10-12 | 2022-06-08 | 주식회사 바스젠바이오 | disease onset information generating apparatus through disease-related factor analysis based on time variability and method therefor |
WO2023063528A1 (en) * | 2021-10-12 | 2023-04-20 | 주식회사 바스젠바이오 | Device and method for generating disease onset information by means of disease-related factor analysis based on time variability |
Also Published As
Publication number | Publication date |
---|---|
KR102367565B1 (en) | 2022-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Handelman et al. | eD octor: machine learning and the future of medicine | |
Doppalapudi et al. | Lung cancer survival period prediction and understanding: Deep learning approaches | |
Trister et al. | Will machine learning tip the balance in breast cancer screening? | |
Thomsen et al. | Systematic review of machine learning for diagnosis and prognosis in dermatology | |
Liu et al. | Prediction of lymph node metastasis in patients with papillary thyroid carcinoma: a radiomics method based on preoperative ultrasound images | |
Hiremath et al. | An integrated nomogram combining deep learning, Prostate Imaging–Reporting and Data System (PI-RADS) scoring, and clinical variables for identification of clinically significant prostate cancer on biparametric MRI: a retrospective multicentre study | |
JP6127160B2 (en) | Personalized healthcare system and method | |
Acharya et al. | Higher order spectra analysis of breast thermograms for the automated identification of breast cancer | |
Salod et al. | Comparison of the performance of machine learning algorithms in breast cancer screening and detection: A protocol | |
Wang et al. | Application of support vector machine in cancer diagnosis | |
Ramana et al. | Performance comparison of classification algorithms on medical datasets | |
KR102367564B1 (en) | Method and system for predicting colon cancer related information based on lifestyle information | |
KR102367565B1 (en) | Method and system for predicting colon cancer related information according to the degree of risk factor of lifestyle information. | |
Mahoro et al. | Breast cancer classification on thermograms using deep CNN and transformers | |
Jazayeri et al. | Breast cancer diagnosis based on genomic data and extreme learning machine | |
Vasudevan et al. | Cancer subtype discovery using prognosis-enhanced neural network classifier in multigenomic data | |
Dublin et al. | Predictive value of a genomic classifier in indeterminate thyroid nodules based on nodule size | |
Zhang et al. | Development and validation of a deep learning model to screen for trisomy 21 during the first trimester from nuchal ultrasonographic images | |
Singh et al. | Information retrieval using machine learning from breast cancer diagnosis | |
Li et al. | ML3 LASSO (least absolute shrinkage and selection operator) and XGBoost (eXtreme gradient boosting) models for predicting depression-related work impairment in US working adults | |
Abreu et al. | Personalizing breast cancer patients with heterogeneous data | |
KR102490077B1 (en) | Method and system for predicting high risk adenoma related information based on plural of machine-leaned model | |
Durgalakshmi et al. | Feature selection and classification using support vector machine and decision tree | |
KR102577294B1 (en) | Method and system for predicting adenoma related information based on machine-leaned model | |
Xiong et al. | Kernelized information-theoretic metric learning for cancer diagnosis using high-dimensional molecular profiling data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |