KR101951727B1 - Computing method for predicting multiple kinds of cancers, and computing apparatus using the same - Google Patents

Computing method for predicting multiple kinds of cancers, and computing apparatus using the same Download PDF

Info

Publication number
KR101951727B1
KR101951727B1 KR1020180013390A KR20180013390A KR101951727B1 KR 101951727 B1 KR101951727 B1 KR 101951727B1 KR 1020180013390 A KR1020180013390 A KR 1020180013390A KR 20180013390 A KR20180013390 A KR 20180013390A KR 101951727 B1 KR101951727 B1 KR 101951727B1
Authority
KR
South Korea
Prior art keywords
cancer
information
diagnostic biomarker
cancer diagnostic
learned
Prior art date
Application number
KR1020180013390A
Other languages
Korean (ko)
Inventor
김철우
강경남
김형민
김보영
Original Assignee
(주)바이오인프라생명과학
주식회사 아이디어랩스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)바이오인프라생명과학, 주식회사 아이디어랩스 filed Critical (주)바이오인프라생명과학
Priority to KR1020180013390A priority Critical patent/KR101951727B1/en
Priority to PCT/KR2018/003724 priority patent/WO2019151573A1/en
Application granted granted Critical
Publication of KR101951727B1 publication Critical patent/KR101951727B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Abstract

The present invention relates to a computing method for multi-cancer determination, comprising the following steps: making a binary classification of diagnostic biomarker group information of k number of cancers and determining whether the diagnostic biomarker information of k number of cancers corresponds to cancer; if a result of the binary classification of the diagnostic biomarker information of k number of cancers is determined to be a cancer, using and analyzing the diagnostic biomarker information of k number of cancers and determining which cancer corresponds to the diagnostic biomarker information of k number of cancers. The computing method for multi-cancer determination is to improve the reliability of the determination of a cancer by using a statistical determination method which uses a biomarker group for a multi-cancer diagnosis.

Description

멀티 암 판별을 위한 컴퓨팅 방법 및 이를 이용한 컴퓨팅 장치 {COMPUTING METHOD FOR PREDICTING MULTIPLE KINDS OF CANCERS, AND COMPUTING APPARATUS USING THE SAME}BACKGROUND OF THE INVENTION 1. Field of the Invention [0001] The present invention relates to a computing method for multi-arm discrimination,

본 발명은 멀티 암 판별을 위한 컴퓨팅 방법 및 이를 이용한 컴퓨팅 장치에 관한 것으로, 보다 상세하게는, k개 암 진단 바이오마커의 정보를 바이너리 클래시피케이션하여 k개 암 진단 바이오마커의 정보가 암인지 암이 아닌지를 판별하며, k개 암 진단 바이오마커의 정보를 바이너리 클래시피케이션한 결과 암인 것으로 판별되면, k개 암 진단 바이오마커 정보를 신경망을 사용하여 분석하여 k개 암 진단 바이오마커의 정보가 k개 암 중 어느 암에 해당되는지를 판별하는 멀티 암을 판별하는 컴퓨팅 방법 및 이를 이용한 컴퓨팅 장치에 관한 것이다.The present invention relates to a computing method for multi-cancer discrimination and a computing apparatus using the same. More particularly, the present invention relates to a method of binarizing information of k cancer diagnostic biomarkers, K cancer diagnostic biomarker information is analyzed using a neural network to determine whether the information of k cancer diagnostic biomarkers is k < RTI ID = 0.0 > The present invention relates to a computing method for discriminating a multi-arm that discriminates which of cancer is cancer, and a computing apparatus using the same.

종양의 전이는 고형암을 가진 환자에서 종양의 일부분이 떨어져 나와 혈액을 통해 체내의 다른 부분으로 이동하는 현상으로 암과 관련된 사망에서 중요한 부분을 차지하고 있다. 현재 암을 진단하는 일반적인 방법은 초기 전이상태에서 조직의 일정부분을 떼어내어 조사하는 생검(biopsy)인데, 정확한 생검부위를 결정하는 것은 쉽지 않은 단점이 있다. 이에 반해 근래에 들어 주목받고 있는 액체생검 (liquid biopsy) 방법은 환자의 혈액, 소변 등 환자의 신체로부터 유래한 생물학적 시료를 채취하여 생물학적 시료 내의 종양세포를 검출하는 것으로 암의 진행과 암의 치료의 경과를 가늠할 수 있을 뿐만 아니라 초기의 검출과 진단에도 유용하다고 여겨지고 있다.Tumor metastasis is an important part of cancer-related deaths in patients with solid tumors, with a portion of the tumor falling off and moving through the blood to other parts of the body. Currently, a common method for diagnosing cancer is biopsy, in which a part of the tissue is removed from the initial metastatic state. However, it is not easy to determine the exact biopsy site. On the other hand, the liquid biopsy method, which has been attracting attention recently, is to detect a tumor cell in a biological sample by collecting a biological sample derived from the patient's body such as blood or urine, It is thought that it is not only useful for early detection and diagnosis, but also for measuring progress.

이와 같이 생물학적 시료에 포함된 단백질, 핵산, 대사물질 등을 이용하여 몸 안의 변화를 알아낼 수 있는 지표를 바이오마커(biomarker)라고 한다.A biomarker is an index that can detect changes in the body using proteins, nucleic acids, and metabolites contained in biological samples.

예컨대, 폐암을 조기 진단하기 위한 종래의 바이오마커 기술에는, 대한민국 등록특허 제10-1463588호에 개시되어 있는 바와 같이 A1AT, IGF-1, RANTES 및 TTR를 필수적으로 포함하는 것이 있었다.For example, conventional biomarker techniques for early diagnosis of lung cancer include those which essentially include A1AT, IGF-1, RANTES and TTR as disclosed in Korean Patent No. 10-1463588.

하지만, 단일 바이오마커만으로는 암 진단에 한계가 있어, 현재 이 기술분야에는 바이오마커를 2개 이상 복합적으로 사용함으로써 암의 진단 민감도 및 특이도를 향상시킨 복합 바이오마커를 이용한 암 진단 방법이 이용되고 있다.However, there is a limit to the diagnosis of cancer with only a single biomarker, and a cancer diagnosis method using a complex biomarker that improves the diagnostic sensitivity and specificity of cancer by using two or more biomarkers in combination is currently used in the technical field .

그러나, 이와 같은 복합 바이오마커를 이용하여 특정 암을 판별하는 경우, 특정 바이오마커가 특정 암에 대한 지표만 나타내는 것이 아니라 다른 암에 대한 지표도 나타낼 수 있으며, 그에 따라 복합 바이오마커를 이용하여 특정 암을 판별하는 데 있어 오판별이 발생할 수 있다.However, when such a complex biomarker is used to identify a specific cancer, the specific biomarker may not only indicate an indicator for a specific cancer but may also indicate an indicator for other cancer, A false discrimination may occur.

일 예로, 복합 바이오마커를 이용하여 선암(adenocarcinoma)을 진단하는 데 있어서, 복합 바이오마커의 정보를 이용하여 판별한 결과 선암으로 판별될 수 있으나, 실제 환자의 암은 편평상피세포암(squamous cell carcinoma)일 수도 있다. For example, in the diagnosis of adenocarcinoma using a complex biomarker, the result of discrimination using the information of the complex biomarker can be discriminated as adenocarcinoma. Actually, the cancer of the patient is squamous cell carcinoma ).

또한, 복합 바이오마커의 각각의 바이오마커 정보를 분석하여 암을 판별하는 데 있어서 판별자에 따라 다른 결과가 도출되는 등의 문제가 발생할 수 도 있다.In addition, when biomarker information of each of the complex biomarkers is analyzed to discriminate the cancer, different results may be derived depending on the discriminator.

본 발명은 상술한 문제점을 모두 해결하는 것을 목적으로 한다.The present invention aims at solving all of the above problems.

본 발명은 멀티 암 진단을 위한 바이오마커군을 이용하여 암의 종류를 정확히 판별할 수 있도록 하는 것을 다른 목적으로 한다.Another object of the present invention is to accurately discriminate the type of cancer using a group of biomarkers for diagnosis of multiple cancers.

또한, 본 발명은 멀티 암 진단을 위한 바이오마커군을 이용하여 멀티 암을 판별할 수 있도록 하는 것을 또 다른 목적으로 한다.It is another object of the present invention to make it possible to discriminate a multi-cancer using a biomarker group for multi-cancer diagnosis.

또한, 본 발명은 멀티 암 진단을 위한 바이오마커군을 이용한 통계적 판별 방법에 암의 종류를 정확히 판별할 수 있도록 하는 것을 또 다른 목적으로 한다.Another object of the present invention is to accurately discriminate types of cancer in a statistical discrimination method using a biomarker group for diagnosis of multiple cancers.

또한, 본 발명은 멀티 암 진단을 위한 바이오마커군을 이용한 통계적 판별 방법에 의해 암 판별에 대한 신뢰성을 향상시킬 수 있도록 하는 것을 또 다른 목적으로 한다.It is another object of the present invention to improve the reliability of cancer discrimination by a statistical discrimination method using a biomarker group for multi-cancer diagnosis.

상기한 바와 같은 본 발명의 목적을 달성하고, 후술하는 본 발명의 특징적인 효과를 실현하기 위한, 본 발명의 특징적인 구성은 하기와 같다.In order to accomplish the objects of the present invention as described above and achieve the characteristic effects of the present invention described below, the characteristic structure of the present invention is as follows.

본 발명의 일 실시예에 따르면,According to an embodiment of the present invention,

멀티 암을 판별하는 컴퓨팅 방법에 있어서, (a) k개 암 진단 바이오마커군의 정보가 입력되면, 컴퓨팅 장치가, 상기 k개 암 진단 바이오마커군의 정보를 바이너리 클래시피케이션하여 상기 k개 암 진단 바이오마커의 정보가 암인지 암이 아닌지를 판별하는 단계; 및 (b) 상기 k개 암 진단 바이오마커군의 정보를 상기 바이너리 클래시피케이션한 결과 암인 것으로 판별되면, 상기 컴퓨팅 장치가, 상기 k개 암 진단 바이오마커군 정보를 신경망을 사용하여 분석하여 상기 k개 암 진단 바이오마커군의 정보가 상기 k개 암 중 어느 암에 해당되는지를 판별하는 단계; 를 포함하는 멀티 암 판별을 위한 컴퓨팅 방법이 제공된다.(A) when information on a group of k cancer diagnostic biomarkers is inputted, the computing device binarily classifies the information of the k cancer diagnostic biomarkers, Determining whether the information of the diagnostic biomarker is cancer or cancer; And (b) if it is determined that the information on the k cancer diagnostic biomarker groups is cancerous as a result of the binary classification, the computing device analyzes the k cancer diagnostic biomarker group information using a neural network, Determining whether the information of the group of cancer diagnosis biomarkers corresponds to which of the k cancers; A method for computing a multi-arm is provided.

또한, 본 발명의 일 실시예에 따르면, 멀티 암을 판별하는 컴퓨팅 장치에 있어서, k개 암 진단 바이오마커군의 정보를 획득하는 통신부; 및 (i) 상기 k개 암 진단 바이오마커군의 정보를 바이너리 클래시피케이션하여 상기 k개 암 진단 바이오마커군의 정보가 암인지 암이 아닌지를 판별하는 프로세스와, (ii) 상기 k개 암 진단 바이오마커군의 정보를 상기 바이너리 클래시피케이션한 결과 암인 것으로 판별되면, 상기 k개 암 진단 바이오마커군 정보를 신경망을 사용하여 분석하여 상기 k개 암 진단 바이오마커군의 정보가 상기 k개 암 중 어느 암에 해당되는지를 판별하는 프로세스를 수행하는 프로세서; 를 포함하는 멀티 암 판별을 위한 컴퓨팅 장치가 제공된다.According to an embodiment of the present invention, there is provided a computing device for discriminating a multi-arm, comprising: a communication unit for acquiring information on k cancer diagnostic biomarker groups; And (i) binarizing the information of the k cancer diagnostic biomarker groups to determine whether the information of the k cancer diagnostic biomarker groups is cancer or cancer, and (ii) The information of the k cancer diagnostic biomarker group is analyzed using the neural network, and when the information of the k cancer diagnostic biomarker group is analyzed as a result of the binary classification, A processor for performing a process of determining which cancer corresponds; A computing device for multi-cancer determination is provided.

이 외에도, 본 발명의 방법을 실행하기 위한 컴퓨터 프로그램을 기록하기 위한 컴퓨터 판독 가능한 기록 매체가 더 제공된다.In addition, a computer readable recording medium for recording a computer program for executing the method of the present invention is further provided.

본 발명은 멀티 암 진단을 위한 바이오마커군을 이용하여 암의 종류를 정확히 판별할 수 있게 된다.The present invention can accurately discriminate types of cancer by using a group of biomarkers for diagnosis of multiple cancers.

또한, 본 발명은 멀티 암 진단을 위한 바이오마커군을 이용하여 멀티 암을 판별할 수 있게 된다.In addition, the present invention makes it possible to discriminate a multi-cancer using a biomarker group for diagnosis of multiple cancers.

또한, 본 발명은 멀티 암 진단을 위한 바이오마커군을 이용한 통계적 판별 방법에 암의 종류를 정확히 판별할 수 있게 된다.Further, the present invention makes it possible to accurately determine the type of cancer in the statistical discrimination method using the biomarker group for diagnosis of multiple cancers.

또한, 본 발명은 멀티 암 진단을 위한 바이오마커군을 이용한 통계적 판별 방법에 의해 암 판별에 대한 신뢰성을 향상시킬 수 있다.In addition, the present invention can improve the reliability of cancer discrimination by a statistical discrimination method using a biomarker group for multi-cancer diagnosis.

도 1은 본 발명의 일 실시예에 따른 멀티 암을 판별하는 컴퓨팅 장치를 개략적으로 도시한 것이고,
도 2는 본 발명의 일 실시예에 따른 멀티 암을 판별하는 컴퓨팅 방법을 개략적으로 도시한 것이고,
도 3은 본 발명의 일 실시예에 따른 멀티 암을 판별하는 컴퓨팅 방법에서 바이너리 클래시피케이션을 위한 엑스퍼트 네트워크의 모형을 개략적으로 도시한 것이고,
도 4는 본 발명의 일 실시예에 따른 멀티 암을 판별하는 컴퓨팅 방법에서 바이너리 클래시피케이션을 위한 엑스퍼트 네트워크에서 엑스퍼트를 선택하는 방법을 개략적으로 도시한 것이고,
도 5는 본 발명의 일 실시예에 따른 멀티 암을 판별하는 컴퓨팅 방법에서 멀티 클래시피케이션을 위한 신경망 모형을 개략적으로 도시한 것이다.
FIG. 1 schematically shows a computing apparatus for discriminating a multi-arm according to an embodiment of the present invention,
2 schematically shows a computing method for discriminating a multi-arm according to an embodiment of the present invention,
3 schematically illustrates a model of an expert network for binary classification in a method for computing a multi-arm according to an embodiment of the present invention,
FIG. 4 is a schematic view illustrating a method of selecting an expert in an expert network for binary classification in a multi-arm computing method according to an embodiment of the present invention,
5 is a schematic diagram of a neural network model for multiclassification in a computing method for identifying a multi-arm according to an embodiment of the present invention.

후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.The following detailed description of the invention refers to the accompanying drawings, which illustrate, by way of illustration, specific embodiments in which the invention may be practiced. These embodiments are described in sufficient detail to enable those skilled in the art to practice the invention. It should be understood that the various embodiments of the present invention are different, but need not be mutually exclusive. For example, certain features, structures, and characteristics described herein may be implemented in other embodiments without departing from the spirit and scope of the invention in connection with an embodiment. It is also to be understood that the position or arrangement of the individual components within each disclosed embodiment may be varied without departing from the spirit and scope of the invention. The following detailed description is, therefore, not to be taken in a limiting sense, and the scope of the present invention is to be limited only by the appended claims, along with the full scope of equivalents to which such claims are entitled, if properly explained. In the drawings, like reference numerals refer to the same or similar functions throughout the several views.

이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings, so that those skilled in the art can easily carry out the present invention.

도 1은 본 발명의 일 실시예에 따른 멀티 암을 판별하는 컴퓨팅 장치(1000)를 개략적으로 도시한 것으로, 도 1을 참조하면, 멀티 암을 판별하는 컴퓨팅 장치(1000)는 통신부(100)와 프로세서(200)를 포함할 수 있다.FIG. 1 schematically illustrates a computing apparatus 1000 for identifying a multi-arm according to an embodiment of the present invention. Referring to FIG. 1, a computing apparatus 1000 for discriminating a multi-arm includes a communication unit 100, Processor 200 may be included.

통신부(100)는 k개 암 진단 바이오마커군의 정보를 획득하는 기능을 수행하되, k개의 암 진단을 위한 각각의 바이오마커로 구성된 k개 암 진단 바이오마커 키트로부터 각각의 바이오마커의 지표값을 수신하거나 사용자에 의해 입력되는 각각의 바이오마커 지표값을 수신하거나 각각의 바이오마커 지표값을 측정하는 외부 장치로부터 각각의 바이오마커 지표값을 수신할 수 있다.The communication unit 100 performs the function of acquiring the information of the k cancer diagnostic biomarker groups, and calculates the index values of the respective biomarkers from the k cancer diagnostic biomarker kits composed of the respective biomarkers for k cancer diagnosis Receiving the respective biomarker index values received by the user or receiving the respective biomarker index values from an external device measuring the respective biomarker index values.

프로세서(200)는 통신부(100)에서 획득된 k개 암 진단 바이오마커군의 정보를 바이너리 클래시피케이션하여 k개 암 진단 바이오마커군의 정보가 암인지 암이 아닌지를 판별하는 프로세스와, k개 암 진단 바이오마커군의 정보를 바이너리 클래시피케이션한 결과 암인 것으로 판별되면, k개 암 진단 바이오마커군 정보를 신경망을 사용하여 분석하여 k개 암 진단 바이오마커군의 정보가 k개 암 중 어느 암에 해당되는지를 판별하는 프로세스를 수행할 수 있다.Processor 200 classifies the information of the k cancer diagnostic biomarker clusters obtained in communication unit 100 to determine whether the information of k cancer diagnostic biomarker clusters is cancer or cancer, When the information of cancer diagnosis biomarker group is judged to be cancer as a result of binary classification, information of k cancer diagnostic biomarker group information is analyzed by using neural network, and information of k cancer diagnostic biomarker group is classified into any one of k cancer The process of determining whether or not the process corresponds to the process shown in FIG.

이와 같이 구성된 본 발명의 일 실시예에 따른 멀티 암을 판별하는 컴퓨팅 장치(1000)를 이용하여 본 발명의 일 실시예에 따른 멀티 암을 판별하는 방법을 설명하면 다음과 같다.A method for discriminating a multi-arm according to an embodiment of the present invention using a computing apparatus 1000 for discriminating a multi-arm according to an embodiment of the present invention will now be described.

먼저, 도 2에서 알 수 있는 바와 같이, 컴퓨팅 장치(1000)는 통신부(100)를 통해 k개 암 진단 바이오마커군 정보를 획득하며(210), 컴퓨팅 장치(1000)의 프로세서(200)가 통신부(100)를 통해 획득된 k개 암 진단 바이오마커군 정보를 바이너리 클래시피케이션하여 k개 암 진단 바이오마커의 정보가 암인지 암이 아닌지를 판별한다(220).2, the computing device 1000 acquires k cancer diagnostic biomarker group information through the communication unit 100 (210), and the processor 200 of the computing device 1000 transmits the k cancer diagnostic biomarker group information (K) of the k cancer diagnostic biomarker group information obtained from the cancer diagnostic biomarker 100 to determine whether the information of the k cancer diagnostic biomarkers is cancer or cancer (220).

이때, k개 암 진단 바이오마커군 정보는 k개의 암을 진단하기 위한 각각의 바이오마커의 정보를 포함하는 것으로, 환자의 혈액, 소변 등 환자의 신체로부터 유래한 생물학적 시료에 포함된 단백질, 핵산, 대사물질 등을 이용한 암 진단을 위한 지표값일 수 있다. 또한, k개 암 진단 바이오마커군 정보는 환자의 나이, 성별, 병력 등의 정보를 포함할 수 있다.In this case, the k cancer diagnostic biomarker group information includes information of each biomarker for diagnosing k cancer. The information includes proteins, nucleic acids, and proteins contained in biological samples derived from the patient's body such as blood and urine, It can be an indicator value for cancer diagnosis using metabolites and the like. In addition, the k cancer diagnostic biomarker group information may include information such as age, sex, and medical history of the patient.

그리고, 컴퓨팅 장치(1000)의 프로세서(200)는 k개 암 진단 바이오마커군 정보를 이용하여 암인지 암이 아닌지를 판별하기 위하여 바이너리 클래시피케이션하는 데 있어서, 믹스쳐 오브 엑스퍼츠(mixture of experts), 의사결정트리(decision tree), 트리 기반 앙상블(tree ensemble), 랜덤 포레스트(random forest), 베이지안 네트워크(Bayesian network), 서포트 벡터 머신(support vector machine), 신경망(neural network), 및 로지스틱 회귀분석(logistic regression) 중 적어도 하나의 방법을 이용할 수 있다. 다만, 이하에서는 믹스쳐 오브 엑스퍼츠(mixture of experts) 방법을 위주로 설명한다.The processor 200 of the computing device 1000 may perform a binary classification to determine whether cancer is cancer or not using the k cancer diagnostic biomarker group information using a mixture of experts A decision tree, a tree ensemble, a random forest, a Bayesian network, a support vector machine, a neural network, and a logistic regression At least one of logistic regression may be used. Hereinafter, the method of mixture of experts is mainly described.

즉, 컴퓨팅 장치(1000)의 프로세서(200)는 멀티 암에 의해 영향을 받는 k개의 암 진단 바이오마커 각각의 지표값 등을 이용하여 환자가 k개의 암 중 적어도 하나의 암을 보유하는지 여부를 확인하다.That is, the processor 200 of the computing device 1000 determines whether the patient holds at least one of the k cancers using the index values of each of the k cancer diagnostic biomarkers affected by the multi-cancer Do.

일 예로, 도 3을 참조하면, 컴퓨팅 장치(1000)의 프로세서(200)는 k개 암 진단 바이오마커군 정보(x)를 학습된 k개의 엑스퍼트 네트워크(221; 221-1, 221-2, …, 221-k) 각각에 입력하여 각각의 학습된 k개의 엑스퍼트 네트워크(221)로 하여금 해당하는 각각의 암인지 여부를 추론하도록 한다. 구체적으로, 제1 엑스퍼트 네트워크(221-1)는 k개 암 진단 바이오마커군 정보를 분석하여 제1 암인지 여부를 추론하며, 제2 엑스퍼트 네트워크(221-2)는 k개 암 진단 바이오마커군 정보를 분석하여 제2 암인지 여부를 추론하며, 제k 엑스퍼트 네트워크(221-k)는 k개 암 진단 바이오마커군 정보가 제k 암인지 여부를 추론하게 된다.For example, referring to FIG. 3, the processor 200 of the computing device 1000 may compare k cancer diagnostic biomarker group information x with k learned expert networks 221 (221-1, 221-2, ..., And 221-k, respectively, so as to cause the learned k expert networks 221 to deduce whether each of the learned experts is cancer. Specifically, the first expert network 221-1 analyzes k cancer diagnostic biomarker group information to deduce whether it is a first cancer, and the second expert network 221-2 analyzes k cancer diagnostic biomarker group information Information is analyzed to infer whether the second cancer is a cancer, and the kth expert network 221-k deduces whether the k cancer diagnostic biomarker group information is k cancer.

그리고, 컴퓨팅 장치(1000)의 프로세서(200)는 k개 암 진단 바이오마커군 정보(x)에 대응하여 k개의 엑스퍼트 네트워크 각각에 대한 기여도가 결정된 게이팅 네트워크(222)의 게이팅 함수(g1, g2, …, gk)를 이용하여 k개의 엑스퍼트 네트워크(221) 각각의 추론값들을 재연산하며, 재연산된 결과값을 이용하여 k개 암 진단 바이오마커군의 정보(x)가 암인지 여부를 클래시피케이션(y)한다.The processor 200 of the computing device 1000 then calculates the gating functions g1, g2, and g3 of the gating network 222 for which the contribution to each of the k expert networks has been determined corresponding to the k cancer diagnostic biomarker group information x, ..., gk) to recalculate the speculative values of each of the k expert networks (221) and determine whether the information (x) of the k cancer diagnostic biomarker groups is cancer, using the re- (Y).

이때, 컴퓨팅 장치(1000)의 프로세서(200)는 재연산된 결과값을 이용하여 k개 암 진단 바이오마커군의 정보가 암인지 여부를 클래시피케이션하는데 있어서, 소프트맥스 알고리즘을 이용할 수 있다.At this time, the processor 200 of the computing device 1000 can use the soft max algorithm to classify whether or not the information of the k cancer diagnostic biomarker groups is cancer using the re-computed result values.

그리고, 도 3의 바이너리 클래시피케이션 모형은 다음의 수학식 1과 같이 나타낼 수 있으며, 입력값 x가 주어졌을 때

Figure 112018012019309-pat00001
의 확률로 j번째 엑스퍼트 네트워크가 선택되고 출력 y는
Figure 112018012019309-pat00002
의 확률로 선택됨을 알 수 있다.The binary classification model of FIG. 3 can be expressed by the following Equation 1, and when the input value x is given
Figure 112018012019309-pat00001
, The jth expert network is selected and the output y is
Figure 112018012019309-pat00002
Is selected as a probability.

[수학식 1][Equation 1]

Figure 112018012019309-pat00003
Figure 112018012019309-pat00003

Figure 112018012019309-pat00004
Figure 112018012019309-pat00004

수학식 1에서 g(-)는 게이팅 네트워크(222)의 게이팅 함수로, 어떤 엑스퍼트 네트워크를 사용할지 결정하여 준다.In Equation (1), g (-) is a gating function of the gating network 222, which determines which expert network to use.

이때, 게이팅 함수는 다음의 수학식 2와 같이 나타내어질 수 있다.At this time, the gating function can be expressed by the following equation (2).

[수학식 2]&Quot; (2) "

Figure 112018012019309-pat00005
Figure 112018012019309-pat00005

그리고, 게이팅 함수는

Figure 112018012019309-pat00006
의 조건을 가진다.And the gating function
Figure 112018012019309-pat00006
.

이를 도 4를 참조하여 예시적으로 설명하면, (a) 입력값 0에서는 e2가 사용되어 출력은 [0, 1, 0]이 되며, (b) 입력값 0.5에서는 e2와 e3가 사용되어 출력은 [0, 0.5, 0.5]가 된다.(A) e2 is used for the input value 0 and the output is [0, 1, 0], (b) e2 and e3 are used for the input value 0.5, and the output is [0, 0.5, 0.5].

다음으로, 도 2에서 알 수 있는 바와 같이, 컴퓨팅 장치(1000)의 프로세서(200)는 k개 암 진단 바이오마커군의 정보를 바이너리 클래시피케이션한 결과 암인 것으로 판별되면, k개 암 진단 바이오마커군 정보를 신경망을 사용하여 분석하여 k개 암 진단 바이오마커군의 정보가 k개 암 중 어느 암에 해당되는지를 판별할 수 있다(230).2, when the processor 200 of the computing device 1000 determines that the cancer is a result of binary classification of the information of the k cancer diagnostic biomarker groups, the k cancer diagnostic biomarkers Using the neural network, the information of the k cancer diagnostic biomarkers can be used to determine which of the cancer is cancer (230).

일 예로, 도 5에서와 같이, 컴퓨팅 장치(1000)의 프로세서(200)는 바이너리 클래시피케이션한 결과 암으로 판별된 k개 암 진단 바이오마커군 정보가 입력 레이어(231)에 입력되면 학습된 제1연결강도(Wj)를 이용하여 k개 암 진단 바이오마커 정보를 연산하여 다수의 뉴런으로 이루어진 학습된 히든 레이어(232)에 입력하고, 학습된 히든 레이어(232)에서 제1연결강도(Wj)를 이용하여 연산된 값을 히든 레이어 액티베이션 함수를 이용하여 연산한다. 이때, 히든레이어 액티베이션 함수는 sigmoid function(σ), hyperbolic tangent function(tanh), 및 rectified linear unit function(ReLU) 중 어느 하나를 이용할 수 있다. 또한, 히든 레이어(232)는 단일층으로 형성하거나 다층으로 형성할 수 있으나, 도 5에서는 히든 레이어(232)가 단일층인 것으로 상정하였다. 그리고, 학습된 히든 레이어(232)의 각각의 뉴런에서의 연산값에 학습된 제2연결강도(Wk)를 적용하여 출력 레이어(233)에 입력하고, 출력 레이어(233)에서 k개의 암 각각에 대하여 클래시피케이션하여 k개 암 진단 바이오마커군 정보로부터 환자의 암이 k개의 암 중 어느 암인지를 판별할 수 있게 된다. 이때, k개의 암 각각에 대한 클래시피케이션은 소프트맥스 알고리즘을 이용할 수 있다.5, when the k cancer diagnostic biomarker group information determined as a cancer as a result of binary classification is input to the input layer 231, the processor 200 of the computing device 1000 determines 1 connection strength Wj is used to calculate k cancer diagnostic biomarker information and input into the learned hidden layer 232 composed of a plurality of neurons and the first connection strength Wj is calculated from the learned hidden layer 232, Is calculated using a hidden layer activation function. At this time, the hidden layer activation function may use one of sigmoid function (), hyperbolic tangent function (tanh), and rectified linear unit function (ReLU). In addition, the hidden layer 232 may be formed as a single layer or may be formed in multiple layers, but it is assumed in FIG. 5 that the hidden layer 232 is a single layer. Then, the learned second connection strength Wk is applied to the computed value of each neuron of the learned hidden layer 232 and input to the output layer 233, and in the output layer 233, And the k cancer diagnostic biomarker group information can be used to discriminate the cancer of the patient from any of k cancer. At this time, the classification for each of the k arms can use the soft max algorithm.

그리고, 도 5의 신경망 모형에서,

Figure 112018012019309-pat00007
를 i번째 입력 변수,
Figure 112018012019309-pat00008
을 m번째 히든 레이어의 뉴런,
Figure 112018012019309-pat00009
를 k번째 출력 뉴런이라 하며, 입력 레이어(231)의 차원 수를 p, 히든 레이어(232)의 뉴런 수를 M이라 하고, 출력 레이어(233)의 뉴런 수를 K라고 하면, 도 5의 모형은 다음의 수학식 3과 같이 나타내어질 수 있다.In the neural network model of Fig. 5,
Figure 112018012019309-pat00007
Is the i-th input variable,
Figure 112018012019309-pat00008
The neuron of the mth hidden layer,
Figure 112018012019309-pat00009
The number of neurons of the input layer 231 is denoted by p, the number of neurons of the hidden layer 232 is denoted by M, and the number of neurons of the output layer 233 is denoted by K, Can be expressed by the following equation (3).

[수학식 3]&Quot; (3) "

Figure 112018012019309-pat00010
Figure 112018012019309-pat00010

Figure 112018012019309-pat00011
Figure 112018012019309-pat00011

Figure 112018012019309-pat00012
Figure 112018012019309-pat00012

Figure 112018012019309-pat00013
Figure 112018012019309-pat00013

상기에서는 학습된 엑스퍼트 네트워크와 학습된 신경망을 통해 k개 암 진단 바이오마커군 정보를 이용하여 바이너리 클래시피케이션을 통한 암인지 여부를 판별하며, 암인 경우 멀티 클래시피케이션을 통해 해당 암인 k개 암 중 어느 암인지를 판별하는 방법에 대해 설명하였으며, 다음에서 엑스퍼트 네트워크와 신경망을 학습하는 방법을 간략히 설명한다.In the above example, k cancer diagnostic biomarker group information is used to determine whether cancer is through binary classification through the learned expert network and the learned neural network, and in the case of cancer, In this section, we explain how to determine which cancer is cancer, and briefly explain how to learn Expert Network and Neural Network.

먼저, 엑스퍼트 네트워크의 학습 방법을 설명하면, 컴퓨팅 장치(1000)의 프로세서(200)는 트레이닝용 k개 암 진단 바이오마커군 정보를 학습되기 전의 k개의 엑스퍼트 네트워크 각각에 입력하여 트레이닝용 k개 암 진단 바이오마커군 정보가 암인지 여부를 추론하도록 하고, 트레이닝용 k개 암 진단 바이오마커군 정보에 대응하여 k개의 엑스퍼트 네트워크 각각에 대한 기여도가 결정된 게이팅 네트워크의 게이팅 함수를 이용하여 k개의 엑스퍼트 네트워크 각각의 추론값들을 재연산하며, 재연산된 결과값을 이용하여 트레이닝용 k개 암 진단 바이오마커군의 정보가 암인지 여부를 클래시피케이션한다. 그리고, 클래시피케이션된 결과값을 참조하여 학습되기 전의 k개의 엑스퍼트 네트워크의 파라메터 및 학습되기 전의 게이팅 네트워크의 파라메터를 학습한다.First, the learning method of the expert network will be described. The processor 200 of the computing device 1000 inputs k cancer diagnostic biomarker group information for training to each of k expert networks before training, In order to infer whether the biomarker group information is cancerous or not, the gating function of the gating network determined in correspondence with the k cancer diagnostic biomarker group information for training, The inference values are recomputed, and the information of the k cancer diagnostic biomarker groups for training is classified using the recalculated result values. Then, the parameters of the k expert networks before learning and the parameters of the gating network before learning are learned by referring to the result of classifying.

이때, 학습되기 전의 k개의 엑스퍼트 네트워크와 학습되기 전의 게이팅 네트워크의 파라메터를 학습하는 데 있어서, 로그우도(log likelihood)를 최대로 하는 gradient ascent, EM 알고리즘, 및 quasi-Newton method 중 어느 하나를 이용할 수 있다.At this time, any one of the gradient ascent, the EM algorithm, and the quasi-Newton method, which maximizes the log likelihood, can be used to learn the parameters of the k expert networks before learning and the gating network before learning have.

즉, 수학식 2에서

Figure 112018012019309-pat00014
이며,
Figure 112018012019309-pat00015
이므로, 수학식 1에서
Figure 112018012019309-pat00016
로 로지스틱 모형을 사용할 수 있다.That is, in Equation 2,
Figure 112018012019309-pat00014
Lt;
Figure 112018012019309-pat00015
Therefore, in Equation 1,
Figure 112018012019309-pat00016
A logistic model can be used.

여기서,

Figure 112018012019309-pat00017
이며, 추정하고자 하는 모수는
Figure 112018012019309-pat00018
이다.here,
Figure 112018012019309-pat00017
, And the parameter to be estimated is
Figure 112018012019309-pat00018
to be.

다음으로, 컴퓨팅 장치(1000)의 프로세서(200)가 신경망을 학습하는 방법을 설명하면, 트레이닝용 k개 암 진단 바이오마커군 정보가 학습되기 전의 입력 레이어에 입력되면 학습되기 전의 제1연결강도를 이용하여 트레이닝용 k개 암 진단 바이오마커군 정보를 연산하여 다수의 뉴런으로 이루어진 학습되기 전의 히든 레이어에 입력하고, 학습되기 전의 히든 레이어에서 학습되기 전의 제1연결강도를 이용하여 연산된 값을 히든 레이어 액티베이션 함수를 이용하여 연산하며, 학습되기 전의 히든 레이어의 각각의 뉴런에서의 연산값에 학습되기 전의 제2연결강도를 적용하여 학습되기 전의 출력 레이어에 입력함으로써 k개의 암 각각에 대하여 클래시피케이션한다. 그리고, 클래시피케이션된 결과값과 트레이닝용 k개 암 진단 바이오마커군 정보에 대응되는 기준값을 비교하여 로스값을 획득하며, 로스값을 이용한 백프로퍼게이션을 통해 학습되기 전의 제1연결강도, 학습되기 전의 제2연결강도, 학습되기 전의 히든 레이어의 파라메터, 및 학습되기 전의 출력 레이어의 파라메터를 학습한다.Next, a description will be given of how the processor 200 of the computing device 1000 learns the neural network. When k pieces of cancer diagnostic biomarker group information for training are input to the input layer before learning, the first connection strength before being learned , The information of k cancer diagnostic biomarker group for training is computed and input to the hidden layer before learning which is composed of a plurality of neurons and the value calculated by using the first connection strength before being learned in the hidden layer before learning, And a second connection strength before being learned is applied to an operation value in each neuron of the hidden layer before being learned and input to the output layer before being learned, do. Then, the class value is compared with the reference value corresponding to the k cancer diagnostic biomarker group information for training to obtain the loss value, and the first connection strength, learning The parameters of the hidden layer before learning, and the parameters of the output layer before learning are learned.

즉, 수학식 3에서, 추정해야 하는 모수는

Figure 112018012019309-pat00019
의 웨이트(weight) 행렬과 b(M 차원), c(K 차원)의 바이어스 벡터이며, 손실 함수를 크로스 엔트로피 손실 함수로 하고, 이것을 최소화하도록 백프로퍼게이션 알고리즘을 사용하여 모수를 업데이트한다.That is, in Equation 3, the parameter to be estimated is
Figure 112018012019309-pat00019
And a bias vector of b (M dimension) and c (K dimension), respectively. The loss function is a cross entropy loss function, and the parameter is updated using a backprojection algorithm to minimize the loss function.

상기에서는 엑스퍼트 네트워크와 신경망을 각각 트레이닝용 k개 암 진단 바이오마커군 정보를 이용하여 학습하는 방법을 설명하였지만, 이와는 달리 k개 암 진단 바이오마커군 정보를 이용하되 최종 결과인 멀티 클래시피케이션 결과값을 이용하여 신경망과 엑스퍼트 네트워크를 동시에 학습할 수도 있다.In the above description, a method of learning k cancer diagnostic biomarker group information for each training network and a neural network is described. Alternatively, k cancer diagnostic biomarker group information is used, but the final result of the multiclassification result Can be used to simultaneously learn neural networks and expert networks.

또한, 상기에서는 동일한 컴퓨팅 장치를 이용하여 학습하고 학습된 파라메터들에 의해 멀티 암을 판별하였으나, 이와는 달리 별도의 학습 장치를 통해 학습하고, 학습된 결과를 멀티 암 판별을 위한 컴퓨팅 장치에서 이용할 수도 있다.In the above description, the multi-arm is discriminated by learning and learning parameters using the same computing device. Alternatively, the multi-arm may be learned through a separate learning device, and the learned result may be used in a computing device for multi-arm discrimination .

이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The embodiments of the present invention described above can be implemented in the form of program instructions that can be executed through various computer components and recorded on a computer-readable recording medium. The computer-readable recording medium may include program commands, data files, data structures, and the like, alone or in combination. The program instructions recorded on the computer-readable recording medium may be those specially designed and constructed for the present invention or may be those known and used by those skilled in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tape, optical recording media such as CD-ROMs and DVDs, magneto-optical media such as floptical disks, media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions include machine language code such as those generated by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. The hardware device may be configured to operate as one or more software modules for performing the processing according to the present invention, and vice versa.

이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, but, on the contrary, Those skilled in the art will appreciate that various modifications, additions and substitutions are possible, without departing from the scope and spirit of the invention as disclosed in the accompanying claims.

따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention should not be construed as being limited to the above-described embodiments, and all of the equivalents or equivalents of the claims, as well as the following claims, I will say.

Claims (22)

멀티 암을 판별하는 컴퓨팅 방법에 있어서,
(a) k개 암 진단 바이오마커군의 정보가 입력되면, 컴퓨팅 장치가, 상기 k개 암 진단 바이오마커군의 정보를 바이너리 클래시피케이션하여 상기 k개 암 진단 바이오마커의 정보가 암인지 암이 아닌지를 판별하는 단계; 및
(b) 상기 k개 암 진단 바이오마커군의 정보를 상기 바이너리 클래시피케이션한 결과 암인 것으로 판별되면, 상기 컴퓨팅 장치가, 상기 k개 암 진단 바이오마커군 정보를 신경망을 사용하여 분석하여 상기 k개 암 진단 바이오마커군의 정보가 상기 k개 암 중 어느 암에 해당되는지를 판별하는 단계;
를 포함하되,
상기 (a) 단계에서,
상기 컴퓨팅 장치가, 상기 k개 암 진단 바이오마커군 정보를 학습된 k개의 엑스퍼트 네트워크 각각에 입력하여 상기 k개 암 진단 바이오마커군 정보가 암인지 여부를 추론하도록 하고, 상기 k개 암 진단 바이오마커군 정보에 대응하여 상기 k개의 엑스퍼트 네트워크 각각에 대한 기여도가 결정된 게이팅 네트워크의 게이팅 함수를 이용하여 상기 k개의 엑스퍼트 네트워크 각각의 추론값들을 재연산하며, 상기 재연산된 결과값을 이용하여 상기 k개 암 진단 바이오마커군의 정보가 암인지 여부를 클래시피케이션하며,
상기 (b) 단계에서,
상기 컴퓨팅 장치가, 상기 (a) 단계에서 암인 것으로 판별된 상기 k개 암 진단 바이오마커군 정보가 입력 레이어에 입력되면 학습된 제1연결강도를 이용하여 상기 k개 암 진단 바이오마커 정보를 연산하여 다수의 뉴런으로 이루어진 학습된 히든 레이어에 입력하고, 상기 학습된 히든 레이어에서 상기 제1연결강도를 이용하여 연산된 값을 히든 레이어 액티베이션 함수를 이용하여 연산하며, 상기 학습된 히든 레이어의 각각의 뉴런에서의 연산값에 학습된 제2연결강도를 적용하여 출력 레이어에 입력하고, 상기 출력 레이어에서 k개의 암 각각에 대하여 클래시피케이션하는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 방법.
A method of computing a multi-arm,
(a) when the information of the k cancer diagnostic biomarker group is inputted, the computing device binarily classifies the information of the k cancer diagnostic biomarker groups so that the information of the k cancer diagnostic biomarkers is either cancerous or cancerous Judging whether or not it is a non-volatile memory; And
(b) if it is determined that the information on the k cancer diagnostic biomarker groups is cancerous as a result of the binary classification, the computing device analyzes the k cancer diagnostic biomarker group information using a neural network, Determining whether the information of the cancer diagnosis biomarker group corresponds to which of the k cancers;
, ≪ / RTI &
In the step (a)
Wherein the computing device inputs the k cancer diagnostic biomarker group information to each of k learned expert networks to deduce whether the k cancer diagnostic biomarker group information is cancer, Computing the respective inference values of each of the k expert networks using a gating function of the gating network in which the contribution to each of the k expert networks is determined in response to the group information, Cancer Diagnosis Classification of whether the information of the biomarker group is cancer,
In the step (b)
The computing device calculates the k cancer diagnostic biomarker information using the learned first connection strength when the k cancer diagnostic biomarker group information determined to be cancer in the step (a) is input to the input layer Wherein the hidden layer includes a plurality of neurons and a plurality of neurons, and wherein the hidden layer includes a plurality of neurons, a learned hidden layer having a plurality of neurons, Wherein the second connection strength is applied to the computed value in the output layer and is input to the output layer, and the classifying is performed for each of the k arms in the output layer.
삭제delete 제1항에 있어서,
상기 컴퓨팅 장치는, 상기 재연산된 결과값을 이용하여 상기 k개 암 진단 바이오마커군의 정보가 암인지 여부를 클래시피케이션하는데 있어서, 소프트맥스 알고리즘을 이용하는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 방법.
The method according to claim 1,
Wherein the computing device uses a soft max algorithm to classify whether the information of the k cancer diagnostic biomarker groups is cancer using the re-computed result value. Way.
제1항에 있어서,
상기 (a) 단계 이전에,
(a01) 상기 컴퓨팅 장치가, 트레이닝용 k개 암 진단 바이오마커군 정보를 학습되기 전의 상기 k개의 엑스퍼트 네트워크 각각에 입력하여 상기 트레이닝용 k개 암 진단 바이오마커군 정보가 암인지 여부를 추론하도록 하고, 상기 트레이닝용 k개 암 진단 바이오마커군 정보에 대응하여 상기 k개의 엑스퍼트 네트워크 각각에 대한 기여도가 결정된 게이팅 네트워크의 게이팅 함수를 이용하여 상기 k개의 엑스퍼트 네트워크 각각의 추론값들을 재연산하며, 상기 재연산된 결과값을 이용하여 상기 트레이닝용 k개 암 진단 바이오마커군의 정보가 암인지 여부를 클래시피케이션하고, 상기 클래시피케이션된 결과값을 참조하여 학습되기 전의 상기 k개의 엑스퍼트 네트워크의 파라메터 및 학습되기 전의 상기 게이팅 네트워크의 파라메터를 학습하는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 방법.
The method according to claim 1,
Before the step (a)
(a01) The computing device inputs k cancer diagnostic biomarker group information for training into each of the k expert networks before learning, so as to deduce whether the k cancer diagnostic biomarker group information for training is cancer Computing recursive values of each of the k expert networks using the gating function of the gating network in which the contribution to each of the k expert networks is determined corresponding to the k cancer diagnostic biomarker group information for training, Classifying the information of the k cancer diagnostic biomarker groups for training into cancer using the calculated result values, referring to the classified result values, and determining parameters of the k expert networks before being learned And learns parameters of the gating network before being learned Computing method for determining a multi-arm.
제4항에 있어서,
상기 컴퓨팅 장치는, 상기 학습되기 전의 k개의 엑스퍼트 네트워크와 상기 학습되기 전의 게이팅 네트워크의 파라메터를 학습하는 데 있어서, 로그우도(log likelihood)를 최대로 하는 gradient ascent, EM 알고리즘, 및 quasi-Newton method 중 어느 하나를 이용하는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 방법.
5. The method of claim 4,
Wherein the computing device includes a gradient ascent, an EM algorithm, and a quasi-Newton method for maximizing a log likelihood in learning the parameters of the k prior expert networks and the gating network before the learning, The method comprising the steps of:
제1항에 있어서,
상기 (a) 단계에서,
상기 바이너리 클래시피케이션은 의사결정트리(decision tree), 트리 기반 앙상블(tree ensemble), 랜덤 포레스트(random forest), 베이지안 네트워크(Bayesian network), 서포트 벡터 머신(support vector machine), 신경망(neural network), 및 로지스틱 회귀분석(logistic regression) 중 적어도 하나의 방법에 의해 수행되는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 방법.
The method according to claim 1,
In the step (a)
The binary classifications may include a decision tree, a tree ensemble, a random forest, a Bayesian network, a support vector machine, a neural network, , And logistic regression. ≪ Desc / Clms Page number 20 >
삭제delete 제1항에 있어서,
상기 히든레이어 액티베이션 함수는 sigmoid function(σ), hyperbolic tangent function(tanh), 및 rectified linear unit function(ReLU) 중 어느 하나인 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 방법.
The method according to claim 1,
Wherein the hidden layer activation function is one of a sigmoid function (?), A hyperbolic tangent function (tanh), and a rectified linear unit function (ReLU).
제1항에 있어서,
상기 k개의 암 각각에 대한 클래시피케이션은 소프트맥스 알고리즘을 이용하는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 방법.
The method according to claim 1,
Wherein the classification for each of the k arms uses a soft max algorithm.
제1항에 있어서,
상기 (b) 단계 이전에,
(b01) 상기 컴퓨팅 장치가, 트레이닝용 k개 암 진단 바이오마커군 정보가 학습되기 전의 상기 입력 레이어에 입력되면 학습되기 전의 상기 제1연결강도를 이용하여 상기 트레이닝용 k개 암 진단 바이오마커군 정보를 연산하여 다수의 뉴런으로 이루어진 학습되기 전의 상기 히든 레이어에 입력하고, 상기 학습되기 전의 히든 레이어에서 상기 학습되기 전의 제1연결강도를 이용하여 연산된 값을 히든 레이어 액티베이션 함수를 이용하여 연산하며, 상기 학습되기 전의 히든 레이어의 각각의 뉴런에서의 연산값에 학습되기 전의 상기 제2연결강도를 적용하여 학습되기 전의 상기 출력 레이어에 입력함으로써 상기 k개의 암 각각에 대하여 클래시피케이션하고, 상기 클래시피케이션된 결과값과 상기 트레이닝용 k개 암 진단 바이오마커군 정보에 대응되는 기준값을 비교하여 로스값을 획득하며, 상기 로스값을 이용한 백프로퍼게이션을 통해 상기 학습되기 전의 제1연결강도, 상기 학습되기 전의 제2연결강도, 상기 학습되기 전의 히든 레이어의 파라메터, 및 상기 학습되기 전의 출력 레이어의 파라메터를 학습하는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 방법.
The method according to claim 1,
Before the step (b)
(b01) when the computing device inputs the k pieces of cancer diagnostic biomarker group information for training into the input layer before learning, the k pieces of cancer diagnostic biomarker group information for training Calculating a value calculated using the first connection strength before being learned in the hidden layer before the learning by using a hidden layer activation function, Classifies the k arrays by inputting them to the output layer before being learned by applying the second connection strength before being learned to arithmetic values in each neuron of the hidden layer before being learned, And a result corresponding to the k cancer diagnostic biomarker group information for training Values of the first connection strength before learning, the parameters of the hidden layer before the learning, and the learning value of the learning layer before learning are obtained through back propagation using the loss value, Wherein the parameters of the output layer before the calculation are learned.
제1항에 있어서,
상기 히든 레이어는 단일층이거나 다층으로 형성된 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 방법.
The method according to claim 1,
Wherein the hidden layer is formed as a single layer or a multi-layered structure.
멀티 암을 판별하는 컴퓨팅 장치에 있어서,
k개 암 진단 바이오마커군의 정보를 획득하는 통신부; 및
(i) 상기 k개 암 진단 바이오마커군의 정보를 바이너리 클래시피케이션하여 상기 k개 암 진단 바이오마커군의 정보가 암인지 암이 아닌지를 판별하는 프로세스와, (ii) 상기 k개 암 진단 바이오마커군의 정보를 상기 바이너리 클래시피케이션한 결과 암인 것으로 판별되면, 상기 k개 암 진단 바이오마커군 정보를 신경망을 사용하여 분석하여 상기 k개 암 진단 바이오마커군의 정보가 상기 k개 암 중 어느 암에 해당되는지를 판별하는 프로세스를 수행하는 프로세서;
를 포함하되,
상기 프로세서는,
상기 (i) 프로세스에서, 상기 k개 암 진단 바이오마커군 정보를 학습된 k개의 엑스퍼트 네트워크 각각에 입력하여 상기 k개 암 진단 바이오마커군 정보가 암인지 여부를 추론하도록 하고, 상기 k개 암 진단 바이오마커군 정보에 대응하여 상기 k개의 엑스퍼트 네트워크 각각에 대한 기여도가 결정된 게이팅 네트워크의 게이팅 함수를 이용하여 상기 k개의 엑스퍼트 네트워크 각각의 추론값들을 재연산하며, 상기 재연산된 결과값을 이용하여 상기 k개 암 진단 바이오마커군의 정보가 암인지 여부를 클래시피케이션하며,
상기 (ii) 프로세스에서, 상기 (i) 프로세스에서 암인 것으로 판별된 상기 k개 암 진단 바이오마커군 정보가 입력 레이어에 입력되면 학습된 제1연결강도를 이용하여 상기 k개 암 진단 바이오마커군 정보를 연산하여 다수의 뉴런으로 이루어진 학습된 히든 레이어에 입력하고, 상기 학습된 히든 레이어에서 상기 제1연결강도를 이용하여 연산된 값을 히든 레이어 액티베이션 함수를 이용하여 연산하며, 상기 학습된 히든 레이어의 각각의 뉴런에서의 연산값에 학습된 제2연결강도를 적용하여 출력 레이어에 입력하고, 상기 출력 레이어에서 k개의 암 각각에 대하여 클래시피케이션하는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 장치.
A computing device for determining a multi-arm,
a communication unit for acquiring information on the k cancer diagnostic biomarker group; And
(i) binarizing the information of the k cancer diagnostic biomarker groups to determine whether the information of the k cancer diagnostic biomarker groups is cancer or cancer; and (ii) Wherein the k cancer diagnostic biomarker group information is analyzed using a neural network to determine whether the information of the k cancer diagnostic biomarker group is the one of the k cancer cells A processor for performing a process of determining whether the subject is cancerous;
, ≪ / RTI &
The processor comprising:
In the process (i), the k cancer diagnostic biomarker group information is input to each of k learned expert networks to deduce whether the k cancer diagnostic biomarker group information is cancer, and the k cancer diagnostic biomarker group information Computing the respective speculative values of the k expert networks using a gating function of the gating network in which the contribution to each of the k expert networks is determined corresponding to the biomarker group information, k Cancer Diagnosis Classifies the information of the biomarker group as cancer,
In the process (ii), when the k cancer diagnostic biomarker group information determined to be cancer in the process (i) is input to the input layer, the k cancer diagnostic biomarker group information Calculating a value calculated using the first connection strength in the learned hidden layer by using a hidden layer activation function, and calculating a value of the learned hidden layer using the hidden layer activation function, Wherein the second connection strength learned in each neuron is applied to the output layer, and the classification is performed for each of the k arms in the output layer.
삭제delete 제12항에 있어서,
상기 프로세서는, 상기 재연산된 결과값을 이용하여 상기 k개 암 진단 바이오마커군의 정보가 암인지 여부를 클래시피케이션하는데 있어서, 소프트맥스 알고리즘을 이용하는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 장치.
13. The method of claim 12,
Wherein the processor uses a soft max algorithm to classify whether the information of the k cancer diagnostic biomarker group is cancer using the re-computed result value. .
제12항에 있어서,
상기 프로세서는,
상기 (i) 프로세스 이전에, 트레이닝용 k개 암 진단 바이오마커군 정보를 학습되기 전의 상기 k개의 엑스퍼트 네트워크 각각에 입력하여 상기 트레이닝용 k개 암 진단 바이오마커군 정보가 암인지 여부를 추론하도록 하고, 상기 트레이닝용 k개 암 진단 바이오마커군 정보에 대응하여 상기 k개의 엑스퍼트 네트워크 각각에 대한 기여도가 결정된 게이팅 네트워크의 게이팅 함수를 이용하여 상기 k개의 엑스퍼트 네트워크 각각의 추론값들을 재연산하며, 상기 재연산된 결과값을 이용하여 상기 트레이닝용 k개 암 진단 바이오마커군의 정보가 암인지 여부를 클래시피케이션하고, 상기 클래시피케이션된 결과값을 참조하여 학습되기 전의 상기 k개의 엑스퍼트 네트워크의 파라메터 및 학습되기 전의 상기 게이팅 네트워크의 파라메터를 학습하는 프로세스를 더 수행하는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 장치.
13. The method of claim 12,
The processor comprising:
Before the process (i), the k cancer diagnostic biomarker group information for training is input to each of the k expert networks before being learned, so as to deduce whether the k cancer diagnostic biomarker group information for training is cancer Computing recursive values of each of the k expert networks using the gating function of the gating network in which the contribution to each of the k expert networks is determined corresponding to the k cancer diagnostic biomarker group information for training, Classifying the information of the k cancer diagnostic biomarker groups for training into cancer using the calculated result values, referring to the classified result values, and determining parameters of the k expert networks before being learned The process of learning the parameters of the gating network before learning Wherein the step of determining the number of multi-arms is further performed.
제15항에 있어서,
상기 프로세서는, 상기 학습되기 전의 k개의 엑스퍼트 네트워크와 상기 학습되기 전의 게이팅 네트워크의 파라메터를 학습하는 데 있어서, 로그우도(log likelihood)를 최대로 하는 gradient ascent, EM 알고리즘, 및 quasi-Newton method 중 어느 하나를 이용하는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 장치.
16. The method of claim 15,
Wherein the processor is configured to calculate parameters of the k prior expert network and the gating network before the learning by using any one of a gradient ascent, an EM algorithm, and a quasi-Newton method that maximizes a log likelihood Wherein the one of the plurality of arcs is used.
제12항에 있어서,
상기 프로세서는,
상기 (i) 프로세스에서, 상기 바이너리 클래시피케이션은 의사결정트리(decision tree), 트리 기반 앙상블(tree ensemble), 랜덤 포레스트(random forest), 베이지안 네트워크(Bayesian network), 서포트 벡터 머신(support vector machine), 신경망(neural network), 및 로지스틱 회귀분석(logistic regression) 중 적어도 하나의 방법에 의해 수행되는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 장치.
13. The method of claim 12,
The processor comprising:
In the process (i), the binary classification may be a decision tree, a tree ensemble, a random forest, a Bayesian network, a support vector machine ), A neural network, and a logistic regression. ≪ RTI ID = 0.0 > [0002] < / RTI >
삭제delete 제12항에 있어서,
상기 히든레이어 액티베이션 함수는 sigmoid function(σ), hyperbolic tangent function(tanh), 및 rectified linear unit function(ReLU) 중 어느 하나인 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 장치.
13. The method of claim 12,
Wherein the hidden layer activation function is any one of a sigmoid function (?), A hyperbolic tangent function (tanh), and a rectified linear unit function (ReLU).
제12항에 있어서,
상기 k개의 암 각각에 대한 클래시피케이션은 소프트맥스 알고리즘을 이용하는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 장치.
13. The method of claim 12,
Wherein the classification for each of the k arms utilizes a soft max algorithm.
제12항에 있어서,
상기 프로세서는,
상기 (ii) 프로세스 이전에, 트레이닝용 k개 암 진단 바이오마커군 정보가 학습되기 전의 상기 입력 레이어에 입력되면 학습되기 전의 상기 제1연결강도를 이용하여 상기 트레이닝용 k개 암 진단 바이오마커군 정보를 연산하여 다수의 뉴런으로 이루어진 학습되기 전의 상기 히든 레이어에 입력하고, 상기 학습되기 전의 히든 레이어에서 상기 학습되기 전의 제1연결강도를 이용하여 연산된 값을 히든 레이어 액티베이션 함수를 이용하여 연산하며, 상기 학습되기 전의 히든 레이어의 각각의 뉴런에서의 연산값에 학습되기 전의 상기 제2연결강도를 적용하여 학습되기 전의 상기 출력 레이어에 입력함으로써 상기 k개의 암 각각에 대하여 클래시피케이션하고, 상기 클래시피케이션된 결과값과 상기 트레이닝용 k개 암 진단 바이오마커군 정보에 대응되는 기준값을 비교하여 로스값을 획득하며, 상기 로스값을 이용한 백프로퍼게이션을 통해 상기 학습되기 전의 제1연결강도, 상기 학습되기 전의 제2연결강도, 상기 학습되기 전의 히든 레이어의 파라메터, 및 상기 학습되기 전의 출력 레이어의 파라메터를 학습하는 프로세스를 더 수행하는 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 장치.
13. The method of claim 12,
The processor comprising:
Wherein when the k cancer diagnostic biomarker group information for training is input to the input layer before learning (ii) before the step (ii), the first k-th cancer biomarker group information for training Calculating a value calculated using the first connection strength before being learned in the hidden layer before the learning by using a hidden layer activation function, Classifies the k arrays by inputting them to the output layer before being learned by applying the second connection strength before being learned to arithmetic values in each neuron of the hidden layer before being learned, Corresponding to the k cancer diagnostic biomarker group information for training A second connection strength before being learned, a parameter of a hidden layer before being learned, and a second connection strength before learning are obtained through back propagation using the loss value, And a step of learning parameters of the output layer before the calculation of the parameter of the multi-arm.
제12항에 있어서,
상기 히든 레이어는 단일층이거나 다층으로 형성된 것을 특징으로 하는 멀티 암 판별을 위한 컴퓨팅 장치.
13. The method of claim 12,
Wherein the hidden layer is formed as a single layer or a multi-layered structure.
KR1020180013390A 2018-02-02 2018-02-02 Computing method for predicting multiple kinds of cancers, and computing apparatus using the same KR101951727B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020180013390A KR101951727B1 (en) 2018-02-02 2018-02-02 Computing method for predicting multiple kinds of cancers, and computing apparatus using the same
PCT/KR2018/003724 WO2019151573A1 (en) 2018-02-02 2018-03-29 Computing method for multi-cancer identification and computing device using same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180013390A KR101951727B1 (en) 2018-02-02 2018-02-02 Computing method for predicting multiple kinds of cancers, and computing apparatus using the same

Publications (1)

Publication Number Publication Date
KR101951727B1 true KR101951727B1 (en) 2019-02-26

Family

ID=65562442

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180013390A KR101951727B1 (en) 2018-02-02 2018-02-02 Computing method for predicting multiple kinds of cancers, and computing apparatus using the same

Country Status (2)

Country Link
KR (1) KR101951727B1 (en)
WO (1) WO2019151573A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022029824A (en) * 2020-08-05 2022-02-18 憲一 佐藤 Cancer diagnosis method, device, and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6248063B1 (en) * 1994-10-13 2001-06-19 Horus Therapeutics, Inc. Computer assisted methods for diagnosing diseases
JP2007052774A (en) * 1995-07-25 2007-03-01 Ortho-Clinical Diagnostics Inc Computer assisted method for diagnosing disease
WO2017176423A1 (en) * 2016-04-08 2017-10-12 Biodesix, Inc. Classifier generation methods and predictive test for ovarian cancer patient prognosis under platinum chemotherapy

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6208983B1 (en) * 1998-01-30 2001-03-27 Sarnoff Corporation Method and apparatus for training and operating a neural network for detecting breast cancer
KR101401561B1 (en) * 2010-12-30 2014-06-11 주식회사 바이오인프라 Cancer Diagnosis Information Generation Method, Cancer Diagnosis System Device
CN105005680B (en) * 2011-04-29 2019-08-02 癌症预防和治疗有限公司 Use categorizing system and its method of kit identification and diagnosis pulmonary disease
KR101910576B1 (en) * 2011-11-08 2018-12-31 삼성전자주식회사 The apparutus and method for classify input pattern promptly using artificial neural network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6248063B1 (en) * 1994-10-13 2001-06-19 Horus Therapeutics, Inc. Computer assisted methods for diagnosing diseases
JP2007052774A (en) * 1995-07-25 2007-03-01 Ortho-Clinical Diagnostics Inc Computer assisted method for diagnosing disease
WO2017176423A1 (en) * 2016-04-08 2017-10-12 Biodesix, Inc. Classifier generation methods and predictive test for ovarian cancer patient prognosis under platinum chemotherapy

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022029824A (en) * 2020-08-05 2022-02-18 憲一 佐藤 Cancer diagnosis method, device, and program

Also Published As

Publication number Publication date
WO2019151573A1 (en) 2019-08-08

Similar Documents

Publication Publication Date Title
US20230029915A1 (en) Multimodal machine learning based clinical predictor
Lancashire et al. An introduction to artificial neural networks in bioinformatics—application to complex microarray and mass spectrometry datasets in cancer studies
KR102044094B1 (en) Method for classifying cancer or normal by deep neural network using gene expression data
CN113113130A (en) Tumor individualized diagnosis and treatment scheme recommendation method
Golugula et al. Evaluating feature selection strategies for high dimensional, small sample size datasets
Sekaran et al. Predicting autism spectrum disorder from associative genetic markers of phenotypic groups using machine learning
Devetyarov et al. Conformal predictors in early diagnostics of ovarian and breast cancers
JP7197795B2 (en) Machine learning program, machine learning method and machine learning apparatus
CN115896242A (en) Intelligent cancer screening model and method based on peripheral blood immune characteristics
Gangurde et al. Developing an efficient cancer detection and prediction tool using convolution neural network integrated with neural pattern recognition
KR101951727B1 (en) Computing method for predicting multiple kinds of cancers, and computing apparatus using the same
Karhan et al. Lung Cancer Detection and Classification with Classification Algorithms
Kaur et al. Rectal Cancer Prediction and Performance Based on Intelligent Variational Autoencoders Machine Using Deep Learning on CDAS Dataset
Khoirunnisa et al. Implementation of CRNN method for lung cancer detection based on microarray data
CN116047074A (en) Marker for diagnosing and/or predicting lung cancer, diagnostic model and construction method thereof
KR102376212B1 (en) Gene expression marker screening method using neural network based on gene selection algorithm
Alqahtani et al. Artificial neural network as classification method for prostate cancer incidence
CN113971984A (en) Classification model construction method and device, electronic equipment and storage medium
Shankar et al. An extensible framework for recurrent breast cancer prognosis using deep learning techniques
Feng et al. Statistical considerations in combining biomarkers for disease classification
Mohammed A comparison of cancer classification methods based on microarray data.
Gangurde et al. Research Article Developing an Efficient Cancer Detection and Prediction Tool Using Convolution Neural Network Integrated with Neural Pattern Recognition
Sherif et al. A Machine Learning Approach for Stroke Differential Diagnosis by Blood Biomarkers
CN115171906A (en) Prostate cancer screening and diagnosing method based on machine learning
Tonmoy et al. Breast Cancer Prediction with Gaussian Process Using Anthropometric Parameters

Legal Events

Date Code Title Description
GRNT Written decision to grant