KR20200083921A - Apparatus for analyzing genes based on neural network - Google Patents

Apparatus for analyzing genes based on neural network Download PDF

Info

Publication number
KR20200083921A
KR20200083921A KR1020190175909A KR20190175909A KR20200083921A KR 20200083921 A KR20200083921 A KR 20200083921A KR 1020190175909 A KR1020190175909 A KR 1020190175909A KR 20190175909 A KR20190175909 A KR 20190175909A KR 20200083921 A KR20200083921 A KR 20200083921A
Authority
KR
South Korea
Prior art keywords
user
dna information
markers
network
learning
Prior art date
Application number
KR1020190175909A
Other languages
Korean (ko)
Other versions
KR102151436B1 (en
Inventor
백석철
이민섭
함인철
배명근
Original Assignee
주식회사 마이지놈박스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 마이지놈박스 filed Critical 주식회사 마이지놈박스
Publication of KR20200083921A publication Critical patent/KR20200083921A/en
Application granted granted Critical
Publication of KR102151436B1 publication Critical patent/KR102151436B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Abstract

According to the present invention, an apparatus for analyzing genes based on an artificial neural network comprises: a prediction network which is an artificial neural network model for outputting predictions for body requirements as probability values based on DNA information; a communication module for receiving a request for prediction on DNA information of a user and body requirements selected by the user; and a control module for extracting all markers from the DNA information of the user, selecting a marker which meets the minimum quality control (QC) of a microarray among all the extracted markers, predicting the user′s body requirements according to the probability values outputted by the prediction network after inputting the selected marker into the prediction network, and transmitting the predicted body requirements of the user to a user device of the user through the communication module.

Description

인공신경망 기반의 유전자를 분석하기 위한 장치{Apparatus for analyzing genes based on neural network}Apparatus for analyzing genes based on neural network

본 발명은 유전자 분석 기술에 관한 것으로, 보다 상세하게는, 인공지능 기술을 이용하여 유전자를 분석하는 인공신경망 기반의 유전자를 분석하기 위한 장치에 관한 것이다. The present invention relates to a gene analysis technology, and more particularly, to an apparatus for analyzing genes based on an artificial neural network that analyzes genes using artificial intelligence technology.

마이크로어레이는 기능 유전체학 연구에 있어서 혁명적인 발상의 전환을 가져온 기술이다. 기존의 방법이 개별 유전자 발현을 측정하는 반면, 마이크로어레이 기술은 한 번의 실험으로 수천에서 수만 개의 유전자 발현을 측정할 수 있다. Shena 등은 1995년에 실험실에서 직접 제작한 마이크로어레이 기판을 이용하여 세포에서 발현하는 전사체(transcriptome)의 발현을 측정하였다. 이러한 유전자 발현 마이크로어레이(gene expression microarray)의 등장으로 한 세포에서 대용량의 유전체정보를 손쉽게 측정할 수 있는 고효율실험기법(high-throughput technology)이 발달하기 시작하였다. 그 결과 단일염기다형성(single nucleotide polymorphism, SNP), 복제수변이(copy number variation, CNV), 염색질 면역침강법(chromatin immunoprecipitation, ChIP)등에 대한 정보를 마이크로어레이 실험으로 발굴할 수 있는 기술들이 개발되었다.Microarray is a technology that has revolutionized the idea of functional genomics research. While conventional methods measure individual gene expression, microarray technology can measure thousands to tens of thousands of gene expressions in a single experiment. Shena et al. measured the expression of transcriptome expressed in cells using a microarray substrate prepared directly in a laboratory in 1995. With the advent of such gene expression microarrays, high-throughput technology that can easily measure large amounts of genomic information in a cell began to develop. As a result, technologies have been developed to discover information on single nucleotide polymorphism (SNP), copy number variation (CNV), and chromatin immunoprecipitation (ChIP) through microarray experiments. .

마이크로어레이 기술이 발달하면서 대용량 유전체자료에 대한 분석이 유전체 및 생물정보학 연구에서 중요한 주제로 자리 잡기 시작하였다. 변수의 종류가 상대적으로 제한적이고 시료의 수가 많던 기존의 자료 형태에서 변수의 양이 기하급수적으로 늘어난 고차원자료(high-dimensional data)의 형태로 바뀌면서 기존의 통계적인 분석방법론을 곧바로 적용하는 것이 어렵게 되었다. 그 결과, 마이크로어레이 자료에 적합한 고유의 방법론들이 계속해서 등장하였다. With the development of microarray technology, analysis of large-capacity genomic data has begun to become an important topic in genomic and bioinformatics research. As the types of variables were relatively limited and the number of samples was large, the amount of variables changed from exponentially to high-dimensional data, making it difficult to apply the existing statistical analysis methodology directly. . As a result, unique methodologies suitable for microarray data continued to emerge.

한국등록특허 제1874527호 2018년 06월 28일 등록 (명칭: 유전자 분석판정 방법, 이를 구현하기 위한 프로그램이 저장된 기록매체 및 이를 구현하기 위해 매체에 저장된 컴퓨터프로그램)Registered Korean Registered Patent No. 1874527 on June 28, 2018 (Name: Genetic analysis determination method, recording medium in which a program for implementing it is stored, and a computer program stored in a medium to implement it)

본 발명의 목적은 인공지능 기술을 이용하여 유전자를 분석하는 인공신경망 기반의 유전자를 분석하기 위한 장치를 제공함에 있다. An object of the present invention is to provide a device for analyzing genes based on artificial neural networks that analyze genes using artificial intelligence technology.

상술한 바와 같은 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 인공신경망 기반의 유전자를 분석하기 위한 장치는 DNA 정보를 기초로 신체 요건에 대한 예측을 확률값으로 출력하는 인공신경망 모델인 예측망과, 사용자의 DNA 정보 및 상기 사용자가 선택한 신체 요건에 대한 예측 요청을 수신하는 통신모듈과, 상기 사용자의 DNA 정보에서 모든 마커를 추출하고, 추출된 모든 마커 중 마이크로어레이의 최소 QC(Quality Control)에 부합하는 마커를 선별하고, 선별된 마커를 상기 예측망에 입력한 후, 상기 예측망이 출력한 확률값에 따라 상기 사용자의 신체 요건을 예측하고, 상기 사용자의 사용자장치로 상기 통신모듈을 통해 상기 예측된 상기 사용자의 신체 요건을 전송하는 제어모듈을 포함한다. An apparatus for analyzing genes based on an artificial neural network according to a preferred embodiment of the present invention for achieving the above object is a prediction network, which is an artificial neural network model that outputs predictions of physical requirements as probability values based on DNA information. , A communication module that receives a user's DNA information and a prediction request for the user's selected body requirements, and extracts all markers from the user's DNA information, and extracts all markers from the extracted micromarkers to the minimum QC (Quality Control) After selecting the matching marker, inputting the selected marker into the prediction network, predicts the user's body requirements according to the probability value output by the prediction network, and predicts the user's body through the communication module to the user device It includes a control module for transmitting the user's body requirements.

상기 장치는 DNA 정보를 생성하는 인공신경망 모델인 학습데이터생성망을 더 포함한다. 여기서, 상기 제어모듈은 상기 통신모듈을 통해 상기 예측 요청을 수신한 후, 상기 사용자의 DNA 정보와 기 설정된 유사도를 가지는 DNA 정보의 수가 기 설정된 기준치 미만이면, 상기 학습데이터생성망을 기초로 머신러닝을 통해 생성된 모델을 이용하여 상기 사용자의 DNA 정보로부터 1차 목표치의 학습 DNA 정보를 생성하고, 상기 학습데이터생성망을 기초로 딥러닝을 통해 생성된 모델을 이용하여 1차 목표치의 학습 DNA 정보로부터 2차 목표치의 학습 DNA 정보를 생성하는 것을 특징으로 한다. The device further includes a learning data generation network that is an artificial neural network model that generates DNA information. Here, after receiving the prediction request through the communication module, the control module is machine-learned based on the learning data generation network if the number of DNA information having a predetermined similarity to the user's DNA information is less than a preset reference value. Using the model generated through the generated DNA information of the primary target value from the user's DNA information, based on the learning data generation network, using the model generated through deep learning based learning DNA information of the primary target value It is characterized by generating learning DNA information of the secondary target value from.

상기 제어모듈은 상기 2차 목표치의 학습 DNA 정보로부터 모든 마커를 추출하고, 추출된 모든 마커 중 마이크로어레이의 최소 QC(Quality Control)에 부합하는 마커를 선정하고, 선정된 마커를 이용하여 상기 예측망을 다시 학습시키는 것을 특징으로 한다. The control module extracts all markers from the learning DNA information of the secondary target value, selects a marker that meets the minimum quality control (QC) of the microarray among all the extracted markers, and uses the selected marker to predict the network It is characterized by learning again.

상기 제어모듈은 상기 사용자의 DNA 정보의 마커 중 마이크로어레이의 최소 QC에 부합하는 마커를 선별하고, 상기 선별된 마커를 상기 다시 학습된 예측망에 입력한 후, 상기 다시 학습된 예측망이 출력한 확률값에 따라 상기 사용자의 신체 요건을 추정하고, 상기 사용자의 사용자장치로 상기 통신모듈을 통해 추정된 상기 사용자의 신체 요건을 전송하는 것을 특징으로 한다. The control module selects a marker that satisfies the minimum QC of the microarray among markers of the user's DNA information, inputs the selected marker into the re-trained prediction network, and outputs the re-trained prediction network. It is characterized in that the user's body requirements are estimated according to a probability value, and the user's body requirements estimated through the communication module are transmitted to the user device.

상기 제어모듈은 상기 사용자의 상기 예측된 신체 요건과 실제 신체 요건이 서로 다른 경우, 신체 요건이 다른 이유를 추정한 후, 추정된 이유에 따라 이를 개선할 수 있는 처방을 추출하고, 상기 통신모듈을 통해 추출된 처방을 상기 사용자장치로 전송하는 것을 특징으로 한다. The control module estimates the reason why the body requirements are different when the predicted body requirements and the actual body requirements of the user are different, and then extracts a prescription to improve it according to the estimated reason, and extracts the communication module. Characterized in that it transmits the prescription extracted through the user device.

본 발명에 따르면, 머신러닝 및 딥러닝 기술과 같은 인공지능 기술을 이용하여 사용자의 유전자 정보를 분석하고, 분석된 유전자 정보를 통해 사용자의 미래에 대한 신체 요건을 분석할 수 있다.According to the present invention, it is possible to analyze the user's genetic information using artificial intelligence technologies such as machine learning and deep learning technology, and analyze the physical requirements of the user's future through the analyzed genetic information.

또한 사용자가 사용자장치를 통해 자기 자신의 유전자 정보와 관련된 분석 결과를 손쉽게 확인할 수 있다.In addition, the user can easily check the analysis result related to his own genetic information through the user device.

이때 본 발명은 유전자 정보를 분석하기 위한 샘플이 기 설정된 기준 이하인 경우, 자체적으로 샘플을 생산하고, 생산된 샘플을 이용하여 유전자 정보를 분석함으로써, 예측 정확도를 높일 수 있다. At this time, in the present invention, when the sample for analyzing the genetic information is below a predetermined criterion, the sample can be produced on its own, and by analyzing the genetic information using the produced sample, prediction accuracy can be increased.

도 1은 본 발명의 실시예에 따른 인공신경망 기반의 유전자를 분석하기 위한 시스템의 구성을 설명하기 위한 도면이다.
도 2는 본 발명의 실시예에 따른 사용자장치의 구성을 설명하기 위한 블록도이다.
도 3은 본 발명의 실시예에 따른 인공신경망 기반의 유전자를 분석하기 위한 서비스서버의 구성을 설명하기 위한 블록도이다.
도 4는 본 발명의 실시예에 따른 인공신경망 기반의 유전자를 분석하기 위한 방법을 설명하기 위한 흐름도이다.
도 5는 도 4의 S140 단계를 보다 상세하게 설명하기 위한 도면이다.
1 is a view for explaining the configuration of a system for analyzing genes based on artificial neural networks according to an embodiment of the present invention.
2 is a block diagram illustrating the configuration of a user device according to an embodiment of the present invention.
3 is a block diagram illustrating the configuration of a service server for analyzing genes based on an artificial neural network according to an embodiment of the present invention.
4 is a flowchart illustrating a method for analyzing genes based on an artificial neural network according to an embodiment of the present invention.
5 is a view for explaining in step S140 of Figure 4 in more detail.

본 발명의 상세한 설명에 앞서, 이하에서 설명되는 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 실시예에 불과할 뿐, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다. Prior to the detailed description of the present invention, the terms or words used in the present specification and claims described below should not be interpreted as being limited to the ordinary or lexical meanings, and the inventors of their own inventions in the best way. In order to explain, it should be interpreted as meanings and concepts consistent with the technical spirit of the present invention based on the principle that it can be properly defined as a concept of terms. Therefore, the embodiments shown in the embodiments and the drawings described in this specification are only the most preferred embodiments of the present invention, and do not represent all of the technical spirit of the present invention, and various equivalents that can replace them at the time of this application It should be understood that there may be water and variations.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 이때, 첨부된 도면에서 동일한 구성 요소는 가능한 동일한 부호로 나타내고 있음을 유의해야 한다. 또한, 본 발명의 요지를 흐리게 할 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략할 것이다. 마찬가지의 이유로 첨부 도면에 있어서 일부 구성요소는 과장되거나 생략되거나 또는 개략적으로 도시되었으며, 각 구성요소의 크기는 실제 크기를 전적으로 반영하는 것이 아니다. Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. At this time, it should be noted that the same components are denoted by the same reference numerals in the accompanying drawings. In addition, detailed descriptions of well-known functions and configurations that may obscure the subject matter of the present invention will be omitted. For the same reason, in the accompanying drawings, some components are exaggerated, omitted, or schematically illustrated, and the size of each component does not entirely reflect the actual size.

먼저, 본 발명의 실시예에 따른 인공신경망 기반의 유전자를 분석하기 위한 시스템에 대해서 설명하기로 한다. 도 1은 본 발명의 실시예에 따른 인공신경망 기반의 유전자를 분석하기 위한 시스템의 구성을 설명하기 위한 도면이다. 도 1을 참조하면, 본 발명의 실시예에 따른 인공신경망 기반의 유전자를 분석하기 위한 시스템(이하, ‘분석시스템’으로 축약함)은 사용자장치(100), 서비스서버(200) 및 정보제공서버(300)를 포함한다. First, a system for analyzing genes based on an artificial neural network according to an embodiment of the present invention will be described. 1 is a view for explaining the configuration of a system for analyzing genes based on artificial neural networks according to an embodiment of the present invention. Referring to FIG. 1, a system for analyzing genes based on an artificial neural network according to an embodiment of the present invention (hereinafter abbreviated as'analysis system') includes a user device 100, a service server 200, and an information providing server. 300.

사용자장치(100)는 본 발명의 실시예에 따른 분석 서비스를 요청하는 사용자가 사용하거나 휴대하는 장치이다. 사용자장치(100)는 컴퓨팅 연산을 수행하고, 네트워크를 통해 통신을 수행하는 장치라면 어떠한 장치라도 무방하다. 예컨대, 사용자장치(100)는 정보통신기기, 멀티미디어 단말기, 유선 단말기, 고정형 단말기 및 IP(Internet Protocol) 단말기 등의 다양한 단말기에 적용될 수 있다. 예컨대, 사용자장치(100는 휴대폰, PMP(Portable MultimediaPlayer), MID(Mobile Internet Device), 스마트폰(Smart Phone), 태블릿, 패블릿, 노트북, 퍼스널컴퓨터 등을 예시할 수 있다. The user device 100 is a device used or carried by a user requesting an analysis service according to an embodiment of the present invention. The user device 100 may be any device as long as it is a device that performs computing operations and communicates through a network. For example, the user device 100 may be applied to various terminals such as information and communication devices, multimedia terminals, wired terminals, fixed terminals, and Internet Protocol (IP) terminals. For example, the user device 100 may exemplify a mobile phone, a portable multimedia player (PMP), a mobile Internet device (MID), a smart phone, a tablet, a phablet, a notebook, and a personal computer.

서비스서버(200)는 본 발명의 실시예에 따라 인공신경망 기반의 유전자를 분석하기 위한 장치이다. 이러한 서비스서버(200)는 워크스테이션 이상의 연산 성능을 가지는 서버인 것이 바람직하다. 서비스서버(200)는 사용자장치(100)로부터의 요청에 따라 사용자의 DNA 정보를 분석하여 사용자의 신체 요건을 예측한 후, 그 예측 결과를 제공한다. 신체 요건은 키, 몸무게, 시력, 대머리 등이 포함되며, 본 발명에서는 대표적으로 키와 관련하여 예시하였다. The service server 200 is a device for analyzing genes based on an artificial neural network according to an embodiment of the present invention. It is preferable that the service server 200 is a server having a computing power higher than a workstation. The service server 200 analyzes the user's DNA information according to a request from the user device 100 to predict the user's physical requirements, and provides the prediction result. Body requirements include height, weight, vision, baldness, etc., and in the present invention, exemplarily related to height.

정보제공서버(300)는 정보를 제공하는 서버를 통칭한다. 예컨대, 정보제공서버(300)는 DNA 정보를 저장하는 서버가 될 수 있다. 이러한 경우, 예컨대, 정보제공서버(300)는 병원에서 운영하는 서버, DNA 정보를 제공하는 업체에서 운영하는 서버가 될 수 있다. 이에 따라, 필요한 경우, 정보제공서버(300)는 서비스서버(200)에 DNA 정보를 제공할 수 있다. The information providing server 300 collectively refers to a server providing information. For example, the information providing server 300 may be a server that stores DNA information. In this case, for example, the information providing server 300 may be a server operated by a hospital or a server operated by a company providing DNA information. Accordingly, if necessary, the information providing server 300 may provide DNA information to the service server 200.

그러면, 본 발명의 실시예에 따른 사용자장치(100)의 구성에 대해서 상세하게 설명하기로 한다. 도 2는 본 발명의 실시예에 따른 사용자장치의 구성을 설명하기 위한 블록도이다. 도 2를 참조하면, 본 발명의 실시예에 따른 사용자장치(100)는 통신부(110), 카메라부(120), 입력부(130), 표시부(140), 저장부(150) 및 제어부(160)를 포함한다. Then, the configuration of the user device 100 according to an embodiment of the present invention will be described in detail. 2 is a block diagram illustrating the configuration of a user device according to an embodiment of the present invention. Referring to FIG. 2, the user device 100 according to an embodiment of the present invention includes a communication unit 110, a camera unit 120, an input unit 130, a display unit 140, a storage unit 150, and a control unit 160 It includes.

통신부(110)는 서비스서버(200)와 통신하기 위한 수단이다. 통신부(110)는 네트워크를 통해 서비스서버(200)와 통신할 수 있다. 통신부(110)는 송신되는 신호의 주파수를 상승 변환 및 증폭하는 RF(Radio Frequency) 송신기(Tx) 및 수신되는 신호를 저 잡음 증폭하고 주파수를 하강 변환하는 RF 수신기(Rx)를 포함할 수 있다. 그리고 통신부(110)는 송신되는 신호를 변조하고, 수신되는 신호를 복조하는 모뎀(Modem)을 포함할 수 있다. 통신부(110)는 수신되는 메시지를 제어부(160)로 전달한다. 또한, 통신부(110)는 제어부(160)로부터 송신하는 메시지를 전달받아 네트워크를 통해 서비스서버(200)로 전송한다. The communication unit 110 is a means for communicating with the service server 200. The communication unit 110 may communicate with the service server 200 through a network. The communication unit 110 may include an RF (Radio Frequency) transmitter (Tx) for up-converting and amplifying the frequency of the transmitted signal and an RF receiver (Rx) for amplifying the received signal with low noise and down-converting the frequency. In addition, the communication unit 110 may include a modem for modulating the transmitted signal and demodulating the received signal. The communication unit 110 transmits the received message to the control unit 160. In addition, the communication unit 110 receives the message transmitted from the control unit 160 and transmits it to the service server 200 through the network.

카메라부(120)는 영상을 촬영하기 위한 것으로, 적어도 이미지 센서를 포함한다. 이미지 센서는 피사체에서 반사되는 빛을 입력받아 전기신호로 변환하며, CCD(Charged Coupled Device), CMOS(Complementary Metal-Oxide Semiconductor) 등을 기반으로 구현될 수 있다. 카메라부(120)는 아날로그-디지털 변환기(Analog to Digital Converter)를 더 포함할 수 있으며, 이미지 센서에서 출력되는 아날로그 신호를 디지털 신호로 변환하여 제어부(160)로 출력할 수 있다. The camera unit 120 is for photographing an image, and includes at least an image sensor. The image sensor receives light reflected from a subject and converts it into an electric signal, and may be implemented based on a CCD (Charged Coupled Device), a Complementary Metal-Oxide Semiconductor (CMOS), or the like. The camera unit 120 may further include an analog-to-digital converter, and convert the analog signal output from the image sensor into a digital signal and output it to the controller 160.

입력부(130)는 사용자장치(100)를 제어하기 위한 사용자의 키 조작을 입력받고 입력 신호를 생성하여 제어부(160)에 전달한다. 입력부(130)는 사용자장치(100)를 제어하기 위한 각 종 키들을 포함할 수 있다. 입력부(130)는 표시부(140)가 터치스크린으로 이루어진 경우, 각 종 키들의 기능이 표시부(140)에서 이루어질 수 있으며, 터치스크린만으로 모든 기능을 수행할 수 있는 경우, 입력부(130)는 생략될 수도 있다. The input unit 130 receives a key operation of a user for controlling the user device 100, generates an input signal, and transmits the input signal to the control unit 160. The input unit 130 may include various types of keys for controlling the user device 100. When the display unit 140 is made of a touch screen, the input unit 130 may perform functions of various types of keys on the display unit 140, and if all functions can be performed only by the touch screen, the input unit 130 may be omitted. It might be.

표시부(140)는 사용자장치(100)의 메뉴, 입력된 데이터, 기능 설정 정보 및 기타 다양한 정보를 사용자에게 시각적으로 제공한다. 표시부(140)는 사용자장치(100)의 부팅 화면, 대기 화면, 메뉴 화면, 등의 화면을 출력하는 기능을 수행한다. 특히, 표시부(140)는 본 발명의 실시예에 따른 다양한 정보를 화면으로 출력하는 기능을 수행한다. 이러한 표시부(140)는 액정표시장치(LCD, Liquid Crystal Display), 유기 발광 다이오드(OLED, Organic Light Emitting Diodes), 능동형 유기 발광 다이오드(AMOLED, Active Matrix Organic Light Emitting Diodes) 등으로 형성될 수 있다. 한편, 표시부(140)는 터치스크린으로 구현될 수 있다. 이러한 경우, 표시부(140)는 터치센서를 포함한다. 터치센서는 사용자의 터치 입력을 감지한다. 터치센서는 정전용량 방식(capacitive overlay), 압력식, 저항막 방식(resistive overlay), 적외선 감지 방식(infrared beam) 등의 터치 감지 센서로 구성되거나, 압력 감지 센서(pressure sensor)로 구성될 수도 있다. 상기 센서들 이외에도 물체의 접촉 또는 압력을 감지할 수 있는 모든 종류의 센서 기기가 본 발명의 터치센서로 이용될 수 있다. 터치센서는 사용자의 터치 입력을 감지하고, 감지 신호를 발생시켜 제어부(160)로 전송한다. 특히, 표시부(140)가 터치스크린으로 이루어진 경우, 입력부(130) 기능의 일부 또는 전부는 표시부(140)를 통해 이루어질 수 있다. The display 140 visually provides a menu of the user device 100, input data, function setting information, and various other information to the user. The display 140 performs a function of outputting a screen of a boot screen, a standby screen, a menu screen, and the like of the user device 100. In particular, the display unit 140 performs a function of outputting various information according to an embodiment of the present invention to a screen. The display unit 140 may be formed of a liquid crystal display (LCD), organic light emitting diodes (OLED), active matrix organic light emitting diodes (AMOLED), or the like. Meanwhile, the display unit 140 may be implemented as a touch screen. In this case, the display unit 140 includes a touch sensor. The touch sensor detects the user's touch input. The touch sensor may include a touch sensing sensor such as a capacitive overlay, a pressure type, a resistive overlay, an infrared beam, or a pressure sensor. . In addition to the above sensors, all kinds of sensor devices capable of sensing contact or pressure of an object can be used as the touch sensor of the present invention. The touch sensor detects a user's touch input, generates a detection signal, and transmits it to the controller 160. In particular, when the display unit 140 is made of a touch screen, some or all of the functions of the input unit 130 may be performed through the display unit 140.

저장부(150)는 사용자장치(100)의 동작에 필요한 프로그램 및 데이터를 저장하는 역할을 수행한다. 특히, 저장부(150)는 사용자 데이터, 예컨대, 사용자의 신체 요건, DNA 정보 등이 저장되는 영역이다. 저장부(150)에 저장되는 각 종 데이터는 사용자의 조작에 따라, 삭제, 변경, 추가될 수 있다. The storage unit 150 serves to store programs and data necessary for the operation of the user device 100. In particular, the storage unit 150 is an area in which user data, such as a user's body requirements and DNA information, is stored. Various types of data stored in the storage unit 150 may be deleted, changed, or added according to user manipulation.

제어부(160)는 사용자장치(100)의 전반적인 동작 및 사용자장치(100)의 내부 블록들 간 신호 흐름을 제어하고, 데이터를 처리하는 데이터 처리 기능을 수행할 수 있다. 또한, 제어부(160)는 기본적으로, 사용자장치(100의 각 종 기능을 제어하는 역할을 수행한다. 제어부(160)는 CPU(Central Processing Unit), BP(baseband processor), AP(application processor), DSP(Digital Signal Processor) 등을 예시할 수 있다. 이러한 제어부(160)의 동작에 대해서는 아래에서 더 상세하게 설명될 것이다. The control unit 160 may control the overall operation of the user device 100 and the signal flow between the internal blocks of the user device 100, and may perform a data processing function for processing data. In addition, the control unit 160 basically serves to control various functions of the user device 100. The control unit 160 includes a central processing unit (CPU), a baseband processor (BP), and an application processor (AP), Digital Signal Processor (DSP) may be exemplified, etc. The operation of the controller 160 will be described in more detail below.

그러면, 본 발명의 실시예에 따른 인공신경망 기반의 유전자를 분석하기 위한 서비스서버(200)에 대해서 설명하기로 한다. 도 3은 본 발명의 실시예에 따른 인공신경망 기반의 유전자를 분석하기 위한 서비스서버의 구성을 설명하기 위한 블록도이다. 도 3을 참조하면, 본 발명의 실시예에 따른 서비스서버(200)는 통신모듈(210), 저장모듈(220) 및 제어모듈(230)을 포함한다. Then, the service server 200 for analyzing genes based on the artificial neural network according to an embodiment of the present invention will be described. 3 is a block diagram illustrating the configuration of a service server for analyzing genes based on an artificial neural network according to an embodiment of the present invention. Referring to Figure 3, the service server 200 according to an embodiment of the present invention includes a communication module 210, a storage module 220 and a control module 230.

통신모듈(210)은 사용자장치(100) 및 정보제공서버(300)와의 통신을 위한 것이다. 통신모듈(210)은 예컨대, 네트워크를 통해 사용자장치(100) 및 정보제공서버(300)와 통신할 수 있다. 통신모듈(210)은 네트워크를 통해 데이터를 송수신하기 위해 송신되는 신호를 변조하고, 수신되는 신호를 복조하는 모뎀(Modem)을 포함할 수 있다. 이러한 통신모듈(210)은 사용자장치(100) 또는 정보제공서버(300)로부터 수신되는 다양한 정보를 제어모듈(230)로 전달할 수 있다. 또한, 통신모듈(210)은 제어모듈(230)로부터 전달받은 DNA 정보와 관련된 예측 정보, 예측 정보를 기반으로 생활 패턴을 추천하는 처방 정보 등을 네트워크를 통해 사용자장치(100)로 전송할 수 있다. The communication module 210 is for communication with the user device 100 and the information providing server 300. The communication module 210 may communicate with the user device 100 and the information providing server 300 through a network, for example. The communication module 210 may include a modem that modulates a transmitted signal and demodulates the received signal to transmit and receive data through a network. The communication module 210 may transmit various information received from the user device 100 or the information providing server 300 to the control module 230. In addition, the communication module 210 may transmit prediction information related to DNA information received from the control module 230 and prescription information recommending a life pattern based on the prediction information to the user device 100 through a network.

저장모듈(220)은 서비스서버(200)의 동작에 필요한 프로그램 및 데이터를 저장하는 역할을 수행한다. 특히, 저장모듈(220)은 DNA 정보를 예측하기 위한 복수의 DNA 샘플 정보, DNA 정보 각각의 임계치와 임계치 이상인 경우에 수치의 단계별 건강 처방을 포함하는 DNA 건강 정보 및 DNA 정보와 관련된 추천 정보를 저장한다. 이러한 정보들은 데이터베이스의 형태로 저장될 수도 있다. 저장모듈(220)에 저장되는 각 종 정보를 포함하는 데이터는 사용자의 조작에 따라 등록, 삭제, 변경, 추가될 수 있다. The storage module 220 serves to store programs and data necessary for the operation of the service server 200. In particular, the storage module 220 stores a plurality of DNA sample information for predicting DNA information, DNA health information including a step-by-step health prescription of DNA values, and recommendation information related to DNA information when each of the DNA information is above a threshold and a threshold. do. Such information may be stored in the form of a database. Data including various types of information stored in the storage module 220 may be registered, deleted, changed, and added according to user manipulation.

제어모듈(230)은 서비스서버(200)의 전반적인 동작 및 서비스서버(200)의 내부 블록들 간 신호 흐름을 제어하고, 데이터를 처리하는 데이터 처리 기능을 수행할 수 있다. 제어모듈(230)은 중앙처리장치(CPU: Central Processing Unit), 디지털신호처리기(DSP: Digital Signal Processor) 등이 될 수 있다. 이러한 제어모듈(230)의 동작은 아래에서 더 상세하게 설명될 것이다. The control module 230 may control the overall operation of the service server 200 and the signal flow between the internal blocks of the service server 200 and perform a data processing function to process data. The control module 230 may be a central processing unit (CPU), a digital signal processor (DSP), or the like. The operation of the control module 230 will be described in more detail below.

다음으로, 본 발명의 실시예에 따른 인공신경망 기반의 유전자를 분석하기 위한 방법에 대해서 설명하기로 한다. 도 4는 본 발명의 실시예에 따른 인공신경망 기반의 유전자를 분석하기 위한 방법을 설명하기 위한 흐름도이다. Next, a method for analyzing genes based on an artificial neural network according to an embodiment of the present invention will be described. 4 is a flowchart illustrating a method for analyzing genes based on an artificial neural network according to an embodiment of the present invention.

도 4를 참조하면, 사용자는 서비스서버(200)가 제공하는 유전자 분석 서비스에 가입하고자 한다. 가입을 위하여, 사용자는 사용자장치(100)를 조작하여 사용자 정보를 제공할 수 있다. 이에 따라, 사용자장치(100)의 제어부(160)는 S110 단계에서 통신부(110)를 통해 서비스서버(200)로 사용자 정보를 전송한다. 여기서, 설명의 편의를 위해 사용자 정보는 성별, 나이 등의 개인 정보 및 키, 몸무게, 시력, 등의 신체 요건을 포함한다. Referring to Figure 4, the user wants to sign up for a genetic analysis service provided by the service server 200. For subscription, the user may provide user information by operating the user device 100. Accordingly, the control unit 160 of the user device 100 transmits user information to the service server 200 through the communication unit 110 in step S110. Here, for convenience of description, the user information includes personal information such as gender and age, and body requirements such as height, weight, vision, and the like.

또한, 사용자는 서비스를 제공 받기 위해 사용자장치(100)를 조작하여 DNA 정보를 제공할 수 있다. 이에 따라, 사용자장치(100)의 제어부(160)는 입력부(130)를 통해 사용자가 입력하는 DNA 정보를 수신하고, S120 단계에서 통신부(110)를 통해 서비스서버(200)로 DNA 정보를 전송할 수 있다. 한편, S130 단계의 대안적인 실시예에 따르면, 사용자장치(100)가 정보제공서버(300)로 DNA 정보를 서비스서버(200)에 제공하도록 요청하는 메시지를 전송하면, 정보제공서버(300)가 DNA 정보를 서비스서버(200)에 제공할 수도 있다. 이에 따라, 서비스서버(100)의 제어모듈(130)은 S110 및 S120 단계에서 통신모듈(110)을 통해 사용자 정보 및 DNA 정보를 수신할 수 있다. In addition, the user may provide the DNA information by operating the user device 100 to receive the service. Accordingly, the control unit 160 of the user device 100 receives the DNA information input by the user through the input unit 130, and can transmit the DNA information to the service server 200 through the communication unit 110 in step S120. have. On the other hand, according to an alternative embodiment of step S130, when the user device 100 transmits a message requesting to provide DNA information to the service server 200 to the information providing server 300, the information providing server 300 DNA information may be provided to the service server 200. Accordingly, the control module 130 of the service server 100 may receive user information and DNA information through the communication module 110 in steps S110 and S120.

한편, 사용자는 자신의 신체 요건 중 예측을 원하는 신체 요건을 예측하도록 서비스서버(200)에 요청할 수 있다. 예컨대, 사용자는 완전히 성장한 자신의 키를 알고 싶을 수 있다. 이에 따라, 사용자는 예측을 원하는 신체 요건을 입력할 수 있다. 이에 따라, 사용자장치(100)의 제어부(160)는 입력부(130)를 통해 사용의 입력을 감지하고, S120 단계에서 통신부(110)를 통해 서비스서버(200)로 상기 사용자가 입력한 신체 요건에 대한 예측 요청을 전송한다. 본 발명의 실시예에서 사용자가 자신의 키에 대한 예측을 요청하였다고 가정한다. On the other hand, the user may request the service server 200 to predict a body requirement to be predicted among his body requirements. For example, a user may want to know his or her height when fully grown. Accordingly, the user can input a body requirement for prediction. Accordingly, the control unit 160 of the user device 100 detects the input of use through the input unit 130, and in step S120, to the body requirements input by the user to the service server 200 through the communication unit 110. Send a prediction request for In the embodiment of the present invention, it is assumed that the user has requested prediction for his key.

서비스서버(200)의 제어모듈(230)은 통신모듈(210)을 통해 사용자장치(100)로부터 신체 요건에 대한 예측 요청을 수신하면, S140 단계에서 예측망(240)을 통해 사용자의 DNA 정보를 분석하여 신체 요건을 예측할 수 있다. 이러한 S140 단계에 대해 보다 상세히 설명하면 다음과 같다. When the control module 230 of the service server 200 receives a prediction request for physical requirements from the user device 100 through the communication module 210, in step S140, the user's DNA information is transmitted through the prediction network 240. Analyze to predict body requirements. The step S140 will be described in more detail as follows.

제어모듈(230)은 S140a 단계에서 앞서(S120 단계) 수신한 사용자의 DNA 정보에서 모든 마커를 추출한다. 그런 다음, 제어모듈(230)은 S140b 단계에서 추출된 모든 마커 중 마이크로어레이의 최소 QC(Quality Control)에 부합하는 마커를 선별한다. 이어서, 제어모듈(230)은 S140c 단계에서 선별된 마커를 예측망(240)에 입력한다. The control module 230 extracts all markers from the DNA information of the user previously received in step S140a (step S120). Then, the control module 230 selects a marker that satisfies the minimum quality control (QC) of the microarray among all the markers extracted in step S140b. Subsequently, the control module 230 inputs the marker selected in step S140c to the prediction network 240.

예측망(240)은 DNA 정보의 마커가 입력되면, 마커에 대해 연산을 수행하여 사용자의 최종적인 키에 대해 예측되는 확률값을 출력한다. 이때, 예측망(240)은 키를 소정의 범위에 따라 구분하고, 구분된 키의 범위에 대해 사용자가 최종적으로 해당 범위의 키로 성장할 확률을 출력한다. 예컨대, 예측망(240)은 사용자의 키가 160cm 이하, 161~165cm, 166~170cm, 171~175cm, 176~180cm, 181~185cm, 186~190cm 및 191cm 이상과 같이, 8개의 범위로 구분한 후, 각 범위에 대해 사용자가 최종적으로 해당 범위의 키로 성장할 확률을 출력한다. 그러면, 제어모듈(230)은 S140d 단계에서 예측망(240)이 출력한 확률값에 따라 사용자의 신체 요건을 추정한다. 예컨대, 예측망(240)은 사용자의 키가 160cm 이하일 확률을 0.01(1%), 161~165cm일 확률을 0.02(2%), 166~170cm일 확률을 0.04(4%), 171~175cm일 확률을 0.05(5%), 176~180cm일 확률을 0.78(78%), 181~185cm 일 확률을 0.06(6%), 186~190cm 일 확률을 0.05(5%), 191 이상일 확률을 0.01(1%)로 출력할 수 있다. 그러면, 제어모듈(230)은 가장 확률이 높은 176~180cm를 사용자의 키로 예측한다. When the marker of DNA information is input, the prediction network 240 performs an operation on the marker and outputs a predicted probability value for the user's final key. At this time, the prediction network 240 classifies the keys according to a predetermined range, and outputs a probability that the user will eventually grow into the keys of the range for the range of the divided keys. For example, the prediction network 240 is divided into eight ranges, such as a user's height of 160 cm or less, 161 to 165 cm, 166 to 170 cm, 171 to 175 cm, 176 to 180 cm, 181 to 185 cm, 186 to 190 cm, and 191 cm or more. Then, for each range, the probability that the user will finally grow with the key of the range is output. Then, the control module 230 estimates the user's body requirements according to the probability value output by the prediction network 240 in step S140d. For example, the prediction network 240 has a probability that the user's height is 160 cm or less, 0.01 (1%), 161 to 165 cm, 0.02 (2%), and 166 to 170 cm, 0.04 (4%), and 171 to 175 cm. Probability 0.05 (5%), 176-180 cm probability 0.78 (78%), 181-185 cm probability 0.06 (6%), 186-190 cm probability 0.05 (5%), 191 or higher probability 0.01 ( 1%). Then, the control module 230 predicts the most likely 176 ~ 180cm as the user's height.

전술한 바와 같이, 사용자의 키를 예측망(240)을 통해 예측한 후, 제어모듈(230)은 S150 단계에서 그 예측 결과를 통신모듈(210)을 통해 사용자장치(100)로 전송한다. 이때, 사용자의 최종키에 대한 확률값을 모두 전송하거나, 최종 예측값만을 전송할 수 있다. 이 실시예와 같이, 176~180cm일 확률이 0.78(78%)로 나머지 키에 대한 확률에 비해 압도적으로 높은 확률이 출력된 경우, 최종 예측값만을 전송해도 무방하지만, 만약, 176~180cm일 확률이 0.49(49%), 181~185cm일 확률이 0.48(48%)로 출력되었다면, 모든 범위의 키에 대해 사용자가 최종적으로 해당 범위의 키로 성장할 확률을 전송하는 것이 바람직하다. 그러면, 사용자장치(100)의 제어부(160)는 통신부(110)를 통해 예측 결과를 수신하고, 표시부(140)를 통해 예측 결과를 표시한다. 이에 따라, 사용자는 표시부(140)에 표시된 예측 결과를 열람할 수 있다. As described above, after predicting the user's key through the prediction network 240, the control module 230 transmits the prediction result to the user device 100 through the communication module 210 in step S150. At this time, all probability values for the user's final key may be transmitted, or only the final prediction value may be transmitted. As in this embodiment, when the probability that the probability is 176 to 180 cm is overwhelmingly high compared to the probability for the remaining keys at 0.78 (78%), only the final prediction value may be transmitted, but if the probability is 176 to 180 cm If the probability of 0.49 (49%) and 181 to 185 cm is output as 0.48 (48%), it is desirable to transmit the probability that the user will eventually grow to the key of the range for all range keys. Then, the control unit 160 of the user device 100 receives the prediction result through the communication unit 110, and displays the prediction result through the display unit 140. Accordingly, the user can browse the prediction result displayed on the display unit 140.

한편, 서비스서버(200)는 예측 결과를 제공한 후, 부가 서비스를 제공할 수 있다. 이를 위하여, 서비스서버(200)의 저장모듈(220)은 예측망(240)이 예측한 신체 요건과 사용자의 실제 신체 요건이 다른 경우, 신체 요건이 다른 이유와 다른 이유 별로 개선할 수 있는 처방을 포함하는 개선정보를 저장할 수 있다. 이에 따라, 서비스서버(200)의 제어모듈(230)은 S160 단계에서 앞서(S110 단계) 수신한 사용자 정보에서 사용자의 신체 요건을 추출하고, 사용자의 신체 요건과, 예측망(240)이 예측한 신체 요건이 서로 다른 경우, 신체 요건이 다른 이유를 추정한 후, 추정된 이유에 따라 이를 개선할 수 있는 처방을 저장모듈(220)로부터 추출한다. Meanwhile, the service server 200 may provide an additional service after providing a prediction result. To this end, the storage module 220 of the service server 200 prescribes a prescription that can be improved for different reasons and different reasons when the physical requirements predicted by the prediction network 240 are different from the actual physical requirements of the user. It can store the improvement information to include. Accordingly, the control module 230 of the service server 200 extracts the user's body requirements from the user information received in step S160 (step S110), the user's body requirements, and the prediction network 240 predicts When the physical requirements are different, after estimating the reason for the different physical requirements, a prescription for improving it according to the estimated reason is extracted from the storage module 220.

그런 다음, 제어모듈(230)은 S220 단계에서 통신모듈(210)을 통해 단계별 건강 처방에 적합한 시간에 해당 건강 처방을 사용자장치(100)로 전송한다. 예컨대, 처방이 식이 요법인 경우, 식사 시간 1시간 내지 30분 전에 피해야할 음식과 권장하는 음식을 전송한다. 또한, 처방이 운동 요법인 경우, 운동이 필요한 시간에 운동 요령을 안내하는 텍스트, 이미지, 영상 등을 전송할 수 있다. Then, the control module 230 transmits the corresponding health prescription to the user device 100 at a time suitable for the step-by-step health prescription through the communication module 210 in step S220. For example, if the prescription is a diet, foods to be avoided and recommended foods are transmitted 1 hour to 30 minutes before the meal time. In addition, when the prescription is exercise therapy, texts, images, images, etc. that guide exercise tips can be transmitted at a time when exercise is required.

한편, 전술한 S140 단계에서 예측망(240)이 사용자의 DNA 정보를 분석하기 위해 충분한 학습(learning)이 이루어지지 않았을 수가 있다. 이러한 경우, 제어모듈(230)은 예측망(240)을 다시 학습시킨 후, 다시 학습된 예측망(240)을 통해 신체 요건을 예측할 수 있다. 이러한 방법에 대해서 설명하기로 한다. 도 5는 본 발명의 다른 실시예에 따른 인공신경망 기반의 유전자를 분석하기 위한 방법을 설명하기 위한 흐름도이다. 강조하면, 도 5는 전술한 S140 단계를 보다 상세하게 설명하기 위한 도면이다. On the other hand, in the aforementioned step S140, the prediction network 240 may not have sufficiently learned to analyze the user's DNA information. In this case, the control module 230 may re-learn the prediction network 240 and then predict the physical requirements through the learned prediction network 240 again. This method will be described. 5 is a flowchart illustrating a method for analyzing genes based on an artificial neural network according to another embodiment of the present invention. If emphasized, FIG. 5 is a view for explaining the above-described step S140 in more detail.

도 5를 참조하면, 제어모듈(230)은 S210 단계에서 신체 요건 예측 요건을 수신할 수 있다. 그러면, 제어모듈(230)은 S220 단계에서 사용자의 DNA 정보와 저장모듈(220)에 학습 데이터로 기존에 사용된 후, 저장된 기 설정된 유사도를 가지는 DNA 정보의 수가 기 설정된 기준치 미만인지 여부를 판단한다. Referring to FIG. 5, the control module 230 may receive a body condition prediction requirement in step S210. Then, the control module 230 determines whether the number of DNA information having a predetermined similarity is less than a predetermined reference value after being previously used as the learning data in the user's DNA information and the storage module 220 in step S220. .

S220 단계의 판단 결과, 사용자의 DNA 정보와 기 설정된 유사도를 가지는 DNA 정보의 수가 기 설정된 기준치 미만이면, S230 단계로 진행한다. As a result of the determination in step S220, if the number of DNA information having a predetermined similarity with the user's DNA information is less than a preset reference value, the process proceeds to step S230.

제어모듈(230)은 S230 단계에서 학습데이터생성망(250)을 이용하여 사용자의 DNA 정보로부터 1차 목표치의 학습 DNA 정보를 생성한다. 이와 같이, 1차 목표치의 학습 DNA 정보를 생성할 때, 학습데이터생성망(250)으로부터 머신러닝을 통해 생성된 인공신경망 모델을 이용하여 사용자의 DNA 정보로부터 1차 목표치의 학습 DNA 정보를 생성한다. 예컨대, 1차 목표치의 학습 DNA 정보는 2 만개 이상이 될 수 있다. The control module 230 generates learning DNA information of the primary target value from the user's DNA information using the learning data generation network 250 in step S230. As described above, when generating the learning DNA information of the primary target value, using the artificial neural network model generated through machine learning from the learning data generation network 250, the learning DNA information of the primary target value is generated from the user's DNA information. . For example, the learning DNA information of the primary target value may be 20,000 or more.

다음으로, 제어모듈(230)은 S230 단계에서 학습데이터생성망(250)을 이용하여 사용자의 DNA 정보로부터 2차 목표치의 학습 DNA 정보를 생성한다. 이와 같이, 2차 목표치의 학습 DNA 정보를 생성할 때, 학습데이터생성망(250)으로부터 딥러닝을 통해 생성된 인공신경망 모델을 이용하여 사용자의 DNA 정보 및 1차 목표치의 학습 DNA 정보로부터 2차 목표치의 학습 DNA 정보를 생성한다. Next, the control module 230 generates learning DNA information of the secondary target value from the user's DNA information using the learning data generation network 250 in step S230. As described above, when generating the learning DNA information of the secondary target value, using the artificial neural network model generated through deep learning from the learning data generation network 250, secondary from the user's DNA information and the learning DNA information of the primary target value Generates target learning DNA information.

다음으로, 제어모듈(230)은 S250 단계에서 2차 목표치의 학습 DNA 정보로부터 모든 마커를 추출하고, S260 단계에서 추출된 모든 마커 중 마이크로어레이의 최소 품질(QC: Quality Control)에 부합하는 마커를 선정한다. 그런 다음, 제어모듈(230)은 S270 단계에서 선정된 마커를 이용하여 상기 예측망(240)을 다시 학습시킨다. 그런 다음, 제어모듈(230)은 S280 단계에서 재학습이 완료된 예측망(240)을 통해 사용자의 신체 요건을 예측한다. 즉, 제어모듈(230)은 사용자의 DNA 정보의 마커 중 마이크로어레이의 최소 QC에 부합하는 마커를 선별하고, 상기 선별된 마커를 다시 학습된 예측망(240)에 입력한 후, 다시 학습된 예측망(240)이 출력한 확률값에 따라 사용자의 신체 요건을 추정한다. Next, the control module 230 extracts all the markers from the learning DNA information of the secondary target value in step S250, and extracts markers meeting the minimum quality (QC: Quality Control) of the microarrays among all the markers extracted in step S260. Select. Then, the control module 230 re-learns the prediction network 240 using the marker selected in step S270. Then, the control module 230 predicts the user's body requirements through the prediction network 240, where re-learning is completed in step S280. That is, the control module 230 selects a marker that satisfies the minimum QC of the microarray among markers of the user's DNA information, inputs the selected marker into the learned prediction network 240, and then re-learns the prediction. The user's body requirements are estimated according to the probability value output by the network 240.

반면, S220 단계의 판단 결과, 사용자의 DNA 정보와 기 설정된 유사도를 가지는 DNA 정보의 수가 기 설정된 기준치 이상이면, S290 단계로 진행한다. 제어모듈(230)은 S290 단계에서 사용자의 DNA 정보의 마커 중 마이크로어레이의 최소 QC에 부합하는 마커를 선별하고, 선별된 마커를 기존(재학습하지 않은) 예측망(240)에 입력한 후, 그 예측망(240)이 출력한 확률값에 따라 사용자의 신체 요건을 추정한다. On the other hand, as a result of the determination in step S220, if the number of DNA information having a predetermined similarity to the user's DNA information is greater than or equal to a preset reference value, the process proceeds to step S290. The control module 230 selects a marker that satisfies the minimum QC of the microarray among markers of the user's DNA information in step S290, inputs the selected marker into the existing (not re-learned) prediction network 240, The user's body requirements are estimated according to the probability value output by the prediction network 240.

이와 같이, 본 발명은 사용자의 유전자 데이터를 입력 받아서 표현형을 해석할 때 미리 학습된 모델을 이용하여 예측된 결과를 알려주고, 그 데이터를 다시 학습하여 새로운 모델을 구축함으로써 계속 진화하는 실시간 학습모델을 제공한다. 또한, 마이크로어레이 기반의 유전형 데이터, 유전체와 유전체 관련 데이터를 활용하여 논문에서 밝혀진 부분 마커가 아닌 전체 마커세트를 사용하여 데이터를 재학습함으로써 정확도를 지속적으로 높이는 딥러닝과 머신러닝 알고리즘(랜덤 포레스트, 서포트 벡터 머신)을 동시에 이용할 수 있다. 분석 초기부터 많은 수의 샘플을 구할 수 없다는 문제를 해결하기 위해, 샘플 수에 따라 적용 기술이 달라질 수 있다. 즉, 초기 2만개의 샘플까지는 머신러닝을 적용 하고, 이후에는 서서히 딥러닝으로 변경하는 방법을 적용함으로써 유전자 분석 및 해석에 가장 정확한 답을 찾을 수 있다. As described above, the present invention provides a real-time learning model that continuously evolves by receiving a user's genetic data and interpreting a phenotype to inform a predicted result using a pre-trained model, and re-learning the data to build a new model. do. In addition, deep learning and machine learning algorithms (Random Forest, which continuously improve accuracy) by re-learning data using the entire set of markers instead of the partial markers revealed in the paper using microarray-based genotype data, genome and genome-related data (Random Forest, Support vector machine) at the same time. In order to solve the problem that a large number of samples cannot be obtained from the beginning of the analysis, application techniques may vary depending on the number of samples. That is, by applying machine learning to the initial 20,000 samples, and then gradually changing to deep learning, the most accurate answer can be found for genetic analysis and interpretation.

한편, 앞서 설명된 본 발명의 실시예에 따른 방법들은 다양한 컴퓨터수단을 통하여 판독 가능한 프로그램 형태로 구현되어 컴퓨터로 판독 가능한 기록매체에 기록될 수 있다. 여기서, 기록매체는 프로그램 명령, 데이터 파일, 데이터구조 등을 단독으로 또는 조합하여 포함할 수 있다. 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 예컨대 기록매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광 기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함한다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 와이어뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 와이어를 포함할 수 있다. 이러한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다. Meanwhile, the methods according to the embodiments of the present invention described above may be implemented in a program readable form through various computer means and recorded in a computer readable recording medium. Here, the recording medium may include a program command, a data file, a data structure, or the like alone or in combination. The program instructions recorded on the recording medium may be specially designed and configured for the present invention, or may be known and available to those skilled in computer software. For example, the recording medium includes magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs, DVDs, and magnetic-optical media such as floptical disks. magneto-optical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions may include high-level language wires that can be executed by a computer using an interpreter, as well as machine language wires such as those produced by a compiler. Such a hardware device may be configured to operate as one or more software modules to perform the operation of the present invention, and vice versa.

이상 본 발명을 몇 가지 바람직한 실시예를 사용하여 설명하였으나, 이들 실시예는 예시적인 것이며 한정적인 것이 아니다. 이와 같이, 본 발명이 속하는 기술분야에서 통상의 지식을 지닌 자라면 본 발명의 사상과 첨부된 특허청구범위에 제시된 권리범위에서 벗어나지 않으면서 균등론에 따라 다양한 변화와 수정을 가할 수 있음을 이해할 것이다. Although the present invention has been described above using some preferred embodiments, these embodiments are illustrative and not limiting. As described above, those skilled in the art to which the present invention pertains will understand that various changes and modifications can be made according to the theory of equality without departing from the spirit of the present invention and the scope of the rights set forth in the appended claims.

100: 사용자장치 110: 통신부
120: 카메라부 130: 입력부
140: 저장부 150: 표시부
160: 제어부 200: 서비스서버
210: 통신모듈 220: 저장모듈
230: 제어모듈 240: 예측망
250: 학습데이터생성망 300: 정보제공서버
100: user device 110: communication unit
120: camera unit 130: input unit
140: storage unit 150: display unit
160: control unit 200: service server
210: communication module 220: storage module
230: control module 240: prediction network
250: learning data generation network 300: information providing server

Claims (5)

인공신경망 기반의 유전자를 분석하기 위한 장치에 있어서,
DNA 정보를 기초로 신체 요건에 대한 예측을 확률값으로 출력하는 인공신경망 모델인 예측망;
사용자의 DNA 정보 및 상기 사용자가 선택한 신체 요건에 대한 예측 요청을 수신하는 통신모듈; 및
상기 사용자의 DNA 정보에서 모든 마커를 추출하고,
추출된 모든 마커 중 마이크로어레이의 최소 QC(Quality Control)에 부합하는 마커를 선별하고,
선별된 마커를 상기 예측망에 입력한 후, 상기 예측망이 출력한 확률값에 따라 상기 사용자의 신체 요건을 예측하고,
상기 사용자의 사용자장치로 상기 통신모듈을 통해 상기 예측된 상기 사용자의 신체 요건을 전송하는 제어모듈;을 포함하는 것을 특징으로 하는
유전자를 분석하기 위한 장치.
In the device for analyzing the genes based on the artificial neural network,
A prediction network that is an artificial neural network model that outputs predictions of physical requirements as probability values based on DNA information;
A communication module for receiving a user's DNA information and a prediction request for the user's selected physical requirements; And
Extract all markers from the user's DNA information,
Among all the extracted markers, markers that meet the minimum quality control (QC) of the microarray are selected,
After inputting the selected marker into the prediction network, the user's body requirements are predicted according to the probability value output by the prediction network,
And a control module for transmitting the predicted body condition of the user through the communication module to the user device of the user.
Device for analyzing genes.
제1항에 있어서,
상기 장치는
DNA 정보를 생성하는 인공신경망 모델인 학습데이터생성망;을 더 포함하며,
상기 제어모듈은
상기 통신모듈을 통해 상기 예측 요청을 수신한 후,
상기 사용자의 DNA 정보와 기 설정된 유사도를 가지는 DNA 정보의 수가 기 설정된 기준치 미만이면,
상기 학습데이터생성망을 기초로 머신러닝을 통해 생성된 모델을 이용하여 상기 사용자의 DNA 정보로부터 1차 목표치의 학습 DNA 정보를 생성하고,
상기 학습데이터생성망을 기초로 딥러닝을 통해 생성된 모델을 이용하여 1차 목표치의 학습 DNA 정보로부터 2차 목표치의 학습 DNA 정보를 생성하는 것을 특징으로 하는
유전자를 분석하기 위한 장치.
According to claim 1,
The device
It further includes a learning data generation network, an artificial neural network model that generates DNA information.
The control module
After receiving the prediction request through the communication module,
If the number of DNA information having a predetermined similarity with the user's DNA information is less than a preset reference value,
Based on the learning data generation network, using the model generated through machine learning to generate learning DNA information of the primary target value from the DNA information of the user,
On the basis of the learning data generation network, characterized by generating a learning DNA information of the secondary target value from the learning DNA information of the primary target value using a model generated through deep learning
Device for analyzing genes.
제2항에 있어서,
상기 제어모듈은
상기 2차 목표치의 학습 DNA 정보로부터 모든 마커를 추출하고,
추출된 모든 마커 중 마이크로어레이의 최소 QC(Quality Control)에 부합하는 마커를 선정하고,
선정된 마커를 이용하여 상기 예측망을 다시 학습시키는 것을 특징으로 하는
유전자를 분석하기 위한 장치.
According to claim 2,
The control module
All markers are extracted from the learning DNA information of the secondary target value,
Among all the extracted markers, markers that meet the minimum quality control (QC) of the microarray are selected,
Characterized in that the predicted network is re-trained using the selected marker
Device for analyzing genes.
제3항에 있어서,
상기 제어모듈은
상기 사용자의 DNA 정보의 마커 중 마이크로어레이의 최소 QC에 부합하는 마커를 선별하고, 상기 선별된 마커를 상기 다시 학습된 예측망에 입력한 후, 상기 다시 학습된 예측망이 출력한 확률값에 따라 상기 사용자의 신체 요건을 추정하고,
상기 사용자의 사용자장치로 상기 통신모듈을 통해 추정된 상기 사용자의 신체 요건을 전송하는 것을 특징으로 하는
유전자를 분석하기 위한 장치.
According to claim 3,
The control module
The markers corresponding to the minimum QC of the microarray are selected from among the markers of the user's DNA information, the selected markers are input to the re-trained prediction network, and the probability is output by the re-trained prediction network. Estimate the user's physical requirements,
Characterized in that the body requirements of the user estimated through the communication module are transmitted to the user device of the user.
Device for analyzing genes.
제1항에 있어서,
상기 제어모듈은
상기 사용자의 상기 예측된 신체 요건과 실제 신체 요건이 서로 다른 경우, 신체 요건이 다른 이유를 추정한 후, 추정된 이유에 따라 이를 개선할 수 있는 처방을 추출하고, 상기 통신모듈을 통해 추출된 처방을 상기 사용자장치로 전송하는 것을 특징으로 하는
유전자를 분석하기 위한 장치.
According to claim 1,
The control module
When the user's predicted physical requirements and actual physical requirements are different, after estimating the reason why the physical requirements are different, extracting a prescription to improve it according to the estimated reason and extracting the prescription through the communication module Characterized in that the transmission to the user device
Device for analyzing genes.
KR1020190175909A 2018-12-28 2019-12-27 Apparatus for analyzing genes based on neural network KR102151436B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020180172178 2018-12-28
KR20180172178 2018-12-28

Related Child Applications (2)

Application Number Title Priority Date Filing Date
KR1020190175954A Division KR102151438B1 (en) 2019-12-27 2019-12-27 System for analyzing genes based on neural network
KR1020190175952A Division KR102151437B1 (en) 2019-12-27 2019-12-27 Method for analyzing genes based on neural network

Publications (2)

Publication Number Publication Date
KR20200083921A true KR20200083921A (en) 2020-07-09
KR102151436B1 KR102151436B1 (en) 2020-09-04

Family

ID=71602294

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190175909A KR102151436B1 (en) 2018-12-28 2019-12-27 Apparatus for analyzing genes based on neural network

Country Status (1)

Country Link
KR (1) KR102151436B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022086053A1 (en) * 2020-10-19 2022-04-28 (주)제이엘케이 Artificial intelligence-based microarray specific determinant extraction system
WO2022260466A1 (en) * 2021-06-11 2022-12-15 한국생명공학연구원 Method and system for selecting individual- and lineage-specific classification variations and markers by using artificial intelligence

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101874527B1 (en) 2017-07-21 2018-07-04 데일리소프트(주) Method for gene analysis judgement and recording medium storing program for executing the same, and recording medium storing program for executing the same

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101874527B1 (en) 2017-07-21 2018-07-04 데일리소프트(주) Method for gene analysis judgement and recording medium storing program for executing the same, and recording medium storing program for executing the same

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
M. Leung 외, "Machine Learning in Genomic Medicine: A Review of Computational Problems and Data Sets", Proceedings of IEEE, 104권, 1호, pp.176-197, 2016.01.* *
P. Bellot 외, "Can Deep Learning Improve Genomic Prediction of Complex Human Traits?", Genetics, 210권, pp.809-819, 2018.11.* *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022086053A1 (en) * 2020-10-19 2022-04-28 (주)제이엘케이 Artificial intelligence-based microarray specific determinant extraction system
WO2022260466A1 (en) * 2021-06-11 2022-12-15 한국생명공학연구원 Method and system for selecting individual- and lineage-specific classification variations and markers by using artificial intelligence

Also Published As

Publication number Publication date
KR102151436B1 (en) 2020-09-04

Similar Documents

Publication Publication Date Title
US10217048B2 (en) Predictive assignments that relate to genetic information and leverage machine learning models
Braga-Neto et al. Is cross-validation better than resubstitution for ranking genes?
US11868582B2 (en) Apparatus for controlling device based on augmented reality and method thereof
CN113112030B (en) Method and system for training model and method and system for predicting sequence data
KR102151436B1 (en) Apparatus for analyzing genes based on neural network
KR102281590B1 (en) System nad method of unsupervised training with weight sharing for the improvement in speech recognition and recording medium for performing the method
CN109615060B (en) CTR estimation method, CTR estimation device and computer-readable storage medium
US20200057937A1 (en) Electronic apparatus and controlling method thereof
KR101964694B1 (en) Device, Method, and Computer-Readable Medium for Judging Drug Similarity
CN112287994A (en) Pseudo label processing method, device, equipment and computer readable storage medium
US20190019083A1 (en) Predictive assignments that relate to genetic information and leverage machine learning models
KR20210077916A (en) A method for integrated controlling home appliance and system for the same
KR20200080418A (en) Terminla and operating method thereof
Ghazanfar et al. Stabilized mosaic single-cell data integration using unshared features
KR20210030796A (en) A method for controlling cooking appliance and system for the same
KR102151437B1 (en) Method for analyzing genes based on neural network
KR102151438B1 (en) System for analyzing genes based on neural network
CN112819152B (en) Neural network training method and device
Jia et al. Online V2X scheduling for raw-level cooperative perception
US20240046065A1 (en) System, devices and/or processes for defining a search space for neural network processing device architectures
CN109583583B (en) Neural network training method and device, computer equipment and readable medium
CN111435381A (en) Request distribution method and device
KR102074412B1 (en) Apparatus for adjusting power mode of iot module
Selvarajan et al. SCMC: Smart city measurement and control process for data security with data mining algorithms
Rajinikanth et al. Energy Efficient Cluster Based Clinical Decision Support System in IoT Environment.

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right