WO2021141312A1 - 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법 - Google Patents
인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법 Download PDFInfo
- Publication number
- WO2021141312A1 WO2021141312A1 PCT/KR2020/019242 KR2020019242W WO2021141312A1 WO 2021141312 A1 WO2021141312 A1 WO 2021141312A1 KR 2020019242 W KR2020019242 W KR 2020019242W WO 2021141312 A1 WO2021141312 A1 WO 2021141312A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- subject
- genotype information
- genetic
- preset
- marker
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Definitions
- the present invention relates to a method of providing a self-improvement genetic test service using artificial intelligence-based genomic big data, and by using the accumulated genotype information of a group having the same attributes as the subject, in addition to the target gene marker, candidate gene markers and disease and physical characteristics By calculating the degree of association with , it provides a platform for updating the test marker list.
- control group to be compared according to the same country, ethnicity, and race as the subject that is, even if genotype information exists, the control group to which the subject belongs, such as sampling of the research sample, errors in the genotype information production process, and errors in the analysis process If the genetic markers are used as they are without checking whether they are effectively correlated, the genetic test results are unreliable and inevitably meaningless data.
- An embodiment of the present invention compares and contrasts the genotype information of the subject with the genotype information of the control group based on the previously stored genetic markers, based on the identification of diseases and physical characteristics, of the same country, ethnicity, and race as the subject.
- genotype information is accumulated, in addition to the target gene marker, which is a previously compared genetic marker, a candidate gene marker, which is another genetic marker, calculates a degree of association for identifying diseases and physical characteristics, and if there is a degree of association, a candidate gene marker is selected.
- Self-improvement genetic testing service using artificial intelligence-based genomic big data that can self-improving to identify diseases or physical characteristics with new genetic markers by updating the test marker list A method of providing can be provided.
- an embodiment of the present invention includes the steps of receiving, from the subject terminal, information of a subject group including country, ethnicity, and race, and a genetic test request event, country, ethnicity, and extracting the control genotype information of the pre-stored control group corresponding to the race, the subject genotype information produced from the DNA sample extracted from the subject for the predetermined diseases and physical characteristics, and the control genotype information of the control group in the preset Comparing based on the genetic marker, and when the control genotype information is present in the subject genotype information based on the preset genetic marker, determining that the preset disease and physical characteristics exist, generating a report and transmitting it to the subject terminal includes
- the genotype information of the subject and the genotype information of the control group are compared and contrasted based on a previously stored genetic marker, based on the identification of diseases and physical characteristics, the same country as the subject
- a correlation is calculated for a candidate genetic marker, which is another genetic marker, for identifying diseases and physical characteristics, and the correlation exists.
- FIG. 1 is a diagram for explaining a system for providing a self-improvement genetic test service using artificial intelligence-based genomic big data according to an embodiment of the present invention.
- FIG. 2 is a block diagram illustrating a genetic test service providing server included in the system of FIG. 1 .
- 3 and 4 are diagrams for explaining an embodiment in which a self-improvement genetic test service using artificial intelligence-based genomic big data according to an embodiment of the present invention is implemented.
- FIG. 5 is a diagram illustrating a process in which data is transmitted/received between components included in the self-improvement genetic test service providing system using artificial intelligence-based genomic big data of FIG. 1 according to an embodiment of the present invention.
- FIG. 6 is an operation flowchart illustrating a method of providing a self-improvement genetic test service using artificial intelligence-based genomic big data according to an embodiment of the present invention.
- a "part" includes a unit realized by hardware, a unit realized by software, and a unit realized using both.
- one unit may be implemented using two or more hardware, and two or more units may be implemented by one hardware.
- mapping or matching with the terminal means mapping or matching the terminal's unique number or personal identification information, which is the identification data of the terminal. can be interpreted as
- the self-improvement genetic test service providing system 1 using artificial intelligence-based genomic big data includes at least one test subject terminal 100 , a genetic test service providing server 300 , and at least one other test subject terminal. (400).
- the self-improvement genetic test service providing system 1 using the artificial intelligence-based genome big data of FIG. 1 is only an embodiment of the present invention, the present invention is not limitedly interpreted through FIG. 1 .
- each component of FIG. 1 is generally connected through a network 200 .
- at least one test subject terminal 100 may be connected to the genetic test service providing server 300 through the network 200 .
- the genetic test service providing server 300 may be connected to at least one test subject terminal 100 and at least one other test subject terminal 400 through the network 200 .
- at least one other test subject terminal 400 may be connected to the genetic test service providing server 300 through the network 200 .
- the network refers to a connection structure in which information exchange is possible between each node, such as a plurality of terminals and servers, and an example of such a network includes RF, 3rd Generation Partnership Project (3GPP) network, Long Term (LTE). Evolution) network, 5th Generation Partnership Project (5GPP) network, WIMAX (World Interoperability for Microwave Access) network, Internet, LAN (Local Area Network), Wireless LAN (Wireless Local Area Network), WAN (Wide Area Network) , PAN (Personal Area Network), Bluetooth (Bluetooth) network, NFC network, satellite broadcasting network, analog broadcasting network, DMB (Digital Multimedia Broadcasting) network, and the like are included, but are not limited thereto.
- 3GPP 3rd Generation Partnership Project
- LTE Long Term
- Evolution Fifth Generation Partnership Project
- 5GPP Fifth Generation Partnership Project
- WIMAX Worldwide Interoperability for Microwave Access
- Internet Internet
- LAN Local Area Network
- Wireless LAN Wireless Local Area Network
- WAN
- At least one test subject terminal 100 receives a genetic test request through the genetic test service providing server 300 using a self-improvement genetic test service related web page, app page, program or application using artificial intelligence-based genomic big data. It may be a terminal that does In addition, the at least one test subject terminal 100 may be a terminal that consents to the collection and use of the DNA sample. In addition, the at least one test subject terminal 100 may be a terminal that receives a genetic test result from the genetic test service providing server 300 .
- the at least one testee terminal 100 may be implemented as a computer capable of accessing a remote server or terminal through a network.
- the computer may include, for example, a navigation device, a laptop computer equipped with a web browser, a desktop computer, and a laptop computer.
- the at least one testee terminal 100 may be implemented as a terminal capable of accessing a remote server or terminal through a network.
- the at least one terminal 100 is, for example, a wireless communication device that guarantees portability and mobility, such as navigation, Personal Communication System (PCS), Global System for Mobile communications (GSM), Personal Digital Cellular (PDC), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) ) terminal, a smart phone, a smart pad, a tablet PC, etc. may include all kinds of handheld-based wireless communication devices.
- PCS Personal Communication System
- GSM Global System for Mobile communications
- PDC Personal Digital Cellular
- PHS Personal Handyphone System
- IMT International Mobile Telecommunication
- CDMA Code Division Multiple Access
- W-CDMA(W-Code Division Multiple Access) Wideband Internet
- Wibro Wireless Broadband Internet
- the genetic test service providing server 300 may be a server that provides a self-improvement genetic test service web page, an app page, a program, or an application using artificial intelligence-based genomic big data.
- the genetic test service providing server 300 in order to provide a genetic test service, at least one type of group, for example, genotype information about a country, ethnicity, and race, a genetic marker, a test marker list, and It may be a server that maps disease and physical characteristic information into a database.
- the genetic test service providing server 300 receives information about the subject's DNA sample from the manager terminal (not shown), and receives the subject's genotype from the manager terminal It may be a server that receives information.
- the genetic test service providing server 300 compares the same group as the subject, that is, a group having the same country, ethnicity, and race as a control group, from a previously built database the genotype of the same group. It may be a server that extracts information, that is, control genotype information, and calculates a degree of association with diseases and physical characteristics through comparison. And, when the degree of association is equal to or greater than the reference value, the genetic test service providing server 300 determines whether to delete the target genetic marker that has already been tested in the test marker list, and any genetic marker that has not been tested, that is, a candidate gene. It may be a server that determines whether to add a marker and adds it to the test marker list.
- the genetic test service providing server 300 may be implemented as a computer capable of accessing a remote server or terminal through a network.
- the computer may include, for example, a navigation device, a laptop computer equipped with a web browser, a desktop computer, and a laptop computer.
- the at least one other subject terminal 400 may be a terminal of another subject requesting a genetic test using a web page, an app page, a program or an application related to a self-improvement genetic test service using artificial intelligence-based genomic big data.
- the subject is defined as the person who first performed the genetic test (1st) within the group grouped by the same country, ethnicity, and race, and the other testee is classified as the same group as the subject and tested later than the subject It is defined as (2nd, etc,nth).
- the other subject terminal 400 is a terminal that has applied for the genetic test in the same way as the subject terminal 100, but according to the order, depending on who has the reference point, before or after being divided into groups, the object Since is divided, it will be obvious that all operations executed in the terminal 100 under test are possible.
- the at least one other terminal 400 of the examinee may be implemented as a computer capable of accessing a remote server or terminal through a network.
- the computer may include, for example, a navigation device, a laptop computer equipped with a web browser, a desktop computer, and a laptop computer.
- the at least one other terminal 400 of the examinee may be implemented as a terminal capable of accessing a remote server or terminal through a network.
- the at least one other terminal 400 is, for example, a wireless communication device that guarantees portability and mobility, such as navigation, Personal Communication System (PCS), Global System for Mobile communications (GSM), and Personal Digital Cellular (PDC).
- PCS Personal Communication System
- GSM Global System for Mobile communications
- PDC Personal Digital Cellular
- PHS Personal Handyphone System
- PDA Personal Digital Assistant
- IMT International Mobile Telecommunication
- CDMA Code Division Multiple Access
- W-CDMA Wide-Code Division Multiple Access
- Wibro Wireless Broadband Internet
- smart phones smart pads, tablet PCs, and the like may include all kinds of handheld-based wireless communication devices.
- FIG. 2 is a block diagram for explaining a gene test service providing server included in the system of FIG. 1, and FIGS. 3 and 4 are self-improvement genetic testing using artificial intelligence-based genomic big data according to an embodiment of the present invention. It is a diagram for explaining an embodiment in which a service is implemented.
- the genetic test service providing server 300 may include a receiving unit 310 , an extracting unit 320 , a comparing unit 33 , a transmitting unit 340 , and an update unit 350 .
- the genetic test service providing server 300 according to an embodiment of the present invention or another server (not shown) operating in conjunction with at least one test subject terminal 100 and at least one other subject terminal 400 provides artificial intelligence.
- at least one subject terminal 100 and at least one other subject terminal 400 are artificial intelligence-based You can install or open self-improvement genetic testing service applications, programs, app pages, and web pages using genome big data.
- the service program may be driven in at least one examinee terminal 100 and at least one other examinee terminal 400 by using a script executed in a web browser.
- the web browser is a program that enables the use of a web (WWW: world wide web) service, and refers to a program that receives and displays hypertext written in HTML (hyper text mark-up language), for example, Netscape , Explorer, Chrome, and the like.
- the application means an application on the terminal, for example, includes an app (app) executed in a mobile terminal (smartphone).
- the receiver 310 may receive, from the test subject terminal 100 , information on a subject group including country, ethnicity, and race, and a genetic test request event.
- the group may be divided into the aforementioned country, ethnicity, and race, but it is not excluded that the group is divided or classified and grouped by other characteristics.
- the extraction unit 320 may extract control genotype information of a pre-stored control group corresponding to a country, an ethnicity, and a race. For example, if the subject is Korean or Asian, the genotype information of both Korean and Asian must be extracted in the same way as the subject, so that comparison with the subject can be performed. This is called a control, and since genotype information is compared, it is defined as control genotype information.
- the genotype information may be generated by sequencing the genome (Genome) sequence.
- the DNA sample of the subject is a sample collected from blood, saliva, oral epithelial cells, etc., DNA is extracted from the DNA sample, and genotype information can be produced by full-length genome decoding and DNA chip method. Detoxification and genotype production methods can be used in various commercialized platforms, and is not limited to any one experimental method or platform. Accordingly, the control genotype information and the subject genotype information can be generated and compared by the above-described method.
- control genotype information may be extracted by dividing the case where the study result exists and the case where the study result does not exist.
- the relationship between genetic markers and diseases in which i) is the same group (group) as the subject, and ii) the study result of the same group as the subject exists is extracted as control genotyping information.
- genotyping information that does not show a significant association with diseases and physical characteristics, that is, gene polymorphism positions (locus) may also be collected.
- Korea Patent Registration No. 10-2023464 (announced on September 20, 2019), which is a previously applied patent of the present applicant, can be used.
- a related group may be designated using history, geography, genetic information, etc., and when generating virtual genotype information, various methods other than the above-described method may be used.
- the extraction unit 320 selects the pre-stored control group corresponding to the country, ethnicity, and race. If it does not exist, it is possible to extract control genotyping information by designating and creating a virtual control group corresponding to country, ethnicity, and race.
- the comparator 330 may compare the subject genotype information produced from a DNA sample extracted from the subject and the control genotype information of the control group with respect to a preset disease and physical characteristic based on a preset genetic marker.
- the subject genotype information may include a target gene marker corresponding to a position included in the genetic test based on a preset genetic marker, and a candidate gene marker corresponding to a position not included in the genetic test.
- a preset genetic marker is information that has been revealed due to previously published research results or accumulated research results, and a known position of a chromosome in a human or an animal can be identified with a DNA sequence.
- Genetic markers are short DNA sequences, such as single nucleotide polymorphisms (SNPs) resulting from a change of one base.
- SNPs single nucleotide polymorphisms
- genetic markers for which research results have not been revealed may be related to diseases or physical characteristics, but cannot be used because there are no research results yet. that there is no
- an unknown genetic marker that is, an arbitrary genetic marker (hereinafter referred to as a candidate genetic marker) that is not a target genetic marker, and disease and physical characteristics are measured, and the degree of association is greater than or equal to a preset reference value.
- A, B, C, and D are target gene markers
- A is tuberculosis
- B is obesity
- C is blood pressure
- D is used to identify cholesterol
- E to Z are candidate gene markers.
- E can be a genetic marker for detecting obesity by calculating the degree of association
- a genetic marker for detecting obesity can be BE, and can be mapped and stored like BE-obesity, and test for obesity
- the marker list can be updated from B to BE.
- disease characteristics include triglyceride concentration, cholesterol, blood sugar, blood pressure, vitamin C concentration, and caffeine metabolism
- physical characteristics include body mass index, pigmentation, hair loss, hair thickness, skin aging (glycation action), skin elasticity may include, but is not limited to.
- test marker list should be updated in the direction of deleting previously identified genetic markers, ie, target genetic markers. Accordingly, the test marker list may be updated by recalculating the correlation between the target genetic markers that have already been tested and the disease and physical characteristics.
- the comparator 330 compares the subject genotype information produced from the DNA sample extracted from the subject with the control genotype information of the control group with respect to a preset disease and physical characteristic based on a preset genetic marker. A comparison can be made based on the degree of association calculated using a genome-wide association study.
- the transmitter 340 determines that the preset disease and physical characteristics exist, generates a report, and transmits it to the subject terminal 100. .
- the transmitter 340 when the control genotype information exists in the subject genotype information based on the preset genetic marker, determines that the preset disease and physical characteristics exist, generates a report and transmits it to the subject terminal 100, A scoring algorithm (Polygenic Risk Score) can be used when generating the report.
- the update process of the update unit 350 will be divided into four and described.
- the first is the process of verifying the target genetic markers present in the test marker list, and the second is removing (deleting) from the test marker list when the relevance of the target genetic markers present in the test marker list is lower than the reference value. It is a process.
- the third is the process of verifying candidate genetic markers that do not exist in the test marker list, including them in the test marker list, and updating them with target genetic markers.
- the result of verifying candidate genetic markers that do not exist in the test marker list This is the process of remaining as a candidate genetic marker because the degree of association does not meet the reference value (no update of the test marker list).
- the update unit 350 determines that the preset disease and physical characteristics exist and sends a report when the control unit 340 has the control genotype information in the subject genotype information based on the preset genetic marker.
- the control unit 340 After generating and transmitting to the subject terminal 100, other subject genotype information of at least one other subject belonging to the subject group is accumulated by a preset number or more, and a target gene marker in the other subject genotype information and a preset disease and physical characteristic
- the test marker list may be updated by adding a target genetic marker in other subject genotype information as a preset genetic marker.
- the update unit 350 determines that the preset disease and physical characteristics exist and sends the report when the control genotype information in the transmission unit 340 is present in the subject genotype information based on the preset genetic marker.
- other subject genotype information of at least one other subject belonging to the subject group is accumulated by a preset number or more, and a target gene marker in the other subject genotype information and a preset disease and physical characteristic
- the test marker list may be updated by deleting the target gene marker in the genotype information of another subject from the preset genetic marker.
- the update unit 350 determines that the preset disease and physical characteristics exist and sends the report when the control unit 340 has the control genotype information in the subject genotype information based on the preset genetic marker.
- other subject genotype information of at least one other subject belonging to the subject group is accumulated by a predetermined number or more, and between the candidate gene marker in the other subject genotype information and the predetermined disease and physical characteristics
- the test marker list may be updated by adding candidate genetic markers in other subject genotype information as preset genetic markers.
- a candidate genetic marker an unknown region not revealed in the study
- it can be redefined as a target genetic marker. Now, this is because it has been identified as a genetic marker that can identify diseases and physical characteristics, rather than an unknown genetic marker.
- the update unit 350 determines that the preset disease and physical characteristics exist and sends a report when the control unit 340 has the control genotype information in the subject genotype information based on the preset genetic marker. After being generated and transmitted to the subject terminal 100, other subject genotype information of at least one other subject belonging to the subject group is accumulated by a predetermined number or more, and between the candidate gene marker in the other subject genotype information and the predetermined disease and physical characteristics When the degree of association is less than a preset reference value, candidate genetic markers in other subject genotype information may be maintained as candidate genetic markers. That is, the candidate gene marker is not included in the test marker list, but remains and maintained.
- the method for determining the degree of relevance in the four steps described above may be calculated by an odd ratio or a beta coefficient, but is not limited to the above-described method.
- a genome-wide association study is also possible, and association analysis methods according to various embodiments may be used.
- the genetic test service providing server 300 maps, stores and classifies genotype information, genetic markers, and diseases and physical characteristics for countries, ethnicities, and races. Databaseization can proceed.
- the genetic test service providing server 300 when a test request is received from the subject terminal 100, compares the subject genotype information with the control genotype information, what kind of disease the subject has and what physical characteristics Data such as whether it has or whether there is a possibility of it is generated and transmitted to the subject terminal 100 .
- test marker list may be a list of each genetic marker capable of distinguishing each disease and physical characteristic, and may be classified by country, race, and ethnicity. In this case, since the update method is the same as described above, it will not be repeatedly described.
- FIG. 5 is a diagram illustrating a process in which data is transmitted/received between components included in the self-improvement genetic test service providing system using artificial intelligence-based genomic big data of FIG. 1 according to an embodiment of the present invention.
- FIG. 5 an example of a process in which data is transmitted and received between each component will be described with reference to FIG. 5, but the present application is not limited to such an embodiment, and the example shown in FIG. 5 according to the various embodiments described above will be described. It is apparent to those skilled in the art that the data transmission/reception process may be changed.
- the genetic test service providing server 300 by databaseizing genotype information and genetic markers, and disease and physical characteristic information for each country, ethnicity, and race, a subject genotype generated from a DNA sample of a subject thereafter A target to be compared with the information is constructed (S4100).
- the genetic test service providing server 300 when a test request is received from the subject terminal 100, generates the subject genotype information from the DNA sample (S4300), and compares the subject genotype information with the control genotype information ( S4400), after comparison based on the genetic marker, when the same genetic marker is included in both genotype information, a report indicating that the patient has the corresponding disease and physical characteristics is generated (S4500) and transmitted to the terminal 100 of the subject.
- the genetic markers up to step S4500 are target genetic markers.
- the genetic test service providing server 300 accumulates more than a preset number of test results of other subjects included in the same group (group) as the subject (S4700, S4800), the target gene marker and the candidate gene marker are used to , disease and physical characteristics are checked (S4900), and the test marker list is updated according to the degree of association (S4920).
- the method for providing self-improvement genetic test service using artificial intelligence-based genome big data of FIG. 5 is described above with reference to FIGS. 1 to 4 through the method of providing self-improvement genetic test service using artificial intelligence-based genomic big data. Since it is the same as the content described with respect to or can be easily inferred from the described content, the following description will be omitted.
- the genetic test service providing server receives the test subject group information including the country, ethnicity, and race, and the genetic test request event from the test subject terminal (S5100)
- the genetic test service providing server extracts the control genotype information of the pre-stored control group corresponding to the country, ethnicity, and race (S5200).
- the genetic test service providing server compares the subject genotype information produced from a DNA sample extracted from the subject with the control group genotype information for a preset disease and physical characteristic based on a preset genetic marker (S5300) ), when the control genotype information exists in the subject genotype information based on the preset genetic marker, it is determined that the preset disease and physical characteristics exist, and a report is generated and transmitted to the subject terminal (S5400).
- the method of providing a self-improvement genetic test service using artificial intelligence-based genomic big data is a recording medium including instructions executable by a computer, such as an application or program module executed by a computer. It can also be implemented in the form of Computer-readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media. Also, computer-readable media may include all computer storage media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.
- the method for providing a self-improvement genetic test service using artificial intelligence-based genomic big data includes an application basically installed in a terminal (which includes a program included in a platform or operating system basically installed in the terminal) may be executed), and may be executed by an application (ie, a program) installed directly on the master terminal by a user through an application providing server such as an application store server, an application, or a web server related to the corresponding service.
- an application ie, a program installed directly on the master terminal by a user through an application providing server such as an application store server, an application, or a web server related to the corresponding service.
- the method for providing a self-improvement genetic test service using artificial intelligence-based genomic big data is implemented as an application (ie, program) that is basically installed in a terminal or installed directly by a user, It may be recorded in a computer-readable recording medium such as a terminal.
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법이 제공되며, 피검자 단말로부터 국가, 민족, 및 인종을 포함한 피검자 그룹의 정보와, 유전자 검사 요청 이벤트를 수신하는 단계, 국가, 민족, 및 인종에 대응하는 기 저장된 대조군 그룹의 대조군 유전형 정보를 추출하는 단계, 기 설정된 질병 및 신체적 특성에 대하여, 피검자로부터 추출된 DNA 시료로부터 생산된 피검자 유전형 정보와, 대조군 그룹의 대조군 유전형 정보를 기 설정된 유전자 마커를 기준으로 비교하는 단계, 및 대조군 유전형 정보가 기 설정된 유전자 마커를 기준으로 피검자 유전형 정보에 존재하는 경우, 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 피검자 단말로 전송하는 단계를 포함한다.
Description
본 발명은 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법에 관한 것으로, 피검자와 동일한 속성을 가진 그룹의 누적된 유전형 정보를 이용하여, 타겟 유전자 마커 외에도 후보 유전자 마커와 질병 및 신체적 특성과의 연관도를 산출함으로써, 검사 마커 리스트를 업데이트하는 플랫폼을 제공한다.
유전자분석 전문기업이 개인 유전정보 분석 테스트에 대한 각 정부기관의 승인을 얻어내면서, 유전자검사시장의 판도는 달라지고 있다. 규제로 잠시 주춤했던 세계 유전자검사시장은, 백만 명이 넘는 사람들의 유전정보를 분석한 자료를 바탕으로, 유전자검사 연구개발과 함께 급속하게 성장하여 엘빈 토플러의 제4의 물결로서 자리 잡았다. 국내에서도 유전자검사 기술이 도입된 후 WES(Whole Exome Sequencing) 유전체 정보를 빅데이터화하고 이를 통합하고 최적화하는 기술로 개인유전체맵 플랫폼(PMAP)을 개발하기에 이르렀다. 이는 슈퍼 컴퓨팅 시스템으로 질병감수성을 찾아내 질병을 미연에 예방할 수 있게 하며, 신생아 유전질환 스크리닝 검사, 희귀질환 및 암 유전자 검사, 신약 및 줄기세포치료제 개발 등 다양한 분야에서 적용 가능할 것으로 전망된다.
이때, 유전자 마커를 이용하여 질병의 상태 지수를 예측하는 방법이 연구 및 개발되었는데, 이와 관련하여, 선행기술인 한국등록특허 제10-1828955호(2018년03월07일 공개)에는, 다중 유전자 검사 마커 각각에 대한 가중치를 계산하고, 계산된 각각의 가중치를 이용하여 질병에 대한 상태 지수를 예측함으로써, 유전자 검사를 통한 질병 예측 및 표현형 예측의 정확도를 높일 수 있는 구성이 개시된다. 구체적으로, 질병에 관련된 복수의 유전자 마커 정보와 사용자 유전 정보를 토대로 사용자가 질병 관련 인자를 보유하는지의 여부를 검출하고, 사용자의 질병 관련 인자 보유 여부와 복수의 유전자 마커 정보 각각의 가중치 정보를 이용하여 사용자의 질병 상태 지수를 산출하는 구성이 개시된다.
다만, 상술한 구성을 이용한다고 할지라도, 연구로 밝혀진 유전자 마커가 존재해야 피검자의 유전형 정보와 비교를 할 수가 있는데, 유전자 마커가 존재하지 않거나 유전자 마커에 대한 오류가 존재하는 경우 결과가 결과없음(Void) 또는 오류처리되는 경우가 존재한다. 또, 피검자와 동일한 국가, 민족, 및 인종에 따른 비교대상인 대조군, 즉 유전형 정보가 존재하는 경우일지라도, 연구표본의 샘플링, 유전형 정보 생산과정의 에러, 분석과정의 오류 등 피검자가 속한 집단에 대한 대조군의 유전자 마커가 유효하게 연관성을 보이는지 확인하지 않고 그대로 이용하는 경우, 유전자 검사 결과는 신뢰할 수 없어 무의미한 데이터일 수 밖에 없다.
[선행기술문헌]
등록특허공보 제10-1828955호(공개일자: 2018년03월07일)
공개특허공보 제10-2007-0085817호(공개일자: 2007년08월27일)
등록특허공보 제10-1542529호(공고일자: 2015년08월06일)
등록특허공보 제10-0806436호(공고일자: 2008년02월15일)
본 발명의 일 실시예는, 피검자의 유전형 정보와 대조군의 유전형 정보를 기 저장된 유전자 마커를 기준으로 비교대조함으로써, 질병 및 신체적 특성을 파악하는 것을 기본으로, 피검자와 동일한 국가, 민족, 및 인종의 유전형 정보가 누적되는 경우, 이미 비교했던 유전자 마커인 타겟 유전자 마커 외에도, 기타 유전자 마커인 후보 유전자 마커를 질병 및 신체적 특성을 파악하기 위한 연관도를 산출하고, 연관도가 존재하는 경우 후보 유전자 마커를 검사 마커 리스트로 업데이트함으로써 연구로 밝혀진 유전자 마커가 아닐지라도 새로운 유전자 마커로 질병이나 신체적 특성을 파악할 수 있도록 자기개선(Self-Improving)할 수 있는, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법을 제공할 수 있다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예는, 피검자 단말로부터 국가, 민족, 및 인종을 포함한 피검자 그룹의 정보와, 유전자 검사 요청 이벤트를 수신하는 단계, 국가, 민족, 및 인종에 대응하는 기 저장된 대조군 그룹의 대조군 유전형 정보를 추출하는 단계, 기 설정된 질병 및 신체적 특성에 대하여, 피검자로부터 추출된 DNA 시료로부터 생산된 피검자 유전형 정보와, 대조군 그룹의 대조군 유전형 정보를 기 설정된 유전자 마커를 기준으로 비교하는 단계, 및 대조군 유전형 정보가 기 설정된 유전자 마커를 기준으로 피검자 유전형 정보에 존재하는 경우, 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 피검자 단말로 전송하는 단계를 포함한다.
전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 피검자의 유전형 정보와 대조군의 유전형 정보를 기 저장된 유전자 마커를 기준으로 비교대조함으로써, 질병 및 신체적 특성을 파악하는 것을 기본으로, 피검자와 동일한 국가, 민족, 및 인종의 유전형 정보가 누적되는 경우, 이미 비교했던 유전자 마커인 타겟 유전자 마커 외에도, 기타 유전자 마커인 후보 유전자 마커를 질병 및 신체적 특성을 파악하기 위한 연관도를 산출하고, 연관도가 존재하는 경우 후보 유전자 마커를 검사 마커 리스트로 업데이트함으로써 연구로 밝혀진 유전자 마커가 아닐지라도 새로운 유전자 마커로 질병이나 신체적 특성을 파악할 수 있도록 자기개선(Self-Improving)할 수 있다.
도 1은 본 발명의 일 실시예에 따른 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 시스템을 설명하기 위한 도면이다.
도 2는 도 1의 시스템에 포함된 유전자 검사 서비스 제공 서버를 설명하기 위한 블록 구성도이다.
도 3 및 도 4는 본 발명의 일 실시예에 따른 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스가 구현된 일 실시예를 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 도 1의 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 시스템에 포함된 각 구성들 상호 간에 데이터가 송수신되는 과정을 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따른 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법을 설명하기 위한 동작 흐름도이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
명세서 전체에서 사용되는 정도의 용어 "약", "실질적으로" 등은 언급된 의미에 고유한 제조 및 물질 허용오차가 제시될 때 그 수치에서 또는 그 수치에 근접한 의미로 사용되고, 본 발명의 이해를 돕기 위해 정확하거나 절대적인 수치가 언급된 개시 내용을 비양심적인 침해자가 부당하게 이용하는 것을 방지하기 위해 사용된다. 본 발명의 명세서 전체에서 사용되는 정도의 용어 "~(하는) 단계" 또는 "~의 단계"는 "~ 를 위한 단계"를 의미하지 않는다.
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1개의 유닛이 2개 이상의 하드웨어를 이용하여 실현되어도 되고, 2개 이상의 유닛이 1개의 하드웨어에 의해 실현되어도 된다.
본 명세서에 있어서 단말, 장치 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말, 장치 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말, 장치 또는 디바이스에서 수행될 수도 있다.
본 명세서에서 있어서, 단말과 매핑(Mapping) 또는 매칭(Matching)으로 기술된 동작이나 기능 중 일부는, 단말의 식별 정보(Identifying Data)인 단말기의 고유번호나 개인의 식별정보를 매핑 또는 매칭한다는 의미로 해석될 수 있다.
이하 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 시스템을 설명하기 위한 도면이다. 도 1을 참조하면, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 시스템(1)은, 적어도 하나의 피검자 단말(100), 유전자 검사 서비스 제공 서버(300), 적어도 하나의 다른 피검자 단말(400)을 포함할 수 있다. 다만, 이러한 도 1의 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 시스템(1)은, 본 발명의 일 실시예에 불과하므로, 도 1을 통하여 본 발명이 한정 해석되는 것은 아니다.
이때, 도 1의 각 구성요소들은 일반적으로 네트워크(network, 200)를 통해 연결된다. 예를 들어, 도 1에 도시된 바와 같이, 적어도 하나의 피검자 단말(100)은 네트워크(200)를 통하여 유전자 검사 서비스 제공 서버(300)와 연결될 수 있다. 그리고, 유전자 검사 서비스 제공 서버(300)는, 네트워크(200)를 통하여 적어도 하나의 피검자 단말(100), 적어도 하나의 다른 피검자 단말(400)과 연결될 수 있다. 또한, 적어도 하나의 다른 피검자 단말(400)은, 네트워크(200)를 통하여 유전자 검사 서비스 제공 서버(300)와 연결될 수 있다.
여기서, 네트워크는, 복수의 단말 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크의 일 예에는 RF, 3GPP(3rd Generation Partnership Project) 네트워크, LTE(Long Term Evolution) 네트워크, 5GPP(5th Generation Partnership Project) 네트워크, WIMAX(World Interoperability for Microwave Access) 네트워크, 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), 블루투스(Bluetooth) 네트워크, NFC 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.
하기에서, 적어도 하나의 라는 용어는 단수 및 복수를 포함하는 용어로 정의되고, 적어도 하나의 라는 용어가 존재하지 않더라도 각 구성요소가 단수 또는 복수로 존재할 수 있고, 단수 또는 복수를 의미할 수 있음은 자명하다 할 것이다. 또한, 각 구성요소가 단수 또는 복수로 구비되는 것은, 실시예에 따라 변경가능하다 할 것이다.
적어도 하나의 피검자 단말(100)은, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 유전자 검사 서비스 제공 서버(300)를 통하여 유전자 검사 요청을 하는 단말일 수 있다. 그리고, 적어도 하나의 피검자 단말(100)은, DNA 시료의 채취동의 및 이용동의를 하는 단말일 수 있다. 또한, 적어도 하나의 피검자 단말(100)은, 유전자 검사 결과를 유전자 검사 서비스 제공 서버(300)로부터 수신하는 단말이 수 있다.
여기서, 적어도 하나의 피검자 단말(100)은, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다. 이때, 적어도 하나의 피검자 단말(100)은, 네트워크를 통해 원격지의 서버나 단말에 접속할 수 있는 단말로 구현될 수 있다. 적어도 하나의 피검자 단말(100)은, 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 네비게이션, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(smartphone), 스마트 패드(smartpad), 타블렛 PC(Tablet PC) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.
유전자 검사 서비스 제공 서버(300)는, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 제공하는 서버일 수 있다. 그리고, 유전자 검사 서비스 제공 서버(300)는, 유전자 검사 서비스를 제공하기 위하여, 적어도 하나의 종류의 집단, 예를 들어, 국가, 민족, 및 인종에 대한 유전형 정보, 유전자 마커, 검사 마커 리스트, 및 질병과 신체적 특성 정보를 매핑하여 데이터베이스화한 서버일 수 있다. 그리고, 유전자 검사 서비스 제공 서버(300)는, 피검자 단말(100)로부터 유전자 검사 요청이 수신되는 경우, 피검자의 DNA 시료를 채취한 정보를 관리자 단말(미도시)로부터 입력받고, 관리자 단말로부터 피검자 유전형 정보를 입력받는 서버일 수 있다. 이렇게 피검자 유전형 정보가 입력이 되면, 유전자 검사 서비스 제공 서버(300)는, 피검자와 동일한 집단, 즉 국가, 민족, 및 인종이 동일한 집단을 대조군으로 비교하기 위하여, 기 구축된 데이터베이스로부터 동일한 집단의 유전형 정보, 즉 대조군 유전형 정보를 추출하고, 비교를 통하여 질병 및 신체적 특성과의 연관도를 계산하는 서버일 수 있다. 그리고, 연관도가 기준값 이상인 경우, 유전자 검사 서비스 제공 서버(300)는, 이미 검사가 진행된 타겟 유전자 마커의 검사 마커 리스트 내의 삭제 여부를 결정하고, 검사가 진행되지 않았던 임의의 유전자 마커, 즉 후보 유전자 마커의 추가 여부를 결정하여 검사 마커 리스트 내에 추가하는 서버일 수 있다.
여기서, 유전자 검사 서비스 제공 서버(300)는, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다.
적어도 하나의 다른 피검자 단말(400)은, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 유전자 검사를 요청하는 다른 피검자의 단말일 수 있다. 이때, 피검자는 동일국가, 민족, 및 인종으로 그룹지어지는 집단 내에서 최초로 유전자 검사를 한 자(1st)로 정의하고, 다른 피검자는, 피검자와 동일한 집단으로 분류되면서, 피검자보다 늦게 검사를 한 자(2nd,....,nth)로 정의한다. 다른 피검자 단말(400)도 피검자 단말(100)과 같이 동일하게 유전자 검사를 신청한 단말이지만, 그 순서에 따라, 기준점을 가지는 자가 누구인지에 따라, 집단으로 나뉘어지기 전인지, 후인지에 따라 객체가 나뉘어지는 것이므로, 피검자 단말(100)에서 실행되는 모든 동작이 가능한 것은 자명하다 할 것이다.
여기서, 적어도 하나의 다른 피검자 단말(400)은, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다. 이때, 적어도 하나의 다른 피검자 단말(400)은, 네트워크를 통해 원격지의 서버나 단말에 접속할 수 있는 단말로 구현될 수 있다. 적어도 하나의 다른 피검자 단말(400)은, 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 네비게이션, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(smartphone), 스마트 패드(smartpad), 타블렛 PC(Tablet PC) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.
도 2는 도 1의 시스템에 포함된 유전자 검사 서비스 제공 서버를 설명하기 위한 블록 구성도이고, 도 3 및 도 4는 본 발명의 일 실시예에 따른 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스가 구현된 일 실시예를 설명하기 위한 도면이다.
도 2를 참조하면, 유전자 검사 서비스 제공 서버(300)는, 수신부(310), 추출부(320), 비교부(33), 전송부(340), 업데이트부(350)를 포함할 수 있다.
본 발명의 일 실시예에 따른 유전자 검사 서비스 제공 서버(300)나 연동되어 동작하는 다른 서버(미도시)가 적어도 하나의 피검자 단말(100), 및 적어도 하나의 다른 피검자 단말(400)로 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 전송하는 경우, 적어도 하나의 피검자 단말(100), 및 적어도 하나의 다른 피검자 단말(400)은, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 설치하거나 열 수 있다. 또한, 웹 브라우저에서 실행되는 스크립트를 이용하여 서비스 프로그램이 적어도 하나의 피검자 단말(100), 및 적어도 하나의 다른 피검자 단말(400)에서 구동될 수도 있다. 여기서, 웹 브라우저는 웹(WWW: world wide web) 서비스를 이용할 수 있게 하는 프로그램으로 HTML(hyper text mark-up language)로 서술된 하이퍼 텍스트를 받아서 보여주는 프로그램을 의미하며, 예를 들어 넷스케이프(Netscape), 익스플로러(Explorer), 크롬(chrome) 등을 포함한다. 또한, 애플리케이션은 단말 상의 응용 프로그램(application)을 의미하며, 예를 들어, 모바일 단말(스마트폰)에서 실행되는 앱(app)을 포함한다.
도 2를 참조하면, 수신부(310)는, 피검자 단말(100)로부터 국가, 민족, 및 인종을 포함한 피검자 그룹의 정보와, 유전자 검사 요청 이벤트를 수신할 수 있다. 이때, 그룹(집단)은, 상술한 국가, 민족, 및 인종으로 나뉘어질 수도 있지만, 다른 특질에 의해 나뉘어지거나 분류 및 그룹핑되는 것을 배제하지는 않는다.
추출부(320)는, 국가, 민족, 및 인종에 대응하는 기 저장된 대조군 그룹의 대조군 유전형 정보를 추출할 수 있다. 예를 들어, 피검자가 한국인, 아시아인이라고 하면, 피검자와 동일하게 한국인이면서 아시아인인 유전형 정보를 추출해야, 피검자와 비교를 할 수 있다. 이를, 대조군이라고 하는데, 유전형 정보를 비교하는 것이므로, 대조군 유전형 정보로 정의한다. 또한, 유전형 정보는, 유전체(Genome) 서열 해독(Sequencing)으로 생성될 수 있다. 그리고, 피검자의 DNA 시료는, 혈액, 타액, 구강상피세포 등으로부터 채취한 시료이며, 이 DNA 시료로부터 DNA를 추출하고, 전장유전체해독 및 DNA 칩(Chip) 방식으로 유전형 정보를 생산할 수 있다. 해독 및 유전형 생산 방식은 상용화된 다양한 플랫폼이 이용될 수 있으며, 어느 하나의 실험방법이나 플랫폼으로 한정하지는 않는다. 이에 따라, 대조군 유전형 정보와, 피검자 유전형 정보는 상술한 방법에 의해 생성되며 비교될 수 있다.
여기서, 대조군 유전형 정보는, 연구 결과가 존재하는 경우와 존재하지 않는 경우로 나뉘어 추출될 수 있다. 전자의 경우, i) 피검자와 동일한 집단(그룹)이고, ii) 피검자와 동일한 집단의 연구 결과가 존재하는 질병 및 신체적 특성과, 유전자 마커 간의 관계를, 대조군 유전형 정보로 추출한다. 이때, 질병 및 신체적 특성과 유의한 연관성을 보이지 않는 유전형 정보, 즉 유전자 다형성 위치(좌위)도 함께 수집할 수 있다. 후자의 경우, 본 출원인의 기 출원 등록특허인 한국등록특허 제10-2023464호(2019년09월20일 공고)를 이용할 수 있다. 연구 결과가 없는 경우, 역사, 지리, 유전적 정보 등을 이용하여 근연 그룹을 지정할 수 있으며, 가상의 유전형 정보를 생성하는 경우 상술한 방법 이외에도 다양한 방법이 이용될 수 있다. 정리하면, 후자의 경우, 추출부(320)는, 국가, 민족, 및 인종에 대응하는 기 저장된 대조군 그룹의 대조군 유전형 정보를 추출할 때, 국가, 민족, 및 인종에 대응하는 기 저장된 대조군 그룹이 존재하지 않는 경우, 국가, 민족, 및 인종에 대응하는 가상 대조군 그룹을 지정하여 생성하여 대조군 유전형 정보를 추출할 수 있다.
비교부(330)는, 기 설정된 질병 및 신체적 특성에 대하여, 피검자로부터 추출된 DNA 시료로부터 생산된 피검자 유전형 정보와, 대조군 그룹의 대조군 유전형 정보를 기 설정된 유전자 마커를 기준으로 비교할 수 있다. 이때, 피검자 유전형 정보는, 기 설정된 유전자 마커를 기준으로 유전자 검사에 포함된 위치에 대응하는 타겟 유전자 마커와, 유전자 검사에 포함되지 않은 위치에 대응하는 후보 유전자 마커를 포함할 수 있다 예를 들어, 기 설정된 유전자 마커(Genetic Marker)는, 이미 발표된 연구결과나 누적된 연구결과로 인하여 밝혀진 정보인데, DNA서열로 사람 또는 동물에게서 염색체의 알려진 위치를 확인할 수 있는 것이다. 유전자 마커는, 짧은 DNA서열로, 예를 들어 하나의 염기의 변화로 생긴 단일 염기 다형성(SNP) 같은 것들이 존재할 수 있다. 이때, A 유전자 마커가 B 질병과 연관이 있다고 연구결과가 나온 경우, 피검자의 A 유전자 마커와, 대조군의 A 유전자 마커를 비교하고, 두 개의 유전자 마커가 동일한 경우, 피검자에게 B 질병의 가능성이 존재한다는 예측을 할 수 있다.
문제는, 연구결과가 밝혀지지 않은 유전자 마커, 즉 연구결과도 존재하지 않고, 검사 마커 리스트에 존재하지 않는 유전자 마커는, 질병 또는 신체적 특성과 연관이 있을 수도 있지만, 아직 연구결과가 없기 때문에 이용할 수 없다는 것이다. 이를 위하여, 밝혀지지 않은 유전자 마커, 즉 타겟 유전자 마커가 아닌 임의의 유전자 마커(이하, 후보 유전자 마커라 칭함)와, 질병 및 신체적 특성과 연관도를 측정하고, 측정된 연관도가 기 설정된 기준값 이상이면, 검사 마커 리스트에 포함시켜, 질병 및 신체적 특성을 밝히는 표지(Marker)로 이용하도록 한다. 예를 들어, A,B,C,D가 타겟 유전자 마커이고, A는 결핵, B는 비만, C는 혈압, D는 콜레스테롤을 확인하기 위해 이용되고 있으며, E 내지 Z가 미지의 영역이라면, E 내지 Z까지가 후보 유전자 마커이다. 이때, E가, 연관도 산출로 비만을 알아내는 유전자 마커가 될 수 있는 경우, 비만을 알아내기 위한 유전자 표지는, B-E가 가능하고, B-E-비만과 같이 매핑되어 저장될 수 있으며, 비만의 검사 마커 리스트는 B에서 B-E로 업데이트될 수 있다. 이때, 질병 특성은, 중성지방 농도, 콜레스테롤, 혈당, 혈압, 비타민 C 농도, 카페인 대사를 포함하고, 신체적 특성은, 체질량 지수, 색소 침착, 탈모, 모발 굵기, 피부노화(당화작용), 피부탄력을 포함할 수 있지만, 이에 한정되지는 않는다.
또 하나의 문제는, 이미 밝혀진 유전자 마커라도 샘플링 오류 등으로 에러가 존재하는 경우이다. 이때에는, A 유전자 마커 - B 질병이라는 연관도를 없애야 하는데, 이때 A 유전자 마커를 B 질병을 검사하는데 기 설정된 검사 마커 리스트에서 제외해야 한다. 이를 위하여, 이미 밝혀진 유전자 마커, 즉 타겟 유전자 마커를 삭제하는 방향으로 검사 마커 리스트가 업데이트되어야 한다. 이에 따라, 이미 연구결과가 존재하고, 검사를 했던 타겟 유전자 마커도, 질병 및 신체적 특성 간의 연관도를 재계산하여 검사 마커 리스트를 업데이트할 수 있다. 상술한 두 가지 문제에 대한 업데이트 과정은, 피검자와 동일한 그룹(집단)에 속할 다른 피검자의 유전자 검사 정보가 누적되어야 가능하다. 예를 들어, 100 명 정도가 모여야 하는데, 피검자는 1 번째 사람이므로, 이후 99 명이 더 모여 결과가 누적된 후 수행가능하다. 물론, 100 명이라는 숫자는 임의로 설정된 것이므로 이에 한정되지는 않는다. 또, 상술한 업데이트 과정은 후술될 업데이트부(350)를 통하여 다시 한번 정리하기로 한다.
한편, 비교부(330)는, 기 설정된 질병 및 신체적 특성에 대하여, 피검자로부터 추출된 DNA 시료로부터 생산된 피검자 유전형 정보와, 대조군 그룹의 대조군 유전형 정보를 기 설정된 유전자 마커를 기준으로 비교할 때, 전장유전체 연관분석(Genome-Wide Association Study)를 이용하여 산출된 연관도에 기초하여 비교할 수 있다.
전송부(340)는, 대조군 유전형 정보가 기 설정된 유전자 마커를 기준으로 피검자 유전형 정보에 존재하는 경우, 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 피검자 단말(100)로 전송할 수 있다. 전송부(340)는, 대조군 유전형 정보가 기 설정된 유전자 마커를 기준으로 피검자 유전형 정보에 존재하는 경우, 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 피검자 단말(100)로 전송할 때, 보고서를 생성할 때 스코어링 알고리즘(Polygenic Risk Score)을 이용할 수 있다.
이하에서, 업데이트부(350)의 업데이트 과정을 4 가지로 나누어 설명하기로 한다. 첫 번째는, 검사 마커 리스트에 존재하는 타겟 유전자 마커를 검증하는 과정이고, 두 번째는, 검사 마커 리스트에 존재하는 타겟 유전자 마커의 연관도가 기준값보다 낮은 경우, 검사 마커 리스트로부터 탈락(삭제)시키는 과정이다. 세 번째는, 검사 마커 리스트에 존재하지 않는 후보 유전자 마커를 검증하여 검사 마커 리스트에 포함시키고 타겟 유전자 마커로 업데이트하는 과정이고, 네 번째는, 검사 마커 리스트에 존재하지 않는 후보 유전자 마커를 검증한 결과 연관도가 기준값을 충족하지 못하여 후보 유전자 마커로 잔류시키는 과정이다(검사 마커 리스트 업데이트 없음).
첫 번째의 경우, 업데이트부(350)는, 전송부(340)에서 대조군 유전형 정보가 기 설정된 유전자 마커를 기준으로 피검자 유전형 정보에 존재하는 경우, 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 피검자 단말(100)로 전송한 후, 피검자 그룹에 속하는 적어도 하나의 다른 피검자의 다른 피검자 유전형 정보가 기 설정된 수 이상 누적되고, 다른 피검자 유전형 정보 내의 타겟 유전자 마커와 기 설정된 질병 및 신체적 특성 간의 연관도가 기 설정된 기준값을 초과한 경우, 다른 피검자 유전형 정보 내의 타겟 유전자 마커를 기 설정된 유전자 마커로 추가하여 검사 마커 리스트를 업데이트할 수 있다.
두 번째의 경우, 업데이트부(350)는, 전송부(340)에서 대조군 유전형 정보가 기 설정된 유전자 마커를 기준으로 피검자 유전형 정보에 존재하는 경우, 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 피검자 단말(100)로 전송한 후, 피검자 그룹에 속하는 적어도 하나의 다른 피검자의 다른 피검자 유전형 정보가 기 설정된 수 이상 누적되고, 다른 피검자 유전형 정보 내의 타겟 유전자 마커와 기 설정된 질병 및 신체적 특성 간의 연관도가 기 설정된 기준값 미만인 경우, 다른 피검자 유전형 정보 내의 타겟 유전자 마커를 기 설정된 유전자 마커에서 삭제하여 검사 마커 리스트를 업데이트할 수 있다.
세 번째의 경우, 업데이트부(350)는, 전송부(340)에서 대조군 유전형 정보가 기 설정된 유전자 마커를 기준으로 피검자 유전형 정보에 존재하는 경우, 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 피검자 단말(100)로 전송한 후, 피검자 그룹에 속하는 적어도 하나의 다른 피검자의 다른 피검자 유전형 정보가 기 설정된 수 이상 누적되고, 다른 피검자 유전형 정보 내의 후보 유전자 마커와 기 설정된 질병 및 신체적 특성 간의 연관도가 기 설정된 기준값을 초과한 경우, 다른 피검자 유전형 정보 내의 후보 유전자 마커를 기 설정된 유전자 마커로 추가하여 검사 마커 리스트를 업데이트할 수 있다. 이렇게 후보 유전자 마커(연구에서 밝혀지지 않은 미지의 영역)가 검사 마커 리스트에 포함되는 경우, 이를 타겟 유전자 마커로 재정의할 수 있다. 이제, 밝혀지지 않은 미지의 유전자 마커가 아니라, 질병 및 신체적 특성을 파악할 수 있는 유전자 마커로 확인되었기 때문이다.
네 번째의 경우, 업데이트부(350)는, 전송부(340)에서 대조군 유전형 정보가 기 설정된 유전자 마커를 기준으로 피검자 유전형 정보에 존재하는 경우, 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 피검자 단말(100)로 전송한 후, 피검자 그룹에 속하는 적어도 하나의 다른 피검자의 다른 피검자 유전형 정보가 기 설정된 수 이상 누적되고, 다른 피검자 유전형 정보 내의 후보 유전자 마커와 기 설정된 질병 및 신체적 특성 간의 연관도가 기 설정된 기준값 미만인 경우, 다른 피검자 유전형 정보 내의 후보 유전자 마커를 후보 유전자 마커로 유지시킬 수 있다. 즉, 후보 유전자 마커를 검사 마커 리스트에 포함시키지 않고, 그대로 잔류시켜 유지시키는 것이다.
상술한 4 가지 단계에서 연관도를 파악하기 위한 방법은, 교차비(Odd Ratio) 또는 베타 계수(Beta Coefficient)에 의해 산출될 수 있으나, 상술한 방법에 한정하지는 않는다. 물론, 전장유전체 연관분석(Genome-Wide Association Study)도 가능하며, 다양한 실시예에 따른 연관분석 방법을 이용할 수 있다.
이하, 상술한 도 2의 유전자 검사 서비스 제공 서버의 구성에 따른 동작 과정을 도 3 및 도 4를 예로 들어 상세히 설명하기로 한다. 다만, 실시예는 본 발명의 다양한 실시예 중 어느 하나일 뿐, 이에 한정되지 않음은 자명하다 할 것이다.
도 3 및 도 4를 참조하면, (a) 유전자 검사 서비스 제공 서버(300)는, 국가, 민족, 및 인종에 대한 유전형 정보, 유전자 마커, 및 질병과 신체적 특성을 매핑하여 저장 및 분류하는 방식으로 데이터베이스화를 진행할 수 있다. 이때, (b) 유전자 검사 서비스 제공 서버(300)는, 피검자 단말(100)로부터 검사 요청이 수신되는 경우, 피검자 유전형 정보와, 대조군 유전형 정보를 비교하면서 피검자가 어떠한 질병이 있는지, 어떠한 신체적 특성을 가지고 있는지, 또는 그럴 가능성이 존재하는지 등의 데이터를 생성하여 피검자 단말(100)로 전송한다.
이때, (c) 피검자와 동일한 집단(그룹)의 다른 피검자의 유전자 검사 결과가 누적되는 경우, 이를 수집하여 (d)와 같이 유전자 마커를 분류하고, 유전자 마커로 이루어진 검사 마커 리스트를 업데이트할 수 있다. 상술한 과정은 도 4에 상세히 도시된다. 이때, 검사 마커 리스트는, 각 질병 및 신체적 특성을 구분할 수 있는 각각의 유전자 마커의 리스트일 수 있으며, 국가, 인종, 및 민족별로 구분될 수도 있다. 이때, 업데이트 방법은 상술한 바와 같으므로 중복하여 설명하지는 않는다.
이와 같은 도 2, 도 3 및 도 4의 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법에 대해서 설명되지 아니한 사항은 앞서 도 1을 통해 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법에 대하여 설명된 내용과 동일하거나 설명된 내용으로부터 용이하게 유추 가능하므로 이하 설명을 생략하도록 한다.
도 5는 본 발명의 일 실시예에 따른 도 1의 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 시스템에 포함된 각 구성들 상호 간에 데이터가 송수신되는 과정을 나타낸 도면이다. 이하, 도 5를 통해 각 구성들 상호간에 데이터가 송수신되는 과정의 일 예를 설명할 것이나, 이와 같은 실시예로 본원이 한정 해석되는 것은 아니며, 앞서 설명한 다양한 실시예들에 따라 도 5에 도시된 데이터가 송수신되는 과정이 변경될 수 있음은 기술분야에 속하는 당업자에게 자명하다.
도 5를 참조하면, 유전자 검사 서비스 제공 서버(300)는, 국가, 민족, 및 인종별 유전형 정보 및 유전자 마커와, 질병 및 신체적 특성 정보를 데이터베이스화함으로써, 이후 피검자의 DNA 시료로부터 생성된 피검자 유전형 정보와 비교할 대상을 구축한다(S4100).
그리고 나서, 유전자 검사 서비스 제공 서버(300)는, 피검자 단말(100)로부터 검사 요청이 수신되는 경우, DNA 시료로부터 피검자 유전형 정보를 생성하고(S4300), 피검자 유전형 정보와 대조군 유전형 정보를 비교하는데(S4400), 유전자 마커를 기준으로 비교 후, 동일한 유전자 마커가 양 유전형 정보에 포함된 경우 해당 질병 및 신체적 특성을 가졌다는 보고서를 생성하고(S4500), 피검자 단말(100)로 전송하게 된다. S4500 단계까지의 유전자 마커는, 타겟 유전자 마커이다.
한편, 유전자 검사 서비스 제공 서버(300)는, 피검자와 동일한 집단(그룹) 내에 포함된 다른 피검자의 검사결과가 기 설정된 수 이상 누적되면(S4700, S4800), 타겟 유전자 마커와 후보 유전자 마커를 이용하여, 질병 및 신체적 특징과의 연관도가 있는지를 확인하고(S4900), 연관도에 따라 검사 마커 리스트를 갱신한다(S4920).
상술한 단계들(S4100~S4920)간의 순서는 예시일 뿐, 이에 한정되지 않는다. 즉, 상술한 단계들(S4100~S4920)간의 순서는 상호 변동될 수 있으며, 이중 일부 단계들은 동시에 실행되거나 삭제될 수도 있다.
이와 같은 도 5의 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법에 대해서 설명되지 아니한 사항은 앞서 도 1 내지 도 4를 통해 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법에 대하여 설명된 내용과 동일하거나 설명된 내용으로부터 용이하게 유추 가능하므로 이하 설명을 생략하도록 한다.
도 6은 본 발명의 일 실시예에 따른 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법을 설명하기 위한 동작 흐름도이다. 도 6을 참조하면, 유전자 검사 서비스 제공 서버는, 피검자 단말로부터 국가, 민족, 및 인종을 포함한 피검자 그룹의 정보와, 유전자 검사 요청 이벤트를 수신한다(S5100)
그리고, 유전자 검사 서비스 제공 서버는, 국가, 민족, 및 인종에 대응하는 기 저장된 대조군 그룹의 대조군 유전형 정보를 추출한다(S5200).
또, 유전자 검사 서비스 제공 서버는, 기 설정된 질병 및 신체적 특성에 대하여, 피검자로부터 추출된 DNA 시료로부터 생산된 피검자 유전형 정보와, 대조군 그룹의 대조군 유전형 정보를 기 설정된 유전자 마커를 기준으로 비교하고(S5300), 대조군 유전형 정보가 기 설정된 유전자 마커를 기준으로 피검자 유전형 정보에 존재하는 경우, 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 피검자 단말로 전송한다(S5400).
이와 같은 도 6의 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법에 대해서 설명되지 아니한 사항은 앞서 도 1 내지 도 5를 통해 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법에 대하여 설명된 내용과 동일하거나 설명된 내용으로부터 용이하게 유추 가능하므로 이하 설명을 생략하도록 한다.
도 6을 통해 설명된 일 실시예에 따른 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법은, 컴퓨터에 의해 실행되는 애플리케이션이나 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
전술한 본 발명의 일 실시예에 따른 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법은, 단말기에 기본적으로 설치된 애플리케이션(이는 단말기에 기본적으로 탑재된 플랫폼이나 운영체제 등에 포함된 프로그램을 포함할 수 있음)에 의해 실행될 수 있고, 사용자가 애플리케이션 스토어 서버, 애플리케이션 또는 해당 서비스와 관련된 웹 서버 등의 애플리케이션 제공 서버를 통해 마스터 단말기에 직접 설치한 애플리케이션(즉, 프로그램)에 의해 실행될 수도 있다. 이러한 의미에서, 전술한 본 발명의 일 실시예에 따른 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법은 단말기에 기본적으로 설치되거나 사용자에 의해 직접 설치된 애플리케이션(즉, 프로그램)으로 구현되고 단말기에 등의 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
Claims (11)
- 유전자 검사 서비스 제공 서버에서 실행되는 유전자 검사 서비스 제공 방법에 있어서,피검자 단말로부터 국가, 민족, 및 인종을 포함한 피검자 그룹의 정보와, 유전자 검사 요청 이벤트를 수신하는 단계;상기 국가, 민족, 및 인종에 대응하는 기 저장된 대조군 그룹의 대조군 유전형 정보를 추출하는 단계;기 설정된 질병 및 신체적 특성에 대하여, 상기 피검자로부터 추출된 DNA 시료로부터 생산된 피검자 유전형 정보와, 상기 대조군 그룹의 대조군 유전형 정보를 기 설정된 유전자 마커를 기준으로 비교하는 단계; 및상기 대조군 유전형 정보가 상기 기 설정된 유전자 마커를 기준으로 상기 피검자 유전형 정보에 존재하는 경우, 상기 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 상기 피검자 단말로 전송하는 단계;를 포함하는 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법.
- 제 1 항에 있어서,상기 피검자 유전형 정보는,상기 기 설정된 유전자 마커를 기준으로 유전자 검사에 포함된 위치에 대응하는 타겟 유전자 마커와, 상기 유전자 검사에 포함되지 않은 위치에 대응하는 후보 유전자 마커를 포함하는 것인, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법.
- 제 2 항에 있어서,상기 대조군 유전형 정보가 상기 기 설정된 유전자 마커를 기준으로 상기 피검자 유전형 정보에 존재하는 경우, 상기 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 상기 피검자 단말로 전송하는 단계 이후에,상기 피검자 그룹에 속하는 적어도 하나의 다른 피검자의 다른 피검자 유전형 정보가 기 설정된 수 이상 누적되고, 상기 다른 피검자 유전형 정보 내의 타겟 유전자 마커와 상기 기 설정된 질병 및 신체적 특성 간의 연관도가 기 설정된 기준값을 초과한 경우, 상기 다른 피검자 유전형 정보 내의 타겟 유전자 마커를 상기 기 설정된 유전자 마커로 추가하여 검사 마커 리스트를 업데이트하는 단계;를 더 포함하는 것인, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법.
- 제 2 항에 있어서,상기 대조군 유전형 정보가 상기 기 설정된 유전자 마커를 기준으로 상기 피검자 유전형 정보에 존재하는 경우, 상기 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 상기 피검자 단말로 전송하는 단계 이후에,상기 피검자 그룹에 속하는 적어도 하나의 다른 피검자의 다른 피검자 유전형 정보가 기 설정된 수 이상 누적되고, 상기 다른 피검자 유전형 정보 내의 타겟 유전자 마커와 상기 기 설정된 질병 및 신체적 특성 간의 연관도가 기 설정된 기준값 미만인 경우, 상기 다른 피검자 유전형 정보 내의 타겟 유전자 마커를 상기 기 설정된 유전자 마커에서 삭제하여 검사 마커 리스트를 업데이트하는 단계;를 더 포함하는 것인, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법.
- 제 2 항에 있어서,상기 대조군 유전형 정보가 상기 기 설정된 유전자 마커를 기준으로 상기 피검자 유전형 정보에 존재하는 경우, 상기 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 상기 피검자 단말로 전송하는 단계 이후에,상기 피검자 그룹에 속하는 적어도 하나의 다른 피검자의 다른 피검자 유전형 정보가 기 설정된 수 이상 누적되고, 상기 다른 피검자 유전형 정보 내의 후보 유전자 마커와 상기 기 설정된 질병 및 신체적 특성 간의 연관도가 기 설정된 기준값을 초과한 경우, 상기 다른 피검자 유전형 정보 내의 후보 유전자 마커를 상기 기 설정된 유전자 마커로 추가하여 검사 마커 리스트를 업데이트하는 단계;를 더 포함하는 것인, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법.
- 제 2 항에 있어서,상기 대조군 유전형 정보가 상기 기 설정된 유전자 마커를 기준으로 상기 피검자 유전형 정보에 존재하는 경우, 상기 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 상기 피검자 단말로 전송하는 단계 이후에,상기 피검자 그룹에 속하는 적어도 하나의 다른 피검자의 다른 피검자 유전형 정보가 기 설정된 수 이상 누적되고, 상기 다른 피검자 유전형 정보 내의 후보 유전자 마커와 상기 기 설정된 질병 및 신체적 특성 간의 연관도가 기 설정된 기준값 미만인 경우, 상기 다른 피검자 유전형 정보 내의 후보 유전자 마커를 후보 유전자 마커로 유지시키는 단계;를 더 포함하는 것인, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법.
- 제 1 항에 있어서,상기 기 설정된 질병 및 신체적 특성에 대하여, 상기 피검자로부터 추출된 DNA 시료로부터 생산된 피검자 유전형 정보와, 상기 대조군 그룹의 대조군 유전형 정보를 기 설정된 유전자 마커를 기준으로 비교하는 단계에서,전장유전체 연관분석(Genome-Wide Association Study)를 이용하여 산출된 연관도에 기초하여 비교하는 것인, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법.
- 제 3 항 내지 제 6 항 중 어느 한 항에 있어서,상기 연관도는, 교차비(Odd Ratio) 또는 베타 계수(Beta Coefficient)에 의해 산출되는 것인, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법.
- 제 1 항에 있어서,상기 국가, 민족, 및 인종에 대응하는 기 저장된 대조군 그룹의 대조군 유전형 정보를 추출하는 단계에서,상기 국가, 민족, 및 인종에 대응하는 기 저장된 대조군 그룹이 존재하지 않는 경우, 상기 국가, 민족, 및 인종에 대응하는 가상 대조군 그룹을 지정하여 생성하여 상기 대조군 유전형 정보를 추출하는 것인, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법.
- 제 1 항에 있어서,상기 대조군 유전형 정보가 상기 기 설정된 유전자 마커를 기준으로 상기 피검자 유전형 정보에 존재하는 경우, 상기 기 설정된 질병 및 신체적 특성이 존재한다고 판단하고 보고서를 생성하여 상기 피검자 단말로 전송하는 단계에서,상기 보고서를 생성할 때 스코어링 알고리즘(Polygenic Risk Score)을 이용하는 것인, 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법.
- 제 1 항 내지 제 7 항, 제 9 항, 및 제 10 항 중 어느 한 항의 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 판독가능한 기록매체.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2020-0001984 | 2020-01-07 | ||
KR1020200001984A KR102138166B1 (ko) | 2020-01-07 | 2020-01-07 | 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2021141312A1 true WO2021141312A1 (ko) | 2021-07-15 |
Family
ID=71893831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2020/019242 WO2021141312A1 (ko) | 2020-01-07 | 2020-12-28 | 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR102138166B1 (ko) |
WO (1) | WO2021141312A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102138166B1 (ko) * | 2020-01-07 | 2020-07-27 | 주식회사 클리노믹스 | 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017116139A1 (ko) * | 2015-12-28 | 2017-07-06 | (주)신테카바이오 | 개인 유전체의 유전변이정보를 이용한 생리활성변이 분석 시스템 |
US20180018590A1 (en) * | 2016-07-18 | 2018-01-18 | NantOmics, Inc. | Distributed Machine Learning Systems, Apparatus, and Methods |
KR101937434B1 (ko) * | 2017-09-25 | 2019-01-10 | 천자혜 | 빅데이터 및 인공지능 기반 공공 주치의 서비스 제공 방법 |
KR102138166B1 (ko) * | 2020-01-07 | 2020-07-27 | 주식회사 클리노믹스 | 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법 |
-
2020
- 2020-01-07 KR KR1020200001984A patent/KR102138166B1/ko active IP Right Grant
- 2020-12-28 WO PCT/KR2020/019242 patent/WO2021141312A1/ko active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017116139A1 (ko) * | 2015-12-28 | 2017-07-06 | (주)신테카바이오 | 개인 유전체의 유전변이정보를 이용한 생리활성변이 분석 시스템 |
US20180018590A1 (en) * | 2016-07-18 | 2018-01-18 | NantOmics, Inc. | Distributed Machine Learning Systems, Apparatus, and Methods |
KR101937434B1 (ko) * | 2017-09-25 | 2019-01-10 | 천자혜 | 빅데이터 및 인공지능 기반 공공 주치의 서비스 제공 방법 |
KR102138166B1 (ko) * | 2020-01-07 | 2020-07-27 | 주식회사 클리노믹스 | 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법 |
Non-Patent Citations (2)
Title |
---|
CARAMEL QUIN: "If you’re comfortable sharing your genetic history, a small drop of saliva sent away in the post can reveal a lot about your ancestral background", 18 November 2019 (2019-11-18), pages 1 - 4, XP055827517, Retrieved from the Internet <URL:https://eandt.theiet.org/content/articles/2019/11/hands-on-review-ancestrydna-test-kit/> * |
TAO HUANG, YANG SHU , YU-DONG CAI: "Genetic differences among ethnic groups", BMC GENOMICS, vol. 16, no. 1, 1093, 21 December 2015 (2015-12-21), pages 1 - 10, XP055700079, DOI: 10.1186/s12864-015-2328-0 * |
Also Published As
Publication number | Publication date |
---|---|
KR102138166B1 (ko) | 2020-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Monson | The mtDNA Population Database: An Integrated Software and Database Resource for Forensic Comparison by Monson, Miller, Wilson, DiZinno, and Budowle (Forensic Science Communications, April 2002) | |
CN109524069B (zh) | 医疗数据处理方法、装置、电子设备和存储介质 | |
Bassett et al. | Linkage to care following community‐based mobile HIV testing compared with clinic‐based testing in U mlazi T ownship, D urban, S outh A frica | |
Warnow | Mathematical approaches to comparative linguistics | |
US11901040B2 (en) | Cross-network genomic data user interface | |
Fedoruk | Virtual drug testing: redefining sample collection in a global pandemic | |
Schendel et al. | The International Collaboration for Autism Registry Epidemiology (iCARE): multinational registry-based investigations of autism risk factors and trends | |
WO2021141312A1 (ko) | 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법 | |
Griffin et al. | A Metadata description of the data in" A metabolomic comparison of urinary changes in type 2 diabetes in mouse, rat, and human." | |
WO2016204535A1 (ko) | 의료 검사를 위한 이미지 분석 관리 방법 및 서버 | |
US20200134136A1 (en) | Cross-network genomic data user interface | |
McFadden et al. | Prevalence and spatial distribution of cattle herds infected with Theileria orientalis in New Zealand between 2012 and 2013 | |
CN113628751A (zh) | 胃癌预后预测方法、装置及电子设备 | |
Maichomo et al. | Assessment of the Rose-Bengal plate test for the diagnosis of human brucellosis in health facilities in Narok district, Kenya. | |
Wambua | African perceptions and myths about menopause. | |
WO2021194227A1 (ko) | 이종생물 유래의 유전자 마커 매칭에 기반한 하나 혹은 그 이상의 모델생물의 유전자 마커와 그 패턴 정보를 목표하는 생물의 유전자 마커 정보로 이용하는 유전자 검사 서비스 제공 방법 | |
KR20220075594A (ko) | 인공지능 기반 자기개선 게놈 시퀀싱을 통한 유전자 진단 시스템 | |
WO2021066523A1 (ko) | 정신건강 평가 시스템 및 그 방법 | |
KR20080013484A (ko) | 디엔에이 분석이 가능한 이동통신 단말기 및 그 단말기를이용한 디엔에이 응용 서비스 시스템 및 그 방법 | |
Cheng et al. | Mass testing to support sustained containment of COVID-19 | |
Shimada et al. | Relationship between lifestyle activities and physical functions in elderly persons utilizing care facilities | |
Rossi et al. | Surveillance of SARS-CoV-2 in Urban Wastewater in Italy | |
Singh-Carlson et al. | Name recognition to identify patients of South Asian ethnicity within the cancer registry | |
WO2014168333A1 (ko) | 집단지성을 이용한 번역 컨텐츠공유 시스템 | |
WO2021107410A1 (ko) | 동시통역을 이용한 의료 상담 채팅 서비스 제공 방법, 그를 수행하기 위한 서버 및 컴퓨터 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 20912070 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 20912070 Country of ref document: EP Kind code of ref document: A1 |