KR101961438B1 - Data providing apparatus, and method - Google Patents
Data providing apparatus, and method Download PDFInfo
- Publication number
- KR101961438B1 KR101961438B1 KR1020180069060A KR20180069060A KR101961438B1 KR 101961438 B1 KR101961438 B1 KR 101961438B1 KR 1020180069060 A KR1020180069060 A KR 1020180069060A KR 20180069060 A KR20180069060 A KR 20180069060A KR 101961438 B1 KR101961438 B1 KR 101961438B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- biological
- pathological
- gene
- user
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
Abstract
본 발명에 따른 질병 기전 연구를 위한 데이터 제공 장치, 방법, 데이터 제공 방법을 실행하기 위한 프로그램이 기록되어 있는 컴퓨터 판독가능한 기록매체에 따르면, 대상체로부터 직접 추출해야 하는 생체 세포로부터 영구적으로 사용될 수 있고, 사용에 따라서 훼손되지 않는 전자적 데이터를 획득하고, 상기 획득된 생체 세포에 대한 전자적 데이터를 적정한 가격으로 거래될 수 있도록 할 수 있다.According to the present invention, there is provided a data providing apparatus, method, and data providing method for studying a disease mechanism, and a computer readable recording medium on which a program for executing the data providing method is recorded. The computer readable recording medium can be permanently used from biomedical cells, Electronic data that is not damaged according to use can be acquired and electronic data of the obtained biomolecules can be traded at an appropriate price.
Description
본 발명은 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 방법에 관한 것이다.The present invention relates to a data providing apparatus and method for providing biological data for disease mechanism research.
인체 종양 조직은 유전체, 전사체, 단백질체, 대사체 등과 같은 여러 가지 연구 방법들을 이용하여, 암의 발생 원인을 찾고, 암 진단의 정확도를 높이기 위해서, 그리고 암의 치료 효과를 증진하기 위해 연구되고 있다. 특히, 암 환자의 암 조직을 통해 암에 대한 연구를 하고 있다. 조직 세포의 연구를 위해서, 국내외적으로 이미 많은 병원 및 연구소에서 조직 은행 시스템을 갖추고, 환자 조직을 관리하고 있다. Human tumor tissues have been studied using various research methods such as dielectrics, transcripts, protein bodies, metabolites, etc. to find the cause of cancer, to increase the accuracy of cancer diagnosis, and to improve the therapeutic effect of cancer . In particular, we are studying cancer through cancer tissue in cancer patients. For the study of tissue cells, we already have a tissue banking system in many hospitals and laboratories both domestically and externally, and manage patient organizations.
조직을 액체 질소 혹은 냉동 상태로 보관해야 하기 때문에 매년 많은 비용이 필요한 문제가 있었다. Because the tissue must be kept in liquid nitrogen or frozen, there was a problem that cost a lot each year.
또한, 암을 연구하는 연구자는 본인의 연구를 위해서, 필요한 조직을 구매하고, 선행적으로 DNA/RNA/단백질/대사산물과 같은 파생물들을 추출하는 과정을 거쳐야 한며, 최근 암연구를 위해 대용량 염기서열 분석법(NGS)가 많이 활용되어, 암 또는 정상조직의 DNA/RNA 염기서열 분석이 많이 이루어 지고 있다.In addition, researchers studying cancer must go through the process of purchasing the necessary tissues and extracting derivatives such as DNA / RNA / protein / metabolites in advance for their own research. In recent years, Analysis method (NGS) is widely used, and DNA / RNA base sequence analysis of cancer or normal tissue is performed.
그러나, 조직 세포는 액체 질소 또는 냉동 상태로 보관해야 하기 때문에 많은 보관 비용이 필요하고, 하나의 조직 세포에 대한 DNA/RNA/단백질/대사산물과 같은 파생물들을 추출하는 과정은 역시 많은 시간과 많은 비용을 필요로 하는 문제가 있었다. However, because tissue cells must be kept in liquid nitrogen or frozen state, they require a lot of storage costs and the process of extracting derivatives such as DNA / RNA / protein / metabolites on one tissue cell is also time consuming and costly There is a problem that it is necessary.
게다가, 인체 종양 조직으로부터 다양한 파생물(DNA, RNA, Protein 등)을 추출하는 과정에 오류가 있을 경우, 추출된 파생물에 대한 정보를 신뢰할 수 없을 뿐만 아니라, 파생물이 인체 종양 조직으로부터 잘못 추출되는 과정에서 수량이 한정된 인체 종양 조직이 낭비되는 문제도 발생할 수 있다.Furthermore, in the case of errors in the extraction of various derivatives (DNA, RNA, Protein, etc.) from human tumor tissues, the information on the extracted derivatives is not reliable, and in the process in which the derivatives are erroneously extracted from the human tumor tissue There is a problem that the human tumor tissue having a limited quantity is wasted.
암 연구를 위해서는 과도한 비용이 필요하기 때문에 현실적으로, 한정된 연구자에게만 조직 세포들이 독식되는 경향이 있었고, 잘못된 추출 과정으로 인해 조직이 낭비되는 문제도 있었다. Because of the high cost of cancer research, in reality, only a limited number of researchers tend to be monopolized by tissue cells, and the tissue is wasted due to erroneous extraction processes.
본 발명이 해결하고자 하는 기술적 과제는, 특정 방법으로 한정적인 양만 산출할 수 있는 데이터, 좀 더 상세하게는 대용량 염기서열 분석법(NGS)을 통해 생산된 데이터를 복사와 전송이 용이한 데이터로 변환하여 데이터베이스에 저장해두었다가, 사용자의 요청에 따라 사용자에게 제공함으로써, 이미 존재하는 데이터와 동일한 데이터를 얻어내기 위해서 막대한 비용으로 동일한 과정을 불필요하게 반복 수행하는 것을 최소화할 수 있는 데이터 제공 장치, 방법, 데이터 제공 방법을 실행하기 위한 프로그램이 기록되어 있는 컴퓨터 판독 가능한 기록매체를 제공하는 데에 있다.SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and it is an object of the present invention to provide an apparatus and a method for converting data produced through a large capacity sequencing method (NGS) A data providing apparatus, a method, and a data providing apparatus capable of minimizing the unnecessary repetition of the same process at a great cost in order to obtain the same data as existing data by storing the data in a database and providing the data to a user at the request of a user And a computer-readable recording medium on which a program for executing the method is recorded.
상기의 기술적 과제를 해결하기 위한 본 발명의 일 실시 예에 따른 데이터 제공 방법은, 사용자 단말로부터 데이터 요청을 수신하는 데이터 요청 수신단계; 상기 데이터 요청에 포함된 조건을 기초로 사용자 단말에 제공할 데이터의 속성을 결정하는 데이터 속성 결정단계; 상기 데이터의 속성과 대응되는 데이터를 검색하는 데이터 검색단계; 상기 검색된 데이터의 생성자에 대한 정보, 생성에 필요한 시간, 생성에 필요한 자원을 고려하여 상기 데이터의 가격을 결정하는 가격 결정단계; 및 상기 데이터 및 상기 데이터의 가격을 포함하는 표시 정보를 상기 사용자 단말로 제공하는 데이터 제공단계를 포함한다.According to an aspect of the present invention, there is provided a method of providing data, the method comprising: receiving a data request from a user terminal; Determining a property of data to be provided to a user terminal based on a condition included in the data request; A data retrieval step of retrieving data corresponding to the attribute of the data; A pricing step of determining the price of the data in consideration of information on a creator of the searched data, a time required for generation, and resources required for generation; And a data providing step of providing display information including the data and the price of the data to the user terminal.
상기 방법에 있어서, 상기 데이터 요청에 포함된 조건은, 상기 데이터의 대상물질, 상기 데이터의 종류, 상기 데이터의 처리방법의 종류, 상기 데이터의 가공여부, 및 상기 데이터의 생성시기 중 적어도 하나를 포함할 수 있다.In the method, the condition included in the data request includes at least one of a target substance of the data, a kind of the data, a kind of a processing method of the data, a processing state of the data, and a generation time of the data can do.
상기 방법에 있어서, 상기 데이터 요청에 포함된 조건은, 상기 데이터의 예산 범위, 총 한도 금액 중 적어도 하나를 포함하고, 상기 데이터 제공단계는, 상기 가격 범위에 포함된 최소 금액 또는 최대 금액을 고려하여 상기 데이터 중 일부를 추출하고, 상기 추출한 데이터를 상기 사용자 단말로 제공하거나, 추출한 데이터의 가격의 총합이 상기 총 한도 금액을 초과하지 않도록 상기 데이터 중 하나 이상의 데이터를 추출하고, 상기 추출한 데이터를 상기 사용자 단말로 제공하는 선택적 제공단계;를 포함할 수 있다.In the above method, the condition included in the data request includes at least one of a budget range and a total limit amount of the data, and the data providing step may include a minimum amount or a maximum amount included in the price range Extracting a part of the data and providing the extracted data to the user terminal or extracting one or more pieces of data from the data so that the total sum of prices of the extracted data does not exceed the total limit amount, And an optional providing step of providing to the terminal.
상기 방법에 있어서, 상기 표시 정보는, 상기 데이터를 통해 획득할 수 있는 효과 및 상기 데이터에 포함되는 일부내용 중 적어도 하나를 더 포함할 수 있다.In the method, the display information may further include at least one of an effect obtainable through the data and a content included in the data.
상기 방법에 있어서, 상기 생성자에 대한 정보는, 상기 생성자의 생성 당시의 지위, 현재의 지위 중 적어도 하나를 포함하고, 상기 데이터의 가격은 상기 생성자의 생성 당시의 지위 및 현재의 지위 중 적어도 하나에 의해서 차등적으로 결정될 수 있다.Wherein the information about the creator includes at least one of a position at the time of creation of the constructor and a current position and the price of the data is at least one of the position at the time of creation of the constructor and the current position As shown in FIG.
상기 방법에 있어서, 상기 데이터의 가격은 상기 데이터를 요청한 사용자와 상기 데이터를 생성한 생성자의 동일 여부, 상기 사용자와 상기 데이터 사이의 관련성 중 적어도 하나를 고려하여 차등적으로 결정될 수 있다.In the method, the price of the data may be differentiated in consideration of at least one of whether the user requesting the data and the creator generating the data, and the relation between the user and the data.
상기 방법에 있어서, 상기 생성자에 대한 정보는, 레벨 정보를 포함하고, 상기 레벨 정보는 상기 생성자가 생성한 데이터의 수, 상기 생성자가 생성한 데이터의 누적 판매량, 상기 생성자가 생성한 데이터로부터의 수입 중 적어도 하나를 고려하여 결정될 수 있다.In the above method, the information on the creator includes level information, and the level information includes a number of data generated by the creator, a cumulative sales amount of data generated by the creator, an import from the data generated by the creator, May be determined in consideration of at least one of.
상기의 기술적 과제를 해결하기 위한 본 발명의 다른 일 실시 예에 따른 데이터 제공 장치는, 사용자 단말로부터 데이터 요청을 수신하는 데이터 요청 수신부; 상기 데이터 요청에 포함된 조건을 기초로 사용자 단말에 제공할 데이터의 속성을 결정하는 데이터 속성 결정부; 상기 데이터의 속성과 대응되는 데이터를 검색하는 데이터 검색부; 상기 검색된 데이터의 생성자에 대한 정보, 생성에 필요한 시간, 생성에 필요한 자원을 고려하여 상기 데이터의 가격을 결정하는 가격 결정부; 및 상기 데이터 및 상기 데이터의 가격을 포함하는 표시 정보를 상기 사용자 단말로 제공하는 데이터 제공부;를 포함한다.According to another aspect of the present invention, there is provided a data providing apparatus including: a data request receiving unit receiving a data request from a user terminal; A data attribute determination unit for determining an attribute of data to be provided to a user terminal based on a condition included in the data request; A data retrieving unit for retrieving data corresponding to the attribute of the data; A pricing unit for determining a price of the data in consideration of information on a creator of the searched data, a time required for generation, and resources required for generation; And data providing means for providing the user terminal with display information including the data and the price of the data.
상기 장치에 있어서, 상기 데이터 요청에 포함된 조건은, 상기 데이터의 대상물질, 상기 데이터의 종류, 상기 데이터의 처리방법의 종류, 상기 데이터의 가공여부, 및 상기 데이터의 생성시기 중 적어도 하나를 포함할 수 있다.In the apparatus, the condition included in the data request includes at least one of a target substance of the data, a kind of the data, a kind of a processing method of the data, a processing state of the data, and a generation time of the data can do.
상기 장치에 있어서, 상기 데이터 요청에 포함된 조건은, 상기 데이터의 예산 범위, 총 한도 금액 중 적어도 하나를 포함하고, 상기 데이터 제공부는, 상기 가격 범위에 포함된 최소 금액 또는 최대 금액을 고려하여 상기 데이터 중 일부를 추출하고, 상기 추출한 데이터를 상기 사용자 단말로 제공하거나, 추출한 데이터의 가격의 총합이 상기 총 한도 금액을 초과하지 않도록 상기 데이터 중 하나 이상의 데이터를 추출하고, 상기 추출한 데이터를 상기 사용자 단말로 제공하는 선택적 제공부;를 포함할 수 있다.The apparatus of claim 1, wherein the condition included in the data request includes at least one of a budget range and a total limit amount of the data, and the data providing unit may include a minimum amount or a maximum amount included in the price range, Extracting one or more pieces of data from the data so that the total sum of the prices of the extracted data does not exceed the total limit amount, and extracting the extracted data from the user terminal And an optional providing unit for providing the information.
상기 장치에 있어서, 상기 표시 정보는 상기 데이터를 통해 획득할 수 있는 효과 및 상기 데이터에 포함되는 일부내용 중 적어도 하나를 더 포함할 수 있다..In the apparatus, the display information may further include at least one of an effect obtainable through the data and a content included in the data.
상기 장치에 있어서, 상기 생성자에 대한 정보는, 상기 생성자의 생성 당시의 지위, 현재의 지위 중 적어도 하나를 포함하고, 상기 데이터의 가격은 상기 생성자의 생성 당시의 지위, 및 현재의 지위 중 적어도 하나에 의해서 차등적으로 결정될 수 있다.Wherein the information on the creator includes at least one of a position at the time of creation of the constructor and a current position, the price of the data is at least one of a position at the time of creation of the constructor, Can be determined differentially.
상기 장치에 있어서, 상기 데이터의 가격은 상기 데이터를 요청한 사용자와 상기 데이터를 생성한 생성자의 동일 여부, 상기 사용자와 상기 데이터 사이의 관련성 중 적어도 하나를 고려하여 차등적으로 결정될 수 있다.In the apparatus, the price of the data may be differentially determined in consideration of at least one of whether the user requesting the data and the creator generating the data, and the relation between the user and the data.
상기 장치에 있어서, 상기 생성자에 대한 정보는, 레벨 정보를 포함하고, 상기 레벨 정보는 상기 생성자가 생성한 데이터의 수, 상기 생성자가 생성한 데이터의 누적 판매량, 상기 생성자가 생성한 데이터로부터의 수입 중 적어도 하나를 고려하여 결정될 수 있다.In the apparatus, the information on the creator includes level information, the level information includes a number of data generated by the creator, a cumulative sales amount of data generated by the creator, an import from the data generated by the creator, May be determined in consideration of at least one of.
이 외에도, 본 발명을 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공된다.In addition to this, another method for implementing the present invention, another system, and a computer-readable recording medium for recording a computer program for executing the method are further provided.
전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 특허청구범위 및 발명의 상세한 설명으로부터 명확해 질 것이다.Other aspects, features, and advantages other than those described above will become apparent from the following drawings, claims, and the detailed description of the invention.
본 발명에 따른 데이터 제공 장치, 방법에 따르면, 대상체로부터 직접 추출해야 하는 생체 세포로부터 영구적으로 사용될 수 있고, 사용에 따라서 훼손되지 않는 전자적 데이터를 획득하고 좀 더 상세하게는 DNA/RNA의 염기서열(A,T,G,C)등으로, 상기 획득된 생체 세포에 대한 전자적 데이터를 적정한 가격으로 거래될 수 있도록 할 수 있다. 또한, 수집하기 어렵고 수량이 한정적인 데이터의 메타데이터로서, 해당 데이터의 생성자에 대한 정보를 사용자에게 제공하여, 사용자가 데이터를 구매하는 데에 도움을 줄 수 있으며, 이미 존재하는 데이터와 동일한 데이터를 얻어내기 위해서 막대한 비용으로 동일한 과정을 불필요하게 반복 수행하는 것을 최소화하여 그 데이터를 반복적으로 이용하는 연구자들의 연구비용과 연구시간을 대폭 절감할 수 있다. 여기서, 데이터는 암 발병 기전 연구를 위한 생물학적 데이터일 수 있다. According to the apparatus and method for providing data according to the present invention, it is possible to obtain electronic data which can be permanently used from biological cells to be directly extracted from a target object and which is not damaged according to use, and more specifically, A, T, G, C, etc., the electronic data of the obtained living cells can be traded at an appropriate price. It is also possible to provide the user with information about the creator of the data, which is difficult to collect and whose quantity is limited, as meta data, which can help the user to purchase the data, It is possible to greatly reduce research cost and research time of researchers who use the data repeatedly by minimizing unnecessary repetition of the same process at a great cost. Here, the data may be biological data for cancer-causing mechanism studies.
특히, 본 발명에 따른 데이터 제공 장치, 방법, 데이터 제공 방법을 실행하기 위한 프로그램이 인체 종양 조직에 관련된 데이터의 제공을 위해 이용되는 경우, 여러 연구자들이 시간적, 금전적인 제약을 받지 않고 연구가 가능하게 되어 궁극적으로는 암 정복 및 암 환자별 맞춤형 치료가 가능해질 수 있다.Particularly, when a program for executing a data providing apparatus, method, and data providing method according to the present invention is used for providing data related to a human tumor tissue, it is possible that researchers can research without being limited by time and money Ultimately, it can be possible to treat patients with cancer and to treat them individually.
도 1은 본 발명의 일 실시 예에 따른 데이터 제공 시스템의 구성을 나타낸 도면이다.
도 2는 본 발명의 일 실시 예에 따른 데이터 제공 장치에 대한 블록도를 도시한 도면이다.
도 3은 데이터 제공 장치의 데이터를 인체 종양 조직에 대한 데이터로 한정했을 때의 데이터베이스 그룹에 저장되는 데이터를 도시한 도면이다.
도 4는 본 발명의 다른 일 실시 예에 따른 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.
도 5는 본 발명의 또 다른 일 실시 예에 따른 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.
도 6은 본 발명의 또 다른 일 실시 예에 따른 데이터 제공 장치를 기준으로 한 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.
도 7은 생체 세포로부터 데이터를 생성하는 과정을 설명하기 위한 도면이다.
도 8 및 도 9는 본 발명의 실시예들에 따른 질병 기전 연구를 위한 데이터 제공 방법의 흐름도들이다.
도 10은 본 발명의 실시예들에 따른 질병 기전 연구를 위한 데이터 제공 장치에 추가적으로 포함될 수 있는 데이터 생성부의 구조를 나타내는 블록도이다. 1 is a diagram illustrating a configuration of a data providing system according to an embodiment of the present invention.
2 is a block diagram illustrating a data providing apparatus according to an embodiment of the present invention.
3 is a diagram showing data stored in a database group when data of a data providing apparatus is limited to data on a human tumor tissue.
4 is a flowchart illustrating a data providing method according to another embodiment of the present invention.
5 is a flowchart illustrating a data providing method according to another embodiment of the present invention.
6 is a flowchart illustrating a data providing method based on a data providing apparatus according to another embodiment of the present invention.
7 is a diagram for explaining a process of generating data from a living cell.
8 and 9 are flowcharts of a data providing method for disease mechanism research according to embodiments of the present invention.
FIG. 10 is a block diagram illustrating a structure of a data generating unit that may be additionally included in a data providing apparatus for disease mechanism research according to embodiments of the present invention.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시 예를 가질 수 있는바, 특정 실시 예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있다.BRIEF DESCRIPTION OF THE DRAWINGS The present invention is capable of various modifications and various embodiments, and specific embodiments are illustrated in the drawings and described in detail in the detailed description. The effects and features of the present invention and methods of achieving them will be apparent with reference to the embodiments described in detail below with reference to the drawings. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein.
이하, 첨부된 도면을 참조하여 본 발명의 실시 예들을 상세히 설명하기로 하며, 도면을 참조하여 설명할 때 동일하거나 대응하는 구성 요소는 동일한 도면부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings, wherein like reference numerals refer to like or corresponding components throughout the drawings, and a duplicate description thereof will be omitted .
이하의 실시 예에서, 제1, 제2 등의 용어는 한정적인 의미가 아니라 하나의 구성 요소를 다른 구성 요소와 구별하는 목적으로 사용되었다.In the following embodiments, the terms first, second, and the like are used for the purpose of distinguishing one element from another element, not the limitative meaning.
이하의 실시 예에서, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.In the following examples, the singular forms "a", "an" and "the" include plural referents unless the context clearly dictates otherwise.
이하의 실시 예에서, 포함하다 또는 가지다 등의 용어는 명세서 상에 기재된 특징, 또는 구성요소가 존재함을 의미하는 것이고, 하나 이상의 다른 특징을 또는 구성요소가 부가될 가능성을 미리 배제하는 것은 아니다.In the following embodiments, terms such as inclusive or possessed mean that a feature or element described in the specification is present, and does not exclude the possibility that one or more other features or components are added in advance.
어떤 실시 예가 달리 구현 가능한 경우에 특정한 공정 순서는 설명되는 순서와 다르게 수행될 수도 있다. 예를 들어, 연속하여 설명되는 두 공정이 실질적으로 동시에 수행될 수도 있고, 설명되는 순서와 반대의 순서로 진행될 수 있다.If certain embodiments are otherwise feasible, the particular process sequence may be performed differently from the sequence described. For example, two processes that are described in succession may be performed substantially concurrently, and may be performed in the reverse order of the order described.
도 1은 본 발명의 일 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 시스템의 구성을 나타낸 도면이다.FIG. 1 is a block diagram illustrating a data providing system for disease mechanism research according to an embodiment of the present invention. Referring to FIG.
도 1을 참조하면, 본 발명의 일 실시 예에 따른 데이터 제공 시스템(1)은 데이터 제공 장치(10), 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)을 포함한다. 또한, 운영자 단말(30), 사용자 단말(50), 생성자 단말(51), 데이터 제공 장치(10)를 상호 연결하는 통신망(70)을 포함한다.Referring to FIG. 1, a data providing system 1 according to an embodiment of the present invention includes a
설명의 편의를 위해서, 도 1의 데이터 제공 시스템(1)은 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)을 각각 한 대씩 포함하고 있으나, 데이터 제공 시스템(1)은 필요에 따라 복수의 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)을 포함할 수도 있다.1 includes one
데이터 제공 장치(10)는 암 관련 연구를 하고자 하는 자에게 암 관련 조직 또는 세포 등에 대한 정보를 제공하는 수단을 제공한다. 데이터 제공 장치(10)는 진단적 검사, 예측적 검사, 보인자 검사, 신생아 선별 검사, 산전 진단 검사, 착상전 검사를 위한 데이터를 제공할 수 있다. 데이터 제공 장치(10)는 대상체로부터 획득된 생체 세포로부터 DNA 수준에서의 돌연변이, 유전체의 구조적 이상, 염색체의 이상, 대사산물의 변화 등을 검출할 수 있도록 처리 할 수 있다. 이때, 대상체로부터 획득된 생체 세포가 적당한 방법으로 처리될 수 있도록 제어할 수 있다. 데이터 제공 장치(10)는 사용자 단말(50)로부터 수신된 데이터 요청과 대응되는 데이터를 검색하고, 데이터에 대한 가격을 결정할 수 있다. 데이터 제공 장치(10)는 암 관련 연구를 위한 데이터를 사용자로부터의 요청에 따라 제공함으로써, 매 연구 마다 동일한 데이터를 생성해야 하는 수고를 덜 수 있고, 암 관련 데이터를 직접 구하지 않더라도 암 관련 연구를 진행할 수 있으며, 조직 또는 세포 등을 보관하는 것에 비해서, 보관 비용도 현저히 적게 발생하게 된다. The
데이터 제공 장치(10)는 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)로부터 데이터 요청을 받고 각 단말에 데이터를 제공할 수 있다. 도 1에는 하나의 데이터 제공 장치를 표시하였으나, 접속량 또는 데이터 양에 따라 복수의 데이터 제공 장치가 존재할 수도 있다. 이 경우, 데이터 제공 시스템(1)은 각 데이터 제공 장치의 현재 부하량을 측정 및 비교하고 각 데이터 제공 장치에서 효율적으로 작업이 처리하도록 로드 밸런싱(Load Balancing)을 수행하는 레이어 4(Layer 4) 스위치(미도시)를 추가로 포함할 수 있다.The
데이터 제공 장치(10)는 내부에 저장하고 있는 데이터의 업데이트 및 동작을 위한 프로그램의 유지 및 보수를 위해서 운영자 단말(30)로부터 주기적으로 특정 데이터를 수신할 수 있다.The
운영자 단말(30)은 개인용 컴퓨터(PC) 또는 워크스테이션(workstation) 중 하나가 될 수 있으며, 필요에 따라 데이터 제공 장치(10)에 접속하여 데이터 제공 장치(10)에 저장되어 있는 데이터의 업데이트 및 데이터 제공 장치(10)의 동작을 위한 프로그램의 유지 및 보수를 수행한다.The
사용자 단말(50)은 사용자가 유무선 네트워크를 통해 데이터 제공 장치(10)에 접속한 후, 데이터 제공 서비스에 대한 회원 등록을 할 수 있다. 또한, 사용자 단말(50)은 사용자가 제공받을 데이터의 종류를 검색 및 선택한 후 결제하는 데에 사용될 수 있다.After the user accesses the
생성자 단말(51)은 데이터 제공 장치(10)에 저장되어 있는 데이터와 동종의 데이터를 생성할 수 있는 전문가가 이용하는 사용자 단말의 한 종류이다. 즉, 생성자 단말(51)은 사용자 단말(50)의 기능을 필수적으로 포함한다. 생성자 단말(51)은 운영자 단말(30)에 데이터 업로드 요청을 하여 운영자가 운영자 단말(30)을 통해 데이터 제공 장치(10)에 저장되는 데이터를 업데이트할 수 있도록 하는 기능을 포함할 수 있다.The
운영자 단말(30)은 사용자 단말(50)과 생성자 단말(51)을 각각 구별하기 위한 식별코드를 각 사용자 단말(50)과 생성자 단말(51)에 부여할 수 있다. 운영자 단말(30)은 업로드 요청을 할 수 있는 식별코드를 가진 생성자 단말(51)에 한해 데이터 업로드 요청을 할 수 있도록 하여 데이터 제공 장치(10)에 저장될 수 있는 데이터의 품질 및 신뢰도를 확보할 수 있다.The
도 1을 참조했을 때, 사용자 단말(50) 및 생성자 단말(51)은 스마트폰 형태를 띄고 있으나, 본 발명에서 사용자 단말(50) 및 생성자 단말(51)은 특정한 기기로 한정되지 않으므로, 스마트폰이 아니더라도 웹 브라우징이 가능한 애플리케이션이 설치되어 있는 단말이라면 제한 없이 차용될 수 있다. 1, the
통신망(70)은 데이터 제공 장치(10), 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)을 연결한다. 본 발명에서 통신망(70)은 그 구동 방식에 있어서 유선과 무선 중 어느 한 방식으로 한정되지 않으므로, 랜(LAN, Local Area Network)과 같은 유선 네트워크나, 블루투스(Bluetooth), 와이파이(WIFI), 와이브로(Wibro), 위성 통신과 같은 무선 네트워크에 의해 구동되는 모든 통신망을 포함할 수 있다.The
도 2는 본 발명의 일 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 장치에 대한 블록도를 도시한 도면이다.FIG. 2 is a block diagram of a data providing apparatus for disease mechanism research according to an embodiment of the present invention. Referring to FIG.
도 2를 참조하면, 본 발명의 일 실시 예에 따른 데이터 제공 장치(200)는 데이터 요청 수신부(210), 데이터 속성 결정부(220), 데이터 검색부(230), 데이터베이스 그룹(240), 가격 결정부(250), 데이터 제공부(260), 사용자 단말(270), 생성자 단말(280). 운영자 단말(290)을 포함할 수 있다.2, a
데이터 요청 수신부(210)는 사용자 단말(270)로부터 데이터 요청을 수신한다. 사용자 단말(270)은 사용자가 데이터 제공 장치(200)에 접근할 수 있게 하는 기기로서, 데이터 제공 장치(200)에 각종 유무선 네트워크를 통해 연결될 수 있다. 사용자 단말(270)은 사용자가 웹 브라우징(web browsing)을 수행할 수 있게 하는 브라우저 애플리케이션(browser application)이 설치되어 있는 단말이며, 본 발명은 사용자 단말(270)에 있어서 단말의 성능, 형태, 및 종류를 특정한 어느 것으로 한정하지 않는다.The data
여기서, 데이터 요청은 데이터 제공 장치(200)의 데이터베이스 그룹(240)에 저장되어 있는 데이터 중 사용자가 지정한 조건에 따른 데이터가 있는지 여부를 판단하여 그 결과를 사용자 단말(270)에 전송하라는 신호를 의미한다.Here, the data request refers to a signal for determining whether data stored in the
데이터 속성 결정부(220)는 데이터 요청에 포함된 대상 물질 및/또는 조건을 기초로 데이터의 검색 속성을 결정한다. 여기서, 검색 속성은 데이터 요청에 포함된 조건 즉, 대상물질, 종류, 처리방법의 종류, 생성 시기 등으로부터 결정되는 것으로, 물질 관련 속성 또는 처리 관련 속성으로 구분될 수 있다. 물질 관련 속성은 조건으로부터 유추될 수 있는 속성 중에서, 대상물질 자체와 관련된 것으로, 대상물질의 위치, 종류 등을 포함하며, 처리 관련 속성은 조건으로부터 유추될 수 있는 속성 중에서, 대상물질의 처리와 관련된 처리방법, 가공 여부, 생성 시기 등을 포함할 수 있다. The data attribute
여기서, 데이터 요청에 포함된 조건은 데이터의 종류, 처리방법의 종류, 생성 시기 중 적어도 하나를 포함할 수 있고, 제공할 데이터의 속성은 데이터의 종류, 처리방법의 종류, 가공 여부, 생성 시기, 데이터의 인용횟수 중 적어도 하나를 포함할 수 있다. Here, the condition included in the data request may include at least one of the type of data, the kind of the processing method, and the generation time, and the attribute of the data to be provided includes the type of the data, the kind of the processing method, And the number of citations of the data.
데이터의 대상물질은 사용자가 요청하는 데이터의 주체가 되는 물질을 말하며, 실험을 시행했던 대상이 되는 물질로서, '췌장암 조직(78세, 남, Stage Ⅲ, Grade 4)' 과 같이 실험 대상이 되었던 샘플(sample)에 대한 물질 정보를 의미한다. 또한, 데이터의 대상물질은 학계에서 이미 널리 알려진 분류도 포괄적으로 포함할 수 있다. 예를 들어, 사용자가 사용자 단말(270)을 통해 데이터 요청을 할 때, 필수 아미노산 20종을 특정하여 입력했다면, 사용자가 요청한 데이터의 대상물질은 필수 아미노산 20종 모두가 될 수 있다.The target substance of the data refers to the substance that is the subject of the data requested by the user and is a substance to be subjected to the experiment such as' pancreatic cancer tissue (78 years old, male, Stage Ⅲ, Grade 4) Means material information for a sample. In addition, the subject matter of the data may include a wide range of already well-known classifications in academia. For example, when a user makes a data request through the
여기서, 데이터의 종류는 전유전체 염기서열분석(Whole Genome Sequencing), 전엑솜 염기서열분석(Whole Exome Sequencing), 알엔에이 염기서열분석(RNA Sequencing) 등과 같은 차세대염기서열분석기법(Next Generation Sequencing)의 분석대상 중 어느 것인지를 나타낸다. 예를 들어, 알엔에이 염기서열분석(RNA Sequencing)에 대한 데이터의 종류는 알엔에이(RiboNucleic Acid)가 된다.Here, the data can be classified into the next generation sequencing method such as whole genome sequencing, whole exome sequencing, and RNA sequencing. Which is one of the analysis objects. For example, the data type for RNA Sequencing is RiboNucleic Acid.
여기서, 데이터의 처리방법의 종류는, 데이터를 생성하는 방법에 대한 정보를 말한다. 보다 상세하게는, 데이터의 처리방법의 종류는 차세대염기서열분석기법을 활용하여 분석하는 툴(tool)에 대한 종류를 의미한다. 특별히, 데이터의 처리방법의 종류에는 처리 또는 공정의 이름이 포함될 수 있다. 데이터의 처리방법의 종류에 대한 예시로는, 유전체학 기법인 전유전체 염기서열(WGS, Whole Genome Sequencing)나 전엑솜 시퀀싱(WES, Whole Exome Sequencing), 전사체학 기법인 마이크로어레이(Microarray)나 알엔에이 염기서열분석(RNA Sequencing), 단백질체학(Proteomics) 기법인 말디토프(MALDI-TOF, Matrix-Assisted Laser Desorption-Ionization Time Of Flight), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 대사체학(Metabolomics) 기법인, 핵자기공명-질량분석(NMR-MS, Nuclear Magnetic Resonance-Mass Spectrometry), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 가스 크로마토그래피-질량 분석(GC-MS, Gas Chromatography-Mass Spectrometry)가 있다. Here, the type of data processing method refers to information on a method of generating data. More specifically, the type of data processing method refers to a type of tool for analyzing using a next-generation sequencing analysis technique. In particular, the type of data processing method may include the name of the process or process. Examples of methods of processing data include genomic techniques such as whole genome sequencing (WGS), whole exome sequencing (WES), microarray (microarray) (MALDI-TOF, Liquid Chromatography-Mass Spectrometry (LC-MS), and Molecular-Assisted Laser Desorption-Ionization Time-of-Flight Mass spectrometry (NMR), liquid chromatography-mass spectrometry (LC-MS), gas chromatography (mass spectrometry) - GC-MS (Gas Chromatography-Mass Spectrometry).
또한, 데이터의 처리 방법은 아래의 분석 방법을 포함할 수 있다. The data processing method may include the following analysis method.
- (A) 유전체 데이터: whole genome, exome 서열 데이터 및 분석 데이터 등(variant calling, assembly, CNV, SV, visualization 등의 처리/가공 방법으로 처리할 수 있음)- (A) Dielectric data: Whole genome, exome sequence data and analysis data (can be processed by processing / processing methods such as variant calling, assembly, CNV, SV,
- (B) 전사체 데이터: RNA-seq, miRNA-seq 서열데이터 및 분석 데이터 등 (quantification, variant detection, alternative splicing, DEG 등의 처리/가공 방법으로 처리할 수 있음)- (B) Transcript data: RNA-seq, miRNA-seq sequence data and analysis data (can be processed by processing / processing methods such as quantification, variant detection, alternative splicing,
- (C) 후성유전체 데이터: ChIP-seq, Histone modifications, DNA methylation 분석 데이터 및 visualization 데이터 등- (C) Follow-up genomic data: ChIP-seq, Histone modifications, DNA methylation analysis data and visualization data
- (D) 네트워크 분석과 신호전달 조절 및 Pharmaco-Genomic 데이터: 네트워크 추론, subnetwork 및 모듈 분석, pathway 규명, 전사조절, 단백질 상호작용, 기능 네트워크, 질병-약물-유전체 정보 데이터마이닝 등- (D) Network analysis and signaling control and Pharmaco-Genomic data: Network reasoning, subnetwork and module analysis, pathway identification, transcription control, protein interaction, functional network, disease-drug-genome information data mining etc.
- (E) Meta-genome 데이터: microbiota, phylogeny 분석 등- (E) Meta-genome data: microbiota, phylogeny analysis, etc.
유전체와 관련된 데이터는 서로 다른 목적을 위해서 획득되어 지는데, 특히, 유전체 데이터를 이용하여 유전체의 염기 변이를 확인할 수 있고, 전사체 데이터를 이용하여 유전체의 발현 여부를 확인할 수 있고, 후성유전체 데이터를 이용하여 후성적으로 변화된 유전체를 확인할 수 있다. Data relating to the genome are obtained for different purposes. In particular, it is possible to confirm the base variation of the genome using the genome data, to confirm the expression of the genome using the transcript data, and to use the genome data To identify genetically altered genomes.
여기서, 데이터의 가공 여부는 데이터를 생성하는데 있어서 대상물질로부터 바로 획득되는 데이터 인지, 또는 대상물질에 특수한 처리(실험, 분리, 추출, 여과 등)를 한 후에 획득될 수 있는 데이터 인지 여부에 대한 정보를 말할 수 있다. Here, whether or not the data is processed is whether the data is obtained directly from the target material in generating the data or whether the data can be obtained after performing a special process (experiment, separation, extraction, filtration, etc.) .
보다 상세하게는, 데이터의 가공여부는 차세대염기분석기법으로 처리한 1차적인 실험 데이터를 기초로 하여, 단순하게는 유전자 염기서열 해독 더 나아가서는 해독된 염기서열 에서 돌연변이 유전자변이를 찾을 수 있는알고리즘으로 동작하는 소프트웨어를 사용하여, 유전자 복세수 변이 (Copy-number Variation:CNV), 유전자의 단일 염기의 다형성(Single Nucleotide Polymorphism:SNP)등을 찾아 정보를 찾는 등 보다 향상되고 진보된(advanced) 정보를 추출하는 과정을 거쳤는지 여부를 의미한다.More specifically, the processing of data is based on the primary experimental data processed by the next-generation base analysis technique, and is based on a simple algorithm for searching for a mutated gene sequence in a nucleotide sequence to be decoded, Advanced information such as copy-number variation (CNV), single nucleotide polymorphism (SNP), and so on, can be found by using software that operates on a single nucleotide polymorphism Is extracted or extracted.
유전자 변이를 선택하기 위한 소프트웨어로서 뮤트시그(MutSig, Mutation Significance)가 이용될 수 있고, 주기적인 복사 개수 변경으로부터 유전자를 선택하기 위한 소프트웨어로서 기스틱(Gistic)이 이용될 수 있으나, 반드시 상술한 소프트웨어로 한정하는 것은 아니며, 동일한 알고리즘을 수행할 수 있다면 다른 소프트웨어를 통해 데이터를 가공하더라도 본 발명의 범주를 벗어나는 것은 아니다.MutSig (Mutation Significance) may be used as software for selecting a gene variation, and Gistic may be used as software for selecting a gene from a periodic copy number change, And it is not outside the scope of the present invention to process the data through other software if the same algorithm can be performed.
본 발명의 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 장치는 1차적인 실험 데이터와 1차적인 실험 데이터를 가공한 데이터를 모두 제공할 수 있다. 즉, 여기서, 데이터의 가공 여부라는 항목을 통해서 대상물질을 통해 바로 획득되는 데이터(미가공 데이터), 대상물질에 대해서 특수한 처리(실험, 추출, 분리, 여과 등) 등을 한 후에 획득되는 데이터(가공 데이터)인지 여부에 대한 정보를 말한다.The data providing apparatus for the disease mechanism research according to the embodiment of the present invention can provide both the primary experimental data and the data obtained by processing the primary experimental data. That is, the data (raw data) obtained immediately after the object substance through the item of whether or not the data is processed, the data (raw data) obtained after performing a special process (experiment, extraction, separation, filtration, Data). ≪ / RTI >
즉, 다시 말해서, 데이터의 처리방법의 종류는 데이터에 적용되는 특수한 처리 또는 공정을 명확하게 알고 있을 때에 사용자가 사용자 단말을 통해 입력할 수 있는 조건이고, 사용자가 요청한 데이터의 가공여부는 데이터에 적용되는 특수한 처리 또는 공정을 모르더라도, 특수한 처리 또는 공정 전후로 데이터의 성질이 크게 달라지는 특성만 알고 있어도 적절한 데이터를 찾기 위한 조건으로 활용할 수 있는 조건이다.In other words, the type of data processing method is a condition that a user can input through a user terminal when a specific process or process applied to the data is clearly known, and whether or not the data requested by the user is processed is applied to the data Even if you do not know the specific process or process, you can use it as a condition to search for appropriate data even if you know the characteristic that the characteristic of the data greatly changes before or after the special process.
여기서, 데이터의 생성 시기는 데이터가 생성된 시점을 말한다. 데이터 요청자(사용자)는 데이터의 생성 시기를 한정하여 데이터 요청을 할 수 있다.Here, the generation time of the data refers to the time when the data is generated. The data requester (user) can request data by limiting the generation time of data.
예를 들어, 사용자가 6개월전에 생성된 데이터를 요청한다면, 사용자는 사용자 단말(270)에 현재로부터 6개월 전의 날짜범위를 입력함으로써, 데이터 제공 장치(200)로부터 해당 날짜범위에 생성된 데이터를 제공받을 수 있다.For example, if the user requests data generated six months in advance, the user inputs data in the date range from the
여기서, 데이터의 인용 횟수는 데이터가 논문에 인용된 횟수에 대한 정보를 의미한다. 데이터의 인용 횟수는 해당 데이터가 얼마나 심도있게 연구되고 있는지에 대해서 알려주는 척도가 될 수 있다. 데이터 속성 결정부(220)는 데이터의 인용 횟수에 대한 최신 정보를 수집하기 위해서 논문관련정보를 제공하는 외부 서버와 유무선 네트워크를 통해서 연결될 수 있다.Here, the number of citations of data means information on the number of times the data is cited in the paper. The number of citations of the data can be a measure of how deeply the data is being studied. The data attribute
사용자 단말(270)에 제공할 데이터의 속성(이하, 데이터 속성)은, 데이터 속성 결정부(220)가 위와 같은 데이터 요청에 포함된 조건을 기초로 결정되며, 데이터 속성은 데이터 요청에 포함된 각각의 조건을 특징값(feature)으로 하는 하나 이상의 값으로 결정되며, 물질 관련 속성 또는 처리 관련 속성을 포함할 수 있다. 최종적으로 제공할 데이터 속성은 테이블 형태가 될 수 있다.The attributes of the data to be provided to the user terminal 270 (hereinafter, data attributes) are determined based on the conditions included in the data request as described above, , And may include a substance-related property or a process-related property. The data attribute to be finally provided can be a table type.
데이터 속성 결정부(220)에 의해 결정된 테이블 형태의 데이터 속성은, 후술하는 데이터 검색부(230)의 입력값으로 입력될 수 있으며, 데이터 속성을 구성하는 테이블의 크기는 데이터 요청에 포함된 조건의 수에 따라 달라질 수 있다. 또한, 데이터 속성(물질 관련 속성 또는 처리 관련 속성)은 데이터 요청에 포함된 각 조건에 하나 이상으로 결정될 수 있다.The data attribute of the table type determined by the data attribute
데이터 검색부(230)는 사용자가 요청한 데이터의 속성(물질 관련 속성 또는 처리 관련 속성)과 대응되는 데이터를 검색한다. 보다 구체적으로는, 데이터 검색부(230)는 데이터 속성을 데이터 속성 결정부(220)로부터 전달받아, 데이터베이스 그룹(240)에 저장되어 있는 데이터 중에서, 데이터 속성(물질 관련 속성 또는 처리 관련 속성)과 대응되는 데이터를 검색할 수 있다.The
데이터베이스 그룹(240)은 데이터 제공 장치(200)가 사용자 단말(270)에 제공할 수 있는 각종 데이터를 저장한다. 데이터베이스 그룹(240)에 저장되는 각종 데이터는 데이터 검색부(230)에서 검색을 용이하게 하기 위해서, 각 데이터마다 고유한 식별코드를 가질 수 있다.The
데이터베이스 그룹(240)은 각 데이터를 특성별로 구분하여 저장하기 위해서 복수 개의 소규모 데이터베이스를 포함할 수 있다. 도 2를 참조하면, 데이터베이스 그룹(240)은 4개의 소규모 데이터베이스를 포함하고, 본 발명은 데이터베이스 그룹(240)에 포함될 수 있는 소규모 데이터베이스의 개수를 특정한 숫자로 한정하지 않으므로, 본 발명의 다른 실시 예에서 데이터베이스 그룹(240)은 4개보다 많거나 적은 소규모 데이터베이스를 포함할 수도 있다.The
선택적 실시 예로서, 데이터베이스 그룹(240)에 포함된 각 소규모 데이터베이스는 가공처리부(미도시)를 포함할 수 있다. 가공처리부(미도시)는 소규모 데이터베이스에 저장되는 데이터가 특정 방법으로 가공처리됨에 따라 데이터의 성질이나 연구 가치가 달라지는 경우, 미가공 데이터를 가공하여 가공 데이터로 처리한다. 소규모 데이터베이스에 가공처리부(미도시)를 두고 사용자의 데이터 요청이 있을 때마다 미가공데이터를 가공한 가공 데이터를 제공하면, 소규모 데이터베이스에 미가공데이터와 가공 데이터를 모두 저장하는 것보다 소규모 데이터베이스의 저장공간의 활용에 있어서 더 이득이 될 수 있다.As an alternative embodiment, each small database included in
가격 결정부(250)는 데이터 검색부(230)에서 검색된 데이터의 생성자에 대한 정보, 생성에 필요한 시간, 생성에 필요한 자원 등을 고려하여 사용자가 요청한 데이터의 가격을 결정한다. 다른 실시예에서, 가격 결정부(250)는 검색된 데이터의 생성자에 대한 정보 및/또는 데이터의 속성을 기초로 데이터의 최초 가격을 결정하는 제1 가격 결정부(미도시) 및 상기 데이터의 생성에 필요한 시간, 생성에 필요한 자원을 고려한 가격 변화율을 산출하고, 상기 최초 가격 및 상기 가격 변화율을 모두 고려하여, 상기 데이터의 최종 가격을 결정하는 제2 가격 결정부를 포함할 수 있다. The
제1 가격 결정부는 검색된 데이터의 속성 중 물질 관련 속성을 기초로 데이터의 최초 가격을 결정할 수 있다. 제1 가격 결정부는 데이터의 대상 물질을 비교하여, 희귀한 암의 조직이라서 획득하기 어려운 대상물질에 대해서는 더 높은 가격을 매길 수 있고, 흔한 암의 조직이라서 획득하기 쉬운 대상물질에 대해서는 더 낮은 가격을 매길 수 있다. The first pricing unit may determine the initial price of the data based on the material-related attributes among the attributes of the retrieved data. The first pricing decision unit compares the data of the target substances and can charge a higher price for a target substance that is difficult to obtain because it is a rare cancer tissue. It can be tied.
여기서, 데이터의 생성자에 대한 정보는 데이터를 생성한 사람에 대한 정보로서, 데이터를 생성할 당시의 지위 및 사용자의 데이터 요청을 받은 현재의 지위를 모두 포함할 수 있다. 여기서, 지위는 직업 또는 경력 등을 포함하는 정보로서, 직업 또는 경력과 대응되는 등급 정보를 포함할 수도 있다. 즉, 경력이 9년차인 생성자의 지위가 경력이 3년차인 생성자의 지위보다 높고, 연구원이 직업인 생성자의 지위가 연구와 무관한 직업을 가진 생성자의 지위보다 높을 수 있다. 즉, 의사, 연구원 등과 같이 암 관련 연구 및 임상을 할 수 있는 직업을 가진 생성자의 지위를 더 높게 책정하고, 해당 경력이 더 많은 생성자의 지위를 더 높게 책정한다. 여기서, 생성자의 지위는 생성자의 최종학력, 생성자의 전공, 생성자의 직업, 생성자의 누적 논문수, 생성자의 수상 경력 등을 포함하거나, 생성자의 최종학력, 생성자의 전공, 생성자의 직업, 생성자의 누적 논문수, 생성자의 수상 경력 등을 종합적으로 고려하여 산출할 수 있다. Here, the information on the creator of the data is information on the person who generated the data, and may include both the status at the time of generation of the data and the status of the user received the data request. Here, the position may include information such as a career or a career, and may include class information corresponding to a career or a career. In other words, the status of the constructor with 9 years of experience is higher than that of the constructor with 3 years of experience, and the status of the constructor who is a researcher may be higher than that of a constructor with a career independent of the research. In other words, the higher the status of a creator with a career to do cancer-related research and clinical work, such as a doctor or a researcher, and the higher the level of the creator with that career. Here, the status of the constructor includes the final educational background of the constructor, the major of the constructor, the profession of the constructor, the number of papers of the constructor, the prize winning history of the constructor, or the final academic ability of the constructor, the major of the constructor, The number of papers, and the awards of the creators.
가격 결정부(250)는 데이터의 생성자의 생성시 지위만을 고려하여, 데이터의 가격을 결정할 수 있다. 예를 들어, 가격 결정부(250)는 데이터를 생성할 당시에 데이터 생성자의 지위가 높은 데이터에 대해서 좀 더 높은 가격을 매길 수 있다.(이하, 제1사례)The
선택적 실시 예로서, 데이터의 가격을 결정하기 위해서 이용되는 생성자의 종합적 등급인 지위는 사용자 또는 관리자에 의해서 새로 매겨질 수도 있다. 또한, 생성자의 지위는 생성자의 과거 경력 또는 직업 등을 통해 산출된 제1 등급과 사용자 또는 관리자에 의해 산출된 제2 등급을 합산하여 결정될 수 있다. 이때, 생성자의 지위는 제1 등급과 제2 등급에 대해서 각각 다른 가중치를 두어 가중 평균하여 산출될 수 있다. As an alternative embodiment, the aggregate rank of the constructors used to determine the price of the data may be updated by the user or administrator. In addition, the position of the creator can be determined by summing the first class calculated through the past career or occupation of the creator, and the second class calculated by the user or the manager. At this time, the status of the creator can be calculated by weighted averaging of different weights for the first and second classes.
예를 들어, 처음에 매겨져 있는 생성자의 종합등급은 생성자의 직업에 대한 요소가 많이 반영되어 있었다면, 사용자는 생성자의 누적 논문수나 생성자의 수상 경력을 위주로 하여 새로운 종합등급을 산출하고, 산출된 종합등급을 기준으로 하여 데이터를 검색함으로써 사용자가 원하는 데이터를 검색할 수 있다.For example, if the overall grade of the constructor initially assigned reflects a lot of elements of the creator's job, the user can calculate a new overall grade based on the number of the cumulative number of papers of the constructor or the award winner of the constructor, So that the user can retrieve the desired data.
가격 결정부(250)는 생성자의 생성시 지위와 현재 지위를 모두 고려하여, 데이터의 최초 가격을 결정할 수 있다. 데이터를 생성할 당시에 데이터 생성자의 지위가 낮았으나, 사용자의 데이터 요청을 받은 현재에 데이터 생성자의 지위가 높을 경우(이하, 제2사례), 가격 결정부(250)는 생성자가 데이터를 생성한 이후에 좀더 많은 연구 성과를 낸 생성자의 현재 지위를 고려하여, 생성시 지위를 통해 산출된 데이터의 가격 보다 더 높게 데이터의 최초 가격을 결정할 수 있다. The
다른 실시 예에서, 가격 결정부(250)는 현재 지위가 검색되지 않은 생성자의 데이터에 대해서 생성시 지위를 통해 산출된 데이터의 가격보다 더 낮은 가격으로 상기 데이터의 최초 가격을 결정할 수 있다. 예를 들어, 데이터를 생성할 당시에 데이터 생성자의 지위가 낮고, 사용자의 데이터 요청을 받은 현재에 데이터 생성자의 지위가 낮거나 검색되지 않는 경우(이하, 제3사례), 가격 결정부(250)는 생성자의 현재 지위가 검색되지 않는 점을 고려하여, 생성자의 연구 의지가 낮다고 판단할 수 있고, 이러한 점을 고려하여, 데이터의 가격을 다소 낮은 가격으로 최초 가격을 결정할 수 있다.In another embodiment, the
가격 결정부(250)는 전술한 것과 같이 데이터를 생성한 사람의 데이터 생성 당시의 지위 및 사용자의 데이터 요청을 받은 현재의 지위 중 적어도 하나에 의해서 데이터의 가격을 차등적으로 결정할 수 있다. 가격 결정부(250)는 데이터 생성자의 현재 지위에 대한 정보를 실시간으로 확인하기 위해서 외부 개인정보 제공서버(미도시)와 유무선 네트워크를 통해 연결될 수 있다.The
선택적 실시 예로서, 가격 결정부(250)는 사용자 단말(270)을 통해 데이터를 요청한 사용자와 데이터를 생성한 생성자의 동일 여부, 사용자 단말(270)을 통해 데이터를 요청한 사용자와 사용자가 요청한 데이터 사이의 관련성 중 적어도 하나를 고려하여 데이터의 가격 변화율을 결정할 수도 있다. 여기서, 사용자 단말(270)을 통해 데이터를 요청한 사용자와 사용자가 요청한 데이터 사이의 관련성은, 사용자 단말(270)을 통해 데이터를 요청한 사용자가, 사용자 단말(270)을 통해 요청한 데이터를 생성하는 데에 기여한 정도가 될 수 있다. 예를 들어, 특정 데이터 Z의 생성자는 A, B, C, 이상 세 사람이고, 각각 데이터를 생성하는데 기여한 정도가 상, 중, 하이며, C가 데이터 Z에 대한 제공요청을 했다고 가정하면, 가격 결정부(250)는 데이터를 요청한 자와 생성한 자가 모두 C로 동일하다고 판단하여, 높은 할인율을 적용하여 데이터 가격을 결정하거나, 데이터를 요청한 자가 데이터를 생성한 자이기는 하지만, 기여도가 낮으므로, 낮은 할인율을 적용하여 데이터 가격을 결정할 수 있다.As an alternative embodiment, the
선택적 실시 예로서, 데이터의 생성자에 대한 정보는 생성자의 레벨 정보를 포함할 수 있다. 여기서, 생성자의 레벨 정보는 생성자가 생성한 데이터의 수, 생성자가 생성한 데이터의 누적 판매량, 생성자가 생성한 데이터로부터의 수입 중 적어도 하나를 고려하여 결정될 수 있다. 다른 실시 예에서, 가격 결정부(250)는 데이터의 가공 여부를 고려하여 데이터의 가격 변화율을 결정할 수 있다. 예를 들어, A라는 대상물질에 대한 미가공 데이터, A라는 대상물질에 대한 가공 데이터가 있다고 하면, 가격 결정부는 가공 데이터의 가격 변화율을 미가공 데이터의 가격 변화율보다 높게 결정할 수 있다. 차등된 데이터의 가격에 따라, 미가공 데이터만을 구매하는 사용자는 미가공 데이터 및 가공 데이터를 모두 구매하거나, 가공 데이터만을 구매하는 사용자보다 더 낮은 금액을 결제하면 된다.As an alternative embodiment, the information about the creator of the data may include the level information of the creator. Here, the level information of the producer can be determined in consideration of at least one of the number of data generated by the producer, the cumulative sales amount of the data generated by the producer, and the income from the data generated by the producer. In another embodiment, the
다른 실시 예에서, 가격 결정부(250)는 데이터의 생성에 필요한 시간을 고려하여 상기 데이터의 가격 변화율을 결정할 수 있다. 가격 결정부(250)는 데이터의 생성에 필요한 시간이 길수록 상기 데이터의 가격 변화율을 높게 결정할 수 있다. 데이터의 생성에 대한 필요한 시간은 데이터를 생성하는 방식 및 생성자의 역량에 따라 달라질 수 있으므로, 고정된 시간이 아닌 시간적 범위로 표시할 수 있다. 이때, 표시되는 시간적 범위 외에 데이터 생성하는 데 걸리는 최대시간 및 최소시간과 해당 데이터를 생성하여 업로드한 여러 업로더의 데이터의 생성 시간에 대한 평균시간도 추가로 표시할 수도 있다. 예를 들어, 유전체 데이터 중 assembly 방법으로 가공된 데이터를 요청하는 데이터 요청과 대응하여, 가격 결정부(250)는 유전체 데이터를 assembly 방법으로 가공하는데 필요한 자원(시간, 비용 등)을 고려하여, 상기 데이터의 가격 변화율을 결정할 수 있다. 또한, 유전체 데이터 중 CNV 방법으로 가공된 데이터를 요청하는 데이터 요청과 대응하여, 가격 결정부(250)는 유전체 데이터를 assembly 방법으로 가공하는 것과는 구별되게 CNV 방법으로 가공하는데 필요한 자원(시간, 비용 등)을 고려하여, 상기 데이터의 가격 변화율을 결정할 수 있다. 이를 통해, 본 발명의 실시예에 따른 데이터 제공 장치는 요청된 동일한 종류의 데이터에 대한 가격을 요청자의 요청에 포함된 데이터 가공 방법에 따라서 차등적으로 결정할 수 있다. In another embodiment, the
다른 실시 예에서, 가격 결정부(250)는 데이터의 생성에 필요한 자원, 예를 들어, 비용 등을 고려하여 데이터의 가격 변화율을 결정할 수 있다. 가격 결정부(250)는 데이터를 생성하는 필요한 자원이 많은 데이터에 대해서 더 높은 가격 변화율을 매길 수 있다.In another embodiment, the
다른 실시 예에서, 가격 결정부(250)는 미가공 데이터 및 가공 데이터를 생성하기 위해서 필요한 초기 데이터에 따라서, 미가공 데이터 및 가공 데이터의 가격 변화율을 결정할 수 있다. 여기서 초기 데이터는 데이터의 가격을 명확하게 정할 수 있도록, 데이터에 대한 순도나 분석 결과에 대한 정성적, 정량적 판단이 가능한 데이터일 것을 요한다.In another embodiment, the
데이터 제공부(260)는 사용자가 요청한 데이터 및 가격 결정부(250)에서 결정된 데이터의 가격을 포함하는 표시 정보를 사용자 단말(270)로 제공한다. 사용자는 표시 정보에 포함된 데이터 및 데이터의 가격을 확인하고, 결제를 진행할지 여부를 결정할 수 있다.The
사용자 단말(270)로 제공되는 표시 정보는 사용자 단말(270)로 제공된 데이터를 통해 획득할 수 있는 효과 및 사용자 단말(270)로 제공된 데이터에 포함되는 일부내용 중 적어도 하나를 포함할 수 있다.The indication information provided to the
사용자가 요청한 데이터에 포함되는 일부내용은, 해당 데이터를 취급하는 분야에 속한 사람이라면 바로 알 수 있을 정도로, 미리보기 형식으로 제공되는 데이터를 의미한다. 사용자는 데이터에 포함되는 일부내용을 확인하여 구매여부를 결정하는 데에 활용할 수 있다.Some of the data included in the data requested by the user means data provided in a preview format so that the user can know immediately if the user belongs to the field handling the data. The user can check some contents included in the data and utilize them to decide whether or not to purchase.
표 1은 사용자 단말(270)의 디스플레이부를 통해 출력되는 표시 정보에 대한 예시이다.Table 1 is an example of display information output through the display unit of the
표 1을 해석하면, 사용자는 데이터 제공 장치에 2013년 11월 13일에 생성된 췌장암 조직 데이터의 미가공 디앤에이 데이터에 대한 제공을 요청한 것을 알 수 있다. 표 1을 참조하면, 사용자는 미가공 디앤에이 데이터를 이용해서, 췌장암의 항암제 개발 및 바이오마커를 특정할 수 있을 것으로 기대된다.Analyzing Table 1, it can be seen that the user requested the data providing device to provide the raw D & A data of the pancreatic cancer tissue data generated on November 13, Referring to Table 1, the user is expected to be able to identify cancer drug development and biomarkers of pancreatic cancer using raw D & A data.
표 1을 참조하면, 미가공 디앤에이 데이터를 생성한 생성자는 3명으로, 미가공 디앤에이 데이터를 생성할 당시의 지위와, 현재의 지위가 각각 달라졌으며, 생성자 3명의 기여도도 각각 다르다. 사용자는 상술한 내용 외에도 표 1과 같은 표시 정보를 통해, 데이터 생성에 필요한 물질, 시간, 사용자 레벨, 데이터의 가격, 데이터 미리보기(데이터의 일부내용)을 확인한 후, 결제를 하여 데이터를 제공받을지 여부를 결정할 수 있다.Referring to Table 1, there are three producers that generated raw D & A data, and their status at the time of generation of raw D & A data and current status are different, and the contribution of the three producers is also different. In addition to the above-mentioned contents, the user confirms the substance, time, user level, price of the data, and data preview (a part of the data) required for data generation through the display information as shown in Table 1, Can be determined.
표 1을 참조하면, 사용자가 요청한 데이터의 가격은 160만원으로 결정되었는데, 이 가격은 요청된 데이터의 생성에 필요한 자원(난이도, 시간, 비용 등), 데이터를 생성한 생성자의 정보, 생성 시기를 종합적으로 고려하여 산출된 것이며, 만약 사용자 레벨이 3보다 높아지면 사용자는 160만원보다 더 할인된 가격에 데이터를 구매할 수도 있다. 또한 가격은 요청된 데이터의 종류 및 각 데이터의 획득 방법(처리, 가공 방법)을 고려하여, 산출될 수 있다. 이때. 데이터의 획득 방법(처리, 가공 방법)에 따른 가격은 생성에 필요한 자원, 시간 등에 따라 설정된 난이도 등급에 비례할 수 있다.Referring to Table 1, the price of the data requested by the user is determined to be 1,600,000 won. This price includes the resources (difficulty, time, cost, etc.) required for generating the requested data, information of the producer that generated the data, And if the user level is higher than 3, the user may purchase the data at a discount rate of less than 1.6 million won. The price can be calculated in consideration of the kind of requested data and the method of obtaining each data (processing, processing method). At this time. The price according to the data acquisition method (processing, processing method) may be proportional to the degree of difficulty set according to the resources, time, etc. required for generation.
데이터 제공부(260)는 사용자가 사용자 단말(270)을 통해 결제를 완료하면 사용자 단말(270)로 사용자가 요청한 데이터를 전송할 수 있다. 선택적 실시 예로서, 사용자가 요청한 데이터의 용량이 방대하여 유무선 네트워크를 통한 전송이 어려울 경우에는, 데이터 제공 장치(200)에 연결되어 있는 배송용 하드디스크(미도시)에 사용자가 요청한 데이터가 전송될 수도 있다. 사용자는 오프라인으로 배송용 하드디스크를 수신함으로써, 사용자가 사용자 단말(270)을 통해 요청했던 데이터를 제공받을 수 있다.The
선택적 실시 예로서, 데이터 요청에 포함된 조건은 전술한 사용자가 요청한 데이터의 대상물질, 종류, 처리방법의 종류, 생성 시기 외에 데이터의 예산 범위, 총 한도 금액 중 적어도 하나를 포함할 수 있다.As an alternative embodiment, the condition included in the data request may include at least one of the target material, the type of the data requested by the user, the kind of the processing method, the budget range of the data besides the generation time, and the total limit amount.
사용자는 사용자 단말(270)을 통해 데이터 요청을 하면서 사용자가 결제할 수 있는 금액에 대한 정보도 같이 전송함으로써, 데이터 제공 장치(200)가 그 금액에 대한 정보를 고려하여 데이터를 제공하도록 할 수 있다. 이 선택적 실시 예에 의하면, 데이터 제공부(260)는 데이터의 예산 범위에 포함된 최소 금액 또는 최대 금액을 고려하여 데이터 검색부(230)에 의해 검색된 데이터 중 일부를 추출하고, 추출한 데이터를 사용자 단말로 제공하거나, 추출한 데이터의 가격의 총합이 총 한도 금액을 초과하지 않도록 데이터 검색부(230)에 의해 검색된 데이터 중 하나 이상의 데이터를 추출하고, 추출한 데이터를 사용자 단말(270)로 제공하는 선택적 제공부(261)를 포함할 수 있다.The user can also transmit information about the amount that the user can make payment while requesting the data through the
선택적 실시예에서, 데이터 요청 수신부(210)는 사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신할 수 있다. 또한, 데이터 요청 수신부(210)는 유전체 관련 데이터를 포함하는 검색 요청을 수신할 수 있다. 검색 요청은 다양한 사용자 입력을 통해 수신되며, 병리학적 데이터 뿐만 아니라 생물학적 데이터를 포함할 수 있다. 병리학적 데이터를 포함하는 검색 요청의 경우에는 데이터 속성 결정부(220)는 상기 병리학적 데이터와 관련된 유전자의 종류를 추출할 수 있다. 예를 들어, 데이터 속성 결정부(220)는 병리학적 데이터인 위암과 관련된 유전자의 종류를 추출할 수 있다. In an alternative embodiment, the
데이터 속성 결정부(220)는 병리학적 데이터 뿐만 아니라, 검색 요청에 포함된 다른 조건을 고려하여, 상기 검색 요청과 대응되는 유전자의 종류 및 대상체의 또 다른 속성을 결정할 수 있다. 유전체 관련 데이터를 포함하는 검색 요청의 경우에는 데이터 속성 결정부(220)는 검색 요청에 포함된 데이터의 종류를 고려하여, 상기 유전체 관련 데이터로부터 검색 대상의 속성을 결정할 수 있다. 예를 들어, 질병인 유방암을 포함하는 검색 요청의 응답으로, 데이터 속성 결정부(220)는 Estrogen Receptor (ER) 유전자를 추출하고, 데이터 검색부(230)는 상기 유전자에 대해서 변이가 발생한 대상체를 검색할 수 있다. 데이터 검색부(230)는 검색된 대상체의 해당 유전자에 대한 변이 여부, 변이 종류를 검색할 수 있다. 또한, 질병인 폐암을 포함하는 검색 요청의 응답으로, 데이터 속성 결정부(220)는 EGFR 유전자를 추출하고, 데이터 검색부(230)는 상기 유전자에 대해서 변이가 발생한 대상체를 검색할 수 있다. 데이터 검색부(230)는 검색된 대상체의 해당 유전자에 대한 변이 여부, 변이 종류를 검색할 수 있다.The data attribute
데이터 속성 결정부(220)는 제1 시점에서는 제1 질병과 관련된 유전자로서 제1 유전자를 추출하다가도, 제1 시점 이후의 연구 결과에 따라 제1 시점으로부터 소정의 시간 이후의 제2 시점에서는 제1 질병과 동일한 질병에 대해서, 제1 유전자와 다른 제2 유전자를 추출하도록 할 수 있다. 즉, 데이터 속성 결정부(220)는 시간이 흘러 많은 연구가 이루어져 제1 시점에서의 결정된 데이터 및 제2 시점에서의 결정된 데이터를 다르게 결정할 수 있다. 즉, 이를 통해, 사용자는 데이터를 요청한 시점에 따라 다른 데이터를 제공 받을 수 있게 된다. 이를 통해, 본 발명의 실시예들에 따른 데이터 제공 장치(200)는 과학, 의료 기술의 진보를 반영할 수 있는 데이터를 제공하게 된다. The data attribute
데이터 속성 결정부(220)는 질병 및 질병에 대한 치료, 처방 내역 등을 포함하는 검색 요청의 응답으로, 상기 질병 및 치료, 처방 내역이 동일한 대상체를 검색하도록 할 수 있다. 즉, 데이터 속성 결정부(220)는 상기 질병 및 치료, 처방 내역이 동일한 대상체를 검색하는 검색식을 생성할 수도 있다. The data attribute
데이터 검색부(230)는 상기 제1 병리학적 데이터와 관련된 상기 유전자의 종류에 포함되는 각 유전자의 발현 정도를 검색하고, 각 유전자의 발현 정도로 발현된 생물학적 데이터를 검색하고, 상기 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색한다. The
데이터 제공부(260)는 상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로 제공한다. The
가격 결정부(250)는 상기 제2 생물학적 데이터의 적정성 또는 상기 제2 병리학적 데이터의 완전성을 기초로 상기 사용자에게 청구할 청구 금액을 결정할 수 있다. 추가적으로, 가격 결정부(250)는 상기 청구 금액에 대한 결제 처리를 사용자의 단말로 전송할 수 있다. 여기서, 생물학적 데이터의 적정성 및 병리학적 데이터의 완전성은 도 10에 대한 설명에서 자세히 하겠다. The
생성자 단말(280)은 데이터 제공 장치(200)에 저장되어 있는 데이터와 동종의 데이터를 생성할 수 있는 전문가가 이용하는 사용자 단말의 한 종류이다. 생성자 단말(280)은 사용자 단말(270)의 기능을 필수적으로 포함한다. 생성자 단말(280)은 운영자 단말(290)에 데이터 업로드 요청을 하여 운영자가 운영자 단말(290)을 통해 데이터 제공 장치(200)에 저장되는 데이터를 업데이트할 수 있도록 하는 기능을 포함할 수 있다. 생성자 단말(280)은 각종 유무선 네트워크로 데이터 제공 장치(200)에 연결될 수 있으며, 운영자 단말(290)에 연결될 수 있다.The
운영자 단말(290)은 데이터 제공 장치(200)에 접속하여 데이터 제공 장치(200)에 저장되어 있는 데이터의 업데이트 및 데이터 제공 장치(200)의 동작을 위한 프로그램의 유지 및 보수를 수행한다. 운영자 단말(290)은 사용자 단말(270)과 생성자 단말(280)을 각각 구별하기 위한 식별코드를 각 사용자 단말(270)과 생성자 단말(280)에 부여할 수 있다. 운영자 단말(290)은 업로드 요청을 할 수 있는 식별코드를 가진 생성자 단말(280)에 한해 데이터 업로드 요청을 할 수 있도록 하여 데이터 제공 장치(200)에 저장될 수 있는 데이터의 품질 및 신뢰도를 확보할 수 있다.The
데이터 제공 장치(200)는 도 3에 도시된 바와 같은 데이터의 구조로 데이터를 저장할 수 있다. 데이터의 구조에 대해서 설명하면, 아래와 같다. 비디지털 데이터 그룹(310)은 사람의 행동이 개입되어 실험이 행해지고 데이터가 산출되는 부분으로, 인체 종양 조직(A1), 디앤에이(A2), 알엔에이(A3), 단백질(A4), 및 대사체(A5)를 포함할 수 있다.The
데이터베이스 그룹(330)은 본 발명에 따른 데이터 제공 장치에 저장되는 데이터를 포함하며, 디앤에이 소규모 데이터베이스(331), 알엔에이 소규모 데이터베이스(333), 단백질 소규모 데이터베이스(335), 대사체 소규모 데이터베이스(337)를 포함할 수 있다.The
데이터 제공 장치(200)에 의해 사용자 단말(270)로 제공될 수 있는 데이터의 일 예로, 인체 종양 조직(A1)의 대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)가 있다. 인체 종양 조직(A10)에 대한 데이터가 연구자에게 의미 있는 데이터가 되기 위해서는, 인체 종양 조직으로부터 파생물을 추출하고, 추출된 파생물(A2, A3, A4, A5)에 유전체학, 전사체학, 단백질체학, 대사체학 기법을 적용하여 대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)를 생성하는 과정이 필요하다.A3-1, A4-1, A5-1) of the human tumor tissue (A1) as an example of data that can be provided to the user terminal (270) by the data providing apparatus (200) . In order for the data on human tumor tissue (A10) to be meaningful data to the researcher, it is necessary to extract the derivative from human tumor tissue and to apply the extracted genetic material (A2, A3, A4, A5) It is necessary to generate a large amount of raw data (A2-1, A3-1, A4-1, A5-1) by applying a choreography technique.
대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)를 생성하는 과정에서 최초의 인체 종양 조직(A1)은 소멸될 뿐만 아니라, 인체 종양 조직(A1)으로부터 추출된 파생물(A2)에 적용되는 각종 기법은 막대한 비용을 필요로 하므로, 대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)는 수집하기 어렵고 수량이 한정된 특성을 갖는다.In the process of generating large-volume raw data (A2-1, A3-1, A4-1, A5-1), not only the first human tumor tissue (A1) is annihilated, but also the foreign body tissue (A1) A2) require enormous cost, large-volume raw data (A2-1, A3-1, A4-1, A5-1) are difficult to collect and have a limited number of characteristics.
인체 종양 조직(A1)으로부터 연구에 사용할 디앤에이(DNA, DeoxyriboNucleic Acid)(A2), 알엔에이(RNA, RiboNucleic Acid)(A3), 단백질(Protein)(A4), 대사체(Metabolites)(A5)가 추출될 수 있다. 디앤에이 추출물(A2)의 경우, 유전체학 기법인 전유전체 염기서열분석(WGS, Whole Genome Sequencing)나 전엑솜 염기서열분석(WES, Whole Exome Sequencing)등이 적용되어 미가공 디앤에이 데이터(A2-1, 유전자 변이 데이터)가 생성될 수 있다.DNA (DeoxyriboNucleic Acid) (A2), RNA (RiboNucleic Acid) (A3), Protein (A4), Metabolites (A5) for use in research from human tumor tissues (A1) Can be extracted. In the case of D & A extract (A2), genomic techniques such as whole genome sequencing (WGS) and whole exome sequencing (WES) Gene mutation data) can be generated.
알엔에이 추출물(A3)의 경우, 전사체학 기법인 마이크로어레이(Microarray)나 알엔에이 염기서열분석(RNA Sequencing)이 적용되어 미가공 알엔에이 데이터(A3-1, 전사체 발현 데이터)가 생성될 수 있다.In the case of the RNase A extract (A3), raw RNE data (A3-1, transcript expression data) can be generated by applying a microarray or RNA sequencing, which is a transcription system technique .
단백질 추출물(A4)의 경우, 단백질체학 기법인 말디토프(MALDI-TOF, Matrix-Assisted Laser Desorption-Ionization Time Of Flight), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry) 등이 적용되어 정량, 정성적 미가공 단백질 데이터(A4-1)가 생성될 수 있다.In the case of protein extract (A4), Matrix-Assisted Laser Desorption-Ionization Time of Flight (MALDI-TOF), liquid chromatography-mass spectrometry (LC-MS) Quantitative, qualitative raw protein data (A4-1) can be generated.
대사체 추출물(A5)의 경우, 대사체학 기법인 핵자기공명-질량분석(NMR-MS, Nuclear Magnetic Resonance-Mass Spectrometry), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 가스 크로마토그래피-질량 분석(GC-MS, Gas Chromatography-Mass Spectrometry) 등과 같은 기법으로 정량, 정성적 대사체 데이터(A5-1)가 생성될 수 있다.In the case of the metabolite extract (A5), the metabolism techniques such as nuclear magnetic resonance-mass spectrometry (NMR-MS), liquid chromatography-mass spectrometry (LC-MS) Quantitative, qualitative metabolite data (A5-1) can be generated by techniques such as gas chromatography-mass spectrometry (GC-MS).
전술한 과정을 통해 산출된 유전자 변이 데이터(A2-1), 전사체 발현 데이터(A3-1), 단백질 데이터(A4-1), 대사체 데이터(A5-1)는 오믹스(Omics) 데이터 또는 대용량 미가공 데이터라고 통칭될 수 있으며, 인체 종양 조직(A1)을 연구하는 연구자가 해당 인체 종양 조직을 분석하는 데에 이용할 수 있다.The gene mutation data (A2-1), transcript expression data (A3-1), protein data (A4-1), and metabolism data (A5-1) calculated through the above-described process are used as Omics data or It can be referred to as large-volume raw data and can be used by researchers studying human tumor tissue (A1) to analyze the human tumor tissue.
위와 같은 방식으로 산출된 대용량 미가공 데이터는 디지털 처리가 되어 데이터 제공 장치의 데이터베이스 그룹(330)에 저장되며, 사용자의 요청에 따라서 추가로 가공되어 사용자에게 제공될 수 있다.The large-volume unprocessed data calculated in the above manner is digitally processed and stored in the
인체 종양 조직(A1)의 대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)는 각 소규모 데이터베이스(331, 333, 335, 337)에 포함된 각 미가공 데이터에 대응되는 가공처리부(3311, 3331, 3351, 3371)에 의해 가공처리되어 대용량 가공 데이터(A2-2, A3-2, A4-2, A5-2)가 될 수 있다. 예를 들어, 인체 종양 조직(A1)의 대용량 가공 데이터(A2-2, A3-2, A4-2, A5-2)에는, 항암제 개발 데이터, 항암제 리포지셔닝(Repositioning) 데이터, 인체 종양 진단 데이터, 바이오마커(biomarker)가 포함될 수 있다.The large-volume raw data A2-1, A3-1, A4-1, and A5-1 of the human tumor tissue A1 are processed by processing corresponding to each raw data included in each of the
전술한 것과 같이 대용량 가공 데이터는 사용자의 요청에 따라 사용자에게 제공된 후에는 소규모 데이터베이스에서 삭제될 수 있다. 또한, 도 3은 미가공 데이터와 가공 데이터의 설명의 편의를 위해서 데이터 제공 장치의 데이터를 인체 종양 조직에 대한 데이터로 한정한 것이므로, 도 3에서 인체 종양 조직에 대한 데이터는 다른 종류의 데이터로도 변경적용이 가능하다.As described above, the large-capacity processed data can be deleted from the small-scale database after being provided to the user at the request of the user. 3, the data of the data providing apparatus is limited to the data for the human tumor tissue for convenience of explanation of the raw data and the processed data. Therefore, in FIG. 3, the data on the human tumor tissue may be changed to other kinds of data It is applicable.
도 4는 본 발명의 다른 일 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.4 is a flowchart illustrating a data providing method for disease mechanism research according to another embodiment of the present invention.
사용자 단말(410)은 데이터 제공 장치(430)에 데이터 요청을 송신한다(S410). 데이터 제공 장치(430)는 데이터 요청에 포함된 조건을 기초로 데이터 속성을 결정한다(S420).The
데이터 속성은 데이터 요청에 포함된 조건을 기초로 결정되며, 데이터 요청에 포함된 각각의 조건을 특징값(feature)으로 하는 하나 이상의 값으로 결정될 수 있다. 최종적으로 제공할 데이터 속성은 테이블 형태가 될 수 있다.The data attribute is determined based on the conditions included in the data request, and may be determined as one or more values, each of the conditions included in the data request being a feature. The data attribute to be finally provided can be a table type.
데이터 제공 장치(430)는 데이터 속성에 대응되는 데이터를 검색한다(S430). S430의 동작은 데이터 검색부와 동일하므로, 상세한 설명을 생략한다. The
데이터 제공 장치(430)는 검색된 데이터의 메타데이터로 데이터의 가격을 결정한다(S440). S440의 동작은 가격 결정부와 동일하므로, 상세한 설명을 생략한다. The
데이터 제공 장치(430)는 데이터 및 데이터의 가격을 포함하는 표시 정보를 사용자 단말(410)로 제공한다(S450). The
도 5는 본 발명의 또 다른 일 실시 예에 따른 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.5 is a flowchart illustrating a data providing method according to another embodiment of the present invention.
사용자 단말(510)은 데이터 제공 장치(530)에 데이터 요청을 송신한다(S505). 데이터 제공 장치(430)는 데이터 요청에 포함된 조건을 기초로 데이터 속성을 결정한다(S510).The
데이터 요청에 포함된 조건은 사용자가 요청한 데이터의 대상물질, 종류, 처리방법의 종류, 생성 시기, 사용자가 결제할 수 있는 데이터의 가격범위, 총 한도 금액 중 적어도 하나를 포함할 수 있다.The conditions included in the data request may include at least one of the target substance of the data requested by the user, the kind, the kind of the processing method, the generation time, the price range of the data the user can settle, and the total limit amount.
데이터 속성은 데이터 요청에 포함된 조건을 기초로 결정되며, 데이터 요청에 포함된 각각의 조건을 특징값(feature)으로 하는 테이블 형태가 될 수 있다.The data attribute is determined based on the condition included in the data request, and may be a table type having each condition included in the data request as a feature.
데이터 제공 장치(530)는 데이터 속성에 대응되는 데이터를 검색한다(S515). 데이터 제공 장치(530)는 검색된 데이터의 메타데이터로 가격을 결정하고 결정된 가격을 차등적으로 조정할 수 있다(S520).The
검색된 데이터의 메타데이터에는 데이터 생성자에 대한 정보, 데이터 생성에 필요한 시간, 데이터 생성에 필요한 자원이 포함될 수 있고, 데이터 생성자에 대한 정보에는 데이터 생성자의 데이터 생성 당시의 지위와 현재의 지위가 포함될 수 있다. 데이터 제공 장치(530)는 데이터의 메타데이터 중 하나만으로 가격을 결정할 수도 있다. 예를 들어, 데이터의 생성자의 생성시 지위만을 고려하여 데이터의 가격을 결정할 수 있다.The meta data of the retrieved data may include information on the data creator, time required for data generation, and resources necessary for data generation, and the information on the data creator may include the status of the data creator at the time of data generation and the current status . The
여기서, 생성자의 지위는 생성자의 최종학력, 생성자의 전공, 생성자의 직업, 생성자의 누적 논문수, 생성자의 수상 경력을 포함하거나, 생성자의 최종학력, 생성자의 전공, 생성자의 직업, 생성자의 누적 논문수, 생성자의 수상 경력 등을 종합하여 산출된 하나의 등급이 될 수도 있다.Here, the status of the constructor includes the final educational background of the constructor, the major of the constructor, the occupation of the constructor, the number of papers of the constructor, the awards of the constructor, or the final academic achievement of the constructor, the major of the constructor, Number, and the creator's awards.
단계 520에서 데이터를 요청한 사용자와 데이터를 생성한 생성자가 동일하거나, 데이터를 요청한 사용자가 데이터를 생성하는 데에 기여했다면, 그 내용을 반영하여 데이터의 가격은 낮은 가격으로 조정될 수 있다.If the user who requested the data and the creator that generated the data are the same in step 520 or the user who requested the data contributes to the generation of the data, the price of the data may be adjusted to a lower price by reflecting the contents.
선택적 실시 예로서, 단계 520에서 생성자에 대한 정보에는 레벨 정보가 포함될 수 있다. 생성자의 레벨 정보는 생성자가 생성한 데이터의 수, 생성자가 생성한 데이터의 누적 판매량, 생성자가 생성한 데이터로부터의 수입 중 적어도 하나를 고려하여 결정될 수 있다. 높은 레벨의 생성자는 본 발명에 따른 데이터 제공 장치에 데이터를 생성하여 업로드하면 업로드된 데이터가 높은 판매가격으로 결정되거나, 데이터 제공 장치로부터 데이터를 제공받을 때에 일정비율 할인을 받을 수 있는 것과 같은 혜택을 누릴 수 있다.In an alternative embodiment, level information may be included in the information about the generator in step 520. [ The level information of the generator can be determined in consideration of at least one of the number of data generated by the generator, the cumulative sales amount of the data generated by the generator, and the income from the data generated by the generator. A high level creator can benefit from the fact that when the data is created and uploaded to the data providing apparatus according to the present invention, the uploaded data is determined as a high selling price or a certain rate discount can be received when data is provided from the data providing apparatus Can enjoy.
데이터 제공 장치(530)는 단계 520에서 최종 결정된 가격과 사용자가 입력한 결제가능한 금액을 비교하여 사용자 단말에 제공할 데이터를 결정할 수 있다(S525).The
데이터 제공 장치(530)는 데이터 및 데이터의 가격을 포함한 표시 정보를 사용자 단말(510)에 제공할 수 있다(S530).The
사용자는 사용자 단말(510)을 통해 표시 정보를 확인하고, 데이터를 구매하기로 결정한 후, 결제 정보를 사용자 단말(510)을 통해 데이터 제공 장치(530)로 전송할 수 있다(S535).The user confirms the display information through the
데이터 제공 장치(530)는 사용자 단말(510)로부터 수신한 결제 정보의 진위를 확인하고, 결제를 승인할 수 있다(S540).The
데이터 제공 장치(530)는 사용자가 요청한 데이터를 어떤 방식으로 제공할 지 결정한다(S545).The
사용자가 유무선 네트워크를 통해 사용자 단말(510)로 데이터를 전송할 것을 요청하거나, 사용자가 요청한 데이터의 용량이 미리 설정된 기준용량을 초과하지 않으면, 데이터 제공 장치(530)는 사용자 단말(510)로 사용자가 요청한 데이터를 전송한다(S550).If the user requests to transmit data to the
사용자가 보안 등을 이유로 유무선 네트워크를 통해 사용자 단말(510)로 데이터를 전송하지 않을 것을 요청하거나, 사용자가 요청한 데이터의 용량이 미리 설정된 기준용량을 초과하면, 데이터 제공 장치(530)는 사용자에게 배송할 하드디스크에 데이터를 압축 및 암호화하여 전송한다(S555). 단계 555에서, 사용자가 요청한 데이터를 저장하고 있는 하드디스크가 오프라인으로 사용자에게 직접 전달됨으로써, 사용자는 데이터 제공 장치(530)에 요청한 데이터를 제공받을 수 있다.When the user requests not to transmit data to the
도 6은 본 발명의 또 다른 일 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 장치를 기준으로 한 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.FIG. 6 is a flowchart illustrating a data providing method based on a data providing apparatus for disease mechanism research according to another embodiment of the present invention. Referring to FIG.
전술한 도 4 및 도 5과 대비하기 위해, 도 6에서는 데이터 제공 장치를 기준으로 하여 데이터 제공 방법을 설명한다.In order to compare with FIG. 4 and FIG. 5 described above, FIG. 6 illustrates a data providing method based on the data providing apparatus.
데이터 제공 장치는 사용자 단말로부터 데이터 요청을 수신한다(S610).The data providing apparatus receives a data request from the user terminal (S610).
데이터 제공 장치는 데이터 요청에 포함된 조건을 기초로 데이터 속성을 결정한다(S620). 데이터 요청에 포함된 조건은 사용자가 요청한 데이터의 대상물질, 종류, 처리방법의 종류, 생성 시기, 사용자가 결제할 수 있는 데이터의 가격범위, 총 한도 금액 중 적어도 하나를 포함할 수 있다.The data providing apparatus determines a data attribute based on the condition included in the data request (S620). The conditions included in the data request may include at least one of the target substance of the data requested by the user, the kind, the kind of the processing method, the generation time, the price range of the data the user can settle, and the total limit amount.
데이터 제공 장치는 데이터 속성에 대응되는 데이터를 검색한다(S630).The data providing apparatus retrieves data corresponding to the data attribute (S630).
데이터 제공 장치는 검색된 데이터의 메타데이터로 가격을 결정하고 결정된 가격을 차등적으로 조정할 수 있다(S640).The data providing apparatus may determine the price as meta data of the searched data and adjust the determined price differentially (S640).
검색된 데이터의 메타데이터에는 데이터 생성자에 대한 정보, 데이터 생성에 필요한 시간, 데이터 생성에 필요한 자원이 포함될 수 있고, 데이터 생성자에 대한 정보에는 데이터 생성자의 데이터 생성 당시의 지위와 현재의 지위가 포함될 수 있다. 단계 640에서 데이터를 요청한 사용자와 데이터를 생성한 생성자가 동일하거나, 데이터를 요청한 사용자가 데이터를 생성하는 데에 기여했다면, 그 내용을 반영하여 데이터의 가격은 낮은 가격으로 조정될 수 있다. 또한, 선택적 실시 예로서, 단계 640에서 생성자에 대한 정보에는 레벨 정보가 포함될 수 있어, 높은 레벨의 생성자가 데이터 구매에 있어서 할인 혜택을 받을 수 있도록 할 수 있다.The meta data of the retrieved data may include information on the data creator, time required for data generation, and resources necessary for data generation, and the information on the data creator may include the status of the data creator at the time of data generation and the current status . If the user who requested the data and the creator that generated the data are the same in step 640 or the user who requested the data has contributed to the generation of the data, the price of the data may be adjusted to a lower price by reflecting the contents. Also, as an alternative embodiment, level information may be included in the information about the constructor in step 640, so that a high-level constructor can receive discounts on data purchase.
데이터 제공 장치는 단계 640에서 최종 결정된 가격과 사용자가 입력한 결제가능한 금액을 비교하여 사용자 단말에 제공할 데이터를 결정할 수 있다(S650).In step S650, the data providing apparatus compares the final determined price with the settlement amount input by the user in step 640 and determines data to be provided to the user terminal.
데이터 제공 장치는 데이터 및 데이터의 가격을 포함한 표시 정보를 사용자 단말에 제공할 수 있다(S660). 단계 660에서 데이터 제공 장치는 표시 정보를 사용자 단말에 제공함과 동시에 전자상 결제를 요청할 수도 있다.The data providing apparatus may provide display information including the price of data and data to the user terminal (S660). In step 660, the data providing apparatus may request the electronic settlement while providing the display information to the user terminal.
데이터 제공 장치는 사용자 단말로부터 결제 정보를 수신하여, 결제가 적법한 절차를 거쳐 이루어졌는지 여부를 확인한다(S670).The data providing apparatus receives the payment information from the user terminal, and confirms whether payment has been made through a proper procedure (S670).
데이터 제공 장치는 사용자가 원하는 제공 방법에 따라 사용자가 요청한 데이터를 제공한다(S680). 단계 680에서 데이터 제공 장치는 사용자가 요청한 데이터를 사용자가 원하는 제공 방법 외에 사용자가 요청한 데이터의 크기도 함께 고려하여 사용자가 요청한 데이터를 제공할 수도 있다. The data providing apparatus provides the data requested by the user according to the providing method desired by the user (S680). In step 680, the data providing apparatus may provide the data requested by the user in consideration of the size of the data requested by the user, in addition to the method of providing the data requested by the user.
예를 들어, 사용자가 유무선 네트워크를 통해 사용자 단말로 데이터를 전송할 것을 요청하거나, 사용자가 요청한 데이터의 용량이 미리 설정된 기준용량을 초과하지 않으면, 데이터 제공 장치는 사용자 단말로 사용자가 요청한 데이터를 전송할 수 있다.For example, if the user requests to transmit data to the user terminal via the wired or wireless network, or if the capacity of the data requested by the user does not exceed the preset reference capacity, the data providing device can transmit the data requested by the user to the user terminal have.
다른 예로서, 사용자가 보안 등을 이유로 유무선 네트워크를 통해 사용자 단말로 데이터를 전송하지 않을 것을 요청하거나, 사용자가 요청한 데이터의 용량이 미리 설정된 기준용량을 초과하면, 데이터 제공 장치는 사용자에게 배송할 하드디스크에 데이터를 압축 및 암호화하여 전송할 수 있다. 단계 680에서, 사용자가 요청한 데이터를 저장하고 있는 하드디스크가 오프라인으로 사용자에게 직접 전달됨으로써, 사용자는 데이터 제공 장치에 요청한 데이터를 제공받을 수 있게 된다.As another example, when the user requests to not transmit data to the user terminal via the wired / wireless network due to security or the like, or when the capacity of the data requested by the user exceeds the preset reference capacity, It is possible to compress and encrypt the data on the disk and transmit it. In step 680, the hard disk storing the data requested by the user is directly transferred to the user offline, so that the user can receive the requested data to the data providing apparatus.
도 7은 생체 세포로부터 데이터를 생성하는 과정을 설명하기 위한 도면이다. 7 is a diagram for explaining a process of generating data from a living cell.
데이터 제공 장치(200)는 대상체(object)의 생체 세포(D1)로부터 획득된 생물학적 데이터를 제1 레코드(R1)로 생성할 수 있다. 여기서, 생체 세포는 세포에 한정되지 않고 조직(Tissue), 타액(saliva), 혈액(Blood), 소변(urine), 체액(body fluid), 단백질(protein, DNA, RNA) 등을 포함할 수 있다. 데이터 제공 장치(200)는 대상체(object)에 대한 병리학적 데이터(D2)를 제2 레코드(R2)로 생성할 수 있다. The
대상체와 대응되는 생물학적 데이터의 레코드(R1)은 세포를 소정의 처리 방법으로 처리하여 획득되는 데이터로서, 유전자들의 배열 및 각 유전자의 발현 정도, 발현 여부, 돌연변이 발생 여부 등을 포함할 수 있다. 여기서, 처리 방법의 예시로는 유전체학 기법인 전유전체 염기서열분석(WGS, Whole Genome Sequencing)나 전엑솜 염기서열분석(WES, Whole Exome Sequencing), 마이크로어레이(Microarray)나 알엔에이 염기서열분석(RNA Sequencing), 말디토프(MALDI-TOF, Matrix-Assisted Laser Desorption-Ionization Time Of Flight), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 대사체학 기법인 핵자기공명-질량분석(NMR-MS, Nuclear Magnetic Resonance-Mass Spectrometry), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 가스 크로마토그래피-질량 분석(GC-MS, Gas Chromatography-Mass Spectrometry) 등이 있을 수 있다. 즉, 도 7에 도시된 바와 같이, 제1 레코드(R1)는 상기 생체 세포로부터 획득된 유전자들의 배열 정보(op1-1), 각 유전자의 발현 정도(op1-2), 발현 여부(op1-3), 돌연변이 존재 여부(op1-4) 등을 포함할 수 있다. 대상체의 생체 세포는 종에 따라 동일한 유전자 배열을 가지게 된다. 대상체의 유전적 특성은 달라지므로, 각 유전자의 발현 여부 및 발현 정도는 달라지게 된다. 제1 레코드(R1)는 유전체의 이름, 유전체 내 위치, 원래 값, 변경 값, 변이 타입, 엑손 내 위치, 유전자의 특이 사항 등을 포함할 수 있다. 원래 값은 해당 유전체의 염기 서열의 값에 대한 것으로, 정상인의 염기 서열을 의미한다. 변경 값은 대상체의 염기 서열을 의미한다. 제1 레코드(R1)는 정상인의 염기 서열과 대상체의 염기 서열 사이에 차이가 있으면서, 표현되는 단백질에도 차이가 나는 정보를 더 포함할 수 있다. 여기서, 변이 타입은 염기 서열 중 일부 염기 서열의 제거, 변경, 삽입 중 하나를 말하며, 염기 서열이 변경되더라도 발현되는 단백질에 차이가 없는 경우는 염기 서열이 변이되지 않은 것으로 볼 수 있다. 제2 레코드(R2)는 상기 대상체와 관련된 질병, 질환 등의 병리학적 데이터를 포함하며, 대상체와 관련하여 생성된 각 항목의 생성 시점(op2-1) 및 각 항목에 대한 상세 정보(op2-2)를 포함할 수 있다. 또한, 제2 레코드(R2)는 대상체와 관련된 질병에 대한 처방, 치료 내역을 제공하면서, 해당 처방, 치료 내역을 통해 획득되어진 결과, 예후와 관련된 정보를 더 포함할 수 있다. 제2 레코드(R2)는 의료 기관(병원, 약국 등)의 서버로부터 획득되어지는 데이터를 포함하게 된다. The record R1 of the biological data corresponding to the object is data obtained by processing the cell by a predetermined processing method and may include the arrangement of the genes, the degree of expression of each gene, whether or not the gene is expressed, and whether mutation has occurred. Herein, examples of the treatment method include genomic techniques such as whole genome sequencing (WGS), whole exome sequencing (WES), microarray or RNA sequencing (RNA Sequencing, Matrix-Assisted Laser Desorption-Ionization Time of Flight (MALDI-TOF), Liquid Chromatography-Mass Spectrometry (LC-MS), Nuclear Magnetic Resonance- (NMR-MS, Nuclear Magnetic Resonance-Mass Spectrometry), Liquid Chromatography-Mass Spectrometry (LC-MS), Gas Chromatography-Mass Spectrometry Can be. 7, the first record R1 includes the sequence information (op1-1) of the genes obtained from the living cells, the expression level (op1-2) of each gene, the expression level (op1-3 ), The presence or absence of a mutation (op1-4), and the like. Biological cells of a subject have the same gene sequence depending on the species. Because the genetic characteristics of the subject are different, the expression and expression level of each gene will be different. The first record R1 may include the name of the dielectric, the position in the dielectric, the original value, the modification value, the type of mutation, the position in the exon, the specificity of the gene, and the like. The original value refers to the value of the nucleotide sequence of the corresponding genome and means the nucleotide sequence of a normal person. The change value means the nucleotide sequence of the subject. The first record (R1) may further include information indicating a difference between the nucleotide sequence of the normal person and the nucleotide sequence of the subject, and the difference in the expressed protein. Here, the mutation type refers to one of removal, modification, and insertion of some base sequences in the base sequence, and even if the base sequence is changed, the base sequence may not be mutated if there is no difference in the expressed protein. The second record R2 includes pathological data such as diseases and diseases associated with the object, and includes a generation time (op2-1) of each item generated with respect to the object and detailed information (op2-2 ). In addition, the second record R2 may further include information related to the prescription, a result obtained through the treatment history, and the prognosis, while providing a prescription and treatment history for the disease associated with the subject. The second record R2 contains data obtained from a server of a medical institution (hospital, pharmacy, etc.).
도 8 및 도 9는 본 발명의 실시예들에 따른 질병 기전 연구를 위한 데이터 제공 방법의 흐름도들이다. 8 and 9 are flowcharts of a data providing method for disease mechanism research according to embodiments of the present invention.
도 8을 참조하면, 본 발명의 실시예들에 따른 데이터 제공 방법은 데이터 수집 단계(S801), 데이터 1차 분석 단계(S802), 방법 선택 단계(S803), 데이터 획득 단계(S804), 레코드 생성 단계(S805)를 포함할 수 있다. Referring to FIG. 8, a method of providing data according to embodiments of the present invention includes a data collection step S801, a data primary analysis step S802, a method selection step S803, a data acquisition step S804, Step S805.
S801에서는 데이터 제공 장치(200)는 하나 이상의 대상체로부터 획득된 생체 세포 및 상기 하나 이상의 대상체에 대한 병리학적 데이터를 수집할 수 있다. 여기서, 대상체는 사람, 동물, 식물 등과 같은 생물을 말하며, 여기서, 생체 세포는 대상체로부터 획득된 세포로서, 종류를 불문한 모든 세포들을 포함할 수 있다. 여기서, 병리학적 데이터는 상기 대상체와 관련된 질병, 질환 등에 대한 것으로, 상기 대상체의 진단, 진료, 치료, 경과 등을 종합적으로 포함하는 데이터일 수 있다. In S801, the
S802에서는 데이터 제공 장치(200)는 상기 생체 세포를 1차적으로 분석할 수 있다. 이때, 생체 세포의 양을 고려하여, 데이터 제공 장치(200)는 상기 생체 세포를 유전체 데이터, 전사체 데이터를 획득할 수 있도록 1차적으로 처리할 수 있다. 데이터 제공 장치(200)는 유전체의 염기 변이를 확인할 수 있는 유전체 데이터를 획득하기 위한 처리 방법, 유전체의 발현 여부를 확인할 수 있는 전사체 데이터를 획득하기 위한 처리 방법을 이용하여, 상기 생체 세포를 분석할 수 있다. 데이터 제공 장치(200)는 생체 세포의 외관, 생체 세포의 크기, 보관 상태, 대상체의 병리학적 데이터 등을 고려하여, 생체 세포를 분석할 수 있다. 데이터 제공 장치(200)는 생체 세포에 소정의 처리를 함으로써, 생체 세포를 1차적으로 분석할 수 있다. 예를 들어, 데이터 제공 장치(200)는 생체 세포에 포함된 DNA에 열을 가하여, 이중 나선의 DNA를 단일 가닥으로 처리함으로써, 생체 세포를 1차적으로 분석할 수 있다. 데이터 제공 장치(200)는 소량의 DNA를 염기 순서가 동일한 양의 DNA로 증폭시킴으로써, 생체 세포를 1차적으로 분석할 수 있다. In step S802, the
S803에서는 데이터 제공 장치(200)는 상기 1차적으로 분석한 결과를 이용하여, 상기 생체 세포를 처리하는 처리 방법을 선택할 수 있다. 이때, 처리 방법은 하나 이상일 수 있다. 이때, 처리 방법의 선택 기준은 가격, 시간, 획득하고자 하는 데이터에 따라 달라질 수 있다. In S803, the
생체 세포는 그 자체로 의미 있는 데이터가 될 수 없으므로, 의미 있는 데이터가 되기 위해서는 생체 세포를 처리하는 과정이 필요하다. 생체 세포는 시퀀싱(sequencing)을 통해 처리될 수 있다. DNA 시퀀싱(sequencing)의 종류는 다양하며, 각 시퀀싱을 처리하는데 필요한 비용, 시간 등은 다양하다. Since living cells can not be meaningful data in themselves, a process of processing living cells is necessary in order to become meaningful data. Biological cells can be processed through sequencing. There are many types of DNA sequencing, and the costs, time, etc. required to process each sequence vary.
데이터 제공 장치(200)는 생체 세포를 분석하여, 생체 세포와 관련된 조직, 기관 등을 추출할 수 있다. 데이터 제공 장치(200)는 생체 세포와 관련된 조직, 기관의 종류, 보관 상태, 크기 등을 고려하여, 생체 세포의 처리 방법을 결정할 수 있다. The
데이터 제공 장치(200)는 생체 세포의 대상체의 병리학적 데이터를 이용하여 상기 생체 세포를 처리할 처리 방법을 결정할 수도 있다. 데이터 제공 장치(200)는 생체 세포의 대상체의 종(species)에 따라 상기 생체 세포의 처리 방법을 결정할 수 있다. 생체 세포의 대상체의 종은 생체 세포를 분석하거나 관리자에 의해 결정될 수 있다. The
데이터 제공 장치(200)는 생체 세포의 대상체에 대한 기타 정보(성별, 나이, 연령, 서식지, 주거지 등)를 이용하여 상기 생체 세포를 처리할 처리 방법을 결정할 수 있다. The
S804에서는 데이터 제공 장치(200)는 상기 처리 방법으로 상기 생체 세포를 처리함으로써, 상기 생체 세포의 제1 대상체의 유전자들의 배열(gene alignment) 및 각 유전자의 발현 정도를 상기 생체 세포와 대응되는 생물학적 데이터로 획득할 수 있다. 데이터 제공 장치(200)는 생체 세포의 대상체의 종에 따라 대상체의 유전자들의 배열을 결정할 수 있다. 예를 들어, 생체 세포의 대상체가 사람인 경우, 데이터 제공 장치(200)는 사람의 유전자 배열에 따라 상기 생체 세포의 대상체에 포함된 유전자들을 분류하고, 분류된 정보를 생물학적 데이터로 생성할 수 있다. 추가적으로, 데이터 제공 장치(200)는 생체 세포를 분석하여, 각 유전자의 발현 여부 또는 돌연변이 여부도 추가적으로 획득할 수 있다. In step S804, the
S805에서는 데이터 제공 장치(200)는 상기 생물학적 데이터 및 상기 병리학적 데이터를 각각의 레코드로 생성하여 저장하고, 상기 제1 대상체와 대응되는 레코드 및 상기 생물학적 데이터의 레코드를 연결 시키고, 상기 제1 대상체와 대응되는 레코드 및 상기 병리학적 데이터의 레코드를 연결 시켜 저장할 수 있다. 여기서, 생물학적 데이터의 레코드는 2개 이상의 행을 가지는 배열(array)의 형태로 구성되며, 유전자의 종류 및 각 유전자의 발현 정도에 해당하는 데이터들을 포함할 수 있다. 병리학적 데이터의 레코드 역시 2개 이상의 행을 가지는 배열의 형태로 구성되며, 시간 순으로 정렬되거나 동일한 질병 또는 질환으로 분류될 수 있다. In step S805, the
도 9를 참조하면, 본 발명의 실시예들에 따른 데이터 제공 방법은 검색 요청 수신 단계(S901), 유전자의 종류를 추출하는 단계(S902), 데이터 검색 단계(S903), 대상체 및 레코드 검색 단계(S904), 데이터 제공 단계(S905), 청구 금액 결정 단계(S906), 상기 청구 금액에 대한 결제 처리 수행 단계(S907)를 포함할 수 있다. Referring to FIG. 9, a method of providing data according to embodiments of the present invention includes receiving a search request (S901), extracting a gene type (S902), retrieving data (S903) (Step S904), a data providing step (step S905), a charge amount determination step (step S906), and a payment processing step (step S907).
S901에서는 데이터 제공 장치(200)는 사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신 받는다. 검색 요청은 다양한 사용자 입력을 통해 수신되며, 병리학적 데이터 뿐만 아니라 생물학적 데이터도 포함할 수 있다. In step S901, the
S902에서는 데이터 제공 장치(200)는 상기 제1 병리학적 데이터와 관련된 유전자의 종류를 추출한다. 데이터 제공 장치(200)는 병리학적 데이터인 위암과 관련된 유전자의 종류를 추출한다. 병리학적 데이터의 종류에 따라 관련된 유전자의 종류는 달라진다. In step S902, the
S903에서는 데이터 제공 장치(200)는 상기 제1 병리학적 데이터와 관련된 상기 유전자의 종류에 포함되는 각 유전자의 발현 정도를 검색하고, 각 유전자의 발현 정도로 발현된 생물학적 데이터를 검색한다. In step S903, the
S904에서는 데이터 제공 장치(200)는 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색한다. 이때, 데이터 제공 장치(300)는 검색된 데이터 중에서, 이상, 장애, 변이 등을 가장 많이 포함하고 있는 생물학적 데이터 및/또는 병리학적 데이터를 보유한 대상체를 추출할 수 있다. 또는 데이터 제공 장치(200)는 검색된 데이터 중에서, 과거의 대상체의 상태 및 현재 대상체의 상태 사이의 차이가 가장 크고, 현재 대상체의 상태가 완치인 대상체를 추출하고, 상기 대상체의 생물학적 데이터 및/또는 병리학적 데이터를 추출할 수 있다. In step S904, the
S905에서는 데이터 제공 장치(200)는 상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로 제공한다. In step S905, the
S906에서는 데이터 제공 장치(200)는 상기 제2 생물학적 데이터의 적정성 또는 상기 제2 병리학적 데이터의 완전성을 기초로 상기 사용자에게 청구할 청구 금액을 결정한다. In step S906, the
S907에서는 데이터 제공 장치(200)는 상기 청구 금액에 대한 결제 처리를 사용자의 단말로 전송한다. In step S907, the
도 10은 본 발명의 실시예들에 따른 질병 기전 연구를 위한 데이터 제공 장치(200)에 포함될 수 있는 데이터 생성부(201)의 구조를 나타내는 블록도이다. 10 is a block diagram showing the structure of a
도 10을 참조하면, 데이터 생성부(201)는 데이터 수집부(202), 1차 분석부(203), 처리 방법 선택부(204), 데이터 획득부(205), 데이터 처리부(206)를 포함할 수 있다. 10, the
데이터 수집부(202)는 하나 이상의 사용자로부터 하나 이상의 대상체와 관련된 데이터를 수집한다. 데이터 수집부(202)는 하나 이상의 대상체로부터 획득된 생체 세포를 수집할 수 있으며, 각 대상체에 대한 병리학적 데이터를 수집할 수 있다. The
1차 분석부(203)는 상기 각 대상체의 생체 세포를 1차적으로 분석한다. The
처리 방법 선택부(204)는 상기 1차적 분석 결과를 이용하여 각 대상체를 처리하는 처리 방법을 선택한다. The processing
데이터 획득부(205)는 상기 1차적으로 분석한 결과를 이용하여, 상기 생체 세포를 처리하는 처리 방법을 선택하고, 상기 처리 방법으로 상기 생체 세포를 처리함으로써, 상기 생체 세포의 제1 대상체의 유전자들의 배열 및 각 유전자의 발현 정도를 상기 생체 세포와 대응되는 생물학적 데이터로 획득할 수 있다. The
데이터 처리부(206)는 상기 생물학적 데이터 및 상기 병리학적 데이터를 각각의 레코드로 생성하여 저장하고, 상기 제1 대상체와 대응되는 레코드 및 상기 생물학적 데이터의 레코드를 연결시키고, 상기 제1 대상체와 대응되는 레코드 및 상기 병리학적 데이터의 레코드를 연결 시켜 저장할 수 있다. The
상기 생물학적 데이터의 레코드는 2 이상의 행을 가지는 배열의 형태로 유전자 배열, 유전자의 발현 정도에 해당하는 데이터들을 포함할 수 있다. A record of the biological data may include data corresponding to the degree of gene expression and gene expression in the form of an array having two or more rows.
상기 병리학적 데이터는 상기 제1 대상체의 진료 내역, 상기 제1 대상체의 치료 내역, 상기 제1 대상체의 진단 내역 중 적어도 하나를 포함할 수 있다. 또한, 병리학적 데이터는 제1 대상체의 체질, 건강 정도, 성별, 직업, 유전적 가족력 등을 더 포함할 수 있다. The pathological data may include at least one of a medical history of the first object, a treatment history of the first object, and a diagnosis history of the first object. The pathological data may further include constitution, health status, sex, occupation, genetic family history, etc. of the first subject.
또 다른 실시예에서, 데이터 요청 수신부(210)는 사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신할 수 있다. 수신한 검색 요청을 처리하기 위해서, 데이터 검색부(230)는 상기 제1 병리학적 데이터와 관련된 유전자의 종류를 추출할 수 있고, 상기 제1 병리학적 데이터와 관련된 상기 유전자의 종류에 포함되는 각 유전자의 발현 정도를 검색하고, 각 유전자의 발현 정도로 발현된 생물학적 데이터를 검색할 수 있다. 또한, 데이터 검색부(230)는 상기 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색할 수 있다. 데이터 제공부(260)는 상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로 제공할 수 있다. 또한, 데이터 제공부(260)는 상기 제2 생물학적 데이터의 적정성 또는 상기 제2 병리학적 데이터의 완전성을 기초로 상기 사용자에게 청구할 청구 금액을 결정하고, 상기 청구 금액에 대한 결제 처리를 상기 사용자의 단말로 전송할 수 있다. In yet another embodiment, the
상기 제2 생물학적 데이터의 적정성은 생체 세포의 원시적 요인, 추출시 발생되는 요인, 보관시 발생되는 요인 중 적어도 하나를 통하여 결정될 수 있다. 좀더 구체적으로 살펴보면, 상기 제2 생물학적 데이터의 적정성은 생체 세포의 크기, 양이 클수록 커질 수 있다. 생체 세포가 클수록 추출할 수 있는 DNA의 양도 크기 때문이다. 상기 제2 생물학적 데이터의 적정성은 생체 세포가 불순물을 적게 포함할수록 커질 수 있다. 제2 생물학적 데이터의 적정성은 생체 세포의 보관 상태로 결정될 수 있다. 적정한 조건으로 보관된 생체 세포로부터 획득된 제2 생물학적 데이터의 적정성은 올라간다. 또한, 제2 생물학적 데이터의 적정성은 상기 제2 생물학적 데이터의 처리 방법의 정확성, 생체 세포의 상태, 생체 세포의 추출시 파괴 정도, 생체 세포의 보관시 변질 정도, 생체 세포의 처리자의 숙련 정도로 결정될 수 있다. 상기 제2 생물학적 데이터의 처리 방법의 정확성을 기초로 설정, 산출, 측정될 수 있다. 예를 들어, 제2 생물학적 데이터의 처리 방법이 최신에 출시된 방법인지 여부, 세계적으로 권위 있는 학술 논문지에 소개되었거나, 논문에 인용된 횟수, 논문에 게재된 횟수 중 적어도 하나를 고려하여, 결정될 수 있다. 또한, 제2 생물학적 데이터의 적정성은 생체 세포가 채취, 채집, 획득된 기관의 종류를 통해서 결정될 수 있다. 생체 세포가 채취, 채집, 획득된 기관이 대상체의 병리학적 데이터와의 관련성을 고려하여 상기 제2 생물학적 데이터의 적정성은 결정될 수 있다. 즉, 병리학적 데이터에 포함된 기관, 즉 질병, 질환이 있는 기관에 대한 생체 세포에 대한 생물학적 데이터의 적정성은 질병, 질환 등의 연구를 위해서 활발히 이용될 수 있기 때문에 그렇지 않은 경우보다 높게 설정될 수 있다. 생체 세포에 대한 생물학적 데이터의 적정성은 생체 세포의 채집 기관, 채집 시기, 채집된 크기 등을 고려하여 결정될 수 있다. 생체 세포의 생물학적 데이터의 적정성은 생체 세포의 채집 기관이 질병, 질환의 원인이 되는 기관인지 여부, 채집 시기가 질병, 질환의 발생 시기인지 여부, 채집된 크기 중 적어도 하나를 고려하여 결정될 수 있다. 즉, 생물학적 데이터의 적정성은 채집된 크기가 미리 설정된 크기 이상인 경우, 있다고 결정될 수 있다. The suitability of the second biological data may be determined through at least one of primitive factors of living cells, factors generated upon extraction, and factors generated during storage. More specifically, the appropriateness of the second biological data may be increased as the size and amount of living cells increase. The larger the living cells, the larger the amount of DNA that can be extracted. The suitability of the second biological data may be increased as the biological cells contain less impurities. The suitability of the second biological data can be determined as the storage state of the living cells. The appropriateness of the second biological data obtained from the stored biological cells under appropriate conditions is increased. The suitability of the second biological data may be determined by the accuracy of the method of processing the second biological data, the state of the living cells, the degree of destruction upon extraction of the living cells, the degree of deterioration during storage of the living cells, have. Can be set, calculated and measured based on the accuracy of the method of processing the second biological data. For example, it may be determined whether the method of processing the second biological data is up-to-date, taking into consideration at least one of the number of citations in a manuscript, the number of citations in a manuscript, have. In addition, the suitability of the second biological data can be determined through the type of organ in which the biological cells are collected, collected and obtained. Suitability of the second biological data can be determined in consideration of the relevance of pathological data of the organ in which the organism cells are collected, collected, and obtained. In other words, the appropriateness of biological data on organisms contained in pathological data, ie, diseased or diseased organs, can be set higher than otherwise have. The appropriateness of the biological data on the living cells can be determined in consideration of the collection organ of the living cells, the collecting time, the collected size, and the like. The adequacy of the biological data of biological cells can be determined by taking into account at least one of the collection organ of the living cell is the disease, the organ causing the disease, the collection time is the disease, the occurrence time of the disease, and the collected size. That is, the appropriateness of the biological data can be determined to be the case where the collected size is equal to or larger than a predetermined size.
생체 세포의 상태가 매우 좋을 수록, 미리 설정된 임계 상태를 초과할 경우, 생체 세포가 추출시 파괴되지 않을 수록, 미리 설정된 파괴율을 초과하지 않는 경우, 생체 세포가 보관시 변질되지 않을수록, 즉 미리 설정된 보관율을 초과하는 경우, 생체 세포의 처리자의 숙련도가 높을수록, 즉 미리 설정된 경력 이상을 가지는 경우, 제2 생물학적 데이터의 적정성은 매우 높게 설정될 수 있다. When the state of the living cells is very good, the state exceeds a predetermined threshold, the living cells are not destroyed during extraction, the predetermined destruction rate is not exceeded, the living cells are not deteriorated during storage, When the set storage rate is exceeded, the suitability of the second biological data can be set to be very high, as the operator of the biological cell has a high degree of skill, that is, has a predetermined career experience or more.
상기 제2 병리학적 데이터의 완전성은 상기 제2 병리학적 데이터의 최초 입력 시점 및 최후 입력 시점 사이의 시간 차와 비례하여 설정될 수 있다. 제2 병리학적 데이터는 대상체의 진료, 진단, 치료 내역 등을 통해서 획득되어지는 사회적인 데이터를 말하며, 진료, 진단, 치료 내역을 입력한 의료진에 대한 정보도 포함할 수 있다. 제2 병리학적 데이터의 완전성은 대상체의 수명, 나이를 고려하여 결정될 수 있다. 즉, 대상체의 수명 만큼의 시간 동안 축적된 제2 병리학적 데이터의 완전성은 매우 높게 설정되고, 대상체의 수명에 턱없이 부족한 시간 동안, 예를 들어 수명의 10프로 미만의 시간 동안 축적된 제2 병리학적 데이터의 완전성은 매우 낮게 설정될 수 있다. 특히, 제2 병리학적 데이터의 완전성은 제2 병리학적 데이터의 최초 입력 시점 및 최후 입력 시점 사이의 시간 차와 비례 하여 설정될 수 있으며, 상기 시간 차가 소정의 임계 시간, 즉 대상체의 수명 또는 나이를 초과하는 경우, 거의 완전하다고 볼 수 있도록 자연수 1 또는 100으로 설정될 수 있다. 또한, 제2 병리학적 데이터를 생성한 사용자에 대한 정보를 고려하여, 상기 제2 병리학적 데이터의 완전성은 설정될 수 있다. 제2 병리학적 데이터의 완전성은 상기 제2 병리학적 데이터의 작성자 또는 생성자의 직업이 의료부분 종사자인지 여부 및 상기 제2 병리학적 데이터의 작성자 또는 생성자의 경력의 길이를 고려하여 산출될 수 있다. 제2 병리학적 데이터의 완전성은 제2 병리학적 데이터의 작성자 또는 생성자의 직업이 의료 부분인 경우, 또는 제2 병리학적 데이터의 작성자 또는 생성자의 경력의 길이가 길수록 높게 설정될 수 있다. 또한, 제2 병리학적 데이터의 완전성은 제2 병리학적 데이터의 대상체의 최종적인 상태를 고려하여 결정될 수 있다. 대상체의 현재 상태가 완치 상태라면, 상기 제2 병리학적 데이터의 완전성은 매우 높게 결정될 수 있다. The completeness of the second pathological data may be set in proportion to the time difference between the first input point and the last input point of the second pathological data. The second pathological data refers to social data obtained through the medical examination, diagnosis, and treatment history of the subject, and may include information on the medical staff who entered the diagnosis, diagnosis, and treatment history. The completeness of the second pathological data can be determined in consideration of the life span and age of the object. That is, the completeness of the accumulated second pathological data for a time period corresponding to the life of the object is set to be very high, and for a short period of time insufficient for the life of the object, for example, Completeness of the enemy data can be set very low. In particular, the completeness of the second pathological data can be set in proportion to the time difference between the first input point and the last input point of the second pathological data, and the time difference is set to a predetermined threshold time, , It can be set to a natural number of 1 or 100 so as to be almost perfect. In addition, the completeness of the second pathological data may be established, taking into account information about the user who generated the second pathological data. The completeness of the second pathological data may be calculated in consideration of whether the creator or creator of the second pathological data is a medical partial worker and the length of the career of the creator or creator of the second pathological data. Completeness of the second pathological data may be set higher when the creator or creator of the second pathological data is a medical part, or the longer the career of the creator or creator of the second pathological data. In addition, the completeness of the second pathological data may be determined in consideration of the final state of the object of the second pathological data. If the current state of the object is in a cured state, the completeness of the second pathological data can be determined to be very high.
본 발명의 실시예들에 따른 데이터 제공 장치(200)는 제공되는 데이터가 가지는 경제적 사회적 가치를 측정할 수 있게 된다. 또한, 이를 통해, 동일한 대상체라 하더라도, 처리 방법 또는 생성자에 따라서 대상체의 생물학적 데이터 및 대상체의 병리학적 데이터는 변경될 수 있다. The
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.The present invention can also be embodied as computer-readable codes on a computer-readable recording medium. A computer-readable recording medium includes all kinds of recording apparatuses in which data that can be read by a computer system is stored. Examples of the computer-readable recording medium include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like. In addition, the computer-readable recording medium may be distributed over network-connected computer systems so that computer readable codes can be stored and executed in a distributed manner. In addition, functional programs, codes, and code segments for implementing the present invention can be easily inferred by programmers of the technical field to which the present invention belongs.
본 발명은 상술한 실시형태 및 첨부된 도면에 의해 한정되지 아니하고, 첨부된 청구범위에 의해 권리범위를 한정하고자 하며, 청구범위에 기재된 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 다양한 형태의 치환, 변형 및 변경할 수 있다는 것은 당 기술분야의 통상의 지식을 가진 자에게 자명할 것이다.It is to be understood that the present invention is not limited to the above-described embodiments and the accompanying drawings, and that the scope of the present invention is defined by the appended claims, and that various changes, substitutions and alterations can be made hereto without departing from the spirit of the invention, It will be apparent to those skilled in the art that various modifications, additions and substitutions are possible, without departing from the scope and spirit of the invention.
200 : 데이터 제공 장치 260 : 데이터 제공부
210 : 데이터 요청 수신부 261 : 선택적 제공부
220 : 데이터 속성 결정부 270 : 사용자 단말
230 : 데이터 검색부 280 : 생성자 단말
240 : 데이터베이스 그룹 290 : 운영자 단말
250 : 가격 결정부200: data providing apparatus 260: data providing apparatus
210: data request receiving unit 261:
220: Data attribute determination unit 270:
230: Data search unit 280: Creator terminal
240: Database group 290: Operator terminal
250:
Claims (6)
상기 데이터 제공 장치가 상기 생체 유래물의 유전체 염기 변이를 확인할 수 있는 유전체 데이터를 획득하기 위한 전유전체 염기서열분석(WGS, Whole Genome Sequencing)이나 전엑솜 시퀀싱(WES, Whole Exome Sequencing), 마이크로어레이(Microarray), 타겟 시퀀싱(Target Sequencing), 생어 시퀀싱(Sanger sequencing), 전기영동법(Electrophoresis) 방법 중 적어도 하나를 이용하여 분석 또는 처리하는 단계;
유전체의 발현 여부를 확인할 수 있는 전사체 데이터를 획득하기 차세대염기서열분석법(NGS), 알엔에이 시퀀싱(RNA Sequenicng), 중합효소연쇄반응법(PCR), 전기영동법(Electrophoresis) 중 적어도 하나를 이용하여 분석 또는 처리하는 단계;
상기 데이터 제공 장치가 상기 분석 또는 처리한 결과, 생체 유래물의 대상체의 병리학적 데이터 및 상기 대상체의 종(species)을 이용하여, 상기 생체 유래물을 처리하는 처리 방법을 선택하고, 상기 처리 방법으로 상기 생체 유래물을 처리함으로써, 상기 생체 유래물의 제1 대상체의 종에 따라 유전자와 관련된 생물학적 데이터를 획득하는 단계;
상기 데이터 제공 장치가 상기 생물학적 데이터 및 상기 병리학적 데이터를 각각의 레코드로 생성하여 저장하고, 상기 제1 대상체와 대응되는 레코드 및 상기 생물학적 데이터의 레코드를 연결 시키고, 상기 제1 대상체와 대응되는 레코드 및 상기 병리학적 데이터의 레코드를 연결 시켜 저장하는 단계;
상기 데이터 제공 장치가 사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신 받는 단계;
상기 데이터 제공 장치가 상기 제1 병리학적 데이터와 관련된 유전자의 염기 서열을 추출하는 단계;
상기 데이터 제공 장치가 상기 제1 병리학적 데이터와 관련된 상기 유전자의 염기 서열에 포함되는 각 유전자의 변이 및 발현 정도를 검색하고, 각 유전자의 변이 및 발현 정도로 발현된 생물학적 데이터를 검색하는 단계;
상기 데이터 제공 장치가 상기 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색하는 단계; 및
상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로 전송하는 단계;를 포함하는 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법.
Collecting pathological data for the at least one subject and the bio-derivative comprising the gene obtained from the at least one subject;
(WGS), Whole Exome Sequencing (WES), Microarray (Microarray), or the like to obtain genome data that can confirm the genomic base mutation of the biological material. Analyzing or processing using at least one of a target sequence, a target sequencing, a Sanger sequencing, and an electrophoresis method;
Obtaining transcript data to confirm the expression of the genome Using at least one of the following methods: NGS, RNA Sequenicng, PCR, and electrophoresis Analysis or processing;
Wherein the data providing apparatus selects the processing method for processing the bio-derived material by using the pathological data of the subject of the bio-derivative and the species of the subject as a result of the analysis or processing, Obtaining biological data related to the gene according to the species of the first subject of the biological material by treating the biological material;
Wherein the data providing apparatus generates and stores the biological data and the pathological data as respective records, connects records corresponding to the first object and records of the biological data, records corresponding to the first object, Concatenating and storing a record of the pathological data;
Receiving the search request including the first pathological data from the user;
Extracting a nucleotide sequence of a gene associated with the first pathological data;
The data providing apparatus searches for the degree of mutation and expression of each gene included in the nucleotide sequence of the gene related to the first pathological data and searches for biological data expressed by the degree of mutation and expression of each gene;
Searching for a second object provided with the biological data, retrieving a record of second biological data and a record of second pathological data linked to the record corresponding to the second object; And
And transmitting a record of the second biological data and a record of the second pathological data to the terminal of the user.
상기 생물학적 데이터의 레코드는
2 이상의 행을 가지는 배열(array)의 형태로, 유전자 배열, 및 유전자의 발현 정도에 해당하는 데이터들을 포함하는, 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법. The method according to claim 1,
A record of the biological data
A method for providing biological data for disease mechanism research comprising, in the form of an array having two or more rows, a gene sequence, and data corresponding to the degree of expression of the gene.
상기 병리학적 데이터는
상기 제1 대상체의 진료 내역, 상기 제1 대상체의 치료 내역, 상기 제1 대상체의 진단 내역 중 적어도 하나를 포함하는, 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법. The method according to claim 1,
The pathological data
A medical history of the first object, a treatment history of the first object, and a diagnosis history of the first object, the biological data for disease mechanism research.
상기 생체 유래물의 염기 변이를 확인할 수 있는 유전체 데이터를 획득하기 위한 전유전체 염기서열분석(WGS, Whole Genome Sequencing)이나 전엑솜 시퀀싱(WES, Whole Exome Sequencing), 마이크로어레이(Microarray), 타겟 시퀀싱(Target Sequencing), 생어 시퀀싱(Sanger sequencing), 전기영동법(Electrophoresis) 방법 중 적어도 하나를 이용하여 분석 또는 처리하고, 유전체의 발현 여부를 확인할 수 있는 전사체 데이터를 획득하기 위한 차세대염기서열분석법(NGS), 알엔에이 시퀀싱(RNA Sequenicng), 중합효소연쇄반응법(PCR), 전기영동법(Electrophoresis) 중 적어도 하나를 이용하여 분석 또는 처리하는 1차 분석부;
상기 분석 또는 처리한 결과, 생체 유래물의 대상체의 병리학적 데이터 또는 상기 대상체의 종(species)을 이용하여, 상기 생체 유래물을 처리하는 처리 방법을 선택하고, 상기 처리 방법으로 상기 생체 유래물을 처리함으로써, 상기 생체 유래물의 제1 대상체의 종에 따라 유전자들의 배열(gene alignment) 및 각 유전자의 발현 정도를 상기 유전자와 대응되는 생물학적 데이터로 획득하는 데이터 획득부;
상기 생물학적 데이터 및 상기 병리학적 데이터를 각각의 레코드로 생성하여 저장하고, 상기 제1 대상체와 대응되는 레코드 및 상기 생물학적 데이터의 레코드를 연결 시키고, 상기 제1 대상체와 대응되는 레코드 및 상기 병리학적 데이터의 레코드를 연결 시켜 저장하는 데이터 처리부;
사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신 받는 데이터 요청 수신부;
상기 제1 병리학적 데이터와 관련된 유전자의 염기 서열을 추출하는 데이터 속성 결정부;
상기 제1 병리학적 데이터와 관련된 상기 유전자의 종류에 포함되는 각 유전자의 변이 및 발현 정도를 검색하고, 각 유전자의 변이 및 발현 정도로 발현된 생물학적 데이터를 검색하고, 상기 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색하는 데이터 검색부;를 포함하고,
상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로전송하는 점을 특징으로 하는 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치.
A data collector for collecting pathological data for the at least one subject and a bio-derivative comprising genes obtained from at least one subject;
(WGS), Whole Exome Sequencing (WES), Microarray, and Target Sequencing (Target Sequencing) to obtain genomic data that can confirm the base mutation of the above-mentioned bio-derived material. Next Generation Sequence Analysis (NGS) to obtain transcript data for analyzing or processing using at least one of the sequencing, Sanger sequencing, and electrophoresis methods and verifying the expression of the genome, A primary analysis unit for analyzing or processing using at least one of RNA Sequenicng, Polymerase Chain Reaction (PCR), and Electrophoresis;
The method according to any one of claims 1 to 3, wherein the result of the analysis or treatment is obtained by selecting a treatment method for treating the biological material by using pathological data of a target of the biological material or species of the target object, A data acquiring unit for acquiring gene alignment and degree of expression of each gene in accordance with the species of the first object of the living body derived from the biological data corresponding to the gene;
And generating and storing the biological data and the pathological data as respective records, connecting a record corresponding to the first object and a record of the biological data, and recording the record corresponding to the first object and the pathological data A data processing unit for connecting and storing records;
A data request receiving unit receiving a search request including a first pathological data from a user;
A data attribute determination unit for extracting a nucleotide sequence of a gene related to the first pathological data;
Searching for the degree of mutation and expression of each gene included in the type of the gene related to the first pathological data, searching for biological data expressed by the degree of mutation and expression of each gene, And a data retrieval unit for retrieving a record of second biological data and a record of second pathological data linked to the record corresponding to the second object,
A record of the second biological data and a record of the second pathological data are transmitted to the terminal of the user.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150052454 | 2015-04-14 | ||
KR20150052454 | 2015-04-14 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160045807A Division KR101870632B1 (en) | 2015-04-14 | 2016-04-14 | Data providing apparatus, and method |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180072625A KR20180072625A (en) | 2018-06-29 |
KR101961438B1 true KR101961438B1 (en) | 2019-07-17 |
Family
ID=57256968
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160045807A KR101870632B1 (en) | 2015-04-14 | 2016-04-14 | Data providing apparatus, and method |
KR1020180069060A KR101961438B1 (en) | 2015-04-14 | 2018-06-15 | Data providing apparatus, and method |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160045807A KR101870632B1 (en) | 2015-04-14 | 2016-04-14 | Data providing apparatus, and method |
Country Status (1)
Country | Link |
---|---|
KR (2) | KR101870632B1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200098189A (en) | 2019-02-12 | 2020-08-20 | 주식회사 꿀비 | System for providing analysis service of next generation sequencing and method thereof |
CN112132646B (en) * | 2020-08-27 | 2023-04-25 | 广东壹健康健康产业集团股份有限公司 | User distribution processing method, device, medium and terminal equipment |
KR102535319B1 (en) * | 2022-09-02 | 2023-05-26 | 주식회사 메디클라우드 | Method, apparatus and system of providing transaction service for genetic information based on blockchain |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001325454A (en) | 2000-05-12 | 2001-11-22 | Ntt Me Corp | System and method for distributing data |
JP2005222468A (en) | 2004-02-09 | 2005-08-18 | Takuji Otani | Literary work management system |
US20070178458A1 (en) | 2003-09-05 | 2007-08-02 | O'brien Philippa | Methods of diagnosis and prognosis of ovarian cancer II |
WO2009120909A1 (en) | 2008-03-26 | 2009-10-01 | Theranos, Inc. | Methods and systems for assessing clinical outcomes |
KR101261042B1 (en) | 2011-02-23 | 2013-05-06 | (주)터보소프트 | A service providing method for customized medical information sales |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070081157A (en) | 2006-02-10 | 2007-08-16 | (주)엔앤에스 | Ubiquitous genbank system using ubiquitous network and service offer method thereof |
KR20120063720A (en) * | 2010-12-08 | 2012-06-18 | 주식회사 펀진 | Internet multiple searching method using multiple serching system |
KR20150076310A (en) * | 2013-12-26 | 2015-07-07 | 주식회사 케이티 | System and method of forming social network for cancer patients |
-
2016
- 2016-04-14 KR KR1020160045807A patent/KR101870632B1/en active IP Right Grant
-
2018
- 2018-06-15 KR KR1020180069060A patent/KR101961438B1/en active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001325454A (en) | 2000-05-12 | 2001-11-22 | Ntt Me Corp | System and method for distributing data |
US20070178458A1 (en) | 2003-09-05 | 2007-08-02 | O'brien Philippa | Methods of diagnosis and prognosis of ovarian cancer II |
JP2005222468A (en) | 2004-02-09 | 2005-08-18 | Takuji Otani | Literary work management system |
WO2009120909A1 (en) | 2008-03-26 | 2009-10-01 | Theranos, Inc. | Methods and systems for assessing clinical outcomes |
KR101261042B1 (en) | 2011-02-23 | 2013-05-06 | (주)터보소프트 | A service providing method for customized medical information sales |
Also Published As
Publication number | Publication date |
---|---|
KR101870632B1 (en) | 2018-06-25 |
KR20160122669A (en) | 2016-10-24 |
KR20180072625A (en) | 2018-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Manzoni et al. | Genome, transcriptome and proteome: the rise of omics data and their integration in biomedical sciences | |
Dillon et al. | Exome sequencing has higher diagnostic yield compared to simulated disease-specific panels in children with suspected monogenic disorders | |
Monroe et al. | Effectiveness of whole-exome sequencing and costs of the traditional diagnostic trajectory in children with intellectual disability | |
Clima et al. | HmtDB 2016: data update, a better performing query system and human mitochondrial DNA haplogroup predictor | |
MacArthur et al. | Locus Reference Genomic: reference sequences for the reporting of clinically relevant sequence variants | |
Frank et al. | Genome sequencing: a systematic review of health economic evidence | |
KR101961438B1 (en) | Data providing apparatus, and method | |
JP5690039B2 (en) | Tumor identification | |
CN108474040A (en) | Recommended using the treatment based on group of Cell-free DNA | |
Plöthner et al. | Cost analysis of whole genome sequencing in German clinical practice | |
JP2003021630A (en) | Method of providing clinical diagnosing service | |
JP2007102709A (en) | Gene diagnostic marker selection program, device and system executing this program, and gene diagnostic system | |
CN109310332A (en) | Method for analyzing numerical data | |
CA3126147A1 (en) | Machine learning in functional cancer assays | |
US20220013195A1 (en) | Systems and methods for access management and clustering of genomic or phenotype data | |
EP4260340A1 (en) | Predicting fractional flow reserve from electrocardiograms and patient records | |
Ahmed et al. | Advancing clinical genomics and precision medicine with GVViZ: FAIR bioinformatics platform for variable gene-disease annotation, visualization, and expression analysis | |
Thareja et al. | Differences and commonalities in the genetic architecture of protein quantitative trait loci in European and Arab populations | |
CN106960133B (en) | Disease prediction method and device | |
US20110093448A1 (en) | System method and computer program product for pedigree analysis | |
Shi et al. | HUSCH: an integrated single-cell transcriptome atlas for human tissue gene expression visualization and analyses | |
Jegathisawaran et al. | Trio genome sequencing for developmental delay and pediatric heart conditions: A comparative microcost analysis | |
Gelly et al. | Protein Peeling 3D: new tools for analyzing protein structures | |
Labuzzetta et al. | Complementary feature selection from alternative splicing events and gene expression for phenotype prediction | |
Poszewiecka et al. | TADeus2: a web server facilitating the clinical diagnosis by pathogenicity assessment of structural variations disarranging 3D chromatin structure |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |