KR101961438B1 - Data providing apparatus, and method - Google Patents

Data providing apparatus, and method Download PDF

Info

Publication number
KR101961438B1
KR101961438B1 KR1020180069060A KR20180069060A KR101961438B1 KR 101961438 B1 KR101961438 B1 KR 101961438B1 KR 1020180069060 A KR1020180069060 A KR 1020180069060A KR 20180069060 A KR20180069060 A KR 20180069060A KR 101961438 B1 KR101961438 B1 KR 101961438B1
Authority
KR
South Korea
Prior art keywords
data
biological
pathological
gene
user
Prior art date
Application number
KR1020180069060A
Other languages
Korean (ko)
Other versions
KR20180072625A (en
Inventor
고진업
Original Assignee
주식회사 테라젠이텍스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 테라젠이텍스 filed Critical 주식회사 테라젠이텍스
Publication of KR20180072625A publication Critical patent/KR20180072625A/en
Application granted granted Critical
Publication of KR101961438B1 publication Critical patent/KR101961438B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data

Abstract

본 발명에 따른 질병 기전 연구를 위한 데이터 제공 장치, 방법, 데이터 제공 방법을 실행하기 위한 프로그램이 기록되어 있는 컴퓨터 판독가능한 기록매체에 따르면, 대상체로부터 직접 추출해야 하는 생체 세포로부터 영구적으로 사용될 수 있고, 사용에 따라서 훼손되지 않는 전자적 데이터를 획득하고, 상기 획득된 생체 세포에 대한 전자적 데이터를 적정한 가격으로 거래될 수 있도록 할 수 있다.According to the present invention, there is provided a data providing apparatus, method, and data providing method for studying a disease mechanism, and a computer readable recording medium on which a program for executing the data providing method is recorded. The computer readable recording medium can be permanently used from biomedical cells, Electronic data that is not damaged according to use can be acquired and electronic data of the obtained biomolecules can be traded at an appropriate price.

Description

질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 및 방법 {Data providing apparatus, and method}[0002] Data providing apparatus, and method for providing biological data for disease mechanism research,

본 발명은 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 방법에 관한 것이다.The present invention relates to a data providing apparatus and method for providing biological data for disease mechanism research.

인체 종양 조직은 유전체, 전사체, 단백질체, 대사체 등과 같은 여러 가지 연구 방법들을 이용하여, 암의 발생 원인을 찾고, 암 진단의 정확도를 높이기 위해서, 그리고 암의 치료 효과를 증진하기 위해 연구되고 있다. 특히, 암 환자의 암 조직을 통해 암에 대한 연구를 하고 있다. 조직 세포의 연구를 위해서, 국내외적으로 이미 많은 병원 및 연구소에서 조직 은행 시스템을 갖추고, 환자 조직을 관리하고 있다. Human tumor tissues have been studied using various research methods such as dielectrics, transcripts, protein bodies, metabolites, etc. to find the cause of cancer, to increase the accuracy of cancer diagnosis, and to improve the therapeutic effect of cancer . In particular, we are studying cancer through cancer tissue in cancer patients. For the study of tissue cells, we already have a tissue banking system in many hospitals and laboratories both domestically and externally, and manage patient organizations.

조직을 액체 질소 혹은 냉동 상태로 보관해야 하기 때문에 매년 많은 비용이 필요한 문제가 있었다. Because the tissue must be kept in liquid nitrogen or frozen, there was a problem that cost a lot each year.

또한, 암을 연구하는 연구자는 본인의 연구를 위해서, 필요한 조직을 구매하고, 선행적으로 DNA/RNA/단백질/대사산물과 같은 파생물들을 추출하는 과정을 거쳐야 한며, 최근 암연구를 위해 대용량 염기서열 분석법(NGS)가 많이 활용되어, 암 또는 정상조직의 DNA/RNA 염기서열 분석이 많이 이루어 지고 있다.In addition, researchers studying cancer must go through the process of purchasing the necessary tissues and extracting derivatives such as DNA / RNA / protein / metabolites in advance for their own research. In recent years, Analysis method (NGS) is widely used, and DNA / RNA base sequence analysis of cancer or normal tissue is performed.

그러나, 조직 세포는 액체 질소 또는 냉동 상태로 보관해야 하기 때문에 많은 보관 비용이 필요하고, 하나의 조직 세포에 대한 DNA/RNA/단백질/대사산물과 같은 파생물들을 추출하는 과정은 역시 많은 시간과 많은 비용을 필요로 하는 문제가 있었다. However, because tissue cells must be kept in liquid nitrogen or frozen state, they require a lot of storage costs and the process of extracting derivatives such as DNA / RNA / protein / metabolites on one tissue cell is also time consuming and costly There is a problem that it is necessary.

게다가, 인체 종양 조직으로부터 다양한 파생물(DNA, RNA, Protein 등)을 추출하는 과정에 오류가 있을 경우, 추출된 파생물에 대한 정보를 신뢰할 수 없을 뿐만 아니라, 파생물이 인체 종양 조직으로부터 잘못 추출되는 과정에서 수량이 한정된 인체 종양 조직이 낭비되는 문제도 발생할 수 있다.Furthermore, in the case of errors in the extraction of various derivatives (DNA, RNA, Protein, etc.) from human tumor tissues, the information on the extracted derivatives is not reliable, and in the process in which the derivatives are erroneously extracted from the human tumor tissue There is a problem that the human tumor tissue having a limited quantity is wasted.

암 연구를 위해서는 과도한 비용이 필요하기 때문에 현실적으로, 한정된 연구자에게만 조직 세포들이 독식되는 경향이 있었고, 잘못된 추출 과정으로 인해 조직이 낭비되는 문제도 있었다. Because of the high cost of cancer research, in reality, only a limited number of researchers tend to be monopolized by tissue cells, and the tissue is wasted due to erroneous extraction processes.

대한민국 공개특허 제2007-0081157호Korea Patent Publication No. 2007-0081157

본 발명이 해결하고자 하는 기술적 과제는, 특정 방법으로 한정적인 양만 산출할 수 있는 데이터, 좀 더 상세하게는 대용량 염기서열 분석법(NGS)을 통해 생산된 데이터를 복사와 전송이 용이한 데이터로 변환하여 데이터베이스에 저장해두었다가, 사용자의 요청에 따라 사용자에게 제공함으로써, 이미 존재하는 데이터와 동일한 데이터를 얻어내기 위해서 막대한 비용으로 동일한 과정을 불필요하게 반복 수행하는 것을 최소화할 수 있는 데이터 제공 장치, 방법, 데이터 제공 방법을 실행하기 위한 프로그램이 기록되어 있는 컴퓨터 판독 가능한 기록매체를 제공하는 데에 있다.SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and it is an object of the present invention to provide an apparatus and a method for converting data produced through a large capacity sequencing method (NGS) A data providing apparatus, a method, and a data providing apparatus capable of minimizing the unnecessary repetition of the same process at a great cost in order to obtain the same data as existing data by storing the data in a database and providing the data to a user at the request of a user And a computer-readable recording medium on which a program for executing the method is recorded.

상기의 기술적 과제를 해결하기 위한 본 발명의 일 실시 예에 따른 데이터 제공 방법은, 사용자 단말로부터 데이터 요청을 수신하는 데이터 요청 수신단계; 상기 데이터 요청에 포함된 조건을 기초로 사용자 단말에 제공할 데이터의 속성을 결정하는 데이터 속성 결정단계; 상기 데이터의 속성과 대응되는 데이터를 검색하는 데이터 검색단계; 상기 검색된 데이터의 생성자에 대한 정보, 생성에 필요한 시간, 생성에 필요한 자원을 고려하여 상기 데이터의 가격을 결정하는 가격 결정단계; 및 상기 데이터 및 상기 데이터의 가격을 포함하는 표시 정보를 상기 사용자 단말로 제공하는 데이터 제공단계를 포함한다.According to an aspect of the present invention, there is provided a method of providing data, the method comprising: receiving a data request from a user terminal; Determining a property of data to be provided to a user terminal based on a condition included in the data request; A data retrieval step of retrieving data corresponding to the attribute of the data; A pricing step of determining the price of the data in consideration of information on a creator of the searched data, a time required for generation, and resources required for generation; And a data providing step of providing display information including the data and the price of the data to the user terminal.

상기 방법에 있어서, 상기 데이터 요청에 포함된 조건은, 상기 데이터의 대상물질, 상기 데이터의 종류, 상기 데이터의 처리방법의 종류, 상기 데이터의 가공여부, 및 상기 데이터의 생성시기 중 적어도 하나를 포함할 수 있다.In the method, the condition included in the data request includes at least one of a target substance of the data, a kind of the data, a kind of a processing method of the data, a processing state of the data, and a generation time of the data can do.

상기 방법에 있어서, 상기 데이터 요청에 포함된 조건은, 상기 데이터의 예산 범위, 총 한도 금액 중 적어도 하나를 포함하고, 상기 데이터 제공단계는, 상기 가격 범위에 포함된 최소 금액 또는 최대 금액을 고려하여 상기 데이터 중 일부를 추출하고, 상기 추출한 데이터를 상기 사용자 단말로 제공하거나, 추출한 데이터의 가격의 총합이 상기 총 한도 금액을 초과하지 않도록 상기 데이터 중 하나 이상의 데이터를 추출하고, 상기 추출한 데이터를 상기 사용자 단말로 제공하는 선택적 제공단계;를 포함할 수 있다.In the above method, the condition included in the data request includes at least one of a budget range and a total limit amount of the data, and the data providing step may include a minimum amount or a maximum amount included in the price range Extracting a part of the data and providing the extracted data to the user terminal or extracting one or more pieces of data from the data so that the total sum of prices of the extracted data does not exceed the total limit amount, And an optional providing step of providing to the terminal.

상기 방법에 있어서, 상기 표시 정보는, 상기 데이터를 통해 획득할 수 있는 효과 및 상기 데이터에 포함되는 일부내용 중 적어도 하나를 더 포함할 수 있다.In the method, the display information may further include at least one of an effect obtainable through the data and a content included in the data.

상기 방법에 있어서, 상기 생성자에 대한 정보는, 상기 생성자의 생성 당시의 지위, 현재의 지위 중 적어도 하나를 포함하고, 상기 데이터의 가격은 상기 생성자의 생성 당시의 지위 및 현재의 지위 중 적어도 하나에 의해서 차등적으로 결정될 수 있다.Wherein the information about the creator includes at least one of a position at the time of creation of the constructor and a current position and the price of the data is at least one of the position at the time of creation of the constructor and the current position As shown in FIG.

상기 방법에 있어서, 상기 데이터의 가격은 상기 데이터를 요청한 사용자와 상기 데이터를 생성한 생성자의 동일 여부, 상기 사용자와 상기 데이터 사이의 관련성 중 적어도 하나를 고려하여 차등적으로 결정될 수 있다.In the method, the price of the data may be differentiated in consideration of at least one of whether the user requesting the data and the creator generating the data, and the relation between the user and the data.

상기 방법에 있어서, 상기 생성자에 대한 정보는, 레벨 정보를 포함하고, 상기 레벨 정보는 상기 생성자가 생성한 데이터의 수, 상기 생성자가 생성한 데이터의 누적 판매량, 상기 생성자가 생성한 데이터로부터의 수입 중 적어도 하나를 고려하여 결정될 수 있다.In the above method, the information on the creator includes level information, and the level information includes a number of data generated by the creator, a cumulative sales amount of data generated by the creator, an import from the data generated by the creator, May be determined in consideration of at least one of.

상기의 기술적 과제를 해결하기 위한 본 발명의 다른 일 실시 예에 따른 데이터 제공 장치는, 사용자 단말로부터 데이터 요청을 수신하는 데이터 요청 수신부; 상기 데이터 요청에 포함된 조건을 기초로 사용자 단말에 제공할 데이터의 속성을 결정하는 데이터 속성 결정부; 상기 데이터의 속성과 대응되는 데이터를 검색하는 데이터 검색부; 상기 검색된 데이터의 생성자에 대한 정보, 생성에 필요한 시간, 생성에 필요한 자원을 고려하여 상기 데이터의 가격을 결정하는 가격 결정부; 및 상기 데이터 및 상기 데이터의 가격을 포함하는 표시 정보를 상기 사용자 단말로 제공하는 데이터 제공부;를 포함한다.According to another aspect of the present invention, there is provided a data providing apparatus including: a data request receiving unit receiving a data request from a user terminal; A data attribute determination unit for determining an attribute of data to be provided to a user terminal based on a condition included in the data request; A data retrieving unit for retrieving data corresponding to the attribute of the data; A pricing unit for determining a price of the data in consideration of information on a creator of the searched data, a time required for generation, and resources required for generation; And data providing means for providing the user terminal with display information including the data and the price of the data.

상기 장치에 있어서, 상기 데이터 요청에 포함된 조건은, 상기 데이터의 대상물질, 상기 데이터의 종류, 상기 데이터의 처리방법의 종류, 상기 데이터의 가공여부, 및 상기 데이터의 생성시기 중 적어도 하나를 포함할 수 있다.In the apparatus, the condition included in the data request includes at least one of a target substance of the data, a kind of the data, a kind of a processing method of the data, a processing state of the data, and a generation time of the data can do.

상기 장치에 있어서, 상기 데이터 요청에 포함된 조건은, 상기 데이터의 예산 범위, 총 한도 금액 중 적어도 하나를 포함하고, 상기 데이터 제공부는, 상기 가격 범위에 포함된 최소 금액 또는 최대 금액을 고려하여 상기 데이터 중 일부를 추출하고, 상기 추출한 데이터를 상기 사용자 단말로 제공하거나, 추출한 데이터의 가격의 총합이 상기 총 한도 금액을 초과하지 않도록 상기 데이터 중 하나 이상의 데이터를 추출하고, 상기 추출한 데이터를 상기 사용자 단말로 제공하는 선택적 제공부;를 포함할 수 있다.The apparatus of claim 1, wherein the condition included in the data request includes at least one of a budget range and a total limit amount of the data, and the data providing unit may include a minimum amount or a maximum amount included in the price range, Extracting one or more pieces of data from the data so that the total sum of the prices of the extracted data does not exceed the total limit amount, and extracting the extracted data from the user terminal And an optional providing unit for providing the information.

상기 장치에 있어서, 상기 표시 정보는 상기 데이터를 통해 획득할 수 있는 효과 및 상기 데이터에 포함되는 일부내용 중 적어도 하나를 더 포함할 수 있다..In the apparatus, the display information may further include at least one of an effect obtainable through the data and a content included in the data.

상기 장치에 있어서, 상기 생성자에 대한 정보는, 상기 생성자의 생성 당시의 지위, 현재의 지위 중 적어도 하나를 포함하고, 상기 데이터의 가격은 상기 생성자의 생성 당시의 지위, 및 현재의 지위 중 적어도 하나에 의해서 차등적으로 결정될 수 있다.Wherein the information on the creator includes at least one of a position at the time of creation of the constructor and a current position, the price of the data is at least one of a position at the time of creation of the constructor, Can be determined differentially.

상기 장치에 있어서, 상기 데이터의 가격은 상기 데이터를 요청한 사용자와 상기 데이터를 생성한 생성자의 동일 여부, 상기 사용자와 상기 데이터 사이의 관련성 중 적어도 하나를 고려하여 차등적으로 결정될 수 있다.In the apparatus, the price of the data may be differentially determined in consideration of at least one of whether the user requesting the data and the creator generating the data, and the relation between the user and the data.

상기 장치에 있어서, 상기 생성자에 대한 정보는, 레벨 정보를 포함하고, 상기 레벨 정보는 상기 생성자가 생성한 데이터의 수, 상기 생성자가 생성한 데이터의 누적 판매량, 상기 생성자가 생성한 데이터로부터의 수입 중 적어도 하나를 고려하여 결정될 수 있다.In the apparatus, the information on the creator includes level information, the level information includes a number of data generated by the creator, a cumulative sales amount of data generated by the creator, an import from the data generated by the creator, May be determined in consideration of at least one of.

이 외에도, 본 발명을 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공된다.In addition to this, another method for implementing the present invention, another system, and a computer-readable recording medium for recording a computer program for executing the method are further provided.

전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 특허청구범위 및 발명의 상세한 설명으로부터 명확해 질 것이다.Other aspects, features, and advantages other than those described above will become apparent from the following drawings, claims, and the detailed description of the invention.

본 발명에 따른 데이터 제공 장치, 방법에 따르면, 대상체로부터 직접 추출해야 하는 생체 세포로부터 영구적으로 사용될 수 있고, 사용에 따라서 훼손되지 않는 전자적 데이터를 획득하고 좀 더 상세하게는 DNA/RNA의 염기서열(A,T,G,C)등으로, 상기 획득된 생체 세포에 대한 전자적 데이터를 적정한 가격으로 거래될 수 있도록 할 수 있다. 또한, 수집하기 어렵고 수량이 한정적인 데이터의 메타데이터로서, 해당 데이터의 생성자에 대한 정보를 사용자에게 제공하여, 사용자가 데이터를 구매하는 데에 도움을 줄 수 있으며, 이미 존재하는 데이터와 동일한 데이터를 얻어내기 위해서 막대한 비용으로 동일한 과정을 불필요하게 반복 수행하는 것을 최소화하여 그 데이터를 반복적으로 이용하는 연구자들의 연구비용과 연구시간을 대폭 절감할 수 있다. 여기서, 데이터는 암 발병 기전 연구를 위한 생물학적 데이터일 수 있다. According to the apparatus and method for providing data according to the present invention, it is possible to obtain electronic data which can be permanently used from biological cells to be directly extracted from a target object and which is not damaged according to use, and more specifically, A, T, G, C, etc., the electronic data of the obtained living cells can be traded at an appropriate price. It is also possible to provide the user with information about the creator of the data, which is difficult to collect and whose quantity is limited, as meta data, which can help the user to purchase the data, It is possible to greatly reduce research cost and research time of researchers who use the data repeatedly by minimizing unnecessary repetition of the same process at a great cost. Here, the data may be biological data for cancer-causing mechanism studies.

특히, 본 발명에 따른 데이터 제공 장치, 방법, 데이터 제공 방법을 실행하기 위한 프로그램이 인체 종양 조직에 관련된 데이터의 제공을 위해 이용되는 경우, 여러 연구자들이 시간적, 금전적인 제약을 받지 않고 연구가 가능하게 되어 궁극적으로는 암 정복 및 암 환자별 맞춤형 치료가 가능해질 수 있다.Particularly, when a program for executing a data providing apparatus, method, and data providing method according to the present invention is used for providing data related to a human tumor tissue, it is possible that researchers can research without being limited by time and money Ultimately, it can be possible to treat patients with cancer and to treat them individually.

도 1은 본 발명의 일 실시 예에 따른 데이터 제공 시스템의 구성을 나타낸 도면이다.
도 2는 본 발명의 일 실시 예에 따른 데이터 제공 장치에 대한 블록도를 도시한 도면이다.
도 3은 데이터 제공 장치의 데이터를 인체 종양 조직에 대한 데이터로 한정했을 때의 데이터베이스 그룹에 저장되는 데이터를 도시한 도면이다.
도 4는 본 발명의 다른 일 실시 예에 따른 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.
도 5는 본 발명의 또 다른 일 실시 예에 따른 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.
도 6은 본 발명의 또 다른 일 실시 예에 따른 데이터 제공 장치를 기준으로 한 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.
도 7은 생체 세포로부터 데이터를 생성하는 과정을 설명하기 위한 도면이다.
도 8 및 도 9는 본 발명의 실시예들에 따른 질병 기전 연구를 위한 데이터 제공 방법의 흐름도들이다.
도 10은 본 발명의 실시예들에 따른 질병 기전 연구를 위한 데이터 제공 장치에 추가적으로 포함될 수 있는 데이터 생성부의 구조를 나타내는 블록도이다.
1 is a diagram illustrating a configuration of a data providing system according to an embodiment of the present invention.
2 is a block diagram illustrating a data providing apparatus according to an embodiment of the present invention.
3 is a diagram showing data stored in a database group when data of a data providing apparatus is limited to data on a human tumor tissue.
4 is a flowchart illustrating a data providing method according to another embodiment of the present invention.
5 is a flowchart illustrating a data providing method according to another embodiment of the present invention.
6 is a flowchart illustrating a data providing method based on a data providing apparatus according to another embodiment of the present invention.
7 is a diagram for explaining a process of generating data from a living cell.
8 and 9 are flowcharts of a data providing method for disease mechanism research according to embodiments of the present invention.
FIG. 10 is a block diagram illustrating a structure of a data generating unit that may be additionally included in a data providing apparatus for disease mechanism research according to embodiments of the present invention.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시 예를 가질 수 있는바, 특정 실시 예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있다.BRIEF DESCRIPTION OF THE DRAWINGS The present invention is capable of various modifications and various embodiments, and specific embodiments are illustrated in the drawings and described in detail in the detailed description. The effects and features of the present invention and methods of achieving them will be apparent with reference to the embodiments described in detail below with reference to the drawings. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein.

이하, 첨부된 도면을 참조하여 본 발명의 실시 예들을 상세히 설명하기로 하며, 도면을 참조하여 설명할 때 동일하거나 대응하는 구성 요소는 동일한 도면부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings, wherein like reference numerals refer to like or corresponding components throughout the drawings, and a duplicate description thereof will be omitted .

이하의 실시 예에서, 제1, 제2 등의 용어는 한정적인 의미가 아니라 하나의 구성 요소를 다른 구성 요소와 구별하는 목적으로 사용되었다.In the following embodiments, the terms first, second, and the like are used for the purpose of distinguishing one element from another element, not the limitative meaning.

이하의 실시 예에서, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.In the following examples, the singular forms "a", "an" and "the" include plural referents unless the context clearly dictates otherwise.

이하의 실시 예에서, 포함하다 또는 가지다 등의 용어는 명세서 상에 기재된 특징, 또는 구성요소가 존재함을 의미하는 것이고, 하나 이상의 다른 특징을 또는 구성요소가 부가될 가능성을 미리 배제하는 것은 아니다.In the following embodiments, terms such as inclusive or possessed mean that a feature or element described in the specification is present, and does not exclude the possibility that one or more other features or components are added in advance.

어떤 실시 예가 달리 구현 가능한 경우에 특정한 공정 순서는 설명되는 순서와 다르게 수행될 수도 있다. 예를 들어, 연속하여 설명되는 두 공정이 실질적으로 동시에 수행될 수도 있고, 설명되는 순서와 반대의 순서로 진행될 수 있다.If certain embodiments are otherwise feasible, the particular process sequence may be performed differently from the sequence described. For example, two processes that are described in succession may be performed substantially concurrently, and may be performed in the reverse order of the order described.

도 1은 본 발명의 일 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 시스템의 구성을 나타낸 도면이다.FIG. 1 is a block diagram illustrating a data providing system for disease mechanism research according to an embodiment of the present invention. Referring to FIG.

도 1을 참조하면, 본 발명의 일 실시 예에 따른 데이터 제공 시스템(1)은 데이터 제공 장치(10), 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)을 포함한다. 또한, 운영자 단말(30), 사용자 단말(50), 생성자 단말(51), 데이터 제공 장치(10)를 상호 연결하는 통신망(70)을 포함한다.Referring to FIG. 1, a data providing system 1 according to an embodiment of the present invention includes a data providing apparatus 10, an operator terminal 30, a user terminal 50, and a creator terminal 51. It also includes a communication network 70 for interconnecting the operator terminal 30, the user terminal 50, the creator terminal 51, and the data providing apparatus 10.

설명의 편의를 위해서, 도 1의 데이터 제공 시스템(1)은 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)을 각각 한 대씩 포함하고 있으나, 데이터 제공 시스템(1)은 필요에 따라 복수의 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)을 포함할 수도 있다.1 includes one operator terminal 30, one user terminal 50, and one creator terminal 51, the data providing system 1 is provided with one And may include a plurality of operator terminals 30, a user terminal 50, and a creator terminal 51.

데이터 제공 장치(10)는 암 관련 연구를 하고자 하는 자에게 암 관련 조직 또는 세포 등에 대한 정보를 제공하는 수단을 제공한다. 데이터 제공 장치(10)는 진단적 검사, 예측적 검사, 보인자 검사, 신생아 선별 검사, 산전 진단 검사, 착상전 검사를 위한 데이터를 제공할 수 있다. 데이터 제공 장치(10)는 대상체로부터 획득된 생체 세포로부터 DNA 수준에서의 돌연변이, 유전체의 구조적 이상, 염색체의 이상, 대사산물의 변화 등을 검출할 수 있도록 처리 할 수 있다. 이때, 대상체로부터 획득된 생체 세포가 적당한 방법으로 처리될 수 있도록 제어할 수 있다. 데이터 제공 장치(10)는 사용자 단말(50)로부터 수신된 데이터 요청과 대응되는 데이터를 검색하고, 데이터에 대한 가격을 결정할 수 있다. 데이터 제공 장치(10)는 암 관련 연구를 위한 데이터를 사용자로부터의 요청에 따라 제공함으로써, 매 연구 마다 동일한 데이터를 생성해야 하는 수고를 덜 수 있고, 암 관련 데이터를 직접 구하지 않더라도 암 관련 연구를 진행할 수 있으며, 조직 또는 세포 등을 보관하는 것에 비해서, 보관 비용도 현저히 적게 발생하게 된다. The data providing apparatus 10 provides a means for providing information on cancer-related tissues or cells to a person who intends to perform cancer-related research. The data providing apparatus 10 can provide data for diagnostic tests, predictive tests, donor tests, neonatal screening tests, prenatal diagnosis tests, and pre-implantation tests. The data providing apparatus 10 can process the mutation at the DNA level, the structural abnormality of the genome, the abnormality of the chromosome, the change of the metabolite, etc. from the living body cell obtained from the subject. At this time, it is possible to control the biological cells obtained from the target body to be processed in an appropriate manner. The data providing apparatus 10 can retrieve the data corresponding to the data request received from the user terminal 50 and determine the price for the data. The data providing apparatus 10 can provide the data for cancer-related research according to a request from a user, thereby reducing the labor required to generate the same data every research, and even if the cancer-related data is not directly obtained, And storage cost is significantly lower than that of storing tissues or cells.

데이터 제공 장치(10)는 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)로부터 데이터 요청을 받고 각 단말에 데이터를 제공할 수 있다. 도 1에는 하나의 데이터 제공 장치를 표시하였으나, 접속량 또는 데이터 양에 따라 복수의 데이터 제공 장치가 존재할 수도 있다. 이 경우, 데이터 제공 시스템(1)은 각 데이터 제공 장치의 현재 부하량을 측정 및 비교하고 각 데이터 제공 장치에서 효율적으로 작업이 처리하도록 로드 밸런싱(Load Balancing)을 수행하는 레이어 4(Layer 4) 스위치(미도시)를 추가로 포함할 수 있다.The data providing apparatus 10 can receive data requests from the operator terminal 30, the user terminal 50, and the creator terminal 51 and provide data to each terminal. Although FIG. 1 shows one data providing apparatus, a plurality of data providing apparatuses may exist depending on the amount of connection or the amount of data. In this case, the data providing system 1 includes a layer 4 switch (not shown) that measures and compares the current load of each data providing apparatus and performs load balancing so that each data providing apparatus can efficiently process the job Not shown).

데이터 제공 장치(10)는 내부에 저장하고 있는 데이터의 업데이트 및 동작을 위한 프로그램의 유지 및 보수를 위해서 운영자 단말(30)로부터 주기적으로 특정 데이터를 수신할 수 있다.The data providing apparatus 10 may periodically receive specific data from the operator terminal 30 for maintenance and repair of the program for updating and operating the data stored therein.

운영자 단말(30)은 개인용 컴퓨터(PC) 또는 워크스테이션(workstation) 중 하나가 될 수 있으며, 필요에 따라 데이터 제공 장치(10)에 접속하여 데이터 제공 장치(10)에 저장되어 있는 데이터의 업데이트 및 데이터 제공 장치(10)의 동작을 위한 프로그램의 유지 및 보수를 수행한다.The operator terminal 30 may be one of a personal computer (PC) or a workstation and may be connected to the data providing apparatus 10 to update and update the data stored in the data providing apparatus 10 And performs maintenance and repair of the program for the operation of the data providing apparatus 10. [

사용자 단말(50)은 사용자가 유무선 네트워크를 통해 데이터 제공 장치(10)에 접속한 후, 데이터 제공 서비스에 대한 회원 등록을 할 수 있다. 또한, 사용자 단말(50)은 사용자가 제공받을 데이터의 종류를 검색 및 선택한 후 결제하는 데에 사용될 수 있다.After the user accesses the data providing apparatus 10 via the wired / wireless network, the user terminal 50 can register the member for the data providing service. In addition, the user terminal 50 can be used to search for, select, and settle the type of data to be provided by the user.

생성자 단말(51)은 데이터 제공 장치(10)에 저장되어 있는 데이터와 동종의 데이터를 생성할 수 있는 전문가가 이용하는 사용자 단말의 한 종류이다. 즉, 생성자 단말(51)은 사용자 단말(50)의 기능을 필수적으로 포함한다. 생성자 단말(51)은 운영자 단말(30)에 데이터 업로드 요청을 하여 운영자가 운영자 단말(30)을 통해 데이터 제공 장치(10)에 저장되는 데이터를 업데이트할 수 있도록 하는 기능을 포함할 수 있다.The creator terminal 51 is a kind of user terminal used by an expert capable of generating data of the same kind as the data stored in the data providing device 10. [ That is, the creator terminal 51 essentially includes the function of the user terminal 50. [ The creator terminal 51 may include a function of allowing the operator to update the data stored in the data providing apparatus 10 through the operator terminal 30 by requesting the operator terminal 30 to upload data.

운영자 단말(30)은 사용자 단말(50)과 생성자 단말(51)을 각각 구별하기 위한 식별코드를 각 사용자 단말(50)과 생성자 단말(51)에 부여할 수 있다. 운영자 단말(30)은 업로드 요청을 할 수 있는 식별코드를 가진 생성자 단말(51)에 한해 데이터 업로드 요청을 할 수 있도록 하여 데이터 제공 장치(10)에 저장될 수 있는 데이터의 품질 및 신뢰도를 확보할 수 있다.The operator terminal 30 can give an identification code for distinguishing the user terminal 50 and the creator terminal 51 to the user terminal 50 and the creator terminal 51, respectively. The operator terminal 30 can make a data upload request only to the creator terminal 51 having an identification code capable of making an upload request so as to secure the quality and reliability of data that can be stored in the data providing apparatus 10 .

도 1을 참조했을 때, 사용자 단말(50) 및 생성자 단말(51)은 스마트폰 형태를 띄고 있으나, 본 발명에서 사용자 단말(50) 및 생성자 단말(51)은 특정한 기기로 한정되지 않으므로, 스마트폰이 아니더라도 웹 브라우징이 가능한 애플리케이션이 설치되어 있는 단말이라면 제한 없이 차용될 수 있다. 1, the user terminal 50 and the creator terminal 51 are smart phones, but the user terminal 50 and the creator terminal 51 are not limited to specific devices, , It can be borrowed without limitation if the terminal is installed with an application capable of web browsing.

통신망(70)은 데이터 제공 장치(10), 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)을 연결한다. 본 발명에서 통신망(70)은 그 구동 방식에 있어서 유선과 무선 중 어느 한 방식으로 한정되지 않으므로, 랜(LAN, Local Area Network)과 같은 유선 네트워크나, 블루투스(Bluetooth), 와이파이(WIFI), 와이브로(Wibro), 위성 통신과 같은 무선 네트워크에 의해 구동되는 모든 통신망을 포함할 수 있다.The communication network 70 connects the data providing apparatus 10, the operator terminal 30, the user terminal 50, and the creator terminal 51. In the present invention, the communication network 70 is not limited to a wired or wireless mode in its driving method. Therefore, a wired network such as a LAN (Local Area Network), a Bluetooth, a WiFi, (Wibro), satellite communications, and the like.

도 2는 본 발명의 일 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 장치에 대한 블록도를 도시한 도면이다.FIG. 2 is a block diagram of a data providing apparatus for disease mechanism research according to an embodiment of the present invention. Referring to FIG.

도 2를 참조하면, 본 발명의 일 실시 예에 따른 데이터 제공 장치(200)는 데이터 요청 수신부(210), 데이터 속성 결정부(220), 데이터 검색부(230), 데이터베이스 그룹(240), 가격 결정부(250), 데이터 제공부(260), 사용자 단말(270), 생성자 단말(280). 운영자 단말(290)을 포함할 수 있다.2, a data providing apparatus 200 according to an embodiment of the present invention includes a data request receiving unit 210, a data attribute determining unit 220, a data searching unit 230, a database group 240, A determining unit 250, a data providing unit 260, a user terminal 270, and a creator terminal 280. And an operator terminal 290.

데이터 요청 수신부(210)는 사용자 단말(270)로부터 데이터 요청을 수신한다. 사용자 단말(270)은 사용자가 데이터 제공 장치(200)에 접근할 수 있게 하는 기기로서, 데이터 제공 장치(200)에 각종 유무선 네트워크를 통해 연결될 수 있다. 사용자 단말(270)은 사용자가 웹 브라우징(web browsing)을 수행할 수 있게 하는 브라우저 애플리케이션(browser application)이 설치되어 있는 단말이며, 본 발명은 사용자 단말(270)에 있어서 단말의 성능, 형태, 및 종류를 특정한 어느 것으로 한정하지 않는다.The data request receiving unit 210 receives a data request from the user terminal 270. The user terminal 270 is a device that enables a user to access the data providing apparatus 200 and can be connected to the data providing apparatus 200 through various wired and wireless networks. The user terminal 270 is a terminal equipped with a browser application that allows a user to perform web browsing. The present invention can be applied to a user terminal 270, And does not limit the type to any particular one.

여기서, 데이터 요청은 데이터 제공 장치(200)의 데이터베이스 그룹(240)에 저장되어 있는 데이터 중 사용자가 지정한 조건에 따른 데이터가 있는지 여부를 판단하여 그 결과를 사용자 단말(270)에 전송하라는 신호를 의미한다.Here, the data request refers to a signal for determining whether data stored in the database group 240 of the data providing apparatus 200 is in accordance with a condition specified by the user, and transmitting the result to the user terminal 270 do.

데이터 속성 결정부(220)는 데이터 요청에 포함된 대상 물질 및/또는 조건을 기초로 데이터의 검색 속성을 결정한다. 여기서, 검색 속성은 데이터 요청에 포함된 조건 즉, 대상물질, 종류, 처리방법의 종류, 생성 시기 등으로부터 결정되는 것으로, 물질 관련 속성 또는 처리 관련 속성으로 구분될 수 있다. 물질 관련 속성은 조건으로부터 유추될 수 있는 속성 중에서, 대상물질 자체와 관련된 것으로, 대상물질의 위치, 종류 등을 포함하며, 처리 관련 속성은 조건으로부터 유추될 수 있는 속성 중에서, 대상물질의 처리와 관련된 처리방법, 가공 여부, 생성 시기 등을 포함할 수 있다. The data attribute determination unit 220 determines the search attribute of the data based on the target material and / or the condition included in the data request. Here, the search attribute is determined from the conditions included in the data request, that is, from the target substance, the type, the kind of the processing method, the generation time, and so on. The material-related attributes are those related to the subject matter itself, including the position, type, etc. of the subject matter, among the attributes that can be deduced from the condition, and the processing-related attribute Processing method, whether it is processed, the generation time, and the like.

여기서, 데이터 요청에 포함된 조건은 데이터의 종류, 처리방법의 종류, 생성 시기 중 적어도 하나를 포함할 수 있고, 제공할 데이터의 속성은 데이터의 종류, 처리방법의 종류, 가공 여부, 생성 시기, 데이터의 인용횟수 중 적어도 하나를 포함할 수 있다. Here, the condition included in the data request may include at least one of the type of data, the kind of the processing method, and the generation time, and the attribute of the data to be provided includes the type of the data, the kind of the processing method, And the number of citations of the data.

데이터의 대상물질은 사용자가 요청하는 데이터의 주체가 되는 물질을 말하며, 실험을 시행했던 대상이 되는 물질로서, '췌장암 조직(78세, 남, Stage Ⅲ, Grade 4)' 과 같이 실험 대상이 되었던 샘플(sample)에 대한 물질 정보를 의미한다. 또한, 데이터의 대상물질은 학계에서 이미 널리 알려진 분류도 포괄적으로 포함할 수 있다. 예를 들어, 사용자가 사용자 단말(270)을 통해 데이터 요청을 할 때, 필수 아미노산 20종을 특정하여 입력했다면, 사용자가 요청한 데이터의 대상물질은 필수 아미노산 20종 모두가 될 수 있다.The target substance of the data refers to the substance that is the subject of the data requested by the user and is a substance to be subjected to the experiment such as' pancreatic cancer tissue (78 years old, male, Stage Ⅲ, Grade 4) Means material information for a sample. In addition, the subject matter of the data may include a wide range of already well-known classifications in academia. For example, when a user makes a data request through the user terminal 270 and inputs 20 essential amino acids, the target substance of the data requested by the user can be all 20 essential amino acids.

여기서, 데이터의 종류는 전유전체 염기서열분석(Whole Genome Sequencing), 전엑솜 염기서열분석(Whole Exome Sequencing), 알엔에이 염기서열분석(RNA Sequencing) 등과 같은 차세대염기서열분석기법(Next Generation Sequencing)의 분석대상 중 어느 것인지를 나타낸다. 예를 들어, 알엔에이 염기서열분석(RNA Sequencing)에 대한 데이터의 종류는 알엔에이(RiboNucleic Acid)가 된다.Here, the data can be classified into the next generation sequencing method such as whole genome sequencing, whole exome sequencing, and RNA sequencing. Which is one of the analysis objects. For example, the data type for RNA Sequencing is RiboNucleic Acid.

여기서, 데이터의 처리방법의 종류는, 데이터를 생성하는 방법에 대한 정보를 말한다. 보다 상세하게는, 데이터의 처리방법의 종류는 차세대염기서열분석기법을 활용하여 분석하는 툴(tool)에 대한 종류를 의미한다. 특별히, 데이터의 처리방법의 종류에는 처리 또는 공정의 이름이 포함될 수 있다. 데이터의 처리방법의 종류에 대한 예시로는, 유전체학 기법인 전유전체 염기서열(WGS, Whole Genome Sequencing)나 전엑솜 시퀀싱(WES, Whole Exome Sequencing), 전사체학 기법인 마이크로어레이(Microarray)나 알엔에이 염기서열분석(RNA Sequencing), 단백질체학(Proteomics) 기법인 말디토프(MALDI-TOF, Matrix-Assisted Laser Desorption-Ionization Time Of Flight), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 대사체학(Metabolomics) 기법인, 핵자기공명-질량분석(NMR-MS, Nuclear Magnetic Resonance-Mass Spectrometry), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 가스 크로마토그래피-질량 분석(GC-MS, Gas Chromatography-Mass Spectrometry)가 있다. Here, the type of data processing method refers to information on a method of generating data. More specifically, the type of data processing method refers to a type of tool for analyzing using a next-generation sequencing analysis technique. In particular, the type of data processing method may include the name of the process or process. Examples of methods of processing data include genomic techniques such as whole genome sequencing (WGS), whole exome sequencing (WES), microarray (microarray) (MALDI-TOF, Liquid Chromatography-Mass Spectrometry (LC-MS), and Molecular-Assisted Laser Desorption-Ionization Time-of-Flight Mass spectrometry (NMR), liquid chromatography-mass spectrometry (LC-MS), gas chromatography (mass spectrometry) - GC-MS (Gas Chromatography-Mass Spectrometry).

또한, 데이터의 처리 방법은 아래의 분석 방법을 포함할 수 있다. The data processing method may include the following analysis method.

- (A) 유전체 데이터: whole genome, exome 서열 데이터 및 분석 데이터 등(variant calling, assembly, CNV, SV, visualization 등의 처리/가공 방법으로 처리할 수 있음)- (A) Dielectric data: Whole genome, exome sequence data and analysis data (can be processed by processing / processing methods such as variant calling, assembly, CNV, SV,

- (B) 전사체 데이터: RNA-seq, miRNA-seq 서열데이터 및 분석 데이터 등 (quantification, variant detection, alternative splicing, DEG 등의 처리/가공 방법으로 처리할 수 있음)- (B) Transcript data: RNA-seq, miRNA-seq sequence data and analysis data (can be processed by processing / processing methods such as quantification, variant detection, alternative splicing,

- (C) 후성유전체 데이터: ChIP-seq, Histone modifications, DNA methylation 분석 데이터 및 visualization 데이터 등- (C) Follow-up genomic data: ChIP-seq, Histone modifications, DNA methylation analysis data and visualization data

- (D) 네트워크 분석과 신호전달 조절 및 Pharmaco-Genomic 데이터: 네트워크 추론, subnetwork 및 모듈 분석, pathway 규명, 전사조절, 단백질 상호작용, 기능 네트워크, 질병-약물-유전체 정보 데이터마이닝 등- (D) Network analysis and signaling control and Pharmaco-Genomic data: Network reasoning, subnetwork and module analysis, pathway identification, transcription control, protein interaction, functional network, disease-drug-genome information data mining etc.

- (E) Meta-genome 데이터: microbiota, phylogeny 분석 등- (E) Meta-genome data: microbiota, phylogeny analysis, etc.

유전체와 관련된 데이터는 서로 다른 목적을 위해서 획득되어 지는데, 특히, 유전체 데이터를 이용하여 유전체의 염기 변이를 확인할 수 있고, 전사체 데이터를 이용하여 유전체의 발현 여부를 확인할 수 있고, 후성유전체 데이터를 이용하여 후성적으로 변화된 유전체를 확인할 수 있다. Data relating to the genome are obtained for different purposes. In particular, it is possible to confirm the base variation of the genome using the genome data, to confirm the expression of the genome using the transcript data, and to use the genome data To identify genetically altered genomes.

여기서, 데이터의 가공 여부는 데이터를 생성하는데 있어서 대상물질로부터 바로 획득되는 데이터 인지, 또는 대상물질에 특수한 처리(실험, 분리, 추출, 여과 등)를 한 후에 획득될 수 있는 데이터 인지 여부에 대한 정보를 말할 수 있다. Here, whether or not the data is processed is whether the data is obtained directly from the target material in generating the data or whether the data can be obtained after performing a special process (experiment, separation, extraction, filtration, etc.) .

보다 상세하게는, 데이터의 가공여부는 차세대염기분석기법으로 처리한 1차적인 실험 데이터를 기초로 하여, 단순하게는 유전자 염기서열 해독 더 나아가서는 해독된 염기서열 에서 돌연변이 유전자변이를 찾을 수 있는알고리즘으로 동작하는 소프트웨어를 사용하여, 유전자 복세수 변이 (Copy-number Variation:CNV), 유전자의 단일 염기의 다형성(Single Nucleotide Polymorphism:SNP)등을 찾아 정보를 찾는 등 보다 향상되고 진보된(advanced) 정보를 추출하는 과정을 거쳤는지 여부를 의미한다.More specifically, the processing of data is based on the primary experimental data processed by the next-generation base analysis technique, and is based on a simple algorithm for searching for a mutated gene sequence in a nucleotide sequence to be decoded, Advanced information such as copy-number variation (CNV), single nucleotide polymorphism (SNP), and so on, can be found by using software that operates on a single nucleotide polymorphism Is extracted or extracted.

유전자 변이를 선택하기 위한 소프트웨어로서 뮤트시그(MutSig, Mutation Significance)가 이용될 수 있고, 주기적인 복사 개수 변경으로부터 유전자를 선택하기 위한 소프트웨어로서 기스틱(Gistic)이 이용될 수 있으나, 반드시 상술한 소프트웨어로 한정하는 것은 아니며, 동일한 알고리즘을 수행할 수 있다면 다른 소프트웨어를 통해 데이터를 가공하더라도 본 발명의 범주를 벗어나는 것은 아니다.MutSig (Mutation Significance) may be used as software for selecting a gene variation, and Gistic may be used as software for selecting a gene from a periodic copy number change, And it is not outside the scope of the present invention to process the data through other software if the same algorithm can be performed.

본 발명의 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 장치는 1차적인 실험 데이터와 1차적인 실험 데이터를 가공한 데이터를 모두 제공할 수 있다. 즉, 여기서, 데이터의 가공 여부라는 항목을 통해서 대상물질을 통해 바로 획득되는 데이터(미가공 데이터), 대상물질에 대해서 특수한 처리(실험, 추출, 분리, 여과 등) 등을 한 후에 획득되는 데이터(가공 데이터)인지 여부에 대한 정보를 말한다.The data providing apparatus for the disease mechanism research according to the embodiment of the present invention can provide both the primary experimental data and the data obtained by processing the primary experimental data. That is, the data (raw data) obtained immediately after the object substance through the item of whether or not the data is processed, the data (raw data) obtained after performing a special process (experiment, extraction, separation, filtration, Data). ≪ / RTI >

즉, 다시 말해서, 데이터의 처리방법의 종류는 데이터에 적용되는 특수한 처리 또는 공정을 명확하게 알고 있을 때에 사용자가 사용자 단말을 통해 입력할 수 있는 조건이고, 사용자가 요청한 데이터의 가공여부는 데이터에 적용되는 특수한 처리 또는 공정을 모르더라도, 특수한 처리 또는 공정 전후로 데이터의 성질이 크게 달라지는 특성만 알고 있어도 적절한 데이터를 찾기 위한 조건으로 활용할 수 있는 조건이다.In other words, the type of data processing method is a condition that a user can input through a user terminal when a specific process or process applied to the data is clearly known, and whether or not the data requested by the user is processed is applied to the data Even if you do not know the specific process or process, you can use it as a condition to search for appropriate data even if you know the characteristic that the characteristic of the data greatly changes before or after the special process.

여기서, 데이터의 생성 시기는 데이터가 생성된 시점을 말한다. 데이터 요청자(사용자)는 데이터의 생성 시기를 한정하여 데이터 요청을 할 수 있다.Here, the generation time of the data refers to the time when the data is generated. The data requester (user) can request data by limiting the generation time of data.

예를 들어, 사용자가 6개월전에 생성된 데이터를 요청한다면, 사용자는 사용자 단말(270)에 현재로부터 6개월 전의 날짜범위를 입력함으로써, 데이터 제공 장치(200)로부터 해당 날짜범위에 생성된 데이터를 제공받을 수 있다.For example, if the user requests data generated six months in advance, the user inputs data in the date range from the data providing device 200 to the user terminal 270 by inputting the date range six months before the current date Can be provided.

여기서, 데이터의 인용 횟수는 데이터가 논문에 인용된 횟수에 대한 정보를 의미한다. 데이터의 인용 횟수는 해당 데이터가 얼마나 심도있게 연구되고 있는지에 대해서 알려주는 척도가 될 수 있다. 데이터 속성 결정부(220)는 데이터의 인용 횟수에 대한 최신 정보를 수집하기 위해서 논문관련정보를 제공하는 외부 서버와 유무선 네트워크를 통해서 연결될 수 있다.Here, the number of citations of data means information on the number of times the data is cited in the paper. The number of citations of the data can be a measure of how deeply the data is being studied. The data attribute determination unit 220 may be connected to an external server that provides paper related information in order to collect the latest information on the number of citations of data through a wired / wireless network.

사용자 단말(270)에 제공할 데이터의 속성(이하, 데이터 속성)은, 데이터 속성 결정부(220)가 위와 같은 데이터 요청에 포함된 조건을 기초로 결정되며, 데이터 속성은 데이터 요청에 포함된 각각의 조건을 특징값(feature)으로 하는 하나 이상의 값으로 결정되며, 물질 관련 속성 또는 처리 관련 속성을 포함할 수 있다. 최종적으로 제공할 데이터 속성은 테이블 형태가 될 수 있다.The attributes of the data to be provided to the user terminal 270 (hereinafter, data attributes) are determined based on the conditions included in the data request as described above, , And may include a substance-related property or a process-related property. The data attribute to be finally provided can be a table type.

데이터 속성 결정부(220)에 의해 결정된 테이블 형태의 데이터 속성은, 후술하는 데이터 검색부(230)의 입력값으로 입력될 수 있으며, 데이터 속성을 구성하는 테이블의 크기는 데이터 요청에 포함된 조건의 수에 따라 달라질 수 있다. 또한, 데이터 속성(물질 관련 속성 또는 처리 관련 속성)은 데이터 요청에 포함된 각 조건에 하나 이상으로 결정될 수 있다.The data attribute of the table type determined by the data attribute determination unit 220 may be input as an input value of the data search unit 230 to be described later. It depends on the number. In addition, the data attributes (material-related attributes or process-related attributes) can be determined more than once for each condition included in the data request.

데이터 검색부(230)는 사용자가 요청한 데이터의 속성(물질 관련 속성 또는 처리 관련 속성)과 대응되는 데이터를 검색한다. 보다 구체적으로는, 데이터 검색부(230)는 데이터 속성을 데이터 속성 결정부(220)로부터 전달받아, 데이터베이스 그룹(240)에 저장되어 있는 데이터 중에서, 데이터 속성(물질 관련 속성 또는 처리 관련 속성)과 대응되는 데이터를 검색할 수 있다.The data retrieving unit 230 retrieves data corresponding to attributes (material-related attributes or process-related attributes) of data requested by the user. More specifically, the data retrieving unit 230 receives a data attribute from the data attribute determining unit 220 and extracts a data attribute (a substance-related property or a process-related property) from the data stored in the database group 240 The corresponding data can be retrieved.

데이터베이스 그룹(240)은 데이터 제공 장치(200)가 사용자 단말(270)에 제공할 수 있는 각종 데이터를 저장한다. 데이터베이스 그룹(240)에 저장되는 각종 데이터는 데이터 검색부(230)에서 검색을 용이하게 하기 위해서, 각 데이터마다 고유한 식별코드를 가질 수 있다.The database group 240 stores various data that the data providing apparatus 200 can provide to the user terminal 270. Various data stored in the database group 240 may have an identification code unique to each data in order to facilitate the search in the data searching unit 230. [

데이터베이스 그룹(240)은 각 데이터를 특성별로 구분하여 저장하기 위해서 복수 개의 소규모 데이터베이스를 포함할 수 있다. 도 2를 참조하면, 데이터베이스 그룹(240)은 4개의 소규모 데이터베이스를 포함하고, 본 발명은 데이터베이스 그룹(240)에 포함될 수 있는 소규모 데이터베이스의 개수를 특정한 숫자로 한정하지 않으므로, 본 발명의 다른 실시 예에서 데이터베이스 그룹(240)은 4개보다 많거나 적은 소규모 데이터베이스를 포함할 수도 있다.The database group 240 may include a plurality of small databases in order to store each data classified according to characteristics. Referring to FIG. 2, the database group 240 includes four small databases, and the present invention does not limit the number of small databases that can be included in the database group 240 to a specific number. Therefore, The database group 240 may include fewer or more small databases than four.

선택적 실시 예로서, 데이터베이스 그룹(240)에 포함된 각 소규모 데이터베이스는 가공처리부(미도시)를 포함할 수 있다. 가공처리부(미도시)는 소규모 데이터베이스에 저장되는 데이터가 특정 방법으로 가공처리됨에 따라 데이터의 성질이나 연구 가치가 달라지는 경우, 미가공 데이터를 가공하여 가공 데이터로 처리한다. 소규모 데이터베이스에 가공처리부(미도시)를 두고 사용자의 데이터 요청이 있을 때마다 미가공데이터를 가공한 가공 데이터를 제공하면, 소규모 데이터베이스에 미가공데이터와 가공 데이터를 모두 저장하는 것보다 소규모 데이터베이스의 저장공간의 활용에 있어서 더 이득이 될 수 있다.As an alternative embodiment, each small database included in database group 240 may include a processing unit (not shown). The processing unit (not shown) processes the raw data and processes it as processed data when the data stored in the small-scale database is processed by a specific method and the nature of the data or the research value is changed. When processing data (raw data) is processed every time a user requests data with a processing unit (not shown) in a small database, it is more efficient to store the raw data and processed data in a small database It can be more beneficial in utilization.

가격 결정부(250)는 데이터 검색부(230)에서 검색된 데이터의 생성자에 대한 정보, 생성에 필요한 시간, 생성에 필요한 자원 등을 고려하여 사용자가 요청한 데이터의 가격을 결정한다. 다른 실시예에서, 가격 결정부(250)는 검색된 데이터의 생성자에 대한 정보 및/또는 데이터의 속성을 기초로 데이터의 최초 가격을 결정하는 제1 가격 결정부(미도시) 및 상기 데이터의 생성에 필요한 시간, 생성에 필요한 자원을 고려한 가격 변화율을 산출하고, 상기 최초 가격 및 상기 가격 변화율을 모두 고려하여, 상기 데이터의 최종 가격을 결정하는 제2 가격 결정부를 포함할 수 있다. The price determining unit 250 determines the price of data requested by the user in consideration of the information on the creator of the data retrieved from the data retrieving unit 230, the time required for the generation, resources required for generation, and the like. In another embodiment, the pricing unit 250 includes a first pricing unit (not shown) for determining the initial price of the data on the basis of the information about the producer of the retrieved data and / or the attributes of the data, A second price determining unit that calculates a rate of price change considering a required time and a resource required for generation and determines a final price of the data in consideration of both the initial price and the rate of change in price.

제1 가격 결정부는 검색된 데이터의 속성 중 물질 관련 속성을 기초로 데이터의 최초 가격을 결정할 수 있다. 제1 가격 결정부는 데이터의 대상 물질을 비교하여, 희귀한 암의 조직이라서 획득하기 어려운 대상물질에 대해서는 더 높은 가격을 매길 수 있고, 흔한 암의 조직이라서 획득하기 쉬운 대상물질에 대해서는 더 낮은 가격을 매길 수 있다. The first pricing unit may determine the initial price of the data based on the material-related attributes among the attributes of the retrieved data. The first pricing decision unit compares the data of the target substances and can charge a higher price for a target substance that is difficult to obtain because it is a rare cancer tissue. It can be tied.

여기서, 데이터의 생성자에 대한 정보는 데이터를 생성한 사람에 대한 정보로서, 데이터를 생성할 당시의 지위 및 사용자의 데이터 요청을 받은 현재의 지위를 모두 포함할 수 있다. 여기서, 지위는 직업 또는 경력 등을 포함하는 정보로서, 직업 또는 경력과 대응되는 등급 정보를 포함할 수도 있다. 즉, 경력이 9년차인 생성자의 지위가 경력이 3년차인 생성자의 지위보다 높고, 연구원이 직업인 생성자의 지위가 연구와 무관한 직업을 가진 생성자의 지위보다 높을 수 있다. 즉, 의사, 연구원 등과 같이 암 관련 연구 및 임상을 할 수 있는 직업을 가진 생성자의 지위를 더 높게 책정하고, 해당 경력이 더 많은 생성자의 지위를 더 높게 책정한다. 여기서, 생성자의 지위는 생성자의 최종학력, 생성자의 전공, 생성자의 직업, 생성자의 누적 논문수, 생성자의 수상 경력 등을 포함하거나, 생성자의 최종학력, 생성자의 전공, 생성자의 직업, 생성자의 누적 논문수, 생성자의 수상 경력 등을 종합적으로 고려하여 산출할 수 있다. Here, the information on the creator of the data is information on the person who generated the data, and may include both the status at the time of generation of the data and the status of the user received the data request. Here, the position may include information such as a career or a career, and may include class information corresponding to a career or a career. In other words, the status of the constructor with 9 years of experience is higher than that of the constructor with 3 years of experience, and the status of the constructor who is a researcher may be higher than that of a constructor with a career independent of the research. In other words, the higher the status of a creator with a career to do cancer-related research and clinical work, such as a doctor or a researcher, and the higher the level of the creator with that career. Here, the status of the constructor includes the final educational background of the constructor, the major of the constructor, the profession of the constructor, the number of papers of the constructor, the prize winning history of the constructor, or the final academic ability of the constructor, the major of the constructor, The number of papers, and the awards of the creators.

가격 결정부(250)는 데이터의 생성자의 생성시 지위만을 고려하여, 데이터의 가격을 결정할 수 있다. 예를 들어, 가격 결정부(250)는 데이터를 생성할 당시에 데이터 생성자의 지위가 높은 데이터에 대해서 좀 더 높은 가격을 매길 수 있다.(이하, 제1사례)The price determining unit 250 can determine the price of the data by considering only the status when generating the data. For example, the price determination unit 250 may set a higher price for data having a high status of the data producer at the time of generating the data (hereinafter, the first case)

선택적 실시 예로서, 데이터의 가격을 결정하기 위해서 이용되는 생성자의 종합적 등급인 지위는 사용자 또는 관리자에 의해서 새로 매겨질 수도 있다. 또한, 생성자의 지위는 생성자의 과거 경력 또는 직업 등을 통해 산출된 제1 등급과 사용자 또는 관리자에 의해 산출된 제2 등급을 합산하여 결정될 수 있다. 이때, 생성자의 지위는 제1 등급과 제2 등급에 대해서 각각 다른 가중치를 두어 가중 평균하여 산출될 수 있다. As an alternative embodiment, the aggregate rank of the constructors used to determine the price of the data may be updated by the user or administrator. In addition, the position of the creator can be determined by summing the first class calculated through the past career or occupation of the creator, and the second class calculated by the user or the manager. At this time, the status of the creator can be calculated by weighted averaging of different weights for the first and second classes.

예를 들어, 처음에 매겨져 있는 생성자의 종합등급은 생성자의 직업에 대한 요소가 많이 반영되어 있었다면, 사용자는 생성자의 누적 논문수나 생성자의 수상 경력을 위주로 하여 새로운 종합등급을 산출하고, 산출된 종합등급을 기준으로 하여 데이터를 검색함으로써 사용자가 원하는 데이터를 검색할 수 있다.For example, if the overall grade of the constructor initially assigned reflects a lot of elements of the creator's job, the user can calculate a new overall grade based on the number of the cumulative number of papers of the constructor or the award winner of the constructor, So that the user can retrieve the desired data.

가격 결정부(250)는 생성자의 생성시 지위와 현재 지위를 모두 고려하여, 데이터의 최초 가격을 결정할 수 있다. 데이터를 생성할 당시에 데이터 생성자의 지위가 낮았으나, 사용자의 데이터 요청을 받은 현재에 데이터 생성자의 지위가 높을 경우(이하, 제2사례), 가격 결정부(250)는 생성자가 데이터를 생성한 이후에 좀더 많은 연구 성과를 낸 생성자의 현재 지위를 고려하여, 생성시 지위를 통해 산출된 데이터의 가격 보다 더 높게 데이터의 최초 가격을 결정할 수 있다. The price determination unit 250 can determine the initial price of the data in consideration of both the status and the current status when the producer is created. In the case where the status of the data producer is low at the time of generating the data but the status of the data producer is high at the time of receiving the data request of the user (hereinafter, the second case), the pricing unit 250 The initial price of the data can be determined to be higher than the price of the data generated through the position at the time of creation, taking into account the current status of the creator who has made more research achievements.

다른 실시 예에서, 가격 결정부(250)는 현재 지위가 검색되지 않은 생성자의 데이터에 대해서 생성시 지위를 통해 산출된 데이터의 가격보다 더 낮은 가격으로 상기 데이터의 최초 가격을 결정할 수 있다. 예를 들어, 데이터를 생성할 당시에 데이터 생성자의 지위가 낮고, 사용자의 데이터 요청을 받은 현재에 데이터 생성자의 지위가 낮거나 검색되지 않는 경우(이하, 제3사례), 가격 결정부(250)는 생성자의 현재 지위가 검색되지 않는 점을 고려하여, 생성자의 연구 의지가 낮다고 판단할 수 있고, 이러한 점을 고려하여, 데이터의 가격을 다소 낮은 가격으로 최초 가격을 결정할 수 있다.In another embodiment, the pricing unit 250 may determine the initial price of the data for the data of the producer whose current position is not searched for at a price lower than the price of the data calculated through the position at the time of generation. For example, if the status of the data producer is low at the time of generating the data and the status of the data producer is low or is not searched at present (hereinafter, the third case), the pricing decision unit 250 Considering the fact that the current position of the constructor is not searched, it can be determined that the creator is willing to study, and in consideration of this, the initial price can be determined at a slightly lower price of the data.

가격 결정부(250)는 전술한 것과 같이 데이터를 생성한 사람의 데이터 생성 당시의 지위 및 사용자의 데이터 요청을 받은 현재의 지위 중 적어도 하나에 의해서 데이터의 가격을 차등적으로 결정할 수 있다. 가격 결정부(250)는 데이터 생성자의 현재 지위에 대한 정보를 실시간으로 확인하기 위해서 외부 개인정보 제공서버(미도시)와 유무선 네트워크를 통해 연결될 수 있다.The price determining unit 250 can differentially determine the price of the data by at least one of the status at the time of data generation of the person who generated the data and the current status in which the data request of the user is received as described above. The price determining unit 250 may be connected to an external personal information providing server (not shown) through a wired or wireless network in order to check information on the current status of the data producer in real time.

선택적 실시 예로서, 가격 결정부(250)는 사용자 단말(270)을 통해 데이터를 요청한 사용자와 데이터를 생성한 생성자의 동일 여부, 사용자 단말(270)을 통해 데이터를 요청한 사용자와 사용자가 요청한 데이터 사이의 관련성 중 적어도 하나를 고려하여 데이터의 가격 변화율을 결정할 수도 있다. 여기서, 사용자 단말(270)을 통해 데이터를 요청한 사용자와 사용자가 요청한 데이터 사이의 관련성은, 사용자 단말(270)을 통해 데이터를 요청한 사용자가, 사용자 단말(270)을 통해 요청한 데이터를 생성하는 데에 기여한 정도가 될 수 있다. 예를 들어, 특정 데이터 Z의 생성자는 A, B, C, 이상 세 사람이고, 각각 데이터를 생성하는데 기여한 정도가 상, 중, 하이며, C가 데이터 Z에 대한 제공요청을 했다고 가정하면, 가격 결정부(250)는 데이터를 요청한 자와 생성한 자가 모두 C로 동일하다고 판단하여, 높은 할인율을 적용하여 데이터 가격을 결정하거나, 데이터를 요청한 자가 데이터를 생성한 자이기는 하지만, 기여도가 낮으므로, 낮은 할인율을 적용하여 데이터 가격을 결정할 수 있다.As an alternative embodiment, the pricing unit 250 may determine whether the user requesting the data through the user terminal 270 is the same as the creator that generated the data, between the user requesting the data through the user terminal 270 and the data requested by the user The rate of change in the price of the data may be determined in consideration of at least one of the relevancy of the data. Here, the relevance between the user requesting the data through the user terminal 270 and the data requested by the user is determined by the user requesting the data through the user terminal 270 to generate the data requested through the user terminal 270 Contribution can be degree. For example, assuming that the producer of the specific data Z is A, B, C, three or more persons, and the degree of contribution to the generation of the data is high, medium and low, The decision unit 250 decides that the data requesting party and the data requesting party are identical to each other in C, determines the data price by applying a high discount rate, or generates the data requesting the data. However, since the contribution is low, Data rates can be determined by applying a low discount rate.

선택적 실시 예로서, 데이터의 생성자에 대한 정보는 생성자의 레벨 정보를 포함할 수 있다. 여기서, 생성자의 레벨 정보는 생성자가 생성한 데이터의 수, 생성자가 생성한 데이터의 누적 판매량, 생성자가 생성한 데이터로부터의 수입 중 적어도 하나를 고려하여 결정될 수 있다. 다른 실시 예에서, 가격 결정부(250)는 데이터의 가공 여부를 고려하여 데이터의 가격 변화율을 결정할 수 있다. 예를 들어, A라는 대상물질에 대한 미가공 데이터, A라는 대상물질에 대한 가공 데이터가 있다고 하면, 가격 결정부는 가공 데이터의 가격 변화율을 미가공 데이터의 가격 변화율보다 높게 결정할 수 있다. 차등된 데이터의 가격에 따라, 미가공 데이터만을 구매하는 사용자는 미가공 데이터 및 가공 데이터를 모두 구매하거나, 가공 데이터만을 구매하는 사용자보다 더 낮은 금액을 결제하면 된다.As an alternative embodiment, the information about the creator of the data may include the level information of the creator. Here, the level information of the producer can be determined in consideration of at least one of the number of data generated by the producer, the cumulative sales amount of the data generated by the producer, and the income from the data generated by the producer. In another embodiment, the pricing unit 250 may determine the rate of price change of the data in consideration of whether or not the data is processed. For example, if raw data for a target material A and processed data for a target material A are present, the pricing section can determine the price change rate of the processed data to be higher than the rate of price change of the raw data. Depending on the price of the differential data, a user who purchases only raw data may purchase all the raw data and processed data, or settle a lower amount than the user who purchases only processed data.

다른 실시 예에서, 가격 결정부(250)는 데이터의 생성에 필요한 시간을 고려하여 상기 데이터의 가격 변화율을 결정할 수 있다. 가격 결정부(250)는 데이터의 생성에 필요한 시간이 길수록 상기 데이터의 가격 변화율을 높게 결정할 수 있다. 데이터의 생성에 대한 필요한 시간은 데이터를 생성하는 방식 및 생성자의 역량에 따라 달라질 수 있으므로, 고정된 시간이 아닌 시간적 범위로 표시할 수 있다. 이때, 표시되는 시간적 범위 외에 데이터 생성하는 데 걸리는 최대시간 및 최소시간과 해당 데이터를 생성하여 업로드한 여러 업로더의 데이터의 생성 시간에 대한 평균시간도 추가로 표시할 수도 있다. 예를 들어, 유전체 데이터 중 assembly 방법으로 가공된 데이터를 요청하는 데이터 요청과 대응하여, 가격 결정부(250)는 유전체 데이터를 assembly 방법으로 가공하는데 필요한 자원(시간, 비용 등)을 고려하여, 상기 데이터의 가격 변화율을 결정할 수 있다. 또한, 유전체 데이터 중 CNV 방법으로 가공된 데이터를 요청하는 데이터 요청과 대응하여, 가격 결정부(250)는 유전체 데이터를 assembly 방법으로 가공하는 것과는 구별되게 CNV 방법으로 가공하는데 필요한 자원(시간, 비용 등)을 고려하여, 상기 데이터의 가격 변화율을 결정할 수 있다. 이를 통해, 본 발명의 실시예에 따른 데이터 제공 장치는 요청된 동일한 종류의 데이터에 대한 가격을 요청자의 요청에 포함된 데이터 가공 방법에 따라서 차등적으로 결정할 수 있다. In another embodiment, the pricing unit 250 may determine the rate of price change of the data in consideration of the time required to generate the data. The price determining unit 250 can determine the rate of price change of the data to be higher as the time required for generating the data is longer. The time required to generate the data may vary depending on the method of generating the data and the capacity of the creator, so that the time can be displayed instead of the fixed time. At this time, besides the displayed temporal range, the maximum time and minimum time required to generate data and the average time for generating data of the uploaders of the uploaded data may be additionally displayed. For example, in response to a data request for requesting data processed by the assembly method among the dielectric data, the pricing unit 250 determines the resources (time, cost, etc.) necessary for processing the dielectric data by the assembly method, The rate of price change of the data can be determined. In addition, in response to a data request requesting data processed by the CNV method among the dielectric data, the pricing unit 250 allocates resources (time, cost, etc.) necessary for processing by the CNV method, differently from processing the dielectric data by the assembly method , It is possible to determine the price change rate of the data. Accordingly, the data providing apparatus according to the embodiment of the present invention can differentially determine the price for the requested same kind of data according to the data processing method included in the request of the requester.

다른 실시 예에서, 가격 결정부(250)는 데이터의 생성에 필요한 자원, 예를 들어, 비용 등을 고려하여 데이터의 가격 변화율을 결정할 수 있다. 가격 결정부(250)는 데이터를 생성하는 필요한 자원이 많은 데이터에 대해서 더 높은 가격 변화율을 매길 수 있다.In another embodiment, the pricing unit 250 may determine a rate of price change of data in consideration of resources required for generating data, for example, cost. The pricing unit 250 may set a higher price change rate for the data with a large amount of necessary resources for generating the data.

다른 실시 예에서, 가격 결정부(250)는 미가공 데이터 및 가공 데이터를 생성하기 위해서 필요한 초기 데이터에 따라서, 미가공 데이터 및 가공 데이터의 가격 변화율을 결정할 수 있다. 여기서 초기 데이터는 데이터의 가격을 명확하게 정할 수 있도록, 데이터에 대한 순도나 분석 결과에 대한 정성적, 정량적 판단이 가능한 데이터일 것을 요한다.In another embodiment, the pricing unit 250 can determine the rate of price change of the raw data and the processed data according to the raw data and the initial data required to generate the processed data. Here, the initial data needs to be data that can be used for qualitative and quantitative determination of the purity of the data or the analysis result so that the price of the data can be clearly determined.

데이터 제공부(260)는 사용자가 요청한 데이터 및 가격 결정부(250)에서 결정된 데이터의 가격을 포함하는 표시 정보를 사용자 단말(270)로 제공한다. 사용자는 표시 정보에 포함된 데이터 및 데이터의 가격을 확인하고, 결제를 진행할지 여부를 결정할 수 있다.The data providing unit 260 provides display information including the data requested by the user and the price of the data determined by the price determining unit 250 to the user terminal 270. The user can confirm the price of the data and data included in the display information, and decide whether or not to proceed with the payment.

사용자 단말(270)로 제공되는 표시 정보는 사용자 단말(270)로 제공된 데이터를 통해 획득할 수 있는 효과 및 사용자 단말(270)로 제공된 데이터에 포함되는 일부내용 중 적어도 하나를 포함할 수 있다.The indication information provided to the user terminal 270 may include at least one of the effects that can be obtained through the data provided to the user terminal 270 and some contents included in the data provided to the user terminal 270. [

사용자가 요청한 데이터에 포함되는 일부내용은, 해당 데이터를 취급하는 분야에 속한 사람이라면 바로 알 수 있을 정도로, 미리보기 형식으로 제공되는 데이터를 의미한다. 사용자는 데이터에 포함되는 일부내용을 확인하여 구매여부를 결정하는 데에 활용할 수 있다.Some of the data included in the data requested by the user means data provided in a preview format so that the user can know immediately if the user belongs to the field handling the data. The user can check some contents included in the data and utilize them to decide whether or not to purchase.

Figure 112018058831008-pat00001
Figure 112018058831008-pat00001

표 1은 사용자 단말(270)의 디스플레이부를 통해 출력되는 표시 정보에 대한 예시이다.Table 1 is an example of display information output through the display unit of the user terminal 270.

표 1을 해석하면, 사용자는 데이터 제공 장치에 2013년 11월 13일에 생성된 췌장암 조직 데이터의 미가공 디앤에이 데이터에 대한 제공을 요청한 것을 알 수 있다. 표 1을 참조하면, 사용자는 미가공 디앤에이 데이터를 이용해서, 췌장암의 항암제 개발 및 바이오마커를 특정할 수 있을 것으로 기대된다.Analyzing Table 1, it can be seen that the user requested the data providing device to provide the raw D & A data of the pancreatic cancer tissue data generated on November 13, Referring to Table 1, the user is expected to be able to identify cancer drug development and biomarkers of pancreatic cancer using raw D & A data.

표 1을 참조하면, 미가공 디앤에이 데이터를 생성한 생성자는 3명으로, 미가공 디앤에이 데이터를 생성할 당시의 지위와, 현재의 지위가 각각 달라졌으며, 생성자 3명의 기여도도 각각 다르다. 사용자는 상술한 내용 외에도 표 1과 같은 표시 정보를 통해, 데이터 생성에 필요한 물질, 시간, 사용자 레벨, 데이터의 가격, 데이터 미리보기(데이터의 일부내용)을 확인한 후, 결제를 하여 데이터를 제공받을지 여부를 결정할 수 있다.Referring to Table 1, there are three producers that generated raw D & A data, and their status at the time of generation of raw D & A data and current status are different, and the contribution of the three producers is also different. In addition to the above-mentioned contents, the user confirms the substance, time, user level, price of the data, and data preview (a part of the data) required for data generation through the display information as shown in Table 1, Can be determined.

표 1을 참조하면, 사용자가 요청한 데이터의 가격은 160만원으로 결정되었는데, 이 가격은 요청된 데이터의 생성에 필요한 자원(난이도, 시간, 비용 등), 데이터를 생성한 생성자의 정보, 생성 시기를 종합적으로 고려하여 산출된 것이며, 만약 사용자 레벨이 3보다 높아지면 사용자는 160만원보다 더 할인된 가격에 데이터를 구매할 수도 있다. 또한 가격은 요청된 데이터의 종류 및 각 데이터의 획득 방법(처리, 가공 방법)을 고려하여, 산출될 수 있다. 이때. 데이터의 획득 방법(처리, 가공 방법)에 따른 가격은 생성에 필요한 자원, 시간 등에 따라 설정된 난이도 등급에 비례할 수 있다.Referring to Table 1, the price of the data requested by the user is determined to be 1,600,000 won. This price includes the resources (difficulty, time, cost, etc.) required for generating the requested data, information of the producer that generated the data, And if the user level is higher than 3, the user may purchase the data at a discount rate of less than 1.6 million won. The price can be calculated in consideration of the kind of requested data and the method of obtaining each data (processing, processing method). At this time. The price according to the data acquisition method (processing, processing method) may be proportional to the degree of difficulty set according to the resources, time, etc. required for generation.

데이터 제공부(260)는 사용자가 사용자 단말(270)을 통해 결제를 완료하면 사용자 단말(270)로 사용자가 요청한 데이터를 전송할 수 있다. 선택적 실시 예로서, 사용자가 요청한 데이터의 용량이 방대하여 유무선 네트워크를 통한 전송이 어려울 경우에는, 데이터 제공 장치(200)에 연결되어 있는 배송용 하드디스크(미도시)에 사용자가 요청한 데이터가 전송될 수도 있다. 사용자는 오프라인으로 배송용 하드디스크를 수신함으로써, 사용자가 사용자 단말(270)을 통해 요청했던 데이터를 제공받을 수 있다.The data providing unit 260 may transmit the data requested by the user to the user terminal 270 when the user completes the settlement through the user terminal 270. In an alternative embodiment, when the amount of data requested by the user is too large to be transmitted over a wired or wireless network, data requested by a user may be transmitted to a hard disk for delivery (not shown) connected to the data providing apparatus 200 have. The user can receive the data requested by the user through the user terminal 270 by receiving the hard disk for distribution offline.

선택적 실시 예로서, 데이터 요청에 포함된 조건은 전술한 사용자가 요청한 데이터의 대상물질, 종류, 처리방법의 종류, 생성 시기 외에 데이터의 예산 범위, 총 한도 금액 중 적어도 하나를 포함할 수 있다.As an alternative embodiment, the condition included in the data request may include at least one of the target material, the type of the data requested by the user, the kind of the processing method, the budget range of the data besides the generation time, and the total limit amount.

사용자는 사용자 단말(270)을 통해 데이터 요청을 하면서 사용자가 결제할 수 있는 금액에 대한 정보도 같이 전송함으로써, 데이터 제공 장치(200)가 그 금액에 대한 정보를 고려하여 데이터를 제공하도록 할 수 있다. 이 선택적 실시 예에 의하면, 데이터 제공부(260)는 데이터의 예산 범위에 포함된 최소 금액 또는 최대 금액을 고려하여 데이터 검색부(230)에 의해 검색된 데이터 중 일부를 추출하고, 추출한 데이터를 사용자 단말로 제공하거나, 추출한 데이터의 가격의 총합이 총 한도 금액을 초과하지 않도록 데이터 검색부(230)에 의해 검색된 데이터 중 하나 이상의 데이터를 추출하고, 추출한 데이터를 사용자 단말(270)로 제공하는 선택적 제공부(261)를 포함할 수 있다.The user can also transmit information about the amount that the user can make payment while requesting the data through the user terminal 270 so that the data providing apparatus 200 can provide the data considering the information about the amount . According to this alternative embodiment, the data providing unit 260 extracts a part of the data retrieved by the data retrieving unit 230 in consideration of the minimum or maximum amount included in the budget range of the data, Or extracts one or more pieces of data retrieved by the data retrieving unit 230 so that the total of the prices of the extracted data does not exceed the total limit amount, and provides the extracted data to the user terminal 270 (261).

선택적 실시예에서, 데이터 요청 수신부(210)는 사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신할 수 있다. 또한, 데이터 요청 수신부(210)는 유전체 관련 데이터를 포함하는 검색 요청을 수신할 수 있다. 검색 요청은 다양한 사용자 입력을 통해 수신되며, 병리학적 데이터 뿐만 아니라 생물학적 데이터를 포함할 수 있다. 병리학적 데이터를 포함하는 검색 요청의 경우에는 데이터 속성 결정부(220)는 상기 병리학적 데이터와 관련된 유전자의 종류를 추출할 수 있다. 예를 들어, 데이터 속성 결정부(220)는 병리학적 데이터인 위암과 관련된 유전자의 종류를 추출할 수 있다. In an alternative embodiment, the data request receiver 210 may receive a search request containing the first pathological data from the user. In addition, the data request receiving unit 210 may receive a search request including the genome-related data. The search request is received via various user inputs and may include biological data as well as pathological data. In the case of a search request including pathological data, the data property determination unit 220 may extract the type of gene related to the pathological data. For example, the data attribute determination unit 220 may extract the types of genes associated with gastric cancer, which are pathological data.

데이터 속성 결정부(220)는 병리학적 데이터 뿐만 아니라, 검색 요청에 포함된 다른 조건을 고려하여, 상기 검색 요청과 대응되는 유전자의 종류 및 대상체의 또 다른 속성을 결정할 수 있다. 유전체 관련 데이터를 포함하는 검색 요청의 경우에는 데이터 속성 결정부(220)는 검색 요청에 포함된 데이터의 종류를 고려하여, 상기 유전체 관련 데이터로부터 검색 대상의 속성을 결정할 수 있다. 예를 들어, 질병인 유방암을 포함하는 검색 요청의 응답으로, 데이터 속성 결정부(220)는 Estrogen Receptor (ER) 유전자를 추출하고, 데이터 검색부(230)는 상기 유전자에 대해서 변이가 발생한 대상체를 검색할 수 있다. 데이터 검색부(230)는 검색된 대상체의 해당 유전자에 대한 변이 여부, 변이 종류를 검색할 수 있다. 또한, 질병인 폐암을 포함하는 검색 요청의 응답으로, 데이터 속성 결정부(220)는 EGFR 유전자를 추출하고, 데이터 검색부(230)는 상기 유전자에 대해서 변이가 발생한 대상체를 검색할 수 있다. 데이터 검색부(230)는 검색된 대상체의 해당 유전자에 대한 변이 여부, 변이 종류를 검색할 수 있다.The data attribute determination unit 220 may determine the type of the gene corresponding to the search request and another attribute of the object in consideration of the pathological data as well as other conditions included in the search request. In the case of the search request including the genome-related data, the data attribute determination unit 220 may determine the attribute of the search target from the genome-related data in consideration of the type of the data included in the search request. For example, in response to a search request including breast cancer, which is a disease, the data attribute determination unit 220 extracts an Estrogen Receptor (ER) gene, and the data search unit 230 searches for a subject You can search. The data search unit 230 can search for the mutation type and the mutation type for the corresponding gene of the searched object. Also, in response to a search request including lung cancer, which is a disease, the data attribute determination unit 220 extracts the EGFR gene, and the data search unit 230 can search for the object in which the mutation has occurred with respect to the gene. The data search unit 230 can search for the mutation type and the mutation type for the corresponding gene of the searched object.

데이터 속성 결정부(220)는 제1 시점에서는 제1 질병과 관련된 유전자로서 제1 유전자를 추출하다가도, 제1 시점 이후의 연구 결과에 따라 제1 시점으로부터 소정의 시간 이후의 제2 시점에서는 제1 질병과 동일한 질병에 대해서, 제1 유전자와 다른 제2 유전자를 추출하도록 할 수 있다. 즉, 데이터 속성 결정부(220)는 시간이 흘러 많은 연구가 이루어져 제1 시점에서의 결정된 데이터 및 제2 시점에서의 결정된 데이터를 다르게 결정할 수 있다. 즉, 이를 통해, 사용자는 데이터를 요청한 시점에 따라 다른 데이터를 제공 받을 수 있게 된다. 이를 통해, 본 발명의 실시예들에 따른 데이터 제공 장치(200)는 과학, 의료 기술의 진보를 반영할 수 있는 데이터를 제공하게 된다. The data attribute determination unit 220 extracts the first gene as a gene related to the first disease at the first time point and extracts the first gene at the second time point after the predetermined time from the first time point, For the same disease as the disease, the first gene and the other second gene can be extracted. That is, the data attribute determination unit 220 can determine the determined data at the first point of time and the determined data at the second point of time by conducting a lot of research over time. That is, the user can receive different data according to the time of requesting the data. Accordingly, the data providing apparatus 200 according to the embodiments of the present invention provides data that can reflect advances in science and medical technology.

데이터 속성 결정부(220)는 질병 및 질병에 대한 치료, 처방 내역 등을 포함하는 검색 요청의 응답으로, 상기 질병 및 치료, 처방 내역이 동일한 대상체를 검색하도록 할 수 있다. 즉, 데이터 속성 결정부(220)는 상기 질병 및 치료, 처방 내역이 동일한 대상체를 검색하는 검색식을 생성할 수도 있다. The data attribute determination unit 220 may cause the disease, treatment, and prescription history to search for the same object in response to a search request including treatment for diseases and diseases, prescription details, and the like. That is, the data attribute determination unit 220 may generate a retrieval expression for retrieving the object having the same disease, treatment, and prescription history.

데이터 검색부(230)는 상기 제1 병리학적 데이터와 관련된 상기 유전자의 종류에 포함되는 각 유전자의 발현 정도를 검색하고, 각 유전자의 발현 정도로 발현된 생물학적 데이터를 검색하고, 상기 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색한다. The data searching unit 230 searches the degree of expression of each gene included in the type of the gene related to the first pathological data, searches for biological data expressed by the expression level of each gene, Searches for a second object, retrieves a record of second biological data and second pathological data linked to the record corresponding to the second object.

데이터 제공부(260)는 상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로 제공한다. The data providing unit 260 provides a record of the second biological data and a record of the second pathological data to the terminal of the user.

가격 결정부(250)는 상기 제2 생물학적 데이터의 적정성 또는 상기 제2 병리학적 데이터의 완전성을 기초로 상기 사용자에게 청구할 청구 금액을 결정할 수 있다. 추가적으로, 가격 결정부(250)는 상기 청구 금액에 대한 결제 처리를 사용자의 단말로 전송할 수 있다. 여기서, 생물학적 데이터의 적정성 및 병리학적 데이터의 완전성은 도 10에 대한 설명에서 자세히 하겠다. The price determining unit 250 may determine a charge to be charged to the user based on the appropriateness of the second biological data or the completeness of the second pathological data. In addition, the price determination unit 250 may transmit the settlement processing for the charged amount to the user terminal. Here, the suitability of the biological data and the completeness of the pathological data will be described in detail in FIG.

생성자 단말(280)은 데이터 제공 장치(200)에 저장되어 있는 데이터와 동종의 데이터를 생성할 수 있는 전문가가 이용하는 사용자 단말의 한 종류이다. 생성자 단말(280)은 사용자 단말(270)의 기능을 필수적으로 포함한다. 생성자 단말(280)은 운영자 단말(290)에 데이터 업로드 요청을 하여 운영자가 운영자 단말(290)을 통해 데이터 제공 장치(200)에 저장되는 데이터를 업데이트할 수 있도록 하는 기능을 포함할 수 있다. 생성자 단말(280)은 각종 유무선 네트워크로 데이터 제공 장치(200)에 연결될 수 있으며, 운영자 단말(290)에 연결될 수 있다.The creator terminal 280 is a kind of user terminal used by an expert capable of generating data of the same kind as the data stored in the data providing device 200. The creator terminal 280 essentially includes the functionality of the user terminal 270. The creator terminal 280 may include a function of allowing the operator to update the data stored in the data providing apparatus 200 through the operator terminal 290 by requesting the operator terminal 290 to upload data. The creator terminal 280 may be connected to the data providing apparatus 200 through various wired / wireless networks and may be connected to the operator terminal 290.

운영자 단말(290)은 데이터 제공 장치(200)에 접속하여 데이터 제공 장치(200)에 저장되어 있는 데이터의 업데이트 및 데이터 제공 장치(200)의 동작을 위한 프로그램의 유지 및 보수를 수행한다. 운영자 단말(290)은 사용자 단말(270)과 생성자 단말(280)을 각각 구별하기 위한 식별코드를 각 사용자 단말(270)과 생성자 단말(280)에 부여할 수 있다. 운영자 단말(290)은 업로드 요청을 할 수 있는 식별코드를 가진 생성자 단말(280)에 한해 데이터 업로드 요청을 할 수 있도록 하여 데이터 제공 장치(200)에 저장될 수 있는 데이터의 품질 및 신뢰도를 확보할 수 있다.The operator terminal 290 connects to the data providing apparatus 200 and performs maintenance and repair of the data for updating the data stored in the data providing apparatus 200 and for operating the data providing apparatus 200. The operator terminal 290 may provide an identification code to the user terminal 270 and the creator terminal 280 to distinguish the user terminal 270 and the creator terminal 280 from each other. The operator terminal 290 can make a data upload request only to the creator terminal 280 having an identification code capable of making an upload request to secure the quality and reliability of data that can be stored in the data providing apparatus 200 .

데이터 제공 장치(200)는 도 3에 도시된 바와 같은 데이터의 구조로 데이터를 저장할 수 있다. 데이터의 구조에 대해서 설명하면, 아래와 같다. 비디지털 데이터 그룹(310)은 사람의 행동이 개입되어 실험이 행해지고 데이터가 산출되는 부분으로, 인체 종양 조직(A1), 디앤에이(A2), 알엔에이(A3), 단백질(A4), 및 대사체(A5)를 포함할 수 있다.The data providing apparatus 200 can store data in a structure of data as shown in FIG. The structure of the data is described below. The non-digital data group 310 is a part in which human behavior is intervened and an experiment is performed and data is calculated. The non-digital data group 310 includes human tumor tissues A1, D2, A2, A3, A5 < / RTI >

데이터베이스 그룹(330)은 본 발명에 따른 데이터 제공 장치에 저장되는 데이터를 포함하며, 디앤에이 소규모 데이터베이스(331), 알엔에이 소규모 데이터베이스(333), 단백질 소규모 데이터베이스(335), 대사체 소규모 데이터베이스(337)를 포함할 수 있다.The database group 330 includes data stored in the data providing apparatus according to the present invention and includes a DENA small database 331, an ANA small database 333, a protein small database 335, a small database 337 ).

데이터 제공 장치(200)에 의해 사용자 단말(270)로 제공될 수 있는 데이터의 일 예로, 인체 종양 조직(A1)의 대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)가 있다. 인체 종양 조직(A10)에 대한 데이터가 연구자에게 의미 있는 데이터가 되기 위해서는, 인체 종양 조직으로부터 파생물을 추출하고, 추출된 파생물(A2, A3, A4, A5)에 유전체학, 전사체학, 단백질체학, 대사체학 기법을 적용하여 대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)를 생성하는 과정이 필요하다.A3-1, A4-1, A5-1) of the human tumor tissue (A1) as an example of data that can be provided to the user terminal (270) by the data providing apparatus (200) . In order for the data on human tumor tissue (A10) to be meaningful data to the researcher, it is necessary to extract the derivative from human tumor tissue and to apply the extracted genetic material (A2, A3, A4, A5) It is necessary to generate a large amount of raw data (A2-1, A3-1, A4-1, A5-1) by applying a choreography technique.

대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)를 생성하는 과정에서 최초의 인체 종양 조직(A1)은 소멸될 뿐만 아니라, 인체 종양 조직(A1)으로부터 추출된 파생물(A2)에 적용되는 각종 기법은 막대한 비용을 필요로 하므로, 대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)는 수집하기 어렵고 수량이 한정된 특성을 갖는다.In the process of generating large-volume raw data (A2-1, A3-1, A4-1, A5-1), not only the first human tumor tissue (A1) is annihilated, but also the foreign body tissue (A1) A2) require enormous cost, large-volume raw data (A2-1, A3-1, A4-1, A5-1) are difficult to collect and have a limited number of characteristics.

인체 종양 조직(A1)으로부터 연구에 사용할 디앤에이(DNA, DeoxyriboNucleic Acid)(A2), 알엔에이(RNA, RiboNucleic Acid)(A3), 단백질(Protein)(A4), 대사체(Metabolites)(A5)가 추출될 수 있다. 디앤에이 추출물(A2)의 경우, 유전체학 기법인 전유전체 염기서열분석(WGS, Whole Genome Sequencing)나 전엑솜 염기서열분석(WES, Whole Exome Sequencing)등이 적용되어 미가공 디앤에이 데이터(A2-1, 유전자 변이 데이터)가 생성될 수 있다.DNA (DeoxyriboNucleic Acid) (A2), RNA (RiboNucleic Acid) (A3), Protein (A4), Metabolites (A5) for use in research from human tumor tissues (A1) Can be extracted. In the case of D & A extract (A2), genomic techniques such as whole genome sequencing (WGS) and whole exome sequencing (WES) Gene mutation data) can be generated.

알엔에이 추출물(A3)의 경우, 전사체학 기법인 마이크로어레이(Microarray)나 알엔에이 염기서열분석(RNA Sequencing)이 적용되어 미가공 알엔에이 데이터(A3-1, 전사체 발현 데이터)가 생성될 수 있다.In the case of the RNase A extract (A3), raw RNE data (A3-1, transcript expression data) can be generated by applying a microarray or RNA sequencing, which is a transcription system technique .

단백질 추출물(A4)의 경우, 단백질체학 기법인 말디토프(MALDI-TOF, Matrix-Assisted Laser Desorption-Ionization Time Of Flight), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry) 등이 적용되어 정량, 정성적 미가공 단백질 데이터(A4-1)가 생성될 수 있다.In the case of protein extract (A4), Matrix-Assisted Laser Desorption-Ionization Time of Flight (MALDI-TOF), liquid chromatography-mass spectrometry (LC-MS) Quantitative, qualitative raw protein data (A4-1) can be generated.

대사체 추출물(A5)의 경우, 대사체학 기법인 핵자기공명-질량분석(NMR-MS, Nuclear Magnetic Resonance-Mass Spectrometry), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 가스 크로마토그래피-질량 분석(GC-MS, Gas Chromatography-Mass Spectrometry) 등과 같은 기법으로 정량, 정성적 대사체 데이터(A5-1)가 생성될 수 있다.In the case of the metabolite extract (A5), the metabolism techniques such as nuclear magnetic resonance-mass spectrometry (NMR-MS), liquid chromatography-mass spectrometry (LC-MS) Quantitative, qualitative metabolite data (A5-1) can be generated by techniques such as gas chromatography-mass spectrometry (GC-MS).

전술한 과정을 통해 산출된 유전자 변이 데이터(A2-1), 전사체 발현 데이터(A3-1), 단백질 데이터(A4-1), 대사체 데이터(A5-1)는 오믹스(Omics) 데이터 또는 대용량 미가공 데이터라고 통칭될 수 있으며, 인체 종양 조직(A1)을 연구하는 연구자가 해당 인체 종양 조직을 분석하는 데에 이용할 수 있다.The gene mutation data (A2-1), transcript expression data (A3-1), protein data (A4-1), and metabolism data (A5-1) calculated through the above-described process are used as Omics data or It can be referred to as large-volume raw data and can be used by researchers studying human tumor tissue (A1) to analyze the human tumor tissue.

위와 같은 방식으로 산출된 대용량 미가공 데이터는 디지털 처리가 되어 데이터 제공 장치의 데이터베이스 그룹(330)에 저장되며, 사용자의 요청에 따라서 추가로 가공되어 사용자에게 제공될 수 있다.The large-volume unprocessed data calculated in the above manner is digitally processed and stored in the database group 330 of the data providing apparatus, and can be further processed and provided to the user at the request of the user.

인체 종양 조직(A1)의 대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)는 각 소규모 데이터베이스(331, 333, 335, 337)에 포함된 각 미가공 데이터에 대응되는 가공처리부(3311, 3331, 3351, 3371)에 의해 가공처리되어 대용량 가공 데이터(A2-2, A3-2, A4-2, A5-2)가 될 수 있다. 예를 들어, 인체 종양 조직(A1)의 대용량 가공 데이터(A2-2, A3-2, A4-2, A5-2)에는, 항암제 개발 데이터, 항암제 리포지셔닝(Repositioning) 데이터, 인체 종양 진단 데이터, 바이오마커(biomarker)가 포함될 수 있다.The large-volume raw data A2-1, A3-1, A4-1, and A5-1 of the human tumor tissue A1 are processed by processing corresponding to each raw data included in each of the small databases 331, 333, 335, The processed data can be processed by the processing units 3311, 3331, 3351, and 3371 to become the large capacity processed data A2-2, A3-2, A4-2, and A5-2. For example, large-scale processed data (A2-2, A3-2, A4-2, A5-2) of human tumor tissue (A1) includes various kinds of data such as anticancer drug development data, cancer drug reprocessing data, A biomarker may be included.

전술한 것과 같이 대용량 가공 데이터는 사용자의 요청에 따라 사용자에게 제공된 후에는 소규모 데이터베이스에서 삭제될 수 있다. 또한, 도 3은 미가공 데이터와 가공 데이터의 설명의 편의를 위해서 데이터 제공 장치의 데이터를 인체 종양 조직에 대한 데이터로 한정한 것이므로, 도 3에서 인체 종양 조직에 대한 데이터는 다른 종류의 데이터로도 변경적용이 가능하다.As described above, the large-capacity processed data can be deleted from the small-scale database after being provided to the user at the request of the user. 3, the data of the data providing apparatus is limited to the data for the human tumor tissue for convenience of explanation of the raw data and the processed data. Therefore, in FIG. 3, the data on the human tumor tissue may be changed to other kinds of data It is applicable.

도 4는 본 발명의 다른 일 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.4 is a flowchart illustrating a data providing method for disease mechanism research according to another embodiment of the present invention.

사용자 단말(410)은 데이터 제공 장치(430)에 데이터 요청을 송신한다(S410). 데이터 제공 장치(430)는 데이터 요청에 포함된 조건을 기초로 데이터 속성을 결정한다(S420).The user terminal 410 transmits a data request to the data providing apparatus 430 (S410). The data providing apparatus 430 determines a data attribute based on the condition included in the data request (S420).

데이터 속성은 데이터 요청에 포함된 조건을 기초로 결정되며, 데이터 요청에 포함된 각각의 조건을 특징값(feature)으로 하는 하나 이상의 값으로 결정될 수 있다. 최종적으로 제공할 데이터 속성은 테이블 형태가 될 수 있다.The data attribute is determined based on the conditions included in the data request, and may be determined as one or more values, each of the conditions included in the data request being a feature. The data attribute to be finally provided can be a table type.

데이터 제공 장치(430)는 데이터 속성에 대응되는 데이터를 검색한다(S430). S430의 동작은 데이터 검색부와 동일하므로, 상세한 설명을 생략한다. The data providing device 430 retrieves data corresponding to the data attribute (S430). The operation of S430 is the same as that of the data retrieving unit, and thus a detailed description thereof will be omitted.

데이터 제공 장치(430)는 검색된 데이터의 메타데이터로 데이터의 가격을 결정한다(S440). S440의 동작은 가격 결정부와 동일하므로, 상세한 설명을 생략한다. The data providing device 430 determines the price of the data as the metadata of the retrieved data (S440). The operation of S440 is the same as that of the pricing unit, and a detailed description thereof will be omitted.

데이터 제공 장치(430)는 데이터 및 데이터의 가격을 포함하는 표시 정보를 사용자 단말(410)로 제공한다(S450). The data providing device 430 provides display information including data and data prices to the user terminal 410 (S450).

도 5는 본 발명의 또 다른 일 실시 예에 따른 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.5 is a flowchart illustrating a data providing method according to another embodiment of the present invention.

사용자 단말(510)은 데이터 제공 장치(530)에 데이터 요청을 송신한다(S505). 데이터 제공 장치(430)는 데이터 요청에 포함된 조건을 기초로 데이터 속성을 결정한다(S510).The user terminal 510 transmits a data request to the data providing apparatus 530 (S505). The data providing apparatus 430 determines a data attribute based on the condition included in the data request (S510).

데이터 요청에 포함된 조건은 사용자가 요청한 데이터의 대상물질, 종류, 처리방법의 종류, 생성 시기, 사용자가 결제할 수 있는 데이터의 가격범위, 총 한도 금액 중 적어도 하나를 포함할 수 있다.The conditions included in the data request may include at least one of the target substance of the data requested by the user, the kind, the kind of the processing method, the generation time, the price range of the data the user can settle, and the total limit amount.

데이터 속성은 데이터 요청에 포함된 조건을 기초로 결정되며, 데이터 요청에 포함된 각각의 조건을 특징값(feature)으로 하는 테이블 형태가 될 수 있다.The data attribute is determined based on the condition included in the data request, and may be a table type having each condition included in the data request as a feature.

데이터 제공 장치(530)는 데이터 속성에 대응되는 데이터를 검색한다(S515). 데이터 제공 장치(530)는 검색된 데이터의 메타데이터로 가격을 결정하고 결정된 가격을 차등적으로 조정할 수 있다(S520).The data providing apparatus 530 retrieves data corresponding to the data attribute (S515). The data providing device 530 may determine the price using the metadata of the retrieved data and may differentially adjust the determined price (S520).

검색된 데이터의 메타데이터에는 데이터 생성자에 대한 정보, 데이터 생성에 필요한 시간, 데이터 생성에 필요한 자원이 포함될 수 있고, 데이터 생성자에 대한 정보에는 데이터 생성자의 데이터 생성 당시의 지위와 현재의 지위가 포함될 수 있다. 데이터 제공 장치(530)는 데이터의 메타데이터 중 하나만으로 가격을 결정할 수도 있다. 예를 들어, 데이터의 생성자의 생성시 지위만을 고려하여 데이터의 가격을 결정할 수 있다.The meta data of the retrieved data may include information on the data creator, time required for data generation, and resources necessary for data generation, and the information on the data creator may include the status of the data creator at the time of data generation and the current status . The data providing apparatus 530 may determine the price by using only one of the meta data of the data. For example, the price of the data can be determined by considering only the status of the producer of the data.

여기서, 생성자의 지위는 생성자의 최종학력, 생성자의 전공, 생성자의 직업, 생성자의 누적 논문수, 생성자의 수상 경력을 포함하거나, 생성자의 최종학력, 생성자의 전공, 생성자의 직업, 생성자의 누적 논문수, 생성자의 수상 경력 등을 종합하여 산출된 하나의 등급이 될 수도 있다.Here, the status of the constructor includes the final educational background of the constructor, the major of the constructor, the occupation of the constructor, the number of papers of the constructor, the awards of the constructor, or the final academic achievement of the constructor, the major of the constructor, Number, and the creator's awards.

단계 520에서 데이터를 요청한 사용자와 데이터를 생성한 생성자가 동일하거나, 데이터를 요청한 사용자가 데이터를 생성하는 데에 기여했다면, 그 내용을 반영하여 데이터의 가격은 낮은 가격으로 조정될 수 있다.If the user who requested the data and the creator that generated the data are the same in step 520 or the user who requested the data contributes to the generation of the data, the price of the data may be adjusted to a lower price by reflecting the contents.

선택적 실시 예로서, 단계 520에서 생성자에 대한 정보에는 레벨 정보가 포함될 수 있다. 생성자의 레벨 정보는 생성자가 생성한 데이터의 수, 생성자가 생성한 데이터의 누적 판매량, 생성자가 생성한 데이터로부터의 수입 중 적어도 하나를 고려하여 결정될 수 있다. 높은 레벨의 생성자는 본 발명에 따른 데이터 제공 장치에 데이터를 생성하여 업로드하면 업로드된 데이터가 높은 판매가격으로 결정되거나, 데이터 제공 장치로부터 데이터를 제공받을 때에 일정비율 할인을 받을 수 있는 것과 같은 혜택을 누릴 수 있다.In an alternative embodiment, level information may be included in the information about the generator in step 520. [ The level information of the generator can be determined in consideration of at least one of the number of data generated by the generator, the cumulative sales amount of the data generated by the generator, and the income from the data generated by the generator. A high level creator can benefit from the fact that when the data is created and uploaded to the data providing apparatus according to the present invention, the uploaded data is determined as a high selling price or a certain rate discount can be received when data is provided from the data providing apparatus Can enjoy.

데이터 제공 장치(530)는 단계 520에서 최종 결정된 가격과 사용자가 입력한 결제가능한 금액을 비교하여 사용자 단말에 제공할 데이터를 결정할 수 있다(S525).The data providing apparatus 530 may compare the final determined price with the settlement amount input by the user in step 520 and determine data to be provided to the user terminal (S525).

데이터 제공 장치(530)는 데이터 및 데이터의 가격을 포함한 표시 정보를 사용자 단말(510)에 제공할 수 있다(S530).The data providing device 530 may provide the display information including the price of the data and the data to the user terminal 510 (S530).

사용자는 사용자 단말(510)을 통해 표시 정보를 확인하고, 데이터를 구매하기로 결정한 후, 결제 정보를 사용자 단말(510)을 통해 데이터 제공 장치(530)로 전송할 수 있다(S535).The user confirms the display information through the user terminal 510 and may transmit the payment information to the data providing apparatus 530 through the user terminal 510 after determining to purchase the data (S535).

데이터 제공 장치(530)는 사용자 단말(510)로부터 수신한 결제 정보의 진위를 확인하고, 결제를 승인할 수 있다(S540).The data providing apparatus 530 may confirm the authenticity of the payment information received from the user terminal 510 and approve the payment (S540).

데이터 제공 장치(530)는 사용자가 요청한 데이터를 어떤 방식으로 제공할 지 결정한다(S545).The data providing apparatus 530 determines in what manner the data requested by the user is to be provided (S545).

사용자가 유무선 네트워크를 통해 사용자 단말(510)로 데이터를 전송할 것을 요청하거나, 사용자가 요청한 데이터의 용량이 미리 설정된 기준용량을 초과하지 않으면, 데이터 제공 장치(530)는 사용자 단말(510)로 사용자가 요청한 데이터를 전송한다(S550).If the user requests to transmit data to the user terminal 510 via the wired or wireless network or if the capacity of the data requested by the user does not exceed the preset reference capacity, And transmits the requested data (S550).

사용자가 보안 등을 이유로 유무선 네트워크를 통해 사용자 단말(510)로 데이터를 전송하지 않을 것을 요청하거나, 사용자가 요청한 데이터의 용량이 미리 설정된 기준용량을 초과하면, 데이터 제공 장치(530)는 사용자에게 배송할 하드디스크에 데이터를 압축 및 암호화하여 전송한다(S555). 단계 555에서, 사용자가 요청한 데이터를 저장하고 있는 하드디스크가 오프라인으로 사용자에게 직접 전달됨으로써, 사용자는 데이터 제공 장치(530)에 요청한 데이터를 제공받을 수 있다.When the user requests not to transmit data to the user terminal 510 via the wired / wireless network because of security or the like, or when the capacity of the data requested by the user exceeds the preset reference capacity, the data providing device 530 transmits Compresses and encrypts the data on the hard disk to be transmitted (S555). In step 555, the hard disk storing the data requested by the user is directly transferred to the user offline, so that the user can be provided with the data requested to the data providing apparatus 530.

도 6은 본 발명의 또 다른 일 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 장치를 기준으로 한 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.FIG. 6 is a flowchart illustrating a data providing method based on a data providing apparatus for disease mechanism research according to another embodiment of the present invention. Referring to FIG.

전술한 도 4 및 도 5과 대비하기 위해, 도 6에서는 데이터 제공 장치를 기준으로 하여 데이터 제공 방법을 설명한다.In order to compare with FIG. 4 and FIG. 5 described above, FIG. 6 illustrates a data providing method based on the data providing apparatus.

데이터 제공 장치는 사용자 단말로부터 데이터 요청을 수신한다(S610).The data providing apparatus receives a data request from the user terminal (S610).

데이터 제공 장치는 데이터 요청에 포함된 조건을 기초로 데이터 속성을 결정한다(S620). 데이터 요청에 포함된 조건은 사용자가 요청한 데이터의 대상물질, 종류, 처리방법의 종류, 생성 시기, 사용자가 결제할 수 있는 데이터의 가격범위, 총 한도 금액 중 적어도 하나를 포함할 수 있다.The data providing apparatus determines a data attribute based on the condition included in the data request (S620). The conditions included in the data request may include at least one of the target substance of the data requested by the user, the kind, the kind of the processing method, the generation time, the price range of the data the user can settle, and the total limit amount.

데이터 제공 장치는 데이터 속성에 대응되는 데이터를 검색한다(S630).The data providing apparatus retrieves data corresponding to the data attribute (S630).

데이터 제공 장치는 검색된 데이터의 메타데이터로 가격을 결정하고 결정된 가격을 차등적으로 조정할 수 있다(S640).The data providing apparatus may determine the price as meta data of the searched data and adjust the determined price differentially (S640).

검색된 데이터의 메타데이터에는 데이터 생성자에 대한 정보, 데이터 생성에 필요한 시간, 데이터 생성에 필요한 자원이 포함될 수 있고, 데이터 생성자에 대한 정보에는 데이터 생성자의 데이터 생성 당시의 지위와 현재의 지위가 포함될 수 있다. 단계 640에서 데이터를 요청한 사용자와 데이터를 생성한 생성자가 동일하거나, 데이터를 요청한 사용자가 데이터를 생성하는 데에 기여했다면, 그 내용을 반영하여 데이터의 가격은 낮은 가격으로 조정될 수 있다. 또한, 선택적 실시 예로서, 단계 640에서 생성자에 대한 정보에는 레벨 정보가 포함될 수 있어, 높은 레벨의 생성자가 데이터 구매에 있어서 할인 혜택을 받을 수 있도록 할 수 있다.The meta data of the retrieved data may include information on the data creator, time required for data generation, and resources necessary for data generation, and the information on the data creator may include the status of the data creator at the time of data generation and the current status . If the user who requested the data and the creator that generated the data are the same in step 640 or the user who requested the data has contributed to the generation of the data, the price of the data may be adjusted to a lower price by reflecting the contents. Also, as an alternative embodiment, level information may be included in the information about the constructor in step 640, so that a high-level constructor can receive discounts on data purchase.

데이터 제공 장치는 단계 640에서 최종 결정된 가격과 사용자가 입력한 결제가능한 금액을 비교하여 사용자 단말에 제공할 데이터를 결정할 수 있다(S650).In step S650, the data providing apparatus compares the final determined price with the settlement amount input by the user in step 640 and determines data to be provided to the user terminal.

데이터 제공 장치는 데이터 및 데이터의 가격을 포함한 표시 정보를 사용자 단말에 제공할 수 있다(S660). 단계 660에서 데이터 제공 장치는 표시 정보를 사용자 단말에 제공함과 동시에 전자상 결제를 요청할 수도 있다.The data providing apparatus may provide display information including the price of data and data to the user terminal (S660). In step 660, the data providing apparatus may request the electronic settlement while providing the display information to the user terminal.

데이터 제공 장치는 사용자 단말로부터 결제 정보를 수신하여, 결제가 적법한 절차를 거쳐 이루어졌는지 여부를 확인한다(S670).The data providing apparatus receives the payment information from the user terminal, and confirms whether payment has been made through a proper procedure (S670).

데이터 제공 장치는 사용자가 원하는 제공 방법에 따라 사용자가 요청한 데이터를 제공한다(S680). 단계 680에서 데이터 제공 장치는 사용자가 요청한 데이터를 사용자가 원하는 제공 방법 외에 사용자가 요청한 데이터의 크기도 함께 고려하여 사용자가 요청한 데이터를 제공할 수도 있다. The data providing apparatus provides the data requested by the user according to the providing method desired by the user (S680). In step 680, the data providing apparatus may provide the data requested by the user in consideration of the size of the data requested by the user, in addition to the method of providing the data requested by the user.

예를 들어, 사용자가 유무선 네트워크를 통해 사용자 단말로 데이터를 전송할 것을 요청하거나, 사용자가 요청한 데이터의 용량이 미리 설정된 기준용량을 초과하지 않으면, 데이터 제공 장치는 사용자 단말로 사용자가 요청한 데이터를 전송할 수 있다.For example, if the user requests to transmit data to the user terminal via the wired or wireless network, or if the capacity of the data requested by the user does not exceed the preset reference capacity, the data providing device can transmit the data requested by the user to the user terminal have.

다른 예로서, 사용자가 보안 등을 이유로 유무선 네트워크를 통해 사용자 단말로 데이터를 전송하지 않을 것을 요청하거나, 사용자가 요청한 데이터의 용량이 미리 설정된 기준용량을 초과하면, 데이터 제공 장치는 사용자에게 배송할 하드디스크에 데이터를 압축 및 암호화하여 전송할 수 있다. 단계 680에서, 사용자가 요청한 데이터를 저장하고 있는 하드디스크가 오프라인으로 사용자에게 직접 전달됨으로써, 사용자는 데이터 제공 장치에 요청한 데이터를 제공받을 수 있게 된다.As another example, when the user requests to not transmit data to the user terminal via the wired / wireless network due to security or the like, or when the capacity of the data requested by the user exceeds the preset reference capacity, It is possible to compress and encrypt the data on the disk and transmit it. In step 680, the hard disk storing the data requested by the user is directly transferred to the user offline, so that the user can receive the requested data to the data providing apparatus.

도 7은 생체 세포로부터 데이터를 생성하는 과정을 설명하기 위한 도면이다. 7 is a diagram for explaining a process of generating data from a living cell.

데이터 제공 장치(200)는 대상체(object)의 생체 세포(D1)로부터 획득된 생물학적 데이터를 제1 레코드(R1)로 생성할 수 있다. 여기서, 생체 세포는 세포에 한정되지 않고 조직(Tissue), 타액(saliva), 혈액(Blood), 소변(urine), 체액(body fluid), 단백질(protein, DNA, RNA) 등을 포함할 수 있다. 데이터 제공 장치(200)는 대상체(object)에 대한 병리학적 데이터(D2)를 제2 레코드(R2)로 생성할 수 있다. The data providing apparatus 200 can generate the biological data acquired from the living cell D1 of the object as the first record R1. Here, the living cells are not limited to cells but may include tissues, saliva, blood, urine, body fluid, proteins (protein, DNA, RNA) . The data providing apparatus 200 may generate the pathological data D2 for the object as the second record R2.

대상체와 대응되는 생물학적 데이터의 레코드(R1)은 세포를 소정의 처리 방법으로 처리하여 획득되는 데이터로서, 유전자들의 배열 및 각 유전자의 발현 정도, 발현 여부, 돌연변이 발생 여부 등을 포함할 수 있다. 여기서, 처리 방법의 예시로는 유전체학 기법인 전유전체 염기서열분석(WGS, Whole Genome Sequencing)나 전엑솜 염기서열분석(WES, Whole Exome Sequencing), 마이크로어레이(Microarray)나 알엔에이 염기서열분석(RNA Sequencing), 말디토프(MALDI-TOF, Matrix-Assisted Laser Desorption-Ionization Time Of Flight), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 대사체학 기법인 핵자기공명-질량분석(NMR-MS, Nuclear Magnetic Resonance-Mass Spectrometry), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 가스 크로마토그래피-질량 분석(GC-MS, Gas Chromatography-Mass Spectrometry) 등이 있을 수 있다. 즉, 도 7에 도시된 바와 같이, 제1 레코드(R1)는 상기 생체 세포로부터 획득된 유전자들의 배열 정보(op1-1), 각 유전자의 발현 정도(op1-2), 발현 여부(op1-3), 돌연변이 존재 여부(op1-4) 등을 포함할 수 있다. 대상체의 생체 세포는 종에 따라 동일한 유전자 배열을 가지게 된다. 대상체의 유전적 특성은 달라지므로, 각 유전자의 발현 여부 및 발현 정도는 달라지게 된다. 제1 레코드(R1)는 유전체의 이름, 유전체 내 위치, 원래 값, 변경 값, 변이 타입, 엑손 내 위치, 유전자의 특이 사항 등을 포함할 수 있다. 원래 값은 해당 유전체의 염기 서열의 값에 대한 것으로, 정상인의 염기 서열을 의미한다. 변경 값은 대상체의 염기 서열을 의미한다. 제1 레코드(R1)는 정상인의 염기 서열과 대상체의 염기 서열 사이에 차이가 있으면서, 표현되는 단백질에도 차이가 나는 정보를 더 포함할 수 있다. 여기서, 변이 타입은 염기 서열 중 일부 염기 서열의 제거, 변경, 삽입 중 하나를 말하며, 염기 서열이 변경되더라도 발현되는 단백질에 차이가 없는 경우는 염기 서열이 변이되지 않은 것으로 볼 수 있다. 제2 레코드(R2)는 상기 대상체와 관련된 질병, 질환 등의 병리학적 데이터를 포함하며, 대상체와 관련하여 생성된 각 항목의 생성 시점(op2-1) 및 각 항목에 대한 상세 정보(op2-2)를 포함할 수 있다. 또한, 제2 레코드(R2)는 대상체와 관련된 질병에 대한 처방, 치료 내역을 제공하면서, 해당 처방, 치료 내역을 통해 획득되어진 결과, 예후와 관련된 정보를 더 포함할 수 있다. 제2 레코드(R2)는 의료 기관(병원, 약국 등)의 서버로부터 획득되어지는 데이터를 포함하게 된다. The record R1 of the biological data corresponding to the object is data obtained by processing the cell by a predetermined processing method and may include the arrangement of the genes, the degree of expression of each gene, whether or not the gene is expressed, and whether mutation has occurred. Herein, examples of the treatment method include genomic techniques such as whole genome sequencing (WGS), whole exome sequencing (WES), microarray or RNA sequencing (RNA Sequencing, Matrix-Assisted Laser Desorption-Ionization Time of Flight (MALDI-TOF), Liquid Chromatography-Mass Spectrometry (LC-MS), Nuclear Magnetic Resonance- (NMR-MS, Nuclear Magnetic Resonance-Mass Spectrometry), Liquid Chromatography-Mass Spectrometry (LC-MS), Gas Chromatography-Mass Spectrometry Can be. 7, the first record R1 includes the sequence information (op1-1) of the genes obtained from the living cells, the expression level (op1-2) of each gene, the expression level (op1-3 ), The presence or absence of a mutation (op1-4), and the like. Biological cells of a subject have the same gene sequence depending on the species. Because the genetic characteristics of the subject are different, the expression and expression level of each gene will be different. The first record R1 may include the name of the dielectric, the position in the dielectric, the original value, the modification value, the type of mutation, the position in the exon, the specificity of the gene, and the like. The original value refers to the value of the nucleotide sequence of the corresponding genome and means the nucleotide sequence of a normal person. The change value means the nucleotide sequence of the subject. The first record (R1) may further include information indicating a difference between the nucleotide sequence of the normal person and the nucleotide sequence of the subject, and the difference in the expressed protein. Here, the mutation type refers to one of removal, modification, and insertion of some base sequences in the base sequence, and even if the base sequence is changed, the base sequence may not be mutated if there is no difference in the expressed protein. The second record R2 includes pathological data such as diseases and diseases associated with the object, and includes a generation time (op2-1) of each item generated with respect to the object and detailed information (op2-2 ). In addition, the second record R2 may further include information related to the prescription, a result obtained through the treatment history, and the prognosis, while providing a prescription and treatment history for the disease associated with the subject. The second record R2 contains data obtained from a server of a medical institution (hospital, pharmacy, etc.).

도 8 및 도 9는 본 발명의 실시예들에 따른 질병 기전 연구를 위한 데이터 제공 방법의 흐름도들이다. 8 and 9 are flowcharts of a data providing method for disease mechanism research according to embodiments of the present invention.

도 8을 참조하면, 본 발명의 실시예들에 따른 데이터 제공 방법은 데이터 수집 단계(S801), 데이터 1차 분석 단계(S802), 방법 선택 단계(S803), 데이터 획득 단계(S804), 레코드 생성 단계(S805)를 포함할 수 있다. Referring to FIG. 8, a method of providing data according to embodiments of the present invention includes a data collection step S801, a data primary analysis step S802, a method selection step S803, a data acquisition step S804, Step S805.

S801에서는 데이터 제공 장치(200)는 하나 이상의 대상체로부터 획득된 생체 세포 및 상기 하나 이상의 대상체에 대한 병리학적 데이터를 수집할 수 있다. 여기서, 대상체는 사람, 동물, 식물 등과 같은 생물을 말하며, 여기서, 생체 세포는 대상체로부터 획득된 세포로서, 종류를 불문한 모든 세포들을 포함할 수 있다. 여기서, 병리학적 데이터는 상기 대상체와 관련된 질병, 질환 등에 대한 것으로, 상기 대상체의 진단, 진료, 치료, 경과 등을 종합적으로 포함하는 데이터일 수 있다. In S801, the data providing apparatus 200 may collect pathological data on the living cells and the one or more subjects obtained from the one or more subjects. Herein, the object refers to a living organism such as a person, an animal, a plant, etc., wherein the living cell is a cell obtained from a subject, and may include all cells of any kind. Herein, the pathological data is related to diseases, diseases, and the like related to the subject, and may include data collectively including diagnosis, treatment, treatment, and progress of the subject.

S802에서는 데이터 제공 장치(200)는 상기 생체 세포를 1차적으로 분석할 수 있다. 이때, 생체 세포의 양을 고려하여, 데이터 제공 장치(200)는 상기 생체 세포를 유전체 데이터, 전사체 데이터를 획득할 수 있도록 1차적으로 처리할 수 있다. 데이터 제공 장치(200)는 유전체의 염기 변이를 확인할 수 있는 유전체 데이터를 획득하기 위한 처리 방법, 유전체의 발현 여부를 확인할 수 있는 전사체 데이터를 획득하기 위한 처리 방법을 이용하여, 상기 생체 세포를 분석할 수 있다. 데이터 제공 장치(200)는 생체 세포의 외관, 생체 세포의 크기, 보관 상태, 대상체의 병리학적 데이터 등을 고려하여, 생체 세포를 분석할 수 있다. 데이터 제공 장치(200)는 생체 세포에 소정의 처리를 함으로써, 생체 세포를 1차적으로 분석할 수 있다. 예를 들어, 데이터 제공 장치(200)는 생체 세포에 포함된 DNA에 열을 가하여, 이중 나선의 DNA를 단일 가닥으로 처리함으로써, 생체 세포를 1차적으로 분석할 수 있다. 데이터 제공 장치(200)는 소량의 DNA를 염기 순서가 동일한 양의 DNA로 증폭시킴으로써, 생체 세포를 1차적으로 분석할 수 있다. In step S802, the data providing apparatus 200 can primarily analyze the living cells. At this time, considering the amount of living cells, the data providing apparatus 200 can primarily process the living cells so as to acquire genome data and transcript data. The data providing apparatus 200 analyzes the biological cell using a processing method for obtaining dielectric data capable of confirming a base variation of the dielectric and a processing method for acquiring transcript data for confirming the expression of the dielectric can do. The data providing apparatus 200 can analyze living cells in consideration of the appearance of the living cells, the size of the living cells, the storage state, the pathological data of the target, and the like. The data providing apparatus 200 can primarily analyze living cells by performing predetermined processing on the living cells. For example, the data providing device 200 can primarily analyze biomolecules by applying heat to DNA contained in living cells and treating double-stranded DNA with a single strand. The data providing apparatus 200 can primarily analyze the living cells by amplifying a small amount of DNA with DNA having the same amount of base sequence.

S803에서는 데이터 제공 장치(200)는 상기 1차적으로 분석한 결과를 이용하여, 상기 생체 세포를 처리하는 처리 방법을 선택할 수 있다. 이때, 처리 방법은 하나 이상일 수 있다. 이때, 처리 방법의 선택 기준은 가격, 시간, 획득하고자 하는 데이터에 따라 달라질 수 있다. In S803, the data providing apparatus 200 can select the processing method for processing the living cells using the result of the primary analysis. At this time, the processing method may be one or more. At this time, the selection criteria of the processing method may vary depending on the price, the time, and the data to be acquired.

생체 세포는 그 자체로 의미 있는 데이터가 될 수 없으므로, 의미 있는 데이터가 되기 위해서는 생체 세포를 처리하는 과정이 필요하다. 생체 세포는 시퀀싱(sequencing)을 통해 처리될 수 있다. DNA 시퀀싱(sequencing)의 종류는 다양하며, 각 시퀀싱을 처리하는데 필요한 비용, 시간 등은 다양하다. Since living cells can not be meaningful data in themselves, a process of processing living cells is necessary in order to become meaningful data. Biological cells can be processed through sequencing. There are many types of DNA sequencing, and the costs, time, etc. required to process each sequence vary.

데이터 제공 장치(200)는 생체 세포를 분석하여, 생체 세포와 관련된 조직, 기관 등을 추출할 수 있다. 데이터 제공 장치(200)는 생체 세포와 관련된 조직, 기관의 종류, 보관 상태, 크기 등을 고려하여, 생체 세포의 처리 방법을 결정할 수 있다. The data providing apparatus 200 can analyze a living cell and extract a tissue, an organ, and the like related to the living cell. The data providing apparatus 200 can determine a treatment method of a living cell in consideration of a tissue, an organ type, a storage state, a size, and the like associated with the living cell.

데이터 제공 장치(200)는 생체 세포의 대상체의 병리학적 데이터를 이용하여 상기 생체 세포를 처리할 처리 방법을 결정할 수도 있다. 데이터 제공 장치(200)는 생체 세포의 대상체의 종(species)에 따라 상기 생체 세포의 처리 방법을 결정할 수 있다. 생체 세포의 대상체의 종은 생체 세포를 분석하거나 관리자에 의해 결정될 수 있다. The data providing apparatus 200 may determine a processing method of processing the living body cells by using pathological data of the subject of the living body cells. The data providing apparatus 200 can determine the treatment method of the living cells according to the species of the target of the living cells. Species of a subject of a living cell may be analyzed by a living cell or may be determined by an administrator.

데이터 제공 장치(200)는 생체 세포의 대상체에 대한 기타 정보(성별, 나이, 연령, 서식지, 주거지 등)를 이용하여 상기 생체 세포를 처리할 처리 방법을 결정할 수 있다. The data providing apparatus 200 can determine a processing method of processing the living body cell using other information (sex, age, age, habitat, residence, etc.) of the subject of the living body cell.

S804에서는 데이터 제공 장치(200)는 상기 처리 방법으로 상기 생체 세포를 처리함으로써, 상기 생체 세포의 제1 대상체의 유전자들의 배열(gene alignment) 및 각 유전자의 발현 정도를 상기 생체 세포와 대응되는 생물학적 데이터로 획득할 수 있다. 데이터 제공 장치(200)는 생체 세포의 대상체의 종에 따라 대상체의 유전자들의 배열을 결정할 수 있다. 예를 들어, 생체 세포의 대상체가 사람인 경우, 데이터 제공 장치(200)는 사람의 유전자 배열에 따라 상기 생체 세포의 대상체에 포함된 유전자들을 분류하고, 분류된 정보를 생물학적 데이터로 생성할 수 있다. 추가적으로, 데이터 제공 장치(200)는 생체 세포를 분석하여, 각 유전자의 발현 여부 또는 돌연변이 여부도 추가적으로 획득할 수 있다. In step S804, the data providing apparatus 200 processes the biological cells by the above-described processing method, thereby determining the gene alignment of the genes of the first subject of the living cells and the degree of expression of each gene based on the biological data . The data providing apparatus 200 can determine the arrangement of the genes of the subject according to the species of the subject of the living cell. For example, when the subject of a living cell is a person, the data providing apparatus 200 can classify the genes included in the subject of the living cell according to a gene sequence of a human, and generate the classified information as biological data. In addition, the data providing apparatus 200 may further analyze whether or not each gene is expressed or mutated by analyzing the living cells.

S805에서는 데이터 제공 장치(200)는 상기 생물학적 데이터 및 상기 병리학적 데이터를 각각의 레코드로 생성하여 저장하고, 상기 제1 대상체와 대응되는 레코드 및 상기 생물학적 데이터의 레코드를 연결 시키고, 상기 제1 대상체와 대응되는 레코드 및 상기 병리학적 데이터의 레코드를 연결 시켜 저장할 수 있다. 여기서, 생물학적 데이터의 레코드는 2개 이상의 행을 가지는 배열(array)의 형태로 구성되며, 유전자의 종류 및 각 유전자의 발현 정도에 해당하는 데이터들을 포함할 수 있다. 병리학적 데이터의 레코드 역시 2개 이상의 행을 가지는 배열의 형태로 구성되며, 시간 순으로 정렬되거나 동일한 질병 또는 질환으로 분류될 수 있다. In step S805, the data providing apparatus 200 generates and stores the biological data and the pathological data as respective records, links records corresponding to the first object and records of the biological data, A corresponding record, and a record of the pathological data may be concatenated and stored. Here, a record of biological data is formed in the form of an array having two or more rows, and may include data corresponding to the type of gene and the degree of expression of each gene. A record of pathological data is also organized in the form of an array having two or more rows, and may be sorted in chronological order or categorized into the same disease or disease.

도 9를 참조하면, 본 발명의 실시예들에 따른 데이터 제공 방법은 검색 요청 수신 단계(S901), 유전자의 종류를 추출하는 단계(S902), 데이터 검색 단계(S903), 대상체 및 레코드 검색 단계(S904), 데이터 제공 단계(S905), 청구 금액 결정 단계(S906), 상기 청구 금액에 대한 결제 처리 수행 단계(S907)를 포함할 수 있다. Referring to FIG. 9, a method of providing data according to embodiments of the present invention includes receiving a search request (S901), extracting a gene type (S902), retrieving data (S903) (Step S904), a data providing step (step S905), a charge amount determination step (step S906), and a payment processing step (step S907).

S901에서는 데이터 제공 장치(200)는 사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신 받는다. 검색 요청은 다양한 사용자 입력을 통해 수신되며, 병리학적 데이터 뿐만 아니라 생물학적 데이터도 포함할 수 있다. In step S901, the data providing apparatus 200 receives a search request including the first pathological data from the user. The search request is received via various user inputs and may include biological data as well as pathological data.

S902에서는 데이터 제공 장치(200)는 상기 제1 병리학적 데이터와 관련된 유전자의 종류를 추출한다. 데이터 제공 장치(200)는 병리학적 데이터인 위암과 관련된 유전자의 종류를 추출한다. 병리학적 데이터의 종류에 따라 관련된 유전자의 종류는 달라진다. In step S902, the data providing apparatus 200 extracts the types of genes associated with the first pathological data. The data providing apparatus 200 extracts the types of genes associated with gastric cancer, which are pathological data. The type of gene involved depends on the type of pathological data.

S903에서는 데이터 제공 장치(200)는 상기 제1 병리학적 데이터와 관련된 상기 유전자의 종류에 포함되는 각 유전자의 발현 정도를 검색하고, 각 유전자의 발현 정도로 발현된 생물학적 데이터를 검색한다. In step S903, the data providing apparatus 200 searches the degree of expression of each gene included in the type of the gene related to the first pathological data, and searches the biological data expressed by the degree of expression of each gene.

S904에서는 데이터 제공 장치(200)는 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색한다. 이때, 데이터 제공 장치(300)는 검색된 데이터 중에서, 이상, 장애, 변이 등을 가장 많이 포함하고 있는 생물학적 데이터 및/또는 병리학적 데이터를 보유한 대상체를 추출할 수 있다. 또는 데이터 제공 장치(200)는 검색된 데이터 중에서, 과거의 대상체의 상태 및 현재 대상체의 상태 사이의 차이가 가장 크고, 현재 대상체의 상태가 완치인 대상체를 추출하고, 상기 대상체의 생물학적 데이터 및/또는 병리학적 데이터를 추출할 수 있다.  In step S904, the data providing apparatus 200 searches for a second object providing the biological data, and records a second biological data and a second pathological data linked to the record corresponding to the second object. At this time, the data providing apparatus 300 can extract a target object having biological data and / or pathological data that contains the most abnormalities, faults, mutations, among the searched data. Or data providing apparatus 200 extracts a target object in which the difference between the state of the past object and the state of the current object is the largest among the searched data and the state of the current object is cured and the biological data and / It is possible to extract the enemy data.

S905에서는 데이터 제공 장치(200)는 상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로 제공한다. In step S905, the data providing apparatus 200 provides a record of the second biological data and a record of the second pathological data to the terminal of the user.

S906에서는 데이터 제공 장치(200)는 상기 제2 생물학적 데이터의 적정성 또는 상기 제2 병리학적 데이터의 완전성을 기초로 상기 사용자에게 청구할 청구 금액을 결정한다. In step S906, the data providing apparatus 200 determines a charge to be charged to the user based on the appropriateness of the second biological data or the completeness of the second pathological data.

S907에서는 데이터 제공 장치(200)는 상기 청구 금액에 대한 결제 처리를 사용자의 단말로 전송한다. In step S907, the data providing apparatus 200 transmits a settlement process for the charge amount to the user terminal.

도 10은 본 발명의 실시예들에 따른 질병 기전 연구를 위한 데이터 제공 장치(200)에 포함될 수 있는 데이터 생성부(201)의 구조를 나타내는 블록도이다. 10 is a block diagram showing the structure of a data generation unit 201 that may be included in the data providing apparatus 200 for disease mechanism research according to embodiments of the present invention.

도 10을 참조하면, 데이터 생성부(201)는 데이터 수집부(202), 1차 분석부(203), 처리 방법 선택부(204), 데이터 획득부(205), 데이터 처리부(206)를 포함할 수 있다. 10, the data generation unit 201 includes a data collection unit 202, a primary analysis unit 203, a processing method selection unit 204, a data acquisition unit 205, and a data processing unit 206 can do.

데이터 수집부(202)는 하나 이상의 사용자로부터 하나 이상의 대상체와 관련된 데이터를 수집한다. 데이터 수집부(202)는 하나 이상의 대상체로부터 획득된 생체 세포를 수집할 수 있으며, 각 대상체에 대한 병리학적 데이터를 수집할 수 있다. The data collection unit 202 collects data related to one or more objects from one or more users. The data collection unit 202 may collect the living cells obtained from one or more objects and collect pathological data for each object.

1차 분석부(203)는 상기 각 대상체의 생체 세포를 1차적으로 분석한다. The primary analysis unit 203 primarily analyzes biomolecules of the respective objects.

처리 방법 선택부(204)는 상기 1차적 분석 결과를 이용하여 각 대상체를 처리하는 처리 방법을 선택한다. The processing method selection unit 204 selects a processing method for processing each object using the primary analysis result.

데이터 획득부(205)는 상기 1차적으로 분석한 결과를 이용하여, 상기 생체 세포를 처리하는 처리 방법을 선택하고, 상기 처리 방법으로 상기 생체 세포를 처리함으로써, 상기 생체 세포의 제1 대상체의 유전자들의 배열 및 각 유전자의 발현 정도를 상기 생체 세포와 대응되는 생물학적 데이터로 획득할 수 있다. The data acquisition unit 205 selects a processing method for processing the living cells using the result of the primary analysis and processes the living body cells by the processing method so that the gene of the first subject of the living body cells And the degree of expression of each gene can be obtained as biological data corresponding to the living cells.

데이터 처리부(206)는 상기 생물학적 데이터 및 상기 병리학적 데이터를 각각의 레코드로 생성하여 저장하고, 상기 제1 대상체와 대응되는 레코드 및 상기 생물학적 데이터의 레코드를 연결시키고, 상기 제1 대상체와 대응되는 레코드 및 상기 병리학적 데이터의 레코드를 연결 시켜 저장할 수 있다. The data processing unit 206 generates and stores the biological data and the pathological data as respective records, connects records corresponding to the first object and records of the biological data, records corresponding to the first object, And a record of the pathological data may be concatenated and stored.

상기 생물학적 데이터의 레코드는 2 이상의 행을 가지는 배열의 형태로 유전자 배열, 유전자의 발현 정도에 해당하는 데이터들을 포함할 수 있다. A record of the biological data may include data corresponding to the degree of gene expression and gene expression in the form of an array having two or more rows.

상기 병리학적 데이터는 상기 제1 대상체의 진료 내역, 상기 제1 대상체의 치료 내역, 상기 제1 대상체의 진단 내역 중 적어도 하나를 포함할 수 있다. 또한, 병리학적 데이터는 제1 대상체의 체질, 건강 정도, 성별, 직업, 유전적 가족력 등을 더 포함할 수 있다. The pathological data may include at least one of a medical history of the first object, a treatment history of the first object, and a diagnosis history of the first object. The pathological data may further include constitution, health status, sex, occupation, genetic family history, etc. of the first subject.

또 다른 실시예에서, 데이터 요청 수신부(210)는 사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신할 수 있다. 수신한 검색 요청을 처리하기 위해서, 데이터 검색부(230)는 상기 제1 병리학적 데이터와 관련된 유전자의 종류를 추출할 수 있고, 상기 제1 병리학적 데이터와 관련된 상기 유전자의 종류에 포함되는 각 유전자의 발현 정도를 검색하고, 각 유전자의 발현 정도로 발현된 생물학적 데이터를 검색할 수 있다. 또한, 데이터 검색부(230)는 상기 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색할 수 있다. 데이터 제공부(260)는 상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로 제공할 수 있다. 또한, 데이터 제공부(260)는 상기 제2 생물학적 데이터의 적정성 또는 상기 제2 병리학적 데이터의 완전성을 기초로 상기 사용자에게 청구할 청구 금액을 결정하고, 상기 청구 금액에 대한 결제 처리를 상기 사용자의 단말로 전송할 수 있다. In yet another embodiment, the data request receiver 210 may receive a search request that includes the first pathological data from a user. In order to process the received search request, the data search unit 230 may extract the type of the gene related to the first pathological data, and may search for each gene included in the type of the gene associated with the first pathological data And the biological data expressed by the expression level of each gene can be retrieved. The data retrieval unit 230 may search for a second object providing the biological data, retrieve a record of second biological data linked to the record corresponding to the second object, and a record of the second pathological data have. The data providing unit 260 may provide a record of the second biological data and a record of the second pathological data to the terminal of the user. In addition, the data providing unit 260 may determine a charge to be charged to the user based on the appropriateness of the second biological data or the completeness of the second pathological data, To the terminal.

상기 제2 생물학적 데이터의 적정성은 생체 세포의 원시적 요인, 추출시 발생되는 요인, 보관시 발생되는 요인 중 적어도 하나를 통하여 결정될 수 있다. 좀더 구체적으로 살펴보면, 상기 제2 생물학적 데이터의 적정성은 생체 세포의 크기, 양이 클수록 커질 수 있다. 생체 세포가 클수록 추출할 수 있는 DNA의 양도 크기 때문이다. 상기 제2 생물학적 데이터의 적정성은 생체 세포가 불순물을 적게 포함할수록 커질 수 있다. 제2 생물학적 데이터의 적정성은 생체 세포의 보관 상태로 결정될 수 있다. 적정한 조건으로 보관된 생체 세포로부터 획득된 제2 생물학적 데이터의 적정성은 올라간다. 또한, 제2 생물학적 데이터의 적정성은 상기 제2 생물학적 데이터의 처리 방법의 정확성, 생체 세포의 상태, 생체 세포의 추출시 파괴 정도, 생체 세포의 보관시 변질 정도, 생체 세포의 처리자의 숙련 정도로 결정될 수 있다. 상기 제2 생물학적 데이터의 처리 방법의 정확성을 기초로 설정, 산출, 측정될 수 있다. 예를 들어, 제2 생물학적 데이터의 처리 방법이 최신에 출시된 방법인지 여부, 세계적으로 권위 있는 학술 논문지에 소개되었거나, 논문에 인용된 횟수, 논문에 게재된 횟수 중 적어도 하나를 고려하여, 결정될 수 있다. 또한, 제2 생물학적 데이터의 적정성은 생체 세포가 채취, 채집, 획득된 기관의 종류를 통해서 결정될 수 있다. 생체 세포가 채취, 채집, 획득된 기관이 대상체의 병리학적 데이터와의 관련성을 고려하여 상기 제2 생물학적 데이터의 적정성은 결정될 수 있다. 즉, 병리학적 데이터에 포함된 기관, 즉 질병, 질환이 있는 기관에 대한 생체 세포에 대한 생물학적 데이터의 적정성은 질병, 질환 등의 연구를 위해서 활발히 이용될 수 있기 때문에 그렇지 않은 경우보다 높게 설정될 수 있다. 생체 세포에 대한 생물학적 데이터의 적정성은 생체 세포의 채집 기관, 채집 시기, 채집된 크기 등을 고려하여 결정될 수 있다. 생체 세포의 생물학적 데이터의 적정성은 생체 세포의 채집 기관이 질병, 질환의 원인이 되는 기관인지 여부, 채집 시기가 질병, 질환의 발생 시기인지 여부, 채집된 크기 중 적어도 하나를 고려하여 결정될 수 있다. 즉, 생물학적 데이터의 적정성은 채집된 크기가 미리 설정된 크기 이상인 경우, 있다고 결정될 수 있다. The suitability of the second biological data may be determined through at least one of primitive factors of living cells, factors generated upon extraction, and factors generated during storage. More specifically, the appropriateness of the second biological data may be increased as the size and amount of living cells increase. The larger the living cells, the larger the amount of DNA that can be extracted. The suitability of the second biological data may be increased as the biological cells contain less impurities. The suitability of the second biological data can be determined as the storage state of the living cells. The appropriateness of the second biological data obtained from the stored biological cells under appropriate conditions is increased. The suitability of the second biological data may be determined by the accuracy of the method of processing the second biological data, the state of the living cells, the degree of destruction upon extraction of the living cells, the degree of deterioration during storage of the living cells, have. Can be set, calculated and measured based on the accuracy of the method of processing the second biological data. For example, it may be determined whether the method of processing the second biological data is up-to-date, taking into consideration at least one of the number of citations in a manuscript, the number of citations in a manuscript, have. In addition, the suitability of the second biological data can be determined through the type of organ in which the biological cells are collected, collected and obtained. Suitability of the second biological data can be determined in consideration of the relevance of pathological data of the organ in which the organism cells are collected, collected, and obtained. In other words, the appropriateness of biological data on organisms contained in pathological data, ie, diseased or diseased organs, can be set higher than otherwise have. The appropriateness of the biological data on the living cells can be determined in consideration of the collection organ of the living cells, the collecting time, the collected size, and the like. The adequacy of the biological data of biological cells can be determined by taking into account at least one of the collection organ of the living cell is the disease, the organ causing the disease, the collection time is the disease, the occurrence time of the disease, and the collected size. That is, the appropriateness of the biological data can be determined to be the case where the collected size is equal to or larger than a predetermined size.

생체 세포의 상태가 매우 좋을 수록, 미리 설정된 임계 상태를 초과할 경우, 생체 세포가 추출시 파괴되지 않을 수록, 미리 설정된 파괴율을 초과하지 않는 경우, 생체 세포가 보관시 변질되지 않을수록, 즉 미리 설정된 보관율을 초과하는 경우, 생체 세포의 처리자의 숙련도가 높을수록, 즉 미리 설정된 경력 이상을 가지는 경우, 제2 생물학적 데이터의 적정성은 매우 높게 설정될 수 있다. When the state of the living cells is very good, the state exceeds a predetermined threshold, the living cells are not destroyed during extraction, the predetermined destruction rate is not exceeded, the living cells are not deteriorated during storage, When the set storage rate is exceeded, the suitability of the second biological data can be set to be very high, as the operator of the biological cell has a high degree of skill, that is, has a predetermined career experience or more.

상기 제2 병리학적 데이터의 완전성은 상기 제2 병리학적 데이터의 최초 입력 시점 및 최후 입력 시점 사이의 시간 차와 비례하여 설정될 수 있다. 제2 병리학적 데이터는 대상체의 진료, 진단, 치료 내역 등을 통해서 획득되어지는 사회적인 데이터를 말하며, 진료, 진단, 치료 내역을 입력한 의료진에 대한 정보도 포함할 수 있다. 제2 병리학적 데이터의 완전성은 대상체의 수명, 나이를 고려하여 결정될 수 있다. 즉, 대상체의 수명 만큼의 시간 동안 축적된 제2 병리학적 데이터의 완전성은 매우 높게 설정되고, 대상체의 수명에 턱없이 부족한 시간 동안, 예를 들어 수명의 10프로 미만의 시간 동안 축적된 제2 병리학적 데이터의 완전성은 매우 낮게 설정될 수 있다. 특히, 제2 병리학적 데이터의 완전성은 제2 병리학적 데이터의 최초 입력 시점 및 최후 입력 시점 사이의 시간 차와 비례 하여 설정될 수 있으며, 상기 시간 차가 소정의 임계 시간, 즉 대상체의 수명 또는 나이를 초과하는 경우, 거의 완전하다고 볼 수 있도록 자연수 1 또는 100으로 설정될 수 있다. 또한, 제2 병리학적 데이터를 생성한 사용자에 대한 정보를 고려하여, 상기 제2 병리학적 데이터의 완전성은 설정될 수 있다. 제2 병리학적 데이터의 완전성은 상기 제2 병리학적 데이터의 작성자 또는 생성자의 직업이 의료부분 종사자인지 여부 및 상기 제2 병리학적 데이터의 작성자 또는 생성자의 경력의 길이를 고려하여 산출될 수 있다. 제2 병리학적 데이터의 완전성은 제2 병리학적 데이터의 작성자 또는 생성자의 직업이 의료 부분인 경우, 또는 제2 병리학적 데이터의 작성자 또는 생성자의 경력의 길이가 길수록 높게 설정될 수 있다. 또한, 제2 병리학적 데이터의 완전성은 제2 병리학적 데이터의 대상체의 최종적인 상태를 고려하여 결정될 수 있다. 대상체의 현재 상태가 완치 상태라면, 상기 제2 병리학적 데이터의 완전성은 매우 높게 결정될 수 있다. The completeness of the second pathological data may be set in proportion to the time difference between the first input point and the last input point of the second pathological data. The second pathological data refers to social data obtained through the medical examination, diagnosis, and treatment history of the subject, and may include information on the medical staff who entered the diagnosis, diagnosis, and treatment history. The completeness of the second pathological data can be determined in consideration of the life span and age of the object. That is, the completeness of the accumulated second pathological data for a time period corresponding to the life of the object is set to be very high, and for a short period of time insufficient for the life of the object, for example, Completeness of the enemy data can be set very low. In particular, the completeness of the second pathological data can be set in proportion to the time difference between the first input point and the last input point of the second pathological data, and the time difference is set to a predetermined threshold time, , It can be set to a natural number of 1 or 100 so as to be almost perfect. In addition, the completeness of the second pathological data may be established, taking into account information about the user who generated the second pathological data. The completeness of the second pathological data may be calculated in consideration of whether the creator or creator of the second pathological data is a medical partial worker and the length of the career of the creator or creator of the second pathological data. Completeness of the second pathological data may be set higher when the creator or creator of the second pathological data is a medical part, or the longer the career of the creator or creator of the second pathological data. In addition, the completeness of the second pathological data may be determined in consideration of the final state of the object of the second pathological data. If the current state of the object is in a cured state, the completeness of the second pathological data can be determined to be very high.

본 발명의 실시예들에 따른 데이터 제공 장치(200)는 제공되는 데이터가 가지는 경제적 사회적 가치를 측정할 수 있게 된다. 또한, 이를 통해, 동일한 대상체라 하더라도, 처리 방법 또는 생성자에 따라서 대상체의 생물학적 데이터 및 대상체의 병리학적 데이터는 변경될 수 있다. The data providing apparatus 200 according to the embodiments of the present invention can measure the economic and social value of the provided data. In addition, through this, the biological data of the subject and the pathological data of the subject can be changed depending on the treatment method or the creator, even if they are the same subject.

본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.The present invention can also be embodied as computer-readable codes on a computer-readable recording medium. A computer-readable recording medium includes all kinds of recording apparatuses in which data that can be read by a computer system is stored. Examples of the computer-readable recording medium include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like. In addition, the computer-readable recording medium may be distributed over network-connected computer systems so that computer readable codes can be stored and executed in a distributed manner. In addition, functional programs, codes, and code segments for implementing the present invention can be easily inferred by programmers of the technical field to which the present invention belongs.

본 발명은 상술한 실시형태 및 첨부된 도면에 의해 한정되지 아니하고, 첨부된 청구범위에 의해 권리범위를 한정하고자 하며, 청구범위에 기재된 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 다양한 형태의 치환, 변형 및 변경할 수 있다는 것은 당 기술분야의 통상의 지식을 가진 자에게 자명할 것이다.It is to be understood that the present invention is not limited to the above-described embodiments and the accompanying drawings, and that the scope of the present invention is defined by the appended claims, and that various changes, substitutions and alterations can be made hereto without departing from the spirit of the invention, It will be apparent to those skilled in the art that various modifications, additions and substitutions are possible, without departing from the scope and spirit of the invention.

200 : 데이터 제공 장치 260 : 데이터 제공부
210 : 데이터 요청 수신부 261 : 선택적 제공부
220 : 데이터 속성 결정부 270 : 사용자 단말
230 : 데이터 검색부 280 : 생성자 단말
240 : 데이터베이스 그룹 290 : 운영자 단말
250 : 가격 결정부
200: data providing apparatus 260: data providing apparatus
210: data request receiving unit 261:
220: Data attribute determination unit 270:
230: Data search unit 280: Creator terminal
240: Database group 290: Operator terminal
250:

Claims (6)

데이터 제공 장치가 하나 이상의 대상체로부터 획득된 유전자를 포함하는 생체 유래물 및 상기 하나 이상의 대상체에 대한 병리학적 데이터를 수집하는 단계;
상기 데이터 제공 장치가 상기 생체 유래물의 유전체 염기 변이를 확인할 수 있는 유전체 데이터를 획득하기 위한 전유전체 염기서열분석(WGS, Whole Genome Sequencing)이나 전엑솜 시퀀싱(WES, Whole Exome Sequencing), 마이크로어레이(Microarray), 타겟 시퀀싱(Target Sequencing), 생어 시퀀싱(Sanger sequencing), 전기영동법(Electrophoresis) 방법 중 적어도 하나를 이용하여 분석 또는 처리하는 단계;
유전체의 발현 여부를 확인할 수 있는 전사체 데이터를 획득하기 차세대염기서열분석법(NGS), 알엔에이 시퀀싱(RNA Sequenicng), 중합효소연쇄반응법(PCR), 전기영동법(Electrophoresis) 중 적어도 하나를 이용하여 분석 또는 처리하는 단계;
상기 데이터 제공 장치가 상기 분석 또는 처리한 결과, 생체 유래물의 대상체의 병리학적 데이터 및 상기 대상체의 종(species)을 이용하여, 상기 생체 유래물을 처리하는 처리 방법을 선택하고, 상기 처리 방법으로 상기 생체 유래물을 처리함으로써, 상기 생체 유래물의 제1 대상체의 종에 따라 유전자와 관련된 생물학적 데이터를 획득하는 단계;
상기 데이터 제공 장치가 상기 생물학적 데이터 및 상기 병리학적 데이터를 각각의 레코드로 생성하여 저장하고, 상기 제1 대상체와 대응되는 레코드 및 상기 생물학적 데이터의 레코드를 연결 시키고, 상기 제1 대상체와 대응되는 레코드 및 상기 병리학적 데이터의 레코드를 연결 시켜 저장하는 단계;
상기 데이터 제공 장치가 사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신 받는 단계;
상기 데이터 제공 장치가 상기 제1 병리학적 데이터와 관련된 유전자의 염기 서열을 추출하는 단계;
상기 데이터 제공 장치가 상기 제1 병리학적 데이터와 관련된 상기 유전자의 염기 서열에 포함되는 각 유전자의 변이 및 발현 정도를 검색하고, 각 유전자의 변이 및 발현 정도로 발현된 생물학적 데이터를 검색하는 단계;
상기 데이터 제공 장치가 상기 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색하는 단계; 및
상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로 전송하는 단계;를 포함하는 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법.
Collecting pathological data for the at least one subject and the bio-derivative comprising the gene obtained from the at least one subject;
(WGS), Whole Exome Sequencing (WES), Microarray (Microarray), or the like to obtain genome data that can confirm the genomic base mutation of the biological material. Analyzing or processing using at least one of a target sequence, a target sequencing, a Sanger sequencing, and an electrophoresis method;
Obtaining transcript data to confirm the expression of the genome Using at least one of the following methods: NGS, RNA Sequenicng, PCR, and electrophoresis Analysis or processing;
Wherein the data providing apparatus selects the processing method for processing the bio-derived material by using the pathological data of the subject of the bio-derivative and the species of the subject as a result of the analysis or processing, Obtaining biological data related to the gene according to the species of the first subject of the biological material by treating the biological material;
Wherein the data providing apparatus generates and stores the biological data and the pathological data as respective records, connects records corresponding to the first object and records of the biological data, records corresponding to the first object, Concatenating and storing a record of the pathological data;
Receiving the search request including the first pathological data from the user;
Extracting a nucleotide sequence of a gene associated with the first pathological data;
The data providing apparatus searches for the degree of mutation and expression of each gene included in the nucleotide sequence of the gene related to the first pathological data and searches for biological data expressed by the degree of mutation and expression of each gene;
Searching for a second object provided with the biological data, retrieving a record of second biological data and a record of second pathological data linked to the record corresponding to the second object; And
And transmitting a record of the second biological data and a record of the second pathological data to the terminal of the user.
제1항에 있어서,
상기 생물학적 데이터의 레코드는
2 이상의 행을 가지는 배열(array)의 형태로, 유전자 배열, 및 유전자의 발현 정도에 해당하는 데이터들을 포함하는, 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법.
The method according to claim 1,
A record of the biological data
A method for providing biological data for disease mechanism research comprising, in the form of an array having two or more rows, a gene sequence, and data corresponding to the degree of expression of the gene.
제1항에 있어서,
상기 병리학적 데이터는
상기 제1 대상체의 진료 내역, 상기 제1 대상체의 치료 내역, 상기 제1 대상체의 진단 내역 중 적어도 하나를 포함하는, 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법.
The method according to claim 1,
The pathological data
A medical history of the first object, a treatment history of the first object, and a diagnosis history of the first object, the biological data for disease mechanism research.
삭제delete 삭제delete 하나 이상의 대상체로부터 획득된 유전자를 포함하는 생체 유래물 및 상기 하나 이상의 대상체에 대한 병리학적 데이터를 수집하는 데이터 수집부;
상기 생체 유래물의 염기 변이를 확인할 수 있는 유전체 데이터를 획득하기 위한 전유전체 염기서열분석(WGS, Whole Genome Sequencing)이나 전엑솜 시퀀싱(WES, Whole Exome Sequencing), 마이크로어레이(Microarray), 타겟 시퀀싱(Target Sequencing), 생어 시퀀싱(Sanger sequencing), 전기영동법(Electrophoresis) 방법 중 적어도 하나를 이용하여 분석 또는 처리하고, 유전체의 발현 여부를 확인할 수 있는 전사체 데이터를 획득하기 위한 차세대염기서열분석법(NGS), 알엔에이 시퀀싱(RNA Sequenicng), 중합효소연쇄반응법(PCR), 전기영동법(Electrophoresis) 중 적어도 하나를 이용하여 분석 또는 처리하는 1차 분석부;
상기 분석 또는 처리한 결과, 생체 유래물의 대상체의 병리학적 데이터 또는 상기 대상체의 종(species)을 이용하여, 상기 생체 유래물을 처리하는 처리 방법을 선택하고, 상기 처리 방법으로 상기 생체 유래물을 처리함으로써, 상기 생체 유래물의 제1 대상체의 종에 따라 유전자들의 배열(gene alignment) 및 각 유전자의 발현 정도를 상기 유전자와 대응되는 생물학적 데이터로 획득하는 데이터 획득부;
상기 생물학적 데이터 및 상기 병리학적 데이터를 각각의 레코드로 생성하여 저장하고, 상기 제1 대상체와 대응되는 레코드 및 상기 생물학적 데이터의 레코드를 연결 시키고, 상기 제1 대상체와 대응되는 레코드 및 상기 병리학적 데이터의 레코드를 연결 시켜 저장하는 데이터 처리부;
사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신 받는 데이터 요청 수신부;
상기 제1 병리학적 데이터와 관련된 유전자의 염기 서열을 추출하는 데이터 속성 결정부;
상기 제1 병리학적 데이터와 관련된 상기 유전자의 종류에 포함되는 각 유전자의 변이 및 발현 정도를 검색하고, 각 유전자의 변이 및 발현 정도로 발현된 생물학적 데이터를 검색하고, 상기 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색하는 데이터 검색부;를 포함하고,
상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로전송하는 점을 특징으로 하는 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치.
A data collector for collecting pathological data for the at least one subject and a bio-derivative comprising genes obtained from at least one subject;
(WGS), Whole Exome Sequencing (WES), Microarray, and Target Sequencing (Target Sequencing) to obtain genomic data that can confirm the base mutation of the above-mentioned bio-derived material. Next Generation Sequence Analysis (NGS) to obtain transcript data for analyzing or processing using at least one of the sequencing, Sanger sequencing, and electrophoresis methods and verifying the expression of the genome, A primary analysis unit for analyzing or processing using at least one of RNA Sequenicng, Polymerase Chain Reaction (PCR), and Electrophoresis;
The method according to any one of claims 1 to 3, wherein the result of the analysis or treatment is obtained by selecting a treatment method for treating the biological material by using pathological data of a target of the biological material or species of the target object, A data acquiring unit for acquiring gene alignment and degree of expression of each gene in accordance with the species of the first object of the living body derived from the biological data corresponding to the gene;
And generating and storing the biological data and the pathological data as respective records, connecting a record corresponding to the first object and a record of the biological data, and recording the record corresponding to the first object and the pathological data A data processing unit for connecting and storing records;
A data request receiving unit receiving a search request including a first pathological data from a user;
A data attribute determination unit for extracting a nucleotide sequence of a gene related to the first pathological data;
Searching for the degree of mutation and expression of each gene included in the type of the gene related to the first pathological data, searching for biological data expressed by the degree of mutation and expression of each gene, And a data retrieval unit for retrieving a record of second biological data and a record of second pathological data linked to the record corresponding to the second object,
A record of the second biological data and a record of the second pathological data are transmitted to the terminal of the user.
KR1020180069060A 2015-04-14 2018-06-15 Data providing apparatus, and method KR101961438B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020150052454 2015-04-14
KR20150052454 2015-04-14

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020160045807A Division KR101870632B1 (en) 2015-04-14 2016-04-14 Data providing apparatus, and method

Publications (2)

Publication Number Publication Date
KR20180072625A KR20180072625A (en) 2018-06-29
KR101961438B1 true KR101961438B1 (en) 2019-07-17

Family

ID=57256968

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020160045807A KR101870632B1 (en) 2015-04-14 2016-04-14 Data providing apparatus, and method
KR1020180069060A KR101961438B1 (en) 2015-04-14 2018-06-15 Data providing apparatus, and method

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020160045807A KR101870632B1 (en) 2015-04-14 2016-04-14 Data providing apparatus, and method

Country Status (1)

Country Link
KR (2) KR101870632B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200098189A (en) 2019-02-12 2020-08-20 주식회사 꿀비 System for providing analysis service of next generation sequencing and method thereof
CN112132646B (en) * 2020-08-27 2023-04-25 广东壹健康健康产业集团股份有限公司 User distribution processing method, device, medium and terminal equipment
KR102535319B1 (en) * 2022-09-02 2023-05-26 주식회사 메디클라우드 Method, apparatus and system of providing transaction service for genetic information based on blockchain

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001325454A (en) 2000-05-12 2001-11-22 Ntt Me Corp System and method for distributing data
JP2005222468A (en) 2004-02-09 2005-08-18 Takuji Otani Literary work management system
US20070178458A1 (en) 2003-09-05 2007-08-02 O'brien Philippa Methods of diagnosis and prognosis of ovarian cancer II
WO2009120909A1 (en) 2008-03-26 2009-10-01 Theranos, Inc. Methods and systems for assessing clinical outcomes
KR101261042B1 (en) 2011-02-23 2013-05-06 (주)터보소프트 A service providing method for customized medical information sales

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070081157A (en) 2006-02-10 2007-08-16 (주)엔앤에스 Ubiquitous genbank system using ubiquitous network and service offer method thereof
KR20120063720A (en) * 2010-12-08 2012-06-18 주식회사 펀진 Internet multiple searching method using multiple serching system
KR20150076310A (en) * 2013-12-26 2015-07-07 주식회사 케이티 System and method of forming social network for cancer patients

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001325454A (en) 2000-05-12 2001-11-22 Ntt Me Corp System and method for distributing data
US20070178458A1 (en) 2003-09-05 2007-08-02 O'brien Philippa Methods of diagnosis and prognosis of ovarian cancer II
JP2005222468A (en) 2004-02-09 2005-08-18 Takuji Otani Literary work management system
WO2009120909A1 (en) 2008-03-26 2009-10-01 Theranos, Inc. Methods and systems for assessing clinical outcomes
KR101261042B1 (en) 2011-02-23 2013-05-06 (주)터보소프트 A service providing method for customized medical information sales

Also Published As

Publication number Publication date
KR101870632B1 (en) 2018-06-25
KR20160122669A (en) 2016-10-24
KR20180072625A (en) 2018-06-29

Similar Documents

Publication Publication Date Title
Manzoni et al. Genome, transcriptome and proteome: the rise of omics data and their integration in biomedical sciences
Dillon et al. Exome sequencing has higher diagnostic yield compared to simulated disease-specific panels in children with suspected monogenic disorders
Monroe et al. Effectiveness of whole-exome sequencing and costs of the traditional diagnostic trajectory in children with intellectual disability
Clima et al. HmtDB 2016: data update, a better performing query system and human mitochondrial DNA haplogroup predictor
MacArthur et al. Locus Reference Genomic: reference sequences for the reporting of clinically relevant sequence variants
Frank et al. Genome sequencing: a systematic review of health economic evidence
KR101961438B1 (en) Data providing apparatus, and method
JP5690039B2 (en) Tumor identification
CN108474040A (en) Recommended using the treatment based on group of Cell-free DNA
Plöthner et al. Cost analysis of whole genome sequencing in German clinical practice
JP2003021630A (en) Method of providing clinical diagnosing service
JP2007102709A (en) Gene diagnostic marker selection program, device and system executing this program, and gene diagnostic system
CN109310332A (en) Method for analyzing numerical data
CA3126147A1 (en) Machine learning in functional cancer assays
US20220013195A1 (en) Systems and methods for access management and clustering of genomic or phenotype data
EP4260340A1 (en) Predicting fractional flow reserve from electrocardiograms and patient records
Ahmed et al. Advancing clinical genomics and precision medicine with GVViZ: FAIR bioinformatics platform for variable gene-disease annotation, visualization, and expression analysis
Thareja et al. Differences and commonalities in the genetic architecture of protein quantitative trait loci in European and Arab populations
CN106960133B (en) Disease prediction method and device
US20110093448A1 (en) System method and computer program product for pedigree analysis
Shi et al. HUSCH: an integrated single-cell transcriptome atlas for human tissue gene expression visualization and analyses
Jegathisawaran et al. Trio genome sequencing for developmental delay and pediatric heart conditions: A comparative microcost analysis
Gelly et al. Protein Peeling 3D: new tools for analyzing protein structures
Labuzzetta et al. Complementary feature selection from alternative splicing events and gene expression for phenotype prediction
Poszewiecka et al. TADeus2: a web server facilitating the clinical diagnosis by pathogenicity assessment of structural variations disarranging 3D chromatin structure

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant