KR20160122669A - 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 및 방법 - Google Patents

질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 및 방법 Download PDF

Info

Publication number
KR20160122669A
KR20160122669A KR1020160045807A KR20160045807A KR20160122669A KR 20160122669 A KR20160122669 A KR 20160122669A KR 1020160045807 A KR1020160045807 A KR 1020160045807A KR 20160045807 A KR20160045807 A KR 20160045807A KR 20160122669 A KR20160122669 A KR 20160122669A
Authority
KR
South Korea
Prior art keywords
data
pathological
user
biological
gene
Prior art date
Application number
KR1020160045807A
Other languages
English (en)
Other versions
KR101870632B1 (ko
Inventor
고진업
Original Assignee
주식회사 테라젠이텍스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 테라젠이텍스 filed Critical 주식회사 테라젠이텍스
Publication of KR20160122669A publication Critical patent/KR20160122669A/ko
Application granted granted Critical
Publication of KR101870632B1 publication Critical patent/KR101870632B1/ko

Links

Images

Classifications

    • G06F19/28
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F17/30386
    • G06F19/18
    • G06F19/32
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioethics (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명에 따른 질병 기전 연구를 위한 데이터 제공 장치, 방법, 데이터 제공 방법을 실행하기 위한 프로그램이 기록되어 있는 컴퓨터 판독가능한 기록매체에 따르면, 대상체로부터 직접 추출해야 하는 생체 세포로부터 영구적으로 사용될 수 있고, 사용에 따라서 훼손되지 않는 전자적 데이터를 획득하고, 상기 획득된 생체 세포에 대한 전자적 데이터를 적정한 가격으로 거래될 수 있도록 할 수 있다.

Description

질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 및 방법 {Data providing apparatus, and method}
본 발명은 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 방법에 관한 것이다.
인체 종양 조직은 유전체, 전사체, 단백질체, 대사체 등과 같은 여러 가지 연구 방법들을 이용하여, 암의 발생 원인을 찾고, 암 진단의 정확도를 높이기 위해서, 그리고 암의 치료 효과를 증진하기 위해 연구되고 있다. 특히, 암 환자의 암 조직을 통해 암에 대한 연구를 하고 있다. 조직 세포의 연구를 위해서, 국내외적으로 이미 많은 병원 및 연구소에서 조직 은행 시스템을 갖추고, 환자 조직을 관리하고 있다.
조직을 액체 질소 혹은 냉동 상태로 보관해야 하기 때문에 매년 많은 비용이 필요한 문제가 있었다.
또한, 암을 연구하는 연구자는 본인의 연구를 위해서, 필요한 조직을 구매하고, 선행적으로 DNA/RNA/단백질/대사산물과 같은 파생물들을 추출하는 과정을 거쳐야 한며, 최근 암연구를 위해 대용량 염기서열 분석법(NGS)가 많이 활용되어, 암 또는 정상조직의 DNA/RNA 염기서열 분석이 많이 이루어 지고 있다.
그러나, 조직 세포는 액체 질소 또는 냉동 상태로 보관해야 하기 때문에 많은 보관 비용이 필요하고, 하나의 조직 세포에 대한 DNA/RNA/단백질/대사산물과 같은 파생물들을 추출하는 과정은 역시 많은 시간과 많은 비용을 필요로 하는 문제가 있었다.
게다가, 인체 종양 조직으로부터 다양한 파생물(DNA, RNA, Protein 등)을 추출하는 과정에 오류가 있을 경우, 추출된 파생물에 대한 정보를 신뢰할 수 없을 뿐만 아니라, 파생물이 인체 종양 조직으로부터 잘못 추출되는 과정에서 수량이 한정된 인체 종양 조직이 낭비되는 문제도 발생할 수 있다.
암 연구를 위해서는 과도한 비용이 필요하기 때문에 현실적으로, 한정된 연구자에게만 조직 세포들이 독식되는 경향이 있었고, 잘못된 추출 과정으로 인해 조직이 낭비되는 문제도 있었다.
대한민국 공개특허 제2007-0081157호
본 발명이 해결하고자 하는 기술적 과제는, 특정 방법으로 한정적인 양만 산출할 수 있는 데이터, 좀 더 상세하게는 대용량 염기서열 분석법(NGS)을 통해 생산된 데이터를 복사와 전송이 용이한 데이터로 변환하여 데이터베이스에 저장해두었다가, 사용자의 요청에 따라 사용자에게 제공함으로써, 이미 존재하는 데이터와 동일한 데이터를 얻어내기 위해서 막대한 비용으로 동일한 과정을 불필요하게 반복 수행하는 것을 최소화할 수 있는 데이터 제공 장치, 방법, 데이터 제공 방법을 실행하기 위한 프로그램이 기록되어 있는 컴퓨터 판독 가능한 기록매체를 제공하는 데에 있다.
상기의 기술적 과제를 해결하기 위한 본 발명의 일 실시 예에 따른 데이터 제공 방법은, 사용자 단말로부터 데이터 요청을 수신하는 데이터 요청 수신단계; 상기 데이터 요청에 포함된 조건을 기초로 사용자 단말에 제공할 데이터의 속성을 결정하는 데이터 속성 결정단계; 상기 데이터의 속성과 대응되는 데이터를 검색하는 데이터 검색단계; 상기 검색된 데이터의 생성자에 대한 정보, 생성에 필요한 시간, 생성에 필요한 자원을 고려하여 상기 데이터의 가격을 결정하는 가격 결정단계; 및 상기 데이터 및 상기 데이터의 가격을 포함하는 표시 정보를 상기 사용자 단말로 제공하는 데이터 제공단계를 포함한다.
상기 방법에 있어서, 상기 데이터 요청에 포함된 조건은, 상기 데이터의 대상물질, 상기 데이터의 종류, 상기 데이터의 처리방법의 종류, 상기 데이터의 가공여부, 및 상기 데이터의 생성시기 중 적어도 하나를 포함할 수 있다.
상기 방법에 있어서, 상기 데이터 요청에 포함된 조건은, 상기 데이터의 예산 범위, 총 한도 금액 중 적어도 하나를 포함하고, 상기 데이터 제공단계는, 상기 가격 범위에 포함된 최소 금액 또는 최대 금액을 고려하여 상기 데이터 중 일부를 추출하고, 상기 추출한 데이터를 상기 사용자 단말로 제공하거나, 추출한 데이터의 가격의 총합이 상기 총 한도 금액을 초과하지 않도록 상기 데이터 중 하나 이상의 데이터를 추출하고, 상기 추출한 데이터를 상기 사용자 단말로 제공하는 선택적 제공단계;를 포함할 수 있다.
상기 방법에 있어서, 상기 표시 정보는, 상기 데이터를 통해 획득할 수 있는 효과 및 상기 데이터에 포함되는 일부내용 중 적어도 하나를 더 포함할 수 있다.
상기 방법에 있어서, 상기 생성자에 대한 정보는, 상기 생성자의 생성 당시의 지위, 현재의 지위 중 적어도 하나를 포함하고, 상기 데이터의 가격은 상기 생성자의 생성 당시의 지위 및 현재의 지위 중 적어도 하나에 의해서 차등적으로 결정될 수 있다.
상기 방법에 있어서, 상기 데이터의 가격은 상기 데이터를 요청한 사용자와 상기 데이터를 생성한 생성자의 동일 여부, 상기 사용자와 상기 데이터 사이의 관련성 중 적어도 하나를 고려하여 차등적으로 결정될 수 있다.
상기 방법에 있어서, 상기 생성자에 대한 정보는, 레벨 정보를 포함하고, 상기 레벨 정보는 상기 생성자가 생성한 데이터의 수, 상기 생성자가 생성한 데이터의 누적 판매량, 상기 생성자가 생성한 데이터로부터의 수입 중 적어도 하나를 고려하여 결정될 수 있다.
상기의 기술적 과제를 해결하기 위한 본 발명의 다른 일 실시 예에 따른 데이터 제공 장치는, 사용자 단말로부터 데이터 요청을 수신하는 데이터 요청 수신부; 상기 데이터 요청에 포함된 조건을 기초로 사용자 단말에 제공할 데이터의 속성을 결정하는 데이터 속성 결정부; 상기 데이터의 속성과 대응되는 데이터를 검색하는 데이터 검색부; 상기 검색된 데이터의 생성자에 대한 정보, 생성에 필요한 시간, 생성에 필요한 자원을 고려하여 상기 데이터의 가격을 결정하는 가격 결정부; 및 상기 데이터 및 상기 데이터의 가격을 포함하는 표시 정보를 상기 사용자 단말로 제공하는 데이터 제공부;를 포함한다.
상기 장치에 있어서, 상기 데이터 요청에 포함된 조건은, 상기 데이터의 대상물질, 상기 데이터의 종류, 상기 데이터의 처리방법의 종류, 상기 데이터의 가공여부, 및 상기 데이터의 생성시기 중 적어도 하나를 포함할 수 있다.
상기 장치에 있어서, 상기 데이터 요청에 포함된 조건은, 상기 데이터의 예산 범위, 총 한도 금액 중 적어도 하나를 포함하고, 상기 데이터 제공부는, 상기 가격 범위에 포함된 최소 금액 또는 최대 금액을 고려하여 상기 데이터 중 일부를 추출하고, 상기 추출한 데이터를 상기 사용자 단말로 제공하거나, 추출한 데이터의 가격의 총합이 상기 총 한도 금액을 초과하지 않도록 상기 데이터 중 하나 이상의 데이터를 추출하고, 상기 추출한 데이터를 상기 사용자 단말로 제공하는 선택적 제공부;를 포함할 수 있다.
상기 장치에 있어서, 상기 표시 정보는 상기 데이터를 통해 획득할 수 있는 효과 및 상기 데이터에 포함되는 일부내용 중 적어도 하나를 더 포함할 수 있다..
상기 장치에 있어서, 상기 생성자에 대한 정보는, 상기 생성자의 생성 당시의 지위, 현재의 지위 중 적어도 하나를 포함하고, 상기 데이터의 가격은 상기 생성자의 생성 당시의 지위, 및 현재의 지위 중 적어도 하나에 의해서 차등적으로 결정될 수 있다.
상기 장치에 있어서, 상기 데이터의 가격은 상기 데이터를 요청한 사용자와 상기 데이터를 생성한 생성자의 동일 여부, 상기 사용자와 상기 데이터 사이의 관련성 중 적어도 하나를 고려하여 차등적으로 결정될 수 있다.
상기 장치에 있어서, 상기 생성자에 대한 정보는, 레벨 정보를 포함하고, 상기 레벨 정보는 상기 생성자가 생성한 데이터의 수, 상기 생성자가 생성한 데이터의 누적 판매량, 상기 생성자가 생성한 데이터로부터의 수입 중 적어도 하나를 고려하여 결정될 수 있다.
이 외에도, 본 발명을 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공된다.
전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 특허청구범위 및 발명의 상세한 설명으로부터 명확해 질 것이다.
본 발명에 따른 데이터 제공 장치, 방법에 따르면, 대상체로부터 직접 추출해야 하는 생체 세포로부터 영구적으로 사용될 수 있고, 사용에 따라서 훼손되지 않는 전자적 데이터를 획득하고 좀 더 상세하게는 DNA/RNA의 염기서열(A,T,G,C)등으로, 상기 획득된 생체 세포에 대한 전자적 데이터를 적정한 가격으로 거래될 수 있도록 할 수 있다. 또한, 수집하기 어렵고 수량이 한정적인 데이터의 메타데이터로서, 해당 데이터의 생성자에 대한 정보를 사용자에게 제공하여, 사용자가 데이터를 구매하는 데에 도움을 줄 수 있으며, 이미 존재하는 데이터와 동일한 데이터를 얻어내기 위해서 막대한 비용으로 동일한 과정을 불필요하게 반복 수행하는 것을 최소화하여 그 데이터를 반복적으로 이용하는 연구자들의 연구비용과 연구시간을 대폭 절감할 수 있다. 여기서, 데이터는 암 발병 기전 연구를 위한 생물학적 데이터일 수 있다.
특히, 본 발명에 따른 데이터 제공 장치, 방법, 데이터 제공 방법을 실행하기 위한 프로그램이 인체 종양 조직에 관련된 데이터의 제공을 위해 이용되는 경우, 여러 연구자들이 시간적, 금전적인 제약을 받지 않고 연구가 가능하게 되어 궁극적으로는 암 정복 및 암 환자별 맞춤형 치료가 가능해질 수 있다.
도 1은 본 발명의 일 실시 예에 따른 데이터 제공 시스템의 구성을 나타낸 도면이다.
도 2는 본 발명의 일 실시 예에 따른 데이터 제공 장치에 대한 블록도를 도시한 도면이다.
도 3은 데이터 제공 장치의 데이터를 인체 종양 조직에 대한 데이터로 한정했을 때의 데이터베이스 그룹에 저장되는 데이터를 도시한 도면이다.
도 4는 본 발명의 다른 일 실시 예에 따른 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.
도 5는 본 발명의 또 다른 일 실시 예에 따른 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.
도 6은 본 발명의 또 다른 일 실시 예에 따른 데이터 제공 장치를 기준으로 한 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.
도 7은 생체 세포로부터 데이터를 생성하는 과정을 설명하기 위한 도면이다.
도 8 및 도 9는 본 발명의 실시예들에 따른 질병 기전 연구를 위한 데이터 제공 방법의 흐름도들이다.
도 10은 본 발명의 실시예들에 따른 질병 기전 연구를 위한 데이터 제공 장치에 추가적으로 포함될 수 있는 데이터 생성부의 구조를 나타내는 블록도이다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시 예를 가질 수 있는바, 특정 실시 예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 실시 예들을 상세히 설명하기로 하며, 도면을 참조하여 설명할 때 동일하거나 대응하는 구성 요소는 동일한 도면부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.
이하의 실시 예에서, 제1, 제2 등의 용어는 한정적인 의미가 아니라 하나의 구성 요소를 다른 구성 요소와 구별하는 목적으로 사용되었다.
이하의 실시 예에서, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
이하의 실시 예에서, 포함하다 또는 가지다 등의 용어는 명세서 상에 기재된 특징, 또는 구성요소가 존재함을 의미하는 것이고, 하나 이상의 다른 특징을 또는 구성요소가 부가될 가능성을 미리 배제하는 것은 아니다.
어떤 실시 예가 달리 구현 가능한 경우에 특정한 공정 순서는 설명되는 순서와 다르게 수행될 수도 있다. 예를 들어, 연속하여 설명되는 두 공정이 실질적으로 동시에 수행될 수도 있고, 설명되는 순서와 반대의 순서로 진행될 수 있다.
도 1은 본 발명의 일 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 시스템의 구성을 나타낸 도면이다.
도 1을 참조하면, 본 발명의 일 실시 예에 따른 데이터 제공 시스템(1)은 데이터 제공 장치(10), 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)을 포함한다. 또한, 운영자 단말(30), 사용자 단말(50), 생성자 단말(51), 데이터 제공 장치(10)를 상호 연결하는 통신망(70)을 포함한다.
설명의 편의를 위해서, 도 1의 데이터 제공 시스템(1)은 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)을 각각 한 대씩 포함하고 있으나, 데이터 제공 시스템(1)은 필요에 따라 복수의 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)을 포함할 수도 있다.
데이터 제공 장치(10)는 암 관련 연구를 하고자 하는 자에게 암 관련 조직 또는 세포 등에 대한 정보를 제공하는 수단을 제공한다. 데이터 제공 장치(10)는 진단적 검사, 예측적 검사, 보인자 검사, 신생아 선별 검사, 산전 진단 검사, 착상전 검사를 위한 데이터를 제공할 수 있다. 데이터 제공 장치(10)는 대상체로부터 획득된 생체 세포로부터 DNA 수준에서의 돌연변이, 유전체의 구조적 이상, 염색체의 이상, 대사산물의 변화 등을 검출할 수 있도록 처리 할 수 있다. 이때, 대상체로부터 획득된 생체 세포가 적당한 방법으로 처리될 수 있도록 제어할 수 있다. 데이터 제공 장치(10)는 사용자 단말(50)로부터 수신된 데이터 요청과 대응되는 데이터를 검색하고, 데이터에 대한 가격을 결정할 수 있다. 데이터 제공 장치(10)는 암 관련 연구를 위한 데이터를 사용자로부터의 요청에 따라 제공함으로써, 매 연구 마다 동일한 데이터를 생성해야 하는 수고를 덜 수 있고, 암 관련 데이터를 직접 구하지 않더라도 암 관련 연구를 진행할 수 있으며, 조직 또는 세포 등을 보관하는 것에 비해서, 보관 비용도 현저히 적게 발생하게 된다.
데이터 제공 장치(10)는 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)로부터 데이터 요청을 받고 각 단말에 데이터를 제공할 수 있다. 도 1에는 하나의 데이터 제공 장치를 표시하였으나, 접속량 또는 데이터 양에 따라 복수의 데이터 제공 장치가 존재할 수도 있다. 이 경우, 데이터 제공 시스템(1)은 각 데이터 제공 장치의 현재 부하량을 측정 및 비교하고 각 데이터 제공 장치에서 효율적으로 작업이 처리하도록 로드 밸런싱(Load Balancing)을 수행하는 레이어 4(Layer 4) 스위치(미도시)를 추가로 포함할 수 있다.
데이터 제공 장치(10)는 내부에 저장하고 있는 데이터의 업데이트 및 동작을 위한 프로그램의 유지 및 보수를 위해서 운영자 단말(30)로부터 주기적으로 특정 데이터를 수신할 수 있다.
운영자 단말(30)은 개인용 컴퓨터(PC) 또는 워크스테이션(workstation) 중 하나가 될 수 있으며, 필요에 따라 데이터 제공 장치(10)에 접속하여 데이터 제공 장치(10)에 저장되어 있는 데이터의 업데이트 및 데이터 제공 장치(10)의 동작을 위한 프로그램의 유지 및 보수를 수행한다.
사용자 단말(50)은 사용자가 유무선 네트워크를 통해 데이터 제공 장치(10)에 접속한 후, 데이터 제공 서비스에 대한 회원 등록을 할 수 있다. 또한, 사용자 단말(50)은 사용자가 제공받을 데이터의 종류를 검색 및 선택한 후 결제하는 데에 사용될 수 있다.
생성자 단말(51)은 데이터 제공 장치(10)에 저장되어 있는 데이터와 동종의 데이터를 생성할 수 있는 전문가가 이용하는 사용자 단말의 한 종류이다. 즉, 생성자 단말(51)은 사용자 단말(50)의 기능을 필수적으로 포함한다. 생성자 단말(51)은 운영자 단말(30)에 데이터 업로드 요청을 하여 운영자가 운영자 단말(30)을 통해 데이터 제공 장치(10)에 저장되는 데이터를 업데이트할 수 있도록 하는 기능을 포함할 수 있다.
운영자 단말(30)은 사용자 단말(50)과 생성자 단말(51)을 각각 구별하기 위한 식별코드를 각 사용자 단말(50)과 생성자 단말(51)에 부여할 수 있다. 운영자 단말(30)은 업로드 요청을 할 수 있는 식별코드를 가진 생성자 단말(51)에 한해 데이터 업로드 요청을 할 수 있도록 하여 데이터 제공 장치(10)에 저장될 수 있는 데이터의 품질 및 신뢰도를 확보할 수 있다.
도 1을 참조했을 때, 사용자 단말(50) 및 생성자 단말(51)은 스마트폰 형태를 띄고 있으나, 본 발명에서 사용자 단말(50) 및 생성자 단말(51)은 특정한 기기로 한정되지 않으므로, 스마트폰이 아니더라도 웹 브라우징이 가능한 애플리케이션이 설치되어 있는 단말이라면 제한 없이 차용될 수 있다.
통신망(70)은 데이터 제공 장치(10), 운영자 단말(30), 사용자 단말(50), 생성자 단말(51)을 연결한다. 본 발명에서 통신망(70)은 그 구동 방식에 있어서 유선과 무선 중 어느 한 방식으로 한정되지 않으므로, 랜(LAN, Local Area Network)과 같은 유선 네트워크나, 블루투스(Bluetooth), 와이파이(WIFI), 와이브로(Wibro), 위성 통신과 같은 무선 네트워크에 의해 구동되는 모든 통신망을 포함할 수 있다.
도 2는 본 발명의 일 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 장치에 대한 블록도를 도시한 도면이다.
도 2를 참조하면, 본 발명의 일 실시 예에 따른 데이터 제공 장치(200)는 데이터 요청 수신부(210), 데이터 속성 결정부(220), 데이터 검색부(230), 데이터베이스 그룹(240), 가격 결정부(250), 데이터 제공부(260), 사용자 단말(270), 생성자 단말(280). 운영자 단말(290)을 포함할 수 있다.
데이터 요청 수신부(210)는 사용자 단말(270)로부터 데이터 요청을 수신한다. 사용자 단말(270)은 사용자가 데이터 제공 장치(200)에 접근할 수 있게 하는 기기로서, 데이터 제공 장치(200)에 각종 유무선 네트워크를 통해 연결될 수 있다. 사용자 단말(270)은 사용자가 웹 브라우징(web browsing)을 수행할 수 있게 하는 브라우저 애플리케이션(browser application)이 설치되어 있는 단말이며, 본 발명은 사용자 단말(270)에 있어서 단말의 성능, 형태, 및 종류를 특정한 어느 것으로 한정하지 않는다.
여기서, 데이터 요청은 데이터 제공 장치(200)의 데이터베이스 그룹(240)에 저장되어 있는 데이터 중 사용자가 지정한 조건에 따른 데이터가 있는지 여부를 판단하여 그 결과를 사용자 단말(270)에 전송하라는 신호를 의미한다.
데이터 속성 결정부(220)는 데이터 요청에 포함된 대상 물질 및/또는 조건을 기초로 데이터의 검색 속성을 결정한다. 여기서, 검색 속성은 데이터 요청에 포함된 조건 즉, 대상물질, 종류, 처리방법의 종류, 생성 시기 등으로부터 결정되는 것으로, 물질 관련 속성 또는 처리 관련 속성으로 구분될 수 있다. 물질 관련 속성은 조건으로부터 유추될 수 있는 속성 중에서, 대상물질 자체와 관련된 것으로, 대상물질의 위치, 종류 등을 포함하며, 처리 관련 속성은 조건으로부터 유추될 수 있는 속성 중에서, 대상물질의 처리와 관련된 처리방법, 가공 여부, 생성 시기 등을 포함할 수 있다.
여기서, 데이터 요청에 포함된 조건은 데이터의 종류, 처리방법의 종류, 생성 시기 중 적어도 하나를 포함할 수 있고, 제공할 데이터의 속성은 데이터의 종류, 처리방법의 종류, 가공 여부, 생성 시기, 데이터의 인용횟수 중 적어도 하나를 포함할 수 있다.
데이터의 대상물질은 사용자가 요청하는 데이터의 주체가 되는 물질을 말하며, 실험을 시행했던 대상이 되는 물질로서, '췌장암 조직(78세, 남, Stage Ⅲ, Grade 4)' 과 같이 실험 대상이 되었던 샘플(sample)에 대한 물질 정보를 의미한다. 또한, 데이터의 대상물질은 학계에서 이미 널리 알려진 분류도 포괄적으로 포함할 수 있다. 예를 들어, 사용자가 사용자 단말(270)을 통해 데이터 요청을 할 때, 필수 아미노산 20종을 특정하여 입력했다면, 사용자가 요청한 데이터의 대상물질은 필수 아미노산 20종 모두가 될 수 있다.
여기서, 데이터의 종류는 전유전체 염기서열분석(Whole Genome Sequencing), 전엑솜 염기서열분석(Whole Exome Sequencing), 알엔에이 염기서열분석(RNA Sequencing) 등과 같은 차세대염기서열분석기법(Next Generation Sequencing)의 분석대상 중 어느 것인지를 나타낸다. 예를 들어, 알엔에이 염기서열분석(RNA Sequencing)에 대한 데이터의 종류는 알엔에이(RiboNucleic Acid)가 된다.
여기서, 데이터의 처리방법의 종류는, 데이터를 생성하는 방법에 대한 정보를 말한다. 보다 상세하게는, 데이터의 처리방법의 종류는 차세대염기서열분석기법을 활용하여 분석하는 툴(tool)에 대한 종류를 의미한다. 특별히, 데이터의 처리방법의 종류에는 처리 또는 공정의 이름이 포함될 수 있다. 데이터의 처리방법의 종류에 대한 예시로는, 유전체학 기법인 전유전체 염기서열(WGS, Whole Genome Sequencing)나 전엑솜 시퀀싱(WES, Whole Exome Sequencing), 전사체학 기법인 마이크로어레이(Microarray)나 알엔에이 염기서열분석(RNA Sequencing), 단백질체학(Proteomics) 기법인 말디토프(MALDI-TOF, Matrix-Assisted Laser Desorption-Ionization Time Of Flight), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 대사체학(Metabolomics) 기법인, 핵자기공명-질량분석(NMR-MS, Nuclear Magnetic Resonance-Mass Spectrometry), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 가스 크로마토그래피-질량 분석(GC-MS, Gas Chromatography-Mass Spectrometry)가 있다.
또한, 데이터의 처리 방법은 아래의 분석 방법을 포함할 수 있다.
- (A) 유전체 데이터: whole genome, exome 서열 데이터 및 분석 데이터 등(variant calling, assembly, CNV, SV, visualization 등의 처리/가공 방법으로 처리할 수 있음)
- (B) 전사체 데이터: RNA-seq, miRNA-seq 서열데이터 및 분석 데이터 등 (quantification, variant detection, alternative splicing, DEG 등의 처리/가공 방법으로 처리할 수 있음)
- (C) 후성유전체 데이터: ChIP-seq, Histone modifications, DNA methylation 분석 데이터 및 visualization 데이터 등
- (D) 네트워크 분석과 신호전달 조절 및 Pharmaco-Genomic 데이터: 네트워크 추론, subnetwork 및 모듈 분석, pathway 규명, 전사조절, 단백질 상호작용, 기능 네트워크, 질병-약물-유전체 정보 데이터마이닝 등
- (E) Meta-genome 데이터: microbiota, phylogeny 분석 등
유전체와 관련된 데이터는 서로 다른 목적을 위해서 획득되어 지는데, 특히, 유전체 데이터를 이용하여 유전체의 염기 변이를 확인할 수 있고, 전사체 데이터를 이용하여 유전체의 발현 여부를 확인할 수 있고, 후성유전체 데이터를 이용하여 후성적으로 변화된 유전체를 확인할 수 있다.
여기서, 데이터의 가공 여부는 데이터를 생성하는데 있어서 대상물질로부터 바로 획득되는 데이터 인지, 또는 대상물질에 특수한 처리(실험, 분리, 추출, 여과 등)를 한 후에 획득될 수 있는 데이터 인지 여부에 대한 정보를 말할 수 있다.
보다 상세하게는, 데이터의 가공여부는 차세대염기분석기법으로 처리한 1차적인 실험 데이터를 기초로 하여, 단순하게는 유전자 염기서열 해독 더 나아가서는 해독된 염기서열 에서 돌연변이 유전자변이를 찾을 수 있는알고리즘으로 동작하는 소프트웨어를 사용하여, 유전자 복세수 변이 (Copy-number Variation:CNV), 유전자의 단일 염기의 다형성(Single Nucleotide Polymorphism:SNP)등을 찾아 정보를 찾는 등 보다 향상되고 진보된(advanced) 정보를 추출하는 과정을 거쳤는지 여부를 의미한다.
유전자 변이를 선택하기 위한 소프트웨어로서 뮤트시그(MutSig, Mutation Significance)가 이용될 수 있고, 주기적인 복사 개수 변경으로부터 유전자를 선택하기 위한 소프트웨어로서 기스틱(Gistic)이 이용될 수 있으나, 반드시 상술한 소프트웨어로 한정하는 것은 아니며, 동일한 알고리즘을 수행할 수 있다면 다른 소프트웨어를 통해 데이터를 가공하더라도 본 발명의 범주를 벗어나는 것은 아니다.
본 발명의 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 장치는 1차적인 실험 데이터와 1차적인 실험 데이터를 가공한 데이터를 모두 제공할 수 있다. 즉, 여기서, 데이터의 가공 여부라는 항목을 통해서 대상물질을 통해 바로 획득되는 데이터(미가공 데이터), 대상물질에 대해서 특수한 처리(실험, 추출, 분리, 여과 등) 등을 한 후에 획득되는 데이터(가공 데이터)인지 여부에 대한 정보를 말한다.
즉, 다시 말해서, 데이터의 처리방법의 종류는 데이터에 적용되는 특수한 처리 또는 공정을 명확하게 알고 있을 때에 사용자가 사용자 단말을 통해 입력할 수 있는 조건이고, 사용자가 요청한 데이터의 가공여부는 데이터에 적용되는 특수한 처리 또는 공정을 모르더라도, 특수한 처리 또는 공정 전후로 데이터의 성질이 크게 달라지는 특성만 알고 있어도 적절한 데이터를 찾기 위한 조건으로 활용할 수 있는 조건이다.
여기서, 데이터의 생성 시기는 데이터가 생성된 시점을 말한다. 데이터 요청자(사용자)는 데이터의 생성 시기를 한정하여 데이터 요청을 할 수 있다.
예를 들어, 사용자가 6개월전에 생성된 데이터를 요청한다면, 사용자는 사용자 단말(270)에 현재로부터 6개월 전의 날짜범위를 입력함으로써, 데이터 제공 장치(200)로부터 해당 날짜범위에 생성된 데이터를 제공받을 수 있다.
여기서, 데이터의 인용 횟수는 데이터가 논문에 인용된 횟수에 대한 정보를 의미한다. 데이터의 인용 횟수는 해당 데이터가 얼마나 심도있게 연구되고 있는지에 대해서 알려주는 척도가 될 수 있다. 데이터 속성 결정부(220)는 데이터의 인용 횟수에 대한 최신 정보를 수집하기 위해서 논문관련정보를 제공하는 외부 서버와 유무선 네트워크를 통해서 연결될 수 있다.
사용자 단말(270)에 제공할 데이터의 속성(이하, 데이터 속성)은, 데이터 속성 결정부(220)가 위와 같은 데이터 요청에 포함된 조건을 기초로 결정되며, 데이터 속성은 데이터 요청에 포함된 각각의 조건을 특징값(feature)으로 하는 하나 이상의 값으로 결정되며, 물질 관련 속성 또는 처리 관련 속성을 포함할 수 있다. 최종적으로 제공할 데이터 속성은 테이블 형태가 될 수 있다.
데이터 속성 결정부(220)에 의해 결정된 테이블 형태의 데이터 속성은, 후술하는 데이터 검색부(230)의 입력값으로 입력될 수 있으며, 데이터 속성을 구성하는 테이블의 크기는 데이터 요청에 포함된 조건의 수에 따라 달라질 수 있다. 또한, 데이터 속성(물질 관련 속성 또는 처리 관련 속성)은 데이터 요청에 포함된 각 조건에 하나 이상으로 결정될 수 있다.
데이터 검색부(230)는 사용자가 요청한 데이터의 속성(물질 관련 속성 또는 처리 관련 속성)과 대응되는 데이터를 검색한다. 보다 구체적으로는, 데이터 검색부(230)는 데이터 속성을 데이터 속성 결정부(220)로부터 전달받아, 데이터베이스 그룹(240)에 저장되어 있는 데이터 중에서, 데이터 속성(물질 관련 속성 또는 처리 관련 속성)과 대응되는 데이터를 검색할 수 있다.
데이터베이스 그룹(240)은 데이터 제공 장치(200)가 사용자 단말(270)에 제공할 수 있는 각종 데이터를 저장한다. 데이터베이스 그룹(240)에 저장되는 각종 데이터는 데이터 검색부(230)에서 검색을 용이하게 하기 위해서, 각 데이터마다 고유한 식별코드를 가질 수 있다.
데이터베이스 그룹(240)은 각 데이터를 특성별로 구분하여 저장하기 위해서 복수 개의 소규모 데이터베이스를 포함할 수 있다. 도 2를 참조하면, 데이터베이스 그룹(240)은 4개의 소규모 데이터베이스를 포함하고, 본 발명은 데이터베이스 그룹(240)에 포함될 수 있는 소규모 데이터베이스의 개수를 특정한 숫자로 한정하지 않으므로, 본 발명의 다른 실시 예에서 데이터베이스 그룹(240)은 4개보다 많거나 적은 소규모 데이터베이스를 포함할 수도 있다.
선택적 실시 예로서, 데이터베이스 그룹(240)에 포함된 각 소규모 데이터베이스는 가공처리부(미도시)를 포함할 수 있다. 가공처리부(미도시)는 소규모 데이터베이스에 저장되는 데이터가 특정 방법으로 가공처리됨에 따라 데이터의 성질이나 연구 가치가 달라지는 경우, 미가공 데이터를 가공하여 가공 데이터로 처리한다. 소규모 데이터베이스에 가공처리부(미도시)를 두고 사용자의 데이터 요청이 있을 때마다 미가공데이터를 가공한 가공 데이터를 제공하면, 소규모 데이터베이스에 미가공데이터와 가공 데이터를 모두 저장하는 것보다 소규모 데이터베이스의 저장공간의 활용에 있어서 더 이득이 될 수 있다.
가격 결정부(250)는 데이터 검색부(230)에서 검색된 데이터의 생성자에 대한 정보, 생성에 필요한 시간, 생성에 필요한 자원 등을 고려하여 사용자가 요청한 데이터의 가격을 결정한다. 다른 실시예에서, 가격 결정부(250)는 검색된 데이터의 생성자에 대한 정보 및/또는 데이터의 속성을 기초로 데이터의 최초 가격을 결정하는 제1 가격 결정부(미도시) 및 상기 데이터의 생성에 필요한 시간, 생성에 필요한 자원을 고려한 가격 변화율을 산출하고, 상기 최초 가격 및 상기 가격 변화율을 모두 고려하여, 상기 데이터의 최종 가격을 결정하는 제2 가격 결정부를 포함할 수 있다.
제1 가격 결정부는 검색된 데이터의 속성 중 물질 관련 속성을 기초로 데이터의 최초 가격을 결정할 수 있다. 제1 가격 결정부는 데이터의 대상 물질을 비교하여, 희귀한 암의 조직이라서 획득하기 어려운 대상물질에 대해서는 더 높은 가격을 매길 수 있고, 흔한 암의 조직이라서 획득하기 쉬운 대상물질에 대해서는 더 낮은 가격을 매길 수 있다.
여기서, 데이터의 생성자에 대한 정보는 데이터를 생성한 사람에 대한 정보로서, 데이터를 생성할 당시의 지위 및 사용자의 데이터 요청을 받은 현재의 지위를 모두 포함할 수 있다. 여기서, 지위는 직업 또는 경력 등을 포함하는 정보로서, 직업 또는 경력과 대응되는 등급 정보를 포함할 수도 있다. 즉, 경력이 9년차인 생성자의 지위가 경력이 3년차인 생성자의 지위보다 높고, 연구원이 직업인 생성자의 지위가 연구와 무관한 직업을 가진 생성자의 지위보다 높을 수 있다. 즉, 의사, 연구원 등과 같이 암 관련 연구 및 임상을 할 수 있는 직업을 가진 생성자의 지위를 더 높게 책정하고, 해당 경력이 더 많은 생성자의 지위를 더 높게 책정한다. 여기서, 생성자의 지위는 생성자의 최종학력, 생성자의 전공, 생성자의 직업, 생성자의 누적 논문수, 생성자의 수상 경력 등을 포함하거나, 생성자의 최종학력, 생성자의 전공, 생성자의 직업, 생성자의 누적 논문수, 생성자의 수상 경력 등을 종합적으로 고려하여 산출할 수 있다.
가격 결정부(250)는 데이터의 생성자의 생성시 지위만을 고려하여, 데이터의 가격을 결정할 수 있다. 예를 들어, 가격 결정부(250)는 데이터를 생성할 당시에 데이터 생성자의 지위가 높은 데이터에 대해서 좀 더 높은 가격을 매길 수 있다.(이하, 제1사례)
선택적 실시 예로서, 데이터의 가격을 결정하기 위해서 이용되는 생성자의 종합적 등급인 지위는 사용자 또는 관리자에 의해서 새로 매겨질 수도 있다. 또한, 생성자의 지위는 생성자의 과거 경력 또는 직업 등을 통해 산출된 제1 등급과 사용자 또는 관리자에 의해 산출된 제2 등급을 합산하여 결정될 수 있다. 이때, 생성자의 지위는 제1 등급과 제2 등급에 대해서 각각 다른 가중치를 두어 가중 평균하여 산출될 수 있다.
예를 들어, 처음에 매겨져 있는 생성자의 종합등급은 생성자의 직업에 대한 요소가 많이 반영되어 있었다면, 사용자는 생성자의 누적 논문수나 생성자의 수상 경력을 위주로 하여 새로운 종합등급을 산출하고, 산출된 종합등급을 기준으로 하여 데이터를 검색함으로써 사용자가 원하는 데이터를 검색할 수 있다.
가격 결정부(250)는 생성자의 생성시 지위와 현재 지위를 모두 고려하여, 데이터의 최초 가격을 결정할 수 있다. 데이터를 생성할 당시에 데이터 생성자의 지위가 낮았으나, 사용자의 데이터 요청을 받은 현재에 데이터 생성자의 지위가 높을 경우(이하, 제2사례), 가격 결정부(250)는 생성자가 데이터를 생성한 이후에 좀더 많은 연구 성과를 낸 생성자의 현재 지위를 고려하여, 생성시 지위를 통해 산출된 데이터의 가격 보다 더 높게 데이터의 최초 가격을 결정할 수 있다.
다른 실시 예에서, 가격 결정부(250)는 현재 지위가 검색되지 않은 생성자의 데이터에 대해서 생성시 지위를 통해 산출된 데이터의 가격보다 더 낮은 가격으로 상기 데이터의 최초 가격을 결정할 수 있다. 예를 들어, 데이터를 생성할 당시에 데이터 생성자의 지위가 낮고, 사용자의 데이터 요청을 받은 현재에 데이터 생성자의 지위가 낮거나 검색되지 않는 경우(이하, 제3사례), 가격 결정부(250)는 생성자의 현재 지위가 검색되지 않는 점을 고려하여, 생성자의 연구 의지가 낮다고 판단할 수 있고, 이러한 점을 고려하여, 데이터의 가격을 다소 낮은 가격으로 최초 가격을 결정할 수 있다.
가격 결정부(250)는 전술한 것과 같이 데이터를 생성한 사람의 데이터 생성 당시의 지위 및 사용자의 데이터 요청을 받은 현재의 지위 중 적어도 하나에 의해서 데이터의 가격을 차등적으로 결정할 수 있다. 가격 결정부(250)는 데이터 생성자의 현재 지위에 대한 정보를 실시간으로 확인하기 위해서 외부 개인정보 제공서버(미도시)와 유무선 네트워크를 통해 연결될 수 있다.
선택적 실시 예로서, 가격 결정부(250)는 사용자 단말(270)을 통해 데이터를 요청한 사용자와 데이터를 생성한 생성자의 동일 여부, 사용자 단말(270)을 통해 데이터를 요청한 사용자와 사용자가 요청한 데이터 사이의 관련성 중 적어도 하나를 고려하여 데이터의 가격 변화율을 결정할 수도 있다. 여기서, 사용자 단말(270)을 통해 데이터를 요청한 사용자와 사용자가 요청한 데이터 사이의 관련성은, 사용자 단말(270)을 통해 데이터를 요청한 사용자가, 사용자 단말(270)을 통해 요청한 데이터를 생성하는 데에 기여한 정도가 될 수 있다. 예를 들어, 특정 데이터 Z의 생성자는 A, B, C, 이상 세 사람이고, 각각 데이터를 생성하는데 기여한 정도가 상, 중, 하이며, C가 데이터 Z에 대한 제공요청을 했다고 가정하면, 가격 결정부(250)는 데이터를 요청한 자와 생성한 자가 모두 C로 동일하다고 판단하여, 높은 할인율을 적용하여 데이터 가격을 결정하거나, 데이터를 요청한 자가 데이터를 생성한 자이기는 하지만, 기여도가 낮으므로, 낮은 할인율을 적용하여 데이터 가격을 결정할 수 있다.
선택적 실시 예로서, 데이터의 생성자에 대한 정보는 생성자의 레벨 정보를 포함할 수 있다. 여기서, 생성자의 레벨 정보는 생성자가 생성한 데이터의 수, 생성자가 생성한 데이터의 누적 판매량, 생성자가 생성한 데이터로부터의 수입 중 적어도 하나를 고려하여 결정될 수 있다. 다른 실시 예에서, 가격 결정부(250)는 데이터의 가공 여부를 고려하여 데이터의 가격 변화율을 결정할 수 있다. 예를 들어, A라는 대상물질에 대한 미가공 데이터, A라는 대상물질에 대한 가공 데이터가 있다고 하면, 가격 결정부는 가공 데이터의 가격 변화율을 미가공 데이터의 가격 변화율보다 높게 결정할 수 있다. 차등된 데이터의 가격에 따라, 미가공 데이터만을 구매하는 사용자는 미가공 데이터 및 가공 데이터를 모두 구매하거나, 가공 데이터만을 구매하는 사용자보다 더 낮은 금액을 결제하면 된다.
다른 실시 예에서, 가격 결정부(250)는 데이터의 생성에 필요한 시간을 고려하여 상기 데이터의 가격 변화율을 결정할 수 있다. 가격 결정부(250)는 데이터의 생성에 필요한 시간이 길수록 상기 데이터의 가격 변화율을 높게 결정할 수 있다. 데이터의 생성에 대한 필요한 시간은 데이터를 생성하는 방식 및 생성자의 역량에 따라 달라질 수 있으므로, 고정된 시간이 아닌 시간적 범위로 표시할 수 있다. 이때, 표시되는 시간적 범위 외에 데이터 생성하는 데 걸리는 최대시간 및 최소시간과 해당 데이터를 생성하여 업로드한 여러 업로더의 데이터의 생성 시간에 대한 평균시간도 추가로 표시할 수도 있다. 예를 들어, 유전체 데이터 중 assembly 방법으로 가공된 데이터를 요청하는 데이터 요청과 대응하여, 가격 결정부(250)는 유전체 데이터를 assembly 방법으로 가공하는데 필요한 자원(시간, 비용 등)을 고려하여, 상기 데이터의 가격 변화율을 결정할 수 있다. 또한, 유전체 데이터 중 CNV 방법으로 가공된 데이터를 요청하는 데이터 요청과 대응하여, 가격 결정부(250)는 유전체 데이터를 assembly 방법으로 가공하는 것과는 구별되게 CNV 방법으로 가공하는데 필요한 자원(시간, 비용 등)을 고려하여, 상기 데이터의 가격 변화율을 결정할 수 있다. 이를 통해, 본 발명의 실시예에 따른 데이터 제공 장치는 요청된 동일한 종류의 데이터에 대한 가격을 요청자의 요청에 포함된 데이터 가공 방법에 따라서 차등적으로 결정할 수 있다.
다른 실시 예에서, 가격 결정부(250)는 데이터의 생성에 필요한 자원, 예를 들어, 비용 등을 고려하여 데이터의 가격 변화율을 결정할 수 있다. 가격 결정부(250)는 데이터를 생성하는 필요한 자원이 많은 데이터에 대해서 더 높은 가격 변화율을 매길 수 있다.
다른 실시 예에서, 가격 결정부(250)는 미가공 데이터 및 가공 데이터를 생성하기 위해서 필요한 초기 데이터에 따라서, 미가공 데이터 및 가공 데이터의 가격 변화율을 결정할 수 있다. 여기서 초기 데이터는 데이터의 가격을 명확하게 정할 수 있도록, 데이터에 대한 순도나 분석 결과에 대한 정성적, 정량적 판단이 가능한 데이터일 것을 요한다.
데이터 제공부(260)는 사용자가 요청한 데이터 및 가격 결정부(250)에서 결정된 데이터의 가격을 포함하는 표시 정보를 사용자 단말(270)로 제공한다. 사용자는 표시 정보에 포함된 데이터 및 데이터의 가격을 확인하고, 결제를 진행할지 여부를 결정할 수 있다.
사용자 단말(270)로 제공되는 표시 정보는 사용자 단말(270)로 제공된 데이터를 통해 획득할 수 있는 효과 및 사용자 단말(270)로 제공된 데이터에 포함되는 일부내용 중 적어도 하나를 포함할 수 있다.
사용자가 요청한 데이터에 포함되는 일부내용은, 해당 데이터를 취급하는 분야에 속한 사람이라면 바로 알 수 있을 정도로, 미리보기 형식으로 제공되는 데이터를 의미한다. 사용자는 데이터에 포함되는 일부내용을 확인하여 구매여부를 결정하는 데에 활용할 수 있다.
Figure pat00001
표 1은 사용자 단말(270)의 디스플레이부를 통해 출력되는 표시 정보에 대한 예시이다.
표 1을 해석하면, 사용자는 데이터 제공 장치에 2013년 11월 13일에 생성된 췌장암 조직 데이터의 미가공 디앤에이 데이터에 대한 제공을 요청한 것을 알 수 있다. 표 1을 참조하면, 사용자는 미가공 디앤에이 데이터를 이용해서, 췌장암의 항암제 개발 및 바이오마커를 특정할 수 있을 것으로 기대된다.
표 1을 참조하면, 미가공 디앤에이 데이터를 생성한 생성자는 3명으로, 미가공 디앤에이 데이터를 생성할 당시의 지위와, 현재의 지위가 각각 달라졌으며, 생성자 3명의 기여도도 각각 다르다. 사용자는 상술한 내용 외에도 표 1과 같은 표시 정보를 통해, 데이터 생성에 필요한 물질, 시간, 사용자 레벨, 데이터의 가격, 데이터 미리보기(데이터의 일부내용)을 확인한 후, 결제를 하여 데이터를 제공받을지 여부를 결정할 수 있다.
표 1을 참조하면, 사용자가 요청한 데이터의 가격은 160만원으로 결정되었는데, 이 가격은 요청된 데이터의 생성에 필요한 자원(난이도, 시간, 비용 등), 데이터를 생성한 생성자의 정보, 생성 시기를 종합적으로 고려하여 산출된 것이며, 만약 사용자 레벨이 3보다 높아지면 사용자는 160만원보다 더 할인된 가격에 데이터를 구매할 수도 있다. 또한 가격은 요청된 데이터의 종류 및 각 데이터의 획득 방법(처리, 가공 방법)을 고려하여, 산출될 수 있다. 이때. 데이터의 획득 방법(처리, 가공 방법)에 따른 가격은 생성에 필요한 자원, 시간 등에 따라 설정된 난이도 등급에 비례할 수 있다.
데이터 제공부(260)는 사용자가 사용자 단말(270)을 통해 결제를 완료하면 사용자 단말(270)로 사용자가 요청한 데이터를 전송할 수 있다. 선택적 실시 예로서, 사용자가 요청한 데이터의 용량이 방대하여 유무선 네트워크를 통한 전송이 어려울 경우에는, 데이터 제공 장치(200)에 연결되어 있는 배송용 하드디스크(미도시)에 사용자가 요청한 데이터가 전송될 수도 있다. 사용자는 오프라인으로 배송용 하드디스크를 수신함으로써, 사용자가 사용자 단말(270)을 통해 요청했던 데이터를 제공받을 수 있다.
선택적 실시 예로서, 데이터 요청에 포함된 조건은 전술한 사용자가 요청한 데이터의 대상물질, 종류, 처리방법의 종류, 생성 시기 외에 데이터의 예산 범위, 총 한도 금액 중 적어도 하나를 포함할 수 있다.
사용자는 사용자 단말(270)을 통해 데이터 요청을 하면서 사용자가 결제할 수 있는 금액에 대한 정보도 같이 전송함으로써, 데이터 제공 장치(200)가 그 금액에 대한 정보를 고려하여 데이터를 제공하도록 할 수 있다. 이 선택적 실시 예에 의하면, 데이터 제공부(260)는 데이터의 예산 범위에 포함된 최소 금액 또는 최대 금액을 고려하여 데이터 검색부(230)에 의해 검색된 데이터 중 일부를 추출하고, 추출한 데이터를 사용자 단말로 제공하거나, 추출한 데이터의 가격의 총합이 총 한도 금액을 초과하지 않도록 데이터 검색부(230)에 의해 검색된 데이터 중 하나 이상의 데이터를 추출하고, 추출한 데이터를 사용자 단말(270)로 제공하는 선택적 제공부(261)를 포함할 수 있다.
선택적 실시예에서, 데이터 요청 수신부(210)는 사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신할 수 있다. 또한, 데이터 요청 수신부(210)는 유전체 관련 데이터를 포함하는 검색 요청을 수신할 수 있다. 검색 요청은 다양한 사용자 입력을 통해 수신되며, 병리학적 데이터 뿐만 아니라 생물학적 데이터를 포함할 수 있다. 병리학적 데이터를 포함하는 검색 요청의 경우에는 데이터 속성 결정부(220)는 상기 병리학적 데이터와 관련된 유전자의 종류를 추출할 수 있다. 예를 들어, 데이터 속성 결정부(220)는 병리학적 데이터인 위암과 관련된 유전자의 종류를 추출할 수 있다.
데이터 속성 결정부(220)는 병리학적 데이터 뿐만 아니라, 검색 요청에 포함된 다른 조건을 고려하여, 상기 검색 요청과 대응되는 유전자의 종류 및 대상체의 또 다른 속성을 결정할 수 있다. 유전체 관련 데이터를 포함하는 검색 요청의 경우에는 데이터 속성 결정부(220)는 검색 요청에 포함된 데이터의 종류를 고려하여, 상기 유전체 관련 데이터로부터 검색 대상의 속성을 결정할 수 있다. 예를 들어, 질병인 유방암을 포함하는 검색 요청의 응답으로, 데이터 속성 결정부(220)는 Estrogen Receptor (ER) 유전자를 추출하고, 데이터 검색부(230)는 상기 유전자에 대해서 변이가 발생한 대상체를 검색할 수 있다. 데이터 검색부(230)는 검색된 대상체의 해당 유전자에 대한 변이 여부, 변이 종류를 검색할 수 있다. 또한, 질병인 폐암을 포함하는 검색 요청의 응답으로, 데이터 속성 결정부(220)는 EGFR 유전자를 추출하고, 데이터 검색부(230)는 상기 유전자에 대해서 변이가 발생한 대상체를 검색할 수 있다. 데이터 검색부(230)는 검색된 대상체의 해당 유전자에 대한 변이 여부, 변이 종류를 검색할 수 있다.
데이터 속성 결정부(220)는 제1 시점에서는 제1 질병과 관련된 유전자로서 제1 유전자를 추출하다가도, 제1 시점 이후의 연구 결과에 따라 제1 시점으로부터 소정의 시간 이후의 제2 시점에서는 제1 질병과 동일한 질병에 대해서, 제1 유전자와 다른 제2 유전자를 추출하도록 할 수 있다. 즉, 데이터 속성 결정부(220)는 시간이 흘러 많은 연구가 이루어져 제1 시점에서의 결정된 데이터 및 제2 시점에서의 결정된 데이터를 다르게 결정할 수 있다. 즉, 이를 통해, 사용자는 데이터를 요청한 시점에 따라 다른 데이터를 제공 받을 수 있게 된다. 이를 통해, 본 발명의 실시예들에 따른 데이터 제공 장치(200)는 과학, 의료 기술의 진보를 반영할 수 있는 데이터를 제공하게 된다.
데이터 속성 결정부(220)는 질병 및 질병에 대한 치료, 처방 내역 등을 포함하는 검색 요청의 응답으로, 상기 질병 및 치료, 처방 내역이 동일한 대상체를 검색하도록 할 수 있다. 즉, 데이터 속성 결정부(220)는 상기 질병 및 치료, 처방 내역이 동일한 대상체를 검색하는 검색식을 생성할 수도 있다.
데이터 검색부(230)는 상기 제1 병리학적 데이터와 관련된 상기 유전자의 종류에 포함되는 각 유전자의 발현 정도를 검색하고, 각 유전자의 발현 정도로 발현된 생물학적 데이터를 검색하고, 상기 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색한다.
데이터 제공부(260)는 상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로 제공한다.
가격 결정부(250)는 상기 제2 생물학적 데이터의 적정성 또는 상기 제2 병리학적 데이터의 완전성을 기초로 상기 사용자에게 청구할 청구 금액을 결정할 수 있다. 추가적으로, 가격 결정부(250)는 상기 청구 금액에 대한 결제 처리를 사용자의 단말로 전송할 수 있다. 여기서, 생물학적 데이터의 적정성 및 병리학적 데이터의 완전성은 도 10에 대한 설명에서 자세히 하겠다.
생성자 단말(280)은 데이터 제공 장치(200)에 저장되어 있는 데이터와 동종의 데이터를 생성할 수 있는 전문가가 이용하는 사용자 단말의 한 종류이다. 생성자 단말(280)은 사용자 단말(270)의 기능을 필수적으로 포함한다. 생성자 단말(280)은 운영자 단말(290)에 데이터 업로드 요청을 하여 운영자가 운영자 단말(290)을 통해 데이터 제공 장치(200)에 저장되는 데이터를 업데이트할 수 있도록 하는 기능을 포함할 수 있다. 생성자 단말(280)은 각종 유무선 네트워크로 데이터 제공 장치(200)에 연결될 수 있으며, 운영자 단말(290)에 연결될 수 있다.
운영자 단말(290)은 데이터 제공 장치(200)에 접속하여 데이터 제공 장치(200)에 저장되어 있는 데이터의 업데이트 및 데이터 제공 장치(200)의 동작을 위한 프로그램의 유지 및 보수를 수행한다. 운영자 단말(290)은 사용자 단말(270)과 생성자 단말(280)을 각각 구별하기 위한 식별코드를 각 사용자 단말(270)과 생성자 단말(280)에 부여할 수 있다. 운영자 단말(290)은 업로드 요청을 할 수 있는 식별코드를 가진 생성자 단말(280)에 한해 데이터 업로드 요청을 할 수 있도록 하여 데이터 제공 장치(200)에 저장될 수 있는 데이터의 품질 및 신뢰도를 확보할 수 있다.
데이터 제공 장치(200)는 도 3에 도시된 바와 같은 데이터의 구조로 데이터를 저장할 수 있다. 데이터의 구조에 대해서 설명하면, 아래와 같다. 비디지털 데이터 그룹(310)은 사람의 행동이 개입되어 실험이 행해지고 데이터가 산출되는 부분으로, 인체 종양 조직(A1), 디앤에이(A2), 알엔에이(A3), 단백질(A4), 및 대사체(A5)를 포함할 수 있다.
데이터베이스 그룹(330)은 본 발명에 따른 데이터 제공 장치에 저장되는 데이터를 포함하며, 디앤에이 소규모 데이터베이스(331), 알엔에이 소규모 데이터베이스(333), 단백질 소규모 데이터베이스(335), 대사체 소규모 데이터베이스(337)를 포함할 수 있다.
데이터 제공 장치(200)에 의해 사용자 단말(270)로 제공될 수 있는 데이터의 일 예로, 인체 종양 조직(A1)의 대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)가 있다. 인체 종양 조직(A10)에 대한 데이터가 연구자에게 의미 있는 데이터가 되기 위해서는, 인체 종양 조직으로부터 파생물을 추출하고, 추출된 파생물(A2, A3, A4, A5)에 유전체학, 전사체학, 단백질체학, 대사체학 기법을 적용하여 대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)를 생성하는 과정이 필요하다.
대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)를 생성하는 과정에서 최초의 인체 종양 조직(A1)은 소멸될 뿐만 아니라, 인체 종양 조직(A1)으로부터 추출된 파생물(A2)에 적용되는 각종 기법은 막대한 비용을 필요로 하므로, 대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)는 수집하기 어렵고 수량이 한정된 특성을 갖는다.
인체 종양 조직(A1)으로부터 연구에 사용할 디앤에이(DNA, DeoxyriboNucleic Acid)(A2), 알엔에이(RNA, RiboNucleic Acid)(A3), 단백질(Protein)(A4), 대사체(Metabolites)(A5)가 추출될 수 있다. 디앤에이 추출물(A2)의 경우, 유전체학 기법인 전유전체 염기서열분석(WGS, Whole Genome Sequencing)나 전엑솜 염기서열분석(WES, Whole Exome Sequencing)등이 적용되어 미가공 디앤에이 데이터(A2-1, 유전자 변이 데이터)가 생성될 수 있다.
알엔에이 추출물(A3)의 경우, 전사체학 기법인 마이크로어레이(Microarray)나 알엔에이 염기서열분석(RNA Sequencing)이 적용되어 미가공 알엔에이 데이터(A3-1, 전사체 발현 데이터)가 생성될 수 있다.
단백질 추출물(A4)의 경우, 단백질체학 기법인 말디토프(MALDI-TOF, Matrix-Assisted Laser Desorption-Ionization Time Of Flight), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry) 등이 적용되어 정량, 정성적 미가공 단백질 데이터(A4-1)가 생성될 수 있다.
대사체 추출물(A5)의 경우, 대사체학 기법인 핵자기공명-질량분석(NMR-MS, Nuclear Magnetic Resonance-Mass Spectrometry), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 가스 크로마토그래피-질량 분석(GC-MS, Gas Chromatography-Mass Spectrometry) 등과 같은 기법으로 정량, 정성적 대사체 데이터(A5-1)가 생성될 수 있다.
전술한 과정을 통해 산출된 유전자 변이 데이터(A2-1), 전사체 발현 데이터(A3-1), 단백질 데이터(A4-1), 대사체 데이터(A5-1)는 오믹스(Omics) 데이터 또는 대용량 미가공 데이터라고 통칭될 수 있으며, 인체 종양 조직(A1)을 연구하는 연구자가 해당 인체 종양 조직을 분석하는 데에 이용할 수 있다.
위와 같은 방식으로 산출된 대용량 미가공 데이터는 디지털 처리가 되어 데이터 제공 장치의 데이터베이스 그룹(330)에 저장되며, 사용자의 요청에 따라서 추가로 가공되어 사용자에게 제공될 수 있다.
인체 종양 조직(A1)의 대용량 미가공 데이터(A2-1, A3-1, A4-1, A5-1)는 각 소규모 데이터베이스(331, 333, 335, 337)에 포함된 각 미가공 데이터에 대응되는 가공처리부(3311, 3331, 3351, 3371)에 의해 가공처리되어 대용량 가공 데이터(A2-2, A3-2, A4-2, A5-2)가 될 수 있다. 예를 들어, 인체 종양 조직(A1)의 대용량 가공 데이터(A2-2, A3-2, A4-2, A5-2)에는, 항암제 개발 데이터, 항암제 리포지셔닝(Repositioning) 데이터, 인체 종양 진단 데이터, 바이오마커(biomarker)가 포함될 수 있다.
전술한 것과 같이 대용량 가공 데이터는 사용자의 요청에 따라 사용자에게 제공된 후에는 소규모 데이터베이스에서 삭제될 수 있다. 또한, 도 3은 미가공 데이터와 가공 데이터의 설명의 편의를 위해서 데이터 제공 장치의 데이터를 인체 종양 조직에 대한 데이터로 한정한 것이므로, 도 3에서 인체 종양 조직에 대한 데이터는 다른 종류의 데이터로도 변경적용이 가능하다.
도 4는 본 발명의 다른 일 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.
사용자 단말(410)은 데이터 제공 장치(430)에 데이터 요청을 송신한다(S410). 데이터 제공 장치(430)는 데이터 요청에 포함된 조건을 기초로 데이터 속성을 결정한다(S420).
데이터 속성은 데이터 요청에 포함된 조건을 기초로 결정되며, 데이터 요청에 포함된 각각의 조건을 특징값(feature)으로 하는 하나 이상의 값으로 결정될 수 있다. 최종적으로 제공할 데이터 속성은 테이블 형태가 될 수 있다.
데이터 제공 장치(430)는 데이터 속성에 대응되는 데이터를 검색한다(S430). S430의 동작은 데이터 검색부와 동일하므로, 상세한 설명을 생략한다.
데이터 제공 장치(430)는 검색된 데이터의 메타데이터로 데이터의 가격을 결정한다(S440). S440의 동작은 가격 결정부와 동일하므로, 상세한 설명을 생략한다.
데이터 제공 장치(430)는 데이터 및 데이터의 가격을 포함하는 표시 정보를 사용자 단말(410)로 제공한다(S450).
도 5는 본 발명의 또 다른 일 실시 예에 따른 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.
사용자 단말(510)은 데이터 제공 장치(530)에 데이터 요청을 송신한다(S505). 데이터 제공 장치(430)는 데이터 요청에 포함된 조건을 기초로 데이터 속성을 결정한다(S510).
데이터 요청에 포함된 조건은 사용자가 요청한 데이터의 대상물질, 종류, 처리방법의 종류, 생성 시기, 사용자가 결제할 수 있는 데이터의 가격범위, 총 한도 금액 중 적어도 하나를 포함할 수 있다.
데이터 속성은 데이터 요청에 포함된 조건을 기초로 결정되며, 데이터 요청에 포함된 각각의 조건을 특징값(feature)으로 하는 테이블 형태가 될 수 있다.
데이터 제공 장치(530)는 데이터 속성에 대응되는 데이터를 검색한다(S515). 데이터 제공 장치(530)는 검색된 데이터의 메타데이터로 가격을 결정하고 결정된 가격을 차등적으로 조정할 수 있다(S520).
검색된 데이터의 메타데이터에는 데이터 생성자에 대한 정보, 데이터 생성에 필요한 시간, 데이터 생성에 필요한 자원이 포함될 수 있고, 데이터 생성자에 대한 정보에는 데이터 생성자의 데이터 생성 당시의 지위와 현재의 지위가 포함될 수 있다. 데이터 제공 장치(530)는 데이터의 메타데이터 중 하나만으로 가격을 결정할 수도 있다. 예를 들어, 데이터의 생성자의 생성시 지위만을 고려하여 데이터의 가격을 결정할 수 있다.
여기서, 생성자의 지위는 생성자의 최종학력, 생성자의 전공, 생성자의 직업, 생성자의 누적 논문수, 생성자의 수상 경력을 포함하거나, 생성자의 최종학력, 생성자의 전공, 생성자의 직업, 생성자의 누적 논문수, 생성자의 수상 경력 등을 종합하여 산출된 하나의 등급이 될 수도 있다.
단계 520에서 데이터를 요청한 사용자와 데이터를 생성한 생성자가 동일하거나, 데이터를 요청한 사용자가 데이터를 생성하는 데에 기여했다면, 그 내용을 반영하여 데이터의 가격은 낮은 가격으로 조정될 수 있다.
선택적 실시 예로서, 단계 520에서 생성자에 대한 정보에는 레벨 정보가 포함될 수 있다. 생성자의 레벨 정보는 생성자가 생성한 데이터의 수, 생성자가 생성한 데이터의 누적 판매량, 생성자가 생성한 데이터로부터의 수입 중 적어도 하나를 고려하여 결정될 수 있다. 높은 레벨의 생성자는 본 발명에 따른 데이터 제공 장치에 데이터를 생성하여 업로드하면 업로드된 데이터가 높은 판매가격으로 결정되거나, 데이터 제공 장치로부터 데이터를 제공받을 때에 일정비율 할인을 받을 수 있는 것과 같은 혜택을 누릴 수 있다.
데이터 제공 장치(530)는 단계 520에서 최종 결정된 가격과 사용자가 입력한 결제가능한 금액을 비교하여 사용자 단말에 제공할 데이터를 결정할 수 있다(S525).
데이터 제공 장치(530)는 데이터 및 데이터의 가격을 포함한 표시 정보를 사용자 단말(510)에 제공할 수 있다(S530).
사용자는 사용자 단말(510)을 통해 표시 정보를 확인하고, 데이터를 구매하기로 결정한 후, 결제 정보를 사용자 단말(510)을 통해 데이터 제공 장치(530)로 전송할 수 있다(S535).
데이터 제공 장치(530)는 사용자 단말(510)로부터 수신한 결제 정보의 진위를 확인하고, 결제를 승인할 수 있다(S540).
데이터 제공 장치(530)는 사용자가 요청한 데이터를 어떤 방식으로 제공할 지 결정한다(S545).
사용자가 유무선 네트워크를 통해 사용자 단말(510)로 데이터를 전송할 것을 요청하거나, 사용자가 요청한 데이터의 용량이 미리 설정된 기준용량을 초과하지 않으면, 데이터 제공 장치(530)는 사용자 단말(510)로 사용자가 요청한 데이터를 전송한다(S550).
사용자가 보안 등을 이유로 유무선 네트워크를 통해 사용자 단말(510)로 데이터를 전송하지 않을 것을 요청하거나, 사용자가 요청한 데이터의 용량이 미리 설정된 기준용량을 초과하면, 데이터 제공 장치(530)는 사용자에게 배송할 하드디스크에 데이터를 압축 및 암호화하여 전송한다(S555). 단계 555에서, 사용자가 요청한 데이터를 저장하고 있는 하드디스크가 오프라인으로 사용자에게 직접 전달됨으로써, 사용자는 데이터 제공 장치(530)에 요청한 데이터를 제공받을 수 있다.
도 6은 본 발명의 또 다른 일 실시 예에 따른 질병 기전 연구를 위한 데이터 제공 장치를 기준으로 한 데이터 제공 방법에 대한 흐름도를 도시한 도면이다.
전술한 도 4 및 도 5과 대비하기 위해, 도 6에서는 데이터 제공 장치를 기준으로 하여 데이터 제공 방법을 설명한다.
데이터 제공 장치는 사용자 단말로부터 데이터 요청을 수신한다(S610).
데이터 제공 장치는 데이터 요청에 포함된 조건을 기초로 데이터 속성을 결정한다(S620). 데이터 요청에 포함된 조건은 사용자가 요청한 데이터의 대상물질, 종류, 처리방법의 종류, 생성 시기, 사용자가 결제할 수 있는 데이터의 가격범위, 총 한도 금액 중 적어도 하나를 포함할 수 있다.
데이터 제공 장치는 데이터 속성에 대응되는 데이터를 검색한다(S630).
데이터 제공 장치는 검색된 데이터의 메타데이터로 가격을 결정하고 결정된 가격을 차등적으로 조정할 수 있다(S640).
검색된 데이터의 메타데이터에는 데이터 생성자에 대한 정보, 데이터 생성에 필요한 시간, 데이터 생성에 필요한 자원이 포함될 수 있고, 데이터 생성자에 대한 정보에는 데이터 생성자의 데이터 생성 당시의 지위와 현재의 지위가 포함될 수 있다. 단계 640에서 데이터를 요청한 사용자와 데이터를 생성한 생성자가 동일하거나, 데이터를 요청한 사용자가 데이터를 생성하는 데에 기여했다면, 그 내용을 반영하여 데이터의 가격은 낮은 가격으로 조정될 수 있다. 또한, 선택적 실시 예로서, 단계 640에서 생성자에 대한 정보에는 레벨 정보가 포함될 수 있어, 높은 레벨의 생성자가 데이터 구매에 있어서 할인 혜택을 받을 수 있도록 할 수 있다.
데이터 제공 장치는 단계 640에서 최종 결정된 가격과 사용자가 입력한 결제가능한 금액을 비교하여 사용자 단말에 제공할 데이터를 결정할 수 있다(S650).
데이터 제공 장치는 데이터 및 데이터의 가격을 포함한 표시 정보를 사용자 단말에 제공할 수 있다(S660). 단계 660에서 데이터 제공 장치는 표시 정보를 사용자 단말에 제공함과 동시에 전자상 결제를 요청할 수도 있다.
데이터 제공 장치는 사용자 단말로부터 결제 정보를 수신하여, 결제가 적법한 절차를 거쳐 이루어졌는지 여부를 확인한다(S670).
데이터 제공 장치는 사용자가 원하는 제공 방법에 따라 사용자가 요청한 데이터를 제공한다(S680). 단계 680에서 데이터 제공 장치는 사용자가 요청한 데이터를 사용자가 원하는 제공 방법 외에 사용자가 요청한 데이터의 크기도 함께 고려하여 사용자가 요청한 데이터를 제공할 수도 있다.
예를 들어, 사용자가 유무선 네트워크를 통해 사용자 단말로 데이터를 전송할 것을 요청하거나, 사용자가 요청한 데이터의 용량이 미리 설정된 기준용량을 초과하지 않으면, 데이터 제공 장치는 사용자 단말로 사용자가 요청한 데이터를 전송할 수 있다.
다른 예로서, 사용자가 보안 등을 이유로 유무선 네트워크를 통해 사용자 단말로 데이터를 전송하지 않을 것을 요청하거나, 사용자가 요청한 데이터의 용량이 미리 설정된 기준용량을 초과하면, 데이터 제공 장치는 사용자에게 배송할 하드디스크에 데이터를 압축 및 암호화하여 전송할 수 있다. 단계 680에서, 사용자가 요청한 데이터를 저장하고 있는 하드디스크가 오프라인으로 사용자에게 직접 전달됨으로써, 사용자는 데이터 제공 장치에 요청한 데이터를 제공받을 수 있게 된다.
도 7은 생체 세포로부터 데이터를 생성하는 과정을 설명하기 위한 도면이다.
데이터 제공 장치(200)는 대상체(object)의 생체 세포(D1)로부터 획득된 생물학적 데이터를 제1 레코드(R1)로 생성할 수 있다. 데이터 제공 장치(200)는 대상체(object)에 대한 병리학적 데이터(D2)를 제2 레코드(R2)로 생성할 수 있다.
대상체와 대응되는 생물학적 데이터의 레코드(R1)은 세포를 소정의 처리 방법으로 처리하여 획득되는 데이터로서, 유전자들의 배열 및 각 유전자의 발현 정도, 발현 여부, 돌연변이 발생 여부 등을 포함할 수 있다. 여기서, 처리 방법의 예시로는 유전체학 기법인 전유전체 염기서열분석(WGS, Whole Genome Sequencing)나 전엑솜 염기서열분석(WES, Whole Exome Sequencing), 마이크로어레이(Microarray)나 알엔에이 염기서열분석(RNA Sequencing), 말디토프(MALDI-TOF, Matrix-Assisted Laser Desorption-Ionization Time Of Flight), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 대사체학 기법인 핵자기공명-질량분석(NMR-MS, Nuclear Magnetic Resonance-Mass Spectrometry), 액체 크로마토그래피-질량 분석(LC-MS, Liquid Chromatography-Mass Spectrometry), 가스 크로마토그래피-질량 분석(GC-MS, Gas Chromatography-Mass Spectrometry) 등이 있을 수 있다. 즉, 도 7에 도시된 바와 같이, 제1 레코드(R1)는 상기 생체 세포로부터 획득된 유전자들의 배열 정보(op1-1), 각 유전자의 발현 정도(op1-2), 발현 여부(op1-3), 돌연변이 존재 여부(op1-4) 등을 포함할 수 있다. 대상체의 생체 세포는 종에 따라 동일한 유전자 배열을 가지게 된다. 대상체의 유전적 특성은 달라지므로, 각 유전자의 발현 여부 및 발현 정도는 달라지게 된다. 제1 레코드(R1)는 유전체의 이름, 유전체 내 위치, 원래 값, 변경 값, 변이 타입, 엑손 내 위치, 유전자의 특이 사항 등을 포함할 수 있다. 원래 값은 해당 유전체의 염기 서열의 값에 대한 것으로, 정상인의 염기 서열을 의미한다. 변경 값은 대상체의 염기 서열을 의미한다. 제1 레코드(R1)는 정상인의 염기 서열과 대상체의 염기 서열 사이에 차이가 있으면서, 표현되는 단백질에도 차이가 나는 정보를 더 포함할 수 있다. 여기서, 변이 타입은 염기 서열 중 일부 염기 서열의 제거, 변경, 삽입 중 하나를 말하며, 염기 서열이 변경되더라도 발현되는 단백질에 차이가 없는 경우는 염기 서열이 변이되지 않은 것으로 볼 수 있다. 제2 레코드(R2)는 상기 대상체와 관련된 질병, 질환 등의 병리학적 데이터를 포함하며, 대상체와 관련하여 생성된 각 항목의 생성 시점(op2-1) 및 각 항목에 대한 상세 정보(op2-2)를 포함할 수 있다. 또한, 제2 레코드(R2)는 대상체와 관련된 질병에 대한 처방, 치료 내역을 제공하면서, 해당 처방, 치료 내역을 통해 획득되어진 결과, 예후와 관련된 정보를 더 포함할 수 있다. 제2 레코드(R2)는 의료 기관(병원, 약국 등)의 서버로부터 획득되어지는 데이터를 포함하게 된다.
도 8 및 도 9는 본 발명의 실시예들에 따른 질병 기전 연구를 위한 데이터 제공 방법의 흐름도들이다.
도 8을 참조하면, 본 발명의 실시예들에 따른 데이터 제공 방법은 데이터 수집 단계(S801), 데이터 1차 분석 단계(S802), 방법 선택 단계(S803), 데이터 획득 단계(S804), 레코드 생성 단계(S805)를 포함할 수 있다.
S801에서는 데이터 제공 장치(200)는 하나 이상의 대상체로부터 획득된 생체 세포 및 상기 하나 이상의 대상체에 대한 병리학적 데이터를 수집할 수 있다. 여기서, 대상체는 사람, 동물, 식물 등과 같은 생물을 말하며, 여기서, 생체 세포는 대상체로부터 획득된 세포로서, 종류를 불문한 모든 세포들을 포함할 수 있다. 여기서, 병리학적 데이터는 상기 대상체와 관련된 질병, 질환 등에 대한 것으로, 상기 대상체의 진단, 진료, 치료, 경과 등을 종합적으로 포함하는 데이터일 수 있다.
S802에서는 데이터 제공 장치(200)는 상기 생체 세포를 1차적으로 분석할 수 있다. 이때, 생체 세포의 양을 고려하여, 데이터 제공 장치(200)는 상기 생체 세포를 유전체 데이터, 전사체 데이터를 획득할 수 있도록 1차적으로 처리할 수 있다. 데이터 제공 장치(200)는 유전체의 염기 변이를 확인할 수 있는 유전체 데이터를 획득하기 위한 처리 방법, 유전체의 발현 여부를 확인할 수 있는 전사체 데이터를 획득하기 위한 처리 방법을 이용하여, 상기 생체 세포를 분석할 수 있다. 데이터 제공 장치(200)는 생체 세포의 외관, 생체 세포의 크기, 보관 상태, 대상체의 병리학적 데이터 등을 고려하여, 생체 세포를 분석할 수 있다. 데이터 제공 장치(200)는 생체 세포에 소정의 처리를 함으로써, 생체 세포를 1차적으로 분석할 수 있다. 예를 들어, 데이터 제공 장치(200)는 생체 세포에 포함된 DNA에 열을 가하여, 이중 나선의 DNA를 단일 가닥으로 처리함으로써, 생체 세포를 1차적으로 분석할 수 있다. 데이터 제공 장치(200)는 소량의 DNA를 염기 순서가 동일한 양의 DNA로 증폭시킴으로써, 생체 세포를 1차적으로 분석할 수 있다.
S803에서는 데이터 제공 장치(200)는 상기 1차적으로 분석한 결과를 이용하여, 상기 생체 세포를 처리하는 처리 방법을 선택할 수 있다. 이때, 처리 방법은 하나 이상일 수 있다. 이때, 처리 방법의 선택 기준은 가격, 시간, 획득하고자 하는 데이터에 따라 달라질 수 있다.
생체 세포는 그 자체로 의미 있는 데이터가 될 수 없으므로, 의미 있는 데이터가 되기 위해서는 생체 세포를 처리하는 과정이 필요하다. 생체 세포는 시퀀싱(sequencing)을 통해 처리될 수 있다. DNA 시퀀싱(sequencing)의 종류는 다양하며, 각 시퀀싱을 처리하는데 필요한 비용, 시간 등은 다양하다.
데이터 제공 장치(200)는 생체 세포를 분석하여, 생체 세포와 관련된 조직, 기관 등을 추출할 수 있다. 데이터 제공 장치(200)는 생체 세포와 관련된 조직, 기관의 종류, 보관 상태, 크기 등을 고려하여, 생체 세포의 처리 방법을 결정할 수 있다.
데이터 제공 장치(200)는 생체 세포의 대상체의 병리학적 데이터를 이용하여 상기 생체 세포를 처리할 처리 방법을 결정할 수도 있다. 데이터 제공 장치(200)는 생체 세포의 대상체의 종(species)에 따라 상기 생체 세포의 처리 방법을 결정할 수 있다. 생체 세포의 대상체의 종은 생체 세포를 분석하거나 관리자에 의해 결정될 수 있다.
데이터 제공 장치(200)는 생체 세포의 대상체에 대한 기타 정보(성별, 나이, 연령, 서식지, 주거지 등)를 이용하여 상기 생체 세포를 처리할 처리 방법을 결정할 수 있다.
S804에서는 데이터 제공 장치(200)는 상기 처리 방법으로 상기 생체 세포를 처리함으로써, 상기 생체 세포의 제1 대상체의 유전자들의 배열(gene alignment) 및 각 유전자의 발현 정도를 상기 생체 세포와 대응되는 생물학적 데이터로 획득할 수 있다. 데이터 제공 장치(200)는 생체 세포의 대상체의 종에 따라 대상체의 유전자들의 배열을 결정할 수 있다. 예를 들어, 생체 세포의 대상체가 사람인 경우, 데이터 제공 장치(200)는 사람의 유전자 배열에 따라 상기 생체 세포의 대상체에 포함된 유전자들을 분류하고, 분류된 정보를 생물학적 데이터로 생성할 수 있다. 추가적으로, 데이터 제공 장치(200)는 생체 세포를 분석하여, 각 유전자의 발현 여부 또는 돌연변이 여부도 추가적으로 획득할 수 있다.
S805에서는 데이터 제공 장치(200)는 상기 생물학적 데이터 및 상기 병리학적 데이터를 각각의 레코드로 생성하여 저장하고, 상기 제1 대상체와 대응되는 레코드 및 상기 생물학적 데이터의 레코드를 연결 시키고, 상기 제1 대상체와 대응되는 레코드 및 상기 병리학적 데이터의 레코드를 연결 시켜 저장할 수 있다. 여기서, 생물학적 데이터의 레코드는 2개 이상의 행을 가지는 배열(array)의 형태로 구성되며, 유전자의 종류 및 각 유전자의 발현 정도에 해당하는 데이터들을 포함할 수 있다. 병리학적 데이터의 레코드 역시 2개 이상의 행을 가지는 배열의 형태로 구성되며, 시간 순으로 정렬되거나 동일한 질병 또는 질환으로 분류될 수 있다.
도 9를 참조하면, 본 발명의 실시예들에 따른 데이터 제공 방법은 검색 요청 수신 단계(S901), 유전자의 종류를 추출하는 단계(S902), 데이터 검색 단계(S903), 대상체 및 레코드 검색 단계(S904), 데이터 제공 단계(S905), 청구 금액 결정 단계(S906), 상기 청구 금액에 대한 결제 처리 수행 단계(S907)를 포함할 수 있다.
S901에서는 데이터 제공 장치(200)는 사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신 받는다. 검색 요청은 다양한 사용자 입력을 통해 수신되며, 병리학적 데이터 뿐만 아니라 생물학적 데이터도 포함할 수 있다.
S902에서는 데이터 제공 장치(200)는 상기 제1 병리학적 데이터와 관련된 유전자의 종류를 추출한다. 데이터 제공 장치(200)는 병리학적 데이터인 위암과 관련된 유전자의 종류를 추출한다. 병리학적 데이터의 종류에 따라 관련된 유전자의 종류는 달라진다.
S903에서는 데이터 제공 장치(200)는 상기 제1 병리학적 데이터와 관련된 상기 유전자의 종류에 포함되는 각 유전자의 발현 정도를 검색하고, 각 유전자의 발현 정도로 발현된 생물학적 데이터를 검색한다.
S904에서는 데이터 제공 장치(200)는 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색한다. 이때, 데이터 제공 장치(300)는 검색된 데이터 중에서, 이상, 장애, 변이 등을 가장 많이 포함하고 있는 생물학적 데이터 및/또는 병리학적 데이터를 보유한 대상체를 추출할 수 있다. 또는 데이터 제공 장치(200)는 검색된 데이터 중에서, 과거의 대상체의 상태 및 현재 대상체의 상태 사이의 차이가 가장 크고, 현재 대상체의 상태가 완치인 대상체를 추출하고, 상기 대상체의 생물학적 데이터 및/또는 병리학적 데이터를 추출할 수 있다.
S905에서는 데이터 제공 장치(200)는 상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로 제공한다.
S906에서는 데이터 제공 장치(200)는 상기 제2 생물학적 데이터의 적정성 또는 상기 제2 병리학적 데이터의 완전성을 기초로 상기 사용자에게 청구할 청구 금액을 결정한다.
S907에서는 데이터 제공 장치(200)는 상기 청구 금액에 대한 결제 처리를 사용자의 단말로 전송한다.
도 10은 본 발명의 실시예들에 따른 질병 기전 연구를 위한 데이터 제공 장치(200)에 포함될 수 있는 데이터 생성부(201)의 구조를 나타내는 블록도이다.
도 10을 참조하면, 데이터 생성부(201)는 데이터 수집부(202), 1차 분석부(203), 처리 방법 선택부(204), 데이터 획득부(205), 데이터 처리부(206)를 포함할 수 있다.
데이터 수집부(202)는 하나 이상의 사용자로부터 하나 이상의 대상체와 관련된 데이터를 수집한다. 데이터 수집부(202)는 하나 이상의 대상체로부터 획득된 생체 세포를 수집할 수 있으며, 각 대상체에 대한 병리학적 데이터를 수집할 수 있다.
1차 분석부(203)는 상기 각 대상체의 생체 세포를 1차적으로 분석한다.
처리 방법 선택부(204)는 상기 1차적 분석 결과를 이용하여 각 대상체를 처리하는 처리 방법을 선택한다.
데이터 획득부(205)는 상기 1차적으로 분석한 결과를 이용하여, 상기 생체 세포를 처리하는 처리 방법을 선택하고, 상기 처리 방법으로 상기 생체 세포를 처리함으로써, 상기 생체 세포의 제1 대상체의 유전자들의 배열 및 각 유전자의 발현 정도를 상기 생체 세포와 대응되는 생물학적 데이터로 획득할 수 있다.
데이터 처리부(206)는 상기 생물학적 데이터 및 상기 병리학적 데이터를 각각의 레코드로 생성하여 저장하고, 상기 제1 대상체와 대응되는 레코드 및 상기 생물학적 데이터의 레코드를 연결시키고, 상기 제1 대상체와 대응되는 레코드 및 상기 병리학적 데이터의 레코드를 연결 시켜 저장할 수 있다.
상기 생물학적 데이터의 레코드는 2 이상의 행을 가지는 배열의 형태로 유전자 배열, 유전자의 발현 정도에 해당하는 데이터들을 포함할 수 있다.
상기 병리학적 데이터는 상기 제1 대상체의 진료 내역, 상기 제1 대상체의 치료 내역, 상기 제1 대상체의 진단 내역 중 적어도 하나를 포함할 수 있다. 또한, 병리학적 데이터는 제1 대상체의 체질, 건강 정도, 성별, 직업, 유전적 가족력 등을 더 포함할 수 있다.
또 다른 실시예에서, 데이터 요청 수신부(210)는 사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신할 수 있다. 수신한 검색 요청을 처리하기 위해서, 데이터 검색부(230)는 상기 제1 병리학적 데이터와 관련된 유전자의 종류를 추출할 수 있고, 상기 제1 병리학적 데이터와 관련된 상기 유전자의 종류에 포함되는 각 유전자의 발현 정도를 검색하고, 각 유전자의 발현 정도로 발현된 생물학적 데이터를 검색할 수 있다. 또한, 데이터 검색부(230)는 상기 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색할 수 있다. 데이터 제공부(260)는 상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로 제공할 수 있다. 또한, 데이터 제공부(260)는 상기 제2 생물학적 데이터의 적정성 또는 상기 제2 병리학적 데이터의 완전성을 기초로 상기 사용자에게 청구할 청구 금액을 결정하고, 상기 청구 금액에 대한 결제 처리를 상기 사용자의 단말로 전송할 수 있다.
상기 제2 생물학적 데이터의 적정성은 생체 세포의 원시적 요인, 추출시 발생되는 요인, 보관시 발생되는 요인 중 적어도 하나를 통하여 결정될 수 있다. 좀더 구체적으로 살펴보면, 상기 제2 생물학적 데이터의 적정성은 생체 세포의 크기, 양이 클수록 커질 수 있다. 생체 세포가 클수록 추출할 수 있는 DNA의 양도 크기 때문이다. 상기 제2 생물학적 데이터의 적정성은 생체 세포가 불순물을 적게 포함할수록 커질 수 있다. 제2 생물학적 데이터의 적정성은 생체 세포의 보관 상태로 결정될 수 있다. 적정한 조건으로 보관된 생체 세포로부터 획득된 제2 생물학적 데이터의 적정성은 올라간다. 또한, 제2 생물학적 데이터의 적정성은 상기 제2 생물학적 데이터의 처리 방법의 정확성, 생체 세포의 상태, 생체 세포의 추출시 파괴 정도, 생체 세포의 보관시 변질 정도, 생체 세포의 처리자의 숙련 정도로 결정될 수 있다. 상기 제2 생물학적 데이터의 처리 방법의 정확성을 기초로 설정, 산출, 측정될 수 있다. 예를 들어, 제2 생물학적 데이터의 처리 방법이 최신에 출시된 방법인지 여부, 세계적으로 권위 있는 학술 논문지에 소개되었거나, 논문에 인용된 횟수, 논문에 게재된 횟수 중 적어도 하나를 고려하여, 결정될 수 있다. 또한, 제2 생물학적 데이터의 적정성은 생체 세포가 채취, 채집, 획득된 기관의 종류를 통해서 결정될 수 있다. 생체 세포가 채취, 채집, 획득된 기관이 대상체의 병리학적 데이터와의 관련성을 고려하여 상기 제2 생물학적 데이터의 적정성은 결정될 수 있다. 즉, 병리학적 데이터에 포함된 기관, 즉 질병, 질환이 있는 기관에 대한 생체 세포에 대한 생물학적 데이터의 적정성은 질병, 질환 등의 연구를 위해서 활발히 이용될 수 있기 때문에 그렇지 않은 경우보다 높게 설정될 수 있다. 생체 세포에 대한 생물학적 데이터의 적정성은 생체 세포의 채집 기관, 채집 시기, 채집된 크기 등을 고려하여 결정될 수 있다. 생체 세포의 생물학적 데이터의 적정성은 생체 세포의 채집 기관이 질병, 질환의 원인이 되는 기관인지 여부, 채집 시기가 질병, 질환의 발생 시기인지 여부, 채집된 크기 중 적어도 하나를 고려하여 결정될 수 있다. 즉, 생물학적 데이터의 적정성은 채집된 크기가 미리 설정된 크기 이상인 경우, 있다고 결정될 수 있다.
생체 세포의 상태가 매우 좋을 수록, 미리 설정된 임계 상태를 초과할 경우, 생체 세포가 추출시 파괴되지 않을 수록, 미리 설정된 파괴율을 초과하지 않는 경우, 생체 세포가 보관시 변질되지 않을수록, 즉 미리 설정된 보관율을 초과하는 경우, 생체 세포의 처리자의 숙련도가 높을수록, 즉 미리 설정된 경력 이상을 가지는 경우, 제2 생물학적 데이터의 적정성은 매우 높게 설정될 수 있다.
상기 제2 병리학적 데이터의 완전성은 상기 제2 병리학적 데이터의 최초 입력 시점 및 최후 입력 시점 사이의 시간 차와 비례하여 설정될 수 있다. 제2 병리학적 데이터는 대상체의 진료, 진단, 치료 내역 등을 통해서 획득되어지는 사회적인 데이터를 말하며, 진료, 진단, 치료 내역을 입력한 의료진에 대한 정보도 포함할 수 있다. 제2 병리학적 데이터의 완전성은 대상체의 수명, 나이를 고려하여 결정될 수 있다. 즉, 대상체의 수명 만큼의 시간 동안 축적된 제2 병리학적 데이터의 완전성은 매우 높게 설정되고, 대상체의 수명에 턱없이 부족한 시간 동안, 예를 들어 수명의 10프로 미만의 시간 동안 축적된 제2 병리학적 데이터의 완전성은 매우 낮게 설정될 수 있다. 특히, 제2 병리학적 데이터의 완전성은 제2 병리학적 데이터의 최초 입력 시점 및 최후 입력 시점 사이의 시간 차와 비례 하여 설정될 수 있으며, 상기 시간 차가 소정의 임계 시간, 즉 대상체의 수명 또는 나이를 초과하는 경우, 거의 완전하다고 볼 수 있도록 자연수 1 또는 100으로 설정될 수 있다. 또한, 제2 병리학적 데이터를 생성한 사용자에 대한 정보를 고려하여, 상기 제2 병리학적 데이터의 완전성은 설정될 수 있다. 제2 병리학적 데이터의 완전성은 상기 제2 병리학적 데이터의 작성자 또는 생성자의 직업이 의료부분 종사자인지 여부 및 상기 제2 병리학적 데이터의 작성자 또는 생성자의 경력의 길이를 고려하여 산출될 수 있다. 제2 병리학적 데이터의 완전성은 제2 병리학적 데이터의 작성자 또는 생성자의 직업이 의료 부분인 경우, 또는 제2 병리학적 데이터의 작성자 또는 생성자의 경력의 길이가 길수록 높게 설정될 수 있다. 또한, 제2 병리학적 데이터의 완전성은 제2 병리학적 데이터의 대상체의 최종적인 상태를 고려하여 결정될 수 있다. 대상체의 현재 상태가 완치 상태라면, 상기 제2 병리학적 데이터의 완전성은 매우 높게 결정될 수 있다.
본 발명의 실시예들에 따른 데이터 제공 장치(200)는 제공되는 데이터가 가지는 경제적 사회적 가치를 측정할 수 있게 된다. 또한, 이를 통해, 동일한 대상체라 하더라도, 처리 방법 또는 생성자에 따라서 대상체의 생물학적 데이터 및 대상체의 병리학적 데이터는 변경될 수 있다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
본 발명은 상술한 실시형태 및 첨부된 도면에 의해 한정되지 아니하고, 첨부된 청구범위에 의해 권리범위를 한정하고자 하며, 청구범위에 기재된 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 다양한 형태의 치환, 변형 및 변경할 수 있다는 것은 당 기술분야의 통상의 지식을 가진 자에게 자명할 것이다.
200 : 데이터 제공 장치 260 : 데이터 제공부
210 : 데이터 요청 수신부 261 : 선택적 제공부
220 : 데이터 속성 결정부 270 : 사용자 단말
230 : 데이터 검색부 280 : 생성자 단말
240 : 데이터베이스 그룹 290 : 운영자 단말
250 : 가격 결정부

Claims (11)

  1. 데이터 제공 장치가 하나 이상의 대상체로부터 획득된 생체 세포 및 상기 하나 이상의 대상체에 대한 병리학적 데이터를 수집하는 단계;
    상기 데이터 제공 장치가 상기 생체 세포를 1차적으로 분석 또는 처리하는 단계;
    상기 데이터 제공 장치가 상기 1차적으로 분석 또는 처리한 결과를 이용하여, 상기 생체 세포를 처리하는 처리 방법을 선택하고, 상기 처리 방법으로 상기 생체 세포를 처리함으로써, 상기 생체 세포의 제1 대상체의 유전자들의 배열(gene alignment) 및 각 유전자의 발현 정도를 상기 생체 세포와 대응되는 생물학적 데이터로 획득하는 단계;
    상기 데이터 제공 장치가 상기 생물학적 데이터 및 상기 병리학적 데이터를 각각의 레코드로 생성하여 저장하고, 상기 제1 대상체와 대응되는 레코드 및 상기 생물학적 데이터의 레코드를 연결 시키고, 상기 제1 대상체와 대응되는 레코드 및 상기 병리학적 데이터의 레코드를 연결 시켜 저장하는 단계;를 포함하는 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법.
  2. 제1항에 있어서,
    상기 생물학적 데이터의 레코드는
    2 이상의 행을 가지는 배열(array)의 형태로, 유전자 배열, 및 유전자의 발현 정도에 해당하는 데이터들을 포함하는, 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법.
  3. 제1항에 있어서,
    상기 병리학적 데이터는
    상기 제1 대상체의 진료 내역, 상기 제1 대상체의 치료 내역, 상기 제1 대상체의 진단 내역 중 적어도 하나를 포함하는, 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법.
  4. 제1항에 있어서,
    상기 데이터 제공 장치가 사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신 받는 단계;
    상기 데이터 제공 장치가 상기 제1 병리학적 데이터와 관련된 유전자의 종류를 추출하는 단계;
    상기 데이터 제공 장치가 상기 제1 병리학적 데이터와 관련된 상기 유전자의 종류에 포함되는 각 유전자의 발현 정도를 검색하고, 각 유전자의 발현 정도로 발현된 생물학적 데이터를 검색하는 단계;
    상기 데이터 제공 장치가 상기 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색하는 단계;를 더 포함하는 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법.
  5. 제4항에 있어서,
    상기 제2 생물학적 데이터의 레코드 및 상기 제2 병리학적 데이터의 레코드를 상기 사용자의 단말로 제공하는 단계;를 더 포함하는 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법.
  6. 제5항에 있어서,
    상기 제2 생물학적 데이터의 적정성 또는 상기 제2 병리학적 데이터의 완전성을 기초로 상기 사용자에게 청구할 청구 금액을 결정하고, 상기 청구 금액에 대한 결제 처리를 상기 사용자의 단말로 전송하는 단계;를 더 포함하는, 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법.
  7. 제6항에 있어서,
    상기 제2 생물학적 데이터의 적정성은
    상기 제2 생물학적 데이터의 처리 방법의 정확성, 생체 세포의 상태, 생체 세포의 추출시 파괴 정도, 생체 세포의 보관시 변질 정도, 생체 세포의 처리자의 숙련 정도 중 적어도 하나를 기초로 설정되는, 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법.
  8. 제7항에 있어서,
    상기 제2 병리학적 데이터의 완전성은
    상기 제2 병리학적 데이터의 최초 입력 시점 및 최후 입력 시점 사이의 시간 차와 비례하여 설정되는, 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법.
  9. 제8항에 있어서,
    상기 제2 병리학적 데이터의 완전성은
    상기 시간 차가 소정의 임계 시간을 초과하는 경우, 자연수 '1' 또는 '100'으로 설정되는, 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 방법.
  10. 하나 이상의 대상체로부터 획득된 생체 세포 및 상기 하나 이상의 대상체에 대한 병리학적 데이터를 수집하는 데이터 수집부;
    상기 생체 세포를 1차적으로 분석 또는 처리하는 1차 분석부;
    상기 1차적으로 분석 또는 처리한 결과를 이용하여, 상기 생체 세포를 처리하는 처리 방법을 선택하고, 상기 처리 방법으로 상기 생체 세포를 처리함으로써, 상기 생체 세포의 제1 대상체의 유전자들의 배열(gene alignment) 및 각 유전자의 발현 정도를 상기 생체 세포와 대응되는 생물학적 데이터로 획득하는 데이터 획득부;
    상기 생물학적 데이터 및 상기 병리학적 데이터를 각각의 레코드로 생성하여 저장하고, 상기 제1 대상체와 대응되는 레코드 및 상기 생물학적 데이터의 레코드를 연결 시키고, 상기 제1 대상체와 대응되는 레코드 및 상기 병리학적 데이터의 레코드를 연결 시켜 저장하는 데이터 처리부;를 포함하는 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치.
  11. 제10항에 있어서,
    사용자로부터 제1 병리학적 데이터를 포함하는 검색 요청을 수신 받는 데이터 요청 수신부;
    상기 제1 병리학적 데이터와 관련된 유전자의 종류를 추출하는 데이터 속성 결정부;
    상기 제1 병리학적 데이터와 관련된 상기 유전자의 종류에 포함되는 각 유전자의 발현 정도를 검색하고, 각 유전자의 발현 정도로 발현된 생물학적 데이터를 검색하고, 상기 생물학적 데이터를 제공한 제2 대상체를 검색하고, 상기 제2 대상체와 대응되는 레코드와 연결된 제2 생물학적 데이터의 레코드 및 제2 병리학적 데이터의 레코드를 검색하는 데이터 검색부;를 더 포함하는 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치.
KR1020160045807A 2015-04-14 2016-04-14 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 및 방법 KR101870632B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020150052454 2015-04-14
KR20150052454 2015-04-14

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020180069060A Division KR101961438B1 (ko) 2015-04-14 2018-06-15 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 및 방법

Publications (2)

Publication Number Publication Date
KR20160122669A true KR20160122669A (ko) 2016-10-24
KR101870632B1 KR101870632B1 (ko) 2018-06-25

Family

ID=57256968

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020160045807A KR101870632B1 (ko) 2015-04-14 2016-04-14 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 및 방법
KR1020180069060A KR101961438B1 (ko) 2015-04-14 2018-06-15 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 및 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020180069060A KR101961438B1 (ko) 2015-04-14 2018-06-15 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 및 방법

Country Status (1)

Country Link
KR (2) KR101870632B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112132646A (zh) * 2020-08-27 2020-12-25 绿瘦健康产业集团有限公司 一种用户分流处理方法、装置、介质及终端设备
KR102535319B1 (ko) * 2022-09-02 2023-05-26 주식회사 메디클라우드 블록체인 기반 유전자 정보 거래 서비스 제공 방법, 장치 및 시스템

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200098189A (ko) 2019-02-12 2020-08-20 주식회사 꿀비 차세대 염기서열 분석 서비스 제공 시스템 및 그 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070081157A (ko) 2006-02-10 2007-08-16 (주)엔앤에스 유비쿼터스 네트워크를 이용한 유비쿼터스 유전자은행시스템 및 그 서비스 제공방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001325454A (ja) 2000-05-12 2001-11-22 Ntt Me Corp データ配信システムおよびデータ配信方法
US20070178458A1 (en) 2003-09-05 2007-08-02 O'brien Philippa Methods of diagnosis and prognosis of ovarian cancer II
JP2005222468A (ja) 2004-02-09 2005-08-18 Takuji Otani 著作物管理システム
CN106126881A (zh) 2008-03-26 2016-11-16 赛拉诺斯股份有限公司 表征对象的临床结果的计算机系统
KR20120063720A (ko) * 2010-12-08 2012-06-18 주식회사 펀진 복수 검색 시스템을 이용한 인터넷 복수 검색 방법
KR101261042B1 (ko) * 2011-02-23 2013-05-06 (주)터보소프트 개인 맞춤형 의료정보 판매 서비스 제공 방법
KR20150076310A (ko) * 2013-12-26 2015-07-07 주식회사 케이티 암 환자 맞춤형 소셜 네트워크 형성 방법 및 시스템

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070081157A (ko) 2006-02-10 2007-08-16 (주)엔앤에스 유비쿼터스 네트워크를 이용한 유비쿼터스 유전자은행시스템 및 그 서비스 제공방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112132646A (zh) * 2020-08-27 2020-12-25 绿瘦健康产业集团有限公司 一种用户分流处理方法、装置、介质及终端设备
CN112132646B (zh) * 2020-08-27 2023-04-25 广东壹健康健康产业集团股份有限公司 一种用户分流处理方法、装置、介质及终端设备
KR102535319B1 (ko) * 2022-09-02 2023-05-26 주식회사 메디클라우드 블록체인 기반 유전자 정보 거래 서비스 제공 방법, 장치 및 시스템
WO2024049265A1 (ko) * 2022-09-02 2024-03-07 주식회사 메디클라우드 블록체인 기반 유전자 정보 거래 서비스 제공 방법, 장치 및 시스템

Also Published As

Publication number Publication date
KR101961438B1 (ko) 2019-07-17
KR101870632B1 (ko) 2018-06-25
KR20180072625A (ko) 2018-06-29

Similar Documents

Publication Publication Date Title
Dillon et al. Exome sequencing has higher diagnostic yield compared to simulated disease-specific panels in children with suspected monogenic disorders
Monroe et al. Effectiveness of whole-exome sequencing and costs of the traditional diagnostic trajectory in children with intellectual disability
Clima et al. HmtDB 2016: data update, a better performing query system and human mitochondrial DNA haplogroup predictor
MacArthur et al. Locus Reference Genomic: reference sequences for the reporting of clinically relevant sequence variants
Frank et al. Genome sequencing: a systematic review of health economic evidence
US20150142465A1 (en) Pathway recognition algorithm using data integration on genomic models (paradigm)
KR101961438B1 (ko) 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 및 방법
Carroll et al. DNA reference alignment benchmarks based on tertiary structure of encoded proteins
Plöthner et al. Cost analysis of whole genome sequencing in German clinical practice
Chen et al. Comprehensive analysis of coding-lncRNA gene co-expression network uncovers conserved functional lncRNAs in zebrafish
US20220013195A1 (en) Systems and methods for access management and clustering of genomic or phenotype data
WO2022125806A1 (en) Predicting fractional flow reserve from electrocardiograms and patient records
Bourdon et al. RumimiR: a detailed microRNA database focused on ruminant species
JP2020156079A (ja) 生体データ提供方法、生体データ暗号化方法および生体データ処理装置
Ahmed et al. Advancing clinical genomics and precision medicine with GVViZ: FAIR bioinformatics platform for variable gene-disease annotation, visualization, and expression analysis
Thareja et al. Differences and commonalities in the genetic architecture of protein quantitative trait loci in European and Arab populations
CN106960133B (zh) 一种疾病预测方法及装置
WO2009153726A1 (en) A system method and computer program product for pedigree analysis
Shi et al. HUSCH: an integrated single-cell transcriptome atlas for human tissue gene expression visualization and analyses
Jegathisawaran et al. Trio genome sequencing for developmental delay and pediatric heart conditions: A comparative microcost analysis
Li et al. STellaris: a web server for accurate spatial mapping of single cells based on spatial transcriptomics data
Gelly et al. Protein Peeling 3D: new tools for analyzing protein structures
Labuzzetta et al. Complementary feature selection from alternative splicing events and gene expression for phenotype prediction
Poszewiecka et al. TADeus2: a web server facilitating the clinical diagnosis by pathogenicity assessment of structural variations disarranging 3D chromatin structure
JP2005004340A (ja) 情報処理装置および情報処理方法ならびに記憶媒体、プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant