KR20200058757A - 클라우드 기반 유전자 분석 서비스 방법 및 플랫폼 - Google Patents

클라우드 기반 유전자 분석 서비스 방법 및 플랫폼 Download PDF

Info

Publication number
KR20200058757A
KR20200058757A KR1020180143271A KR20180143271A KR20200058757A KR 20200058757 A KR20200058757 A KR 20200058757A KR 1020180143271 A KR1020180143271 A KR 1020180143271A KR 20180143271 A KR20180143271 A KR 20180143271A KR 20200058757 A KR20200058757 A KR 20200058757A
Authority
KR
South Korea
Prior art keywords
information
genome
analysis service
individual
genetic analysis
Prior art date
Application number
KR1020180143271A
Other languages
English (en)
Inventor
신영아
서승범
신필선
Original Assignee
(주) 아이크로진
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주) 아이크로진 filed Critical (주) 아이크로진
Priority to KR1020180143271A priority Critical patent/KR20200058757A/ko
Priority to US16/231,062 priority patent/US20200160935A1/en
Publication of KR20200058757A publication Critical patent/KR20200058757A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/33User authentication using certificates
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/40Encryption of genetic data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Public Health (AREA)
  • Genetics & Genomics (AREA)
  • Computer Security & Cryptography (AREA)
  • Molecular Biology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

클라우드 기반 유전자 분석 서비스 플랫폼이 개시된다. 본 플랫폼은 실험시설에 연결된 단말과 통신하는 통신 모듈, 개인 각각에 대응되는 유전체에 관한 정보의 생성을 통신 모듈을 통해 모니터링하는 컨트롤러 및 생성된 유전체에 관한 정보를 암호화하여 저장하는 저장부를 포함하며, 컨트롤러는, 유전체에 관한 정보 및 개인 각각의 표현형 정보에 기초한 분석을 수행한다. 이에 따라, 유전자 정보의 정보 보호가 효과적으로 수행될 수 있으며, 개인 맞춤형 서비스가 제공될 수 있다.

Description

클라우드 기반 유전자 분석 서비스 방법 및 플랫폼{SERVICE METHOD AND PLATFORM FOR ANALYSING GENE BASED ON CLOUD COMPUTING SYSTEM}
본 발명은 클라우드 컴퓨팅 시스템 기반의 유전자 분석 서비스 방법 및 플랫폼에 관한 것이다.
인간의 몸은 수많은 세포로 이루어져 있고, 세포는 핵을 가지고 있으며, 핵안의 염색체(chromosome)라는 물질에는 생명체의 유전정보를 저장하는 DNA(deoxyriboNucleic Acid)가 있다. DNA는 아데닌(A), 구아닌(G), 시토신(C), 티민(T)과 같은 특정 염기를 갖는 뉴클레오티드(nucleotide) 사슬로 구성되어 있다.
이 DNA는 생명체가 다음 세대로 자신의 유전 정보를 전달 할 수 있는 유전 전달 물질로써, 한 쌍의 염색체를 부모로부터 하나씩 받게 된다. 인간은 22쌍의 상동염색체(autosomal chromosome), 1쌍의 성염색체(sex chromosome)로 이루어진 총 23쌍을 가진다. 전체 염색체를 구성하는 DNA를 유전체(genome)라고 하며, 유전체(genome)중 특정 기능을 암호화 할 수 있는 영역(region)을 유전자라고 한다.
인간의 경우 유전체(genome) 서열(sequence)이 각 개인간에 99.9% 일치하지만 0.1%의 차이를 가진다. 0.1%의 염기서열 차이 중 대부분은 특정위치(locus)에서 한 염기서열(base pair)이 다른 염기로 치환이 된 것이며, 이러한 특정위치(locus)의 특징을 단일염기변이(SNP : Single Nucleotide Polymorphism, 이하 “SNP”로 칭함)라고 한다. 상기 SNP의 인구집단내의 빈도수로부터 유전적 거리, 개인의 질환, 형질, 특징의 차이가 분석될 수 있다.
살핀 바와 같이, 개개인마다 차이가 있는 상기 유전체 서열 정보는 개인을 고유하게 특정할 수 있을 뿐만 아니라, 상기 유전체 서열 정보에 기반하여 다양한 분석이 수행될 수 있다.
이에, 상기 유전체 서열 정보를 보다 안전하게 생성, 관리하는 방법이 필요하다 할 것이다.
한편, 상기와 같은 정보는 본 발명의 이해를 돕기 위한 백그라운드(background) 정보로서만 제시될 뿐이다. 상기 내용 중 어느 것이라도 본 발명에 관한 종래 기술로서 적용 가능할지 여부에 관해, 어떤 결정도 이루어지지 않았고, 또한 어떤 주장도 이루어지지 않는다.
공개특허공보 제10-2006-0059063호(공개일: 2006.6.1)
본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로, 본 발명의 일 실시 예는 클라우드 기반 유전자 분석 서비스 방법을 제안한다.
본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상기한 과제를 실현하기 위한 본 발명의 일 실시 예에 따른 프로세서에 의해 수행되는 유전자 분석 서비스 방법은 개인 각각에 대응되는 유전체에 관한 정보의 생성을 모니터링하는 단계; 생성된 상기 유전체에 관한 정보를 암호화하여 저장하는 단계; 및 상기 유전체에 관한 정보 및 상기 개인 각각의 표현형 정보에 기초한 분석을 수행하는 단계를 포함한다.
보다 구체적으로, 상기 방법은 유전체를 제공한 한명 이상의 오너(Owner), 상기 오너의 유전체에 관한 정보를 사용하려는 한명 이상의 유저 및 상기 플랫폼을 관리하는 한명 이상의 관리자 중 적어도 하나를 토큰 방식으로 인증하는 단계를 더 포함할 수 있다.
보다 구체적으로, 상기 유저 또는 관리자가 특정 오너의 유전체에 관한 정보를 조회 또는 사용하는 경우, 상기 특정 오너의 동의를 받는 단계를 더 포함할 수 있다.
보다 구체적으로, 상기 모니터링하는 단계는, 오너에 의해 제공된 유전체에서 DNA 를 추출하는 제1 단계, DNA 농도를 체크하는 제2 단계 및 유전자 실험을 통해 인간 변이체 정보를 생산하는 제3 단계를 모니터링하는 단계를 포함하며, 상기 유전자 분석 서비스 방법은, 공개키로 암호화된 인간 변이체 정보를 개인키로 복호화하는 단계를 더 포함할 수 있다.
보다 구체적으로, 상기 인간 변이체 정보는, SNP(Single Nucleotide Polymorphism) 정보, Short Indel 정보, 및 copy number variation 정보 중 적어도 하나를 포함할 수 있다.
보다 구체적으로, 상기 저장하는 단계는, 전장(Genome-Wide) 유전체 영역을 대표하는 DNA 서열 정보, 성별 마커 정보,개인 식별 정보, 보험 가입과 관현될수 있는 정보 를 암호화한 부분 정보와 개인의 전체 DNA 서열 정보를 함께 암호화하여 저장하는 단계를 포함할 수 있다.
보다 구체적으로, 상기 분석을 수행하는 단계는, 상기 생활습관 정보, 병력에 관한 정보, 임상 정보 중 적어도 하나를 포함하는 표현형 정보와 상기 유전체에 관한 정보에 기초하여 개인별 질병 위험도를 예측하는 단계를 포함할 수 있다.
보다 구체적으로, 상기 예측된 개인별 질병 위험도에 기초하여 개인 맞춤형으로 식사에 관한 정보, 운동에 관한 정보, 건강에 관한 정보, 수면에 관한 정보 중 적어도 하나를 상기 개인에게 제공하는 단계를 포함할 수 있다.
보다 구체적으로, 상기 개인별 질병 위험도를 예측하는 단계는, 상기 표현형 정보 및 상기 유전체에 관한 정보를 입력 매트릭스로 설정하고, 복수의 레이어(Layer)를 통해 특징을 추출하는 단계; 및 추출된 특징을 풀 커넥션 기법에 기초하여 개인별 질병 위험도를 2진수로 표시하는 단계를 포함할 수 있다.
한편, 본 발명의 일 실시 예에 따른 클라우드 기반 유전자 분석 서비스 플랫폼은 실험시설에 연결된 단말과 통신하는 통신 모듈; 개인 각각에 대응되는 유전체에 관한 정보의 생성을 상기 통신 모듈을 통해 모니터링하는 컨트롤러; 및
생성된 상기 유전체에 관한 정보를 암호화하여 저장하는 저장부를 포함하며, 상기 컨트롤러는, 상기 유전체에 관한 정보 및 상기 개인 각각의 표현형 정보에 기초한 분석을 수행한다.
보다 구체적으로, 상기 플랫폼은 토근 방식으로 인증하는 인증 모듈을 더 포함하며, 상기 컨트롤러는, 유전체를 제공한 한명 이상의 오너(Owner), 상기 오너의 유전체에 관한 정보를 사용하려는 한명 이상의 유저 및 상기 플랫폼을 관리하는 한명 이상의 관리자 중 적어도 하나를 상기 인증 모듈을 통해 인증할 수 있다.
보다 구체적으로, 상기 컨트롤러는, 상기 유저 또는 관리자가 특정 오너의 유전체에 관한 정보를 조회 또는 사용하는 경우, 상기 특정 오너의 동의를 상기 통신 모듈을 통해 수신할 수 있다.
보다 구체적으로, 상기 플랫폼은 데이터를 저장하는 저장부를 더 포함하며,
상기 컨트롤러는, 전장(Genome-Wide) 유전체 영역을 대표하는 DNA 서열 정보, 성별 마커 정보, 개인 식별 정보, 보험 가입과 관련될 수 있는 정보 를 암호화한 부분 정보와 개인의 전체 DNA 서열 정보를 함께 암호화하여 상기 저장부에 저장할 수 있다.
보다 구체적으로, 상기 플랫폼은 유전자 정보를 분석하는 분석 모듈을 더 포함하며, 상기 컨트롤러는, 생활습관 정보, 병력에 관한 정보, 임상 정보 중 적어도 하나를 포함하는 표현형 정보와 상기 유전체에 관한 정보에 기초하여 개인별 질병 위험도를 예측하도록 상기 분석 모듈을 제어할 수 있다.
보다 구체적으로, 상기 컨트롤러는, 상기 예측된 개인별 질병 위험도에 기초하여 개인 맞춤형으로 식사에 관한 정보, 운동에 관한 정보, 건강에 관한 정보, 수면에 관한 정보 중 적어도 하나를 상기 개인에게 제공할 수 있다.
본 발명에 따르면 아래와 같은 효과가 발생된다.
첫째로, 민감한 유전자 정보가 안전하게 보호됨으로써, 유전자 관리의 신뢰도가 향상될 수 있다.
둘째로, 유전체 정보 중 개인을 식별하는 특성 정보를 재차 암호화하여 저장함으로써, 보안 강화성이 더욱 향상될 수 있다.
셋째로, 표현형 정보와 유전 정보의 연관성이 분석됨으로써, 노령화 시대에 걸맞는 헬스 케어 서비스가 제공될 수 있다.
넷째로, 검증된 클라우드 시스템을 적용하여 정보가 더욱 효율적으로 보호될 수 있다.
본 발명에서 얻은 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시 예에 따른 클라우드 기반 유전자 분석 서비스 플랫폼을 개략적으로 설명하기 위한 시스템도이다.
도 2는 도 1에 도시된 클라우드 기반 유전자 분석 서비스 플랫폼의 구성을 나타내는 블록도이다.
도 3 내지 도 6은 본 발명의 일 실시 예에 따른 유전자 분석 서비스 플랫폼의 다양한 구동을 설명하기로 한다.
이하 첨부된 도면들을 참조하여 본 발명의 다양한 실시 예를 보다 상세하게 설명한다. 다만, 본 발명을 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략한다.
도 1은 본 발명의 일 실시 예에 따른 클라우드 기반 유전자 분석 서비스 플랫폼(100)을 개략적으로 설명하기 위한 시스템도이다.
유전자 분석 서비스 플랫폼(100)은 기존의 서버와 클라이언트의 전통적인 시스템에서 탈피하여 클라우드 컴퓨팅 시스템에 기초한 시스템으로, 도면 상으로는 하나의 엔티티로 구성된 것으로 설명하나 실시 예는 보다 많은 엔티티가 포함될 수 있다.
유전자 분석 서비스 플랫폼(100)은 정보 보안을 위해 클라우드 기반 마이크로 서비스, RDS(Relational Database Service), HSM(Hardware Security Module), JWT(JSON Web Token), SSL(Secure Sokket Layer), 암호화 알고리즘(RSA, ARIA Encyption, GCM, AES 등) 등의 기술을 복합적으로 적용할 수 있다.
유전자 분석 서비스 플랫폼(100)은 실험실 단말(200)로부터 다양한 사람의 유전자 정보를 수집할 수 있는데, 유전자 분석 서비스 플랫폼(100)은 정보 보안을 위해 암호화된 유전자 정보를 수신하여 복호화한 후 이를 가공할 수 있다. 유전자 분석 서비스 플랫폼(100)은 Web Application Firewall 및 API Gateway 에 포함된 VPN(Virtual Private Network)를 이용하여 실험실 단말(200)과 통신할 수 있다. 즉, 실험실 단말(200)의 경우 유전자 분석 서비스 플랫폼(100)의 일부로 볼 수도 있다.
실험실 단말(200)은 개개인의 유전체 정보를 해독 및 생산할 수 있으며, DNA 를 추출하고 추출된 DNA 에 대해 정량/정성 분석을 수행할 수 있고, 다양한 실험을 수행할 수 있는데, 실험실 단말(200)은 특정 프로세스를 수행한 후, 수행 후의 정보를 유전자 분석 서비스 플랫폼(100)에 암호화하여 제공할 수 있다.
또한, 유저 단말(300)은 유전자 분석 서비스 플랫폼(100)에 저장된 개개인의 유전자 정보를 사용하고자 하는 단말이며, 오너 단말(400)은 특정 유전체 정보를 제공한 오너가 사용하는 단말 또는 오너에 대응되는 단말일 수 있다.
유전자 분석 서비스 플랫폼(100)은 유전자 분석 서비스 플랫폼(100)을 관리하는 관리 단말, 실험실 단말(200), 유저 단말(300), 소유 단말(400)에게 토큰을 발행할 수 있다. 상기 토큰은 특정 서비스를 제공받기 위해 필요한 암호와 같은 것으로 바코드, QR 코드 등에 관한 정보를 추가적으로 더 포함할 수 있다.
유전자 분석 서비스 플랫폼(100)은 개인 각각에 대응되는 유전체에 관한 정보의 생성을 모니터링할 수 있다. 즉, 유전자 분석 서비스 플랫폼(100)은 실험실 단말(200)에서 수집되는 유전자 정보를 단계별로 모니터링할 수 있다.
또한, 유전자 분석 서비스 플랫폼(100)은 생성된 상기 유전체에 관한 정보를 암호화하여 저장할 수 있다. 유전자 분석 서비스 플랫폼(100)은 유전체 전체에 관한 정보를 저장할 수 있으며, 유전체에 포함된 특정 기능의 정보를 추가적으로 암호화하여 저장할 수 있다. 유전자 분석 서비스 플랫폼(100)은 저장부를 NAS(Network Access Server) 형태로 구현하여 다양한 정보를 저장할 수 있으나, 실시 예가 이에 국한되는 것은 아니다.
유전자 분석 서비스 플랫폼(100)은 유전체에 관한 정보 및 상기 개인 각각의 표현형 정보에 기초하여 다양한 분석을 수행할 수 있는데, 구체적인 방법은 후술하기로 하고 여기서는 생략한다.
도 2는 상술한 유전자 분석 서비스 플랫폼(100)의 구성을 나타내는 블록도이다.
도 2를 참고하면, 유전자 분석 서비스 플랫폼(100)은 통신 모듈(110), 인증 모듈(120), 암호화 모듈(130), 분석 모듈(140), 저장부(150), 컨트롤러(160)를 포함한다. 도 2에 도시된 구성요소들은 상기 유전자 분석 서비스 플랫폼(100)을 구현하는데 필수적인 것은 아니어서, 본 명세서 상에서 설명되는 유전자 분석 서비스 플랫폼(100)은 위에서 열거된 구성요소들 보다 많거나, 또는 적은 구성요소들을 가질 수 있으며, 컨트롤러(160)는 상기 다른 구성요소들을 전반적으로 제어할 수 있다.
통신 모듈(110)은 외부 기기 가령, 실험실 단말, 유저 단말, 관리 단말, 오너 단말 등과 통신할 수 있다. 통신 모듈(110)은 이동 통신 모듈, 근거리 통신 모듈 등을 포함하며, 유무선 통신을 수행하기 위한 모듈을 포함할 수 있다.
인증 모듈(120)은 유전체를 제공한 한명 이상의 오너(Owner), 상기 오너의 유전체에 관한 정보를 사용하려는 한명 이상의 유저 및 상기 플랫폼을 관리하는 한명 이상의 관리자 중 적어도 하나를 토큰 방식으로 인증할 수 있다.
인증 모듈(120)은 토큰 생성부(123) 및 토큰 관리부(125)를 포함하며, 토큰 생성부(123)는 토큰을 생성하는 모듈이며, 토큰 관리부(125)는 생성된 토큰을 관리하는 모듈이다.
암호화 모듈(130)은 유전체 정보, 유전자 정보, 개인 식별 정보 등을 암호화하는 모듈로 공개키 암호 알고리즘인 RSA(Ron Shamir Adleman), 블록 암호 알고리즘인 ARIA(Academy Research Institute Agency) Encyption 을 이용할 수 있으나, 실시 예가 이에 국한되는 것은 아니다.
분석 모듈(140)은 유전자 정보를 분석하는 모듈로, 유전자 정보와 표현형 정보 등을 기초로 다양한 분석을 수행할 수 있다. 분석 모듈(140)은 유전자 데이터 분석부(143)와 위험도 예측부(145)를 포함한다. 분석 모듈(140)은 생활습관 정보, 병력에 관한 정보, 임상 정보 중 적어도 하나를 포함하는 표현형 정보와 유전자 정보를 기초로 개인별 질병 위험도를 예측할 수 있다.
저장부(150)는 유전자 정보 및 개인에 관한 다양한 정보를 저장할 수 있다.
컨트롤러(160)는 유전자 분석 서비스 플랫폼(100)을 전반적으로 제어하는 모듈에 해당된다.
상기 컨트롤러(160)는 유전체를 제공한 한명 이상의 오너(Owner), 상기 오너의 유전체에 관한 정보를 사용하려는 한명 이상의 유저 및 상기 플랫폼을 관리하는 한명 이상의 관리자 중 적어도 하나를 상기 인증 모듈(120)을 통해 인증할 수 있다.
또한, 컨트롤러(160)는 상기 유저 또는 관리자가 특정 오너의 유전체에 관한 정보를 조회 또는 사용하는 경우, 상기 특정 오너의 동의를 상기 통신 모듈(110)을 통해 수신할 수 있다.
또한, 컨트롤러(160)는 전장(Genome-Wide) 유전체 영역을 대표하는 DNA 서열 정보, 성별 마커 정보 및 개인 식별 정보, 및 보험 가입과 관련될 수 있는 DNA 서열 정보 중 적어도 하나를 암호화한 부분 정보와 개인의 전체 DNA 서열 정보를 함께 암호화하여 저장부(150)에 저장할 수 있다. 일 예로, 위의 4개의 정보 각각이 모두 개별적으로 암호화된 정보와 개별적으로 암호화된 정보를 포함한 개인의 전체 DNA 서열 정보를 함께 암호화하여 저장부(150)에 저장할 수 있다.
또한, 컨트롤러(160)는 생활습관 정보, 병력에 관한 정보, 임상 정보 중 적어도 하나를 포함하는 표현형 정보와 상기 유전체에 관한 정보에 기초하여 개인별 질병 위험도를 예측하도록 상기 분석 모듈(140)을 제어할 수 있다.
아울러, 컨트롤러(160)는 예측된 개인별 질병 위험도에 기초하여 개인 맞춤형으로 식사에 관한 정보, 운동에 관한 정보, 건강에 관한 정보, 수면에 관한 정보 중 적어도 하나를 상기 개인에게 제공할 수 있다.
이하에서는 도 3 내지 도 6을 참고하여, 본 발명의 일 실시 예에 따른 유전자 분석 서비스 플랫폼(100)의 다양한 구동을 설명하기로 한다.
도 3은 본 발명의 일 실시 예에 따른 유전체 정보를 해독하는 과정을 모니터링하는 유전자 분석 서비스 플랫폼(100)의 구동을 설명하기 위한 시퀀스도이다. 도 4는 본 발명의 일 실시 예에 따른 유저 단말과 토큰 기반의 인증을 수행하는 유전자 분석 서비스 플랫폼(100)의 구동을 설명하기 위한 시퀀스도이다. 도 5는 본 발명의 일 실시 예에 따른 유전체 정보와 표현형 정보에 기초하여 다양한 분석을 수행하는 유전자 분석 서비스 플랫폼(100)의 구동을 설명하기 위한 시퀀스도이다. 도 6은 본 발명의 일 실시 예에 따른 유전자 분석 서비스 플랫폼(100)이 유전자 정보를 저장부에 저장하는 것을 나타낸다.
우선 도 3을 참고하면, 유전자 분석 서비스 플랫폼(100)에 해독 및 분석 서비스가 신청되면, 실험실 단말(200)은 DNA 추출 및 DNA 정성/정량 검사를 수행한다(S310).
DNA 해독 데이터 생산 시 성공 여부를 결정하는 주요 요인으로 시료 DNA의 농도를 들 수 있으며, Double-stranded DNA 농도를 특이적으로 측정하는 형광측정법dl 적용될 수 있다. NGS 기법, genome-wide SNP array에 따라 각 시료 당 최소 200 ng의 DNA가 필요하며 측정된 농도를 기준으로 한다. 정성/정량 기준을 통과한 DNA를 이용하여 genome-wide SNP array칩 또는 NGS(Next Generation Sequencing) 기법을 이용하여 대용량 유전체/genome 서열 분석을 수행한다. 서열 분석으로 Single Nucelotide Polymorphism (SNP), Short indel, copy number variation 등의 인간 변이체 정보가 획득될 수 있다.
그 다음으로, 실험실 단말(200)은 NGS 실험 또는 SNP array 실험을 수행한다(S330). 다만, 개인의 DNA 의 특성들을 추출하기에 더 좋은 실험이 있다면 구현시에 적용될 수 있다.
NGS 기법으로 생산된 데이터는 read filtering, read mapping, variant calling, 주석 분석을 수행하여 인간 변이체 정보가 확보될 수 잇으며, genome-wide SNP array를 이용하여 생산된 대용량 고집적 SNP 데이터는 microarray의 이미지 원천 데이터로부터 genotype (AA, AB, BB)을 calling 하기 위해 적합한 알고리즘이 이용될 수 있다. 기존의 이미 확보된 데이터를 seed로 삼아 샘플의 genotype이 결정되며, 검증이 충분히 이루어진 SNP만을 genotyping 하여 calling을 수행하기 위한 cluster 형성에 대한 에러율이 낮아질 수 있다.
유전자 분석 서비스 플랫폼(100)은 실험실 단말(200)로부터 암호화된 유전체 정보(S340)를 제공받고, 유전체 정보를 복호화하고, 복호화된 유전체 정보를 저장한다(S350).
가령, 유전자 분석 서비스 플랫폼(100)은 RSA 알고리즘을 이용하여 공개키로 암호환된 유전체 정보를 복호화하여 NAS 에 저장하고, 해시값 및 바코드 정보를 클라우드 RSD(Relational Database Service)에 저장할 수 있다. 유전자 분석 서비스 플랫폼(100)은 유전체의 생성/변경/삭제시마다 유전체 데이터 해시값을 관리하고 위변조를 방지할 수 있다.
유전자 분석 서비스 플랫폼(100)은 오너의 사용 동의를 받은 유저 단말(200)에게 유전체 정보를 제공한다(S360). 이경우, 유전자 분석 서비스 플랫폼(100)은 토큰 기반의 인증을 통해 유저 단말(200)을 인증할 수 있다.
즉, 유전자 분석 서비스 플랫폼(100)은 오너에 의해 제공된 유전체에서 DNA 를 추출하는 제1 단계, DNA 농도를 체크하는 제2 단계 및 유전자 실험을 통해 인간 변이체 정보를 생산하는 제3 단계를 모니터링할 수 있으며, 공개키로 암호화된 인간 변이체 정보를 개인키로 복호화할 수 있다.
상기 인간 변이체 정보는 SNP(Single Nucleotide Polymorphism) 정보, Short Indel 정보, 및 copy number variation 정보 중 적어도 하나를 포함할 수 있다.
또한, 유전자 분석 서비스 플랫폼(100)은 개인 인증을 통해 개인 레포트를 생성하고, 코호트 유전자 데이터를 분석하여 인증을 받은 사용자에게 분석된 유전자 데이터를 제공할 수 있다.
도 4는 본 발명의 일 실시 예에 따른 유저 단말과 토큰 기반의 인증을 수행하는 유전자 분석 서비스 플랫폼(100)의 구동을 설명하기 위한 시퀀스도이다.
도 4를 참고하여, 유저 단말(200)이 유전자 분석 서비스 플랫폼(100)으로부터 토큰을 발행받아 사용하는 방법을 설명하기로 한다.
먼저, 유전자 분석 서비스 플랫폼(100)은 웹사이트를 제공(S410) 하여 로그인 요청(S420)을 유저 단말(200)로부터 받는다.
유전자 분석 서비스 플랫폼(100)은 토큰을 생성하여 유저 단말(200)에 응답하고(S430), 유저 단말(200)은 토큰을 저장한다(S440).
유저 단말(200)은 저장된 토큰을 이용하여 유전자 분석 서비스 플랫폼(100)에 정보를 요청(S450)하면, 유전자 분석 서비스 플랫폼(100)은 토큰을 검증하여 응답한다(S460).
한편, 유전자 분석 서비스 플랫폼(100)은 개인정보 보안을 위한 클라우드 기반의 마이크로 서비스를 이용할 수 있다. 마이크로 서비스(Micro-Services)는 서비스 지향 아키텍처를 지칭하는 용어로서, 하나의 큰 애플리케이션을 여러개의 작은 애플리케이션으로 분할해서 변경과 조합이 가능하도록 만든 독립적인 서비스이다. 서비스는 작고 매우 느슨하게 결합되며, 애플리케이션의 한가지 기능에 초점을 맞춘다. 또한 서비스별로 다른 기술 스택을 사용할 수 있다. 너무 커서 관리에 위험이 따르는 하나의 코드 베이스를 모든 개발자가 건드리게 하는 것보다는, 소규모 팀에서 독립적으로 관리하는 더 작은 코드 베이스로 애플리케이션을 구성한다.
코드 베이스의 유일한 의존성은 응용프로그램 인터페이스(API[Application Programming Interface])를 통해서이며, 이런 아키텍처 스타일은 넷플릭스와 이베이, 아마존 등 거대한 웹 기업에서 인기를 얻고 있다. 기존 모놀리스 아키텍처를 사용해 새로운 기능을 빠르게 개발해야 할 때, 하나의 모놀리스 애플리케이션을 만들지 않고 소규모 서비스를 만들어 각 비즈니스 기능을 처리할 수 있다. 서비스는 자립적이며, 서비스 간의 경계는 서비스의 비즈니스 기능을 노출하는 잘 정의된 응용프로그램 인터페이스(API)다. 본 발명에서는 크게 사용자/데이터/서비스제공 영역으로 나눠 각각 분리된 영역에서 독립적인 확장과 성능을 갖는 자율성 확보 서비스를 구축한다.
유전자 분석 서비스 플랫폼(100)은 클라우드(Cloud) 기반 하드웨어 보안 모듈(HSM[Hardware Security Module])을 포함한다. 클라우드 기반 마이크로 서비스를 통해 독립적인 모듈을 구성하고 클라우드 하드웨어 보안 모듈(Cloud Hardware Security Module) 키 관리를 통해 개인정보는 암호화되어 저장된다. 오너는 자신의 정보를 언제든지 활용할 수 있고 오너에 권한을 요청해서 제한된 임시 권한을 받아 연구 또는 서비스로 활용 할 수 있다. 보안에 대한 관리 주체를 회사(연구단체)가 아닌 개인이 관리하므로 효율적인 데이터 사용과 관리를 할 수 있다.
유전자 해독 서비스 영역에서는 실험실에서 유전체 데이터를 해독하고 생산하며 원천데이터부터 암호화 처리를 하여 데이터를 보호하며, 분석 서비스 영역에서는 실험실에서 업로드한 데이터와 외부 기초 데이터를 통해 사용자 유전자 및 표현형 데이터 분석을 지원할 수 있다.
사용자영역 마이크로 서비스(Micro-Services) 구간에서는 소유자, 관리자, 사용자별로 가입과 인증을 관리한다. 최초 가입시 생성되는 해시값 과 바코드로 개인을 식별할 수 있다. 제공영역 마이크로 서비스(Micro-Services) 구간에서는 소유자가 자신의 건강정보를 열람하고 활용할 수 있는 서비스를 제공하고 관리자나 사용자가 요청하는 활용권을 처리한다. 뱅킹영역 마이크로 서비스(Micro-Services) 구간에서는 암호화 기술과 저장처리를 위해 보안통신구간을 제공한다. 활용권 토큰(JWT) 기반으로 발행하며 인증 및 정보 교류 처리한다.
도 5는 본 발명의 일 실시 예에 따른 유전체 정보와 표현형 정보에 기초하여 다양한 분석을 수행하는 유전자 분석 서비스 플랫폼(100)의 구동을 설명하기 위한 시퀀스도이다.
도 5를 참고하면, 유전자 분석 서비스 플랫폼(100)은 유전체 정보(510)와 표현형 정보(520)를 유전자 및 표현형 DB(530)에 저장할 수 있다.
유전체 정보(510)는 NGS 정보(513)를 포함한다. NGS 정보(513)는 DNA, RNA 서열을 단편화 하여 처리될 수 있으며, genome 전체를 해독하는 whole genome sequencing, 원하는 부분만을 해독하는 targeted sequencing이 모두 적용될 수 있으며, 읽는 영역에 따라 paired read의 depth를 30 X ~ 1000 X까지 정할 수 있다.
NGS 서열을 분석하기 위해 Roche454, Illumina, PacBio 등의 플랫폼이 있으며, target 영역을 효율적으로 sequencing하기 위해 MiSeq, Ion Torrent 등의 플랫폼이 최근에는 사용되고 있다. 정해진 target 영역의 서열을 정확도 높게 panel을 제작하여 해독하여 암, 희귀질환 등의 진단에 활용할 수 있다. 인간은 이미 참조 서열이 있으므로, 참조 서열과 생산된 해독 데이터를 비교하는 resequencing 방법으로 분석을 한다. 참조서열에 read를 mapping하고, variant calling, annotation 분석을 수행하여 개인 유전체 정보를 확보한다. NGS 데이터는 vcf 포맷으로 유전변이 정보를 표준화 한다.
표현형 정보(520)는 생활습관 정보(523), 질병/가족력 정보(525) 및 임상 정보(527) 등을 포함할 수 있다. 생활습관 정보(523)는 활동량, 수면량, 과식, 비만, 카페인 섭취 등에 관한 정보를 포함할 수 있으나, 실시 예에 따라 다양한 생활 습관 정보를 포함할 수 있다. 질병/가족력 정보(525)는 병원이나 설문 등을 통해 수집될 수 있다. 임상 정보는 질병 진단, 약물 처방, 생체 계측 등을 통해 수집될 수 있다.
유전자 분석 서비스 플랫폼(100)은 기 보고된 문헌정보(2nd DB)를 수집하기 위해 GWAS catalog, OMIM, dbGap과 같은 데이터베이스를 가공하여 변이의 질환/형질의 표현형 정보를 정도관리를 수행하여 데이터베이스화할 수 있다.
유전자 분석 서비스 플랫폼(100)은 유전체 정보 및 표현형에 기초하여 분석하고, 개인별로 질병/표현형 위험도 예측한다(S560).
유전자 분석 서비스 플랫폼(100)은 예측된 개인별 질병 위험도에 기초하여 개인 맞춤형으로 식사에 관한 정보, 운동에 관한 정보, 건강에 관한 정보, 수면에 관한 정보 중 적어도 하나를 상기 개인에게 제공할 수 있다.
또한, 유전자 분석 서비스 플랫폼(100)은 피허자의 임상 성별 정보와 유전체 정보의 X, Y 염색체 정보로부터 생성된 성별 정보의 일치 여부를 확인하여 피험자의 샘플 혼동을 1차적으로 판별할 수 있다.
도 6은 본 발명의 일 실시 예에 따른 유전자 분석 서비스 플랫폼(100)이 유전자 정보를 저장부에 저장하는 것을 나타낸다. 상기 저장부(150)는 NAS(Network Access Server)를 포함할 수 있으며, 상기 유전자 정보는 암호화되어 상기 저장부(150)에 저장될 수 있다. 암호화된 유전자 정보는 개인 유전자 분석 수행하거나 사용자가 개인 유전 정보를 출력할 때, 복호화될 수 있다.
컨트롤러(160)는 개인 유전자 정보를 암호화할 경우, 보안 강화를 위해 개인을 식별할 수 있는 DNA 서열 정보를 1차적으로 암호화(컬럼)하고, 전체 개인 유전자 정보를 2차적으로 암호화(파일)할 수 있다.
도 6을 참고하면, 유전자 분석 서비스 플랫폼(100)은 개개인의 유전체 정보(610)와 전장(genome-wide) 유전체 (genome) 영역을 대표하는 DNA 서열 정보(620)를 저장할 수 있다. SNP들 간의 거리가 가깝거나, 특정 인구집단 내에서 서로 연관성이 있어서 haplotype 조합이 형성되지 않고, 다음세대로 block LD(Linkage Disequilibrium) Block을 이루어서 전달될 수 있으며, 이때 LD block을 대표하는 SNP 서열 정보를 DNA pruning 분석 방법을 사용하여 확보하여, 전체 유전체 영역을 대표하는 DNA 서열을 각 인구집단 (ex. 아시아, 유럽, 아프리칸)의 전체 DNA 서열 정보에 대해 찾아낼 수 있으며, 해당 서열은 암호화될 수 있다.
이 때, SNP genotype의 minor allele(특정 인구집단에서 좀 더 작은 비율로써 존재하는 allele)의 빈도수(frequency)에 따라 서로의 연관성(correlation r2)이 계산될 수 있으며, 인구집단 데이터에 따라 값은 0.2로 설정하거나, 0.8로 설정될 수 있다. 이렇게 선정된 전체 영역을 대표하는 서열이 암호화될 수 있다.
해당 방법을 사용하면 전체를 대표하는 SNP는 약 50,000~100,000정도에서 결정될 수 있으며, 해당 서열로 각 SNP에 대해 샘플을 pair로 비교하면서 유전적 거리를 계산할 수 있다. 이?, IBS (Identity-By-State) 방법이 적용될 수 있으며, 아래 표와 같이 SNP genotype의 DNA 서열이 두 개다 같은 경우 : 2점, SNP genotype의 DNA 서열이 둘 중 하나만 같은 경우 : 1점, SNP genotype의 DNA 서열이 두 개다 다른 경우 : 0점으로 설정될 수 있다.
Sample1 Sample2 Score
A/C A/C 2
A/T A/A 1
A/A A/G 1
A/A G/G 0
G/C G/C 2
모든 SNP에 대해 위와 같은 방법으로 샘플을 pair로 점수화하여 80%이상의 동일 확률을 보일 경우 부모, 형제와 같은 친인척으로 간주 할 수 있다. 일치율 99%는 쌍둥이이거나 동일인의 DNA 서열이다. 그러므로, 가족관계를 증명할 수 있는 부분이므로, 해당서열이 암호화될 수 있다.
또한, 유전자 분석 서비스 플랫폼(100)은 성별 마커 정보(630)를 더 저장할 수 있다. 유전자 분석 서비스 플랫폼(100)은 성별 마커를 이용하여 임상정보의 성별과 성별 마커를 이용한 성별이 일치하는지를 판단하여, 샘플의 혼동 여부를 다시 한번 확인한다. 또한, 유전자 분석 서비스 플랫폼(100)은 성별 구분 DNA 서열을 암호화 하여, 서열 정보의 성별 정보 보안을 강화한다. 성별 구분 SNP 마커의 예는 rs2032678 또는 rs5911500일 수 있으나, 구현시에는 다른 마커가 적용될 수도 있다.
또한, 유전자 분석 서비스 플랫폼(100)은 DNA해독 과정에서 샘플 혼동 방지를 위해 사용되는 개인을 식별할 수 있는 DNA정보(640)를 암호화 하여 개인 DNA 서열 정보의 보안을 강화한다.
전장유전체를 대표할 수 있는 SNP 50,000~100,000개에서 minor allele의 빈도수 5%이상의 SNP중에서 랜덤으로 약 50개의 SNP를 선정하여, 개인을 식별할 수 있는 마커를 정할 수 있다. 여기에 혈액형을 결정하는 ABO 유전자의 SNP들이 추가될 수 있으며, ABO혈액형 외의 RH+, RH-를 결정하는 마커도 추가될 수 있다. 또한, 머라카락 굵기, 눈동자 색, 귀지 형태, 키, 눈썹 형태, 엄지발가락 길이차이, 피부노화, 알콜 분해효소, 피부탄력, 피부색, 중독성 성향, 학습능력, 몸무게, 와인성향, 입맛 등의 개인적 특징을 나타내는 SNP정보가 추가될 수 있다. DNA 해독 과정에서 샘플 혼동 방지를 위해 사용될 수 있는 위와 같은 개인을 식별할 수 있는 DNA정보를 암호화하여 개인 DNA서열 정보의 보안이 강화될 수 있다.
또한, 유전자 분석 서비스 플랫폼(100)은 보험 가입과 관련될 수 있는 DNA 정보를 더 저장할 수 있다. 유전자 분석 서비스 플랫폼(100)은 유방암, 소화기계 암(위암, 대장암), 뇌종양, 췌장암 등 주요 암에 대한 위험도를 나타낼 수 있는 SNP의 DNA서열정보를 암호화할 수 있으며, 충치, 치매, 당뇨, 고혈압, 고지혈증, 심혈관 질환, 뇌졸중 등에 대한 위험도를 나타낼 수 있는 SNP의 DNA서열 정보를 암호화할 수 있다.
이와 같은 SNP는 NCBI와 같은 공용데이터 베이스의 문헌정보를 기초로 선발되거나, 다양한 유전체 및 임상 데이터를 연관성 분석, 딥러닝, 머신러닝 방법으로 유전형과 표현형을 분석하여 선발될 수 있다. 해당 마커를 암호화 함으로써 보험회사에 데이터가 유출됨으로써 DNA서열 소유자가 차별 받는 것이 예방될 수 있다.
살핀 바와 같이, 유전자 분석 서비스 플랫폼(100)은 전장(Genome-Wide) 유전체 영역을 대표하는 DNA 서열 정보, 성별 마커 정보 및 개인 식별 정보, 및 보험 가입과 관련될 수 있는 DNA 서열 정보 중 적어도 하나를 암호화한 부분 정보와 개인의 전체 DNA 서열 정보를 함께 암호화하여 저장할 수 있다. 이런 경우, 전체 DNA 서열 정보와 함께 유용한 개인 식별 정보가 별도로 암호화되어 개인 정보 보호가 더욱 고려될 수 있다. 또한, 유전자 분석 서비스 플랫폼(100)은 전장 유전 정보를 양방향 암복호화를 수행하고, 4가지 영역에 대해서는 단방향 암호화하여 복호화하지 않으며, 서비스 레포트 생성시 암호화한 상태로 해쉬값으로 비교분석이 수행되어, 보안이 보다 강화될 수 있다.
또한, 유전자 분석 서비스 플랫폼(100)은 상기 표현형 정보 및 상기 유전체에 관한 정보를 입력 매트릭스로 설정하고, 복수의 레이어(Layer)를 통해 특징을 추출하고, 추출된 특징을 풀 커넥션 기법에 기초하여 개인별 질병 위험도를 2진수로 표시할 수 있다. 즉, 딥 러닝 알고리즘에 기반하여 학습에 의해 질병 위험도가 결과로 도출될 수 있다.
한편, 본 명세서에서 설명하는 기능적인 동작과 주제의 구현물들은 디지털 전자 회로로 구현되거나, 본 명세서에서 개시하는 구조 및 그 구조적인 등가물들을 포함하는 컴퓨터 소프트웨어, 펌웨어 혹은 하드웨어로 구현되거나, 이들 중 하나 이상의 결합으로 구현 가능하다. 본 명세서에서 설명하는 주제의 구현물들은 하나 이상의 컴퓨터 프로그램 제품, 다시 말해 제어 시스템의 동작을 제어하기 위하여 혹은 이것에 의한 실행을 위하여 유형의 프로그램 저장매체 상에 인코딩된 컴퓨터 프로그램 명령에 관한 하나 이상의 모듈로서 구현될 수 있다.
컴퓨터로 판독 가능한 매체는 기계로 판독 가능한 저장 장치, 기계로 판독 가능한 저장 기판, 메모리 장치, 기계로 판독 가능한 전파형 신호에 영향을 미치는 물질의 조성물 혹은 이들 중 하나 이상의 조합일 수 있다.
본 명세서에서 "플랫폼"이나 "시스템"이라 함은 예컨대 프로그래머블 프로세서, 컴퓨터 혹은 다중 프로세서나 컴퓨터를 포함하여 데이터를 제어하기 위한 모든 기구, 장치 및 기계를 포괄한다. 제어 시스템은, 하드웨어에 부가하여, 예컨대 프로세서 펌웨어를 구성하는 코드, 프로토콜 스택, 데이터베이스 관리 시스템, 운영 체제 혹은 이들 중 하나 이상의 조합 등 요청 시 컴퓨터 프로그램에 대한 실행 환경을 형성하는 코드를 포함할 수 있다.
컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 어플리케이션, 스크립트 혹은 코드로도 알려져 있음)은 컴파일되거나 해석된 언어나 선험적 혹은 절차적 언어를 포함하는 프로그래밍 언어의 어떠한 형태로도 작성될 수 있으며, 독립형 프로그램이나 모듈, 컴포넌트, 서브루틴 혹은 컴퓨터 환경에서 사용하기에 적합한 다른 유닛을 포함하여 어떠한 형태로도 전개될 수 있다. 컴퓨터 프로그램은 파일 시스템의 파일에 반드시 대응하는 것은 아니다. 프로그램은 요청된 프로그램에 제공되는 단일 파일 내에, 혹은 다중의 상호 작용하는 파일(예컨대, 하나 이상의 모듈, 하위 프로그램 혹은 코드의 일부를 저장하는 파일) 내에, 혹은 다른 프로그램이나 데이터를 보유하는 파일의 일부(예컨대, 마크업 언어 문서 내에 저장되는 하나 이상의 스크립트) 내에 저장될 수 있다. 컴퓨터 프로그램은 하나의 사이트에 위치하거나 복수의 사이트에 걸쳐서 분산되어 통신 네트워크에 의해 상호 접속된 다중 컴퓨터나 하나의 컴퓨터 상에서 실행되도록 전개될 수 있다.
한편, 컴퓨터 프로그램 명령어와 데이터를 저장하기에 적합한 컴퓨터로 판독 가능한 매체는, 예컨대 EPROM, EEPROM 및 플래시메모리 장치와 같은 반도체 메모리 장치, 예컨대 내부 하드디스크나 외장형 디스크와 같은 자기 디스크, 자기광학 디스크 및 CD-ROM과 DVD-ROM 디스크를 포함하여 모든 형태의 비휘발성 메모리, 매체 및 메모리 장치를 포함할 수 있다. 프로세서와 메모리는 특수 목적의 논리 회로에 의해 보충되거나, 그것에 통합될 수 있다.
본 명세서에서 설명한 주제의 구현물은 예컨대 데이터 서버와 같은 백엔드 컴포넌트를 포함하거나, 예컨대 어플리케이션 서버와 같은 미들웨어 컴포넌트를 포함하거나, 예컨대 사용자가 본 명세서에서 설명한 주제의 구현물과 상호 작용할 수 있는 웹 브라우저나 그래픽 유저 인터페이스를 갖는 클라이언트 컴퓨터와 같은 프론트엔드 컴포넌트 혹은 그러한 백엔드, 미들웨어 혹은 프론트엔드 컴포넌트의 하나 이상의 모든 조합을 포함하는 연산 시스템에서 구현될 수도 있다. 시스템의 컴포넌트는 예컨대 통신 네트워크와 같은 디지털 데이터 통신의 어떠한 형태나 매체에 의해서도 상호 접속 가능하다.
본 명세서는 다수의 특정한 구현물의 세부사항들을 포함하지만, 이들은 어떠한 발명이나 청구 가능한 것의 범위에 대해서도 제한적인 것으로서 이해되어서는 안되며, 오히려 특정한 발명의 특정한 실시형태에 특유할 수 있는 특징들에 대한 설명으로서 이해되어야 한다. 마찬가지로, 개별적인 실시형태의 문맥에서 본 명세서에 기술된 특정한 특징들은 단일 실시형태에서 조합하여 구현될 수도 있다. 반대로, 단일 실시형태의 문맥에서 기술한 다양한 특징들 역시 개별적으로 혹은 어떠한 적절한 하위 조합으로도 복수의 실시형태에서 구현 가능하다. 나아가, 특징들이 특정한 조합으로 동작하고 초기에 그와 같이 청구된 바와 같이 묘사될 수 있지만, 청구된 조합으로부터의 하나 이상의 특징들은 일부 경우에 그 조합으로부터 배제될 수 있으며, 그 청구된 조합은 하위 조합이나 하위 조합의 변형물로 변경될 수 있다.
또한, 본 명세서에서는 특정한 순서로 도면에서 동작들을 묘사하고 있지만, 이는 바람직한 결과를 얻기 위하여 도시된 그 특정한 순서나 순차적인 순서대로 그러한 동작들을 수행하여야 한다거나 모든 도시된 동작들이 수행되어야 하는 것으로 이해되어서는 안 된다. 특정한 경우, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다. 또한, 상술한 실시형태의 다양한 시스템 컴포넌트의 분리는 그러한 분리를 모든 실시형태에서 요구하는 것으로 이해되어서는 안되며, 설명한 프로그램 컴포넌트와 시스템들은 일반적으로 단일의 소프트웨어 제품으로 함께 통합되거나 다중 소프트웨어 제품에 패키징될 수 있다는 점을 이해하여야 한다
이와 같이, 본 명세서는 그 제시된 구체적인 용어에 본 발명을 제한하려는 의도가 아니다. 따라서, 상술한 예를 참조하여 본 발명을 상세하게 설명하였지만, 당업자라면 본 발명의 범위를 벗어나지 않으면서도 본 예들에 대한 개조, 변경 및 변형을 가할 수 있다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (15)

  1. 프로세서에 의해 수행되는 유전자 분석 서비스 방법에 있어서,
    개인 각각에 대응되는 유전체에 관한 정보의 생성을 모니터링하는 단계;
    생성된 상기 유전체에 관한 정보를 암호화하여 저장하는 단계; 및
    상기 유전체에 관한 정보 및 상기 개인 각각의 표현형 정보에 기초한 분석을 수행하는 단계를 포함하는, 유전자 분석 서비스 방법.
  2. 제1항에 있어서,
    유전체를 제공한 한명 이상의 오너(Owner), 상기 오너의 유전체에 관한 정보를 사용하려는 한명 이상의 유저 및 상기 플랫폼을 관리하는 한명 이상의 관리자 중 적어도 하나를 토큰 방식으로 인증하는 단계를 더 포함하는, 유전자 분석 서비스 방법.
  3. 제2항에 있어서,
    상기 유저 또는 관리자가 특정 오너의 유전체에 관한 정보를 조회 또는 사용하는 경우, 상기 특정 오너의 동의를 받는 단계를 더 포함하는, 유전자 분석 서비스 방법.
  4. 제1항에 있어서,
    상기 모니터링하는 단계는,
    오너에 의해 제공된 유전체에서 DNA 를 추출하는 제1 단계, DNA 농도를 체크하는 제2 단계 및 유전자 실험을 통해 인간 변이체 정보를 생산하는 제3 단계를 모니터링하는 단계를 포함하며,
    상기 유전자 분석 서비스 방법은,
    공개키로 암호화된 인간 변이체 정보를 개인키로 복호화하는 단계를 더 포함하는, 유전자 분석 서비스 방법.
  5. 제4항에 있어서,
    상기 인간 변이체 정보는,
    SNP(Single Nucleotide Polymorphism) 정보, Short Indel 정보, 및 copy number variation 정보 중 적어도 하나를 포함하는, 유전자 분석 서비스 방법.
  6. 제1항에 있어서,
    상기 저장하는 단계는,
    전장(Genome-Wide) 유전체 영역을 대표하는 DNA 서열 정보, 성별 마커 정보, 개인 식별 정보 및 보험 가입과 관련될 수 있는 DNA 서열 정보 중 적어도 하나를 암호화한 부분 정보와 개인의 전체 DNA 서열 정보를 함께 암호화하여 저장하는 단계를 포함하는, 유전자 분석 서비스 방법.
  7. 제1항에 있어서,
    상기 분석을 수행하는 단계는,
    상기 생활습관 정보, 병력에 관한 정보, 임상 정보 중 적어도 하나를 포함하는 표현형 정보와 상기 유전체에 관한 정보에 기초하여 개인별 질병 위험도를 예측하는 단계를 포함하는, 유전자 분석 서비스 방법.
  8. 제7항에 있어서,
    상기 예측된 개인별 질병 위험도에 기초하여 개인 맞춤형으로 식사에 관한 정보, 운동에 관한 정보, 건강에 관한 정보, 수면에 관한 정보 중 적어도 하나를 상기 개인에게 제공하는 단계를 포함하는, 유전자 분석 서비스 방법.
  9. 제7항에 있어서,
    상기 개인별 질병 위험도를 예측하는 단계는,
    상기 표현형 정보 및 상기 유전체에 관한 정보를 입력 매트릭스로 설정하고, 복수의 레이어(Layer)를 통해 특징을 추출하는 단계; 및
    추출된 특징을 풀 커넥션 기법에 기초하여 개인별 질병 위험도를 2진수로 표시하는 단계를 포함하는, 유전자 분석 서비스 방법.
  10. 실험시설에 연결된 단말과 통신하는 통신 모듈;
    개인 각각에 대응되는 유전체에 관한 정보의 생성을 상기 통신 모듈을 통해
    모니터링하는 컨트롤러; 및
    생성된 상기 유전체에 관한 정보를 암호화하여 저장하는 저장부를 포함하며,
    상기 컨트롤러는,
    상기 유전체에 관한 정보 및 상기 개인 각각의 표현형 정보에 기초한 분석을 수행하는, 클라우드 기반 유전자 분석 서비스 플랫폼.
  11. 제10항에 있어서,
    토근 방식으로 인증하는 인증 모듈을 더 포함하며,
    상기 컨트롤러는,
    유전체를 제공한 한명 이상의 오너(Owner), 상기 오너의 유전체에 관한 정보를 사용하려는 한명 이상의 유저 및 상기 플랫폼을 관리하는 한명 이상의 관리자 중 적어도 하나를 상기 인증 모듈을 통해 인증하는, 클라우드 기반 유전자 분석 서비스 플랫폼.
  12. 제11항에 있어서,
    상기 컨트롤러는,
    상기 유저 또는 관리자가 특정 오너의 유전체에 관한 정보를 조회 또는 사용하는 경우, 상기 특정 오너의 동의를 상기 통신 모듈을 통해 수신하는, 클라우드 기반 유전자 분석 서비스 플랫폼.
  13. 제10항에 있어서,
    데이터를 저장하는 저장부를 더 포함하며,
    상기 컨트롤러는,
    전장(Genome-Wide) 유전체 영역을 대표하는 DNA 서열 정보, 성별 마커 정보, 개인 식별 정보 및 보험 가입과 관련될 수 있는 DNA 서열 정보 중 적어도 하나를 암호화한 부분 정보와 개인의 전체 DNA 서열 정보를 함께 암호화하여 상기 저장부에 저장하는, 클라우드 기반 유전자 분석 서비스 플랫폼.
  14. 제10항에 있어서,
    유전자 정보를 분석하는 분석 모듈을 더 포함하며,
    상기 컨트롤러는,
    생활습관 정보, 병력에 관한 정보, 임상 정보 중 적어도 하나를 포함하는 표현형 정보와 상기 유전체에 관한 정보에 기초하여 개인별 질병 위험도를 예측하도록 상기 분석 모듈을 제어하는, 클라우드 기반 유전자 분석 서비스 플랫폼.
  15. 제14항에 있어서,
    상기 컨트롤러는,
    상기 예측된 개인별 질병 위험도에 기초하여 개인 맞춤형으로 식사에 관한 정보, 운동에 관한 정보, 건강에 관한 정보, 수면에 관한 정보 중 적어도 하나를 상기 개인에게 제공하는, 클라우드 기반 유전자 분석 서비스 플랫폼.
KR1020180143271A 2018-11-20 2018-11-20 클라우드 기반 유전자 분석 서비스 방법 및 플랫폼 KR20200058757A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020180143271A KR20200058757A (ko) 2018-11-20 2018-11-20 클라우드 기반 유전자 분석 서비스 방법 및 플랫폼
US16/231,062 US20200160935A1 (en) 2018-11-20 2018-12-21 Cloud-based gene analysis service method and platform

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180143271A KR20200058757A (ko) 2018-11-20 2018-11-20 클라우드 기반 유전자 분석 서비스 방법 및 플랫폼

Publications (1)

Publication Number Publication Date
KR20200058757A true KR20200058757A (ko) 2020-05-28

Family

ID=70728148

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180143271A KR20200058757A (ko) 2018-11-20 2018-11-20 클라우드 기반 유전자 분석 서비스 방법 및 플랫폼

Country Status (2)

Country Link
US (1) US20200160935A1 (ko)
KR (1) KR20200058757A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111885177A (zh) * 2020-07-28 2020-11-03 杭州绳武科技有限公司 一种基于云计算技术的生物信息分析云计算方法、系统
KR20230091799A (ko) * 2021-12-16 2023-06-23 주식회사 지놈인사이트테크놀로지 유전 정보 분석 및 보고 방법 및 시스템

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112614545B (zh) * 2020-12-29 2022-11-01 暨南大学 一种支持多属性匿名认证的基因序列安全比对方法及系统
CN115270169B (zh) * 2022-05-18 2023-06-13 蔓之研(上海)生物科技有限公司 一种基因数据的解压方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060059063A (ko) 2004-11-26 2006-06-01 (주)차바이오메드 인유두종바이러스 검출용 신규한 올리고뉴클레오티드프로브와 이를 이용한 인유두종바이러스 유전형 분석용dna칩, 분석키트 및 그 제조 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060059063A (ko) 2004-11-26 2006-06-01 (주)차바이오메드 인유두종바이러스 검출용 신규한 올리고뉴클레오티드프로브와 이를 이용한 인유두종바이러스 유전형 분석용dna칩, 분석키트 및 그 제조 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111885177A (zh) * 2020-07-28 2020-11-03 杭州绳武科技有限公司 一种基于云计算技术的生物信息分析云计算方法、系统
CN111885177B (zh) * 2020-07-28 2023-05-30 杭州绳武科技有限公司 一种基于云计算技术的生物信息分析云计算方法、系统
KR20230091799A (ko) * 2021-12-16 2023-06-23 주식회사 지놈인사이트테크놀로지 유전 정보 분석 및 보고 방법 및 시스템

Also Published As

Publication number Publication date
US20200160935A1 (en) 2020-05-21

Similar Documents

Publication Publication Date Title
EP3525212B1 (en) Bio-information data providing method based on multiple blockchains
Azencott Machine learning and genomics: precision medicine versus patient privacy
KR20200058757A (ko) 클라우드 기반 유전자 분석 서비스 방법 및 플랫폼
KR101982388B1 (ko) 통합된 소비자 게놈 서비스
US20070271604A1 (en) Secure Transaction of Dna Data
RU2765241C2 (ru) Ориентированная на заболевание геномная анонимизация
EP3826021B1 (en) Method for preserving and using genome and genomic data
JP6875498B6 (ja) 生体データ提供方法、生体データ暗号化方法および生体データ処理装置
JP2001357130A (ja) 診療情報管理システム
Abraham et al. Healthcare security using blockchain for pharmacogenomics
Dedeturk et al. Blockchain for genomics and healthcare: a literature review, current status, classification and open issues
Stein An Introduction to the Informatics of “Next‐Generation” Sequencing
KR102357453B1 (ko) 유전 정보를 이용한 시각화 방법 및 시각화 서비스 플랫폼
Cassa et al. A novel, privacy-preserving cryptographic approach for sharing sequencing data
US20230177211A1 (en) Anonymous digital identity derived from individual genome information
Dalpé et al. Opportunities and Challenges Provided by Cloud Repositories for Bioinformatics‐Enabled Drug Discovery
Alsaffar et al. Digital dna lifecycle security and privacy: an overview
Williams et al. The impact of the Human Genome Project on medical genetics
Fernandes Reconciling data privacy with sharing in next-generation genomic workflows
KR102471699B1 (ko) 개인정보를 보호하기 위한 유전체 데이터 비식별화 처리 장치, 유전체 데이터를 비식별화 처리한 비식별 유전 데이터를 생성하는 방법 및 컴퓨터 프로그램
Bellafqira et al. Robust and imperceptible watermarking scheme for GWAS data traceability
Ayday et al. Threats and solutions for genomic data privacy
CN114902343A (zh) 用于处理基因数据的方法和数据处理设备
Spratt et al. Special feature on evolution and genetics in medicine
US20130254547A1 (en) Encrypted transmission to and storage of surprisal data

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application