KR20240033688A - 유전적 변이 정보 제공 방법 및 장치 - Google Patents

유전적 변이 정보 제공 방법 및 장치 Download PDF

Info

Publication number
KR20240033688A
KR20240033688A KR1020240002438A KR20240002438A KR20240033688A KR 20240033688 A KR20240033688 A KR 20240033688A KR 1020240002438 A KR1020240002438 A KR 1020240002438A KR 20240002438 A KR20240002438 A KR 20240002438A KR 20240033688 A KR20240033688 A KR 20240033688A
Authority
KR
South Korea
Prior art keywords
information
output
area
browser
mutation
Prior art date
Application number
KR1020240002438A
Other languages
English (en)
Inventor
이종근
박성열
권영오
Original Assignee
주식회사 지놈인사이트테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020220167819A external-priority patent/KR102623609B1/ko
Application filed by 주식회사 지놈인사이트테크놀로지 filed Critical 주식회사 지놈인사이트테크놀로지
Publication of KR20240033688A publication Critical patent/KR20240033688A/ko

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Biochemistry (AREA)
  • Library & Information Science (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 개시는 적어도 하나의 프로세서에 의해 수행되는 유전 정보 분석 결과 제공 방법을 제공한다. 이 방법은 검체에 대한 유전 정보 분석 결과를 제공하기 위한 사용자 인터페이스를 출력하는 단계 및 사용자 인터페이스를 통해 수신된 사용자 입력에 응답하여, 유전 정보 분석 결과의 세부 정보를 포함하는 반응형(interactive) 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계를 포함할 수 있다. 사용자 인터페이스에 포함된 제1 영역에는, 특정 질병과 연관된 유전자 목록이 출력되고, 사용자 인터페이스에 포함된 제2 영역에는, 검체의 분석에 의해 획득된 변이(variant)에 관한 정보를 시각화하고(visualize) 탐색하기 위한 제1 브라우저가 출력되고, 사용자 인터페이스에 포함된 제3 영역에는, 검체의 분석에 의해 획득된 서열 정보(sequence)를 탐색하기 위한 제2 브라우저가 출력될 수 있다.

Description

유전 정보 분석 결과 제공 방법 및 시스템{METHOD AND SYSTEM FOR PROVIDING ANALYSIS RESULTS FOR GENETIC INFORMATION}
본 개시는 유전 정보 분석 결과 제공 방법에 관한 것으로, 구체적으로, 복수의 브라우저를 포함하는 사용자 인터페이스를 이용하여 유전 정보 분석 결과를 사용자에게 제공하는 방법 및 시스템에 관한 것이다.
최근 들어, 인간 질병과 관련된 유전자(gene)를 밝히기 위한 연구가 활발하게 진행되고 있다. 이 중에서 인체의 유전 정보를 가지고 있는 전장유전체 (genome)을 해독해 유전자 지도(genetic map)를 작성하고 이를 분석해, 인간의 질병 발생을 미리 예상하거나 발생한 질병을 진단하는 프로젝트가 활발하게 진행되고 있다.
프로젝트는 질병을 예측 또는 진단하기 위하여, 피검사자의 염기서열과 레퍼런스 염기서열을 비교하여 변이가 발생한 피검사자의 염기서열을 식별하고, 식별된 염기서열에 기초하여 피검사자에 대한 질병 상관관계를 도출하는 업무를 수행할 수 있다.
이러한 프로젝트를 효과적으로 실현하기 위하여, 차세대 염기서열 분석(NGS, Next Generation Sequencing) 기술이 이용되고 있다. 차세대 염기서열 분석 기술은 분절화된(fragmented) DNA(deoxyribonucleic acid)를 합성을 통한 염기분석(sequencing by synthesis)을 수행하여, 대량의 염기서열을 생성한다. 예컨대, 일루미나 회사의 시퀀싱 장치를 이용하여 차세대 염기서열 분석을 수행하는 경우, DNA 조각(fragment)을 판독하여 염기를 형광 물질로 표시한 이미지 파일이 생성된다. 그 후, 이미지 파일에 포함된 형광 물질이 컴퓨터가 판독 가능한 문자들의 집합인 염기서열로 변환되고, 염기서열이 레퍼런스 염기서열에 기초하여 정렬(매핑)된다. 정렬된 염기서열과 레퍼런스 염기서열을 비교하여, 변이가 발생된 위치와 유전자가 식별된다.
변이가 발생된 위치와 유전자에 기초하여, 인간의 질병을 예측한 보고서가 생성되어 의료 전문가에게 제공되고, 의료 전문가는 보고서에 기초하여 피검사자의 질병을 조기에 예측하거나 피검사자의 질병에 대한 정확한 진단을 통해 적절한 치료 계획을 수립할 수 있다.
한편, 의료 전문가는 보다 정확한 치료 계획을 수립하기 위해서, 보고서 작성에 기초가 되는 세부 분석 결과 및/또는 관련 데이터를 확인하기도 한다. 이 경우, 의료 전문가는 데이터베이스로 접근(access)하여 환자 관련 데이터를 검색할 수 있다. 예컨대, 특정 염색체에 대한 분석 데이터 및 특정 염색체와 연관된 유전자 정보를 모두 확인하고자 하는 경우, 의료 전문가는 데이터베이스로 접근하여 각각의 데이터를 일일이 검색해야 한다. 이때, 의료 전문가는 검색어를 통한 검색을 통해서 해당 데이터를 검색할 수 있다.
이렇게 의료 전문가가 데이터베이스로 접근하여, 필요한 데이터를 획득하는 방식은, 의료 전문가의 작업 효율과 편의성을 저하시킬 수 있다.
한편, 보고서 작성에 기초가 되는 세부 분석 결과 및/또는 관련 데이터의 일부를 제공하는 애플리케이션이 제공되고 있다. 그런데 이러한 애플리케이션은 단편적이거나 획일적인 세부 데이터만을 제공할 뿐, 의료 전문가가 요구하는 다양한 정보를 제공하지 못하고 있다.
본 개시는 상기와 같은 문제점을 해결하기 위한 유전 정보 분석 결과 제공 방법, 기록매체에 저장된 컴퓨터 프로그램 및 장치(시스템)를 제공한다.
본 개시는 방법, 장치(시스템) 및/또는 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램을 포함한 다양한 방식으로 구현될 수 있다.
본 개시의 일 실시예에 따르면, 적어도 하나의 프로세서에 의해서 수행되는 유전 정보 분석 결과 제공 방법은, 검체에 대한 유전 정보 분석 결과를 제공하기 위한 사용자 인터페이스를 출력하는 단계 및 사용자 인터페이스를 통해 수신된 사용자 입력에 응답하여, 유전 정보 분석 결과의 세부 정보를 포함하는 반응형(interactive) 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계를 포함하고, 사용자 인터페이스에 포함된 제1 영역에는, 특정 질병과 연관된 유전자 목록이 출력되고, 사용자 인터페이스에 포함된 제2 영역에는, 검체의 분석에 의해 획득된 변이(variant)에 관한 정보를 시각화하고(visualize) 탐색하기 위한 제1 브라우저가 출력되고, 사용자 인터페이스에 포함된 제3 영역에는, 검체의 분석에 의해 획득된 서열 정보(sequence)를 탐색하기 위한 제2 브라우저가 출력될 수 있다.
또한, 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는, 제1 영역에 출력된 유전자 목록 중에서 특정 돌연변이가 발생한 유전자를 선택하는 사용자 입력을 수신하는 단계, 특정 돌연변이가 발생한 유전자를 선택하는 사용자 입력에 응답하여, 특정 돌연변이가 발생한 유전자의 영역이 출력되도록 제1 브라우저를 제어하는 단계 및 특정 돌연변이가 발생한 유전자를 선택하는 사용자 입력에 응답하여, 서열 정보 중에서 특정 돌연변이가 발생한 유전자의 영역이 출력되도록 제2 브라우저를 제어하는 단계를 포함할 수 있다.
또한, 제2 브라우저를 제어하는 단계는, 제2 브라우저에 출력된 영역 내에서 특정 돌연변이의 위치를 나타내는 그래픽 객체를 출력하는 단계를 포함하고, 유전 정보 분석 결과 제공 방법은, 제2 브라우저를 제어하는 단계 이후에, 그래픽 객체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 검체에 대한 유전 정보 분석 결과 중 특정 돌연변이에 관한 세부 정보를 제2 브라우저를 통해 출력하는 단계를 더 포함할 수 있다.
또한, 제2 브라우저를 제어하는 단계는, 특정 돌연변이가 발생한 유전자와 연관된 전사 모델(transcription model) 목록을 획득하는 단계, 전사 모델 목록에 포함된 복수의 전사 모델 각각의 우선순위에 기초하여, 출력될 타깃 전사 모델을 결정하는 단계 및 결정된 타깃 전사 모델을 통해 전사되어 번역된 결과를 포함하는 아미노산 서열 정보가 출력되도록, 제2 브라우저를 제어하는 단계를 포함할 수 있다.
또한, 제2 브라우저를 제어하는 단계는, 특정 돌연변이가 발생한 유전자와 연관된 제1 아미노산이 레퍼런스 염기서열로부터 번역된 제2 아미노산과 상이하다고 판정된 경우, 제1 아미노산과 제2 아미노산의 차이를 나타내는 아미노산 변경 정보가 출력되도록 제2 브라우저를 제어하는 단계를 포함하고, 아미노산 변경 정보는, 서열 정보 내에서 특정 돌연변이의 위치와 연관하여 출력될 수 있다.
또한, 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는, 전사 모델 목록이 출력되도록 제2 브라우저를 제어하는 단계, 전사 모델 목록에서 특정 전사 모델을 선택하는 사용자 입력을 수신하는 단계 및 특정 전사 모델을 통해 전사되어 번역된 결과를 포함하는 아미노산 서열 정보가 출력되도록, 제2 브라우저를 제어하는 단계를 포함할 수 있다.
또한, 환자 정보에 포함된 질병 코드에 기초하여, 특정 질병이 식별되고, 유전자 목록은, 검체로부터 발견된 돌연변이들 중에서, 특정 질병과 연관된 돌연변이가 발생한 적어도 하나의 유전자를 포함할 수 있다.
또한, 특정 질병은 암과 연관된 질병이고, 유전자 목록은, 검체로부터 발견된 돌연변이들 중에서 질병의 유발에 관련된 돌연변이가 발생된 적어도 하나의 유전자를 포함하는 제1 드라이버 목록 및 검체로부터 발견된 돌연변이들 중에서 질병의 억제에 관련된 돌연변이가 발생한 적어도 하나의 유전자를 포함하는 제2 드라이버 목록을 포함할 수 있다.
또한, 제1 드라이버 목록에 포함된 적어도 하나의 유전자의 레이블은 제1 그래픽 요소가 이용되어 제1 영역에서 시각화되고, 제2 드라이버 목록에 포함된 적어도 하나의 유전자 레이블은 제2 그래픽 요소가 이용되어 제1 영역에서 시각화될 수 있다.
또한, 제2 브라우저에 출력된 영역 내에 특정 돌연변이의 위치와 연관된 그래픽 객체가 출력되고, 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는, 그래픽 객체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 서열 정보 중에서 특정 돌연변이와 연관된 영역이 확대되어 출력되도록 제2 브라우저를 제어하는 단계를 포함할 수 있다.
또한, 확대된 서열 정보 영역에는, 변이가 발생한 염기(base) 또는 아미노산 식별자 중 적어도 하나와 연관된 문자가 디스플레이될 수 있다.
또한, 유전 정보 분석 결과 제공 방법은 사용자 인터페이스의 제4 영역에 포함된 코멘트 입력란을 통해 사용자의 코멘트를 수신하는 단계 및 검체와 연관된 프로젝트에 참여 중인 적어도 하나의 타 사용자에게 수신된 사용자의 코멘트를 제공하는 단계를 더 포함할 수 있다.
또한, 검체에 대한 종양 변이 부담에 대한 플롯(Plot)과 연관된 제1 정보가 사용자 인터페이스의 제5 영역을 통해 출력되고, 제1 정보는 검체에 대한 단일 염기서열 변이(Single Nucleotide Variation), 검체에 대한 인델(indel) 또는 검체에 대한 구조 변이(SV: Structural Variants) 중 적어도 하나에 대한 종양 변이 부담 통계를 포함할 수 있다.
또한, 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는, 타 검체에 대한 종양 변이 부담에 대한 플롯과 연관된 제2 정보를 획득하는 단계 및 제1 정보와 제2 정보를 연관시켜 출력하는 단계를 포함할 수 있다.
또한, 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는, 검체로부터 발견된 돌연변이들 중에서 특정 돌연변이에 대한 비교를 요청하는 사용자 입력을 수신하는 단계, 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 획득하는 단계 및 검체로부터 발견된 특정 돌연변이에 대한 세부 정보 및 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 연관시켜 출력하는 단계를 더 포함할 수 있다.
또한, 제1 영역에는 유전자 명칭이 입력되는 입력란이 출력되고, 유전 정보 분석 결과 제공 방법은, 입력란을 통해서 입력된 유전자 명칭을 수신하는 단계 및 수신된 명칭의 유전자를 유전자 목록에 추가하는 단계를 더 포함할 수 있다.
상술한 유전 정보 분석 결과 제공 방법을 컴퓨터에서 실행하기 위해 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램이 제공될 수 있다.
본 개시의 일 실시예에 따른 컴퓨팅 장치는, 메모리, 및 메모리와 연결되고, 메모리에 포함된 컴퓨터 판독 가능한 적어도 하나의 프로그램을 실행하도록 구성된 적어도 하나의 프로세서를 포함하고, 적어도 하나의 프로그램은, 검체에 대한 유전 정보 분석 결과를 제공하기 위한 사용자 인터페이스를 출력하고, 사용자 인터페이스를 통해 수신된 사용자 입력에 응답하여, 유전 정보 분석 결과의 세부 정보를 포함하는 반응형(interactive) 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하기 위한 명령어들을 포함하고, 사용자 인터페이스에 포함된 제1 영역에는, 특정 질병과 연관된 유전자 목록이 출력되고, 사용자 인터페이스에 포함된 제2 영역에는, 검체의 분석에 의해 획득된 변이(variant)에 관한 정보를 시각화하고(visualize) 탐색하기 위한 제1 브라우저가 출력되고, 사용자 인터페이스에 포함된 제3 영역에는, 검체의 분석에 의해 획득된 서열 정보(sequence)를 탐색하기 위한 제2 브라우저가 출력될 수 있다.
본 개시의 일부 실시예에 따르면, 사용자 인터페이스에 포함된 복수의 영역을 통해서 유전 정보 분석 결과에 연관된 다양한 정보가 효율적으로 제공될 수 있다.
본 개시의 일부 실시예에 따르면, 방대한 분량의 유전 정보 분석 결과를 인터랙티브하게 조회 및 탐색할 수 있는 사용자 인터페이스가 제공될 수 있다.
본 개시의 일부 실시예에 따르면, 사용자 인터페이스에는 검체에서 발견된 변이에 관한 정보를 시각화하고 탐색할 수 있는 제1 브라우저 및 검체의 분석에 의해 획득된 염기서열, 아미노산 서열, 및/또는 변이에 대한 세부 정보를 탐색할 수 있는 제2 브라우저가 포함되고, 사용자는 제1 브라우저와 제2 브라우저를 이용하여 손쉽게 전체 염기서열과 유전자 정보를 함께 탐색할 수 있다.
본 개시의 일부 실시예에 따르면, 제1 브라우저와 제2 브라우저가 서로 연동되어, 하나의 브라우저에서 출력되는 정보가 변경되면, 변경된 정보에 상응하여 다른 하나의 브라우저에서 출력되는 정보가 변경될 수 있다. 이러한 구성 하에서, 사용자는 특정 입력이나 검색에 따른 연동된 정보를 파악할 수 있기 때문에, 브라우저 사용에 있어서의 편의성이 향상될 수 있다.
본 개시의 일부 실시예에 따르면, 제1 브라우저 내에서 상이한 유형의 변이가 출력되는 경우, 상이한 그래픽 객체가 이용되어 각기 다른 유형의 변이가 제1 브라우저에 출력될 수 있다. 이에 따라, 사용자는 염기서열에서 발생된 변이의 유형을 직관적으로 식별하고 다양한 유형의 변이들의 발생 양상을 손쉽게 파악할 수 있다.
본 개시의 일부 실시예에 따르면, 제1 브라우저 내에서 변이가 밀집되어 위치된 경우, 포인터에 의해서 특정 변이가 강조되거나 변이가 밀집된 영역이 자동적으로 확대되거나, 또는 밀집 영역에 위치한 복수의 변이가 로테이션되어 강조되는 등의 그래픽 처리가 수행될 수 있다. 이에 따라, 변이가 밀집되어 있어도 각 변이가 편리하고 정확하게 사용자에 의해 식별될 수 있다.
본 개시의 일부 실시예에 따르면, 드라이버 목록 또는 유전자 목록에 포함된 특정 유전자가 선택되면, 선택된 특정 유전자와 연관된 영역, 예컨대 해당 염색체 또는 유전자가 제1 브라우저에 자동적으로 출력되고, 선택된 유전자와 연관된 영역의 서열 및/또는 기타 변이 관련 정보가 제2 브라우저에 자동적으로 출력될 수 있다. 이에 따라, 사용자는 유전자를 선택하는 것을 통해서, 제1 브라우저와 제2 브라우저에 출력되는 정보를 손쉽게 변경할 수 있다.
본 개시의 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급되지 않은 다른 효과들은 청구범위의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자('통상의 기술자'라 함)에게 명확하게 이해될 수 있을 것이다.
본 개시의 실시예들은, 이하 설명하는 첨부 도면들을 참조하여 설명될 것이며, 여기서 유사한 참조 번호는 유사한 요소들을 나타내지만, 이에 한정되지는 않는다.
도 1은 본 개시의 일 실시예들에 따른 정보 처리 시스템과 그의 서비스 제공 환경을 개략적으로 설명하기 위한 예시적인 도면이다.
도 2는 본 개시의 일 실시예에 따른 정보 처리 시스템이 복수의 사용자 단말과 통신 가능하도록 연결된 구성을 나타내는 개요도이다.
도 3은 본 개시의 일 실시예에 따른 사용자 단말 및 정보 처리 시스템의 내부 구성을 나타내는 블록도이다.
도 4는 본 개시의 일 실시예에 따른 로그인 인증에 성공한 경우에 출력되는 초기 화면을 예시하는 도면이다.
도 5는 본 개시의 일 실시예에 따른 도 4의 제5 영역에 대한 레이아웃을 예시하는 도면이다.
도 6은 본 개시의 일 실시예에 따른 제1 브라우저와 제2 브라우저를 포함하는 사용자 인터페이스를 예시하는 도면이다.
도 7은 본 개시의 일 실시예에 따른 도 6의 제2 영역에 대한 레이아웃을 예시하는 도면이다.
도 8은 도 7의 제3 서브 영역을 확대한 도면이다.
도 9는 도 7의 제1 브라우저가 출력된 제4 서브 영역을 확대한 도면이다.
도 10은 서로 다른 그래픽 객체를 통해서 시각화된 구조 변이를 포함하는 제1 정보 출력 영역에 대한 다른 예시를 나타내는 도면이다.
도 11은 구조 변이와 연관된 그래픽 객체들이 밀집된 경우에, 그래픽 객체 처리에 대한 일 예시를 나타내는 도면이다.
도 12은 구조 변이와 연관된 그래픽 객체들이 밀집된 경우에, 그래픽 객체 처리에 대한 다른 예시를 나타내는 도면이다.
도 13은 구조 변이와 연관된 그래픽 객체들이 밀집된 경우에, 그래픽 객체 처리에 대한 또 다른 예시를 나타내는 도면이다.
도 14는 제1 브라우저에서 확대된 영역을 예시하는 도면이다.
도 15는 본 개시의 일 실시예에 따른 2개의 염색체가 출력된 제1 브라우저의 화면을 예시하는 도면이다.
도 16은 도 7의 제2 브라우저가 출력된 제5 서브 영역을 보다 자세히 도시한 도면이다.
도 17은 본 개시의 일 실시예에 따른 돌연변이에 대한 세부 정보가 출력되는 화면을 예시하는 도면이다.
도 18은 염기서열 및 아미노산 서열 중 특정 영역이 확대되어 디스플레이되도록 설정된 정보 출력 영역을 예시하는 도면이다.
도 19는 전사 모델 목록이 출력된 제2 브라우저를 예시하는 도면이다.
도 20은 본 개시의 일 실시예에 따른, 특정 염색체와 연관된 정보가 출력된 제1 브라우저의 화면을 예시하는 도면이다.
도 21은 제1 브라우저에서 선택된 염색체와 연관된 유전자와 연동하여 동작하는 제2 브라우저의 화면을 예시하는 도면이다.
도 22는 드라이버 목록에서 선택된 돌연변이 정보에 기초하여 동작되는 제1 브라우저의 화면과 제2 브라우저의 화면을 예시하는 도면이다.
도 23은 드라이버 목록에서 선택된 돌연변이 정보에 기초하여 동작하는 제1 브라우저의 화면과 제2 브라우저의 화면에 대한 다른 예시를 나타내는 도면이다.
도 24는 도 7의 제6 서브 영역을 확대한 도면이다.
도 25는 본 개시의 일 실시예에 따른 유전자 목록에서 선택된 유전자에 기초하여 동작하는 제1 브라우저의 화면과 제2 브라우저의 화면을 예시하는 도면이다.
도 26은 도 7의 제7 서브 영역을 확대한 도면이다.
도 27은 도 7의 제8 서브 영역을 확대한 도면이다.
도 28은 본 개시의 일 실시예에 따른 유전 정보 분석 결과 제공 방법을 설명하기 위한 흐름도이다.
이하, 본 개시의 실시를 위한 구체적인 내용을 첨부된 도면을 참조하여 상세히 설명한다. 다만, 이하의 설명에서는 본 개시의 요지를 불필요하게 흐릴 우려가 있는 경우, 널리 알려진 기능이나 구성에 관한 구체적 설명은 생략하기로 한다.
첨부된 도면에서, 동일하거나 대응하는 구성요소에는 동일한 참조부호가 부여되어 있다. 또한, 이하의 실시예들의 설명에 있어서, 동일하거나 대응되는 구성요소를 중복하여 기술하는 것이 생략될 수 있다. 그러나, 구성요소에 관한 기술이 생략되어도, 그러한 구성요소가 어떤 실시예에 포함되지 않는 것으로 의도되지는 않는다.
개시된 실시예의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 개시는 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 개시가 완전하도록 하고, 본 개시가 통상의 기술자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것일 뿐이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 개시된 실시예에 대해 구체적으로 설명하기로 한다. 본 명세서에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 관련 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서, 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 명세서에서의 단수의 표현은 문맥상 명백하게 단수인 것으로 특정하지 않는 한, 복수의 표현을 포함한다. 또한, 복수의 표현은 문맥상 명백하게 복수인 것으로 특정하지 않는 한, 단수의 표현을 포함한다. 명세서 전체에서 어떤 부분이 어떤 구성요소를 포함한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다.
또한, 명세서에서 사용되는 '모듈' 또는 '부'라는 용어는 소프트웨어 또는 하드웨어 구성요소를 의미하며, '모듈' 또는 '부'는 어떤 역할들을 수행한다. 그렇지만, '모듈' 또는 '부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '모듈' 또는 '부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서, '모듈' 또는 '부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 또는 변수들 중 적어도 하나를 포함할 수 있다. 구성요소들과 '모듈' 또는 '부'들은 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '모듈' 또는 '부'들로 결합되거나 추가적인 구성요소들과 '모듈' 또는 '부'들로 더 분리될 수 있다.
본 개시의 일 실시예에 따르면, '모듈' 또는 '부'는 프로세서 및 메모리로 구현될 수 있다. '프로세서'는 범용 프로세서, 중앙 처리 장치(CPU), 마이크로프로세서, 디지털 신호 프로세서(DSP), 제어기, 마이크로제어기, 상태 머신 등을 포함하도록 넓게 해석되어야 한다. 몇몇 환경에서, '프로세서'는 주문형 반도체(ASIC), 프로그램가능 로직 디바이스(PLD), 필드 프로그램가능 게이트 어레이(FPGA) 등을 지칭할 수도 있다. '프로세서'는, 예를 들어, DSP와 마이크로프로세서의 조합, 복수의 마이크로프로세서들의 조합, DSP 코어와 결합한 하나 이상의 마이크로프로세서들의 조합, 또는 임의의 다른 그러한 구성들의 조합과 같은 처리 디바이스들의 조합을 지칭할 수도 있다. 또한, '메모리'는 전자 정보를 저장 가능한 임의의 전자 컴포넌트를 포함하도록 넓게 해석되어야 한다. '메모리'는 임의 액세스 메모리(RAM), 판독-전용 메모리(ROM), 비-휘발성 임의 액세스 메모리(NVRAM), 프로그램가능 판독-전용 메모리(PROM), 소거-프로그램가능 판독 전용 메모리(EPROM), 전기적으로 소거가능 PROM(EEPROM), 플래쉬 메모리, 자기 또는 마킹 데이터 저장장치, 레지스터들 등과 같은 프로세서-판독가능 매체의 다양한 유형들을 지칭할 수도 있다. 프로세서가 메모리로부터 정보를 판독하고/하거나 메모리에 정보를 기록할 수 있다면 메모리는 프로세서와 전자 통신 상태에 있다고 불린다. 프로세서에 집적된 메모리는 프로세서와 전자 통신 상태에 있다.
본 개시에서, '시스템'은 서버 장치와 클라우드 장치 중 적어도 하나의 장치를 포함할 수 있으나, 이에 한정되는 것은 아니다. 예를 들어, 시스템은 하나 이상의 서버 장치로 구성될 수 있다. 다른 예로서, 시스템은 하나 이상의 클라우드 장치(예: 염기서열 분석 장치 등)로 구성될 수 있다. 또 다른 예로서, 시스템은 서버 장치와 클라우드 장치가 함께 구성되어 동작될 수 있다.
또한, 이하의 실시예들에서 사용되는 제1, 제2, A, B, (a), (b) 등의 용어는 어떤 구성요소를 다른 구성요소와 구별하기 위해 사용되는 것일 뿐, 그 용어에 의해 해당 구성요소의 본질이나 차례 또는 순서 등이 한정되지는 않는다.
또한, 이하의 실시예들에서, 어떤 구성요소가 다른 구성요소에 '연결', '결합' 또는 '접속'된다고 기재된 경우, 그 구성요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성요소 사이에 또 다른 구성요소가 '연결', '결합' 또는 '접속'될 수도 있다고 이해되어야 한다.
또한, 이하의 실시예들에서 사용되는 '포함한다(comprises)' 및/또는 '포함하는(comprising)'은 언급된 구성요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
본 개시의 다양한 실시예들을 설명하기에 앞서, 사용되는 용어에 대하여 설명하기로 하기로 한다.
본 개시의 실시예에서, '그래픽 요소(graphic element)'는 도형, 색상 또는 텍스트 중 적어도 하나를 포함한 그래픽 기반의 데이터일 수 있다. 예컨대, 특정 그래픽 요소는 특정 도형, 특정 색상 및/또는 특정 텍스트일 수 있다.
본 개시의 실시예들에서, '그래픽 객체(graphic object)'는 적어도 하나의 그래픽 요소가 포함되어 형성된 것으로서, 사용자가 육안으로 식별할 수 있는 그래픽 기반의 정보일 수 있다. 예컨대, 그래픽 객체는 특정 색상을 가지는 특정 형태의 도형으로 구현될 수 있다. 가령, 제1 그래픽 객체는 제1 색상과 제1 크기를 가지는 제1 형태의 도형일 수 있고, 제2 그래픽 객체는 제2 색상과 제2 크기를 가지는 제2 형태의 도형일 수 있다.
본 개시의 실시예들에서, '유전 정보 분석 결과'란 전장유전체(whole genome) 또는 전장유전체의 일부(예컨대, 특정 염색체, 특정 유전자, 타깃 패널 등)를 분석한 결과를 지칭할 수 있다. 설명의 편의를 위하여 본 개시의 실시예들에서는 전장유전체에 대한 분석 정보, 특정 염색체에 대한 분석 정보, 특정 유전자에 대한 분석 정보, 타깃 패널에 대한 분석 정보를 구분하지 않고, '유전체 분석 정보'로 지칭하였음에 유의한다.
본 개시의 실시예들에서, '제1 브라우저(browser)'는 유전체 분석 정보 중에서 변이들의 탐색을 지원하는 위한 응용 프로그램을 지칭할 수 있다. 몇몇 실시예에서, 제1 브라우저는 전장유전체 전 영역에서 발견된 변이들을 조망할 수 있는 뷰를 제공할 수 있다.
본 개시의 실시예들에서, '제2 브라우저'는 유전체 분석 결과 획득된 서열 정보를 유전자 단위의 수준에서 탐색을 지원하기 위한 응용 프로그램을 지칭할 수 있다. 여기서, 서열 정보는 전사 모델(Transcription Model)에 의해 DNA 서열의 일부 영역이 전사된 RNA(Ribonucleic acid) 서열 및/또는, 그러한 서열들에 대응되어 번역된 아미노산 서열을 포함할 수 있다.
제1 브라우저 및/또는 제2 브라우저는 자바스크립트, HTLM(Hypertext Markup Language), API(Application Programming Interface) 등과 같은 다양한 프로그래밍 도구가 이용되어 구현될 수 있다.
본 개시의 실시예들에서, '염기(base)'는 염기서열을 구성하는 단위로서 뉴클레오타이드의 구성 성분일 수 있다. 예컨대, 염기는 아데닌(adenine)을 나타내는 'A', 사이토신(cytosine)을 나타내는 'C' 및 구아닌(Guanine)을 나타내는 'G' 및 타이민(thymine)을 나타내는 'T' 중에서 어느 하나로 표현될 수 있다.
본 개시의 실시예들에서, '염기서열'은 복수의 염기가 배열되어 구성된 것일 수 있다. 염기서열은 이미 알려진 복수 개의 염색체를 포함할 수 있다.
본 개시의 실시예들에서, '변이'는 검체의 염기서열 중에서 레퍼런스 염기서열과 차이가 있는 부분으로서 식별될 수 있다. 여기서, 변이는 변종/이형(variant), 돌연변이(mutation) 등을 포함할 수 있다. 또한, 변이는 어떤 이유(예: DNA 손상, 복제 오류 등)에 의해 염기서열이 추가, 변경 및/또는 삭제되는 현상을 지칭할 수 있다.
본 개시의 실시예들에서, 'DNA 라이브러리'는 시퀀싱의 대상이 되는 유전 물질을 시퀀싱 장치가 분석하기에 적합한 형태로 처리한 것이다. DNA 라이브러리에는 하나 이상의 피검사자들의 세포(즉, 검체)로부터 획득된 무수히 많은 DNA 조각들(DNA fragments)을 포함될 수 있다.
본 개시의 실시예들에서, '마킹 코드'는 DNA 조각에 포함된 염기와 관련된 코드일 수 있다. 일 실시예에서, 마킹 코드는 이미지 데이터일 수 있다. 마킹 코드를 표기할 때, 마킹 코드의 속성이 이용될 수 있다. 몇몇 실시예에 따르면, 마킹 코드의 속성으로서, 서로 구별되는 형광 물질이 이용될 수 있다. 예컨대, 제1 마킹 코드는 아데닌(adenine)을 나타내는 제1 형광 물질로서 표기될 수 있고, 제2 마킹 코드는 사이토신(cytosine)을 나타내는 제2 형광 물질로 표기될 수 있다. 다른 예로서, 제3 마킹 코드는 구아닌(Guanine)을 나타내는 제3 형광 물질로 표기될 수 있고, 제4 마킹 코드는 타이민(thymine)을 나타내는 제4 형광 물질로 표기될 수 있다.
본 개시의 실시예들에서, '마킹 데이터'는 하나 이상의 마킹 코드를 포함하는 데이터일 수 있다. 예컨대, 마킹 데이터는 이미지 파일일 수 있다.
이하, 본 개시의 다양한 실시예들에 대하여 첨부된 도면에 따라 상세하게 설명한다.
도 1은 본 개시의 일 실시예들에 따른 정보 처리 시스템(110)과 그의 서비스 제공 환경을 개략적으로 설명하기 위한 예시적인 도면이다. 먼저, 피검사자의 DNA 시료를 포함한 DNA 라이브러리(10)가 생성될 수 있다. 예컨대, 분석 대상이 되는 피검사자(예컨대, 환자)의 세포(즉, 검체)가 채취되고, 세포가 소정의 용액과 함께 실험관에 보관된 상태에서 가열되고 원심 분리되는 등의 전처리 작업을 통해서, 피검사자의 세포로부터 획득된 무수히 많은 DNA 조각들을 포함하는 DNA 라이브러리(10)가 만들어질 수 있다.
DNA 라이브러리(10)에는 한 명의 피검사자로부터 획득된 DNA 시료만이 포함될 수도 있지만, 통상적으로 복수의 피검사자들로부터 획득된 DNA 시료들이 포함될 수 있다. 예컨대, 제1 피검사자의 세포로부터 생성된 DNA 시료와 제2 피검사자의 세포로부터 생성된 DNA 시료가 DNA 라이브러리(10)에 함께 포함될 수 있다. 즉, 둘 이상의 피검사자에 대한 시퀀싱 작업이 시퀀싱 장치(120)에 의해서 한 번에 동시에 수행될 수 있다.
DNA 라이브러리(10)가 플로우 셀(flow cell)에 장착되고, 플로우 셀이 시퀀싱 장치(120)로 투입될 수 있다. 몇몇 실시예에서는, DNA 라이브러리(10)를 시퀀싱 장치(120)로 투입시킬 수 있는 임의의 방법이 이용될 수 있다.
시퀀싱 장치(120)는 DNA 라이브러리(10)에 포함된 각 DNA 조각의 염기 유형을 식별하고, 식별된 염기 유형과 대응되는 마킹 코드를 포함하는 마킹 데이터를 생성할 수 있다. 일 실시예에 따르면, 시퀀싱 장치(120)는 매 주기마다, 각 DNA 조각에 포함된 하나의 염기를 식별하고, 식별된 염기에 대응되는 마킹 코드를 생성하고, 생성된 마킹 코드를 마킹 데이터에 추가적으로 기록함으로써 마킹 데이터를 업데이트를 할 수 있다. 시퀀싱 장치(120)는 매 주기마다, 모든 DNA 조각에 대하여 생성된 마킹 코드들을 표현하는 하나의 이미지 파일을 생성할 수 있다. 마킹 데이터는 매 주기마다 생성된 이미지 파일들의 집합일 수 있으며, 정보 처리 시스템(110)이 접근(access)할 수 있는 저장 장치에 저장될 수 있다. 일정한 주기(예컨대, 300 주기)가 경과되면, 모든 주기에서 생성된 마킹 코드들을 포함하는 마킹 데이터(20)가 생성될 수 있다. 일 실시예에 따르면, DNA 조각의 개수에 상응하는 다수의 마킹 데이터(20)가 시퀀싱 장치(120)에 의해 생성될 수 있다.
정보 처리 시스템(110)은 염기서열을 분석하고, 분석된 결과를 포함한 유전 정보 분석 결과 리포트(30)를 출력하는 시스템일 수 있다. 가령, 정보 처리 시스템(110)은 시퀀싱 장치(120)에서 마킹 데이터(20)의 생성이 완료되면, 마킹 데이터(20)에 기초하여 염기서열을 생성할 수 있다. 일 실시예에 따르면, DNA 조각의 개수에 상응하는 다수의 마킹 데이터(20)가 시퀀싱 장치(120)에 의해 생성되고, 정보 처리 시스템(110)은 DNA 조각 개수와 상응하는 개수의 리드들을 포함하는 염기서열을 생성할 수 있다. 예컨대, DNA 라이브러리(10)에 n개(여기서, n은 자연수)의 DNA 조각이 포함된 경우, 시퀀싱 장치(120)는 특정 주기에 n개의 마킹 데이터(20)를 생성할 수 있다. 이어서, 정보 처리 시스템(110)은 n개의 마킹 데이터(20)에 기초하여 n개의 리드를 포함하는 검체에 대한 염기서열을 생성할 수 있다.
지금까지는, 시퀀싱 장치(120)가 마킹 데이터(20)를 출력하고, 정보 처리 시스템(110)이 마킹 데이터(20)로부터 염기서열을 생성하는 실시예를 설명하였지만, 이와 다른 실시예에서는 시퀀싱 장치(120)가 마킹 데이터(20) 대신에 염기서열(예컨대, FASTQ 파일)을 출력할 수도 있다.
또한, 정보 처리 시스템(110)은 검체에 대한 염기서열과 레퍼런스 염기서열을 비교하여, 검체에 대한 염기서열을 정렬(align)하고, 정렬된 염기서열과 레퍼런스 염기서열 간의 차이를 비교하는 것을 통해, 검체로부터 발견되는 복수의 변이를 식별할 수 있다. 정보 처리 시스템(110)은 검체로부터 발견된 복수의 변이들에 기초하여, 유전 정보 분석 결과를 포함하는 유전 정보 분석 결과 리포트(30)를 생성할 수 있다. 예를 들어, 유전 정보 분석 결과 리포트(30)는 유전 정보 분석 결과 및 그와 연관된 임의의 정보를 포함할 수 있는데, 예를 들어, 검체로부터 발견된 돌연변이의 위치, 각 돌연변이의 유형(type), 분석 결과에 대한 통계 정보, 종양 변이 부담(Tumor Mutational Burden: TMB)과 관련된 정보, 돌연변이 시그니처(signature)와 관련된 정보 등을 포함할 수 있으나 이에 한정되지 않는다. 또한 유전 정보 분석 결과 리포트(30)는 검체를 채취한 환자의 정보, 특정 질병과 관련된 드라이버 목록, 돌연변이가 발생한 유전자에 대한 세부 정보 등을 더 포함할 수 있다.
여기서, 유전 정보 분석 결과 리포트(30)는 후술하는 바와 같이, 사용자 인터페이스를 이용하여 사용자(예컨대, 의료진)에게 제공될 수 있다. 여기서, 사용자 인터페이스는 염기서열의 분석 결과를 편리하게 제공하기 위한 수단으로서, 사용자 입력에 기초하여 유전 정보 분석 결과에 대한 세부 정보를 포함하는 반응형(interactive) 응답 정보를 사용자에게 제공할 수 있다. 예를 들어, 사용자가 특정 돌연변이를 선택하면, 돌연변이와 관련된 염색체와 유전자 정보가 사용자 인터페이스를 통해 출력될 수 있다.
정보 처리 시스템(110)에 포함되거나 또는 연결된 디스플레이 수단에 사용자 인터페이스가 출력되고, 사용자 인터페이스를 통해서 유전체 분석과 관련된 정보가 출력될 수 있다. 다른 예로서, 정보 처리 시스템(110)은 네트워크를 통하여 사용자 단말로 유전체 분석과 관련된 정보를 전송하고, 사용자 단말은 사용자 인터페이스를 통해서 수신된 유전체 분석과 관련된 정보를 출력할 수 있다.
도 2는 본 개시의 일 실시예에 따른 정보 처리 시스템(230)이 복수의 사용자 단말(210_1, 210_2, 210_3)과 통신 가능하도록 연결된 구성을 나타내는 개요도이다. 도시된 바와 같이, 복수의 사용자 단말(210_1, 210_2, 210_3)은 네트워크(220)를 통해 검체에 대한 유전 정보 분석 결과를 제공할 수 있는 정보 처리 시스템(230)과 연결될 수 있다. 예를 들어, 도 1의 정보 처리 시스템(110)은 도 2의 정보 처리 시스템(230)과 동일한 시스템일 수 있다.
일 실시예에서, 정보 처리 시스템(230)은 유전 정보 분석 서비스 등을 실행 가능한 프로그램(예를 들어, 다운로드 가능한 애플리케이션) 및 데이터를 저장, 제공 및 실행할 수 있는 하나 이상의 서버 장치 및/또는 데이터베이스, 또는 클라우드 컴퓨팅 서비스 기반의 하나 이상의 분산 컴퓨팅 장치 및/또는 분산 데이터베이스를 포함할 수 있다. 일 실시예에서, 정보 처리 시스템(230)에 의해 제공되는 유전 정보 분석 서비스는 복수의 사용자 단말(210_1, 210_2, 210_3) 각각에 설치된 유전 정보 분석 서비스 관련 애플리케이션 등을 통해 사용자에게 제공될 수 있다. 예컨대, 정보 처리 시스템(230)은 유전 정보 분석 결과 리포트의 일부 또는 전부를 사용자 단말(210_1, 210_2, 210_3)로 전송하고, 사용자 단말(210_1, 210_2, 210_3)은 사용자 인터페이스를 통하여 유전 정보 분석 결과 리포트에 포함된 데이터를 출력할 수 있다.
복수의 사용자 단말(210_1, 210_2, 210_3)은 네트워크(220)를 통해 정보 처리 시스템(230)과 통신할 수 있는 컴퓨팅 장치일 수 있다. 네트워크(220)는 복수의 사용자 단말(210_1, 210_2, 210_3)과 정보 처리 시스템(230) 사이의 통신이 가능하도록 구성될 수 있다. 네트워크(220)는 설치 환경에 따라, 예를 들어, 이더넷(Ethernet), 유선 홈 네트워크(Power Line Communication), 전화선 통신 장치 및 RS-serial 통신 등의 유선 네트워크, 이동통신망, WLAN(Wireless LAN), Wi-Fi, Bluetooth 및 ZigBee 등과 같은 무선 네트워크 또는 그 조합으로 구성될 수 있다. 통신 방식은 제한되지 않으며, 네트워크(220)가 포함할 수 있는 통신망(일례로, 이동통신망, 유선 인터넷, 무선 인터넷, 방송망, 위성망 등)을 활용하는 통신 방식만 아니라 사용자 단말(210_1, 210_2, 210_3) 사이의 근거리 무선 통신 역시 포함될 수 있다.
복수의 사용자 단말(210_1, 210_2, 210_3)은 유전 정보 분석 서비스와 관련 애플리케이션을 이용하여 유전 정보 분석 결과 리포트에 포함된 데이터의 일부 또는 전부를 정보 처리 시스템(230)으로부터 수신할 수 있다. 다른 예로서, 사용자 단말(210_1, 210_2, 210_3)은 웹 브라우저를 이용하여 유전 정보 분석 결과 리포트에 포함된 데이터의 일부 또는 전부를 정보 처리 시스템(230)으로부터 수신할 수 있다. 사용자 단말(210_1, 210_2, 210_3)은 후술하는 사용자 인터페이스를 이용하여, 유전 정보 분석 결과 리포트에 포함된 일부 정보(예컨대, 유전 정보 분석 결과에 대한 세부 정보)를 출력할 수 있다. 사용자 단말(210_1, 210_2, 210_3)은 사용자 인터페이스에서 특정 메뉴 또는 특정 그래픽 객체가 선택되는 사용자 입력이 수신되면, 사용자 입력에 상응한 반응형(interactive) 응답 정보를 출력할 수 있다. 여기서, 반응형 응답 정보는 유전 정보 분석 결과에 대한 세부 정보를 포함할 수 있다.
일 실시예에 따르면, 사용자 단말(210_1, 210_2, 210_3)은 사용자 인터페이스를 통해서 사용자 입력이 수신되면, 이 사용자 입력과 연관된 데이터 요청을 정보 처리 시스템(230)으로 전송할 수 있다. 그 후, 사용자 단말(210_1, 210_2, 210_3)은 정보 처리 시스템(230)으로부터 사용자 입력과 연관된 데이터(예컨대, 유전 정보 분석 결과에 대한 세부 정보)를 수신하여 사용자 인터페이스를 통해 출력할 수 있다.
도 2에서 휴대폰 단말(210_1), 태블릿 단말(210_2) 및 PC 단말 (210_3)이 사용자 단말의 예로서 도시되었으나, 이에 한정되지 않으며, 사용자 단말(210_1, 210_2, 210_3)은 유선 및/또는 무선 통신이 가능하고 애플리케이션 또는 웹 브라우저 등이 설치되어 실행될 수 있는 임의의 컴퓨팅 장치일 수 있다. 예를 들어, 사용자 단말은, 스마트폰, 휴대폰, 내비게이션, 컴퓨터, 노트북, 디지털방송용 단말, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 태블릿 PC 등을 포함할 수 있다. 또한, 도 2에는 3개의 사용자 단말(210_1, 210_2, 210_3)이 네트워크(220)를 통해 정보 처리 시스템(230)과 통신하는 것으로 도시되어 있으나, 이에 한정되지 않으며, 상이한 수의 사용자 단말이 네트워크(220)를 통해 정보 처리 시스템(230)과 통신하도록 구성될 수도 있다. 도 2에서는 사용자 단말과 정보 처리 시스템이 별도의 장치로서 통신하도록 도시되어 있으나, 이는 일 실시예에 불과하며, 사용자 단말에서 제공하는 유전 정보 분석 관련 구성 및/또는 기능과 정보 처리 시스템을 제공하는 유전 정보 분석 관련 구성 및/또는 기능이 하나의 컴퓨팅 장치에 구현될 수 있다.
도 3은 본 개시의 일 실시예에 따른 사용자 단말(210) 및 정보 처리 시스템(230)의 내부 구성을 나타내는 블록도이다. 사용자 단말(210)은 유전 정보 분석 서비스와 연관된 애플리케이션, 유전 정보 분석 서비스를 제공하는 웹 브라우저 등을 실행 가능하고, 유/무선 통신이 가능한 임의의 컴퓨팅 장치를 지칭할 수 있으며, 예를 들어, 도 2의 휴대폰 단말(210_1), 태블릿 단말(210_2), PC 단말(210_3) 등을 포함할 수 있다.
도시된 바와 같이, 사용자 단말(210)은 메모리(312), 프로세서(314), 통신 모듈(316) 및 입출력 인터페이스(318)를 포함할 수 있다. 이와 유사하게, 정보 처리 시스템(230)은 메모리(332), 프로세서(334), 통신 모듈(336) 및 입출력 인터페이스(338)를 포함할 수 있다. 도 3에 도시된 바와 같이, 사용자 단말(210) 및 정보 처리 시스템(230)은 각각의 통신 모듈(316, 336)을 이용하여 네트워크(220)를 통해 정보 및/또는 데이터를 통신할 수 있도록 구성될 수 있다. 또한, 입출력 장치(320)는 입출력 인터페이스(318)를 통해 사용자 단말(210)에 정보 및/또는 데이터를 입력하거나 사용자 단말(210)로부터 생성된 정보 및/또는 데이터를 출력하도록 구성될 수 있다.
메모리(312, 332)는 비-일시적인 임의의 컴퓨터 판독 가능한 기록매체를 포함할 수 있다. 일 실시예에 따르면, 메모리(312, 332)는 ROM(read only memory), 디스크 드라이브, SSD(solid state drive), 플래시 메모리(flash memory) 등과 같은 비소멸성 대용량 저장 장치(permanent mass storage device)를 포함할 수 있다. 다른 예로서, ROM, SSD, 플래시 메모리, 디스크 드라이브 등과 같은 비소멸성 대용량 저장 장치는 메모리와는 구분되는 별도의 영구 저장 장치로서 사용자 단말(210) 또는 정보 처리 시스템(230)에 포함될 수 있다. 또한, 메모리(312, 332)에는 운영체제와 적어도 하나의 프로그램 코드(예를 들어, 사용자 단말(210)에 설치되어 구동되는 유전 정보 분석 서비스와 연관된 애플리케이션 또는 유전 정보 분석 서비스를 제공하는 웹 브라우저 등을 위한 코드 등)가 저장될 수 있다.
이러한 소프트웨어 구성요소들은 메모리(312, 332)와는 별도의 컴퓨터에서 판독가능한 기록매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독가능한 기록매체는 이러한 사용자 단말(210) 및 정보 처리 시스템(230)에 직접 연결가능한 기록 매체를 포함할 수 있는데, 예를 들어, 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록매체를 포함할 수 있다. 다른 예로서, 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록매체가 아닌 통신 모듈을 통해 메모리(312, 332)에 로딩될 수도 있다. 예를 들어, 적어도 하나의 프로그램은 개발자들 또는 애플리케이션의 설치 파일을 배포하는 파일 배포 시스템이 네트워크(220)를 통해 제공하는 파일들에 의해 설치되는 컴퓨터 프로그램에 기반하여 메모리(312, 332)에 로딩될 수 있다.
프로세서(314, 334)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(312, 332) 또는 통신 모듈(316, 336)에 의해 프로세서(314, 334)로 제공될 수 있다. 예를 들어, 프로세서(314, 334)는 메모리(312, 332)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다.
통신 모듈(316, 336)은 네트워크(220)를 통해 사용자 단말(210)과 정보 처리 시스템(230)이 서로 통신하기 위한 구성 또는 기능을 제공할 수 있으며, 사용자 단말(210) 및/또는 정보 처리 시스템(230)이 다른 사용자 단말 또는 다른 시스템(일례로 별도의 클라우드 시스템 등)과 통신하기 위한 구성 또는 기능을 제공할 수 있다. 일례로, 사용자 단말(210)의 프로세서(314)가 메모리(312) 등과 같은 기록 장치에 저장된 프로그램 코드에 따라 생성한 요청(예컨대, 유전 정보 분석 결과에 대한 세부 정보에 대한 요청 등) 또는 데이터는 통신 모듈(316)의 제어에 따라 네트워크(220)를 통해 정보 처리 시스템(230)으로 전달될 수 있다. 역으로, 정보 처리 시스템(230)의 프로세서(334)의 제어에 따라 제공되는 제어 신호, 명령 또는 데이터(예컨대, 유전 정보 분석 결과와 관련된 세부 정보 등) 중 적어도 하나가 통신 모듈(336)과 네트워크(220)를 거쳐 사용자 단말(210)의 통신 모듈(316)을 통해 사용자 단말(210)에 수신될 수 있다.
입출력 인터페이스(318)는 입출력 장치(320)와의 인터페이스를 위한 수단일 수 있다. 일 예로서, 입력 장치는 오디오 센서 및/또는 이미지 센서를 포함한 카메라, 키보드, 마이크로폰, 마우스 등의 장치를, 그리고 출력 장치는 디스플레이, 스피커, 햅틱 피드백 디바이스(haptic feedback device) 등과 같은 장치를 포함할 수 있다. 다른 예로, 입출력 인터페이스(318)는 터치스크린 등과 같이 입력과 출력을 수행하기 위한 구성 또는 기능이 하나로 통합된 장치와의 인터페이스를 위한 수단일 수 있다. 예를 들어, 사용자 단말(210)의 프로세서(314)가 메모리(312)에 로딩된 컴퓨터 프로그램의 명령을 처리함에 있어서 정보 처리 시스템(230)이나 다른 사용자 단말이 제공하는 정보 및/또는 데이터를 이용하여 구성되는 서비스 화면 등이 입출력 인터페이스(318)를 통해 디스플레이에 표시될 수 있다. 도 3에서는 입출력 장치(320)가 사용자 단말(210)에 포함되지 않도록 도시되어 있으나, 이에 한정되지 않으며, 사용자 단말(210)과 하나의 장치로 구성될 수 있다. 또한, 정보 처리 시스템(230)의 입출력 인터페이스(338)는 정보 처리 시스템(230)과 연결되거나 정보 처리 시스템(230)이 포함할 수 있는 입력 또는 출력을 위한 장치(미도시)와의 인터페이스를 위한 수단일 수 있다. 도 3에서는 입출력 인터페이스(318, 338)가 프로세서(314, 334)와 별도로 구성된 요소로서 도시되었으나, 이에 한정되지 않으며, 입출력 인터페이스(318, 338)가 프로세서(314, 334)에 포함되도록 구성될 수 있다.
사용자 단말(210) 및 정보 처리 시스템(230)은 도 3의 구성요소들보다 더 많은 구성요소들을 포함할 수 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 일 실시예에 따르면, 사용자 단말(210)은 상술된 입출력 장치(320) 중 적어도 일부를 포함하도록 구현될 수 있다. 또한, 사용자 단말(210)은 트랜시버(transceiver), GPS(Global Positioning system) 모듈, 카메라, 각종 센서, 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수 있다. 예를 들어, 사용자 단말(210)이 스마트폰인 경우, 일반적으로 스마트폰이 포함하고 있는 구성요소를 포함할 수 있으며, 예를 들어, 가속도 센서, 자이로 센서, 이미지 센서, 근접 센서, 터치 센서, 조도 센서, 카메라 모듈, 각종 물리적인 버튼, 터치패널을 이용한 버튼, 입출력 포트, 진동을 위한 진동기 등의 다양한 구성요소들이 사용자 단말(210)에 더 포함되도록 구현될 수 있다.
유전 정보 분석 서비스를 제공하는 애플리케이션, 웹 브라우저 등을 위한 프로그램이 동작되는 동안에, 프로세서(314)는 입출력 인터페이스(318)와 연결된 터치 스크린, 키보드, 오디오 센서 및/또는 이미지 센서를 포함한 카메라, 마이크로폰 등의 입력 장치를 통해 입력되거나 선택된 텍스트, 이미지, 영상, 음성 및/또는 동작 등을 수신할 수 있으며, 수신된 텍스트, 이미지, 영상, 음성 및/또는 동작 등을 메모리(312)에 저장하거나 통신 모듈(316) 및 네트워크(220)를 통해 정보 처리 시스템(230)에 제공할 수 있다.
사용자 단말(210)의 프로세서(314)는 입출력 장치(320), 다른 사용자 단말, 정보 처리 시스템(230) 및/또는 복수의 외부 시스템으로부터 수신된 정보 및/또는 데이터를 관리, 처리 및/또는 저장하도록 구성될 수 있다. 프로세서(314)에 의해 처리된 정보 및/또는 데이터는 통신 모듈(316) 및 네트워크(220)를 통해 정보 처리 시스템(230)에 제공될 수 있다. 사용자 단말(210)의 프로세서(314)는 입출력 인터페이스(318)를 통해 입출력 장치(320)로 정보 및/또는 데이터를 전송하여, 출력할 수 있다. 예를 들면, 프로세서(314)는 수신된 정보 및/또는 데이터를 출력함으로써, 수신된 정보 및/또는 데이터가 사용자 단말(210)의 화면에 표시되도록 사용자 단말(210)에 포함되거나 연결된 디스플레이 장치를 제어할 수 있다.
정보 처리 시스템(230)의 프로세서(334)는 복수의 사용자 단말(210) 및/또는 복수의 외부 시스템으로부터 수신된 정보 및/또는 데이터를 관리, 처리 및/또는 저장하도록 구성될 수 있다. 프로세서(334)에 의해 처리된 정보 및/또는 데이터는 통신 모듈(336) 및 네트워크(220)를 통해 사용자 단말(210)에 제공할 수 있다.
도면에 도시되지 않았으나, 정보 처리 시스템(230)은 유전체 분석 정보를 포함하는 유전 정보 분석 결과 리포트를 저장하기 위한 적어도 하나의 데이터베이스를 포함할 수 있다. 일 실시예에 따르면, 정보 처리 시스템(230)은 검체별 유전 정보 분석 결과 리포트를 저장할 수 있으며, 각 프로젝트에 포함된 적어도 하나의 검체의 식별정보를 저장할 수 있다. 이에 따라, 하나에 프로젝트에는 적어도 하나의 검체에 대한 유전 정보 분석 결과 리포트가 포함될 수 있다. 여기서, 유전 정보 분석 결과 리포트는 각 돌연변이 위치, 각 돌연변이의 유형(type), 검체를 채취한 환자 정보, 분석 결과에 대한 통계 정보, 분석 결과에 대한 코멘트 정보, 특정 질병과 관련된 드라이버 목록, 돌연변이가 발생한 유전자에 대한 정보, 종양 변이 부담(Tumor Mutational Burden: TMB)과 관련된 정보, 돌연변이 시그니처(signature)와 관련된 정보 등을 포함할 수 있다. 유전 정보 분석 결과 리포트에 포함된 세부 정보가 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력될 수 있다.
또한, 데이터베이스는 사용자의 아이디와 비밀번호, 성명, 생년월일, 모바일 전화번호, 이메일 주소 등을 포함하는 사용자 정보를 저장할 수 있다. 또한, 데이터베이스는 각 프로젝트에 참여중인 복수의 사용자의 정보(즉, 멤버 정보)를 저장할 수 있다. 일 실시예에 따르면, 데이터베이스는 각각의 질병과 연관된 주요 돌연변이 목록을 저장할 수 있다. 예컨대, 제1 질병과 연관된 제1 주요 돌연변이 목록이 데이터베이스에 저장될 수 있고, 제2 질병과 연관된 제2 주요 돌연변이 목록이 데이터베이스에 저장될 수 있다. 여기서 주요 돌연변이 목록은 연관된 질병에서 중요하다고 해당 분야에 알려진 돌연변이를 포함할 수 있다. 또한, 데이터베이스는 하나 이상의 질병의 각각과 연관된 유전자 목록을 저장할 수 있다. 여기서, 유전자 목록은 질병에서 중요하다고 알려진 돌연변이가 발생한 유전자에 대한 레이블을 포함할 수 있다.
도 4는 본 개시의 일 실시예에 따른, 로그인 인증에 성공한 경우에 출력되는 초기 화면(400)을 예시하는 도면이다. 도 4에 예시된 바와 같이, 사용자 단말이 정보 처리 시스템에 접속하여 로그인에 성공하면, 도 4와 같은 초기 화면(400)이 사용자 단말에 출력될 수 있다.
초기 화면(400)은 복수의 영역이 구획된 레이아웃으로 구성될 수 있다. 일 실시예에 따르면, 초기 화면(400)에는 메뉴 버튼이 포함된 제1 영역(410), 프로젝트 선택 메뉴를 포함하는 제2 영역(420), 현재 메뉴의 위치를 나타내는 제3 영역(430), 로그인한 사용자 정보를 나타내는 제4 영역(440) 및 프로젝트에 포함된 각 검체의 분석 결과에 대한 통계 정보 및 검체별 간략 정보가 출력되는 제5 영역(450)으로 구성될 수 있다.
제1 영역(410)에 포함된 메뉴가 선택되면, 통계 정보를 확인할 수 있는 제1 서브 메뉴 및 분석 결과에 대한 정보를 확인할 수 있는 제2 서브 메뉴가 출력될 수 있다. 또한, 제1 영역(410)에 포함된 메뉴가 선택되면, 제1 서브 메뉴 및 제2 서브 메뉴 이외에 다양한 서브 메뉴가 함께 출력될 수 있다. 서브 메뉴를 선택하는 것을 통해, 사용자는 관련 정보를 획득할 수 있다.
제2 영역(420)에는 로그인에 성공한 사용자가 참여중인 프로젝트 목록을 출력하는데 이용되는 프로젝트 선택 메뉴가 포함될 수 있다. 프로젝트 선택 메뉴가 선택되면, 사용자에게 할당된 프로젝트 목록이 사용자 단말에 출력될 수 있다.
제3 영역(430)에는 현재 사용중인 메뉴에 대한 정보가 출력될 수 있다. 도 4에서는 차세대 염기서열 분석에 대한 통계(NGS Statistics)와 관련된 메뉴가 이용 중임이 예시되어 있다.
제4 영역(440)에는 사용자의 로그인 아이디를 포함하는 사용자 정보가 출력될 수 있다.
제5 영역(450)에는 프로젝트에 포함된 각 검체에 대한 간략 정보와 통계 정보가 출력될 수 있다. 제5 영역(450)에 출력되는 통계 정보에 대한 설명은 도 5를 참조하여 자세하게 설명하기로 한다.
사용자는 제2 영역(420)에 포함된 프로젝트 선택 메뉴를 이용하여, 다른 프로젝트를 선택할 수 있다. 프로젝트 선택 메뉴를 통해서, 초기 화면(400)에 출력된 제1 프로젝트와 상이한 제2 프로젝트가 선택되면, 제2 프로젝트에 포함된 각 검체별 분석 결과에 대한 통계 정보와 간략 정보가 제5 영역(450)에 출력될 수 있다.
도 5는 본 개시의 일 실시예에 따른, 도 4의 제5 영역(450)에 대한 레이아웃을 예시하는 도면이다. 도 5를 참조하면, 초기 화면(400)에 포함된 제5 영역(450)은 복수의 서브 영역(510 내지 560)을 포함하는 레이아웃으로 구성될 수 있다.
제1 서브 영역(510)에는 각 검체에 대한 분석 결과에 대한 간략 정보가 출력될 수 있다. 예컨대, 분석 결과에 대한 간략 정보는 검체에 대한 샘플 ID, 분석 결과에 대한 품질 정도, 종양 식별정보, 분석 완료된 날짜 등을 포함할 수 있다. 예컨대, 분석 결과에 대한 품질 정도가 좋은 상태는 'Pass'로 표기되고, 분석 결과에 대한 품질 정도가 좋지 않으면 품질 정도에 따라 'Fail' 또는 'Warning'이 표기될 수 있다.
제2 서브 영역(520)에는 종양 변이 부담(Tumor Mutational Burden)에 통계 정보가 출력될 수 있다. 도 5에 예시된 바와 같이, 단일 염기서열 변이(single nucleotide variation), 인델(indel: Insertion & Deletion), 구조 변이(SV: Structural Variants) 각각에 대한 종양 변이 부담의 통계 정보가 출력될 수 있다. 여기서, 통계 정보는 프로젝트에 포함된 모든 검체를 기초로 산출될 수 있다. 도 5에 예시된 바와 같이, 종양 변이 부담에 해당하는 영역이 일정 개수로 분할되고, 각 영역별로 종양 변이 부담의 발견 횟수가 그래프 형태로 제2 서브 영역(520)에 출력될 수 있다.
제3 서브 영역(530)에는 프로젝트에 대한 시퀀싱 품질에 대한 통계 정보가 출력될 수 있다. 예컨대, 프로젝트에 포함된 각 검체의 시퀀싱 품질에 대한 통계가 산출되고, 산출된 통계가 그래픽 형태로 제3 서브 영역(530)에 출력될 수 있다.
제4 서브 영역(540)에는 특정 질병(예컨대, 암)과 관련된 드라이버 유전자에 대한 돌연변이들의 통계 정보가 출력될 수 있다. 제4 서브 영역(540)에서 출력되는 통계 정보는 프로젝트에 포함된 각 검체로부터 발견된 돌연변이들에 대한 분석 결과를 기초로 생성될 수 있다. 제4 서브 영역(540)의 상부에는 종양 유발 유전자(oncogene)와 관련된 각 돌연변이의 발견 횟수가 막대 그래프 형태로 출력되고, 제4 서브 영역(540)의 하부에는 종양 억제 유전자(Tumor Suppressor Gene)와 연관된 각 돌연변이의 발견 횟수가 막대 그래프로서 출력되는 것으로 예시되어 있다.
제5 서브 영역(550)에는 정상세포 대비 종양세포의 비율이 그래픽 형태로 출력될 수 있다. 여기서, 미리 결정된 구간별로 정상세포 대비 종양세포의 비율이 산출되고, 이렇게 산출된 각 비율을 해당 구간에서 그래프 형태로서 출력될 수 있다.
제6 서브 영역(560)은 배수성(ploidy) 정도가 그래프 형태로 출력될 수 있다. 일 실시예에 따르면, 미리 결정된 구간별로 프로젝트에 포함된 각 검체의 배수성 정도가 산출되고, 이렇게 산출된 각 배수성 정도가 해당 구간에서 그래프 형태로서 출력될 수 있다.
한편, 도 5의 제1 서브 영역(510)에 포함된 각 검체 중에서 어느 하나가 선택되면, 선택된 검체에 대한 분석 결과를 상세하게 확인할 수 있는 제1 브라우저와 제2 브라우저를 포함하는 사용자 인터페이스가 출력될 수 있다.
도 6은 본 개시의 일 실시예에 따른, 제1 브라우저와 제2 브라우저를 포함하는 사용자 인터페이스(600)를 예시하는 도면이다. 도 6에 예시된 바와 같이, 사용자 인터페이스(600)는 복수의 영역(610, 620, 630)이 구획된 레이아웃으로 구성될 수 있다.
사용자 인터페이스(600)에 포함된 제1 영역(610)에는 프로젝트 및 검체를 선택할 수 있는 메뉴가 출력될 수 있다. 해당 메뉴가 선택되면, 프로젝트 목록 및 검체 목록이 사용자 인터페이스(600)를 통해 출력될 수 있다.
사용자 인터페이스(600)에 포함된 제2 영역(620)에는 검체 분석 결과에 대한 세부 정보가 출력될 수 있다. 제2 영역(620)은 복수의 브라우저와 복수의 서브 영역을 포함할 수 있다. 제2 영역(620)의 레이아웃에 대한 설명은 도 7을 참조하여 후술하기로 한다.
사용자 인터페이스(600)에 포함된 제3 영역(630)에는 프로젝트에 참여한 다른 사용자와 코멘트를 주고받을 수 있는 코멘트 입력란을 포함할 수 있다. 정보 처리 시스템에서는 각 프로젝트에 참여한 사용자들의 이메일 주소, 연락처 또는 단말 IP 주소 중에서 적어도 하나가 저장될 수 있다. 특정 사용자가 제3 영역(630)의 코멘트 입력란에 코멘트를 입력하면, 프로젝트에 참여한 타 사용자에게 코멘트가 제공될 수 있다. 예컨대, 사용자가 코멘트 입력란에 코멘트를 입력하면, 정보 처리 시스템은 사용자가 입력한 코멘트를 획득하고, 사용자 인터페이스를 통해서 출력중인 검체와 연관된 프로젝트를 식별한 후, 식별된 프로젝트에 참여중인 적어도 하나의 타 사용자에게 사용자의 코멘트를 제공할 수 있다. 이때, 정보 처리 시스템은 타 사용자의 이메일 또는 타 사용자가 보유한 사용자 단말로 코멘트를 전송할 수 있다.
도 7은 본 개시의 일 실시예에 따른, 도 6의 제2 영역(620)에 대한 레이아웃을 예시하는 도면이다. 도 7에 예시된 바와 같이, 검체에 대한 분석 결과가 출력되는 제2 영역(620)은 복수의 서브 영역(710 내지 780)을 포함하는 레이아웃으로 구성될 수 있다.
제1 서브 영역(710)에는 환자의 정보와 시퀀싱 결과에 대한 통계 정보가 출력될 수 있다. 도 7에 예시된 바와 같이, 질병 관련 코드 및 질병 식별정보(예컨대, 암 식별정보)를 포함하는 환자 정보 및 검체에 대한 시퀀싱 결과에 대한 통계 정보가 제1 서브 영역(710)에 출력될 수 있다.
제2 서브 영역(720)에는 검체 해석 정보가 출력될 수 있다. 검색 해석 정보는 전문 분석가에 의해 기록된 코멘트일 수 있다. 즉, 전문 분석가가 검체에 대한 시퀀싱 결과를 해석하고, 시퀀싱 결과에 대한 코멘트를 사전에 입력하여 정보 처리 시스템에 저장할 수 있고, 이렇게 시퀀싱 결과에 대한 코멘트가 저장된 경우, 제2 서브 영역(720)에 전문 분석가에 의해 작성된 코멘트가 출력될 수 있다.
제3 서브 영역(730)에는 특정 질병(예컨대, 암)과 관련되며 검체로부터 발견된 돌연변이와 연관된 유전자 목록을 포함하는 드라이버 목록이 출력될 수 있다. 여기서, 드라이버 목록은 특정 질병과 연관되며 검체로부터 발견된 돌연변이가 발생한 유전자 목록 및 돌연변이에 대한 정보를 포함할 수 있다. 도 7에서는 드라이버 목록이 암과 연관된 질병인 것으로 예시되어 있다. 드라이버 목록은 암 유발 드라이버(Oncogene driver) 목록 및 암 억제 드라이버(Tumor suppressor driver) 목록을 포함할 수 있다. 검체로부터 발견된 돌연변이들 중에서 암을 유발하는 돌연변이가 발생한 유전자 레이블이 암 유발 드라이버 목록에 포함되어 제3 서브 영역(730)에 출력될 수 있다. 또한, 검체로부터 발견된 돌연변이들 중에서 암을 억제하는 기능을 제한하거나 소실시키는 돌연변이가 발생한 유전자 레이블이 암 억제 드라이버 목록에 포함되어 제3 서브 영역(730)에 출력될 수 있다.
제4 서브 영역(740)에는 검체로부터 발견된 변이들을 염기서열 전 영역에서 탐색할 수 있는 제1 브라우저가 출력될 수 있다. 몇몇 실시예에서, 제1 브라우저는 전장유전체 전 영역에서 발견된 변이들을 조망할 수 있는 뷰를 제공할 수 있다. 사용자는 제1 브라우저를 이용하여 전체 염기서열 내의 특정 영역을 확대 또는 줌인할 수 있고, 유전체 중에서 적어도 하나의 염색체에 해당하는 영역만을 선택할 수 있다. 또한, 사용자는 제1 브라우저를 이용하여 검체로부터 발견된 변이들에 대한 다양한 탐색 작업을 수행할 수 있다. 제1 브라우저 또는 사용자 인터페이스(600)의 다른 영역을 통해서 사용자 입력이 수신되면, 이 사용자 입력에 응답하여 유전체 분석 정보에 기초한 반응형 응답 정보가 제4 서브 영역(740)에 출력될 수 있다. 반응형 응답 정보는 검체의 유전 정보 분석 결과에 대한 다양한 세부 정보를 포함할 수 있다. 제1 브라우저에서 제공하는 다양한 기능에 대해서는, 도 9 내지 도 15를 참조하여 자세하게 후술하기로 한다.
제5 서브 영역(750)에는 검체의 분석에 의해 획득된 서열 정보(sequence) 및 기타 변이에 관한 세부 정보를 탐색하는데 이용되는 제2 브라우저가 출력될 수 있다. 몇몇 실시예에서, 제2 브라우저는 유전체 분석 결과로서 획득된 서열 정보를 유전자 단위의 수준에서 탐색 가능하게 할 수 있다. 사용자는 제2 브라우저를 이용하여 아미노산 정보 영역을 확대할 수 있고, 레퍼런스 아미노산과 변이가 발생한 아미노산 간의 차이점을 확인할 수 있다. 또한, 사용자는 제2 브라우저를 이용하여 유전자 정보와 관련된 다양한 탐색 작업을 수행할 수 있다.
제2 브라우저 또는 사용자 인터페이스(600)의 다른 영역을 통해서 사용자 입력이 수신되면, 이 사용자 입력에 응답하여 유전체 분석 정보에 기초한 반응형 응답 정보가 제5 서브 영역(750)에 출력될 수 있다. 반응형 응답 정보는 돌연변이에 대한 유전자 정보를 포함할 수 있다. 여기서, 유전자 정보는 돌연변이가 발생한 유전자와 연관된 엑손(exon), 염기서열로부터 전사 및 번역된 아미노산(amino acid) 서열, 염기서열로부터 번역되지 않은 비번역 영역(Untranslated Region), 도메인 정보 등을 포함할 수 있다. 제2 브라우저에서 제공하는 다양한 기능에 대해서는, 도 16 내지 도 19를 참조하여 자세하게 후술하기로 한다.
제6 서브 영역(760)에는 특정 질병과 연관된 유전자 목록이 출력될 수 있다. 여기서, 유전자 목록은 특정 질병과 연관된 주요 돌연변이가 발생하는 적어도 하나의 유전자 레이블을 포함할 수 있다. 일 실시예에 따르면, 특정 질병과 연관된 유전자 목록이 정보 처리 시스템에 미리 저장될 수 있고, 정보 처리 시스템은 검체에 대한 유전체 분석 정보에 유전자 목록을 포함시킬 수 있다. 일 실시예에 따르면, 환자 정보에 포함된 질병 코드에 기초하여, 특정 질병이 식별될 수 있고, 정보 처리 시스템은 식별된 특정 질병과 연관된 유전자 목록을 데이터베이스로부터 추출하고, 추출한 유전자 목록을 유전체 분석 정보에 포함시킬 수 있다. 본 개시에서는 특정 질병이 암인 것으로 예시되어 있다.
제3 서브 영역(730)에 포함된 드라이버 목록과 제6 서브 영역(760)에 포함된 유전자 목록을 비교하면, 제6 서브 영역(760)에 출력되는 유전자 목록에는 검체로부터 발견된 돌연변이와 연관된 유전자 레이블 및 검체로부터 발견되지 않은 유전자 레이블이 포함되고, 제3 서브 영역(730)에 출력되는 드라이버 목록에는 검체로부터 발견된 돌연변이와 연관된 유전자 레이블만이 포함될 수 있다. 여기서, 유전자 레이블은, 유전자 명칭일 수 있다.
제7 서브 영역(770)에는 검체의 종양 변이 부담(Tumor Mutational Burden)과 관련된 정보가 출력될 수 있다. 검체에 대한 단일 염기서열 변이(single nucleotide variation), 인델(indel), 구조 변이(SV: Structural Variants) 각각에 대한 변이 부담 통계 정보가 산출되어, 그래프 형태로 제7 서브 영역(770)에 출력될 수 있다. 제7 서브 영역(770)에서 출력되는 종양 변이 부담과 연관된 정보는 도 26을 참조하여 자세하게 후술하기로 한다.
제8 서브 영역(780)에는 검체에 대한 변이 시그니처(Mutational Signature)와 연관된 정보가 출력될 수 있다. 변이 시그니처와 연관된 정보는 단일 염기 치환(Single Base Substitution, 이하 'SBS'로 지칭함) 시그니처 정보와 인델 시그니처 정보를 포함할 수 있다. 제8 서브 영역(780)에서 출력되는 변이 시그니처 정보는 도 27을 참조하여 자세하게 후술하기로 한다.
도 8은 도 7의 제3 서브 영역(730)을 확대한 도면이다. 제3 서브 영역(730)에는 특정 질병(예컨대, 암)과 연관되고 검체로부터 발견된 돌연변이와 연관된 유전자 목록을 포함하는 드라이버 목록이 출력될 수 있다. 여기서, 유전자 목록은 적어도 하나의 유전자 레이블을 포함할 수 있다.
도 8에 예시된 바와 같이, 분석 대상이 되는 질병이 암과 연관된 질병인 경우, 드라이버 목록은 암 유발 드라이버(Oncogene driver) 목록(810) 및 암 억제 드라이버(Tumor suppressor driver) 목록(820)을 포함할 수 있다. 도 8에서는 암 유발 드라이버 목록(810)에는 'MYCN' 유전자 레이블 및 'MYCN' 유전자 레이블을 가지는 유전자에서 염기 'C'가 'T'로 치환된 돌연변이 정보가 포함되고, 암 억제 드라이버 목록(820)에는 'CNTNAP2' 유전자 레이블 및 'MEN1' 유전자 레이블이 포함되고, 추가적으로 'CNTNAP2' 유전자 레이블 와 'MEN1' 유전자 레이블을 가지는 유전자들에 각각 발생한 돌연변이 정보가 포함된 것으로 예시되어 있다. 또한, 암 유발 드라이버 목록(810)에 포함된 유전자 레이블과 돌연변이 정보는 제1 그래픽 요소(예컨대, 제1 색상)이 이용되어 시각화되어 제3 서브 영역(730)에 출력될 수 있다. 암 억제 드라이버 목록(820)에 포함된 유전자 레이블과 돌연변이 정보는 제2 그래픽 요소(예컨대, 제2 색상)가 이용되어 시각화되어 제3 서브 영역(730)에 출력될 수 있다. 도 8에서는 유전자 레이블과 돌연변이 정보가 구분자(:)를 통해서 구분된 것으로 예시되어 있다.
각각의 유전자의 레이블과 인접하여 외부 데이터베이스로 접속할 수 있는 적어도 하나의 링크 아이콘(830 내지 870)이 제3 서브 영역(730)에 출력될 수 있다.
각각의 링크 아이콘(830 내지 870)은 각 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법, 치료 방법으로 인한 효과 등 중 적어도 하나를 제공하는 외부 데이터베이스로 접근할 수 있는 수단으로서, 링크 아이콘(830 내지 870)별로 서로 다른 외부 데이터베이스의 링크 주소를 포함할 수 있다.
제1 링크 아이콘(830)은 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 제공하는 제1 외부 데이터베이스(예컨대, "OncoKB" 데이터베이스)로 접근할 수 있는 링크를 포함할 수 있다. 제1 링크 아이콘(830)이 클릭 또는 터치되는 경우, 사용자 인터페이스는 제1 외부 데이터베이스로 접근하여 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 획득하고, 획득된 정보를 포함하는 웹 페이지를 출력할 수 있다. 제1 링크 아이콘(830)은 제3 서브 영역(730)에 출력된 유전자 레이블과 연관된 정보가 제1 외부 데이터베이스에 포함된 경우에, 활성화되어 제3 서브 영역(730)에 출력될 수 있다.
유사하게, 제2 링크 아이콘(840)은 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 제공하는 제2 외부 데이터베이스(예컨대, "CIVIC" 데이터베이스)로 접근할 수 있는 링크를 포함할 수 있다. 제2 링크 아이콘(840)이 클릭 또는 터치되는 경우, 사용자 인터페이스는 제2 외부 데이터베이스로 접근하여 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 획득하고, 이 획득된 정보를 포함하는 웹 페이지를 출력할 수 있다. 제2 링크 아이콘(840)은 제3 서브 영역(730)에 출력된 유전자 레이블과 연관된 정보가 제2 외부 데이터베이스에 포함된 경우에, 활성화되어 제3 서브 영역(730)에 출력될 수 있다.
또한, 제3 링크 아이콘(850)은 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 제공하는 제3 외부 데이터베이스(예컨대, "Ensembl" 데이터베이스)로 접근할 수 있는 링크를 포함할 수 있다. 제3 링크 아이콘(850)은 제3 서브 영역(730)에 출력된 유전자 레이블과 연관된 정보가 제3 외부 데이터베이스에 포함된 경우에, 활성화되어 제3 서브 영역(730)에 출력될 수 있다. 마찬가지로, 제4 링크 아이콘(860)은 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 제공하는 제4 외부 데이터베이스(예컨대, "UCSC 지놈 연구소" 데이터베이스)로 접근할 수 있는 링크를 포함할 수 있고, 제5 링크 아이콘(870)은 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 제공하는 제5 외부 데이터베이스(예컨대, "ClinicalTrials.gov" 데이터베이스)로 접근할 수 있는 링크를 포함할 수 있다. 제4 링크 아이콘(860)은 유전자 레이블과 연관된 정보가 제4 외부 데이터베이스에 포함된 경우에 활성화되어 제3 서브 영역(730)에 출력될 수 있고, 제5 링크 아이콘(870)은 유전자 레이블과 연관된 정보가 제5 외부 데이터베이스에 포함된 경우에, 활성화되어 제3 서브 영역(730)에 출력될 수 있다.
도 9는 도 7의 제1 브라우저가 출력된 제4 서브 영역(740)을 확대한 도면이다. 도 9에 예시된 바와 같이, 제1 브라우저는 적어도 하나의 염색체를 선택할 수 있는 메뉴 영역(910), 염색체 식별정보가 표시되는 염색체 표시 영역(920), 구조 변이(structural variation) 및 복제수(copy number) 정보가 출력되는 제1 정보 출력 영역(930), 점 돌연변이(point mutation) 및 서열로서 구분되는(allelic) 복제수 정보(예를 들어, 부계로부터 받은 염색체의 복제수와 모계로부터 받은 염색체의 복제수) 등이 출력되는 제2 정보 출력 영역(940), 변이가 발견되었거나 발견되지 않은 유전자의 레이블이 출력되는 유전자 레이블 출력 영역(950) 및 제1 브라우저에 가시적으로 출력할 변이의 유형을 필터링하는데 이용되는 필터링 영역(960)을 포함하는 레이아웃으로 구성될 수 있다.
메뉴 영역(910), 제1 정보 출력 영역(930), 제2 정보 출력 영역(940), 유전자 레이블 출력 영역(950) 각각에 출력되는 정보는 제1 브라우저를 통해 제어될 수 있다.
메뉴 영역(910)에 포함된 Chromosome 메뉴가 선택되면 염기서열에 포함된 염색체 목록이 출력될 수 있다. 염색체 목록 중에서 하나 이상의 염색체가 선택될 수 있으며, 선택된 염색체와 관련된 정보만이 선별되어 제1 정보 출력 영역(930), 제2 정보 출력 영역(940) 및 유전자 레이블 출력 영역(950)에 출력되도록 제1 브라우저가 제어될 수 있다.
염색체 표시 영역(920)에는 각 염색체의 식별정보가 출력될 수 있다. 도 9에서는 모든 염색체가 출력된 것으로 예시되어 있다.
제1 브라우저를 통해 제1 정보 출력 영역(930)에는 유전체 각 영역/위치의 복제수(copy number)를 검은색 점으로 표시(plotting)한 패턴이 출력될 수 있다. 추가적으로, 제1 브라우저를 통해 점 돌연변이 및 구조 변이가 시각화되어 제1 정보 출력 영역(930)에 출력될 수 있다. 일 실시예에 따르면, 검체로부터 발견된 구조 변이와 연관된 그래픽 객체가 시각화되어 제1 정보 출력 영역(930)에 출력될 수 있다. 이때, 시각화하고자 하는 타깃 구조 돌연변이의 유형(type)에 기초하여 그래픽 객체의 형태 또는 색상 중 적어도 하나가 결정되고, 타깃 구조 돌연변이의 영역(위치 범위)에 기초하여 그래픽 객체의 크기(예컨대, 폭)가 결정되어 제1 정보 출력 영역(930)에 시각화될 수 있다.
도 9의 제1 정보 출력 영역(930)은 5개의 구조 변이가 시각화되어 출력되고 있음이 예시되어 있으며, 구조 변이 유형에 따라 색상 및/또는 형태가 상이하게 시각화된 것으로 예시되어 있다.
제2 정보 출력 영역(940)에는 대립 형질(allele) 별 복제수에 대한 정보가 출력될 수 있다. 도 9의 제2 정보 출력 영역(940)에는 하나의 대립 형질의 복제수(예컨대 모계로부터 받은 대립 형질의 복제수)가 제1 그래픽 요소(예컨대, 제1 색상)가 이용되어 시각화되고, 또 다른 대립 형질의 복제수(예컨대, 부계로부터 받은 대립 형질의 복제수)가 제2 그래픽 요소(예컨대, 제2 색상)가 이용되어 시각화된 것으로 예시되어 있다.
또한, 제2 정보 출력 영역(940)에는 염기서열로부터 발견된 점 돌연변이가 시각화되어 출력될 수 있다. 변이의 유형에 기초하여 변이를 시각화하는 그래픽 요소가 결정될 수 있다. 예를 들어, 염기 'C'가 'A'로 치환된 'C>A' 변이는 제3 그래픽 요소가 이용되어 시각화될 수 있고, 염기 'C'가 'G'로 치환된 'C>G' 변이는 제4 그래픽 요소가 이용되어 시각화될 수 있으며, 염기 'C'가 'T'로 치환된 'C>T' 변이는 제5 그래픽 요소가 이용되어 시각화될 수 있다.
유전자 레이블 출력 영역(950)에는 특정 질병과 연관된 주요 돌연변이와 연관된 유전자들 각각이 그 위치와 연관되어 출력될 수 있다. 또한, 유전자 레이블 출력 영역(950)에 출력되는 주요 돌연변이와 연관된 유전자들 중에서, 검체로부터 발견된 돌연변이와 연관된 유전자는 별도의 그래픽 요소를 이용하여 시각화할 수 있다. 일 실시예에 따르면, 주요 돌연변이와 연관된 유전자들 중에서, 검체로부터 발견되고 암 유발 드라이버 목록에 포함되는 유전자는 제6 그래픽 요소가 이용되어 유전자 레이블 출력 영역(950)에 시각화될 수 있다. 또한, 주요 돌연변이와 연관된 유전자들 중에서, 검체로부터 발견되고 암 억제 드라이버 목록에 포함된 유전자는 제7 그래픽 요소가 이용되어 유전자 레이블 출력 영역(950)에 시각화될 수 있다. 또한, 주요 돌연변이와 연관된 유전자들 중에서 검체로부터 발견되지 않은 돌연변이와 연관된 유전자는 제8 그래픽 요소가 이용되어 유전자 레이블 출력 영역(950)에 시각화될 수 있다. 도 9에서는 암 유발 드라이버에 포함된 'MYCN' 유전자는 제6 그래픽 요소로서 제3 색상이 이용되어 시각화되고, 암 억제 드라이버 목록에 포함된 'CNTNAP2'과 'MEN1' 유전자는 제7 그래픽 요소로서 제4 색상이 이용되어 시각화되고, 검체로부터 발견되지 않은 주요 돌연변이들과 관련이 있는 유전자들인 'ARID1A', 'RIT1' 등은 제8 그래픽 요소로서 제5 색상이 이용되어 시각화된 것으로 예시되어 있다.
필터링 영역(960)에는 제1 정보 출력 영역(930)에 출력된 구조 변이를 필터링할 수 있는 제1 필터 객체들과 제2 정보 출력 영역(940)에 출력된 변이를 필터링할 수 있는 제2 필터 객체들을 포함할 수 있다.
필터링 영역(960)에 포함된 제1 필터 객체들은 구조 변이와 관련된 객체들을 포함할 수 있다. 도 9에는 제1 필터 객체들은 결실(deletion)과 연관된 구조 변이를 나타내는 'DEL' 객체, 중복(duplication)과 연관된 구조 변이를 나타내는 'DUP' 객체, 역위(inversion)와 관련된 구조 변이를 나타내는 '5to5INV' 객체와 '3to3INV' 객체 및 전좌(translocation)와 관련된 구조 변이를 나타내는 'TRA' 객체를 포함할 수 있다. 각 객체 옆에 위치한 괄호 안의 숫자는 검체 내에서 발견된 해당 구조 돌연변이의 개수일 수 있다.
제1 필터 객체들 중에서 사용자에 의해서 선택된 필터 객체와 연관된 유형의 구조 변이에 대한 정보(즉, 구조 변이와 연관된 그래픽 객체)가 선별되어 제1 정보 출력 영역(930)에 가시적으로 출력될 수 있다. 또한, 제1 필터 객체들 중에서 사용자에 의해서 선택되지 않은 필터 객체와 연관된 유형의 구조 변이에 대한 정보(즉, 구조 변이와 연관된 그래픽 객체)가 제1 정보 출력 영역(930)에서 제거 또는 비가시화될 수 있다. 제1 필터 객체들에 포함된 객체를 선택하는 것을 통해, 사용자는 확인하고자 하는 구조 변이에 대한 정보를 선별하여 제1 정보 출력 영역(930)에 출력시킬 수 있다.
필터링 영역(960)에 포함된 제2 필터 객체들은 구조 변이 이외의 변이와 연관된 객체들을 포함할 수 있다. 도 9에는 제2 필터 객체들은 모계와 부계 중 어느 하나로부터 받은 대립 형질의 복제수를 나타내는 'Major Allele' 객체, 모계와 부계 중 다른 하나로부터 받은 대립 형질의 복제수를 나타내는 'Minor Allele' 객체를 포함할 수 있다. 여기서, 'Major Allele' 객체가 모계로부터 받은 대립 형질의 복제수를 나타내면, 'Minor Allele' 객체는 부계로부터 받은 대립 형질의 복제수를 나타낼 수 있다. 반대로, 'Major Allele' 객체가 부계로부터 받은 대립 형질의 복제수를 나타내면 'Minor Allele' 객체는 모계로부터 받은 대립 형질의 복제수를 나타낼 수 있다.
또한, 제2 필터 객체들은 점 돌연변이와 연관된 복수의 객체를 포함할 수 있다. 도 9에서는 점 돌연변이와 연관된 객체들이, 'C>A' 객체, 'C>G' 객체, 'C>T' 객체, 'T>A' 객체, 'T>C' 객체 및 'T>G' 객체인 것으로 예시되어 있다. 추가적으로 제2 필터 객체들은 삽입(insertion)과 관련된 'ins' 객체, 염기 결손(deletion)과 관련된 'del' 객체를 포함할 수 있다. 각 객체 옆에 위치한 괄호 안의 숫자는 염기서열로부터 검출된 해당 변이의 개수일 수 있다.
제2 필터 객체들 중에서 선택된 객체와 연관된 복제수 및/또는 변이가 선별되어 제2 정보 출력 영역(940)에 가시적으로 출력되고, 제2 필터 객체들 중에서 선택되지 않은 객체와 연관된 복제수 및/또는 변이는 제2 정보 출력 영역(940)에서 제거 또는 비가시화될 수 있다. 제2 필터 객체들에 포함된 객체를 선택하는 것을 통해, 사용자는 확인하고자 하는 부계/모계 복제수 및/또는 변이를 선별하여 제2 정보 출력 영역(940)에 출력시킬 수 있다.
도 10은 서로 다른 그래픽 객체를 통해서 시각화된 구조 변이를 포함하는 제1 정보 출력 영역(1000)에 대한 다른 예시를 나타내는 도면이다. 도 10에 예시된 바와 같이, 제1 브라우저에 의해 구조 변이의 유형(type)과 연관되는 그래픽 객체가 결정되고, 이 그래픽 객체가 제1 정보 출력 영역(1000)에 시각화될 수 있다.
n 개수(여기서, n은 자연수임)의 염기가 역위된 것과 연관된 제1 유형의 구조 변이(1010)는 제1 그래픽 객체가 이용되어 제1 정보 출력 영역(1000)에 시각화될 수 있다. 또한, m 개수(여기서, m은 자연수임)의 염기가 역위된 것과 연관된 제2 유형의 구조 변이(1020)는 제2 그래픽 객체가 이용되어 제1 정보 출력 영역(1000)에 시각화될 수 있다. 염기가 전좌(translocation)된 것과 연관된 제3 유형의 구조 변이(1030)는 제3 그래픽 객체가 이용되어 제1 정보 출력 영역(1000)에 시각화될 수 있다. 또한, 염기가 결실(deletion)된 것과 연관된 제4 유형의 구조 변이(1040)는 제4 그래픽 객체가 이용되어 제1 정보 출력 영역(1000)에 시각화될 수 있다.
도 10에 예시된 바와 같이, 구조 변이(1010 내지 1040)의 유형이 상이한 경우, 서로 상이한 그래픽 객체가 이용되어 구조 변이(1010 내지 1040)가 시각화될 수 있다. 예컨대, 서로 다른 유형의 구조 변이들(1010 내지 1040)은 각기 다른 색상 및/또는 형태를 가지는 그래픽 객체가 이용될 수 있다.
한편, 구조 변이와 관련된 그래픽 객체들이 밀집되어 제1 정보 출력 영역에 출력될 수 있다. 가령, 염기서열의 특정 영역에서 구조 변이가 복수 개로 발견된 경우에, 특정 영역에 구조 변이와 연관된 그래픽 객체들이 밀집되어 분포될 수 있다. 이러한 경우, 각 구조 변이와 관련된 그래픽 객체들이 중첩되어 시각화될 수 있고, 이에 따라 사용자의 가독성이 저하될 수 있다. 이러한 상황을 대비하여, 구조 변이와 연관된 그래픽 객체의 밀집도가 산출되고, 산출된 밀집도가 미리 결정된 임계값을 초과하는 경우, 가독성을 향상시키기 위한 다양한 그래픽 처리가 수행될 수 있다. 예컨대, 임계거리 이내에 위치한 그래픽 객체의 개수에 기초하여, 그래픽 객체의 밀집도가 산출될 수 있다. 이 경우, 구조 변이와 관련된 임계치 이상의 그래픽 객체들이 임계거리 이내에 포함되어 위치한 경우에, 가독성을 향상시키기 위한 다양한 그래픽 처리가 수행될 수 있다. 다른 예로서, 미리 결정된 단위 면적 내에 그래픽 객체가 시각화된 면적에 기초하여, 그래픽 객체의 밀집도가 산출될 수 있다. 이 경우, 산출된 그래픽 객체의 밀집도가 임계값 이상인 경우에 가독성을 향상시키기 위한 다양한 그래픽 처리가 수행될 수 있다. 이 외에, 다양한 방법으로 그래픽 객체들의 밀접도가 산출될 수 있다.
도 11은 구조 변이와 연관된 그래픽 객체들이 밀집된 경우에, 그래픽 객체 처리에 대한 일 예시를 나타내는 도면이다. 도 11의 제1 화면(1110)에 예시된 바와 같이, 구조 변이와 연관된 그래픽 객체들이 임계거리 이내에 밀집하여 위치한 경우, 임계거리를 포함하는 영역(1112)이 그래픽 객체들이 밀집되어 있는 밀집 영역(1112)인 것으로 결정될 수 있다. 가령, 임계거리에서 소정의 거리만큼을 가로 폭으로 하는 밀집 영역(1112)이 결정될 수 있다. 일 실시예에 따르면, 임계치 이상의 그래픽 객체들이 임계거리에 포함되어 위치하는지 여부가 판정되고, 임계치 이상의 그래픽 객체들이 임계거리에 포함되어 위치하는 경우에, 임계거리를 포함하는 영역이 밀집 영역으로 결정될 수 있다. 몇몇 실시예에 따르면, 미리 결정된 단위 면적 내에 적어도 하나의 그래픽 객체가 시각화된 면적에 기초하여, 그래픽 객체의 밀집도가 산출되고, 산출된 그래픽 객체의 밀집도가 임계값 이상인 경우에 해당 그래픽 객체를 포함하는 영역이 밀집 영역으로 결정될 수 있다.
밀집 영역(1112)에 임계치 이상의 그래픽 객체들이 위치하거나 밀집 영역(1112)의 밀집도가 임계값 이상인 상태에서, 제2 화면(1120)과 같이 포인터가 복수의 그래픽 객체들 중에서 제1 그래픽 객체(1122)에 위치할 수 있다. 이 경우, 포인터가 위치한 제1 그래픽 객체(1122)가 강조될 수 있도록, 제1 브라우저가 제어될 수 있다. 추가적으로 또는 대안적으로, 밀집 영역(1112)에 포함된 그래픽 객체들 중에서 포인터가 위치한 제1 그래픽 객체(1122) 이외에 다른 객체들은 제거되거나 흐리게 되도록 제1 브라우저가 제어될 수 있다. 도 11의 제2 화면(1120)에서는 포인터가 위치한 그래픽 객체(1122)의 선 두께가 두꺼워지고, 나머지 객체들은 흐리게 처리되는 것으로 예시되어 있다.
포인터가 제1 객체(1122)에서 제2 객체(1132)로 이동한 경우, 포인터가 위치한 제2 그래픽 객체(1132)의 선 두께가 굵어져서 강조되고, 제2 그래픽 객체(1122) 이외에 다른 객체들은 제거되거나 흐리게 되도록 제1 브라우저가 제어될 수 있다.
도 12은 구조 변이와 연관된 그래픽 객체들이 밀집된 경우에, 그래픽 객체 처리에 대한 다른 예시를 나타내는 도면이다. 도 12의 제1 화면(1210)에 예시된 바와 같이, 구조 변이와 연관된 임계치 이상의 그래픽 객체들이 임계거리 이내에 밀집하여 위치한 경우, 임계거리를 포함하는 영역(1212)이 그래픽 객체들이 밀집되어 있는 밀집 영역(1212)으로 결정될 수 있다. 몇몇 실시예에 따르면, 미리 결정된 단위 면적 내에 적어도 하나의 그래픽 객체가 시각화된 면적에 기초하여, 그래픽 객체의 밀집도가 산출되고, 산출된 그래픽 객체의 밀집도가 임계값 이상인 경우에 해당 그래픽 객체를 포함하는 영역이 밀집 영역으로 결정될 수 있다.
밀집 영역(1212)이 결정된 것에 응답하여, 밀집 영역(1212)에 위치한 복수의 그래픽 객체들이 일정 시간 간격으로 로테이션하면서 강조되도록, 제1 브라우저가 제어될 수 있다. 예컨대, 밀집 영역(1212)에 포함된 제1 그래픽 객체, 제2 그래픽 객체 및 제3 그래픽 객체 순으로 로테이션되면서 강조되어 시각화될 수 있도록, 제1 브라우저가 제어될 수 있다. 이때, 강조되는 그래픽 객체의 선이 굵게 될 수 있고, 강조되는 객체 이외의 그래픽 객체들은 흐리게 처리되거나 제거될 수 있다.
도 12에 예시된 바와 같이, 제1 그래픽 객체가 강조되는 제2 화면(1220), 제2 그래픽 객체가 강조되는 제3 화면(1230) 및 제3 그래픽 객체가 강조되는 제4 화면(1240) 순서로 로테이션되도록, 제1 브라우저가 제어될 수 있다.
도 13은 구조 변이와 연관된 그래픽 객체들이 밀집된 경우에, 그래픽 객체 처리에 대한 또 다른 예시를 나타내는 도면이다. 도 13의 제1 화면(1310)에 예시된 바와 같이, 구조 변이와 연관된 임계치 이상의 그래픽 객체들이 임계거리 이내에 밀집하여 위치한 경우, 임계거리를 포함하는 영역(1312)이 그래픽 객체들이 밀집되어 있는 밀집 영역(1312)으로 결정될 수 있다. 몇몇 실시예에 따르면, 미리 결정된 단위 면적 내에 적어도 하나의 그래픽 객체가 시각화된 면적에 기초하여, 그래픽 객체의 밀집도가 산출되고, 산출된 그래픽 객체의 밀집도가 임계값 이상인 경우에 해당 그래픽 객체를 포함하는 영역이 밀집 영역으로 결정될 수 있다.
밀집 영역(1312)이 결정된 것에 응답하여, 도 13의 제2 화면(1320)과 같이 밀집 영역(1312)이 미리 결정된 시간만큼 자동적으로 확대 또는 줌인되어 출력되도록 제1 브라우저가 제어될 수 있다. 다른 예로서, 밀집 영역(1312) 내에 포인터가 위치하는 것에 응답하여, 제2 화면(1320)과 같이 밀집 영역이 확대 또는 줌인되어 출력되도록 제1 브라우저가 제어될 수 있다. 또 다른 예로서, 밀집 영역(1312)에 포함된 그래픽 객체에 포인터가 위치하는 것에 응답하여, 제2 화면(1320)과 같이 밀집 영역이 확대 또는 줌인되어 출력되도록 제1 브라우저가 제어될 수 있다.
일 실시예에 따르면, 밀집 영역(1312)에 대해서 사용자가 인지할 수 있도록, 별도의 그래픽 요소가 이용되어 밀집 영역(1312)이 시각화될 수 있다. 여기서, 별도의 그래픽 요소는 색상, 무늬 또는 도형 중 적어도 하나를 포함할 수 있다.
한편, 밀집 영역(1312)에 포함된 그래픽 객체를 선택하는 사용자 입력이 수신되는지 여부가 판정될 수 있다. 미리 결정된 시간 동안에 밀집 영역(1312)에 포함된 그래픽 객체를 선택하는 사용자 입력이 수신되지 않는다고 판정되면, 확대된 밀집 영역(1312)이 원래의 크기로 축소되거나 줌인된 밀집 영역(1312)이 원래대로 줌아웃되도록 제1 브라우저가 제어될 수 있다. 즉, 밀집 영역(1312)이 확대 또는 줌인되었으나, 미리 결정된 시간 동안에 밀집 영역(1312)에 포함된 그래픽 객체가 선택되지 않은 경우에, 밀집 영역(1312)은 원래의 상태로 복귀될 수 있다.
추가적으로 또는 대안적으로, 포인터가 밀집 영역(1312)에 위치한 후에 벗어나는 것이 감지되는 경우, 확대 또는 줌인된 밀집 영역(1312)이 원래 상태로 복귀되도록 제1 브라우저가 제어될 수 있다. 즉, 포인터가 밀집 영역(1312)에 위치한 후에, 밀집 영역(1312) 밖으로 벗어난 경우, 확대 또는 줌인된 밀집 영역(1312)이 원래의 크기로 축소되거나 줌아웃될 수 있다.
한편, 제1 브라우저에서 사용자가 선택한 영역이 확대될 수 있다. 가령, 도 9의 제1 정보 출력 영역(930)과 제2 정보 출력 영역(940)이 사용자의 입력에 기초하여 확대될 수 있다. 사용자는 포인터를 드래그하여 확대하고자 하는 영역을 선택할 수 있고, 제1 브라우저를 통해 사용자에 의해 선택된 영역이 확대 또는 줌인되어 출력될 수 있다. 또한 사용자는 핀치 줌(pinch zoom) 등의 터치 제스처를 통하여 원하는 영역을 확대 또는 줌인할 수 있다.
도 14는 제1 브라우저에서 확대된 영역(1400)을 예시하는 도면이다. 도 14에 예시된 바와 같이, 제1 브라우저에 포함된 제1 정보 출력 영역 및/또는 제2 정보 출력 영역에 포함된 일부 영역이 드래그 되면, 드래그된 영역(1430)이 확대 또는 줌인되어 제1 정보 출력 영역 및/또는 제2 정보 출력 영역에 출력될 수 있다.
도 14에서는 2번째 염색체에 포함된 일부 영역(1430)이 확대 내지는 줌인되어 출력된 것을 예시하고 있다. 도 14에 예시된 바와 같이, 염기서열 전체 영역 중 일부 영역만이 출력되는 경우, 출력된 영역의 위치 정보(1410)가 출력되고, 출력된 영역과 연관된 정보를 제공하는 링크 아이콘(1420)이 활성화되어 출력될 수 있다.
한편, 유전체에 포함된 염색체들 중에서 복수 개가 선택되어 출력될 수 있다. 가령, 도 9에 예시된 메뉴 영역(910)에 포함된 Chromosome 메뉴가 선택되어 염색체 목록이 출력되고, 염색체 목록 중에서 선택된 복수 개의 염색체에 대한 정보가 제1 브라우저를 통해 출력될 수 있다. 복수 개의 염색체가 선택된 경우, 제1 브라우저를 통해서 선택된 염색체 개수와 상응하는 개수로 정보 출력 영역이 분할되고, 선택된 복수의 염색체 각각과 연관된 정보는 분할된 정보 출력 영역에 출력될 수 있다.
도 15는 본 개시의 일 실시예에 따른, 2개의 염색체가 출력된 제1 브라우저의 화면(1500)을 예시하는 도면이다. 도 15에서는 7번 염색체와 14번 염색체만이 선택되고, 7번 염색체 및 14번 염색체와 연관된 정보가 제1 브라우저를 통해 출력되는 것이 예시되어 있다. 가령, Chromosome 메뉴에 포함된 염색체 목록이 출력되고, 염색체 목록 중에서 7번 염색체와 14번 염색체가 선택되면, 제1 브라우저를 통해 정보 출력 영역이 두 개로 분할(1510, 1520)될 수 있다. 이 경우, 분할된 제1 영역(1510)에 7번 염색체와 연관된 정보가 출력되고, 분할된 제2 영역(1520)에 14번 염색체와 연관된 정보가 출력될 수 있다.
한편, Chromosome 메뉴에 포함된 염색체 목록에서 1개 또는 3개 이상의 염색체가 선택될 수 있고, 이 경우, 선택된 개수에 해당하는 염색체 관련 정보가 정보 출력 영역에 출력될 수 있다.
한편, 특정 유형의 구조 변이가 복수의 염색체로부터 발견되고, 그 발견된 위치에 특정 유형의 구조 변이와 연관된 정보(예컨대, 시각화된 정보)가 제1 브라우저에 출력될 수 있다. 예컨대, 특정 유형의 구조 변이가 2번 염색체와 15번 염색체에서 모두에서 발견된 경우, 제1 브라우저의 제1 정보 출력 영역 중에서, 2번 염색체와 연관된 영역 및 15번 염색체와 연관된 영역 각각에 특정 구조 변이에 대한 시각화 정보가 출력될 수 있다. 이렇게 특정 유형의 구조 변이와 연관된 시각화 정보가 복수의 염색체 영역에 위치한 상태에서, 제1 브라우저는 특정 유형의 구조 변이를 선택하는 사용자 입력을 수신할 수 있다. 가령, 특정 유형의 구조 변이와 연관된 시각화 정보를 선택하거나, 특정 유형의 구조 변이와 연관된 필터 객체를 선택하는 사용자 입력이 수신될 수 있다.
이 경우, 특정 유형의 구조 변이가 발견된 적어도 하나의 염색체와 관련된 정보만이 출력되도록 제1 브라우저가 제어될 수 있다. 예컨대, 특정 유형의 구조 변이가 2번 염색체와 15번 염색체에서 모두에서 발견된 상태에서, 특정 유형의 구조 변이를 선택한 사용자 입력을 수신하면, 2번 염색체와 연관된 정보와 15번 염색체와 연관된 정보만이 제1 브라우저에서 출력되도록, 제1 브라우저가 제어될 수 있다. 이 경우, 관련 염색체의 개수만큼 제1 브라우저의 정보 출력 영역이 분할되고, 염색체 각각과 연관된 정보는 분할된 정보 출력 영역에 출력될 수 있다.
도 16은 도 7의 제2 브라우저가 출력된 제5 서브 영역(750)을 보다 자세히 도시한 도면이다. 도 16에 예시된 바와 같이, 제2 브라우저는 현재 선택된 전사 모델(Transcription Model)이 출력되는 전사 모델 영역(1610), DNA 이중 나선 중에서 양성 가닥(positive strand)의 위치에 대한 정보가 출력되는 위치 정보 영역(1620), 외부 데이터베이스로 접속할 수 있는 링크 아이콘이 출력되는 아이콘 영역(1630), 돌연변이에 대한 서열 정보가 출력되는 정보 출력 영역(1640) 및 그래픽 객체별 변이 유형을 설명하는 설명 영역(1650)을 포함하는 레이아웃으로 구성될 수 있다. 여기서, 서열 정보는 전사 모델에 의해 DNA 서열의 일부 영역이 전사된 RNA(Ribonucleic acid) 서열 및/또는, 그러한 서열들에 대응되어 번역된 아미노산 서열을 포함할 수 있다.
현재 선택된 전사 모델에 대한 식별정보(예컨대, 이름)이 전사 모델 영역(1610)에 출력되고, 이 전사 모델의 위치 범위(좌표 범위)가 위치 정보 영역(1620)에 출력될 수 있다. 전사 모델이 변경되는 경우 전사 모델 영역(1610)에 출력된 식별정보와 위치 정보 영역(1620)에 출력된 위치 정보가 변경될 수 있고, 더불어 정보 출력 영역(1640)에 출력되는 서열 정보도 변경될 수 있다.
아이콘 영역(1630)에는 출력 영역(1640)에 출력되고 있는 유전자 및 해당 유전자와 관련하여 잘 알려진 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법, 치료 방법으로 인한 효과 등 중 적어도 하나를 제공하는 외부 데이터베이스로 접근할 수 있는 링크 아이콘이 출력될 수 있다. 링크 아이콘이 활성화되는 방법은, 도 8을 참조하여 설명한 링크 아이콘에 대한 활성화 방법과 동일할 수 있다.
설명 영역(1650)에 기재된 바와 같이, 각각의 변이는 유형에 따라 서로 상이한 그래픽 객체가 이용되어, 정보 출력 영역(1640)에서 시각화될 수 있다. 예컨대, 과오돌연변이(Missense Mutation)는 제1 색상의 원 형태를 가지는 제1 그래픽 객체가 이용되어 정보 출력 영역(1640)에서 시각화될 수 있고, 절단형 돌연변이(Truncating Mutation)는 제2 색상의 원 형태를 가지는 제2 그래픽 객체가 이용되어 정보 출력 영역(1640)에서 시각화될 수 있고, 인프레임 삽입(Inframe Insertion)과 연관된 변이는 제1 색상 및 아래 방향의 화살표 형태를 가지는 제3 그래픽 객체가 이용되어 정보 출력 영역(1640)에서 시각화될 수 있다. 이외에도, 설명 영역(1650)에 예시된 바와 같이, 다양한 그래픽 객체가 이용되어, 해당 유형의 변이가 정보 출력 영역(1640)에서 시각화될 수 있다.
정보 출력 영역(1640)에는 DNA 염기서열, DNA 염기서열이 전사된 RNA 서열, 그러한 서열들에 대응되어 번역된 아미노산 서열, 및/또는 기타 유전자 정보가 출력될 수 있다. 정보 출력 영역(1640)에는 선택된 유전자와 연관된 엑손(exon), 염기서열로부터 번역된 아미노산(amino acid) 서열, 번역 대상이 되는 염기서열 영역, 염기서열로부터 번역되지 않는 비번역 영역(Untranslated Region), 도메인 정보 등이 출력될 수 있다. 번역 대상이 되는 염기서열 영역에는 검체로부터 획득된 복수의 염기가 출력될 수 있으며, 변이가 발생한 염기와 비교의 기준이 되는 레퍼런스 염기 서열의 염기가 함께 출력될 수 있다. 아미노산 서열 영역에는 염기들이 번역된 복수의 아미노산 식별자들이 출력될 수 있다. 또한, 아미노산 정보 영역에는 변이가 발생한 아미노산 식별자와, 레퍼런스 염기서열에 따른 아미노산 서열에서 변이가 발생한 아미노산과 대응되는 위치의 아미노산 식별자를 포함하는 아미노산 변경 정보가 출력될 수 있다.
여기서, 레퍼런스 염기서열은 정렬의 기준이 되는 염기서열일 수 있다. 또한, 레퍼런스 아미노산은 레퍼런스 염기서열에 포함된 일부 염기들이 전사된 RNA 서열, 그러한 RNA 서열로부터 번역된 아미노산 서열일 수 있다. 레퍼런스 아미노산은 아미노산이 변이되었는지를 판정하는데 기준 정보로서 이용될 수 있다. 또한, 레퍼런스 염기는 레퍼런스 염기서열에 포함된 염기이고, 레퍼런스 아미노산 식별자는 레퍼런스 아미노산에 포함된 아미노산 식별자일 수 있다.
정보 출력 영역(1640)에 출력된 정보를 통해서, 사용자는 전사 모델에 따라 염기서열이 아미노산으로 어떻게 번역되는지를 확인할 수 있고, 검체의 염기서열에서 발견된 돌연변이가 아미노산 서열에 어떻게 영향을 미치는지를 파악할 수 있다.
도 16에 예시된 '0'에서부터 '465aa'까지의 구간은, 염기서열의 일부 영역으로부터 번역된 아미노산 영역일 수 있다. 또한, 도 16에 예시된 네모 안에 기재된 숫자 '1', '2' 및 '3'은, DNA 중에 인트론(Intron) 영역이 배제되고 엑손(Exon) 영역이 넘버링된 것일 수 있다.
또한, 정보 출력 영역(1640)은 최하단에는 염기(base)에 대한 변이 정보, 또한 레퍼런스 아미노산과 비교하여 변경된 아미노산 정보가 출력될 수 있다. 즉, 비교 대상이 되는 아미노산과 레퍼런스 아미노산 간의 차이를 나타내는 아미노산 변경 정보가 정보 출력 영역(1640)에 출력될 수 있다. 제2 브라우저의 특정 영역이 드래그되는 경우에, 드래그된 영역이 확대되어 정보 출력 영역(1640)에 출력될 수 있다. 출력 영역(1640)이 확대되면 아미노산 식별자와 염기와 관련된 문자(character)가 디스플레이 되고, 이를 통해 사용자는 돌연변이가 발생한 염기와 아미노산 식별자를 파악할 수 있다.
일 실시예에 따르면, 선택된 유전자에서 돌연변이가 위치와 연관하여, 그래픽 객체(1660)가 정보 출력 영역(1640)에 출력될 수 있다. 앞서 설명한 바와 같이, 돌연변이의 유형에 연관된 그래픽 객체(1660)가 정보 출력 영역(1640)에 출력될 수 있다.
포인터가 이용되어 정보 출력 영역(1640)에 출력된 그래픽 객체(1660)가 선택될 수 있다. 즉, 정보 출력 영역(1640)에 출력된 돌연변이 관련 그래픽 객체(1660)가 선택하는 사용자 입력이 수신될 수 있다. 그래픽 객체(1660)가 선택하는 사용자 입력에 응답하여, 해당 돌연변이에 대한 세부 정보가 출력될 수 있다.
도 17은 본 개시의 일 실시예에 따른, 돌연변이에 대한 세부 정보가 출력되는 화면(1700)을 예시하는 도면이다. 도 17에 예시된 바와 같이, 돌연변이와 연관된 그래픽 객체(1660)가 선택되는 사용자 입력에 응답하여, 돌연변이에 대한 세부 정보(1710)가 출력될 수 있다.
돌연변이의 분석 결과에 대한 세부 정보(1710)는 염색체 정보, 돌연변이의 위치와 연관된 베이스 포지션(base position) 정보, DNA에서의 변이와 관련된 HGVSc 정보, 아미노산 변이와 관련된 HGVSp 정보, 해당 포지션에서의 레퍼런스 대립 형질(allele)의 카운트 개수와 관련된 '# of ref.READ' 정보와 '# of alt.READ' 정보, VAF(Variant allele frequency) 값 및 TCF 값 등을 포함할 수 있다. 여기서, TCF 값은 검체에서 해당 돌연변이를 가지고 있는 비율로서, 주변의 여러 정보를 조합하여 산술적으로 추론한 값일 수 있다. 추가적으로, 돌연변이의 분석 결과에 대한 세부 정보(1710)는 기타 항목, 즉, COSMIC 및 ClinVar, PolyPhen, SIFT 등을 포함할 수 있다. 여기서, PolyPhen 및 SIFT는 서열의 보존도(예컨대, 원숭이에도 완전 똑같은 서열이 존재하는지에 대한 정도) 등을 토대로 해당 변이가 유전자의 기능에 미칠 영향을 추론한 결과일 수 있다.
일 실시예에 따르면, 그래픽 객체(1660)와 연관되는 특정 돌연변이에 대한 비교를 요청하는 사용자 입력이 수신될 수 있다. 이 경우, 정보 처리 시스템은 사용자 단말로부터 특정 돌연변이에 대한 비교 요청을 수신할 수 있고, 비교 요청을 수신하는 것에 응답하여 검체와 연관된 프로젝트에 포함된 타 검체를 식별할 수 있다. 이어서, 정보 처리 시스템은 식별된 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 데이터베이스로부터 추출하여 사용자 단말로 전송할 수 있다. 이 경우, 사용자 단말은 검체로부터 발견된 특정 돌연변이에 대한 세부 정보 및 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 연관시켜 사용자 인터페이스를 통해 출력할 수 있다. 연관된 각 돌연변이에 대한 세부 정보는 사용자 인터페이스를 통해 한 화면에 출력될 수 있다. 이에 따라, 사용자는 한 화면을 통해서 서로 다른 검체에 대한 세부 정보를 비교할 수 있다.
한편, 사용자 단말은 프로젝트와 연관된 모든 정보를 저장할 수 있다. 이렇게 프로젝트와 연관된 모든 정보가 사용자 단말에 저장된 상태에서, 그래픽 객체(1660)와 연관된 특정 돌연변이에 대한 비교를 요청하는 사용자 입력이 수신되면, 사용자 단말은 저장중인 프로젝트 정보로부터 타 검체에 유전체 분석 정보를 추출하고, 추출된 유전체 분석 정보로부터 특정 돌연변이에 대한 세부 정보를 획득할 수 있다. 이어서, 사용자 단말은 검체로부터 발견된 특정 돌연변이에 대한 세부 정보 및 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 연관시켜 사용자 인터페이스를 통해 출력할 수 있다
한편, 돌연변이와 연관된 그래픽 객체(1660)가 선택되는 경우, 돌연변이와 연관된 아미노산 영역이 자동적으로 확대될 수 있다.
도 18은 염기서열 및 아미노산 서열 중 특정 영역이 확대되어 디스플레이되도록 설정된 정보 출력 영역(1800)을 예시하는 도면이다. 특정 돌연변이와 연관된 그래픽 객체(1660)를 선택하는 사용자 입력에 응답하여, 특정 돌연변이와 연관된 아미노산 서열의 특정 영역과 염기서열의 특정 영역이 확대 또는 줌인되어 디스플레이될 수 있다. 아미노산 서열 및 염기서열의 특정 영역들이 줌인되어 디스플레이됨에 따라, 변이가 발생한 염기와 아미노산 식별자 각각과 연관된 문자가 확대되어 디스플레이되고, 이에 따라 사용자는 육안으로 염기와 아미노산 식별자를 인지할 수 있다.
아미노산이 레퍼런스 아미노산과 상이하다고 판정된 경우, 레퍼런스 아미노산의 식별자와 변이된 아미노산 식별자를 포함하는 아미노산 변경 정보(1810)가 정보 출력 영역(1800)에 출력될 수 있다.
도 18의 아미노산 변경 정보(1810)에는, 레퍼런스 염기서열의 염기로서 'C', 검체에서 변이된 염기로서 'T'가 포함되고, 레퍼런스 아미노산 식별자로서 'P' 및 변이된 아미노산 식별자로서 'L'이 포함된 것으로 예시되어 있다. 도 18의 아미노산 변경 정보(1810)에 따르면, 레퍼런스 염기서열과 비교하여 검체의 염기가 'C'에서 'T'로 변이되고, 레퍼런스 아미노산과 비교하여 검체의 아미노산이 'P'에서 'L'로 변이된 것으로 해석될 수 있다.
도 18과 같은 확대 화면은 포인터의 드래그 또는 터치 제스처를 통해서도 달성될 수 있다. 즉, 포인터를 통해 도 18과 연관된 영역을 드래그되면 도 18에 예시된 영역이 확대되어 출력될 수 있다.
제2 브라우저에는 전사 모델을 선택할 수 있는 전사 모델 목록이 출력될 수 있다. 전사 모델 목록은 염기서열 내에서 일부 영역과 연관된 복수의 전사 모델을 포함할 수 있다. 예를 들어, 전체 염기서열 내에서 제1 지점과 제2 지점까지의 범위를 가지는 제1 영역이 선택된 경우, 제1 영역의 일부 또는 전부를 전사 및 번역할 수 있는 복수의 전사 모델이 전사 모델 목록에 포함될 수 있다.
일 실시예에 따르면, 정보 처리 시스템은 검체로부터 획득된 염기서열을 각각의 전사 모델을 통해서 전사 및 번역하고, 각각의 전사 모델을 통해 번역된 결과를 유전체 분석 정보에 포함시킬 수 있다.
도 19는 전사 모델 목록이 출력된 제2 브라우저(1900)를 예시하는 도면이다. 전사 모델 목록을 요구하는 사용자 입력이 수신되는 것에 응답하여, 전사 모델 목록(1910)이 출력될 수 있다. 전사 모델 목록(1910)에 포함된 전사 모델 중에서 특정 전사 모델을 선택하는 사용자 입력이 수신되는 것에 응답하여, 선택된 특정 전사 모델에 의해서 전사 및 번역된 결과를 반영하도록 제2 브라우저가 제어될 수 있다.
한편, 각각의 전사 모델은 우선순위를 가질 수 있다. 이러한 우선순위는 사용 빈도 등과 같은 조건에 기초하여 미리 결정될 수 있으며, 전문 분석가가 사전에 지정한 것일 수 있고, 또는 텍스트 오름차순/내림차순을 통해 결정될 수 있다.
제1 브라우저에서 출력되는 영역이 변경되면, 해당 영역과 연관되어 전사 모델 목록이 변경될 수 있다. 이렇게 전사 모델 목록이 변경되는 경우에, 전사 모델 목록에 포함된 각 전사 모델의 우선순위에 기초하여, 제2 브라우저에 출력될 타깃 전사 모델이 결정될 수 있다. 즉, 전사 모델 목록에 포함된 전사 모델별 우선순위를 기초로, 최우선 순위를 가지는 전사 모델이 타깃 전사 모델로 결정되고, 결정된 타깃 전사 모델을 통해서 전사 및 번역된 결과를 포함하는 유전자 정보가 제2 브라우저를 통해 출력될 수 있다.
한편, 제1 브라우저에서 특정 염색체가 선택되면, 선택된 특정 염색체에 기초하여 제1 브라우저와 제2 브라우저가 서로 연동되어 동작할 수 있다.
도 20은 본 개시의 일 실시예에 따른, 특정 염색체와 연관된 정보가 출력된 제1 브라우저의 화면(2000)을 예시하는 도면이다. 도 20에서는 1번 염색체가 선택된 것에 응답하여, 1번 염색체의 위치 정보 및 크기와 관련된 정보(2010)가 출력되고, 1번 염색체와 관련된 정보만이 선별되어 정보 출력 영역(2020)에 출력된 것으로 예시되어 있다.
제1 브라우저를 통해 1번 염색체와 연관된 정보가 출력되는 것에 응답하여, 제2 브라우저에 출력되는 정보도 변경될 수 있다.
도 21은 제1 브라우저에서 선택된 염색체와 연관된 유전자와 연동하여 동작하는 제2 브라우저의 화면(2100)을 예시하는 도면이다. 도 21에 예시된 바와 같이, 1번 염색체에 포함된 특정 유전자 'ARID1A' 영역을 전사 및 번역할 수 있는 전사 모델 목록이 획득되고, 전사 모델 목록에 포함된 각 전사 모델의 우선순위에 기초하여, 출력될 타깃 전사 모델이 결정될 수 있다.
결정된 타깃 전사 모델과 관련된 정보(2110)가 제2 브라우저를 통해 출력될 수 있다. 또한, 타깃 전사 모델을 통해 전사 및 번역되는 영역 및 크기와 관련된 정보(2120)가 제2 브라우저를 통해 출력될 수 있다. 또한, 타깃 전사 모델에 의해 전사 및 번역된 결과를 포함하는 유전자 정보(2130)가 제2 브라우저에 통해 출력될 수 있다.
상술한 바와 같이, 제1 브라우저에서 특정 염색체가 선택되면, 특정 염색체와 연관된 유전자 정보가 제2 브라우저에 출력될 수 있다.
한편, 드라이버 목록에서 특정 돌연변이 정보/유전자 레이블이 선택되면, 선택된 돌연변이 정보/유전자 레이블과 연관된 정보가 출력되도록 제1 브라우저와 제2 브라우저가 제어될 수 있다.
도 22는 드라이버 목록에서 선택된 돌연변이 정보에 기초하여 동작되는 제1 브라우저의 화면(2210)과 제2 브라우저의 화면(2220)을 예시하는 도면이다. 가령, 드라이버 목록에서 'CNTNAP2' 및/또는 'CNTNAP2'과 관련된 돌연변이 정보를 선택하는 사용자 입력에 응답하여, 'CNTNAP2' 유전자가 위치하는 7번째 염색체에 관련된 정보만이 제1 브라우저를 통해 정보 출력 영역(2214)에 출력될 수 있다. 즉, 사용자가 드라이버 목록에서 'CNTNAP2' 및/또는 'CNTNAP2'와 관련된 돌연변이를 선택할 경우, 'CNTNAP2' 유전자가 발견된 7번 염색체만이 선별되어 제1 브라우저를 통해 정보 출력 영역(2214)에 출력될 수 있다. 'CNTNAP2' 유전자와 관련된 염색체가 7번 염색체임을 나타내는 정보(2212)가 제1 브라우저를 통해 출력되고, 더불어 유전자 레이블인 'CNTNAP2'(2216)가 제1 브라우저를 통해 출력될 수 있다.
또한, 7번째 염색체에서 'CNTNAP2' 유전자가 위치하는 영역과 연관된 전사 모델 목록이 획득되고, 전사 모델 목록에 포함된 각 전사 모델의 우선순위에 기초로 타깃 전사 모델이 결정될 수 있다. 타깃 전사 모델에 의해서 전사 및 번역된 결과를 포함하는 유전자 정보가 제2 브라우저를 통해 정보 출력 영역(2224)에 출력될 수 있다. 또한, 타깃 전사 모델의 식별정보 및 타깃 전사 모델에 번역된 위치 영역을 포함하는 정보(2222)가 제2 브라우저를 통해 출력될 수 있다.
상술한 바와 같이, 드라이버 목록에 포함된 돌연변이 정보/유전자 레이블을 선택하는 것을 통해서, 제1 브라우저와 제2 브라우저 각각에 출력되는 정보가 함께 변경될 수 있다.
도 23은 드라이버 목록에서 선택된 돌연변이 정보에 기초하여 동작하는 제1 브라우저의 화면(2310)과 제2 브라우저의 화면(2320)에 대한 다른 예시를 나타내는 도면이다. 가령, 드라이버 목록에서 'MYCN' 및/또는 'MYCN'과 관련된 돌연변이 정보를 선택하는 사용자 입력에 응답하여, 'MYCN' 유전자가 위치하는 2번째 염색체에 관련된 정보만이 제1 브라우저를 통해 정보 출력 영역(2314)에 출력될 수 있다. 'MYCN' 유전자와 관련된 염색체가 2번 염색체임을 나타내는 정보(2312)가 제1 브라우저를 통해 출력되고, 더불어 유전자 레이블인 'MYCN'(2316)이 제1 브라우저를 통해 출력될 수 있다.
또한, 2번째 염색체에서 'MYCN' 유전자가 위치하는 위치 영역과 연관된 전사 모델 목록이 획득되고, 획득된 전사 모델 목록에 포함된 각 전사 모델의 우선순위에 기초로 타깃 전사 모델이 결정될 수 있다. 타깃 전사 모델에 의해서 전사 및 번역된 결과를 포함하는 유전자 정보가 제2 브라우저를 통해 정보 출력 영역(2324)에 출력될 수 있다. 또한, 타깃 전사 모델의 식별정보 및 타깃 전사 모델에 번역된 위치 영역을 포함하는 정보(2322)가 제2 브라우저를 통해 출력될 수 있다.
도 24는 도 7의 제6 서브 영역(760)을 확대한 도면이다. 도 24에 예시된 바와 같이, 확대된 제6 서브 영역(760)에 예시된 바와 같이, 특정 질병과 연관된 주요 돌연변이가 발생하는 유전자의 목록(2420 내지 2440)이 출력될 수 있다. 가령, 이 목록(2420 내지 2440)은 특정 암과 연관된 대표적인 돌연변이들이 발견되는 유전자들의 레이블을 포함할 수 있다.
제6 서브 영역(760)에는 주요 유전자를 추가할 수 있는 입력란(2410)이 출력될 수 있다. 사용자는 유전자 레이블을 입력란(2410)에 입력함으로써, 유전자 목록에 특정 돌연변이와 연관된 유전자 레이블을 추가할 수 있다.
유전자 목록(2420 내지 2440)에는 유전자 유형별로 상이한 그래픽 요소로 시각화된 유전자 레이블이 포함될 수 있다. 일 실시예에 따르면, 유전자 목록에 포함된 유전자들 중에서, 검체로부터 발견되고 더불어 암 유발 드라이버(Oncogene driver) 목록에 포함된 유전자 레이블(2420)이 제1 그래픽 요소를 이용하여 시각화되어 제6 서브 영역(760)에 출력될 수 있다. 또한, 유전자 목록에 포함된 유전자들 중에서, 검체로부터 발견되고 더불어 암 억제 드라이버(Tumor suppressor driver) 목록에 포함된 유전자 레이블(2430)이 제2 그래픽 요소를 이용하여 시각화되어 제6 서브 영역(760)에 출력될 수 있다. 게다가, 유전자 목록에 포함된 유전자들 중에서, 검체로부터 발견되지 않은 돌연변이와 연관된 유전자 레이블(2440)이 제3 그래픽 요소를 이용하여 시각화되어 제6 서브 영역(760)에 출력될 수 있다. 도 24에서는 제1 그래픽 요소는 제1 색상이고, 제2 그래픽 요소는 제2 색상이며, 제3 그래픽 요소는 제3 색상인 것으로 예시되어 있다.
도면에 도시되지 않았으나, 입력란(2410)을 통해서 유전자 목록에 추가된 유전자 레이블이 제4 그래픽 요소를 이용되어 시각화되어 제6 서브 영역(760)에 출력될 수 있다.
본 개시의 일 실시예에 따르면, 유전자 목록에 포함된 특정 유전자 레이블이 선택되면, 선택된 특정 유전자 레이블에 기초하여 제1 브라우저와 제2 브라우저 각각의 정보가 연동하여 변경될 수 있다.
도 25는 본 개시의 일 실시예에 따른, 유전자 목록에서 선택된 유전자에 기초하여 동작하는 제1 브라우저의 화면(2510)과 제2 브라우저의 화면(2520)을 예시하는 도면이다. 가령, 유전자 목록에서 'SETD2'를 선택하는 사용자 입력에 응답하여, 'SETD2' 유전자가 위치한 3번째 염색체에 관련된 정보가 제1 브라우저를 통해 정보 출력 영역(2514)에 출력될 수 있다. 여기서, 'SETD2'는 검체로부터 돌연변이가 발견되지 않은 유전자임을 유의해야 한다. 즉, 본 개시의 실시예에 따르면, 유전자 목록에는 검체로부터 돌연변이가 발견되지 않은 주요 유전자의 레이블도 포함될 수 있고, 이에 따라 유전자 목록 중에서 검체로부터 돌연변이가 발견되지 않은 'SETD2' 유전자를 선택하는 사용자 입력이 수신될 수 있다.
이런 경우, 'SETD2' 유전자가 위치한 3번 염색체가 선별되어 제1 브라우저를 통해 정보 출력 영역(2514)에 출력될 수 있다. 'SETD2' 유전자가 위치한 3번 염색체에 관한 정보(2512)가 제1 브라우저를 통해 출력되고, 더불어 'SETD2' 유전자의 레이블(2516)이 제1 브라우저를 통해 출력될 수 있다.
또한, 'SETD2' 유전자 영역을 전사 및 번역하는데 이용되는 전사 모델 목록이 획득되고, 전사 모델 목록에 포함된 각 전사 모델의 우선순위에 기초로 타깃 전사 모델이 결정될 수 있다. 타깃 전사 모델이 의해서 번역된 결과를 포함하는 유전자 정보가 제2 브라우저를 통해서 정보 출력 영역(2524)에 출력될 수 있다. 또한, 타깃 전사 모델의 식별정보 및 타깃 전사 모델에 의해 번역된 위치 영역을 포함하는 정보(2522)가 제2 브라우저를 통해서 출력될 수 있다.
상술한 바와 같이, 주요 돌연변이 목록에 포함된 돌연변이를 선택하는 것을 통해서, 제1 브라우저와 제2 브라우저 각각에 출력되는 정보가 함께 변경될 수 있다.
도 26은 도 7의 제7 서브 영역(770)을 확대한 도면이다. 도 26에 예시된 바와 같이, 제7 서브 영역(770)에는 검체의 종양 변이 부담(Tumor Mutational Burden)에 대한 플롯(이하, '종양 변이 부담 플롯'으로 지칭함)과 연관된 정보가 출력될 수 있다. 여기서, 종양 변이 부담에 대한 플롯과 연관된 정보는 서로 다른 유형의 변이에 대한 통계 정보를 포함할 수 있다.
예컨대, 검체로부터 발견된 단일 염기서열 변이(SNV: single nucleotide variation), 인델(indel, 삽입 및 삭제), 구조 변이(SV: Structural Variants) 각각에 대한 변이 부담 통계 정보가 산출되어, 그래프 형태로 제7 서브 영역(770)에 출력될 수 있다. 즉, 검체의 단일 염기서열 변이(SNV)에 대한 종양 변이 부담 플롯이 산출되고, 산출된 단일 염기서열 변이(SNV)에 대한 종양 변이 부담 플롯(Plot)과 관련된 그래픽 요소(도 26에서 This Case임)가 단일 염기서열 변이(SNV) 분포 그래프에서 출력될 수 있다. 도 26에서는 단일 염기서열 변이(SNV)에 대한 종양 변이 부담 플롯이 1.13/Mbps로 산출된 것으로 예시되어 있다.
또한, 검체로부터 발견된 인델에 대한 종양 변이 부담 플롯이 산출되고, 산출된 인델에 대한 종양 변이 부담 플롯과 관련된 그래픽 요소(도 26에서 This Case임)가 인델 분포 그래프에서 출력될 수 있다. 도 26에서는 인델에 대한 종양 변이 부담 플롯이 0.15/Mbps로 산출된 것으로 예시되어 있다.
추가적으로, 검체로부터 발견된 구조 변이(SV)에 대한 종양 변이 부담 플롯이 산출되고, 산출된 구조 변이에 대한 종양 변이 부담 플롯과 관련된 그래픽 요소(도 26에서 This Case임)가 구조 변이 분포 그래프에서 출력될 수 있다. 도 26에서는 구조 변이에 대한 종양 변이 부담 플롯이 1.61/Mbps로 산출된 것으로 예시되어 있다.
한편, 몇몇 실시예에서 종양 변이 부담에 대한 비교를 요청하는 사용자 입력이 사용자 인터페이스를 통해서 수신될 수 있다. 이 경우, 정보 처리 시스템은 사용자 단말로부터 종양 변이 부담에 대한 비교 요청을 수신할 수 있으며, 비교 요청을 수신하는 것에 응답하여, 검체가 포함된 프로젝트 또는 정보 처리 시스템(230)에 저장된 모든 프로젝트로부터 타 검체를 식별할 수 있다. 이어서, 정보 처리 시스템은 식별된 타 검체에 대한 종양 변이 부담 플롯과 연관된 정보를 데이터베이스로부터 추출하여 사용자 단말로 전송할 수 있다. 이어서, 사용자 단말은 검체에 대한 종양 변이 부담 플롯 관련 정보 및 타 검체에 대한 종양 변이 부담 플롯 관련 정보를 연관시켜 사용자 인터페이스를 통해 출력할 수 있다. 연관된 검체 및 타 검체에 대한 종양 변이 부담 플롯 관련 정보는 사용자 인터페이스를 통해 한 화면에 출력될 수 있다. 가령, 타 검체에 대한 종양 변이 부담 플롯 관련 통계 정보와 검체에 대한 종양 변이 부담 플롯 관련 통계 정보(예컨대, 도 26과 관련된 통계 정보)가 한 화면에서 비교될 수 있도록, 사용자 인터페이스에 출력될 수 있다.
한편, 사용자 단말에서 프로젝트와 연관된 모든 정보가 저장될 수 있다. 이렇게 프로젝트와 연관된 모든 정보가 사용자 단말에 저장된 상태에서, 종양 변이 부담에 대한 비교를 요청하는 사용자 입력이 수신되면, 저장중인 프로젝트 정보로부터 타 검체에 대한 종양 변이 부담 플롯과 연관된 정보가 추출될 수 있다. 이어서, 사용자 단말은 검체에 대한 종양 변이 부담 플롯과 관련된 정보 및 타 검체에 대한 종양 변이 부담 플롯 관련과 정보를 연관시켜 사용자 인터페이스를 통해 출력할 수 있다.
도 27은 도 7의 제8 서브 영역(780)을 확대한 도면이다. 도 27에 예시된 바와 같이, 검체에 대한 변이 시그니처(Mutational Signature) 정보가 제8 서브 영역(780)에 출력될 수 있다. 변이 시그니처 정보는 SBS 변이 정보와 인델 변이 정보를 포함할 수 있다. 도 27에 예시된 바와 같이 제4 서브 영역(780)에 출력되는 정보(2710 내지 2740)는 그래프 형태로 출력될 수 있다.
도 27에 예시된 바와 같이, SBS 카테고리별로 점유하는 비율을 포함하는 제1 SBS 변이 정보(2710)가 제8 서브 영역(780)에 출력될 수 있다. 여기서, SBS 카테고리는 SBS1, SBS4, SBS5, SBS40 등을 포함할 수 있다. 도 27에서는 검체로부터 발견된 SBS 변이가 SBS1, SBS4, SBS5 및 SBS40이고, SBS1, SBS4, SBS5 및 SBS40 각각이 전체 SBS에서 점유하는 비율이 산출된 후, 산출된 비율이 도넛 그래프 형태로 출력된 것으로 예시되어 있다. 도 27에서는 SBS4와 SBS1이 Etc. 영역에 포함된 것으로 예시되어 있고, Etc. 영역에 포인터가 이동한 후 클릭(또는 터치)되는 경우에, SBS4와 SBS1이 차지하는 비율이 도넛 그래프에서 출력될 수 있다.
또한, 레퍼런스 SBS 변이 정보와 검체로부터 분석된 SBS 변이 정보 간의 코사인 유사도(Cosine Similarity)가 산출되고, 산출된 SBS 코사인 유사도가 제1 SBS 변이 정보(2710)에 포함될 수 있다. 여기서, 레퍼런스 SBS 변이 정보는 SBS 코사인 유사도를 산출하기 위한 기준이 되는 정보로서, 정보 처리 시스템 및/또는 사용자 단말에 미리 저장되거나 정보 처리 시스템 및/또는 사용자 단말에 의해 접근 가능한 임의의 저장 매체에 될 수 있다. 도 27에서는 SBS 코사인 유사도가 0.965인 것으로 예시되어 있다.
추가적으로, SBS와 관련된 변이들이 변이 유형(즉, C>A, C>G, C>T, T>A, T>C 및 T>G)에 따라 구분되고, 구분된 각 변이 유형이 차지하는 비율을 포함하는 제2 SBS 변이 정보(2720)가 제8 서브 영역(780)에 출력될 수 있다. 도 27에 도시된 바와 같이, SBS 변이 유형별 비율을 나타내는 막대 그래프가 제2 SBS 변이 정보(2720)에 포함되어 제8 서브 영역(780)에 출력될 수 있다.
또한, 인델 카테고리별로 점유하는 비율을 포함하는 제1 인델 변이 정보(2730)가 제8 서브 영역(780)에 출력될 수 있다. 여기서, 인델 카테고리는 ID1, ID2, ID3, ID4, ID5, ID6 등과 같은 다양한 인델들을 포함할 수 있다. 도 27에서는 검체로부터 발견된 인델 변이가 ID1, ID2, ID3, ID4, ID5, ID6, ID9, ID10, ID12, ID14, ID17 및 ID18이고, 전체 인델에서 각 인델이 차지하는 비율이 산출되고, 산출된 비율이 도넛 그래프 형태로 제8 서브 영역(780)에 출력된 것으로 예시되어 있다. 도 27에서는 ID2와 ID7 이외의 인델 변이는 Etc. 영역에 포함된 것으로 예시되어 있고, Etc. 영역에 포인터가 이동한 후 클릭(또는 터치)되는 경우에, ID2와 ID7 이외의 기타 유형의 인델 변이가 차지하는 비율이 도넛 그래프에서 출력될 수 있다.
추가적으로, 레퍼런스 인델 변이 정보와 검체로부터 분석된 인델 변이 정보 간의 코사인 유사도가 산출되고, 산출된 인델 코사인 유사도가 제1 인델 변이 정보(2730)에 포함될 수 있다. 여기서, 레퍼런스 인델 변이 정보는 인델 코사인 유사도를 산출하기 위한 기준이 되는 정보로서, 정보 처리 시스템 및/또는 사용자 단말에 미리 저장될 수 있다. 도 27에서는 인델 코사인 유사도가 0.998인 것으로 예시되어 있다.
또한, 인델과 관련된 변이들이 변이 유형(즉, 1bp deletion, 1bp insertion 등)에 따라 구분되고, 구분된 각 변이 유형이 차지하는 비율을 포함하는 제2 인델 정보(2740)가 제8 서브 영역(780)에 출력될 수 있다. 도 27에 예시된 바와 같이, 인델 변이 유형별 비율을 나타내는 막대 그래프가 제8 서브 영역(780)에 출력될 수 있다.
도 28은 본 개시의 일 실시예에 따른, 유전 정보 분석 결과 제공 방법(2800)을 설명하기 위한 흐름도이다. 도 28에 도시된 방법은, 본 개시의 목적을 달성하기 위한 일 실시예일 뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다. 또한, 도 28에 도시된 방법은 정보 처리 시스템에 포함된 적어도 하나의 프로세서 및/또는 사용자 단말에 포함된 적어도 하나의 프로세서에 의해서 수행될 수 있다. 설명의 편의를 위해서 도 3에 도시된 사용자 단말에 포함된 프로세서에 의해서, 도 28에 도시된 각 단계가 수행되는 것으로 설명하기로 한다.
프로세서는 검체에 대한 유전 정보 분석 결과를 제공하기 위한 사용자 인터페이스를 출력할 수 있다(S2810). 일 실시예에 따르면, 사용자 인터페이스에 포함된 제1 영역에는 특정 질병과 연관된 유전자 목록이 출력되고, 사용자 인터페이스에 포함된 제2 영역에는 검체의 분석에 의해 획득된 변이에 관한 정보를 시각화하고 탐색하기 위한 제1 브라우저가 출력될 수 있다. 또한, 사용자 인터페이스에 포함된 제3 영역에는 검체의 분석에 의해 획득된 서열 정보를 탐색하기 위한 제2 브라우저가 출력될 수 있다. 일 실시예에 따르면, 제1 브라우저와 제2 브라우저는 서로 연동되어 동작될 수 있다.
그 후, 프로세서는 사용자 인터페이스를 통해 수신된 사용자 입력에 응답하여, 유전 정보 분석 결과에 대한 세부 정보를 포함하는 반응형(interactive) 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력할 수 있다(S2820).
일 실시예에 따르면, 프로세서는 제1 영역에 출력된 유전자 목록 중에서 특정 돌연변이가 발생한 유전자 선택하는 사용자 입력을 수신할 수 있다. 이어서, 프로세서는 특정 돌연변이를 선택하는 사용자 입력에 응답하여, 선택된 특정 돌연변이가 발생한 유전자의 영역이 출력되도록 제1 브라우저를 제어할 수 있다. 또한, 프로세서는 특정 돌연변이가 발생한 유전자를 선택하는 사용자 입력에 응답하여 서열 정보 중에서 특정 돌연변이가 발생한 유전자의 영역이 출력되도록 제2 브라우저를 제어할 수 있다.
일 실시예에 따르면, 제2 브라우저에 출력된 영역 내에서 특정 돌연변이의 위치를 나타내는 그래픽 객체가 출력될 수 있다. 프로세서는 그래픽 객체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 검체에 대한 유전 정보 분석 결과 중 특정 돌연변이에 관한 세부 정보를 제2 브라우저를 통해 출력할 수 있다.
일 실시예에 따르면, 프로세서는 특정 돌연변이가 발생한 유전자와 연관된 전사 모델 목록을 획득하고, 전사 모델 목록에 포함된 복수의 전사 모델 각각의 우선순위에 기초하여, 출력될 타깃 전사 모델을 결정한 후, 결정된 타깃 전사 모델을 통해 전사되어 번역된 결과를 포함하는 아미노산 서열 정보가 출력되도록, 제2 브라우저를 제어할 수 있다.
일 실시예에 따르면, 프로세서는 특정 돌연변이가 발생한 유전자와 연관된 제1 아미노산이 레퍼런스 염기서열로부터 번역된 제2 아미노산과 상이하다고 판정된 경우, 제1 아미노산과 제2 아미노산의 차이를 나타내는 아미노산 변경 정보가 출력되도록 제2 브라우저를 제어할 수 있다. 여기서, 아미노산 변경 정보는 서열 정보 내에서 특정 돌연변이의 위치와 연관하여 출력될 수 있다.
일 실시예에 따르면, 프로세서는 전사 모델 목록이 출력되도록 제2 브라우저를 제어할 수 있다. 이어서, 프로세서는 전사 모델 목록에서 특정 전사 모델을 선택하는 사용자 입력을 수신하는 것에 응답하여, 특정 전사 모델을 통해 전사되어 번역된 결과를 포함하는 아미노산 서열 정보가 출력되도록 제2 브라우저를 제어할 수 있다.
일 실시예에 따르면, 환자 정보에 포함된 질병 코드에 기초하여 특정 질병이 식별되고, 유전자 목록은 검체로부터 발견된 돌연변이들 중에서 특정 질병과 연관된 돌연변이가 발생한 적어도 하나의 유전자를 포함할 수 있다.
특정 질병은 암과 연관된 질병이고, 유전자 목록은 검체로부터 발견된 돌연변이들 중에서 질병의 유발에 관련된 돌연변이가 발생한 적어도 하나의 유전자를 포함하는 제1 드라이버 목록 및 검체로부터 발견된 돌연변이들 중에서 질병의 억제에 관련된 돌연변이가 발생한 적어도 하나의 유전자를 포함하는 제2 드라이버 목록을 포함할 수 있다. 일 실시예에 따르면, 프로세서는 제1 드라이버 목록에 포함된 적어도 하나의 유전자의 레이블을 제1 그래픽 요소를 이용하여 제1 영역에서 시각화하고, 제2 드라이버 목록에 포함된 적어도 하나의 유전자 레이블을 제2 그래픽 요소를 이용하여 제1 영역에서 시각화할 수 있다.
일 실시예에 따르면, 제2 브라우저에 출력된 영역 내에 특정 돌연변이의 위치와 연관된 그래픽 객체가 출력될 수 있다. 또한, 프로세서는 그래픽 객체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 서열 정보 중에서 특정 돌연변이와 연관된 서열 정보 영역이 확대되어 출력되도록 제2 브라우저를 제어할 수 있다. 확대된 영역에는, 변이가 발생한 염기 또는 아미노산 식별자 중 적어도 하나와 연관된 문자가 디스플레이될 수 있다.
일 실시예에 따르면, 프로세서는 사용자 인터페이스의 제4 영역에 포함된 코멘트 입력란을 통해 사용자의 코멘트를 수신한 후, 검체와 연관된 프로젝트에 참여 중인 적어도 하나의 타 사용자에게 수신된 사용자의 코멘트를 제공할 수 있다.
일 실시예에 따르면, 프로세서는 검체에 대한 종양 변이 부담에 대한 플롯(Plot)과 연관된 제1 정보를 획득하여, 획득된 제1 정보를 사용자 인터페이스의 제5 영역에 출력할 수 있다. 제1 정보는 검체에 대한 단일 염기서열 변이, 검체에 대한 인델 또는 검체에 대한 구조 변이 중 적어도 하나에 대한 종양 변이 부담 통계를 포함할 수 있다.
일 실시예에 따르면, 프로세서는 타 검체에 대한 종양 변이 부담에 대한 플롯과 연관된 제2 정보를 획득하고, 사용자 인터페이스를 통해 제1 정보와 제2 정보를 연관시켜 출력할 수 있다.
일 실시예에 따르면, 프로세서는 검체로부터 발견된 돌연변이들 중에서 특정 돌연변이에 대한 비교를 요청하는 사용자 입력을 수신하는 것에 응답하여, 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 획득할 수 있다. 이어서, 프로세서는 검체로부터 발견된 특정 돌연변이에 대한 세부 정보 및 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 연관시켜 출력할 수 있다.
일 실시예에 따르면, 제1 영역에는 유전자 명칭이 입력되는 입력란이 출력될 수 있다. 프로세서는 입력란을 통해서 입력된 유전자 명칭을 수신하는 것에 응답하여, 수신된 명칭의 유전자를 유전자 목록에 추가할 수 있다.
일 실시예에 따르면, 프로세서는 제1 브라우저를 통해 특정 염색체 또는 특정 유전자를 선택하는 사용자 입력을 수신할 수 있다. 프로세서는 특정 염색체 또는 특정 유전자를 선택하는 사용자 입력에 응답하여, 서열 정보 중에서 선택된 특정 염색체 또는 특정 유전자에 해당하는 영역이 출력되도록 제2 브라우저를 제어할 수 있다. 또한, 프로세서는 특정 염색체 또는 특정 유전자를 선택하는 사용자 입력을 수신하는 것에 응답하여, 특정 염색체 또는 특정 유전자와 연관된 적어도 하나의 염색체에 상응하는 영역만이 출력되도록 제1 브라우저를 제어할 수 있다.
일 실시예에 따르면, 검체로부터 발견된 복수의 돌연변이와 관련된 유전자의 레이블이, 각 유전자의 위치와 연관하여 출력될 수 있다. 가령, 질병의 유발에 관련된 돌연변이와 관련된 유전자의 레이블은 제1 그래픽 요소가 이용되어 시각화되고, 질병의 억제에 관련된 돌연변이와 관련된 유전자의 레이블은 제2 그래픽 요소가 이용되어 시각화될 수 있다. 또한, 질병과 연관된 돌연변이 목록 중에서 검체에서 발견되지 않은 돌연변이와 연관된 유전자의 레이블은 제1 브라우저를 통해 제3 그래픽 요소가 이용되어 시각화될 수 있다.
일 실시예에 따르면, 검체로부터 발견된 각 구조 변이는 제1 브라우저를 통해 구조 돌연변이 개수와 상응하는 개수의 그래픽 객체가 이용되어 시각화될 수 있다. 제1 브라우저는 표현하고자 하는 타깃 구조 변이의 유형에 기초하여 그래픽 객체의 형태, 색상 또는 크기 중 적어도 하나를 결정할 수 있다. 그래픽 객체는 제1 브라우저를 통해 타깃 구조 변이의 영역과 상응하는 범위로 시각화될 수 있다.
일 실시예에 따르면, 프로세서는 임계치 이상 개수의 그래픽 객체들이 임계거리에 포함되어 위치하는지 여부를 판정할 수 있다.
예컨대, 프로세서는 임계치 이상 개수의 그래픽 객체들이 임계거리에 포함되어 위치하고 임계거리에 포함된 특정 그래픽 객체에 포인터가 위치한다고 판정하는 것에 응답하여, 포인터가 위치한 특정 그래픽 객체가 강조되어 시각화되도록 제1 브라우저를 제어할 수 있다. 추가적으로 또는 대안적으로, 프로세서는 임계거리 내에 포함된 그래픽 객체들 중에서, 포인터가 위치한 특정 그래픽 객체를 제외한 다른 그래픽 객체가 제거되거나 흐리게 되도록 제1 브라우저를 제어할 수 있다.
다른 예로서, 프로세서는 임계치 이상 개수의 그래픽 객체들이 임계거리 내에 포함된다고 판정하는 것에 응답하여, 임계거리 내에 포함되어 위치한 그래픽 객체들이 미리 설정된 시간 간격으로 로테이션되면서 강조되어 시각화되도록 제1 브라우저를 제어할 수 있다.
또 다른 예로서, 프로세서는 임계치 이상 개수의 그래픽 객체들이 임계거리에 포함된다고 판정하는 것에 응답하여, 임계거리를 포함하는 영역을 밀집 영역으로 결정하고, 포인터가 밀집 영역에 위치하는 것이 감지되는 경우, 밀집 영역이 확대되도록 제1 브라우저를 제어할 수 있다. 프로세서는 밀집 영역이 제4 그래픽 요소를 이용하여 시각화되도록 제1 브라우저를 제어할 수 있다. 또한, 프로세서는 밀집 영역에 포함된 그래픽 객체를 선택하는 사용자 입력이 수신되는지 여부를 판정한 후, 미리 결정된 시간 동안에 밀집 영역에 포함된 그래픽 객체를 선택하는 사용자 입력이 수신되지 않는다고 판정하는 것에 응답하여, 확대된 밀집 영역이 원래의 크기로 축소되도록 제1 브라우저를 제어할 수 있다. 프로세서는 밀집 영역이 확대된 후에, 포인터가 밀집 영역에 벗어나는 것이 감지되는 경우, 확대된 밀집 영역이 원래의 크기로 축소되도록 제1 브라우저를 제어할 수 있다.
일 실시예에 따르면, 프로세서는 제1 브라우저를 통해 복수의 염색체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 선택된 복수 염색체와 연관된 정보가 출력되도록 제1 브라우저를 제어할 수 있다. 이 경우, 제1 브라우저는 선택된 염색체 개수와 상응하는 개수로 정보 출력 영역을 분할하고, 선택된 복수의 염색체 각각과 연관된 정보를 분할된 화면에 출력할 수 있다.
일 실시예에 따르면, 제1 브라우저에는 적어도 하나의 구조 변이에 대한 정보가 출력되고, 프로세서는 제1 브라우저를 특정 구조 변이를 선택하는 사용자 입력을 수신하는 것에 응답하여, 선택된 특정 구조 변이가 발견된 적어도 하나의 염색체와 연관된 정보만이 출력되도록 제1 브라우저를 제어할 수 있다.
일 실시예에 따르면, 사용자 인터페이스에는, 변이 유형별 필터 객체가 출력될 수 있다. 프로세서는 출력된 변이 유형별 필터 객체 중에서 적어도 하나의 필터 객체를 선택하는 사용자 입력을 수신하고, 적어도 하나의 필터 객체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 획득된 변이에 관한 정보 중에서 선택된 필터 객체와 상응하는 변이에 관한 정보만이 선별되어 출력되도록 제1 브라우저를 제어할 수 있다.
상술한 흐름도 및 상술한 설명은 일 예시일 뿐이며, 일부 실시예에서는 다르게 구현될 수 있다. 예를 들어, 일부 실시예에서는 각 단계의 순서가 바뀌거나, 일부 단계가 반복 수행되거나, 일부 단계가 생략되거나, 일부 단계가 추가될 수 있다.
상술한 방법은 컴퓨터에서 실행하기 위해 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램으로 제공될 수 있다. 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일수도 있다. 또한, 매체는 단일 또는 수개 하드웨어가 결합된 형태의 다양한 기록 수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD 와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 애플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.
본 개시의 방법, 동작 또는 기법들은 다양한 수단에 의해 구현될 수도 있다. 예를 들어, 이러한 기법들은 하드웨어, 펌웨어, 소프트웨어, 또는 이들의 조합으로 구현될 수도 있다. 본원의 개시와 연계하여 설명된 다양한 예시적인 논리적 블록들, 모듈들, 회로들, 및 알고리즘 단계들은 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양자의 조합들로 구현될 수도 있음을 통상의 기술자들은 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 대체를 명확하게 설명하기 위해, 다양한 예시적인 구성요소들, 블록들, 모듈들, 회로들, 및 단계들이 그들의 기능적 관점에서 일반적으로 위에서 설명되었다. 그러한 기능이 하드웨어로서 구현되는지 또는 소프트웨어로서 구현되는 지의 여부는, 특정 애플리케이션 및 전체 시스템에 부과되는 설계 요구사항들에 따라 달라진다. 통상의 기술자들은 각각의 특정 애플리케이션을 위해 다양한 방식들로 설명된 기능을 구현할 수도 있으나, 그러한 구현들은 본 개시의 범위로부터 벗어나게 하는 것으로 해석되어서는 안 된다.
하드웨어 구현에서, 기법들을 수행하는 데 이용되는 프로세싱 유닛들은, 하나 이상의 ASIC들, DSP들, 디지털 신호 프로세싱 디바이스들(digital signal processing devices; DSPD들), 프로그램가능 논리 디바이스들(programmable logic devices; PLD들), 필드 프로그램가능 게이트 어레이들(field programmable gate arrays; FPGA들), 프로세서들, 제어기들, 마이크로제어기들, 마이크로프로세서들, 전자 디바이스들, 본 개시에 설명된 기능들을 수행하도록 설계된 다른 전자 유닛들, 컴퓨터, 또는 이들의 조합 내에서 구현될 수도 있다.
따라서, 본 개시와 연계하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 및 회로들은 범용 프로세서, DSP, ASIC, FPGA나 다른 프로그램 가능 논리 디바이스, 이산 게이트나 트랜지스터 로직, 이산 하드웨어 컴포넌트들, 또는 본원에 설명된 기능들을 수행하도록 설계된 것들의 임의의 조합으로 구현되거나 수행될 수도 있다. 범용 프로세서는 마이크로프로세서일 수도 있지만, 대안으로, 프로세서는 임의의 종래의 프로세서, 제어기, 마이크로제어기, 또는 상태 머신일 수도 있다. 프로세서는 또한, 컴퓨팅 디바이스들의 조합, 예를 들면, DSP와 마이크로프로세서, 복수의 마이크로프로세서들, DSP 코어와 연계한 하나 이상의 마이크로프로세서들, 또는 임의의 다른 구성의 조합으로서 구현될 수도 있다.
펌웨어 및/또는 소프트웨어 구현에 있어서, 기법들은 랜덤 액세스 메모리(random access memory; RAM), 판독 전용 메모리(read-only memory; ROM), 비휘발성 RAM(non-volatile random access memory; NVRAM), PROM(programmable read-only memory), EPROM(erasable programmable read-only memory), EEPROM(electrically erasable PROM), 플래시 메모리, 컴팩트 디스크(compact disc; CD), 자기 또는 마킹 데이터 스토리지 디바이스 등과 같은 컴퓨터 판독가능 매체 상에 저장된 명령들로서 구현될 수도 있다. 명령들은 하나 이상의 프로세서들에 의해 실행 가능할 수도 있고, 프로세서(들)로 하여금 본 개시에 설명된 기능의 특정 양태들을 수행하게 할 수도 있다.
소프트웨어로 구현되는 경우, 상술된 기법들은 하나 이상의 명령들 또는 코드로서 컴퓨터 판독 가능한 매체 상에 저장되거나 또는 컴퓨터 판독 가능한 매체를 통해 전송될 수도 있다. 컴퓨터 판독가능 매체들은 한 장소에서 다른 장소로 컴퓨터 프로그램의 전송을 용이하게 하는 임의의 매체를 포함하여 컴퓨터 저장 매체들 및 통신 매체들 양자를 포함한다. 저장 매체들은 컴퓨터에 의해 액세스될 수 있는 임의의 이용 가능한 매체들일 수도 있다. 비제한적인 예로서, 이러한 컴퓨터 판독가능 매체는 RAM, ROM, EEPROM, CD-ROM 또는 다른 광학 디스크 스토리지, 자기 디스크 스토리지 또는 다른 자기 스토리지 디바이스들, 또는 소망의 프로그램 코드를 명령들 또는 데이터 구조들의 형태로 이송 또는 저장하기 위해 사용될 수 있으며 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있다. 또한, 임의의 접속이 컴퓨터 판독가능 매체로 적절히 칭해진다.
예를 들어, 소프트웨어가 동축 케이블, 광섬유 케이블, 연선, 디지털 가입자 회선 (DSL), 또는 적외선, 무선, 및 마이크로파와 같은 무선 기술들을 사용하여 웹사이트, 서버, 또는 다른 원격 소스로부터 전송되면, 동축 케이블, 광섬유 케이블, 연선, 디지털 가입자 회선, 또는 적외선, 무선, 및 마이크로파와 같은 무선 기술들은 매체의 정의 내에 포함된다. 본원에서 사용된 디스크(disk) 와 디스크(disc)는, CD, 레이저 디스크, 광 디스크, DVD(digital versatile disc), 플로피디스크, 및 블루레이 디스크를 포함하며, 여기서 디스크들(disks)은 보통 자기적으로 데이터를 재생하고, 반면 디스크들(discs)은 레이저를 이용하여 광학적으로 데이터를 재생한다. 위의 조합들도 컴퓨터 판독가능 매체들의 범위 내에 포함되어야 한다.
소프트웨어 모듈은, RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터들, 하드 디스크, 이동식 디스크, CD-ROM, 또는 공지된 임의의 다른 형태의 저장 매체 내에 상주할 수도 있다. 예시적인 저장 매체는, 프로세가 저장 매체로부터 정보를 판독하거나 저장 매체에 정보를 기록할 수 있도록, 프로세서에 연결될 수 있다. 대안으로, 저장 매체는 프로세서에 통합될 수도 있다. 프로세서와 저장 매체는 ASIC 내에 존재할 수도 있다. ASIC은 유저 단말 내에 존재할 수도 있다. 대안으로, 프로세서와 저장 매체는 유저 단말에서 개별 구성요소들로서 존재할 수도 있다.
이상 설명된 실시예들이 하나 이상의 독립형 컴퓨터 시스템에서 현재 개시된 주제의 양태들을 활용하는 것으로 기술되었으나, 본 개시는 이에 한정되지 않고, 네트워크나 분산 컴퓨팅 환경과 같은 임의의 컴퓨팅 환경과 연계하여 구현될 수도 있다. 또 나아가, 본 개시에서 주제의 양상들은 복수의 프로세싱 칩들이나 장치들에서 구현될 수도 있고, 스토리지는 복수의 장치들에 걸쳐 유사하게 영향을 받게 될 수도 있다. 이러한 장치들은 PC들, 네트워크 서버들, 및 휴대용 장치들을 포함할 수도 있다.
본 명세서에서는 본 개시가 일부 실시예들과 관련하여 설명되었지만, 본 개시의 발명이 속하는 기술분야의 통상의 기술자가 이해할 수 있는 본 개시의 범위를 벗어나지 않는 범위에서 다양한 변형 및 변경이 이루어질 수 있다. 또한, 그러한 변형 및 변경은 본 명세서에 첨부된 특허청구의 범위 내에 속하는 것으로 생각되어야 한다.
110, 230 : 정보 처리 시스템
120 : 시퀀싱 장치
210 : 사용자 단말

Claims (1)

  1. 적어도 하나의 프로세서에 의해서 수행되는 유전 정보 분석 결과 제공 방법에 있어서,
    검체에 대한 유전 정보 분석 결과를 제공하기 위한 사용자 인터페이스를 출력하는 단계; 및
    상기 사용자 인터페이스를 통해 수신된 사용자 입력에 응답하여, 상기 유전 정보 분석 결과의 세부 정보를 포함하는 반응형(interactive) 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계
    를 포함하고,
    상기 사용자 인터페이스에 포함된 제1 영역에는, 특정 질병과 연관된 유전자 목록이 출력되고,
    상기 사용자 인터페이스에 포함된 제2 영역에는, 상기 검체의 분석에 의해 획득된 변이(variant)에 관한 정보를 시각화하고(visualize) 탐색하기 위한 제1 브라우저가 출력되고,
    상기 사용자 인터페이스에 포함된 제3 영역에는, 상기 검체의 분석에 의해 획득된 서열 정보(sequence)를 탐색하기 위한 제2 브라우저가 출력되는,
    유전 정보 분석 결과 제공 방법.
KR1020240002438A 2022-09-05 2024-01-05 유전적 변이 정보 제공 방법 및 장치 KR20240033688A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20220112416 2022-09-05
KR1020220112416 2022-09-05
KR1020220167819A KR102623609B1 (ko) 2022-09-05 2022-12-05 유전 정보 분석 결과 제공 방법 및 시스템

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020220167819A Division KR102623609B1 (ko) 2022-09-05 2022-12-05 유전 정보 분석 결과 제공 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR20240033688A true KR20240033688A (ko) 2024-03-12

Family

ID=87933636

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020240002438A KR20240033688A (ko) 2022-09-05 2024-01-05 유전적 변이 정보 제공 방법 및 장치

Country Status (4)

Country Link
US (1) US20240079094A1 (ko)
EP (1) EP4332974A1 (ko)
KR (1) KR20240033688A (ko)
WO (1) WO2024053860A1 (ko)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101188887B1 (ko) * 2010-10-22 2012-10-09 삼성에스디에스 주식회사 유전 정보를 표시하는 시스템 및 방법
KR101967248B1 (ko) * 2012-08-16 2019-04-10 삼성전자주식회사 개인의 유전 정보를 분석하는 방법 및 장치
KR102345994B1 (ko) * 2020-01-22 2022-01-03 가톨릭대학교 산학협력단 Ngs 분석에서의 질병 관련 유전자 선별 방법 및 장치

Also Published As

Publication number Publication date
WO2024053860A1 (ko) 2024-03-14
EP4332974A1 (en) 2024-03-06
US20240079094A1 (en) 2024-03-07

Similar Documents

Publication Publication Date Title
US11043284B2 (en) Methods and systems for biological data analysis
Azuaje Computational models for predicting drug responses in cancer research
Xia et al. NetworkAnalyst-integrative approaches for protein–protein interaction network analysis and visual exploration
Knijnenburg et al. Logic models to predict continuous outputs based on binary inputs with an application to personalized cancer therapy
US10347361B2 (en) Genome explorer system to process and present nucleotide variations in genome sequence data
Theocharidis et al. Network visualization and analysis of gene expression data using BioLayout Express 3D
Xia et al. NetworkAnalyst for statistical, visual and network-based meta-analysis of gene expression data
Wang et al. CoinFold: a web server for protein contact prediction and contact-assisted protein folding
Okuno et al. GLIDA: GPCR—ligand database for chemical genomics drug discovery—database and tools update
Görmez et al. HomSI: a homozygous stretch identifier from next-generation sequencing data
Gong et al. lncRNA-screen: an interactive platform for computationally screening long non-coding RNAs in large genomics datasets
US10573405B2 (en) Genome analysis and visualization using coverages for bin sizes and ranges of genomic base coordinates calculated and stored before an output request
JP7189239B2 (ja) データを解釈および視覚化用の改善されたユーザインターフェースを備えたコンピューティング装置
Schmid-Burgk et al. BrowserGenome. org: web-based RNA-seq data analysis and visualization
Srivas et al. Assembling global maps of cellular function through integrative analysis of physical and genetic networks
Sankararaman et al. INTREPID: a web server for prediction of functionally important residues by evolutionary analysis
Wright et al. Visualisation of BioPAX Networks using BioLayout Express 3D
KR102623609B1 (ko) 유전 정보 분석 결과 제공 방법 및 시스템
Pearce et al. Interactive browser-based genomics data visualization tools for translational and clinical laboratory applications
KR20240033688A (ko) 유전적 변이 정보 제공 방법 및 장치
Koh et al. STAGEs: A web-based tool that integrates data visualization and pathway enrichment analysis for gene expression studies
Hu Analysis Strategy of Protein–Protein Interaction Networks
Hu et al. SeqVISTA: a new module of integrated computational tools for studying transcriptional regulation
Schubert et al. Exploiting combinatorial patterns in cancer genomic data for personalized therapy and new target discovery
Qu Using Machine Learning to Support Better and Intelligent Visualisation for Genomic Data

Legal Events

Date Code Title Description
A201 Request for examination