KR102289533B1 - 특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 전자 장치, 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램 - Google Patents

특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 전자 장치, 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램 Download PDF

Info

Publication number
KR102289533B1
KR102289533B1 KR1020190101129A KR20190101129A KR102289533B1 KR 102289533 B1 KR102289533 B1 KR 102289533B1 KR 1020190101129 A KR1020190101129 A KR 1020190101129A KR 20190101129 A KR20190101129 A KR 20190101129A KR 102289533 B1 KR102289533 B1 KR 102289533B1
Authority
KR
South Korea
Prior art keywords
gene
signature
genes
major
data
Prior art date
Application number
KR1020190101129A
Other languages
English (en)
Other versions
KR20210021768A (ko
Inventor
황태순
홍성의
Original Assignee
주식회사 테라젠바이오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 테라젠바이오 filed Critical 주식회사 테라젠바이오
Priority to KR1020190101129A priority Critical patent/KR102289533B1/ko
Publication of KR20210021768A publication Critical patent/KR20210021768A/ko
Application granted granted Critical
Publication of KR102289533B1 publication Critical patent/KR102289533B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Primary Health Care (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Public Health (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 명세서는 유전자 분석 장치가 제1 유전자에 대하여, 암유전체 지도를 이용하여 제1 유전자와 발현 유사도의 순위를 추출하는 단계; 상기 유전자 분석 장치가 상기 제1 유전자의 발현 유사도의 순위를 기초로 추출한 하나 이상의 유전자 셋트를 GSEA(Gene Set Enrichment Analysis)방법으로 분석하여 제1 주요 시그니처를 추출하는 단계; 상기 주요 시그니처와 연관되는 하나 이상의 유전자 셋트를 검색하고, 상기 하나 이상의 유전자 셋트와 관련된 제2 주요 시그니처를 추출하는 단계; 상기 제1 주요 시그니처 및 상기 제2 주요 시그니처를 포함하는 주요 시그니처 그룹을 생성하는 단계; TCGA 각 암종별 환자 데이터를 수신하고, 상기 암종별 환자 데이터를 상기 주요 시그니처 그룹에 포함된 개별 주요 시그니처를 기준으로 바이클러스터링(biclustering)하는 단계; 및 바이클러스터링된 상기 암종별 환자 데이터를 이용하여 각 환자의 생존 예후 데이터를 기준으로 구별되는 제3 주요 시그니처 및 상기 제3 주요 시그니처와 연관된 유전자들의 리스트를 생성하는 단계를 포함하는, 암종별 타겟 유전자들의 그룹을 판단하는 방법을 개시한다.

Description

특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 전자 장치, 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램{DEVICE, METHOD AND COMPUTER PROGRAM OF DETERMINING GENES RELATED TO THE TARGET GENE BASED ON THE SIGNATURE RELATED TO THE TARGET GENE OF A SPECIFIC DRUG}
본 명세서의 실시예는 특정 약물의 타겟 유전자의 암종별 주요 기전 및 시그니처 유전자들을 판단하는 전자 장치, 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램에 관한 것이다.
암종과 관련된 유전자에 대한 연구가 활발히 이루어지고 있다. 암이 발현되기 전에도 사용자의 유전자를 통해 미래의 암의 발병 여부를 판단하여 발병이 예측되는 암과 관련된 기관을 미리 제거하는 수술을 수행하기도 하며 암 진단 및 치료에 유전자 분석 결과를 활용할 수 있다.
유전자들은 20,000개가 넘으며 각 환자 별로 발현 여부도 차이가 난다. 암의 발병으로 치료를 받는 환자가 치료제의 타겟 유전자가 발현되지 않는 경우 타겟 유전자에 대한 분석 결과 및 환자의 유전자 분석 결과를 이용하여 환자를 위한 암 치료 방법을 선택하는 기술의 필요성이 대두되고 있다.
본 발명은 상술한 필요성에 따른 것으로, 특정 약물의 타겟 유전자의 암종별 기전 및 주요 시그니처 유전자를 판단하는 전자 장치, 방법 및 컴퓨터 프로그램을 제공하는 것을 목적으로 한다.
또한, 본 발명은 암종별 주요 시그니처 유전자 중에서, 각 환자의 발현 유전자를 고려하여 치료제를 선별하여 제공하는 전자 장치, 방법 및 컴퓨터 프로그램을 제공하는 것을 목적으로 한다.
또한, 본 발명은 암종의 치료제의 타겟 유전자 이외의 다른 유전자에게 적용되는 치료제의 개발을 제공하는 전자 장치, 방법 및 컴퓨터 프로그램을 제공하는 것을 목적으로 한다.
그러나 이러한 과제는 예시적인 것으로, 이에 의해 본 발명의 범위가 한정되는 것은 아니다.
본 발명의 실시예들에 따른 특정 약물의 타겟 유전자의 주요 기전 및 시그니처 관련 유전자들을 판단하는 방법은 전자 장치가 제1 유전자에 대하여, 대규모 암종 전사체 정보를 이용하여 제1 유전자와의 발현 유사도의 순위를 유전자 별로 분류하여 추출하는 단계; 상기 전자 장치가 상기 제1 유전자의 발현 유사도의 순위를 기초로 추출한 하나 이상의 유전자 셋트를 GSEA(Gene Set Enrichment Analysis)방법으로 분석하여 제1 주요 시그니처를 추출하는 단계; 상기 전자 장치가 상기 제1 주요 시그니처 및 상기 제1 주요 시그니처와 연관되는 하나 이상의 유전자 셋트를 검색하고, 상기 제1 주요 시그니처와의 강화 기여도를 기초로 상기 하나 이상의 유전자 셋트와 관련된 제2 주요 시그니처를 다시 추출하는 단계; 상기 전자 장치가 상기 대규모 암종 전사체 정보로부터 각 암종별 환자 데이터를 수신하고, 상기 제2 주요 시그니처에 포함된 각 주요 유전자의 발현 정도를 기준으로 상기 암종별 환자 데이터를 바이클러스터링(biclustering)하는 단계; 및 상기 전자 장치가 바이클러스터링된 상기 암종별 환자 데이터를 이용하여 환자들의 생존 예후 데이터들을 각 주요 시그니처의 발현 정도 별로 비교하고 상기 생존 예후 데이터에 기여하는 제3 주요 시그니처를 추출하고 상기 제3 주요 시그니처와 연관된 유전자들의 리스트를 생성하는 단계를 포함할 수 있다.
본 발명의 실시예들에 따른 특정 약물의 타겟 유전자의 주요 기전 및 시그니처 관련 유전자들을 판단하는 방법은 제1 유전자와 관련된 암종에 대한 치료제의 타겟 유전자를 상기 제3 주요 시그니처와 연관된 유전자들로 확장하여 결정하는 단계를 더 포함할 수 있다.
본 발명의 실시예들에 따른 특정 약물의 타겟 유전자의 주요 기전 및 시그니처 관련 유전자들을 판단하는 방법은 암환자인 제1 사용자의 유전자 셋트를 분석하고, 상기 제1 사용자의 유전자 셋트에서 제3 주요 시그니처와 연관되는 유전자들의 발현 정도를 획득하는 단계; 및 상기 유전자들의 발현 정도를 이용하여 상기 제1 사용자에게 발현된 제2 유전자를 검출하는 단계; 상기 제1 사용자의 암종 및 상기 제2 유전자를 고려하여, 상기 제1 사용자의 제2 유전자에게 적용되는 치료제를 검색하여 제공하는 단계;를 포함할 수 있다.
상기 생존 예후 데이터는 생존률, 생존 기간, 전이 여부, 합병증 발생 여부 중 적어도 하나를 포함할 수 있다.
본 발명의 실시예들에 따른 특정 약물의 타겟 유전자의 주요 기전 및 시그니처 관련 유전자들을 판단하는 전자 장치는 제1 유전자에 대하여, 대규모 암종 전사체 정보를 이용하여 제1 유전자와 발현 유사도의 순위를 유전자 별로 분류하여 추출하는 순위 추출부; 상기 제1 유전자의 발현 유사도의 순위를 기초로 추출한 하나 이상의 유전자 셋트를 GSEA(Gene Set Enrichment Analysis)방법으로 분석하여 제1 주요 시그니처를 추출하는 시그니처 추출부; 상기 제1 주요 시그니처 및 상기 제1 주요 시그니처와 연관되는 하나 이상의 유전자 셋트를 검색하고, 상기 제1 주요 시그니처와의 강화 기여도를 기초로 상기 하나 이상의 유전자 셋트와 관련된 제2 주요 시그니처를 다시 추출하는 확장 시그니처 추출부; 상기 대규모 암종 전사체 정보로부터 각 암종별 환자 데이터를 수신하고, 상기 제2 주요 시그니처에 포함된 각 주요 시그니처의 발현 정도를 기준으로 상기 암종별 환자 데이터를 바이클러스터링(biclustering)하는 클러스터링부; 바이클러스터링된 상기 암종별 환자 데이터를 이용하여 환자들의 생존 예후 데이터들을 각 주요 시그니처의 발현 정도 별로 비교하고 상기 생존 예후 데이터에 기여하는 제3 주요 시그니처를 추출하고 상기 제3 주요 시그니처와 연관된 유전자들의 리스트를 생성하는 유전자 리스트 생성부;를 포함할 수 있다.
본 발명의 실시예들에 따른 특정 약물의 타겟 유전자의 주요 기전 및 시그니처 관련 유전자들을 판단하는 전자 장치는 제1 유전자와 관련된 암종에 대한 치료제의 타겟 유전자를 상기 제3 주요 시그니처와 연관된 유전자들로 확장하여 결정하는 타겟 유전자 결정부;를 더 포함할 수 있다.
본 발명의 실시예들에 따른 특정 약물의 타겟 유전자의 주요 기전 및 시그니처 관련 유전자들을 판단하는 전자 장치는 암환자인 제1 사용자의 유전자 셋트를 분석하고, 상기 제1 사용자의 유전자 셋트에서 제3 주요 시그니처와 연관되는 유전자들의 발현 정도를 확인하고, 상기 유전자들의 발현 정도를 이용하여 상기 제1 사용자에게 발현된 제2 유전자를 검출하고, 상기 제1 사용자의 암종 및 상기 제2 유전자를 고려하여, 상기 제1 사용자의 제2 유전자에게 적용되는 치료제을 검색하여 제공하는 환자 맞춤 치료제 검색부;를 포함할 수 있다.
상기 생존 예후 데이터는 생존률, 생존 기간, 전이 여부, 합병증 발생 여부 중 적어도 하나를 포함할 수 있다.
본 발명의 실시예에 따른 컴퓨터 프로그램은 컴퓨터를 이용하여 본 발명의 실시예에 따른 방법 중 어느 하나의 방법을 실행시키기 위하여 매체에 저장될 수 있다.
이 외에도, 본 발명을 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공된다.
전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 특허청구범위 및 발명의 상세한 설명으로부터 명확해 질 것이다.
상기한 바와 같이 이루어진 본 발명의 일 실시예에 따르면, 특정 약물의 타겟 유전자의 암종별 기전 및 주요 시그니처 유전자를 판단할 수 있다.
또한, 본 발명의 일 실시예에 따르면 특정 약물의 타겟 유전자와 관련한 주요 시그니처 유전자중에서, 각 환자의 발현 유전자를 고려하여 치료제를 선별하여 제공할 수 있다.
또한, 본 발명의 일 실시예에 따르면 암종의 치료제의 타겟 유전자 이외의 다른 유전자에게 적용되는 치료제의 개발을 제공할 수 있다.
도 1은 본 발명의 일 실시예예 따른 특정 약물의 타겟 유전자의 주요 기전 및 시그니처 관련 유전자들을 판단하는 유전자 판단 시스템을 설명하기 위한 시스템도이다.
도 2는 본 발명의 실시예들에 따른 특정 약물의 타겟 유전자의 주요 기전 및 시그니처 관련 유전자들을 판단하는 전자 장치의 블록도이다.
도 3 내지 도 6은 본 발명의 실시예에 각 단계를 설명하기 위한 도면이다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있다.
본 개시의 다양한 실시예에서 사용될 수 있는 "포함한다." 또는 "포함할 수 있다." 등의 표현은 개시(disclosure)된 해당 기능, 동작 또는 구성요소 등의 존재를 가리키며, 추가적인 하나 이상의 기능, 동작 또는 구성요소 등을 제한하지 않는다. 또한, 본 개시의 다양한 실시예에서, "포함하다." 또는 "가지다." 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 개시의 다양한 실시예에서 "또는" 등의 표현은 함께 나열된 단어들의 어떠한, 그리고 모든 조합을 포함한다. 예를 들어, "A 또는 B"는, A를 포함할 수도, B를 포함할 수도, 또는 A 와 B 모두를 포함할 수도 있다.
본 개시의 다양한 실시예에서 사용된 "제1", "제2", "첫째", 또는 "둘째" 등의 표현들은 다양한 실시예들의 다양한 구성요소들을 수식할 수 있지만, 해당 구성요소들을 한정하지 않는다. 예를 들어, 상기 표현들은 해당 구성요소들의 순서 및/또는 중요도 등을 한정하지 않는다. 상기 표현들은 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 수 있다. 예를 들어, 제1 사용자 기기와 제2 사용자 기기는 모두 사용자 기기이며, 서로 다른 사용자 기기를 나타낸다. 예를 들어, 본 개시의 다양한 실시예의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 새로운 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 새로운 다른 구성요소가 존재하지 않는 것으로 이해될 수 있어야 할 것이다.
본 개시의 실시 예에서 "모듈", "유닛", "부(part)" 등과 같은 용어는 적어도 하나의 기능이나 동작을 수행하는 구성요소를 지칭하기 위한 용어이며, 이러한 구성요소는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 "모듈", "유닛", "부(part)" 등은 각각이 개별적인 특정한 하드웨어로 구현될 필요가 있는 경우를 제외하고는, 적어도 하나의 모듈이나 칩으로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다.
본 개시의 다양한 실시예에서 사용한 용어는 단지 특정일 실시예를 설명하기 위해 사용된 것으로, 본 개시의 다양한 실시예를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 개시의 다양한 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.
일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 개시의 다양한 실시예에서 명백하게 정의되지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하에서, 첨부된 도면을 이용하여 본 발명의 다양한 실시 예들에 대하여 구체적으로 설명한다.
도 1은 본 발명의 일 실시예에 따른 특정 약물의 타겟 유전자의 주요 기전 및 시그니처 관련 유전자들을 판단하는 유전자 판단 시스템을 설명하기 위한 시스템도이다.
도 1을 참조하면, 유전자 판단 시스템은 전자 장치(100, 이하 추론장치), 서버(200), 단말기(301) 및 외부 기관(302)을 포함할 수 있다.
전자 장치(100)는 데스크 탑 컴퓨터일 수 있으나, 이에 한정하지 않으며 특정 약물의 타겟 유전자의 주요 기전 및 시그니처 유전자 들을 판단하는 방법을 수행하기 위한 프로그램을 실행시킬 수 있는 모든 종류의 전자장치일 수 있다.
전자 장치(100)는 대규모 암종 전사체 정보, 환자들의 유전자 데이터, 환자의 생존 예후 데이터 등을 기초로 정해진 유전자와 발현 유사도를 가지는 주요 시그니처를 추출하는 장치일 수 있다. 본 발명의 일 실시예에 따르면 전자 장치(100)는 서버(200), 단말기(301), 외부 기관(302) 중 적어도 하나로부터 대규모 암종 전사체 정보, 환자들의 유전자 데이터, 환자의 생존 예후 데이터를 수신 받을 수 있으나, 이에 한정하지 않는다.
한편, 판단을 위한 파일, 알고리즘 등은 서버(200)로 전송되어 관리될 수 있다. 서버(200)는 전자 장치(100), 단말기(301) 및/또는 외부 기관(302)으로부터 수신한 데이터베이스를 바탕으로 판단 모델을 생성, 재생성, 갱신할 수 있고, 이를 전자 장치(100)로 전송할 수 있다. 구체적으로 서버(200)는 환자들의 유전자 데이터, 대규모 암종 전사체 정보 등을 주기적으로 탐색하여 획득하고 각 데이터의 데이터베이스를 갱신할 수 있다.
사용자 단말기(301)는 유무선 통신 환경에서 데이터를 송수신할 수 있는 통신 단말기를 의미한다. 여기서, 사용자 단말기(301)는 사용자의 퍼스널 컴퓨터 일 수도 있고, 사용자의 휴대용 단말기일 수도 있다. 사용자는 피험자일 수 있고, 피험자는 직접 신체 정보, 생활습관정보, 가족력 정보 등을 입력하여 서버(200)로 전송할 수 있다.
도 1에서는 사용자 단말기(301)는 휴대용 단말기가 스마트폰으로 도시되었지만 본 발명의 사상은 이에 제한되지 아니하며 상술한 바와 같이 통신망과 연결이 가능한 프로그램이 탑재되거나 통신 모듈과 연결된 모든 종류의 전자기기를 포함할 수 있다. 구체적으로 사용자 단말기(301)는 컴퓨터(예를 들면, 데스크톱, 랩톱, 태블릿 등), 미디어 컴퓨팅 플랫폼(예를 들면, 케이블, 위성 셋톱박스, 디지털 비디오 레코더), 핸드헬드 컴퓨팅 디바이스(예를 들면, PDA, 이메일 클라이언트 등), 핸드폰의 임의의 형태 또는 다른 종류의 컴퓨팅 또는 커뮤니케이션 플랫폼의 임의의 형태를 포함할 수 있으나, 본 발명이 이에 한정되는 것은 아니다.
도 1에는 사용자 단말기(302)이 각각 단수로 도시되어 있으나, 본 발명의 일 실시예에 따르면 복수개의 사용자 단말기들이 직접 추론장치(100) 및 서버(200)와 연결될 수 있다.
기관(302)은 암환자를 치료하고 암환자의 치료제를 개발하는 의료 기관 및/또는 전문 기업 일 수 있다. 기관(302)은 서버(200)로 환자들의 유전자 데이터, 환자의 치료 데이터, 환자의 생존 예후 데이터를 전송할 수 있고, 기관(302)는 전자 장치(100)를 통해 획득되는 출력 데이터를 수신 받을 수 있다.
도 2는 본 발명의 실시예들에 따른 특정 약물의 타겟 유전자의 주요 기전 및 시그니처 관련 유전자들을 판단하는 전자 장치(100)의 블록도이다.
전자 장치(100)는 프로세서(110), 입력부(120), 출력부(130), 통신부(140), 저장 매체(150)를 포함할 수 있다.
프로세서(110)는 저장 매체(150)에 저장된 모듈들의 실행을 처리할 수 있다. 프로세서(110)는 전자 장치(100)를 전반적으로 제어하기 위한 구성이다. 구체적으로, 프로세서(110)는 전자 장치(100)의 저장 매체(150)에 저장된 각종 프로그램을 이용하여 전자 장치(100)의 전반적인 동작을 제어한다. 예를 들어, 프로세서(110)는 CPU, 램(RAM), 롬(ROM), 시스템 버스를 포함할 수 있다. 여기서, 롬은 시스템 부팅을 위한 명령어 세트가 저장되는 구성이고, CPU는 롬에 저장된 명령어에 따라 전자 장치(100)의 메모리에 저장된 운영체제를 램에 복사하고, O/S를 실행시켜 시스템을 부팅시킨다. 부팅이 완료되면, CPU는 메모리(103)에 저장된 각종 애플리케이션을 램에 복사하고, 실행시켜 각종 동작을 수행할 수 있다. 이상에서는 프로세서(110)가 하나의 CPU만을 포함하는 것으로 설명하였지만, 구현 시에는 복수의 CPU(또는 DSP, SoC 등)으로 구현될 수 있다.
본 발명의 일 실시 예에 따라, 프로세서(110)는 디지털 신호를 처리하는 디지털 시그널 프로세서(digital signal processor(DSP), 마이크로 프로세서(microprocessor), TCON(Time controller)으로 구현될 수 있다. 다만, 이에 한정되는 것은 아니며, 중앙처리장치(central processing unit(CPU)), MCU(Micro Controller Unit), MPU(micro processing unit), 컨트롤러(controller), 어플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)), ARM 프로세서 중 하나 또는 그 이상을 포함하거나, 해당 용어로 정의될 수 있다. 또한, 프로세서(110)는 프로세싱 알고리즘이 내장된 SoC(System on Chip), LSI(large scale integration)로 구현될 수도 있고, FPGA(Field Programmable gate array) 형태로 구현될 수도 있다.
입력부(120)는 전자 장치(100)에 다양한 정보를 입력하기 위한 사용자 인터페이스를 포함할 수 있다. 이때, 전자 장치(100)에 입력되는 다양한 정보는 대규모 암종 전사체 정보, 환자들의 유전자 데이터, 환자들의 생존 예후 데이터 등을 포함할 수 있으나, 이에 한정되지 않는다.
출력부(130)는 전자 장치(100)가 제1 유전자와 관련된 제2 주요 시그니처, 및 제3 주요 시그니처를 디스플레이할 수 있다. 본 발명의 일 실시예에 따르면 디스플레이(104)는 입력부(102)를 통해 입력된 정보들로부터 산출된 주요 시그니처, 환자에 적용되는 치료제 등을 표시할 수 있다.
출력부(130)는 다양한 형태의 디스플레이 패널로 구현될 수 있다. 예로, 디스플레이 패널은 LCD(Liquid Crystal Display), OLED(Organic Light Emitting Diodes), AM-OLED(Active-Matrix Organic Light-Emitting Diode), LcoS(Liquid Crystal on Silicon) 또는 DLP(Digital Light Processing) 등과 같은 다양한 디스플레이 기술로 구현될 수 있다. 또한, 출력부(130)는 플렉서블 디스플레이(flexible display)의 형태로 출력부(130)의 전면 영역 및, 측면 영역 및 후면 영역 중 적어도 하나에 결합될 수도 있다.
출력부(130)는 레이어 구조의 터치 스크린으로 구현될 수 있다. 터치 스크린은 디스플레이 기능뿐만 아니라 터치 입력 위치, 터치된 면적뿐만 아니라 터치 입력 압력까지도 검출하는 기능을 가질 수 있고, 또한 실질적인 터치(real-touch)뿐만 아니라 근접 터치(proximity touch)도 검출하는 기능을 가질 수 있다.
통신부(140)는 전자 장치(100)와 데이터를 송수신하기 위한 구성이다. 통신부(140)는 블루투스 통신부, BLE(Bluetooth Low Energy) 통신부, 근거리 무선 통신부(Near Field Communication unit), WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association) 통신부, WFD(Wi-Fi Direct) 통신부, UWB(ultra wideband) 통신부, Ant+ 통신부 등의 근거리 통신부, 이동통신 망을 포함할 수 있다.
저장 매체(150)는 프로세서(110)의 처리 또는 제어를 위한 프로그램 등 전자 장치(100) 전반의 동작을 위한 다양한 데이터를 저장할 수 있다. 저장 매체(150)는 전자 장치(100)에서 구동되는 다수의 응용 프로그램(application program 또는 애플리케이션(application)), 전자 장치(100)의 동작을 위한 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 무선 통신을 통해 외부 서버로부터 다운로드 될 수 있다. 또한 이러한 응용 프로그램 중 적어도 일부는, 전자 장치(100)의 기본적인 기능을 위하여 출고 당시부터 전자 장치(100) 상에 존재할 수 있다. 응용 프로그램은, 저장 매체(150)에 저장되고, 프로세서(110)에 의하여 전자 장치(100)의 동작(또는 기능)을 수행하도록 구동될 수 있다.
저장 매체(150)는 특정 약물의 타겟 유전자의 주요 기전 및 시그니처 유전자를 판단하기 위해서, 순위 추출부(151), 시그니처 추출부(152), 확장 시그니처 추출부(153), 클러스터링부(154), 유전자 리스트 생성부(155), 타겟 유전자 결정부(156), 환자 맞춤 치료제 검색부(157)를 포함할 수 있다.
순위 추출부(151)는 대규모 암종 전사체 정보를 이용하여 제1 유전자와의 발현 유사도의 순위를 유전자 별로 분류하여 획득한다. 여기서, 발현 유사도는 유전자 X 및 유전자 Y 사이의 PCC(person’s correlation coefficient) 값을 말한다. 여기서, 유전자 Y는 전체 20,000 ~ 25,000개의 유전자 중 특정 유전자 X를 제외한 그외 유전자일 수 있다. 즉, 전체 유전자의 개수를 20,000개로 가정한 경우, 유전자 Y는 X를 제외한 19,999개의 유전자 중 하나로, 정해진 X와의 조합이 19,999개의 경우 수로 발생될 수 있다. 19,999개의 조합에 대해서 발현 유사도의 PCC가 산출될 수 있다.
시그니처 추출부(152)는 제1 유전자의 발현 유사도의 순위를 기초로 추출한 하나 이상의 유전자 세트와 관련하여 GSEA 방법으로 분석하여 제1 주요 시그니처를 추출한다. 여기서, GSEA 방법은 환자의 유전자들을 배열시킨 데이터를 이용하여 주요 시그니처를 추출할 수 있다. 구체적으로, GSEA 방법은 환자의 유전자들을 정해진 주요 시그니처와의 강화 점수(Enrichment Score)의 순서로 배열시킨 후, 강화 점수의 크기가 만드는 곡선의 일정 구간 내에 해당되는 유전자들 및/또는 주요 시그니처를 추출할 수 있다.
확장 시그니처 추출부(153)는 제1 주요 시그니처 및/또는 제1 주요 시그니처와 연관되는 하나 이상의 유전자 세트를 검색하고, 상기 하나 이상의 유전자 세트와 관련된 제2 주요 시그니처를 다시 추출할 수 있다. 제1 주요 시그니처에 해당하는 유전자들 중에서 핵심 유전자를 선별하고 핵심 유전자와 관련된 제2 주요 시그니처를 다시 추출할 수 있다. 핵심 유전자는 제1 주요 시그니처와 관련된 유전자들의 강화 점수(Enrichment Score)의 최고값 까지의 구간 내에 포함된 유전자를 말한다.
클러스터링부(154)는 대규모 암종 전사체 정보로부터 각 암종별 환자의 유전자 데이터를 수신하고 제2 주요 시그니처에 포함된 각 주요 유전자의 발현 정도를 기준으로 암종별 환자의 유전자 데이터를 바이클러스터링한다. 환자의 유전자 데이터는 환자의 유전자들 및 유전자들의 발현 정도를 포함할 수 있다. 클러스터링부(154)는 복수의 환자들의 유전자 데이터들을 각 환자의 전자 별로 분류하고, 각 유전자의 발현 정도가 동일한 환자들의 환자 데이터들이 위치적으로 인접하게 분포하도록 환자 데이터들의 배치 순서를 변경한 분포도를 생성할 수 있다. 유전자별 발현 정도가 동일한 환자 데이터들이 하나의 묶음으로 배치되도록 각 환자 데이터의 순서, 분포 위치가 변경될 수 있다.
유전자 리스트 생성부(155)는 바이클러스터링된 암종별 환자 데이터를 이용하여 환자들의 유전자 별 발현 정도 및 생존 예후 데이터들을 통계적으로 분석하여 각 환자 데이터의 생존 관련 통계값을 기준으로 환자 데이터를 분류하고, 생존 예후 데이터에 기여하는 제3 주요 시그니처를 추출하고 제3 주요 시그니처와 연관된 유전자들의 리스트를 생성할 수 있다. 여기서, 생존 예후 데이터에 기여하는 주요 시그니처는 주요 시그니처의 발현 유무에 따라서 생존여부, 생존 기간, 생존율 등의 차이가 있는 시그니처를 말한다.
이를 통해, 대규모 암종 전사체 정보를 이용하여 제1 유전자와 발현 유사도를 가지는 주요 시그니처, 유전자들을 포함하도록 주요 시그니처를 확장할 수 있다. 제1 유전자를 타겟으로 하는 치료제가 제1 유전자 및 제1 내지 제3 주요 시그니처와 관련된 유전자로 타겟으로 확장하여 적용될 수 있도록 한다.
타겟 유전자 결정부(156)는 제1 유전자와 관련된 암종에 대한 치료제의 타겟 유전자를 제3 주요 시그니처와 연관된 유전자들로 확장하여 결정할 수 있다. 이를 통해, 특정 유전자를 타겟으로 하는 치료제를 환자에게 적용함에 있어서, 타겟인 유전자와 관련되는 특성으로 인해 치료제에 의해 반응하는 다른 유전자 및 다른 주요 시그니처를 추출하고 추출된 유전자 및 주요 시그니처를 환자의 유전자 데이터와 비교 분석하여 치료제의 처방 여부를 분석할 수 있다.
환자 맞춤 치료제 검색부(157)는 암환자인 제1 사용자의 유전자 세트를 분석하고 제1 사용자의 유전자 세트에서 제3 주요 시그니처와 연관되는 유전자들의 발현 정도를 획득하고, 상기 유전자들의 발현 정도를 이용하여 제1 사용자에게 발현된 제2 유전자를 검출하고, 제1 사용자의 암종 및 제2 유전자를 고려하여 제1 사용자의 제2 유전자에게 적용되는 치료제를 검색하여 제공할 수 있다.
환자 맞춤 치료제 검색부(157)는 발현된 제2 유전자를 타겟 유전자로 하거나, 제2 유전자와 관련된 주요 시그니처, 유전자를 타겟 유전자로 하는 치료제를 제1 사용자의 치료제로 선택할 수 있다.
도 2는 본 발명의 실시예들에 따른 특정 약물의 타겟 유전자의 주요 기전 및 시그니처 관련 유전자들을 판단하는 방법의 흐름도이다.
S110에서는 전자 장치(100)는 대규모 암종 전사체 정보를 이용하여 제1 유전자와 발현 유사도의 순위를 추출한다.
S120에서는 전자 장치(100)는 제1 유전자의 발현 유사도의 순위를 기초로 추출한 하나 이상의 유전자 세트와 관련하여 GSEA 방법으로 분석하여 제1 주요 시그니처를 추출한다. 여기서, GSEA 방법은 환자의 유전자들을 배열시킨 데이터를 이용하여 주요 시그니처를 추출할 수 있다. 구체적으로, GSEA 방법은 환자의 유전자들을 정해진 주요 시그니처와의 강화 점수(Enrichment Score)의 순서로 배열시킨 후, 강화 점수의 크기가 만드는 곡선의 일정 구간 내에 해당되는 유전자들 및/또는 주요 시그니처를 추출할 수 있다.
S130에서는 전자 장치(100)는 제1 주요 시그니처와 연관되는 하나 이상의 유전자 세트를 검색하고, 상기 하나 이상의 유전자 세트와 관련된 제2 주요 시그니처를 다시 추출할 수 있다. 제1 주요 시그니처에 해당하는 유전자들 중에서 핵심 유전자를 선별하고 핵심 유전자와 관련된 제2 주요 시그니처를 다시 추출할 수 있다. 핵심 유전자는 제1 주요 시그니처와 관련된 유전자들의 강화 점수(Enrichment Score)의 최고값 까지의 구간 내에 포함된 유전자를 말한다.
S140에서는 전자 장치(100)는 대규모 암종 전사체 정보로부터 각 암종별 환자 데이터를 수신하고 제2 주요 시그니처에 포함된 각 주요 시그니처의 발현 정도를 기준으로 암종별 환자 데이터를 바이클러스터링한다. 환자 데이터는 환자의 유전자들 및 유전자들의 발현 정도를 포함할 수 있다. 전자 장치(100)는 복수의 환자들의 데이터들을 유전자 별로 분류하고, 유전자의 발현 정도가 동일한 환자들의 데이터들이 인접하게 분포하도록 환자 데이터의 배치 순서, 분포도를 변경할 수 있다. 유전자별 발현 정도가 동일한 환자 데이터들이 하나의 묶음으로 배치되도록 각 환자 데이터의 순서, 분포 위치가 변경될 수 있다.
S150에서는 전자 장치(100)는 바이클러스터링된 암종별 환자 데이터를 이용하여 환자들의 유전자 별 발현 정도 및 생존 예후 데이터들을 통계적으로 분석할 수 있다. 전자 장치(100)는 이렇게 분석된 결과를 이용하여 각 환자 데이터의 생존 관련 통계값을 기준으로 환자 데이터를 분류하고, 생존 예후 데이터에 기여하는 제3 주요 시그니처를 추출하고 제3 주요 시그니처에 해당하는 유전자들의 리스트를 생성할 수 있다.
이를 통해, 대규모 암종 전사체 정보를 이용하여 제1 유전자와 관련된 주요 시그니처를 확장할 수 있다. 제1 유전자를 타겟으로 하는 치료제가 제1 유전자 및 제1 내지 제3 주요 시그니처와 관련된 유전자로 타겟으로 확장하여 적용될 수 있도록 한다.
S150 이후에, 전자 장치(100)는 제1 유전자와 관련된 암종에 대한 치료제의 타겟 유전자를 제3 주요 시그니처와 연관된 유전자들로 확장하여 결정할 수 있다. 이를 통해, 특정 유전자를 타겟으로 하는 치료제를 환자에게 적용함에 있어서, 타겟인 유전자와 관련되는 특성으로 인해 치료제에 의해 반응하는 다른 유전자 및 다른 주요 시그니처를 추출하고 추출된 유전자 및 주요 시그니처를 환자의 유전자 데이터와 비교 분석하여 치료제의 처방 여부를 분석할 수 있다.
S150 이후에, 전자 장치(100)는 암환자인 제1 사용자의 유전자 세트를 분석하고 제1 사용자의 유전자 세트에서 제3 주요 시그니처와 연관되는 유전자들의 발현 정도를 획득하고, 상기 유전자들의 발현 정도를 이용하여 제1 사용자에게 발현된 제2 유전자를 검출하고, 제1 사용자의 암종 및 제2 유전자를 고려하여 제1 사용자의 제2 유전자에게 적용되는 치료제를 검색하여 제공할 수 있다.
도 3 내지 도 6은 본 발명의 실시예에 각 단계를 설명하기 위한 도면이다.
도 3에 도시된 바와 같이, 제1 주요 시그니처(31)에서 GSEA 방법을 거쳐 제2 주요 시그니처(32)를 재 설정할 수 있다.
제2 주요 시그니처(31)은 제1 주요 시그니처(31)와 생물학적 특성이 관련된 것이다.
GSEA 방법으로 재 설정된 제2 주요 시그니처(32) 및 제2 주요 시그니처(32)에 기여한 주요 유전자를 다시 시그니처로 재설정하고 상기 설정된 시그니처 및 암종별 환자 데이터를 기초로 환자를 분류할 수 있다. 환자는 제2 주요 시그니처를 추출하는데 이용된 강화 점수로 암종별 환자 데이터를 통계적으로 분석한 결과로 분류될 수 있다. 통계적으로 분석된 수치에 따라서, 사용자들은 33, 34, 35 그룹으로 나뉠 수 있다. 여기서, 통계적으로 분석하는 것과 관련하여, Permutation 방법으로 분석할 수 있으며, Permutation 방법으로 통해 p-value, q-value, Enrichment Score 등을 획득할 수 있다. 좀더 구체적으로, p-value < 0.05 인 경우, High 그룹으로, 0.05 < p-value < 0.5 인 경우, Medium 그룹, p-value < 0.5 인 경우, low 그룹으로 분류될 수 있다.
도 4은 제1 주요 시그니처(31) 및 제2 주요 시그니처(32) 사이의 관계를 나타내는 2차원의 그래프의 예시 도면이다.
제1 주요 시그니처와 관련된 발현 유사도의 크기를 기초로 전체의 유전자들을 배열시키고, 발현 유사도의 최고값까지 이르는 상승 구간(41)에 해당하는 유전자들을 제2 주요 시그니처로 추출할 수 있다. 도 4에 도시된 바와 같이, 2차원의 그래프는 타겟 유전자와의 발현의 유사도의 크기를 x축으로, 주요 시그니처 내 속하는지 여부에 따른 강화 점수를 y축으로 할 수 있다. 강화 점수(Enrichment score)는 도 3에서 설명한 바와 같이 Permutation 방법으로 산출될 수 있다. 특정 약물의 타겟 유전자와 발현의 유사성을 기반으로 서열화된 유전자 (GSEA의 X값) 에 대하여 제1주요 시그니처 내 속하는지 여부에 따라 가산점 혹은 감점을 부여하게 되어 (GSEA의 Y값) 강화 점수의 그래프는 강화 점수에 따라 상승하다가 하강하는 곡선을 이루게 된다. 강화 점수가 상승하는 상승 구간(41) 내에 포함된 유전자들, 41 구간 내의 유전자들의 주요 시그니처를 제2 주요 시그니처로 재 설정할 수 있다. X값은 Rank profile이고, Y 값은 Enrichment Score 일 수 있다.
도 5는 바이클러스터링 단계를 설명하는 도면이다.
도 5에 도시된 바와 같이, 시그니처를 추출하는 단계(51), 중복된 유전자를 제거하는 단계(52), 주요 시그니처를 매핑하는 단계(53), 통계적으로 분석하는 단계(54)를 거쳐서 바이클러스터링할 수 있다.
시그니처 A가 Gene1, Gene3, Gene5, Gene 10이고, 시그니처 B가 Gene1, Gene2, Gene4, Gene7이고, 시그니처 C가 Gene6, Gene8, Gene9인 경우, 시그니처 A, B, C를 기준으로 클러스터 1, 2, 3를 생성할 수 있다. 이때, 대상 유전자는 Gene1, Gene2, Gene3, Gene4, Gene5, Gene6, Gene7, Gene8, Gene9, Gene10(n=10)일 수 있다. 클러스터 1, 2, 3의 유전자들을 비교하여 중복되는 유전자들이 있는지 여부를 판단하고, 중복되는 유전자들을 포함하는 시그니처를 검색하고, 해당 시그니처에 포함된 유전자들을 제거하는 과정을 반복하여, 바이클러스티링할 수 있다.
이렇게 바이클러스터링된 유전자의 수(n) 및 샘플의 수(m)을 기초로 nxm 매트릭스를 최종적으로 생성하게 된다.
바이클러스터링 된 매트릭스는 도 6에 도시된 바와 같으며, 해당 매트릭스에서, x축을 샘플을, y축은 유전자를 나타낸다. 유전자들은 시그니처별로 구별되는 색으로 표현될 수 있다. 예를 들어, 보라색, 검정색, 연두색, 초록색, 빨간색으로 구분될 수 있다. 샘플들도 환자군에 대응되는 구별되는 색으로 표현될 수 있다. 매트릭스의 값들은 해당 샘플의 해당 유전자의 발현 정도를 나타내며, 붉을수록 발현정도가 크고, 푸를수록 발현 정도가 낮다.
보라색에 해당하는 시그니처에 포함된 유전자들을 선택하고, 해당 유전자들의 발현정도들을 환자군 별로 비교하여, 가장 발현정도가 큰 그룹과 가장 발현정도가 작은 그룹을 선별할 수 있다. 해당 유전자들의 발현정도가 큰 제1 그룹의 환자군의 생존률 및 발현정도가 적은 제2 그룹의 환자군의 생존률을 비교하여 생존률에 기 설정된 기준 값 이상의 차이가 있는지 여부를 판단한다. 만약, 제1 그룹과 제2 그룹 사이의 생존률에 기준 값 이상의 차이가 있는 것으로 판단되면, 해당 환자군의 대상 질병인 암종에 대해서 해당 유전자들을 포함하는 시그니처를 주요 시그니처로 추출할 수 있다.
도 6에 도시된 바와 같이, 바이클러스터링된 사용자들의 유전자 데이터는 유전자의 순서에 따라 배열되어 사용자 별로 배치될 수 있다.
바이클러스터링된 유전자 데이터들의 매트릭스에서 발현 유무, 발현 정도가 유사한 부분을 61과 같이 추출하고, 해당 61의 환자군과 다른 환자군의 생존률 사이를 비교하여 시그니처와 대상 질병인 암종 사이의 연관성을 판단할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (9)

  1. 전자 장치가 특정 약물의 치료 타겟 유전자인 제1 유전자에 대하여, 대규모 암종 전사체 정보를 이용하여 제1 유전자와의 발현 유사도의 순위를 유전자 별로 분류하여 추출하는 단계;
    상기 전자 장치가 상기 제1 유전자를 제외한 다른 유전자들에 대해 상기 제1 유전자와의 발현 유사도의 순위를 획득하는 단계;
    상기 전자 장치가 상기 제1 유전자와의 발현 유사도의 크기 값 및 강화 점수의 2차원의 그래프를 이용하여 상기 강화 점수가 상승하는 상승 구간 내에 포함된 유전자들의 제1 주요 시그니처를 추출하는 단계;
    상기 전자 장치가 상기 제1 주요 시그니처 및 상기 제1 주요 시그니처에 해당하는 하나 이상의 유전자의 셋트를 검색하고, 상기 제1 주요 시그니처에 해당하는 유전자들 중에서, 하나 이상의 핵심 유전자를 선별하고, 상기 하나 이상의 핵심 유전자의 강화 점수를 기초로 제2 주요 시그니처를 추출하는 단계;
    상기 전자 장치가 상기 대규모 암종 전사체 정보로부터 각 암종별 환자의 유전자 데이터를 수신하고, 상기 환자들의 유전자 데이터를 각 환자의 유전자 별로 분류하고 상기 환자들의 유전자 데이터를 각 유전자의 발현 정도가 동일한 환자의 유전자 데이터들이 인접하게 분포하도록 각 유전자 데이터의 배치 순서를 변경함으로써 바이클러스터링(biclustering)하는 단계; 및
    상기 전자 장치가 바이클러스터링된 상기 암종별 환자의 유전자 데이터를 이용하여 환자들의 생존률 데이터들을 각 주요 시그니처의 발현 정도 별로 비교하고 상기 생존률 데이터에 기여하는 제3 주요 시그니처를 추출하고 상기 제3 주요 시그니처에 해당하는 유전자들의 리스트를 생성하는 단계를 포함하고,
    상기 핵심 유전자는,
    상기 제1 주요 시그니처와 관련된 유전자들의 강화 점수의 최고값까지의 구간 내에 포함된 유전자를 포함하고,
    상기 강화 점수는,
    환자의 유전자 데이터를 Permutation 방법으로 분석하여 획득된 값이며,
    상기 암종별 환자의 유전자 데이터는
    복수의 환자들의 유전자들 및 상기 유전자들의 발현 정도를 포함하고,
    상기 생존률 데이터에 기여하는 제3 주요 시그니처는,
    상기 생존률 데이터에 포함된 생존률의 차이가 기 설정된 기준 값 이상인 경우, 환자군의 대상 질병인 암종에 대해서 유전자들을 포함하는 시그니처인, 특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 방법.
  2. 제1항에 있어서,
    상기 제1 유전자와 관련된 암종에 대한 치료제의 타겟 유전자를 상기 제3 주요 시그니처와 연관된 제2 유전자들로 확장하여 결정하는 단계를 더 포함하는, 특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 방법.
  3. 제2항에 있어서,
    상기 제1 유전자와 관련된 암종 및 상기 제2 유전자를 고려하여, 상기 제2 유전자에게 적용되는 치료제를 검색하여 제공하는 단계;를 포함하는, 특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 방법.
  4. 삭제
  5. 컴퓨터를 이용하여 제1항 내지 제3항 중 어느 한 항의 방법을 실행시키기 위하여 컴퓨터 판독 가능한 저장 매체에 저장된 컴퓨터 프로그램.
  6. 특정 약물의 치료 타겟 유전자인 제1 유전자에 대하여, 대규모 암종 전사체 정보를 이용하여 제1 유전자를 제외한 다른 유전자들에 대해 제1 유전자와의 발현 유사도의 순위를 획득하는 순위 추출부;
    상기 제1 유전자와의 발현 유사도의 크기 값 및 강화 점수의 2차원의 그래프를 이용하여 상기 강화 점수가 상승하는 상승 구간 내에 포함된 유전자들의 제1 주요 시그니처를 추출하는 시그니처 추출부;
    상기 제1 주요 시그니처 및 상기 제1 주요 시그니처에 해당하는 하나 이상의 유전자의 셋트를 검색하고, 상기 제1 주요 시그니처에 해당하는 유전자들 중에서, 하나 이상의 핵심 유전자를 선별하고, 상기 하나 이상의 핵심 유전자의 강화 점수를 기초로 제2 주요 시그니처를 추출하는 확장 시그니처 추출부;
    상기 대규모 암종 전사체 정보로부터 각 암종별 환자들의 유전자 데이터를 수신하고, 상기 환자들의 유전자 데이터를 각 환자의 유전자 별로 분류하고 상기 환자들의 유전자 데이터를 각 유전자의 발현 정도가 동일한 환자의 유전자 데이터들이 인접하게 분포하도록 각 유전자 데이터의 배치 순서를 변경함으로써, 바이클러스터링(biclustering)하는 클러스터링부; 및
    바이클러스터링된 상기 암종별 환자의 유전자 데이터를 이용하여 환자들의 생존률 데이터들을 각 주요 시그니처의 발현 정도 별로 비교하고 상기 생존률 데이터에 기여하는 제3 주요 시그니처를 추출하고 상기 제3 주요 시그니처에 해당하는 유전자들의 리스트를 생성하는 유전자 리스트 생성부;를 포함하고,
    상기 핵심 유전자는,
    상기 제1 주요 시그니처와 관련된 유전자들의 강화 점수의 최고값까지의 구간 내에 포함된 유전자를 포함하고,
    상기 강화 점수는,
    환자의 유전자 데이터를 Permutation 방법으로 분석하여 획득된 값이며,
    상기 암종별 환자의 유전자 데이터는,
    복수의 환자들의 유전자들 및 상기 유전자들의 발현 정도를 포함하고,
    상기 생존률 데이터에 기여하는 제3 주요 시그니처는
    상기 생존률 데이터에 포함된 생존률의 차이가 기 설정된 기준 값 이상인 경우, 환자군의 대상 질병인 암종에 대해서 유전자들을 포함하는 시그니처인, 특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 전자 장치.
  7. 제6항에 있어서,
    상기 제1 유전자와 관련된 암종에 대한 치료제의 타겟 유전자를 상기 제3 주요 시그니처와 연관된 제2 유전자들로 확장하여 결정하는 타겟 유전자 결정부;를 더 포함하는, 특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 전자 장치.
  8. 제7항에 있어서,
    상기 제1 유전자와 관련된 암종 및 상기 제2 유전자를 고려하여, 상기 제2 유전자에게 적용되는 치료제를 검색하여 제공하는 환자 맞춤 치료제 검색부;를 포함하는, 특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 전자 장치.
  9. 삭제
KR1020190101129A 2019-08-19 2019-08-19 특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 전자 장치, 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램 KR102289533B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190101129A KR102289533B1 (ko) 2019-08-19 2019-08-19 특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 전자 장치, 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190101129A KR102289533B1 (ko) 2019-08-19 2019-08-19 특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 전자 장치, 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램

Publications (2)

Publication Number Publication Date
KR20210021768A KR20210021768A (ko) 2021-03-02
KR102289533B1 true KR102289533B1 (ko) 2021-08-17

Family

ID=75169404

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190101129A KR102289533B1 (ko) 2019-08-19 2019-08-19 특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 전자 장치, 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램

Country Status (1)

Country Link
KR (1) KR102289533B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102385483B1 (ko) * 2021-10-20 2022-04-14 주식회사 테라젠바이오 분자 아형 산출 장치, 질환에 대한 분자 아형 개수를 산출하는 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002521679A (ja) 1998-07-30 2002-07-16 ミレニウム ファーマシューティカルズ,インコーポレーテッド 心血管疾患を治療および診断するための組成物ならびに方法
JP2017079772A (ja) 2011-06-02 2017-05-18 アルマック ダイアグノスティックス リミテッド 癌の分子的診断検査

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100028874A1 (en) * 2006-04-26 2010-02-04 Ramachandran Ravi K Hepatitis c virus infection biomarkers
KR102071491B1 (ko) * 2017-11-10 2020-01-30 주식회사 디시젠 차세대 염기서열분석을 이용한 기계학습 기반 유방암 예후 예측 방법 및 예측 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002521679A (ja) 1998-07-30 2002-07-16 ミレニウム ファーマシューティカルズ,インコーポレーテッド 心血管疾患を治療および診断するための組成物ならびに方法
JP2017079772A (ja) 2011-06-02 2017-05-18 アルマック ダイアグノスティックス リミテッド 癌の分子的診断検査

Also Published As

Publication number Publication date
KR20210021768A (ko) 2021-03-02

Similar Documents

Publication Publication Date Title
McDermott et al. Challenges in biomarker discovery: combining expert insights with statistical analysis of complex omics data
US11461295B2 (en) Data migration system
Witten et al. Extensions of sparse canonical correlation analysis with applications to genomic data
CN111164620A (zh) 用于自动机器学习模型选择的特定于算法的神经网络体系架构
Singh et al. Machine learning models to predict the progression from early to late stages of papillary renal cell carcinoma
Blagus et al. Boosting for high-dimensional two-class prediction
US20210104298A1 (en) Secure communication of nucleic acid sequence information through a network
US11854674B2 (en) Determining rate of recruitment information concerning a clinical trial
US20230377683A1 (en) Thermodynamic measures on protein-protein interaction networks for cancer therapy
Kavitha et al. A correlation based SVM-recursive multiple feature elimination classifier for breast cancer disease using microarray
Kim et al. Module cover–a new approach to genotype-phenotype studies
JP2016058027A (ja) データ処理装置、データ処理方法、およびプログラム
KR20240055704A (ko) 지정 항목 추천 방법
Zhao et al. Whale optimized mixed kernel function of support vector machine for colorectal cancer diagnosis
Thomas et al. Predicting breast cancer using an expression values weighted clinical classifier
Fan et al. Structure-leveraged methods in breast cancer risk prediction
KR102289533B1 (ko) 특정 약물의 타겟 유전자와 관련된 시그니처를 기초로 타겟 유전자와 관련된 유전자들을 판단하는 전자 장치, 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램
Su et al. Identification of glioblastoma molecular subtype and prognosis based on deep MRI features
Zhao et al. Survival prediction in gliomas: current state and novel approaches
Zhang et al. Classification of Non‐Small Cell Lung Cancer Using Significance Analysis of Microarray‐Gene Set Reduction Algorithm
KR102367565B1 (ko) 생활습관정보의 위험요인 정도에 따라 대장암 관련 정보를 예측하는 방법 및 시스템.
KR102367564B1 (ko) 생활습관정보에 기초한 대장암 관련 정보 예측 방법 및 시스템
Mendonca-Neto et al. Classification of breast cancer subtypes: A study based on representative genes
Eschrich et al. DNA microarrays and data analysis: an overview
KR102385483B1 (ko) 분자 아형 산출 장치, 질환에 대한 분자 아형 개수를 산출하는 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant