KR102361615B1 - Method for drug repositioning based on drug responding gene expression features - Google Patents

Method for drug repositioning based on drug responding gene expression features Download PDF

Info

Publication number
KR102361615B1
KR102361615B1 KR1020150012873A KR20150012873A KR102361615B1 KR 102361615 B1 KR102361615 B1 KR 102361615B1 KR 1020150012873 A KR1020150012873 A KR 1020150012873A KR 20150012873 A KR20150012873 A KR 20150012873A KR 102361615 B1 KR102361615 B1 KR 102361615B1
Authority
KR
South Korea
Prior art keywords
drug
drug response
response gene
gene
gene expression
Prior art date
Application number
KR1020150012873A
Other languages
Korean (ko)
Other versions
KR20160010285A (en
Inventor
이관수
차기훈
오기민
신보규
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Publication of KR20160010285A publication Critical patent/KR20160010285A/en
Application granted granted Critical
Publication of KR102361615B1 publication Critical patent/KR102361615B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation

Abstract

본 발명의 실시예에 따른 약물 반응 유전자 발현 특성을 이용한 약물 재창출 방법은 공개 약물 반응 유전자 발현 DB로부터 분석 가능한 약물 반응 유전자 발현 데이터를 선별하는 단계, 상기 선별된 약물 반응 유전자 발현 데이터에서 유의한 유전자 발현을 보이는 약물 반응 유전자를 선정하는 단계, 상기 선별된 약물 반응 유전자 발현 데이터에서 유의한 연관성을 보이는 약물 반응 유전자 셋을 선정하는 단계, 그리고 상기 유의한 유전자 발현을 보이는 약물 반응 유전자와 상기 유의한 연관성을 보이는 약물 반응 유전자 셋을 이용하여 약물간 유사성을 평가하여 약물 유사성 값을 출력하는 단계를 포함한다. The drug re-creation method using drug response gene expression characteristics according to an embodiment of the present invention comprises the steps of selecting analyzable drug response gene expression data from a public drug response gene expression DB, and a significant gene in the selected drug response gene expression data. Selecting a drug response gene showing expression, selecting a drug response gene set showing a significant correlation from the selected drug response gene expression data, and the significant association with the drug response gene showing the significant gene expression and outputting a drug similarity value by evaluating similarity between drugs using a drug response gene set showing

Description

약물 반응 유전자 발현 특성을 이용한 약물 재창출 방법{Method for drug repositioning based on drug responding gene expression features}Method for drug repositioning based on drug responding gene expression features

본 발명은 약물 반응 유전자 발현 특징을 이용한 약물 재창출 방법에 관한 것이다. 보다 상세하게는, 약물 재창출에 있어 약물 반응에 대한 유전자 발현양과 유전자 발현 패턴의 특징 비교 분석을 가능하게 하고, 개체 간 차이에 의한 오류를 최소화 하며, 약물의 기능적 유사성도 함께 비교 할 수 있는 방법을 개발하여 기존 약물 및 실패한 약물의 새로운 기능 및 약효를 보다 정확하게 예측할 수 있는 새로운 약물 재창출 방법에 관한 것이다.The present invention relates to a drug re-creation method using drug response gene expression characteristics. More specifically, a method that enables comparative analysis of the gene expression amount and gene expression pattern for drug response in drug re-creation, minimizes errors due to individual differences, and compares the functional similarity of drugs together It relates to a new drug re-creation method that can more accurately predict the new functions and efficacy of existing drugs and failed drugs by developing

세포의 특정 조건에서 유전자 발현 양상(gene expression profile)은 전사적 레벨의 정보를 제공한다. 이는 일부 표현형(phenotypes)과 연관된 발현 패턴을 보이는 유전자의 신원을 포함한 생물학적 분석에서 많이 쓰이는 방법이다. In certain conditions of the cell, the gene expression profile provides information at the transcriptional level. This is a popular method in biological analysis, including the identification of genes with expression patterns associated with some phenotypes.

이는 분자적 마커의 신원 확인 질병 상태를 진단하는데 쓰일 수 있다. 뿐만 아니라 생물학적 절차에 알맞은 유전자의 조절 관계의 추론에도 사용될 수 있다.The identification of molecular markers can be used to diagnose disease states. In addition, it can be used to infer the regulatory relationship of genes suitable for biological procedures.

유전자 발현 양상을 분석할 수 있는 대표적인 방법은 차등 발현 유전자(differentially expressed gen)(DEGs) 또는 특정 표현형에 관련된 공동 발현 유전자(co??expressed gen)를 밝혀 내는 것이다. 그 밖에도 양상의 발현 패턴을 다른 양상의 것들과 비교하는 방법도 있다. 이러한 비교는 대규모의 유전자 발현 데이터베이스 예를들면, 유전자 발현(Omnibus and ArrayExpress)에 쿼리(query)를 요청하는 다른 방법도 제시한다. 이러한 발현 패턴의 비교에 설득력을 더하기 위해 다양한 발현 유사성 연구 방법이 고안되어 왔다.A representative method for analyzing gene expression patterns is to identify differentially expressed gens (DEGs) or co-expressed genes related to a specific phenotype. Another method is to compare the expression patterns of one modality to those of other modalities. This comparison also provides another way to query large gene expression databases, such as gene expression (Omnibus and ArrayExpress). In order to add persuasiveness to the comparison of these expression patterns, various expression similarity study methods have been devised.

커넥티비티맵(Connectivity map)의 출현은 다양한 소분자로 처리된 인간 세포주에 해당하는 발현 양상이 큰 규모의 라이브러리(library)를 제공하는 유전자 발현 유사성 연구의 이용이 약물 발견과 개발에 까지 활용되었다. With the advent of the connectivity map, the use of gene expression similarity studies that provide a large-scale library of expression patterns corresponding to human cell lines treated with various small molecules has been utilized for drug discovery and development.

커넥티비티맵(Connectivity map)은 입력으로 제공되는 유전자 특징과 약물 반응 참조 유전자 발현 프로파일 간의 유사성을 측정하는 비교 방법도 제공한다. 유사성을 측정하기 위해서는 사용자로부터 높게 또는 적게 발현되는 유전자로 구성된 쿼리(query) 유전자 특징이 요구된다.The Connectivity map also provides a comparative method to measure the similarity between a gene feature provided as input and a drug response reference gene expression profile. In order to measure similarity, a query gene characteristic consisting of genes that are highly or less expressed from the user is required.

커넥티비티맵(Connectivity map)은 상향 조정(up??regulated)된 유전자가 약물 반응 참조 유전자 발현 프로파일의 맨 위에 아니면 맨 밑에 존재하는지를 추정하는 방법을 통해 각 약물 반응 참조 프로파일의 스코어를 계산한다. 데이터 셋의 유용성과 비교 접근 방법은 약물 리퍼포징(repurposing) 특징지어지지 않은 분자 행위의 메커니즘을 밝히는 것, 특정한 생물학적 상태의 흉내 등에 관련된 사례연구의 수행이 입증되었다. Connectivity map calculates a score for each drug response reference profile by estimating whether the upregulated gene is at the top or bottom of the drug response reference gene expression profile. The usefulness of data sets and comparative approaches have been demonstrated by conducting case studies involving drug repurposing, elucidation of uncharacterized molecular mechanisms of action, and mimicry of specific biological states.

혁신적인 접근 방법은 약물 반응 양상의 거대한 규모의 분석에 대한 다양한 방법의 발전을 이끈다. 이러한 변형 방법들이 유사성을 측정하는 접근법을 매칭하는 다른 패턴을 채택하는데도 불구하고 쿼리(query) 양상으로부터 높게 또는 적게 발현되는 유전자 특징의 사용에 대한 유사성 측정의 주된 컨셉은 여전히 가장 많이 사용된다. Innovative approaches lead to the development of various methods for the large-scale analysis of drug response patterns. Although these variant methods employ different patterns of matching approaches to measure similarity, the main concept of similarity measurement for the use of highly or underexpressed genetic features from query modalities is still the most widely used.

공동 발현 유전자 셋은 약물 반응 양상을 군집분석(clustering)하는 방법으로 확인할 수 있다. 군집분석에서 공동발현 유전자 셋의 발현 패턴은 모든 조건과 관련있다고 가정한다. 혹은 이중 집락화(biclustering)는 일부 조건에서 연관된 유전자 셋(sets)을 찾는데 사용된다. 약물 반응 양상으로부터 새롭게 얻어지거나 상당 부분 방해 받는 공동 발현 유전자 셋은 특정 약물로 처리된 세포의 발현 상태를 설명하는데 더 적합할 것이다. 몇몇 연구는 그들의 발현 수준이 현저히 바뀌지 않더라도, 암에 포함된다고 알려진 차등 공동 발현 유전자들을 밝혀내었다. 이러한 이유로 차등 공동 발현 패턴을 갖는 유전자들은 약물 처리 양상 뿐만 아니라 차등 발현 유전자(DEGs) 또한 특징짓는 색다른 가치를 가지는 특징이 될 수 있다.The set of co-expressed genes can be identified by clustering the drug response pattern. In cluster analysis, it is assumed that the expression pattern of the set of co-expressed genes is related to all conditions. Alternatively, double colonization is used to find related gene sets in some conditions. A set of co-expressed genes newly obtained or significantly disrupted from drug response patterns would be more suitable for describing the expression status of cells treated with a particular drug. Several studies have identified differentially co-expressed genes known to be involved in cancer, even if their expression levels do not change significantly. For this reason, genes with differential co-expression patterns can be a characteristic of different value that characterizes not only drug treatment patterns, but also differentially expressed genes (DEGs).

한편, 종래에 한국등록특허 10??1292843에는 약물에 대한 연관 질병 정보를 생성하는 기술이 개시되어 있다. 그런데 이러한 종래 기술은 약물 정보에서 얻어진 타겟 물질과 생물학적 네트워크 정보를 비교하여 약물에 연관된 질병 정보를 발굴하지만 생물학적 네트워크 정보의 경우 조건 특이적인 정보를 반영하고 있지 않다.Meanwhile, in the related art, Korean Patent Registration No. 10??1292843 discloses a technology for generating related disease information for a drug. However, this prior art discovers disease information related to a drug by comparing the target substance and biological network information obtained from drug information, but does not reflect condition-specific information in the case of biological network information.

따라서, 본 발명이 이루고자 하는 기술적 과제는 커넥티비티맵(Connectivity map)으로부터 약물을 투여한 암세포주와 투여하지 않은 암세포주에서 얻어진 약물 반응 유전자 발현 데이터를 수집하여 개체 간 차이에 의한 오류를 최소화 하는 약물 반응에 유의하게 발현된 유전자 및 유의하게 연관성(correlation)이 있는 유전자셋을 선정하고, 약물 별 비교를 통해 유사한 약물을 발굴함으로써 특정 질병에 적용 가능한 약물 발굴을 가능하게 하는 약물 재창출 방법을 제공하는 것이다.Therefore, the technical task of the present invention is to collect drug response gene expression data obtained from cancer cell lines to which drugs were administered and cancer cell lines to which drugs were not administered from a connectivity map to minimize errors due to differences between individuals. To provide a drug re-creation method that enables discovery of drugs applicable to specific diseases by selecting genes significantly expressed in .

본 발명의 하나의 특징에 따르면, 약물 재창출 방법은 공개 약물 반응 유전자 발현 DB로부터 분석 가능한 약물 반응 유전자 발현 데이터를 선별하는 단계, 상기 선별된 약물 반응 유전자 발현 데이터에서 유의한 유전자 발현을 보이는 약물 반응 유전자를 선정하는 단계, 상기 선별된 약물 반응 유전자 발현 데이터에서 유의한 연관성을 보이는 약물 반응 유전자 셋을 선정하는 단계, 그리고 상기 유의한 유전자 발현을 보이는 약물 반응 유전자와 상기 유의한 연관성을 보이는 약물 반응 유전자 셋을 이용하여 약물간 유사성을 평가하여 약물 유사성 값을 출력하는 단계를 포함한다.According to one feature of the present invention, the drug re-creation method comprises the steps of selecting analyzable drug response gene expression data from a public drug response gene expression DB, a drug response showing significant gene expression in the selected drug response gene expression data Selecting a gene, selecting a drug response gene set showing a significant correlation from the selected drug response gene expression data, and a drug response gene showing a significant gene expression and a drug response gene showing a significant correlation and outputting a drug similarity value by evaluating similarity between drugs using the set.

상기 약물 유사성 값을 출력하는 단계는,The step of outputting the drug similarity value comprises:

비교 대상인 두 약물로부터 획득한 각각의 약물 반응 유전자 간의 개인 연관 계수(pearson correlation coefficient, PCC)를 토대로 약물 반응 유전자 기반 약물 유사성 수치화를 수행하는 단계, 비교 대상인 두 약물로부터 획득한 약물 반응 유전자셋을 기준으로 DCS(differentially coexpressed gene sets based similarity score)의 평균값을 계산하는 약물 반응 유전자셋 기반 약물 유사성 수치화를 수행하는 단계, 그리고 상기 약물 반응 유전자 기반 약물 유사성 수치화를 수행한 값과 상기 약물 반응 유전자셋 기반 약물 유사성 수치화를 수행한 값의 크기를 조정한 후, 각 평균을 취하여 최종 약물 유사성 값을 출력하는 단계를 포함할 수 있다.Performing drug similarity quantification based on the drug response gene based on the individual Pearson correlation coefficient (PCC) between each drug response gene obtained from the two drugs to be compared, based on the drug response gene set obtained from the two drugs to be compared performing drug similarity quantification based on the drug response gene set to calculate the average value of differentially coexpressed gene sets based similarity score (DCS), and the value obtained by performing the drug response gene-based drug similarity quantification and the drug response gene set based drug After adjusting the size of the similarity quantification value, outputting a final drug similarity value by taking each average.

또한, 상기 약물 반응 유전자를 선정하는 단계는,In addition, the step of selecting the drug response gene,

상기 약물 반응 유전자 발현 데이터로부터 유전자별 유전자 발현양 수치 전환을 수행한 후, 유의성 평가 결과 기 정의된 임계치 이하인 유의한 유전자를 상기 약물 반응 유전자로 선정하고, After performing the conversion of the gene expression level for each gene from the drug response gene expression data, a significant gene that is less than or equal to a predefined threshold as a result of the significance evaluation is selected as the drug response gene,

상기 약물 반응 유전자 셋을 선정하는 단계는,The step of selecting the drug response gene set,

상기 약물 반응 유전자 발현 데이터로부터 약물 처리 및 약물 비처리 조건 별로 각각 계산된 염관성 값의 차이가 기 정의된 임계치를 충족하는 유전자 쌍을 선별하여 유전자 네트워크를 구축하고, 유전자 네트워크에서 최대 클리크를 이루는 유전자 셋을 상기 약물 반응 유전자 셋으로 선정할 수 있다.From the drug response gene expression data, a gene network is constructed by selecting a gene pair in which the difference in inertia values calculated for each drug-treated and non-drug-treated condition meets a predefined threshold, and a gene forming a maximum click in the gene network. The three may be selected as the drug response gene set.

본 발명의 실시예에 따르면, 유전자 발현양과 연관성(correlation)을 통합하여 약물간 유사성의 정확도를 증가시키고, 통계 분석 방법 변형을 통해 유전자 발현양 기반 약물 반응에 유의한 유전자를 선정함에 있어 개체 간 차이에 의한 오류를 최소화할 수 있다.According to an embodiment of the present invention, the accuracy of the similarity between drugs is increased by integrating the gene expression amount and correlation, and the difference between individuals in selecting genes significant for the drug response based on the gene expression amount through modification of the statistical analysis method errors can be minimized.

또한, 특정 약물이 사용되는 질병에 약물 유사성 비교 방법으로 얻어진 신규 유사 약물을 적용하여 약물 개발 시간 및 비용을 대폭 절감할 수 있다.In addition, it is possible to significantly reduce drug development time and cost by applying a novel similar drug obtained by a drug similarity comparison method to a disease in which a specific drug is used.

도 1은 본 발명의 실시예에 따른 약물 반응 유전자 발현 특성을 이용한 약물 재창출 시스템의 구성도이다.
도 2는 도 1의 약물 반응 유전자 발현 데이터 선별 모듈의 동작을 나타낸 순서도이다.
도 3은 도 1의 약물 반응 유전자 선정 모듈의 동작을 나타낸 순서도이다.
도 4는 도 1의 약물 반응 유전자셋 선정 모듈의 동작을 나타낸 순서도이다.
도 5는 도 1의 약물간 유사성 평가 모듈의 동작을 나타낸 순서도이다.
1 is a block diagram of a drug re-creation system using drug response gene expression characteristics according to an embodiment of the present invention.
FIG. 2 is a flowchart illustrating the operation of the drug response gene expression data selection module of FIG. 1 .
3 is a flowchart illustrating the operation of the drug response gene selection module of FIG. 1 .
4 is a flowchart illustrating the operation of the drug response gene set selection module of FIG. 1 .
5 is a flowchart illustrating the operation of the drug-to-drug similarity evaluation module of FIG. 1 .

아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, with reference to the accompanying drawings, the embodiments of the present invention will be described in detail so that those of ordinary skill in the art to which the present invention pertains can easily implement them. However, the present invention may be embodied in various different forms and is not limited to the embodiments described herein. And in order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.

명세서 전체에서, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.Throughout the specification, when a part "includes" a certain component, it means that other components may be further included, rather than excluding other components, unless otherwise stated.

또한, 명세서에 기재된 "…부", "…모듈" 의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.In addition, the terms “…unit” and “…module” described in the specification mean a unit that processes at least one function or operation, which may be implemented as hardware or software or a combination of hardware and software.

이하, 도면을 참조로 하여 본 발명의 실시예에 따른 약물 반응 유전자 발현 특성을 이용한 약물 재창출 방법에 대하여 상세히 설명한다. Hereinafter, a drug re-creation method using the drug response gene expression characteristic according to an embodiment of the present invention will be described in detail with reference to the drawings.

도 1은 본 발명의 실시예에 따른 약물 반응 유전자 발현 특성을 이용한 약물 재창출 시스템의 구성도이다.1 is a block diagram of a drug re-creation system using drug response gene expression characteristics according to an embodiment of the present invention.

도 1을 참조하면, 약물 재창출 시스템(100)은 약물 반응 유전자 발현 데이터 선별 모듈(101), 약물 반응 유전자 선정 모듈(103), 약물 반응 유전자셋 선정 모듈(105) 및 약물간 유사성 평가 모듈(107)을 포함한다. 1, the drug re-creation system 100 includes a drug response gene expression data selection module 101, a drug response gene selection module 103, a drug response gene set selection module 105, and a drug similarity evaluation module ( 107).

약물 반응 유전자 발현 데이터 선별 모듈(101)은 공개 약물 반응 유전자 발현 DB(미도시)로부터 분석 가능한 약물 반응 유전자 발현 데이터를 선별한다.The drug response gene expression data selection module 101 selects analyzable drug response gene expression data from a public drug response gene expression DB (not shown).

여기서, 공개 약물 반응 유전자 발현 DB(미도시)는 약물을 포함하는 소분자 (small molecule)를 암세포주에 처리/비처리를 통해 유전자 발현 데이터를 제공하는 커넥티비티 맵(Connectivity map)(https://www.broadinstitute.org/cmap/) 정보를 확보하여 구축한 것이다. Here, the open drug response gene expression DB (not shown) is a connectivity map that provides gene expression data through treatment/non-treatment of small molecules including drugs to cancer cell lines (https://www. .broadinstitute.org/cmap/) information was secured and constructed.

약물 반응 데이터는 1,309개의 소분자들로 처리된 5세포주의 6,100개 유전자 발현 양상을 포함한다. 이러한 발현 양상은 배치 아이디(batch ID)로 그룹화된 다음 각각의 그룹은 로버스트 멀티??어레이 애버리지(robust multi??array average)에 의해 정규화된다. 각 실험으로부터 발현 값을 추출한 후 싱글 매트릭스(single matrix)로 합병된다.Drug response data included expression patterns of 6,100 genes in 5 cell lines treated with 1,309 small molecules. These expression patterns are grouped by batch ID, and then each group is normalized by a robust multi-array average. After extracting expression values from each experiment, they are merged into a single matrix.

약물 반응 유전자 선정 모듈(103)은 약물 투여, 비투여 조건의 약물 반응 유전자 발현 데이터에서 유의한 유전자 발현을 보이는 약물 반응 유전자를 선정한다.The drug response gene selection module 103 selects a drug response gene showing significant gene expression from drug response gene expression data under drug administration and non-administration conditions.

약물 반응 유전자 발현 데이터 선별 모듈(101)에서 제공하는 약물 반응 유전자 발현 데이터는 5가지의 암세포주에서 측정된 것이 포함되어 있으므로 조건별 차이를 보정하기 위해 유전자별 유전자 발현양 수치 전환을 수행한다. 이때, 보정하는 수식은 다음 수학식 1과 같다.Since the drug response gene expression data provided by the drug response gene expression data selection module 101 includes those measured in five cancer cell lines, a conversion of gene expression levels for each gene is performed to correct for differences by condition. At this time, the correcting equation is the following equation (1).

Figure 112015008909882-pat00001
Figure 112015008909882-pat00001

여기서,

Figure 112015008909882-pat00002
은 약물비투여 조건에서의 전환된 유전자 발현양을 의미하고,
Figure 112015008909882-pat00003
은 약물투여 조건에서의 전환된 유전자 발현양을 의미하며,
Figure 112015008909882-pat00004
은 약물 처리 조건에서의 초기 유전자 발현양을 의미하며,
Figure 112015008909882-pat00005
은 약물비처리 조건에서의 초기 유전자 발현양을 의미한다. here,
Figure 112015008909882-pat00002
means the converted gene expression amount in the drug non-administration condition,
Figure 112015008909882-pat00003
means the converted gene expression amount under drug administration conditions,
Figure 112015008909882-pat00004
denotes the initial gene expression level under drug treatment conditions,
Figure 112015008909882-pat00005
denotes the initial gene expression level in the non-drug treatment condition.

초기 유전자 발현양을 평균값을 기반으로 이동(shift)시키는 간단한 보정을 통해 약물처리/비처리 조건에서의 유전자 발현양 차이를 극대화 시킬 수 있다. 보정된 수치를 이용하여 t??test 및 FDR(false discovery rate) 멀티플 테스팅 보정(multiple testing corrections)을 통해 약물처리/비처리 조건에서 P??value <0.05 이하인 유전자를 선별하기 위해 유전자 유의성 평가를 수행한다. 유의한 유전자의 발현양을 기준으로 상위 100개, 하위 100개의 유전자를 선정하여 각 약물에 대해 약물 반응 유전자를 제공한다. A simple correction that shifts the initial gene expression level based on the average value can maximize the difference in gene expression level in drug-treated/untreated conditions. Using the corrected values, t??test and FDR (false discovery rate) multiple testing corrections were used to evaluate gene significance to select genes with P??value <0.05 in drug-treated/untreated conditions. carry out A drug response gene is provided for each drug by selecting the top 100 genes and the bottom 100 genes based on the expression level of significant genes.

약물 반응 유전자셋 선정 모듈(105)은 약물 투여, 비투여 조건의 약물 반응 유전자 발현 데이터에서 유의한 연관성을 보이는 약물 반응 유전자셋을 선정한다.The drug response gene set selection module 105 selects a drug response gene set showing a significant correlation in drug response gene expression data under drug administration and non-administration conditions.

약물간 유사성 평가 모듈(107)은 약물 반응 유전자 선정 모듈(103)로부터 선정된 유전자 및 약물 반응 유전자셋 선정 모듈(105)로부터 선정된 유전자셋을 이용하여 약물간 유사성을 평가한다.The drug-to-drug similarity evaluation module 107 evaluates the similarity between drugs using the gene selected from the drug response gene selection module 103 and the gene set selected from the drug response gene set selection module 105 .

약물 반응 유전자를 이용하여 두 약물, 예를 들면, 약물 A, 약물 B의 유사성을 비교하기 위해 비교할 두 약물에서 얻어진 각각의 상위 100개, 하위 100개의 약물 반응 유전자를 입력받는다. 약물 A의 200개의 유전자 값을 하나로 표현하기 위해 약물 처리 발현양/약물비처리 유전자 발현양을 계산하여 200개의 값을 부여한다. 약물 A에서 선정된 200개의 유전자에 대해 약물 B에서 하나의 값으로 계산하여 두 약물간 개인 연관 계수(pearson correlation coefficient, PCC)를 계산하고, 같은 방법으로 약물 B를 기준으로 약물 A와의 PCC를 계산하여 두개의 PCC값의 평균을 취하는 약물 반응 유전자 기반 약물 유사성 수치화를 수행한다. In order to compare the similarity of two drugs, for example, drug A and drug B using the drug response gene, the top 100 and bottom 100 drug response genes respectively obtained from the two drugs to be compared are input. In order to express the 200 gene values of drug A as one, the drug-treated expression amount/drug-untreated gene expression amount is calculated and 200 values are assigned. For 200 genes selected in drug A, calculate the individual correlation coefficient (PCC) between two drugs by calculating one value in drug B, and calculate PCC with drug A based on drug B in the same way Thus, the drug response gene-based drug similarity quantification is performed by taking the average of the two PCC values.

또한, 약물 반응 유전자셋을 이용하여 두 약물, 예를 들면, 약물A, 약물B의 유사성을 비교하기 위해 비교할 두 약물에서 얻어진 약물 반응 유전자셋을 입력받는다. 두 약물에서 입력 받은 유전자셋은 약물반응 유전자셋 선정 모듈에 의해 높은 연관성 유전자셋과 낮은 연관성 유전자셋으로 구분된다. In addition, in order to compare the similarity of two drugs, for example, drug A and drug B using the drug response gene set, the drug response gene set obtained from the two drugs to be compared is input. The gene set input from the two drugs is divided into a high correlation gene set and a low correlation gene set by the drug response gene set selection module.

높은 연관성 유전자셋에서 모든 유전자쌍에 대해 연관성 차이값을 약물 비처리 조건에서의 PCC 값에서 약물 처리 조건에서의 PCC 값을 빼서 계산한다. 수식은 다음과 같다. For all gene pairs in the highly correlated gene set, the association difference value is calculated by subtracting the PCC value in the drug-treated condition from the PCC value in the non-drug treatment condition. The formula is:

Figure 112015008909882-pat00006
Figure 112015008909882-pat00006

여기서, DC는 차등 공동발현 값(differentially coexpression value)이다.

Figure 112015008909882-pat00007
은 유전자쌍의 연관성이 약물처리 조건에서는 없다가 약물비처리 조건에서 나타나는 경우의 차등 공동발현 값을 의미하고,
Figure 112015008909882-pat00008
은 유전자쌍의 약물비처리 조건에서의 PCC 값을 의미하며,
Figure 112015008909882-pat00009
은 유전자쌍의 약물처리 조건에서의 PCC 값을 의미한다.Here, DC is a differentially coexpression value.
Figure 112015008909882-pat00007
denotes the differential co-expression value when the gene pair association is absent in the drug-treated condition but appears in the non-drug-treated condition,
Figure 112015008909882-pat00008
is the PCC value in the non-drug treatment condition of the gene pair,
Figure 112015008909882-pat00009
denotes the PCC value in the drug treatment condition of the gene pair.

낮은 연관성 유전자셋에서 모든 유전자쌍에 대해 연관성 차이값을 약물처리 조건에서의 PCC 값에서 약물비처리 조건에서의 PCC 값을 빼서 계산한다. 수식은 다음과 같다. For all gene pairs in the low association gene set, the association difference value is calculated by subtracting the PCC value in the drug-treated condition from the PCC value in the drug-treated condition. The formula is:

Figure 112015008909882-pat00010
Figure 112015008909882-pat00010

여기서,

Figure 112015008909882-pat00011
은 유전자쌍의 연관성이 약물비처리 조건에서는 없다가 약물처리 조건에서 나타나는 경우의 차등 공동발현 값을 의미한다.here,
Figure 112015008909882-pat00011
denotes the differential co-expression value in the case where the gene pair association does not exist in the drug-treated condition but appears in the drug-treated condition.

약물A에서 선정된 약물반응 유전자셋을 기준으로 약물B에서 같은 유전자쌍를 대상으로 위와 같이 수행한다. 약물A에서 선정된 하나의 약물반응 유전자셋의 약물B와의 연관성 수치는 약물A에서 약물반응 유전자셋의 종류 해당하는 가능한 유전자쌍의 DC 값을 약물A, 약물B에서 모두 계산하여 약물A 내 유전자쌍의 DC값에서 약물B 내 유전자쌍의 DC값을 빼서 계산하여 평균값을 취한다. 수식은 다음과 같다. Based on the drug response gene set selected in drug A, the same gene pair in drug B is performed as above. The correlation value of one drug response gene set selected in drug A with drug B is calculated by calculating the DC value of the possible gene pair corresponding to the type of drug response gene set in drug A from both drug A and drug B. Calculate by subtracting the DC value of the gene pair in drug B from the DC value of , and take the average value. The formula is:

Figure 112015008909882-pat00012
Figure 112015008909882-pat00012

여기서, DCM은 차등 발현 모듈(differentially coexpression module)이고, n은 약물A에서 선정된 다수의 약물반응 유전자셋 중 계산하고자 하는 유전자셋의 모든 유전자쌍 조합의 수이다.

Figure 112015008909882-pat00013
은 약물 A의 차등 공동발현 값이고,
Figure 112015008909882-pat00014
은 물 B의 차등 공동발현 값을 의미한다.Here, DCM is a differentially coexpression module, and n is the number of combinations of all gene pairs of a gene set to be calculated among a plurality of drug response gene sets selected for drug A.
Figure 112015008909882-pat00013
is the differential co-expression value of drug A,
Figure 112015008909882-pat00014
denotes the differential co-expression value of water B.

약물A와 약물B의 유사성 수치화를 계산하기 위해 약물A에서 선정된 모든 약물반응 유전자셋에 대해 DCM을 모두 계산하여 평균을 취한다. 수식은 다음과 같다. To calculate the similarity quantification between drug A and drug B, all DCMs are calculated for all drug response gene sets selected from drug A and averaged. The formula is:

Figure 112015008909882-pat00015
Figure 112015008909882-pat00015

여기서, DCS는 differentially coexpressed gene sets based similarity score이다. N은 약물A에서 선정된 약물반응 유전자셋의 개수이다. 같은 방법으로 약물B를 기준으로 약물A와의 유전자셋 기반 DCS를 계산하여 두 개의 DCS값의 평균을 취하는 약물반응 유전자셋 기반 약물 유사성 수치화를 수행한다. Here, DCS is a differentially coexpressed gene sets based similarity score. N is the number of drug response gene sets selected from drug A. In the same way, the gene set-based DCS with drug A is calculated based on drug B, and the drug response gene set-based drug similarity quantification is performed by taking the average of the two DCS values.

약물반응 유전자셋 기반 유사성과 통합하기 위해 점수를 0에서 1사이의 값으로 변환하는 0~1값으로 크기 조정(scaling)을 수행한다. 변환하는 수식은 다음과 같다. In order to integrate the drug response gene set-based similarity, scaling is performed with a value of 0 to 1, which converts the score to a value between 0 and 1. The conversion formula is as follows.

Figure 112015008909882-pat00016
Figure 112015008909882-pat00016

Figure 112015008909882-pat00017
는 약물반응 유전자셋 기반 얻어진 유사성 값이며,
Figure 112015008909882-pat00018
는 약물반응 유전자 기반 얻어진 유사성 값이다.
Figure 112015008909882-pat00017
is the similarity value obtained based on the drug response gene set,
Figure 112015008909882-pat00018
is the similarity value obtained based on the drug response gene.

크기 조정된 약물반응 유전자 기반 약물 유사성 값과 약물반응 유전자셋기반 약물 유사성 값의 평균을 취하여 최종 약물 유사성 값을 제공한다. The final drug similarity value is provided by taking the average of the scaled drug response gene-based drug similarity value and the drug response gene set-based drug similarity value.

도 2는 도 1의 약물 반응 유전자 발현 데이터 선별 모듈의 동작을 나타낸 순서도이다.FIG. 2 is a flowchart illustrating the operation of the drug response gene expression data selection module of FIG. 1 .

도 2를 참조하면, 약물 반응 유전자 발현 데이터 선별 모듈(101)은 공개 약물 반응 유전자 발현 DB(미도시)로부터 획득한 약물 반응 유전자 발현 데이터의 발현양 수치를 정규화한다(S101). 즉, 약물 반응 유전자 발현 데이터 선별 모듈(101)은 약물 반응 유전자 발현 데이터 내 조건 별 차이를 제거하기 위해 퀀타일 정규화(quantile normalization)를 수행한다.2, the drug response gene expression data selection module 101 normalizes the expression level of the drug response gene expression data obtained from the public drug response gene expression DB (not shown) (S101). That is, the drug response gene expression data selection module 101 performs quantile normalization in order to remove the difference for each condition in the drug response gene expression data.

약물 반응 유전자 발현 데이터 선별 모듈(101)은 정규화된 데이터 중에서 개체 수가 조건 별로, 즉 약물 투여, 약물 비투여에 따라 각각 10개 이상인 약물을 선별한다(S103). 즉, 각 약물별로 약물 투여/비투여의 조건이 각각 10개 이상인 약물을 선별한다. The drug response gene expression data selection module 101 selects 10 or more drugs from the normalized data according to each condition, that is, drug administration and drug non-administration (S103). That is, for each drug, 10 or more drugs for each drug administration/non-administration condition are selected.

약물 반응 유전자 발현 데이터 선별 모듈(101)은 선별한 약물 반응 유전자 발현 데이터를 제공한다(S105). 즉, 최종 약물간 유사성을 위한 선별된 약물 리스트와 이들의 유전자 발현 데이터를 제공한다.The drug response gene expression data selection module 101 provides the selected drug response gene expression data (S105). That is, it provides a list of selected drugs for similarity between final drugs and their gene expression data.

도 3은 도 1의 약물 반응 유전자 선정 모듈의 동작을 나타낸 순서도이다.3 is a flowchart illustrating the operation of the drug response gene selection module of FIG. 1 .

도 3을 참조하면, 약물 반응 유전자 선정 모듈(103)은 약물 반응 유전자 발현 데이터 선별 모듈(101)로부터 제공받은 약물 반응 유전자 발현 데이터로부터 유전자별 유전자 발현양 수치 전환을 수행한다(S201).Referring to FIG. 3 , the drug response gene selection module 103 converts the gene expression level of each gene from the drug response gene expression data provided from the drug response gene expression data selection module 101 ( S201 ).

약물 반응 유전자 선정 모듈(103)은 유전자 유의성 평가를 수행한다(S203).The drug response gene selection module 103 performs gene significance evaluation (S203).

약물 반응 유전자 선정 모듈(103)은 유전자 유의성 평가 결과(p)가 0.05보다 작은지를 판단한다(S205).The drug response gene selection module 103 determines whether the gene significance evaluation result (p) is less than 0.05 (S205).

판단 결과, 0.05보다 작으면, 유의한 유전자 중 발현양 기준 상위 100개, 하위 100개의 유전자를 선정한다(S207). 그리고 선정한 약물 반응 유전자를 제공한다(S209).As a result of the judgment, if it is less than 0.05, the top 100 genes and the bottom 100 genes based on the expression level among the significant genes are selected (S207). And the selected drug response gene is provided (S209).

도 4는 도 1의 약물 반응 유전자셋 선정 모듈의 동작을 나타낸 순서도이다. 4 is a flowchart illustrating the operation of the drug response gene set selection module of FIG. 1 .

도 4를 참조하면, 약물 반응 유전자셋 선정 모듈(105)은 약물 반응 유전자 발현 데이터 선별 모듈(101)로부터 제공받은 약물 반응 유전자 발현 데이터로부터 무작위로 10,000개의 유전자 쌍을 설정한다(S301). 4, the drug response gene set selection module 105 randomly sets 10,000 gene pairs from the drug response gene expression data provided from the drug response gene expression data selection module 101 (S301).

S301 단계에서 설정된 유전자 쌍에 대해 약물 처리/비처리 조건의 PCC 기반 연관성 차이값으로 연관성 차이 분포를 구성한다(S303).For the gene pair set in step S301, an association difference distribution is configured as a PCC-based association difference value of drug treatment/non-treatment conditions (S303).

약물 처리/비처리 조건에서 모든 유전자 쌍의 연관성 값의 차이를 계산한다(S305). The difference between the association values of all gene pairs in the drug-treated/untreated condition is calculated (S305).

연관성 차이 분포에서 유전자 쌍의 연관성 값이 상위 5%인 유전자 쌍을 선별한다(S307).In the correlation difference distribution, a gene pair having a correlation value of the top 5% of the gene pair is selected (S307).

또한, S301 단계에서 설정된 유전자 쌍에 대해 약물 처리/비처리 각 조건의 PCC 기반 연관성 분포를 구성한다(S309).In addition, with respect to the gene pair set in step S301, a PCC-based association distribution of each drug treatment/non-treatment condition is configured (S309).

약물 처리/비처리 각 조건에서 모든 유전자 쌍 조합에 대해 PCC 기반 연관성 값을 계산한다(S311).A PCC-based association value is calculated for all gene pair combinations in each drug-treated/untreated condition (S311).

연관성 값 분포에서 각 유전자 쌍의 약물 처리 또는 비처리 조건에서 하나 이상 상위 5%의 유전자 쌍을 선별한다(S313).In the correlation value distribution, one or more top 5% gene pairs are selected under drug-treated or non-treated conditions of each gene pair (S313).

두 조건으로 선별된 유전자 쌍을 연결하여 유전자 네트워크를 구축한다(S315).A gene network is constructed by connecting the gene pairs selected under the two conditions (S315).

유전자 네트워크에서 최대 클리크(maximal clique)를 이루는 유전자 셋을 선별한다(S317).A gene set constituting a maximal clique in the gene network is selected (S317).

선별된 유전자 셋을 약물 반응 유전자 셋으로 제공한다(S319). The selected gene set is provided as a drug response gene set (S319).

도 5는 도 1의 약물간 유사성 평가 모듈의 동작을 나타낸 순서도이다.5 is a flowchart illustrating the operation of the drug similarity evaluation module of FIG. 1 .

도 5를 참조하면, 약물간 유사성 평가 모듈(107)은 비교 대상인 두 약물에서 얻어진 각각의 약물 반응 유전자를 입력받는다(S401). 그리고 약물 반응 유전자 기반 약물 유사성을 수치화한다(S403).Referring to FIG. 5 , the drug-drug similarity evaluation module 107 receives each drug response gene obtained from two drugs to be compared ( S401 ). And the drug response gene-based drug similarity is quantified (S403).

또한, 비교 대상인 두 약물에서 얻어진 각각의 약물 반응 유전자 셋을 입력받는다(S405). 그리고 약물 반응 유전자 셋 기반 약물 유사성을 수치화한다(S407).In addition, each drug response gene set obtained from two drugs to be compared is input (S405). And the drug response gene set-based drug similarity is quantified (S407).

S403 단계 및 S407 단계에서 수치화된 값을 0~1 값으로 크기 조정(scaling)한다(S409).The digitized values in steps S403 and S407 are scaled to a value of 0 to 1 (S409).

각 약물 유사성 수치의 평균값을 계산(S411)하여 약물 유사성 값을 제공한다(S413).The average value of each drug similarity value is calculated (S411) to provide a drug similarity value (S413).

이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있다. The embodiment of the present invention described above is not implemented only through the apparatus and method, and may be implemented through a program for realizing a function corresponding to the configuration of the embodiment of the present invention or a recording medium in which the program is recorded.

이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.Although the embodiments of the present invention have been described in detail above, the scope of the present invention is not limited thereto. is within the scope of the right.

Claims (3)

공개 약물 반응 유전자 발현 DB로부터 분석 가능한 약물 반응 유전자 발현 데이터를 선별하는 단계,
상기 선별된 약물 반응 유전자 발현 데이터에서 유의한 유전자 발현을 보이는 약물 반응 유전자를 선정하는 단계,
상기 선별된 약물 반응 유전자 발현 데이터에서 유의한 연관성을 보이는 약물 반응 유전자 셋을 선정하는 단계, 그리고
상기 유의한 유전자 발현을 보이는 약물 반응 유전자와 상기 유의한 연관성을 보이는 약물 반응 유전자 셋을 이용하여 약물간 유사성을 평가하여 약물 유사성 값을 출력하는 단계를 포함하고,
상기 약물 반응 유전자 셋을 선정하는 단계는,
상기 선별된 약물 반응 유전자 발현 데이터로부터 약물 처리 및 약물 비처리 조건 별로 각각 계산된 연관성 값의 차이가 기 정의된 임계치를 충족하는 유전자 쌍을 선별하여 유전자 네트워크를 구축하고, 유전자 네트워크에서 최대 클리크를 이루는 유전자 셋을 상기 약물 반응 유전자 셋으로 선정하고,
상기 약물 유사성 값을 출력하는 단계는,
비교 대상인 두 약물로부터 획득한 각각의 약물 반응 유전자 간의 개인 연관 계수(pearson correlation coefficient, PCC)를 토대로 약물 반응 유전자 기반 약물 유사성 수치화를 수행하는 단계,
비교 대상인 두 약물로부터 획득한 약물 반응 유전자셋을 기준으로 DCS(differentially coexpressed gene sets based similarity score)의 평균값을 계산하는 약물 반응 유전자셋 기반 약물 유사성 수치화를 수행하는 단계, 그리고
상기 약물 반응 유전자 기반 약물 유사성 수치화를 수행한 값과 상기 약물 반응 유전자셋 기반 약물 유사성 수치화를 수행한 값의 크기를 조정한 후, 각 평균을 취하여 최종 약물 유사성 값을 출력하는 단계
를 포함하는 약물 재창출 방법.
Selecting analyzable drug response gene expression data from the public drug response gene expression DB;
selecting a drug response gene showing significant gene expression from the selected drug response gene expression data;
Selecting a drug response gene set showing a significant correlation from the selected drug response gene expression data, and
Comprising the step of evaluating the similarity between drugs using the drug response gene showing the significant gene expression and the drug response gene set showing the significant association, and outputting a drug similarity value,
The step of selecting the drug response gene set,
From the selected drug response gene expression data, a gene network is constructed by selecting a gene pair in which the difference in the correlation value calculated for each drug treatment and non-drug treatment condition satisfies a predefined threshold, and the maximum click is formed in the gene network. selecting the gene set as the drug response gene set,
The step of outputting the drug similarity value comprises:
performing drug similarity quantification based on drug response gene based on the individual Pearson correlation coefficient (PCC) between each drug response gene obtained from two drugs to be compared;
performing drug similarity quantification based on the drug response gene set to calculate the average value of the differentially coexpressed gene sets based similarity score (DCS) based on the drug response gene set obtained from the two drugs to be compared; and
After adjusting the size of the drug response gene-based drug similarity quantification value and the drug response gene set-based drug similarity quantification value, taking each average and outputting a final drug similarity value
A drug re-creation method comprising a.
삭제delete 제1항에 있어서,
상기 약물 반응 유전자를 선정하는 단계는,
상기 약물 반응 유전자 발현 데이터로부터 유전자별 유전자 발현양 수치 전환을 수행한 후, 유의성 평가 결과 기 정의된 임계치 이하인 유의한 유전자를 상기 약물 반응 유전자로 선정하는 약물 재창출 방법.
The method of claim 1,
The step of selecting the drug response gene,
A drug re-creation method in which a significant gene, which is less than or equal to a predefined threshold as a result of significance evaluation, is selected as the drug response gene after performing conversion of the gene expression level for each gene from the drug response gene expression data.
KR1020150012873A 2014-07-17 2015-01-27 Method for drug repositioning based on drug responding gene expression features KR102361615B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020140090161 2014-07-17
KR20140090161 2014-07-17

Publications (2)

Publication Number Publication Date
KR20160010285A KR20160010285A (en) 2016-01-27
KR102361615B1 true KR102361615B1 (en) 2022-02-11

Family

ID=55309552

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150012873A KR102361615B1 (en) 2014-07-17 2015-01-27 Method for drug repositioning based on drug responding gene expression features

Country Status (1)

Country Link
KR (1) KR102361615B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101963331B1 (en) * 2017-06-22 2019-03-28 한국과학기술원 Method and system for predicting drug repositioning candidate based on similarity between drug and metabolite
KR102636659B1 (en) * 2019-04-02 2024-02-13 주식회사 엘지화학 Method for selecting biomarkers by utilizing drug repositioning

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Pradhan 등, BMC Systems Biology, 제6권(Suppl 3):S172012 (2012)*
Tan 등, Molecualr BioSystems, 제10권, 페이지 1126-1138 (2014)*

Also Published As

Publication number Publication date
KR20160010285A (en) 2016-01-27

Similar Documents

Publication Publication Date Title
Guo et al. MultiRankSeq: multiperspective approach for RNAseq differential expression analysis and quality control
CN105986008A (en) CNV detection method and CNV detection apparatus
JP2022516152A (en) Transcriptome deconvolution of metastatic tissue samples
Jiang et al. An approach for prioritizing disease-related microRNAs based on genomic data integration
Han et al. How does normalization impact RNA-seq disease diagnosis?
CA3092303A1 (en) A computer-implemented method of analysing genetic data about an organism
WO2017109860A1 (en) Image processing apparatus
CN113574602A (en) Sensitive detection of Copy Number Variation (CNV) from circulating cell-free nucleic acids
US20160132637A1 (en) Noise model to detect copy number alterations
US20140180599A1 (en) Methods and apparatus for analyzing genetic information
WO2016117812A1 (en) Apparatus and method for evaluating performance of cancer biomarker
WO2018152240A1 (en) Methods for predicting transcription factor activity
KR102361615B1 (en) Method for drug repositioning based on drug responding gene expression features
Wang et al. MSB: a mean-shift-based approach for the analysis of structural variation in the genome
JP6932080B2 (en) Methods and systems for generating non-coding-coding gene co-expression networks
Ramazzotti et al. Longitudinal cancer evolution from single cells
Cha et al. Drug similarity search based on combined signatures in gene expression profiles
Gosik et al. iFORM/eQTL: an ultrahigh-dimensional platform for inferring the global genetic architecture of gene transcripts
Chakraborty Use of partial least squares improves the efficacy of removing unwanted variability in differential expression analyses based on RNA-Seq data
CN109390039B (en) Method, device and storage medium for counting DNA copy number information
KR101701168B1 (en) Genomic profile method for in-silico interaction-resolution pathway activity quantification
CN113921085B (en) Prediction method for synergistic regulation and control effect of non-coding RNA genes
KR102462746B1 (en) Method And System For Constructing Cancer Patient Specific Gene Networks And Finding Prognostic Gene Pairs
Mooney et al. Data integration and reproducibility for high-throughput transcriptomics
KR102405732B1 (en) Method and appratus for cell clustering

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant