KR20200038660A - Method for selecting biomarker and method for providing information for diagnosis of cancer using thereof - Google Patents

Method for selecting biomarker and method for providing information for diagnosis of cancer using thereof Download PDF

Info

Publication number
KR20200038660A
KR20200038660A KR1020180118137A KR20180118137A KR20200038660A KR 20200038660 A KR20200038660 A KR 20200038660A KR 1020180118137 A KR1020180118137 A KR 1020180118137A KR 20180118137 A KR20180118137 A KR 20180118137A KR 20200038660 A KR20200038660 A KR 20200038660A
Authority
KR
South Korea
Prior art keywords
cell
cancer
gene
polyadenylation
cells
Prior art date
Application number
KR1020180118137A
Other languages
Korean (ko)
Other versions
KR102170726B1 (en
Inventor
박웅양
이혜옥
김나영
Original Assignee
사회복지법인 삼성생명공익재단
성균관대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 사회복지법인 삼성생명공익재단, 성균관대학교산학협력단 filed Critical 사회복지법인 삼성생명공익재단
Priority to KR1020180118137A priority Critical patent/KR102170726B1/en
Publication of KR20200038660A publication Critical patent/KR20200038660A/en
Application granted granted Critical
Publication of KR102170726B1 publication Critical patent/KR102170726B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pathology (AREA)
  • Biotechnology (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Provided is a method for selecting a biomarker including a step of obtaining single cell RNA sequencing data. By identifying cell type specific alternative polyadenylation in a single cell, cell types based on 3′UTR length changes can be defined with gene expression of various cell types.

Description

바이오마커의 선별 방법 및 이를 이용한 암의 진단을 위한 정보제공방법{Method for selecting biomarker and method for providing information for diagnosis of cancer using thereof}Method for selecting biomarker and method for providing information for diagnosis of cancer using thereof

단일 세포 RNA 시퀀싱 데이터를 이용하여 바이오마커를 선별하는 방법 및 상기 패널을 이용한 암의 진단을 위한 정보 제공방법에 관한 것이다. The present invention relates to a method of selecting a biomarker using single cell RNA sequencing data and a method of providing information for diagnosis of cancer using the panel.

3'비해독 말단영역(untranslated region, UTR)에서의 대체 폴리아데닐화(Alternative polyadenylation, APA)는 전사를 풍부하게 하고, 세포 국소화 및 microRNA와의 상호작용에 영향을 줌으로써 유전자 발현을 조절하는, 중요한 사후-전사(post-transcriptional) 메커니즘이다. 최근 연구는 3'UTR 길이의 변화는 면역 반응 및 암 성장 동안 세포 분화뿐만 아니라 증식의 조절과 밀접하게 연관되어 있음을 밝혀냈다. APA를 통해 짧아진 3'UTR의 사용은 암에서 전 세계적으로 가장 흔하게 발생한다(91%). 이것의 생물학적 중요성은 널리 받아들여지고 있지만, 예후적 바이오마커 또는 치료 표적으로서의 임상적 적용은 충분히 평가되지 않았다. 따라서, 다양한 세포 유형에 대한 APA를 통해 발현 조절을 이해하는 것은 암 치료제에 대한 새로운 통찰력을 제공할 수 있다.Alterative polyadenylation (APA) in the 3 'untranslated region (UTR) is an important post-mortem that regulates gene expression by enriching transcription and affecting cell localization and interaction with microRNA. -It is a post-transcriptional mechanism. Recent studies have revealed that changes in 3'UTR length are closely related to the immune response and regulation of proliferation as well as cell differentiation during cancer growth. The use of 3'UTR shortened through APA is the most common worldwide in cancer (91%). Its biological importance is widely accepted, but its clinical application as a prognostic biomarker or therapeutic target has not been fully evaluated. Thus, understanding expression regulation through APA for various cell types can provide new insights into cancer therapeutics.

일 양상은 환자 유래 세포의 RNA 시퀀싱 데이터를 획득하는 단계; 상기 획득된 RNA 시퀀싱 데이터로부터 개별 유전자의 대체 폴리아데닐화(Alternative polyadenylation, APA)를 추정하는 단계; 개별 유전자의 발현 정도를 나타내는 인덱스를 산출하는 단계; 및 상기 산출된 인덱스 및 대체 폴리아데닐화의 상관관계를 측정하는 단계를 포함하는 바이오마커의 선별 방법을 제공하는 것이다.One aspect is obtaining RNA sequencing data of a patient-derived cell; Estimating alternative polyadenylation (APA) of individual genes from the obtained RNA sequencing data; Calculating an index indicating the expression level of individual genes; And measuring the correlation between the calculated index and the replacement polyadenylation.

다른 양상은 상기 방법으로 선별된 바이오마커 패널을 제공하는 것이다.Another aspect is to provide a biomarker panel selected by the above method.

다른 양상은 환자 유래 세포의 RNA 시퀀싱 데이터를 획득하는 단계; 상기 획득된 RNA 시퀀싱 데이터로부터 개별 유전자의 대체 폴리아데닐화(Alternative polyadenylation, APA)를 추정하는 단계; 개별 유전자의 발현 정도를 나타내는 인덱스를 산출하는 단계; 및 상기 산출된 인덱스 및 대체 폴리아데닐화의 상관관계를 측정하는 단계를 포함하는 암의 진단을 위한 정보제공 방법을 제공하는 것이다. Another aspect is obtaining RNA sequencing data of a patient-derived cell; Estimating alternative polyadenylation (APA) of individual genes from the obtained RNA sequencing data; Calculating an index indicating the expression level of individual genes; And measuring the correlation between the calculated index and the replacement polyadenylation.

일 양상은 환자 유래 세포의 RNA 시퀀싱 데이터를 획득하는 단계; 상기 획득된 RNA 시퀀싱 데이터로부터 개별 유전자의 대체 폴리아데닐화(Alternative polyadenylation, APA)를 추정하는 단계; 개별 유전자의 발현 정도를 나타내는 인덱스를 산출하는 단계; 및 상기 산출된 인덱스 및 대체 폴리아데닐화의 상관관계를 측정하는 단계를 포함하는 바이오마커 패널을 구성하는 바이오마커의 선별 방법을 제공한다. One aspect is obtaining RNA sequencing data of a patient-derived cell; Estimating alternative polyadenylation (APA) of individual genes from the obtained RNA sequencing data; Calculating an index indicating the expression level of individual genes; And measuring the correlation between the calculated index and the replacement polyadenylation.

벌크(Bulk) 조직 전사체 데이터를 이용한 기존의 바이오마커 패널 연구는 조직 내 미세 환경 및 종양 이질성 특성의 반영이 어려워 세포 유형에 따른 바이오마커 패널의 구성이 제한적이라는 문제점이 있었다. 그러나, 일 양상에 따른 방법은 단일세포 전사체 데이터를 이용하여 전사 조절 기작인 대체 RNA 폴리아데닐화와 유전자 발현의 연관성 분석을 수행함으로써, 암 내 존재하는 면역 및 종양세포 특이적이고 기존의 유전자 발현 중심의 패널 구성에서 발견되지 않았던 새로운 유방암 바이오마커 패널을 구성할 수 있다. 일 구체예에 있어서, 상기 바이오마커 패널을 구성하는 유전자는 암 환자 집단 내에 RNA 폴리아데닐화와 밀접하게 연관되어 특정 유전자의 발현 정도가 뚜렷하게 다른 세포의 집단이 존재하는 것으로 환자 모집단(patient population)에서 유전자 발현 조절 변화가 일어났다는 것을 의미한다. 특히, 유전자의 발현 정도가 뚜렷하게 증가되는 양상을 나타내는 동시에 유전자 군집의 생존결과가 통계적 유의성을 보이면서 다르게 나타나는 경우 상피성 암에 있어서 이 유전자의 발현 정도의 변화가 상기 암의 예후와 밀접하게 연관되어 있다고 볼 수 있다. 유전자 발현의 상위 및 하위 25 번째 백분위 수를 컷오프로 사용하여 고발현군과 저발현군으로 분류하였다. Conventional biomarker panel studies using bulk tissue transcript data have a problem that the configuration of biomarker panels according to cell types is limited due to difficulty in reflecting microenvironment and heterogeneity characteristics in tissues. However, the method according to one aspect uses a single-cell transcript data to analyze the association of gene expression with alternative RNA polyadenylation, a transcription control mechanism, and is specific for immune and tumor cell-specific and existing gene expression present in cancer. A new breast cancer biomarker panel that could not be found in the panel composition of can be constructed. In one embodiment, the gene constituting the biomarker panel is closely related to RNA polyadenylation in a cancer patient population, and there is a population of cells having a significantly different expression level of a specific gene in a patient population. It means that changes in gene expression regulation have occurred. In particular, when the expression level of the gene is markedly increased and the survival result of the gene cluster is statistically significant and different, the change in the expression level of this gene in epithelial cancer is closely related to the prognosis of the cancer. can see. The upper and lower 25th percentiles of gene expression were classified into high and low expression groups using cutoff.

일 구체예에 따른 방법은 환자 유래 세포의 RNA 시퀀싱 데이터를 획득하는 단계를 포함한다. 상기 세포는 단일 세포일 수 있다. 예를 들어, 종양세포 B 림프구, T 림프구, 골수성 세포(myeloid) 또는 기질세포(stromal cell)일 수 있다. 또한, 상기 데이터는 RNA 전장 전사체(full-length transcript)일 수 있다. The method according to one embodiment comprises obtaining RNA sequencing data of a patient-derived cell. The cells may be single cells. For example, the tumor cells may be B lymphocytes, T lymphocytes, myeloid cells or stromal cells. In addition, the data may be an RNA full-length transcript.

일 구체예에 따른 방법은 상기 획득된 RNA 시퀀싱 데이터로부터 개별 유전자의 대체 폴리아데닐화를 추정하는 단계를 포함한다. 상기 대체 폴리아데닐화는 DaPars 또는 Roar를 사용하여 추정할 수 있다. 구체적으로, RNA-seq 데이터로부터 유전자의 short isoform과 long isoform의 상대적인 양 변화를 측정하여 대체 폴리아데닐화를 추정할 수 있다. 또한, 상기 대체 폴리아데닐화는 개별 유전자에 대한 3'UTR의 길이 변화에 의해 추정할 수 있다. 또한, 환자 유래 세포는 다양한 종양으로부터 분리될 수 있으며, 예를 들어, 유방암, 교모세포종, 신 세포 암종, 선암, 점액암, 인환세포함, 편평상피암, 선편평상피암, 소세포암, 융모암, 미분화암 등과 같은 기타 상피성 암일 수 있다. 상기 세포 유형에 따라 대체 폴리아데닐화가 조절됨으로써 개별유전자의 대체 폴리아데닐화를 추정할 수 있다.The method according to one embodiment comprises estimating the replacement polyadenylation of an individual gene from the obtained RNA sequencing data. The replacement polyadenylation can be estimated using DaPars or Roar. Specifically, alternative polyadenylation can be estimated by measuring the relative changes in the amount of short isoform and long isoform of a gene from RNA-seq data. In addition, the replacement polyadenylation can be estimated by changing the length of 3'UTR for individual genes. In addition, patient-derived cells can be isolated from a variety of tumors, for example, breast cancer, glioblastoma, renal cell carcinoma, adenocarcinoma, mucus cancer, phantom cell, squamous cell carcinoma, adenosquamous cell carcinoma, small cell carcinoma, chorionic cancer, undifferentiated cancer And other epithelial cancers. Alternative polyadenylation of individual genes can be estimated by adjusting the replacement polyadenylation according to the cell type.

일 구체예에 따른 방법은 개별 유전자의 발현 정도를 나타내는 인덱스를 산출하는 단계를 포함한다. 개별 유전자의 발현 수준은 예를 들어, 마이크로어레이, 멀티 플렉스 PCR(multiplex polymerase chain reaction), 정량 RT-PCR(quantitative reverse transcription polymerase chain reaction), 타일링 어레이(tiling array)를 이용한 전사체(transcriptome) 해석, 쇼트 리드 시퀀싱(short read sequencing)을 이용하여 측정할 수 있다. 또한, 상기 개별 유전자의 발현 정도를 나타내는 인덱스의 산출은 FPKM(Fragments Per Kilobase of transcript per Million), RPKM(Reads Per Kilobase Million), TPM(Transcripts Per Kilobase Million), Quantile-nomrmalization 등 샘플 내 또는 샘플 간 정규화(normalization)를 이용할 수 있다. 구체적으로, 획득된 RNA 시퀀싱 데이터로부터 STAR method를 이용한 리드 정렬(read alignment)과 RSEM 방법을 이용한 리드 정량화(read quantification) 과정을 통해 개별 유전자의 리드 카운트(read count)를 확보할 수 있다. 상기 리드 카운트는 세포/샘플간 비교를 위해 TPM(transcript per million) 수준으로 정규화하고, log2 수준으로 변환하여(log2 (TPM + 1)) 유전자 발현 정도를 정량화할 수 있다.The method according to one embodiment includes calculating an index indicating the expression level of an individual gene. The expression level of individual genes is, for example, microarray, multiplex polymerase chain reaction (PCR), quantitative RT-PCR (quantitative reverse transcription polymerase chain reaction), transcriptome analysis using a tiling array , Can be measured using short read sequencing. In addition, the calculation of the index indicating the expression level of the individual gene is within samples or between samples, such as Fragments Per Kilobase of transcript per Million (FPKM), Reads Per Kilobase Million (RPKM), Transcripts Per Kilobase Million (TPM), Quantile-nomrmalization, etc. Normalization can be used. Specifically, read count of an individual gene may be secured through read alignment using a STAR method and read quantification using an RSEM method from the obtained RNA sequencing data. The read count can be normalized to a transcript per million (TPM) level for comparison between cells / samples, and converted to log2 level (log2 (TPM + 1)) to quantify the degree of gene expression.

일 구체예에 따른 방법은 상기 산출된 인덱스 및 대체 폴리아데닐화의 상관관계를 측정하는 단계를 포함한다. 상기 산출된 인덱스는 상위 4 분위 정규화 RSEM 수로 표시될 수 있으며, 암 환자에서 유래한 단일세포에서 생산된 전사체 데이터를 이용하여 정량화할 수 있다. 상기 상관관계는 상관계수(correlation coefficient)를 계산하여, 측정할 수 있다. 예를 들어, 피어슨 상관계수(Pearson's correlation coefficient)를 이용하여 상관계수를 계산할 수 있다. The method according to one embodiment includes measuring the correlation between the calculated index and the replacement polyadenylation. The calculated index can be expressed as the number of normalized RSEMs in the top 4 quartiles, and can be quantified using transcript data produced from single cells derived from cancer patients. The correlation can be measured by calculating a correlation coefficient. For example, the correlation coefficient can be calculated using Pearson's correlation coefficient.

본 명세서 내 용어, "RESM 수"는 표준화된 전사체(transcript) 정량화 기법 (RSEM)을 이용 RNA-seq 데이터로부터 도출된 발현 추정치를 의미한다. 이때, 상기 4 분위 정규화는 정규화 방법 중 하나로, 생존율 분석에 사용한 TCGA 데이터는 해당 표준화 방법으로 유전자 발현 정도가 정량화 되어 있는 것을 의미한다. As used herein, the term "RESM number" refers to an expression estimate derived from RNA-seq data using a standardized transcript quantification technique (RSEM). At this time, the quartile normalization is one of the normalization methods, and the TCGA data used for the survival rate analysis means that the degree of gene expression is quantified by the corresponding standardization method.

또한, 분류된 환자 그룹 간의 생존율 차이를 나타내는 통계적 유의 수준을 산출하고, 상기 산출된 통계적 유의 수준에 기초하여 유전자를 선별하는 단계를 추가로 포함할 수 있다. 생존분석(survival analysis)은 생존여부(overall survival) 예측된 예후 집단 간의 생존율 차이를 분류할 수 있는지의 여부를 알아보기 위한 통계학적 기술을 의미한다. 상기 생존 분석은 당업계에서 통상적으로 사용하는 다양한 방법을 사용할 수 있다. 예를 들어, 단일 변수 분석법인 카플란-마이어법(Kaplan-meier method), 로그-랭크 시험법(log-rank test), 또는 다중 변수 분석법인 콕스 비례 위험 회귀 모델(cox proportional-hazards regression model)을 사용할 수 있다. 또한, 상기 방법은 초기 암을 진단하기 위한 것일 수 있다. 상기 방법은 암 종에 따라 3'UTR 단축에 대한 차별적인 패턴을 나타내는바, 종양 특이성을 가지는 것일 수 있다. In addition, the method may further include calculating a statistical significance level representing the difference in survival rates between the classified patient groups, and selecting genes based on the calculated statistical significance level. Survival analysis refers to a statistical technique for determining whether survival rate differences between predicted prognostic groups can be classified. The survival analysis can use various methods commonly used in the art. For example, the single-variable Kaplan-meier method, the log-rank test, or the multivariate analytical cox proportional-hazards regression model. Can be used. In addition, the method may be for diagnosing early cancer. The method shows a differential pattern for 3'UTR shortening depending on the cancer type, and thus may have tumor specificity.

다른 양상은 상기 방법에 의해 선별된 바이오마커 패널을 제공한다. 상기 바이오마커 패널은 단일세포 전사체 데이터를 이용하여 개별 유전자의 대체 폴리아데닐화 및 발현 양상을 고려한 것으로서 초기 암 환자의 생존율과 밀접한 연관성을 가지는 바, 암 내에 존재하는 면역 및 종양세포 특이적인 패널을 구성할 수 있다. 일 구체예에 있어서, 상기 패널은 상기 방법에 의해 선별된 바이오마커의 수준을 측정하는 제제를 포함할 수 있다. 예를 들어, 상기 방법에 의해 선별된 2 이상의 바이오마커의 수준을 측정하는 제제를 포함할 수 있다. Another aspect provides a biomarker panel selected by the above method. The biomarker panel is a single cell transcript data that considers alternative polyadenylation and expression patterns of individual genes and is closely related to the survival rate of early cancer patients. Can be configured. In one embodiment, the panel may include an agent that measures the level of the biomarker selected by the method. For example, it may include an agent that measures the level of two or more biomarkers selected by the above method.

상기 바이오마커의 수준을 측정하는 제제는 프라이머쌍, 프로브 또는 안티센스 뉴클레오티드일 수 있다. 구체적으로, 상기 바이오마커 유전자의 mRNA 수준을 측정하기 위한 제제일 수 있으며, 상기 유전자에 특이적으로 결합하는 프라이머 쌍, 프로브 또는 안티센스 뉴클레오티드일 수 있다. 또한, 상기 바이오마커의 수준을 측정하는 제제는 항체일 수 있다. 상기 항체는 모노클로날 항체일 수 있으며, 예를 들어, 상기 바이오마커 중 임의의 것에 특이적으로 결합하는 모노클로날 항체일 수 있다.The agent measuring the level of the biomarker may be a primer pair, a probe or an antisense nucleotide. Specifically, it may be an agent for measuring the mRNA level of the biomarker gene, and may be a primer pair, probe or antisense nucleotide specifically binding to the gene. In addition, the agent for measuring the level of the biomarker may be an antibody. The antibody may be a monoclonal antibody, for example, a monoclonal antibody that specifically binds to any of the biomarkers.

다른 양상은 환자 유래의 RNA 시퀀싱 데이터를 획득하는 단계; 상기 획득된 RNA 시퀀싱 데이터로부터 개별 유전자의 대체 폴리아데닐화(Alternative polyadenylation, APA)를 추정하는 단계; 개별 유전자의 발현 정도를 나타내는 인덱스를 산출하는 단계; 및 상기 산출된 인덱스 및 대체 폴리아데닐화의 상관관계를 측정하는 단계를 포함하는 암의 진단을 위한 정보 제공방법을 제공한다. Another aspect is obtaining RNA sequencing data from a patient; Estimating alternative polyadenylation (APA) of individual genes from the obtained RNA sequencing data; Calculating an index indicating the expression level of individual genes; And measuring a correlation between the calculated index and the replacement polyadenylation.

일 구체예에 따른 방법은 환자 유래 세포의 RNA 시퀀싱 데이터를 획득하는 단계를 포함한다. 상기 데이터를 획득의 구체적인 내용은 전술한 바와 같다. The method according to one embodiment comprises obtaining RNA sequencing data of a patient-derived cell. The details of obtaining the data are as described above.

일 구체예에 따른 방법은 상기 획득된 RNA 시퀀싱 데이터로부터 개별 유전자의 폴리아데닐화를 추정하는 단계를 포함한다. 상기 추정의 구체적인 내용은 전술한 바와 같다. The method according to one embodiment includes estimating polyadenylation of individual genes from the obtained RNA sequencing data. The details of the estimation are as described above.

일 구체예에 따른 방법은 개별 유전자의 발현 정도를 나타내는 인덱스를 산출하는 단계를 포함한다. 상기 산출의 구체적인 내용은 전술한 바와 같다. The method according to one embodiment includes calculating an index indicating the expression level of an individual gene. The details of the calculation are as described above.

일 구체예에 따른 방법은 상기 산출된 인덱스 및 대체 폴리아데닐화의 상관관계를 측정하는 단계를 포함한다. 구체적으로, 개체의 개별 유전자의 발현 수준 및 대체 폴리아데닐화가 대조군에 비해 증가하면, 암으로 판단할 수 있다. 이때, 상기 개별 유전자의 발현 수준은 개별 유전자의 발현 정도를 산출한 것으로서 인덱스로 표현할 수 있다. 또한, 상기 암은 초기 암일 수 있다. The method according to one embodiment includes measuring the correlation between the calculated index and the replacement polyadenylation. Specifically, when the expression level of the individual gene of the individual and the replacement polyadenylation increase compared to the control group, it can be judged as cancer. At this time, the expression level of the individual gene is calculated as the expression level of the individual gene and can be expressed by an index. In addition, the cancer may be an early cancer.

일 양상에 따른 방법은 단일세포 RNA 시퀀싱 데이터를 사용하여 유전자 발현 조절과 3'UTR의 대체 폴리아데닐화와 관련된 전사 시그니처(signature)를 탐색하기 위한 전산 접근법을 제공할 수 있다. 또한, 단일 세포에서 세포 유형 특이 대체 폴리아데닐화를 확인함으로써 다양한 세포 유형의 유전자 발현과 함께 3'UTR 길이 변화에 기반한 세포 유형을 정의할 수 있다. 특히, 유방암에서 면역 특이적인 대체 폴리아데닐화 신호는 조기 유방암의 예후 지표로서 활용될 수 있다. The method according to one aspect can provide a computational approach to exploring transcription signatures associated with regulating gene expression and alternative polyadenylation of 3'UTR using single cell RNA sequencing data. In addition, by identifying cell type specific alternative polyadenylation in a single cell, it is possible to define cell types based on 3'UTR length changes with gene expression of various cell types. In particular, an alternative polyadenylation signal that is immune specific in breast cancer can be used as a prognostic indicator of early breast cancer.

도 1은 종양 및 비-종양 세포 사이의 APA 패턴 차이를 나타낸다. 도 1a는 모든 유전자에 대해 APA(DaPars에 의해 계산된 PDUI)의 신호를 나타낸 것이고, 도 1b 및 도 1c는 각각 유방암 환자로부터 유래된 개별 세포에 대한 유전자 및 유전자 세트에 대한 계층적 클러스터링을 나타낸다. 도 1d는 유방암에서 종양 세포 및 비-종양 세포를 분리하는 유전자 세트-수준 APA에 대한 Unsupervised tSNE을 나타낸다. 개별 세포는 표본 채색되어 있으며, 도 1b 및 도 1c의 채색과 일치한다.
도 2는 3'UTR 단축 및 과발현과 관련된 세포 유형-특이 기능적 카테고리를 나타낸다. 도 2a는 5개의 세포 유형에 특이적인 1,176개의 유전자 세트에 대한 벤 다이어그램을 나타내는 것이고 도 2b는 선택된 유전자 세트의 네트워크 기반 기능적 분석 결과를 나타내는 것이다.
도 3은 세포 유형에 따른 3'UTR 단축 및 증식과 관련된 유전자의 발현 변화를 나타낸다. 교차비와 그 유의성은 플롯의 오른쪽 위에 특정 세포 유형으로 표시하였고 맞춰진 선은 일치하는 세포 유형을 확인하기 위해 채색하였다.
도 4는 암 유형 간의 APA 조절의 이질성을 나타낸다. 도 4a는 3개의 암 유형에서 유래한 598개의 단일 세포에 대한 유전자 세트-수준의 APA 산정을 위한 계층적 클러스터링을 나타내고, 도 4b는 암 유형과 함께 종양 세포를 분리하는 유전자 세트-수준 APA에 대한 Unsupervised tSNE을 나타내며 도 4c는 각 암 유형에서 top 10 유전자 세트의 APA 맵을 나타낸다(p<0.01). 암 종류와 환자에 대한 색은 도 4a에 나타난 바와 같다.
도 5는 임상 연관성이 있는 세포 유형 특이적 유전자를 나타낸다. 도 5a는 5개의 세포 유형에 특이적인 53개의 유전자 히트에 대한 벤 다이어그램을 나타내는 것으로, 붉은색으로 표시된 유전자는 Roar의 결과에서 일반적인 마커이고 파란색으로 표시된 유전자는 공적 APA 데이터베이스에서 de novo 마커이다. 도 5b는 TCGA BRCA 환자에서 SET, HSP90AA1, YWHAZ, 및 DDX5에 대한 Kaplan-Meier 생존 곡선을 나타내는 것으로, 종양 샘플에는 각 유전자의 발현 신호에 대해 '높음' 및 '낮음'(25번째 및 75번째 백분위 수) 그룹을 주석으로 달았다. p값은 로그-순위 테스트에 위해 결정된다.
1 shows APA pattern differences between tumor and non-tumor cells. 1A shows the signal of APA (PDUI calculated by DaPars) for all genes, and FIGS. 1B and 1C show hierarchical clustering of genes and gene sets for individual cells derived from breast cancer patients, respectively. 1D shows Unsupervised tSNE for gene set-level APA separating tumor cells and non-tumor cells from breast cancer. Individual cells are sampled and match the coloration of FIGS. 1B and 1C.
Figure 2 shows cell type-specific functional categories related to 3'UTR shortening and overexpression. FIG. 2A shows the Venn diagram for a set of 1,176 genes specific to 5 cell types and FIG. 2B shows the results of a network-based functional analysis of selected gene sets.
Figure 3 shows the expression change of the gene related to 3'UTR shortening and proliferation according to cell type. The cross ratio and its significance are marked with a specific cell type in the upper right of the plot, and the line of alignment is colored to identify the cell type that matches.
4 shows the heterogeneity of APA regulation between cancer types. Figure 4a shows hierarchical clustering for gene set-level APA estimation for 598 single cells from 3 cancer types, Figure 4b for gene set-level APA separating tumor cells with cancer type Unsupervised tSNE and FIG. 4C shows the APA map of the top 10 gene set in each cancer type (p <0.01). Cancer types and colors for patients are shown in FIG. 4A.
5 shows cell type specific genes with clinical relevance. FIG. 5A shows the Venn diagram for 53 gene hits specific to 5 cell types, the genes in red are typical markers in the results of Roar and the genes in blue are de novo markers in the public APA database. FIG. 5B shows Kaplan-Meier survival curves for SET, HSP90AA1, YWHAZ, and DDX5 in TCGA BRCA patients. Tumor samples show 'high' and 'low' (25th and 75th percentiles) for the expression signal of each gene. Su) The group was annotated. The p-value is determined for log-rank testing.

이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 하기 실시예에 의해 본 발명의 내용이 한정되는 것은 아니다.Hereinafter, preferred embodiments are provided to help understanding of the present invention. However, the following examples are only provided to more easily understand the present invention, and the contents of the present invention are not limited by the following examples.

[실시예][Example]

실시예 1. 데이터 수집Example 1 Data Collection

NCBI Gene Expression Omnibus database에서 accession code GSE75688 및 GSE73122를 사용하여 유방암(breast cancer) 환자 11명으로부터 515개의 세포 및 신장암(renal cancer) 환자로부터 30개의 세포에 대한 Raw RNA-seq 데이터를 획득하였다. 또한, European Genome-phenome Archive (EGA)에서 accession code EGAS00001001880를 사용하여 3명의 교모세포종(glioblastoma) 환자로부터 288개의 세포에 대한 Raw RNA-seq 데이터를 다운로드 받았다. 이 데이터는 전장 전사체(full length transcript)로서 C1 Single-Cell Auto Prep System(100-5760, Fluidigm, San Francisco, CA, USA)에서 생성되었다. 3'UTR 길이의 사용을 평가하기 위해, STAR_2.4.0b의 2-pass mode(기본 매개변수)를 사용하여 Roar method 입력으로 .bam 파일을 생성하였다. 또한,‘genomCoverageBed' 명령(BEDtools v2.17.0)을 사용하여 .bam 파일로부터 DaPars method 입력으로 .bedgraph 파일을 생성하였다. 이후, 유방암의 발현 분석을 위해, 34,942개의 유전자를 추출하였으며, 이 유전자의 발현 값은 적어도 하나의 세포에서 상정되었다. 각 유전자의 상대적 발현은 RSEM v1.2.17 (기본 매개변수)을 사용하여 TPM(transcript per million)로 표현된다. 대조군으로, Body Map 2.0 project로부터 정상 유방, 뇌 및 신장 조직의 Raw RNA-seq 데이터를 ArrayExpress(http://www.ebi.ac.uk/arrayexpress에서 사용 가능한 쿼리(Query) ID: E-MTAB-513.)에서 다운로드하여 획득하였다. 단일 세포 RNA-seq 데이터 과정과 동일하게 리드 정렬(read alignments) 및 정량화(quantification)를 위한 순차적 방법을 적용하였다. 생존 분석을 위해, RNA-seq 및 환자의 침윤 암종(Breast Invasive Carcinoma, BRCA) 샘플의 임상데이터를 암 게놈 아틀라스(The Cancer Genome Atlas,TCGA)에서 획득하였다. 이 RNA-seq 데이터(수준 3)에는 1,073개(2017년에 업데이트 됨)의 종양이 존재하며, 각 유전자의 발현은 상위 4 분위 정규화 RSEM(RNA-Seq by Expectation Maximization) 수로 표시하였다. BRCA 종양의 아형을 R 패키지 'genefu'를 사용하여 예측하였다.Raw RNA-seq data for 515 cells from 11 breast cancer patients and 30 cells from kidney cancer patients were obtained using accession codes GSE75688 and GSE73122 from the NCBI Gene Expression Omnibus database. In addition, Raw RNA-seq data for 288 cells were downloaded from 3 glioblastoma patients using the accession code EGAS00001001880 from the European Genome-phenome Archive (EGA). This data was generated in the C1 Single-Cell Auto Prep System (100-5760, Fluidigm, San Francisco, CA, USA) as a full length transcript. To evaluate the use of 3'UTR length, a .bam file was created with the Roar method input using the 2-pass mode (basic parameter) of STAR_2.4.0b. In addition, using the 'genomCoverageBed' command (BEDtools v2.17.0), a .bedgraph file was created from the .bam file with DaPars method input. Thereafter, 34,942 genes were extracted for expression analysis of breast cancer, and the expression values of these genes were assumed in at least one cell. The relative expression of each gene is expressed in transcript per million (TPM) using RSEM v1.2.17 (basic parameter). As a control, Raw RNA-seq data of normal breast, brain, and kidney tissue from the Body Map 2.0 project can be used in ArrayExpress (http://www.ebi.ac.uk/arrayexpress Query ID: E-MTAB- 513.). Sequential methods for read alignments and quantification were applied in the same manner as the single cell RNA-seq data process. For survival analysis, RNA-seq and clinical data of patients' Invasive Carcinoma (BRCA) samples were obtained from The Cancer Genome Atlas (TCGA). In this RNA-seq data (level 3), there are 1,073 tumors (updated in 2017), and the expression of each gene is expressed by the number of top four quintile normalized RNA-Seq by Expectation Maximization (RSEM). Subtypes of BRCA tumors were predicted using the R package 'genefu'.

실시예 2. 3'UTR 길이 변화의 세포 이질성(cellular heterogeneity) 확인Example 2. Confirmation of cellular heterogeneity of 3'UTR length change

유방암 환자의 종양 조직에서 생성된 전장(full-length) 단일 세포 RNA 시퀀싱 데이터를 이용하여 종양 세포, B 림프구, T 림프구 및 기질 세포를 포함한 5개의 주요 세포 유형에서 3'UTR 길이의 변화를 예측하고 비교하였다. 3'UTR의 단축 및 연장을 결정하기 위하여 두 가지 보완적인 방법을 적용하였다. DaPars (기본 매개변수) 및 Roar를 사용하여 3'UTR의 길이 변화에 의한 대체 폴리아데닐화(Alternative polyadenylation, APA)를 추정하였다. DaPars는 참조 게놈(hg19)에서 3'UTR의 모든 영역을 스캔하여 새로운 APA 사이트를 검출하는 반면, Roar는 3'UTR의 알려진 APA 사이트에 초점을 맞추어 감도를 향상시키는바, 주로 DaPars에서 추정한 3'UTR 스위칭(switching) 결과를 활용하였다. 구체적으로, 단일 세포 및 대량 RNA-seq 샘플을 사용하여 PolyA_DB2 및 APASdb의 공공 APA 데이터베이스에서 생성된 .gtf 파일을 사용하였다. Using full-length single cell RNA sequencing data generated from tumor tissue in breast cancer patients, we predict the change in 3'UTR length in five major cell types, including tumor cells, B lymphocytes, T lymphocytes, and stromal cells. Compared. Two complementary methods were applied to determine the shortening and extension of the 3'UTR. Alternative polyadenylation (APA) due to length change of 3'UTR was estimated using DaPars (basic parameter) and Roar. DaPars scans all regions of the 3'UTR in the reference genome (hg19) to detect new APA sites, while Roar focuses on the known APA sites of the 3'UTR to improve sensitivity, mainly estimated by DaPars 3 'We used the UTR switching results. Specifically, .gtf files generated from public APA databases of PolyA_DB2 and APASdb were used using single cell and bulk RNA-seq samples.

도 1은 종양 및 비-종양 세포 사이에서 APA의 패턴 차이를 보여주는 것이다. 도 1a 및 1b에 나타난 바와 같이, 유방암 환자의 종양 조직에서 유래한 모든 세포에서, 3'UTR 단축이 우세하게 나타났다. 또한 패터닝의 해상도를 높이기 위해, 단일 샘플 GSEA(ssGSEA)를 사용하여 유전자 세트 수준에서 전반적인 APA 패턴을 비교하였다. 그 결과, 도 1c 및 1d에 나타난 바와 같이, 3'UTR 단축은 암 서브타입 및 샘플 배치에 의해 영향을 받지 않는 것을 확인할 수 있었다. 1 shows the pattern difference of APA between tumor and non-tumor cells. 1A and 1B, in all cells derived from tumor tissue of breast cancer patients, 3'UTR shortening was predominant. In addition, to increase the resolution of patterning, a single sample GSEA (ssGSEA) was used to compare the overall APA pattern at the gene set level. As a result, as shown in Figs. 1C and 1D, it was confirmed that 3'UTR shortening was not affected by the cancer subtype and sample arrangement.

실시예 3. 유전자 세트의 구성Example 3. Construction of the gene set

‘원거리 polyA 사이트 이용률의 백분율 변화(change in Percentage of Distal polyA site Usage Index)'(PDUI, by DaPars)의 APA 측정 및 ‘A 비율의 비율(Ratio of A Ratio)'(roar, by Roar)을 각각 입력 자료로서 사용하였다. TPM(transcript per million)으로서 정량된 유전자 발현은 log2를 플러스(plus) 1로 변환시켰다. 또한, 경로 활성화에 기초한 APA 조절 및 유전자 발현을 평가하기 위하여, 모든 유전자 기호를 EntrezID와 일치시킨 다음 ssGSEA(R 패키지의 'GSVA'옵션을 사용)를 적용하여 유전자 세트 당 농축 점수(enrichment score)를 계산하였다. 유전자 세트 데이터베이스, MSigDB v6.0에서 발표된 ssGSEA에 대해 총 5,917개의 유전자 온톨로지(Gene Ontology, GO) term를 수집하였다. APA measurement of 'change in Percentage of Distal polyA site Usage Index' (PDUI, by DaPars) and 'Ratio of A Ratio' (roar, by Roar), respectively Used as input data. Gene expression quantified as transcript per million (TPM) converted log2 to plus 1. In addition, in order to evaluate APA regulation and gene expression based on pathway activation, all gene symbols were matched with EntrezID, and then ssGSEA (using the 'GSVA' option of the R package) was applied to obtain an enrichment score per gene set. It was calculated. A total of 5,917 gene ontology (GO) terms were collected for ssGSEA published in the gene set database, MSigDB v6.0.

실시예 4. 세포 유형별 특이적 시그니처 선별Example 4. Selection of specific signatures by cell type

종양 세포, B 림프구, T 림프구 및 기질 세포를 포함한 5개의 주요 세포 유형에 대하여 유전자 발현과 APA 수준을 비교하였다. 구체적으로, 3'UTR의 사용과 유전자 발현 조절 사이의 연관성을 결정하기 위해 두 가지 측정법을 이용하였다. 각 세포 유형에서 3'UTR 길이의 변화와 유전자 발현의 상관 관계를 피어슨의 상관계수(Pearson's correlation coefficient, PCC)를 사용하여 유전자 세트의 농축 점수 척도로 계산하였다. PCC의 통계적 유의성을 결정하기 위해, 피셔의 Z 변형(Fisher's Z transformation)을 기반으로 p값을 계산하였다. 세포 유형에 대한 3'UTR 단축(shortening)과 과발현의 특이성을 세포 집단을 정량화함으로써 교차비(odds ratio, OR)를 계산하였다. 3'UTR 길이의 변화 및 유전자의 발현 정도를 이용하여 모든 단일 세포를 하기와 같이 4개의 그룹으로 분류하였으며, 교차비를 계산하였다;Gene expression and APA levels were compared for five major cell types, including tumor cells, B lymphocytes, T lymphocytes, and stromal cells. Specifically, two measures were used to determine the association between the use of 3'UTR and gene expression regulation. Correlation between 3'UTR length change and gene expression in each cell type was calculated using the Pearson's correlation coefficient (PCC) as a concentration score scale for the gene set. To determine the statistical significance of PCC, p-values were calculated based on Fisher's Z transformation. The odds ratio (OR) was calculated by quantifying the cell population for the specificity of 3'UTR shortening and overexpression for the cell type. All single cells were classified into 4 groups using the change of 3 'UTR length and the expression level of the gene, and the cross ratio was calculated;

(a) 특정 세포 유형에 대한 3'UTR 단축 및 과발현을 나타내는 세포(a) Cells showing 3'UTR shortening and overexpression for specific cell types

(b) 다른 세포에 대한 3'UTR 단축 및 과발현을 나타내는 세포(b) Cells showing 3'UTR shortening and overexpression to other cells

(c) 특정 세포 유형에 대한 3'UTR 단축 및 과발현을 나타내지 않는 세포(c) Cells that do not show 3'UTR shortening and overexpression for specific cell types

(d) 다른 세포에서 3'UTR 단축 및 과발현을 나타내지 않는 세포. (d) Cells that do not show 3'UTR shortening and overexpression in other cells.

개별 세포가 각 유전자 세트와 유전자에 대해 3'UTR 단축 및 과발현을 나타내는지 여부를 결정하기 위하여 상기 그룹을 분류하는 기준으로써 APA 수준과 유전자 발현의 중앙값을 사용하였다. 그런 다음 Fisher exact test를 사용하여 개별 쿼리 쌍 간의 일치의 통계적 유의성을 결정하였다. 히트(hit)의 선택을 위해, PCC>0(p값<0.05) 및 OR>2(p값<0.01)에 대해 컷오프(cutoff)를 적용하였다.APA levels and median gene expression were used as criteria for classifying the groups to determine whether individual cells exhibit 3'UTR shortening and overexpression for each gene set and gene. The Fisher exact test was then used to determine the statistical significance of the matches between individual query pairs. For the selection of hits, cutoffs were applied for PCC> 0 (p value <0.05) and OR> 2 (p value <0.01).

면역 및 기질 세포 특이적 유전자 세트는 면역 및 염증 반응의 기능적 카테고리를 형성하였다. 특히, 세포가 증식하는 동안, 기질 세포를 제외한 4가지 세포 유형에 특이적인 유전자 세트의 클러스터링 패턴이 나타났다. 3'UTR 길이의 일반적인 단축은 세포 증식 및 탈분화 상태와 밀접하게 연관되어 있다. 또한 세포 증식으로 분류된 유전자 세트에 대한 3'UTR 단축 및 유전자 발현이 각각 그것의 세포 유형에 연관된 제한적인 상관 패턴을 나타냄을 확인할 수 있었다(도 3). 이 결과는 발현 조절과 관련된 APA가 독특한 세포 계통에 크게 의존함을 시사한다. 따라서, 단일 세포 분석에서의 APA의 이해는 암에서 다양한 세포 간의 전사 조절의 차이를 인식하는데 유용하다.Immune and stromal cell specific gene sets have formed functional categories of immune and inflammatory responses. In particular, during cell proliferation, clustering patterns of gene sets specific to four cell types except stromal cells appeared. The general shortening of 3'UTR length is closely related to the state of cell proliferation and dedifferentiation. It was also confirmed that 3'UTR shortening and gene expression for a set of genes classified as cell proliferation each exhibited a limited correlation pattern associated with its cell type (FIG. 3). These results suggest that APAs involved in regulating expression are highly dependent on unique cell lineages. Thus, the understanding of APA in single cell analysis is useful for recognizing differences in transcriptional regulation between various cells in cancer.

실시예 5. 종양 특이 유전자 세트의 선별Example 5. Selection of tumor specific gene sets

암 조직에서 APA 변이의 우세를 비교하기 위해 교모세포종 및 신 세포 암종 조직으로부터 생성된 공공 전장 단일 세포 RNA 시퀀싱 데이터를 확보하고, 유방암 환자의 종양 조직에서는 280개의 종양 세포 APA-예측 데이터를 사용하였다. 델타 및 t-테스트 p값을 유전자 세트로 변형된 APA 예측 데이터를 사용하여 계산하여 각 암 유형별로 유의미한 3'UTR 스위칭을 보이는 유전자 세트를 선택하였다. 이후, 각 암에서 가장 차별적인 유전자 세트(상위 10개 hit) 목록을 작성하였다. 유전자 세트의 델타는 주어진 종양 유형에 대한 단일 세포의 평균과 다른 종양의 차이로 나타나고, 양측-t 통계에 의해 유의성(p값)을 계산하였다.To compare the prevalence of APA mutations in cancer tissues, public full-length single cell RNA sequencing data generated from glioblastoma and renal cell carcinoma tissues was obtained, and 280 tumor cell APA-prediction data were used in tumor tissues of breast cancer patients. Delta and t-test p values were calculated using APA prediction data modified with the gene set to select a gene set showing significant 3'UTR switching for each cancer type. Afterwards, a list of the most differential gene sets (top 10 hits) in each cancer was prepared. The delta of the gene set is expressed as the difference between the average of a single cell for a given tumor type and other tumors, and the significance (p value) was calculated by bi-t statistics.

그 결과, 도 4a 및 4b에 나타난 바와 같이, 유전자 세트 수준에서 3'UTR 길이 변화를 기반으로 한 클러스터링을 통해 종양 조직이 분명하게 구별됨을 확인할 수 있었다. 또한, 차별적인 APA 조절을 통해 종양 특이적 클러스터에 기여하는 유전자 세트를 더 조사하였다. 그 결과, 유방암, 교모세포종 및 신장 세포암에서 각각 739, 898 및 731개의 유전자 세트가 유의하게 스위칭 되는 것을 확인할 수 있었다(p<0.01). 또한, 도 4c에 나타난 바와 같이, 각 암에서 3'UTR 단축에 대한 차별적인 패턴을 확인할 수 있었다. As a result, as shown in Figures 4a and 4b, it was confirmed that the tumor tissue is clearly distinguished through clustering based on 3'UTR length change at the gene set level. In addition, the gene set contributing to the tumor-specific cluster through differential APA regulation was further investigated. As a result, it was confirmed that 739, 898, and 731 gene sets were significantly switched in breast cancer, glioblastoma, and kidney cell cancer, respectively (p <0.01). In addition, as shown in Figure 4c, it was possible to confirm the differential pattern for 3'UTR shortening in each cancer.

실시예 6. 네트워크에 기반한 클러스터링 유전자 세트의 구성Example 6. Construction of a clustering gene set based on a network

Cytoscape (v3.5.1)를 사용하여 상호 작용 네트워크 그래픽으로 유전자 세트의 생물학적 기능에 기반한 클러스터를 구성하였다. 네트워크의 가장 자리는 2개의 유전자 세트 사이에 공유되는 GO terms의 수에 대한 Jaccard 인덱스를 의미한다. 노드(유전자 세트) 사이의 거리를 force-directed layout을 사용하여 정의하였다. 네트워크는 충분한 기능적 연관성 (Jaccard 인덱스 > 0.5 및 > 클러스터 별 9 유전자 세트) 을 가지는 906개 유전자 세트를 선별해 표현하였다.Cytoscape (v3.5.1) was used to construct clusters based on the biological function of the gene set with interactive network graphics. The edge of the network refers to the Jaccard index for the number of GO terms shared between two sets of genes. The distance between the nodes (gene set) was defined using force-directed layout. The network was expressed by selecting a set of 906 genes with sufficient functional association (Jaccard index> 0.5 and> 9 gene sets per cluster).

실시예 7. 생존 분석- APA 관련 마커 유전자의 임상적 관련성Example 7. Survival Analysis-Clinical relevance of APA-related marker genes

APA 조절과 유전자 마커의 연관성을 밝히기 위하여, 유방암 환자의 유전자 수준에서 단일 세포 시퀀싱 데이터를 재분석하여, 짧아진 3'UTR을 사용하고 각 세포 유형에 특이적으로 과발현되는 53개의 유전자를 발견하였다(도 5a 참조). 그 결과, 도 5a에 나타난 바와 같이, 유전자 세트 수준의 결과와 일치하여, 대부분의 hit 유전자는 면역 세포 유형에 대한 4개의 중첩 유전자를 제외하고는 세포 유형별로 구분됨을 확인할 수 있었다. 다음으로, 이러한 유전자의 임상적 영향을 확인하기 위해, Kaplan-Meier 생존 분석을 실시하고 TCGA RNA 시퀀싱 데이터를 사용하여 유방암 환자에서 발현 변화와 생존의 연관성을 조사하였다. 종양 샘플을 각 표적 유전자의 발현 신호에 따라 '높음'과 '낮음'(25번째 및 75번째 백분위 수)으로 2개의 그룹으로 분류하였다. 이 분석에서 모든 1,091개의 BRCA 샘플을 사용하여, 53개의 유전자 중 16개가 두 그룹 사이의 차별적인 생존율을 유의하게(p<0.01, 10개의 유전자는 p<0.05를 나타냄) 나타냈다(도 5b, 표 1 참조). 패키지‘OIsurv'에서 Kaplan-Meier 공식을 사용하여 생존 곡선을 그렸다. 암 단계별 샘플 창을 변경함으로써, 초기 단계의 종양에서 총 17개의 유전자 발현 수준이 생존율에 유의하게(p<0.1, 11개의 유전자는 p<0.05를 나타냄) 유전 영향을 미친다는 것을 확인할 수 있었다. 대조적으로, 후기 단계 종양에서 컷오프 p-값이 0.1 또는 0.5인 경우 7개의 유전자 또는 2개의 유전자만이 생존에 영향을 미치는 것을 확인할 수 있었다. 다만, 유방암의 분자 서브타입에 대한 생존율에는 차이가 없었다. 또한, R 패키지 '생존'에서 상대적 위험을 조사하기 위해 다변량 Cox 회귀 분석을 수행하였다. 연령, 인종, 병기, 종양 무게, ER/PR/Her2의 유무, 약물/방사선 요법 표시, 및 각 유전자의 발현 클래스 등과 같은 10개의 요인을 고려하여 회귀 모형을 구성하였다. 조직 샘플에서 Kaplan-Meier 생존 분석의 p 값을 통과한 16개의 유전자 중, 11개 유전자의 발현 수준이 BRCA 환자의 생존에 미치는 독립적인(p<0.1) 요인임을 확인할 수 있었다(표 1).To reveal the association between APA regulation and gene markers, single cell sequencing data was re-analyzed at the gene level in breast cancer patients, using shortened 3'UTRs and finding 53 genes specifically overexpressed in each cell type (Fig. 5a). As a result, as shown in FIG. 5A, in accordance with the result of the gene set level, it was confirmed that most of the hit genes are classified by cell type except for the 4 overlapping genes for the immune cell type. Next, in order to confirm the clinical effect of these genes, Kaplan-Meier survival analysis was performed and TCGA RNA sequencing data was used to investigate the relationship between expression change and survival in breast cancer patients. Tumor samples were divided into two groups, 'high' and 'low' (25th and 75th percentiles) according to the expression signal of each target gene. In this analysis, using all 1,091 BRCA samples, 16 out of 53 genes showed significant survival (p <0.01, 10 genes showed p <0.05) between the two groups (FIG. 5B, Table 1). Reference). In the package 'OIsurv', a survival curve was drawn using the Kaplan-Meier formula. By changing the sample window for each cancer stage, it was confirmed that in the early stage tumor, a total of 17 gene expression levels significantly (p <0.1, 11 genes showed p <0.05) genetic effects on survival. In contrast, in the late stage tumor, when the cutoff p-value was 0.1 or 0.5, it was confirmed that only 7 genes or 2 genes affected survival. However, there was no difference in the survival rate for the molecular subtype of breast cancer. In addition, a multivariate Cox regression analysis was performed to investigate the relative risk in the R package 'survival'. A regression model was constructed considering 10 factors such as age, race, stage, tumor weight, presence of ER / PR / Her2, drug / radiation therapy indication, and expression class of each gene. Of the 16 genes that passed the p value of the Kaplan-Meier survival analysis in the tissue sample, it was confirmed that the expression level of 11 genes was an independent (p <0.1) factor affecting the survival of BRCA patients (Table 1).

유전자gene 세포 유형Cell type Kaplan-Kaplan- MeierMeier (p-값) (p-value) 콕스회귀분석방법Cox regression analysis method (Cox-(Cox-
Regression)Regression)
(p-값)(p-value)
단계step 서브유형Sub type gun
(1,073)(1,073)
초기Early
(792)(792)
후기review
(267)(267)
BasalBasal
(222)(222)
Her2Her2
(90)(90)
LuminalLuminal A A
(329)(329)
LuminalLuminal B B
(432)(432)
gun
(1,073)(1,073)
ALDOAALDOA 종양tumor 0.0710.071 0.2070.207 0.4890.489 0.1410.141 0.4270.427 0.1180.118 0.8910.891 0.0420.042 CHCHD2CHCHD2 종양tumor 0.0220.022 0.1550.155 0.1510.151 0.8610.861 0.2610.261 0.3880.388 0.070.07 0.1420.142 GGCTGGCT 종양tumor 0.0180.018 0.1310.131 0.0770.077 0.4950.495 0.0080.008 0.8120.812 0.0350.035 0.10.1 H3F3AH3F3A 종양tumor 0.8570.857 0.4550.455 0.9620.962 0.3230.323 0.4210.421 0.2850.285 0.1690.169 0.9590.959 HSP90AB1HSP90AB1 종양tumor 0.0340.034 0.0120.012 0.6240.624 0.4650.465 0.8070.807 0.0750.075 0.1040.104 0.0190.019 MYL12BMYL12B 종양tumor 0.4590.459 0.8380.838 0.2240.224 0.8270.827 0.6010.601 0.5980.598 0.720.72 0.640.64 NME1NME1 종양tumor 0.8770.877 0.960.96 0.8650.865 0.7790.779 0.9570.957 0.8140.814 0.7040.704 0.770.77 NR4A1NR4A1 종양tumor 0.2350.235 0.250.25 0.3790.379 0.4140.414 0.1930.193 0.5880.588 0.8620.862 0.730.73 PABPC1PABPC1 종양tumor 0.0930.093 0.1960.196 0.0850.085 0.5130.513 0.8720.872 0.5460.546 0.1470.147 0.0610.061 SETSET 종양tumor 0.0860.086 0.0190.019 0.8470.847 0.8960.896 0.2840.284 0.4120.412 0.2930.293 0.0020.002 SOD1SOD1 종양tumor 0.6040.604 0.5230.523 0.8450.845 0.8320.832 0.5160.516 0.5890.589 0.0980.098 0.8450.845 TSTA3TSTA3 종양tumor 0.1360.136 0.410.41 0.1530.153 0.0160.016 0.6050.605 0.3270.327 0.3270.327 0.1350.135 ZNF706ZNF706 종양tumor 0.0150.015 0.1240.124 0.210.21 0.40.4 0.4780.478 0.8320.832 0.0030.003 0.0350.035 CFL1CFL1 T 세포T cell 0.3890.389 0.7410.741 0.1970.197 0.8960.896 0.1620.162 0.490.49 0.2210.221 0.6970.697 CLIC1CLIC1 T 세포T cell 0.0960.096 0.8420.842 0.04960.0496 0.6560.656 0.0740.074 0.5820.582 0.0730.073 0.3450.345 CTSBCTSB T 세포T cell 0.1130.113 0.2430.243 0.5390.539 0.5660.566 0.9290.929 0.5540.554 0.4830.483 0.0130.013 GABARAPGABARAP T 세포T cell 0.8090.809 0.5590.559 0.2160.216 0.7270.727 0.9250.925 0.4620.462 0.8550.855 0.820.82 HSP90AA1HSP90AA1 T 세포 T cell 0.0010.001 00 0.9170.917 0.7770.777 0.1380.138 0.2760.276 0.0260.026 00 PSMC2PSMC2 T 세포 T cell 0.090.09 0.4770.477 0.1130.113 0.2320.232 0.1170.117 0.0940.094 0.4960.496 0.4180.418 RPL23ARPL23A T 세포 T cell 0.1190.119 0.4770.477 0.1490.149 0.4590.459 0.6740.674 0.3430.343 0.1480.148 0.580.58 SH3BGRL3SH3BGRL3 T 세포 T cell 0.2230.223 0.0430.043 0.050.05 0.6350.635 0.0440.044 0.5880.588 0.9330.933 0.4840.484 TMEM126BTMEM126B T 세포T cell 0.1790.179 0.0830.083 0.6850.685 0.8940.894 0.1670.167 0.5050.505 0.5460.546 0.0360.036 WACWAC T 세포T cell 0.0170.017 0.0270.027 0.8970.897 0.8610.861 0.1520.152 0.0990.099 0.2680.268 0.0030.003 TMEM59TMEM59 스트로마 세포
(Stromal cell)
Stroma cells
(Stromal cell)
0.8850.885 0.7040.704 0.9830.983 0.960.96 0.1950.195 0.0220.022 0.6230.623 0.150.15
TSC22D1TSC22D1 스트로마 세포Stroma cells 0.1770.177 0.1870.187 0.7270.727 0.020.02 0.0940.094 0.6080.608 0.2610.261 0.2010.201 B2MB2M 골수 & T 세포Bone marrow & T cells 0.1640.164 0.1930.193 0.9690.969 0.0740.074 0.6330.633 0.7670.767 0.8230.823 0.4080.408 RHOARHOA 골수 & T 세포Bone marrow & T cells 0.4170.417 0.0220.022 0.1780.178 0.2210.221 0.2430.243 0.1780.178 0.4090.409 0.1180.118 ATP6V0E1ATP6V0E1 골수marrow 0.5620.562 0.1530.153 0.0570.057 0.2060.206 0.6290.629 0.6550.655 0.2570.257 0.170.17 HLA-AHLA-A 골수marrow 0.2520.252 0.0740.074 0.1430.143 0.0230.023 0.2790.279 0.4270.427 0.9460.946 0.1940.194 SEP15SEP15 골수marrow 0.350.35 0.80.8 0.7440.744 0.020.02 0.1860.186 0.9260.926 0.5570.557 0.5750.575 DDX5DDX5 B 세포 &
T 세포
B cells &
T cell
0.6320.632 0.099930.09993 0.2240.224 0.960.96 0.6460.646 0.0290.029 0.8530.853 0.0610.061
LAP3LAP3 B 세포 &
T 세포
B cells &
T cell
0.3440.344 0.8090.809 0.1240.124 0.1540.154 0.780.78 0.6670.667 0.7680.768 0.3750.375
ACTBACTB B 세포B cell 0.5630.563 0.2630.263 0.0040.004 0.7020.702 0.7490.749 0.1420.142 0.1250.125 0.1380.138 ACTG1ACTG1 B 세포B cell 0.520.52 0.4170.417 0.3910.391 0.5840.584 0.5430.543 0.2870.287 0.1660.166 0.8420.842 ARPC2ARPC2 B 세포B cell 0.110.11 0.0590.059 0.5360.536 0.2650.265 0.4230.423 0.5250.525 0.0560.056 0.0310.031 BRK1BRK1 B 세포B cell 0.090.09 0.0820.082 0.5370.537 0.1390.139 0.0130.013 0.4640.464 0.0530.053 0.1120.112 CLK1CLK1 B 세포B cell 0.6870.687 0.2670.267 0.8160.816 0.8690.869 0.3290.329 0.0070.007 0.250.25 0.2310.231 CSNK1A1CSNK1A1 B 세포B cell 0.0060.006 0.0080.008 0.8250.825 0.7160.716 0.0610.061 0.0140.014 0.0370.037 00 EIF2S1EIF2S1 B 세포B cell 0.20.2 0.1310.131 0.8990.899 0.5810.581 0.4990.499 0.6890.689 0.1680.168 0.050.05 EIF4A2EIF4A2 B 세포B cell 0.6750.675 0.120.12 0.3260.326 0.7660.766 0.310.31 0.1770.177 0.6310.631 0.0660.066 FKBP1AFKBP1A B 세포B cell 0.1420.142 0.3440.344 0.0680.068 0.5830.583 0.5190.519 0.660.66 0.0620.062 0.040.04 GPBP1L1GPBP1L1 B 세포B cell 0.6910.691 0.270.27 0.2450.245 0.4710.471 0.3960.396 0.2420.242 0.4590.459 0.2530.253 GSPT1GSPT1 B 세포B cell 0.2320.232 0.0220.022 0.2470.247 0.6650.665 0.230.23 0.2770.277 0.3580.358 0.0070.007 HNRNPA1HNRNPA1 B 세포B cell 0.4010.401 0.7180.718 0.190.19 0.5720.572 0.450.45 0.0920.092 0.3670.367 0.7510.751 HNRNPKHNRNPK B 세포B cell 0.5580.558 0.0770.077 0.1530.153 0.0340.034 0.8810.881 0.2730.273 0.7290.729 0.0560.056 LTV1LTV1 B 세포B cell 0.0250.025 0.0010.001 0.7210.721 0.90.9 0.8240.824 0.0540.054 0.030.03 0.0030.003 MMADHCMMADHC B 세포B cell 0.0490.049 0.0020.002 0.4470.447 0.2490.249 0.2480.248 0.0660.066 0.0920.092 0.0040.004 PFN1PFN1 B 세포B cell 0.5890.589 0.9880.988 0.4340.434 0.9120.912 0.1920.192 0.4880.488 0.0260.026 0.8110.811 SNAP23SNAP23 B 세포B cell 0.9850.985 0.3740.374 0.2090.209 0.5180.518 0.2330.233 0.5040.504 0.6740.674 0.1080.108 SUMO2SUMO2 B 세포B cell 0.8660.866 0.2270.227 0.9370.937 0.020.02 0.4670.467 0.1690.169 0.1980.198 0.3170.317 TAF9TAF9 B 세포B cell 0.5110.511 0.5070.507 0.8570.857 0.7660.766 0.6950.695 0.1920.192 0.5950.595 0.0160.016 UBBUBB B 세포B cell 0.3340.334 0.1520.152 0.3990.399 0.2810.281 0.40.4 0.3370.337 0.1640.164 0.6240.624 YWHAZYWHAZ B 세포B cell 0.0060.006 0.0070.007 0.2630.263 0.7640.764 0.3370.337 0.7380.738 0.2240.224 0.0010.001

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.The above description of the present invention is for illustration only, and a person having ordinary knowledge in the technical field to which the present invention pertains can understand that it can be easily modified into other specific forms without changing the technical spirit or essential features of the present invention. will be. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive.

Claims (15)

환자 유래 세포의 RNA 시퀀싱 데이터를 획득하는 단계;
상기 획득된 RNA 시퀀싱 데이터로부터 개별 유전자의 대체 폴리아데닐화(Alternative polyadenylation, APA)를 추정하는 단계;
개별 유전자의 발현 정도를 나타내는 인덱스를 산출하는 단계; 및
상기 산출된 인덱스 및 대체 폴리아데닐화의 상관관계를 측정하는 단계를 포함하는 바이오마커의 선별 방법.
Obtaining RNA sequencing data of a patient-derived cell;
Estimating alternative polyadenylation (APA) of individual genes from the obtained RNA sequencing data;
Calculating an index indicating the expression level of individual genes; And
A method of screening for a biomarker comprising measuring the correlation between the calculated index and alternative polyadenylation.
청구항 1에 있어서, 분류된 환자 그룹 간의 생존율 차이를 나타내는 통계적 유의 수준을 산출하고, 상기 산출된 통계적 유의 수준에 기초하여 유전자를 선별하는 단계를 추가로 포함하는 방법. The method of claim 1, further comprising calculating a statistical significance level representing a difference in survival rates between the classified patient groups, and selecting a gene based on the calculated statistical significance level. 청구항 1에 있어서, 단일 세포 RNA 시퀀싱 데이터인 방법.The method of claim 1, which is single cell RNA sequencing data. 청구항 3에 있어서, 상기 단일 세포는 종양세포, B 림프구, T 림프구, 골수성 세포 및 기질세포로 구성된 군에서 선택된 것인 방법.The method according to claim 3, wherein the single cell is selected from the group consisting of tumor cells, B lymphocytes, T lymphocytes, myeloid cells and stromal cells. 청구항 1에 있어서, 상기 데이터는 RNA 전장 전사체(full-length transcript)인 방법.The method of claim 1, wherein the data is an RNA full-length transcript. 청구항 1에 있어서, 상기 대체 폴리아데닐화는 DaPars 또는 Roar를 사용하여 추정하는 것인 방법.The method of claim 1, wherein the replacement polyadenylation is estimated using DaPars or Roar. 청구항 1에 있어서, 상기 대체 폴리아데닐화는 개별 유전자의 3'UTR의 길이 변화에 의해 추정되는 것인 방법. The method of claim 1, wherein the replacement polyadenylation is estimated by a change in the length of 3′UTR of an individual gene. 청구항 1에 있어서, 상기 세포는 유방암, 교모세포종, 신 세포 암종, 선암, 점액암, 인환세포함, 편평상피암, 선편평상피암, 소세포암, 융모암 및 미분화암으로 구성된 군에서 선택된 것인 방법.The method according to claim 1, wherein the cell is selected from the group consisting of breast cancer, glioblastoma, renal cell carcinoma, adenocarcinoma, mucous cancer, leukocytosis, squamous cell carcinoma, squamous cell carcinoma, small cell carcinoma, chorionic cancer, and undifferentiated cancer. 청구항 1에 있어서, 세포 유형에 따라 대체 폴리아데닐화가 조절되는 것인 방법.The method of claim 1, wherein alternative polyadenylation is regulated according to cell type. 청구항 9에 있어서, 상기 세포는 종양세포, B 림프구, T 림프구, 골수성 세포 및 기질세포로 구성된 군에서 선택된 것인 방법.The method of claim 9, wherein the cell is selected from the group consisting of tumor cells, B lymphocytes, T lymphocytes, myeloid cells and stromal cells. 청구항 1에 있어서, 종양 특이성을 가지는 것인 방법.The method of claim 1 having tumor specificity. 청구항 1에 의해 선별된 바이오마커 패널.Biomarker panel selected by claim 1. 환자 유래 세포의 RNA 시퀀싱 데이터를 획득하는 단계;
상기 획득된 RNA 시퀀싱 데이터로부터 개별 유전자의 대체 폴리아데닐화(Alternative polyadenylation, APA)를 추정하는 단계;
개별 유전자의 발현 정도를 나타내는 인덱스를 산출하는 단계; 및
상기 산출된 인덱스 및 대체 폴리아데닐화의 상관관계를 측정하는 단계를 포함하는 암의 진단을 위한 정보 제공방법.
Obtaining RNA sequencing data of a patient-derived cell;
Estimating alternative polyadenylation (APA) of individual genes from the obtained RNA sequencing data;
Calculating an index indicating the expression level of individual genes; And
Method for providing information for diagnosis of cancer, comprising the step of measuring the correlation between the calculated index and alternative polyadenylation.
청구항 13에 있어서, 개체의 개별 유전자의 발현 수준 및 대체 폴리아데닐화가 대조군에 비해 증가하면 암으로 판단하는 단계를 추가로 포함하는 것인 방법. The method of claim 13, further comprising the step of judging cancer if the expression level of the individual gene of the individual and the replacement polyadenylation increase compared to the control group. 청구항 13에 있어서, 초기 암을 진단하기 위한 것인 방법. The method of claim 13 for diagnosing early cancer.
KR1020180118137A 2018-10-04 2018-10-04 Method for selecting biomarker and method for providing information for diagnosis of cancer using thereof KR102170726B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180118137A KR102170726B1 (en) 2018-10-04 2018-10-04 Method for selecting biomarker and method for providing information for diagnosis of cancer using thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180118137A KR102170726B1 (en) 2018-10-04 2018-10-04 Method for selecting biomarker and method for providing information for diagnosis of cancer using thereof

Publications (2)

Publication Number Publication Date
KR20200038660A true KR20200038660A (en) 2020-04-14
KR102170726B1 KR102170726B1 (en) 2020-10-27

Family

ID=70291576

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180118137A KR102170726B1 (en) 2018-10-04 2018-10-04 Method for selecting biomarker and method for providing information for diagnosis of cancer using thereof

Country Status (1)

Country Link
KR (1) KR102170726B1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111739586A (en) * 2020-06-17 2020-10-02 浙江大学 Model for predicting cell proliferation activity by using 87 genes as biomarkers
CN113724782A (en) * 2021-08-19 2021-11-30 西安交通大学 Disease prognosis marker screening method based on variable polyadenylation site
CN115798723A (en) * 2023-01-18 2023-03-14 北京泽桥医疗科技股份有限公司 Construction method of cancer recurrence risk prediction model
CN116758994A (en) * 2023-07-03 2023-09-15 杭州联川生物技术股份有限公司 Gene sets, methods, media and apparatus for distinguishing tumor cells from non-tumor cells
WO2023191503A1 (en) * 2022-03-29 2023-10-05 주식회사 포트래이 Method for recommending candidate target of cell cluster in cancer microenvironment through single-cell transcriptome analysis, and apparatus and program therefor

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040064275A (en) * 2001-11-09 2004-07-16 소스 프리시전 메디슨, 인코포레이티드 Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
JP2015503923A (en) * 2012-01-09 2015-02-05 オスロ ウニヴェルスィテーツスィーケフース ハーエフOslo Universitetssykehus Hf Methods and biomarkers for the analysis of colorectal cancer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040064275A (en) * 2001-11-09 2004-07-16 소스 프리시전 메디슨, 인코포레이티드 Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
JP2015503923A (en) * 2012-01-09 2015-02-05 オスロ ウニヴェルスィテーツスィーケフース ハーエフOslo Universitetssykehus Hf Methods and biomarkers for the analysis of colorectal cancer

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111739586A (en) * 2020-06-17 2020-10-02 浙江大学 Model for predicting cell proliferation activity by using 87 genes as biomarkers
CN111739586B (en) * 2020-06-17 2024-04-05 浙江大学 Model for predicting cell proliferation activity by using 87 genes as biomarkers
CN113724782A (en) * 2021-08-19 2021-11-30 西安交通大学 Disease prognosis marker screening method based on variable polyadenylation site
CN113724782B (en) * 2021-08-19 2024-04-02 西安交通大学 Disease prognosis marker screening method based on variable polyadenylation site
WO2023191503A1 (en) * 2022-03-29 2023-10-05 주식회사 포트래이 Method for recommending candidate target of cell cluster in cancer microenvironment through single-cell transcriptome analysis, and apparatus and program therefor
CN115798723A (en) * 2023-01-18 2023-03-14 北京泽桥医疗科技股份有限公司 Construction method of cancer recurrence risk prediction model
CN115798723B (en) * 2023-01-18 2023-09-15 北京泽桥医疗科技股份有限公司 Construction method of cancer recurrence risk prediction model
CN116758994A (en) * 2023-07-03 2023-09-15 杭州联川生物技术股份有限公司 Gene sets, methods, media and apparatus for distinguishing tumor cells from non-tumor cells
CN116758994B (en) * 2023-07-03 2024-02-27 杭州联川生物技术股份有限公司 Gene sets, methods, media and apparatus for distinguishing tumor cells from non-tumor cells

Also Published As

Publication number Publication date
KR102170726B1 (en) 2020-10-27

Similar Documents

Publication Publication Date Title
KR102170726B1 (en) Method for selecting biomarker and method for providing information for diagnosis of cancer using thereof
Liu et al. Comprehensive transcriptome profiling reveals multigene signatures in triple-negative breast cancer
Manne et al. Keynote review: Recent advances in biomarkers for cancer diagnosis and treatment
Davicioni et al. Gene expression profiling for survival prediction in pediatric rhabdomyosarcomas: a report from the children's oncology group
JP2011515666A (en) DNA repair protein associated with triple negative breast cancer and use thereof
CN105986034A (en) Application of group of gastric cancer genes
Fan et al. Comprehensive analysis of novel three‐long noncoding RNA signatures as a diagnostic and prognostic biomarkers of human triple‐negative breast cancer
US20230193358A1 (en) Compositions and methods for determining endometrial cancer prognosis
Song et al. Prognostic and predictive value of an immune infiltration signature in diffuse lower-grade gliomas
EP2780476B1 (en) Methods for diagnosis and/or prognosis of gynecological cancer
US20230340608A1 (en) Prognostic biomarkers for cancer
CN114300139A (en) Construction of breast cancer prognosis model, application method and storage medium thereof
Maimaiti et al. Identification and validation of a novel eight mutant-derived long non-coding RNAs signature as a prognostic biomarker for genome instability in low-grade glioma
Guo et al. Identification of potential prognostic TF‐associated lncRNAs for predicting survival in ovarian cancer
WO2020091316A1 (en) Biomarker panel for determining molecular subtype of lung cancer, and use thereof
Zhou et al. Development and validation of an individualized immune-related gene pairs prognostic signature in papillary renal cell carcinoma
Kim et al. Single-cell RNA sequencing for the identification of early-stage lung cancer biomarkers from circulating blood
Chen et al. Molecular subtyping of breast cancer intrinsic taxonomy with oligonucleotide microarray and NanoString nCounter
Jia et al. Identification of a four-Gene-Based SERM signature for prognostic and drug sensitivity prediction in gastric cancer
McCafferty et al. Breast cancer subtypes and molecular biomarkers
Gao et al. Transcriptome profiling reveals an integrated mRNA–lncRNA signature with predictive value for long-term survival in diffuse large B-cell lymphoma
Dong et al. Prognostic model development and molecular subtypes identification in bladder urothelial cancer by oxidative stress signatures
KR100835296B1 (en) Methods of Selecting Gene Set Predicting Cancer Phenotype
KR20200037640A (en) Biomarker panel for diagnosis of breast cancer and method for providing information diagnosis of breast cancer using thereof
Chang et al. LINC00963 May Be Associated with a Poor Prognosis in Patients with Cervical Cancer

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant