KR101987477B1 - 바이오마커 발굴 방법 - Google Patents

바이오마커 발굴 방법 Download PDF

Info

Publication number
KR101987477B1
KR101987477B1 KR1020120048110A KR20120048110A KR101987477B1 KR 101987477 B1 KR101987477 B1 KR 101987477B1 KR 1020120048110 A KR1020120048110 A KR 1020120048110A KR 20120048110 A KR20120048110 A KR 20120048110A KR 101987477 B1 KR101987477 B1 KR 101987477B1
Authority
KR
South Korea
Prior art keywords
mirna
protein
gene
cnv
factor
Prior art date
Application number
KR1020120048110A
Other languages
English (en)
Other versions
KR20130124745A (ko
Inventor
최형석
어해석
허지연
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020120048110A priority Critical patent/KR101987477B1/ko
Priority to US13/653,849 priority patent/US20130296193A1/en
Priority to PCT/KR2012/008534 priority patent/WO2013168859A1/en
Publication of KR20130124745A publication Critical patent/KR20130124745A/ko
Application granted granted Critical
Publication of KR101987477B1 publication Critical patent/KR101987477B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/30Microarray design
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Abstract

본 발명은 바이오마커 발굴 방법에 대한 것으로, 특히 특정 질환을 가진 다수의 환자를 포함하는 사람의 유전인자(gene-factor) 발현 수준을 사람별로 매칭(matching)하고, 상기 유전인자와 그에 따른 유전자(gene)의 발현 수준을 군집분석(cluster analysis) 및 상관분석(correlation analysis) 중 어느 하나의 분석에 의하여 비교함으로써, 상기 유전인자 중 일부를 선택하는 것을 포함한다. 이러한 본 발명에 의하면 특정 질환에 높은 정확도를 가지는 바이오 마커를 간단하고 용이하게 발굴할 수 있다.

Description

바이오마커 발굴 방법{Method for discovering a biomarker}
본 발명은 바이오마커를 발굴하는 방법에 대한 것으로, 특히 유전인자(gene-factor)와 그에 따른 유전자(gene)의 발현 수준을 군집분석(cluster analysis) 및 상관분석(correlation analysis) 중 어느 하나 이상의 분석에 의하여 비교함으로써, 특정 질환에 높은 정확도를 가지는 바이오 마커를 간단하고 용이하게 발굴하기 위한 것이다.
유방암은 임상적 거동 및 요법에 대한 반응과 관련하여 이질적인 질환이다. 이러한 가변성은 유방암의 각각의 아형 내 암 세포의 다양한 분자 구성의 결과이다. 그러나, 단지 2개의 분자적 특징만이 현재 치료 표적으로서 이용되고 있다. 이들은 각각 항에스트로겐 (타목시펜 및 아로마타제 억제제) 및 헤르셉틴(HERCEPTIN,등록상표) (트라스투주맙)의 표적인 에스트로겐 수용체 및 HER2이다. 이들 두 분자를 표적화하기 위한 노력은 매우 생산적인 것으로 입증된 바 있다. 그럼에도 불구하고, 상기 2가지 표적을 갖지 않는 종양은 일반적으로 증식성 세포를 표적화한 화학요법으로 종종 치료된다. 일부 중요한 정상세포도 또한 증식성이기 때문에, 화학요법에 의해서 이들도 동시에 손상된다. 따라서, 화학요법은 심각한 독성과 연관된다. ER 또는 HER2 이외의 종양에서의 분자 표적의 확인이 새로운 항암요법의 개발에 있어서 중요하다.
이와 같이, 암의 발생과 진행은 몇몇 특정 유전자들에 의해 이루어지는 것이 아니라 암의 악성화가 진행되면서 발생하는 세포내 다양한 신호전달과 조절기작에 관여하는 많은 유전자들의 복합적인 상호작용에 의한 것임을 알 수 있다. 따라서 몇몇 특정한 유전자들에 중점을 두고 암의 형성 기작을 연구하는 것은 매우 국한된 연구에 지나지 않기 때문에 정상 세포와 암 세포주들 사이의 다량의 유전자 발현정도를 비교 분석하여 암에 관련된 새로운 유전자들을 발굴할 필요가 있다.
본 발명은 상기한 문제점을 해결하기 위한 것으로, 특정 질환에 높은 정확도를 가지는 바이오 마커를 간단하고 용이하게 발굴하는 것이 목적이다.
상기한 목적을 달성하기 위한 본 발명에 따른 바이오마커 발굴 방법은, 특정 질환을 가진 다수의 환자를 포함하는 사람의 유전인자(gene-factor) 발현 수준을 사람별로 매칭(matching)하는 단계; 상기 유전인자와 그에 따른 유전자(gene)의 발현 수준을 군집분석(cluster analysis) 및 상관분석(correlation analysis) 중 어느 하나 이상의 분석에 의하여 비교함으로써, 상기 유전인자 중 일부를 선택하는 단계;를 포함하는 것이 특징이다.
여기서, 상기 유전인자는 염색체 상의 유전자(gene), 단일염기다형성(SNP), 복제수변이(CNV) 및 마이크로RNA(miRNA)로 이루어진 군에서 선택된 하나 이상인 것이 바람직하다.
본 발명의 다른 형태는, 특정 질환을 가진 다수의 환자의 염색체 상의 유전자(gene) 발현 수준을 환자별로 매칭하고, 상기 유전자 중 특정 질환과 관련된 유전자에 대한 정보만을 선발하는 단계; 상기 유전자 별로 환자의 질환 타입별 발현 패턴을 분석하는 단계; 및 상기 발현 패턴에 따라 유전자를 군집화(clustering)하는 단계;를 포함하는 것을 특징으로 하는 서브타이핑(sub-typing) 바이오마커 발굴 방법이다.
여기서, 상기 유전자 중 특정 질환과 관련된 유전자에 대한 정보만을 선발하는 것은, 상기 유전자 중 특정 질환과 관련된 것으로 알려진 공지된 유전자에 대한 정보만을 선발하는 것이 가능하다.
그리고, 상기 유전자 별로 환자의 질환 타입별 발현 패턴을 분석하는 것은, 상기 유전자 별로 환자의 질환 타입에 따른 발현 패턴을 2등급 이상으로 구분하는 것일 수 있다.
또한, 상기 발현 패턴에 따라 유전자를 군집화하는 단계는, 상기 발현 패턴에 따라 군집화 가능한 유전자만을 선발하고, 선발한 유전자를 특정 질환의 서브 타이핑과 관련된 마커로 선정하는 단계를 포함하는 것이 바람직하다.
본 발명의 또 다른 형태는, 특정 질환을 가진 다수의 환자의 염색체 상의 단일염기다형성(SNP)과 유전자 각각의 발현 수준을 환자별로 매칭하는 단계; 상기 SNP 발현 수준이 소정의 기준값 이상이거나 이하인 복제수변이(CNV) 영역을 선정하고, 상기 CNV 영역의 염색체 상의 위치가 유효한 유전자 상에 존재하는 CNV를 선발하는 단계; 및 상기 선발한 CNV와 그에 대응하는 상기 환자의 염색체 상의 유전자 발현 수준을 상관분석하여, 양(+)의 상관관계가 있는 유전자를 선택하는 단계;를 포함하는 것을 특징으로 하는 복제수 변이(Copy Number Variation, CNV)에 의한 바이오마커 발굴 방법이다.
여기서, 상기 유효한 유전자는 유전정보를 담고 있는 서열인 것이 바람직하다.
그리고, 상기 CNV를 선발하는 것은, 상기 SNP 발현 수준이 소정의 제1기준값 이상이거나 소정의 제2기준값 이하인 CNV 영역을 선정하고, 상기 CNV의 염색체 상의 위치가 유전정보를 담고 있는 서열 상에 존재하는 CNV를 선발하는 것이 더욱 바람직하다.
본 발명의 또 다른 형태는, 특정 질환을 가진 다수의 환자를 포함하는 사람의 마이크로RNA(miRNA)와 유전자 각각의 발현 수준을 사람별로 매칭하는 단계; 및 상기 miRNA와 그에 상응하는 유전자의 발현 수준을 상관분석하여, 음(-) 또는 양(+)의 상관관계가 있는 유전자를 선발하고, 상기 선발한 유전자 중 특정 질환과 관련된 miRNA에 상응하는 유전자를 선택하는 단계;를 포함하는 것을 특징으로 하는 마이크로RNA(miRNA)에 의한 바이오마커 발굴 방법이다.
여기서, 상기 특정 질환과 관련된 miRNA는, 상기 특정 질환과 관련된 것으로 알려진 공지된 miRNA일 수 있다.
본 발명의 또 다른 형태는, 질환의 바이오마커로 사용하기에 적합한 후보 유전자군에 속한 유전자를 특정 질환의 작동 메커니즘(mechanism)과 관련된 그룹으로 구분하는 단계; 및 상기 질환을 가진 다수의 환자군과 정상인군을 대상으로, 상기 구분한 그룹 내의 유전자 발현 수준을 비교하여, 환자군에서 더 높게 발현되는 유전자를 선택하는 단계;를 포함하는 메커니즘 분석에 의한 바이오마커 발굴 방법이다.
여기서, 상기 후보 유전자군은 상술한 바이오마커 발굴 방법에 의해 얻어진 유전자를 포함하는 것이 바람직하다.
그리고, 상기 후보 유전자군은 상술한 서브타이핑(sub-typing) 바이오마커 발굴 방법에 의해 얻어진 유전자와, 복제수 변이(Copy Number Variation, CNV)에 의한 바이오마커 발굴 방법에 의해 얻어진 유전자와, 마이크로RNA(miRNA)에 의한 바이오마커 발굴 방법에 의해 얻어진 유전자를 포함하는 것이 더욱 바람직하다.
또한, 상기 후보 유전자군에 속한 유전자를 특정 질환의 작동 메커니즘과 관련된 그룹으로 구분하는 것은, 다수의 질환 작동 메커니즘 중, 특정 질환을 가진 다수의 환자군과 정상인군 간의 유전자 발현 수준을 비교하여, 환자군에서 더 높게 발현되는 유전자를 포함하는 질환 작동 메커니즘을 특정 질환의 작동 메커니즘과 관련된 그룹으로 선발하는 것이 가능하다.
또한, 상기 질환을 가진 다수의 환자군과 정상인군을 대상으로, 환자군에서 더 높게 발현되는 유전자를 선택하는 것은, 상기 질환을 가진 다수의 환자군과 정상인군을 대상으로, T-test 에 의하여, 환자군에서 더 높게 발현되는 유전자를 선택하는 것일 수 있다.
또한, 상기 구분한 그룹 내의 유전자 발현 수준을 비교하여, 환자군에서 더 높게 발현되는 유전자를 선택하는 것은, 상기 구분한 그룹 내의 유전자 발현 수준이 높은 유전자에 대하여 우선적으로 T-test 를 실시하여 환자군에서 더 높게 발현되는 유전자를 선택하는 것이 바람직하다.
한편, 본 발명의 다른 실시형태는, 표 1에 기재된 유전자를 포함하는 유방암 관련 바이오마커이다.
그리고, 본 발명은 표 1에 기재된 유전자를 포함하여 유방암의 서브타입(sub-type) 판별이 가능한 바이오마커일 수 있다.
또한, 본 발명은 표 1에 기재된 유전자에 대응하는 프로브를 포함하는 마이크로 어레이; 및 상기 유전자의 발현 변화를 측정하는 광학측정 장치;를 포함하는 유방암 검사 키트인 것도 가능하다.
기타 실시예들의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
이러한 본 발명은 유전인자(gene-factor)와 그에 따른 유전자(gene)의 발현 수준을 군집분석(cluster analysis) 및 상관분석(correlation analysis) 중 어느 하나 이상의 분석에 의하여 비교함으로써, 특정 질환에 높은 정확도를 가지는 바이오 마커를 간단하고 용이하게 발굴할 수 있는 효과가 있다.
도 1은 본 발명의 바람직한 일 실시예에 따른 서브타이핑(sub-typing) 바이오마커 발굴 방법에 사용되는 환자별 유전자 발현 수준을 나타내는 매칭표의 일례이고,
도 2는 도 1의 유전자별로 환자의 질환 타입별 발현 패턴의 일례이고,
도 3은 도 2의 발현 패턴에 따라 유전자를 군집화한 일례를 나타내는 표이고,
도 4는 본 발명의 바람직한 일 실시예에 따른 복제수 변이(Copy Number Variation, CNV)에 의한 바이오마커 발굴 방법에 사용되는 환자별 단일염기다형성(SNP) 발현 수준을 나타내는 매칭표의 일례이고,
도 5는 도 4의 SNP 별 발현 수준으로부터 선별된 CNV 영역과 유효한 유전자를 포함하는 CNV 영역을 염색체 상에 나타낸 것의 일례이고,
도 6은 도 4의 CNV와 그에 대응하는 유전자 발현 수준의 상관분석 일례를 나타내는 그래프이고,
도 7은 본 발명의 바람직한 일 실시예에 따른 마이크로RNA(miRNA)에 의한 바이오마커 발굴 방법에 사용되는 환자별 miRNA 발현 수준을 나타내는 매칭표의 일례이고,
도 8은 도 7의 miRNA와 그에 대응하는 유전자 발현 수준의 상관분석 일례를 나타내는 그래프이고,
도 9는 본 발명의 바람직한 일 실시예에 따른 메커니즘 분석에 의한 바이오마커 발굴 방법에 사용되는 메커니즘 분석을 설명하기 위한 메커니즘별 유전자의 일례이고,
도 10은 도 9의 메커니즘I과 그에 속하는 유전자의 발현 수준 일례를 나타내는 그래프이고,
도 11은 도 9의 메커니즘II과 그에 속하는 유전자의 발현 수준 일례를 나타내는 그래프이고,
도 12는 도 9의 메커니즘III과 그에 속하는 유전자의 발현 수준 일례를 나타내는 그래프이고,
도 13은 본 발명의 바람직한 일 실시예에 따른 바이오마커 발굴 방법에 의해 발굴된 바이오마커의 유의수준별 정확도의 일례를 나타내는 그래프이고,
도 14는 본 발명의 바람직한 일 실시예에 따른 바이오마커 발굴 방법에 의해 발굴된 바이오마커를 이용하여 유방암의 서브타입을 확인한 광학 사진이고,
도 15는 본 발명의 바람직한 일 실시예에 따른 바이오마커를 타사의 바이오마커 구성과 비교한 다이어그램이다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시 예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 상세한 설명에서 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
본 발명에 따른 바이오마커 발굴 방법은 특정 질환을 가진 다수의 환자를 포함하는 사람의 유전인자 발현 수준을 사람별로 매칭(matching)하는 단계;를 거치고, 이어서 상기 유전인자와 그에 따른 유전자(gene)의 발현 수준을 군집분석(cluster analysis) 및 상관분석(correlation analysis) 중 어느 하나 이상의 분석에 의하여 비교함으로써, 상기 유전인자 중 일부를 선택하는 단계;를 포함한다.
본 발명은 환자 또는 이를 포함하는 사람의 유전인자(gene-factor) 발현 수준을 바탕으로 특정 질환을 검사하기에 적합한 바이오마커를 발굴하는 방법에 대한 것이다. 상기 유전인자는 사람마다 상이한 염색체 상의 유전자(gene), 단일염기다형성(SNP), 복제수 변이(CNV) 및 마이크로RNA(miRNA)로 이루어진 군에서 선택된 하나 이상의 것일 수 있다. 즉, 본 발명은 환자 또는 사람의 유전자를 이용하거나 CNV를 이용하거나 특정 질환관 관련된 miRNA를 이용하거나 이것들 중 2개 이상을 이용하여 정확성이 높은 바이오마커들을 발굴하는 방법에 대한 것이다.
이를 위하여, 본 발명에 따른 바이오마커 발굴 방법은 먼저 특정 질환을 가진 다수의 환자를 포함하는 사람의 유전인자 발현 수준을 사람별로 매칭(matching)하는 단계;를 거친다. 예를 들어, 다수의 환자 또는 사람별로 유전자 및 그것의 발현 수준을 DB화하는 것일 수 있다(도 1 참조). 또한, 다수의 환자 또는 사람의 CNV 및 그것의 발현 수준을 매칭시키거나(도 4 왼쪽 그림 참조), miRNA 및 그것의 발현 수준을 매칭시키는 것(도 7 왼쪽 그림 참조)도 가능하다.
그런 다음, 본 발명은 상기 유전인자와 그에 따른 유전자(gene)의 발현 수준을 군집분석(cluster analysis) 및 상관분석(correlation analysis) 중 어느 하나 이상의 분석에 의하여 비교함으로써, 상기 유전인자 중 일부를 선택하는 단계;를 거친다. 이에 대해서는 이하에서 더욱 상세하게 설명한다.
이하에서는 질환 중 유방암을 예로 들어 설명하지만, 본 발명은 특별히 여기에 제한되지 않고, 모든 질환에 적용가능함은 이 기술분야에서 보통의 지식을 가진자에게 명백하다.
도 1은 본 발명의 바람직한 일 실시예에 따른 서브타이핑(sub-typing) 바이오마커 발굴 방법에 사용되는 환자별 유전자 발현 수준을 나타내는 매칭표의 일례이고, 도 2는 도 1의 유전자별로 환자의 질환 타입별 발현 패턴의 일례이며, 도 3은 도 2의 발현 패턴에 따라 유전자를 군집화한 일례를 나타내는 표이다.
본 발명에 따른 서브타이핑(sub-typing) 바이오마커 발굴 방법은, 특정 질환을 가진 다수의 환자의 염색체 상의 유전자(gene) 발현 수준을 환자별로 매칭하고, 상기 유전자 중 특정 질환과 관련된 유전자에 대한 정보만을 선발하는 단계; 상기 유전자 별로 환자의 질환 타입별 발현 패턴을 분석하는 단계; 및 상기 발현 패턴에 따라 유전자를 군집화(clustering)하는 단계;를 포함한다.
이러한 본 발명은 유전인자로써 환자의 유전자를 이용하고, 그것의 발현 수준에 따른 유전자 발현(gene expression, GE) 분석을 통하여 바이오마커를 발굴하는 방법이다. 이러한 본 발명은 특정 질환의 서브타입(sub-type)까지 확인할 수 있는 바이오마커를 발굴할 수 있게 한다.
본 발명에 따른 서브타이핑 바이오마커 발굴 방법은 먼저 도 1에 나타난 바와 같이, 특정 질환을 가진 다수의 환자의 염색체 상의 유전자(gene) 발현 수준을 환자별로 매칭하는 단계를 거친다. 즉, 환자의 전체 또는 일부 유전자 각각의 발현 수준을 환자별로 맵핑(mapping)하는 것이다. 여기서, 환자는 질환의 유형별로 구분되어 있으면 족하고, 환자의 순서는 상관이 없다. 이러한 환자의 유전자에는 특정 질환과 관련이 없는 유전자도 포함되어 있기 때문에, 그런 다음에는 상기 유전자 중 특정 질환과 관련된 유전자에 대한 정보만을 선발하는 단계;를 거칠 수 있다. 예를 들어, 각 환자의 유전자가 대략 30,000개인 경우 유방암과 관련된 유전자에 대한 정보만을 추출하는 것이다. 이와 같이, 특정 질환과 관련된 유전자에 대한 정보만을 선발하는 것은, 상기 특정 질환과 관련된 것으로 알려진 공지된 유전자에 대한 정보를 이용하여 비교 선발할 수 있다. 본 발명자들은 유방암과 관련된 환자, 논문, 특허, 학술정보 등 327개의 정보를 통하여 유방암과 관련된 866개의 유전자를 선별하였다. 여기서, 상기 유전자 발현 수준을 환자별로 매칭하는 것과, 상기 유전자 중 특정 질환과 관련된 유전자에 대한 정보만을 선발하는 것은, 순서에 상관없이 이루어질 수 있고, 동시에 수행되는 것도 가능하다.
이어서, 본 발명에 따른 서브타이핑 바이오마커 발굴 방법은 도 2에 나타난 바와 같이 상기 유전자 별로 환자의 질환 타입별 발현 패턴을 분석하는 단계;를 거친다. 즉, 특정 유전자가 환자의 질환 타입에 따라 발현되는 양상을 분석하는 것이고, 이러한 분석은 유전자 별로 환자의 질환 타입에 따른 발현 패턴을 2등급 이상으로 구분하는 것이 가능하다. 예를 들어, 도 2에 나타난 바와 같이 유전자별로 질환 타입에 따라 발현되는 양상을 높음(high) 이나 낮음(low)으로 구분하여 패턴화할 수 있다. 본 발명은 유전자 각각의 발현 정도를 분석하는 것이 아니라, 상기와 같이 패턴화하는 것을 특징으로 하여, 후술하는 바와 같이 그 발현 패턴에 따라 유전자를 군집화할 수 있다.
즉, 본 발명에 따른 서브타이핑 바이오마커 발굴 방법은 계속해서 도 3에 나타난 바와 같이 상기 발현 패턴에 따라 유전자를 군집화(clustering)하는 단계;를 포함한다. 질환의 타입에 따라 동일한 발현 패턴을 보이는 유전자를 그룹핑(grouping) 하는 것이다. 여기서, 상기 발현 패턴에 따라 유전자를 군집화하는 것은, 상기 발현 패턴이 유사한 유전자만을 선발해서 군집화하고, 발현 패턴이 상이하여 군집화할 수 없는 것은 제외하는 것이 바람직하다. 실제로, 본 발명자들은 유방암과 관련하여 선별된 상기 866개의 유전자를 발현 패턴에 따라 구분하여 4가지로 구분하였고, 그렇게 군집화된 유전자는 646개였다. 이와 같이, 본 발명은 군집화된 유전자를 특정 질환의 서브 타이핑과 관련된 마커로 선정하는 것이 특징이고, 상기 선정된 유전자를 바이오마커로 이용해서, 이것과 목적하는 환자의 유전자 발현 패턴을 비교하면 상기 환자의 질환을 예측할 수 있는 것이다.
도 4는 본 발명의 바람직한 일 실시예에 따른 복제수 변이(Copy Number Variation, CNV)에 의한 바이오마커 발굴 방법에 사용되는 환자별 단일염기다형성(SNP) 발현 수준을 나타내는 매칭표의 일례이고, 도 5는 도 4의 SNP 별 발현 수준을 통해 얻어낸 CNV 영역과 유효한 유전자를 포함하는 염색체 상에 나타낸 것의 일례이며, 도 6은 도 4의 CNV와 그에 대응하는 유전자 발현 수준의 상관분석 일례를 나타내는 그래프이다.
본 발명에 따른 복제수 변이(CNV)에 의한 바이오마커 발굴 방법은, 특정 질환을 가진 다수의 환자의 염색체 상의 단일염기다형성(SNP)과 유전자 각각의 발현 수준을 환자별로 매칭하는 단계; 상기 SNP 발현 수준이 소정의 기준값 이상이거나 이하인 CNV를 선별하고, 상기 CNV 영역의 염색체 상의 위치가 유효한 유전자 상에 존재하는 CNV를 선발하는 단계; 및 상기 선발한 CNV와 그에 대응하는 상기 환자의 염색체 상의 유전자 발현 수준을 상관분석하여, 양(+)의 상관관계가 있는 유전자를 선택하는 단계;를 포함한다.
이러한 본 발명은 유전인자로써 환자의 SNP 및/또는 CNV 를 이용하고, 그것의 발현 수준에 따른 복제수 변이(CNV) 분석을 통하여 바이오마커를 발굴하는 방법이다. 이러한 본 발명은 특정 질환과 관련된 SNP가 존재하고, 상기 SNP에 따른 CNV를 포함하는 특정 유전자의 발현 수준이 상기 특정 질환에 정비례한다는 상관관계를 바탕으로 한다.
본 발명에 따른 복제수 변이(CNV)에 의한 바이오마커 발굴 방법은 먼저 도 4에 나타난 바와 같이, 특정 질환을 가진 다수의 환자의 염색체 상의 SNP 발현 수준을 환자별로 매칭하는 단계를 거친다. 여기서, 상기 SNP로부터 선별된 CNV는 환자 전체의 CNV일 수 있고, 그 중에서 특정 질환과 관련된 CNV일 수도 있다. 이러한 CNV 중에는 특정 질환과 관련이 없는 것도 포함되어 있을 수 있다. 그래서, 이러한 CNV 중에서 질환 분석 또는 평가에 적합하게 사용될 수 있는 바이오마커로써의 CNV를 선발하는 과정이 필요하다.
이를 위하여, 본 발명은 도 5에 나타난 바와 같이 상기 SNP 발현 수준이 소정의 기준값 이상이거나 이하인 CNV 영역을 선정하고, 상기 CNV의 염색체 상의 위치가 유효한 유전자 상에 존재하는 CNV를 선발하는 단계;를 거친다. 즉, 본 발명에 따른 상기 CNV는 특정 질환을 가진 환자를 대상으로 하는 것이므로, 이것의 발현 수준에 따라 질환 관련 CNV를 선정하는 것이고, 이러한 CNV 중에서도 특별히 유전자 발현에 영향을 미치는 CNV를 선정하기 위하여, CNV의 위치에 따라 유효한 유전정보를 담고 있는 서열 상에 존재하는 CNV를 선발하는 것이다. 여기서, 상기 CNV를 선발하는 것은, SNP와 그에 따른 유전자 발현 수준의 상관성에 따라, 상기 SNP 발현 수준이 소정의 제1기준값 이상(또는 초과)이거나, 또는/및 소정의 제2기준값 이하(또는 미만)인 것을 선택하여 CNV를 선발하는 것이 바람직하다. 예를 들어, 도 5에 나타난 바와 같이, 염색체1(chr 1) 상에 존재하는 SNP 마다 그것의 발현 수준이 다르게 나타날 수 있고, 그 중에서 소정의 기준값 이상이거나 이하인 SNP의 존재 위치에 따라 유효한 유전정보를 담고 있는 서열 상에 존재하는 CNV를 선발할 수 있다.
그런 다음에는, 상기 선발한 CNV 영역과 그에 대응하는 상기 환자의 염색체 상의 유전자 발현 수준(도 4의 오른쪽 그림 참조)을 상관분석하고, 도 6에 나타난 바와 같이, 양(+)의 상관관계가 있는 유전자를 선택하는 단계;를 거친다. 이를 위하여, 본 발명은 환자의 염색체 상의 유전자 발현 수준 정보를 더 포함하고, 이러한 정보는 CNV와는 상관있는 환자의 유전자에 따른 발현 수준 정보이며, 상술한 서브타이핑 바이오마커 발굴 방법에서 사용한 염색체 상의 유전자(gene) 발현 수준 정보와 동일한 것(도 1 참조)일 수 있다. 이러한 상관분석은 상기 선발된 CNV 중에서 실제로 유전자 발현과 관련 있는 것만을 추출하기 위한 것이다. 즉, SNP의 발현으로부터 구한 CNV 수준이 높아질수록 그와 관련된 유전자(상기 CNV가 위치하는 유전자)의 발현 수준이 높다는 것은, 상기 CNV 및 그와 관련된 유전자가 질환과의 관련성이 높다는 것을 의미한다. 이에 반하여, CNV와 그에 대응하는 유전자의 발현수준이 음(-)의 상관관계를 갖거나 특별한 상관관계를 갖지 않는 경우는, 상기 CNV 및 그와 관련된 유전자가 질환과의 관련성이 낮다는 것을 의미한다.
실제로 본 발명자들은 최초 100만여개의 SNP를 대상으로, 상기 SNP의 발현 수준으로부터 324개의 CNV 영역을 찾고, 상기 CNV의 염색체 상의 위치에 따라 그와 관련된 327개의 유전자를 선발하였고, 선발된 327개의 유전자 중에서 양(+)의 상관분석에 의하여 73개의 유전자를 선택하였다. 이와 같이, 본 발명은 특정 질환과 관련된 CNV를 선발하고, 이것과 관련된 특정 유전자를 마커로 선정하는 것이 특징이고, 상기 선정된 유전자를 바이오마커로 이용해서, 이것과 목적하는 환자의 유전자 발현 패턴을 비교하면 환자의 질환을 예측할 수 있는 것이다.
도 7은 본 발명의 바람직한 일 실시예에 따른 마이크로RNA(miRNA)에 의한 바이오마커 발굴 방법에 사용되는 환자별 miRNA 발현 수준을 나타내는 매칭표의 일례이고, 도 8은 도 7의 miRNA와 그에 대응하는 유전자 발현 수준의 상관분석 일례를 나타내는 그래프이다.
본 발명에 따른 마이크로RNA(miRNA)에 의한 바이오마커 발굴 방법은, 특정 질환을 가진 다수의 환자를 포함하는 사람의 마이크로RNA(miRNA)와 유전자 각각의 발현 수준을 사람별로 매칭하는 단계; 및 상기 miRNA와 그에 상응하는 유전자의 발현 수준을 상관분석하여, 음(-) 또는 양(+)의 상관관계가 있는 유전자를 선발하고, 상기 선발한 유전자 중 특정 질환과 관련된 miRNA에 상응하는 유전자를 선택하는 단계;를 포함한다.
이러한 본 발명은 유전인자로써 환자의 miRNA를 이용하고, 그것의 발현 수준에 따른 miRNA 분석을 통하여 바이오마커를 발굴하는 방법이다. 이러한 본 발명은 특정 질환과 관련된 miRNA가 존재하고, 일반적으로 miRNA는 유전자의 발현을 억제하는 작용을 하는바, 상기 miRNA의 발현 수준은 이와 관련된 특정 유전자의 발현 수준과 반비례한다는 음(-)의 상관관계를 바탕으로 한다. 또한, 일부 miRNA의 경우 유전자의 발현을 증가시키는 작용을 하는바, 이 때에 miRNA의 발현 수준은 이와 관련된 특정 유전자의 발현 수준과 비례한다는 양(+)의 상관관계를 바탕으로 한다.
본 발명에 따른 miRNA에 의한 바이오마커 발굴 방법은 먼저 도 7에 나타난 바와 같이, 특정 질환을 가진 다수의 환자를 포함하는 사람의 miRNA와 유전자 각각의 발현 수준을 사람별로 매칭하는 단계를 거친다. 여기서, 상기 miRNA는 인간 전체의 miRNA일 수 있고, 그 중에서 특정 질환과 관련된 miRNA일 수도 있다. 이러한 miRNA 중에는 특정 질환과 관련이 없는 것도 포함되어 있을 수 있다. 그래서, 이러한 miRNA 중에서 질환 분석 또는 평가에 적합하게 사용될 수 있는 바이오마커로써의 miRNA를 선발하는 과정이 필요하다.
이를 위하여, 본 발명은 상기 선발한 miRNA와 그에 대응하는 유전자의 발현 수준(도 7의 오른쪽 그림 참조)을 상관분석하고, 예를 들어 도 8에 나타난 바와 같이 음(-)의 상관관계가 있는 유전자를 선발할 수 있으며, 상기 선발한 유전자 중 특정 질환과 관련된 miRNA에 상응하는 유전자를 선택하는 단계;를 거친다. 즉, 본 발명에 따른 상기 miRNA는 환자와 정상인을 포함한 모든 사람을 대상으로 하는 것이므로, 이러한 miRNA 중에서 질환과 관련 miRNA를 선정하는 것이 필요하고, 이를 위하여 상기 특정 질환과 관련된 miRNA는 상기 특정 질환과 관련된 것으로 알려진 공지된 miRNA를 이용하여 비교함으로써 선택하는 것이 가능하다. 동시에 이러한 miRNA 중에서도 특별히 유전자 발현에 영향을 미치는 miRNA를 선정하는 것이 필요하고, 이를 위하여 본 발명에서는 상관분석을 수행하는 것이다. 상관분석을 위하여, 본 발명은 환자의 염색체 상의 유전자 발현 수준 정보를 더 포함하고, 이러한 정보는 miRNA와는 상관없이 환자의 유전자에 따른 발현 수준 정보이며, 상술한 서브타이핑 바이오마커 발굴 방법에서 사용한 염색체 상의 유전자(gene) 발현 수준 정보와 동일한 것(도 1 참조)일 수 있다. 이러한 상관분석은 상기 선발된 miRNA 중에서 실제로 유전자 발현과 관련 있는 것만을 추출하기 위한 것이다. 즉, miRNA의 발현 수준이 높아질수록 그와 관련된 유전자의 발현 수준이 어떤 기준값보다 낮거나 높다는 것은, 상기 miRNA 및 그와 관련된 유전자가 질환과의 관련성이 높다는 것을 의미한다. 이에 반하여, miRNA와 그에 대응하는 유전자의 발현수준이 상기 기준값 이내의 상관관계를 갖거나 특별한 상관관계를 갖지 않는 경우는, 상기 miRNA 및 그와 관련된 유전자가 질환과의 관련성이 낮다는 것을 의미한다.
이러한 본 발명에 있어서, 상기 유전자 중 특정 질환과 관련된 miRNA에 상응하는 유전자를 선발하는 것의 순서는 특별히 제한되지 않는다. 예를 들어, 상관분석 전에 수행되는 것도 가능하다. 즉, 본 발명에 따른 마이크로RNA에 의한 바이오마커 발굴 방법은, 특정 질환을 가진 다수의 환자를 포함하는 사람의 마이크로RNA(miRNA)와 유전자 각각의 발현 수준을 사람별로 매칭하는 단계; 상기 유전자 중 특정 질환과 관련된 miRNA에 상응하는 유전자를 선발하는 단계; 및 상기 특정 질환된 관련된 miRNA와 그에 상응하는 유전자의 발현 수준을 상관분석하여, 음(-) 또는 양(+)의 상관관계가 있는 유전자를 선택하는 단계;를 포함하는 것도 가능하다.
실제로 본 발명자들은 27,830여개의 miRNA 중에서, 유방암과 관련된 환자, 논문, 특허, 학술정보 등 1,265개의 정보를 통하여 유방암과 관련된 38개의 miRNA를 선발하였고, 선발된 38개의 miRNA와 관련된 유전자 중에서 음(-) 또는 양(+)의 상관분석에 의하여 246개의 유전자를 선택하였다. 이와 같이, 본 발명은 특정 질환과 관련된 miRNA를 선발하고, 이것과 관련된 특정 유전자를 마커로 선정하는 것이 특징이고, 상기 선정된 유전자를 바이오마커로 이용해서, 이것과 목적하는 환자의 유전자 발현 패턴을 비교하면 환자의 질환을 예측할 수 있는 것이다.
도 9는 본 발명의 바람직한 일 실시예에 따른 메커니즘 분석에 의한 바이오마커 발굴 방법에 사용되는 메커니즘 분석을 설명하기 위한 메커니즘별 유전자의 일례이고, 도 10은 도 9의 메커니즘I과 그에 속하는 유전자의 발현 수준 일례를 나타내는 그래프이며, 도 11은 도 9의 메커니즘II과 그에 속하는 유전자의 발현 수준 일례를 나타내는 그래프이고, 도 12는 도 9의 메커니즘III과 그에 속하는 유전자의 발현 수준 일례를 나타내는 그래프이다.
여기에 도시된 본 발명에 따른 메커니즘(mechanism) 분석에 의한 바이오마커 발굴 방법은, 질환의 바이오마커로 사용하기에 적합한 후보 유전자군에 속한 유전자를 특정 질환의 작동 메커니즘과 관련된 그룹으로 구분하는 단계; 및 상기 질환을 가진 다수의 환자군과 정상인군을 대상으로, 상기 구분한 그룹 내의 유전자 발현 수준을 비교하여, 환자군에서 더 높게 발현되는 유전자를 선택하는 단계;를 포함한다.
이러한 본 발명은 후보 유전자들을 분자생물학적 작동 또는 기능의 연관성에 따라 그룹핑하고, 이를 바탕으로 상기 그룹 및 거기에 속한 유전자의 발현 수준에 따라 바이오마커를 발굴하는 방법이다.
이를 위하여, 본 발명은 먼저 후보 유전자군에 속한 유전자를 특정 질환의 작동 메커니즘과 관련된 그룹으로 구분하는 단계;를 거친다. 여기서, 특정 질환의 작동 메커니즘이라 함은 상기한 바와 같이 어느 하나의 분자생물학적 작동 또는 기능의 연관성을 의미한다. 예를 들어, 유전자 A, B, E, F가 서로 연관되어 특정 질환과 관련된 분자생물학적 기능을 수행할 때 상기 유전자 A, B, E, F는 도 9에 나타난 바와 같이 하나의 메커니즘(또는 pathway, network) I 그룹으로 구분될 수 있다. 그리고, 이 단계에는 다수의 메커니즘 중 특정 질환과 관련된 메커니즘만을 선택하는 과정이 포함될 수 있고, 이것은 상술한 유전자 발현(GE) 분석에서 사용한 유전자 발현 수준 정보를 이용하여 높은 발현 수준을 나타내는 유전자가 포함된 메커니즘을 선택하는 것으로 수행될 수 있다. 즉, 상기 후보 유전자군에 속한 유전자를 특정 질환의 작동 메커니즘과 관련된 그룹으로 구분하는 것은, 다수의 질환 작동 메커니즘 중, 특정 질환을 가진 다수의 환자군과 정상인군 간의 유전자 발현 수준을 비교하여, 환자군에서 더 높게 발현되는 유전자를 포함하는 질환 작동 메커니즘을 특정 질환의 작동 메커니즘과 관련된 그룹으로 선발하는 것이 가능하다.
그런 다음, 또는 이와 함께, 또는 이에 앞서서, 본 발명은 상기 질환을 가진 다수의 환자군과 정상인군을 대상으로, 상기 구분한 그룹 내의 유전자 발현 수준을 비교하여, 환자군에서 더 높게 발현되는 유전자를 선택하는 단계;를 거친다. 이것은 상기 질환을 가진 다수의 환자군과 정상인군을 대상으로 하는 T-test 에 의하여 수행될 수 있다. 즉, 도 10에 나타난 바와 같이, 메카니즘 I에 속하는 유전자에 대하여 환자군과 정상인군을 대상으로 T-test(유의수준 0.01)를 수행하는 경우, 유전자 A, B, F 는 유의수준 범위 내이므로, 환자군과 정상인군 간에 유의한 차이가 있는 것으로 볼 수 있고, 이에 따르면 상기 유전자 A, B, F 는 유효한 바이오마커가 될 수 있다. 이와 비교하여, 유전자 E의 유의수준은 0.01을 넘어서고, 이에 따라 상기 유전자 E는 유효한 바이오마커가 될 수 없는 것이다. 이와 같은 원리로 도 11의 메커니즘 II에서는 유전자 L과 Q만이 유효한 바이오마커가 될 수 있고, 도 12의 메커니즘 III에서는 어떠한 유전자도 유효한 바이오마커가 될 수 없으며, 상기 메커니즘 III는 특정 질환의 작동 메커니즘과 관련된 그룹으로 구분될 수도 없는 것이다.
이와 같이 환자군과 정상인군을 대상으로 하는 T-test 에 의하면, 본 발명에 따른 상기 유전자를 특정 질환의 작동 메커니즘과 관련된 그룹으로 구분하는 단계;와 상기 환자군에서 더 높게 발현되는 유전자를 선택하는 단계;는 동시에 이루어질 수도 있다.
또한, 이러한 본 발명의 다른 특징은 상기 구분한 그룹 내의 유전자 발현 수준을 비교하여, 환자군에서 더 높게 발현되는 유전자를 선택함에 있어서, 상기 구분한 그룹 내의 유전자 발현 수준이 높은 유전자에 대하여 우선적으로 T-test 를 실시함으로써, 환자군에서 더 높게 발현되는 유전자를 선택하는 것이다. 예를 들어, 도 12에 나타난 바와 같이 유전자 E, G, P, D 중에서 발현수준이 가장 높은 유전자 E에 대하여 우선적으로 T-test 를 실시하여, 그 결과가 유의수준(0.01)을 넘는 것으로 확인되면, 다른 유전자 G, P, D에 대해서는 T-test 를 실시할 필요도 없이 그 메커니즘 및 거기에 속하는 유전자는 필요없는 것으로 볼 수 있다.
이와 함께, 본 발명에 따른 메커니즘 분석에 의한 바이오마커 발굴 방법에 있어서, 상기 후보 유전자군은 상술한 바이오마커 발굴 방법에 의해 얻어진 유전자를 포함하는 것이 바람직한데, 이 경우 상술한 바이오마커 발굴 방법과 함께 메커니즘 분석에 의한 바이오마커 발굴 방법을 이중으로 동시에 사용하여 더욱 정확도 높은 바이오마커를 선별할 수 있는 특징이 있다.
나아가, 상기 후보 유전자군은 상술한 서브타이핑(sub-typing) 바이오마커 발굴 방법에 의해 얻어진 유전자와, 복제수 변이(Copy Number Variation, CNV)에 의한 바이오마커 발굴 방법에 의해 얻어진 유전자와, 마이크로RNA(miRNA)에 의한 바이오마커 발굴 방법에 의해 얻어진 유전자를 모두 포함하는 것이 더욱 바람직하고, 이 경우 환자 및 사람을 대상으로 한 다양한 바이오마커 발굴 방법을 종합적으로 통합하여 가장 정확도가 높은 바이오마커를 선별할 수 있는 효과가 있다.
실제로, 본 발명자들은 도 9에 나타난 바와 같이, 서브타이핑 바이오마커 발굴 방법에 의해 646개의 유전자와, 복제수 변이에 의한 바이오마커 발굴 방법에 의해 73개의 유전자와, 마이크로RNA에 의한 바이오마커 발굴 방법에 의해 246개의 유전자를 얻은 뒤, 중복되지 않은 965개의 후보 유전자를 구성하였고, 이에 대하여 1,340개의 메커니즘 중 유방암과 관련된 메커니즘을 분석하여, 최종적으로 215개의 유전자를 선정하였다.
선정된 215개의 유전자는 하기 표 1에 나타난 바와 같다.
  No Gene symbol Gene function Discovery type
1 402 Acacb acetyl-Coenzyme A carboxylase beta GE
2 302 ACADSB acyl-Coenzyme A dehydrogenase, short/branched chain GE
3 272 agl amylo-1, 6-glucosidase, 4-alpha-glucanotransferase GE
4 461 Ap1g1 adaptor-related protein complex 1, gamma 1 subunit GE
5 35 APC adenomatous polyposis coli miRNA
6 16 APP amyloid beta (A4) precursor protein miRNA
7 313 aqp1 aquaporin 1 (Colton blood group) GE
8 273 AQP3 aquaporin 3 (Gill blood group) GE
9 365 Ar androgen receptor GE
10 146 Arf6 ADP-ribosylation factor 6 CNV
11 289 Atp7b ATPase, Cu++ transporting, beta polypeptide GE
12 281 AURKA aurora kinase A; aurora kinase A pseudogene 1 GE
13 338 AURKB aurora kinase B GE
14 145 Bad BCL2-associated agonist of cell death CNV
15 39 BCL2 B-cell CLL/lymphoma 2 miRNA
16 12 BDNF brain-derived neurotrophic factor miRNA
17 224 bhlhe40 basic helix-loop-helix family, member e40 GE
18 238 BIRC5 baculoviral IAP repeat-containing 5 GE
19 345 BUB1 budding uninhibited by benzimidazoles 1 homolog (yeast) GE
20 274 BUB1B budding uninhibited by benzimidazoles 1 homolog beta (yeast) GE
21 423 C3 similar to Complement C3 precursor; complement component 3; hypothetical protein LOC100133511 GE
22 400 capn3 calpain 3, (p94) GE
23 262 cav1 caveolin 1, caveolae protein, 22kDa GE
24 268 CCNA2 cyclin A2 GE
25 405 CCNB1 cyclin B1 GE
26 254 CCNB2 cyclin B2 GE
27 319 CCND1 cyclin D1 GE
28 126 CCNE1 cyclin E1 miRNA
29 299 Ccne2 cyclin E2 GE
30 351 ccno cyclin O GE
31 211 cct5 chaperonin containing TCP1, subunit 5 (epsilon) GE
32 310 CD36 CD36 molecule (thrombospondin receptor) GE
33 66 CDC14B CDC14 cell division cycle 14 homolog B (S. cerevisiae) miRNA
34 258 cdc20 cell division cycle 20 homolog (S. cerevisiae) GE
35 209 CDC25A cell division cycle 25 homolog A (S. pombe) GE
36 53 Cdc42 cell division cycle 42 (GTP binding protein, 25kDa); cell division cycle 42 pseudogene 2 miRNA
37 399 CDC42BPA CDC42 binding protein kinase alpha (DMPK-like) GE
38 54 CDC42P2 cell division cycle 42 (GTP binding protein, 25kDa); cell division cycle 42 pseudogene 2 miRNA
39 277 cdc6 cell division cycle 6 homolog (S. cerevisiae) GE
40 453 cdca7 cell division cycle associated 7 GE
41 440 CDCA8 cell division cycle associated 8 GE
42 222 CDH1 cadherin 1, type 1, E-cadherin (epithelial) GE
43 263 Cdk1 cell division cycle 2, G1 to S and G2 to M GE
44 153 CDK11A similar to cell division cycle 2-like 1 (PITSLRE proteins); cell division cycle 2-like 1 (PITSLRE proteins); cell division cycle 2-like 2 (PITSLRE proteins) CNV
45 154 Cdk11b similar to cell division cycle 2-like 1 (PITSLRE proteins); cell division cycle 2-like 1 (PITSLRE proteins); cell division cycle 2-like 2 (PITSLRE proteins) CNV
46 74 CEBPB CCAAT/enhancer binding protein (C/EBP), beta miRNA
47 386 cebpd CCAAT/enhancer binding protein (C/EBP), delta GE
48 297 CENPA centromere protein A GE
49 300 CENPE centromere protein E, 312kDa GE
50 315 CENPF centromere protein F, 350/400ka (mitosin) GE
51 431 CENPN centromere protein N GE
52 243 CFB complement factor B GE
53 439 CLTC clathrin, heavy chain (Hc) GE
54 212 CP ceruloplasmin (ferroxidase) GE
55 148 CTDSP2 similar to hCG2013701; CTD (carboxy-terminal domain, RNA polymerase II, polypeptide A) small phosphatase 2 CNV
56 5 CTNNB1 catenin (cadherin-associated protein), beta 1, 88kDa miRNA
57 306 Cx3cr1 chemokine (C-X3-C motif) receptor 1 GE
58 286 CXCL1 chemokine (C-X-C motif) ligand 1 (melanoma growth stimulating activity, alpha) GE
59 425 cybrd1 cytochrome b reductase 1 GE
60 311 CYP2B6 cytochrome P450, family 2, subfamily B, polypeptide 6 GE
61 93 dcaf7 WD repeat domain 68 miRNA
62 266 DCK deoxycytidine kinase GE
63 418 DST dystonin GE
64 179 E2F1 E2F transcription factor 1 miRNA, GE
65 441 E2f5 E2F transcription factor 5, p130-binding GE
66 234 egfr epidermal growth factor receptor (erythroblastic leukemia viral (v-erb-b) oncogene homolog, avian) GE
67 201 Erbb2 v-erb-b2 erythroblastic leukemia viral oncogene homolog 2, neuro/glioblastoma derived oncogene homolog (avian) CNV, GE
68 301 Esr1 estrogen receptor 1 GE
69 208 ETS1 v-ets erythroblastosis virus E26 oncogene homolog 1 (avian) GE
70 167 F11r F11 receptor CNV
71 48 F2 coagulation factor II (thrombin) miRNA
72 499 FABP4 fatty acid binding protein 4, adipocyte GE
73 250 Fadd Fas (TNFRSF6)-associated via death domain GE
74 292 FEN1 flap structure-specific endonuclease 1 GE
75 395 Fermt2 fermitin family homolog 2 (Drosophila) GE
76 314 Fgfr1 fibroblast growth factor receptor 1 GE
77 287 Fgfr4 fibroblast growth factor receptor 4 GE
78 432 FGG fibrinogen gamma chain GE
79 464 FLT1 fms-related tyrosine kinase 1 (vascular endothelial growth factor/vascular permeability factor receptor) GE
80 213 fn1 fibronectin 1 GE
81 305 Gas2 growth arrest-specific 2 GE
82 340 GATA3 GATA binding protein 3 GE
83 303 gfra1 GDNF family receptor alpha 1 GE
84 502 GMPS guanine monphosphate synthetase GE
85 50 Gna13 guanine nucleotide binding protein (G protein), alpha 13 miRNA
86 394 Gnas GNAS complex locus GE
87 10 gpD1 glycerol-3-phosphate dehydrogenase 1 (soluble) miRNA
88 356 Grb7 growth factor receptor-bound protein 7 GE
89 27 GTF2H1 general transcription factor IIH, polypeptide 1, 62kDa miRNA
90 4 HDAC4 histone deacetylase 4 miRNA
91 433 Hhat hedgehog acyltransferase GE
92 426 Hjurp Holliday junction recognition protein GE
93 348 HOXB13 homeobox B13 GE
94 130 HSD17B12 hydroxysteroid (17-beta) dehydrogenase 12 miRNA
95 332 id4 inhibitor of DNA binding 4, dominant negative helix-loop-helix protein GE
96 228 Ifitm1 interferon induced transmembrane protein 1 (9-27) GE
97 244 IGF2 insulin-like growth factor 2 (somatomedin A); insulin; INS-IGF2 readthrough transcript GE
98 334 IKBKB inhibitor of kappa light polypeptide gene enhancer in B-cells, kinase beta GE
99 309 IL18 interleukin 18 (interferon-gamma-inducing factor) GE
100 295 IL6ST interleukin 6 signal transducer (gp130, oncostatin M receptor) GE
101 245 INS insulin-like growth factor 2 (somatomedin A); insulin; INS-IGF2 readthrough transcript GE
102 182 IRS1 insulin receptor substrate 1 miRNA, GE
103 60 ITCH itchy E3 ubiquitin protein ligase homolog (mouse) miRNA
104 298 ITGA2 integrin, alpha 2 (CD49B, alpha 2 subunit of VLA-2 receptor) GE
105 346 ITGA7 integrin, alpha 7 GE
106 21 Jun jun oncogene miRNA
107 220 JUP junction plakoglobin GE
108 285 KIF11 kinesin family member 11 GE
109 430 KIF15 kinesin family member 15 GE
110 427 kif20a kinesin family member 20A GE
111 291 KIF23 kinesin family member 23 GE
112 337 KIF2C kinesin family member 2C GE
113 434 Klf4 Kruppel-like factor 4 (gut) GE
114 221 KPNA2 karyopherin alpha 2 (RAG cohort 1, importin alpha 1); karyopherin alpha-2 subunit like GE
115 336 Krt14 keratin 14 GE
116 227 KRT18 keratin 18; keratin 18 pseudogene 26; keratin 18 pseudogene 19 GE
117 233 KRT5 keratin 5 GE
118 323 krt8 keratin 8 pseudogene 9; similar to keratin 8; keratin 8 GE
119 352 LAMA5 laminin, alpha 5 GE
120 375 lbp lipopolysaccharide binding protein GE
121 304 LRP2 low density lipoprotein-related protein 2 GE
122 519 lzts1 leucine zipper, putative tumor suppressor 1 GE
123 207 Mad2l1 MAD2 mitotic arrest deficient-like 1 (yeast) GE
124 283 MAOA monoamine oxidase A GE
125 516 MAOB monoamine oxidase B GE
126 384 MAP1B microtubule-associated protein 1B GE
127 163 MAP3K1 mitogen-activated protein kinase kinase kinase 1 CNV
128 275 mapt microtubule-associated protein tau GE
129 210 mccc2 methylcrotonoyl-Coenzyme A carboxylase 2 (beta) GE
130 124 mcl1 myeloid cell leukemia sequence 1 (BCL2-related) miRNA
131 436 Mcm10 minichromosome maintenance complex component 10 GE
132 240 mcm2 minichromosome maintenance complex component 2 GE
133 380 MCM4 minichromosome maintenance complex component 4 GE
134 422 mdm2 Mdm2 p53 binding protein homolog (mouse) GE
135 269 med1 mediator complex subunit 1 GE
136 390 MED24 mediator complex subunit 24 GE
137 34 MET met proto-oncogene (hepatocyte growth factor receptor) miRNA
138 363 MGLL monoglyceride lipase GE
139 428 MLF1IP MLF1 interacting protein GE
140 276 Mmp9 matrix metallopeptidase 9 (gelatinase B, 92kDa gelatinase, 92kDa type IV collagenase) GE
141 507 mtss1 metastasis suppressor 1 GE
142 9 myb v-myb myeloblastosis viral oncogene homolog (avian) miRNA
143 231 MYBL2 v-myb myeloblastosis viral oncogene homolog (avian)-like 2 GE
144 178 MYC v-myc myelocytomatosis viral oncogene homolog (avian) CNV
145 265 myo6 myosin VI GE
146 282 NDC80 NDC80 homolog, kinetochore complex component (S. cerevisiae) GE
147 216 ndrg1 N-myc downstream regulated 1 GE
148 454 NFIA nuclear factor I/A GE
149 330 NFIB nuclear factor I/B GE
150 471 nfix nuclear factor I/X (CCAAT-binding transcription factor) GE
151 307 Nmu neuromedin U GE
152 2 NT5E 5'-nucleotidase, ecto (CD73) miRNA
153 392 Oip5 Opa interacting protein 5 GE
154 429 ORC6L origin recognition complex, subunit 6 like (yeast) GE
155 215 Pak2 p21 protein (Cdc42/Rac)-activated kinase 2 GE
156 326 PEG3 paternally expressed 3; PEG3 antisense RNA (non-protein coding); zinc finger, imprinted 2 GE
157 214 PGK1 phosphoglycerate kinase 1 GE
158 31 Phkb phosphorylase kinase, beta miRNA
159 424 Pigt phosphatidylinositol glycan anchor biosynthesis, class T GE
160 520 PIGV phosphatidylinositol glycan anchor biosynthesis, class V GE
161 150 PIK3CA phosphoinositide-3-kinase, catalytic, alpha polypeptide CNV
162 71 Pik3r1 phosphoinositide-3-kinase, regulatory subunit 1 (alpha) miRNA
163 241 PLK1 polo-like kinase 1 (Drosophila) GE
164 11 Plxnd1 plexin D1 miRNA
165 25 pnp nucleoside phosphorylase miRNA
166 29 POLR2K polymerase (RNA) II (DNA directed) polypeptide K, 7.0kDa miRNA
167 46 POM121 POM121 membrane glycoprotein (rat) miRNA
168 317 PPARG peroxisome proliferator-activated receptor gamma GE
169 149 PPP6C protein phosphatase 6, catalytic subunit CNV
170 45 PRIM1 primase, DNA, polypeptide 1 (49kDa) miRNA
171 255 PRKACB protein kinase, cAMP-dependent, catalytic, beta GE
172 58 PRKCI protein kinase C, iota miRNA
173 42 pten phosphatase and tensin homolog; phosphatase and tensin homolog pseudogene 1 miRNA
174 271 PTTG1 pituitary tumor-transforming 1; pituitary tumor-transforming 2 GE
175 105 Rab23 RAB23, member RAS oncogene family miRNA
176 446 racgap1 Rac GTPase activating protein 1 pseudogene; Rac GTPase activating protein 1 GE
177 67 RB1 retinoblastoma 1 miRNA
178 142 Rbl1 retinoblastoma-like 1 (p107) CNV
179 125 rheb Ras homolog enriched in brain miRNA
180 347 rrm2 ribonucleotide reductase M2 polypeptide GE
181 166 rsf1 remodeling and spacing factor 1 CNV
182 260 S100A8 S100 calcium binding protein A8 GE
183 235 Sfrp1 secreted frizzled-related protein 1 GE
184 15 SFRS9 splicing factor, arginine/serine-rich 9 miRNA
185 75 slc30a1 solute carrier family 30 (zinc transporter), member 1 miRNA
186 33 SLC35A1 solute carrier family 35 (CMP-sialic acid transporter), member A1 miRNA
187 451 SLC40A1 solute carrier family 40 (iron-regulated transporter), member 1 GE
188 280 slc5a6 solute carrier family 5 (sodium-dependent vitamin transporter), member 6 GE
189 226 SLC7A5 solute carrier family 7 (cationic amino acid transporter, y+ system), member 5 GE
190 257 SLC7A8 solute carrier family 7 (cationic amino acid transporter, y+ system), member 8 GE
191 407 Smarce1 SWI/SNF related, matrix associated, actin dependent regulator of chromatin, subfamily e, member 1 GE
192 230 SMC4 structural maintenance of chromosomes 4 GE
193 417 SNRPN small nuclear ribonucleoprotein polypeptide N; SNRPN upstream reading frame GE
194 219 STAT1 signal transducer and activator of transcription 1, 91kDa GE
195 308 STAT4 signal transducer and activator of transcription 4 GE
196 38 tbca tubulin folding cofactor A miRNA
197 288 Tff3 trefoil factor 3 (intestinal) GE
198 312 TFRC transferrin receptor (p90, CD71) GE
199 349 TGFB2 transforming growth factor, beta 2 GE
200 55 Tgfbr2 transforming growth factor, beta receptor II (70/80kDa) miRNA
201 90 Th1l TH1-like (Drosophila) miRNA
202 205 tk1 thymidine kinase 1, soluble GE
203 1 TNFRSF10A tumor necrosis factor receptor superfamily, member 10a miRNA
204 252 TNFSF10 tumor necrosis factor (ligand) superfamily, member 10 GE
205 232 tp53 tumor protein p53 GE
206 259 TRAF4 TNF receptor-associated factor 4 GE
207 18 TRAM1 translocation associated membrane protein 1 miRNA
208 8 TXNRD1 thioredoxin reductase 1; hypothetical LOC100130902 miRNA
209 206 Tyms thymidylate synthetase GE
210 261 UBE2C ubiquitin-conjugating enzyme E2C GE
211 47 UGP2 UDP-glucose pyrophosphorylase 2 miRNA
212 40 Vcam1 vascular cell adhesion molecule 1 miRNA
213 6 VIM vimentin miRNA
214 217 YWHAZ tyrosine 3-monooxygenase/tryptophan 5-monooxygenase activation protein, zeta polypeptide GE
215 279 ZWINT ZW10 interactor GE
상기 표 1에서 No.는 최초 유전자 번호를 나타내고, Discovery type 은 해당 유전자 발굴된 방법을 의미한다.
한편, 본 발명의 다른 실시형태는 상기 표 1에 기재된 유전자를 포함하는 유방암 관련 바이오마커이다.
그리고, 본 발명은 상기 표 1에 기재된 유전자를 포함하여 유방암의 서브타입(sub-type) 판별이 가능한 바이오마커일 수 있다.
또한, 본 발명의 또 다른 실시형태는 상기 표 1에 기재된 유전자에 대응하는 프로브를 포함하는 마이크로 어레이; 및 상기 유전자의 발현 변화를 측정하는 광학측정 장치;를 포함하는 유방암 검사 키트인 것도 가능하다.
도 13은 본 발명의 바람직한 일 실시예에 따른 바이오마커 발굴 방법에 의해 발굴된 바이오마커의 유의수준별 정확도의 일례를 나타내는 그래프이다. 본 발명자들은 상기 최종 선정된 215개의 유전자를 508개의 프로브로 구성하였고, T-test 의 유의수준을 0.01~0.05로 달리하여 측정한 결과, 유의수준 0.01인 경우 정확도는 94.8%에 달하는 것으로 측정되었다.
또한, 도 14는 본 발명의 바람직한 일 실시예에 따른 바이오마커 발굴 방법에 의해 발굴된 바이오마커를 이용하여 유방암의 서브타입을 확인한 광학 사진이고, 여기에 나타난 바와 같이, 4가지의 유방암 형태별로 508개의 프로브는 다른 광학특성을 나타내고 있으며, 이에 따라 유방암의 유형 판별까지 가능함을 확인할 수 있다.
본 발명에 따른 바이오마커를 타사의 바이오마커 구성과 비교하면, 하기 표 2에 나타난 바와 같고, 도 15에 나타난 바와 같이 타사의 바이오마커와 일부 중복되기는 하지만 다른 바이오마커도 143개에 달한다.
개발사 유전자 개수 Probe 개수 비고
LG전자 215 개 508 개 GE: 346개1)
CNV: 47 개
miRNA: 162개
KFSYSCC
(대만 암센터)
625개 783개 GE: 783개2)
Agendia社
(네덜란드)
80개 219개 GE: 219개2)
1) Probe간에 겹치는 것이 있음. 2) KFSYSCC와 Agendia社는 GE 데이터만 사용
그리고, 본 발명에 따른 바이오마커와 KFSYSCC (대만 암센터)의 바이오마커의 정확도를 4개의 유방암 유형에 따라 비교분석한 결과는 하기 표 3(KFSYSCC (783 probes, 625 genes)) 및 표 4(LG전자 (508 probes, 215 genes))에 나타난 바와 같다.
Type Sensitivity Specificity Total accuracy (%)
Basal 0.98 0.97 87.80
HER2 0.85 0.95
Luminal B 0.53 0.95
Luminal A 0.43 0.89
Type Sensitivity Specificity Total accuracy (%)
Basal 0.98 0.96 89.80
HER2 0.80 0.95
Luminal B 0.52 0.94
Luminal A 0.89 0.85
상기 표 3 및 표 4에 나타난 바와 같이, 총 250 개의 유방암 샘플로 비교테스트 수행한 결과, 상대적으로 적은 개수의 유전자로 구성된 본 발명에 따른 다중 바이오마커가 KFSYSCC(대만 암센터)보다 높은 서브타이핑 정확도를 보여주었다.
또한, 본 발명에 따른 바이오마커와 Agendia社의 바이오마커의 정확도를 3개의 유방암 유형에 따라 비교분석한 결과는 하기 표 5(Agendia社 (219 probes, 80 genes)) 및 표 6(LG전자 (508 probes, 215 genes))에 나타난 바와 같다.
Type Sensitivity Specificity Total accuracy (%)
Basal 0.98 0.95 88.50
HER2 0.85 0.94
Luminal 0.59 0.95
Type Sensitivity Specificity Total accuracy (%)
Basal 0.98 0.96 94.13
HER2 0.80 0.95
Luminal 0.91 0.95
상기 표 5 및 표 6에 나타난 바와 같이, 총 250 개의 유방암 샘플로 비교테스트 수행한 결과, 본 발명에 따른 다중 바이오마커는 각 서브타입별로 균일한 정확도를 보여 주었으나, Agendia社의 다중 바이오마커는 luminal type 예측에서 정확도가 현저히 떨어짐을 확인할 수 있다.
한편, 상기에서는 본 발명을 특정의 바람직한 실시예에 관련하여 도시하고 설명하였지만, 이하의 특허청구범위에 의해 마련되는 본 발명의 기술적 특징이나 분야를 이탈하지 않는 한도 내에서 본 발명이 다양하게 개조 및 변화될 수 있다는 것은 당업계에서 통상의 지식을 가진 자에게 명백한 것이다.

Claims (20)

  1. 삭제
  2. 다수의 유방암 환자의 유방암과 관련된 복제수변이(CNV), 마이크로RNA(miRNA) 및 염색체 상의 유전자(gene)의 발현 수준을 결정하는 단계;
    상기 복제수변이(CNV), 마이크로RNA(miRNA) 및 염색체 상의 유전자(gene)의 발현 수준을 데이터베이스(DB)에 저장하는 단계;
    상기 데이터베이스에 저장된 복제수변이(CNV), 마이크로RNA(miRNA) 및 염색체 상의 유전자(gene)의 발현 수준 데이터를 사람별로 매칭하는 단계;
    상기 매칭된 복제수변이(CNV), 마이크로RNA(miRNA) 및 염색체 상의 유전자(gene)의 발현 수준의 데이터를 유방암이 없는 정상인의 발현 수준의 데이터와 비교하되,
    상기 매칭된 복제수변이(CNV)의 발현 수준의 데이터를 비교함에 있어서는,
    SNP 발현 수준이 소정의 기준값 이상이거나 이하인 복제수변이(CNV) 영역을 선정하고, 상기 CNV 영역의 염색체 상의 위치에 유방암과 관련된 CNV를 선발하고, 상기 선발한 CNV와 그에 대응하는 상기 환자의 염색체 상의 유전자 발현 수준을 상관분석하여, 양(+)의 상관관계가 있는 유전자를 선택하며,
    상기 매칭된 마이크로RNA(miRNA)의 발현 수준의 데이터를 비교함에 있어서는,
    상기 miRNA와 그에 상응하는 유전자의 발현 수준을 상관분석하여, 음(-) 또는 양(+)의 상관관계가 있는 유전자를 선발하고, 상기 선발한 유전자 중 유방암과 관련된 miRNA에 상응하는 유전자를 선택하는 단계; 및
    상기 선택된 유전자에 의하여 Basal, HER2, Luminal A 및 Luminal B의 4가지 유방암 유형의 바이오마커를 판별하는 단계;를 포함하고,
    상기 선택된 유전자는 하기 표 7의 215개의 유전자 내에 포함되어 있는 것을 특징으로 하는 유방암에 대한 바이오마커를 발굴하는 방법.
    구분  최초 유전자 번호 유전자 심볼(Gene symbol) 유전자 기능(Gene function) 유전자
    발굴방법
    1 402 Acacb acetyl-Coenzyme A carboxylase beta GE 2 302 ACADSB acyl-Coenzyme A dehydrogenase, short/branched chain GE 3 272 agl amylo-1, 6-glucosidase, 4-alpha-glucanotransferase GE 4 461 Ap1g1 adaptor-related protein complex 1, gamma 1 subunit GE 5 35 APC adenomatous polyposis coli miRNA 6 16 APP amyloid beta (A4) precursor protein miRNA 7 313 aqp1 aquaporin 1 (Colton blood group) GE 8 273 AQP3 aquaporin 3 (Gill blood group) GE 9 365 Ar androgen receptor GE 10 146 Arf6 ADP-ribosylation factor 6 CNV 11 289 Atp7b ATPase, Cu++ transporting, beta polypeptide GE 12 281 AURKA aurora kinase A; aurora kinase A pseudogene 1 GE 13 338 AURKB aurora kinase B GE 14 145 Bad BCL2-associated agonist of cell death CNV 15 39 BCL2 B-cell CLL/lymphoma 2 miRNA 16 12 BDNF brain-derived neurotrophic factor miRNA 17 224 bhlhe40 basic helix-loop-helix family, member e40 GE 18 238 BIRC5 baculoviral IAP repeat-containing 5 GE 19 345 BUB1 budding uninhibited by benzimidazoles 1 homolog (yeast) GE 20 274 BUB1B budding uninhibited by benzimidazoles 1 homolog beta (yeast) GE 21 423 C3 similar to Complement C3 precursor; complement component 3; hypothetical protein LOC100133511 GE 22 400 capn3 calpain 3, (p94) GE 23 262 cav1 caveolin 1, caveolae protein, 22kDa GE 24 268 CCNA2 cyclin A2 GE 25 405 CCNB1 cyclin B1 GE 26 254 CCNB2 cyclin B2 GE 27 319 CCND1 cyclin D1 GE 28 126 CCNE1 cyclin E1 miRNA 29 299 Ccne2 cyclin E2 GE 30 351 ccno cyclin O GE 31 211 cct5 chaperonin containing TCP1, subunit 5 (epsilon) GE 32 310 CD36 CD36 molecule (thrombospondin receptor) GE 33 66 CDC14B CDC14 cell division cycle 14 homolog B (S. cerevisiae) miRNA 34 258 cdc20 cell division cycle 20 homolog (S. cerevisiae) GE 35 209 CDC25A cell division cycle 25 homolog A (S. pombe) GE 36 53 Cdc42 cell division cycle 42 (GTP binding protein, 25kDa); cell division cycle 42 pseudogene 2 miRNA 37 399 CDC42BPA CDC42 binding protein kinase alpha (DMPK-like) GE 38 54 CDC42P2 cell division cycle 42 (GTP binding protein, 25kDa); cell division cycle 42 pseudogene 2 miRNA 39 277 cdc6 cell division cycle 6 homolog (S. cerevisiae) GE 40 453 cdca7 cell division cycle associated 7 GE 41 440 CDCA8 cell division cycle associated 8 GE 42 222 CDH1 cadherin 1, type 1, E-cadherin (epithelial) GE 43 263 Cdk1 cell division cycle 2, G1 to S and G2 to M GE 44 153 CDK11A similar to cell division cycle 2-like 1 (PITSLRE proteins); cell division cycle 2-like 1 (PITSLRE proteins); cell division cycle 2-like 2 (PITSLRE proteins) CNV 45 154 Cdk11b similar to cell division cycle 2-like 1 (PITSLRE proteins); cell division cycle 2-like 1 (PITSLRE proteins); cell division cycle 2-like 2 (PITSLRE proteins) CNV 46 74 CEBPB CCAAT/enhancer binding protein (C/EBP), beta miRNA 47 386 cebpd CCAAT/enhancer binding protein (C/EBP), delta GE 48 297 CENPA centromere protein A GE 49 300 CENPE centromere protein E, 312kDa GE 50 315 CENPF centromere protein F, 350/400ka (mitosin) GE 51 431 CENPN centromere protein N GE 52 243 CFB complement factor B GE 53 439 CLTC clathrin, heavy chain (Hc) GE 54 212 CP ceruloplasmin (ferroxidase) GE 55 148 CTDSP2 similar to hCG2013701; CTD (carboxy-terminal domain, RNA polymerase II, polypeptide A) small phosphatase 2 CNV 56 5 CTNNB1 catenin (cadherin-associated protein), beta 1, 88kDa miRNA 57 306 Cx3cr1 chemokine (C-X3-C motif) receptor 1 GE 58 286 CXCL1 chemokine (C-X-C motif) ligand 1 (melanoma growth stimulating activity, alpha) GE 59 425 cybrd1 cytochrome b reductase 1 GE 60 311 CYP2B6 cytochrome P450, family 2, subfamily B, polypeptide 6 GE 61 93 dcaf7 WD repeat domain 68 miRNA 62 266 DCK deoxycytidine kinase GE 63 418 DST dystonin GE 64 179 E2F1 E2F transcription factor 1 miRNA, GE 65 441 E2f5 E2F transcription factor 5, p130-binding GE 66 234 egfr epidermal growth factor receptor (erythroblastic leukemia viral (v-erb-b) oncogene homolog, avian) GE 67 201 Erbb2 v-erb-b2 erythroblastic leukemia viral oncogene homolog 2, neuro/glioblastoma derived oncogene homolog (avian) CNV, GE 68 301 Esr1 estrogen receptor 1 GE 69 208 ETS1 v-ets erythroblastosis virus E26 oncogene homolog 1 (avian) GE 70 167 F11r F11 receptor CNV 71 48 F2 coagulation factor II (thrombin) miRNA 72 499 FABP4 fatty acid binding protein 4, adipocyte GE 73 250 Fadd Fas (TNFRSF6)-associated via death domain GE 74 292 FEN1 flap structure-specific endonuclease 1 GE 75 395 Fermt2 fermitin family homolog 2 (Drosophila) GE 76 314 Fgfr1 fibroblast growth factor receptor 1 GE 77 287 Fgfr4 fibroblast growth factor receptor 4 GE 78 432 FGG fibrinogen gamma chain GE 79 464 FLT1 fms-related tyrosine kinase 1 (vascular endothelial growth factor/vascular permeability factor receptor) GE 80 213 fn1 fibronectin 1 GE 81 305 Gas2 growth arrest-specific 2 GE 82 340 GATA3 GATA binding protein 3 GE 83 303 gfra1 GDNF family receptor alpha 1 GE 84 502 GMPS guanine monphosphate synthetase GE 85 50 Gna13 guanine nucleotide binding protein (G protein), alpha 13 miRNA 86 394 Gnas GNAS complex locus GE 87 10 gpD1 glycerol-3-phosphate dehydrogenase 1 (soluble) miRNA 88 356 Grb7 growth factor receptor-bound protein 7 GE 89 27 GTF2H1 general transcription factor IIH, polypeptide 1, 62kDa miRNA 90 4 HDAC4 histone deacetylase 4 miRNA 91 433 Hhat hedgehog acyltransferase GE 92 426 Hjurp Holliday junction recognition protein GE 93 348 HOXB13 homeobox B13 GE 94 130 HSD17B12 hydroxysteroid (17-beta) dehydrogenase 12 miRNA 95 332 id4 inhibitor of DNA binding 4, dominant negative helix-loop-helix protein GE 96 228 Ifitm1 interferon induced transmembrane protein 1 (9-27) GE 97 244 IGF2 insulin-like growth factor 2 (somatomedin A); insulin; INS-IGF2 readthrough transcript GE 98 334 IKBKB inhibitor of kappa light polypeptide gene enhancer in B-cells, kinase beta GE 99 309 IL18 interleukin 18 (interferon-gamma-inducing factor) GE 100 295 IL6ST interleukin 6 signal transducer (gp130, oncostatin M receptor) GE 101 245 INS insulin-like growth factor 2 (somatomedin A); insulin; INS-IGF2 readthrough transcript GE 102 182 IRS1 insulin receptor substrate 1 miRNA, GE 103 60 ITCH itchy E3 ubiquitin protein ligase homolog (mouse) miRNA 104 298 ITGA2 integrin, alpha 2 (CD49B, alpha 2 subunit of VLA-2 receptor) GE 105 346 ITGA7 integrin, alpha 7 GE 106 21 Jun jun oncogene miRNA 107 220 JUP junction plakoglobin GE 108 285 KIF11 kinesin family member 11 GE 109 430 KIF15 kinesin family member 15 GE 110 427 kif20a kinesin family member 20A GE 111 291 KIF23 kinesin family member 23 GE 112 337 KIF2C kinesin family member 2C GE 113 434 Klf4 Kruppel-like factor 4 (gut) GE 114 221 KPNA2 karyopherin alpha 2 (RAG cohort 1, importin alpha 1); karyopherin alpha-2 subunit like GE 115 336 Krt14 keratin 14 GE 116 227 KRT18 keratin 18; keratin 18 pseudogene 26; keratin 18 pseudogene 19 GE 117 233 KRT5 keratin 5 GE 118 323 krt8 keratin 8 pseudogene 9; similar to keratin 8; keratin 8 GE 119 352 LAMA5 laminin, alpha 5 GE 120 375 lbp lipopolysaccharide binding protein GE 121 304 LRP2 low density lipoprotein-related protein 2 GE 122 519 lzts1 leucine zipper, putative tumor suppressor 1 GE 123 207 Mad2l1 MAD2 mitotic arrest deficient-like 1 (yeast) GE 124 283 MAOA monoamine oxidase A GE 125 516 MAOB monoamine oxidase B GE 126 384 MAP1B microtubule-associated protein 1B GE 127 163 MAP3K1 mitogen-activated protein kinase kinase kinase 1 CNV 128 275 mapt microtubule-associated protein tau GE 129 210 mccc2 methylcrotonoyl-Coenzyme A carboxylase 2 (beta) GE 130 124 mcl1 myeloid cell leukemia sequence 1 (BCL2-related) miRNA 131 436 Mcm10 minichromosome maintenance complex component 10 GE 132 240 mcm2 minichromosome maintenance complex component 2 GE 133 380 MCM4 minichromosome maintenance complex component 4 GE 134 422 mdm2 Mdm2 p53 binding protein homolog (mouse) GE 135 269 med1 mediator complex subunit 1 GE 136 390 MED24 mediator complex subunit 24 GE 137 34 MET met proto-oncogene (hepatocyte growth factor receptor) miRNA 138 363 MGLL monoglyceride lipase GE 139 428 MLF1IP MLF1 interacting protein GE 140 276 Mmp9 matrix metallopeptidase 9 (gelatinase B, 92kDa gelatinase, 92kDa type IV collagenase) GE 141 507 mtss1 metastasis suppressor 1 GE 142 9 myb v-myb myeloblastosis viral oncogene homolog (avian) miRNA 143 231 MYBL2 v-myb myeloblastosis viral oncogene homolog (avian)-like 2 GE 144 178 MYC v-myc myelocytomatosis viral oncogene homolog (avian) CNV 145 265 myo6 myosin VI GE 146 282 NDC80 NDC80 homolog, kinetochore complex component (S. cerevisiae) GE 147 216 ndrg1 N-myc downstream regulated 1 GE 148 454 NFIA nuclear factor I/A GE 149 330 NFIB nuclear factor I/B GE 150 471 nfix nuclear factor I/X (CCAAT-binding transcription factor) GE 151 307 Nmu neuromedin U GE 152 2 NT5E 5'-nucleotidase, ecto (CD73) miRNA 153 392 Oip5 Opa interacting protein 5 GE 154 429 ORC6L origin recognition complex, subunit 6 like (yeast) GE 155 215 Pak2 p21 protein (Cdc42/Rac)-activated kinase 2 GE 156 326 PEG3 paternally expressed 3; PEG3 antisense RNA (non-protein coding); zinc finger, imprinted 2 GE 157 214 PGK1 phosphoglycerate kinase 1 GE 158 31 Phkb phosphorylase kinase, beta miRNA 159 424 Pigt phosphatidylinositol glycan anchor biosynthesis, class T GE 160 520 PIGV phosphatidylinositol glycan anchor biosynthesis, class V GE 161 150 PIK3CA phosphoinositide-3-kinase, catalytic, alpha polypeptide CNV 162 71 Pik3r1 phosphoinositide-3-kinase, regulatory subunit 1 (alpha) miRNA 163 241 PLK1 polo-like kinase 1 (Drosophila) GE 164 11 Plxnd1 plexin D1 miRNA 165 25 pnp nucleoside phosphorylase miRNA 166 29 POLR2K polymerase (RNA) II (DNA directed) polypeptide K, 7.0kDa miRNA 167 46 POM121 POM121 membrane glycoprotein (rat) miRNA 168 317 PPARG peroxisome proliferator-activated receptor gamma GE 169 149 PPP6C protein phosphatase 6, catalytic subunit CNV 170 45 PRIM1 primase, DNA, polypeptide 1 (49kDa) miRNA 171 255 PRKACB protein kinase, cAMP-dependent, catalytic, beta GE 172 58 PRKCI protein kinase C, iota miRNA 173 42 pten phosphatase and tensin homolog; phosphatase and tensin homolog pseudogene 1 miRNA 174 271 PTTG1 pituitary tumor-transforming 1; pituitary tumor-transforming 2 GE 175 105 Rab23 RAB23, member RAS oncogene family miRNA 176 446 racgap1 Rac GTPase activating protein 1 pseudogene; Rac GTPase activating protein 1 GE 177 67 RB1 retinoblastoma 1 miRNA 178 142 Rbl1 retinoblastoma-like 1 (p107) CNV 179 125 rheb Ras homolog enriched in brain miRNA 180 347 rrm2 ribonucleotide reductase M2 polypeptide GE 181 166 rsf1 remodeling and spacing factor 1 CNV 182 260 S100A8 S100 calcium binding protein A8 GE 183 235 Sfrp1 secreted frizzled-related protein 1 GE 184 15 SFRS9 splicing factor, arginine/serine-rich 9 miRNA 185 75 slc30a1 solute carrier family 30 (zinc transporter), member 1 miRNA 186 33 SLC35A1 solute carrier family 35 (CMP-sialic acid transporter), member A1 miRNA 187 451 SLC40A1 solute carrier family 40 (iron-regulated transporter), member 1 GE 188 280 slc5a6 solute carrier family 5 (sodium-dependent vitamin transporter), member 6 GE 189 226 SLC7A5 solute carrier family 7 (cationic amino acid transporter, y+ system), member 5 GE 190 257 SLC7A8 solute carrier family 7 (cationic amino acid transporter, y+ system), member 8 GE 191 407 Smarce1 SWI/SNF related, matrix associated, actin dependent regulator of chromatin, subfamily e, member 1 GE 192 230 SMC4 structural maintenance of chromosomes 4 GE 193 417 SNRPN small nuclear ribonucleoprotein polypeptide N; SNRPN upstream reading frame GE 194 219 STAT1 signal transducer and activator of transcription 1, 91kDa GE 195 308 STAT4 signal transducer and activator of transcription 4 GE 196 38 tbca tubulin folding cofactor A miRNA 197 288 Tff3 trefoil factor 3 (intestinal) GE 198 312 TFRC transferrin receptor (p90, CD71) GE 199 349 TGFB2 transforming growth factor, beta 2 GE 200 55 Tgfbr2 transforming growth factor, beta receptor II (70/80kDa) miRNA 201 90 Th1l TH1-like (Drosophila) miRNA 202 205 tk1 thymidine kinase 1, soluble GE 203 1 TNFRSF10A tumor necrosis factor receptor superfamily, member 10a miRNA 204 252 TNFSF10 tumor necrosis factor (ligand) superfamily, member 10 GE 205 232 tp53 tumor protein p53 GE 206 259 TRAF4 TNF receptor-associated factor 4 GE 207 18 TRAM1 translocation associated membrane protein 1 miRNA 208 8 TXNRD1 thioredoxin reductase 1; hypothetical LOC100130902 miRNA 209 206 Tyms thymidylate synthetase GE 210 261 UBE2C ubiquitin-conjugating enzyme E2C GE 211 47 UGP2 UDP-glucose pyrophosphorylase 2 miRNA 212 40 Vcam1 vascular cell adhesion molecule 1 miRNA 213 6 VIM vimentin miRNA 214 217 YWHAZ tyrosine 3-monooxygenase/tryptophan 5-monooxygenase activation protein, zeta polypeptide GE 215 279 ZWINT ZW10 interactor GE

  3. 제2항에 있어서,
    상기 유방암과 관련된 miRNA는,
    유방암과 관련된 것으로 알려진 공지된 miRNA인 것을 특징으로 하는 유방암에 대한 바이오마커를 발굴하는 방법.
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
KR1020120048110A 2012-05-07 2012-05-07 바이오마커 발굴 방법 KR101987477B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020120048110A KR101987477B1 (ko) 2012-05-07 2012-05-07 바이오마커 발굴 방법
US13/653,849 US20130296193A1 (en) 2012-05-07 2012-10-17 Method for discovering a biomarker
PCT/KR2012/008534 WO2013168859A1 (en) 2012-05-07 2012-10-18 Method for discovering biomarkers

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120048110A KR101987477B1 (ko) 2012-05-07 2012-05-07 바이오마커 발굴 방법

Publications (2)

Publication Number Publication Date
KR20130124745A KR20130124745A (ko) 2013-11-15
KR101987477B1 true KR101987477B1 (ko) 2019-06-10

Family

ID=49512982

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120048110A KR101987477B1 (ko) 2012-05-07 2012-05-07 바이오마커 발굴 방법

Country Status (3)

Country Link
US (1) US20130296193A1 (ko)
KR (1) KR101987477B1 (ko)
WO (1) WO2013168859A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10395759B2 (en) 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
US11410745B2 (en) * 2018-06-18 2022-08-09 International Business Machines Corporation Determining potential cancer therapeutic targets by joint modeling of survival events
CN114591418A (zh) * 2020-12-04 2022-06-07 南京大学 PPARγ蛋白的第166位苏氨酸磷酸化修饰及其应用
CN114743593B (zh) * 2022-06-13 2023-02-24 北京橡鑫生物科技有限公司 一种基于尿液进行前列腺癌早期筛查模型的构建方法、筛查模型及试剂盒

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1504123A4 (en) * 2002-05-01 2006-11-08 Irm Llc METHOD FOR DISCOVERING BIOLOGICAL TUMOR MARKERS AND TUMOR DIAGNOSIS
US20050170378A1 (en) * 2004-02-03 2005-08-04 Yakhini Zohar H. Methods and systems for joint analysis of array CGH data and gene expression data
EP2591794A1 (en) * 2006-01-05 2013-05-15 The Ohio State University Research Foundation MicroRNA expressions abnormalities in pancreatic endocrine and acinar tumors
EP2069778A2 (en) * 2006-08-03 2009-06-17 Numira Biosciences, Inc. Methods and compositions for identifying biomarkers

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Cancer Genet. Cytogenet., Vol. 189, No. 1, pp. 15-23 (2009.02.)*
Nature, Vol. 486, No. 7403, pp. 346-352 (2012.04.18.)*

Also Published As

Publication number Publication date
WO2013168859A1 (en) 2013-11-14
US20130296193A1 (en) 2013-11-07
KR20130124745A (ko) 2013-11-15

Similar Documents

Publication Publication Date Title
US8682593B2 (en) Methods, systems, and compositions for classification, prognosis, and diagnosis of cancers
EP1721159B1 (en) Breast cancer prognostics
US9057108B2 (en) Hybrid model for the classification of carcinoma subtypes
EP2333112B1 (en) Breast cancer prognostics
US20120071346A1 (en) Gene-based algorithmic cancer prognosis
CA2608643A1 (en) Gene-based algorithmic cancer prognosis
US20070134688A1 (en) Calculated index of genomic expression of estrogen receptor (er) and er-related genes
WO2008077165A1 (en) Set of tumor markers
EP3301192A1 (en) Breast tumour grading
André et al. Exonic expression profiling of breast cancer and benign lesions: a retrospective analysis
KR101987477B1 (ko) 바이오마커 발굴 방법
WO2015017537A2 (en) Colorectal cancer recurrence gene expression signature
US20140154681A1 (en) Methods to Predict Breast Cancer Outcome
WO2011039734A2 (en) Use of genes involved in anchorage independence for the optimization of diagnosis and treatment of human cancer
US20050170351A1 (en) Materials and methods relating to cancer diagnosis
AU2008294687A1 (en) Methods and tools for prognosis of cancer in ER- patients
CA2695814A1 (en) Methods and tools for prognosis of cancer in her2+ patients
US20030134324A1 (en) Identifying drugs for and diagnosis of Benign Prostatic Hyperplasia using gene expression profiles
JP2023504555A (ja) 遺伝子発現解析のための機械学習技法
US7321830B2 (en) Identifying drugs for and diagnosis of benign prostatic hyperplasia using gene expression profiles
EP2344675B1 (en) Gene expression signature of genomic instability in breast cancer
Islakoğlu et al. hsa-miR-301a-and SOX10-dependent miRNA-TF-mRNA regulatory circuits inbreast cancer
Delmonico et al. Expression concordance of 325 novel RNA biomarkers between data generated by NanoString nCounter and Affymetrix GeneChip
US9037416B2 (en) Genotypic tumor progression classifier and predictor
US20170121778A1 (en) E2f4 signature for use in diagnosing and treating breast and bladder cancer

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant