KR101887161B1 - 자폐 스펙트럼 장애의 진단용 조성물, 이를 포함하는 마이크로어레이 및 이를 검출하는 방법 - Google Patents

자폐 스펙트럼 장애의 진단용 조성물, 이를 포함하는 마이크로어레이 및 이를 검출하는 방법 Download PDF

Info

Publication number
KR101887161B1
KR101887161B1 KR1020160130648A KR20160130648A KR101887161B1 KR 101887161 B1 KR101887161 B1 KR 101887161B1 KR 1020160130648 A KR1020160130648 A KR 1020160130648A KR 20160130648 A KR20160130648 A KR 20160130648A KR 101887161 B1 KR101887161 B1 KR 101887161B1
Authority
KR
South Korea
Prior art keywords
seq
gene
probe
autism spectrum
spectrum disorder
Prior art date
Application number
KR1020160130648A
Other languages
English (en)
Other versions
KR20180039397A (ko
Inventor
오동훈
Original Assignee
오동훈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오동훈 filed Critical 오동훈
Priority to KR1020160130648A priority Critical patent/KR101887161B1/ko
Publication of KR20180039397A publication Critical patent/KR20180039397A/ko
Application granted granted Critical
Publication of KR101887161B1 publication Critical patent/KR101887161B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 자폐 스펙트럼 장애를 앓고 있는 환자군과 정상군에서의 유전자 발현 수준을 비교하여, 자폐 스펙트럼 장애에 대해 바이오마커 역할을 수행할 수 있는 하나 또는 하나 이상의 유전자 발현을 확인하였고, 이러한 유전자와 상보적으로 결합할 수 있는 프로브를 통해 자폐 스펙트럼 장애의 예후 예측 또는 진단에 유용하게 사용될 수 있다.

Description

자폐 스펙트럼 장애의 진단용 조성물, 이를 포함하는 마이크로어레이 및 이를 검출하는 방법{composition for autism spectrum disorder diagnosis, microarry containing the same and method of detecting the same}
본 발명은 혈액에서 자폐 스펙트럼 장애 발병 유무를 선택적으로 진단할 수 있는 유전자의 프로브를 포함하는 조성물, 이를 포함하는 마이크로어레이 및 자폐 스펙트럼 장애의 진단에 필요한 정보를 제공하기 위하여 상기 유전자를 검출하는 방법에 관한 것이다.
자폐 스펙트럼 장애(autism spectrum disorder; ASDs)는 사회적 상호작용의 장애, 의사소통의 장애, 반복적이고 상동증적인 행동을 보이는 신경발달 장애이다. 자폐 스펙트럼 장애는 다양한 형태로 나타나고 개인에 따라 심각한 정도가 다르며, 자폐장애(autistic disorder), 레트장애(Rett's disorder), 소아기 붕괴장애(childhood disintegrative disorder), 아스퍼거 증후군(Asperger's syndrome), 특정불능의 전반적 발달장애(Pervasive Developmental Disorder Not Otherwise Specified; PDD-NOS)를 포함한다.
자폐 스펙트럼 장애는 여러 가지 병인에 의해서 나타날 수 있는데, 환경적인 병인과 유전적인 영향에 의해 나타날 수 있다. 현재 질병 통제 센터(CDC)와 같이 많은 연구기관에서 영유아에서의 ASD의 발병률이 증가하고 있다고 보고되고 있다.
자폐증을 갖는 영유아들은 조기 집중 행동 교정과 발달 과정에 대한 집중 교육을 받아 증상이 완화되기 때문에, 4 세 이상의 영유아에서는 ASD 환자를 구별하는 것은 매우 어려운 실정이다. 따라서 초기에 ASD를 검출할 수 있는 신뢰성있는 자폐 스펙트럼 장애 진단용 마커의 개발이 시급하다.
자폐 스펙트럼 장애의 복잡한 병인(etiology)에 대해서는 아직도 제대로 밝혀진 바 없으나, 이러한 병증이 높은 확률로 유전될 가능성(heritability)이 있다는 사실에 대해서는 다양한 실험을 통해 입증된 바 있다.
그러나 이러한 자폐 스펙트럼 장애의 유전자 발현 신호 바이오마커(gene expression signature biomaker)를 개발하여, 자폐 스펙트럼 장애를 조기에 진단하려는 시도는 거의 없었으며, 특히 환자들로부터 채취가 쉽고 간편한 혈액으로부터 측정할 수 있는 특이적 유전자 발현 신호들을 진단적 또는 예후 인자로 공식적으로 권장되는 표지자는 개시된 바 없다.
본 발명은 상술한 문제점을 해결함과 동시에, 검사자 특히 영유아의 혈액으로부터 쉽고 빠르게 자폐 스펙트럼 장애 여부를 예측 및 진단할 수 있도록 하는 바이오마커를 개발하고자 노력한 바 본 발명을 완성하기에 이르렀다.
특허문헌 1 : 대한민국 공개특허공보 제10-2009-0056921호
상기와 같은 문제점을 감안하여 안출된 것으로, 본 발명의 목적은 다수의 유전자와 상보적으로 결합하는 프로브를 바이오마커로 하여, 이의 변화양상을 이용하여 간편하게 자폐 스펙트럼 장애 환자를 구별할 수 있도록 하는 자폐 스펙트럼 장애의 진단용 조성물을 제공하는 것이다.
또한 본 발명의 다른 목적은 검사자의 혈액으로부터 쉽고 간편하게 자폐 스펙트럼 장애의 예후 또는 진단이 가능한 마이크로어레이를 제공하는 것이다.
또한 본 발명의 또 다른 목적은 자폐 스펙트럼 장애의 진단에 필요한 정보를 제공하기 위하여, PKM(pyruvate kinase, muscle) 유전자 발현을 검출할 수 있는 프로브를 이용한 PKM 유전자를 검출하는 방법을 제공하는 것이다.
본 발명은 상기 목적을 이루기 위하여, PKM 유전자에 상보적으로 결합할 수 있는 프로브를 포함하는 자폐 스펙트럼 장애의 진단용 조성물을 제공한다.
상기 프로브는 서열번호 10의 염기서열을 포함하는 올리고뉴클레오티드인 것을 특징으로 한다.
본 발명은 상기 다른 목적을 이루기 위하여, 서열번호 1 내지 22로 표시되는 염기서열 중에서 선택되는 어느 하나이상의 올리고뉴클레오티드 프로브를 포함하는 자폐 스펙트럼 장애의 진단용 조성물을 제공한다.
상기 올리고뉴클레오티드 프로브는 서열번호 1 내지 19로 표시되는 염기서열인 것을 특징으로 한다. 즉, 상기 자폐 스펙트럼 장애의 진단용 조성물은 서열번호 1 내지 19로 표시되는 염기서열의 올리고뉴클레오티드 프로브로 이루어진 것일 수 있다.
상기 올리고뉴클레오티드 프로브는 서열번호 1, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 10, 서열번호 16, 서열번호 20, 서열번호 21 및 서열번호 22로 표시되는 염기서열인 것을 특징으로 한다. 즉, 상기 자폐 스펙트럼 장애의 진단용 조성물은 서열번호 1, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 10, 서열번호 16, 서열번호 20, 서열번호 21 및 서열번호 22로 표시되는 염기서열의 올리고뉴클레오티드 프로브로 이루어진 것일 수 있다.
본 발명은 상기 또 다른 목적을 이루기 위하여, 상기 자폐 스펙트럼 장애 진단용 조성물을 포함하는 자폐 스펙트럼 장애의 진단용 마이크로어레이를 제공한다.
본 발명은 상기 또 다른 목적을 이루기 위하여, 자폐 스펙트럼 장애의 진단에 필요한 정보를 제공하기 위하여, 상기 유전자 발현을 검출할 수 있는 프로브를 이용한 상술한 유전자를 검출하는 방법을 제공한다.
본 발명은 자폐 스펙트럼 장애를 앓고 있는 환자군과 정상군에서의 유전자 발현 수준을 비교하여, 자폐 스펙트럼 장애에 대해 바이오마커 역할을 수행할 수 있는 하나 또는 하나 이상의 유전자 발현을 확인하였고, 이러한 유전자와 상보적으로 결합할 수 있는 프로브를 통해 자폐 스펙트럼 장애의 예후 예측 또는 진단에 유용하게 사용될 수 있다.
게다가 상술한 유전자 또는 프로브는 검사자의 혈액 시료로부터 자폐 스펙트럼 장애 진단에 필요한 정보를 제공할 수 있으므로, 채취부터 진단까지 신속하고 빠르게 이루어지도록 할 뿐만 아니라, 이를 이용하여 보다 효율적으로 치료제를 개발할 수 있다.
또한 본 발명에 따른 자폐 스펙트럼 장애 진단용 조성물은 자폐 스펙트럼 장애를 앓고 있는 환자군과 정상군의 분류에 있어서 정확도, 민감도 및 특이도가 매우 우수하다.
도 1은 발현 데이터를 정규화하기 전(a)과 후(b)의 박스형 플롯이다.
상기 각각의 박스에서 흑색선은 데이터의 각각 세트의 중앙값을 나타내는 것이다. 상기 중앙값(medians; 흑색선)은 거의 동일하고, 정규화된 플롯(b)과 raw 데이터(a)를 비교하였을 때 좋은 성능을 나타내고 있다.
도 2는 본 발명에 따른 자폐 스펙트럼 장애 진단용 유전자를 분류하기 위한 과정을 도시한 순서도이다.
도 3은 ASD 환자군과 정상군에서의 선택적인 유전자 발현 프로파일을 위한 Volcano 플롯이다. 상기 청색 선은 FWER(family wise error rate)에서 P-값(P-value)가 0.05(-log10p=5.5)로 나타난 것이다.
도 4는 정상군의 트레이닝 데이터세트와 자폐 스펙트럼 장애(ASD)를 앓고 있는 환자군의 트레이닝 데이터세트를 비교하기 위해, 유의성이 우수한(수정된 P-값; adj. P-values < 0.05) 프로브들을 나타낸 것이다.
도 5는 실험예 1에서 선발된 19 개의 DE 프로브를 두 가지 방법에 따른 계층적 클러스터 분석으로 분석한 히트맵(heat-map)을 나타낸 도면이다. 각각 열(row)은 단일 프로브로 인해 측정된 유전자의 상대적인 발현양을 나타낸 것이고, 상기 적색 또는 녹색은 각각 상대적으로 높거나 낮은 각각의 프로브로 인해 측정된 유전자 발현양을 나타낸 것이다.
도 6a, 도 6b는 정상군(청색 점), ASD 환자군(적색 점)을 잘 구별하는지 여부를 판단하기 위해, 본 발명에 따른 프로브들 중에서 A_23_P399501 프로브 ID를 갖는 PKM 유전자와 상보적으로 결합하는 프로브의 ROC(receiver poerating characteristic) 그래프이다.
이하에서, 본 발명의 여러 측면 및 다양한 구현예에 대해 더욱 구체적으로 살펴보도록 한다.
본 발명은 자폐 스펙트럼 장애를 앓고 있는 환자군과 정상군의 전사체를 비교 분석을 통해, 자폐 스펙트럼 장애에 대한 특정 단일 또는 다중 유전자를 찾기 위한 연구를 거듭한 끝에 완성하게 되었다.
본 발명의 다른 측면은 PKM 유전자에 상보적으로 결합할 수 있는 프로브를 포함하는 자폐 스펙트럼 장애의 진단용 조성물에 관한 것이다.
본 발명에서 사용된 용어 "마커", "바이오 마커" 또는 "진단용 마커"란 정상이나 병적인 상태를 구분할 수 있거나 치료반응을 예측할 수 있고 객관적으로 측정할 수 있는 표지자를 의미한다. 특히, 본 발명에서 자폐 스펙트럼 장애과 관련해서는, 정상 대조군(자폐 스펙트럼 장애가 아닌 개체 또는 군)에 비해 자폐 스펙트럼 장애를 앓고 있거나, 자폐 스펙트럼 장애 발병 가능성(위험성)이 있는 개체 또는 집단에서 단백질 발현 수준 또는 유전자 발현 수준이 유의적으로 증가하거나 감소하는 양상을 보이는, 폴리펩타이드 또는 핵산(예: mRNA 등), 지질, 당지질, 당단백질, 당(단당류, 이당류, 올리고당류 등) 등과 같은 유기 생체 분자 등을 의미한다.
본 발명에서 자폐 스펙트럼 장애의 예후 또는 진단할 수 있는 바이오마커로 활용될 수 있는 PKM(Pyruvate kinase) 유전자는 일반적으로 해당작용(glycolysis)에 관여하는 효소의 유전자로 알려져 있고, 이의 구체적인 염기서열 및 단백질 정보는 NCBI에 공지되어 있다.
상기 PKM의 주요 기능은 아데노신 트리포스페이트(ATP) 한 분자와 피부르산 한 분자를 생성하는 해당작용의 최종 단계에 작용하는 효소로, 포스포에놀피루브산(phosphoenolpyruvate; PEP)로부터 아데노신 디포스페이트(adenosine diphosphate; ADP)로 포스페이트 작용기의 전이를 촉진하는 역할을 수행한다.
본 발명에서 자폐 스펙트럼 장애를 앓고 있는 환자군과 정상군(대조군; control)을 대상으로 유전자발현수준을 비교한 결과, ASD를 앓고 있는 환자군에서 정상군에서보다 PKM 유전자의 발현이 가장 유의적(P-값<0.05)으로 증가하는 것을 확인하였다. 즉, 상기 PKM 유전자의 발현 수준을 확인함으로써, 자폐 스펙트럼 장애의 예후를 예측하거나, 진단할 수 있는 것이다.
따라서 본 발명은 상기 PKM 유전자 발현을 검출하여, 자폐 스펙트럼 장애의 진단에 필요한 정보를 제공하기 위하여, 상기 PKM 유전자에 상보적으로 결합할 수 있는 프로브(probe ID : A_23_P399501, 대상 유전자: PKM)를 포함하는 자폐 스펙트럼 장애의 진단용 조성물을 제공하고 있다.
상기 프로브는 서열번호 10의 염기서열을 포함하는 올리고뉴클레오티드 군에서 선택되는 어느 하나 이상의 올리고뉴클레오티드 프로브일 수 있다.
본 발명의 일 실시예에 따르면 자폐 스펙트럼 장애 환자군 및 정상군에서 선택적으로 발현이 증가된 각각의 마이크로어레이 데이터세트로부터 유전자 또는 상기 유전자와 상보적으로 결합하는 프로브를 선택한 후 다양한 알고리즘을 적용하여 예측율을 측정하였다.
다양한 알고리즘의 반복 실시를 통해 예견 정확성을 확인한 결과, 선정된 유전자들 중에서 PKM 유전자가 가장 신뢰도가 높은 것으로 선택되었다. 따라서, 본 발명의 유의성 있는 예후 예측 유전자의 발현정도를 측정하여 얻은 결과를 토대로 예후 예측된 결과는 타당하게 신뢰할 수 있다.
현재까지 상기 PKM 유전자가 자폐 스펙트럼 장애의 예후 또는 진단을 위한 바이오마커로 사용된 예가 개시된 종래 기술은 전혀 알려진 바가 없다. 또한 상기 PKM 유전자에 상보적으로 결합하여, 이의 발현을 검출할 수 있는 프로브를 이용하여 자폐 스펙트럼 장애의 예후 또는 진단할 수 있다는 예도 개시된 바 없다.
상기 "예후"란 자폐 스펙트럼 장애와 같은 질환의 병의 경과 및 완치 여부를 의미하는 것이다.
본 발명에서 "진단"은 병리 상태의 존재 또는 특징을 확인하는 것을 의미하는 것으로, 본 발명의 목적 상 진단이라 함은 자폐 스펙트럼 장애의 발병 여부를 확인하는 것이다.
본 발명에서 PKM 유전자 및 이와 상보적으로 결합할 수 있는 프로브는 자폐 스펙트럼 장애를 갖는 환자군과 정상적인 대조군 그룹을 정확히 구별할 수 있도록 하는 "바이오마커" 물질로, 이는 본 발명의 목적상 정상 혈액 시료, 특히 백혈구에서보다 자폐 스펙트럼 장애를 앓고 있는 환자의 혈액 시료 또는 백혈구에서 특이적으로 높은 수준의 발현을 보이는 유전자 또는 이와 상보적으로 결합할 수 있는 프로브이다.
본 발명의 다른 측면은 자폐 스펙트럼 장애의 진단에 필요한 정보를 제공하기 위하여, PKM(pyruvate kinase, muscle) 유전자 발현을 검출할 수 있는 프로브를 이용한 PKM 유전자를 검출하는 방법에 관한 것이다.
본 발명에 따른 PKM 유전자 발현을 검출할 수 있는 상기 프로브를 이용하여, 검사자의 혈액 시료로부터 자폐 스펙트럼 장애의 진단에 필요한 정보를 제공할 수 있다.
상기 PKM 유전자는 자폐 스펙트럼 장애의 예후를 예측하거나 진단하기 위한 바이오마커인지를 측정한, 유의성 있는 예후 예측 실험을 통해 확인한 것으로, 알고리즘을 적용하여 측정한 ROC 커브 실험 결과, 예측률이 매우 높으면서도, 단일 프로브만으로도 정확도가 매우 높다는 장점을 갖는다.
다시 말해, 상기 PKM 유전자의 발현을 검출하여, 검사자의 자폐 스펙트럼 장애에 대한 예후 또는 진단할 수 있는 필요한 정보를 제공할 수 있게 되고, 이를 위해 상기 PKM 유전자의 발현을 검출할 수 있는, 상기 PKM 유전자에 상보적으로 결합하는 프로브를 이용할 수 있다.
본 발명의 일 실시예에 따르면, 상기 PKM 유전자의 발현이 증가한 경우에 자폐 스펙트럼 장애 발명 가능성에 대한 예후를 예측하거나 진단할 수 있다.
본 발명에서 "유전자 또는 전사체(transcript)"는 서로 혼용하여 사용될 수 있다.
본 발명에서 "선택적으로 발현된 유전자(differentially expressed genes, DEGs)"는 정상군 (또는 대조군)(control)에서의 발현에 비하여, 자폐 스펙트럼 장애를 앓고 있는 환자군에서 그 발현이 보다 높거나 보다 낮은 수준으로 활성화되는 유전자를 말하는 것으로써, 이 용어는 그 발현이 동일한 자폐 스펙트럼 장애의 상이한 병기에서 보다 높거나 보다 낮은 수준으로 활성화되는 유전자를 의미한다. 이러한 유전자의 발현은 2 개 이상의 유전자 또는 이의 유전자 산물 간의 발현을 비교하여 측정될 수 있다.
"differentially"란 정상군과 환자군에서 질병 발생의 다양한 병기에서 주어진 유전자의 발현 사이에 적어도 약 2배, 바람직하게는 약 4배의 차이가 있을 때 존재하는 것으로 간주되는 것이다.
상기 프로브는 서열번호 10의 염기서열을 포함하는 올리고뉴클레오티드 군에서 선택되는 어느 하나 이상의 올리고뉴클레오티드 프로브일 수 있다.
본 발명의 또 다른 측면은 상기 PKM 유전자와 상보적으로 결합할 수 있는 프로브를 포함하는 마이크로어레이에 관한 것이다.
본 발명에 따른 마이크로어레이는 자폐 스펙트럼 장애 환자군에서 선택적으로 발현이 증가된 PKM 유전자의 발현수준을 확인하여 검사 대상에게서 상기 유전자의 과다 발현 여부를 확인하고, 정상군에서 발현이 증가된 PKM 유전자의 발현 수준을 확인하여 검사 대상에게서 상기 PKM 유전자의 과다 발한 여부를 확인함으로써 자폐 스펙트럼 장애의 가능성을 예후 예축하거나 진단할 수 있다.
본 발명에 따른 마이크로어레이는 PKM 유전자의 발현수준을 확인하기 위하여 PKM 유전자와 상보적으로 결합하는 상술한 프로브가 집적되어 있는 것으로서, 이외에 다른 구성성분, 용액 또는 장치가 더 포함될 수 있다.
상기 프로브는 서열번호 1의 염기서열을 포함하는 올리고뉴클레오티드 프로브일 수 있다.
바람직하게 상기 마이크로어레이는 상기 자폐 스펙트럼 장애와 관련된 PKM 유전자와 상보적으로 결합하는 프로브를 포함하는 것을 제외하고는 통상적인 마이크로어레이의 구성을 포함하는 것이라면 특별히 이에 제한되지 않는다.
상기 PKM 유전자와 상보적으로 결합할 수 있는 프로브를 기판 상에 고정화하여 마이크로어레이를 제조하는 방법 역시, 통상의 방법이라면 특별히 이에 제한되지 않는다.
본 발명의 또 다른 측면은 서열번호 1 내지 22로 표시되는 염기서열 중에서 선택되는 어느 하나의 올리고뉴클레오티드 프로브를 포함하는 자폐 스펙트럼 장애의 진단용 조성물에 관한 것이다.
보다 구체적으로 자폐 스펙트럼 장애를 앓고 있는 환자군과 정상군(대조군; control)을 대상으로 유전자발현수준을 비교한 결과, ASD를 앓고 있는 환자군에서 정상군에서 발현이 가장 유의적(P-값<0.05)으로 증가한 다중 유전자를 확인하였다. 즉, 상기 유전자들의 발현 수준을 확인함으로써, 자폐 스펙트럼 장애의 예후를 예측하거나, 진단할 수 있는 것이다.
다시 말해, 이들 중에서 어느 하나의 유전자와 상보적으로 결합하는 프로브를 단독 또는 조합으로 사용할 수 있으나, 다중 유전자와 각각의 유전자와 상보적으로 결합하는 프로브의 조합을 사용하였을 때, 자폐 스펙트럼 장애 예후 예측 및 진단 정확도가 현저히 높아지는 것을 후술하는 실험예에서 확인하였다.
본 발명의 일 실시예에 따르면, 상기 22 개의 올리고뉴클레오티드 프로브(서열번호 1 내지 22로 표시되는 염기서열) 중에서도 특히 서열번호 1 내지 19로 표시되는 염기서열의 올리고뉴클레오티드 프로브 조합을 포함할 경우, 후술하는 실험예에서 나타난 바와 같이 ASD 환자군과 정상군의 혈액 시료를 얻은 후, 이를 마이크로어레이로 분석한 데이터세트를 분석하여 자폐 스펙트럼 장애와 상관성을 보이는 유전자들을 검출할 수 있는 상기 19개의 프로브 조합을 선발하였고, 이를 예측 알고리즘을 적용한 결과, KNN, SVM 알고리즘을 사용한 경우 정확도(accuracy), 민감도(sensitivity) 및 특이도(specificity)가 각각 87-100%의 범위로 측정되었고, 음성/양성 예측 수치(positive predictive value %, negative predictive value %)도 88-100%로 매우 유의성 있음을 확인할 수 있다.
본 발명의 일 실시예에 따르면, 상기 프로브는 바람직하게 서열번호 1 내지 19로 표시되는 염기서열 중에서 선택되는 어느 하나의 올리고뉴클레오티드 프로브로 이루어진 군의 조합일 수 있다.
한편 상기 22 개의 올리고뉴클레오티드 프로브(서열번호 1 내지 22로 표시되는 염기서열) 중에서 특히 서열번호 1, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 10, 서열번호 16, 서열번호 20, 서열번호 21 및 서열번호 22로 표시되는 염기서열의 올리고뉴클레오티드 프로브 조합을 사용할 경우, 후술하는 실험예에서 나타난 바와 같이 ASD 환자군과 정상군의 혈액 시료를 얻은 후, 이를 마이크로어레이로 분석한 데이터세트를 분석하여 자폐 스펙트럼 장애와 상관성을 보이는 유전자들을 검출할 수 있는 상기 9개의 프로브 조합을 선발하였고, 이를 예측 알고리즘을 적용한 결과, KNN, SVM 알고리즘뿐만 아니라 LDA 알고리즘을 사용한 경우 모두에서 정확도(accuracy), 민감도(sensitivity) 및 특이도(specificity)가 각각 87-100%의 범위로 측정되었고, 음성/양성 예측 수치(positive predictive value %, negative predictive value %)도 88-100%로 매우 유의성 있음을 확인할 수 있다.
즉, 서열번호 1 내지 22로 표시되는 염기서열 중에서 선택되는 어느 하나이상의 올리고뉴클레오티드 프로브를 포함하는 자폐 스펙트럼 장애의 진단용 조성물은 이 자체만으로도 충분히 자폐 스펙트럼 장애를 진단할 수 있으나, 보다 정확성 및 민감도 및 특이도가 향상되기 위해서는 서열번호 1 내지 19로 표시되는 염기서열의 올리고뉴클레오티드 프로브로 이루어진 것이 바람직하고, 일반적인 세가지 예측 알고리즘 모두에서 정확도, 민감도 및 특이도가 87 % 이상이기 위해서는 서열번호 1, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 10, 서열번호 16, 서열번호 20, 서열번호 21 및 서열번호 22로 표시되는 염기서열의 올리고뉴클레오티드 프로브로 이루어진 것이 가장 바람직하다.
본 발명의 일 실시예에 따르면 자폐 스펙트럼 장애 환자군 및 정상군에서 선택적으로 발현이 증가된 각각의 마이크로어레이 데이터세트로부터 유전자 또는 상기 유전자와 상보적으로 결합하는 프로브를 선택한 후 다양한 알고리즘을 적용하여 예측율을 측정하였다.
이중에서도 가장 바람직한 조합은 서열번호 1, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 10, 서열번호 16, 서열번호 20, 서열번호 21 및 서열번호 22로 표시되는 염기서열의 올리고뉴클레오티드 프로브로 이루어진 것일 수 있다.
특히 상술한 서열번호 1, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 10, 서열번호 16, 서열번호 20, 서열번호 21 및 서열번호 22로 표시되는 염기서열의 올리고뉴클레오티드 프로브 즉, 9 개의 프로브 조합을 사용할 경우, 후술하는 실험예에서 나타난 바와 같이 ASD 환자군과 정상군의 혈액 시료를 얻은 후, 이를 마이크로어레이로 분석한 데이터세트를 분석하여 자폐 스펙트럼 장애와 상관성을 보이는 유전자들을 검출할 수 있는 상기 9개의 프로브 조합을 선발하였고, 이를 예측 알고리즘을 적용한 결과, KNN, SVM 알고리즘뿐만 아니라 LDA 알고리즘을 사용한 경우 모두에서 정확도(accuracy), 민감도(sensitivity) 및 특이도(specificity)가 각각 87-100%의 범위로 측정되었고, 음성/양성 예측 수치(positive predictive value %, negative predictive value %)도 88-100%로 매우 유의성 있음을 확인할 수 있다.
본 발명의 다른 측면은 자폐 스펙트럼 장애의 진단에 필요한 정보를 제공하기 위하여, 앞서 기술된 유전자 발현을 검출할 수 있는 프로브를 이용하여, 상기 유전자를 검출하는 방법에 관한 것이다.
상기 유전자는 검사자의 혈액 시료 특히, 백혈구로부터 측정이 가능하기 때문에, 검사자로부터 쉽게 얻을 수 있고, 유전자 발현의 검출과정도 편리하다는 장점을 갖는다.
상기 유전자는 검사자의 혈액 시료로부터 쉽게 측정이 가능하면서 자폐 스펙트럼 장애와 상관성을 갖는 것으로, 상기 프로브는 이러한 유전자들과 상보적으로 결합하여 검출할 수 있는 서열번호 1 내지 22로 표시되는 염기서열로써, 이들 프로브 중에서 서열번호 1 내지 19로 표시되는 염기서열의 올리고뉴클레오티드 프로브의 구체적인 정보는 하기 도 4에 나타내었다.
상기 프로브를 이용하여 자폐 스펙트럼 장애와 상관성을 갖는 상술한 유전자들 중에서 어느 하나이상의 유전자 발현을 검출할 수 있다면, 검사자의 혈액 시료로부터 자폐 스펙트럼 장애의 진단에 필요한 정보를 제공할 수 있는 것을 특징으로 한다.
이때, 상기 유전자 발현을 검출할 수 있도록 하는, 상기 각각의 유전자들과 상보적으로 결합할 수 있는 프로브들은 다음과 같다.
서열번호 1 내지 22로 표시되는 염기서열 중에서 선택되는 어느 하나이상의 올리고뉴클레오티드 프로브일 수 있다.
바람직하게 상기 22 개의 프로브들을 통해 상기 유전자들의 발현을 모두 측정하거나, 그 중에서 선택되는 어느 하나 이상의 유전자 조합들의 발현을 측정할 수 있는데, 구체적으로 서열번호 1 내지 19로 표시되는 염기서열의 올리고뉴클레오티드 프로브로 이루어진 19 개의 프로브들을 이용하는 것이 우수한 정확도, 민감도 및 특이도를 갖는 정보를 제공할 수 있고, 보다 바람직하게는 서열번호 1, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 10, 서열번호 16, 서열번호 20, 서열번호 21 및 서열번호 22로 표시되는 염기서열의 올리고뉴클레오티드 프로브들로 이루어진 9개의 프로브 조합을 이용하는 것이, 세가지 예측 알고리즘 모두에서 가장 우수한 정확도, 민감도, 특이도를 갖는 정보를 제공하는 것일 수 있다.
본 발명의 일 실시예에 따르면 자폐 스펙트럼 장애 환자군 및 정상군에서 선택적으로 발현이 증가된 각각의 마이크로어레이 데이터세트로부터 유전자 또는 상기 유전자와 상보적으로 결합하는 프로브를 선택한 후 다양한 알고리즘을 적용하여 예측율을 측정하였다.
그러나 가장 바람직한 조합은 서열번호 1, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 10, 서열번호 16, 서열번호 20, 서열번호 21 및 서열번호 22로 표시되는 염기서열의 올리고뉴클레오티드 프로브로 이루어진 것인 것일 수 있다.
앞서 나열한 9 개의 프로브 조합을 사용할 경우, 후술하는 실험예에서 나타난 바와 같이 ASD 환자군과 정상군의 혈액 시료를 얻은 후, 이를 마이크로어레이로 분석한 데이터세트를 분석한 결과, 자폐 스펙트럼 장애와 상관성을 보이는 유전자들을 검출할 수 있는 상기 9개의 프로브 조합을 선발하였고, 이를 예측 알고리즘을 적용한 결과, KNN, SVM 알고리즘뿐만 아니라 LDA 알고리즘을 사용한 경우 모두에서 정확도(accuracy), 민감도(sensitivity) 및 특이도(specificity)가 각각 87-100%의 범위로 측정되었고, 음성/양성 예측 수치(positive predictive value %, negative predictive value %)도 88-100%로 매우 유의성 있음을 확인할 수 있다.
본 발명의 또 다른 측면은 상기 유전자와 상보적으로 결합할 수 있는 프로브를 포함하는 마이크로어레이에 관한 것이다.
본 발명에 따른 마이크로어레이는 자폐 스펙트럼 장애 환자군에서 선택적으로 발현이 증가된 유전자의 발현수준을 확인하여 검사 대상에게서 상기 유전자의 과다 발현 여부를 확인하고, 정상군에서 발현이 증가된 유전자의 발현 수준을 확인하여 검사 대상에게서 상기 유전자의 과다 발한 여부를 확인함으로써 자폐 스펙트럼 장애의 가능성을 예후 예축하거나 진단할 수 있다.
본 발명에 따른 마이크로어레이는 상기 유전자의 발현수준을 확인하기 위하여 상기 유전자 각각에 대해 상보적으로 결합하는 각각의 프로브가 집적되어 있는 것으로서, 이외에 다른 구성성분, 용액 또는 장치가 더 포함될 수 있다.
바람직하게 상기 마이크로어레이는 상기 자폐 스펙트럼 장애와 관련된 상기 유전자와 상보적으로 결합하는 프로브를 포함하는 것을 제외하고는 통상적인 마이크로어레이의 구성을 포함하는 것이라면 특별히 이에 제한되지 않는다.
상기 유전자와 상보적으로 결합할 수 있는 프로브를 기판 상에 고정화하여 마이크로어레이를 제조하는 방법 역시, 통상의 방법이라면 특별히 이에 제한되지 않는다.
본 발명에서는 자폐 스펙트럼 장애와 관련된 유전자를 선발하기 위하여 다음과 같은 방법을 이용하였다.
1) 마이크로어레이 데이터세트를 이용하여, 특정 라이브러리 내의 전체 발현량과 특정 라이브러리내 특정 유전자 발현량의 비율인 유전자 발현량을 구하는 단계;
2) 상기 각 데이터세트에서 구한 유전자 발현량을 이용하여 p-값을 측정하여, p-값이 낮은 순으로 유전자를 정렬하는 단계;
3) 상기 데이터세트에서 p-값이 0.01 내지 0.05인 유전자를 선별하는 단계;를 포함한다.
본 발명자는 우선 데이터 세트를 구성하고자 Gene Expression Omnibus(GEO, http://www.ncbi.nlm.nih.gov/geo/) database,12)에 공개된 마이크로 어레이 데이터세트(GSE26415) 자료를 입수하였다.
상기 데이터세트는 활용 가능한 데이터 베이스를 기반으로 하여 통합한 것이라면 특별히 이에 제한되지 않는다. 상기 데이터세트로부터 입수한 자료를 이용하여, 각각의 유전자에 대한 발현량을 결정하였다.
상기의 데이터세트로부터 입수한 자료를 이용하여 상기 두 집단에서의 유전자 발현 수준에 차이가 있는지를 t-검정(t-test)를 통해 조사하였다. 상기 t-검정 결과에서 나온 P-값에 따라 유전자의 순위를 결정하였다.
3) 상기 선별된 유전자의 P-값을 측정하여 P-값이 낮은 순서대로 유전자를 선별한다. 상기 방법으로 선발된 유전자들 중에서, P-값이 0.05 이하인, 바람직하게는 0.05 내지 0.01인 유전자를 검출할 수 있다.
이러한 마이크로어레이를 이용한 다중 유전자 발현을 사용한 예측 모델은 스크리닝, 진단 및 예후 진단을 위해 광범위하게 적용될 수 있다.
이하에서 실시예 등을 통해 본 발명을 더욱 상세히 설명하고자 하며, 다만 이하에 실시예 등에 의해 본 발명의 범위와 내용이 축소되거나 제한되어 해석될 수 없다. 또한, 이하의 실시예를 포함한 본 발명의 개시 내용에 기초한다면, 구체적으로 실험 결과가 제시되지 않은 본 발명을 통상의 기술자가 용이하게 실시할 수 있음은 명백한 것이며, 이러한 변형 및 수정이 첨부된 특허청구범위에 속하는 것도 당연하다.
<실험방법>
1) 마이크로어레이 데이터의 분석
공개적으로 사용가능한 마이크로 어레이 데이터세트(GSE26415)를 Gene Expression Omnibus(GEO, http://www.ncbi.nlm.nih.gov/geo/) database,12)으로부터 다운로드 받아 사용하였다.
원래 데이터는 ASD를 앓고 있는 젊은 성인 집단의 혈액에서 분리된 말초 백혈구(peripheral leukocyte); 이와 나이, 성별이 동일한 정상군(control)의 혈액에서 분리된 말초 백혈구(peripheral leukocyte); ASD를 앓고 있는 어린이 집단과 ASD를 앓고 있는 건강한 여성집단의 혈액에서 분리된 말초 백혈구(peripheral leukocyte); 및 이와 동일한 나이, 성별의 정상군의 혈액에서 분리된 말초 백혈구(peripheral leukocyte);에 대한 21개의 시료를 포함하고 있다. 상기 플랫폼 정보는 GPL6480(Agilent-014850 Whole Human Genome Microarray 4x44K G4112F)이다.
본 연구에서 ASD(n=21)을 앓고 있는 환자군과 이들과 매치되는 정상군(n=21)로부터 얻은 42 개의 마이크로어레이 데이터를 활용하였다.
상술한 집단들에 대한 인구 통계학적 및 임상적 특성은 하기 표 1에 요약하였다.
ASD를 앓고 있는 환자군(n=21) 정상군(control)(n=21)
실태적인 인구통계[Demographic]
Gender, M/F 17/4 17/4
Age, Mean(SD) 26.7(5.5) 27.0(5.5)
임상실험 결과[Clinical]
WAIS AQ, Mean(SD) 30.2(5.1) NA
VIQ, Mean(SD) 96.2(19.9) NA
PIQ, Mean(SD) 87.5(21.6) NA
FIQ, Mean(SD) 91.9(21.6) NA
표 1에서 용어, ASD는 자폐 스펙트럼 장애(autism spectrum disorder)를 나타내는 것이고, WAIS는 웩슬러 성인용 지능검사(Wechsler Adult Intelligence Scale)를 의미하는 것이다.
또한, 'IQ'는 지능을 측정하여 나타낸 수치Intelligence quotients)를 나타내는 것이고, 'VIQ'는 언어성 지능(Verbal IQ)을 나타낸 것이며, 'PIQ'는 수행지능지수(Performance IQ)를 나타내는 것이며, 'FIQ'는 총 지능지수(Full IQ)를 의미하는 것이며, 'AQ'는 자폐증 지수 검사(Autism spectrum quotient)를 의미한다.
아울러 'M'은 남성(Male), 'F'는 여성(Female), 'SD'는 표준편차(Standard deviation)이며, 'NA'는 적용되지 않음(Not applied)을 의미한다.
2) 선택적으로(differentially) 발현된 유전자의 전처리(preprocessing)와 선발(selection)
.CEL 형식에서의 raw 데이터는 주로 R 언어(http://www.r-project.org/) "limma" package를 이용하여 처리하였다. 데이터세트는 "read.maimages" 기능을 사용하는 R을 도입하였고; 상기 "normexp" 기능을 사용하여 바탕을 보정(background correction)하였다.
상기 수정된 데이터를 정규화(또는 표준화; normalization)하기 위해, 도 1에서와 같이 사분위도(Quatile) 방법을 통해 로그(logarithm)로 변형하였다.
상술한 마이크로어레이 데이터세트로부터 후보 발현 유전자를 선발하기 위하여 필터링을 하는데, 상기 각 마이크로어레이의 전체 음성 프로브의 95% 이상이 갖고 있는 값을 표준 밝기 값(standard point of brightness)으로 설정하여 수행하였다. 예컨대, 상기 프로브가 총 마이크로어레이 중에서 표준 밝기 값에 비해 10% 미만이라면, 정상군과 낮은 발현 프로브는 필터링과정을 통해 제외되는 것이다.
상기 "avereps" 기능은 각각의 마이크로어레이 데이터세트로부터 반복되는 스팟(spot)의 평균을 사용하는 것이다.
이어서, 상기 limma package로부터 선발된 선택적으로 발현된(DE) 프로브는 중도 t-검정(moderated t-test)을 사용하여 ASD를 앓고 있는 환자군과 정상군(대조군, control)로 나누어 두 군에서 mRNA 발현수준에 차이가 있는지 조사하였다. t-검정 결과에서 나온 P-값이 작은 순서대로(즉, 유의한 정도가 큰 순서대로) 전사체의 순위를 결정하였다.
이때 P-값은 본페로니 교정(Bonferroni correction)을 이용하여 엄격한 다중 분석을 시행하였고, 이렇게 보정된(adjusted) P-값을 이용하여 유의성이 있는 프로브를 선별하는 것이다. 상기 데이터세트에서 구한 프로브 중에서 P-값이 0.05 이하인 것들만 유의한 프로브로 간주하여 유전자를 선발하였다.
3) 기계 학습 알고리즘을 이용한 예측모델의 개발
본 발명자들은 테스트 세트에서 ASD를 앓고 있는 환자군과 정상군(control, 대조군)을 구별할 수 있는 유전자를 선발하기 위해, 전체 환자 중에서 1명을 선택하여 실험집합(test set 또는 테스트 데이터세트라고도 한다.)으로 설정하고, 나머지를 학습집합(이하, 트레이닝 세트 또는 트레이닝 데이터세트라고도 한다.)으로 설정하였다.
상기 트레이닝 세트 중에서 선택된 일부 DE 프로브를 사용하여 기계 학습 알고리즘을 학습시킨 후 실험집합의 예후를 예측하였다. 이러한 검증은 다양한 감독하 기계 학습 알고리즘(supervised machine learning algorithm)을 적용하였다. 본 발명에서는 총 두가지 유형을 사용하였고, 본 실시예에서 사용된 알고리즘은 다음과 같다:
우선, 비감독 학습(unsupervised learning)은, 완전한 결합(complete linkage)와 유클리드 거리(Eucildean distance)를 사용하여 계층적(hierarchical)으로 클러스터를 분석하는 전략을 채택하였다. 이러한 클러스터 분석 및 이의 시각화(visualization)는 R 통계 프로그램에서 상기 "gplots" package의 "heatmap.2' 기능을 사용하여 수행하였다.
다음으로 감독하 학습은, 본 발명자들은 상기 서포트 벡터 기계(support vector machine; SVM), K-최인접 이웃(K-nearest neighbors; KNN) 및 선형 판별 분석(linear discriminant analysis; LDA)의 서로 다른 세가지 기계 학습 알고리즘을 사용하였다.
본 발명자들은 상기 순차적 단계를 통한 예측 분석을 수행하였는데, 우선 학습집합 데이터세트(13 개의 ASD 환자군과 13 개의 정상군(대조군))과 데스트 데이터세트(8 개의 ASD 환자군과 8 개의 정상군(대조군))로 본 발명의 데이터(n=42)를 인위적으로 나누어 수행하였다.
상술한 각각의 알고리즘은 상기 트레이닝 데이터세트로부터 26 개의 DE 프로브를 랜덤하게 선택한 것을 이용하여, 학습시켰다.
테스트 데이터세트에서 8 개의 ASD 환자군과 8 개의 정상군이 검증되었고, 모든 감독 기계 학습 분석은 R 언어 중에서 "MLinterfaces" packages를 사용하여 수행되었다.
도 2는 본 발명에 따른 자폐 스펙트럼 장애 진단용 유전자를 분류하기 위한 과정을 도시한 순서도이다. 이러한 연구 설계에 대한 프로토콜은 한양대학교 병원 제도 검토위원회(HYUH IRB-2015-05-008)의 검토과정을 통해 승인되었다.
<실험예 1> ASD 그룹과 대조군 그룹 사이에서 변경된 유전자 발현 프로파일링
도 3은 ASD 환자군과 정상군에서의 선택적인 유전자 발현 프로파일을 위한 Volcano 플롯이다. 상기 청색 선은 FWER(family wise error rate)에서 P-값(P-value)가 0.05(-log10p=5.5)로 나타난 것이다.
상기 적색 도트는 트레이닝 테스트세트에서 ASD 환자군(n=13)과 정상군(n=13) 사이에서 선택적으로 발현된 프로브의 유의성을 나타낸 것이다.
트레이닝 데이터세트에서 영향을 받지 않은 정상군(n=13)과 ASD 환자군(n=13)에 대하여 마이크로어레이 데이터를 비교한 결과, 6 개의 up-regulated 프로브와 13 개의 down-regulated 프로브를 포함하는 총 19 개의 DE 프로브가 확인되었다(이때, P-값 <0.05).
19 개의 프로브 중에서, 15 개의 프로브는 Bioconductor "hgug4112a.db" package 프로그램을 이용하여, 도 4에 유전자 기호로 표기하였다.
도 4는 정상군의 트레이닝 데이터세트와 자폐 스펙트럼 장애(ASD)를 앓고 있는 환자군의 트레이닝 데이터세트를 비교하기 위해, 유의성이 우수한(수정된 P-값; adj. P-values < 0.05) 프로브들을 나타낸 것이다.
도 4에서 용어 'NA'는 아무것도 적용되지 않은 것이고, 'logFC'는 폴드 변화의 log2이며, 'adj. P-val'은 수정된 P-값(본페로니 교정; bonferroni correction)이다. 또한 * 표시된 곳은 SFARI(Simons Foundation Autism Research Initiative) Gene 2.0 database(available at 얻은 것이다.
<실험예 2> 각 유전자와 상보적으로 결합하는 19 개 프로브의 알고리즘 분석-1
도 4에 나타난 바와 같이 선별된 19 개의 프로브 발현형(19-probe expression signature; DE 프로브)을 사용하여, 계층적(hierarchical) 클러스터 분석을 수행하였다.
구체적으로 ASD 환자군과 정상군으로 구별되는 42개의 집단(n=42)(대조군 그룹에서 세가지 ASD 케이스를 분류함)를 사용하였고, 여기에 상기 19 개의 프로브 발현형을 이용하여 ASD 환자군과 정상군을 구별할 수 있는지 여부를 계층적 클러스터 분석을 통해 확인하였으며, 이의 결과를 도 5에 나타내었다.
도 5는 실험예 1에서 선발된 19 개의 DE 프로브를 두 가지 방법에 따른 계층적 클러스터 분석으로 분석한 히트맵(heat-map)을 나타낸 도면이다. 각각 열(row)은 단일 프로브로 인해 측정된 유전자의 상대적인 발현양을 나타낸 것이고, 상기 적색 또는 녹색은 각각 상대적으로 높거나 낮은 각각의 프로브로 인해 측정된 유전자 발현양을 나타낸 것이다. 도 5에는 히트맵을 통해 나타낸 계층적 클러스터의 통계적 유의성을 나타낸 덴드로그램도 내삽되어 있는데, 이때 상기 덴드로그램에서 적색은 정상군이 아닌 ASD 환자군을 의미하고, 청색이 정상군을 의미한다.
<실험예 3> 각 유전자와 상보적으로 결합하는 19 개 프로브의 알고리즘 분석-2
실험방법 3)에 기술한 예측 알고리즘에 적용하여, 알고리즘을 분석하였다.
우선 감독하 기계 학습 알고리즘에 적용하기 위해, 19 개의 프로브 발현형을 사용하여 분류자(classifier)를 설계하였고, 이들의 예측 성능을 평가하였다.
상기 19 개의 프로브를 실험방법 3)의 예측 모델과 함께, 상기 테스트 데이터세트를 ASD 환자군의 예측의 타당성을 검증하기 위해 사용하였고, 이에 대한 결과를 표 2에 나타내었다.
구분 accuracy(%) sensitivity(%) specificity(%) positive predictive value(%) negative prdictive value(%)
SVM 93.8 100.0 87.5 88.9 100.0
KNN 93.8 100.0 87.5 88.9 100.0
LDA 68.8 62.5 75.0 71.4 66.7
표 2에 나타난 바와 같이, 본 발명에 따른 19 개의 프로브 세트는 모두 ASD 환자군과 정상군 사이를 정확히 구별하고 있음을 확인하였다. SVM 및 KNN 알고리즘 분석 결과, ASD 환자군과 정상군을 정확하게 8 개로 분류하였고, 이는 ASD 환자군으로서 하나의 정상군을 제외하고 모두 정확하게 일치하는 것으로 확인되었다.
이러한 결과를 통해 본 발명에 따른 단일 프로브 또는 프로브 조합을 이용할 경우, 예측 정확도(accuracy, %)가 93.8% 임을 확인하였고, 이는 100%의 민감도(sensitivity, %)와 87.5%의 특이도(specificity, %)을 의미한다.
그런데 상기 LDA 분석에서는 상기 ASD 환자군과 정상군의 진단 예측이 약 68.8% 정확도를 갖는 것으로 측정되었다.
<실험예 4> 각 유전자와 상보적으로 결합하는 9 개 프로브의 알고리즘 분석-1
본 실험예에서는 트레이닝 데이터세트의 ASD 환자군(n=13)과 정상군(n=13)의 마이크로어레이 실험결과들로부터 ROX 커브의 AUC 면적이 가장 높은 것 9개를 추출한 것을 사용하였고, 이들을 표 3에 정리하였다.
추출된 9 개의 프로브를 이용하여 테스트 데이터세트에서 기계 학습 알고리즘을 적용한 결과(실험방법 3) 참조)를 표 4에 나타내었다.
서열번호 GENE_SYMBOL ID 염기서열
1 HSF2 A_32_P9963 TATTCATGTTCAACAGGAAAGACAAAGTGTACGTGAATGCTCGCTGTCTGATAGGGTTCC
2 RFX1 A_24_P391104 CAGTTTTCTCAGTGTTTTCAGCCTGTGAGATAGATGTTTATGGCAAGAAAAAGGAAAAAA
4 NA A_32_P184330 TGTGACCGTTTGTGACGAGTTATCTCAGTCCTCACATGAGTTCTTACATGAGTCCCTCTA
6 MIER2 A_23_P119683 CATCCCTCACCCCACCAAGGACCACACTGTGAAGTGATAACTGCCTTGAACCCCCCTTTG
10 PKM2 A_23_P399501 TTTCCTGTGTGTACTCTGTCCAGTTCCTTTAGAAAAAATGGATGCCCAGAGGACTCCCAA
16 TAPT1-AS1 A_23_P322593 GTCAAGAAGGAAGTAGGCTTTTATTGCTATTTTTATGTCAGTTTCCATTTACTGTCTCAC
20 PKM2 A_32_P82251 CCTACCAGTGCCACGTTACAGCCCAGAGTGAGTTCTACAAGCGTTGCTGGCCTAATGGAT
21 RGPD5 A_23_P218637 GGAACTGACTTTGCACTTTGGTTACACAGAACATTGGTTTCCAATTTAGTTTAACTGAAA
22 ZNF585B A_23_P90223 AAACTCATACCGGAGAAAAGCCCTACATTTGTTCTGAATGTGGGAAGACCTTTCGACAGA
구분 accuracy(%) sensitivity(%) specificity(%) positive predictive value(%) negative prdictive value(%)
SVM 93.8 100.0 87.5 88.9 100.0
KNN 93.8 100.0 87.5 88.9 100.0
LDA 93.8 100.0 87.5 88.9 100.0
표 4에 나탄 바와 같이, 본 발명에 따른 9 개의 프로브 세트 역시 모두 ASD 환자군과 정상군 사이를 정확히 구별하고 있음을 확인하였다. SVM 및 KNN 알고리즘 분석 결과, 도 4에 따른 19 개의 프로브 세트를 이용한 것과 전체적인 결과는 유사하나, 표 3에 따른 9 개의 프로브 세트를 이용할 경우 LDA 알고리즘 기법을 적용한 경우에서도 현저히 우수한 예측 성능이 관찰되었다.
즉, 도 4의 19 개의 프로브 세트를 이용한 것보다 표 3에 따른 9개의 프로브 세트를 이용할 경우 보다 정확하고 특이적으로 자폐 스펙트럼 장애를 예측 및 진단할 수 있음을 알 수 있다.
특히 PKM 프로브는 상기 도 4 및 표 3의 프로브 세트 양쪽 모두 포함되어 있는, 자폐 스펙트럼 장애 예측 및 진단에 주요한 인자로, 이를 단독으로도 충분히 사용이 가능하고, 단일 사용만으로도 높은 정확도, 민감도 및 특이도로 자폐 스펙트럼 장애를 예측 및 진단할 수 있다.
<실험예 5> ROC 커브 분석
본 발명 중에서 A_23_P399501 프로브 ID를 갖는 PKM 유전자와 상보적으로 결합하는 프로브에 대하여 구별 성능(Discrimination ability)을 평가하기 위하여 ROC 커브를 측정하였다.
도 6a, 도 6b는 정상군(청색 점), ASD 환자군(적색 점)을 잘 구별하는지 여부를 판단하기 위해, 본 발명에 따른 프로브들 중에서 A_23_P399501 프로브 ID를 갖는 PKM 유전자와 상보적으로 결합하는 프로브의 ROC(receiver poerating characteristic) 그래프이다.
도 6에 나타난 바와 같이, 구별 성능의 척도가 되는 ROC 그래프의 곡선 아래 면적(AUC; area under ROC curve)을 측정하여 비교하였다, 결과적으로 본 발명에 따른 프로브들 중에서 A_23_P399501 프로브 ID를 갖는 PKM 유전자는 자폐 스펙트럼 장애를 앓고 있는 환자군과 정상군을 명확하게 구분할 수 있는 것을 확인하였다.
또한 상기 ROU 커브로부터 측정된 AUC는 일반적으로 해당 유전자가 자폐 스펙트럼 장애를 진단하는 것이 적합한지 여부(구별 성능 즉, 정확도를 나타내는 것으로, 그 수치가 1에 가까울수록 좋은 검사방법에 해당한다고 여길 수 있다. 이에 따르면 본 실험에서와 같이 PKM 유전자와 상보적으로 결합하는 프로브를 이용하여 PKM 유전자 발현을 측정한 경우, 상기 AUC가 0.94(정확도)이므로 매우 좋은 검사에 해당된다는 것을 확인할 수 있다.
아울러, 상기 ROC 커브의 일 부분에서의 AUC(partial AUC)의 경우, 예컨대 population 스크리닝 검사에서 위양성률을 0 에서 0.1 이하로 제한했을 때(ROC 커브와 파란 점선 사이 영역)의 AUC 수치가 0.0882로 측정되는 것을 확인할 수 있다.
특히, PKM 유전자는 단독으로도 충분히 자폐 스펙트럼 장애 예후 예측 및 진단할 수 있다는 점에서 매우 효율적이다.
<110> OH, Donghoon <120> composition for autism spectrum disorder diagnosis, microarry containing the same and method of detecting the same <130> HPC6748 <160> 22 <170> KoPatentIn 3.0 <210> 1 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of HSF2 <400> 1 tattcatgtt caacaggaaa gacaaagtgt acgtgaatgc tcgctgtctg atagggttcc 60 60 <210> 2 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of RFX1 <400> 2 cagttttctc agtgttttca gcctgtgaga tagatgttta tggcaagaaa aaggaaaaaa 60 60 <210> 3 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of NPM1 <400> 3 gcaaaaatgc aagcaagtat agaaaaaggt ggttctcttc ccaaagtgga agccaaattc 60 60 <210> 4 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of NA(ID:A_23_P184330) <400> 4 tgtgaccgtt tgtgacgagt tatctcagtc ctcacatgag ttcttacatg agtccctcta 60 60 <210> 5 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of NPM1 <400> 5 ctttgaaata acaccaccag tagtcttacg gttgaagtgt ggttcagggc cagtgcatat 60 60 <210> 6 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of MIER2 <400> 6 catccctcac cccaccaagg accacactgt gaagtgataa ctgccttgaa cccccctttg 60 60 <210> 7 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of MRPS31 <400> 7 atatatttct ggagaaacac ctggagagct ttccaaaaca aggaccaatt cgccacttca 60 60 <210> 8 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of TC2N <400> 8 tgatgatatg tatgcatcat tataatatag tatagtttcg ctgccctaaa catcctctgc 60 60 <210> 9 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of NPM1 <400> 9 tggaagccaa gttcatcaat tacgtgaaga attgcttccg gatgactgac caagaggcta 60 60 <210> 10 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of PKM2 <400> 10 tttcctgtgt gtactctgtc cagttccttt agaaaaaatg gatgcccaga ggactcccaa 60 60 <210> 11 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of C12orf29 <400> 11 tttagaatag ccagtgatca ctagctaatt ctcatatcca tgcctttttg tcctgtttac 60 60 <210> 12 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of JADE2 <400> 12 tatcgcagac gctacagttg ctgccagttt agggatagaa gtatcaggga tgtcttccca 60 60 <210> 13 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of ACKR3 <400> 13 atctgtgtgg tgttttgtac cggcacggga tatggaacga aaactgcttt gtaatgcagt 60 60 <210> 14 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of ARHGAP1 <400> 14 aatgcattga agctgttgag aaaagaggtc tagatgttga tggaatatat cgagttagtg 60 60 <210> 15 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of ATP6AP1 <400> 15 cttggctgtc gttatcgttt tctggtgatg ttgtgctaac aataagaagt acacgggttt 60 60 <210> 16 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of TAPT1-AS1 <400> 16 gtcaagaagg aagtaggctt ttattgctat ttttatgtca gtttccattt actgtctcac 60 60 <210> 17 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of TMEM41B <400> 17 ttcttctcct aagagaatag acagtttttc cagattcatc atcattgact gtcaagaaag 60 60 <210> 18 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of DCAF11 <400> 18 ttaatcatgt ttgaatgtta ggggttggat cctagagtag atgcctgagg ccacatctga 60 60 <210> 19 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of NA(ID:A_32_P90685) <400> 19 agcctcacaa taataccttg tacaatttat aactgctaaa gggcctatag aaggctaccc 60 60 <210> 20 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of PKM2 <400> 20 cctaccagtg ccacgttaca gcccagagtg agttctacaa gcgttgctgg cctaatggat 60 60 <210> 21 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of RGPD5 <400> 21 ggaactgact ttgcactttg gttacacaga acattggttt ccaatttagt ttaactgaaa 60 60 <210> 22 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> probe sequence of ZNF585B <400> 22 aaactcatac cggagaaaag ccctacattt gttctgaatg tgggaagacc tttcgacaga 60 60

Claims (7)

  1. 서열번호 10으로 표시되는 PKM 유전자에 상보적으로 결합할 수 있는 프로브를 포함하는 자폐 스펙트럼 장애의 진단용 조성물.
  2. 삭제
  3. 서열번호 10으로 표시되는 PKM 유전자에 상보적으로 결합할 수 있는 프로브; 및 서열번호 1 내지 9, 서열번호 11 내지 22로 표시되는 염기서열 중에서 선택되는 어느 하나 이상의 올리고뉴클레오티드 프로브;로 이루어진 조합인 것을 특징으로 하는 자폐 스펙트럼 장애의 진단용 조성물.
  4. 삭제
  5. 제3항에 있어서,
    상기 올리고뉴클레오티드 프로브는 서열번호 1, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 16, 서열번호 20, 서열번호 21 및 서열번호 22로 표시되는 염기서열의 올리고뉴클레오티드 프로브인 것을 특징으로 하는 자폐 스펙트럼 장애의 진단용 조성물.
  6. 제1항 또는 제3항에 따른 자폐 스펙트럼 장애 진단용 조성물을 포함하는 자폐 스펙트럼 장애의 진단용 마이크로어레이.
  7. 자폐 스펙트럼 장애의 진단에 필요한 정보를 제공하기 위하여, 제1항 또는 제3항에 따른 자폐 스펙트럼 장애 진단용 조성물을 이용하여 자폐 스펙트럼 장애와 관련된 유전자를 검출하는 방법.
KR1020160130648A 2016-10-10 2016-10-10 자폐 스펙트럼 장애의 진단용 조성물, 이를 포함하는 마이크로어레이 및 이를 검출하는 방법 KR101887161B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160130648A KR101887161B1 (ko) 2016-10-10 2016-10-10 자폐 스펙트럼 장애의 진단용 조성물, 이를 포함하는 마이크로어레이 및 이를 검출하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160130648A KR101887161B1 (ko) 2016-10-10 2016-10-10 자폐 스펙트럼 장애의 진단용 조성물, 이를 포함하는 마이크로어레이 및 이를 검출하는 방법

Publications (2)

Publication Number Publication Date
KR20180039397A KR20180039397A (ko) 2018-04-18
KR101887161B1 true KR101887161B1 (ko) 2018-08-09

Family

ID=62082671

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160130648A KR101887161B1 (ko) 2016-10-10 2016-10-10 자폐 스펙트럼 장애의 진단용 조성물, 이를 포함하는 마이크로어레이 및 이를 검출하는 방법

Country Status (1)

Country Link
KR (1) KR101887161B1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150227681A1 (en) 2012-07-26 2015-08-13 The Regents Of The University Of California Screening, Diagnosis and Prognosis of Autism and Other Developmental Disorders

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150227681A1 (en) 2012-07-26 2015-08-13 The Regents Of The University Of California Screening, Diagnosis and Prognosis of Autism and Other Developmental Disorders

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Front Psychiatry. 2014; 5: 100
Nat Rev Drug Discov. 2016 Jan;15(1):70-3
Psychopharmacology (Berl). 2014 Mar;231(6):1201-16

Also Published As

Publication number Publication date
KR20180039397A (ko) 2018-04-18

Similar Documents

Publication Publication Date Title
JP7297015B2 (ja) エピジェネティックな染色体相互作用
US20220243272A1 (en) Biomarker identification
CN103299188B (zh) 用于癌症的分子诊断试验
CN103733065B (zh) 用于癌症的分子诊断试验
Oh et al. Predicting autism spectrum disorder using blood-based gene expression signatures and machine learning
CN105219844B (zh) 一种筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型
US20210065847A1 (en) Systems and methods for determining consensus base calls in nucleic acid sequencing
US20150018238A1 (en) Multi-biomarker-based outcome risk stratification model for pediatric septic shock
US20230126920A1 (en) Method and device for classification of urine sediment genomic dna, and use of urine sediment genomic dna
EP3129496A1 (en) Molecular predictors of sepsis
O'Connell et al. Stroke-associated pattern of gene expression previously identified by machine-learning is diagnostically robust in an independent patient population
CN105874080A (zh) 用于食道癌的分子诊断测试
US20210407623A1 (en) Determining tumor fraction for a sample based on methyl binding domain calibration data
CN104968802A (zh) 作为诊断标志物的新miRNA
CN111020020A (zh) 一种精神分裂症的生物标志物组合、其应用及metaphlan2筛选方法
KR101887161B1 (ko) 자폐 스펙트럼 장애의 진단용 조성물, 이를 포함하는 마이크로어레이 및 이를 검출하는 방법
CN108588218A (zh) 一种血清miRNA组合的微创检测试剂盒
US20120264633A1 (en) Methods for detecting thrombocytosis using biomarkers
CN109813912B (zh) 一组血清差异蛋白组合在制备用于检测孤独症的试剂中的应用
CN112063709A (zh) 一种以微生物作为诊断标志物的重症肌无力的诊断试剂盒及应用
JP2015522258A (ja) 子癇前症及び/またはhellp症候群の予測または早期検出のバイオマーカー検査
CN112011604B (zh) 一种用于评估重症肌无力风险的微生物标志物及其应用
CN117476097B (zh) 一种基于三级淋巴结构特征基因的结直肠癌预后和治疗反应预测模型及其构建方法和应用
US12006548B2 (en) Treating or inhibiting severe sepsis based on measuring defensin alpha 4 (DEFA4) expression
US20230374601A1 (en) Fragmentation for measuring methylation and disease

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right