KR102193657B1 - 사상체질 중 태음인 진단용 snp 마커 및 이의 용도 - Google Patents

사상체질 중 태음인 진단용 snp 마커 및 이의 용도 Download PDF

Info

Publication number
KR102193657B1
KR102193657B1 KR1020190074102A KR20190074102A KR102193657B1 KR 102193657 B1 KR102193657 B1 KR 102193657B1 KR 1020190074102 A KR1020190074102 A KR 1020190074102A KR 20190074102 A KR20190074102 A KR 20190074102A KR 102193657 B1 KR102193657 B1 KR 102193657B1
Authority
KR
South Korea
Prior art keywords
seq
base
snp
constitution
pcr
Prior art date
Application number
KR1020190074102A
Other languages
English (en)
Inventor
반효정
진희정
이시우
백영화
차성원
류다은
Original Assignee
한국한의학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국한의학연구원 filed Critical 한국한의학연구원
Priority to KR1020190074102A priority Critical patent/KR102193657B1/ko
Application granted granted Critical
Publication of KR102193657B1 publication Critical patent/KR102193657B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Abstract

본 발명은 사상체질 중 태음인 진단용 SNP (single nucleotide polymorphism) 마커에 관한 것으로, 보다 자세하게는 태음인 특이적 SNP 마커를 포함하는 태음인 진단용 조성물, 상기 조성물을 포함하는 키트 또는 마이크로어레이, 상기 마커를 이용한 사상체질 중 태음인 진단방법 및 태음인 진단용 SNP를 선별하는 방법에 관한 것이다.

Description

사상체질 중 태음인 진단용 SNP 마커 및 이의 용도 {SNP markers for diagnosing Taeeumin of sasang constitution and use thereof}
본 발명은 사상체질 중 태음인 진단용 SNP(single nucleotide polymorphism) 마커에 관한 것으로, 보다 구체적으로 태음인 특이적 SNP 마커를 포함하는 태음인 진단용 조성물, 상기 조성물을 포함하는 키트 또는 마이크로어레이, 상기 마커를 이용한 사상체질 중 태음인 예측 또는 진단을 위한 정보의 제공방법 및 태음인 진단용 SNP를 선별하는 방법에 관한 것이다.
사상의학은 100여년 전 이제마가 독자적으로 창설한 우리나라 고유의 체질의학으로 알려져 있다. 사상의학은 사람의 체질을 태양, 소양, 태음, 및 소음의 네 가지로 분류하는데, 이는 체질의 특성을 다소강약(多少强弱) 이라는 비례 기능적 생리현상과 성정, 행동, 태도, 용모 등을 종합하여 분류한 것이다. 이때, 다소(多少)의 의미는 기능상의 생리적 허실(虛實), 즉 강약(强弱)을 의미한다.
상기 네 가지 체질은 약에 대한 반응성이 다를 뿐만 아니라 외모, 체형, 성격, 장부기능, 식생활 등에서도 차이를 보인다고 알려져 있다. 이제마는 1894년에 저술한 동의수세보원을 통해 인간은 천부적으로 장부허실이 있고, 이에 따른 희로애락의 성정이 작용하여 생리현상을 빚는다고 주장하면서, 각 체질에 대한 생리, 병리, 진단 감별법, 치료와 약물, 식품 섭취에 이르기까지 체질과 연관지어 이를 임상에 응용할 수 있는 새로운 방법을 제시하였다.
동의수세보원에 의하면, 체질은 선천적으로 정해지면 일생 동안 변하지 않고 유지되는 것으로 받아들여지고 있어, 생물학적으로는 유전적인 특성이라고 할 수 있다. 관련하여, 인구 내 체질 비율이 태음인:소양인:소음인 = 5:3:2로서 사상체질 이론이 주장된 후 100년이 넘는 기간 동안 거의 변하지 않고 있고, 쌍둥이 및 가계를 대상으로 이루어진 체질의 유전율 연구에서도 체질별로 유전적 소양이 50% 안팎에 이르는 것으로 밝혀졌다. 따라서, 모태에서 결정된 체질은 일생 동안 변하지 않는다고 보기 때문에 체질 형성과 유전적인 차이는 서로 연관성이 클 것으로 여겨진다.
한편, 전통적으로 사상체질의 판별은 개인의 음성, 외모, 체형, 성격 및 다양한 외형적인 생물학적 지표를 종합적으로 이용하여 수행해왔으며, 숙련된 전문가에 의하여 주관적 판단을 바탕으로 진단이 행해지고 있다. 현대에 들어서는 맥진법, 신체형태지수, 설문검사법, 안면부 형상분류법, 약물복용법, 적외선 촬영법 및 O-ring test법 등 다양한 방법이 개발되었다.
뿐만 아니라, 체질분류의 객관화를 위해 체질문진표를 고안하여 다양한 체질의 판정지표를 체계적으로 종합하여 과학적인 체질 진단을 가능케 하고, 체질을 유전학적인 면에서 검토하여 체질별 상이성 및 연관성을 찾아보려는 노력이 수행되어 왔다.
그러나, 기존의 연구들로 체질에 대한 유전적 배경은 확립되었으나, 유전적/환경적 소인이 복합된 형질의 특성 상 기존의 유전체 분석방법에 의한 분류가 어려운 실정이다. 또한, 한방병원 및 한의원에서 수집한 통계자료나 질병관리본부 및 건강보험공단에서 제공하는 환자의 정보를 이용한 체질 분류는 규모가 매우 작고 성능평가가 어렵다는 단점이 있다.
또한, 사상체질 진단과 관련된 공개, 등록 특허가 존재하며, 예시적인 특허는 아래와 같다. 등록번호 10-0455996호는 손가락을 금고리 및 은고리에 접촉시킨 후 신체 반응을 측정해 사상체질을 판별하는 장치에 관한 것이며; 등록번호 제10-0427243호는 음성의 피치를 분석하여 사상체질을 감별하는 방법에 관한 것이며; 등록번호 제10-0563127호는 체질에 맞는 식품 또는 약품 접촉 시 손목의 압력을 통해 사상체질을 판별하는 장치에 관한 것이다. 하지만, 이러한 연구에도 불구하고, 아직은 과학적이고 정밀도가 높은 사상체질 진단방법이 개발되지 못하고 있는 실정이다. 따라서, 높은 정확도와 재현성 및 신뢰도를 갖는 사상체질 진단방법의 개발이 절실하다.
이러한 배경하에 본 발명자들은 사상체질의 유전성에 근거하여 사상체질과 연관된 SNP를 대상으로 연구를 수행하였고, 과학적이고 객관적으로 사상체질을 진단할 수 있는 표지자를 찾기 위해 노력하였다. 그 결과, SNP 중 태음 집단은 특정 SNP들에서 특정 유전자형을 가지고 있음을 확인하고, 본 발명을 완성하였다.
본 발명의 하나의 목적은 사상체질 중 태음인 진단용 SNP(single nucleotide polymorphism) 마커를 제공하는 것이다.
본 발명의 다른 하나의 목적은 상기 태음인 진단용 SNP 마커를 검출할 수 있는 프로브 또는 증폭할 수 있는 프라이머를 포함하는 태음인 진단용 조성물을 제공하는 것이다.
본 발명의 또 다른 하나의 목적은 피험자로부터 채취한 시료로부터 획득한 염기서열을 이용하여 태음인 특이적으로 발현하는 SNP의 검출 여부를 확인하는 단계를 포함하는 태음인 예측 또는 진단을 위한 정보의 제공방법을 제공하는 것이다.
본 발명의 또 다른 하나의 목적은 피험자의 상기 태음인 진단용 조성물을 포함하는 태음인 진단용 키트를 제공하는 것이다.
본 발명의 또 다른 하나의 목적은 피험자의 상기 태음인 진단용 조성물을 포함하는 태음인 진단용 마이크로 어레이를 제공하는 것이다.
본 발명의 또 다른 하나의 목적은 상기 태음인 진단용 SNP 마커를 선별하는 방법을 제공하는 것이다.
이를 구체적으로 설명하면 다음과 같다. 한편, 본 발명에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시형태에도 적용될 수 있다. 즉, 본 발명에서 개시된 다양한 요소들의 모든 조합이 본 발명의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 발명의 범주가 제한된다고 볼 수 없다.
또한, 당해 기술분야의 통상의 지식을 가진 자는 통상의 실험만을 사용하여 본 발명에 기재된 본 발명의 특정 양태에 대한 다수의 등가물을 인지하거나 확인할 수 있다. 또한, 이러한 등가물은 본 발명에 포함되는 것으로 의도된다.
상기 목적을 달성하기 위하여, 본 발명의 하나의 양태는 사상체질 중 태음인 진단용 SNP (single nucleotide polymorphism) 마커를 제공한다.
상기 마커는 구체적으로 서열번호 1 내지 12로 구성된 군에서 선택된 하나 이상의 폴리뉴클레오티드들에 있어서, SNP 위치인 각 서열의 16번째 염기를 포함하고, 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드로부터 선택된 하나 이상의 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드를 포함하는, 태음인 진단용 마커일 수 있다.
본 발명에서 사용되는 용어, "다형성(polymorphism)"이란 하나의 유전자 좌위(locus)에 두 가지 이상의 대립 유전자(allele)가 존재하는 경우를 말하며 다형성 부위 중에서, 사람에 따라 단일 염기만이 다른 것을 단일 염기 다형성(single nucleotide polymorphism, SNP)이라 한다. 구체적인 다형성 마커는 선택된 집단에서 1% 이상, 더욱 구체적으로 5% 또는 10% 이상의 발생 빈도를 나타내는 두 가지 이상의 대립 유전자를 가진다.
본 발명에서 사용되는 용어, "대립 유전자"는 상동 염색체의 동일한 유전자 좌위에 존재하는 한 유전자의 여러 타입을 말한다. 대립 유전자는 다형성을 나타내는데 사용되기도 하며, 예컨대, SNP는 두 종류의 대립 인자(biallele)를 갖는다.
본 발명에서 사용되는 용어, "rs_id"란 1998년부터 SNP 정보를 축적하기 시작한 NCBI가 초기에 등록되는 모든 SNP에 대하여 부여한 독립된 표지자인 rs-ID를 의미한다. 본 발명에서는 rs10804157과 같은 형태로 기재하였다. 이와 같은 표에 기재된 rs_id는 본 발명의 다형성 마커인 SNP 마커를 의미한다. 당업자라면 상기 rs_id를 이용하여 SNP의 위치 및 서열을 용이하게 확인할 수 있을 것이다. NCBI의 dbSNP (The Single Nucleotide Polymorphism Database) 번호인 rs_id에 해당하는 구체적인 서열은 시간이 지남에 따라 약간 변경될 수 있다. 본 발명의 범위가 상기 변경된 서열에도 미치는 것은 당업자에게 자명할 것이다.
상기 "서열번호 1 내지 12"는 다형성 부위를 포함하는 다형성 서열(polymorphic sequence)이다. 다형성 서열이란 폴리뉴클레오티드 서열 중에 SNP를 포함하는 다형성 부위(polymorphic site)를 포함하는 서열을 의미한다. 상기 폴리뉴클레오티드 서열은 DNA 또는 RNA가 될 수 있다.
본 발명의 SNP 마커는 표 3에 표시된 마커로서, 개체의 SNP 마커의 다형성 부위가 효과 대립 유전자(effect allele)로 표시된 대립 유전자일 경우, 개체의 사상체질을 태음으로 판단할 수 있는 것이다.
본 발명에서 사용되는 용어, "사상체질"이란 사상의학에 의해 사람의 체질을 태양인, 소양인, 태음인 및 소음인의 네 가지로 분류한 것을 의미하는 것으로 체질은 선천적이며 일생에 걸쳐 변하지 않아 생물학적으로 유전적인 특성을 가진 것으로 볼 수 있다. 체질별로 유전적 차이가 있어서, 사상체질 특이적 마커를 제공할 수 있다면, 보다 정확한 사상체질의 진단이 이루어 질 수 있을 것으로 기대되고 있어 본 발명자들에 의해 최초로 사상체질별로 특이적인 사상체질 진단용 SNP 마커를 제공한 것이다. 본 발명의 목적상, 한국인에 있어서 그 빈도가 매우 낮은 태양인을 제외하고 태음인, 소양인 및 소음인, 구체적으로 태음인에 특이적인 SNP 마커를 제공한다.
본 발명에서 사용되는 용어, "진단"은 사상체질을 결정하거나 판별하는데 사용되는 모든 유형의 분석을 포함한다.
구체적으로 상기 SNP 마커는 태음인 진단용 SNP 마커로서, 상기 서열번호 1 내지 12로 구성된 폴리뉴클레오티드들 중, 서열번호 1로 기재되는 rs10804157에 있어서, 16번째 염기가 T 또는 C인 16번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드;
서열번호 2로 기재되는 rs13181166에 있어서, 16번째 염기가 T 또는 C인 16번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드;
서열번호 3으로 기재되는 rs28519074에 있어서, 16번째 염기가 C 또는 T인 16번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드;
서열번호 4로 기재되는 rs17458750에 있어서, 16번째 염기가 C 또는 T인 16번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드;
서열번호 5로 기재되는 rs636910에 있어서, 16번째 염기가 C 또는 G인 16번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드;
서열번호 6으로 기재되는 rs1421207에 있어서, 16번째 염기가 C 또는 G인 16번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드;
서열번호 7로 기재되는 rs2625890에 있어서, 16번째 염기가 G 또는 C인 16번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드;
서열번호 8로 기재되는 rs6888436에 있어서, 16번째 염기가 G 또는 A인 16번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드;
서열번호 9로 기재되는 rs1295401에 있어서, 16번째 염기가 C 또는 A인 16번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드;
서열번호 10으로 기재되는 rs11135730에 있어서, 16번째 염기가 G 또는 C인 16번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드;
서열번호 11로 기재되는 rs1034934에 있어서, 16번째 염기가 C 또는 G인 16번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드;
서열번호 12로 기재되는 rs484319에 있어서, 16번째 염기가 G 또는 C인 16번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드로 이루어진 군에서 선택된 하나 이상의 폴리뉴클레오티드일 수 있다.
보다 구체적으로는 2개 이상, 보다 더 구체적으로는 3개 내지 11개 이상, 가장 구체적으로는 12개 모두의 SNP 마커 세트일 수 있다. 상기 마커는 각 SNP 마커의 16번째 염기가 표 3의 효과 대립 유전자 염기인 경우에는 태음인으로 진단할 수 있고, 개체의 SNP 마커의 수가 많을수록 정확도가 높아질 수 있다.
본 발명자들은 상기 SNP가 태음인 진단용 마커임을 다음과 같은 입증을 통하여 확인하였다. 구체적으로 단축형 사상체질 진단도구(KS-15)를 통해 설문(Sasang Constitut Med, 2015, 27(2): 211-221)을 기반으로 체질을 확정한 사람을 대상으로 체질과 연관성 있는 SNP들을 확보하였다.
체질정보은행의 자료에서 체형과 성격, 병증의 중요항목을 선별하여 체질을 분류하는 단축형 사상체질 진단설문지(KS-15)를 개발하였고, KS-15 설문지를 통해 얻어진 체질 특성의 가중치를 부여한 점수를 기반으로 유전체 연관 분석을 실시하였다. 상기 KS-15 설문은 체형 요소, 성격, 및 증상요소를 포함한다. 즉 키와 몸무게를 통해 생성되는 체질량 지수(Body Mass Index; BMI)를 상기 체형요소 문항으로, 체질정보은행에서 수집한 성격문항과 소증 문항으로부터 상기 성격 및 증상요소 문항으로 선정하였다. 이후, 최종적으로 사상체질전문가 논의를 통해 14문항을 선정하였다.
각 문항별로 체질 가중치가 부여되고 가중치의 합이 각 체질별 점수 3개로 도출되며 BMI 1개를 독립변수로 하고 체질을 종속변수로 하는 다항 로지스틱 회귀(Multinomial Logistic Regression)을 실시하였다. 분석을 통해 얻어진 회귀계수를 이용하여 체질별 예측확률을 구하였다. 상기 체질별 예측확률은 체질별 설문항의 점수에 해당하는 가중치의 합을 말한다(Sasang Constitut Med, 2015, 27(2): 211-221).
상기 체질별 예측 확률을 유전형과의 연관 분석으로 유전 후보 물질을 선정하는데 기초자료로 사용하였다.
즉, KS-15의 점수의 수치값과 유전형의 선형관계성을 도출하여 연관 유전 후보 물질을 선정하였고, 후보물질들의 위치 정보를 이용해 SNP의 생물학적 기능 점수를 부여하여 최종 선정에 사용하였다.
유전 후보 마커 SNP들은 각각 유전체 특정 부위에 위치하게 되는데, 이 경우 유전자 이외에도 유전자를 조절하는 다양한 단백질이 붙거나 후성 유전 물질이 붙게 된다. 이에, 유전자를 조절하는 기능 정보들을 모두 수집하여 기능 점수를 부여하는 절차를 추가하였다. 상기 기능 점수의 부여는 선정된 구간(block) 내에서 SNP 기능 정보 패턴을 추출하는 것으로, 학습 사례/컨트롤(case/control) 데이터 셋들을 이용하여 학습하면서 정답셋과 유사할 수록 높은 점수를 부여하여 합산하였다. 전체 점수의 합산 결과들을 분포 변환을 통해 0 내지 1의 점수로 환산하였다. 1에 가까워질수록 패턴이 정답셋들과 유사하다고 판단하였으며, 본 발명에서 선정한 마커들은 점수가 1인 것들부터 순위를 매겨 선정한 것이다.
각 SNP는 하나의 위치 정보를 가지고 있기 때문에 기능 점수를 부여하기 위해 주변 1M 영역으로 확장하여 함께 관여할 수 있는 SNP들을 모아 패턴을 분석하였다. 학습시키는 SNP의 구간(block)이 이미 체질 연관 후보 SNP들이기 때문에 이들의 패턴은 체질에 관여되는 기능 정보들임을 알 수 있다. 상기 패턴을 도출하는 과정은 하기와 같다.
p-value를 기반으로 연관성이 가장 강한 SNP를 lead(단서) SNP로 선출하고, 하나의 lead SNP와 그 주변 1Mb 이내의 후보 SNP들 중에 p-value가 5 x 10-4 이하인 SNP들 중에서 연관성이 높은 순으로 최대 30개의 SNP를 선정하여 한 구간(block)으로 설정하였다. 훈련, 검증, 테스팅 세트로 나누고 SNP의 기능 영역을 맵핑하였다. 딥러닝 알고리즘을 적용하여 SNP의 기능을 점수화하여 체질별 후보 SNP를 선정하였다. 체질확진자를 통한 검증절차를 거쳐 최종적으로 태음인 특이적 사상체질 진단용 SNP를 선정하였다.
본 발명의 다른 하나의 양태는, 태음인 진단용 SNP 마커를 검출할 수 있는 프로브 또는 증폭할 수 있는 제제를 포함하는, 태음인 진단용 조성물을 제공한다.
본 발명에서 사용되는 용어, "태음인 진단용 SNP 마커를 검출할 수 있는 프로브"는 상기와 같은 유전자의 다형성 부위와 특이적으로 혼성화 반응을 통해 확인하여 사상체질 중 태음인을 진단할 수 있는 조성물을 의미하며, 이와 같은 유전자 분석의 구체적 방법은 특별한 제한이 없으며, 이 발명이 속하는 기술분야에 알려진 모든 유전자 검출 방법에 의하는 것일 수 있다.
본 발명에서 사용되는 용어, "태음인 진단용 SNP 마커를 증폭할 수 있는 프라이머"란 상기와 같은 유전자의 다형성 부위를 증폭을 통해 확인하여 태음인을 진단할 수 있는 조성물을 의미하며, 구체적으로 상기 태음인 진단용 마커의 폴리뉴클레오티드를 특이적으로 증폭할 수 있는 프라이머를 의미한다.
상기 다형성 마커 증폭에 사용되는 프라이머는, 적절한 버퍼 중의 적절한 조건(예를 들면, 4개의 다른 뉴클레오시드 트리포스페이트 및 DNA, RNA 폴리머라제 또는 역전사 효소와 같은 중합제) 및 적당한 온도 하에서 주형-지시 DNA 합성의 시작점으로서 작용할 수 있는 단일가닥 올리고뉴클레오티드를 말한다. 상기 프라이머의 적절한 길이는 사용 목적에 따라 달라질 수 있으나, 통상 15 내지 30 뉴클레오티드이다. 짧은 프라이머 분자는 일반적으로 주형과 안정한 혼성체를 형성하기 위해서는 더 낮은 온도를 필요로 한다. 프라이머 서열은 주형과 완전하게 상보적일 필요는 없으나, 주형과 혼성화 할 정도로 충분히 상보적이어야 한다.
본 발명에서 사용되는 용어, "프라이머"는 짧은 자유 3' 말단 수산화기(free 3' hydroxyl group)를 가지는 염기 서열로 상보적인 템플레이트(template)와 염기쌍(base pair)을 형성할 수 있고 주형 가닥 복사를 위한 시작 지점으로 기능을 하는 짧은 서열을 의미한다. 프라이머는 적절한 완충용액 및 온도에서 중합반응(즉, DNA 폴리머라아제 또는 역전사 효소)을 위한 시약 및 상이한 4가지 뉴클레오사이드 트리포스페이트의 존재하에서 DNA 합성을 개시할 수 있다. PCR 증폭을 실시하여 원하는 생성물의 생성 여부를 통해 사상체질 특이적 대사증후군을 예측할 수 있다. PCR 조건, 센스 및 안티센스 프라이머의 길이는 당업계에 공지된 것을 기초로 변형할 수 있다.
본 발명의 프로브 또는 프라이머는 포스포르아미다이트 고체 지지체 방법, 또는 기타 널리 공지된 방법을 사용하여 화학적으로 합성할 수 있다. 이러한 핵산 서열은 또한 당해 분야에 공지된 많은 수단을 이용하여 변형시킬 수 있다. 이러한 변형의 비-제한적인 예로는 메틸화, 캡화, 천연 뉴클레오타이드 하나 이상의 동족체로의 치환, 및 뉴클레오타이드 간의 변형, 예를 들면, 하전되지 않은 연결체(예: 메틸 포스포네이트, 포스포트리에스테르, 포스포로아미데이트, 카바메이트 등) 또는 하전된 연결체(예: 포스포로티오에이트, 포스포로디티오에이트 등)로의 변형이 있다.
본 발명의 또 다른 하나의 양태는, (a) 개체로부터 분리된 시료의 DNA로부터 서열번호 1 내지 12로 구성된 군에서 선택된 하나 이상의 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드의 SNP를 포함하는 다형성 부위를 증폭하거나 프로브와 혼성화하는 단계; (b) 상기 (a) 단계의 증폭된 또는 혼성화된 다형성 부위의 염기를 결정하는 단계를 포함하는 태음인 예측 또는 진단을 위한 정보의 제공방법을 제공한다.
본 발명의 용어 "개체"란 사상체질을 예측 또는 진단하기 위한 피험자일 수 있다. 상기 개체에서 머리카락, 뇨, 혈액, 각종 체액, 분리된 조직, 분리된 세포 또는 타액과 같은 시료 등으로부터 DNA를 수득할 수 있으나, 이에 제한되는 것은 아니다.
상기 (a) 단계의 DNA로부터 상기 SNP 마커의 다형성 부위를 증폭하거나 프로브와 혼성화하는 단계는 당업자에게 알려진 어떠한 방법이든 사용 가능하다. 예를 들면, 표적 핵산을 PCR을 통하여 증폭하고 이를 정제하여 얻을 수 있다. 그 외 리가제 연쇄 반응(LCR)(Wu 및 Wallace, Genomics 4, 560(1989), Landegren 등, Science 241, 1077(1988)), 전사증폭(transcription amplification)(Kwoh 등, Proc. Natl.Acad. Sci. USA 86, 1173(1989)) 및 자가유지 서열 복제(Guatelli 등, Proc. Natl. Acad. Sci. USA 87, 1874(1990)) 및 핵산에 근거한 서열 증폭(NASBA)이 사용될 수 있다.
상기 방법 중 (b) 단계의 다형성 부위의 염기를 결정하는 것은 서열 분석, 마이크로어레이(microarray)에 의한 혼성화, 대립유전자 특이적인 PCR(allele specific PCR), 다이나믹 대립유전자 혼성화 기법(dynamic allele-specific hybridization, DASH), PCR 연장 분석, PCR-SSCP, PCR-RFLP 분석 또는 TaqMan 기법, SNPlex 플랫폼(Applied Biosystems), 질량 분석법(예를 들면, Sequenom의 MassARRAY 시스템), 미니-시퀀싱(mini-sequencing)방법, Bio-Plex 시스템(BioRad), CEQ and SNPstream 시스템(Beckman), Molecular Inversion Probe 어레이 기술(예를 들면, Affymetrix GeneChip), 및 BeadArray Technologies(예를 들면, Illumina GoldenGate 및 Infinium 분석법)를 포함하나, 이에 한정되지 않는다. 상기 방법들 또는 본 발명이 속하는 기술분야의 당업자에게 이용가능한 다른 방법에 의해, 마이크로새틀라이트, SNP 또는 다른 종류의 다형성 마커를 포함한, 다형성 마커에서의 하나 이상의 대립유전자가 확인될 수 있다. 이와 같은 다형성 부위의 염기를 결정하는 것은 구체적으로는 SNP 칩을 통해 수행할 수 있다.
본 발명에서 용어, "SNP 칩"은 수십만 개의 SNP의 각 염기를 한번에 확인할 수 있는 DNA 마이크로어레이의 하나를 의미한다.
TaqMan 방법은 (1) 원하는 DNA 단편을 증폭할 수 있도록 프라이머 및 TaqMan 탐침을 설계 및 제작하는 단계; (2) 서로 다른 대립유전자의 탐침을 FAM 염료 및 VIC 염료로 표지(Applied Biosystems)하는 단계; (3) 상기 DNA를 주형으로 하고, 상기의 프라이머 및 탐침을 이용하여 PCR을 수행하는 단계; (4) 상기의 PCR 반응이 완성된 후, TaqMan 분석 플레이트를 핵산 분석기로 분석 및 확인하는 단계; 및 (5) 상기 분석결과로부터 단계 (1)의 폴리뉴클레오티들의 유전자형을 결정하는 단계를 포함한다.
상기에서, 시퀀싱 분석은 염기서열 결정을 위한 통상적인 방법을 사용할 수 있으며, 자동화된 유전자분석기를 이용하여 수행될 수 있다. 또한, 대립유전자 특이적 PCR은 SNP가 위치하는 염기를 3' 말단으로 하여 고안한 프라이머를 포함한 프라이머 세트로 상기 SNP가 위치하는 DNA 단편을 증폭하는 PCR 방법을 의미한다. 상기 방법의 원리는, 예를 들어, 특정 염기가 A에서 G로 치환된 경우, 상기 A를 3' 말단염기로 포함하는 프라이머 및 적당한 크기의 DNA 단편을 증폭할 수 있는 반대 방향 프라이머를 고안하여 PCR 반응을 수행할 경우, 상기 SNP 위치의 염기가 A인 경우에는 증폭반응이 정상적으로 수행되어 원하는 위치의 밴드가 관찰되고, 상기 염기가 G로 치환된 경우에는 프라이머는 주형 DNA에 상보결합 할 수 있으나, 3' 말단 쪽이 상보결합을 하지 못함으로써 증폭 반응이 제대로 수행되지 않는 점을 이용한 것이다. DASH는 통상적인 방법으로 수행될 수 있고, 구체적으로는 프린스 등에 의한 방법에 의하여 수행될 수 있다.
한편, PCR 연장 분석은 먼저 단일염기 다형성이 위치하는 염기를 포함하는 DNA 단편을 프라이머 쌍으로 증폭을 한 다음, 반응에 첨가된 모든 뉴클레오티드를 탈인산화시킴으로써 불활성화시키고, 여기에 SNP 특이적 연장 프라이머, dNTP 혼합물, 디디옥시뉴클레오티드, 반응 완충액 및 DNA 중합효소를 첨가하여 프라이머 연장반응을 수행함으로써 이루어진다. 이때, 연장 프라이머는 SNP가 위치하는 염기의 5' 방향의 바로 인접한 염기를 3' 말단으로 삼으며, dNTP 혼합물에는 디디옥시뉴클레오티드와 동일한 염기를 갖는 핵산이 제외되고, 상기 디디옥시뉴클레오티드는 SNP를 나타내는 염기 종류 중 하나에서 선택된다. 예를 들어, A에서 G로의 치환이 있는 경우, dGTP, dCTP 및 TTP 혼합물과 ddATP를 반응에 첨가할 경우, 상기 치환이 일어난 염기에서 프라이머는 DNA 중합효소에 의하여 연장되고, 몇 염기가 지난 후 A 염기가 최초로 나타나는 위치에서 ddATP에 의하여 프라이머 연장반응이 종결된다. 만일 상기 치환이 일어나지 않았다면, 그 위치에서 연장반응이 종결되므로, 상기 연장된 프라이머의 길이를 비교함으로써 SNP를 나타내는 염기 종류를 판별할 수 있게 된다.
이때, 검출방법으로는 연장 프라이머 또는 디디옥시뉴클레오티드를 형광 표지한 경우에는 일반적인 염기서열 결정에 사용되는 유전자 분석기(예를 들어, ABI사의 Model 3700 등)를 사용하여 형광을 검출함으로써 상기 SNP를 검출할 수 있으며, 무-표지된 연장 프라이머 및 디디옥시뉴클레오티드를 사용할 경우에는 MALDI-TOF(matrix assisted laser desorption ionization-time of flight) 기법을 이용하여 분자량을 측정함으로써 상기 SNP를 검출할 수 있다.
구체적으로, 상기 (b) 단계에서 결정된 염기서열 중, 서열번호 1로 기재되는 rs10804157에 있어서, 16번째 염기가 T 인 경우; 서열번호 2로 기재되는 rs13181166에 있어서, 16번째 염기가 T인 경우; 서열번호 3으로 기재되는 rs28519074에 있어서, 16번째 염기가 C인 경우; 서열번호 4로 기재되는 rs17458750에 있어서, 16번째 염기가 C인 경우; 서열번호 5로 기재되는 rs636910에 있어서, 16번째 염기가 C인 경우; 서열번호 6으로 기재되는 rs1421207에 있어서, 16번째 염기가 C인 경우; 서열번호 7로 기재되는 rs2625890에 있어서, 16번째 염기가 G인 경우; 서열번호 8로 기재되는 rs6888436에 있어서, 16번째 염기가 G인 경우; 서열번호 9로 기재되는 rs1295401에 있어서, 16번째 염기가 C인 경우; 서열번호 10으로 기재되는 rs11135730에 있어서, 16 번째 염기가 G인 경우; 서열번호 11로 기재되는 rs1034934에 있어서, 16번째 염기가 C인 경우; 서열번호 12로 기재되는 rs484319에 있어서, 16 번째 염기가 G인 경우, 사상체질 중 태음인으로 판단할 수 있다.
본 발명의 또 다른 하나의 양태는, 태음인 진단용 조성물을 포함하는 태음인 진단용 키트를 제공한다.
상기 키트는 RT-PCR 키트 또는 DNA 분석용(예, DNA 칩) 키트일 수 있다.
본 발명의 키트는 태음인 진단용 마커인 SNP 마커를 증폭을 통해 확인하거나, SNP 마커의 발현 수준을 mRNA의 발현 수준을 확인함으로써 사상체질을 진단할 수 있다.
구체적인 일 구현예에서, 본 발명의 키트는 DNA 칩을 수행하기 위해 필요한 필수 요소를 포함하는 태음인 진단용 키트일 수 있다. DNA 칩 키트는, 일반적으로 편평한 고체 지지판, 전형적으로는 현미경용 슬라이드보다 크지 않은 유리 표면에 핵산 종을 격자형 배열(gridded array)로 부착한 것으로, 칩 표면에 핵산이 일정하게 배열되어, DNA 칩 상의 핵산과 칩 표면에 처리된 용액 내에 포함된 상보적인 핵산 간에 다중 혼성화(hybridization) 반응이 일어나 대량 병렬 분석이 가능하도록 하는 도구이다.
본 발명의 또 다른 하나의 양태는, 태음인 진단용 조성물을 포함하는 태음인 진단용 마이크로어레이를 제공한다.
상기 마이크로어레이는 DNA 또는 RNA 폴리뉴클레오티드를 포함하는 것일 수 있다. 상기 마이크로어레이는 프로브 폴리뉴클레오티드에 본 발명의 폴리뉴클레오티드를 포함하는 것을 제외하고는 통상적인 마이크로어레이로 이루어진다.
프로브 폴리뉴클레오티드를 기판상에 고정화하여 마이크로어레이를 제조하는 방법은 당업계에 잘 알려져 있다. 상기 프로브 폴리뉴클레오티드는 혼성화할 수 있는 폴리뉴클레오티드를 의미하는 것으로, 핵산의 상보성 가닥에 서열 특이적으로 결합할 수 있는 올리고뉴클레오티드를 의미한다.
본 발명의 프로브는 대립 유전자 특이적 프로브로서, 같은 종의 두 구성원으로부터 유래한 핵산 단편 중에 다형성 부위가 존재하여, 한 구성원으로부터 유래한 DNA 단편에는 혼성화하나, 다른 구성원으로부터 유래한 단편에는 혼성화하지 않는다. 이 경우 혼성화 조건은 대립 유전자간의 혼성화 강도에 있어서 유의한 차이를 보여, 대립 유전자 중 하나에만 혼성화 하도록 충분히 엄격해야 한다. 이렇게 함으로써 다른 대립 유전자 형태 간에 좋은 혼성화 차이를 유발할 수 있다.
본 발명의 상기 프로브는 대립 유전자를 검출하여 사상체질 중 태음인 진단 방법 등에 사용될 수 있다. 상기 예측 또는 진단 방법에는 서던 블롯트 등과 같은 핵산의 혼성화에 근거한 검출방법들이 포함되며, DNA 칩을 이용한 방법에서 DNA 칩의 기판에 미리 결합된 형태로 제공될 수도 있다. 상기 혼성화란 엄격한 조건, 예를 들면 1M 이하의 염 농도 및 25 ℃ 이상의 온도 하에서 보통 수행될 수 있다. 예를 들면, 5x SSPE (750 mM NaCl, 50 mM Na Phosphate, 5 mM EDTA, pH 7.4) 및 2530 ℃의 조건이 대립 유전자 특이적 프로브 혼성화에 적합할 수 있다.
본 발명의 사상체질 중 태음인 진단과 연관된 프로브 폴리뉴클레오티드의 기판상에 고정화하는 과정도 또한 이러한 종래 기술을 사용하여 용이하게 제조할 수 있다. 또한, 마이크로어레이 상에서의 핵산의 혼성화 및 혼성화 결과의 검출은 당업계에 잘 알려져 있다. 상기 검출은 예를 들면, 핵산 시료를 형광 물질 예를 들면 Cy3 및 Cy5와 같은 물질을 포함하는 검출가능한 신호를 발생시킬 수 있는 표지 물질로 표지한 다음, 마이크로어레이 상에 혼성화하고 상기 표지 물질로부터 발생하는 신호를 검출함으로써 혼성화 결과를 검출할 수 있다.
본 발명의 또 다른 하나의 양태는, 진단용 SNP 마커를 선별하는 방법을 제공한다.
상기 방법은 구체적으로, (a) 전장유전체 분석(Genome-Wide Association Study, GWAS)을 통해 체질과 연관성이 있는 SNP를 선별하는 단계; (b) 상기 (a) 단계의 선별된 SNP를 바탕으로 SNP 세트 선정 및 기능 영역을 맵핑하는 단계; (c) 딥러닝 알고리즘을 적용하여 SNP 기능 점수를 스코어링하는 단계; 및 (d) 상기 (c) 단계에서 기능점수가 높은 SNP를 선별하는 단계를 포함하는, 태음인 진단용 SNP 선별 방법일 수 있다.
상기 (a) 단계는 복잡한 데이터들로부터 체질과 연관성이 있는 SNP를 효과적으로 추출하기 위해 컨볼루션 레이어(Convolution layer)의 도입, 제한 볼츠만 머신(Restricted Boltzmann machine; RBM), 또는 오토 인코더(Auto-encoder)를 통해SNP를 선별할 수 있으나, 이에 제한되지는 않는다. 구체적으로는 각 체질별로 연관성이 P < 0.0001인 SNP들을 선별할 수 있다.
상기 (b) 단계는 상기 (a) 단계에서 선별된 체질 연관 SNP를 바탕으로 SNP 세트를 선정하고 기능 영역을 맵핑할 수 있다.
통계적 유의성이 높은 SNP 주변으로 연관 불균형이 존재하는 LD 영역 내 실제 형질에 주요하게 작용하는 SNP가 존재할 수 있으므로, 하나의 SNP가 아닌 SNP 주변영역으로 확장하여 기능 패턴을 조사하였다.
상기 (c) 단계는 딥러닝 알고리즘을 적용하여 SNP 기능 점수를 스코어링할 수 있다.
상기 (d) 단계는 상기 (c) 단계에서 기능점수가 높은 SNP를 선별할 수 있다.
본 발명의 SNP 마커는 사상체질 중 태음인을 진단하는 태음인 특이적 SNP 마커로서, 정확하고 객관적인 사상체질의 진단을 할 수 있을 것이다.
도 1은 본 발명의 SNP를 선별하기 위한 방법의 순서도를 간략하게 나타낸 도이다.
이하, 실시예를 통하여 본 발명을 보다 상세히 설명하고자 한다. 이들 실시예는 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 범위가 이들 실시예에 의해 한정되는 것은 아니다.
실시예 1. 대상자 선별
단축형 사상체질 진단도구(KS-15)를 통해 설문을 기반으로 체질이 분류된 태음인(TE), 소음인(SE), 소양인(SY) 집단을 대상으로 하였다. 각각의 체질별 집단은 5797명의 사람들로 이루어졌다.
실시예 2. 체질 연관 유전인자 선정
상기 태음인 집단의 5797명에 대해 전장 유전체 분석(Genome-Wide Association Study, GWAS)을 진행하였다. 실험에서는 1000 genome project에서 제공되고 있는 ASN 패널을 사용하여 결측값을 추정(imputation)하였다.
전장 유전체 분석을 통해 찾은 유전형과 체질간 연관 분석(linear regression)을 통해 체질 연관 유전인자를 선정하였다. 이 때, 통계 파워를 계산하여 P-value < 0.0001을 기준으로 통계적으로 연관이 많은 유의한 SNP를 선정하였다.
실시예 3. SNP block 생성 및 SNP 세트 선정
전장 유전체에 대해서 p-value를 기반으로 연관성이 강한 순서대로 정렬한 후, 연관성이 가장 강한 SNP를 lead(단서) SNP로 선출하였고, lead SNP는 서로 1Mb 이내에 겹치지 않도록 선출하였다.
상기 유전체의 연관성은 유전자의 대립형(genotype allele type)에 따른 표현형(phenotype) 즉, 체질값으로 계산하였다. 상기 연관성의 정도는 오즈비(Odds Ratio)나 베타(BETA) 값의 통계량값으로 해석하였고, 유의성은 p-value 값으로 정하였다. 상기 p-value를 cut off로 설정하여 후보 가능한 SNP들을 정하였으며, 이를 정렬(sorting)하여 순차적으로 leadSNP를 선출하였다.
하나의 lead SNP와 그 주변 1Mb 이내의 후보 SNP들 중에 p-value가 5 x 10-4 이하인 SNP들 중에서 연관성이 높은 순으로 최대 30개의 SNP를 선정하여 한 구간(block)으로 정의하였다.
통계적 연관 변이 주변에는 통계적으로는 유의하지 않지만 유전적 연관 불균형 구간에 포함되어 있어 형질에 영향을 미치는 경우가 있으므로, 주변의 연관 SNP도 포함하기 위해 SNP block 구간 내의 SNP 목록을 하기 표 1과 같이 선정하였다.
또한, 훈련, 검증, 테스팅 세트 사이에 중복이 없도록 하기 위해 염색체 정보에 기반하여 데이터 세트를 구분하였다. 염색체 1번부터 10번까지는 훈련 세트로 사용하고, 모델의 최종 성능(performance)을 평가하는데 사용되는 테스팅 세트는 11번부터 14번까지를 사용하였다. 나머지 15번에서 22번까지의 염색체는 검증세트로 사용하였다.
하기 표 1의 수치는 학습에 사용된 SNP 세트의 기본 정보수로서 SNP block(구간)의 수를 의미한다.
훈련, 검증, 테스트 세트 수
GWAS SNP set (out off P value < 5e-04)
소음 (SE) 소양 (SY) 태음 (TE)
Training Set (Chr. 1-10) 92 89 86
Validation Set (Chr. 15-22) 33 22 26
Test Set (Chr.11-14) 30 21 31
실시예 4: SNP의 기능 영역 맵핑
각각의 SNP들의 위치에 존재하는 후성유전학적인 정보의 특이적 패턴들을 학습하여 SNP에 기능 점수를 부여하였다. 상기 후성유전학적인 정보는 ENCODE 프로젝트(The ENCODE Project Consortium, 2012) 및 Roadmap 에피지놈 프로젝트(Roadmap Epigenomics Consortium, 2015)에서 제공하는 DNase Hypersensitive site(DHS), 히스톤 변형, 타겟 유전자 기능, 전사조절인자들이 결합하는 부위 내에 포함되어 있는 유전자 영역이다(표 2). 상기 후성유전체 정보는 근처 유전자들의 발현 조절을 담당하는 단백질이 붙는 부위나 그 유전자가 작용하는 대사경로에 관한 것이다. 이를 기반으로 SNP에 기능점수가 부여된다. 즉, SNP가 상기 기능 부위에 해당하는 경우 1, 해당하지 않은 경우를 0으로 하는 바이너리 데이터를 구성하였다.
학습에 사용된 기능 맵핑 정보 수
# feature 소음 (SE) 소양 (SY) 태음 (TE)
DHS 124 124 122 119
Histone modification 606 570 511 453
Target gene pathway 301 9 14 11
FMO 996 15 7 6
실시예 5: 딥러닝 알고리즘을 적용한 SNP의 기능 점수화
체질값과 통계적으로 연관된 유전부위에 존재하는 생물학적 기능 패턴을 추출하기 위해 컨볼루션 신경망 기반의 딥러닝 프레임워크를 활용하였다.
실시예 2에서 생성된 하나의 SNP block이 하나의 훈련 이미지 데이터가 되며, 이 block 내에 적어도 하나 이상의 원인 변이가 있는 것을 바탕으로 컨볼루션 신경망 프레임워크를 활용하여 원인 변이의 특징을 학습하였다.
학습에 사용한 모델은 패턴 탐색기 부분과 각 SNP 마다 기능 점수를 스코어링하는 부분으로 나눌 수 있으며, 하기의 과정으로 수행되었다.
5-1. 전장 유전체 연관성 분석 결과로부터 입력 이미지의 구성
전장 유전체에 대해 p-value를 기반으로 연관성이 강한 순서대로 정렬한 후 가장 강한 SNP부터 시작하여 1Mb 이내에 겹치지 않도록 단서(lead) SNP를 선출하였다. 하나의 lead SNP와 그 주변 1Mb 이내에서 선택된 SNP를 포함하는 후보 SNP 중에 연관성이 높은 순으로 최대 30개 SNP까지 한 구간(block)으로 정의하였다. 이 때, 한 구간으로부터 하나의 이미지로 규정되는 훈련 이미지 데이터가 생성되며, 이 구간 내 적어도 하나 이상의 원인 변이가 있다는 것을 이용하여 이미지의 부분적인 특징을 추출할 수 있는 CNN 프레임워크를 활용하여 원인변이의 특징을 학습하였다.
5-2. 모델 디자인
CNN 프레임워크는 조정(tuning)이 가능한 패턴 탐색기(pattern detector)들로 구성되어 있다. 상기 패턴 탐색기들은 커널(kernel), 또는 필터(filter)로 불리며, 이는 국소 연결성(local connectivity)이 있는 부분적인 패턴을 감지하고, 이를 전체 입력 필드(field)에 대해 반복적으로 연산을 수행하였다.
5-3. Denoising-오토 인코더(DA)를 활용한 사전학습(pre-training)
오토 인코더는 딥러닝에서 커널들을 미세조정(fine-tuning)하기에 앞서 훈련(training) 데이터들의 좀 더 일반적인 특징을 학습할 수 있도록, 국소 최소값에 빠지지 않도록 좀 더 최적화된 포인트에서부터 학습을 시작할 수 있도록 하는 비지도(unsupervised) 학습 기법이다. 모델이 더 강건한(robust) 특징을 학습할 수 있도록 입력값에 무작위적인 노이즈를 섞어서 학습하는 denoising-오토인코더(DA)를 활용하여 사전학습을 수행하였다.
5-4. 하이퍼 파라미터(hyper parameter)
딥러닝 모델은 다수의 하이퍼 파라미터들에 의존하며, 각각의 하이퍼 파라미터들은 모델의 성능에 상당한 영향을 미친다. 하이퍼 파라미터는 DA 사전학습 과정에서의 입력값에 적용되는 노이즈 레벨(corruption level), 미세조정 과정에서의 학습률(learning rate), 모멘텀(momemtum), 엘라스틱넷(elastic net) 규제화(regularization) 과정에 사용되는 파라미터가 포함된다.
무작위적으로 선출된 하이퍼 파라미터 셋에 기반하여 최적화된 조건을 찾았다.
5-5. SNP의 기능 점수화
첫 번째 레이어(Convolution layer)(C1)에서는 한 개의 제1층 입력이미지를 규정하는 이미지 매트릭스를 입력한다. 제1층 입력이미지와 컨볼루션 커널인 제1층 커널을 사용하여 각 후보 SNP 들이 각 종류의 패턴들과 부합하는지에 대한 매트릭스를 생성하는 컨볼루션 과정을 수행하였다. 제1층 커널을 나타내는 어레이의 각 요소는 0 또는 1의 값을 갖는다.
두 번째 레이어(Convolution layer)(C2)에서는 추출된 패턴 결과를 바탕으로 비선형적인 복잡한 패턴을 분석할 수 있었다. 제2층 커널의 어레이 각 요소는 0 또는 1의 값을 갖는다.
예측 점수가 1에 가까울수록 리스크 유전 구간들에서 공통적으로 나타나는 조절 패턴들이 감지되었음을 의미한다.
마지막으로, max-pooling을 수행하여 최종 도출된 점수는 하나의 연관성 구간 내에서 리스크 패턴과 가장 잘 매칭되는 SNP의 점수로 도출하였다.
실시예 6: 검증절차를 통한 사상체질 진단용 SNP 선정
체질 확진자를 통한 검증절차를 거쳐 최종적으로 태음인 특이적 사상체질 진단용 SNP를 선정하였다.
체질 확진자의 선정 기준은 다음과 같다.
기준 1: 각 체질별 KS-15의 확률 값이 높은 대상자 우선
기준 2: 체질 전문가의 진단과 KS-15 의 확률 값 진단 체질이 동일
기준 3: BMI 지수 18.5 이상
기준 4: 태음인의 경우, BMI 지수 18.5 내지 25의 정상체중 집단 30명 및 BMI 지수 25 초과의 과체중 집단 30명으로 나눔
기준 5: 대사증후군이 없고, 질병 과거력 중 암 및 갑상선 이상이 없을 것
체질 확진자 선정 기준에 따라 소음인 30명, 소양인 30명, 태음인 살찐 그룹 30명, 태음인 정상체중 그룹 30명을 대상으로 WGS(Whole Genome Sequencing)를 수행하였다. 각각의 체질 확진자 그룹에서 체질별로 선정된 후보 SNP들이 존재하는지 재현성 확인을 하고, 다른 체질 값과 연관된 SNP를 제외하였다.
필터링 된 SNP 중, SNP의 빈도와 기능 점수를 고려하여 Minor Allel Frequency가 높고 기능 점수 값이 높은 SNP를 선정하였다.
후보 SNP 선정 절차 및 검증 절차를 거쳐 최종적으로 선정된 체질 특이적 SNP를 하기 표 3에 나타내었다.
태음인 특이적 SNP
SNP ID Allel Type  Minor Allel Frequency Chr. Position  GWAS P-value Functional Score Heavy TE Allel Frequency Normal TE Allel Frequency
rs10804157 T>C 0.4927 2 208123384 0.000327 1 0.68 0.74
rs13181166 T>C 0.4244 5 169361187 0.0001977 0.999 0.65 0.75
rs28519074 C>T 0.4418 6 148763683 0.0003706 0.999 0.48 0.4
rs17458750 C>T 0.3644 9 73196666 0.00001 0.996 0.76 0.7
rs636910 C>G 0.2635 15 45932871 0.0002904 1 0.84 0.79
rs1421207 C>G 0.0064 1 237422084 0.0003253 1 1 1
rs2625890 G>C 0.07853 3 9547950 0.0002683 1 1 1
rs6888436 G>A 0.3044 5 118724509 0.0003967 1 1 1
rs1295401 C>A 0.06435 7 51141405 0.0004893 1 1 1
rs11135730 G>C 0.2516 8 23228990 0.0002018 0.999 1 1
rs1034934 C>G 0.02959 12 2660096 0.0003251 0.957 1 1
rs484319 G>C 0.05862 12 69980141 0.0001454 1 1 1
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
<110> Korea Institute of Oriental Medicine <120> SNP markers for diagnosing Taeeumin of sasang constitution and use thereof <130> KPA181217-KR <160> 12 <170> KoPatentIn 3.0 <210> 1 <211> 31 <212> DNA <213> Homo sapiens <220> <221> variation <222> (16) <223> Y=T or C <400> 1 gccaagaagg gaaggygtgg ttcactttgt c 31 <210> 2 <211> 31 <212> DNA <213> Homo sapiens <220> <221> variation <222> (16) <223> R=C or T <400> 2 aatcaggtac tggggrgggg cttatgccac t 31 <210> 3 <211> 31 <212> DNA <213> Homo sapiens <220> <221> variation <222> (16) <223> Y=T or C <400> 3 ctctcacaca cccccygccc cccacataca c 31 <210> 4 <211> 31 <212> DNA <213> Homo sapiens <220> <221> variation <222> (16) <223> S= C or T <400> 4 catggcaacc accgcsggca tggtgaggct c 31 <210> 5 <211> 31 <212> DNA <213> Homo sapiens <220> <221> variation <222> (16) <223> K= G or C <400> 5 gagttcactg taaackggac tggccatttc a 31 <210> 6 <211> 31 <212> DNA <213> Homo sapiens <220> <221> variation <222> (16) <223> R= C or G <400> 6 gacagaatgc taaggrgtta atttagagtt t 31 <210> 7 <211> 31 <212> DNA <213> Homo sapiens <220> <221> variation <222> (16) <223> R= C or G <400> 7 gactgcggac actagrgagt aatggtcttt t 31 <210> 8 <211> 31 <212> DNA <213> Homo sapiens <220> <221> variation <222> (16) <223> R= G or A <400> 8 tttttttttt tttttragtt ttttttgtag a 31 <210> 9 <211> 31 <212> DNA <213> Homo sapiens <220> <221> variation <222> (16) <223> R= C or A <400> 9 aaggtcctta caagcrgaga cacgaagcag c 31 <210> 10 <211> 31 <212> DNA <213> Homo sapiens <220> <221> variation <222> (16) <223> K= G or C <400> 10 atggcaactg gctggktgca gtggctcacg c 31 <210> 11 <211> 31 <212> DNA <213> Homo sapiens <220> <221> variation <222> (16) <223> K= C or G <400> 11 tcactcactc tgacaktggc accagggagt c 31 <210> 12 <211> 31 <212> DNA <213> Homo sapiens <220> <221> variation <222> (16) <223> Y= C or G <400> 12 atctttaaaa caatgyttag aacaaggctt a 31

Claims (11)

  1. 서열번호 6의 염기서열로 이루어진 폴리뉴클레오티드 또는 이의 상보적인 폴리뉴클레오티드를 포함하며, 상기 염기서열은 16번째 염기를 SNP(single nucleotide polymorphism)로서 포함하고,
    상기 서열번호 6의 16번째 염기는 C인, 사상체질 중 태음인 진단용 마이크로 어레이.
  2. 제1항에 있어서, 상기 폴리뉴클레오티드는 서열번호 1 내지 5 및 7 내지 12의 염기서열로 구성되는 군에서 선택된 하나 이상의 폴리뉴클레오티드를 더 포함하며, 상기 염기서열은 16번째 염기를 SNP(single nucleotide polymorphism)로서 포함하고,
    상기 서열번호 1의 16번째 염기는 T, 서열번호 2의 16번째 염기는 T, 서열번호 3의 16번째 염기는 C, 서열번호 4의 16번째 염기는 C, 서열번호 5의 16번째 염기는 C, 서열번호 7의 16번째 염기는 G, 서열번호 8의 16번째 염기는 G, 서열번호 9의 16번째 염기는 C, 서열번호 10의 16번째 염기는 G, 서열번호 11의 16번째 염기는 C, 서열번호 12의 16번째 염기는 G인, 사상체질 중 태음인 진단용 마이크로 어레이.
  3. 서열번호 6의 염기서열로 이루어진 폴리뉴클레오티드 또는 이의 상보적인 폴리뉴클레오티드에 결합할 수 있는 프로브 또는 특이적으로 증폭할 수 있는 프라이머를 포함하고, 상기 서열번호 6의 16번째 염기는 C인, 사상체질 중 태음인 진단용 조성물.
  4. 제3항에 있어서, 상기 폴리뉴클레오티드는 서열번호 1 내지 5 및 7 내지 12의 염기서열로 구성되는 군에서 선택된 하나 이상의 폴리뉴클레오티드를 더 포함하고,
    상기 서열번호 1의 16번째 염기는 T, 서열번호 2의 16번째 염기는 T, 서열번호 3의 16번째 염기는 C, 서열번호 4의 16번째 염기는 C, 서열번호 5의 16번째 염기는 C, 서열번호 7의 16번째 염기는 G, 서열번호 8의 16번째 염기는 G, 서열번호 9의 16번째 염기는 C, 서열번호 10의 16번째 염기는 G, 서열번호 11의 16번째 염기는 C, 서열번호 12의 16번째 염기는 G인, 사상체질 중 태음인 진단용 조성물.
  5. 제3항 또는 제4항의 조성물을 포함하는 사상체질 중 태음인 진단용 키트.
  6. 제5항에 있어서, 상기 키트는 RT-PCR 키트 또는 DNA 칩 키트인 것인, 키트.
  7. (a) 개체로부터 분리된 시료의 DNA로부터 서열번호 6의 염기서열로 이루어진 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드의 SNP를 포함하는 다형성 부위를 증폭하거나 프로브와 혼성화하는 단계;
    (b) 상기 (a) 단계의 증폭된 또는 혼성화된 다형성 부위의 염기를 결정하는 단계; 및
    (c) 상기 (b) 단계에서 결정된 염기서열 중,
    서열번호 6으로 기재되는 rs1421207에 있어서, 16번째 염기가 C인 경우, 상기 개체를 태음인으로 결정하는 단계를 포함하는, 사상체질 중 태음인 예측 또는 진단을 위한 정보의 제공방법.
  8. 제7항에 있어서, 상기 폴리뉴클레오티드는 서열번호 1 내지 5 및 7 내지 12로 구성되는 군에서 선택된 하나 이상의 폴리뉴클레오티드를 더 포함하며,
    상기 (b) 단계에서 결정된 염기서열 중,
    서열번호 6으로 기재되는 rs1421207에 있어서, 16번째 염기가 C이고,
    서열번호 1로 기재되는 rs10804157에 있어서, 16번째 염기가 T 인 경우;
    서열번호 2로 기재되는 rs13181166에 있어서, 16번째 염기가 T인 경우;
    서열번호 3으로 기재되는 rs28519074에 있어서, 16번째 염기가 C인 경우;
    서열번호 4로 기재되는 rs17458750에 있어서, 16번째 염기가 C인 경우;
    서열번호 5로 기재되는 rs636910에 있어서, 16번째 염기가 C인 경우;
    서열번호 7로 기재되는 rs2625890에 있어서, 16번째 염기가 G인 경우;
    서열번호 8로 기재되는 rs6888436에 있어서, 16번째 염기가 G인 경우;
    서열번호 9로 기재되는 rs1295401에 있어서, 16번째 염기가 C인 경우;
    서열번호 10으로 기재되는 rs11135730에 있어서, 16번째 염기가 G인 경우;
    서열번호 11로 기재되는 rs1034934에 있어서, 16번째 염기가 C인 경우; 또는
    서열번호 12로 기재되는 rs484319에 있어서, 16번째 염기가 G인 경우,
    상기 개체를 태음인으로 결정하는 단계를 포함하는, 방법.
  9. 제7항 또는 제8항에 있어서, 상기 (b) 단계의 염기 결정은 서열 분석, 마이크로어레이에 의한 혼성화, 대립 유전자 특이적인 PCR (allele specific PCR), 다이나믹 대립 유전자 혼성화 기법(dynamic allele-specific hybridization, DASH), PCR 연장 분석, PCR-SSCP (PCR-single strand conformation polymorphism), PCR-RFLP (PCR-restriction fragment length polymorphism) 및 TaqMan 기법으로 이루어진 군에서 선택된 하나 이상의 방법에 의해 수행되는 것인, 방법.
  10. 삭제
  11. 삭제
KR1020190074102A 2019-06-21 2019-06-21 사상체질 중 태음인 진단용 snp 마커 및 이의 용도 KR102193657B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190074102A KR102193657B1 (ko) 2019-06-21 2019-06-21 사상체질 중 태음인 진단용 snp 마커 및 이의 용도

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190074102A KR102193657B1 (ko) 2019-06-21 2019-06-21 사상체질 중 태음인 진단용 snp 마커 및 이의 용도

Publications (1)

Publication Number Publication Date
KR102193657B1 true KR102193657B1 (ko) 2020-12-22

Family

ID=74086455

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190074102A KR102193657B1 (ko) 2019-06-21 2019-06-21 사상체질 중 태음인 진단용 snp 마커 및 이의 용도

Country Status (1)

Country Link
KR (1) KR102193657B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100123050A (ko) * 2009-05-14 2010-11-24 한국생명공학연구원 사상체질 진단용 다중 snp 마커,그를 포함하는 마이크로어레이,및 그를 이용한 사상체질 진단용 키트
KR20180082801A (ko) * 2017-01-11 2018-07-19 인제대학교 산학협력단 사상체질 진단용 조성물 및 이를 이용한 사상체질 진단방법
KR20190059882A (ko) * 2019-05-23 2019-05-31 인제대학교 산학협력단 태음인 진단용 조성물 및 이를 이용한 태음인 진단방법
KR20190060962A (ko) * 2019-05-23 2019-06-04 인제대학교 산학협력단 소음인 진단용 조성물 및 이를 이용한 소음인 진단방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100123050A (ko) * 2009-05-14 2010-11-24 한국생명공학연구원 사상체질 진단용 다중 snp 마커,그를 포함하는 마이크로어레이,및 그를 이용한 사상체질 진단용 키트
KR20180082801A (ko) * 2017-01-11 2018-07-19 인제대학교 산학협력단 사상체질 진단용 조성물 및 이를 이용한 사상체질 진단방법
KR20190059882A (ko) * 2019-05-23 2019-05-31 인제대학교 산학협력단 태음인 진단용 조성물 및 이를 이용한 태음인 진단방법
KR20190060962A (ko) * 2019-05-23 2019-06-04 인제대학교 산학협력단 소음인 진단용 조성물 및 이를 이용한 소음인 진단방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Gabriel E. Hoffman et al, BioRxiv, 2018, 1-52 *
Uppu et al, Int J Med Inform. 2018 Nov;119:134-151* *

Similar Documents

Publication Publication Date Title
KR20170034829A (ko) 미백 피부 타입 유전자 다형성 마커 및 이의 용도
JP2008526249A5 (ko)
EP2061910B1 (en) Prognostic method
KR101546058B1 (ko) 대사증후군 예측용 snp 마커 및 이의 용도
KR100590547B1 (ko) 복합 질환과 연관된 다중 snp 마커들로부터 최적 마커세트를 선택하는 방법
US20110039710A1 (en) Apparatus and methods for applications of genomic microarrays in screening, surveillance and diagnostics
KR101761801B1 (ko) 코 표현형 판단용 조성물
KR102193657B1 (ko) 사상체질 중 태음인 진단용 snp 마커 및 이의 용도
KR102193658B1 (ko) 사상체질 중 소음인 진단용 snp 마커 및 이의 용도
KR102193659B1 (ko) 사상체질 중 소양인 진단용 snp 마커 및 이의 용도
KR102348688B1 (ko) 냉증 진단용 snp 마커 및 이의 용도
KR102268059B1 (ko) 운동 민감도 예측용 조성물, 키트, 및 이를 이용한 방법
WO2008010082A2 (en) Diagnostic method for fibromyalgia (fms) or chronic fatigue syndrome (cfs)
KR102156699B1 (ko) 소음인 판별용 조성물
KR101663171B1 (ko) 다운증후군 진단을 위한 바이오마커 및 그의 용도
KR101772448B1 (ko) 성격 특성 판단용 조성물
KR102346185B1 (ko) 피부 색소 침착 위험도 예측용 바이오마커 및 이의 용도
KR101167945B1 (ko) Atg16l1 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 자폐 스펙트럼 장애 분석방법
KR101687261B1 (ko) 음성표현형 판별용 조성물
KR20240057772A (ko) 우울증 진단용 단일염기다형성 및 이의 용도
KR20220141659A (ko) 피부색 판단용 유전자 다형성 마커 및 이의 용도
KR20230072354A (ko) 레티놀을 포함하는 처방의 자극 유무 예측 방법 및 시스템
KR20220141658A (ko) 피부색 판단용 유전자 다형성 마커 및 이의 용도
KR101402919B1 (ko) 중풍 분류용 뉴로펩타이드 y 유전자 다형성 마커 및 이의 용도
KR101075392B1 (ko) Fga 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 이를 이용한 검출 방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant