KR101541142B1 - Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease - Google Patents

Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease Download PDF

Info

Publication number
KR101541142B1
KR101541142B1 KR1020150090475A KR20150090475A KR101541142B1 KR 101541142 B1 KR101541142 B1 KR 101541142B1 KR 1020150090475 A KR1020150090475 A KR 1020150090475A KR 20150090475 A KR20150090475 A KR 20150090475A KR 101541142 B1 KR101541142 B1 KR 101541142B1
Authority
KR
South Korea
Prior art keywords
base
host disease
human chromosome
graft
snps
Prior art date
Application number
KR1020150090475A
Other languages
Korean (ko)
Other versions
KR20150080475A (en
Inventor
양송주
정정희
백규흠
김정은
양갑석
서정선
전은형
박선양
Original Assignee
주식회사 마크로젠
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 마크로젠, 서울대학교산학협력단 filed Critical 주식회사 마크로젠
Priority to KR1020150090475A priority Critical patent/KR101541142B1/en
Publication of KR20150080475A publication Critical patent/KR20150080475A/en
Application granted granted Critical
Publication of KR101541142B1 publication Critical patent/KR101541142B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

이식편대숙주병 발병과 유의적 상관관계를 갖는 특정 단일염기다형성(SNP)을 선별하고, 이를 마커로 이용하여 이식편대숙주병 위험성을 예측하기 위한 기술이 제공된다.Techniques are provided to select specific single nucleotide polymorphisms (SNPs) that have a significant correlation with the onset of graft versus host disease and use this as a marker to predict graft versus host disease risk.

Description

이식편대숙주병 발병 위험성의 예측 방법, 예측용 조성물 및 키트{Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease}Technical Field [0001] The present invention relates to a method for predicting the risk of graft-versus-host disease and a composition and kit for predicting the risk of graft-versus-

이식편대숙주병 발병과 유의적 상관관계를 갖는 특정 단일염기다형성(SNP); 상기 SNP의 염기를 확인하여 이식편대숙주병 발병 위험성예측에 정보를 제공하는 방법; 상기 SNP을 검출하기 위한 프로브 및/또는 상기 염색체 부위를 증폭하기 위한 프라이머를 포함하는 이식편대숙주병 발병 위험성 검진용 조성물, 및 상기 이식편대숙주병 발병 위험성 검진용 조성물을 포함하는 이식편대숙주병 발병 위험성 검진용 키트가 제공된다.Specific single nucleotide polymorphisms (SNPs) that have a significant correlation with the onset of graft versus host disease; Identifying the SNP bases and providing information to predicting the risk of graft-versus-host disease; A composition for screening a risk of graft-versus-host disease comprising a probe for detecting the SNP and / or a primer for amplifying the chromosomal region, and a graft-versus-host disease disease comprising the graft-versus- A kit for risk assessment is provided.

조혈모세포이식은 백혈병, 재생불량성빈혈, 면역결핍 환자 등에게 항암/면역억제 치료 또는 방사선 치료를 한 후, 손상된 골수 또는 질병이 있는 골수를 대체하여 건강한 세포를 공급하고 만들 수 있게 하기 위해 정상 혈액세포를 보충해 주는 시술이며, 종류는 자가이식과 동종이식이 있다. 동종조혈모세포이식은 많은 난치성 혈액질환을 완치 시킬 수 있는 우수한 치료법이지만, 이식 후에 많은 합병증이 발생 할 수 있으며, 가장 대표적인 합병증은 이식편대숙주병 (graft-versus-host disease, GVHD)으로서 이식 사망원인의 15~25%에 이른다.Hematopoietic stem cell transplantation is the treatment of leukemia, aplastic anemia, and immunodeficiency patients after the anti-cancer / immunosuppressive therapy or radiation therapy, to replace damaged bone marrow or diseased bone marrow, , And the types are autotransplantation and homologous transplantation. Allogeneic hematopoietic stem cell transplantation is an excellent treatment that can cure many intractable blood diseases, but many complications can occur after transplantation. The most common complication is graft-versus-host disease (GVHD) Of the total.

이식편대숙주병이란 공여자로부터 이식된 조직 (내지는 골수)에 포함되어 있는 면역세포 (림프구)가 면역이 저하된 환자(숙주)의 세포를 공격하는 병이다. 일반적으로 이식 후 100일을 기준으로 급성 (acute)과 만성 (chronic)으로 나눌 수 있으며, 급성의 표적기관은 피부, 간, 위장관 등에 주로 손상이 발생하게 되며, 만성은 전신에 걸쳐 자가면역질환과 유사한 형태로 발병하게 된다.  Graft-versus-host disease is a disease in which immune cells (lymphocytes) contained in tissues (or bone marrow) transplanted from a donor attack cells of a patient (host) whose immune system has been degraded. In general, acute and chronic can be divided into 100 days after transplantation. Acute target organs are mainly damaged in skin, liver, gastrointestinal tract, etc. Chronic is caused by autoimmune disease It will develop in a similar form.

병원조혈모세포이식간호사회 (http://bmtnurse.org/)의 이식현황 보고자료에 따르면, 해마다 이식환자수가 증가하는 추세에 있으며, 2011년 이식현황 자료에 따르면 연간 약2,000명에 가까운 환자들이 조혈모세포를 이식 받은 것으로 보고되어 있다. 따라서 이들 환자들은 개인별 중증의 정도 차이는 다를지라도 이식편대숙주병이라는 합병증이 발병할 가능성이 있을 것이다. 동종조혈모세포를 이식하기 전에 이식편대숙주병의 발병 여부를 미리 예측 가능하게 함으로써 조기진단 및 치료에 대한 대응방법을 차별화하여 처치할 수 있을 것이다. 그러나, 아직까지 개인별 감수성을 미리 판단하여 이식편대숙주병의 발병 위험성을 미리 예측할 수 있는 분자진단적인 방법이 상용화 되지 못하고 있어서, 이에 대한 연구 및 기술 개발이 요구된다.According to the transplantation status data of the hospital hematopoietic stem cell transplantation nursing society (http://bmtnurse.org/), the number of transplant patients is increasing year by year, and according to the 2011 transplant status data, The cells have been reported to have been transplanted. Therefore, these patients may have a complication of graft versus host disease, even though the severity of the individual severity may be different. Pre-transplantation of allogeneic hematopoietic stem cells can predict the onset of graft-versus-host disease, so that early diagnosis and treatment can be dealt with differently. However, molecular diagnostic methods for predicting the risk of graft-versus-host disease in advance can not be commercialized by preliminarily judging individual susceptibility, so research and technology development are required.

본 발명의 일 예는 인간 피험자로부터 채취한 유전자 시료에 대하여 이식편대숙주병 발병과 유의적 상관관계를 갖는 소정의 단일염기다형성(SNP)의 염기를 확인하여 이식편대숙주병 발병 위험성을 예측하는 방법을 제공한다.One example of the present invention is a method for predicting the risk of graft-versus-host disease by identifying a base of a predetermined single nucleotide polymorphism (SNP) having a significant correlation with the onset of graft-versus-host disease in a gene sample collected from a human subject .

다른 예는 이식편대숙주병 발병과 유의적 상관관계를 갖는 소정의 SNP을 포함하는 염색체 부위와 상보적 서열을 갖는 프로브 및 상기 염색체 부위의 증폭을 위한 프라이머로 이루어진 군에서 선택된 하나 이상을 포함하는 이식편대숙주병 발병 위험성 검진용 조성물을 제공한다. Another example is a graft comprising a probe having a complementary sequence with a chromosome region containing a predetermined SNP having a significant correlation with the onset of graft versus host disease and a primer for amplification of the chromosome region There is provided a composition for screening for the risk of metastatic disease.

다른 예는 상기 이식편대숙주병 발병 위험성 검진용 조성물을 포함하는 이식편대숙주병 발병 위험성 검진용 키트를 제공한다.Another example provides a kit for screening a risk of graft-versus-host disease comprising a composition for screening for the risk of graft-versus-host disease.

또 다른 예는 인간 피험자로부터 채취한 유전자 시료에 대하여 이식편대숙주병 발병과 유의적 상관관계를 갖는 소정의 SNP의 염기를 확인하는 단계를 포함하는, 이식편대숙주병 발병 위험성 검진(예측)에 정보를 제공하는 방법을 제공한다.Yet another example is a method for identifying a SNP in a sample of a human subject, comprising identifying a base of a predetermined SNP having a significant correlation with the onset of graft-versus-host disease The method comprising the steps of:

이에, 본 발명자들은 이식편대숙주병 환자 개개인의 염기서열을 검사하여 이식편대숙주병 환자에서 많이 나타나는 단일염기다형성(SNP)을 선별하여 이식편대숙주병 발병 위험성 예측에 사용함으로써, 이식편대숙주병의 전향적인 예방을 가능하게 하는 검진 기술을 개발하여 본 발명을 완성하였다.Therefore, the present inventors examined the nucleotide sequences of individual graft-versus-host disease patients and used single nucleotide polymorphisms (SNPs) in graft-versus-host disease patients to predict the risk of graft-versus-host disease The present invention has been completed by developing a screening technique that enables proactive prevention.

본 발명자들은 동종조혈모세포 이식 전에 환자의 혈액으로부터 genomic DNA를 채취하여 이식편대숙주병이 발병한 환자군과 이식편대숙주병이 발병하지 않은 환자군 2군으로 나누어서 이식편대숙주병과 관련성이 있을 것으로 예상되거나 문헌에서 보고된 바가 있는 유전자들을 대상으로 DNA를 분석하여 이식편대숙주병 발병과 관련이 있을 것으로 예상되는 SNP의 염기를 확인함으로써, 이식편대숙주병 환자군에 특이적으로 나타나는 SNP 및 그 양상을 조사하여 이를 이식편대숙주병과 유의적 상관관계를 갖는 SNP으로서 선별하였으며, 개체의 유전자 중의 상기 선별된 SNP의 양상에 대한 정보를 기반으로 그 개체의 이식편대숙주병 발병 위험성을 측정하는 검진 기술을 완성하였다.
The present inventors obtained genomic DNA from the blood of a patient before allogeneic hematopoietic stem cell transplantation and found that the graft-versus-host disease was expected to be related to graft-versus-host disease by dividing the graft-versus-host disease- , We examined the SNPs specific to graft-versus-host disease patients by examining the DNA of the genes that have been reported in the graft-versus-host disease group by identifying the SNP bases that are expected to be associated with graft- SNPs having a significant correlation with graft versus host disease and screening techniques for measuring the risk of graft versus host disease of the individual based on information on the pattern of the selected SNPs in the genes of the individual were completed.

*본 발명에 따른 검진 기술은 간편하면서도 고감도로 이식편대숙주병 발병 위험군을 분류할 수 있도록 하여, 이들 위험군을 별도 관리함으로써 이식편대숙주병 발병을 미연에 예방하거나 조기 발견할 수 있도록 하는 유용한 기술이다.* The screening technique according to the present invention is a useful technique for preventing or early detection of graft-versus-host disease by separately classifying the risk groups of graft-versus-host disease by a simple and high sensitivity .

본 발명에 있어서, 이식편대숙주병(graft-versus-host disease, GVHD)은 만성 및 급성을 모두 포함할 수 있으며, 구체적으로, 급성이식편대숙주병일 수 있다.In the present invention, graft-versus-host disease (GVHD) may include both chronic and acute, and may specifically be an acute graft-versus-host disease.

본 발명에서는 이식편대숙주병 환자군에 특이적이고 유의성 상관관계를 갖는 SNP으로서 7개의 SNP을 선별하였으며, 상기 이식편대숙주병과 유의적 상관관계를 갖는 SNP을 하기의 표 1에 나타내었다.In the present invention, seven SNPs were selected as SNPs having a specific and significant correlation with graft-versus-host disease patients, and SNPs having a significant correlation with the graft-versus-host disease were shown in Table 1 below.

마커 SNPMarker SNP 염색체 번호Chromosome number 염색체상 위치
(ref)
Chromosomal location
(ref)
유전자명Gene name Ancestal
Allele
Ancestal
Allele
WildWild HeteroHetero HomoHomo Significant genetic modelSignificant genetic model 해석Translate
rs882559rs882559 66 3986906639869066 DAAM2/intronDAAM2 / intron GG GGGG GCGC CCCC recessiverecessive CC protectiveCC protective rs7178935rs7178935 1515 5936816759368167 RNF111/cds-synonRNF111 / cds-synon AA GGGG AGAG AAAA dominantdominant AG+AA riskyAG + AA risky rs3744805rs3744805 1717 3824835438248354 THRA/intronTHRA / intron GG AAAA AGAG GGGG recessiverecessive GG protectiveGG protective rs7564005rs7564005 22 137512698137512698 -- TT TTTT TGTG GGGG recessiverecessive GG protectiveGG protective rs1876522rs1876522 1717 5361028953610289 -- CC TTTT TCTC CCCC co.dominantco.dominant TC or CC protectiveTC or CC protective rs2228048rs2228048 33 3071384230713842 TGFBR2/cds-synonTGFBR2 / cds-synon CC CCCC TCTC TTTT co.dominantco.dominant TC or TT riskyTC or TT risky rs1946518rs1946518 1111 112035458112035458 IL18/5'near geneIL18 / 5 gene TT TTTT TGTG GGGG recessiverecessive GG riskyGG risky

(Genome Build GRCh37/hg19)(Genome Build GRCh37 / hg19)

상기 표 중에서 굵은체로 표시된 것은 이식편대숙주병 발병 위험성이 높은 인자이고, 이탤릭체로 표시된 것은 야생형과 변이형의 중간 정도의 위험성을 갖는 인자를 나타낸 것이다. 또한 상기 표 중의 SNP rs882559, rs3744805, rs1876522에 해당하는 염기는 이중 가닥 중 역방향 가닥(reverse strand)의 두 대립 유전자 염기를 나타낸 것이고, 나머지는 정방향가닥 (forward strand)의 두 대립 유전자 염기를 나타낸 것이며, 이러한 표시는 본 명세서 전체에 걸쳐서 동일하다.Bold in the above table is a factor with a high risk of graft-versus-host disease, and italicized indicates a factor having a medium risk of wild type and mutation type. Also, the bases corresponding to SNPs rs882559, rs3744805, and rs1876522 in the above table represent two allele bases of the reverse strand of the double strand and two allele bases of the forward strand, These indications are the same throughout this specification.

상기 표 1에 나타낸 바와 같이, SNP rs882559는 6번 염색체의 39869066번째 염기 위치에 존재하는 SNP으로서, 야생형의 경우 상기 위치에 염기 G를 갖지만, 변이가 일어나 C로 바뀌면 변이가 된 C는 이식편대숙주병 발병에 있어서 열성모델에서 보호적(protective)으로 작용하여, 두 대립유전자가 모두 C로 변이된 CC의 경우 이식편대숙주병 발병의 위험성이 유의적으로 낮아진다. 즉, GG 야생형이나 GC에서 이식편대숙주병 발병의 위험성이 높아진다(굵은체로 표시). As shown in Table 1, SNP rs882559 is a SNP located at position 39869066 base of chromosome 6. In the case of wild type, SNP rs882559 has a base G in the above position, but when mutated and changed into C, C is a graft- CC in which both alleles are mutated into C, acting as protective in the recessive model in disease outbreaks, significantly reduces the risk of graft-versus-host disease development. That is, the risk of graft-versus-host disease development increases in GG wild-type or GC (shown in bold).

SNP rs7178935는 15번 염색체의 59368167번째 염기 위치에 존재하는 SNP으로서, 야생형의 경우 상기 위치에 염기 G를 갖지만, 변이가 일어나 A로 바뀌면 변이된 A는 이식편대숙주병 발병에 있어서 우성(dominant)모델에서 위험적(risky)으로 작용하여, 두 대립 유전자가 모두 A로 변이된 AA의 경우뿐 아니라, 한 대립 유전자만 A로 변이된 AG의 경우에도 이식편대숙주병 발병 위험이 높아진다 (굵은체로 표시).SNP rs7178935 is a SNP located at position 59368167 base of chromosome 15 and has a base G at the above position in the case of the wild type but the mutated A when changed into A is a dominant model for the onset of graft versus host disease , The risk of graft-versus-host disease increases (not only in AA where both alleles are mutated to A, but also in AG when only one allele is mutated to A) (indicated in bold) .

SNP rs3744805는 17번 염색체의 38248354 위치에 존재하는 SNP으로서, 야생형의 경우 상기 위치에 염기 A를 갖지만, 변이가 일어나 G로 바뀌면 변이된 G는 이식편대숙주병 발병에 있어서 열성(recessive)모델에서 보호적(protective)으로 작용하여, 두 대립유전자가 모두 G로 변이된 GG의 경우 이식편대숙주병 발병의 위험성이 유의적으로 낮아진다. 즉, AA 야생형이나 AG에서 급성이식편대수주병의 발병 위험성이 높아진다(굵은체로 표시). SNP rs3744805 is a SNP located at position 38248354 on chromosome 17, which has base A in the above position in the case of wild type, but mutated G when changed into G, protects it from a recessive model in the onset of graft- GG, in which both alleles are mutated into G, acts as a protective factor, and the risk of graft-versus-host disease development is significantly lowered. In other words, there is an increased risk of developing acute graft alopecia in AA wild type or AG (shown in bold).

SNP rs7564005는 2번 염색체의 137512698번째 염기 위치에 존재하는 SNP으로서, 야생형의 경우 상기 위치에 염기 T를 갖지만, 변이가 일어나 G로 바뀌면 변이된 G는 이식편대숙주병 발병에 있어서 열성(recessive)모델에서 보호적(protective)으로 작용하여, 두 대립 유전자가 모두 G로 변이된 GG의 경우 이식편대숙주병 발병의 위험성이 유의적으로 낮아진다. 즉, TT 야생형이나 TG에서 급성이식편대수주병의 발병 위험성이 높아진다(굵은체로 표시).SNP rs7564005 is a SNP located at the 137512698th base position of chromosome 2 and has a base T in the above position in the case of wild type but G mutant when mutated and changed to G is a recessive model in the onset of graft versus host disease , The risk of graft-versus-host disease development is significantly lower for GG in which both alleles are mutated to G. [ That is, the risk of developing acute graft alopecia are increased in TT wild type or TG (indicated in bold).

SNP rs1876522는 17번 염색체의 53610289번째 염기 위치에 존재하는 SNP으로서, 야생형의 경우 상기 위치에 염기 T를 갖지만, 변이가 일어나 C로 바뀌면 변이가 된 C는 이식편대숙주병 발병에 있어서 공우성(co.dominant)모델에서 보호적(protective)으로 작용하여, 두 대립유전자가 모두 C로 변이된 CC의 경우 이식편대숙주병 발병 위험이 낮아지며, 한 대립 유전자가 C로 변이된 TC의 경우에도 CC 경우 보다는 약간 낮지만 야생형의 경우보다는 낮은 이식편대숙주병 발병의 위험을 나타낸다. 즉, TT 야생형인 경우 급성이식편대수주병의 발병 위험성이 높아진다(굵은체로 표시).SNP rs1876522 is a SNP located at position 53610289 base of chromosome 17 and has a base T in the above position in the case of wild type but mutated C when C is changed to C in the presence of a homozygous (co In contrast, CC with both alleles mutated to C has a lower risk of graft-versus-host disease, and TC with an allele shifted to C, But a lower risk of graft-versus-host disease than wild-type. That is, the TT wild type increases the risk of developing acute graft-versus-host disease (indicated in bold).

SNP rs2228048는 3번 염색체의 30713842번째 염기 위치에 존재하는 SNP으로서, 야생형의 경우 상기 위치에 염기 C를 갖지만, 변이가 일어나 T로 바뀌면 변이가 된 T는 이식편대숙주병 발병에 있어서 공우성 (co.dominant)모델에서 위험적(risky)으로 작용하여, 두 대립유전자가 모두 T로 변이된 TT의 경우 이식편대숙주병 발병 위험이 높아지며(굵은체로 표시) 또는 한 대립 유전자가 T로 변이된 TC의 경우에도 TT 경우 보다는 약간 낮지만 야생형의 경우보다는 높은 이식편대숙주병 발병의 위험을 나타낸다(이탤릭체로 표시). SNP rs2228048 is a SNP located at position 30713842 base of chromosome 3 and has a base C in the above position in the case of the wild type but mutated T when the mutation occurs and changes to T in the case of graft versus host disease TT in which both alleles are mutated to T, acting as risky in the. dominant model, increases the risk of graft-versus-host disease (indicated in bold), or TC with an allele mutated to T Even slightly lower than in TT, but with a higher risk of graft-versus-host disease (in italics) than in the wild type.

SNP rs1946518는 11번 염색체의 112035458번째 염기 위치에 존재하는 SNP으로서, 야생형의 경우 상기 위치에 염기 T를 갖지만, 변이가 일어나 G로 바뀌면 변이가 된 G는 이식편대숙주병 발병에 있어서 열성 (recessive)모델에서 위험적(risky)으로 작용하여, 두 대립유전자가 모두 G로 변이된 GG의 경우 이식편대숙주병 발병의 위험이 높아진다(굵은체로 표시). SNP rs1946518 is a SNP located at position 112035458 base of chromosome 11 and has a base T in the above position in the case of wild type but mutated G when G is changed to recessive in the onset of graft- GGs with both alleles mutated to G, acting as risky in the model, increase the risk of graft-versus-host disease (shown in bold).

상기와 같은 7개의 SNP에 대한 정보를 기반으로, 피험자(예컨대, 이식편대숙주병이 발병하지 않은 개체)의 전체 유전자 중 상기 7개 SNP의 염기를 확인하고, 이식편대숙주병 발병 위험이 높은 경우에 해당하는지 여부를 결정하여, 상기 피험자의 이식편대숙주병 발병 위험을 예측할 수 있다. Based on the information on the seven SNPs as described above, the nucleotide sequences of the seven SNPs among all the genes of the subjects (for example, those without graft-versus-host disease) are identified and the risk of graft- To determine the risk of graft versus host disease in the subject.

또한, 본 발명은, 상기한 바와 같은 이식편대숙주병 발병 위험이 있는 SNP을 선별한 것에 더하여, 각 SNP의 변이형이 우성, 열성, 공우성 중 어떠한 양상으로 작용하는지를 밝혀서 각 SNP에서의 이식편대숙주병 발병 위험성이 높은 양상을 세분하여 정량화할 수 있는 기술을 제공할 수 있다. 따라서, 상기 선별된 SNP과 그의 이식편대숙주병 발병 위험성 관련 염기형에 대한 정보를 이용하면 보다 고감도로 이식편대숙주병 발병 위험군을 선별해낼 수 있다. 실제로, 상기 선별된 SNP을 그 선별에 사용된 유전자 시료의 소스가 된 이식편대숙주병 환자군에 다시 시험한 경우뿐 아니라, 전혀 다른 이식편대숙주병정상-환자군에 사용한 경우에도 72%가 넘는 이식편대숙주병 예측 정확도를 보였다. In addition, the present invention has revealed that SNPs that are at risk of developing graft-versus-host disease as described above are selected, and the mutation type of each SNP acts as dominant, recessive, or heterozygous, It is possible to provide a technique capable of quantifying and quantifying aspects of high risk of host disease. Therefore, using the information on the selected SNPs and the risk base of the risk of graft-versus-host disease, the risk of graft-versus-host disease can be selected with higher sensitivity. Indeed, it has been shown that the selected SNPs were tested again in graft-versus-host disease patients who were the source of the gene samples used for their screening, as well as in more than 72% of graft- And predicted the accuracy of host disease prediction.

한편, 연관불균형 (Linkage Disequilibrium, LD) 부위는 특정 게놈 상의 구간이 세대를 거치며 cross-over가 거의 일어나지 않을 정도로 짧거나 유전자가 밀집되어 있어서 생기는 부분이다. 따라서 이 구간에 존재하는 유전적 정보(genomic information)는 거의 동일하고 세대를 거쳐도 거의 보존된다. 본 발명에서 선별된 이식편대숙주병 발병 위험성과 유의적 상관관계를 갖는 7개의 SNP은 게놈 상에 특정 위치에 존재하는 변이이다. 따라서 상기 7개의 SNP 주변에 LD 구간이 형성되어 있는 경우, 그 LD 구간에 위치하는 유전자들도 상기 SNP과 동일한 유전적 정보를 갖게 되므로, 상기 7개의 SNP 이외에도 그 각각의 LD 구간 내에 존재하는 다른 SNP을 사용하는 경우에도 이식편대숙주병 발병 위험성을 예측 가능하다. On the other hand, Linkage Disequilibrium (LD) is a part of a genome that is generated by a genome that is as short as a genome-wide section, with little cross-over. Thus, the genomic information present in this section is almost identical and is almost preserved throughout the generations. Seven SNPs having a significant correlation with the risk of selected graft-versus-host disease in the present invention are mutations present at specific positions on the genome. Therefore, when the LD region is formed around the seven SNPs, the genes located in the LD region also have the same genetic information as the SNPs. Therefore, in addition to the seven SNPs, other SNPs It is possible to predict the risk of graft-versus-host disease.

따라서, 상기 7개의 SNP과R 스퀘어 값(R square value)이 1인 연관불균형 부위 (LD region)에 존재하는 SNP 또한 이식편대숙주병 발병 위험성 예측에 유용하게 사용될 수 있다. 특정SNP 쌍의R 스퀘어 값이 1이라는 것은 두 SNP의 정보가 동일하다는 것을 의미하기 때문이다. International HapMap project (http://www.hapmap.org/downloads/index.html.en)의 데이터에 의거하여, 상기 선별된 각각의 SNP이 위치한 염색체 위치를 기준으로 1Mbp내의 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교하여 그 결과를 도3 내지 도 9에 나타내었다. 본 발명에서는 특정 SNP쌍의 R 스퀘어 값이 1이 나올 수 있는 거리(distance)의 계산은 도3 내지 도 9의 분포 그림과 같이 각 SNP 염색체 위치를 기준으로 1Mbps내 밝혀진 모든 SNP쌍의 거리 분포에서 1이 나올 경우로 한정하고, 이 이상의 거리에서 1이 나올 경우는 이상 값으로 판단하였다. 또한 연관 불균형 길이의 한계는 R 스퀘어 값이 1 인 분포에서의 90퍼센타일의 값으로 잡았고, 도3 내지 9의 파란색 수직선이 상기 거리의 한계를 의미한다. 즉, 도3 내지 9의 X축은 본 발명에서 선별된 7개의 SNP이 위치한 chromosome상에서 7개 SNP 각각을 기준으로 1Mbp내에 모든 SNP 쌍의 거리를 base pair(bp) 단위로 나타낸 것이며, 위 R 스퀘어 값의 거리의 한계를 파란색 수직선으로 나타내었다. 아래의 표2는 R스퀘어 값이 1이 나올 수 있는 SNP 쌍의 거리의 분포에서 90퍼센타일의 bp 길이를 가능한 연관불균형 블록(LD 블록) 길이로 하여 나타내었다. Thus, SNPs present in the LD region of the seven SNPs and the R square value of 1 can also be useful for predicting the risk of graft-versus-host disease. The reason why the R-square value of a specific SNP pair is 1 means that the information of two SNPs is the same. Based on the data of the International HapMap project ( http://www.hapmap.org/downloads/index.html.en ), the distance of all revealed SNP pairs within 1 Mbp based on the chromosomal location of each of the selected SNPs R square values are compared and the results are shown in FIGS. 3 to 9. FIG. In the present invention, the calculation of the distance at which the R square value of a specific SNP pair is 1 can be calculated from the distance distribution of all the SNP pairs revealed within 1 Mbps based on the positions of the respective SNP chromosomes 1 was considered to be an abnormal value. Also, the limit of the association imbalance length is taken as the value of 90 percentile in the distribution with the R square value of 1, and the blue vertical line in Figs. 3 to 9 means the limit of the distance. In other words, the X-axis in FIGS. 3 to 9 represents the distance of all the SNP pairs within 1 Mbp on the basis of each of the seven SNPs in the chromosome on which the seven SNPs selected in the present invention are located, in the base pair (bp) Is shown by a blue vertical line. Table 2 below shows the bp length of 90 percentile in the distribution of the distance of the SNP pair in which the R square value can be 1, as a possible link unbalance block (LD block) length.

또한, 이러한 연관불균형 블록은 상기 7개의 SNP의 상류 및 하류 양쪽에 모두 존재하므로, 연관불균형 부위는 각각의 SNP을 기준으로 상류 및 하류로 각각 연관불균형 블록 길이만큼에 걸쳐서 존재하는 것으로 나타낼 수 있으며, 이 또한 아래의 표 2에 염색체 내에서의 염기 위치로서 나타내었다. In addition, since the linkage unbalance block is present in both the upstream and downstream of the seven SNPs, the linkage unbalance portion can be represented to exist as far as the association unbalance block length upstream and downstream respectively with respect to each SNP, This is also shown in Table 2 below as the position of the base in the chromosome.

마커 SNPMarker SNP 염색체 번호Chromosome number 염색체상 위치(ref)Chromosomal location (ref) 상류 또는 하류 각각의 가능 LD 블록 길이 (bp)The possible LD block length (bp) 마커 SNP 중심의 가능 LD 부위Possible LD region centered on marker SNP rs882559rs882559 66 3986906639869066 56822 56822 39812244~3992588839812244 to 39925888 rs7178935rs7178935 1515 5936816759368167 30582 30582 59337585~5939874959337585 ~ 59398749 rs3744805rs3744805 1717 3824835438248354 33992 33992 38214362~3828234638214362 to 38282346 rs7564005rs7564005 22 137512698137512698 93625 93625 137419073~137606323137419073 to 137606323 rs1876522rs1876522 1717 5361028953610289 48000 48000 53562289~5365828953562289 to 53658289 rs2228048rs2228048 33 3071384230713842 17329 17329 30696513~3073117130696513 ~ 30731171 rs1946518rs1946518 1111 112035458112035458 95872 95872 111939586~112131330111939586 to 112131330

각 염색체마다 세대를 따라 상동 염색체들간의cross-over 경향이 조금씩 다르기 때문에, 연관 불균형 지역의 길이가 다를 수 있음을 상기 표 2를 통해 확인할 수 있다. 상기 R 스퀘어 값(R square value)이 1인 연관불균형 부위(LD 부위)는 각각의 SNP을 기준으로 상류 및 하류에 각각 약 17 내지 96Kbp에 걸친 부위로서 이 부위에 존재하는 모든 SNP로 이루어진 군에서 선택된 하나 이상의 SNP이 이식편대숙주병 발병 위험성 예측에 사용할 수 있다. 상기와 같이 정해진 부위에 존재하는 SNP의 수와 종류는 이미 이 발명이 속하는 기술 분야에 공지된 내용이므로, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자라면 상기와 같이 시작 위치와 종결 위치가 특정된 연관불균형 부위에 존재하는 SNP을 용이하게 선택하여 사용할 수 있다. 예컨대, 상기 SNP은 National Center for Biotechnology Information에서 제공하는 사이트인 http://www.ncbi.nlm.nih.gov/sites/entrez?db=snp (entrezSNP)에서 용이하게 선택할 수 있으며, 상기 연관불균형 부위에 존재하는 SNP의대표적인 예를 아래 표 3에 예시하였다:Since the cross-over tendencies of homologous chromosomes are slightly different for each chromosome in each generation, it can be seen from Table 2 that the lengths of the unbalanced regions may be different. The linkage disequilibrium region (LD region) in which the R square value is 1 is a region covering about 17 to 96 kbp upstream and downstream based on each SNP as a group consisting of all SNPs present in the region One or more selected SNPs may be used to predict graft-versus-host disease risk. Since the number and types of SNPs present in the above-mentioned predetermined regions are already known in the technical field of the present invention, those skilled in the art will appreciate that the starting and ending positions SNPs present in the specified linkage disequilibrium region can be easily selected and used. For example, the SNP can be easily selected from http://www.ncbi.nlm.nih.gov/sites/entrez?db=snp (entrezSNP), a site provided by the National Center for Biotechnology Information, ≪ / RTI > are shown in Table 3 below: < tb >< TABLE &

마커 SNPMarker SNP 염색체 번호Chromosome number Neighbor SNP
(upstream)
Neighbor SNP
(upstream)
Neighbor SNP
(downstream)
Neighbor SNP
(downstream)
rs882559rs882559 66 rs7765077, rs186480179, rs182233667, rs77149857, rs191290624rs7765077, rs186480179, rs182233667, rs77149857, rs191290624 rs111433318, rs148294935, rs141483786, rs199589116, rs112473099gt; rs7178935rs7178935 1515 rs148964812, rs145696454, rs149777069, rs184331808, rs140572228rs148964812, rs145696454, rs149777069, rs184331808, rs140572228 rs142867281, rs200747794, rs149481646, rs139318473, rs77443443rs142867281, rs200747794, rs149481646, rs139318473, rs77443443 rs3744805rs3744805 1717 rs138640083, rs145404278, rs113211153, rs139979507, rs75248071rs138640083, rs145404278, rs113211153, rs139979507, rs75248071 rs148709476, rs3834609, rs59275034, rs113962350, rs3760531rs148709476, rs3834609, rs59275034, rs113962350, rs3760531 rs7564005rs7564005 22 rs7563777, rs2558090, rs34800310, rs35134764, rs2558089rs7563777, rs2558090, rs34800310, rs35134764, rs2558089 rs35545627, rs34367058, rs13416345, rs13416453, rs1427591rs35545627, rs34367058, rs13416345, rs13416453, rs1427591 rs1876522rs1876522 1717 rs1876523, rs1876524, rs1508230, rs8079251, rs6504973rs1876523, rs1876524, rs1508230, rs8079251, rs6504973 rs8080030, rs9896610, rs8080297, rs9902863, rs8082684rs8080030, rs9896610, rs8080297, rs9902863, rs8082684 rs2228048rs2228048 33 rs35766612, rs35719192, rs17854016, rs2229102, rs3209742rs35766612, rs35719192, rs17854016, rs2229102, rs3209742 rs11466513, rs11466514, rs17026171, rs11466515, rs11466516rs11466513, rs11466514, rs17026171, rs11466515, rs11466516 rs1946518rs1946518 1111 rs1946519, rs5744224, rs182302223, rs187031408, rs192374798rs1946519, rs5744224, rs182302223, rs187031408, rs192374798 rs5744225, rs5744226, rs185641181, rs34360641, rs5744227rs5744225, rs5744226, rs185641181, rs34360641, rs5744227

즉, 인간의 6번 염색체의 39869066번째 염기에 위치하는 SNP(예컨대, rs882559), 인간의 15번 염색체의 59368167번째 염기에 위치하는 SNP(예컨대, rs7178935), 인간의 17번 염색체의 38248354번째 염기에 위치하는 SNP(예컨대, rs3744805), 인간의 2번 염색체의 137512698번째 염기에 위치하는 SNP(예컨대, rs7564005), 인간의 17번 염색체의 53610289번째 염기에 위치하는 SNP(예컨대, rs1876522), 인간의 3번 염색체의 30713842번째 염기에 위치하는 SNP(예컨대, rs2228048), 인간의 11번 염색체의 112035458번째 염기에 위치하는 SNP(예컨대, rs1946518), 및 상기 각각의 SNP의 상류 및 하류 각각의 약17kbp 내지 96kbp(표 2 참조)에 걸친 연관불균형 지역에 존재하는 SNP들(표 3 참조)은 이식편대숙주병 발병 위험성에 대한 마커로서 매우 유용한 것이다. 따라서, 본 발명은 기본적으로 인간의 6번 염색체의 39869066번째 염기에 위치하는 SNP, 인간의 15번 염색체의 59368167번째 염기에 위치하는 SNP, 인간의 17번 염색체의 38248354번째 염기에 위치하는 SNP, 인간의 2번 염색체의 137512698번째 염기에 위치하는 SNP, 인간의 17번 염색체의 53610289번째 염기에 위치하는 SNP, 인간의 3번 염색체의 30713842번째 염기에 위치하는 SNP, 인간의 11번 염색체의 112035458번째 염기에 위치하는 SNP 및 상기 각각의 SNP의 상류 및 하류 각각의 약 17kbp 내지 96kbp에 걸친 연관불균형 지역에 존재하는 SNP들로 이루어진 군에서 선택된 하나 이상의 이식편대숙주병 발병 위험성 예측용 마커로서의 용도에 관한 것이다. That is, SNPs (for example, rs882559) located at 39869066 base of human chromosome 6, SNPs located at 59368167 base of human chromosome 15 (for example, rs7178935), 38248354 base of human chromosome 17 (E. G., Rs3744805), SNPs (e.g., rs7564005) located in the 137512698th base of human chromosome 2, SNPs located in the 53610289th base of human chromosome 17 (e.g., rs1876522) (For example, rs2228048) located in the 30713842 base of the chromosome of the chromosome 11, a SNP located in the 112035458 base of human chromosome 11 (for example, rs1946518), and about 17 kbp to 96 kbp (See Table 3) are very useful as markers for the risk of graft-versus-host disease. Therefore, the present invention basically comprises a SNP located at 39869066 base of human chromosome 6, a SNP located at 59368167 base of human chromosome 15, a SNP located at 38248354 base of human chromosome 17, The SNP located at 137512698 base of chromosome 2, the SNP located at 53610289 base of human chromosome 17, the SNP located at 30713842 base of human chromosome 3, the 112035458 base of human chromosome 11 And SNPs present in an associated disequilibrium region over about 17 kbp to 96 kbp of each of the upstream and downstream of the respective SNPs, as markers for predicting risk of one or more graft-versus-host disease .

이에, 본 발명의 일 예는 인간의 6번 염색체의 39869066번째 염기에 위치하는 SNP, 인간의 15번 염색체의 59368167번째 염기에 위치하는 SNP, 인간의 17번 염색체의 38248354번째 염기에 위치하는 SNP, 인간의 2번 염색체의 137512698번째 염기에 위치하는 SNP, 인간의 17번 염색체의 53610289번째 염기에 위치하는 SNP, 인간의 3번 염색체의 30713842번째 염기에 위치하는 SNP, 인간의 11번 염색체의 112035458번째 염기에 위치하는 SNP 및 상기 각각의 SNP의 상류 및 하류 각각의 약17kbp 내지 96kbp에 걸친 연관불균형 지역에 존재하는 SNP들로 이루어진 군에서 선택된 하나 이상을 포함하는 이식편대숙주병 발병 위험성 예측용 마커조성물을 제공한다.Thus, one example of the present invention is a SNP located at 39869066 base of human chromosome 6, a SNP located at 59368167 base of human chromosome 15, SNP located at 38248354 base of human chromosome 17, A SNP located at 137512698 base of human chromosome 2, a SNP located at 53610289 base of human chromosome 17, a SNP located at 30713842 base of human chromosome 3, 112035458 of human chromosome 11 A SNP located in a base and SNPs present in an associated disequilibrium region ranging from about 17 kbp to 96 kbp upstream and downstream of each of the SNPs, respectively, and a marker matrix for predicting risk of graft-versus-host disease .

이러한 내용을 근거로, 본 발명의 다른 예는 각 개체의 유전자를 분석하여 상기 개체가 이식편대숙주병 발병 위험군인지 여부를 결정하는 이식편대숙주병 발병 위험성 예측에 정보를 제공하는 방법을 제공한다. 상기 유전자 분석은 인간 피험자로부터 얻은 유전자 시료에 대하여 인간의 6번 염색체의 39869066번째 염기에 위치하는 SNP, 인간의 15번 염색체의 59368167번째 염기에 위치하는 SNP, 인간의 17번 염색체의 38248354번째 염기에 위치하는 SNP, 인간의 2번 염색체의 137512698번째 염기에 위치하는 SNP, 인간의 17번 염색체의 53610289번째 염기에 위치하는 SNP, 인간의 3번 염색체의 30713842번째 염기에 위치하는 SNP, 인간의 11번 염색체의 112035458번째 염기에 위치하는 SNP, 및 상기 각각의 SNP의 상류 및 하류에 각각 약 17kbp 내지 96kbp에 걸친 연관불균형 지역에 존재하는 SNP들로 이루어진 군에서 선택된 하나 이상의 SNP의 염기를 확인하는 단계를 포함한다. 또한 상기 방법은, 필요에 따라서, 상기 SNP를 검출하기에 적절한 프로브 및/또는 프라이머를 사용할 수 있다. 이와 같은 유전자 분석의 구체적 방법은 특별한 제한이 없으며, 이 발명이 속하는 기술분야에 알려진 모든 유전자 검출 방법에 의하는 것일 수 있다. 상기 유전자 시료는 피험자로부터 분리한 모든 생체 시료를 포함하며, 예컨대, 머리카락, 혈액, 각종 체액, 분리된 조직 및 세포 등으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 한정되지 않는다. Another example of the present invention provides a method of analyzing genes of each individual to provide information on the risk of developing graft-versus-host disease, which determines whether the individual is at risk of developing graft versus host disease. The gene analysis was performed on a gene sample obtained from a human subject, a SNP located at 39869066 base of human chromosome 6, a SNP located at 59368167 base of human chromosome 15, a 38248354 base of human chromosome 17 A SNP located at 137512698 base of human chromosome 2, a SNP located at 53610289 base of human chromosome 17, a SNP located at 30713842 base of human chromosome 3, Confirming the bases of one or more SNPs selected from the group consisting of SNPs located at 112035458 base of the chromosome and SNPs located at about 17 kbp to 96 kbp upstream and downstream of each of the SNPs in association disequilibrium regions, . In addition, the above method can use a probe and / or a primer suitable for detecting the SNP, if necessary. The specific method of such gene analysis is not particularly limited, and may be by any gene detection method known in the art. The gene sample includes all the biological samples separated from the subject, and may be, for example, at least one selected from the group consisting of hair, blood, various body fluids, isolated tissues and cells, but is not limited thereto.

보다 구체적으로, 상기 이식편대숙주병 발병 위험성 예측에 정보를 제공하는 방법은, 인간 피험자로부터 얻은 유전자 시료에 대하여,More particularly, the present invention provides a method of providing information on the risk of graft-versus-host disease, comprising:

인간의 6번 염색체의 39812244번째 염기부터 39925888번째 염기까지에 위치하는 SNP;A SNP located in positions 39812244 to 39925888 of the human chromosome 6;

인간의 15번 염색체의 59337585번째 염기부터 59398749번째 염기까지에 위치하는 SNP; A SNP located at 59337585th base to 59398749th base of human chromosome 15;

인간의 17번 염색체의 38214362번째 염기부터 38282346번째 염기까지에 위치하는 SNP;A SNP located at positions 38214362 to 38282346 of the human chromosome 17;

인간의 2번 염색체의 137419073번째 염기부터 137606323번째 염기까지에 위치하는 SNP;SNPs located from 137419073 th base to 137606323 th base of human chromosome 2;

인간의 17번 염색체의 53562289번째 염기부터 53658289번째 염기까지에 위치하는 SNP; A SNP located at positions 53562289 base to 53658289 base of human chromosome 17;

인간의 3번 염색체의 30696513번째 염기부터 30731171번째 염기까지에 위치하는 SNP;및 A SNP located in positions 30696513 to 30731171 of the human chromosome 3; and

인간의 11번 염색체의 111939586번째 염기부터 112131330번째 염기까지에 위치하는 SNPSNPs located from 111939586 base to 112131330 base of human chromosome 11

로 이루어진 군에서 선택된 하나 이상의 SNP의 염기를 확인하는 단계를 포함하는 것일 수 있다.
≪ / RTI > and identifying the base of one or more SNPs selected from the group consisting of SEQ ID NOs.

*보다 구체적으로, More specifically,

상기 인간의 6번 염색체의 39812244번째 염기부터 39925888번째 염기까지에 위치하는 SNP은 인간의 6번 염색체의 39869066번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs882559, rs7765077, rs186480179, rs182233667, rs77149857, rs191290624, rs111433318, rs148294935, rs141483786, rs199589116, rs112473099 등으로 이루어진 군에서 선택된 하나 이상일 수 있고,The SNP located in the 39812244 base to the 39925888 base of the human chromosome 6 includes one or more SNPs including the SNP located in the 39869066 base of human chromosome 6, such as rs882559, rs7765077, rs186480179, rs182233667, may be at least one selected from the group consisting of rs77149857, rs191290624, rs111433318, rs148294935, rs141483786, rs199589116, rs112473099,

상기 인간의 15번 염색체의 59337585번째 염기부터 59398749번째 염기까지에 위치하는 SNP은 인간의 15번 염색체의 59368167번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs7178935, rs148964812, rs145696454, rs149777069, rs184331808, rs140572228, rs142867281, rs200747794, rs149481646, rs139318473, rs77443443 등으로 이루어진 군에서 선택된 하나 이상일 수 있으며, The SNPs located at 59337585th base to 59398749th base of human chromosome 15 include one or more SNPs including SNPs located at 59368167 base of human chromosome 15, such as rs7178935, rs148964812, rs145696454, rs149777069, rs184331808, rs140572228, rs142867281, rs200747794, rs149481646, rs139318473, rs77443443, etc.,

상기 인간의 17번 염색체의 38214362번째 염기부터 38282346번째 염기까지에 위치하는 SNP은 인간의 17번 염색체의 38248354번째 염기에 위치하는 SNP을 포함하는 하나 이상, 예컨대, rs3744805, rs138640083, rs145404278, rs113211153, rs139979507, rs75248071, rs148709476, rs3834609, rs59275034, rs113962350, rs3760531 등으로 이루어진 군에서 선택된 하나 이상일 수 있고, The SNPs located at positions 38214362 to 38282346 of the human chromosome 17 include one or more SNPs located in the 38248354 base of human chromosome 17, such as rs3744805, rs138640083, rs145404278, rs113211153, rs139979507 , rs75248071, rs148709476, rs3834609, rs59275034, rs113962350, rs3760531, and the like,

상기 인간의 2번 염색체의 137419073번째 염기부터 137606323번째 염기까지에 위치하는 SNP은 인간의 2번 염색체의 137512698번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs7564005, rs7563777, rs2558090, rs34800310, rs35134764, rs2558089, rs35545627, rs34367058, rs13416345, rs13416453, rs1427591 등으로 이루어진 군에서 선택된 하나 이상일 수 있으며, The SNPs located from 137419073 th base to 137606323 th base of the human chromosome 2 include one or more SNPs including SNPs located in the 137512698 base of human chromosome 2, such as rs7564005, rs7563777, rs2558090, rs34800310, rs35134764, rs2558089, rs35545627, rs34367058, rs13416345, rs13416453, rs1427591, etc.,

상기 인간의 17번 염색체의 53562289번째 염기부터 53658289번째 염기까지에 위치하는 SNP은 인간의 17번 염색체의 53610289번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs1876522, rs1876523, rs1876524, rs1508230, rs8079251, rs6504973, rs8080030, rs9896610, rs8080297, rs9902863, rs8082684 등으로 이루어진 군에서 선택된 하나 이상일 수 있고,The SNPs located in the 53562289th base to the 53658289th base of the human chromosome 17 include one or more SNPs including SNPs located at 53610289 base of human chromosome 17, such as rs1876522, rs1876523, rs1876524, rs1508230, may be at least one selected from the group consisting of rs8079251, rs6504973, rs8080030, rs9896610, rs8080297, rs9902863, rs8082684,

상기 인간의 3번 염색체의 30696513번째 염기부터 30731171번째 염기까지에 위치하는 SNP은 인간의 3번 염색체의 30713842번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs2228048, rs35766612, rs35719192, rs17854016, rs2229102, rs3209742, rs11466513, rs11466514, rs17026171, rs11466515, rs11466516 등으로 이루어진 군에서 선택된 하나 이상일 수 있으며,The SNPs located at positions 30696513 to 30731171 of the human chromosome 3 include one or more SNPs including SNPs located at the 30713842 base of human chromosome 3, such as rs2228048, rs35766612, rs35719192, rs17854016, may be at least one selected from the group consisting of rs2229102, rs3209742, rs11466513, rs11466514, rs17026171, rs11466515, rs11466516,

상기 인간의 11번 염색체의 111939586번째 염기부터 112131330번째 염기까지에 위치하는 SNP은 인간의 11번 염색체의 112035458번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs1946518, rs1946519, rs5744224, rs182302223, rs187031408, rs192374798, rs5744225, rs5744226, rs185641181, rs34360641, rs5744227 등으로 이루어진 군에서 선택된 하나 이상일 수 있다.The SNPs located from the 111939586th base to the 112131330th base of the human chromosome 11 include one or more SNPs including the SNP located at 112035458 base of human chromosome 11 such as rs1946518, rs1946519, rs5744224, rs182302223, may be at least one selected from the group consisting of rs187031408, rs192374798, rs5744225, rs5744226, rs185641181, rs34360641, rs5744227, and the like.

상기한 바와 같이, 상기 SNP의 염기를 확인하는 단계는, 인간 피험자로부터 얻은 유전자 시료를 직접적 서열분석 하거나, 상기 SNP을 포함하는 소정의 부위와 혼성화 가능한 프로브, 또는 상기 SNP을 포함하는 소정의 부위를 증폭 가능한 프라이머쌍과 접촉시켜 시료와 프로브와의 반응 여부, 또는 증폭된 유전자 단편을 조사하는 등, 이 발명이 속하는 기술분야에 알려진 모든 통상의 방법에 의한 것일 수 있다.As described above, the step of confirming the base of the SNP may include directly sequencing a gene sample obtained from a human subject, a probe capable of hybridizing with a predetermined site containing the SNP, or a predetermined site containing the SNP Or by any conventional method known in the art to which the present invention belongs, such as whether the sample is in contact with an amplifiable primer pair and whether the probe is reacted or the amplified gene fragment is examined.

한 구체 예에 있어서, 상기 SNP의 염기를 확인하는 단계는 인간 피험자로부터 얻은 유전자 시료가 아래의 7 가지 경우 중 한 가지 이상에 해당하는지 여부를 확인하는 과정을 포함할 수 있다: In one embodiment, identifying the base of the SNP may include determining whether the genetic sample from the human subject is one or more of the following seven cases:

6번 염색체의 39869066번째 염기가 GG 또는 GC인 경우(예컨대, rs882559);When 39869066th base of chromosome 6 is GG or GC (e.g., rs882559);

15번 염색체의 59368167번째 염기가 AG또는 AA인 경우(예컨대, rs7178935);When 59368167th base of chromosome 15 is AG or AA (e.g., rs7178935);

17번 염색체의 38248354번째 염기가 AA 또는 AG인 경우(예컨대, rs3744805);When the 38248354th base of chromosome 17 is AA or AG (e.g., rs3744805);

2번 염색체의 137512698번째 염기가 TT 또는 TG인 경우(예컨대, rs7564005); When the 137512698th base of chromosome 2 is TT or TG (e.g., rs7564005);

17번 염색체의 53610289번째 염기가 TT 인 경우(예컨대, rs1876522);The 53610289th base of chromosome 17 is TT (e.g., rs1876522);

3번 염색체의 30713842번째 염기가 TC 또는 TT인 경우(예컨대, rs2228048); 및When the 30713842th base of chromosome 3 is TC or TT (e.g., rs2228048); And

11번 염색체의 112035458번째 염기가 GG 인 경우(예컨대, rs1946518).When the 112035458th base of chromosome 11 is GG (e.g., rs1946518).

이 때, 7 가지 경우 중 한 가지 이상에 해당하면, 이식편대숙주병 발병 위험성이 높은 위험군으로 분류할 수 있다.If at least one of the seven cases is present, the risk of graft-versus-host disease is high.

상기 유전자 시료가 아래의 7 가지 경우 중 한 가지 이상에 해당하는지 여부를 확인하는 과정은 유전자 시료의 염기 서열을 통상의 방법으로 분석하여 수행될 수 있다.The process of determining whether the gene sample corresponds to one or more of the following seven cases can be performed by analyzing the nucleotide sequence of the gene sample by a conventional method.

또한, 본 발명의 한 구체 예에서, 이식편대숙주병 발병 예측 감도를 보다 높이기 위하여, 유전적 정보 이외에 기존에 이식편대숙주병 발병과 관련 있는 것으로 알려진 몇 가지 임상적 인자를 추가로 사용할 수 있다. 상기 임상적 인자는 수여자의 질병형태, 공유자와 수여자와의 관계, 이식형태 등일 수 있다. In addition, in one embodiment of the present invention, in addition to genetic information, in addition to genetic information, several clinical factors known to be associated with graft-versus-host disease outbreaks may be further used to further increase the predictive sensitivity of graft-versus-host disease development. The clinical factor may be a disease type of the recipient, a relationship with the recipient and recipient, a transplant type, and the like.

일 구체 예에서, 상기 이식편대숙주병 발병 위험성 예측에 정보를 제공하는 방법은, 상기 SNP의 염기를 확인하는 단계 이외에, 수여자의 질병형태, 공유자와 수여자와의 관계, 이식형태 등으로 이루어진 군에서 선택된 하나 이상의 임상적 인자를 조사하는 단계를 추가로 포함할 수 있다. 상기 임상적 인자를 조사하는 단계는, 상기 SNP의 염기를 확인하는 단계와 순서에 있어서 제한이 없으며, SNP의 염기를 확인하는 단계 이전, 이후 또는 동시에 수행될 수 있다. 또한 두 개 이상의 임상적 인자를 조사하는 경우에, 각 임상적 인자를 조사하는 단계는 동시 또는 이시적으로 진행될 수 있으며, 이시적으로 진행되는 경우 그 순서에는 특별한 제한 사항이 없다. 예컨대, 상기 이식편대숙주병 발병 위험성 예측에 정보를 제공하는 방법은, 상기와 같은 유전 정보(SNP) 분석 이외에, 수여자의 질병형태[1: 급성골수성백혈병 (acute myeloid leukemia, AML), 2: 급성림프구성백혈병(acute lymphocytic leukemia, ALL), 3: 만성골수성백혈병 (chronic myeloid leukemia, CML), 4: 골수이형성증후군 (myelodysplastic syndrome, MDS), 5: 재생불량성빈혈 (aplastic anemia), 6: 림프종 (Lymphoma), 7: 급성혼합형백혈병 (acute biphenotypic leukemia, ABL), 8: 골수섬유증 (Myelo-Fibrosis, MF), 9: 다발성골수종 (Multiple Myeloma, MM), 10: 그 외 다른 혈액관련 질환], 공유자와 수여자와의 관계(0: related (sibling), 1: un-related, 2: haploidentical), 이식형태 (1: 골수이식 (bone-marrow, BM), 2:말초혈액조혈모이식 (peripheral blood, PB), 3:BM+PB) 등과 같은 임상적 변수를 조사하는 단계를 추가로 포함할 수 있다. 상기 임상적 변수를 조사하는 단계에서 얻어진 결과를 이식편대숙주병 발병 위험성 판단에 반영함으로써, 이식편대숙주병 발병 위험성 예측의 정확성을 보다 증진 시킨 것일 수 있다 (표 6 및 표 7 참조). In one embodiment, the method of providing information to predicting the risk of graft-versus-host disease comprises, in addition to identifying the bases of the SNPs, the disease form of the recipient, the relationship between the recipient and recipient, The method further comprises the step of examining one or more clinical factors selected from the group. The step of examining the clinical factors may be performed before and after the step of confirming the base of the SNP without limitation in the step and sequence of confirming the base of the SNP. Also, in the case of examining two or more clinical factors, the step of examining each clinical factor may proceed concurrently or temporally, and there is no particular limitation in the order in which it proceeds. For example, in addition to the above-described genetic information (SNP) analysis, a method of providing information on the risk of graft-versus-host disease risk may include a disease type [1: acute myeloid leukemia (AML) Acute lymphocytic leukemia (ALL), 3: chronic myeloid leukemia (CML), 4: myelodysplastic syndrome (MDS), 5: aplastic anemia, 6: lymphoma Lymphoma, 7: acute biphenotypic leukemia (ABL), 8: myelo-fibrosis, 9: multiple myeloma, 10: other blood related diseases] The relationship between the sharer and the recipient (0: related (sibling), 1: un-related, 2: haploidentical), transplantation type (1: bone-marrow, BM), 2: peripheral blood hemolysis blood, PB), 3: BM + PB), and the like. By reflecting the results obtained in the step of examining the clinical variables into the judgment of the risk of graft-versus-host disease, the accuracy of predicting the risk of graft-versus-host disease may be further improved (see Table 6 and Table 7).

또 다른 측면에서, 본 발명은 인간의 6번 염색체의 39869066번째 염기에 위치하는 SNP, 인간의 15번 염색체의 59368167번째 염기에 위치하는 SNP, 인간의 17번 염색체의 38248354번째 염기에 위치하는 SNP, 인간의 2번 염색체의 137512698번째 염기에 위치하는 SNP, 인간의 17번 염색체의 53610289번째 염기에 위치하는 SNP, 인간의 3번 염색체의 30713842번째 염기에 위치하는 SNP, 인간의 11번 염색체의 112035458번째 염기에 위치하는 SNP 및 상기 각각의 SNP의 상류 및 하류 각각의 약17kbp 내지 96kbp에 걸친 연관불균형 지역에 존재하는 SNP들로 이루어진 군에서 선택된 하나 이상의 SNP의 검출 가능한 하나 이상의 프로브 및 상기 하나 이상의 SNP의 증폭 가능한 프라이머쌍으로 이루어진 군에서 선택된 하나 이상을 포함하는 이식편대숙주병 발병 위험성 검진용 조성물을 제공한다. 상기한 바와 같이, 상기 상류 및 하류 각각의 약 17kbp 내지 96kbp에 걸친 부위는 각 SNP이 위치한 chromosome R 스퀘어 값(R square value)이 1이 나오는 현재까지 알려진 모든SNP 쌍의 distance 의 90퍼센타일을 의미하는 것으로, 즉, 가능한 연관불균형 부위에 해당하는 부위이다. 상기 R 스퀘어 값이 보여주듯이, 이들 연관불균형 부위의 유전적 정보는 완전히 동일하기 때문에, 표 1의 7개의 SNP뿐 아니라, 상기 7 개 SNP 각각의 상류 상류 및 하류 각각의 약17kbp 내지 96kbp에 걸친 연관불균형 지역에 존재하는 SNP의 염기(표 3 참조)를 확인함으로써 이식편대숙주병 발병 가능성을 예측할 수 있음은 상기한 바와 같다. In another aspect, the present invention provides a method for detecting the presence of a SNP located at 39869066 base of human chromosome 6, a SNP located at 59368167 base of human chromosome 15, SNP located at 38248354 base of human chromosome 17, A SNP located at 137512698 base of human chromosome 2, a SNP located at 53610289 base of human chromosome 17, a SNP located at 30713842 base of human chromosome 3, 112035458 of human chromosome 11 A detectable one or more probes of one or more SNPs selected from the group consisting of SNPs located in bases and SNPs present in an associated unbalanced region over about 17 kbp to 96 kbp of each of the upstream and downstream of said respective SNPs, An amplifiable primer pair, and at least one selected from the group consisting of an amplifiable primer pair. As described above, a region ranging from about 17 kbp to 96 kbp in each of the upstream and downstream means 90 percentile of the distance of all known SNP pairs in which the chromosome R square value at which each SNP is located is 1 That is, a region corresponding to a possible link disequilibrium region. Since the genetic information of these linkage disequilibrium sites is completely identical, as shown by the R square values, it is possible that not only the seven SNPs of Table 1 but also the association over about 17 kbp to 96 kbp of each of the upstream and downstream of each of the seven SNPs The possibility of developing graft-versus-host disease can be predicted by confirming the base of SNPs present in unbalanced regions (see Table 3).

보다 구체적으로, 본 발명에 따른 이식편대숙주병 발병 위험성 검진용 조성물은, More specifically, the composition for screening a risk of graft-versus-host disease according to the present invention comprises:

인간의 6번 염색체의 39812244번째 염기부터 39925888번째 염기까지에 위치하는 SNP;A SNP located in positions 39812244 to 39925888 of the human chromosome 6;

인간의 15번 염색체의 59337585번째 염기부터 59398749번째 염기까지에 위치하는 SNP; A SNP located at 59337585th base to 59398749th base of human chromosome 15;

인간의 17번 염색체의 38214362번째 염기부터 38282346번째 염기까지에 위치하는 SNP;A SNP located at positions 38214362 to 38282346 of the human chromosome 17;

인간의 2번 염색체의 137419073번째 염기부터 137606323번째 염기까지에 위치하는 SNP;SNPs located from 137419073 th base to 137606323 th base of human chromosome 2;

인간의 17번 염색체의 53562289번째 염기부터 53658289번째 염기까지에 위치하는 SNP; A SNP located at positions 53562289 base to 53658289 base of human chromosome 17;

인간의 3번 염색체의 30696513번째 염기부터 30731171번째 염기까지에 위치하는 SNP;및 A SNP located in positions 30696513 to 30731171 of the human chromosome 3; and

인간의 11번 염색체의 111939586번째 염기부터 112131330번째 염기까지에 위치하는 SNPSNPs located from 111939586 base to 112131330 base of human chromosome 11

으로 이루어진 군에서 선택된 하나 이상의 SNP을 검출 가능한 프로브, 또는 상기 하나 이상의 SNP을 증폭 가능한 프라이머 쌍, 또는 이들 모두를 포함하는 것일 수 있다. , A probe capable of detecting one or more SNPs selected from the group consisting of the above-mentioned SNPs, or a pair of primers capable of amplifying the SNPs, or both.

보다 구체적으로, More specifically,

상기 인간의 6번 염색체의 39812244번째 염기부터 39925888번째 염기까지에 위치하는 SNP은 인간의 6번 염색체의 39869066번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs882559, rs7765077, rs186480179, rs182233667, rs77149857, rs191290624, rs111433318, rs148294935, rs141483786, rs199589116, rs112473099 등으로 이루어진 군에서 선택된 하나 이상일 수 있고,The SNP located in the 39812244 base to the 39925888 base of the human chromosome 6 includes one or more SNPs including the SNP located in the 39869066 base of human chromosome 6, such as rs882559, rs7765077, rs186480179, rs182233667, may be at least one selected from the group consisting of rs77149857, rs191290624, rs111433318, rs148294935, rs141483786, rs199589116, rs112473099,

상기 인간의 15번 염색체의 59337585번째 염기부터 59398749번째 염기까지에 위치하는 SNP은 인간의 15번 염색체의 59368167번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs7178935, rs148964812, rs145696454, rs149777069, rs184331808, rs140572228, rs142867281, rs200747794, rs149481646, rs139318473, rs77443443 등으로 이루어진 군에서 선택된 하나 이상일 수 있으며, The SNPs located at 59337585th base to 59398749th base of human chromosome 15 include one or more SNPs including SNPs located at 59368167 base of human chromosome 15, such as rs7178935, rs148964812, rs145696454, rs149777069, rs184331808, rs140572228, rs142867281, rs200747794, rs149481646, rs139318473, rs77443443, etc.,

상기 인간의 17번 염색체의 38214362번째 염기부터 38282346번째 염기까지에 위치하는 SNP은 인간의 17번 염색체의 38248354번째 염기에 위치하는 SNP을 포함하는 하나 이상, 예컨대, rs3744805, rs138640083, rs145404278, rs113211153, rs139979507, rs75248071, rs148709476, rs3834609, rs59275034, rs113962350, rs3760531 등으로 이루어진 군에서 선택된 하나 이상일 수 있고, The SNPs located at positions 38214362 to 38282346 of the human chromosome 17 include one or more SNPs located in the 38248354 base of human chromosome 17, such as rs3744805, rs138640083, rs145404278, rs113211153, rs139979507 , rs75248071, rs148709476, rs3834609, rs59275034, rs113962350, rs3760531, and the like,

상기 인간의 2번 염색체의 137419073번째 염기부터 137606323번째 염기까지에 위치하는 SNP은 인간의 2번 염색체의 137512698번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs7564005, rs7563777, rs2558090, rs34800310, rs35134764, rs2558089, rs35545627, rs34367058, rs13416345, rs13416453, rs1427591 등으로 이루어진 군에서 선택된 하나 이상일 수 있으며, The SNPs located from 137419073 th base to 137606323 th base of the human chromosome 2 include one or more SNPs including SNPs located in the 137512698 base of human chromosome 2, such as rs7564005, rs7563777, rs2558090, rs34800310, rs35134764, rs2558089, rs35545627, rs34367058, rs13416345, rs13416453, rs1427591, etc.,

상기 인간의 17번 염색체의 53562289번째 염기부터 53658289번째 염기까지에 위치하는 SNP은 인간의 17번 염색체의 53610289번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs1876522, rs1876523, rs1876524, rs1508230, rs8079251, rs6504973, rs8080030, rs9896610, rs8080297, rs9902863, rs8082684 등으로 이루어진 군에서 선택된 하나 이상일 수 있고,The SNPs located in the 53562289th base to the 53658289th base of the human chromosome 17 include one or more SNPs including SNPs located at 53610289 base of human chromosome 17, such as rs1876522, rs1876523, rs1876524, rs1508230, may be at least one selected from the group consisting of rs8079251, rs6504973, rs8080030, rs9896610, rs8080297, rs9902863, rs8082684,

상기 인간의 3번 염색체의 30696513번째 염기부터 30731171번째 염기까지에 위치하는 SNP은 인간의 3번 염색체의 30713842번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs2228048, rs35766612, rs35719192, rs17854016, rs2229102, rs3209742, rs11466513, rs11466514, rs17026171, rs11466515, rs11466516 등으로 이루어진 군에서 선택된 하나 이상일 수 있으며,The SNPs located at positions 30696513 to 30731171 of the human chromosome 3 include one or more SNPs including SNPs located at the 30713842 base of human chromosome 3, such as rs2228048, rs35766612, rs35719192, rs17854016, may be at least one selected from the group consisting of rs2229102, rs3209742, rs11466513, rs11466514, rs17026171, rs11466515, rs11466516,

상기 인간의 11번 염색체의 111939586번째 염기부터 112131330번째 염기까지에 위치하는 SNP은 인간의 11번 염색체의 112035458번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs1946518, rs1946519, rs5744224, rs182302223, rs187031408, rs192374798, rs5744225, rs5744226, rs185641181, rs34360641, rs5744227 등으로 이루어진 군에서 선택된 하나 이상일 수 있다.The SNPs located from the 111939586th base to the 112131330th base of the human chromosome 11 include one or more SNPs including the SNP located at 112035458 base of human chromosome 11 such as rs1946518, rs1946519, rs5744224, rs182302223, may be at least one selected from the group consisting of rs187031408, rs192374798, rs5744225, rs5744226, rs185641181, rs34360641, rs5744227, and the like.

한 구체 예에 있어서, 상기 이식편대숙주병 발병 위험성 검진용 조성물은 이식편대숙주병 발병과 유의적 상관관계를 갖는 SNP을 검출하기 위한 프로브를 포함하는 것일 수 있으며, 상기 프로브는 본 발명에서 밝힌 7개의 SNP을 포함하여 이와 유전적 정보가 거의 동일한 연관불균형 부위 내의 SNP을 검출 가능한 것으로, In one embodiment, the composition for screening for risk of graft-versus-host disease may comprise a probe for detecting a SNP having a significant correlation with the onset of graft-versus-host disease, SNPs within the linkage disequilibrium region with almost the same genetic information as the SNPs,

인간의 6번 염색체의 39812244번째 염기부터 39925888번째 염기까지의 부위 중의 연속하는 5 내지 100bp 염기서열, 예컨대, 인간의 6번 염색체의 39812244번째 염기부터 39925888번째 염기까지의 부위 중, rs882559, rs7765077, rs186480179, rs182233667, rs77149857, rs191290624, rs111433318, rs148294935, rs141483786, rs199589116, rs112473099 등으로 이루어진 군에서 선택된 하나 이상의 SNP을 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드; Among consecutive 5 to 100 bp sequences in the region from 39812244 base to 39925888 base of human chromosome 6, for example, from 39812244 base to 39925888 base of human chromosome 6, rs882559, rs7765077, rs186480179 an oligonucleotide having a sequence complementary to a consecutive 5 to 100 bp nucleotide sequence comprising at least one SNP selected from the group consisting of rs182233667, rs77149857, rs191290624, rs141493135, rs148294935, rs141483786, rs199589116, rs112473099 and the like;

인간의 15번 염색체의 59337585번째 염기부터 59398749번째 염기까지의 부위 중의 연속하는 5 내지 100bp 염기서열, 예컨대, 인간의 15번 염색체의 59337585번째 염기부터 59398749번째 염기까지의 부위 중, rs7178935, rs148964812, rs145696454, rs149777069, rs184331808, rs140572228, rs142867281, rs200747794, rs149481646, rs139318473, rs77443443 등으로 이루어진 군에서 선택된 하나 이상의 SNP을 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드; Among consecutive 5 to 100 bp sequences in the region from 59337585th base to 59398749th base of human chromosome 15, for example, from 59337585th base to 59398749th base of human chromosome 15, rs7178935, rs148964812, rs145696454 an oligonucleotide having a sequence complementary to a consecutive 5 to 100 bp nucleotide sequence comprising at least one SNP selected from the group consisting of rs149777069, rs184331808, rs140572228, rs142867281, rs200747794, rs149481646, rs139318473, rs77443443 and the like;

인간의 17번 염색체의 38214362번째 염기부터 38282346번째 염기까지의 부위 중의 연속하는 5 내지 100bp 염기서열, 예컨대, 인간의 17번 염색체의 38214362번째 염기부터 38282346번째 염기까지의 부위 중, rs3744805, rs138640083, rs145404278, rs113211153, rs139979507, rs75248071, rs148709476, rs3834609, rs59275034, rs113962350, rs3760531 등으로 이루어진 군에서 선택된 하나 이상의 SNP을 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴크레오타이드; Among consecutive 5 to 100 bp sequences in the region from the 38214362 base to the 38282346 base of human chromosome 17, for example, from the 38214362 base to the 38282346 base of human chromosome 17, rs3744805, rs138640083, rs145404278 oligonucleotides having a sequence complementary to a consecutive 5 to 100 bp nucleotide sequence comprising at least one SNP selected from the group consisting of rs113211153, rs139979507, rs75248071, rs148709476, rs3834609, rs59275034, rs113962350, rs3760531 and the like;

인간의 2번 염색체의 137419073번째 염기부터 137606323번째 염기까지의 부위 중의 연속하는 5 내지 100bp 염기서열, 예컨대, 인간의 2번 염색체의 137419073번째 염기부터 137606323번째 염기까지의 부위 중, rs7564005, rs7563777, rs2558090, rs34800310, rs35134764, rs2558089, rs35545627, rs34367058, rs13416345, rs13416453, rs1427591 등으로 이루어진 군에서 선택된 하나 이상의 SNP을 포함하는 연속하는 5 내지 100bp 염기서열 과 상보적인 서열을 갖는 올리고뉴클레오타이드; Among consecutive 5 to 100 bp sequences in the region from 137419073 th base to 137606323 th base of human chromosome 2, for example, from 137419073 th base to 137606323 th base of human chromosome 2, rs7564005, rs7563777, rs2558090 an oligonucleotide having a sequence complementary to a consecutive 5 to 100 bp nucleotide sequence comprising at least one SNP selected from the group consisting of rs34800310, rs35134764, rs2558089, rs35545627, rs34367058, rs13416345, rs13416453, rs1427591 and the like;

인간의 17번 염색체의 53562289번째 염기부터 53658289번째 염기까지의 부위 중의 연속하는 5 내지 100bp 염기서열, 예컨대, 인간의 17번 염색체의 53562289번째 염기부터 53658289번째 염기까지의 부위 중, rs1876522, rs1876523, rs1876524, rs1508230, rs8079251, rs6504973, rs8080030, rs9896610, rs8080297, rs9902863, rs8082684 등으로 이루어진 군에서 선택된 하나 이상의 SNP을 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드;Among consecutive 5 to 100 bp sequences in the region from the 53562289th base to the 53658289th base of the human chromosome 17, for example, from the 53562289th base to the 53658289th base of human chromosome 17, rs1876522, rs1876523, rs1876524 oligonucleotides having a sequence complementary to a consecutive 5 to 100 bp nucleotide sequence comprising at least one SNP selected from the group consisting of rs1508230, rs8079251, rs6504973, rs8080030, rs9896610, rs8080297, rs9902863, rs8082684,

인간의 3번 염색체의 30696513번째 염기부터 30731171번째 염기까지의 부위 중의 연속하는 5 내지 100bp 염기서열, 예컨대, 인간의 3번 염색체의 30696513번째 염기부터 30731171번째 염기까지의 부위 중, rs2228048, rs35766612, rs35719192, rs17854016, rs2229102, rs3209742, rs11466513, rs11466514, rs17026171, rs11466515, rs11466516 등으로 이루어진 군에서 선택된 하나 이상의 SNP을 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드; 및Among consecutive 5 to 100 bp nucleotide sequences from the 30696513 base to 30731171 base of human chromosome 3, for example, from 30696513 base to 30731171 base of human chromosome 3, rs2228048, rs35766612, rs35719192 oligonucleotides having a sequence complementary to a consecutive 5 to 100 bp nucleotide sequence comprising at least one SNP selected from the group consisting of rs17854016, rs2229102, rs3209742, rs11466513, rs11466514, rs17026171, rs11466515, rs11466516 and the like; And

인간의 11번 염색체의 111939586번째 염기부터 112131330번째 염기까지의 부위 중의 연속하는 5 내지 100bp 염기서열, 예컨대, 인간의 11번 염색체의 111939586번째 염기부터 112131330번째 염기까지의 부위 중, rs1946518, rs1946519, rs5744224, rs182302223, rs187031408, rs192374798, rs5744225, rs5744226, rs185641181, rs34360641, rs5744227 등으로 이루어진 군에서 선택된 하나 이상을 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드Among consecutive 5 to 100 bp nucleotide sequences from the 111939586th base to the 112131330th base of human chromosome 11, for example, from 111939586 base to 112131330 base of human chromosome 11, rs1946518, rs1946519, rs5744224 an oligonucleotide having a sequence complementary to a consecutive 5 to 100 bp base sequence comprising at least one selected from the group consisting of rs182302223, rs187031408, rs192374798, rs5744225, rs5744226, rs185641181, rs34360641, rs5744227,

로 이루어진 군에서 선택된 하나 이상의 올리고뉴클레오타이드일 수 있다.≪ / RTI > can be one or more oligonucleotides selected from the group consisting of < RTI ID = 0.0 >

구체 예에서, 상기 프로브는 상기한 7개(표 1 또는 표 2)의 SNP 중 하나 이상의 검출이 가능한 것으로,In an embodiment, the probe is capable of detecting one or more of the SNPs of the seven (Table 1 or Table 2)

인간의 6번 염색체의 39869066번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 포함하며, 상기 39869066번째 염기는 GC 또는 CC인(rs882559), 올리고뉴클레오타이드;Comprising a sequence complementary to a consecutive 5 to 100 bp base sequence comprising 39869066 base of human chromosome 6, wherein the 39869066 base is GC or CC (rs882559), oligonucleotide;

인간의 15번 염색체의 59368167번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 포함하며, 상기 59368167번째 염기는 AG 또는 AA인(rs7178935), 올리고뉴클레오타이드; A sequence complementary to a consecutive 5 to 100 bp base sequence comprising 59368167 base of human chromosome 15, wherein the 59368167 base is AG or AA (rs7178935), an oligonucleotide;

인간의 17번 염색체의 38248354번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 포함하며, 상기 38248354번째 염기는 AG 또는 AA인(rs3744805), 올리고뉴크레오타이드;A sequence complementary to a consecutive 5 to 100 bp base sequence comprising the 38248354 base of human chromosome 17, said base 38248354 being AG or AA (rs3744805), oligonucleotide;

인간의 2번 염색체의 137512698번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 포함하며, 상기 137512698번째 염기는 TT 또는 TG인(rs7564005), 올리고뉴클레오타이드; A sequence complementary to a consecutive 5 to 100 bp nucleotide sequence comprising the 137512698 base of human chromosome 2, wherein the base 137512698 is selected from the group consisting of TT or TG (rs7564005), oligonucleotides;

인간의 17번 염색체의 53610289번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 포함하며, 상기 53610289번째 염기는 TT인(rs1876522), 올리고뉴클레오타이드;A sequence complementary to a consecutive 5 to 100 bp base sequence comprising 53610289 base of human chromosome 17, wherein the 53610289 base is selected from the group consisting of TT (rs1876522), oligonucleotides;

인간의 3번 염색체의 30713842번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 포함하며, 상기 30713842번째 염기는 TC 또는 TT인(rs2228048), 올리고뉴클레오타이드; 및Wherein the 30713842 base is a TC or TT (rs2228048), an oligonucleotide; a sequence complementary to a consecutive 5 to 100 bp base sequence comprising 30713842 base of human chromosome 3; And

인간의 11번 염색체의 112035458번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 포함하며, 상기 112035458번째 염기는 GG인(rs1946518), 올리고뉴클레오타이드Comprising a sequence complementary to a consecutive 5 to 100 bp nucleotide sequence comprising the 112035458 base of human chromosome 11, wherein the 112035458 base is selected from the group consisting of GG (rs1946518), oligonucleotide

로 이루어진 군에서 선택된 하나 이상의 올리고뉴클레오타이드일 수 있으나, 상기한 바와 같이 이에 한정되는 것은 아니다., But it is not limited thereto.

본 발명의 또 다른 구체 예에서, 상기 이식편대숙주병 발병 위험성 진단용 조성물은 유전자 서열 분석을 통한 이식편대숙주병 발병과 유의적인 SNP의 염기 확인을 위하여, 상기 SNP을 포함하는 유전자 단편을 증폭할 수 있는 특정 프라이머 쌍을 포함하는 것일 수 있다. 본 명세서에 있어서, "프라이머 쌍"은 정방향 프라이머 및 역방향 프라이머를 포함하는 개념으로 사용된다. 일 구체 예에서, 상기 프라이머 쌍은 상기한 SNP 중 하나 이상을 포함하는 약 50bp 내지 약 20 kbp, 약 50 내지 약 1000 bp, 약 50 내지 약 500 bp, 또는 약 100 내지 약 300 bp 정도의 유전자 단편을 증폭 가능한 약 5 내지 50bp 길이의 정방향 및 역방향 프라이머의 쌍일 수 있다. In another embodiment of the present invention, the composition for diagnosing the risk of graft-versus-host disease may be used to amplify a gene fragment containing the SNP in order to identify a graft-versus- Lt; RTI ID = 0.0 > a < / RTI > specific primer pair. As used herein, a "primer pair" is used as a concept including a forward primer and a reverse primer. In one embodiment, the primer pair comprises a gene fragment of about 50 bp to about 20 kbp, about 50 to about 1000 bp, about 50 to about 500 bp, or about 100 to about 300 bp, Can be amplified to a pair of forward and reverse primers of about 5 to 50 bp in length.

본 발명에서 사용 가능한 프라이머 쌍은,The primer pairs usable in the present invention include,

인간의 6번 염색체의 39812244번째 염기부터 39925888번째 염기까지의 부위 중의 상호 중복되지 않는 두 개의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍;A pair of primers consisting of two oligonucleotides having a sequence complementary to two consecutive 5 to 50 bp nucleotide sequences not overlapping each other in a region from 39812244 base to 39925888 base of human chromosome 6;

인간의 15번 염색체의 59337585번째 염기부터 59398749번째 염기까지의 부위 중의 상호 중복되지 않는 두 개의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍; A pair of primers consisting of two oligonucleotides having a sequence complementary to two consecutive 5 to 50 bp nucleotide sequences that do not overlap each other in a region from 59337585th base to 59398749th base of human chromosome 15;

인간의 17번 염색체의 38214362번째 염기부터 38282346번째 염기까지의 부위 중의 상호 중복되지 않는 두 개의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 두 개의 올리고뉴크레오타이드로 이루어진 프라이머 쌍;A pair of primers consisting of two oligonucleotides having a sequence complementary to two consecutive 5 to 50 bp nucleotide sequences not overlapping each other in a region from 38214362 base to 38282346 base of human chromosome 17;

인간의 2번 염색체의 137419073번째 염기부터 137606323번째 염기까지의 부위 중의 상호 중복되지 않는 두 개의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍;A primer pair consisting of two oligonucleotides having a sequence complementary to two consecutive 5 to 50 bp nucleotide sequences not overlapping each other in a region from 137419073 th base to 137606323 th base of human chromosome 2;

인간의 17번 염색체의 53562289번째 염기부터 53658289번째 염기까지의 부위 중의 상호 중복되지 않는 두 개의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍;
A pair of primers consisting of two oligonucleotides having a sequence complementary to two consecutive 5 to 50 bp nucleotide sequences that do not overlap each other in the region from 53562289 base to 53658289 base of human chromosome 17;

*인간의 3번 염색체의 30696513번째 염기부터 30731171번째 염기까지의 부위 중의 상호 중복되지 않는 두 개의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍; 및A pair of primers consisting of two oligonucleotides having a sequence complementary to two consecutive 5 to 50 bp nucleotide sequences that do not overlap each other in the region from 30696513 base to 30731171 base of human chromosome 3; And

인간의 11번 염색체의 111939586번째 염기부터 112131330번째 염기까지의 부위 중의 상호 중복되지 않는 두 개의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍으로 이루어진 군에서 선택된 하나 이상의 프라이머 쌍일 수 있다. A primer pair consisting of two oligonucleotides having a sequence complementary to two consecutive 5 to 50 bp nucleotide sequences that do not overlap each other in a region from 111939586 base to 112131330 base of human chromosome 11 Or more.

한 구체 예에서, 상기 프라이머 쌍은,In one embodiment, the primer pair comprises:

인간의 6번 염색체의 39812244번째 염기부터 39925888번째 염기까지의 부위 중의rs882559, rs7765077, rs186480179, rs182233667, rs77149857, rs191290624, rs111433318, rs148294935, rs141483786, rs199589116, rs112473099 등으로 이루어진 군에서 선택된 하나 이상을 포함하는 연속하는 약 50bp 내지 약 20 kbp 정도의 유전자 단편의 5' 말단 및 3' 말단의 연속하는 5 내지 50bp 염기서열 각각에 대하여 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍;A sequence comprising at least one selected from the group consisting of rs882559, rs7765077, rs186480179, rs182233667, rs191290624, rs111433318, rs148294935, rs148294935, rs149983786, rs199589116, rs112473099, etc. in the region from 39812244 base to 39925888 base of human chromosome 6 A primer pair consisting of two oligonucleotides having a sequence complementary to each of the 5 to 50 bp consecutive nucleotide sequences at the 5 'end and the 3' end of the gene fragment of about 50 bp to about 20 kbp;

인간의 15번 염색체의 59337585번째 염기부터 59398749번째 염기까지의 부위 중rs7178935, rs148964812, rs145696454, rs149777069, rs184331808, rs140572228, rs142867281, rs200747794, rs149481646, rs139318473, rs77443443 등으로 이루어진 군에서 선택된 하나 이상을 포함하는 연속하는 약 50bp 내지 약 20 kbp 정도의 유전자 단편의 5' 말단 및 3' 말단의 연속하는 5 내지 50bp 염기서열 각각에 대하여 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍; A sequence comprising at least one selected from the group consisting of rs7178935, rs148964812, rs14579669, rs144777069, rs184331808, rs140572228, rs142867281, rs200747794, rs149481646, rs139318473 and rs77443443 from the 59337585th base to the 59398749th base of human chromosome 15 A primer pair consisting of two oligonucleotides having a sequence complementary to each of the 5 to 50 bp consecutive nucleotide sequences at the 5 'end and the 3' end of the gene fragment of about 50 bp to about 20 kbp;

인간의 17번 염색체의 38214362번째 염기부터 38282346번째 염기까지의 부위 중의 rs3744805, rs138640083, rs145404278, rs113211153, rs139979507, rs75248071, rs148709476, rs3834609, rs59275034, rs113962350,rs3760531 등으로 이루어진 군에서 선택된 하나 이상을 포함하는 연속하는 약 50bp 내지 약 20 kbp 정도의 유전자 단편의 5' 말단 및 3' 말단의 연속하는 5 내지 50bp 염기서열 각각에 대하여 상보적인 서열을 갖는 두 개의 올리고뉴크레오타이드로 이루어진 프라이머 쌍;A sequence comprising at least one selected from the group consisting of rs3744805, rs134640083, rs145404278, rs133211153, rs139979507, rs75248071, rs148709476, rs3834609, rs59275034, rs113962350, rs3760531, etc. in the region from 38214362 base to 38282346 base of human chromosome 17 A primer pair consisting of two oligonucleotides having a sequence complementary to each of the 5 to 50 bp consecutive nucleotide sequences at the 5 'end and the 3' end of the gene fragment of about 50 bp to about 20 kbp;

인간의 2번 염색체의 137419073번째 염기부터 137606323번째 염기까지의 부위 중의 rs7564005, rs7563777, rs2558090, rs34800310, rs35134764, rs2558089, rs35545627, rs34367058, rs13416345, rs13416453, rs1427591등으로 이루어진 군에서 선택된 하나 이상을 포함하는 연속하는 약 50bp 내지 약 20 kbp 정도의 유전자 단편의 5' 말단 및 3' 말단의 연속하는 5 내지 50bp 염기서열 각각에 대하여 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍;A sequence comprising at least one selected from the group consisting of rs7564005, rs7563777, rs2558090, rs34800310, rs35134764, rs2558089, rs35545627, rs34367058, rs13416345, rs13416453, rs1427591, etc. in the region from 137419073 th base to 137606323 th base of human chromosome 2 A primer pair consisting of two oligonucleotides having a sequence complementary to each of the 5 to 50 bp consecutive nucleotide sequences at the 5 'end and the 3' end of the gene fragment of about 50 bp to about 20 kbp;

인간의 17번 염색체의 53562289번째 염기부터 53658289번째 염기까지의 부위 중의 rs1876522, rs1876523, rs1876524, rs1508230, rs8079251, rs6504973, rs8080030, rs9896610, rs8080297, rs9902863, rs8082684등으로 이루어진 군에서 선택된 하나 이상을 포함하는 연속하는 약 50bp 내지 약 20 kbp 정도의 유전자 단편의 5' 말단 및 3' 말단의 연속하는 5 내지 50bp 염기서열 각각에 대하여 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍; A sequence comprising at least one selected from the group consisting of rs1876522, rs1876523, rs1876524, rs1508230, rs8079251, rs6504973, rs8080030, rs9896610, rs8080297, rs9902863, rs8082684, etc. in the region from 53562289th base to 53658289th base of human chromosome 17 A primer pair consisting of two oligonucleotides having a sequence complementary to each of the 5 to 50 bp consecutive nucleotide sequences at the 5 'end and the 3' end of the gene fragment of about 50 bp to about 20 kbp;

인간의 3번 염색체의 30696513번째 염기부터 30731171번째 염기까지의 부위 중의 rs2228048, rs35766612, rs35719192, rs17854016, rs2229102, rs3209742, rs11466513, rs11466514, rs17026171, rs11466515, rs11466516등으로 이루어진 군에서 선택된 하나 이상을 포함하는 연속하는 약 50bp 내지 약 20 kbp 정도의 유전자 단편의 5' 말단 및 3' 말단의 연속하는 5 내지 50bp 염기서열 각각에 대하여 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍; 및A sequence comprising at least one selected from the group consisting of rs2228048, rs35766612, rs35719192, rs17854016, rs2229102, rs3209742, rs11466513, rs11466514, rs17026171, rs11466515, rs11466516, etc. in the region from 3069651313 base to 30731171 base of human chromosome 3 A primer pair consisting of two oligonucleotides having a sequence complementary to each of the 5 to 50 bp consecutive nucleotide sequences at the 5 'end and the 3' end of the gene fragment of about 50 bp to about 20 kbp; And

인간의 11번 염색체의 111939586번째 염기부터 112131330번째 염기까지의 부위 중의 rs1946518, rs1946519, rs5744224, rs182302223, rs187031408, rs192374798, rs5744225, rs5744226, rs185641181, rs34360641, rs5744227등으로 이루어진 군에서 선택된 하나 이상을 포함하는 연속하는 약 50bp 내지 약 20 kbp 정도의 유전자 단편의 5' 말단 및 3' 말단의 연속하는 5 내지 50bp 염기서열 각각에 대하여 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍A sequence comprising at least one selected from the group consisting of rs1946518, rs1946519, rs1843019, rs182302223, rs187031408, rs192374798, rs5744225, rs5744226, rs185641181, rs34360641, rs5744227, etc. in the region from 111939586 base to 112131330 base of human chromosome 11 A pair of primers consisting of two oligonucleotides having a sequence complementary to each of the 5 to 50 bp consecutive nucleotide sequences at the 5 ' end and the 3 ' end of the gene fragment of about 50 bp to about 20 kbp

으로 이루어진 군에서 선택된 하나 이상의 프라이머 쌍일 수 있다.And a primer pair.

보다 구체적으로, 상기 프라이머 쌍은,More specifically, the primer pair is a primer pair,

인간의 6번 염색체의 39869066번째 염기를 포함하는 염색체 단편을 증폭시키기 위한 것으로, 상기 39869066번째 염기를 기준으로 상류쪽으로 56822bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드 및 하류쪽으로 56822bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드로 이루어진 프라이머 쌍;An oligonucleotide having a sequence complementary to a consecutive 5 to 50 bp sequence in the 56822 bp region toward the upstream side based on the 39869066 base sequence and an oligonucleotide having a sequence complementary to the downstream sequence A primer pair consisting of an oligonucleotide having a sequence complementary to a consecutive 5 to 50 bp nucleotide sequence in the 56822 bp region;

인간의 15번 염색체의 59368167번째 염기를 포함하는 염색체 단편을 증폭시키기 위한 것으로, 상기 59368167번째 염기를 기준으로 상류쪽으로 30582bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드 및 하류쪽으로 30582bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드로 이루어진 프라이머 쌍; The method for amplifying a chromosome fragment comprising 59368167 base of human chromosome 15, wherein the oligonucleotide having a sequence complementary to a consecutive 5 to 50 bp nucleotide sequence in the 30582 bp region toward the upstream side based on the 59368167 base sequence, A primer pair consisting of an oligonucleotide having a sequence complementary to a consecutive 5 to 50 bp nucleotide sequence in the 30582 bp region;

인간의 17번 염색체의 38248354번째 염기를 포함하는 염색체 단편을 증폭시키기 위한 것으로, 상기 38248354번째 염기를 기준으로 상류쪽으로 33992bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드 및 하류쪽으로 33992bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드로 이루어진 프라이머 쌍;An oligonucleotide having a sequence complementary to a consecutive 5 to 50 bp nucleotide sequence upstream of the 33992 bp region on the basis of the 38248354 base sequence and an oligonucleotide having a sequence complementary to the downstream nucleotide sequence A primer pair consisting of an oligonucleotide having a sequence complementary to a consecutive 5-50 bp nucleotide sequence in the 33992 bp region;

인간의 2번 염색체의 137512698번째 염기를 포함하는 염색체 단편을 증폭시키기 위한 것으로, 상기 137512698번째 염기를 기준으로 상류쪽으로 93625bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드 및 하류쪽으로 93625bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드로 이루어진 프라이머 쌍; The present invention relates to a method for amplifying a chromosome fragment comprising 137512698 base of human chromosome 2, wherein the oligonucleotide having a sequence complementary to a consecutive 5-50 bp nucleotide sequence in the 93625 bp region upstream of the 137512698 base sequence, A primer pair consisting of an oligonucleotide having a sequence complementary to a consecutive 5 to 50 bp nucleotide sequence in the 93625 bp region;

인간의 17번 염색체의 53610289번째 염기를 포함하는 염색체 단편을 증폭시키기 위한 것으로, 상기 53610289번째 염기를 기준으로 상류쪽으로 48000bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드 및 하류쪽으로 48000bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드로 이루어진 프라이머 쌍;An oligonucleotide having a sequence complementary to a consecutive 5 to 50 bp nucleotide sequence upstream of the 48000 bp region on the basis of the 53610289 base sequence and an oligonucleotide having a nucleotide sequence complementary to the nucleotide sequence of SEQ ID NO: A primer pair consisting of an oligonucleotide having a sequence complementary to a consecutive 5 to 50 bp nucleotide sequence in the 48000 bp region;

인간의 3번 염색체의 30713842번째 염기를 포함하는 염색체 단편을 증폭시키기 위한 것으로, 상기 30713842번째 염기를 기준으로 상류쪽으로17329bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드 및 하류쪽으로17329bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드로 이루어진 프라이머 쌍;An oligonucleotide having a sequence complementary to a consecutive 5 to 50 bp nucleotide sequence in the 17329 bp region toward the upstream side based on the 30713842 base sequence, and an oligonucleotide having a nucleotide sequence complementary to the downstream nucleotide sequence A primer pair consisting of an oligonucleotide having a sequence complementary to a consecutive 5 to 50 bp nucleotide sequence in the 17329 bp region;

And

인간의 11번 염색체의 112035458번째 염기를 포함하는 염색체 단편을 증폭시키기 위한 것으로, 상기 112035458번째 염기를 기준으로 상류쪽으로 95872bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드 및 하류쪽으로 95872bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드로 이루어진 프라이머 쌍으로 이루어진 군에서 선택된 하나 이상의 프라이머 쌍일 수 있다.An oligonucleotide having a sequence complementary to a consecutive 5 to 50 bp sequence in the 95872 bp region upstream of the 112035458 base sequence and an upstream oligonucleotide having a sequence complementary to the 5 to 50 bp sequence upstream of the 112035458 base sequence, And a primer pair consisting of an oligonucleotide having a sequence complementary to a consecutive 5-50 bp nucleotide sequence in the 95872 bp region.

상기 프라이머 쌍으로 증폭된 염색체 단편은 염기 서열을 분석하여 상기 이식편대숙주병 발병과 유의적 상관관계가 있는 SNP의 염기를 확인하여 이식편대숙주병 발병 위험성을 예측할 수 있다. 상기 유전자 증폭 및 염기 서열 분석 방법은 특별한 제한이 없으며, 이 발명이 속하는 기술분야에 통상적으로 알려진 모든 방법을 사용할 수 있다. The chromosomal fragment amplified by the primer pair can be analyzed for the nucleotide sequence to identify a SNP base having a significant correlation with the graft-versus-host disease outbreak, thereby predicting the risk of graft-versus-host disease. There is no particular limitation on the above-mentioned gene amplification and nucleotide sequence analysis method, and all methods commonly known in the art can be used.

또 다른 측면에 있어서, 본 발명은 상기와 같은 이식편대숙주병 발병 위험성 진단용 조성물을 포함하는 이식편대숙주병 발병 위험성 검진용 키트를 제공한다. 상기 이식편대숙주병 발병 위험성 검진용 키트는 유전자 검출 수단을 추가로 포함할 수 있다. 보다 구체적으로, 상기 이식편대숙주병 발병 위험성 진단용 조성물에 포함된, 상기한 바와 같은 표 1의 7개의 SNP 및 상기 각각의 SNP (표 1 및 표 2 참조)의 상류 및 하류에 각각 약 17kbp 내지 96kbp에 걸친 연관 불균형 지역에 존재하는 SNP(표 3 참조)들로 이루어진 군에서 선택된 하나 이상의 SNP의 검출 가능한 하나 이상의 프로브 및/또는 프라이머쌍의 사용 형태는 아무런 제한이 없으며, 예컨대, 기판에 고정되어 칩 형태로 사용되거나, 용액 형태로 사용되거나, 다른 어떠한 형태도 무방하다. 또한, 상기 유전자 검출 수단은 상기 이식편대숙주병 발병 위험성 진단용 조성물에 포함된 프로브 및/또는 프라이머쌍의 사용 형태에 따라 달라지며, 형광 표지된 프로브를 사용하는 경우, 형광 측정 수단을 포함할 수 있고, 프라이머쌍을 사용하는 경우 PCR을 통한 서열분석 수단을 포함할 수 있으며, 이 외에도 이 발명이 속하는 기술분야에 통상적으로 알려진 어떠한 유전자 분석 수단도 포함될 수 있다. In another aspect, the present invention provides a kit for the risk assessment of graft-versus-host disease comprising the composition for diagnosing the risk of graft-versus-host disease. The kit for detecting the risk of graft-versus-host disease may further include a gene detecting means. More specifically, the SNPs of Table 1 and the respective SNPs (see Tables 1 and 2), as described above, contained in the composition for diagnosing the risk of graft-versus-host disease infection are each about 17 kbp to 96 kbp There is no limitation on the use form of one or more detectable probes and / or primer pairs of one or more SNPs selected from the group consisting of SNPs (see Table 3) Used in the form of a solution, or in any other form. In addition, the gene detecting means may be dependent on the use form of the probe and / or the primer pair included in the composition for diagnosing the risk of graft-versus-host disease infection. In the case of using a fluorescence-labeled probe, And a sequence analysis means through PCR when a primer pair is used. In addition, any gene analysis means commonly known in the technical field of the present invention may be included.

상기한 이식편대숙주병 발병 위험성 예측에 정보를 제공하는 방법, 이식편대숙주병 발병 위험성 검진용 조성물, 및 이식편대숙주병 발병 위험성 검진용 키트는, 이식편대숙주병 마커로서, A method for providing information on the risk of developing graft-versus-host disease, a composition for screening graft-versus-host disease risk, and a graft-versus-host disease risk screening kit is a graft-

인간의 15번 염색체의 59337585번째 염기부터 59398749번째 염기까지에 위치하는 SNP, 구체적으로, 인간의 15번 염색체의 59368167번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs7178935, rs148964812, rs145696454, rs149777069, rs184331808, rs140572228, rs142867281, rs200747794, rs149481646, rs139318473, rs77443443 등으로 이루어진 군에서 선택된 하나 이상;One or more SNPs, such as rs7178935, rs148964812, rs145696454, etc., including SNPs located in the 59337585th base to 59398749th base of human chromosome 15, specifically SNPs located in 59368167th base of human chromosome 15, at least one selected from the group consisting of rs149777069, rs184331808, rs140572228, rs142867281, rs200747794, rs149481646, rs139318473, rs77443443 and the like;

인간의 17번 염색체의 38214362번째 염기부터 38282346번째 염기까지에 위치하는 SNP, 구체적으로, 인간의 17번 염색체의 38248354번째 염기에 위치하는 SNP을 포함하는 하나 이상, 예컨대, rs3744805, rs138640083, rs145404278, rs113211153, rs139979507, rs75248071, rs148709476, rs3834609, rs59275034, rs113962350, rs3760531 등으로 이루어진 군에서 선택된 하나 이상;A SNP located in the 38214362 base to the 38282346 base of human chromosome 17, specifically, one or more SNPs located in the 38248354 base of human chromosome 17, such as rs3744805, rs138640083, rs145404278, rs113211153 , rs139979507, rs75248071, rs148709476, rs3834609, rs59275034, rs113962350, rs3760531, and the like;

인간의 2번 염색체의 137419073번째 염기부터 137606323번째 염기까지에 위치하는 SNP, 구체적으로, 인간의 2번 염색체의 137512698번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs7564005, rs7563777, rs2558090, rs34800310, rs35134764, rs2558089, rs35545627, rs34367058, rs13416345, rs13416453, rs1427591 등으로 이루어진 군에서 선택된 하나 이상; 및One or more SNPs comprising SNPs located at positions 137419073 to 137606323 of human chromosome 2, specifically SNPs located at the 137512698th base of human chromosome 2, such as rs7564005, rs7563777, rs2558090, at least one selected from the group consisting of rs34800310, rs35134764, rs2558089, rs35545627, rs34367058, rs13416345, rs13416453, rs1427591 and the like; And

인간의 17번 염색체의 53562289번째 염기부터 53658289번째 염기까지에 위치하는 SNP, 구체적으로 인간의 17번 염색체의 53610289번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs1876522, rs1876523, rs1876524, rs1508230, rs8079251, rs6504973, rs8080030, rs9896610, rs8080297, rs9902863, rs8082684 등으로 이루어진 군에서 선택된 하나 이상One or more SNPs including SNP located in the 53562289th base to the 53658289th base of human chromosome 17, specifically SNP located in the 53610289th base of human chromosome 17, such as rs1876522, rs1876523, rs1876524, rs1508230 , rs8079251, rs6504973, rs8080030, rs9896610, rs8080297, rs9902863, rs8082684, etc.

으로 이루어진 군에서 선택된 하나 이상을 필수적으로 사용하는 것일 수 있다., And the like.

여기에 더하여, 임의로, 상기 이식편대숙주병 발병 위험성 예측에 정보를 제공하는 방법, 이식편대숙주병 발병 위험성 검진용 조성물, 및 이식편대숙주병 발병 위험성 검진용 키트는, 이식편대숙주병 마커로서,In addition, optionally, a method for providing information to predict the risk of graft-versus-host disease, a composition for screening for risk of graft-versus-host disease, and a graft-versus-host disease risk screening kit is a graft-

인간의 6번 염색체의 39812244번째 염기부터 39925888번째 염기까지에 위치하는 SNP, 구체적으로, 인간의 6번 염색체의 39869066번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs882559, rs7765077, rs186480179, rs182233667, rs77149857, rs191290624, rs111433318, rs148294935, rs141483786, rs199589116, rs112473099 등으로 이루어진 군에서 선택된 하나 이상,One or more SNPs, such as rs882559, rs7765077, rs186480179, including SNPs located in 39812244 base to 39925888 base of human chromosome 6, specifically SNPs located in 39869066 base of human chromosome 6, at least one selected from the group consisting of rs182233667, rs77149857, rs191290624, rs111433318, rs148294935, rs141483786, rs199589116, rs112473099,

인간의 3번 염색체의 30696513번째 염기부터 30731171번째 염기까지에 위치하는 SNP, 구체적으로, 인간의 3번 염색체의 30713842번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs2228048, rs35766612, rs35719192, rs17854016, rs2229102, rs3209742, rs11466513, rs11466514, rs17026171, rs11466515, rs11466516 등으로 이루어진 군에서 선택된 하나 이상, 및One or more SNPs, such as rs2228048, rs35766612, rs35719192, and rs35719192, comprising SNPs located in the 30696513 base to 30731171 base of human chromosome 3, specifically SNPs located in the 30713842 base of human chromosome 3, at least one selected from the group consisting of rs17854016, rs2229102, rs3209742, rs11466513, rs11466514, rs17026171, rs11466515, rs11466516,

인간의 11번 염색체의 111939586번째 염기부터 112131330번째 염기까지에 위치하는 SNP, 구체적으로, 인간의 11번 염색체의 112035458번째 염기에 위치하는 SNP을 포함하는 하나 이상의 SNP, 예컨대, rs1946518, rs1946519, rs5744224, rs182302223, rs187031408, rs192374798, rs5744225, rs5744226, rs185641181, rs34360641, rs5744227 등으로 이루어진 군에서 선택된 하나 이상One or more SNPs including SNPs located at 111939586 base to 112131330 base of human chromosome 11, specifically SNPs located at 112035458 base of human chromosome 11, such as rs1946518, rs1946519, rs5744224, at least one selected from the group consisting of rs182302223, rs187031408, rs192374798, rs5744225, rs5744226, rs185641181, rs34360641, rs5744227, etc.

으로 이루어진 군에서 선택된 하나 이상을 추가로 사용하는 것일 수 있다.Or a combination thereof.

본 발명에 따른 이식편대숙주병 발병 위험성 예측 기술은 이식편대숙주병이 이미 발병한 상태에서 진단하는 사후적 방법이 아니고, 동종조혈모세포이식 환자에서 이식편대숙주병 발병 위험성을 미리 예측하는 사전적 방법으로써, 이식편대숙주병 발병 위험성이 높은 개체가 특별하고 적절한 관리를 통하여 발병시기를 늦추거나 발병하지 않도록 할 수 있고, 발병되더라도 지속적인 사전 모니터링을 통하여 조기에 진단할 수 있도록 할 수 있는 기술이다.The present invention relates to a method for predicting the risk of graft-versus-host disease in a patient with graft-versus-host disease, It is a technique that allows individuals with high risk of graft-versus-host disease to be prevented from delaying or developing the onset of disease through special and appropriate management, and to be able to diagnose early through continuous proactive monitoring even if it develops.

도 1은 샘플 제공군 (original data set)에서 질병예측모델 구축을 위해 선발된 7개 SNP의 minor allele 빈도를 나타낸 그래프이다.
도 2는 6 가지 알고리즘 모델의 ROC(receiver operating characteristic) 곡선을 보여주는 그래프이다.
도 3은 인간의 6번 염색체의39869066번째 위치를 기준으로 1Mbps내 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교한 결과를 나타낸 것이다.
도 4는 인간의 15번 염색체의 59368167번째 위치를 기준으로 1Mbps내 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교한 결과를 나타낸 것이다.
도 5는 인간의 17번 염색체의 38248354번째 위치를 기준으로 1Mbps내 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교한 결과를 나타낸 것이다.
도 6은 인간의 2번 염색체의 137512698번째 위치를 기준으로 1Mbps내 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교한 결과를 나타낸 것이다.
도 7은 인간의 17번 염색체의 53610289번째 위치를 기준으로 1Mbps내 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교한 결과를 나타낸 것이다.
도 8은 인간의 3번 염색체의 30713842번째 위치를 기준으로 1Mbps내 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교한 결과를 나타낸 것이다.
도 9는 인간의 11번 염색체의 112035458번째 위치를 기준으로 1Mbps내 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교한 결과를 나타낸 것이다.
Figure 1 is a graph showing the minor allele frequencies of the seven SNPs selected for constructing the disease prediction model in the original data set.
2 is a graph showing receiver operating characteristic (ROC) curves of six algorithm models.
Fig. 3 shows the results of comparing the R square value with the distance of all SNP pairs revealed within 1 Mbps based on the 39869066-th position of the human chromosome 6.
FIG. 4 shows the results of comparing the R square value and the distance of all SNP pairs revealed within 1 Mbps based on the 59368167-th position of human chromosome 15.
FIG. 5 shows the results of comparing the R square value and the distance of all SNP pairs revealed within 1 Mbps based on the 38248354-th position of the human chromosome 17.
FIG. 6 shows the results of comparing the R square value and the distance of all SNP pairs revealed within 1 Mbps based on the 137512698-th position of human chromosome 2.
FIG. 7 shows the results of comparing the R square value with the distance of all SNP pairs revealed within 1 Mbps based on the 53610289-th position of human chromosome 17.
FIG. 8 shows the results of comparing the R square value and the distance of all the SNP pairs revealed within 1 Mbps based on the 30713842-th position of the human chromosome 3.
FIG. 9 shows the results of comparing the R square value and the distance of all SNP pairs revealed within 1 Mbps based on the 112035458-th position of human chromosome 11.

하기의 실시 예에 의하여 본 발명을 보다 상세히 설명한다. 그러나, 이들 실시 예는 본 발명을 예시하기 위한 것일 뿐이며, 본 발명이 이들 실시 예에 의하여 제한되는 것은 아니다.
The present invention will be described in more detail with reference to the following examples. However, these examples are only for illustrating the present invention, and the present invention is not limited by these examples.

실시 예 1: Example 1: 급성이식편대숙주병에Acute graft versus host disease 특이적인 SNP 탐색 Specific SNP discovery

급성이식편대숙주병 환자의 유전자를 분석하여 급성이식편대숙주병에서 특징적으로 나타나는 단일 염기다형성 (Single Nucleotide Polymorphism: SNP)을 찾아내기 위하여 다음의 시험을 수행하였다.The following tests were performed to determine the single nucleotide polymorphism (SNP) characteristic of acute graft versus host disease by analyzing the genes of patients with acute graft versus host disease.

1.1. 분석대상 유전자 및 SNP1.1. The gene and SNP to be analyzed

급성이식편대숙주병 환자의 유전적 성향을 파악하기 위하여, 하기의 표4에 나타낸 53개의 유전자 대상으로 87개의 SNP, 그리고 유전자와 유전자 사이에 존재 즉 intergenic region에 7개의 SNP, 총 94개의 SNP에 대하여 연구를 수행하였다. 이들 SNP들은 아시아 개체군에서 minor allele frequency가 0.05 이상인 SNP들이었으며, 하기의 실시 예에서는 급성이식편대숙주병 환자군(74명)과 급성이식편대숙주병이 발생하지 않은 환자군(114명)에 대하여 94개 SNP을 조사하여 급성이식편대숙주병 환자에 유의적 상관성을 갖는 SNP을 선별하였다.To determine the genetic tendency of patients with acute graft-versus-host disease, 87 SNPs and 53 SNPs shown in Table 4 below, and 7 SNPs in the intergenic region, . These SNPs were SNPs with a minor allele frequency of 0.05 or more in the Asian populations. In the following examples, 94 patients (114 patients) without acute graft versus host disease (74 patients) and acute graft versus host disease SNPs were screened to identify SNPs with significant correlations with patients with acute GVHD.

유전자 별 기능모티브의 SNP 개수 Number of SNPs by function motif by gene No.No. Promoter/
5'UTR
Promoter /
5'UTR
ExonExon IntronIntron 3'UTR/
flanking
3'UTR /
flanking
IntergenicregionIntergenicregion TotalTotal
1One ABCB1ABCB1 22 22 22 ABCC2ABCC2 1One 1One 22 33 ACTA2ACTA2 22 22 44 ATICATIC 1One 1One 55 BCL2BCL2 1One 22 33 66 C18orf56C18orf56 1One 1One 77 CD44CD44 1One 1One 88 CTGFCTGF 1One 1One 99 CTLA4CTLA4 22 1One 22 55 1010 CYP2B6CYP2B6 1One 1One 1111 CYP2C19CYP2C19 22 22 1212 CYP3A5CYP3A5 1One 1One 1313 DAAM2DAAM2 22 22 1414 DPY30DPY30 1One 1One 1515 ENOSF1ENOSF1 1One 1One 22 1616 ESR1ESR1 1One 1One 1717 FASFAS 1One 1One 1818 GGHGGH 1One 1One 22 1919 GSTA1GSTA1 1One 1One 2020 GSTP1GSTP1 1One 1One 2121 HMHA1HMHA1 1One 1One 2222 HSPA1LHSPA1L 22 22 2323 ICOSICOS 1One 1One 2424 IFNGR2IFNGR2 1One 1One 2525 IL10IL10 33 33 2626 IL10RBIL10RB 1One 1One 2727 IL13IL13 1One 1One 2828 IL18IL18 22 22 2929 IL1AIL1A 1One 1One 3030 IL1BIL1B 1One 1One 22 3131 IL2IL2 1One 1One 3232 IL4IL4 1One 1One 3333 IL4RIL4R 22 22 3434 IL6IL6 1One 1One 3535 IRF4IRF4 1One 1One 22 3636 LTALTA 1One 22 33 3737 MTHFRMTHFR 22 1One 33 3838 NIPSNAP3BNIPSNAP3B 1One 1One 3939 NLRC4NLRC4 1One 1One 4040 NOD2NOD2 1One 1One 4141 RNF111RNF111 1One 1One 4242 SERPINE2SERPINE2 22 22 4343 SLC30A6SLC30A6 22 22 4444 SPASTSPAST 44 44 4545 TGFB1TGFB1 1One 1One 4646 TGFBR2TGFBR2 1One 1One 4747 THRATHRA 1One 1One 4848 TNFTNF 1One 1One 4949 TNFRSF1BTNFRSF1B 1One 1One 5050 TRAF3IP1TRAF3IP1 1One 1One 5151 VDRVDR 1One 33 44 5252 VEGFAVEGFA 22 1One 33 5353 ZNF597ZNF597 1One 1One 5454 IntergenicIntergenic 77 77 TotalTotal 2121 3030 2323 1313 77 9494

1.2. 시료 및 분석기구 준비1.2. Prepare Samples and Analysis Instruments

유전체 시료는 동종조혈모세포이식를 수행해야 하는 환자들을 대상으로 이식 전에 환자의 혈액으로부터 게놈 DNA를 추출하였다. 100일을 기준으로 급성이식편대숙주병이 발병한 환자군을 실험군(74명)으로, 급성이식편대숙주병이 발병하지 않은 환자군을 대조군(114명)으로 하여, 총 188명의 유전체 시료를 사용하였다. 동종조혈모세포이식을 받게 되는 질환은 급성골수성백혈병 (acute myeloid leukemia, AML), 급성림프구성백혈병(acute lymphocytic leukemia, ALL), 만성골수성백혈병 (chronic myeloid leukemia, CML), 골수이형성증후군 (myelodysplastic syndrome, MDS), 재생불량성빈혈 (aplastic anemia), 림프종 (Lymphoma), 급성혼합형백혈병 (acute biphenotypic leukemia, ABL), 골수섬유증 (Myelo-Fibrosis, MF), 다발성골수종 (Multiple Myeloma, MM), 기타 다른 혈액 관련 질환 등 10개의 그룹으로 진단 받은 환자들이다. 서울대병원에 2002년 1월에서 2013년 2월까지 입원한 환자들 중에서 동종조혈모세포이식을 수행하고 임상적으로 급성이식편대숙주병이 발병한 환자군과 발병하지 않은 환자군으로 나누어본 연구에 사용하였다. Genomic DNA samples were extracted from patient blood prior to transplantation in patients who had to undergo allogeneic hematopoietic stem cell transplantation. A total of 188 genomic samples were used in the experimental group (74 patients) and the control group (114 patients) who did not develop acute graft versus host disease on the 100th day after acute graft versus host disease. Diseases that undergo allogeneic stem cell transplantation are acute myeloid leukemia (AML), acute lymphocytic leukemia (ALL), chronic myeloid leukemia (CML), myelodysplastic syndrome, (MDS), aplastic anemia, lymphoma, acute biphenotypic leukemia (ABL), myelo-fibrosis (MF), multiple myeloma (MM) The patients were diagnosed as 10 groups. We performed allogeneic stem cell transplantation from January 2002 to February 2013 in Seoul National University Hospital. The patients were divided into two groups: those with acute GVHD and the patients without GVHD.

SNP 유전자형 분석 플랫폼으로서 Illumina사의 BeadArray technology를 이용하여 94개의 SNP을 contents로 포함하도록 제작된 SNP칩을 이용하였다. 유전자형 분석은 GoldenGate Genotyping Assay로 Illumina사에서 제공하는 protocol에 따라서 수행하였고, SNP칩 실험을 통하여 급성이식편대숙주병과 관련성이 높은 유의한 SNP 7개를 선발하였다. 예측모델 구축의 Power를 높이기 위하여, 추가적으로 206명 (실험군 50명, 대조군 156명)에 대하여 유전자 분석을 수행하였다. 상기 유전자 분석은 기술적 편향보정을 위하여, 기존의 Illumina chip 대신 Applied Biosystems사의 TaqMan Genotyping Assay에 의하여 실시하였다. 또한, 상기 7개의 SNP genotyping 결과를 확보한 총 394명 중에서 임상정보 (질환 타입, 수여자와 공여자와의 관계, 및 이식형태)가 존재하는 298명을 선별하여 질환 예측 모델을 구축하였다.
As the SNP genotyping platform, we used SNP chips prepared by Illumina's BeadArray technology to contain 94 SNPs as contents. Genotyping was performed using the GoldenGate Genotyping Assay according to the protocol provided by Illumina. Seven SNPs with high SNP associated with acute GVHD were selected by SNP chip experiment. In order to increase the power of the prediction model construction, an additional 206 individuals (50 in the experimental group and 156 in the control group) were analyzed. The gene analysis was performed by TaqMan Genotyping Assay from Applied Biosystems, Inc. instead of the existing Illumina chip for technical bias correction. Of the 394 patients who obtained the above 7 SNP genotyping results, 298 patients with clinical information (disease type, recipient and donor relationship, and transplant type) were selected and the disease prediction model was constructed.

1.3. 분석 방법1.3. Analysis method

1.3.1. feature 선별1.3.1. feature selection

① 특징적 SNP 선별① Characteristic SNP screening

상기 94 개의 SNP의 급성이식편대숙주병과의 관련성 정도를 각각 독립적으로 판별하기 위하여, 5 개의 genetic model [우성모델(dominant model), 열성모델(recessive model), 공우성모델(co-dominant model), 부가적 모델(additive model), 대립형질모델(allelic model)]에 대하여 로지스틱 회귀분석(logistic regression)을 수행하여, 각 SNP별로 가장 유의한 genetic model을 선별하고 그의 p-value로 SNP을 정렬하였다. 보통의 discriminate analysis에서 feature의 수를 결정하는 rule of thumb은 모델 구축에 이용된 샘플 수의 1/10 이하이다. 따라서 본 실험에서 이용된 샘플의 개수는 총 298 개이므로, 약 20 내지 30 개 정도의 feature수가 적절하다. P value 순으로 정렬된 SNP 목록에서 상위 30개 SNP을 추출하였다.In order to independently discriminate the degree of association between the 94 SNPs and the acute graft-versus-host disease, five genetic models (dominant model, recessive model, co-dominant model, Logistic regression was performed on the additive model and the allelic model to select the most significant genetic model for each SNP and align the SNP with its p-value. The rule of thumb, which determines the number of features in a normal discriminate analysis, is less than 1/10 of the number of samples used in model building. Therefore, the total number of samples used in this experiment is 298, so that about 20 to 30 features are suitable. The top 30 SNPs were extracted from the list of SNPs sorted by P value.

한국인 집단에서 Minor Allele 빈도가 0.05 이하가 되는 것은 다형성(polymorphism)의 정의를 충족하지 못하므로, 이를 필터링하였다. 또한, All pair-wise SNP의 r2> 0.8 인 SNP이 존재한다면, 인포메이션 중복으로 인하여 모델 구축 과정에서 문제가 생기므로, 이 또한 필터링하였다.Minor allele frequencies of 0.05 or less in the Korean population did not meet the definition of polymorphism and were filtered. In addition, if SNPs with r 2 > 0.8 of all pair-wise SNPs exist, filtering is also performed because a problem arises in the model construction process due to information redundancy.

상기 단계를 거쳐 7개의 유의한 SNP을 선별하였고, 선별된 SNP를 아래의 표 5에 정리하였다:Seven significant SNPs were selected through the above steps and the selected SNPs were summarized in Table 5 below:

SNPSNP 염색체 번호Chromosome number 염색체상 위치(ref)Chromosomal location (ref) rs882559rs882559 66 3986906639869066 rs7178935rs7178935 1515 5936816759368167 rs3744805rs3744805 1717 3824835438248354 rs7564005rs7564005 22 137512698137512698 rs1876522rs1876522 1717 5361028953610289 rs2228048rs2228048 33 3071384230713842 rs1946518rs1946518 1111 112035458112035458

② 임상적 변수 선별 ② Selection of clinical variables

상기에서 얻어진 샘플에 대하여 데이터 마이닝 툴로서 일반적으로 널리 알려져 있는 Weka 프로그램의 카이제곱 Eval 함수와 ranker 함수를 통하여, 10-fold cross-validataion 방법으로 여러 가지 임상적 변수 중, 급성이식편대숙주병에 상대적으로 영향력이 높은 변수를 평가하여 검정하여 그 결과를 아래의 표 6에 나타내었다. 이 때 급성이식편대숙주병 유무(0, 또는 1) 및 급성이식편대숙주병 등급 (0, 1, 2, 3, 4)로 나누어 영향력 있는 변수를 선별하였으며, 본 시험에 고려된 임상 변수는 성별, 나이, 수여자의 질병형태 [1: 급성골수성백혈병 (acute myeloid leukemia, AML), 2: 급성림프구성백혈병 (acute lymphocytic leukemia, ALL), 3: 만성골수성백혈병 (chronic myeloid leukemia, CML), 4: 골수이형성증후군 (myelodysplastic syndrome, MDS), 5: 재생불량성빈혈 (aplastic anemia), 6: 림프종 (Lymphoma), 7: 급성혼합형백혈병 (acute biphenotypic leukemia, ABL), 8: 골수 섬유증 (Myelo-Fibrosis, MF), 9: 다발성골수종 (Multiple Myeloma, MM), 10: 그 외 다른 혈액관련 질환], 공유자와 수여자와의 관계 (0: related (sibling), 1: un-related, 2: haploidentical), 이식형태 (1: 골수이식 (bone-marrow, BM), 2: 말초혈액조혈모이식 (peripheral blood, PB), 3:BM+PB), 및 전처치 형태(0: Non-myeloablative, 1: Myeloablative)이다.Using the 10-fold cross-validation method, the Weka program's chi-square Eval function and ranker function, commonly known as a data mining tool, are used to compare the samples obtained from the above to the acute graft versus host disease , And the results are shown in Table 6 below. At this time, influential variables were selected by dividing into acute graft versus host disease (0 or 1) and acute graft versus host disease grade (0, 1, 2, 3, 4) , Acute myeloid leukemia (AML), 2: acute lymphocytic leukemia (ALL), 3: chronic myeloid leukemia (CML), 4 : Myelodysplastic syndrome (MDS), 5: aplastic anemia, 6: lymphoma, 7: acute biphenotypic leukemia, 8: myelo-fibrosis, MF), 9: Multiple myeloma (MM), 10: other blood related diseases, 0: related (sibling), 1: un- related, 2: haploidentical) (1: bone marrow, BM, 2: peripheral blood, 3: BM + PB) and pretreatment type (0: Non- myeloablative, 1: Myeloablative.

Figure 112015061682069-pat00001
Figure 112015061682069-pat00001

상기 표 6에서, average merit값이 높을 수록, average rank값이 낮을수록 영향력이 높은 변수라 할 수 있는데, average merit값이 높고 average rank값이 낮은 순서대로 표에 나타내었으며, 상위 5위권에 해당하는 유의한 변수를 빨간색으로 표시하였다. 구체적으로, 상기 시험된 총 6가지 임상 변수 중에서, 공유자와 수여자와의 관계(Transplant_donor) 변수 (0: related (sibling), 1: un-related, 2: haploidentical), 수여자의 질병형태(Disease) 변수 (1: AML, 2: ALL, 3: CML, 4: MDS, 5: Aplastic anemia, 6: Lymphoma, 7: ABL, 8: MF, 9: MM, 10: Others), 이식형태(Transplant_type) 변수 (1: 골수이식 (bone-marrow, BM), 2:말초혈액조혈모이식 (peripheral blood, PB), 3:BM+PB) 등의 총 3개의 임상 변수가 높은 순위로 나타나, 이들 임상변수가 급성이식편대숙주병에 높은 영향력을 보이는 요인으로 확인되었다. In Table 6, the higher the average merit value and the lower the average rank value, the more influential the variable. The average merit value is higher and the average rank value is lower in the table. Significant variables are shown in red. Specifically, among the six clinical parameters tested, the relationship between the sharer and the recipient (Transplant_donor) (0: related (sibling), 1: un- related, 2: haploidentical) 8, MF, 9: MM, 10: Others), transplant type (Transplant type) Three clinical variables such as variable (1: bone-marrow, BM, 2: peripheral blood, PB, 3: BM + PB) Were found to be highly influential in acute graft versus host disease.

또한, 상기에서 얻어진 298명 샘플에 대한 로지스틱 회귀분석을 통하여 여러 가지 임상변수 중, 급성이식편대숙주병과 연관성을 검증하여 그 결과를 아래의 표 7에 나타내었다.In addition, logistic regression analysis of the 298 samples obtained above verified the association with acute graft versus host disease among various clinical parameters, and the results are shown in Table 7 below.

  OddsRatioOddsRatio z valuez value Pr(>|z|)Pr (> | z |) (Intercept)(Intercept) 0.248 0.248 -1.652 -1.652 0.09860.0986 Sex(성별)Sex (sex) 1.072 1.072 0.247 0.247 0.80510.8051 Age(나이)Age (age) 1.003 1.003 0.240 0.240 0.81040.8104 Disease2_(수여자의 질병형태)Disease2_ (Disease form of the recipient) 0.991 0.991 -0.024 -0.024 0.98090.9809 Disease3_(수여자의 질병형태)Disease3_ (Disease form of the recipient) 1.636 1.636 0.942 0.942 0.34630.3463 Disease4_(수여자의 질병형태)Disease4_ (Disease form of the recipient) 1.086 1.086 0.161 0.161 0.87210.8721 Disease5_(수여자의 질병형태)Disease5_ (Disease form of the recipient) 0.380 0.380 -1.738 -1.738 0.0822*0.0822 * Disease6_(수여자의 질병형태)Disease6_ (Disease form of the recipient) 0.608 0.608 -0.692 -0.692 0.4890.489 Disease7_(수여자의 질병형태)Disease7_ (Disease form of the recipient) 2.824 2.824 1.382 1.382 0.16690.1669 Disease8_(수여자의 질병형태)Disease8_ (Disease form of the recipient) 1.558 1.558 0.526 0.526 0.59880.5988 Disease9_(수여자의 질병형태)Disease9_ (Disease form of the recipient) 2.702 2.702 0.954 0.954 0.34020.3402 Disease10_(수여자의 질병형태)Disease10_ (Disease form of the recipient) 0.775 0.775 -0.280 -0.280 0.77910.7791 transplant_donor1_(수여자와의 관계)transplant_donor1_ (relationship with recipient) 3.298 3.298 3.968 3.968 0.0000724***0.0000724 *** transplant_donor2_(수여자와의 관계)transplant_donor2_ (relationship with recipient) 0.000 0.000 -0.015 -0.015 0.9880.988 transplant_type2_(이식형태)transplant_type2_ (transplant type) 1.169 1.169 0.467 0.467 0.64060.6406 transplant_type3_(이식형태)transplant_type3_ (transplant type) 1.180 1.180 0.191 0.191 0.84840.8484 prehandle1(전처치)prehandle1 (pretreatment) 0.571 0.571 -1.612 -1,612 0.10690.1069

* 유의한 variable에 대해 굵은 글씨로 나타냄.* Indicated in bold type for a meaningful variable.

(*** p<0.0001을 나타내며, * p<0.1을 나타냄.)(*** p <0.0001, * p <0.1).

표 7에서 확인할 수 있는 바와 같이, 여러 가지 임상 변수 중, 공여자와 수여자의 관계가 "transplant_donor 0: sibling"인 경우(즉, 비혈연관계)와 "transplant_donor 1:unrelated"인 경우(즉, 혈연관계)를 비교하면, 비혈연관계로부터 이식을 받은 경우가 혈연관계로부터 이식 받은 경우와 비교하여 이식편대숙주병 발명이 3.2배 이상이 증가하였고, 이는 일반적인 의학상식의 범주와 부합되는 사실이다. 그리고, p value <0.1을 만족하는 변수 중 수여자의 질병형태가 Disease1(AML)인 경우와 비교시, Disease5(Aplastic anemia)인 경우의 odds ratio값이 0.38 배로, 이식편대숙주병에 걸릴 위험이 낮았으며, 질병형태가 Disease3(CML), Disease7(ABL), Disease9(MM) 등은 odds ratio값이 각 1.6, 2.7, 2.6으로 Disease1(AML)에 비해 이식편대숙주병에 걸릴 위험이 높게 나타났다.As shown in Table 7, among the various clinical variables, the relationship between donor and recipient is "transplant_donor 0: sibling" (ie, non-blood-related) and "transplant_donor 1: unrelated" ), The number of graft versus host disease inventions increased more than 3.2 times compared with the case of grafting from a non-blood-related relationship to that of a graft from a blood-related relationship, which is consistent with general medical sense. In addition, the odds ratio value of Disease5 (Aplastic anemia) is 0.38 times as compared with the case of Disease1 (AML) among the parameters satisfying p value <0.1, and the risk of graft-versus host disease The risk of graft versus host disease was higher for Disease 3 (CML), Disease 7 (ABL) and Disease 9 (MM) compared to Disease 1 (AML) with odds ratio values of 1.6, 2.7 and 2.6, respectively.

따라서 앞서 선별한 7개 SNP외에 상기 유의한 임상변수 인 수여자의 관계 변수와 수여자의 질병 형태의 임상 변수를 모델에 추가하면 보다 더 질병예측의 정확도와 설명력을 높일 수 있을 것으로 생각되어 모델 구축 시 입력변수에 추가하였고, 로지스틱 결과에서는 유의하지 않았지만, 상기 표 6에서 이식형태 또한 aGVHD_grade 변수를 구분하는데 높은 영향력을 주는 변수로 상위 순위에 있었고, 임상적으로도 의미있는 요인이기 때문에 급성이식편대 숙주 질병 예측 모델의 입력변수에 포함시켰다.
In addition to the above-mentioned 7 SNPs, it is thought that adding the clinical variables of the above-mentioned significant clinical variables, such as the recipient and the disease type of the recipient, to the model would further improve the accuracy and clarity of disease prediction. And the logistic results were not significant. However, in Table 6, the transplantation type was also ranked as a highly influential variable to distinguish the aGVHD_grade variable, and since it is a clinically significant factor, the acute graft versus host Were included in the input variables of the disease prediction model.

1.3.2. 모델 구축1.3.2. Model building

① 모델 구축에 사용된 알고리즘① The algorithm used for model building

i) Artificial Neural Net (ANN): 선택된 Feature들을 입력 뉴런(Input neuron)으로 두고, 그 feature들을 이용하여 특정 개체가 급성이식편대숙주병인지 아닌지를 판별하는 출력 뉴런(output neuron)을 설정한 뒤, 은닉층(hidden layer)의 connection과의 값의 업데이트를 통하여 가장 판별력이 좋은 모델을 찾는 대표적인 machine learning 기법이다. i) Artificial Neural Net (ANN): Set the selected neurons as input neurons, set the output neurons to determine whether the specific entity is an acute graft versus host disease using the features, It is a typical machine learning method that finds the most discriminating model by updating the value of connection with the hidden layer (hidden layer).

ii) Logistic Regression: 선택된 Feature들을 independent variable, 급성이식편대숙주병 여부를 dependent variable로 이용하여, 회귀 모델의 계수를 추정함. 추정된 함수에 특정 sample의 각 feature에 대한 information을 대입하면 그 sample이 급성이식편대숙주병에 걸릴 확률이 얼만큼 되는지에 대한 결과가 추론되어 나온다. ii) Logistic Regression: Estimates the coefficients of the regression model by using the selected features as independent variable and the dependent variable as acute graft versus host disease. When the information about each feature of a specific sample is assigned to the estimated function, the result of the probability that the sample is caught in the acute graft versus host disease is deduced.

iii) Support Vector Machine: ANN과 더불어 최근 많은 분야에서 사용되고 있는 분류 알고리즘이다. Data point들을 support vector로 이용하여 가장 유의미한 classifier를 구분한다. 여러 kernel method를 통해 non-linear한 형태의 classifier도 구현이 가능하다. iii) Support Vector Machine: In addition to ANN, it is a classification algorithm used in many fields in recent years. Data points are used as support vectors to identify the most significant classifiers. Non-linear type classifiers can be implemented through several kernel methods.

iv) Naive Bayes: 지도학습(Supervised Learning)을 사용한 간단한 분류 중 하나이다. 이 분류는 분류를 위해서 베이즈 룰(Bayes' Rule)을 기본적으로 사용하고 있다. 베이즈 룰을 사용하는 가장 큰 이유는 조건부 확률을 구할 때 베이즈 룰을 이용하면 더 손쉽게 값을 구하는 경우가 많기 때문이다. 분류를 위해 특정 sample의 feature를 입력값로 받고, 급성이식편대숙주병에 걸리는 그룹과 그렇지 않은 그룹을 분류하고자 할 때 각 그룹별 해당 조건부 확률 계산할 수 있고, 가장 높은 확률을 가지는 그룹이 해당 입력 값이 속하게 될 그룹이 된다.iv) Naive Bayes: One of the simplest classifications using Supervised Learning. This classification basically uses Bayes' Rule for classification. The main reason for using Bayes rules is that it is easier to get the values by using Bayes rules when calculating conditional probabilities. In order to classify a sample into features of a specific sample as an input value, and to classify a group that has acute graft versus host disease and a group that does not have acute graft versus host disease, the conditional probability of each group can be calculated. This is the group to which you belong.

v)RBFNetWork (Radial basis function network): Neural Network 중 한 방법으로 RBFN은 다층 앞 먹임 신경망에 속하며, 두 개의 층을 갖고 있다. 은닉층의 각각의 뉴런들은 가우시안과 같은 방사형기저함수를 활성함수로 갖는다. 각 뉴런이 가지는 방사형기저함수의 중심은 그 뉴런이 갖는 연결강도에 의해 결정되고, 그 위치와 함수의 폭은 학습을 통해 구한다. 출력은 모든 방사형기저함수의 출력의 선형 조합으로 결정된다. 함수 근사의 관점에서 보면, 은닉층은 입력패턴을 표현하기 위한 기저(basis)를 형성한다고 할 수 있다.v) RBFNetWork (Radial basis function network): One of the neural networks, RBFN belongs to the multi-layer feed-forward neural network and has two layers. Each neuron in the hidden layer has a radial basis function, such as Gaussian, as an activation function. The center of the radial basis function of each neuron is determined by the connection strength of the neuron, and the position and the width of the function are obtained through learning. The output is determined by the linear combination of the outputs of all radial basis functions. From the viewpoint of function approximation, it can be said that the hidden layer forms a basis for expressing the input pattern.

vi)Decision Tree: 예측과 분류를 위해 보편적이고 강력한 툴이다. 신경망구조 분석과 달리 나무구조로 규칙을 표현하기 때문에 이해하기 쉽다. 나무구조 형성의 형태 중 하나는 이진트리구조를 들 수 있고, 이 구조는 각각의 노드가 두개의 자식 노드를 만들어 yes-no 질문에 답함으로써 터미널노드까지 진행해 나가는 방법이다. 단순한 이진트리모양만 있는 것이 아니라 혼합된 형태의 모형도 있다.
vi) Decision Tree: A universal and powerful tool for prediction and classification. Unlike neural network structure analysis, it is easy to understand because it expresses rule by tree structure. One form of tree structure is a binary tree structure, where each node creates two child nodes and proceeds to the terminal node by answering yes-no questions. There is not only a simple binary tree shape, but also mixed models.

② 모델 구축을 위한 데이터 코딩② Data coding for model building

7개의 SNP feature에 대하여 샘플들의 유전자형 정보를 모두 (0 = Wild Homo, 1 = Hetero, 2 = Mutant Homo)로 코딩하고, 임상정보인 공유자와 수여자와의 관계, 수여자의 질병형태, 이식형태를 범주형 자료로 각 category 순으로 번호를 부여하였다. 선별된 7개의 SNP과 임상정보를 추가하여 상기에 나열한 Machine Learning 알고리즘을 적용하여 급성이식편대숙주병의 감수성 여부를 판별하였다.
We coded all the genotypes of the samples (0 = Wild Homo, 1 = Hetero, 2 = Mutant Homo) for 7 SNP features and compared the relationship between the sharer and the recipient, Were categorized as categories in each category. The selected SNPs and clinical information were added to determine the susceptibility of the acute graft versus host disease by applying the machine learning algorithm described above.

1.4. 선별된 SNP pool의 유의성 시험1.4. Significance test of selected SNP pool

1.4.1. 각 알고리즘의 최적 파라미터1.4.1. The optimal parameters of each algorithm

i) Artificial Neural Network (ANN): learning rate: 0.3, momentum:0.2, training time: 500, number of hidden nodes=21, activation function: sigmoid function,i) Artificial Neural Network (ANN): learning rate: 0.3, momentum: 0.2, training time: 500, number of hidden nodes = 21, activation function: sigmoid function,

ii) Logistic Regression: no parameter,ii) Logistic Regression: no parameter,

iii) Support Vector Machine (SVM): Linear kernel,iii) Support Vector Machine (SVM): Linear kernel,

iv) Naive Bayes: no parameter,iv) Naive Bayes: no parameter,

v) RBFNetWork (Radial basis function network): clusteringSeed: 1, numClusters:2,v) Radial basis function network (RBFNetWork): clusteringSeed: 1, numClusters: 2,

vi) Decision Tree: Confidence Factor: 0.25, The minimum number of instances per leaf:2.
vi) Decision Tree: Confidence Factor: 0.25, The minimum number of instances per leaf: 2.

1.4.2. 샘플 1.4.2. Sample 제공군에서의In the providing group 급성이식편대숙주병Acute graft versus host disease 발병 위험군 분류 실험 Classification experiment

상기 실시 예 1.3.1에서 선별된 7개의 SNP과 임상정보(공유자와 수여자와의 관계, 수여자의 질병형태, 및 이식형태)를 사용하여, 실시 예 1.2에서 언급한 최종 임상정보가 정리된 298명을 대상으로 급성이식편대숙주병 환자군과 정상인군 분류 정확성을 시험하였다. Using the seven SNPs selected in Example 1.3.1 and clinical information (the relationship between the sharer and the recipient, the disease type of the recipient, and the transplantation form), the final clinical information mentioned in Example 1.2 is summarized 298 patients were classified into acute graft versus host disease and normal group.

즉, Y~7 SNPs+Transplant_donor+Disease+Transplant_type에 대해 통계적 처리를 위하여 상기 6 가지 알고리즘을 이용하였으며, 10 번의 cross validation 얻어진 결과를 아래의 표8에 나타내었다.That is, the above-mentioned six algorithms were used for statistical processing for Y ~ 7 SNPs + Transplant_donor + Disease + Transplant_type, and 10 cross validation results are shown in Table 8 below.

Figure 112015061682069-pat00002
Figure 112015061682069-pat00002

표8에 나타낸 바와 같이, 상기 6개의 모델 중 ANN 모델에서 급성이식편대숙주병 발생 위험 예측의 정확도가 82.89%(특이도 88.89%, 민감도67.07%)로 나타났다. 상기 6가지 모델의 ROC(receiver operating characteristic) curve 를 도 2에 나타내었다. 도 2에 나타난 바와 같이, ANN모델에서 AUR(Area under ROC)이 84.8% 로 모델의 설명력이 가장 높았다.
As shown in Table 8, the accuracy of prediction of risk of acute graft versus host disease was 82.89% (specificity 88.89%, sensitivity 67.07%) in the ANN model among the six models. The receiver operating characteristic (ROC) curves of the six models are shown in FIG. As shown in FIG. 2, in the ANN model, the area under ROC (AUR) was 84.8% and the explanatory power of the model was the highest.

실시 예 2: 다양한 개체군에서의 Example 2: 급성이식편대숙주병Acute graft versus host disease 발병 위험성 예측 Prediction of onset risk

상기 실시 예 1.3.1에서 선별된 7개의 SNP의 급성이식편대숙주병 발병 위험성 예측의 객관적 정확성을 담보하기 위하여, 상기 SNP 선별을 위한 유전자 샘플을 제공한 개체군 이외의 다른 독립된 개체군(validation set)에서 급성이식편대숙주병 발병 위험군 예측 정확성을 측정하여, 샘플 제공군(original data set)에서의 정확성과 동등의 결과를 얻을 수 있음을 확인함으로써, 실제 환자 검진에서의 급성이식편대숙주병 발병 위험성 결정에 만족할만한 효용성을 나타낼 수 있음을 입증하였다. 세부 임상정보가 존재하는 76명 (control: 50명, case:26명)의 다른 개체군(validation set)을 서울대학교 병원으로부터 제공받았으며, 유전체형 분석은 Applied Biosystems사의 TaqManGenotyping Assay를 통해 수행하였다.In order to ensure the objective accuracy of predicting the risk of acute graft versus host disease in the selected seven SNPs in Example 1.3.1, a separate validation set other than the population providing the gene sample for SNP selection By confirming the accuracy of prediction of the risk of acute graft versus host disease and obtaining the same level of accuracy as in the original data set, the risk of acute graft versus host disease in actual patient screening And demonstrate satisfactory utility. A validation set of 76 patients (control: 50 patients, case: 26 patients) with detailed clinical information was obtained from Seoul National University Hospital. The genotype analysis was performed by the Applied Biosystems TaqMan Genotyping Assay.

상기 실시 예 1.4.2와 동일한 방법으로 다른 개체군(validation set)에 대하여 급성이식편대숙주병 발병 위험성 예측을 조사하였으며, 그 결과를 표 9에 나타내었다.The prediction of the risk of acute graft versus host disease for other population (validation set) was conducted in the same manner as in Example 1.4.2, and the results are shown in Table 9.

Figure 112015061682069-pat00003
Figure 112015061682069-pat00003

표 9에 나타난 바와 같이, 다른 개체군(validation set)에서, ANN 모델에서 급성이식편대숙주병 발생 위험예측의 정확도가 72.4%(특이도 88%, 민감도 42.3%)로 나타났다.As shown in Table 9, in another population (validation set), the accuracy of predicting the risk of acute graft versus host disease in the ANN model was 72.4% (specificity 88%, sensitivity 42.3%).

상기 표 8 및 표 9에서 알 수 있는 바와 같이, 선별된 7개 SNP과 임상정보(공유자와 수여자와의 관계, 수여자의 질병형태, 이식형태)를 사용하는 경우, 상기 SNP 및 임상 정보 선별에 사용된 샘플 제공군(original data set)에서 83%에 가까운 정확도를 나타낼 뿐 아니라, 무작위로 선택된 다른 개체군(validation set)에서도 72%의 정확도를 나타내어 이들 SNP 및 임상 정보가 급성이식편대숙주병의 발생 위험을 예측하는데 유효함이 확인되었다.As can be seen from Tables 8 and 9, when the selected seven SNPs and the clinical information (the relationship between the sharer and the recipient, the disease type of the recipient, and the transplantation form) are used, the SNP and the clinical information selection The accuracy of the original data set used in this study was close to 83% and the accuracy of 72% of the validation set was also selected randomly. These SNPs and clinical information were used to evaluate the acute graft versus host disease It was confirmed to be effective in predicting the risk of occurrence.

한편, 상기 실시예 1.2에서 1차로 확보한 총 188명의 SNP genotyping 결과를 대상으로, 상기 표 5에서 선발된 SNP genotype에 대한 급성이식편대숙주병과의 연관성을 로지스틱 회귀분석을 통하여 분석한 결과를 아래의 표 10에 나타내었다. The SNP genotypes of the 188 SNP genotypes obtained in Example 1.2 were firstly analyzed by logistic regression analysis. The results are shown in Table 5 below. Table 10 shows the results.

Figure 112015061682069-pat00004
Figure 112015061682069-pat00004

1): p-value of Z statistic of logistic regression model, 2): p-value of chi-square statistic of chi-square test 1) : p-value of Z statistic of logistic regression model, 2) : p-value of chi-square statistic of chi-square test

** p< 0.05 : 빨간색 표시, p<0.1 : 밑줄 표시** p <0.05: red mark, p <0.1: underline mark

상기 표 10에 나타난 바와 같이, rs882559, rs7178935, rs3744805, rs7564005, 및 rs1876522 은 5가지 genetic model 중 적어도 한 가지 이상의 모델에서 p<0.05로 유의하게 나타났고, rs2228048 및 rs1946518은 상기 5가지 genetic model 중 적어도 한 가지 이상의 모델에서 p<0.1으로 나타났다. 따라서 상기 SNP들은 이식편대숙주병 질환 연관성을 설명하고 발생 위험을 예측하는데 유용하게 활용될 수 있다.
As shown in Table 10 above, rs882559, rs7178935, rs3744805, rs7564005, and rs1876522 were significant at p <0.05 in at least one of the five genetic models and rs2228048 and rs1946518 were at least one of the five genetic models P <0.1 in one or more models. Thus, the SNPs may be useful in explaining graft-versus-host disease association and predicting the risk of outbreaks.

Claims (7)

인간 피험자로부터 얻은 유전자 시료에 대하여,
17번 염색체의 53610289번째 염기가 TT인 경우에 해당하는지 여부를 확인하는 단계를 포함하는,
이식편대숙주병 발병 위험성 예측에 정보를 제공하는 방법.
For gene samples obtained from human subjects,
Confirming whether the 53610289 base of the chromosome 17 corresponds to the case of TT.
Methods for providing information on the risk of developing graft versus host disease.
제1항에 있어서, 상기 방법은, 인간 피험자로부터 얻은 유전자 시료가 아래의 2가지 경우 중 한 가지 이상에 해당하는지 여부를 확인하는 과정을 추가로 포함하는, 이식편대숙주병 발병 위험성 예측에 정보를 제공하는 방법:
3번 염색체의 30713842번째 염기가 TC 또는 TT인 경우; 및
11번 염색체의 112035458번째 염기가 GG 인 경우.
2. The method of claim 1, wherein the method further comprises the step of determining whether a genetic sample from a human subject is one or more of the following two cases: How to provide:
The 30713842th base of chromosome 3 is TC or TT; And
The 112035458th base of chromosome 11 is GG.
제1항 또는 제2항에 있어서, 수여자의 질병형태, 공유자와 수여자와의 관계, 및 이식형태로 이루어진 군에서 선택된 하나 이상의 임상적 변수를 조사하는 단계를 추가로 포함하는, 이식편대숙주병 발병 위험성 예측에 정보를 제공하는 방법.3. The method of claim 1 or 2, further comprising the step of examining one or more clinical variables selected from the group consisting of the type of disease of the recipient, the relationship with the recipient and recipient, How to provide information on disease outbreak risk prediction. 인간의 17번 염색체의 53610289번째 염기에 위치하는 SNP를 검출가능한 프로브;
상기 SNP를 증폭 가능한 프라이머 쌍, 또는 이들 모두를 포함하며,
상기 프로브는 인간의 17번 염색체의 53610289번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 포함하는 올리고뉴클레오타이드이며, 이 때, 상기 53610289번째 염기는 TT이고,
상기 프라이머 쌍은 인간의 17번 염색체의 rs1876522를 포함하는 연속하는 50 내지 20 kbp의 유전자 단편의 5' 말단 및 3' 말단의 연속하는 5 내지 50bp 염기서열 각각에 대하여 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍인,
이식편대숙주병 발병 위험성 검진용 조성물.
A probe capable of detecting a SNP located at 53610289 base of human chromosome 17;
A primer pair capable of amplifying the SNP, or both,
Wherein the probe is an oligonucleotide comprising a sequence complementary to a consecutive 5 to 100 bp nucleotide sequence comprising the 53610289 base of human chromosome 17, wherein the 53610289 base is TT,
The primer pair consists of two oligos of the sequence complementary to each of the consecutive 5 to 50 bp sequences of the 5 ' and 3 ' ends of consecutive 50 to 20 kbp gene fragments comprising rs1876522 of human chromosome 17, A pair of primers consisting of nucleotides,
A composition for screening for risk of graft versus host disease.
제4항에 있어서, 상기 조성물은,
인간의 3번 염색체의 30713842번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 포함하며, 상기 30713842번째 염기는 TC 또는 TT인, 올리고뉴클레오타이드; 및
인간의 11번 염색체의 112035458번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 포함하며, 상기 112035458번째 염기는 GG인, 올리고뉴클레오타이드
로 이루어진 군에서 선택된 하나 이상의 프로브를 추가로 포함하는, 이식편대숙주병 발병 위험성 검진용 조성물.
5. The composition of claim 4,
An oligonucleotide comprising a sequence complementary to a consecutive 5 to 100 bp base sequence comprising 30713842 base of human chromosome 3, wherein the 30713842 base is TC or TT; And
Comprising a sequence complementary to a consecutive 5 to 100 bp base sequence comprising 112035458 base of human chromosome 11, wherein the 112035458 base is an oligonucleotide
&Lt; / RTI &gt; wherein the composition further comprises one or more probes selected from the group consisting of &lt; RTI ID = 0.0 &gt;
제4항에 있어서, 상기 조성물은,
인간의 3번 염색체의 rs2228048을 포함하는 연속하는 50 내지 20 kbp의 유전자 단편의 5' 말단 및 3' 말단의 연속하는 5 내지 50bp 염기서열 각각에 대하여 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍; 및
인간의 11번 염색체의 rs1946518을 포함하는 연속하는 50 내지 20 kbp의 유전자 단편의 5' 말단 및 3' 말단의 연속하는 5 내지 50bp 염기서열 각각에 대하여 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍
으로 이루어진 군에서 선택된 하나 이상의 프라이머 쌍을 추가로 포함하는, 이식편대숙주병 발병 위험성 검진용 조성물.
5. The composition of claim 4,
A primer consisting of two oligonucleotides having a sequence complementary to each of the 5 'terminal and the consecutive 5 to 50 bp nucleotide sequences at the 5' end and the 3 'end of a consecutive 50 to 20 kbp gene fragment containing rs2228048 of human chromosome 3 pair; And
A primer consisting of two oligonucleotides having a sequence complementary to each of the 5 to 50 bp consecutive nucleotide sequences at the 5 'end and the 3' end of a consecutive 50 to 20 kbp gene fragment comprising rs1946518 of human chromosome 11 pair
&Lt; / RTI &gt; wherein the composition further comprises at least one primer pair selected from the group consisting of: &lt; RTI ID = 0.0 &gt;
제4항 내지 제6항 중 어느 한 항의 이식편대숙주병 발병 위험성 검진용 조성물을 포함하는 이식편대숙주병 발병 위험성 검진용 키트.A kit for screening a risk of graft-versus-host disease comprising a composition for screening a risk of graft-versus-host disease according to any one of claims 4 to 6.
KR1020150090475A 2015-06-25 2015-06-25 Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease KR101541142B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150090475A KR101541142B1 (en) 2015-06-25 2015-06-25 Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150090475A KR101541142B1 (en) 2015-06-25 2015-06-25 Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020150022671A Division KR101541139B1 (en) 2015-02-13 2015-02-13 Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease

Publications (2)

Publication Number Publication Date
KR20150080475A KR20150080475A (en) 2015-07-09
KR101541142B1 true KR101541142B1 (en) 2015-08-07

Family

ID=53792262

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150090475A KR101541142B1 (en) 2015-06-25 2015-06-25 Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease

Country Status (1)

Country Link
KR (1) KR101541142B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070212694A1 (en) 2004-03-27 2007-09-13 Hanns-Georg Klein Polymorphisms In The Nod2/Card15 Gene
JP2009178129A (en) 2008-01-31 2009-08-13 Mitsubishi Rayon Co Ltd Graft-versus-host disease-associated gene

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070212694A1 (en) 2004-03-27 2007-09-13 Hanns-Georg Klein Polymorphisms In The Nod2/Card15 Gene
JP2009178129A (en) 2008-01-31 2009-08-13 Mitsubishi Rayon Co Ltd Graft-versus-host disease-associated gene

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Biology of blood and marrow transplantation. 2011, Volume 17, Issue 4, Pages 542-549.

Also Published As

Publication number Publication date
KR20150080475A (en) 2015-07-09

Similar Documents

Publication Publication Date Title
KR101850437B1 (en) Method for predicting transplantation rejection using next generation sequencing
AU2017316709B2 (en) Methods of identifying microsatellite instability
US8431345B2 (en) Method for determination of progression risk of glaucoma
US20150159220A1 (en) Methods for predicting and detecting cancer risk
US7627436B2 (en) Method of selecting optimized SNP marker sets from multiple SNP markers associated with a complex disease
Fudalej et al. Association between tryptophan hydroxylase 2 gene polymorphism and completed suicide
Rubinstein et al. Ultrahigh-density linkage map for cultivated cucumber (Cucumis sativus L.) using a single-nucleotide polymorphism genotyping array
KR101541139B1 (en) Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease
CN113667759A (en) SNP genetic marker related to egg-laying duration of chicken and application thereof
EP3652749A1 (en) Novel methods of predicting transplant rejection risk
KR101593090B1 (en) Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease
KR101530535B1 (en) Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease
Lavergne et al. Genetic analysis of the Saimiri breeding colony of the Pasteur Institute (French Guiana): development of a molecular typing method using a combination of nuclear and mitochondrial DNA markers
KR101541142B1 (en) Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease
KR101541140B1 (en) Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease
KR101541141B1 (en) Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease
KR101541143B1 (en) Method, Composition, and Kit for Predicting the Risk of Developing Graft Versus Host Disease
US20230279493A1 (en) Testing assay for screening and diagnosis of usher, pendred, jervell, and lange-nielsen syndromes
KR102193657B1 (en) SNP markers for diagnosing Taeeumin of sasang constitution and use thereof
KR102193659B1 (en) SNP markers for diagnosing Soyangin of sasang constitution and use thereof
KR101012601B1 (en) Composition for Predicting the Risk of Developing Breast Cancer
KR101772448B1 (en) A composition for determining personality traits
Ken-Dror et al. Approach for Genetic Studies
KR101687261B1 (en) Composition for determining voice phenotype
JP2020174638A (en) Method for determining risk of chronic otitis media

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant