KR101480208B1 - 저산소증 적응 형질에 대한 신규 단일염기변이 마커 - Google Patents
저산소증 적응 형질에 대한 신규 단일염기변이 마커 Download PDFInfo
- Publication number
- KR101480208B1 KR101480208B1 KR20120113514A KR20120113514A KR101480208B1 KR 101480208 B1 KR101480208 B1 KR 101480208B1 KR 20120113514 A KR20120113514 A KR 20120113514A KR 20120113514 A KR20120113514 A KR 20120113514A KR 101480208 B1 KR101480208 B1 KR 101480208B1
- Authority
- KR
- South Korea
- Prior art keywords
- amino acid
- egln1
- hypoxia
- species
- acid sequence
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6806—Determination of free amino acids
- G01N33/6812—Assays for specific amino acids
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Physics & Mathematics (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Cell Biology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Peptides Or Proteins (AREA)
- Plant Pathology (AREA)
Abstract
본 발명은 저산소증 적응(adaptation to hypoxia) 형질에 대한 신규한 단일염기변이(single nucleotide variation, SNVs) 마커(marker)에 관한 것으로서, 구체적으로 여러 종(species)의 개체들을 대상으로 저산소증(hypoxia) 관련 단백질인 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 및 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1)의 아미노산 서열들에 대한 이종간 서열 비교분석(interspecific sequence comparison)을 수행하여 검색된 저산소증 적응을 통해 고산지대에 서식하는 설표범 종 고유의 EGLN1 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 EPAS1 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이와 역시 저산소증 적응을 통해 땅속에 서식하는 두더지쥐 종 고유의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이를 포함하는 저산소증 적응 형질에 특이적인 SNVs(single nucleotide variations) 마커에 관한 것이다. 본 발명에 따른 SNVs 마커는 동물의 저산소증 적응 형질과 관련된 유전 정보를 제공함으로써 저산소증(hypoxia) 관련 질환의 신규 표적 후보에 대한 치료제 개발 분야에서 뿐 아니라 동물 종의 환경 적응성과 관련된 진화 연구 등에 광범위하게 활용될 수 있다.
Description
본 발명은 저산소증 적응(adaptation to hypoxia) 형질에 대한 신규한 단일염기변이(single nucleotide variation, SNVs) 마커(marker)에 관한 것으로서, 구체적으로 아무르(Amur, 시베리아) 호랑이, 벵갈 호랑이(백호랑이), 설표범, 아프리카 사자 및 백사자 등을 포함하는 여러 종(species)의 개체들을 대상으로 저산소증(hypoxia) 관련 단백질인 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 및 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1)의 아미노산 서열들에 대한 이종간 서열 비교분석(interspecific sequence comparison)을 수행하여 검색된 저산소증 적응 형질에 특이적인 신규 SNVs 마커에 관한 것이다.
다중 서열 정렬(multiple-sequence alignment) 분석을 통한 단일염기다형성(single nucleotide polymorphism, SNP) 또는 단일염기변이(single nucleotide variation, SNVs) 연구는 최근 활발히 이루어지고 있는 게놈 프로젝트의 발전과 함께 형질 또는 기능과 유전자 간의 연관 관계를 밝히는데 널리 활용되고 있다.
이러한 서열의 비교 분석을 통한 형질-유전자 연관성에 대한 연구는 주로 동종 내 여러 개체간 관련 유전자의 서열비교 등을 통한 질병이나 형질 관련 SNP 또는 SNVs 마커 개발 분야에서 활발히 이루어지고 있으며, 예를 들면 미국 특허공개 제2010/0303813호에는 항-TNF 반응성에 대한 EGLN2(Egl nine homolog 2) 유전자의 SNP가 제시되어 있고; 문헌 [Andersen J.D 등, Forensic science international. Genetics (2011), e153-e154]에는 덴마크인의 피부색과 관련된 SLC45A2, SLC24A5 및 TYR 유전자의 특정 SNP가 제시되어 있으며; 대한민국 특허공개 제2011-0129783호에는 유방암 발병과 연관된 CDK7(CDK-activating kinase 7) 및 ESR1(estrogen receptor 1) 유전자의 SNP가 제시되어 있다.
최근에는 진화적으로 더 뚜렷한 형질 차이를 나타내는 이종간의 서열 비교 분석을 통해 특정 종에 특이적인 유전자-형질 관련 마커에 대한 연구가 이루어지고 있으며, 예를 들면 문헌 [Kim, E. B. 등, Nature (2011), 479: 223-227]에는 두더지쥐(naked mole rat)의 드 노보 어셈블리(de novo assembly) 서열을 이용하여 두더지쥐, 인간, 쥐, 침팬지, 소 등의 이종간 서열 비교 분석을 통해 검색된 두더지쥐 특이적인 체온조절(thermoregulation) 관련 UCP1(uncoupling protein 1) 유전자의 SNVs가 제시되어 있다.
한편, 고산지대에 거주하는 티베트 인종과 고산지대가 아닌 같은 인종 출신의 한족간의 유전학적 연관성 연구(genetic association study)를 통해, EGLN1(Egl nine homolog 1) 유전자와 EPAS1(endothelial PAS domain-containing protein 1) 유전자가 고지대 적응과 관련 있다는 것이 밝혀졌다[Xu, S. 등, Mol. Biol. Evol. (2011), 28: 1003-1011]. 특히, Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1)은 PHD2(prolyl hydroxylase domain-containing protein 2) 또는 HIF-PH2(hypoxia-inducible factor prolyl hydroxylase 2)으로도 알려진 효소로서, 여러 유전체 관련 연구들을 통해 고산지대 적응에 중요한 역할을 하는 티베트 인종에서 특징적인 낮은 적혈구용적율(hematocrit) 형질과 관련이 있는 것이 제시되어 있으며[Simonson TS 등, Science (2010), 329(5987): 72-75], 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1)의 경우 이합체(dimer)를 이루어 저산소증(hypoxia)에 의해 유도되는 유전자들에 대한 전사인자로서 작용하며 배아의 심장 발달 등에 관여하는 것으로 알려져 있다[Tian H 등, Genes Dev (1997), 11(1): 72].
이에 본 발명자들은 동물의 저산소증 적응 형질 관련 SNVs 마커를 검색하기 위해 아무르 호랑이, 벵갈 호랑이(백호랑이), 설표범, 아프리카 사자 및 백사자를 포함하는 여러 서로 다른 종(species)의 유전체 서열들을 대상으로 저산소증 관련 단백질인 EGLN1 및 EPAS1의 아미노산 서열에 대한 이종간 서열 비교분석(interspecific sequence comparison)을 통해 예의 연구한 결과, 저산소증 적응을 통해 고산지대에 서식하는 설표범 종 고유의 EGLN1 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 EPAS1 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이와 역시 저산소증 적응을 통해 땅속에 서식하는 두더지쥐 종 고유의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이가 저산소증 적응 형질에 특이적인 SNVs 마커임을 발견하여 본 발명을 완성하였다.
따라서 본 발명의 목적은 동물의 저산소증 적응 형질과 관련된 신규 SNVs 마커를 제공하는 것이다.
상기 목적을 달성하기 위하여, 본 발명은 설표범의 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 설표범이 아닌 다른 종(species)의 EGLN1 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 동일 변이; 두더지쥐의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이, 및 두더지쥐가 아닌 다른 종의 EGLN1 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 동일 변이; 및 설표범의 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1) 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이, 및 설표범이 아닌 다른 종(species)의 EPAS1 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 동일 변이를 포함하는 군으로부터 하나 이상 선택된 저산소증 적응 형질에 특이적인 SNVs(single nucleotide variations) 마커를 제공한다.
본 발명에 따른 저산소증 적응을 통해 고산지대에 서식하는 설표범 종 고유의 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1) 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이와 역시 저산소증 적응을 통해 땅속에 서식하는 두더지쥐 종 고유의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이를 포함하는 저산소증 적응 형질에 특이적인 SNVs(single nucleotide variations) 마커는 동물의 저산소증 적응 형질과 관련된 유전 정보를 제공함으로써 저산소증(hypoxia) 관련 질환의 신규 표적 후보에 대한 치료제 개발 분야에서 뿐 아니라 동물 종의 환경 적응성과 관련된 진화 연구 등에 광범위하게 활용될 수 있다.
도 1은 본 발명의 일실시예에 따라 아무르 호랑이(Amur tiger), 벵갈 호랑이(White tiger), 설표범(Snow leopard), 아프리카 사자(African lion) 및 백사자(White lion)를 포함하는 총 5종의 개체들 과 유전체 서열이 공지된 인간(Human), 쥐(Mouse), 랫트(Rat), 두더지쥐(Naked mole rat) 및 개(Dog)의 각 종별 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1)의 아미노산 서열들을 다중 서열 정렬(multiple sequence alignment)을 통해 비교 분석한 결과이다.
도 2는 본 발명의 일실시예에 따라 아무르 호랑이(Amur tiger), 벵갈 호랑이(White tiger), 설표범(Snow leopard), 아프리카 사자(African lion) 및 백사자(White lion)를 포함하는 총 5종의 개체들의 각 종별 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1)의 아미노산 서열들을 다중 서열 정렬을 통해 비교 분석한 결과이다.
도 2는 본 발명의 일실시예에 따라 아무르 호랑이(Amur tiger), 벵갈 호랑이(White tiger), 설표범(Snow leopard), 아프리카 사자(African lion) 및 백사자(White lion)를 포함하는 총 5종의 개체들의 각 종별 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1)의 아미노산 서열들을 다중 서열 정렬을 통해 비교 분석한 결과이다.
이하, 본 발명을 상세히 설명한다.
본 명세서에 기재된 용어 "(아미노산 약자)(숫자)"는 해당 단백질의 아미노산 서열에서 (숫자)번째 아미노산이 (아미노산 약자)의 아미노산인 것을 의미하며, 예를 들면 "Met39"는 해당 단백질의 아미노산 서열에서의 39번째 아미노산이 메티오닌(methionine)인 것을 의미한다.
본 명세서에 기재된 용어 "(아미노산 약자)(숫자)(아미노산 약자)"는 해당 단백질의 아미노산 서열에서 (숫자)번째 아미노산이 (숫자)의 왼쪽 (아미노산 약자)의 아미노산에서 숫자의 오른쪽 (아미노산 약자)의 아미노산으로 치환된 변이를 의미하며, 예를 들면 "Lys39Met"은 아미노산 서열의 39번째 아미노산이 라이신(lysine)에서 메티오닌(methionine)으로 치환된 변이를 의미한다.
본 명세서에 기재된 용어 "대응되는 위치"는 서로 다른 종(species) 간의 해당 단백질의 아미노산 서열들을 통상적인 다중 서열 정렬(multiple sequence alignment)을 통해 매칭(matching)시켰을 때 서로 짝이 되는 위치를 의미한다.
본 명세서에 기재된 용어 "동일 변이"는 아미노산 서열에서의 변이로서 치환되기 전 아미노산이 서로 동일하고 치환된 후의 아미노산이 서로 동일한 것을 의미하며, 예를 들면 백사자 타이로시나제(tyrosinase, TYR) 아미노산 서열에서의 Arg87Gln 변이와의 "동일 변이"는 백사자가 아닌 다른 종의 TYR 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 아르기닌(Arginine)이 글루타민(glutamine)으로 치환된 변이를 의미한다.
본 발명의 일실시예에 따르면, 유전체 서열이 공지되지 않은 아무르(Amur, 시베리안) 호랑이, 벵갈 호랑이(백호랑이), 설표범, 아프리카 사자 및 백사자를 포함하는 총 5종의 개체들의 유전체 서열 정보는 통상적인 차세대 서열분석(next-generation sequencing, NGS) 방법에 따라 확보할 수 있었으며, 구체적으로 아무르 호랑이의 조직으로부터 수득한 유전체 라이브러리 서열 정보를 대상으로 통상적인 드 노보 어셈블리(de novo assembly) 분석 방법에 따라 스캐폴드 서열(scaffold sequence) 정보를 이용한 유전자 세트(gene set) 예측을 수행하여 아무르 호랑이의 유전체 서열 정보를 확보한 후, 아무르(Amur, 시베리안) 호랑이를 제외한 나머지 4종의 개체들, 즉 벵갈 호랑이, 설표범, 아프리카 사자 및 백사자의 조직 시료로부터 수득한 유전체 라이브러리 서열들을 각각 아무르 호랑이의 스캐폴드 서열 상에 정렬(align)하여 종 특이적 변이(mutation) 위치를 치환하는 방법을 통해 각각의 유전체 서열을 확보할 수 있었다.
본 발명의 일실시예에 따르면, 저산소증 적응 형질에 특이적인 SNVs 검색을 위해 이종간 서열 비교 분석을 수행하였으며, 구체적으로 상기에서와 같이 확보된 아무르(Amur, 시베리안) 호랑이, 벵갈 호랑이(백호랑이), 설표범, 아프리카 사자 및 백사자를 포함하는 총 5종의 개체들의 유전체 서열 정보를 근거로 하여 저산소증 적응에 관련된 것으로 알려진 EGLN1(Egl 나인 상동단백질 1) 유전자와 EPAS1(내피세포 PAS 도메인-함유 단백질 1) 유전자의 각 종별 유전자 서열을 아미노산 서열로 전사(transcription)시켜 각 종별 EGLN1 또는 EPAS1 아미노산 서열들을 수득하였으며, 이들을 공지된 인간(human), 쥐(mouse), 랫트(rat), 두더지쥐(naked mole rat) 및 개(dog)의 각 종별 EGLN1 또는 EPAS1 아미노산 서열들과 함께 통상적인 다중 서열 정렬(multiple sequence alignment) 방법을 통해 매칭(matching)시켜 비교분석하였다.
그 결과, 고산지대에 서식하는 설표범의 EGLN1 아미노산 서열에서는 39번째 아미노산이 Met(비극성)인 반면 고산지대에 서식하지 않는 아무르 호랑이, 벵갈호랑이, 아프리카 사자, 백사자, 인간 및 개 등의 EGLN1 아미노산 서열에서는 대응되는 위치의 아미노산이 모두 Lys(양전하 하전)인 것을 확인하였으며, 설표범의 EPAS1의 아미노산 서열에서는 663번째 및 794번째 아미노산이 각각 Ile 및 Arg인 반면 다른 종들의 EPAS1 서열에서는 대응되는 위치의 아미노산이 모두 각각 Val 및 Cys인 것을 확인하였다.
한편, 땅속에 서식하며 설표범과 마찬가지로 저산소증 적응 형질을 갖는 두더지쥐의 경우에는 EGLN1 아미노산 서열의 39번째 아미노산이 Arg(양전하 하전)인 것을 확인하였는데, 이러한 Lys39Arg 변이는 두 아미노산 모두 단백질 구조적으로 양전하 하전된 곁사슬(side chain)을 제공하므로 EGLN1의 기능에 별다른 영향을 미치진 못할 것으로 판단되었으며, 대신에 두더지쥐 고유의 EGLN1 아미노산 서열에서의 Pro15, Arg 17 및 Arg36의 변이를 확인하였다.
따라서, 본 발명에 따른 저산소증 적응을 통해 고산지대에 서식하는 설표범 종 고유의 EGLN1 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 EPAS1 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이와 역시 저산소증 적응을 통해 땅속에 서식하는 두더지쥐 종 고유의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이를 포함하는 저산소증 적응 형질에 특이적인 SNVs(single nucleotide variations) 마커는 저산소증 적응 형질에 특이적인 EGLN1 및 EPAS1 유전자의 단일염기변이(SNVs)에 대한 특이적인 마커로 활용될 수 있음을 알 수 있다.
또한, 본 발명에서는 설표범 또는 두더지쥐가 아닌 다른 다른 종(species)의 EGLN1 단백질 또는 EPAS1 단백질의 아미노산 서열에서도 상기 변이들과 대응되는 위치에서의 동일 변이들의 경우 역시 동일하게 저산소증 적응 형질에 특이적인 EGLN1 및 EPAS1 유전자의 단일염기변이(SNVs)에 대한 특이적인 마커로 활용될 수 있으므로 이들 변이를 발명 범위에 포함할 수 있다.
따라서, 본 발명은 설표범의 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 설표범이 아닌 다른 종(species)의 EGLN1 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 동일 변이; 두더지쥐의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이, 및 두더지쥐가 아닌 다른 종의 EGLN1 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 동일 변이; 및 설표범의 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1) 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이, 및 설표범이 아닌 다른 종(species)의 EPAS1 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 동일 변이를 포함하는 군으로부터 하나 이상 선택된 저산소증 적응 형질에 특이적인 SNVs(single nucleotide variations) 마커를 제공한다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지는 않는 것은 당 업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예
: 저산소증 적응 형질에 특이적인
SNVs
마커의
검색
1) 동물 조직 시료
이종간 서열 비교를 위해 사용된 하기 표 1에 나타낸 아무르(Amur, 시베리안) 호랑이, 벵갈 호랑이(백호랑이), 설표범, 아프리카 사자 및 백사자의 조직을 수득하였다. 구체적으로, 아무르 호랑이, 벵갈 백호랑이, 아프리카 사자 및 아프리카 백사자의 조직 시료는 대한민국 에버랜드 동물원으로부터 제공받았으며, 설표범의 조직 시료는 CITES 허가 하에 몽고로부터 수입된 원 조직 시료(original tissue sample; 몽고 수출 허가번호 제0390호, 대한민국 수입 허가 번호 제ES2012-02507호)를 보관하고 있는 서울대학교 수의과대학 야생동물유전자원은행으로부터 제공받았다.
동물 종 | 동물명 | 출생 | 암수 | 출신 |
아무르 호랑이 | 태극 | 2003. 04. 01 | 수컷 | 러시아 원 동부 |
뱅갈 백호랑이 | 화랑 | 1999. 06. 18 | 암컷 | 벵갈 |
아프리카 사자 | 선돌 | 2007. 06. 22 | 수컷 | 사하라 이남 |
백사자 | 스노우걸 | 2005. 01. 18 | 암컷 | 사하라 이남 |
설표범 | N/A | N/A | 암컷 | 서 몽고 |
2) 이종간 유전자 서열 비교를 위한 유전체(genome, 게놈) 서열 확보
이종간 유전자 서열 비교를 위해, 유전체(genome) 서열이 공지되어 있는 인간(human), 쥐(mouse), 랫트(rat), 두더지쥐(naked mole rat) 및 개(dog)의 단백질 서열에 대한 정보는 UniProt의 데이타베이스(database)로부터 제공받았다[Kim, E. B. 등, Nature (2011), 479: 223-227; UniProt, Nucleic Acids Res. (2012), 40: D71-75]. 한편, 유전체 서열이 공지되지 않은 아무르(Amur, 시베리안) 호랑이, 벵갈 호랑이, 설표범, 아프리카 사자 및 백사자를 포함하는 총 5종의 개체들의 경우에는 하기와 같이 유전체 서열 정보를 확보하였다.
3) 아무르(Amur, 시베리안) 호랑이의 유전체 서열 확보
아무르 호랑이의 유전체 서열 정보를 수득하기 위해, 통상적인 드 노보 어셈블리(de novo assembly) 분석 방법에 따라 다음과 같이 스캐폴드 서열(scaffold sequence)을 통한 유전자 세트(gene set) 예측을 수행하였다.
우선 아무르 호랑이의 유전체 서열 정보를 확보하기 위해, 통상적인 차세대 서열분석(next-generation sequencing, NGS) 방법에 따라 Illumina HiSeq 2000(제조사: Illumina)을 이용하여 3개의 각 170 bp(base pairs), 500 bp 및 800 bp 길이의 짧은 삽입 페어-엔드 라이브러리(short insert paired-end libraries) 및 4개의 각 2 Kb(kilo bp), 5 Kb, 10 Kb 및 20 Kb 길이의 긴 삽입 메이트-페어 라이브러리(long insert mate-pair libraries)로 구성된 27개의 레인(lane)으로부터 총 288.20 Gb(giga bp)의 유전체 라이브러리를 수득하여 판독하였으며, 이때 평균 판독 길이(read length)는 76.62 bp이었다. 이를 근거로 통상적인 방법[Bairoch, A. 등, Nucleic Acids Res. (2000), 28: 45-48]에 따라 유전체 (스캐폴드) 어셈블리 소프트웨어(genome (scaffold) assembly software, SOAPdenovo)를 사용하여 아무르 호랑이 유전체에 대한 총 2.4 Gb 길이의 스캐폴드(scaffold) 서열 정보를 수득하였으며, 이때 스캐폴드의 N50 값은 8.8 Mb(mega bp)였다. 수득한 스캐폴드 서열을 근거로 통상적인 순이론 예측(ab initio prediction), 상동성-기반 예측(homology-based prediction) 및 cDNA/EST-기반 예측(cDNA/EST-based prediction) 방법에 따라 GLEAN[Elsik, C. G. 등, Genome Biol. (2007), 8, R13]이라는 프로그램을 사용하여 다음과 같이 유전자 예측을 수행하여 아무르 호랑이의 유전자 세트를 확보하였다.
i) 순이론 예측(ab initio prediction): HMM(hidden Markov model) 기반의 반복구역 마스킹 유전체 서열(repeat masked genome) 상에서 신규 예측(de novo prediction)을 수행하였으며, 이때 예측 프로그램으로는 AUGUSTUS(version 2.5.5)[Stanke, M. 등, Nucleic Acids Res. (2006), 34: W435-439] 및 GENSCAN(version 1.0)[Burge, C. 등, J. Mol. Biol. (1997), 268: 78-94]을 사용하였다.
ii) 상동성-기반 예측(homology-based prediction): 서로 다른 종들의 상동 단백질 서열들(from Ensembl 60 release)을 TblastN (Blast 2.2.23)[Altschul, S. F. 등, J. Mol. Biol. (1990), 215: 403-410](with an E-value cutoff 1E-5)을 사용하여 유전체 서열상에 맵핑(mapping)하였다. 정렬된 서열(aligned sequence) 및 그 특정 단백질(query protein)을 걸러낸 후 GeneWise(version 2.2.0)[Birney, E. 등, Genome Res. (2004), 14: 988-995]를 사용한 검색을 통해 정밀한 스플라이스 서열정렬(accurate spliced alignments) 분석을 수행하였다.
iii) cDNA/EST-기반 예측(cDNA/EST-based prediction): 고양이 EST 및 전장(full length) cDNA(from UCSC)를 BLAT[Kent, W. J., Genome Res. (2002), 12: 656-664](blat-34, identity≥0.90, coverage≥0.90)을 통해 유전체 서열상에 정렬하여 스플라이스 서열정렬 분석을 수행하였으며, EST 결과에 대해서는 PASA[Haas, B. J. 등, Nucleic Acids Res. (2003), 31: 5654-5666]를 사용한 오버랩(overlap) 방법에 따라 스플라이스 서열정렬을 수행하였다.
4) 벵갈 호랑이, 백호랑이, 설표범, 아프리카 사자 및 백사자의 유전체 서열 확보
상기 아무르(Amur, 시베리안) 호랑이를 제외한 나머지 4종의 개체들, 즉 벵갈 호랑이, 설표범, 아프리카 사자 및 백사자를 대상으로 통상적인 차세대 서열분석(next-generation sequencing, NGS) 방법에 따라 Illumina HiSeq2000를 사용하여 유전체(genome) 서열분석을 수행하여 평균 71.5 Gb 길이의 유전체 라이브러리 서열을 수득하였다. 이들의 짧은 판독 서열(short read)들을 BWA[Li, H. 등, Bioinformatics (2009), 25: 1754-1760] 프로그램을 사용하여 각각 아무르 호랑이의 스캐폴드 서열 상에 정렬(align)한 후, SAMtools[Li, H. 등, Bioinformatics (2009), 25: 2078-2079](with default option)를 이용하여 동형접합(homozygous) 및 이형접합(heterozygous) SNVs 검색을 수행하였으며, 이러한 결과를 근거로 종 특이적 변이(mutation) 위치를 치환하는 방법을 통해 각각의 유전체 서열을 확보하였다.
5) 이종간 유전자 서열 비교 분석
상기에서와 같이 확보된 아무르(Amur, 시베리안) 호랑이, 벵갈 호랑이(백호랑이), 설표범, 아프리카 사자 및 백사자를 포함하는 총 5종의 개체들의 유전체 서열 정보를 근거로 하여 저산소증 적응과 관련된 것으로 알려진 EGLN1(Egl 나인 상동단백질 1) 유전자와 EPAS1(내피세포 PAS 도메인-함유 단백질 1) 유전자의 각 종별 유전자 서열을 검색한 후, 이들을 각각 아미노산 코돈 테이블에 의거하여 아미노산 서열로 전사(transcription)시켰다. 수득한 각 종별 EGLN1 또는 EPAS1 아미노산 서열들을 공지된 인간(human), 쥐(mouse), 랫트(rat), 두더지쥐(naked mole rat) 및 개(dog)의 TYR 또는 DCT 아미노산 서열들과 함께 ClustalW2(http://www.ebi.ac.uk/Tools/msa/clustalw2/) 프로그램을 사용한 다중 서열 정렬(multiple sequence alignment)을 통해 매칭(matching)시켜 비교분석을 수행하였다.
그 결과, 도 1 및 2에서 볼 수 있는 바와 같이, 설표범 및 두더지쥐 특이적인 아미노산 서열 변이 및 그 위치를 확인할 수 있었다. 구체적으로 살펴보면, 도 1에서 볼 수 있는 바와 같이, 고산지대에 서식하는 설표범의 EGLN1 아미노산 서열에서는 39번째 아미노산(서열번호 1에서는 38번째 아미노산)이 Met(비극성)인 반면 고산지대에 서식하지 않는 아무르 호랑이, 벵갈호랑이, 아프리카 사자, 백사자, 인간 및 개 등의 EGLN1에서는 대응되는 위치의 아미노산이 모두 Lys(양전하 하전)인 것을 확인하였으며, 도 2에서 볼 수 있는 바와 같이, 설표범의 EPAS1의 아미노산 서열에서는 663번째 및 794번째 아미노산이 각각 Ile 및 Arg인 반면 다른 종들의 EPAS1 서열에서는 대응되는 위치의 아미노산이 각각 Val 및 Cys인 것을 확인하였다. 한편, 땅속에 서식하며 설표범과 마찬가지로 저산소증 적응 형질을 갖는 두더지쥐의 경우에는 EGLN1 아미노산 서열에서의 39번째 아미노산이 Arg(양전하 하전)인 것을 확인하였는데, 이러한 Lys39Arg 변이는 두 아미노산 모두 단백질 구조적으로 양전하 하전된 곁사슬(side chain)을 제공하므로 EGLN1 단백질의 기능에 별다른 영향을 미치진 못할 것으로 판단되었으며, 대신에 두더지쥐 고유의 EGLN1 아미노산 서열에서의 Pro15, Arg 17 및 Arg36의 변이를 확인하였다.
결론적으로, 하기 표 2에 제세된 본 발명에 따른 저산소증 적응을 통해 고산지대에 서식하는 설표범 종 고유의 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1) 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이와 역시 저산소증 적응을 통해 땅속에 서식하는 두더지쥐 종 고유의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이는 저산소증 적응 형질에 특이적인 EGLN1 및 EPAS1 유전자의 단일염기변이(SNVs)에 대한 특이적인 마커로 활용될 수 있음을 알 수 있다.
단백질 | 변이위치 | 변이위치의 기준 종 | 변이 종류 |
EGLN1 | 39 | 설표범 | Lys -> Met |
EGLN1 | 15 | 두더지쥐 | Leu -> Pro |
EGLN1 | 17 | 두더지쥐 | Pro -> Arg |
EGLN1 | 36 | 두더지쥐 | Pro -> Arg |
EPAS1 | 663 | 설표범 | Val -> Ile |
EPAS1 | 794 | 설표범 | Cys -> Arg |
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
<110> Genome Research Foundation
THERAGEN ETEX CO., LTD
<120> Novel single nucleotide variation markers specific for hypoxia
adaptation
<130> NP12-1251
<160> 1
<170> KopatentIn 2.0
<210> 1
<211> 59
<212> PRT
<213> Snow leopard
<400> 1
Leu Arg Pro Asn Gly Gln Thr Lys Pro Leu Pro Ala Leu Lys Leu Ala
1 5 10 15
Leu Glu Tyr Ile Val Pro Cys Met Asn Lys His Gly Ile Cys Val Val
20 25 30
Asp Asp Phe Leu Gly Met Glu Thr Gly Gln Gln Ile Gly Asp Glu Val
35 40 45
Arg Ala Leu His Asp Thr Gly Lys Phe Thr Asp
50 55
Claims (1)
- 설표범의 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 아미노산 서열에서, 서열번호 1로 표시되는 아미노산 서열의 38번째 Lys이 Met로 치환된 Lys38Met 변이인 것을 특징으로 하는 저산소증 적응 형질에 특이적인 SNVs(single nucleotide variations) 마커.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20120113514A KR101480208B1 (ko) | 2012-10-12 | 2012-10-12 | 저산소증 적응 형질에 대한 신규 단일염기변이 마커 |
PCT/KR2012/009361 WO2014058094A1 (ko) | 2012-10-12 | 2012-11-08 | 저산소증 적응 형질에 대한 신규 단일염기변이 마커 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20120113514A KR101480208B1 (ko) | 2012-10-12 | 2012-10-12 | 저산소증 적응 형질에 대한 신규 단일염기변이 마커 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140049121A KR20140049121A (ko) | 2014-04-25 |
KR101480208B1 true KR101480208B1 (ko) | 2015-01-08 |
Family
ID=50477549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR20120113514A KR101480208B1 (ko) | 2012-10-12 | 2012-10-12 | 저산소증 적응 형질에 대한 신규 단일염기변이 마커 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR101480208B1 (ko) |
WO (1) | WO2014058094A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114606325B (zh) * | 2022-01-11 | 2024-03-15 | 佛山科学技术学院 | 与牛血小板生成相关的snp标记位点及其应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012076943A1 (en) * | 2010-12-09 | 2012-06-14 | Council Of Scientific & Industrial Research | Biomarker for detecting high-altitude adaptation and high-altitude pulmonary edema |
-
2012
- 2012-10-12 KR KR20120113514A patent/KR101480208B1/ko active IP Right Grant
- 2012-11-08 WO PCT/KR2012/009361 patent/WO2014058094A1/ko active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012076943A1 (en) * | 2010-12-09 | 2012-06-14 | Council Of Scientific & Industrial Research | Biomarker for detecting high-altitude adaptation and high-altitude pulmonary edema |
Non-Patent Citations (2)
Title |
---|
Blood Cells, Molecules, and Diseases. 2012.08.15, Volume 49, Issue 2, Pages 67-73. * |
Mol. Biol. Evol. 2011, Volume 28, No. 2, Pages 1075-1081. * |
Also Published As
Publication number | Publication date |
---|---|
WO2014058094A1 (ko) | 2014-04-17 |
KR20140049121A (ko) | 2014-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sulak et al. | TP53 copy number expansion is associated with the evolution of increased body size and an enhanced DNA damage response in elephants | |
CN107002289B (zh) | 用于定量评价dna-蛋白质复合物密度的组合物和方法 | |
Gehring et al. | Genomic analysis of parent-of-origin allelic expression in Arabidopsis thaliana seeds | |
Liu et al. | Global involvement of lysine crotonylation in protein modification and transcription regulation in rice | |
Vidotto et al. | Transcriptome sequencing and de novo annotation of the critically endangered Adriatic sturgeon | |
AU2012326971B2 (en) | Method for designing RNA binding protein utilizing PPR motif, and use thereof | |
Aeschlimann et al. | The draft assembly of the radically organized Stylonychia lemnae macronuclear genome | |
Chatterjee et al. | Mapping the zebrafish brain methylome using reduced representation bisulfite sequencing | |
Mitros et al. | A chromosome-scale genome assembly and dense genetic map for Xenopus tropicalis | |
Guo et al. | Profiling substrates of protein arginine N-methyltransferase 3 with S-adenosyl-L-methionine analogues | |
Prunier et al. | CNVs into the wild: screening the genomes of conifer trees (Picea spp.) reveals fewer gene copy number variations in hybrids and links to adaptation | |
Xiao et al. | Functional marker detection and analysis on a comprehensive transcriptome of large yellow croaker by next generation sequencing | |
US20120178635A1 (en) | Compositions and methods for identifying and detecting sites of translocation and dna fusion junctions | |
Sánchez et al. | Monitoring histone methylation (H3K9me3) changes in live cells | |
Keele et al. | Regulation of protein abundance in genetically diverse mouse populations | |
Zhao et al. | Functional analysis of the methyltransferase SMYD in the single-cell model organism Tetrahymena thermophila | |
Shi et al. | Construction of a high-density genetic linkage map and QTL mapping for growth-related traits in Takifugu bimaculatus | |
Liu et al. | Whole-genome analysis of structural variations between Xiang pigs with larger litter sizes and those with smaller litter sizes | |
Zhang et al. | Chromosome-scale assemblies of the male and female Populus euphratica genomes reveal the molecular basis of sex determination and sexual dimorphism | |
Li et al. | The first sheep graph-based pan-genome reveals the spectrum of structural variations and their effects on tail phenotypes | |
Lu et al. | Strain-specific copy number variation in the intelectin locus on the 129 mouse chromosome 1 | |
Xu et al. | Genomic, transcriptomic, and epigenomic analysis of a medicinal snake, Bungarus multicinctus, to provides insights into the origin of Elapidae neurotoxins | |
Faber-Hammond et al. | Pseudo-de novo assembly and analysis of unmapped genome sequence reads in wild zebrafish reveal novel gene content | |
KR101480208B1 (ko) | 저산소증 적응 형질에 대한 신규 단일염기변이 마커 | |
US20140303010A1 (en) | Methods and Compositions for Species-Specific Kinome Microarrays |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20171019 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20181025 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20191111 Year of fee payment: 6 |