KR101480208B1 - 저산소증 적응 형질에 대한 신규 단일염기변이 마커 - Google Patents

저산소증 적응 형질에 대한 신규 단일염기변이 마커 Download PDF

Info

Publication number
KR101480208B1
KR101480208B1 KR20120113514A KR20120113514A KR101480208B1 KR 101480208 B1 KR101480208 B1 KR 101480208B1 KR 20120113514 A KR20120113514 A KR 20120113514A KR 20120113514 A KR20120113514 A KR 20120113514A KR 101480208 B1 KR101480208 B1 KR 101480208B1
Authority
KR
South Korea
Prior art keywords
amino acid
egln1
hypoxia
species
acid sequence
Prior art date
Application number
KR20120113514A
Other languages
English (en)
Other versions
KR20140049121A (ko
Inventor
박종화
조윤성
김학민
조성웅
고준수
한정훈
송상훈
Original Assignee
재단법인 게놈연구재단
주식회사 테라젠이텍스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 재단법인 게놈연구재단, 주식회사 테라젠이텍스 filed Critical 재단법인 게놈연구재단
Priority to KR20120113514A priority Critical patent/KR101480208B1/ko
Priority to PCT/KR2012/009361 priority patent/WO2014058094A1/ko
Publication of KR20140049121A publication Critical patent/KR20140049121A/ko
Application granted granted Critical
Publication of KR101480208B1 publication Critical patent/KR101480208B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6806Determination of free amino acids
    • G01N33/6812Assays for specific amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Peptides Or Proteins (AREA)
  • Plant Pathology (AREA)

Abstract

본 발명은 저산소증 적응(adaptation to hypoxia) 형질에 대한 신규한 단일염기변이(single nucleotide variation, SNVs) 마커(marker)에 관한 것으로서, 구체적으로 여러 종(species)의 개체들을 대상으로 저산소증(hypoxia) 관련 단백질인 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 및 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1)의 아미노산 서열들에 대한 이종간 서열 비교분석(interspecific sequence comparison)을 수행하여 검색된 저산소증 적응을 통해 고산지대에 서식하는 설표범 종 고유의 EGLN1 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 EPAS1 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이와 역시 저산소증 적응을 통해 땅속에 서식하는 두더지쥐 종 고유의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이를 포함하는 저산소증 적응 형질에 특이적인 SNVs(single nucleotide variations) 마커에 관한 것이다. 본 발명에 따른 SNVs 마커는 동물의 저산소증 적응 형질과 관련된 유전 정보를 제공함으로써 저산소증(hypoxia) 관련 질환의 신규 표적 후보에 대한 치료제 개발 분야에서 뿐 아니라 동물 종의 환경 적응성과 관련된 진화 연구 등에 광범위하게 활용될 수 있다.

Description

저산소증 적응 형질에 대한 신규 단일염기변이 마커{Novel single nucleotide variation markers specific for hypoxia adaptation}
본 발명은 저산소증 적응(adaptation to hypoxia) 형질에 대한 신규한 단일염기변이(single nucleotide variation, SNVs) 마커(marker)에 관한 것으로서, 구체적으로 아무르(Amur, 시베리아) 호랑이, 벵갈 호랑이(백호랑이), 설표범, 아프리카 사자 및 백사자 등을 포함하는 여러 종(species)의 개체들을 대상으로 저산소증(hypoxia) 관련 단백질인 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 및 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1)의 아미노산 서열들에 대한 이종간 서열 비교분석(interspecific sequence comparison)을 수행하여 검색된 저산소증 적응 형질에 특이적인 신규 SNVs 마커에 관한 것이다.
다중 서열 정렬(multiple-sequence alignment) 분석을 통한 단일염기다형성(single nucleotide polymorphism, SNP) 또는 단일염기변이(single nucleotide variation, SNVs) 연구는 최근 활발히 이루어지고 있는 게놈 프로젝트의 발전과 함께 형질 또는 기능과 유전자 간의 연관 관계를 밝히는데 널리 활용되고 있다.
이러한 서열의 비교 분석을 통한 형질-유전자 연관성에 대한 연구는 주로 동종 내 여러 개체간 관련 유전자의 서열비교 등을 통한 질병이나 형질 관련 SNP 또는 SNVs 마커 개발 분야에서 활발히 이루어지고 있으며, 예를 들면 미국 특허공개 제2010/0303813호에는 항-TNF 반응성에 대한 EGLN2(Egl nine homolog 2) 유전자의 SNP가 제시되어 있고; 문헌 [Andersen J.D 등, Forensic science international. Genetics (2011), e153-e154]에는 덴마크인의 피부색과 관련된 SLC45A2, SLC24A5 및 TYR 유전자의 특정 SNP가 제시되어 있으며; 대한민국 특허공개 제2011-0129783호에는 유방암 발병과 연관된 CDK7(CDK-activating kinase 7) 및 ESR1(estrogen receptor 1) 유전자의 SNP가 제시되어 있다.
최근에는 진화적으로 더 뚜렷한 형질 차이를 나타내는 이종간의 서열 비교 분석을 통해 특정 종에 특이적인 유전자-형질 관련 마커에 대한 연구가 이루어지고 있으며, 예를 들면 문헌 [Kim, E. B. 등, Nature (2011), 479: 223-227]에는 두더지쥐(naked mole rat)의 드 노보 어셈블리(de novo assembly) 서열을 이용하여 두더지쥐, 인간, 쥐, 침팬지, 소 등의 이종간 서열 비교 분석을 통해 검색된 두더지쥐 특이적인 체온조절(thermoregulation) 관련 UCP1(uncoupling protein 1) 유전자의 SNVs가 제시되어 있다.
한편, 고산지대에 거주하는 티베트 인종과 고산지대가 아닌 같은 인종 출신의 한족간의 유전학적 연관성 연구(genetic association study)를 통해, EGLN1(Egl nine homolog 1) 유전자와 EPAS1(endothelial PAS domain-containing protein 1) 유전자가 고지대 적응과 관련 있다는 것이 밝혀졌다[Xu, S. 등, Mol. Biol. Evol. (2011), 28: 1003-1011]. 특히, Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1)은 PHD2(prolyl hydroxylase domain-containing protein 2) 또는 HIF-PH2(hypoxia-inducible factor prolyl hydroxylase 2)으로도 알려진 효소로서, 여러 유전체 관련 연구들을 통해 고산지대 적응에 중요한 역할을 하는 티베트 인종에서 특징적인 낮은 적혈구용적율(hematocrit) 형질과 관련이 있는 것이 제시되어 있으며[Simonson TS 등, Science (2010), 329(5987): 72-75], 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1)의 경우 이합체(dimer)를 이루어 저산소증(hypoxia)에 의해 유도되는 유전자들에 대한 전사인자로서 작용하며 배아의 심장 발달 등에 관여하는 것으로 알려져 있다[Tian H 등, Genes Dev (1997), 11(1): 72].
이에 본 발명자들은 동물의 저산소증 적응 형질 관련 SNVs 마커를 검색하기 위해 아무르 호랑이, 벵갈 호랑이(백호랑이), 설표범, 아프리카 사자 및 백사자를 포함하는 여러 서로 다른 종(species)의 유전체 서열들을 대상으로 저산소증 관련 단백질인 EGLN1 및 EPAS1의 아미노산 서열에 대한 이종간 서열 비교분석(interspecific sequence comparison)을 통해 예의 연구한 결과, 저산소증 적응을 통해 고산지대에 서식하는 설표범 종 고유의 EGLN1 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 EPAS1 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이와 역시 저산소증 적응을 통해 땅속에 서식하는 두더지쥐 종 고유의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이가 저산소증 적응 형질에 특이적인 SNVs 마커임을 발견하여 본 발명을 완성하였다.
따라서 본 발명의 목적은 동물의 저산소증 적응 형질과 관련된 신규 SNVs 마커를 제공하는 것이다.
상기 목적을 달성하기 위하여, 본 발명은 설표범의 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 설표범이 아닌 다른 종(species)의 EGLN1 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 동일 변이; 두더지쥐의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이, 및 두더지쥐가 아닌 다른 종의 EGLN1 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 동일 변이; 및 설표범의 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1) 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이, 및 설표범이 아닌 다른 종(species)의 EPAS1 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 동일 변이를 포함하는 군으로부터 하나 이상 선택된 저산소증 적응 형질에 특이적인 SNVs(single nucleotide variations) 마커를 제공한다.
본 발명에 따른 저산소증 적응을 통해 고산지대에 서식하는 설표범 종 고유의 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1) 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이와 역시 저산소증 적응을 통해 땅속에 서식하는 두더지쥐 종 고유의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이를 포함하는 저산소증 적응 형질에 특이적인 SNVs(single nucleotide variations) 마커는 동물의 저산소증 적응 형질과 관련된 유전 정보를 제공함으로써 저산소증(hypoxia) 관련 질환의 신규 표적 후보에 대한 치료제 개발 분야에서 뿐 아니라 동물 종의 환경 적응성과 관련된 진화 연구 등에 광범위하게 활용될 수 있다.
도 1은 본 발명의 일실시예에 따라 아무르 호랑이(Amur tiger), 벵갈 호랑이(White tiger), 설표범(Snow leopard), 아프리카 사자(African lion) 및 백사자(White lion)를 포함하는 총 5종의 개체들 과 유전체 서열이 공지된 인간(Human), 쥐(Mouse), 랫트(Rat), 두더지쥐(Naked mole rat) 및 개(Dog)의 각 종별 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1)의 아미노산 서열들을 다중 서열 정렬(multiple sequence alignment)을 통해 비교 분석한 결과이다.
도 2는 본 발명의 일실시예에 따라 아무르 호랑이(Amur tiger), 벵갈 호랑이(White tiger), 설표범(Snow leopard), 아프리카 사자(African lion) 및 백사자(White lion)를 포함하는 총 5종의 개체들의 각 종별 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1)의 아미노산 서열들을 다중 서열 정렬을 통해 비교 분석한 결과이다.
이하, 본 발명을 상세히 설명한다.
본 명세서에 기재된 용어 "(아미노산 약자)(숫자)"는 해당 단백질의 아미노산 서열에서 (숫자)번째 아미노산이 (아미노산 약자)의 아미노산인 것을 의미하며, 예를 들면 "Met39"는 해당 단백질의 아미노산 서열에서의 39번째 아미노산이 메티오닌(methionine)인 것을 의미한다.
본 명세서에 기재된 용어 "(아미노산 약자)(숫자)(아미노산 약자)"는 해당 단백질의 아미노산 서열에서 (숫자)번째 아미노산이 (숫자)의 왼쪽 (아미노산 약자)의 아미노산에서 숫자의 오른쪽 (아미노산 약자)의 아미노산으로 치환된 변이를 의미하며, 예를 들면 "Lys39Met"은 아미노산 서열의 39번째 아미노산이 라이신(lysine)에서 메티오닌(methionine)으로 치환된 변이를 의미한다.
본 명세서에 기재된 용어 "대응되는 위치"는 서로 다른 종(species) 간의 해당 단백질의 아미노산 서열들을 통상적인 다중 서열 정렬(multiple sequence alignment)을 통해 매칭(matching)시켰을 때 서로 짝이 되는 위치를 의미한다.
본 명세서에 기재된 용어 "동일 변이"는 아미노산 서열에서의 변이로서 치환되기 전 아미노산이 서로 동일하고 치환된 후의 아미노산이 서로 동일한 것을 의미하며, 예를 들면 백사자 타이로시나제(tyrosinase, TYR) 아미노산 서열에서의 Arg87Gln 변이와의 "동일 변이"는 백사자가 아닌 다른 종의 TYR 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 아르기닌(Arginine)이 글루타민(glutamine)으로 치환된 변이를 의미한다.
본 발명의 일실시예에 따르면, 유전체 서열이 공지되지 않은 아무르(Amur, 시베리안) 호랑이, 벵갈 호랑이(백호랑이), 설표범, 아프리카 사자 및 백사자를 포함하는 총 5종의 개체들의 유전체 서열 정보는 통상적인 차세대 서열분석(next-generation sequencing, NGS) 방법에 따라 확보할 수 있었으며, 구체적으로 아무르 호랑이의 조직으로부터 수득한 유전체 라이브러리 서열 정보를 대상으로 통상적인 드 노보 어셈블리(de novo assembly) 분석 방법에 따라 스캐폴드 서열(scaffold sequence) 정보를 이용한 유전자 세트(gene set) 예측을 수행하여 아무르 호랑이의 유전체 서열 정보를 확보한 후, 아무르(Amur, 시베리안) 호랑이를 제외한 나머지 4종의 개체들, 즉 벵갈 호랑이, 설표범, 아프리카 사자 및 백사자의 조직 시료로부터 수득한 유전체 라이브러리 서열들을 각각 아무르 호랑이의 스캐폴드 서열 상에 정렬(align)하여 종 특이적 변이(mutation) 위치를 치환하는 방법을 통해 각각의 유전체 서열을 확보할 수 있었다.
본 발명의 일실시예에 따르면, 저산소증 적응 형질에 특이적인 SNVs 검색을 위해 이종간 서열 비교 분석을 수행하였으며, 구체적으로 상기에서와 같이 확보된 아무르(Amur, 시베리안) 호랑이, 벵갈 호랑이(백호랑이), 설표범, 아프리카 사자 및 백사자를 포함하는 총 5종의 개체들의 유전체 서열 정보를 근거로 하여 저산소증 적응에 관련된 것으로 알려진 EGLN1(Egl 나인 상동단백질 1) 유전자와 EPAS1(내피세포 PAS 도메인-함유 단백질 1) 유전자의 각 종별 유전자 서열을 아미노산 서열로 전사(transcription)시켜 각 종별 EGLN1 또는 EPAS1 아미노산 서열들을 수득하였으며, 이들을 공지된 인간(human), 쥐(mouse), 랫트(rat), 두더지쥐(naked mole rat) 및 개(dog)의 각 종별 EGLN1 또는 EPAS1 아미노산 서열들과 함께 통상적인 다중 서열 정렬(multiple sequence alignment) 방법을 통해 매칭(matching)시켜 비교분석하였다.
그 결과, 고산지대에 서식하는 설표범의 EGLN1 아미노산 서열에서는 39번째 아미노산이 Met(비극성)인 반면 고산지대에 서식하지 않는 아무르 호랑이, 벵갈호랑이, 아프리카 사자, 백사자, 인간 및 개 등의 EGLN1 아미노산 서열에서는 대응되는 위치의 아미노산이 모두 Lys(양전하 하전)인 것을 확인하였으며, 설표범의 EPAS1의 아미노산 서열에서는 663번째 및 794번째 아미노산이 각각 Ile 및 Arg인 반면 다른 종들의 EPAS1 서열에서는 대응되는 위치의 아미노산이 모두 각각 Val 및 Cys인 것을 확인하였다.
한편, 땅속에 서식하며 설표범과 마찬가지로 저산소증 적응 형질을 갖는 두더지쥐의 경우에는 EGLN1 아미노산 서열의 39번째 아미노산이 Arg(양전하 하전)인 것을 확인하였는데, 이러한 Lys39Arg 변이는 두 아미노산 모두 단백질 구조적으로 양전하 하전된 곁사슬(side chain)을 제공하므로 EGLN1의 기능에 별다른 영향을 미치진 못할 것으로 판단되었으며, 대신에 두더지쥐 고유의 EGLN1 아미노산 서열에서의 Pro15, Arg 17 및 Arg36의 변이를 확인하였다.
따라서, 본 발명에 따른 저산소증 적응을 통해 고산지대에 서식하는 설표범 종 고유의 EGLN1 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 EPAS1 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이와 역시 저산소증 적응을 통해 땅속에 서식하는 두더지쥐 종 고유의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이를 포함하는 저산소증 적응 형질에 특이적인 SNVs(single nucleotide variations) 마커는 저산소증 적응 형질에 특이적인 EGLN1EPAS1 유전자의 단일염기변이(SNVs)에 대한 특이적인 마커로 활용될 수 있음을 알 수 있다.
또한, 본 발명에서는 설표범 또는 두더지쥐가 아닌 다른 다른 종(species)의 EGLN1 단백질 또는 EPAS1 단백질의 아미노산 서열에서도 상기 변이들과 대응되는 위치에서의 동일 변이들의 경우 역시 동일하게 저산소증 적응 형질에 특이적인 EGLN1EPAS1 유전자의 단일염기변이(SNVs)에 대한 특이적인 마커로 활용될 수 있으므로 이들 변이를 발명 범위에 포함할 수 있다.
따라서, 본 발명은 설표범의 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 설표범이 아닌 다른 종(species)의 EGLN1 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 동일 변이; 두더지쥐의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이, 및 두더지쥐가 아닌 다른 종의 EGLN1 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 동일 변이; 및 설표범의 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1) 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이, 및 설표범이 아닌 다른 종(species)의 EPAS1 단백질의 아미노산 서열에서 상기 변이와 대응되는 위치에서의 동일 변이를 포함하는 군으로부터 하나 이상 선택된 저산소증 적응 형질에 특이적인 SNVs(single nucleotide variations) 마커를 제공한다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지는 않는 것은 당 업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예 : 저산소증 적응 형질에 특이적인 SNVs 마커의 검색
1) 동물 조직 시료
이종간 서열 비교를 위해 사용된 하기 표 1에 나타낸 아무르(Amur, 시베리안) 호랑이, 벵갈 호랑이(백호랑이), 설표범, 아프리카 사자 및 백사자의 조직을 수득하였다. 구체적으로, 아무르 호랑이, 벵갈 백호랑이, 아프리카 사자 및 아프리카 백사자의 조직 시료는 대한민국 에버랜드 동물원으로부터 제공받았으며, 설표범의 조직 시료는 CITES 허가 하에 몽고로부터 수입된 원 조직 시료(original tissue sample; 몽고 수출 허가번호 제0390호, 대한민국 수입 허가 번호 제ES2012-02507호)를 보관하고 있는 서울대학교 수의과대학 야생동물유전자원은행으로부터 제공받았다.
동물 종 동물명 출생 암수 출신
아무르 호랑이 태극 2003. 04. 01 수컷 러시아 원 동부
뱅갈 백호랑이 화랑 1999. 06. 18 암컷 벵갈
아프리카 사자 선돌 2007. 06. 22 수컷 사하라 이남
백사자 스노우걸 2005. 01. 18 암컷 사하라 이남
설표범 N/A N/A 암컷 서 몽고
2) 이종간 유전자 서열 비교를 위한 유전체(genome, 게놈) 서열 확보
이종간 유전자 서열 비교를 위해, 유전체(genome) 서열이 공지되어 있는 인간(human), 쥐(mouse), 랫트(rat), 두더지쥐(naked mole rat) 및 개(dog)의 단백질 서열에 대한 정보는 UniProt의 데이타베이스(database)로부터 제공받았다[Kim, E. B. 등, Nature (2011), 479: 223-227; UniProt, Nucleic Acids Res. (2012), 40: D71-75]. 한편, 유전체 서열이 공지되지 않은 아무르(Amur, 시베리안) 호랑이, 벵갈 호랑이, 설표범, 아프리카 사자 및 백사자를 포함하는 총 5종의 개체들의 경우에는 하기와 같이 유전체 서열 정보를 확보하였다.
3) 아무르(Amur, 시베리안) 호랑이의 유전체 서열 확보
아무르 호랑이의 유전체 서열 정보를 수득하기 위해, 통상적인 드 노보 어셈블리(de novo assembly) 분석 방법에 따라 다음과 같이 스캐폴드 서열(scaffold sequence)을 통한 유전자 세트(gene set) 예측을 수행하였다.
우선 아무르 호랑이의 유전체 서열 정보를 확보하기 위해, 통상적인 차세대 서열분석(next-generation sequencing, NGS) 방법에 따라 Illumina HiSeq 2000(제조사: Illumina)을 이용하여 3개의 각 170 bp(base pairs), 500 bp 및 800 bp 길이의 짧은 삽입 페어-엔드 라이브러리(short insert paired-end libraries) 및 4개의 각 2 Kb(kilo bp), 5 Kb, 10 Kb 및 20 Kb 길이의 긴 삽입 메이트-페어 라이브러리(long insert mate-pair libraries)로 구성된 27개의 레인(lane)으로부터 총 288.20 Gb(giga bp)의 유전체 라이브러리를 수득하여 판독하였으며, 이때 평균 판독 길이(read length)는 76.62 bp이었다. 이를 근거로 통상적인 방법[Bairoch, A. 등, Nucleic Acids Res. (2000), 28: 45-48]에 따라 유전체 (스캐폴드) 어셈블리 소프트웨어(genome (scaffold) assembly software, SOAPdenovo)를 사용하여 아무르 호랑이 유전체에 대한 총 2.4 Gb 길이의 스캐폴드(scaffold) 서열 정보를 수득하였으며, 이때 스캐폴드의 N50 값은 8.8 Mb(mega bp)였다. 수득한 스캐폴드 서열을 근거로 통상적인 순이론 예측(ab initio prediction), 상동성-기반 예측(homology-based prediction) 및 cDNA/EST-기반 예측(cDNA/EST-based prediction) 방법에 따라 GLEAN[Elsik, C. G. 등, Genome Biol. (2007), 8, R13]이라는 프로그램을 사용하여 다음과 같이 유전자 예측을 수행하여 아무르 호랑이의 유전자 세트를 확보하였다.
i) 순이론 예측(ab initio prediction): HMM(hidden Markov model) 기반의 반복구역 마스킹 유전체 서열(repeat masked genome) 상에서 신규 예측(de novo prediction)을 수행하였으며, 이때 예측 프로그램으로는 AUGUSTUS(version 2.5.5)[Stanke, M. 등, Nucleic Acids Res. (2006), 34: W435-439] 및 GENSCAN(version 1.0)[Burge, C. 등, J. Mol. Biol. (1997), 268: 78-94]을 사용하였다.
ii) 상동성-기반 예측(homology-based prediction): 서로 다른 종들의 상동 단백질 서열들(from Ensembl 60 release)을 TblastN (Blast 2.2.23)[Altschul, S. F. 등, J. Mol. Biol. (1990), 215: 403-410](with an E-value cutoff 1E-5)을 사용하여 유전체 서열상에 맵핑(mapping)하였다. 정렬된 서열(aligned sequence) 및 그 특정 단백질(query protein)을 걸러낸 후 GeneWise(version 2.2.0)[Birney, E. 등, Genome Res. (2004), 14: 988-995]를 사용한 검색을 통해 정밀한 스플라이스 서열정렬(accurate spliced alignments) 분석을 수행하였다.
iii) cDNA/EST-기반 예측(cDNA/EST-based prediction): 고양이 EST 및 전장(full length) cDNA(from UCSC)를 BLAT[Kent, W. J., Genome Res. (2002), 12: 656-664](blat-34, identity≥0.90, coverage≥0.90)을 통해 유전체 서열상에 정렬하여 스플라이스 서열정렬 분석을 수행하였으며, EST 결과에 대해서는 PASA[Haas, B. J. 등, Nucleic Acids Res. (2003), 31: 5654-5666]를 사용한 오버랩(overlap) 방법에 따라 스플라이스 서열정렬을 수행하였다.
4) 벵갈 호랑이, 백호랑이, 설표범, 아프리카 사자 및 백사자의 유전체 서열 확보
상기 아무르(Amur, 시베리안) 호랑이를 제외한 나머지 4종의 개체들, 즉 벵갈 호랑이, 설표범, 아프리카 사자 및 백사자를 대상으로 통상적인 차세대 서열분석(next-generation sequencing, NGS) 방법에 따라 Illumina HiSeq2000를 사용하여 유전체(genome) 서열분석을 수행하여 평균 71.5 Gb 길이의 유전체 라이브러리 서열을 수득하였다. 이들의 짧은 판독 서열(short read)들을 BWA[Li, H. 등, Bioinformatics (2009), 25: 1754-1760] 프로그램을 사용하여 각각 아무르 호랑이의 스캐폴드 서열 상에 정렬(align)한 후, SAMtools[Li, H. 등, Bioinformatics (2009), 25: 2078-2079](with default option)를 이용하여 동형접합(homozygous) 및 이형접합(heterozygous) SNVs 검색을 수행하였으며, 이러한 결과를 근거로 종 특이적 변이(mutation) 위치를 치환하는 방법을 통해 각각의 유전체 서열을 확보하였다.
5) 이종간 유전자 서열 비교 분석
상기에서와 같이 확보된 아무르(Amur, 시베리안) 호랑이, 벵갈 호랑이(백호랑이), 설표범, 아프리카 사자 및 백사자를 포함하는 총 5종의 개체들의 유전체 서열 정보를 근거로 하여 저산소증 적응과 관련된 것으로 알려진 EGLN1(Egl 나인 상동단백질 1) 유전자와 EPAS1(내피세포 PAS 도메인-함유 단백질 1) 유전자의 각 종별 유전자 서열을 검색한 후, 이들을 각각 아미노산 코돈 테이블에 의거하여 아미노산 서열로 전사(transcription)시켰다. 수득한 각 종별 EGLN1 또는 EPAS1 아미노산 서열들을 공지된 인간(human), 쥐(mouse), 랫트(rat), 두더지쥐(naked mole rat) 및 개(dog)의 TYR 또는 DCT 아미노산 서열들과 함께 ClustalW2(http://www.ebi.ac.uk/Tools/msa/clustalw2/) 프로그램을 사용한 다중 서열 정렬(multiple sequence alignment)을 통해 매칭(matching)시켜 비교분석을 수행하였다.
그 결과, 도 1 및 2에서 볼 수 있는 바와 같이, 설표범 및 두더지쥐 특이적인 아미노산 서열 변이 및 그 위치를 확인할 수 있었다. 구체적으로 살펴보면, 도 1에서 볼 수 있는 바와 같이, 고산지대에 서식하는 설표범의 EGLN1 아미노산 서열에서는 39번째 아미노산(서열번호 1에서는 38번째 아미노산)이 Met(비극성)인 반면 고산지대에 서식하지 않는 아무르 호랑이, 벵갈호랑이, 아프리카 사자, 백사자, 인간 및 개 등의 EGLN1에서는 대응되는 위치의 아미노산이 모두 Lys(양전하 하전)인 것을 확인하였으며, 도 2에서 볼 수 있는 바와 같이, 설표범의 EPAS1의 아미노산 서열에서는 663번째 및 794번째 아미노산이 각각 Ile 및 Arg인 반면 다른 종들의 EPAS1 서열에서는 대응되는 위치의 아미노산이 각각 Val 및 Cys인 것을 확인하였다. 한편, 땅속에 서식하며 설표범과 마찬가지로 저산소증 적응 형질을 갖는 두더지쥐의 경우에는 EGLN1 아미노산 서열에서의 39번째 아미노산이 Arg(양전하 하전)인 것을 확인하였는데, 이러한 Lys39Arg 변이는 두 아미노산 모두 단백질 구조적으로 양전하 하전된 곁사슬(side chain)을 제공하므로 EGLN1 단백질의 기능에 별다른 영향을 미치진 못할 것으로 판단되었으며, 대신에 두더지쥐 고유의 EGLN1 아미노산 서열에서의 Pro15, Arg 17 및 Arg36의 변이를 확인하였다.
결론적으로, 하기 표 2에 제세된 본 발명에 따른 저산소증 적응을 통해 고산지대에 서식하는 설표범 종 고유의 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 아미노산 서열에서의 Lys39Met 변이(서열번호 1에서는 Lys38Met 변이) 및 내피세포 PAS 도메인-함유 단백질 1(endothelial PAS domain-containing protein 1, EPAS1) 아미노산 서열에서의 Val663Ile 및 Cys794Arg 변이와 역시 저산소증 적응을 통해 땅속에 서식하는 두더지쥐 종 고유의 EGLN1 아미노산 서열에서의 Leu15Pro, Pro17Arg 및 Pro36Arg 변이는 저산소증 적응 형질에 특이적인 EGLN1EPAS1 유전자의 단일염기변이(SNVs)에 대한 특이적인 마커로 활용될 수 있음을 알 수 있다.
단백질 변이위치 변이위치의 기준 종 변이 종류
EGLN1 39 설표범 Lys -> Met
EGLN1 15 두더지쥐 Leu -> Pro
EGLN1 17 두더지쥐 Pro -> Arg
EGLN1 36 두더지쥐 Pro -> Arg
EPAS1 663 설표범 Val -> Ile
EPAS1 794 설표범 Cys -> Arg
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
<110> Genome Research Foundation THERAGEN ETEX CO., LTD <120> Novel single nucleotide variation markers specific for hypoxia adaptation <130> NP12-1251 <160> 1 <170> KopatentIn 2.0 <210> 1 <211> 59 <212> PRT <213> Snow leopard <400> 1 Leu Arg Pro Asn Gly Gln Thr Lys Pro Leu Pro Ala Leu Lys Leu Ala 1 5 10 15 Leu Glu Tyr Ile Val Pro Cys Met Asn Lys His Gly Ile Cys Val Val 20 25 30 Asp Asp Phe Leu Gly Met Glu Thr Gly Gln Gln Ile Gly Asp Glu Val 35 40 45 Arg Ala Leu His Asp Thr Gly Lys Phe Thr Asp 50 55

Claims (1)

  1. 설표범의 Egl 나인 상동단백질 1(Egl nine homolog 1, EGLN1) 아미노산 서열에서, 서열번호 1로 표시되는 아미노산 서열의 38번째 Lys이 Met로 치환된 Lys38Met 변이인 것을 특징으로 하는 저산소증 적응 형질에 특이적인 SNVs(single nucleotide variations) 마커.
KR20120113514A 2012-10-12 2012-10-12 저산소증 적응 형질에 대한 신규 단일염기변이 마커 KR101480208B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR20120113514A KR101480208B1 (ko) 2012-10-12 2012-10-12 저산소증 적응 형질에 대한 신규 단일염기변이 마커
PCT/KR2012/009361 WO2014058094A1 (ko) 2012-10-12 2012-11-08 저산소증 적응 형질에 대한 신규 단일염기변이 마커

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20120113514A KR101480208B1 (ko) 2012-10-12 2012-10-12 저산소증 적응 형질에 대한 신규 단일염기변이 마커

Publications (2)

Publication Number Publication Date
KR20140049121A KR20140049121A (ko) 2014-04-25
KR101480208B1 true KR101480208B1 (ko) 2015-01-08

Family

ID=50477549

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20120113514A KR101480208B1 (ko) 2012-10-12 2012-10-12 저산소증 적응 형질에 대한 신규 단일염기변이 마커

Country Status (2)

Country Link
KR (1) KR101480208B1 (ko)
WO (1) WO2014058094A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114606325B (zh) * 2022-01-11 2024-03-15 佛山科学技术学院 与牛血小板生成相关的snp标记位点及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012076943A1 (en) * 2010-12-09 2012-06-14 Council Of Scientific & Industrial Research Biomarker for detecting high-altitude adaptation and high-altitude pulmonary edema

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012076943A1 (en) * 2010-12-09 2012-06-14 Council Of Scientific & Industrial Research Biomarker for detecting high-altitude adaptation and high-altitude pulmonary edema

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Blood Cells, Molecules, and Diseases. 2012.08.15, Volume 49, Issue 2, Pages 67-73. *
Mol. Biol. Evol. 2011, Volume 28, No. 2, Pages 1075-1081. *

Also Published As

Publication number Publication date
WO2014058094A1 (ko) 2014-04-17
KR20140049121A (ko) 2014-04-25

Similar Documents

Publication Publication Date Title
Sulak et al. TP53 copy number expansion is associated with the evolution of increased body size and an enhanced DNA damage response in elephants
CN107002289B (zh) 用于定量评价dna-蛋白质复合物密度的组合物和方法
Gehring et al. Genomic analysis of parent-of-origin allelic expression in Arabidopsis thaliana seeds
Liu et al. Global involvement of lysine crotonylation in protein modification and transcription regulation in rice
Vidotto et al. Transcriptome sequencing and de novo annotation of the critically endangered Adriatic sturgeon
AU2012326971B2 (en) Method for designing RNA binding protein utilizing PPR motif, and use thereof
Aeschlimann et al. The draft assembly of the radically organized Stylonychia lemnae macronuclear genome
Chatterjee et al. Mapping the zebrafish brain methylome using reduced representation bisulfite sequencing
Mitros et al. A chromosome-scale genome assembly and dense genetic map for Xenopus tropicalis
Guo et al. Profiling substrates of protein arginine N-methyltransferase 3 with S-adenosyl-L-methionine analogues
Prunier et al. CNVs into the wild: screening the genomes of conifer trees (Picea spp.) reveals fewer gene copy number variations in hybrids and links to adaptation
Xiao et al. Functional marker detection and analysis on a comprehensive transcriptome of large yellow croaker by next generation sequencing
US20120178635A1 (en) Compositions and methods for identifying and detecting sites of translocation and dna fusion junctions
Sánchez et al. Monitoring histone methylation (H3K9me3) changes in live cells
Keele et al. Regulation of protein abundance in genetically diverse mouse populations
Zhao et al. Functional analysis of the methyltransferase SMYD in the single-cell model organism Tetrahymena thermophila
Shi et al. Construction of a high-density genetic linkage map and QTL mapping for growth-related traits in Takifugu bimaculatus
Liu et al. Whole-genome analysis of structural variations between Xiang pigs with larger litter sizes and those with smaller litter sizes
Zhang et al. Chromosome-scale assemblies of the male and female Populus euphratica genomes reveal the molecular basis of sex determination and sexual dimorphism
Li et al. The first sheep graph-based pan-genome reveals the spectrum of structural variations and their effects on tail phenotypes
Lu et al. Strain-specific copy number variation in the intelectin locus on the 129 mouse chromosome 1
Xu et al. Genomic, transcriptomic, and epigenomic analysis of a medicinal snake, Bungarus multicinctus, to provides insights into the origin of Elapidae neurotoxins
Faber-Hammond et al. Pseudo-de novo assembly and analysis of unmapped genome sequence reads in wild zebrafish reveal novel gene content
KR101480208B1 (ko) 저산소증 적응 형질에 대한 신규 단일염기변이 마커
US20140303010A1 (en) Methods and Compositions for Species-Specific Kinome Microarrays

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171019

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20181025

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20191111

Year of fee payment: 6