KR101568352B1 - 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법 및 이를 이용한 우수한 경주마 선발방법 - Google Patents

경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법 및 이를 이용한 우수한 경주마 선발방법 Download PDF

Info

Publication number
KR101568352B1
KR101568352B1 KR1020130168153A KR20130168153A KR101568352B1 KR 101568352 B1 KR101568352 B1 KR 101568352B1 KR 1020130168153 A KR1020130168153 A KR 1020130168153A KR 20130168153 A KR20130168153 A KR 20130168153A KR 101568352 B1 KR101568352 B1 KR 101568352B1
Authority
KR
South Korea
Prior art keywords
biec2
snps
value
regression model
genotype
Prior art date
Application number
KR1020130168153A
Other languages
English (en)
Other versions
KR20150078620A (ko
Inventor
이진우
김희발
신동현
Original Assignee
한국마사회
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국마사회 filed Critical 한국마사회
Priority to KR1020130168153A priority Critical patent/KR101568352B1/ko
Publication of KR20150078620A publication Critical patent/KR20150078620A/ko
Application granted granted Critical
Publication of KR101568352B1 publication Critical patent/KR101568352B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/124Animal traits, i.e. production traits, including athletic performance or the like
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법 및 이를 이용한 우수한 경주마 선발방법에 관한 것으로, 보다 상세하게는 말의 SNP chip을 통해 확인된 SNPs의 유전자형과 주파기록(racing time)의 추정육종가(estimated breeding value, EBV)를 비교하는 유전체 연관분석(Genome wide association studies, GWAS)을 통해 말의 경주능력과 관련된 SNPs를 선발하고, 상기 선발된 SNPs 중 다수가 근육 조성과 관련된 유전자 내에 위치하고 있음을 확인하였다. 이를 이용하여 경주마 선발을 위한 회귀모형을 개발함으로써, 표현형에만 의존하던 고전적인 경주마 선발방법에서 벗어나, 분자 유전학적 기술을 바탕으로 경주능력이 우수한 말을 조기에 선발할 수 있는 기반을 제공하고자 한다.
본 발명에 의한 경주능력 관련 유전체 육종가 예측 회귀모형 및 이를 통한 경주마 선발방법은, 근육 조성과 관련된 SNPs를 이용해 구축된 회귀모형으로 유전체 육종가를 산출할 수 있으며, 유전체 육종가를 추정육종가와 함께 사용시 선발의 정확도를 높일 수 있다. 따라서, 본 발명에 의한 유전체 육종가 예측 회귀모형을 이용함으로써, 매년 20~40억원의 씨수말을 수입하는데 있어서 후보 씨수말을 평가하는데 유용하게 활용될 수 있고, 특히 유전자정보를 이용하여 평가하기 때문에 생산실적이 없는 검증되지 않은 씨수말의 도입 시, 성공가능성을 증대시킬 수 있어 경주마 개량에 기여할 수 있는 효과가 있다.

Description

경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법 및 이를 이용한 우수한 경주마 선발방법{METHOD FOR PREDICTING GENOMIC BREEDING VALUE OF RACEHORCE USING REGRESSION MODEL ASSOCIATED WITH RACING PERFORMACE AND METHOD FOR SELECTING EXCELLENT RACEHORCE USING THE SAME}
본 발명은 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법 및 이를 이용한 우수한 경주마 선발방법에 관한 것으로, 보다 상세하게는 말의 SNP chip을 통해 확인된 SNPs의 유전자형과 주파기록(racing time)의 추정육종가(estimated breeding value, EBV)를 비교하는 유전체 연관분석(Genome wide association studies, GWAS)을 통해 말의 경주능력과 관련된 SNPs를 선발하고, 상기 선발된 SNPs 중 다수가 근육 조성과 관련된 유전자 내에 위치하고 있음을 확인하였다. 이를 이용하여 경주마 선발을 위한 회귀모형을 개발함으로써, 표현형에만 의존하던 고전적인 경주마 선발방법에서 벗어나, 분자 유전학적 기술을 바탕으로 경주능력이 우수한 말을 조기에 선발할 수 있는 기반을 제공하고자 한다.
야생마는 주로 초원에 서식하는 초식동물로써, 서부 유라시아 초원의 건조한 환경에 잘 적응되어 있다. 또한 이들을 조련 및 사육함으로써 인간사회에서 전쟁, 수송 및 통신 능력은 크게 향상되었으며, 이들보다 인간 사회에 영향을 주는 종은 많지 않다.
경주마로 알려진 서러브레드(Thoroughbred)는 17세기 말에서 18세기 초 사이에 중동과 북 아프리카로부터 영국으로 수입되어 만들어진 품종으로써, 체질과 체형이 모두 뛰어나고 기품이 있는 종으로 우수한 골격근 및 높은 유산소 능력을 가지고 있다. 오랫동안 소수의 숫말에 대해서만 강력한 선발을 해왔음에도 서러브레드의 경주능력에 대한 유전적 잠재력은 아직도 매우 높은데, 지난 몇 십년 동안 유전적 개량의 량은 둔화 되어 새로운 개량기술에 대한 개발의 필요성이 제기되고 있다. 이를 위해, 최근 분자유전학적 기술의 발달로 특정 형질과 관련된 유전적 마커(marker)를 이용하여 DNA 분자 수준에서 유전자의 구조와 기능의 해석을 통해 양적 또는 질적 형질에 영향을 미치는 SNP를 발굴하고 이러한 SNP를 이용하여 효율적인 인위선발이 가능하게 되었다.
동물 육종에 관하여 유전학 연구의 핵심 분야는 DNA 염기서열변이(Single nucleotide polymorphism, SNP)와 표현형(phenotype, 유전자의 작용과 환경에 의해 외부로 나타나는 성질을 뜻함)의 관련성이다. 여기서 말하는 DNA 염기서열 변이는 염색체 단일부위에서 여러 가지 DNA 염기들 중 하나에 나타나는 일반적인 변이로, 최근 개체 내의 SNP를 발굴하고 이를 통해 형질 관련성에 대한 연구가 활발히 진행되고 있다. 반면, 표현형은 경기력이 좌우되는 운동수행능력이 포함된다. 따라서, 운동수행능력과 관련이 있는 SNP를 찾아낸다면 경주능력 관련 유전자형을 밝힐 수 있을 것이다.
DNA 염기서열변이의 분석방법으로는 통상적으로 DNA 염기서열 자동 분석기(DNA sequencer)를 이용하고 있으나, 상기 분석 장치는 부분만을 위한 것이며, 개체의 염색체 전반을 위한 SNP 스크리닝을 하기에는 한계를 가지고 있다.
이러한 한계를 극복하기 위한 수단으로 미리 유전체 분석회사에서 만들어 놓은 말 SNP chip을 이용하여 한번에 5만개의 SNP를 검사할 수 있게 되었다.
경주마에 있어서, 운동수행능력은 순발력, 근력, 폐활량 등 육체적인 능력과 승부 근성, 사람과의 친화력 등 정신적인 부분이 합쳐져 만들어진다. 또한 이러한 운동수행능력은 약 32.4% 정도의 유전력에 의해 결정된다. 경주마가 공유하고 있는 환경을 고려한다면, 이 수치는 매우 높은 수치로, 경주 성적에 많은 영향을 끼친다고 볼 수 있다. 마필별로 유전능력을 수치로 평가할 수 있는데, 이 점수를 "육종가(Breeding value)"라고 한다. 이 육종가는 주파기록을 결과변수로 하여 추정하였기에 집단평균인 0을 기준으로 우수한 유전능력을 갖춘 말일수록 더 작은 수를 갖게 된다. 즉, 육종가를 통계적으로 추정한 값인 추정육종가((Estimated Breeding value;EBV)를 통해 말의 유전능력을 평가하게 된다.
따라서 본 발명에서는 SNP chip을 이용해 말 염색체 전역에 걸쳐 분포하고 있는 SNPs를 확인하고, 이를 주파기록(racing time)의 추정육종가(EBV)와 비교 분석함으로 경주마의 경주능력과 관련된 SNP 마커를 선발하고, 이를 이용하여 경주마 선발을 위한 회귀모형을 개발함으로써 분자유전학적 기법으로 경주능력이 우수한 경주마를 선발할 수 있는 기반을 마련하고자 한다.
특허문헌 1. 출원번호 10-2005-7004536 운동수행능력에 대한 ACTN 3 유전자형 스크린
비특허문헌 1. Hill EW, Gu J, Eivers SS, Fonseca RG, McGivney BA, Govindarajan P, Orr N, Katz LM, MacHugh D: A sequence polymorphism in MSTN predicts sprinting ability and racing stamina in thoroughbred horses. PLoS One 2010, 5:e8645. 비특허문헌 2. Binns M, Boehler D, Lambert D: Identification of the myostatin locus (MSTN) as having a major effect on optimum racing distance in the Thoroughbred horse in the USA. Animal Genetics 2010, 41:154-158. 비특허문헌 3. Velleman SG, Shin J, Li X, Song Y: Review: The skeletal muscle extracellular matrix: Possible roles in the regulation of muscle development and growth. Canadian Journal of Animal Science 2012, 92:1-10. 비특허문헌 4. Grozdanov PN, Roy S, Kittur N, Meier UT: SHQ1 is required prior to NAF1 for assembly of H/ACA small nucleolar and telomerase RNPs. Rna 2009, 15:1188-1197. 비특허문헌 5. O'Connor MS, Carlson ME, Conboy IM: Differentiation rather than aging of muscle stem cells abolishes their telomerase activity. Biotechnology progress 2009, 25:1130-1137. 비특허문헌 6. Ko JA, Kimura Y, Matsuura K, Yamamoto H, Gondo T, Inui M: PDZRN3 (LNX3, SEMCAP3) is required for the differentiation of C2C12 myoblasts into myotubes. Journal of Cell Science 2006, 119:5106-5113. 비특허문헌 7. Bach AS, Enjalbert S, Comunale F, Bodin S, Vitale N, Charrasse S, Gauthier-Rouviere C: ADP-ribosylation factor 6 regulates mammalian myoblast fusion through phospholipase D1 and phosphatidylinositol 4, 5-bisphosphate signaling pathways. Molecular biology of the cell 2010, 21:2412-2424. 비특허문헌 8. Szustakowski JD, Lee JH, Marrese CA, Kosinski PA, Nirmala N, Kemp DM: Identification of novel pathway regulation during myogenic differentiation. Genomics 2006, 87:129-138. 비특허문헌 9. Liscurn L: Cholesterol biosynthesis. New Comprehensive Biochemistry 2002, 36:409-431. 비특허문헌 10. Jelinsky SA, Archambault J, Li L, Seeherman H: Tendon?selective genes identified from rat and human musculoskeletal tissues. Journal of Orthopaedic Research 2010, 28:289-297. 비특허문헌 11. Kojic S, Radojkovic D, Faulkner G: Muscle ankyrin repeat proteins: their role in striated muscle function in health and disease. Critical Reviews in Clinical Laboratory Sciences 2011, 48:269-294. 비특허문헌 12. Kimball SR, Vary TC, Jefferson LS: Regulation of protein synthesis by insulin. Annual review of physiology 1994, 56:321-348. 비특허문헌 13. Joseph SJ, Robbins KR, Pavan E, Pratt SL, Duckett SK, Rekaya R: Effect of diet supplementation on the expression of bovine genes associated with Fatty Acid synthesis and metabolism. Bioinformatics and Biology Insights 2010, 4:19. 비특허문헌 14. Houston ME: Biochemistry primer for exercise science. Human Kinetics Publishers; 2006. 비특허문헌 15. Moschella MC, Watras J, Jayaraman T, Marks AR: Inositol 1, 4, 5-trisphosphate receptor in skeletal muscle: differential expression in myofibres. Journal of muscle research and cell motility 1995, 16:390-400. 비특허문헌 16. Hill EW, McGivney BA, Gu J, Whiston R, MacHugh DE: A genome-wide SNP-association study confirms a sequence variant (g. 66493737C> T) in the equine myostatin (MSTN) gene as the most powerful predictor of optimum racing distance for Thoroughbred racehorses. BMC genomics 2010, 11:552
본 발명은 상기 목적을 달성하기 위한 것으로, 말의 염색체 전역에 분포하는 SNPs를 주파기록(racing time)과 관련된 추정육종가(estimated breeding value)와 비교하여 분석하는 유전체 연관 분석(Gemone wide association studies, GWAS)을 통해 경주능력과 강한 유의성이 확인된 SNPs를 선발하고, 상기 선발된 SNPs 다수가 근육 조성과 관련된 유전자 내에 위치하고 있음을 확인, 이를 이용해 경주마 선발을 위한 회귀모형을 개발함으로써, 분자유전학 기술을 바탕으로 경주능력이 우수한 말을 조기에 선발할 수 있는 기반을 제공하고자 한다.
본 발명의 위와 같은 목적은, -2.871 + 0.08916 × BIEC2_1026200 유전자형 값 + 0.15014 × BIEC2_1029757 유전자형 값 + 0.15014 × BIEC2_330101 유전자형 값 + -0.09905× BIEC2_330509 유전자형 값 + 0.17936 × BIEC2_330575 유전자형 값 + -0.22790 × BIEC2_330691 유전자형 값 + 0.08524 × BIEC2_417495 유전자형 값 + -0.13067 × BIEC2_527879 유전자형 값 + 0.08571× BIEC2_554645 유전자형 값 + 0.08156 × BIEC2_569862 유전자형 값 + -0.07506 × BIEC2_732151 유전자형 값 + -0.07957 × BIEC2_814518 유전자형 값 + -0.13404 × BIEC2_906777 유전자형 값 으로 이루어지는 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법을 제공함으로써 달성된다.
또한, 상기 유전자형 값은 표 4에 의해 결정되는 것을 특징으로 하는 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법인 것을 특징으로 한다.
또한, 상기 경주마 유전체 육종가의 예측방법은 BIEC2_1026200, BIEC2_1029757, BIEC2_330101, BIEC2_330509, BIEC2_330575, BIEC2_330691, BIEC2_417495, BIEC2_527879, BIEC2_554645, BIEC2_569862, BIEC2_732151, BIEC2_814518, BIEC2_906777 SNP 각각의 유전자형을 확인하는 단계;
상기 확인된 SNP 각각의 유전자형에 해당하는 유전자형 값을 회귀모형에 대입하여 유전체 육종가를 도출하는 단계; 를 포함하여 구성되는 것을 특징으로 하는 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법인 것을 특징으로 한다.
또한 본 발명의 위와 같은 목적은, 이와 같이 예측된 유전체 육종가가 0을 기준으로 작은 값일수록 우수한 경주능력을 갖는 경주마로 판단하는 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법을 통해 우수한 경주마 선발방법을 제공함으로써 달성된다.
본 발명에 의한 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법 및 이를 이용한 우수한 경주마 선발방법은, 근육 조성과 관련된 SNPs를 이용해 구축된 회귀모형으로 유전체 육종가를 산출할 수 있으며, 유전체 육종가를 추정육종가와 함께 사용시 선발의 정확도를 높일 수 있다. 따라서, 본 발명에 의한 유전체 육종가 예측 회귀모형을 이용함으로써, 매년 20~40억원의 씨수말을 수입하는데 있어서 후보 씨수말을 평가하는데 유용하게 활용될 수 있고, 특히 유전자정보를 이용하여 평가하기 때문에 생산실적이 없는 검증되지 않은 씨수말의 도입 시, 성공가능성을 증대시킬 수 있어 경주마 개량에 기여할 수 있는 효과가 있다.
본 발명은 상술한 특정의 바람직한 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것을 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.
도 1. 주파능력의 추정육종가(EBV)와 비교 분석한 유전체연관분석 맨하탄 플롯. (빨간색 점으로 표시된 라인은 P<2.41×10-06, Bonferroni 보정 후 P= 0.05을 가르킨다)
도 2.주파기록의 추정육종가(EBV)와 비교 분석한 유전체연관분석 맨하탄 플롯. (단계 1의 결과는 서로 다른 색의 회색으로 나타내었다. 홀수 염색체는 진한 회색, 이외 다른 염색체는 밝은 회색으로 나타내었다. 빨간색 점으로 표시된 라인은 단계 2의 임계값을 나타낸다. 단계 2에서 확인된 SNP는 2가지의 빨간색으로 나타내었다. 임계값보다 낮은 P 값을 갖는 중요한 SNP는 진한 빨간색, 그 외 다른 SNP는 밝은 빨간색으로 나타내었다. 파란색 점으로 표시된 SNP는 이미 보고된 MSTN 유전자 내 경주능력과 관련된 SNP를 나타낸다.)
도 3. 16번 염색체 상의 SNPs 주변 pairwise linkage disequilibrium(LD)와 연관신호의 위치. (단계 1의 데이타를 이용하여 LD 패턴을 나타내었다. 연관신호는 단계 1의 샘플(초록색 원, n=240)의 모든 SNPs의 유전자형, 단계2(빨간색 다이아몬드, n=1,156)의 결합된 데이타 셋 내의 중요한 SNPs 이다. 이 지역은 중요한 중요한 SNPs와 연관된 6개의 유전자와 가깝게 위치한다. BIEC2-330691은 GXYLT2에 위치하며, 작은 LD를 갖는다. 4개의 SNPs는 PDZRN3 유전자에 위치하며, 대부분 완벽한 LD를 갖는다.)
도 4. 16번 염색체 상, 12개 주요 SNPs의 효과 대립유전자 수의 측정된 추정육종가에 대한 누적효과 플롯 결과.(16번 염색체 상에 위치한 모든 12개 SNPs는 파지티브 효과를 갖는다.)
도 5. 이미 보고된 MSTN 유전자 관련 SNPs 주변 pairwise linkage disequilibrium(LD)와 연관신호의 위치.(단계 1(n=240)의 데이타를 이용하여 LD 패턴을 나타내었다.)
도 6. 이미 보고된 MSTN 유전자 주위 2개 주요 SNPs의 효과 대립유전자 수의 측정된 추정육종가에 대한 누적효과 플롯 결과.(이 두개의 SNP는 네가티브 효과를 갖는다.)
도 7. 21번 염색체 위에 위치한 2개의 SNPs 주변 pairwise linkage disequilibrium(LD)와 연관신호 위치.(단계 1의 데이타를 이용하여 LD 패턴을 나타내었다. 연관신호는 단계 1의 샘플(초록색 원, n=240)의 모든 SNPs의 유전자형, 단계2(빨간색 다이아몬드, n=1,156)의 결합된 데이타 셋 내의 중요한 SNPs 이다. 이 지역은 2개의 중요한 SNP를 포함하는 ARL15 유전자와 가깝게 위치한다.)
도 8. 8번 염색체 위에 위치한 SNPs 주변 pairwise linkage disequilibrium(LD)와 연관신호 위치.(단계 1의 데이타를 이용하여 LD 패턴을 나타내었다. 연관신호는 단계 1의 샘플(초록색 원, n=240)의 모든 SNPs의 유전자형, 단계2(빨간색 다이아몬드, n=1,156)의 결합된 데이타 셋 내의 중요한 SNPs 이다. 이 지역은 INPP5J, OSBP1 유전자를 포함하며, 각각 중요한 SNP를 하나씩 갖는다.)
도 9. 8번 염색체 위에 위치한 SNPs 주변 pairwise linkage disequilibrium(LD)와 연관신호 위치.(단계 1의 데이타를 이용하여 LD 패턴을 나타내었다. 연관신호는 단계 1의 샘플(초록색 원, n=240)의 모든 SNPs의 유전자형, 단계2(빨간색 다이아몬드, n=1,156)의 결합된 데이타 셋 내의 중요한 SNPs 이다. 이 지역은 MVK 유전자를 포함하며, 중요한 1개의 SNP와 연관되어 있다.)
도 10. 21번 염색체 위에 위치한 4개의 SNPs 주변 pairwise linkage disequilibrium(LD)와 연관신호 위치.(단계 1의 데이타를 이용하여 LD 패턴을 나타내었다. 연관신호는 단계 1의 샘플(초록색 원, n=240)의 모든 SNPs의 유전자형, 단계2(빨간색 다이아몬드, n=1,156)의 결합된 데이타 셋 내의 중요한 SNPs 이다. 이 지역은 CCT5, TAS2R1 유전자를 포함하며 각각 2개와 1개의 중요한 SNP를 갖는다.)
도 11. 20번 염색체 위에 위치한 4개의 주변 pairwise linkage disequilibrium(LD)와 연관신호 위치.(단계 1의 데이타를 이용하여 LD 패턴을 나타내었다. 연관신호는 단계 1의 샘플(초록색 원, n=240)의 모든 SNPs의 유전자형, 단계2(빨간색 다이아몬드, n=1,156)의 결합된 데이타 셋 내의 중요한 SNPs 이다. 이 지역은 VARS2 유전자를 포함하며 1개의 중요한 SNP를 갖는다.)
도 12. 30번 염색체 위에 위치한 SNPs 주변 pairwise linkage disequilibrium(LD)와 연관신호 위치.(단계 1의 데이타를 이용하여 LD 패턴을 나타내었다. 연관신호는 단계 1의 샘플(초록색 원, n=240)의 모든 SNPs의 유전자형, 단계2(빨간색 다이아몬드, n=1,156)의 결합된 데이타 셋 내의 중요한 SNPs 이다. 이 지역은 RGS7 유전자를 포함하며 1개의 중요한 SNP를 갖는다.)
도 13. 21번 염색체 상에 위치하는 6개 주요 SNPs의 효과 대립유전자수의 측정된 추정육종가에 대한 누적효과 박스 플롯.
도 14. 20번 염색체 상에 위치하는 4개 주요 SNPs의 효과 대립유전자수의 측정된 추정육종가에 대한 누적효과 박스 플롯.
도 15. 8반 염색체 상에 위치하는 3개의 주요 SNPs의 효과 대립유전자수의 측정된 추정육종가에 대한 누적효과 박스 플롯.
도 16. 5번, 28번, 30번 염색체 상에 위치하는 각각의 주요 SNPs의 효과 대리유전자수의 측정된 추정육종가에 대한 누적효과 박스 플롯.
도 17. 1,156두 서러브레드의 추정육종가의 히스토그램(histogram).
도 18. R 프로그램으로 개발한 회귀모형
도 19. 본 발명의 경주능력 관련 유전체 육종가 예측을 위한 회귀모형으로 추정된 값과 육종가 간의 상관관계를 보여주는 산점도.
도 20. 육종가의 정확도가 0.9 이상인 마필에 대해 본 발명의 경주능력 관련 유전체 육종가 예측을 위한 회귀모형으로 추정한 값과 육종가 간의 상관관계를 보여주는 산점도.
도 21. 본 발명의 경주능력 관련 유전체 육종가 예측을 위한 회귀모형의 잔차분석도.
도 22. 도 21의 잔차가 정규분포를 따르는지 확인하기 위한 차트.
도 23. X 축에 선형회귀로 적합된 값, Y 축에 표준화잔차를 보여주어, 기울기가 0인 직선이 이상적인 차트.
도 24. X 축에 Leverage, Y 축에 표준화잔차를 보여주는 차트.
이하, 본 발명은 첨부된 도면에 의해 보다 상세하게 설명하면 다음과 같다.
참고로 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단될 경우 그 상세한 설명을 생략하였다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운영자의 의도 또는 관례 등에 따라 달라질 수 있다.
그러므로, 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것은 물론이다.
본 발명에서는 서러브레드의 혈액으로 실험이 실시되었으며, 서러브레드의 혈액은 숙련된 수의사로부터 채취되었다.
실시예 1. 주파기록의 추정육종가(estimated breeding value of racing time)
육종가(Breeding value, BV)는 부모로서의 가치, 즉 다음 세대에 유전자를 전달해주는 공여자로서의 가치로 정의된다. 유전자형 값은 한 형질에 있어서 개체의 능력에 영향을 미치는 각 유전자들의 전체적인 효과를 나타낸다. 그러나 모든 유전자형 값이 유전되는 것은 아니다.
육종가는 부모가 자손에게 전달할 수 있는 독립 유전자 효과에 기인하는 개체의 유전자형 값의 한 부분이다. 유전자형 값과 육종가의 차이는 유전자형 값은 자신의 능력에 대한 개체의 유전자 값(genetic value)이고, 육종가는 그 자손의 능력에 대한 개체의 유전자 값이다. 직접 유전자형 값을 측정할 수 없는 것과 같이 육종가도 직접 측정할 수 없다. 그러나 혈연 기록과 능력 자료를 사용하여 그것들을 예측할 수는 있다. 이러한 육종가의 예측 값을 추정육종가(estimated breeding value, EBV)라고 한다.
상대적인 유전육종 값과 선발을 위해 육종서열을 정하는데 사용되는데 통계수칙 예측과 같은 추정육종가(EBV)가 각 샘플에 지정되었다.
말에서 여러 기록(multiple record)이 있을 경우, 추정육종가는 하나의 수치로 모든 기록의 측정을 결합하는데 사용할 수 있다.
추정육종가의 정확성을 향상시키려면, 불필요한 효과를 줄이는 방법으로 동물 모델을 간략화해야 한다.
반복기록(Repeat-record) 동물모델은 유전적 매개변수(육종가)를 측정하는데 사용된다.
Figure 112013121001610-pat00001
Y : 관측 벡터(the vector of observations)
b : 고정된 효과의 벡터(the vector of fixed effects)
v : 임의 효과의 벡터(the vector of random effects)
P e : 영구적인 환경적 효과의 벡터 : 일반적인 환경(the vector of permanent environmental effect : common environment)
a : 개별적으로 첨가된 유전적 효과의 벡터(the vector of individual additive genetic effect)
e : 잔여 오류의 벡터(the vector for residual error)
X, W1, W2와 Z는 b, v, Pe 와 a 각각의 디자인 매트릭스(design matrix)이다.
한국 마사회 경마장에서 1994년부터 2011년까지 14,752두의 서러브레드의 경주 횟수는 총 262,326회이다.
고정된 결과로는 경주거리, 출생국, 성별, 연령을 사용하였다.
한국마사회의 경주거리는 1000, 1200, 1300, 1400, 1600, 1700, 1800, 1900, 2000, 2200, 2300m이다.
출생국은 한국과 그 외의 국가로 나누었으며, 성별은 수컷 또는 거세로 나누었다.
본 발명의 변동되는 결과로는 경주로의 함수율(경주로의 수분 함량), 기수, 부담중량(경주에 출전하는 말이 기본적으로 얹고 달려야 하는 중량), 그리고 말을 훈련하는 사람, 즉 조교사이다.
모든 매개변수는 단일-형질 동물모델을 위한 derivative-free restricted maximum likelihood(DFREML)에 의해 ASREML program을 사용하였다.
실시예 2. 초기단계 게놈 와이드 스캔(Initial genome-wide scan) : 단계 1
본 발명의 초기단계 게놈 와이드 스캔 단계에서 사용된 공시재료는 한국마사회에 등록된 씨수말 78두와 경주마 162두로 총 240두의 혈액으로부터 Gemomic DNA Extraction kit(BioneerTM)을 이용하여 지침서에 따라 지노믹 DNA(genomic DNA)를 분리하여 사용하였다.
DNA 정량 분석은 분광광도계(spectrophotometer;Pharmacia Biotech, England)를 이용하여 260nm ~ 280nm에서 흡광도를 측정하여 DNA의 농도와 순도를 확인하였다.
추출된 서러브레드의 지노믹 DNA는 Equine50SNP Genotyping BeadChips(Illumina, SanDiego, CA)을 이용하여 이니셜 게놈 와이드 스캔을 위한 유전자형을 확인하였다. 상기 Equine50SNP Genotyping Beadchips에는 54,602개의 SNPs가 포함되어 있으며, 이 SNPs는 말 게놈의 EquCab2 SNP 데이터베이스로부터 X 염색체와 31번 말 염색체에 균일하게 분포되어 있다(1개 SNP 당 평균 밀도 ~34kb).
Equine50SNP Genoytping Beadchips 실험은 추출된 지노믹 DNA를 genome wide amplification 방법으로 증폭 후 화학적 방법(chemical method)으로 무작위 조각을 내어 2-프로판올(propanol) 침전법으로 정제(purification)하였다.
Equine50SNP Genotyping Beadchips은 상기 준비된 DNA 시료를 넣기 전에 완충용액으로 전처리한 후, DNA 시료를 주입하였다. 프로브(Probe)와 DNA 간의 연장/염색 반응을 위해 16시간 동안 배양(incubation)하고, 스테이닝(staning), 대립유전자 특이적 프라이머 신장반응(allele specific primer extension), 혼성화반응(hybridization), 타겟 리무벌(target removal), 세척(washing)하여 반응을 종료하고 BeadStation 500으로 스캐닝을 진행하였다. 프로그램은 auto-clustering system을 적용하여 대량의 시료 유전자형을 동시에 콜링(calling)하였다.
콜링된 SNP 정보는 Bead Studio version 3.1.(Illumina, USA)을 통해 SNP 마커별 대립유전자형을 분류한 후, PLINK software(Shaun et al., 2007)을 이용하여 미확인 유전자형 비율(missing rate) 5% 이하, 소수 유전자형 비율(minor allele frequency, MAF) 0.05 이하, 하디웨인버그 평형(Hardy-weinberg equilibrium; HWE)테스트의 P 값이 0.001 이하인 SNPs는 제외하고 추가적으로 X 염색체 상에 위치한 SNPs도 제외하여 Microsoft Excel(Microsoft, USA)을 이용하여 자료를 취합하였다.
실시예 3. 반복 연구 단계로서의 조인트 분석(Joint Analysis in replication study) : 단계 2
단계 2의 반복 연구 단계로서의 조인트 분석은 실시 예 2(단계 1)에서 선택된 190개의 SNPs와 기존의 경주능력과 관련된 유전자로 알려진 MSTN 유전자 내 2개의 SNPs, BIEC2-417495와 BIEC2-417274를 함께 분석하였다. 또한 반복 연구를 위해 공시재료로 4회 이상 경주 기록을 갖고 있는 916두의 서러브레드의 혈액으로부터 Genomic DNA Extraction kit(BioneerTM)를 이용하여 지침서에 따라 지노믹 DNA를 분리하여 사용하였다. DNA 정량 분석은 분광 광도계(spectrophotometer;Pharmacia Biotech, England)를 이용하여 260nm ~ 280nm에서 흡광도를 측정하여 DNA의 농도와 순도를 확인하였다.
추출된 서러브레드의 지노믹 DNA는 Equin BeadXpress SNP Chip(Illumina, USA)를 이용하여 유전자형을 확인하였다.
실시 예 2(단계 1)의 분석 결과, 190개의 중요한 SNPs를 선택하였고 이중, 172개의 SNPs가 성공적으로 Equine BeadXpress SNP Chip에 의해 유전자형이 확인되었다. 농생명공동기기원(NICEM)에서 반복 연구 단계를 위해 제조업자의 전형적인 프로토콜을 사용하여 모든 샘플에 대해 유전자형을 확인하였다.
본 발명에서 실시예 2(단계 1)의 240두와 실시예 3(단계 2)의 916두, 총 1,156두의 공동 연관성 분석은 PLINK의 선형 회귀에 근거하여 실시하였다.
실시예 4: 결과
4-1. 240두를 이용한 초기 단계 게놈 와이드 스캔 : 1단계
GWAS(Genome wide association studies)에 있어서, 정량적인 표현형(phenotype)으로 추정육종가(estimated breeding value, EBV)와 유전자형(genotype)을 비교하였다. 염색체 정렬(chromosome sorting)이 맨하탄 플롯(도 1)으로 표시한 240두의 서러브레드 집단에서 초기 단계 게놈-와이드 스캔을 실시하였다.
데이터의 초기 분석에서 주파기록(racing time)의 EBV와 연관된 3,919개 SNPs를 발견하였다(미조정 P-값, <0.05). 이 SNP들은 어느 것도 다중검정의 임계값을 초과하지 않았다(P<2.41×10-06, Bonferroni 보정 후 P= 0.05에 해당). 그러나 이 후도 SNP들의 타당성 및 생물학적 유의성에 관한 추정은 시기상조이며 그 이유는 같은 데이터 세트에 대해 수만 번 테스트를 할 때마다 발생하는 불가피성의 높은 위양성률(false-positive rate) 때문이다.
서러브레드들의 EBV와 연관된 SNP들의 정체성(identity)들은 아직 알려지지 않고 있다. 따라서 큰 집단에서 이러한 발견들의 복제는 경주 능력과 관련된 유의적인 SNP들을 식별하는데 필요하다. 다음 단계를 위해, 다양한 염색체들에 분포된 190 SNPs를 선정하였다.
4-2. 1,156두를 이용한 반복 연구 : 단계 2
단계 2에 있어서, 한국마사회의 서러브레드 집단에서 무작위로 선정한 단계 2 데이터 세트들의 추가샘플들은 단계 1에 포함되지 않은 것들이기 때문에 독립적인 샘플들이다. EBV와의 연관성을 더 확인하기 위해, 916두의 서러브레드를 추가하여 종래 경주능력과 관련된 유전자로 보고된 MSTN 유전자 내 2개의 SNPs를 포함한 192개의 SNPs 확인해 내었으며, 이를 실험적 품질관리를 걸쳐 172개의 유전자형을 확인하였다. 이 후, 데이타 품질 관리 절차를 걸쳐 1,156 서러브레드(단계 1과 단계 2 집단의 결합)에 대한 158개의 SNPs를 추려 내었으며, 이를 단계 2의 조인트 분석을 위해 사용할 수 있었다.
이 SNP들은 <100킬로바이트의 두 SNP 사이의 최대 거리에 의해 정의된 119개의 구별된 염색체 영역들을 커버하였고, 92개 영역들은 단 하나의 SNP만 포함하였으며, 27개의 영역들은 2개 이상의 SNP들을 포함하였다.
단계 2의 조인트 분석에서, 28개 SNPs(158 SNP들 중의 17.7%)이 명확하게 게놈-와이드 유의성 기준을 달성하였다(P=0.000294,Bonferroni 보정 후 P=0.05에 해당)(도 2, 표 1).
Chr BP Neareat Gene
(Ensemble Gene ID)
SNP Type Minor Allele Major Allele Stage 1 Stage 2
P-value MAF SNP
effect
P-value MAF SNP effect
BIEC2_906777 5 40747218 -
(ENSECAG00000019204)
InterGenic A G 1.63.E-04 0.356 0.278 8.38.E-05 0.330 0.141
BIEC2_1026019 8 5906904 INPP5J
(ENSECAG00000006664)
InterGenic A G 1.64.E-05 0.159 -0.4315 1.73.E-04 0.190 -0.163
BIEC2_1026200 8 6126833 OSBP2
(ENSECAG00000015443)
InterGenic G A 1.06.E-05 0.107 -0.5102 1.28.E-05 0.142 -0.215
BIEC2_1029757 8 11590300 MVK
(ENSECAG00000023067)
InterGenic C A 1.75.E-05 0.119 -0.4715 8.85.E-06 0.137 -0.219
BIEC2_330101 16 14185461 - InterGenic C A 1.39.E-04 0.254 0.3328 4.29.E-06 0.216 0.195
BIEC2_330360 16 15550375 - InterGenic A G 8.12.E-04 0.388 0.2536 2.00.E-06 0.371 0.167
BIEC2_330495 16 16289366 CNTN3
(ENSECAG00000013575)
Genic A G 3.81.E-04 0.298 0.2847 1.91.E-04 0.271 0.143
BIEC2_330509 16 16334663 InterGenic G A 4.43.E-04 0.297 0.2818 8.79.E-05 0.274 0.150
BIEC2_330558 16 16948655 PDZRN3
(ENSECAG00000014864)
Genic G A 6.02.E-04 0.377 0.2565 2.28.E-05 0.362 0.150
BIEC2_330572 16 16993987 Genic A G 7.93.E-04 0.367 0.2484 4.53.E-05 0.358 0.145
BIEC2_330575 16 16999220 Genic A G 2.32.E-04 0.354 0.2734 1.73.E-04 0.339 0.134
BIEC2_330578 16 17001997 Genic G A 6.02.E-04 0.377 0.2565 1.92.E-05 0.363 0.152
BIEC2_330677 16 17421511 PPP4R2
(ENSECAG00000000689)
Genic A G 6.13.E-04 0.377 0.2562 2.66.E-05 0.359 0.149
BIEC2_330691 16 17546589 GXYLT2
(ENSECAG00000008483)
Genic G A 7.05.E-04 0.371 0.2611 8.94.E-08 0.355 0.191
BIEC2_330725 16 17763943 SHQ1
(ENSECAG00000015673)
InterGenic G A 4.49.E-04 0.325 0.2802 9.40.E-07 0.316 0.180
BIEC2_330739 16 17790340 InterGenic G A 6.71.E-04 0.315 0.2672 2.97.E-06 0.310 0.172
BIEC2_527753 20 29897398 VARS2
(ENSECAG00000018202)
Genic A G 4.60.E-04 0.219 0.3011 1.32.E-05 0.172 0.195
BIEC2_527879 20 30126579 -
(ENSECAG00000015285)
InterGenic A G 4.60.E-04 0.219 0.3011 6.86.E-06 0.172 0.202
BIEC2_529755 20 32127869 -
(ENSECAG00000017401)
InterGenic A C 5.23.E-04 0.256 0.2969 3.80.E-05 0.210 0.171
BIEC2_529760 20 32131071 InterGenic C A 2.39.E-04 0.296 0.2909 4.09.E-06 0.239 0.180
BIEC2_554645 21 18154976 ARL15
(ENSECAG00000014970)
Genic A G 1.98.E-05 0.218 -0.3696 7.44.E-06 0.213 -0.188
BIEC2_554739 21 18348602 InterGenic C A 9.53.E-05 0.265 -0.3267 1.94.E-04 0.256 -0.146
BIEC2_568963 21 47502588 - InterGenic A G 4.70.E-04 0.471 -0.2539 1.98.E-05 0.474 -0.149
BIEC2_569862 21 48967346 CCT5
(ENSECAG00000019192)
InterGenic G A 2.59.E-04 0.373 -0.2739 2.57.E-06 0.381 -0.165
BIEC2_570062 21 49384234 Genic A C 1.30.E-04 0.404 0.2819 2.12.E-04 0.386 0.127
BIEC2_570485 21 49894191 TAS2R1
(ENSECAG00000005160)
InterGenic A G 3.40.E-04 0.215 0.3012 3.48.E-04 0.209 0.148
BIEC2_732151 28 17405077 - InterGenic A C 7.52.E-05 0.290 0.3151 4.42.E-04 0.274 0.134
BIEC2_814518 30 3869336 RGS7
(ENSECAG00000009422)
InterGenic A G 2.33.E-05 0.388 0.3152 5.79.E-04 0.390 0.119
위의 조인트 분석을 이용한 GWAS에서 28개의 유의한 SNPs가 확인되었다. 이 중 2가지 단계에 거친 GWAS에서 확인된 가장 유의한 SNP는 BIEC2_330691(조인트 분석 후, P=8.94×10-08)이고, 이는 다른 11개의 SNPs와 함께 16번 염색체에 존재하며 GXYLT2 유전자의 여섯 번째 인트론에 위치하고 있다.
28개의 SNPs 중 12개는 16번 염색체(chr16: 14. 18-17.79 Mb)상에 3.6-Mb 영역에 걸쳐서 함께 위치하였고, 이 영역들이 서러브레드의 운동능력에 관계된 것으로 보고된 바는 없다(도 3, 4). 12개의 SNP 중 4개는 PDZRN3 유전자에 위치하고 있었고, BIEC2_330691을 포함한 다른 4개의 유전자들은 0.37Mb 구간(chr16: 17.74-17.79 Mb)에 모여 있었다. 연관 불평형LD(pairwise linkage disequilibrium) 계산은 240두의 초기 단계에서 SNP 정보를 이용하였으며 16번 염색체의 3.6-Mb 지역(chr16 : 14.18-17.79 Mb)에서 수행되었다. 13개의 분리된 LD 블록들은 16번 염색체의 연관성의 3.6-Mb 피크(peak)에서 식별되었다(도 3).
네 번째로 중요한 SNP, BIEC2_569862를 포함한 6개 유의한 SNPs는 염색체 21에 위치하고 있었다. 이 SNPs는 뚜렷한 염색체상의 위치를 확인할 수 없었지만, chr21: 18.15-18.34(2개 SNPs)와 chr21:47.50-49.89(4개 SNPs) 두 위치에 존재하는 것으로 확인되었다.
또한 4개의 유의한 SNPs는 염색체 20에 존재하고 있었다. 2개의 SNP는 chr20:32.12-32.13에 위치하고 있었으며 나머지 두개는 chr20: 29.89-32.13 근처에 존재하고 있었다.
3개의 유의한 SNPs는 염색체 3에 분포하고 있었고, 염색체 5, 28, 30에 각각 하나씩 주요한 SNP가 위치하고 있었다.
기존의 경주능력과 관련된 유전자로 알려진 MSTN 유전자 내 2개의 SNPs, BIEC2-417495와 BIEC2-417274를 함께 분석하여 표 2, 도 5, 6에 나타내었다(표 2, 도 5, 6).
서러브레드의 경주능력과 관련하여 보고된 2개의 SNPs
Chr BP Neareat Gene
(Ensemble Gene ID)
SNP Type Minor Allele Major Allele Stage 1 Stage 2
P-value MAF SNP
effect
P-value MAF SNP effect
BIEC2_417274 18 65868604 - InterGenic C A 0.801 0.498 -0.02 5.38.E-04 0.491 -0.124
BIEC2_417495 18 67186093 - InterGenic G A 0.526 0.483 -0.05 4.97.E-04 0.480 -0.123
4-3. 서러브레드의 경주능력과 연관된 후보유전자들
28개 중요 SNPs의 영향에 생물학적 평가는 EquCab 2.0의 말 유전자 정보에 기초하였다. 이 유전자들은 ENSEMBL genome browser EquCab 2(http://www.ensemble.org/)에서 다운로드한 ENSEMBL Gene ID를 사용하여 주석을 달았다. 전체 정보가 (±10 Kb) SNPs 내에 또는 부근에 위치한 유전자들을 수집하였다. 주파기록을 위한 추정육종가와 연관된 28개 SNPs 중 25개의 SNPs가 17개의 근육 조건과 관련된 유전자(ENSEMBL Gene ID)와 연관이 있었고, 이 중에서 20개의 SNPs가 단백질을 코딩하는 13개 유전자 내에 위치하고 있었다. 이 확인된 유전자 중 5개의 유전자는 하나보다 많은 SNPs를 포함하고 있었다.
이들 13개의 유전자 중에서 11개 유전자가 주로 근육과 연관이 있었다(도2). 근육과 관련된 11개 유전자들 중에서 6개의 유전자들은 근육분화(myogenesis)와 연관이 있다. 이 6개의 유전자들은 glucoside xylosyltransferase 2 (GXYLT2); SHQ1 homolog, Saccharomyces cer evisiae (SHQ1); PDZ domain-containing ring finger 3 (PDZRN3); ADP-ribosylation factor-like 15 (ARL15 ); oxysterol binding protein 2 (OSBP2); 그리고 mevalonate kinase (MVK)이다.
GXYLT2는 37. 4-kDa proteoglycan core protein glucoside xylosyltransferase 2를 인코드한다. 프로테오글리칸들은 세포 외 메트릭스에 있는 고분자군들 중의 하나로서 myogenesis(근육분화) 중에 근육세포 확산 및 부화의 조절작용(regulation)을 조절한다. 게다가 GXYLT2의 인트론 내에 가장 유의적인 P 값을 갖는 변이의 위치는 이 유전자가 후보일 가능성이 매우 높음을 암시한다(도 3).
SHQ1은 SHQ1 homolog of S. cerevisiae 이며, 텔로머라제 RNP(염색체의 양쪽 끝에 말단소립을 부착해 염색체를 보호하는 역할을 하는 효소, telomerase RNP)들의 어셈블리에 필요하다. Mattew et at.은 근육줄기세포에서 분포양상(telomerase activity)이 포유류의 어느 한 변형의 노령의 분화된 근육섬유(old differentiated muscle fibers of either strain in mammals)에서 검출되지 않는다는 것을 발견하였다. 게다가 제2의 유의적인 SNP(BIEC2_330725)와 제5의 SNP (BIEC2_330739)는 SHQ1 영역의 근처에 위치한다 (도 3).
PDZRN3는 그 N-말단영역에서 링-휭거 모티프, 그 중앙 영역에서 두 개의 PDZ 도메인들, 및 그 C-말단에서 PDZ 도메인들을 위한 consensus-binding motif를 함유한다. Ko et al.은 미오게닌(근아세포로부터 근관세포로 분화에 따라 발현하는 MyoD 족에 속하는 유전자 산물의 일종, myogenin)의 하류를 작용하거나 또는 독립적으로 작용하는 것에 의해서 근관세포(근세포의 부화과정에서 근원세포가 길게 신장한 세포, myotube)내로 근원세포(분화되지 않은 근육세포, myoblast)의 분화에 주요 역할을 한다고 보고하였다. PDZRN3은 16번 염색체 상의 영역에서 4개의 유의적인 SNPs를 포함한다(도 3).
21번 염색체 상의 두 개의 유의적인 SNPs는 ARL15 유전자에서 확인되었다. ARL15는 ADP-ribosylation factor-like 15를 인코드하며, ADP-ribosylation factor는 근원세포 융합의 임계 조절자(critical regulator)로 보고되어있다(도 7).
OSBP2는 옥시스테롤 결합 단백질 2(oxysterol binding protein 2 )를 인코드하고, 미오겐(근육을 이루는 주요 단백질 성분) 분화 중의 transitional-phase post-differentiation induction 동안 고도록 조절 된다(도 8).
MVK 유전자는 또한 메발론산염 키나아제(mevalonate kinase)를 인코드한다. 메발론산염 키나아제는 옥시스테롤 합성경로의 중간체이다(도 9).
이 외,contactin 3 (CNTN3); Chaperonin Containing TCP1, Subunit 5 (CCT5); valyl-tRNA synthetase 2, mitochondrial (VARS2) and inositol polyphosphate-5-phosphatase J (INPP5J), Protein Phosphatase 4, Regulatory Subunit 2 (PPP4R2), 5개의 다른 유전자는 근육 유지와 관련된 역할을 한다.
CNTN3는 contactin 1 protein을 인코드한다. 이 contactin 1 protein은 면역글로빈 슈퍼페밀리의 일 구성원이다. Jelinsky et al.은 함유된 CNTN2가 하나의 유전자 SNP와 16번 염색체에 하나의 intergenic SNP를 가진 성숙한 쥐와 인간 tendon에 존재하는 한 세트의 tendon-selective genes를 한정하였다(도 2).
CCT에 의해 인코딩되고 있는 TCP-1 Ring Complex는 엑틴 접힘 현상에 중요한 역할을 한다고 알려져 있다(도 10).
VARS2는 valyl-tRNA synthetase 2를 인코드한다. valyl-tRNA synthetase로서 아미노아실-tRNA synthetase의 포스포릴화는 인슐린에 의해 근육에서 발생하는 것과 같은 단백질 합성의 조절에 역할을 할 수 있다(도 11).
INPP5J는 이노시톨 폴리포스페이트 5-포스포타제 J(inositol polyphosphate 5-phosphatase J)를 인코드한다. 신호 전달에서 제2 메신저로서의 이 포스포타제(phosphatases)의 역할은 골격근에서 시그널링에 포함되는 많은 세포유형에서 잘 설정되어있다(도 8).
PPP4R2는 골격근의 조절에 영향을 끼치는 운동신경의 생존에 중요한 역할을 한다(도 3).
4-4. 운동능력과 연관된 종래 경주형질 관련 SNP와 비교.
Hill et al.과 Binns et al.은 정량적인 표현형으로서 최선의 경주거리(distance)를 갖는 18번 염색체 상의 연관성의 피크(peak)를 보고한 바 있으며, 가장 중요한 SNP들인 BIEC2-417495와 BIEC2-417274를 각각 동정한바 있다. 이들 두 SNPs는 단계 1과 같이 임계 게놈-와이드 유의성 기준(P= 0.000632911, 단계 1에서 Bonferroni 보정 후 P=0.05와 동량)을 초과하지 않았다. 그러나, 운동능력과 연관되어 있다고 보고된 두 SNPs는 본 발명의 조인트 분석에서 다중검정의 임계값에 도달하였다(도 5, 6, 표 2). 더욱이 Hill et al.에 의한 연구에서 염색체들 상의 1.7-Mb 영역을 가로지르는 LD 블록들은 단계 1 데이터를 사용하는 LD 블록과 거의 동일하였다(도 5, 6). 이 영역은 Hill et al.에 따르면 최적의 경주거리와 연관된 BIEC2-417495, BIEC2-417274, 가장 유의하게 나온 g. 66493737 C>T SNP를 포함한다. 이 SNPs는 myostatin MSTN과 관계가 있고, 이 myostatin MSTN은 골격근에 표현된 트랜스포밍 성장 팩터β 패밀리의 한 구성원이며 myocytes의 번식 및 분화의 네가티브 조절자로 작용한다. 이러한 MSTN 기능들은 28개의 유의성이 확인된 SNPs가 위치하는 6개의 유전자의 기능과 유사하다.
4-5. 추정육종가에 대한 SNP 효과들의 평가
선형회귀모델의 결과들을 사용하여, 28개 SNPs 유전자형 효과들을 본 발명에서 동정하였다. 28개의 유의성이 확인된 SNPs의 효과를 평가하기 위해 MSTN 유전자 내 위치한 두 SNP들과 비교하였다.
EBV의 절대값으로 효과 대립 유전자 점수에 대한 30개의 도표를 만들었다(도 4, 6, 13, 14, 15, 16). 각각 소수유전자형은 EBV에 대한 점수가 매겨졌다. 각 SNPs의 도표는 대립유전자 수와 EBV 사이의 관계를 나타내었다. 각 대립유전자는 서러브레드의 경주능력과 관련하여 포지티브(positive) 혹은 네가티브(negative)의 효과를 보였다. 16번 염색체 상의 12개 SNPs는 모두 경주능력과 관련하여 포지티브 효과를 확인할 수 있었다(도 4). 나머지 염색체(도 13, 14, 15, 16) 16개 SNPs 중 9개는 포지티브 효과를 확인할 수 있었으며, 그 외 7개에서는 네가티브 효과를 확인할 수 있었다. MSTN 유전자 내 2개의 SNPs에서는 EBV에 대한 네가티브 효과를 확인하였다(도 6).
5. 선발된 SNP를 이용한 유전체 육종가 예측 회귀모형 구축
경주능력에 관여하는 것으로 확인된 상기 28개의 SNPs를 이용하여 경주마의 유전능력을 추정하는 회귀모형을 구축하였다.
이 회귀모형은 개체의 유전체 육종가를 추정할 수 있으며 추정된 유전체 육종가를 이용할 경우 기존의 표현형(경주성적)이나, 육종가에 의한 선발보다 더욱 정확한 선발이 가능하다.
설명변수(28개)보다 데이터수(1,156두)가 많다는 점을 고려하여 최소자승회귀(OLS, Ordinary Least Squares) 방법을 사용하였고, 최소자승회귀모형은 다음과 같다.
(설명변수(explanatory variable)란, 서로 관계를 주고 받는 둘 또는 그 이상의 변수중, 영향을 주는 변수를 설명변수(독립변수)라 한다.)
최소자승회귀모형 :
y : 추정육종가(EBV), X : 유전자형(0,1,2), β : SNP 효과, e : 오차
회귀모형의 정확도는 10폴드(fold) 교차확인법(Cross Validation)으로 추정하였다. 100회에 걸쳐 시행된 교차확인 결과는 표 3과 같다.
CV차수 참조집단 상관계수 선정된 SNP수 테스트집단 상관계수 (정확도)
1 0.324 13 0.262
2 0.336 11 0.173
3 0.305 14 0.347
4 0.302 12 0.310
5 0.338 12 0.180
6 0.320 12 0.240
7 0.303 13 0.306
8 0.329 15 0.244
9 0.330 14 0.226
10 0.319 11 0.239
11 0.331 11 0.174
12 0.319 12 0.221
13 0.338 11 0.133
14 0.311 12 0.296
15 0.324 13 0.216
16 0.321 12 0.248
17 0.331 11 0.203
18 0.304 11 0.274
19 0.341 14 0.198
20 0.326 12 0.238
21 0.297 11 0.341
22 0.313 12 0.268
23 0.338 11 0.128
24 0.310 13 0.286
25 0.315 11 0.230
26 0.336 11 0.163
27 0.351 15 0.145
28 0.320 11 0.246
29 0.302 12 0.307
30 0.314 9 0.194
31 0.329 12 0.227
32 0.335 14 0.214
33 0.323 12 0.246
34 0.314 12 0.282
35 0.342 13 0.200
36 0.348 14 0.164
37 0.345 14 0.184
38 0.343 12 0.157
39 0.319 12 0.232
40 0.302 11 0.305
41 0.325 13 0.254
42 0.332 11 0.193
43 0.336 13 0.199
44 0.314 12 0.293
45 0.320 13 0.263
46 0.301 11 0.302
47 0.338 12 0.183
48 0.325 12 0.226
49 0.339 11 0.143
50 0.320 12 0.249
51 0.303 11 0.294
52 0.277 8 0.320
53 0.317 10 0.235
54 0.314 11 0.234
55 0.370 12 0.045
56 0.307 10 0.283
57 0.328 13 0.246
58 0.322 10 0.208
59 0.318 12 0.280
60 0.314 11 0.238
61 0.326 12 0.235
62 0.345 12 0.150
63 0.324 12 0.258
64 0.294 11 0.342
65 0.299 11 0.314
66 0.309 13 0.308
67 0.313 12 0.285
68 0.318 10 0.201
69 0.294 12 0.360
70 0.315 12 0.297
71 0.331 11 0.148
72 0.293 11 0.311
73 0.310 13 0.317
74 0.325 14 0.230
75 0.321 12 0.226
76 0.319 12 0.246
77 0.341 12 0.159
78 0.302 10 0.275
79 0.346 13 0.128
80 0.310 12 0.265
81 0.315 12 0.299
82 0.322 11 0.207
83 0.335 12 0.192
84 0.327 13 0.234
85 0.312 12 0.290
86 0.314 12 0.241
87 0.317 14 0.262
88 0.298 15 0.368
89 0.333 12 0.179
90 0.313 11 0.259
91 0.313 11 0.255
92 0.317 12 0.258
93 0.323 10 0.221
94 0.337 15 0.227
95 0.299 13 0.345
96 0.316 14 0.271
97 0.317 14 0.251
98 0.335 13 0.235
99 0.316 10 0.224
합계 0.321 12 0.240
표준편차 0.015 1 0.059
10 폴드 교차확인법(CV)로 추정한 정확도의 평균은 0.240(표준편차 0.059)이며, 선발된 SNP 마커수는 평균 12개 이었다.
1,156개의 모든 데이타는 도 18의 과정으로 상기 최소자승 회귀모형에 적용되어, 다음과 같은 경주능력 관련 유전체 육종가 예측을 위한 회귀모형이 구축되었다.
Figure 112013121001610-pat00002
*유전자형입력 : *에 해당하는 유전자형 값은 하기 표 4에 의해 결정된다.
SNP 유전자형 유전자형 값 SNP 유전자형 유전자형 값 SNP 유전자형 유전자형 값
BIEC2_1026200 AA 2 BIEC2_1026200 AG 1 BIEC2_1026200 GG 0
BIEC2_1029757 GG 0 BIEC2_1029757 GT 1 BIEC2_1029757 TT 2
BIEC2_330101 GG 0 BIEC2_330101 GT 1 BIEC2_330101 TT 2
BIEC2_330509 AA 2 BIEC2_330509 AG 1 BIEC2_330509 GG 0
BIEC2_330575 AA 0 BIEC2_330575 AG 1 BIEC2_330575 GG 2
BIEC2_330691 AA 2 BIEC2_330691 AG 1 BIEC2_330691 GG 0
BIEC2_417495 CC 2 BIEC2_417495 CT 1 BIEC2_417495 TT 0
BIEC2_527879 CC 2 BIEC2_527879 CT 1 BIEC2_527879 TT 0
BIEC2_554645 CC 2 BIEC2_554645 CT 1 BIEC2_554645 TT 0
BIEC2_569862 CC 0 BIEC2_569862 CT 1 BIEC2_569862 TT 2
BIEC2_732151 AA 0 BIEC2_732151 AC 1 BIEC2_732151 CC 2
BIEC2_814518 CC 2 BIEC2_814518 CT 1 BIEC2_814518 TT 0
BIEC2_906777 CC 2 BIEC2_906777 CT 1 BIEC2_906777 TT 0
* BIEC2_1026200(NCBI GenBank ID : rs68798522), BIEC2_1029757(NCBI GenBank ID : rs68753017), BIEC2_330101(NCBI GenBank ID : rs69092250), BIEC2_330509(NCBI GenBank ID : rs69083758), BIEC2_330575(NCBI GenBanㅂk ID : rs69085224), BIEC2_330691(NCBI GenBank ID : rs69086740), BIEC2_417495(NCBI GenBank ID : rs69127797), BIEC2_527879(NCBI GenBank ID : rs69300047), BIEC2_554645(NCBI GenBank ID : rs69181172), BIEC2_569862(NCBI GenBank ID : rs69256593), BIEC2_732151(NCBI GenBank ID : rs69356435), BIEC2_814518(NCBI GenBank ID : rs69407885), BIEC2_906777(NCBI GenBank ID : rs69588623)
본 발명의 유전체 육종가 예측을 위한 회귀모형에는 13개의 설명변수(SNP)가 선정되었으며, 실제 육종가와의 상관계수(정확도)는 0.316, R2은 0.10으로 확인되었다(도 18).
최소자승회귀(OLS)방법으로 추정한 육종가와 실제 육종가 간의 산점도는 도 19와 같다.
표 5와 같이 육종가의 정확도가 0.9 이상인 말(씨수말 등 생산된 자마가 경주에 출주하여 육종가의 정확도가 높은 말) 58두를 대상으로 본 발명의 유전체 육종가 예측을 위한 회귀모형에 대입하여 확인한 결과(도 21), 실제 육종가와 추정된 유전체 육종가의 상관계수(정확도)는 0.515이었다.
개체번호 추정육종가 회귀모형으로추정한 육종가
1 -2.03 -2.75
2 -2.71 -3.41
3 -2.69 -2.68
4 -1.57 -3.12
5 -2.22 -2.91
6 -3.73 -3.64
7 -2.96 -3.19
8 -2.51 -2.63
9 -2.59 -2.72
10 -3.19 -2.62
11 -3.31 -3.20
12 -3.44 -3.11
13 -1.68 -2.93
14 -2.95 -2.70
15 -3.38 -3.39
16 -3.01 -2.94
17 -3.58 -3.53
18 -3.13 -3.18
19 -2.30 -3.19
20 -2.69 -3.02
21 -2.73 -2.89
22 -3.63 -3.74
23 -2.20 -3.01
24 -3.59 -3.10
25 -3.78 -3.23
26 -3.08 -2.87
27 -3.79 -3.34
28 -3.21 -2.88
29 -3.49 -2.59
30 -3.57 -2.67
31 -3.39 -3.21
32 -3.06 -3.00
33 -2.93 -2.94
34 -3.26 -3.31
35 -2.29 -3.34
36 -3.72 -3.23
37 -2.92 -3.13
38 -3.63 -3.51
39 -3.51 -3.34
40 -3.23 -3.39
41 -3.97 -3.32
42 -3.41 -3.19
43 -3.12 -2.99
44 -2.54 -2.42
45 -3.03 -3.31
46 -3.12 -3.15
47 -4.48 -3.87
48 -4.60 -3.62
49 -4.29 -3.43
50 -3.65 -3.12
51 -2.91 -3.52
52 -2.40 -3.40
53 -3.60 -3.10
54 -3.74 -3.50
55 -3.76 -3.16
56 -1.95 -3.10
57 -4.15 -3.79
58 -3.79 -3.40
이와 같이 육종가(경주성적 및 혈통데이터를 이용하여 BLUP(Best Linear Unbiased Prediction) 방법으로 추정한 육종가가 정확할수록 회귀모형의 정확도도 상승하는 것으로 보인다(도 19).
잔차분석(Residual analysis)이란, 회귀모형에 대한 충족여부에 대한 검토 절차로써, 관찰치와 추정치의 차이를 나타낸다. 잘 적합된 모형에서 나온 잔차는 정규분포를 따라야 하고, 분산이 일정하며, 특별한 추세를 보이지 않아야 한다.
도 21은 X 축에 본 발명의 경주능력 관련 유전체 육종가 예측을 위한 회귀모형으로 적합된 값, Y축에 적합된 값과 실데이타의 차이인 잔차를 보여주는 차트이다. 본 발명의 유전체 육종가 예측을 위한 회귀모형에서 오차는 평균 0이고, 분산이 일정한 정규분포임을 가정하였으므로 본 차트의 그래프는 기울기가 0인 직선이 관측되는 것이 이상적이다. 도 21에서는 그 기울기가 0에 가까운 것을 볼 수 확인할 수 있다. 또한 도 22는 잔차가 정규분포를 잘 따르는지 확인하기 위한 차트로써, 정규분포에 가까운 결과를 확인할 수 있다. 도 23는 X 축에 본 발명의 유전체 육종가 예측을 위한 회귀모형으로 적합된 값, Y 축에 표준화잔차를 보여주며 기울기가 0인 직선이 이상적인 차트로써, 그 결과 기울기가 0에 가까운 것을 확인할 수 있었다. 도 24는 X 축에 리버리지(Leverage), Y축에 표준화잔차를 보여주는 차트이다. 표준화 잔차를 보면 어떤 점들이 이상치(outlier)에 해당하는지 알 수 있는데, 표준화된 잔차(Standardized residual)가 지나치게 크거나 작은 점들은 이상치일 가능성이 크다고 본다. 리버리지(Leverage)는 설명변수가 얼마나 극단에 치우져 있는지를 뜻한다. 예를 들어, 다른 데이타의 X 값은 모두 1 내지 10 사이의 값인데, 특정 데이타만 9999의 값을 갖고 있다면, 해당 데이타의 리버리지는 큰 값을 갖게 된다. 이런 데이타는 입력에 오류가 있거나, 해당 범위의 설명변수 값을 갖는 데이타를 더 보충해야 하는 등의 작업이 필요한지 확인하여 살펴보아야 한다. 본 발명의 도 24는 이러한 이상치가 확인되지 않았다.
이상에서 살펴본 바와 같이, 본 발명의 유전체 육종가를 예측하기 위한 회귀모형의 잔차분석 결과, 오류가 없는 것으로 확인되었다.
이상 설명한 바와 같은 본 발명은, 유전체 연관분석을 통해 말의 경주능력과 깊은 관련이 있는 SNP를 28개를 선발하고, 이 중 13개의 SNPs를 이용하여 경주마 선발을 위한 경주능력 관련 유전체 육종가 예측이 가능한 회귀모형을 제공한다.

Claims (4)

  1. -2.871 + 0.08916 × BIEC2_1026200 유전자형 값 + 0.15014 × BIEC2_1029757 유전자형 값 + 0.15014 × BIEC2_330101 유전자형 값 + -0.09905× BIEC2_330509 유전자형 값 + 0.17936 × BIEC2_330575 유전자형 값 + -0.22790 × BIEC2_330691 유전자형 값 + 0.08524 × BIEC2_417495 유전자형 값 + -0.13067 × BIEC2_527879 유전자형 값 + 0.08571× BIEC2_554645 유전자형 값 + 0.08156 × BIEC2_569862 유전자형 값 + -0.07506 × BIEC2_732151 유전자형 값 + -0.07957 × BIEC2_814518 유전자형 값 + -0.13404 × BIEC2_906777 유전자형 값
    으로 이루어지는 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법.
  2. 제 1항에 있어서,
    상기 유전자형 값은 하기와 같이 각각의 SNPs 유전자형에 해당하는 유전자형 값으로 이루어지는 것을 특징으로 하는 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법.
    Figure 112015055242176-pat00029
  3. 제 1항 또는 제 2항에 있어서,
    상기 경주마 유전체 육종가의 예측방법은 BIEC2_1026200, BIEC2_1029757, BIEC2_330101, BIEC2_330509, BIEC2_330575, BIEC2_330691, BIEC2_417495, BIEC2_527879, BIEC2_554645, BIEC2_569862, BIEC2_732151, BIEC2_814518, BIEC2_906777 SNP 각각의 유전자형을 확인하는 단계;
    상기 확인된 SNP 각각의 유전자형에 해당하는 유전자형 값을 회귀모형에 대입하여 유전체 육종가를 도출하는 단계; 를 포함하여 구성되는 것을 특징으로 하는 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법.
  4. 제 3항에 의해 예측된 유전체 육종가가 0을 기준으로 작은 값일수록 우수한 경주능력을 갖는 경주마로 판단하는, 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법을 통한 우수한 경주마 선발방법.
KR1020130168153A 2013-12-31 2013-12-31 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법 및 이를 이용한 우수한 경주마 선발방법 KR101568352B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130168153A KR101568352B1 (ko) 2013-12-31 2013-12-31 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법 및 이를 이용한 우수한 경주마 선발방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130168153A KR101568352B1 (ko) 2013-12-31 2013-12-31 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법 및 이를 이용한 우수한 경주마 선발방법

Publications (2)

Publication Number Publication Date
KR20150078620A KR20150078620A (ko) 2015-07-08
KR101568352B1 true KR101568352B1 (ko) 2015-11-12

Family

ID=53791118

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130168153A KR101568352B1 (ko) 2013-12-31 2013-12-31 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법 및 이를 이용한 우수한 경주마 선발방법

Country Status (1)

Country Link
KR (1) KR101568352B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101825497B1 (ko) 2016-08-22 2018-02-05 (주)다우진유전자연구소 단일염기다형성을 이용한 말의 모계혈통 확인 및 운동능력 예측용 키트 및 이를 이용한 말의 모계혈통 확인 및 운동능력 예측 방법
CN110747280A (zh) * 2019-11-28 2020-02-04 中国农业科学院北京畜牧兽医研究所 与马寒冷适应性相关的te标记及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BMC Genomics. 2010, vol. 11:552, pp. 1-10.

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101825497B1 (ko) 2016-08-22 2018-02-05 (주)다우진유전자연구소 단일염기다형성을 이용한 말의 모계혈통 확인 및 운동능력 예측용 키트 및 이를 이용한 말의 모계혈통 확인 및 운동능력 예측 방법
CN110747280A (zh) * 2019-11-28 2020-02-04 中国农业科学院北京畜牧兽医研究所 与马寒冷适应性相关的te标记及其应用

Also Published As

Publication number Publication date
KR20150078620A (ko) 2015-07-08

Similar Documents

Publication Publication Date Title
Bouwman et al. Meta-analysis of genome-wide association studies for cattle stature identifies common genes that regulate body size in mammals
Ai et al. Adaptation and possible ancient interspecies introgression in pigs identified by whole-genome sequencing
Cole et al. Genome-wide association analysis of thirty one production, health, reproduction and body conformation traits in contemporary US Holstein cows
Wang et al. Detection of selection signatures in Chinese Landrace and Yorkshire pigs based on genotyping-by-sequencing data
Zhang et al. Genome-wide association study for longevity with whole-genome sequencing in 3 cattle breeds
An et al. Multiple association analysis of loci and candidate genes that regulate body size at three growth stages in Simmental beef cattle
Johnsson et al. Genetical genomics of behavior: a novel chicken genomic model for anxiety behavior
Schröder et al. A genome‐wide association study for quantitative trait loci of show‐jumping in Hanoverian warmblood horses
AU2009284493A1 (en) Methods for determining a breeding value based on a plurality of genetic markers
Zhang et al. Genome-wide association studies (GWAS) identify a QTL close to PRKAG3 affecting meat pH and colour in crossbred commercial pigs
Kiser et al. Validation of 46 loci associated with female fertility traits in cattle
Dos Santos et al. Identification of candidate genes for reactivity in Guzerat (Bos indicus) cattle: A genome-wide association study
Nanaei et al. Whole-genome resequencing reveals selection signatures associated with milk production traits in African Kenana dairy zebu cattle
Ponsuksili et al. Integrated Genome-wide association and hypothalamus eQTL studies indicate a link between the circadian rhythm-related gene PER1 and coping behavior
Shorter et al. Quantitative trait mapping in Diversity Outbred mice identifies two genomic regions associated with heart size
Liu et al. A single-nucleotide mutation within the TBX3 enhancer increased body size in Chinese horses
Jardim et al. Association analysis for udder index and milking speed with imputed whole-genome sequence variants in Nordic Holstein cattle
JP2020074781A (ja) 乳生産量を改善するための雌牛の育種方法
Teng et al. Performance of whole genome prediction for growth traits in a crossbred chicken population
KR20140118236A (ko) 돼지의 유두 수 판단용 snp 마커 및 이의 용도
Zhang et al. Analysis on the desert adaptability of indigenous sheep in the southern edge of Taklimakan Desert
Cao et al. Whole genome analyses reveal significant convergence in obsessive-compulsive disorder between humans and dogs
Qiao et al. Population genetic structure analysis and identification of backfat thickness loci of Chinese synthetic Yunan pigs
KR101568352B1 (ko) 경주능력 관련 SNPs로 구축된 회귀모형을 이용한 경주마 유전체 육종가의 예측방법 및 이를 이용한 우수한 경주마 선발방법
Shin et al. Multiple genes related to muscle identified through a joint analysis of a two-stage genome-wide association study for racing performance of 1,156 thoroughbreds

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant