KR20200041533A - Real-time breeding value and genetic parameter evaluation system - Google Patents
Real-time breeding value and genetic parameter evaluation system Download PDFInfo
- Publication number
- KR20200041533A KR20200041533A KR1020180121680A KR20180121680A KR20200041533A KR 20200041533 A KR20200041533 A KR 20200041533A KR 1020180121680 A KR1020180121680 A KR 1020180121680A KR 20180121680 A KR20180121680 A KR 20180121680A KR 20200041533 A KR20200041533 A KR 20200041533A
- Authority
- KR
- South Korea
- Prior art keywords
- information
- genetic
- phenotype
- breeding
- interest
- Prior art date
Links
- 230000002068 genetic effect Effects 0.000 title claims abstract description 78
- 238000009395 breeding Methods 0.000 title claims description 53
- 230000001488 breeding effect Effects 0.000 title claims description 52
- 238000011156 evaluation Methods 0.000 title claims description 33
- 238000000034 method Methods 0.000 claims abstract description 26
- 239000008280 blood Substances 0.000 claims abstract description 20
- 210000004369 blood Anatomy 0.000 claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims description 24
- 244000144972 livestock Species 0.000 claims description 21
- 238000010171 animal model Methods 0.000 claims description 9
- 241000894007 species Species 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 6
- 230000007613 environmental effect Effects 0.000 claims description 5
- 239000000654 additive Substances 0.000 claims description 3
- 230000000996 additive effect Effects 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 2
- 230000006872 improvement Effects 0.000 claims description 2
- 230000003068 static effect Effects 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 description 13
- 238000012937 correction Methods 0.000 description 10
- 239000006185 dispersion Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 241001465754 Metazoa Species 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 3
- 241000282817 Bovidae Species 0.000 description 2
- 238000000219 DamID Methods 0.000 description 2
- 241000282374 Puma concolor Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000004941 influx Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000010223 real-time analysis Methods 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000777300 Congiopodidae Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002922 epistatic effect Effects 0.000 description 1
- 235000021050 feed intake Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 235000013594 poultry meat Nutrition 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000003307 slaughter Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B10/00—ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
Landscapes
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Business, Economics & Management (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Economics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Business, Economics & Management (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Mining & Mineral Resources (AREA)
- Marine Sciences & Fisheries (AREA)
- Animal Husbandry (AREA)
- Agronomy & Crop Science (AREA)
- Animal Behavior & Ethology (AREA)
- Physiology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
본 발명은 효율적인 농축산물의 육종을 위해 육종가를 추정하는 시스템에 대한 발명이다.The present invention is an invention for a system for estimating breeding prices for efficient breeding of agricultural and livestock products.
가축을 개량하기 위해서 개량할 표현형에 대한 육종가의 추정은 선발 및 도태의 기준으로 자리매김하였으며, 이는 과거 표현형기반의 육종 방법보다 효과적인 것으로 판명이 나 있다. 이를 위해 육종학 분야에서는 동물모형(Animal Model)을 기반으로 한 혼합모형(Mixed Model)을 사용하여 육종가를 추정할 수 있고, 이에 따른 표준 오차를 계산하여 관심 있는 집단의 표현형을 육종하기 위한 지표로 사용해왔다.In order to improve livestock, the estimation of breeding prices for phenotypes to be improved has been established as a basis for selection and selection, which proved to be more effective than past phenotype-based breeding methods. To this end, in the field of breeding, the breeding price can be estimated using a mixed model based on an animal model, and the standard error is calculated accordingly to be used as an index for breeding the phenotype of the interested group. I have done
위의 육종가는 분석에 쓰인 집단으로부터 추정된 가치이며 집단 내에서 상대적인 가치이기 때문에, 혼합모형을 계산한 집단에 새로운 개체들이 유입되거나 이주하여 집단유전학적인 유전자풀(Gene pool) 이 달라진 경우, 같은 개체의 육종가의 값은 달라진다. 즉, 집단의 정보가 갱신될 경우마다 개체 각각의 육종가와 집단의 유전 모수를 매번 다시 측정하는 번거로움이 생긴다.Since the above breeders are estimated values from the groups used in the analysis and are relative values within the groups, the same individuals are subject to changes in the group genetic gene pool due to the influx or migration of new individuals to the group for which the mixed model was calculated. The value of the breeding price of is different. In other words, whenever the information of the group is updated, the breeding cost of each individual breeder and the genetic parameter of the group are measured again.
육종가의 경우 최대한 많은 혈연관계로 이루어진 집단을 통합하여 육종가를 추정해야만 정확도를 늘릴 수 있고(통계적인 측면), 실질적인 분석 능력을 갖춘 전문 기관이 아닌 농장주와 개량주들은 데이터를 다루는데 한계가 있으므로(기술적인 측면) 분석 대행기관을 통해서 보유하고 있는 개체를 평가를 수행했었고 이로 인해 실제 현장에 맞는 육종전략을 세우고 개량을 진행하기에 불편함이 따른다.In the case of breeders, it is possible to increase the accuracy only by estimating the breeder's value by integrating as many kinship groups as possible (statistical aspects), and farmers and improvers who are not specialized institutions with practical analytical skills have limitations in handling data (technical) Personnel side) Evaluation of the individuals possessed through the analysis agency was carried out, and as a result, it was inconvenient to develop and improve a breeding strategy suitable for the actual site.
육종가 추정을 위한 혼합모형식을 풀기 위해서는 혈연관계 행렬(NRM, Numeric Relationship Matrix)가 필요한데 이를 위해선 개체 이름, 아비 이름과 어미 이름으로 이루어진 가계 정보(Pedigree 혹은 PED 데이터 형식)가 필요하며 이 가계 정보에는 흔히 일어날 수 있는 가계오류, 예를 들어 중복개체오류, 성별 오류, 순환 오류들 없이 무결해야 한다. 이를 위해 상용 소프트웨어 및 무료 소프트웨어의 라이브러리들이 존재하나 오류확인과 함께 오류 개체를 일괄처리하여 실시간 분석에 이용하기엔 맞지 않는다.위의 문제를 해결하기 위해 각 개체의 혈연 정보, 표현형 정보를 관계형 데이터베이스에서 관리하고, 주기적인 데이터 갱신을 가능하게 한 후, 특정 시점에 특정 조건에 맞는 개체들의 현재 정보를 추출하고, 혈연관계 행렬 보정, 유전능력 평가를 실시간 일괄적으로 수행할 수 있는 방법을 고안하였으며, 일반 사용자가 편리하게 유전능력 평가를 수행할 수 있도록 하였다. In order to solve the mixed model for breeder estimation, a Numeric Relationship Matrix (NRM) is required. To do this, household information (Pedigree or PED data format) consisting of the entity name, father name and mother name is required. It should be flawless without common household errors, such as duplicate object errors, gender errors, and circular errors. To this end, there are libraries of commercial software and free software, but it is not suitable for real-time analysis by processing error objects together with error checking. In order to solve the above problem, blood relation information and phenotype information of each object are managed in a relational database. In addition, after enabling periodic data update, a method was devised to extract current information of individuals meeting specific conditions at a specific time, and to perform a kinetic matrix correction and genetic ability evaluation in real time . It was made possible for the general user to conveniently perform the genetic ability evaluation.
본 발명에 따른 제1 측면은, 농축산물 품종개량을 위한 육종가 및 유전모수평가 정보 제공방법에 있어서, 농축산물의 표현형 정보, 개체 부가정보, 계통 정보, 종(species)정보, 가계정보를 포함하는 데이터베이스를 준비하는 단계; 관심 계통 및 관심 표현형을 선택하는 단계; 관심 계통 및 관심 표현형에 대한 가계 정보 및 개체 부가정보를 포함하는 육종가 산정 및 유전모수 산정에 필요한 정보를 산출하는 단계; 상기 표현형 정보, 가계 정보 및 개체 부가정보를 반영하여 육종가 및 유전모수를 추정하는 단계; 상기 추정된 육종가 및 유전모수를 디스플레이하는 단계;를 포함하는 것을 특징으로 하는 육종가 및 유전모수 평가정보 제공방법을 포함한다.In a first aspect of the present invention, in a method for providing breeding price and genetic parameter evaluation information for improving a variety of agricultural and livestock products, a database including phenotype information of agricultural and livestock products, individual additional information, system information, species information, and household information Preparing a step ; Selecting a line of interest and a phenotype of interest ; Calculating information necessary for calculating a breeding price and calculating a genetic parameter including household information and additional information about an individual of interest and phenotype of interest; Estimating breeding prices and genetic parameters by reflecting the phenotype information, household information, and individual additional information; And displaying the estimated breeding price and genetic parameter.
제2 측면은 제1항에 있어서, 상기 육종가 산정 및 유전모수 산정에 필요한 정보는 혈연관계행렬를 포함하는 것을 특징으로 하는 육종가 및 유전모수를 추정하는 단계를 포함한다. 여기서 혈연관계행렬는 가계 정보에 대한 오류가 수정된 것임을 특징으로 한다. The second aspect of
본 발명은 개체의 혈연관계, 표현형 정보등이 저장되어 있는 관계형 데이터베이스에서 실시간으로 유전능력(육종가 또는 유전모수)를 평가하는 것을 목적으로 한다. 특히 가계정보에서 일어날 수 있는 성별오류, 중복개체 정보의 오류 및 자손이 선조 세대의 부모로 표시된 사이클 오류를 찾아 일괄적으로 수정 또는 제거하여 사용자가 보다 용이하게 유전능력을 평가할 수 있도록 하는 것을 목적으로 한다.The present invention aims to evaluate the genetic ability (breeder or genetic parameter) in real time in a relational database in which an individual's blood relations, phenotype information, and the like are stored. In particular, it aims to make it easier for the user to evaluate genetic abilities by finding and correcting or removing the gender errors that can occur in household information, errors in duplicate object information, and cycle errors where offspring are marked as the parents of the ancestors. do.
본 발명을 통해, 분석 기술을 보유하지 않은 일반 가축 사육 농가 및 기관에서 유전능력평가를 통해 우수개체를 선발하는 등의 주체적인 육종이 가능하다. 현장에서는 가축의 출하와 새로운 자손집단의 생성 및 타 집단으로부터의 개체 유입 등으로 변화된 집단의 유전적 구성을 즉각적으로 반영하여 개체와 집단의 데이터를 관리하고, 특정 데이터가 변경되면 기존의 데이터 세트와 함께 실시간 분석이 가능해짐으로써 빠른 변화에 맞게 대응하여 유연한 육종전략을 수립할 수 있다. 또한, 선발과 함께 교배계획 시에도 응용하여 관심 있는 여러 형질의 평균 개량량을 고려시 집단전체 성적을 향상하는데 기여할 수 있다. Through the present invention, it is possible to subjectively breed such as selecting excellent individuals through genetic ability evaluation in general livestock breeding farms and institutions that do not possess analysis technology. In the field, the genetic composition of the changed group is immediately reflected due to the shipment of livestock, the creation of new descendants, and the influx of individuals from other groups, and the data of the individual and the group is managed immediately. Together, real-time analysis is possible, allowing for flexible breeding strategies in response to rapid changes. In addition, it can be applied to selection and mating planning to contribute to improving the overall group performance when considering the average improvement of various traits of interest.
도1은 유전능력평가를 위한 전체프로세스의 모식도이다.
도2는 동물 모형식에 들어갈 계통 및 표현형 선택 사용자 화면에 대한 예시이다.
도3은 임의의 가계도와 가계 보정 프로세스에 대한 예시이다
도4은 계산된 유전모수 및 육종가가 표시되는 화면에 대한 예시이다.
도5는 선택된 계통 및 표현형에 대한 기초통계량 표와 차트에 대한 예시이다.1 is a schematic diagram of the overall process for evaluating genetic ability.
2 is an example of a user's screen for selecting a phylogeny and phenotype to enter an animal model.
3 is an example of an arbitrary family tree and the household calibration process.
4 is an example of a screen on which the calculated genetic parameters and breeding prices are displayed.
5 is an example of a basic statistics table and chart for the selected phylogeny and phenotype.
본 발명은 농축산물 품종개량을 위한 육종가 및 유전모수 평가정보 제공방법에 있어서,농축산물의 표현형 정보, 개체 부가정보, 계통 정보, 종(species)정보, 가계정보를 포함하는 데이터베이스를 준비하는 단계;관심 계통 및 관심 표현형을 선택하는 단계;관심 계통 및 관심 표현형에 대한 가계 정보 및 개체 부가정보를 포함하는 육종가 산정 및 유전모수 산정에 필요한 정보를 산출하는 단계;상기 표현형 정보, 가계 정보 및 개체 부가정보를 반영하여 육종가 및 유전모수를 추정하는 단계;The present invention provides a method for providing breeding price and genetic parameter evaluation information for improving a variety of agricultural and livestock products , preparing a database including phenotype information of agricultural and livestock products, individual additional information, system information, species information, and household information; Selecting a line of interest and a phenotype of interest; calculating information necessary for calculating a breeder's price and calculating a genetic parameter including household information and individual additional information for the line of interest and the phenotype of interest; the phenotype information, household information, and individual additional information Estimating breeding price and genetic parameters by reflecting;
상기 추정된 육종가 및 유전모수를 디스플레이하는 단계;를 포함하는 것을 특징으로 하는 육종가 및 유전모수 평가 정보 제공방법 및 이를 수행하는 장치를 제공한다.It provides a method for providing a breeding price and genetic parameter evaluation information, and an apparatus for performing the same, including the step of displaying the estimated breeding price and genetic parameter.
또한, 본 발명의 일 실시예에 따른 육종가 및 유전모수 정보 제공장치는,In addition, the breeder and genetic parameter information providing apparatus according to an embodiment of the present invention,
농축산물의 표현형 정보, 개체 부가정보, 계통 정보, 종(species)정보, 가계정보를 포함하는 데이터베이스를 메모리에 저장 관리하는 평가항목 저장부;An evaluation item storage unit that stores and manages a database including phenotypic information of agricultural and livestock products, individual additional information, system information, species information, and household information in memory;
관심 계통 및 관심 표현형을 선택하는 평가항목 선택부; An evaluation item selection unit for selecting a line of interest and a phenotype of interest ;
관심 계통 및 관심 표현형에 대한 가계 정보 및 개체 부가정보를 포함하는 육종가 산정 및 유전모수 산정에 필요한 정보를 산출하여 상기 메모리에 저장관리하는 평가항목 산출부;An evaluation item calculating unit for calculating and storing and managing information necessary for breeding price calculation and genetic parameter calculation including household information and additional information on individuals of interest and phenotype of interest;
상기 표현형 정보, 가계 정보 및 개체 부가정보를 반영하여 육종가 및 유전모수를 추정하여 상기 메모리에 저장하는 평가항목 평가부; An evaluation item evaluation unit that estimates a breeding price and a genetic parameter by reflecting the phenotype information, household information, and individual additional information and stores it in the memory ;
상기 추정된 육종가 및 유전모수를 디스플레이하는 평가결과 제공부; An evaluation result providing unit displaying the estimated breeding price and genetic parameter;
제어부, 메모리, 사용자인터페이스를 포함한다. It includes a control unit, memory, and user interface .
제어부는 육종가 및 유전모수 평가 정보 제공장치의 각 구성 요소들의 전반적인 제어를 담당한다. 또한 다른 구성요소의 전부 또는 일부의 기능을 포함하도록 구현될 수 있다.The control unit is in charge of overall control of each component of the breeder and genetic parameter evaluation information providing device. It may also be implemented to include all or part of the functionality of other components.
사용자 인터페이스는 육종가 및 유전모수 평가 정보 제공장치의 각종 정보나 데이터베이스를 입출력하기 위한 수단으로서, 키보드, 버튼, 터치스크린, 통신포트등 사용자가 장치에 정보나 데이터를 입력하거나 출력하기 위한 다양한 수단을 포함할 수 있다. The user interface is a means for inputting and outputting various information or a database of a breeder and genetic parameter evaluation information providing device, and includes various means for a user to input or output information or data to the device, such as a keyboard, a button, a touch screen, and a communication port. can do.
평가결과 제공부는 평가결과를 디스플레이는 하는 과정을 수행하며, 통상적인 전자표시장치를 포함할 수 있다. The evaluation result providing unit performs a process of displaying the evaluation results, and may include a conventional electronic display device.
제어부는 농축산물의 표현형 정보, 개체 부가정보, 계통 정보, 종(species)정보, 가계정보를 포함하는 데이터베이스를 준비하고, 관심 계통 및 관심 표현형을 선택 또는 입력받아 관심 계통 및 관심 표현형에 대한 가계 정보 및 개체 부가정보를 포함하는 육종가 산정 및 유전모수 산정에 필요한 정보를 산출하고 상기 표현형 정보, 가계 정보 및 개체 부가정보를 반영하여 육종가 및 유전모수를 추정하며, 상기 추정된 육종가 및 유전모수를 디스플레이하는 단계를 수행할 수 있도록 전반적인 제어를 수행할 수 있다. The controller prepares a database including phenotype information of agricultural and livestock products, object additional information, system information, species information, and household information, and selects or inputs a system of interest and a phenotype of interest, and receives household information about the system of interest and phenotype of interest, and and calculating the information required for breeders calculated and estimated genetic parameters containing the object side information, and reflects the phenotypic information, family information, and the object side information, and estimates the breeders and genetic parameters, displaying the estimated breeding values and genetic parameters Overall control can be performed so that can be performed.
상기 메모리에는 육종가 및 유전모수 평가 정보 제공장치의 동작에 필요한 정보나 프로그램이 저장될 수 있으며, 관심 계통 및 관심 표현형에 대한 가계 정보 및 개체 부가정보를 포함하는 육종가 산정 및 유전모수 산정에 필요한 정보,상기 표현형 정보, 가계 정보 및 개체 부가정보를 반영하여 추정된 육종가 및 유전모수등이 저장될 수 있다.In the memory, information or programs necessary for the operation of the breeder and genetic parameter evaluation information providing apparatus may be stored, and information necessary for calculating the breeding price and calculating the genetic parameters, including household information about the line of interest and phenotype of interest, and additional object information, The estimated breeding price and genetic parameters may be stored by reflecting the phenotype information, household information, and individual additional information.
상기 “유전모수(genetic parameter)”란 용어는 유전적 수량 형질(遺傳的數量形質)을 해석할 때 표본에서 실측(實測)에 의하여 얻어진 수치는 통계량(統計量)이지만 이것으로서 추측되는 모집단(母集團)의 유전적 속성(遺傳的屬性)을 말한다.The term “ genetic parameter ” is a statistical quantity, but a population that is estimated as this is a numerical value obtained by measurement in a sample when interpreting a genetic quantity trait. Refers to the genetic property of the group.
또한, "혈연계수(relationship coefficient)”란 용어는 2개체간 유전 구성의 유사성을 상대적으로 나타낸 지수이다. 가축이나 실험 동물의 품종이나 품종 내의 계통에 있어서 개체 간의 혈연 관계의 정도를 나타내는 경우에 쓰인다.In addition, the term " relationship coefficient " is an index that indicates the similarity of the genetic composition between two individuals. It is used to indicate the degree of blood relationship between individuals in a breed or lineage of a livestock or an experimental animal. .
"육종가(breeding value)”란 용어는 특정 교잡의 차대에 있어서 특정한 양적형질의 평균치를 가리킨다. 또는 이는 부모로서의 가치이며 즉, 다음세대에 유전자를 전달해주는 공여자로서의 가치를 뜻한다. The term " breeding value " refers to the mean value of a particular quantitative trait in the next generation of a particular hybrid, or it is the value of the parent, that is, the value of the donor to pass the gene to the next generation.
아울러, “유전력(heritability)”양친의 형질이 자손에게 전달되는 정도를 나타낸다. 흔히 전체의 표현형 분산중 개체간의 유전적 차이에 기인하는 분산의 비로 표현된다. 즉 유전력은 유전분산/ 표현형분산으로 계산되며, 신장, 체중 등 소위 양적형질은 다수인 미소효과를 갖춘 유전자(다원유전자: poly gene)에 의한 지배를 받고, 또한 환경에 의한 효과도 섞이면서 표현하게 된다. 따라서 양적형질변화는 연속적인 분포가 되는데, 그 분포를 표현형 분산(phenotypic variance)이라 한다. 유전분산은 표현형분산 중, 유전자형 차이에 따른 분산을 유전분산(또는 유전자분산)이라고 한다. 유전분산은 다시 상가유전분산(additive genetic variance), 우성분산(dominance variance), 상위분산(epistatic variance)으로 분활된다.In addition, it indicates the extent to which “ heritability ” parental traits are transmitted to offspring. It is often expressed as the ratio of variance due to genetic differences among individuals among the whole phenotype variance. In other words, the genetic power is calculated as the genetic dispersion / phenotype dispersion , and so-called quantitative traits such as height and weight are dominated by genes with multiple micro-effects (polygenes), and also express the effects of the environment mixed together. . Therefore, the quantitative trait change becomes a continuous distribution, and the distribution is called a phenotypic variance . In genotype dispersion, variance according to genotype differences among phenotypic dispersions is called genome dispersion (or genome dispersion) . The genetic variance is further divided into additive genetic variance, dominance variance, and epistatic variance.
"환경분산"은 표현형분산중에서 집단속의 개체가 놓여져 있는 환경변화에 기인하는 부분을 의미한다. "Environmental dispersion" refers to the part of phenotypic dispersion caused by environmental changes in which individuals in a group are placed.
"표현형"은 농축산물의 해당 표현형을 개량시 경제적 가치에 영향을 줄 수 있는 관심이 되는 형질로, 연속형 경제 형질을 의미한다. 농축산물의 표현형은 돼지는 산자수, 등지방 두께 또는 몸무게 일 수 있으며, 젖소의 경우 우유 생산량일 수 있으며, 양의 경우 털의 무게, 산자수 또는 몸무게일 수 있다. 가금류에 있어서, 닭 또는 오리의 경우 산자수, 몸무게 또는 난중(계란 무게)일 수 잇으며, 말 또는 경주마의 경우 점프 능력, 산자수, 경주능력이 될 수 있다. "Phenotype" is a trait of interest that can affect the economic value of improving the corresponding phenotype of agricultural and livestock, and refers to a continuous economic trait. The phenotype of agricultural and livestock products can be either mountain lion, dorsal fat, or weight, and cows can be milk production, and sheep can be hair weight, mountain lion weight, or body weight. For poultry, for chickens or ducks, it can be either an antelope, weight or egg weight (egg weight), and for a horse or racehorse, it can be a jumping ability, an antelope, or a racing ability.
옥수수, 벼, 밀, 보리, 콩, 감자, 고구마 등을 포함하는 작물의 경우에는 수확지수(수량/총 생산량), 수량 육종(열매 갯수) 또는 광합성 효율관련 (잎의 너비, 각도 등) 형질일 수 있다.In the case of crops including corn, rice, wheat, barley, soybean, potato, and sweet potato, harvest index (quantity / total production), quantity breeding (number of fruits), or photosynthesis efficiency (leaf width, angle, etc.) You can.
"개체의 부가정보"는 표현형중 육종가가 차지하는 분산(설명력)만을 정확히 얻기 위해, 즉 모형을 보정하기위해 식에 넣어주는 고정효과들을 의미하며 표현형 또는 농축산물의 특징에 따라 의미있는 고정효과는 달라질 수 있다. "Additional information of an individual" means fixed effects that are put into an expression to accurately obtain only the variance (explanatory power) of breeders among the phenotype, that is, to correct the model. have.
구제적으로, 어미 나이, 동기군(같이 태어난 형제), 사료섭취량, 출생 계절,출생 연도, 일조량, 성별일 수 있다.Remedy, it can be the mother's age, age group (brothers born together), feed intake, season of birth, year of birth, sunshine, gender.
데이터베이스를 준비하는 단계 및 통계적분석을 위한 분석모듈Analysis module for preparing database and statistical analysis
본 방법은 가축의 표현형정보와 가계 정보 및 개체 부가정보를 포함하는 데이터베이스와 자체적으로 만든 가계 정보 오류를 점검 및 제거하는 혈통 보정 모듈 그리고 통계 소프트웨어 R의 패키지들이 필요하며 이를 이용하여 관심 있는 가축 종(Breed) 및 계통(Line 혹은 Stock) 에 대해 기초통계량과 유전 모수 및 육종가를 제공하는 과정으로 구성되며, 이러한 과정은 메모리부 및 제어부를 통해 수행된다.This method requires a database of livestock phenotype information, household information, and additional information about the animals, a pedigree correction module that checks and eliminates self-generated household information errors, and packages of statistical software R. It consists of a process of providing basic statistics, genetic parameters, and breeders for Breed) and line (Line or Stock), and this process is performed through the memory unit and the control unit.
육종가 산정 및 유전모수 산정에 필요한 정보를 산출하는 단계Calculating the information needed to calculate breeders' prices and genetic parameters ;;
선택된 가축 계통의 표현형, 가계 정보 및 모델 식을 보정하기 위해 고정효과로 (Fixed Effect) 이용될 개체의 부가정보들을 데이터베이스에서 추출한다. 이러한 과정은 평가항목저장부를 통해 수행된다.In order to correct the phenotype, household information and model expression of the selected livestock system, additional information of the object to be used as a fixed effect is extracted from the database. This process is performed through the evaluation item storage.
데이터베이스Article Integration Information
Database
예) 시산일령, 시산난중 등) 및
동적 표현형(시간이 흐름에 따라 측정값이 변화되는 표현형들, 예) 체중, 정강이 길이 등),
개체 부가정보 (예) 성별, 출생일, 모색, 도축 월령, 뿔의 유무 등)
계통 및 종 정보
가계 정보(개체 이름, 아비 이름, 어미 이름) Static phenotype required to solve animal model equations (fixed phenotype measurements in one measurement)
E.g. trial age, trial difficulties, etc.) and
Dynamic phenotypes (phenotypes whose measurements change over time, e.g. weight, shank length, etc.),
Additional information of the individual (example) gender, date of birth, search, age of slaughter, presence of horns, etc.)
Lineage and species information
Household information (object name, father's name, mother's name)
<출처>https://cran.r-project.org/web/packages/pedigree/index.html Package that corrects household information in order to calculate the number of households and produce a relationship matrix by receiving household information from which errors have been removed
<Source> https://cran.r-project.org/web/packages/pedigree/index.html
<출처>https://cran.r-project.org/web/packages/nadiv/index.html, http://github.com/matthewwolak/nadiv Package that creates blood-related matrix using corrected household information
<Source> https://cran.r-project.org/web/packages/nadiv/index.html , http://github.com/matthewwolak/nadiv
<출처>https://potatobreeding.cals.wisc.edu/software/
https://cran.r-project.org/web/packages/rrBLUP/index.html Animal set by the analyst with blood-related matrix, phenotype data, and additional information
<Source> https://potatobreeding.cals.wisc.edu/software/
https://cran.r-project.org/web/packages/rrBLUP/index.html
가계정보에 대한 오류를 수정하는 단계Steps to correct errors in household information
가계정보를 활용하는 유전능력분석에선 혈연관계 행렬(Numeric Relationship Matrix, NRM)를 만들기 위해서 이를 사전 점검하고 정리하는 작업이 선행되어야 한다. 잘못된 혈통을 그대로 사용했을 시 행렬이 만들어지지 않을 수 있으며 설령 만들어진다 하더라도 잘못된 개체 몇 마리의 오류는 해당 개체뿐만 아닌 혈연관계가 이어진 모든 개체에 잘못된 유전능력 평가를 초래한다.Genetic capacity analysis using household information requires prior inspection and arrangement to create a Numeric Relationship Matrix (NRM). If the wrong lineage is used as it is, the matrix may not be created, and even if it is made, the error of several wrong individuals results in an incorrect genetic ability evaluation in all the individuals related to the blood relationship.
본 발명의 실시간 유전능력 분석 방법에 들어있는 혈통 오류 보정 모듈은 크게 3가지 유형의 오류관련 정보를 찾고 더 나아가 농축산 품종 관리 데이터베이스관리와 분석 효율에 맞춰, 오류와 관련된 개체 정보들을 일괄적으로 삭제 또는 교정을 해준다.The lineage error correction module included in the real-time genetic ability analysis method of the present invention largely finds three types of error-related information and further deletes individual information related to errors collectively in accordance with the management and analysis efficiency of the livestock breed management database. Correction.
모든 가계정보는 PED 형식( 개체ID, SireID, DamID )의 포맷유형으로 데이터베이스에서 추출한 뒤 아래의 과정을 거쳐 일괄 수정된다.All household information is formatted in PED format (individual ID, SireID, DamID), extracted from the database, and then modified in bulk through the following procedure.
1. 중복 개체 오류1. Duplicate object error
중복 정보는 추출한 가계정보의 첫번째 열인 개체ID에 여러번 같은 개체가 나오는 경우를 의미한다. 단순하게 보이는 중복 오류에는 몇 가지 종류의 서브 타입으로 나눌 수 있으며 각 서브타입 마다 처리방식은 아래와 같다..Duplicate information means that the same entity appears multiple times in the first column of the extracted household information. There are several kinds of sub-types for simple-looking duplicate errors, and the processing method for each subtype is as follows.
1-1 부모의 결측치가 없는 경우1-1 No missing parent
개체의 아비정보 및 어미 정보가 다른 개체의 아비정보 및 어미정보와 일치하는 지 판단하고, 아비정보와 어미정보가 모두 일치하면 개체정보를 삭제하고, 아비정보 또는 어미정보중 어느 하나만 일치하는 경우 일치하지 않는 아비정보 또는 어미정보는 결측치로 교체하여 가계정보에 대한 오류를 수정할 수 있다.It is determined whether the avi information and the parent information of the object match the avi information and the mother information of the other object, and if both the avi information and the mother information match, the object information is deleted, and if only one of the avi information or the mother information matches Absent information or mother information that is not used can be replaced with missing values to correct errors in household information.
보다 구체적으로는, 중복 개체의 Sire와 Dam의 두 아이디 모두 동일한 경우, 정확히 같은 개체가 반복으로 입력된 것이기 때문에 하나의 데이터만 남기고 삭제를 진행한다.More specifically, when both IDs of Sire and Dam of the duplicate object are the same, the exact same object is repeatedly input, so only one data is left and deletion is performed.
<중복 개체의 부모 아이디가 모두 동일한 경우 오류수정방법><How to correct errors when duplicate objects have the same parent ID>
중복 개체의 Sire와 Dam의 두 아이디가 모두 상이한 경우, 부모의 아이디가 다른데 개체가 두 번 이상 나타난다면 어떤 데이터가 실제 데이터인지 구분이 어려워진다. 여러 정보 중 하나의 정보만을 택하여 행렬 안의 혈연관계가 단편적으로 끊어지는 것을 막을 순 있겠지만 추측으로 판단할 수 없으므로 이 경우 중복된 모든 개체들의 모든 가계정보를 지워 잘못 계산된 혈연행렬 계산을 방지한다.If both IDs of Sire and Dam of the duplicated object are different, it is difficult to distinguish which data is the actual data if the parental ID is different and the object appears more than once. By selecting only one of several pieces of information, it is possible to prevent the kinship relationship in the matrix from being fragmented, but since it cannot be determined by guessing, in this case, all family information of all the duplicated objects is erased to prevent incorrectly calculated kinetic matrix calculation.
<중복 개체의 부모 아이디가 모두 다를 경우 오류수정방법><How to correct errors when the parent IDs of duplicate objects are all different>
중복 개체의 두 부모 중 하나의 아이디가 상이한 경우,두 개체 이상의 중복 개체에서 그들의 Sire(혹은 Dam)의 ID가 고정일 경우에는 등록자의 정보가 신뢰할만하다 판단되므로 개체 정보를 지우지 않고 Dam(혹은 Sire)의 ID만 결측치로 교체하여 혈연관계가 끊김을 방지할 수 있다. If the ID of one of the two parents of a duplicate object is different, and if the ID of their Sire (or Dam) is fixed in two or more duplicate objects, the information of the registrant is judged to be reliable, so the Dam (or Sire) is not deleted. By replacing only the ID of the missing value, it is possible to prevent the blood relationship from being broken.
<중복 개체들의 부모 중 하나의 아이디만 다를 경우><If only one ID of the parent of the duplicate objects is different>
1-2 부모 중 한쪽이라도 결측치가 존재 하는 경우1-2 If one of the parents has missing values
개체의 결측치가 아닌 부모 정보를 합칠 때 각각 하나로 수렴되는 경우는 하나의 개체 데이터로 결측이 아닌 부모정보를 합쳐 개체의 정보를 보존한다. When converging each of the parent information that is not the missing value of the object, if each converges, the information of the object is preserved by combining the non-missing parent information with one object data.
<결측치 아닌 부모 정보를 통합 가능한 경우 오류수정방법><Error correction method when it is possible to integrate non-missing parent information>
결측치가 아닌 부모 정보를 합칠 때 각 Sire와 Dam이 하나로 수렴되지 않는 경우 하나로 통일되지 않는 Sire와 Dam의 정보는 결측치로 나타낸다.When summing parent information that is not a missing value, when each Sire and Dam do not converge into one, the information of Sire and Dam that are not united as one is expressed as a missing value.
<결측치 아닌 부모 정보를 통합 불가능한 경우 오류수정방법><How to correct errors when it is impossible to integrate parental information that is not missing>
2. 순환오류2. Circulation error
순환오류는 자손이 선조의 부모로 다시 나타나는 오류이다. 이 경우는 가계정보가 가질 수 있는 심각한 오류 중 하나로, 바로 윗세대 부모와 자손만 고려해야 하는 부분부터 불특정한 세대수 차이가 나는 선조와 혈연관계로 이어진 자손들 간의 관계를 모두 짚어보아야만 확인되는 오류이다.이 경우 출원인은 전산학 및 컴퓨터 공학에서의 자료구조 중 그래프 순회 및 탐색 방법 알고리즘을 응용하여 오류로 판단되는 개체들 리스트를 찾을 수 있었다. Cyclic errors are those in which the offspring reappear as ancestor parents. In this case, it is one of the serious errors that household information can have, and it is an error that can be confirmed only by examining all the relationships between the ancestors and ancestors who have unspecified number of generations from the part that only parents and offspring should consider. In this case, the applicant was able to find a list of individuals judged as errors by applying a graph traversal and search method algorithm among data structures in computational and computer science.
특정개체의 정보가 아비 또는 어미정보중 어느 하나와 일치하는 경우는 해당되는 개체정보를 삭제하고, 개체의 아비정보와 어미정보가 동일한 개체는 타 개체의 아비정보 및 어미정보에서 확인된 성별로 변경하고,When the information of a specific object matches either the father or the mother information, the corresponding entity information is deleted, and the object with the same parent and father information of the individual is changed to the gender identified in the father and father information of other individuals. and,
특정개체의 아비 또는 어미로 확인된 개체의 정보가 상기 특정개체의 자손으로 확인된 개체의 정보와 동일한 경우는 상기 특정개체에 대한 정보를 삭제하여 가계정보에 대한 오류를 수정할 수 있다.When the information of the individual identified as the father or mother of the specific object is the same as the information of the individual identified as a descendant of the specific object, the information on the specific object may be deleted to correct an error in the household information.
보다 구체적으로, 한 개체의 부(또는 모)가 개체 자신과 동일한 경우에도 오류 처리가 필요하다. 이러한 경우에 해당 개체를 삭제한다.More specifically, error handling is required even when the part (or parent) of an object is the same as the object itself. In this case, the object is deleted.
<개체 자기 자신의 순환오류를 수정하는 방법><How to correct an individual's own circular error>
부와 모가 서로 동일한 ID인 경우는 순환오류 이자 일종의 성별 오류도 포함인 경우이다. 이 단계에서 해당 부모 정보를 가진 개체를 제거하지 않더라도 성별 오류에서 제거가 가능하기 때문에 한쪽의 Sire나 Dam으로 취합하고 나머지는 결측으로 채워넣는다. 이때 한쪽 성별로 취합 할 때는 기존 개체의 부모로써 쓰인 정보를 찾아 성별이 고정되어있는 경우에만 가능하며 고정이 되어있지 않은 경우에는 두 정보를 결측치로 대체하여 가계정보에 대한 오류를 수정할 수 있다.When the parent and the parent have the same ID, it is a circular error and also includes a gender error. At this stage, even if the object with the parent information is not removed, it can be removed from the gender error, so it is collected with one Sire or Dam and the other is filled with missing. At this time, when collecting by one gender, it is possible to find information used as the parent of an existing entity and only if the gender is fixed, and if it is not fixed, the information on the household information can be corrected by replacing the two information with missing values.
<순환오류 중 부모가 동일한 오류를 수정하는 방법> <How to fix the same error among parents among circular errors>
자손이 선조의 부모로 다시 나타나는 순환 오류는 계층적인 구조가 무너져서 이어진 개체들간의 선조와 자손의 구분이 불가능해 진다. 결국 어디서부터 Human error가 들어간건지 장담할 수 있는 부분이 아니기에 혈연 정보의 손실이 크더라도 서클 오류에 가담하고 있는 모든 개체들을 가계정보로부터 들어내 제거함으로써 순환오류를 해결 할 수 있다.The cyclical error in which the offspring reappears as the ancestor's parent makes the hierarchical structure collapse, making it impossible to distinguish between the ancestors and offspring. In the end, since it is not a part to guarantee where a human error has entered, even if the loss of blood information is large, it is possible to solve the circular error by removing and removing all the individuals participating in the circle error from the household information.
<자손이 선조의 부모로 다시 나타나는 순환오류의 예시> < Example of a circular error in which the offspring reappear as parents of the ancestors>
3. 성별 오류3. Gender error
PED형식으로 추출한 데이터는 Sire(부) Dam(모)의 정보를 지니고 있으므로 부모로써 역할을 가진 개체는 모두 성별 정보를 지니고 있는 셈이다. 간혹 특정개체가 부로써 이용되다가 다른 개체의 모로써 이용되는 경우를 성별 오류를 지닌 가계정보라고 할 수 있다.Since the data extracted in the PED format has the information of Sire (part) and Dam (parent), all the individuals who have roles as parents have gender information. Sometimes, when a specific object is used as a wealth and then used as a parent of another object, it can be said that the household information has a gender error.
특정개체의 아비정보와 또 다른 개체의 어미정보가 일치하는 경우, 상기 개체들의 아미정보와 어미정보는 결측치로 대체하여 가계정보에 대한 오류를 수정할 수 있다.In the case where the parent information of a specific object and the mother information of another object match, the mother information and the mother information of the objects can be replaced with missing values to correct errors in the household information.
보다 구체적으로, 두 성별을 가진 개체 중 비율이 큰 성별이 95% 미만 나타나는 경우 위와 같은 경우는 성별이 명확하게 기록되지 않았다고 보여지기 때문에 가계데이터 전체의 혼란을 막기위해 아비나 혹은 어미로 사용된 정보를 모두 결측치로 대체하여 가계정보에 대한 오류를 수정할 수 있다.More specifically, if the proportion of individuals with two genders is less than 95%, the information used as an abina or mother to prevent confusion in the entire household data because it seems that the gender was not clearly recorded in the above case. You can correct errors in household information by replacing all of them with missing values.
<특정 개체의 성별을 한쪽 성별로 보기 어려운 경우 오류수정방법><How to correct errors when it is difficult to see the gender of a specific individual as one gender>
다만, 두 성별을 가진 개체 중 비율이 큰 성별이 95% 이상 나타나는 경우자손을 많이 가질 수 있는 종에선 그만큼 부모로써 많은 기록이 만들어지는 것이므로 개체 삭제보단 최대한 개체를 살리는 것이 효율적이다. 이를 위해 특정 개체에 대해서 모든 성별 갯수와 비율을 계산하여 한쪽으로 치우친 비율이 95% 이상일 때 나머지 성별 5%를 오류로 판단한다. 허나 5%의 성별 기록을 바꿔주게 되면 반대 성을 가진 부모의 정보가 문제가 생기므로 5% 오류의 부모 정보를 결측치 처리한다.However, if a large proportion of the individuals with two genders appear more than 95%, in the species that can have many descendants, as many records are created as parents, it is efficient to save the individuals as much as possible. To this end, the number and ratio of all genders are calculated for a specific individual, and when the ratio biased to one side is more than 95%, the remaining 5% of sex is judged as an error. However, if the gender record of 5% is changed, the information of the parents with the opposite sex will cause a problem, so the parental information with the error of 5% will be missing.
< 5%미만의 잘못된 성별 정보를 수정 가능한 경우 오류수정방법><How to correct errors when it is possible to correct wrong gender information of less than 5%>
혈연관계행렬를 제작하는 단계Steps of creating a blood relation matrix
상기 육종가 산정 및 유전모수 산정에 필요한 정보는 혈연관계행렬를 포함할 수 있다. 혈연관계행렬을 제작하기 위해, 추출된 가계 정보에서 오류를 찾아 해당 개체를 제거하고 가계도를 보정하고, 혈연관계 행렬을 제작하기 위한 두 번째 전처리 단계로써 오류정보가 제거된 PED 데이터 형식(개체 이름, 아비 이름, 아미 이름) 의 가계 정보에 조상세대(Founder) 정보를 추가하고 세대 수를 계산하며 가계를 세대 순으로 오름차순 정렬을 한 후 보정된 새로운 PED 데이터를 생성한다. 이와 같은 보정작업은 R 통계 소프트웨어의 'pedigree' 패키지를 사용할 수 있으나, 이에 한정되지 않는다. 보정된 가계 데이터로 혈연관계행렬을 생성할 수 있으며, 일예로 R 통계 소프트웨어의 'nadiv'패키지를 사용할 수 있다. The information necessary for calculating the breeding price and calculating the genetic parameters may include a blood relation matrix . In order to produce a kinship matrix, the PED data format (object name, where the erroneous information is removed) is removed as a second pre-processing step to find the error in the extracted household information, remove the object, correct the pedigree, and create the kinship matrix. After adding the founder information to the household information of the father's name, the mother's name), calculating the number of households, sorting the households in ascending order of households, and then generating new corrected PED data. The 'pedigree' package of R statistical software may be used for the correction, but is not limited thereto. A kinship matrix can be generated from the corrected household data, and the 'nadiv' package of R statistics software can be used as an example.
<임의의 가계도와 가계 보정의 예시><Arbitrary pedigree chart and example of household correction>
기초통계량을 제공하는 단계Steps to provide basic statistics
모델 식을 위해 선택한 종 및 계통의 표현형과 데이터베이스로부터 추출된 부가정보의 기초통계량 정보를 표와 차트로 요약 제공할 수 있다.The basic statistics information of the phenotype of the species and lineage selected for model expression and the additional information extracted from the database can be summarized in tables and charts.
기초통계량은 아래의 예시처럼 가계내의 개체, 아비와 어미 수, 성별 요약, 세대수 계산, 표현형의 개수, 평균, 표준편차 등이 포함될 수 있다.Basic statistics can include individuals in the household, number of fathers and mothers, gender summary, number of households, number of phenotypes, mean, and standard deviation, as in the example below.
동물모델의 적용Application of animal models
가계 정보를 이용하여 혈연관계행렬을 만들고 혈연관계를 이용한 혼합모형으로 유전 모수 및 육종가를 추정한다. 이를 위해 해당계통내의 혈통정보를 활용하여 개체의 유전효과를 고려한 동물모델(animal model)을 적용할 수 있다. Generating the relationship matrix using household information and estimating the genetic parameters and breeding value as a mixed model using the relationship. To this end, an animal model considering the genetic effect of an individual may be applied using lineage information in the corresponding system.
동물모델은 일예로서,다음과 같이 적용될 수 있다.As an example, the animal model can be applied as follows.
y=μ+sex+α+εy = μ + sex + α + ε
y: 관심 형질의 측정치(종속변수) y: Measurement of the trait of interest (dependent variable)
μ: 관심 혈질의 전체평균 μ: Overall mean of the blood quality of interest
sex: 각 개체의 성별 고정효과 sex: sex fixed effect of each individual
α : 각 개체의 임의상가적 유전효과(ex, 육종가) α: Random additive genetic effect of each individual (ex, breeding price)
ε : 환경효과 ε: Environmental effect
가계정보에 대한 오류를 수정하는 단계Steps to correct errors in household information
가계정보를 활용하는 유전능력분석에선 혈연관계 행렬(Numeric Relationship Matrix, NRM)를 만들기 위해서 이를 사전 점검하고 정리하는 작업이 선행되어야 한다. 잘못된 혈통을 그대로 사용했을 시 행렬이 만들어지지 않을 수 있으며 설령 만들어진다 하더라도 잘못된 개체 몇 마리의 오류는 해당 개체뿐만 아닌 혈연관계가 이어진 모든 개체에 잘못된 유전능력 평가를 초래한다.Genetic capacity analysis using household information requires prior inspection and arrangement to create a Numeric Relationship Matrix (NRM). If the wrong lineage is used as it is, the matrix may not be created, and even if it is made, the error of several wrong individuals results in an incorrect genetic ability evaluation in all the individuals related to the blood relationship.
본 발명의 실시간 유전능력 분석 방법에 들어있는 혈통 오류 보정 모듈은 크게 3가지 유형의 오류관련 정보를 찾고 더 나아가 농축산 품종 관리 데이터베이스관리와 분석 효율에 맞춰, 오류와 관련된 개체 정보들을 일괄적으로 삭제 또는 교정을 해준다.The lineage error correction module included in the real-time genetic ability analysis method of the present invention largely finds three types of error-related information and further deletes individual information related to errors collectively in accordance with the management and analysis efficiency of the livestock breed management database. Correction.
모든 가계정보는 PED 형식( 개체ID, SireID, DamID )의 포맷유형으로 데이터베이스에서 추출한 뒤 아래의 과정을 거쳐 일괄 수정된다.All household information is formatted in PED format (individual ID, SireID, DamID), extracted from the database, and then modified in bulk through the following procedure.
1. 중복 개체 오류1. Duplicate object error
중복 정보는 추출한 가계정보의 첫번째 열인 개체ID에 여러번 같은 개체가 나오는 경우를 의미한다. 단순하게 보이는 중복 오류에는 몇 가지 종류의 서브 타입으로 나눌 수 있으며 각 서브타입 마다 처리방식은 아래와 같다..Duplicate information means that the same entity appears multiple times in the first column of the extracted household information. There are several kinds of sub-types for simple-looking duplicate errors, and the processing method for each subtype is as follows.
1-1 부모의 결측치가 없는 경우1-1 No missing parent
개체의 아비정보 및 어미 정보가 다른 개체의 아비정보 및 어미정보와 일치하는 지 판단하고, 아비정보와 어미정보가 모두 일치하면 개체정보를 삭제하고, 아비정보 또는 어미정보중 어느 하나만 일치하는 경우 일치하지 않는 아비정보 또는 어미정보는 결측치로 교체하여 가계정보에 대한 오류를 수정할 수 있다.It is determined whether the avi information and the parent information of the object match the avi information and the mother information of the other object, and if both the avi information and the mother information match, the object information is deleted, and if only one of the avi information or the mother information matches Absent information or mother information that is not used can be replaced with missing values to correct errors in household information.
보다 구체적으로는, 중복 개체의 Sire와 Dam의 두 아이디 모두 동일한 경우, 정확히 같은 개체가 반복으로 입력된 것이기 때문에 하나의 데이터만 남기고 삭제를 진행한다.More specifically, when both IDs of Sire and Dam of the duplicate object are the same, the exact same object is repeatedly input, so only one data is left and deletion is performed.
<중복 개체의 부모 아이디가 모두 동일한 경우 오류수정방법><How to correct errors when duplicate objects have the same parent ID>
중복 개체의 Sire와 Dam의 두 아이디가 모두 상이한 경우, 부모의 아이디가 다른데 개체가 두 번 이상 나타난다면 어떤 데이터가 실제 데이터인지 구분이 어려워진다. 여러 정보 중 하나의 정보만을 택하여 행렬 안의 혈연관계가 단편적으로 끊어지는 것을 막을 순 있겠지만 추측으로 판단할 수 없으므로 이 경우 중복된 모든 개체들의 모든 가계정보를 지워 잘못 계산된 혈연행렬 계산을 방지한다.If both IDs of Sire and Dam of the duplicated object are different, it is difficult to distinguish which data is the actual data if the parental ID is different and the object appears more than once. By selecting only one of several pieces of information, it is possible to prevent the kinship relationship in the matrix from being fragmented, but since it cannot be determined by guessing, in this case, all family information of all the duplicated objects is erased to prevent incorrectly calculated kinetic matrix calculation.
<중복 개체의 부모 아이디가 모두 다를 경우 오류수정방법><How to correct errors when the parent IDs of duplicate objects are all different>
중복 개체의 두 부모 중 하나의 아이디가 상이한 경우,두 개체 이상의 중복 개체에서 그들의 Sire(혹은 Dam)의 ID가 고정일 경우에는 등록자의 정보가 신뢰할만하다 판단되므로 개체 정보를 지우지 않고 Dam(혹은 Sire)의 ID만 결측치로 교체하여 혈연관계가 끊김을 방지할 수 있다. If the ID of one of the two parents of a duplicate object is different, and if the ID of their Sire (or Dam) is fixed in two or more duplicate objects, the information of the registrant is judged to be reliable, so the Dam (or Sire) is not deleted. By replacing only the ID of the missing value, it is possible to prevent the blood relationship from being broken.
<중복 개체들의 부모 중 하나의 아이디만 다를 경우><If only one ID of the parent of the duplicate objects is different>
1-2 부모 중 한쪽이라도 결측치가 존재 하는 경우1-2 If one of the parents has missing values
개체의 결측치가 아닌 부모 정보를 합칠 때 각각 하나로 수렴되는 경우는 하나의 개체 데이터로 결측이 아닌 부모정보를 합쳐 개체의 정보를 보존한다. When converging each of the parent information that is not the missing value of the object, if each converges, the information of the object is preserved by combining the non-missing parent information with one object data.
<육종가 및 유전모수 추정하는 단계><Steps to estimate breeding price and genetic parameters>
<동물 혼합모형(Animal Mixed Model, 왼쪽)과 혼합모형식(MME, 오른쪽)><Animal Mixed Model (left) and Mixed Model (MME, right)>
앞서 제작한 혈연관계행렬을 이용하여 BLUP 분석 방법으로 상기의 동물혼합모형방정식을 풀고 육종가, 예측오차분산( Prediction Error Variance, PEV), 육종가 정확도를 추정할 수 있다.Using the blood-related matrix produced earlier, the above-described animal mixing model equation can be solved using the BLUP analysis method to estimate the breeding price, prediction error variance (PEV), and breeding price accuracy.
REML 분석 방법을 이용하여 유전모수인 유전분산 (Genetic variance), 환경분산 (Environment variance), 유전력 (Heritability)를 추정할 수 있다.The REML analysis method can be used to estimate genetic parameters such as genetic variance, environmental variance, and heritability.
이러한 과정은 평가항목 평가부에 의하여 수행될 수 있다.Such a process may be performed by the evaluation item evaluation unit.
상기 분석알고리즘은 이미 잘 알려져 있으므로 여기서는 자세한 설명은 생략한다.Since the analysis algorithm is well known, detailed description thereof is omitted here.
육종가 및 유전모수를 표시하는 단계Steps for displaying breeder price and genetic parameters
추정된 유전 능력 값들은 동물모형식에 이용되었던 값들과 함께 평가항목 제공부를 통해 표시가능하다.The estimated genetic capacity values can be displayed through the evaluation item providing unit along with the values used in the animal model.
사용자는 전체 개체 중 관심있는 개체만을 검색할 수 있으며(Search 기능), 육종가가 높은 순서대로 개체를 정렬하여 교배 및 선발에 이용하기 수월하도록 출력 가능하다. The user can search only the objects of interest from among the entire objects (Search function), and it is possible to sort the objects in the order of the highest breeder and output them for easy use for mating and selection.
Claims (9)
농축산물의 표현형 정보, 개체 부가정보, 계통 정보, 종(species)정보, 가계정보를 포함하는 데이터베이스를 준비하는 단계;
관심 계통 및 관심 표현형을 선택하는 단계;
관심 계통 및 관심 표현형에 대한 가계 정보 및 개체 부가정보를 포함하는 육종가 산정 및 유전모수 산정에 필요한 정보를 산출하는 단계;
상기 표현형 정보, 가계 정보 및 개체 부가정보를 반영하여 육종가 및 유전모수를 추정하는 단계;
상기 추정된 육종가 및 유전모수를 디스플레이하는 단계;를
포함하는 것을 특징으로 하는 육종가 및 유전모수 평가정보 제공방법.In the method of providing breeding price and genetic parameter evaluation information for improving agricultural and livestock varieties,
Preparing a database including phenotypic information of agricultural and livestock products, individual additional information, lineage information, species information, and household information;
Selecting a line of interest and a phenotype of interest ;
Calculating information necessary for calculating a breeding price and calculating a genetic parameter including household information and additional information about an individual of interest and phenotype of interest;
Estimating breeding prices and genetic parameters by reflecting the phenotype information, household information, and individual additional information;
Displaying the estimated breeding price and genetic parameters;
Breeding value and genetic parameter evaluation information providing method comprising the.
The method of claim 1, wherein the information necessary for calculating the breeding price and calculating the genetic parameter includes a blood-related matrix .
The method of claim 1, wherein the phenotype information includes a static phenotype and a dynamic phenotype .
<수학식1>
y=μ+sex+α+ε
y: 관심 형질의 측정치(종속변수)
μ: 관심 혈질의 전체평균
sex: 각 개체의 성별 고정효과
α : 각 개체의 임의상가적 유전효과(육종가)
ε : 환경효과 및 잔차The method of claim 1, wherein the breeding price is calculated through the animal model of Equation 1 below.
<Equation 1>
y = μ + sex + α + ε
y: Measurement of the trait of interest (dependent variable)
μ: Overall mean of the blood quality of interest
sex: sex fixed effect of each individual
α: Random additive genetic effect of each individual (breeding price)
ε: Environmental effect and residual
The method of claim 1, wherein the step of displaying the breeding price and the genetic parameter for a predetermined phenotype is characterized by arranging and displaying the individuals in the order of breeding price.
농축산물의 표현형 정보, 개체 부가정보, 계통 정보, 종(species)정보, 가계정보를 포함하는 데이터베이스를 메모리에 저장 관리하는 평가항목 저장부;
관심 계통 및 관심 표현형을 선택하는 평가항목 선택부;
관심 계통 및 관심 표현형에 대한 가계 정보 및 개체 부가정보를 포함하는 육종가 산정 및 유전모수 산정에 필요한 정보를 산출하여 상기 메모리에 저장관리하는 평가항목 산출부;
상기 표현형 정보, 가계 정보 및 개체 부가정보를 반영하여 육종가 및 유전모수를 추정하여 상기 메모리에 저장하는 평가항목 평가부;
상기 추정된 육종가 및 유전모수를 디스플레이하는 평가결과 제공부;를
포함하는 것을 특징으로 하는 육종가 및 유전모수 정보 제공장치.
In the apparatus for providing breeding price and genetic parameter information for the improvement of agricultural and livestock varieties,
An evaluation item storage unit that stores and manages a database including phenotypic information of agricultural and livestock products, individual additional information, system information, species information, and household information in memory;
An evaluation item selection unit for selecting a line of interest and a phenotype of interest ;
An evaluation item calculating unit for calculating and storing and managing information necessary for breeding price calculation and genetic parameter calculation including household information and additional information on individuals of interest and phenotype of interest;
An evaluation item evaluation unit that estimates a breeding price and a genetic parameter by reflecting the phenotype information, household information, and individual additional information and stores it in the memory ;
An evaluation result providing unit displaying the estimated breeding price and genetic parameter;
Breeding value and genetic parameter information providing device comprising a.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180121680A KR20200041533A (en) | 2018-10-12 | 2018-10-12 | Real-time breeding value and genetic parameter evaluation system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180121680A KR20200041533A (en) | 2018-10-12 | 2018-10-12 | Real-time breeding value and genetic parameter evaluation system |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200041533A true KR20200041533A (en) | 2020-04-22 |
Family
ID=70472807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180121680A KR20200041533A (en) | 2018-10-12 | 2018-10-12 | Real-time breeding value and genetic parameter evaluation system |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20200041533A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112862076A (en) * | 2021-02-25 | 2021-05-28 | 江苏兴牧农业科技有限公司 | Breeding method, model and breeding system for increasing qualified egg number of yellow-feather broiler breeder |
-
2018
- 2018-10-12 KR KR1020180121680A patent/KR20200041533A/en not_active Application Discontinuation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112862076A (en) * | 2021-02-25 | 2021-05-28 | 江苏兴牧农业科技有限公司 | Breeding method, model and breeding system for increasing qualified egg number of yellow-feather broiler breeder |
CN112862076B (en) * | 2021-02-25 | 2024-04-09 | 江苏兴牧农业科技有限公司 | Breeding method, model and breeding system for improving qualified egg number of yellow feather broiler breeder |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bouwman et al. | Maternal and social genetic effects on average daily gain of piglets from birth until weaning | |
Willson et al. | Estimation of genetic parameters for pork quality, novel carcass, primal-cut and growth traits in Duroc pigs | |
Menge et al. | Bio-economic model to support breeding of indigenous chicken in different production systems | |
Faria et al. | Genetic correlations between categorical morphological traits in Nelore cattle by applying Bayesian analysis under a threshold animal model | |
Michel et al. | Contrasting the effects of maternal and behavioral characteristics on fawn birth mass in white-tailed deer | |
Chen et al. | Genomic-based genetic parameters for resilience across lactations in North American Holstein cattle based on variability in daily milk yield records | |
Hallmann et al. | An exploration of differences in the scaling of life history traits with body mass within reptiles and between amniotes | |
Jemberu et al. | Population, biomass, and economic value of small ruminants in Ethiopia | |
Migose et al. | Accuracy of estimates of milk production per lactation from limited test-day and recall data collected at smallholder dairy farms | |
Folla et al. | Genetics of linear type traits scored on young foals belonging to the Italian Heavy Draught Horse breed | |
Ulukan et al. | Survey data on European organic multi-species livestock farms | |
Grzesiak et al. | Estimation of dairy cow survival in the first three lactations for different culling reasons using the Kaplan–Meier method | |
Wang et al. | Investigating the relationship between fluctuations in daily milk yield as resilience indicators and health traits in Holstein cattle | |
Krupová et al. | Methods for calculating economic weights of important traits in sheep | |
KR20200041533A (en) | Real-time breeding value and genetic parameter evaluation system | |
Thumba et al. | Estimating livestock greenhouse gas emissions: existing models, emerging technologies and associated challenges | |
Doeschl-Wilson et al. | Using mechanistic animal growth models to estimate genetic parameters of biological traits | |
CN106172082A (en) | For the method analyzing poultry growth performance automatic measurement system noisy data | |
Klingström et al. | Beyond the hype: using AI, big data, wearable devices, and the internet of things for high-throughput livestock phenotyping | |
Dubois et al. | Optimization of breeding schemes for sport horses | |
Carleton et al. | Reproductive success of Eastern Bluebirds (Sialia sialis) varies with the timing and severity of drought | |
Rotondo | Predicting body weight with linear body measurements in beef calves | |
Sartori et al. | Genotype by environment interaction and selection response for milk yield traits and conformation in a local cattle breed using a reaction norm approach | |
Mallam et al. | PREDICTION OF BODY WEIGHT OF NIGERIAN NON-DESCRIPT GOATS FROM MORPHOMETRIC TRAITS USING CLASSIFICATION AND REGRESSION TREE MODEL | |
Din et al. | A model for estimating how variability of biological parameters affects economic factors in an integrated turkey farm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |