CN118633552B - 一种鱼类种质资源调配处理方法 - Google Patents
一种鱼类种质资源调配处理方法 Download PDFInfo
- Publication number
- CN118633552B CN118633552B CN202411116589.1A CN202411116589A CN118633552B CN 118633552 B CN118633552 B CN 118633552B CN 202411116589 A CN202411116589 A CN 202411116589A CN 118633552 B CN118633552 B CN 118633552B
- Authority
- CN
- China
- Prior art keywords
- matrix
- fish
- trait
- paternal
- genetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K61/00—Culture of aquatic animals
- A01K61/10—Culture of aquatic animals of fish
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/80—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
- Y02A40/81—Aquaculture, e.g. of fish
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Artificial Intelligence (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Environmental Sciences (AREA)
- Mathematical Physics (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Marine Sciences & Fisheries (AREA)
- Zoology (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Physiology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明属于鱼类种质资源管理的技术领域,公开了一种鱼类种质资源调配处理方法,包括如下步骤,S1、建立鱼类种质资源保护区;S2、构建鱼类种质资源性状遗传数据库并冷冻保存对应的鱼类精子;S3、采集并确定母本性状遗传特征矩阵;S4、采用优化后的K‑最近邻算法,得到筛选出的父本精子选择集;S5、从父本精子选择集中选择一份对应的冷冻父本精子对待受精亲本母鱼的卵子进行受精。本发明采用建立鱼类种质资源保护区和冷冻保存鱼类精子的方式管理种质资源,并通过建立鱼类种质资源性状遗传数据库作为匹配源,采用优化后的‑最近邻算法匹配亲本,得到距离最远的父本精子对亲本母鱼的卵子进行受精,能够有效维护生物多样性。
Description
技术领域
本发明属于鱼类种质资源管理的技术领域,尤其涉及一种鱼类种质资源调配处理方法。
背景技术
目前鱼类种质资源管理的主要方向之一,就是育种,也就是将需求性状通过育种集中到子代上,获得优良品种,长此以往,这个过程中极易造成相当多的基因丢失,不利于维护生物多样性,且还容易造成近亲繁殖,而为了避免近亲繁殖,维护生物多样性,需要在鱼类种质资源管理阶段做好工作,在种质资源调配的时候,不仅仅要满足商业需求进行育种调配,还要从生态发展的角度进行育种调配。
中国专利(CN117322372A)公开了一种基于群组配对的水产动物分子辅助育种方法,包括以下步骤:构建以群组为单元的基础群体;获取留种群体和留种个体的选择指数;筛选留种群组和留种个体;根据选择指数进行留种配对;建立留种配对系谱数据库;通过系谱数据进行育种。本发明通过引入群组为单元的概念,以群组为基础,构建核心育种群组,分子标记的方式进行抽样选种,采用优胜劣汰的末位淘汰,可以选出优质亲本,有利于提高遗传获得,后续通过采用群组中的多个雄性个体和多个配对组进行旋转交配,再建立育种群组的系谱数据库,可以有效避免传统群体选育中的近亲繁殖造成的种质衰退,有利于优良基因的聚合,提高种苗的品质。该发明主要聚焦于满足商业需求进行育种,并未考虑生物多样性的维护。
发明内容
为了克服上述背景技术所述的技术问题,本发明提供一种鱼类种质资源调配处理方法,采用建立鱼类种质资源保护区和冷冻保存鱼类精子的方式管理种质资源,并通过建立鱼类种质资源性状遗传数据库作为匹配源,采用优化后的K-最近邻算法匹配亲本母鱼和冷冻精子,选择距离大于预先实验阈值且距离最远的父本精子对待受精亲本母鱼的卵子进行受精,能够有效维护生物多样性。
本发明的技术方案在于:一种鱼类种质资源调配处理方法,包括步骤S1到S5。
S1、建立鱼类种质资源保护区,根据鱼类群体类型,实现网格化管理。
S2、根据父本性状确定基因信息,对性状基因数据进行编码,生成父本性状遗传特征矩阵,构建鱼类种质资源性状遗传数据库并冷冻保存对应的鱼类精子。
S3、采集并确定亲本母鱼性状对应的基因信息,编码后得到母本性状遗传特征矩阵。
S4、采用优化后的K-最近邻算法,将母本性状遗传特征矩阵与鱼类种质资源性状遗传数据库内所有的父本性状遗传特征矩阵分别进行一对一匹配计算,选择距离大于预先实验阈值且距离最远的对匹配对,得到筛选出的父本精子选择集。
S5、从父本精子选择集中选择一份对应的冷冻父本精子对待受精亲本母鱼的卵子进行受精。
进一步地,根据性状确定基因信息的方式为采用基因测序或单核苷酸多态性(SNP)分型。
进一步地,步骤S4中优化后的-最近邻算法,包括步骤S4101到S4103。
S4101、使用Frobenius范数计算矩阵与矩阵之间的距离为:
,
其中,,,为对应位置的权重,为矩阵在第行列的元素,为矩阵在第行列的元素。
S4102、构建距离向量,。
S4103、从距离向量的元素中选择值最大的个元素,也就是距离最远的对匹配对,,得到筛选出的父本精子选择集。
进一步地,位置权重从性状偏好权重矩阵中按位置提取的元素,,性状偏好权重矩阵内默认元素值全为1,而如果需要育种,则按照性状对应基因编码的位置,调大性状偏好权重矩阵内部对应的元素值。
进一步地,在步骤S4中预先实验阈值由步骤S4201到S4203确定。
S4201、根据具体鱼类种群提取亲本后,繁殖到子代并引入外来子代亲本后,再繁殖至第三代的孙代样本随机抽样个样本并采集基因信息及编码后,得到个性状遗传特征矩阵。
S4202、使用Frobenius范数计算从个样本中任取两个样本的性状遗传特征矩阵和之间的距离。
S4203、预先实验阈值为从个中提取的最大值。
进一步地,为了批量处理亲本母鱼,得到多个性状遗传特征矩阵,步骤S4中优化后的-最近邻算法,包括步骤S4301到S4303。
S4301、使用Frobenius范数计算矩阵与矩阵之间的距离:
,
其中,,,为对应位置的权重,为矩阵在第行列的元素,为矩阵在第行列的元素。
S4302、构建距离矩阵:
。
S4303、从距离矩阵的元素中选择个值最大的元素,也就是距离最远的对匹配对,,得到筛选出的父本精子选择集。
进一步地,在步骤S4中还包括步骤S4401到S4403。
S4401、如果得到筛选出的父本精子选择集为空,则拒绝此次种质资源调配,并向外采集新的种质资源。
S4402、对新采集的种质资源进行采用基因测序或SNP分型,并对得到的性状基因数据进行编码,生成新的父本性状遗传特征矩阵。
S4403、采用优化后的K-最近邻算法,将新的父本性状遗传特征矩阵匹配鱼类种质资源性状遗传数据库所有父本性状遗传特征矩阵,只有当大于预先实验阈值时,才将该新采集的种质资源加入到鱼类种质资源性状遗传数据库并冷冻保存对应的鱼类精子,完成鱼类种质资源的更新。
进一步地,将步骤S4改为:采用改进后的-最近邻算法,在将母本性状遗传特征矩阵与鱼类种质资源性状遗传数据库所有父本性状遗传特征矩阵分别进行一对一匹配计算时,按照所选鱼类所选性状对应的单倍体内染色体的数量将母本性状遗传特征矩阵拆分为若干个母本性状遗传特征子矩阵,同时将计算时的父本性状遗传特征矩阵也按照所选鱼类所选性状对应的单倍体内染色体的数量拆分为若干个父本性状遗传特征子矩阵,计算出所有与之间的距离,提取所有中的最小值作为所对应的这对母本性状遗传特征矩阵与父本性状遗传特征矩阵的距离的代表值,选择距离大于预先实验阈值且代表距离最远的对匹配对,得到筛选出的父本精子选择集。
进一步地,改进后的-最近邻算法,包括步骤S4501到S4505。
S4501、拆分母本性状遗传特征矩阵为若干个,,,拆分父本性状遗传特征矩阵为若干个,,,其中为子矩阵数量且数值等于,为所选性状对应的单倍体内染色体的数量。
S4502、使用Frobenius范数计算任意两个矩阵与之间的距离:
,
其中,,,为对应位置的权重,为矩阵在第行列的元素,为矩阵在第行列的元素。
S4503、取母本性状遗传特征矩阵与父本性状遗传特征矩阵拆分出的子矩阵计算出的所有中的最小值作为取母本性状遗传特征矩阵与父本性状遗传特征矩阵距离的代表值,也就是。
S4504、将母本性状遗传特征矩阵分别与鱼类种质资源性状遗传数据库中的父本性状遗传特征矩阵计算出来的距离代表值作为元素值,构建出距离矩阵,。
S4505、从距离矩阵的元素中选择个值最大的元素,也就是距离最远的对匹配对,,得到筛选出的父本精子选择集。
本发明由于采用了上述技术,产生的有益效果有如下几条。
1、本发明通过建立鱼类种质资源保护区和冷冻保存鱼类精子的方式管理种质资源,并通过建立鱼类种质资源性状遗传数据库作为匹配源,采用优化后的K-最近邻算法匹配亲本母鱼和冷冻精子,选择距离大于预先实验阈值且距离最远的父本精子对待受精亲本母鱼的卵子进行受精,能够有效维护生物多样性。
2、本发明为了兼顾维护生物多样性和满足市场化育种需求,在改进后的K-最近邻算法中,在距离计算公式中设置位置权重,位置权重从性状偏好权重矩阵中按位置提取的元素,,性状偏好权重矩阵内默认元素值全为1,也就是默认采用生物多样化模式,而如果需要育种,则按照性状对应基因编码的位置,调大性状偏好权重矩阵内部对应的元素值。
3、本发明无需直接检测作为种质资源的鱼类精子的基因数据或母本卵子的基因数据,而是直接以亲本基因数据构建对应的性状遗传特征矩阵并进行后续计算,且选择差异最大的种质资源,这样能够降低检测工作量,同时保持基因多样性,有助于维护生物多样性。
4、本发明能够基于亲本基因数据构建对应的性状遗传特征矩阵,然后拆分出所有生殖细胞可能的对应的性状遗传特征子矩阵,然后以精子和卵子所对应的所有可能的性状遗传特征子矩阵按照改进后的K-最近邻算法计算距离,取距离最小值作为对应的两个亲本的性状遗传特征矩阵的距离的代表值,然后再构建出距离矩阵,选择距离大于预先实验阈值且距离最远的父本精子对待受精亲本母鱼的卵子进行受精,以计算量代替检测工作量,进一步提高了调度匹配的准确性。
附图说明
图1是本发明的处理流程示意图;
图2是本发明的优化后的K-最近邻算法的流程示意图;
图3是本发明的预先实验阈值确定过程的流程示意图;
图4是本发明在批量处理亲本母鱼时优化后的K-最近邻算法的流程示意图;
图5是本发明在父本精子选择集为空时的处理流程示意图。
具体实施方式
实施例一:如图1所示,本发明提供一种鱼类种质资源调配处理方法,包括步骤S1到S5。
S1、建立鱼类种质资源保护区,根据鱼类的分布范围、栖息地特点和种群特征,划定保护区的边界,也就是利用GIS技术,结合鱼类的生物学和生态学特性,确保保护区能够涵盖重要的繁殖、栖息和觅食区域等重点区域;同时根据鱼类群体类型,实现网格化管理,也就是将保护区划分为若干个网格单元(如正方形或矩形的池塘,也可以为非规则形状的湾流水域等),确保每个网格单元能够有效覆盖鱼类的活动范围,同时注意每个网格单元应当可以独立管理和监控,避免产生鱼类逃逸或混杂的情况;而针对每个网格内,进行详细的鱼类种群调查,收集每个网格单元内的鱼类种群数据,包括物种、数量、年龄结构、性别比例等,还利用遥感技术监测水体环境和鱼类分布,利用声呐技术探测水下鱼类群体,利用水下摄像直接观察鱼类活动和行为,实现了实时监测鱼类的分布和动态变化;而获得的保护区鱼类数据,通过建立一个集中管理的鱼类种质资源数据库,记录每个网格单元内的鱼类种群数据,并实现数据的存储、管理和分析,也就是实现数据的可视化和动态更新;同时根据每个网格单元内的鱼类种群状况,制定相应的管理和保护措施;而同时也会定期进行鱼类种群监测和评估,分析保护区内鱼类种群的变化趋势,根据评估结果和变化趋势,及时调整和优化管理措施,确保鱼类种质资源的可持续利用。
S2、首先确定需要研究和保存的父本性状,如生长速度、抗病性、体色等,例如金黄色乌鳢的金黄色体色等,根据父本性状通过基因测序或SNP分型,得到每个父本的基因型数据,确定每种性状对应的基因位点和等位基因,对性状基因数据进行编码,例如二进制编码(如AA=0, Aa=1, aa=2)和实数编码,生成父本性状遗传特征矩阵,,其中表示染色体的数量,每一行对应一条染色体,表示基因的编码,每一列对应一个基因位点上的等位基因编码,生成父本性状遗传特征矩阵,进而构建出鱼类种质资源性状遗传数据库并冷冻保存对应的鱼类精子。
例如假设有3个父本,每个父本有一对染色体,每条染色体上有3个基因位点(Aa、Bb、Cc),等位基因分别为Aa、Bb和Cc,则分别编码为A=1.0,a=0.5,B=1.0,b=0.5,C=1.0,c=0.5;因此,还可以继续假设为父本的基因型数据,如表1所示:
表1 父本的基因型数据表
;
则父本1,染色体1:(1.0,1.0,1.0),染色体2:(1.0,0.5,1.0);父本2,染色体1:(0.5,1.0,1.0),染色体2:(1.0,0.5,0.5);父本3,染色体1:(1.0,0.5,0.5),染色体2:(1.0,1.0,1.0)。
因此,构建出对应的三个父本性状遗传特征矩阵、和,,,。
S3、采集并确定亲本母鱼性状对应的基因信息,与得到父本性状遗传特征矩阵的方式类似,编码后得到母本性状遗传特征矩阵。
S4、采用优化后的K-最近邻算法,将母本性状遗传特征矩阵与鱼类种质资源性状遗传数据库所有父本性状遗传特征矩阵分别进行一对一匹配计算,选择距离大于预先实验阈值且距离最远的对匹配对,得到筛选出的父本精子选择集。
S5、从父本精子选择集中随机抽选一份对应的父本精子对母本卵子进行受精。
如图2所示,步骤S4中优化后的K-最近邻算法,包括步骤S4101到S4103。
S4101、使用Frobenius范数计算矩阵与矩阵之间的距离为:
,
其中,,,为对应位置的权重,为矩阵在第行列的元素,为矩阵在第行列的元素。
S4102、构建距离向量,。
S4103、从距离向量的元素中选择值最大的个元素,也就是距离最远的对匹配对,,得到筛选出的父本精子选择集。
其中,位置权重从性状偏好权重矩阵中按位置提取的元素,,性状偏好权重矩阵内默认元素值全为1,而如果需要育种,则按照性状对应基因编码的位置,调大性状偏好权重矩阵内部对应的元素值,这样可以根据不同的育种需求调整每个基因位点的权重,不仅有助于保持生物多样性,还可以在育种过程中优先选择特定性状,例如举例说明的三个父本性状遗传特征矩阵、和,对应的性状偏好权重矩阵默认设置为:,而如果基因点位2对应的性状在育种中更重要,则可以相应地增加权重,对应的性状偏好权重矩阵设置为:。
如图3所示,在步骤S4中预先实验阈值由步骤S4201到S4203确定。
S4201、根据具体鱼类种群提取亲本后,繁殖到子代并引入外来子代亲本后,再繁殖至第三代的孙代样本随机抽样个样本并采集基因信息及编码后,得到个性状遗传特征矩阵。
S4202、使用Frobenius范数计算从个样本中任取两个样本的性状遗传特征矩阵和之间的距离。
S4203、预先实验阈值为从个中提取的最大值。
如图4所示,为了批量处理亲本母鱼,得到多个性状遗传特征矩阵,步骤S4中优化后的-最近邻算法,包括步骤S4301到S4303。
S4301、使用Frobenius范数计算矩阵与矩阵之间的距离;
,
其中,,,为对应位置的权重,为矩阵在第行列的元素,为矩阵在第行列的元素。
S4302、构建距离矩阵:
。
S4303、从距离矩阵的元素中选择个值最大的元素,也就是距离最远的对匹配对,,得到筛选出的父本精子选择集。
如图5所示,在步骤S4中还包括步骤S4401到S4403。
S4401、如果得到筛选出的父本精子选择集为空,则拒绝此次种质资源调配,并向外采集新的种质资源,例如通过野外采集或与其他公司购买或交换,可以有效补充种质资源。
S4402、对新采集的种质资源进行采用基因测序或SNP分型,并对得到的性状基因数据进行编码,生成新的父本性状遗传特征矩阵。
S4403、采用优化后的K-最近邻算法,将新的父本性状遗传特征矩阵匹配鱼类种质资源性状遗传数据库所有父本性状遗传特征矩阵,只有当大于预先实验阈值时,才将该新采集的种质资源加入到鱼类种质资源性状遗传数据库并冷冻保存对应的鱼类精子,完成鱼类种质资源的更新。
其中,SNP分型用于检测DNA序列中单核苷酸多态性(SNP)的位点,主要操作步骤为S001到S004。
S001、样本准备,采集所选鱼类的身体组织样本,确保样本新鲜,防止污染和降解。
S002、DNA提取,使用商业化的DNA提取试剂盒或手工方法,从样本中提取高质量的基因组DNA,此时应注意所提取的DNA质量和浓度符合分型要求。
S003、SNP检测,选择基于测序的SNP分型方法,将提取的DNA样本加载到SNP分型平台上进行检测。
S004、数据分析,获取SNP分型数据后,进行数据质量控制,去除低质量的SNP位点,使用生物信息学工具进行SNP位点的比对和注释,获得个体的SNP基因型数据。
实施例二:为了实现更为精确地计算,通过拆分母本和父本的性状遗传矩阵,计算出精子和卵子对应的所有可能的匹配距离,取最小值作为母本和父本的性状遗传矩阵之间距离的代表值,然后再构建距离矩阵,也就是在实施例一的基础上,将步骤S4改为:采用改进后的-最近邻算法,在将母本性状遗传特征矩阵与鱼类种质资源性状遗传数据库所有父本性状遗传特征矩阵分别进行一对一匹配计算时,按照所选鱼类所选性状对应的单倍体内染色体的数量将母本性状遗传特征矩阵拆分为若干个母本性状遗传特征子矩阵,同时将计算时的父本性状遗传特征矩阵也按照所选鱼类所选性状对应的单倍体内染色体的数量拆分为若干个父本性状遗传特征子矩阵,计算出所有与之间的距离,提取所有中的最小值作为所对应的这对母本性状遗传特征矩阵与父本性状遗传特征矩阵的距离的代表值,选择距离大于预先实验阈值且代表距离最远的对匹配对,得到筛选出的父本精子选择集。
相应地,改进后的K-最近邻算法,包括步骤S4501到S4505。
S4501、拆分母本性状遗传特征矩阵为若干个,,,拆分父本性状遗传特征矩阵为若干个,,,其中为子矩阵数量且数值等于,为所选性状对应的单倍体内染色体的数量。
S4502、使用Frobenius范数计算任意两个矩阵与之间的距离:
,
其中,,,为对应位置的权重,为矩阵在第行列的元素,为矩阵在第行列的元素。
S4503、取母本性状遗传特征矩阵与父本性状遗传特征矩阵拆分出的子矩阵计算出的所有中的最小值作为取母本性状遗传特征矩阵与父本性状遗传特征矩阵距离的代表值,也就是。
S4504、将母本性状遗传特征矩阵分别与鱼类种质资源性状遗传数据库中的父本性状遗传特征矩阵计算出来的距离代表值作为元素值,构建出距离矩阵,。
S4505、从距离矩阵的元素中选择个值最大的元素,也就是距离最远的对匹配对,,得到筛选出的父本精子选择集。
Claims (5)
1.一种鱼类种质资源调配处理方法,其特征在于:包括如下步骤:
S1、建立鱼类种质资源保护区,根据鱼类群体类型,实现网格化管理;
S2、根据父本性状确定基因信息,对性状基因数据进行编码,生成父本性状遗传特征矩阵,构建鱼类种质资源性状遗传数据库并冷冻保存对应的鱼类精子;
S3、采集并确定亲本母鱼性状对应的基因信息,编码后得到母本性状遗传特征矩阵;
S4、采用改进后的-最近邻算法,将母本性状遗传特征矩阵与鱼类种质资源性状遗传数据库所有的父本性状遗传特征矩阵分别进行一对一匹配计算,选择距离大于预先实验阈值且距离最远的对匹配对,得到筛选出的父本精子选择集;
其中,改进后的-最近邻算法,包括如下步骤:
S4101、使用Frobenius范数计算矩阵与矩阵之间的距离为:
,
其中,,,为对应位置的权重,为矩阵在第行列的元素,为矩阵在第行列的元素;
S4102、构建距离向量,;
S4103、从距离向量的元素中选择值最大的个元素,也就是距离最远的对匹配对,,得到筛选出的父本精子选择集;
其中,位置权重从性状偏好权重矩阵中按位置提取的元素,,性状偏好权重矩阵内默认元素值全为1,而如果需要育种,则按照性状对应基因编码的位置,调大性状偏好权重矩阵内部对应的元素值;
其中,预先实验阈值由如下步骤确定:
S4201、根据具体鱼类种群提取亲本后,繁殖到子代并引入外来子代亲本后,再繁殖至第三代的孙代样本随机抽样个样本并采集基因信息及编码后,得到个性状遗传特征矩阵;
S4202、使用Frobenius范数计算从p个样本中任取两个样本的性状遗传特征矩阵和之间的距离;
S4203、预先实验阈值为从个中提取的最大值;
S5、从父本精子选择集中选择一份对应的冷冻父本精子对母本卵子进行受精。
2.根据权利要求1所述的一种鱼类种质资源调配处理方法,其特征在于:根据性状确定基因信息的方式为采用基因测序或单核苷酸多态性(SNP)分型。
3.根据权利要求1所述的一种鱼类种质资源调配处理方法,其特征在于:为了批量处理亲本母鱼,得到多个性状遗传特征矩阵,步骤S4中改进后的-最近邻算法,包括如下步骤:
S4301、使用Frobenius范数计算矩阵与矩阵之间的距离;
,
其中,,,为对应位置的权重,为矩阵在第行列的元素,为矩阵在第行列的元素;
S4302、构建距离矩阵:
;
S4303、从距离矩阵的元素中选择个值最大的元素,也就是距离最远的对匹配对,,得到筛选出的父本精子选择集。
4.根据权利要求1所述的一种鱼类种质资源调配处理方法,其特征在于:在步骤S4中还包括如下步骤:
S4401、如果得到筛选出的父本精子选择集为空,则拒绝此次种质资源调配,并向外采集新的种质资源;
S4402、对新采集的种质资源进行采用基因测序或SNP分型,并对得到的性状基因数据进行编码,生成新的父本性状遗传特征矩阵;
S4403、采用优化后的-最近邻算法,将新的父本性状遗传特征矩阵匹配鱼类种质资源性状遗传数据库所有父本性状遗传特征矩阵,只有当大于预先实验阈值时,才将该新采集的种质资源加入到鱼类种质资源性状遗传数据库并冷冻保存对应的鱼类精子,完成鱼类种质资源的更新。
5.根据权利要求1所述的一种鱼类种质资源调配处理方法,其特征在于:将步骤S4改为:
采用改进后的-最近邻算法,在将母本性状遗传特征矩阵与鱼类种质资源性状遗传数据库所有父本性状遗传特征矩阵分别进行一对一匹配计算时,按照所选鱼类所选性状对应的单倍体内染色体的数量将母本性状遗传特征矩阵拆分为若干个母本性状遗传特征子矩阵,同时将计算时的父本性状遗传特征矩阵也按照所选鱼类所选性状对应的单倍体内染色体的数量拆分为若干个父本性状遗传特征子矩阵,计算出所有与之间的距离,提取所有中的最小值作为所对应的这对母本性状遗传特征矩阵与父本性状遗传特征矩阵的距离的代表值,选择距离大于预先实验阈值且代表距离最远的对匹配对,得到筛选出的父本精子选择集;
其中,改进后的K-最近邻算法,包括如下步骤:
S4501、拆分母本性状遗传特征矩阵为若干个,,,拆分父本性状遗传特征矩阵为若干个,,,其中为子矩阵数量且数值等于,为所选性状对应的单倍体内染色体的数量;
S4502、使用Frobenius范数计算任意两个矩阵与之间的距离:
,
其中,,,为对应位置的权重,为矩阵在第行列的元素,为矩阵在第行列的元素;
S4503、取母本性状遗传特征矩阵与父本性状遗传特征矩阵拆分出的子矩阵计算出的所有中的最小值最为取母本性状遗传特征矩阵与父本性状遗传特征矩阵距离的代表值,也就是:
;
S4504、将母本性状遗传特征矩阵分别与鱼类种质资源性状遗传数据库中的父本性状遗传特征矩阵计算出来的距离代表值作为元素值,构建出距离矩阵,;
S4505、从距离矩阵的元素中选择个值最大的元素,也就是距离最远的对匹配对,,得到筛选出的父本精子选择集。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202411116589.1A CN118633552B (zh) | 2024-08-15 | 2024-08-15 | 一种鱼类种质资源调配处理方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202411116589.1A CN118633552B (zh) | 2024-08-15 | 2024-08-15 | 一种鱼类种质资源调配处理方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN118633552A CN118633552A (zh) | 2024-09-13 |
| CN118633552B true CN118633552B (zh) | 2024-10-18 |
Family
ID=92661395
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202411116589.1A Active CN118633552B (zh) | 2024-08-15 | 2024-08-15 | 一种鱼类种质资源调配处理方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN118633552B (zh) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112021224A (zh) * | 2020-06-15 | 2020-12-04 | 中国水产科学研究院黄海水产研究所 | 一种基于扩繁群体的虾类选择育种方法 |
| CN117322372A (zh) * | 2023-09-08 | 2024-01-02 | 阳江职业技术学院 | 一种基于群组配对的水产动物分子辅助育种方法 |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7428554B1 (en) * | 2000-05-23 | 2008-09-23 | Ocimum Biosolutions, Inc. | System and method for determining matching patterns within gene expression data |
| FR2999602A1 (fr) * | 2012-12-17 | 2014-06-20 | Ifremer | Signature predictive de la capacite de biomineralisation d’une huitre perliere donneuse de greffons |
| CN104686423B (zh) * | 2015-03-23 | 2016-09-14 | 江苏中洋集团股份有限公司 | 一种暗纹东方鲀群体—家系—分子综合遗传育种的方法 |
| US11551787B2 (en) * | 2018-07-02 | 2023-01-10 | Pheramor, Inc. | Personality genetics |
| EP3626835A1 (en) * | 2018-09-18 | 2020-03-25 | Sistemas Genómicos, S.L. | Method for genotypically identifying both alleles of at least one locus of a subject's hla gene |
| US20230103457A1 (en) * | 2021-07-02 | 2023-04-06 | Kite Pharma, Inc. | Method for identifying variants in gene products from gene constructs used in cell therapy applications |
| US20240229124A9 (en) * | 2022-10-19 | 2024-07-11 | DNAalgo S.r.l. | Optimized clustering of dna strands |
-
2024
- 2024-08-15 CN CN202411116589.1A patent/CN118633552B/zh active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112021224A (zh) * | 2020-06-15 | 2020-12-04 | 中国水产科学研究院黄海水产研究所 | 一种基于扩繁群体的虾类选择育种方法 |
| CN117322372A (zh) * | 2023-09-08 | 2024-01-02 | 阳江职业技术学院 | 一种基于群组配对的水产动物分子辅助育种方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN118633552A (zh) | 2024-09-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Knol et al. | Genomic selection in commercial pig breeding | |
| Lovell et al. | Mutation accumulation in an asexual relative of Arabidopsis | |
| Pandey et al. | Genetic diversity and population structure of advanced clones selected over forty years by a potato breeding program in the USA | |
| Imai et al. | Genome-wide association mapping of fruit-quality traits using genotyping-by-sequencing approach in citrus landraces, modern cultivars, and breeding lines in Japan | |
| US20130117878A1 (en) | Statistical approach for optimal use of genetic information collected on historical pedigrees | |
| CN116844641B (zh) | 基于全基因组选择预测甘蓝型油菜杂种优势的方法 | |
| CN111128306B (zh) | 一种罗非鱼基因组选择育种方法 | |
| Yu et al. | Comparison of sequencing-based and array-based genotyping platforms for genomic prediction of maize hybrid performance | |
| CN112687340A (zh) | 一种基于全基因组关联分析和全基因组选择选育玉米高产材料的方法 | |
| Mousavi-Derazmahalleh et al. | The western Mediterranean region provided the founder population of domesticated narrow-leafed lupin | |
| CN109741789B (zh) | 一种基于rrblup的全基因组预测方法和装置 | |
| Tomimoto et al. | Modelling somatic mutation accumulation and expansion in a long-lived tree with hierarchical modular architecture | |
| Lillie et al. | Genomic signatures of 60 years of bidirectional selection for 8-week body weight in chickens | |
| WO2024212036A1 (zh) | 基于集成学习的育种跨代表型预测方法与系统、电子设备 | |
| CN117778585A (zh) | 一种大黄鱼55k液相芯片及其应用 | |
| CN110692512A (zh) | 一种基于作物基因组大小快速预测杂种优势的方法 | |
| CN112750494B (zh) | 一种评估香猪表型性状的个体基因组育种值方法 | |
| CN118633552B (zh) | 一种鱼类种质资源调配处理方法 | |
| Moeskjær et al. | Major effect loci for plant size before onset of nitrogen fixation allow accurate prediction of yield in white clover | |
| CN115083518A (zh) | 一种snp双通道编码方法 | |
| Kim et al. | Exome-wide variation in a diverse barley panel reveals genetic associations with ten agronomic traits in Eastern landraces | |
| Opoola et al. | The genetic structure and diversity of smallholder dairy cattle in Rwanda | |
| CN120883931A (zh) | 基于多性状协同选择的红鳍笛鲷育种辅助方法及系统 | |
| Mason et al. | Fine-tuning EMS treatments to produce large sorghum mutant populations for FIND-IT | |
| CN119709828B (zh) | 一种增加玉米产量的方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |