CN108647491A - 一种智能白血病癌细胞检测仪 - Google Patents

一种智能白血病癌细胞检测仪 Download PDF

Info

Publication number
CN108647491A
CN108647491A CN201810458515.4A CN201810458515A CN108647491A CN 108647491 A CN108647491 A CN 108647491A CN 201810458515 A CN201810458515 A CN 201810458515A CN 108647491 A CN108647491 A CN 108647491A
Authority
CN
China
Prior art keywords
gene
value
sample
feature
population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810458515.4A
Other languages
English (en)
Inventor
刘兴高
高信腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201810458515.4A priority Critical patent/CN108647491A/zh
Publication of CN108647491A publication Critical patent/CN108647491A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Analytical Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种智能白血病癌细胞检测仪,该系统由基因微阵列读入模块、数据预处理及特征排序模块、参数寻优模块、模型输出模块组成。系统首先将输入的基因微阵列数据预处理,然后对剩余的各个基因进行重要性排序,通过统计分数计算相关性,再利用分类器准则函数计算贡献度,将所有基因重要性进行排序。改进的优化方法在原始的智能寻优算法下加入了适应度检测与种群扰动,能够防止种群多样性散失以及优化过程陷入局部最优。然后将搜寻到的最优参数作为分类器参数完成模型构建并输出结果。系统具有很好的去相关性,精度高。

Description

一种智能白血病癌细胞检测仪
技术领域
本发明涉及基因微阵列数据应用技术领域,具体地,涉及一种智能白血病癌细胞检测仪。
背景技术
DNA微阵列(DNA microarray)又称DNA阵列或DNA芯片,比较通俗的名字是基因芯片(gene chip)。是一块带有DNA微阵列(micorarray)涂层的特殊玻璃片,在数平方厘米之面积上安装数千或数万个核酸探针,经由一次测验,即可提供大量基因序列相关资讯。它是基因组学和遗传学研究的工具。研究人员应用基因芯片就可以在同一时间定量的分析大量(成千上万个)的基因表达的水平,具有快速、精确、低成本之生物分析检验能力。其中可以用来检测基因表现程度之cDNA微阵列(cDNA-microarray),已开始商业化,市场主要以研发实验室为主。此外,以光刻(photolithography)技术制作,可检测基因多形式(Polymorphisms)之生物芯片,尚处于试验阶段而结合微流体学(microfluidics)之临床用芯片,则仍在研发阶段。急性白血病(acute leukemia,AL)是造血干细胞的恶性克隆性疾病,发病时骨髓中异常的原始细胞及幼稚细胞(白血病细胞)大量增殖,蓄积于骨髓并抑制正常造血,广泛浸润肝、脾、淋巴结等髓外脏器。表现为贫血、出血、感染和浸润等征象。根据受累的细胞类型,AL通常可以分为急性淋巴细胞白血病(acute lymphoblastic leukemia,ALL)和急性髓细胞白血病(acute myeloid leukemia,AML)两大类。我国AML的发病率约为1.62/10万,而ALL则约为0.69/10万。成人以AML多见,儿童以ALL多见。急性白血病若不经特殊治疗,平均生存期仅3个月左右,短者甚至在数天后即死亡。因此,对于急性白血病这样的病症,如何找到合适的办法进行快速高效的得出结果就显得十分重要而且有着迫切的现实意义。而这样的高维小样本数据,一直就是科研届的一大难题。
发明内容
为了克服目前难以搜寻基因微阵列数据最优特征子集以及分类最佳参数的不足,本发明的目的在于提供一种智能白血病癌细胞检测仪。
本发明解决其技术问题所采用的技术方案是:一种智能白血病癌细胞检测仪,该系统由基因微阵列读入模块、数据预处理及特征排序模块、参数寻优模块、模型输出模块组成;其中:
基因微阵列读入模块读入的是所有基因微阵列的类别标签Y=[y1,y2,...,ym],其中yi=k,k∈(-1,1),以及所有样本的基因微阵列表达值:
其中每一行xi代表一个样本所有基因的表达值,对应的每一列xj代表一个基因在所有样本中的表达值,下标i表示第i个样本、总共m个,下标j表示第j个基因、总共n个。
数据预处理及特征排序模块是对读入的原始微阵列数据进行归一化以及特征排序的处理过程。其中归一化操作为:
其中,Min、Max分别为样本基因表达值的最小值、最大值。而特征排序选择使用每个基因对分类准确度的贡献度打分来实现,在支持向量机理论中,通过定义一个贡献度函数:
其中,α=[α1,...,αn],Hij=yiyjK(xi,xj),α为法向量对应的系数、H为中间矩阵,J为代价函数、I为单位矩阵、K为核函数、y为标签值、x为样本特征值,上标T表示矩阵的转置、下标i、j分别表示第i个样本和第j个基因。事实上,该式代表分类边界大小的平方值,支持向量机的目标函数即是最小化它。在使用线性核作为支持向量机的核函数的情况下,则有:
其中,w*为最优支持向量、w为法向量、α*最优支持向量对应的系数。观察上式,可以得到:各个特征的重要程度根据该特征对于这个代价函数的贡献大小来决定,即每个特征的贡献值为:其中,δ表示贡献度。
在使用非线性核作为核函数的时候,一般可以如下近似计算:
其中,合理假设某个特征消去之后α值不变,H(-i)表示该特征消去之后的H矩阵值。而在使用该假设时,得到的结果与线性核的结果相差不大。利用该式即可循环计算特征贡献度进行基因重要性排序。
对于一组训练样本集合(x1,y1),…(xn,yn),x∈Rn,y∈R,其中x表示训练样本,y表示类别标签。与SVM类似,通过变换将训练样本映射到高维空间。目标函数等价于求解下面二次规划问题:
其中,ξi为松弛变量,即预测值与实际值的误差,b为超平面的截距,C为惩罚因子,上标T表示转置。与标准SVM相比不同的是,LSSVM中的二次规划约束条件为等式,并且损失函数为二次函数。为了求解该二次规划问题,通过引入拉格朗日乘子,得到如下的拉格朗日函数L:
对w,b,αi,ξi分别求偏导,并令其等于零,可得如下四式:
回代入约束等式,原来的优化问题目标方程转化为求解如下线性方程:
其中y=[y1,...,yn]T,1v=[1,...,1]T,α=[α1,...,αn]T,K=[kij]n×nI为单位阵,表示核变换,K为核函数。最后得到非线性模型f(x):
参数寻优模块设计使用差分进化算法作为基础,并在算法中加入智能算法来增加种群的多样性,具体设计如下:
1)初始化DE算法的种群信息:
在种群中,随机产生:
上式中xi(0)代表初代第i个个体染色体基因的表达值,xj,i(0)代表初代第i个个体中第j个染色体基因的表达值、rand(0,1)是(0,1)区间里的均匀随机数、NP是种群大小、上标L、U分别表示下界值、上界值。
2)变异操作(Mutation):DE算法区分于遗传算法(GA)的特点就在于其采用查分策略进行变异,通过随机选择两个个体之差,缩放后与目标个体进行向量和,也就是
vi(g+1)=xr1(g)+F·(xr2(g)-xr3(g))
其中,g代表第g代,F是两个随机向量差的缩放系数,vi(g+1)是变异中间变量,xr1(g)、xr2(g)、xr3(g)分别表示第g代第1、2、3个个体第r个染色体基因的表达值。
3)交叉操作(Crossover):将第g代种群xi(g)与步骤2)产生的变异中间变量vi(g+1)进行交叉,产生
其中,CR是设定的交叉率,uj,i(g+1)是交叉中间变量。
4)选择操作(Selection):差分进化算法使用通常的贪心算法进行保留下一代,如果交叉产生的种群适应度f(ui(g+1)大于上一代的种群适应度f(xi(g)),则保留,否则种群不变,即
为了避免出现早熟情况,设计一个自适应算子λ:
上式中Gmax代表最大迭代次数,G代表当前迭代数,F0为变异算子,初期该值较大,保证样本多样性,后期逐渐变小,意在保护进化过程的优良信息。
5)迭代运行以上过程直至达到最大代数。然后将历史最佳参数作为参数寻优的最终结果输入模型输出模块。
模型输出模块,利用以上过程得到的模型,直接输入病患数据,即可根据标签值得出结果。
本发明的有益效果主要表现在:利用了智能寻优技术对分类器的参数进行群智能寻优,避免了人工调参带来的低效以及随意性,且系统具有很好的去相关性,精度高。
附图说明
图1是本发明的结构示意图;
图2是本发明的流程图。
具体实施方式
下面根据附图具体说明本发明。
参照图1,一种智能白血病癌细胞检测仪,该系统由基因微阵列读入模块1、数据预处理及特征排序模块2、参数寻优模块3、模型输出模块4组成;其中:
基因微阵列读入模块1,读入的是所有基因微阵列的类别标签Y=[y1,y2,...,ym],其中yi=k,k∈(-1,1),以及所有样本的基因微阵列表达值:
其中每一行xi代表一个样本所有基因的表达值,对应的每一列xj代表一个基因在所有样本中的表达值,下标i表示第i个样本、总共m个,下标j表示第j个基因、总共n个。
数据预处理及特征排序模块2是对读入的原始微阵列数据进行归一化以及特征排序的处理过程。其中归一化操作为:
其中,Min、Max分别为样本基因表达值的最小值、最大值。而特征排序选择使用每个基因对分类准确度的贡献度打分来实现,在支持向量机理论中,通过定义一个贡献度函数:
其中,α=[α1,...,αn],Hij=yiyjK(xi,xj),α为法向量对应的系数、H为中间矩阵,J为代价函数、I为单位矩阵、K为核函数、y为标签值、x为样本特征值,上标T表示矩阵的转置、下标i、j分别表示第i个样本和第j个基因。事实上,该式代表分类边界大小的平方值,支持向量机的目标函数即是最小化它。在使用线性核作为支持向量机的核函数的情况下,则有:
其中,w*为最优支持向量、w为法向量、α*最优支持向量对应的系数。观察上式,可以得到:各个特征的重要程度根据该特征对于这个代价函数的贡献大小来决定,即每个特征的贡献值为:其中,δ表示贡献度。
在使用非线性核作为核函数的时候,一般可以如下近似计算:
其中,合理假设某个特征消去之后α值不变,H(-i)表示该特征消去之后的H矩阵值。而在使用该假设时,得到的结果与线性核的结果相差不大。利用该式即可循环计算特征贡献度进行基因重要性排序。
对于一组训练样本集合(x1,y1),…(xn,yn),x∈Rn,y∈R,其中x表示训练样本,y表示类别标签。与SVM类似,通过变换将训练样本映射到高维空间。目标函数等价于求解下面二次规划问题:
其中,ξi为松弛变量,即预测值与实际值的误差,b为超平面的截距,C为惩罚因子,上标T表示转置。与标准SVM相比不同的是,LSSVM中的二次规划约束条件为等式,并且损失函数为二次函数。为了求解该二次规划问题,通过引入拉格朗日乘子,得到如下的拉格朗日函数L:
对w,b,αi,ξi分别求偏导,并令其等于零,可得如下四式:
回代入约束等式,原来的优化问题目标方程转化为求解如下线性方程:
其中y=[y1,...,yn]T,1v=[1,...,1]T,α=[α1,...,αn]T,K=[kij]n×nI为单位阵,表示核变换,K为核函数。最后得到非线性模型f(x):
参数寻优模块3设计使用差分进化算法作为基础,并在算法中加入智能算法来增加种群的多样性,具体设计如下:
1)初始化DE算法的种群信息:
在种群中,随机产生:
上式中xi(0)代表初代第i个个体染色体基因的表达值,xj,i(0)代表初代第i个个体中第j个染色体基因的表达值、rand(0,1)是(0,1)区间里的均匀随机数、NP是种群大小、上标L、U分别表示下界值、上界值。
2)变异操作(Mutation):DE算法区分于遗传算法(GA)的特点就在于其采用查分策略进行变异,通过随机选择两个个体之差,缩放后与目标个体进行向量和,也就是
vi(g+1)=xr1(g)+F·(xr2(g)-xr3(g))
其中,g代表第g代,F是两个随机向量差的缩放系数,vi(g+1)是变异中间变量,xr1(g)、xr2(g)、xr3(g)分别表示第g代第1、2、3个个体第r个染色体基因的表达值。
3)交叉操作(Crossover):将第g代种群xi(g)与步骤2)产生的变异中间变量vi(g+1)进行交叉,产生
其中,CR是设定的交叉率,uj,i(g+1)是交叉中间变量。
4)选择操作(Selection):差分进化算法使用通常的贪心算法进行保留下一代,如果交叉产生的种群适应度f(ui(g+1)大于上一代的种群适应度f(xi(g)),则保留,否则种群不变,即
为了避免出现早熟情况,设计一个自适应算子λ:
上式中Gmax代表最大迭代次数,G代表当前迭代数,F0为变异算子,初期该值较大,保证样本多样性,后期逐渐变小,意在保护进化过程的优良信息。
5)迭代运行以上过程直至达到最大代数。然后将历史最佳参数作为参数寻优的最终结果输入模型输出模块4。
模型输出模块4,利用以上过程得到的模型,直接输入病患数据,即可根据标签值得出结果。
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (5)

1.一种智能白血病癌细胞检测仪,其特征在于:该系统由基因微阵列读入模块、数据预处理及特征排序模块、参数寻优模块、模型输出模块组成。
2.根据权利要求1所述智能白血病癌细胞检测仪,其特征在于:所述基因微阵列读入模块读入的是所有基因微阵列的类别标签Y=[y1,y2,...,ym],其中yi=k,k∈(-1,1),以及所有样本的基因微阵列表达值:
其中每一行xi代表一个样本所有基因的表达值,对应的每一列xj代表一个基因在所有样本中的表达值,下标i表示第i个样本、总共m个,下标j表示第j个基因、总共n个。
3.根据权利要求1所述智能白血病癌细胞检测仪,其特征在于:所述数据预处理及特征排序模块对读入的原始微阵列数据进行归一化以及特征排序的处理过程。其中归一化操作为:
其中,Min、Max分别为样本基因表达值的最小值、最大值。而特征排序选择使用每个基因对分类准确度的贡献度打分来实现,在支持向量机理论中,通过定义一个贡献度函数:
其中,α=[α1,...,αn],Hij=yiyjK(xi,xj),α为法向量对应的系数、H为中间矩阵,J为代价函数、I为单位矩阵、K为核函数、y为标签值、x为样本特征值,上标T表示矩阵的转置、下标i、j分别表示第i个样本和第j个基因。事实上,该式代表分类边界大小的平方值,支持向量机的目标函数即是最小化它。在使用线性核作为支持向量机的核函数的情况下,则有:
其中,w*为最优支持向量、w为法向量、α*最优支持向量对应的系数。观察上式,可以得到:各个特征的重要程度根据该特征对于这个代价函数的贡献大小来决定,即每个特征的贡献值为:其中,δ表示贡献度。
在使用非线性核作为核函数的时候,一般可以如下近似计算:
其中,合理假设某个特征消去之后α值不变,H(-i)表示该特征消去之后的H矩阵值。而在使用该假设时,得到的结果与线性核的结果相差不大。利用该式即可循环计算特征贡献度进行基因重要性排序。
对于一组训练样本集合(x1,y1),…(xn,yn),x∈Rn,y∈R,其中x表示训练样本,y表示类别标签。与SVM类似,通过变换将训练样本映射到高维空间。目标函数等价于求解下面二次规划问题:
其中,ξi为松弛变量,即预测值与实际值的误差,b为超平面的截距,C为惩罚因子,上标T表示转置。与标准SVM相比不同的是,LSSVM中的二次规划约束条件为等式,并且损失函数为二次函数。为了求解该二次规划问题,通过引入拉格朗日乘子,得到如下的拉格朗日函数L:
对w,b,αi,ξi分别求偏导,并令其等于零,可得如下四式:
回代入约束等式,原来的优化问题目标方程转化为求解如下线性方程:
其中y=[y1,...,yn]T,1v=[1,...,1]T,α=[α1,...,αn]T,K=[kij]n×nI为单位阵,表示核变换,K为核函数。最后得到非线性模型f(x):
4.根据权利要求1所述智能白血病癌细胞检测仪,其特征在于:所述参数寻优模块使用差分进化算法作为基础,并在算法中加入群智能蚁群算法来增加种群的多样性,具体如下:
1)初始化DE算法的种群信息:
在种群中,随机产生:
上式中xi(0)代表初代第i个个体染色体基因的表达值,xj,i(0)代表初代第i个个体中第j个染色体基因的表达值、rand(0,1)是(0,1)区间里的均匀随机数、NP是种群大小、上标L、U分别表示下界值、上界值。
2)变异操作(Mutation):DE算法区分于遗传算法(GA)的特点就在于其采用查分策略进行变异,通过随机选择两个个体之差,缩放后与目标个体进行向量和,也就是
vi(g+1)=xr1(g)+F·(xr2(g)-xr3(g))
其中,g代表第g代,F是两个随机向量差的缩放系数,vi(g+1)是变异中间变量,xr1(g)、xr2(g)、xr3(g)分别表示第g代第1、2、3个个体第r个染色体基因的表达值。
3)交叉操作(Crossover):将第g代种群xi(g)与步骤2)产生的变异中间变量vi(g+1)进行交叉,产生
其中,CR是设定的交叉率,uj,i(g+1)是交叉中间变量。
4)选择操作(Selection):差分进化算法使用通常的贪心算法进行保留下一代,如果交叉产生的种群适应度f(ui(g+1)大于上一代的种群适应度f(xi(g)),则保留,否则种群不变,即
为了避免出现早熟情况,设计一个自适应算子λ:
上式中Gmax代表最大迭代次数,G代表当前迭代数,F0为变异算子,初期该值较大,保证样本多样性,后期逐渐变小,意在保护进化过程的优良信息。
5)迭代运行以上过程直至达到最大代数。然后将历史最佳参数作为参数寻优的最终结果输入模型输出模块。
5.根据权利要求1所述智能白血病癌细胞检测仪,其特征在于:所述模型输出模块利用参数寻优模块得到的模型,直接输入病患数据,即可根据标签值得出结果。
CN201810458515.4A 2018-05-14 2018-05-14 一种智能白血病癌细胞检测仪 Pending CN108647491A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810458515.4A CN108647491A (zh) 2018-05-14 2018-05-14 一种智能白血病癌细胞检测仪

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810458515.4A CN108647491A (zh) 2018-05-14 2018-05-14 一种智能白血病癌细胞检测仪

Publications (1)

Publication Number Publication Date
CN108647491A true CN108647491A (zh) 2018-10-12

Family

ID=63755479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810458515.4A Pending CN108647491A (zh) 2018-05-14 2018-05-14 一种智能白血病癌细胞检测仪

Country Status (1)

Country Link
CN (1) CN108647491A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582370A (zh) * 2020-05-08 2020-08-25 重庆工贸职业技术学院 一种基于粗糙集优化的脑转移瘤预后指标约简及分类方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145171A (zh) * 2007-09-15 2008-03-19 中国科学院合肥物质科学研究院 一种基于独立分量集成学习的基因微阵列数据预测方法
CN106055922A (zh) * 2016-06-08 2016-10-26 哈尔滨工业大学深圳研究生院 一种基于基因表达数据的混合网络基因筛选方法
CN107942299A (zh) * 2017-11-13 2018-04-20 浙江大学 一种基于改进混合蛙跳算法的智能雷达海上目标检测系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145171A (zh) * 2007-09-15 2008-03-19 中国科学院合肥物质科学研究院 一种基于独立分量集成学习的基因微阵列数据预测方法
CN106055922A (zh) * 2016-06-08 2016-10-26 哈尔滨工业大学深圳研究生院 一种基于基因表达数据的混合网络基因筛选方法
CN107942299A (zh) * 2017-11-13 2018-04-20 浙江大学 一种基于改进混合蛙跳算法的智能雷达海上目标检测系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XINTENG GAO 等: "A novel effective diagnosis model based on optimized least squaressupport machine for gene microarray", 《APPLIED SOFT COMPUTING》 *
熊伟丽 等: "基于改进差分进化算法的非线性系统模型参数辨识", 《计算机应用研究》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582370A (zh) * 2020-05-08 2020-08-25 重庆工贸职业技术学院 一种基于粗糙集优化的脑转移瘤预后指标约简及分类方法

Similar Documents

Publication Publication Date Title
Dobbin et al. Comparison of microarray designs for class comparison and class discovery
CN109906486A (zh) 使用共识基因库和基于网络的数据结构的表型/疾病特异性基因排序
US9141913B2 (en) Categorization and filtering of scientific data
Chen et al. Identifying gene regulatory networks from experimental data
Dunkler et al. Statistical analysis principles for Omics data
CN109215740A (zh) 基于Xgboost的全基因组RNA二级结构预测方法
Pei et al. CLADES: A classification‐based machine learning method for species delimitation from population genetic data
CN104966106A (zh) 一种基于支持向量机的生物年龄分步预测方法
CN110021340A (zh) 一种基于卷积神经网络和规划动态算法的rna二级结构生成器及其预测方法
CN113257357A (zh) 蛋白质残基接触图预测方法
Oriol Sabat et al. SALAI-Net: species-agnostic local ancestry inference network
CN108647491A (zh) 一种智能白血病癌细胞检测仪
Huang et al. Gene expression profiling for prediction of clinical characteristics of breast cancer
CN101517579A (zh) 蛋白质查找方法和设备
CN107977550A (zh) 一种基于压缩的快速分析致病基因算法
CN103339632B (zh) 核酸信息处理装置及其处理方法
CN115249538B (zh) 一种基于异构图生成对抗网络的lncRNA-疾病关联预测模型的构建方法
Vsevolozhskaya et al. Detecting weak signals by combining small P-values in genetic association studies
Zararsiz et al. Introduction to statistical methods for microRNA analysis
Tsai et al. Significance analysis of ROC indices for comparing diagnostic markers: applications to gene microarray data
Rasanjana et al. A svm model for candidate y-chromosome gene discovery in prostate cancer
Fei et al. Optimal genes selection with a new multi-objective evolutional algorithm hybriding NSGA-II with EDA
CN108715804A (zh) 一种群智能寻优的肺癌癌细胞检测仪
Pramana et al. A comparative assessment on gene expression classification methods of RNA-seq data generated using next-generation sequencing (NGS)
Meinl Maximum-score diversity selection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181012

RJ01 Rejection of invention patent application after publication