CN113255839B - 基于隐马尔可夫模型的目标检测模型的搜索方法 - Google Patents
基于隐马尔可夫模型的目标检测模型的搜索方法 Download PDFInfo
- Publication number
- CN113255839B CN113255839B CN202110730872.3A CN202110730872A CN113255839B CN 113255839 B CN113255839 B CN 113255839B CN 202110730872 A CN202110730872 A CN 202110730872A CN 113255839 B CN113255839 B CN 113255839B
- Authority
- CN
- China
- Prior art keywords
- target detection
- detection model
- state
- observation
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于隐马尔可夫模型的目标检测模型的搜索方法。包括:建立隐马尔可夫模型,对其参数重估后形成重构隐马尔可夫模型;预测得到其观察序列,观察量比较,不相同时,对隐马尔可夫模型参数变异后重复第二步骤;相同时,生成目标检测模型并训练至收敛后进行精度值测定、召回率测定和参数量计算;结果判定,满足预设条件时,判定为搜索到的模型;不满足预设条件时,对所有目标检测模型重新排序后得到观察序列,替换原有观察序列后重复上述步骤。本发明解决了现有技术中的目标检测模型因含带参数量庞大,而导致训练好的目标检测模型在使用中对终端设备的内存和GPU的负荷较大,造成终端设备执行困难的问题,故而存在实用性差的问题的问题。
Description
技术领域
本发明涉及模型搜索技术领域,具体而言,涉及一种基于隐马尔可夫模型的目标检测模型的搜索方法。
背景技术
随着人工智能技术的发展,目标检测作为人工智能的一个重要应用,广泛应用于越来越多的领域。比如人脸识别,行人检测,客流统计,安全防范等。与此同时,各种各样的目标检测算法也应用而生,包括SSD,YOLOv3,Faster R-CNN等。面对不同的检测任务,通常需要构造特定网络结构的目标检测模型,而现有的目标检测模型通常存在含带参数量庞大的问题,这样,训练好的目标检测模型在使用中对终端设备的内存和GPU的负荷较大,易导致终端设备执行困难,故而存在实用性差的问题。
发明内容
本发明的主要目的在于提供一种基于隐马尔可夫模型的目标检测模型的搜索方法,以解决现有技术中的目标检测模型因含带参数量庞大,而导致训练好的目标检测模型在使用中对终端设备的内存和GPU的负荷较大,造成终端设备执行困难的问题,故而存在实用性差的问题。
为了实现上述目的,本发明提供了一种基于隐马尔可夫模型的目标检测模型的搜索方法,包括:步骤S1,根据观察序列O、状态转移矩阵A、概率矩阵B以及初始状态分布概率Π建立用于目标检测模型搜索的隐马尔可夫模型,其中,观察序列O包含n个观察量,每个观察量对应指代一个目标检测模型;步骤S2,利用Baum-Welch算法并基于观察序列O,对隐马尔可夫模型的状态转移矩阵A、概率矩阵B以及初始状态分布概率Π进行参数重估,直至隐马尔可夫模型收敛,保存上述各参数值,形成重构隐马尔可夫模型;步骤S3,利用Viterbi算法和重构隐马尔科夫模型预测得到观察序列O1,其中,观察序列O1包含n+1个观察量;步骤S4,判断观察序列O1中的前n个观察量与观察序列O中的n个观察量是否一一对应相同,当两者不相同时,对隐马尔可夫模型的状态转移矩阵A的参数和/或概率矩阵B的参数进行变异后重复步骤S2;当两者相同时,使用观察序列O1中的第n+1个观察量生成与其对应的目标检测模型Ω(n+1);步骤S5,训练目标检测模型Ω(n+1)至收敛后,对目标检测模型Ω(n+1)进行精度值测定、召回率测定和参数量计算,分别获得目标检测模型Ω(n+1)的精度值、召回率和参数量;步骤S6,对搜索到的目标检测模型Ω(n+1)进行结果判定,当目标检测模型Ω(n+1)的精度值、召回率和参数量同时满足预设条件时,判定目标检测模型Ω(n+1)为搜索输出的目标检测模型;当目标检测模型Ω(n+1)的精度值或召回率或参数量不满足预设条件时,对观察序列O1中的所有观察量对应的目标检测模型分别进行精度值测定、召回率测定和参数量计算,利用各目标检测模型的精度值、召回率和参数量计算目标检测模型的排序得分C,根据排序得分C对所有目标检测模型重新排序后得到对应的观察序列O2,使用观察序列O2替换观察序列O后重复步骤S1至步骤S5。
进一步地,目标检测模型的排序得分C根据公式(1)计算获得:
C=k1·R1+k2·P2+k3·P3 (1)
公式(1)中,R1表示目标检测模型的召回率recall;k1表示目标检测模型的召回率recall对应的权重系数;P2表示目标检测模型的精度值precision;k2表示目标检测模型的精度值precision对应的权重系数;P3表示目标检测模型的参数量parameter;k3表示目标检测模型的参数量parameter对应的权重系数。
进一步地,根据排序得分C由小到大对所有目标检测模型重新排序后得到对应的观察序列O2。
进一步地,预设条件为:目标检测模型Ω(n+1)的精度值大于第一预设值,第一预设值的取值范围为[0.5,0.9];目标检测模型Ω(n+1)的召回率大于第二预设值,第二预设值的取值范围为[0.5,0.9];目标检测模型Ω(n+1)的参数量小于第三预设值,第三预设值的取值范围为[200000,300000]。
进一步地,在步骤S4中,当观察序列O1中的前n个观察量与观察序列O中的n个观察量不一一对应相同时,随机选取隐马尔可夫模型的状态转移矩阵A的一行作为第一遗传变异行,在第一遗传变异行随机选取参数a1和参数a2,将参数a1修改为且将参数a2修改为的取值范围为[-0.1,-0.01]∪[0.01,0.1];和/或随机选取隐马尔可夫模型的概率矩阵B的一行作为第二遗传变异行,在第二遗传变异行随机选取参数b1和参数b2,将参数b1修改为b1+Δψ,且将参数b2修改为b2-Δψ,Δψ的取值范围为[-0.1,-0.01]∪[0.01,0.1]。
进一步地,目标检测模型由前处理网络结构和沙漏网络结构组成,步骤S1包括:
步骤S11,构造隐含状态集合S,其隐含状态数目N为13,隐含状态集合S为{s1,s2,s3,s4,s5,s6,s7,s8,s9,s10,s11,s12,s13},其中,隐含状态s1指代卷积+res网络结构,隐含状态s2指代卷积网络结构,隐含状态s3指代res网络结构,隐含状态s4至隐含状态s13均指代神经网络的不同的channel数;步骤S12,构造观察状态集合V,其观察状态数目M为12,观察状态集合V为{v1,v2,v3,v4,v5,v6,v7,v8,v9,v10,v11,v12},其中,观察状态v1和观察状态v2用于定义前处理网络结构,观察状态v3至观察状态v12用于定义沙漏网络结构,观察状态v1和观察状态v2分别在隐含状态s1、隐含状态s2和隐含状态s3中择一选定,观察状态v3至观察状态v12分别在隐含状态s4至隐含状态s13中择一选定;步骤S13,对隐含状态集合S的所有隐含状态按顺序编码,各观察状态集合V对应于隐含状态集合S的编码号记为观察序列O的一个观察量,多个观察量构造形成观察序列O为{o1,o2,o3···on},其中,n为观察状态集合V的个数,其为大于等于1的正整数。
进一步地,状态转移矩阵A为{{aij(k)}},aij(k)=P[qt(k)+1=sj丨qt(k)=si],其中,1≤i≤N,1≤j≤N,1≤k≤M,qt(k)表示在t时刻观察量on中第k个观察状态,sj表示隐含状态集合S中第j个隐含状态,si表示隐含状态集合S中第i个隐含状态,状态转移矩阵A表示观察序列O中的观察量on-1的所有观察状态转移后形成观察量on的概率;概率矩阵B为{{bjk(k)}},bjk(k)=P[qt(k)=sj],其中,1≤j≤N,1≤k≤M,qt(k)表示在t时刻观察量on中第k个观察状态,sj表示隐含状态集合S中第j个隐含状态,概率矩阵B表示观察序列O中的观察量on的所有观察状态体现为隐含状态集S的概率;初始状态分布概率Π为{πi(k)},πi(k)=P{si=q1(k)},其中,1≤i≤N,1≤k≤M,且∑πi(k)=1;初始状态分布概率Π表示观察序列O中的观察量o1的所有观察状态体现为隐含状态集S的概率。
进一步地,状态转移矩阵A为由M个N*N的方阵构成的三维矩阵。
进一步地,隐马尔可夫模型为二维隐马尔可夫模型。
进一步地,在步骤S5中,使用目标图像训练集训练目标检测模型Ω(n+1);使用目标图像验证集对目标检测模型Ω(n+1)进行精度值测定和召回率测定。
应用本发明的技术方案,通过重构隐马尔可夫模型搜索获得特定网络结构的目标检测模型,能够有效地减小目标检测模型的尺寸,大幅度缩减目标检测模型的参数量,从而确保目标检测模型能够使用于大部分终端设备,提高了目标检测模型的实用性,利用本发明提供的方法获得的目标检测模型不会给终端设备带来过大的运行负荷,确保了终端设备能够长时间稳定运行,确保目标检测的可靠性。利用上述的搜索方法的步骤搜索得到满足预设条件的目标检测模型,能够实现对目标检测模型的有效压缩,在保证了在利用深度学习使得计算机视觉任务的性能提高的前提下,最大限度地减小了目标检测模型对于计算空间和时间的消耗,克服了高额的存储空间、计算资源消耗在各种终端设备上难于有效应用的问题。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明的一种可选实施例的基于隐马尔可夫模型的目标检测模型的搜索方法的流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”、“和”、“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了解决现有技术中的目标检测模型因含带参数量庞大,而导致训练好的目标检测模型在使用中对终端设备的内存和GPU的负荷较大,造成终端设备执行困难的问题,故而存在实用性差的问题的问题,本发明提供了一种基于隐马尔可夫模型的目标检测模型的搜索方法。当然,本发明还提供了一种存储介质,存储介质为计算机可读存储介质,存储介质上存储有计算机程序指令,其中,程序指令被处理器执行时用于实现上述的基于隐马尔可夫模型的目标检测模型的搜索方法的步骤。本发明还提供了一种电子设备,包括:处理器、存储器、通信元件和通信总线,处理器、存储器和通信元件通过所述通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行如上述的基于隐马尔可夫模型的目标检测模型的搜索方法的步骤。
图1是根据本发明实施例的基于隐马尔可夫模型的目标检测模型的搜索方法的流程图。
如图1所示,该目标检测模型的搜索方法包括步骤如下:
步骤S1,根据观察序列O、状态转移矩阵A、概率矩阵B以及初始状态分布概率Π建立用于目标检测模型搜索的隐马尔可夫模型,其中,观察序列O包含n个观察量,每个观察量对应指代一个目标检测模型;步骤S2,利用Baum-Welch算法并基于观察序列O,对隐马尔可夫模型的状态转移矩阵A、概率矩阵B以及初始状态分布概率Π进行参数重估,直至隐马尔可夫模型收敛,保存上述各参数值,形成重构隐马尔可夫模型;步骤S3,利用Viterbi算法和重构隐马尔科夫模型预测得到观察序列O1,其中,观察序列O1包含n+1个观察量;步骤S4,判断观察序列O1中的前n个观察量与观察序列O中的n个观察量是否一一对应相同,当两者不相同时,对隐马尔可夫模型的状态转移矩阵A的参数和/或概率矩阵B的参数进行变异后重复步骤S2;当两者相同时,使用观察序列O1中的第n+1个观察量生成与其对应的目标检测模型Ω(n+1);步骤S5,训练目标检测模型Ω(n+1)至收敛后,对目标检测模型Ω(n+1)进行精度值测定、召回率测定和参数量计算,分别获得目标检测模型Ω(n+1)的精度值、召回率和参数量;步骤S6,对搜索到的目标检测模型Ω(n+1)进行结果判定,当目标检测模型Ω(n+1)的精度值、召回率和参数量同时满足预设条件时,判定目标检测模型Ω(n+1)为搜索输出的目标检测模型;当目标检测模型Ω(n+1)的精度值或召回率或参数量不满足预设条件时,对观察序列O1中的所有观察量对应的目标检测模型分别进行精度值测定、召回率测定和参数量计算,利用各目标检测模型的精度值、召回率和参数量计算目标检测模型的排序得分C,根据排序得分C对所有目标检测模型重新排序后得到对应的观察序列O2,使用观察序列O2替换观察序列O后重复步骤S1至步骤S5。
通过重构隐马尔可夫模型搜索获得特定网络结构的目标检测模型,能够有效地减小目标检测模型的尺寸,大幅度缩减目标检测模型的参数量,从而确保目标检测模型能够使用于大部分终端设备,提高了目标检测模型的实用性,利用本发明提供的方法获得的目标检测模型不会给终端设备带来过大的运行负荷,确保了终端设备能够长时间稳定运行,确保目标检测的可靠性。利用上述的搜索方法的步骤搜索得到满足预设条件的目标检测模型,能够实现对目标检测模型的有效压缩,在保证了在利用深度学习使得计算机视觉任务的性能提高的前提下,最大限度地减小了目标检测模型对于计算空间和时间的消耗,克服了高额的存储空间、计算资源消耗在各种终端设备上难于有效应用的问题。
需要说明的是,本发明的目标检测模型通过目标检测网络对待测图像进行中心点检测以识别目标对象。目标检测网络由前处理网络结构和沙漏网络结构组成。可选地,前处理网络结构作为目标检测网络的一部分用于浅层特征提取和压缩模型计算量,沙漏网络结构用于深层特征提取。神经网络结构搜索(NAS)即在现有的目标检测网络上搜索出一个含有参数量更少的沙漏网络结构的检测网络,从而经过训练得到的目标检测模型在使用过程中计算量更小。
由于基于沙漏网络结构的目标检测网络所使用的特征提取网络是在开源的coco数据集90类上训练得到,而目标检测模型在实际使用中不需要对重多类别的目标对象进行检测,而是只有几类目标对象需要检测,因此,沙漏网络结构不需要设定庞大的参数量(亿级别),参数量能够控制在低量水平(30万-200万),从而训练好的目标检测模型不会因存在大参数量而导致终端设备执行困难,大大地降低了对终端设备的内存和GPU的负荷。
具体地,步骤S1包括:步骤S11,构造隐含状态集合S,其隐含状态数目N为13,隐含状态集合S为{s1,s2,s3,s4,s5,s6,s7,s8,s9,s10,s11,s12,s13},其中,隐含状态s1指代卷积+res网络结构,隐含状态s2指代卷积网络结构,隐含状态s3指代res网络结构,隐含状态s4至隐含状态s13均指代神经网络的不同的channel数;步骤S12,构造观察状态集合V,其观察状态数目M为12,观察状态集合V为{v1,v2,v3,v4,v5,v6,v7,v8,v9,v10,v11,v12},其中,观察状态v1和观察状态v2用于定义前处理网络结构,观察状态v3至观察状态v12用于定义沙漏网络结构,观察状态v1和观察状态v2分别在隐含状态s1、隐含状态s2和隐含状态s3中择一选定,观察状态v3至观察状态v12分别在隐含状态s4至隐含状态s13中择一选定;步骤S13,对隐含状态集合S的所有隐含状态按顺序编码,各观察状态集合V对应于隐含状态集合S的编码号记为观察序列O的一个观察量,多个观察量构造形成观察序列O为{o1,o2,o3···on},其中,n为观察状态集合V的个数,其为大于等于1的正整数。
本实施例中,隐含状态s4至隐含状态s13指代神经网络的10个不同的channel数为{0,8,16,24,32,48,64,80,96,128}。
则构造的隐含状态集合S为:
{卷积+res网络结构,卷积网络结构,res网络结构,0,8,16,24,32,48,64,80,96,128}。对隐含状态集合S中的每一个隐含状态进行编号,则13个隐含状态分别对应的编号为:0、1、2、3、4、5、6、7、8、9、10、11、12。
观察状态集合V为{v1,v2,v3,v4,v5,v6,v7,v8,v9,v10,v11,v12},其中,{v1,v2}定义为前处理网络结构,{v3,v4,v5,v6,v7,v8,v9,v10,v11,v12}定义为沙漏网络结构。
在一个可选实施例中,构造的观察状态集合V为:
{卷积网络结构,卷积+res网络结构,16,32,48,64,64,64,80,80,128,128},则根据隐含状态集合S中的每一个隐含状态进行编号形成观察序列O的一个观察量,记为:
o1={1,0,5,7,8,9,9,9,10,10,12,12}。通过观察量o1不断地迭代出更多的观察量,进而获取包含多个观察量的观察序列O。
需要说明的是,将M个N*N的方阵构成状态转移矩阵A,状态转移矩阵A为{{aij(k)}},aij(k)=P[qt(k)+1=sj丨qt(k)=si],其中,1≤i≤N,1≤j≤N,1≤k≤M,qt(k)表示在t时刻观察量on中第k个观察状态,sj表示隐含状态集合S中第j个隐含状态,si表示隐含状态集合S中第i个隐含状态,状态转移矩阵A表示观察序列O中的观察量on-1的所有观察状态转移后形成观察量on的概率;概率矩阵B为{{bjk(k)}},bjk(k)=P[qt(k)=sj],其中,1≤j≤N,1≤k≤M,qt(k)表示在t时刻观察量on中第k个观察状态,sj表示隐含状态集合S中第j个隐含状态,概率矩阵B表示观察序列O中的观察量on的所有观察状态体现为隐含状态集S的概率;初始状态分布概率Π为{πi(k)},πi(k)=P{si=q1(k)},其中,1≤i≤N,1≤k≤M,且∑πi(k)=1;初始状态分布概率Π表示观察序列O中的观察量o1的所有观察状态体现为隐含状态集S的概率。在本实施例中,N=13,M=12。
需要说明的是,在步骤S2之前,利用对应于初始网络结构的观察量o1以及目标检测模型的网络结构的参数量减小的搜索方向初始化状态转移矩阵A、概率矩阵B和初始状态分布概率Π。连续型的隐马尔可夫模型的概率矩阵B通过一个连续的函数得到观察序列O与状态转移矩阵A的关系,常用方式是使用混合高斯概率密度函数:
其中,1≤j≤N,bj(Ot)表示观察序列在时刻t的值Ot由隐含状态j所表现的概率,Cjm是状态j的第m个混合高斯权重,N(Ot,μjm,Ujm)是一个均值为μjm、方差为Ujm的高斯概率密度函数,M表示混合高斯概率密度函数混合的数目,其中混合系数满足:
在步骤S6中,目标检测模型的排序得分C根据公式(1)计算获得:
C=k1·R1+k2·P2+k3·P3 (1)
公式(1)中,R1表示目标检测模型的召回率recall;k1表示目标检测模型的召回率recall对应的权重系数;P2表示目标检测模型的精度值precision;k2表示目标检测模型的精度值precision对应的权重系数;P3表示目标检测模型的参数量parameter;k3表示目标检测模型的参数量parameter对应的权重系数。
可选地,k1∈(0,1),k3∈(-1/5000000,-1/10000000),k1∈(0,1)。
可选地,根据排序得分C由小到大对所有目标检测模型重新排序后得到对应的观察序列O2。
进一步地,预设条件为:目标检测模型Ω(n+1)的精度值大于第一预设值,第一预设值的取值范围为[0.5,0.9];目标检测模型Ω(n+1)的召回率大于第二预设值,第二预设值的取值范围为[0.5,0.9];目标检测模型Ω(n+1)的参数量小于第三预设值,第三预设值的取值范围为[200000,300000]。
进一步地,在步骤S4中,当观察序列O1中的前n个观察量与观察序列O中的n个观察量不一一对应相同时,随机选取隐马尔可夫模型的状态转移矩阵A的一行作为第一遗传变异行,在第一遗传变异行随机选取参数a1和参数a2,将参数a1修改为且将参数a2修改为的取值范围为[-0.1,-0.01]∪[0.01,0.1];和/或随机选取隐马尔可夫模型的概率矩阵B的一行作为第二遗传变异行,在第二遗传变异行随机选取参数b1和参数b2,将参数b1修改为b1+Δψ,且将参数b2修改为b2-Δψ,Δψ的取值范围为[-0.1,-0.01]∪[0.01,0.1]。
本发明中,可选地,隐马尔可夫模型为二维隐马尔可夫模型。
还需要说明的是,在步骤S5中,使用目标图像训练集训练目标检测模型Ω(n+1);使用目标图像验证集对目标检测模型Ω(n+1)进行精度值测定和召回率测定。目标图像训练集和目标图像验证集都包含有大量的图像样本。
本发明将基于沙漏网络结构的目标检测模型的网络结构进行编号,排列为变量序列,根据初始模型结构训练初始隐马尔可夫模型,利用初始马尔可夫模型预测后续的模型结构后,利用目标图像训练集训练该模型结构后,在目标图像验证集上获得模型的精度后,根据已有的模型结构的计算量和在验证集上的精度对模型结构排序,利用排序好的模型结构重新训练隐马尔可夫模型后,然后循环上述过程直到得到满足需求的目标检测模型。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于隐马尔可夫模型的目标检测模型的搜索方法,其特征在于,包括:
步骤S1,根据观察序列O、状态转移矩阵A、概率矩阵B以及初始状态分布概率Π建立用于目标检测模型搜索的隐马尔可夫模型,其中,所述观察序列O包含n个观察量,每个所述观察量对应指代一个所述目标检测模型;
所述目标检测模型由前处理网络结构和沙漏网络结构组成,所述步骤S1包括:
步骤S11,构造隐含状态集合S,其隐含状态数目N为13,所述隐含状态集合S为{s1,s2,s3,s4,s5,s6,s7,s8,s9,s10,s11,s12,s13},其中,隐含状态s1指代卷积+res网络结构,隐含状态s2指代卷积网络结构,隐含状态s3指代res网络结构,隐含状态s4至隐含状态s13均指代神经网络的不同的channel数;
步骤S12,构造观察状态集合V,其观察状态数目M为12,所述观察状态集合V为{v1,v2,v3,v4,v5,v6,v7,v8,v9,v10,v11,v12},其中,观察状态v1和观察状态v2用于定义所述前处理网络结构,观察状态v3至观察状态v12用于定义所述沙漏网络结构,所述观察状态v1和所述观察状态v2分别在所述隐含状态s1、所述隐含状态s2和所述隐含状态s3中择一选定,所述观察状态v3至所述观察状态v12分别在所述隐含状态s4至所述隐含状态s13中择一选定;
步骤S13,对所述隐含状态集合S的所有隐含状态按顺序编码,各所述观察状态集合V对应于所述隐含状态集合S的编码号记为所述观察序列O的一个所述观察量,多个所述观察量构造形成所述观察序列O为{o1,o2,o3···on},其中,n为观察状态集合V的个数,其为大于等于1的正整数;
所述状态转移矩阵A为{{aij(k)}},aij(k)=P[qt(k)+1=sj丨qt(k)=si],其中,1≤i≤N,1≤j≤N,1≤k≤M,qt(k)表示在t时刻观察量on中第k个观察状态,sj表示所述隐含状态集合S中第j个隐含状态,si表示所述隐含状态集合S中第i个隐含状态,所述状态转移矩阵A表示所述观察序列O中的观察量on-1的所有观察状态转移后形成观察量on的概率;
所述概率矩阵B为{{bjk(k)}},bjk(k)=P[qt(k)=sj],其中,1≤j≤N,1≤k≤M,qt(k)表示在t时刻观察量on中第k个观察状态,sj表示所述隐含状态集合S中第j个隐含状态,所述概率矩阵B表示所述观察序列O中的观察量on的所有观察状态体现为所述隐含状态集S的概率;
所述初始状态分布概率Π为{πi(k)},πi(k)=P{si=q1(k)},其中,1≤i≤N,1≤k≤M,且∑πi(k)=1;所述初始状态分布概率Π表示所述观察序列O中的观察量o1的所有观察状态体现为隐含状态集S的概率;
步骤S2,利用Baum-Welch算法并基于所述观察序列O,对所述隐马尔可夫模型的状态转移矩阵A、概率矩阵B以及初始状态分布概率Π进行参数重估,直至所述隐马尔可夫模型收敛,保存上述各参数值,形成重构隐马尔可夫模型;
步骤S3,利用Viterbi算法和所述重构隐马尔科夫模型预测得到观察序列O1,其中,所述观察序列O1包含n+1个观察量;
步骤S4,判断所述观察序列O1中的前n个观察量与所述观察序列O中的n个观察量是否一一对应相同,当两者不相同时,对所述隐马尔可夫模型的状态转移矩阵A的参数和/或概率矩阵B的参数进行变异后重复所述步骤S2;当两者相同时,使用所述观察序列O1中的第n+1个观察量生成与其对应的目标检测模型Ω(n+1);
步骤S5,训练所述目标检测模型Ω(n+1)至收敛后,对所述目标检测模型Ω(n+1)进行精度值测定、召回率测定和参数量计算,分别获得所述目标检测模型Ω(n+1)的精度值、召回率和参数量;
步骤S6,对搜索到的所述目标检测模型Ω(n+1)进行结果判定,
当所述目标检测模型Ω(n+1)的精度值、召回率和参数量同时满足预设条件时,判定所述目标检测模型Ω(n+1)为搜索输出的目标检测模型;
当所述目标检测模型Ω(n+1)的精度值或召回率或参数量不满足预设条件时,对所述观察序列O1中的所有观察量对应的目标检测模型分别进行精度值测定、召回率测定和参数量计算,利用各所述目标检测模型的精度值、召回率和参数量计算所述目标检测模型的排序得分C,根据所述排序得分C对所有所述目标检测模型重新排序后得到对应的观察序列O2,使用所述观察序列O2替换所述观察序列O后重复所述步骤S1至所述步骤S5;
在所述步骤S5中,使用目标图像训练集训练所述目标检测模型Ω(n+1);使用目标图像验证集对所述目标检测模型Ω(n+1)进行精度值测定和召回率测定;
所述目标检测模型通过目标检测网络对待测图像进行中心点检测以识别目标对象。
2.根据权利要求1所述的目标检测模型的搜索方法,其特征在于,所述目标检测模型的排序得分C根据公式(1)计算获得:
C=k1·R1+k2·P2+k3·P3 (1)
公式(1)中,
R1表示所述目标检测模型的召回率recall;
k1表示所述目标检测模型的召回率recall对应的权重系数;
P2表示所述目标检测模型的精度值precision;
k2表示所述目标检测模型的精度值precision对应的权重系数;
P3表示所述目标检测模型的参数量parameter;
k3表示所述目标检测模型的参数量parameter对应的权重系数。
3.根据权利要求1所述的目标检测模型的搜索方法,其特征在于,根据所述排序得分C由小到大对所有所述目标检测模型重新排序后得到对应的所述观察序列O2。
4.根据权利要求1所述的目标检测模型的搜索方法,其特征在于,所述预设条件为:
所述目标检测模型Ω(n+1)的精度值大于第一预设值,所述第一预设值的取值范围为[0.5,0.9];
所述目标检测模型Ω(n+1)的召回率大于第二预设值,所述第二预设值的取值范围为[0.5,0.9];
所述目标检测模型Ω(n+1)的参数量小于第三预设值,所述第三预设值的取值范围为[200000,300000]。
5.根据权利要求1所述的目标检测模型的搜索方法,其特征在于,在所述步骤S4中,当所述观察序列O1中的前n个观察量与所述观察序列O中的n个观察量不一一对应相同时,
随机选取所述隐马尔可夫模型的状态转移矩阵A的一行作为第一遗传变异行,在所述第一遗传变异行随机选取参数a1和参数a2,将所述参数a1修改为且将所述参数a2修改为所述的取值范围为[-0.1,-0.01]∪[0.01,0.1];和/或
随机选取所述隐马尔可夫模型的概率矩阵B的一行作为第二遗传变异行,在所述第二遗传变异行随机选取参数b1和参数b2,将所述参数b1修改为b1+Δψ,且将所述参数b2修改为b2-Δψ,所述Δψ的取值范围为[-0.1,-0.01]∪[0.01,0.1]。
6.根据权利要求1所述的目标检测模型的搜索方法,其特征在于,所述状态转移矩阵A为由M个N*N的方阵构成的三维矩阵。
7.根据权利要求1所述的目标检测模型的搜索方法,其特征在于,所述隐马尔可夫模型为二维隐马尔可夫模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110730872.3A CN113255839B (zh) | 2021-06-30 | 2021-06-30 | 基于隐马尔可夫模型的目标检测模型的搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110730872.3A CN113255839B (zh) | 2021-06-30 | 2021-06-30 | 基于隐马尔可夫模型的目标检测模型的搜索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113255839A CN113255839A (zh) | 2021-08-13 |
CN113255839B true CN113255839B (zh) | 2021-10-01 |
Family
ID=77190170
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110730872.3A Active CN113255839B (zh) | 2021-06-30 | 2021-06-30 | 基于隐马尔可夫模型的目标检测模型的搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113255839B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115063428B (zh) * | 2022-08-18 | 2022-11-08 | 中国科学院国家空间科学中心 | 一种基于深度强化学习的空间暗弱小目标检测方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103034847A (zh) * | 2012-12-13 | 2013-04-10 | 河海大学 | 一种基于隐马尔可夫模型的人脸识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10929767B2 (en) * | 2016-05-25 | 2021-02-23 | International Business Machines Corporation | Method for complex events detection using hidden markov models |
-
2021
- 2021-06-30 CN CN202110730872.3A patent/CN113255839B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103034847A (zh) * | 2012-12-13 | 2013-04-10 | 河海大学 | 一种基于隐马尔可夫模型的人脸识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113255839A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6959308B2 (ja) | スパース性制約及び知識の蒸留に基づくスパースかつ圧縮されたニューラルネットワーク | |
CN108737406B (zh) | 一种异常流量数据的检测方法及系统 | |
Beskos et al. | A stable particle filter for a class of high-dimensional state-space models | |
CN109086653B (zh) | 手写模型训练方法、手写字识别方法、装置、设备及介质 | |
Asuncion et al. | Learning with blocks: Composite likelihood and contrastive divergence | |
CN111488985A (zh) | 深度神经网络模型压缩训练方法、装置、设备、介质 | |
CN110135681A (zh) | 风险用户识别方法、装置、可读存储介质及终端设备 | |
WO2020086176A1 (en) | Artificial neural network and method of training an artificial neural network with epigenetic neurogenesis | |
CN113255839B (zh) | 基于隐马尔可夫模型的目标检测模型的搜索方法 | |
CN114332500A (zh) | 图像处理模型训练方法、装置、计算机设备和存储介质 | |
CN113516019B (zh) | 高光谱图像解混方法、装置及电子设备 | |
CN113345564B (zh) | 一种基于图神经网络的患者住院时长早期预测方法及装置 | |
Ballani et al. | Sparse inverse covariance estimation with hierarchical matrices | |
Tembine | Mean field stochastic games: Convergence, Q/H-learning and optimality | |
CN106707243A (zh) | 一种重构雷达信号的广义正则化正交匹配追踪方法 | |
CN114912109B (zh) | 一种基于图嵌入的异常行为序列识别方法及系统 | |
CN107808164B (zh) | 一种基于烟花算法的纹理图像特征选择方法 | |
Brandejsky | Model identification from incomplete data set describing state variable subset only–the problem of optimizing and predicting heuristic incorporation into evolutionary system | |
CN112463964B (zh) | 文本分类及模型训练方法、装置、设备及存储介质 | |
Zheng et al. | Minimal support vector machine | |
Dar et al. | MLGAN: Addressing Imbalance in Multilabel Learning Using Generative Adversarial Networks | |
CN110717359A (zh) | 基于数理统计的反向传播优化方法、装置及电子设备 | |
CN112988186B (zh) | 异常检测系统的更新方法及装置 | |
CN115086082B (zh) | 基于深度学习的网络安全评估方法、系统、设备及介质 | |
CN112509640B (zh) | 基因本体项名称生成方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |