CN113128608A - 一种基于5g和图嵌入优化的tsvm模型自优化与预测方法、设备及存储介质 - Google Patents

一种基于5g和图嵌入优化的tsvm模型自优化与预测方法、设备及存储介质 Download PDF

Info

Publication number
CN113128608A
CN113128608A CN202110451360.3A CN202110451360A CN113128608A CN 113128608 A CN113128608 A CN 113128608A CN 202110451360 A CN202110451360 A CN 202110451360A CN 113128608 A CN113128608 A CN 113128608A
Authority
CN
China
Prior art keywords
tsvm
sample
model
optimization
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110451360.3A
Other languages
English (en)
Other versions
CN113128608B (zh
Inventor
张海霞
王翊州
袁东风
马睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Publication of CN113128608A publication Critical patent/CN113128608A/zh
Application granted granted Critical
Publication of CN113128608B publication Critical patent/CN113128608B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本发明涉及一种基于5G和图嵌入优化的TSVM模型自优化与预测方法、设备及存储介质,包括:(1)获取训练集并进行数据标注,形成带标记数据集;(2)用带标记数据集训练TSVM模型;同时,利用图嵌入技术将带标记数据集中的数据作为节点嵌入到流形空间中;(3)将未标注数据集中的样本数据输入训练好的TSVM模型中进行预测,若能够有把握判断该样本是否合格,此时直接输出识别结果;否则,将该样本数据作为节点嵌入到流形空间当中,判断该样本数据是否合格,并输出识别结果。本发明能够充分有效利用不带标签的数据,通过半监督学习,训练产品外观质检的识别模型,大大节省了数据集标注工作的人工成本。

Description

一种基于5G和图嵌入优化的TSVM模型自优化与预测方法、设 备及存储介质
技术领域
本发明涉及一种基于5G和图嵌入优化的直推式支持向量机(TransductiveSupport Vector Machine,下文均简称为TSVM)离散制造业外观质检模型自优化与预测方法、设备及存储介质,属于半监督学习技术领域。
背景技术
随着中国制造2025以及工业4.0等智能制造进程的推进,越来越多的制造业向自动化智能化生产转型,在离散制造业外观质检环节,很多企业都引入现代传感器来辅助人眼检查,甚至代替人工检查,最普遍的就是利用工业相机获取待测产品外观信息,利用计算机视觉技术来进行检测。但是,仅使用简单的计算机视觉技术(如利用OpenCV进行模板匹配等)并未赋予质检系统智能化,识别率差。
部分先进企业采用人工智能的方法,训练人工神经网络来进行产品外观质检,给产线赋能,但仍然存在以下问题:首先,利用人工智能的手段进行外观质检,通常采用深度学习的方法(如卷积神经网络等),此类方法属于机器学习中的有监督学习,即模型完全由标记好的数据集训练得到,而在实际生产中,带标签的数据集几乎不存在,我们能轻易得到的数据几乎都是不带标签的;其次,深度学习模型的性能直接取决于训练集的大小,若要提升模型性能,则必须增加准确的带标签的数据集,增加人力和时间成本;另外,模型在训练结束后,性能将不再变化,若要提高优化其识别正确率,则需要重新训练新的模型,浪费资源,不方便后期的产线升级。
现已有一部分人针对上述问题提出了提出各种半监督学习半监督的方案,如中国专利文献CN103955462A公开的一种基于多视图和半监督学习机制的图像标注方法,但这些专利申请仅聚焦于图像信息的标注和分类等算法,并未与实际工业生产相结合,未形成完整的生产过程,没有对实际生产生活进行指导。
发明内容
针对现有技术的不足,本发明提供了一种基于5G和图嵌入优化的TSVM离散制造业外观质检模型自优化与预测方法。
本发明还提供了一种计算机设备及存储介质。
术语解释:
1、TSVM模型,即直推式支持向量机(TSVM),是支持向量机模型的一种,支持向量机是机器学习中一种分类方法,属于判别式模型。其基本思想是对给定的数据集在样本空间中找到一个划分超平面,从而将不同的样本分开。求解支持向量机模型,就是在寻找最大间隔的划分超平面(即所有样本点到超平面的距离最大),使得该超平面能够对数据样本的分类效果最好。直推式支持向量机是一种要求超平面在训练集上的分类效果最好的支持向量机模型,其用于训练的数据集也是需要进行分类的数据集。
2、图嵌入(Graph Embedding,也叫Network Embedding)技术,是一种将图数据(通常为高维稠密的矩阵)映射为低微稠密向量的过程,能够很好地解决图数据难以高效输入机器学习算法的问题。
3、流形(Manifold)空间,是局部具有欧氏空间性质的空间。而实际上欧氏空间就是流形最简单的实例。一般的流形可以通过把许多平直的片折弯并粘连而成。
4、超平面(hyperplane),是n维欧氏空间中余维度等于一的线性子空间(也就是必须是(n-1)维度)。这是平面中的直线、空间中的平面之推广(n大于3才被称为"超"平面),是纯粹的数学概念,不是现实的物理概念。因为是子空间,所以超平面一定经过原点。
本发明的技术方案如下:
一种基于5G和图嵌入优化的TSVM离散制造业外观质检模型自优化与预测方法,包括步骤如下:
(1)在已有的未标注数据集(不带标签的数据集)中随机抽取若干数量的数据作为训练集,并对其进行数据标注,形成带标记数据集;带标记数据集中的数据要尽可能做到具有代表性。
(2)用步骤(1)得到的带标记数据集训练TSVM模型;这里由于是多分类问题,采用一类对余类(one-against-all)的模型。
同时,利用图嵌入技术将步骤(1)得到的带标记数据集中的数据作为节点嵌入到流形空间当中,节点间的权重为两个节点的相似程度,即:节点间的权重是指两个节点之间的欧式距离的倒数;两点越近,权重越大,则两点表示的两个样本越相似。嵌入后,两节点间的位置关系可以反映出两个数据间的差别,节点与超平面的位置关系可反映出该样本是否合格以及与质检标准的差别等重要信息。
(3)将未标注数据集中的样本数据输入到步骤(2)训练好的TSVM模型中进行预测,
若该样本数据到TSVM模型划分超平面距离比较远,即样本数据到各个超平面的距离大于阈值,阈值为步骤(1)中已有的未标注数据集中所有初始样本中到超平面最近的欧式距离,则能够有把握判断该样本是否合格,此时直接输出识别结果;
否则,利用图嵌入技术将该样本数据作为节点嵌入到流形空间当中,计算该节点与周围节点的距离以及位置关系(可利用k近邻算法或比较各个节点间连接权重等聚类算法),根据图嵌入聚类判断该样本数据是否合格,并输出识别结果。
根据本发明优选的,步骤(3)中,利用图嵌入技术将该样本数据作为节点嵌入到流形空间当中,计算该节点与周围节点的距离以及位置关系(可利用k近邻算法或比较各个节点间连接权重等聚类算法),根据图嵌入聚类判断该样本数据是否合格,包括步骤如下:
a、对样本数据经过步骤(2)训练好的TSVM模型得到的识别结果进行归一化,并根据判断样本图片是否合格的约束条件,将相应的特征转换为n个特征值,并将所有特征值写为n维的特征向量xT;便于后续的图的特征嵌入以及聚类等;
b、利用图嵌入技术将n维的特征向量xT嵌入到流形空间当中,计算该样本数据与相邻最近的若干个向量之差并进行比较,判断出该样本数据与其它样本间的关系,从而判断出该样本是否合格。
进一步优选的,所述步骤b的具体实现过程为:
令所有n维的特征向量xT的尾均在原点O处,原点O是流形空间中的原点,即所有n维的特征向量xT首的点为以坐标为xT的点,且该节点表示所对应样本特征;
利用k近邻算法或比较各个节点间连接权重等聚类算法计算该节点与周围节点的距离,如果计算结果表明该节点靠近合格节点群,则说明该节点所代表的样本合格;如果结果表明该节点靠近不合格节点群或者其为孤立节点,则说明该节点所代表的样本不合格。
根据本发明优选的,步骤(3)中,
根据图嵌入聚类判断该样本数据不合格时,直接输出识别结果,结束;
根据图嵌入聚类判断该样本数据合格时,直接输出识别结果,并分别执行以下步骤A及步骤B:
步骤A是指:因该样本数据为TSVM模型没有把握识别准别的样本数据,则说明该TSVM模型对此类样本数据识别能力弱,因此,将该样本数据作为一个训练集中的训练样本,继续对TSVM模型参数进行优化,改善其性能;
步骤B是指:TSVM模型对该样本数据识别把握不足有可能是生产误差所致,对该样本数据图嵌入后进行分析,可以得到该样本数据与标准样本间差距,进而分析出此时是否有生产误差存在,该生产误差作为生产线的反馈,根据其对生产流程进行调整以及生产线的维护。
根据本发明优选的,TSVM模型所表示的超平面方程表达式如式(Ⅰ)所示:
wTx+b=0 (Ⅰ)
式(Ⅰ)中,在n维流形空间中,w是TSVM模型超平面的法向量,b为位移项,x是n维变量。
根据本发明优选的,步骤(3)中,xT嵌入到流形空间中的样本数据到TSVM模型划分超平面距离r如式(Ⅱ)所示:
Figure BDA0003038793630000041
设当第i个数据为合格产品时,令yi=1,反之yi=-1,此时,TSVM模型的目标函数如式(Ⅲ)所示:
Figure BDA0003038793630000042
s.t.yi(wTxi+b)≥1,i=1,2…l
式(Ⅲ)中,xi是第i个样本数据所对应的n维坐标,yi是第i个数据是否合格的标志。
根据本发明优选的,将该样本数据作为一个训练集中的训练样本,继续对TSVM模型参数进行优化,改善其性能,是指:
对于合格的样本数据,作为新样本,对TSVM模型进行优化,如式(Ⅳ)所示:
Figure BDA0003038793630000043
s.t.yi(wTx+b)≥1-ξ,i=1,2…l
ξ≥0
式(Ⅳ)中,C为新样本对TSVM模型的优化因子,ξ为松弛变量。
根据本发明优选的,通过工业相机获取的图像作为已有的未标注数据集,通过5G专网将图像从工业相机发送至TSVM模型,通过5G专网实现TSVM模型的下载。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现TSVM离散制造业外观质检模型自优化与预测方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现TSVM离散制造业外观质检模型自优化与预测方法的步骤。
本发明的有益效果为:
1、本发明能够充分有效利用不带标签的数据,通过半监督学习,训练产品外观质检的识别模型,大大节省了数据集标注工作的人工成本。
2、本发明将新的产品外观嵌入流形中建立关系图,创新地使用图嵌入技术来判断出该样本是否能够作为半监督学习的样本,在保障其识别准确率的基础上,有针对性地提高模型的泛化能力。
3、本发明模型基于TSVM进行改进,能够在后续的生产活动中,利用新的数据不断优化改良识别模型,实现识别系统的自优化功能。
4、本发明通过进行图嵌入,能够清楚地得到流形趋势,即产品外观与标准外观的偏差以及偏差趋势,此数据可以作为校准产品生产流水线机器校准的参考数据,实现离散制造业生产流水线预测性维护的闭环。
5、5G赋能整个系统,为数据传输的实时性提供了保障,实现模型的即时优化即时使用。
附图说明
图1为本发明TSVM离散制造业外观质检模型自优化与预测方法的流程示意图;
图2为TSVM模型的示意图。
具体实施方式
下面结合说明书附图和实施例对本发明作进一步限定,但不限于此。以下具体实施方式和附图仅是对本发明的技术方案的示例性说明,而不应当视为本发明的全部或者视为对本发明技术方案的限制或限定。
实施例1
一种基于5G和图嵌入优化的TSVM离散制造业外观质检模型自优化与预测方法,如图1所示,包括步骤如下:
(1)在已有的未标注数据集(不带标签的数据集)中随机抽取若干数量的数据作为训练集,并对其进行数据标注,形成带标记数据集;带标记数据集中的数据要尽可能做到具有代表性。
(2)用步骤(1)得到的带标记数据集训练TSVM模型;这里由于是多分类问题,采用一类对余类(one-against-all)的模型。
同时,利用图嵌入技术将步骤(1)得到的带标记数据集中的数据作为节点嵌入到流形空间当中,节点间的权重为两个节点的相似程度,即:节点间的权重是指两个节点之间的欧式距离的倒数;两点越近,权重越大,则两点表示的两个样本越相似。嵌入后,两节点间的位置关系可以反映出两个数据间的差别,节点与超平面的位置关系可反映出该样本是否合格以及与质检标准的差别等重要信息。
(3)将未标注数据集中的样本数据输入到步骤(2)训练好的TSVM模型中进行预测,
若该样本数据到TSVM模型划分超平面距离比较远,即样本数据到各个超平面的距离大于阈值,阈值为步骤(1)中已有的未标注数据集中所有初始样本中到超平面最近的欧式距离,则能够有把握判断该样本是否合格,此时直接输出识别结果;
否则,利用图嵌入技术将该样本数据作为节点嵌入到流形空间当中,计算该节点与周围节点的距离以及位置关系(可利用k近邻算法或比较各个节点间连接权重等聚类算法),根据图嵌入聚类判断该样本数据是否合格,并输出识别结果。
实施例2
根据实施例1所述的一种基于5G和图嵌入优化的TSVM离散制造业外观质检模型自优化与预测方法,其区别在于:
步骤(3)中,利用图嵌入技术将该样本数据作为节点嵌入到流形空间当中,计算该节点与周围节点的距离以及位置关系(可利用k近邻算法或比较各个节点间连接权重等聚类算法),根据图嵌入聚类判断该样本数据是否合格,包括步骤如下:
a、对样本数据经过步骤(2)训练好的TSVM模型得到的识别结果进行归一化,并根据判断样本图片是否合格的约束条件,将相应的特征转换为n个特征值,并将所有特征值写为n维的特征向量xT;便于后续的图的特征嵌入以及聚类等;
b、利用图嵌入技术将n维的特征向量xT嵌入到流形空间当中,计算该样本数据与相邻最近的若干个向量之差并进行比较,判断出该样本数据与其它样本间的关系,从而判断出该样本是否合格。
步骤b的具体实现过程为:
令所有n维的特征向量xT的尾均在原点O处,原点O是流形空间中的原点,即所有n维的特征向量xT首的点为以坐标为xT的点,且该节点表示所对应样本特征;
利用k近邻算法或比较各个节点间连接权重等聚类算法计算该节点与周围节点的距离,如果计算结果表明该节点靠近合格节点群,则说明该节点所代表的样本合格;如果结果表明该节点靠近不合格节点群或者其为孤立节点,则说明该节点所代表的样本不合格。
(3)中,根据图嵌入聚类判断该样本数据不合格时,直接输出识别结果,结束;根据图嵌入聚类判断该样本数据合格时,直接输出识别结果,并分别执行以下步骤A及步骤B:
步骤A是指:因该样本数据为TSVM模型没有把握识别准别的样本数据,则说明该TSVM模型对此类样本数据识别能力弱,因此,将该样本数据作为一个训练集中的训练样本,继续对TSVM模型参数进行优化,改善其性能;
步骤B是指:TSVM模型对该样本数据识别把握不足有可能是生产误差所致,对该样本数据图嵌入后进行分析,可以得到该样本数据与标准样本间差距,进而分析出此时是否有生产误差存在,该生产误差作为生产线的反馈,根据其对生产流程进行调整以及生产线的维护。
例如,该产品有a、b、c、d四个判别指标,并对应四个TSVM超平面,此时该样本经过图嵌入发现,因为节点位置太靠近超平面c导致系统无把握对其进行判断,这样可知此时生产的产品在关于c指标上存在生产误差,需要及时检查修正。
步骤(1)中,根据企业标准对有要求的部位进行标记,标记好的图片的信息转化为向量x。
图2为TSVM模型的示意图。其中,以二维特征为例,即每个样本特征可由(x1,x2)表示,则其中的超平面应为一条直线。class1是一种类型的样本,class2为另一种类型的样本,该支持向量机模型就是求解一条直线,使得直线将整个样本空间分成两个部分,使得直线两侧的样本为两种不同的样本,并且直线穿过数据低密度区域。TSVM模型所表示的超平面方程表达式如式(Ⅰ)所示:
wTx+b=0 (Ⅰ)
式(Ⅰ)中,在n维流形空间中,w是TSVM模型超平面的法向量,b为位移项,x是n维变量。
步骤(3)中,xT嵌入到流形空间中的样本数据到TSVM模型划分超平面距离r如式(Ⅱ)所示:
Figure BDA0003038793630000071
设当第i个数据为合格产品时,令yi=1,反之yi=-1,此时,TSVM模型的目标函数如式(Ⅲ)所示:
Figure BDA0003038793630000072
s.t.yi(wTxi+b)≥1,i=1,2…l
式(Ⅲ)中,xi是第i个样本数据所对应的n维坐标,yi是第i个数据是否合格的标志。
将该样本数据作为一个训练集中的训练样本,继续对TSVM模型参数进行优化,改善其性能,是指:
对于合格的样本数据,作为新样本,对TSVM模型进行优化,如式(Ⅳ)所示:
Figure BDA0003038793630000073
s.t.yi(wTx+b)≥1-ξ,i=1,2…l
ξ≥0
式(Ⅳ)中,C为新样本对TSVM模型的优化因子,ξ为松弛变量。
通过工业相机获取的图像作为已有的未标注数据集,通过5G专网将图像从工业相机发送至TSVM模型,通过5G专网实现TSVM模型的下载。
实施例3
根据实施例2所述的一种基于5G和图嵌入优化的TSVM离散制造业外观质检模型自优化与预测方法,其区别在于:
下面以一个空调生产商的空调外机外观质量检测所使用的识别模型为例,对本发明作进一步说明。
某空调外机厂商要对其生产的空调外机及其配件进行外观质检,质检指标包括旋风网型号(共四种)、连机管数量以及种类(颜色有白、蓝、黑三种)、logo的种类以及数量(共十种logo)。在已有的工业相机拍摄的空调外机照片数据库中随机抽取一定数量的图片作为训练集,使用深度学习训练网络,用以对目标进行识别(这里使用YOLO网络,需要根据企业标准对有要求的部位用软件进行标记),标记好的图片的信息转化为向量x,步骤如下:
(1)使用OpenCV提取空调外机画像,并对外机进行归一化处理,即将所有外机放缩至相同大小。
(2)将特征转化为特征向量,对旋风网型号进行编号,即将四种型号的旋风网分别对应0、1、2、3(一位);每个空调上最多有两根连机管,够能有最多两种型号的连机管头,取适量(5-9个)标注框内中心点像素进行平均滤波,计算得出连机管头三通道颜色向量,若无连机管则为(-1,-1,-1,-1,-1,-1)T向量(六位);十种logo对应0-9,对logo的识别率(0-1),由于连机管经常遮挡logo,还应计算logo识别框中黑色像素比例(大致等于连机管遮挡率,0-1;三位)。将这些特征向量拉直,按该顺序组合成新的列向量,此时新的10维向量就是该样本的特征向量。例如,向量(2,0,0,0,255,255,255,0,0.89,0.21)T表示该该空调外机旋风网维2型,一个白色连机管头,一个黑色连机管头,0型logo,有0.89的把握识别正确,logo被连机管遮盖大约0.21。
(3)用该数据进行TSVM图嵌入和模型训练:
a、将由标记样本得到的10维向量根据坐标,嵌入到一个10维的流形空间当中。
b、根据TSVM模型wTx+b=0,其中,w是TSVM模型超平面的法向量,b为位移项,由此可得,嵌入到流形中的数据的每个点到超平面的距离表示为
Figure BDA0003038793630000081
设当第i个数据为合格产品时,令yi=1,反之yi=-1,此时TSVM模型的目标函数为
Figure BDA0003038793630000082
s.t.yi(wTx+b)≥σ,i=1,2…l
其中,σ的初始值为1,当r<σ时,令σ=r。
此时,可以利用标记好的训练数据集得到一个初步的TSVM模型,利用该模型,对外观质量检测流水线上拍摄的通过5G发送至云端的空调外机照片进行识别判断,用上述模型有足够把握判断该图片上空调外机是否合格时,直接输出识别结果,以供后续生产过程操作;若未有足够的把握,则进行以下操作:
1)重复步骤(1)、(2)对该样本特征向量化,并对其进行聚类等;
2)对步骤(1)中的数据嵌入到已有的流形当中,计算该样本与相邻最近的几个向量之差并进行比较(这里是使用计算权重的方法进行判断),可以很容易的判断出该样本与其他样本间的关系,从而判断出该样本是否合格;
3)对于步骤(2)中利用图嵌入技术判断出是否合格的样本,若为不合格,则输出该空调外机外观不合格,若为合格,说明空调外机生产过程中存在微小误差,通过对相邻此类样本进行比较分析处理,若样本的特征向量在流体中的分布无规则,则说明空调外机生产线存在随机误差,若样本的特征向量在流体中的分布为一个趋势,则说明空调外机生产线存在累计误差,应及时对生产线机器进行维护。另外,对于合格样本数据,作为样本对现有的TSVM模型进行优化,即:
Figure BDA0003038793630000091
s.t.yi(wTx+b)≥σ-ξ,i=1,2…n
ξ≥0
其中,C为新样本对TSVM模型的优化因子,ξ为松弛变量。
TSVM模型在完成自由化后,将通过5G网络发送至各个识别节点,实现模型的即时优化即时使用。
实施例3
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现实施例1或2所述的TSVM离散制造业外观质检模型自优化与预测方法的步骤。
实施例4
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现实施例1或2所述的TSVM离散制造业外观质检模型自优化与预测方法的步骤。
以上对工作过程描述仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通工程技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明的权利要求书确定的保护范围内。
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。

Claims (10)

1.一种基于5G和图嵌入优化的TSVM离散制造业外观质检模型自优化与预测方法,其特征在于,包括步骤如下:
(1)在已有的未标注数据集中随机抽取若干数量的数据作为训练集,并对其进行数据标注,形成带标记数据集;
(2)用步骤(1)得到的带标记数据集训练TSVM模型;
同时,利用图嵌入技术将步骤(1)得到的带标记数据集中的数据作为节点嵌入到流形空间当中,节点间的权重为两个节点的相似程度,即:节点间的权重是指两个节点之间的欧式距离的倒数;
(3)将未标注数据集中的样本数据输入到步骤(2)训练好的TSVM模型中进行预测,
若该样本数据到TSVM模型划分超平面距离比较远,即样本数据到各个超平面的距离大于阈值,阈值为步骤(1)中已有的未标注数据集中所有初始样本中到超平面最近的欧式距离,则能够有把握判断该样本是否合格,此时直接输出识别结果;
否则,利用图嵌入技术将该样本数据作为节点嵌入到流形空间当中,计算该节点与周围节点的距离以及位置关系,根据图嵌入聚类判断该样本数据是否合格,并输出识别结果。
2.根据权利要求1所述的一种基于5G和图嵌入优化的TSVM离散制造业外观质检模型自优化与预测方法,其特征在于,步骤(3)中,利用图嵌入技术将该样本数据作为节点嵌入到流形空间当中,计算该节点与周围节点的距离以及位置关系,根据图嵌入聚类判断该样本数据是否合格,包括步骤如下:
a、对样本数据经过步骤(2)训练好的TSVM模型得到的识别结果进行归一化,并根据判断样本图片是否合格的约束条件,将相应的特征转换为n个特征值,并将所有特征值写为n维的特征向量xT
b、利用图嵌入技术将n维的特征向量xT嵌入到流形空间当中,计算该样本数据与相邻最近的若干个向量之差并进行比较,判断出该样本数据与其它样本间的关系,从而判断出该样本是否合格。
3.根据权利要求2所述的一种基于5G和图嵌入优化的TSVM离散制造业外观质检模型自优化与预测方法,其特征在于,所述步骤b的具体实现过程为:
令所有n维的特征向量xT的尾均在原点O处,原点O是流形空间中的原点,即所有n维的特征向量xT首的点为以坐标为xT的点,且该节点表示所对应样本特征;
利用k近邻算法计算该节点与周围节点的距离,如果计算结果表明该节点靠近合格节点群,则说明该节点所代表的样本合格;如果结果表明该节点靠近不合格节点群或者其为孤立节点,则说明该节点所代表的样本不合格。
4.根据权利要求1所述的一种基于5G和图嵌入优化的TSVM离散制造业外观质检模型自优化与预测方法,其特征在于,步骤(3)中,根据图嵌入聚类判断该样本数据不合格时,直接输出识别结果,结束;根据图嵌入聚类判断该样本数据合格时,直接输出识别结果,并分别执行以下步骤A及步骤B:
步骤A是指:将该样本数据作为一个训练集中的训练样本,继续对TSVM模型参数进行优化,改善其性能;
步骤B是指:得到该样本数据与标准样本间差距,进而分析出此时是否有生产误差存在,该生产误差作为生产线的反馈,根据其对生产流程进行调整以及生产线的维护。
5.根据权利要求1所述的一种基于5G和图嵌入优化的TSVM离散制造业外观质检模型自优化与预测方法,其特征在于,TSVM模型所表示的超平面方程表达式如式(Ⅰ)所示:
wTx+b=0 (Ⅰ)
式(Ⅰ)中,在n维流形空间中,w是TSVM模型超平面的法向量,b为位移项,x是n维变量。
6.根据权利要求1所述的一种基于5G和图嵌入优化的TSVM离散制造业外观质检模型自优化与预测方法,其特征在于,步骤(3)中,xT嵌入到流形空间中的样本数据到TSVM模型划分超平面距离r如式(Ⅱ)所示:
Figure FDA0003038793620000021
设当第i个数据为合格产品时,令yi=1,反之yi=-1,此时,TSVM模型的目标函数如式(Ⅲ)所示:
Figure FDA0003038793620000022
s.t.yi(wTxi+b)≥1,i=1,2…l
式(Ⅲ)中,xi是第i个样本数据所对应的n维坐标,yi是第i个数据是否合格的标志。
7.根据权利要求4所述的一种基于5G和图嵌入优化的TSVM离散制造业外观质检模型自优化与预测方法,其特征在于,将该样本数据作为一个训练集中的训练样本,继续对TSVM模型参数进行优化,改善其性能,是指:
对于合格的样本数据,作为新样本,对TSVM模型进行优化,如式(Ⅳ)所示:
Figure FDA0003038793620000023
s.t.yi(wTx+b)≥1-ξ,i=1,2…l
ξ≥0
式(Ⅳ)中,C为新样本对TSVM模型的优化因子,ξ为松弛变量。
8.根据权利要求1所述的一种基于5G和图嵌入优化的TSVM离散制造业外观质检模型自优化与预测方法,其特征在于,通过工业相机获取的图像作为已有的未标注数据集,通过5G专网将图像从工业相机发送至TSVM模型,通过5G专网实现TSVM模型的下载。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8任一所述的TSVM离散制造业外观质检模型自优化与预测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8任一所述的TSVM离散制造业外观质检模型自优化与预测方法的步骤。
CN202110451360.3A 2021-02-26 2021-04-26 一种基于5g和图嵌入优化的tsvm模型自优化与预测方法、设备及存储介质 Active CN113128608B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110216425 2021-02-26
CN2021102164256 2021-02-26

Publications (2)

Publication Number Publication Date
CN113128608A true CN113128608A (zh) 2021-07-16
CN113128608B CN113128608B (zh) 2023-02-03

Family

ID=76780099

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110451360.3A Active CN113128608B (zh) 2021-02-26 2021-04-26 一种基于5g和图嵌入优化的tsvm模型自优化与预测方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113128608B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115638788A (zh) * 2022-12-23 2023-01-24 安徽蔚来智驾科技有限公司 语义矢量地图的构建方法、计算机设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070239642A1 (en) * 2006-03-31 2007-10-11 Yahoo!, Inc. Large scale semi-supervised linear support vector machines
US20090204556A1 (en) * 2008-02-07 2009-08-13 Nec Laboratories America, Inc. Large Scale Manifold Transduction
US8527432B1 (en) * 2008-08-08 2013-09-03 The Research Foundation Of State University Of New York Semi-supervised learning based on semiparametric regularization
CN106096557A (zh) * 2016-06-15 2016-11-09 浙江大学 一种基于模糊训练样本的半监督学习人脸表情识别方法
CN108364015A (zh) * 2018-01-10 2018-08-03 杭州电子科技大学 一种具有安全机制的半监督超限学习机分类方法
CN110414575A (zh) * 2019-07-11 2019-11-05 东南大学 一种融合局部度量的半监督多标记距离度量学习方法
US20200234199A1 (en) * 2018-05-09 2020-07-23 Jiangnan University Advanced Ensemble Learning Strategy Based Semi-supervised Soft Sensing Method
US20200327325A1 (en) * 2019-04-15 2020-10-15 China University Of Petroleum (East China) Semi-supervised automatic marking method and device for ground-object in hyperspectral image

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070239642A1 (en) * 2006-03-31 2007-10-11 Yahoo!, Inc. Large scale semi-supervised linear support vector machines
US20090204556A1 (en) * 2008-02-07 2009-08-13 Nec Laboratories America, Inc. Large Scale Manifold Transduction
US8527432B1 (en) * 2008-08-08 2013-09-03 The Research Foundation Of State University Of New York Semi-supervised learning based on semiparametric regularization
CN106096557A (zh) * 2016-06-15 2016-11-09 浙江大学 一种基于模糊训练样本的半监督学习人脸表情识别方法
CN106096557B (zh) * 2016-06-15 2019-01-18 浙江大学 一种基于模糊训练样本的半监督学习人脸表情识别方法
CN108364015A (zh) * 2018-01-10 2018-08-03 杭州电子科技大学 一种具有安全机制的半监督超限学习机分类方法
US20200234199A1 (en) * 2018-05-09 2020-07-23 Jiangnan University Advanced Ensemble Learning Strategy Based Semi-supervised Soft Sensing Method
US20200327325A1 (en) * 2019-04-15 2020-10-15 China University Of Petroleum (East China) Semi-supervised automatic marking method and device for ground-object in hyperspectral image
CN110414575A (zh) * 2019-07-11 2019-11-05 东南大学 一种融合局部度量的半监督多标记距离度量学习方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王利文: "直推式支持向量机的研究学习", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115638788A (zh) * 2022-12-23 2023-01-24 安徽蔚来智驾科技有限公司 语义矢量地图的构建方法、计算机设备及存储介质

Also Published As

Publication number Publication date
CN113128608B (zh) 2023-02-03

Similar Documents

Publication Publication Date Title
CN110414462B (zh) 一种无监督的跨域行人重识别方法及系统
WO2023273290A1 (zh) 基于多特征信息捕捉和相关性分析的物品图像重识别方法
US20220415027A1 (en) Method for re-recognizing object image based on multi-feature information capture and correlation analysis
CN111583263B (zh) 一种基于联合动态图卷积的点云分割方法
CN110532920B (zh) 基于FaceNet方法的小数量数据集人脸识别方法
CN110210335B (zh) 一种行人重识别学习模型的训练方法、系统和装置
CN108537168B (zh) 基于迁移学习技术的面部表情识别方法
CN109376796A (zh) 基于主动半监督学习的图像分类方法
CN111898736A (zh) 基于属性感知的高效行人重识别方法
CN114694165B (zh) 一种pid图纸智能识别与重绘方法
CN111950525B (zh) 一种基于破坏重建学习与GoogLeNet的细粒度图像分类方法
CN110909881B (zh) 一种面向跨媒体知识推理任务的知识表示方法
CN113761259A (zh) 一种图像处理方法、装置以及计算机设备
CN111582337A (zh) 基于小样本细粒度图像分析的草莓畸形状态检测方法
CN116844217B (zh) 用于生成人脸数据的图像处理系统及方法
CN111126155B (zh) 一种基于语义约束生成对抗网络的行人再识别方法
CN113128608B (zh) 一种基于5g和图嵌入优化的tsvm模型自优化与预测方法、设备及存储介质
CN110442736B (zh) 一种基于二次判别分析的语义增强子空间跨媒体检索方法
CN111882000A (zh) 一种应用于小样本细粒度学习的网络结构及方法
CN111144469B (zh) 基于多维关联时序分类神经网络的端到端多序列文本识别方法
CN116206208B (zh) 一种基于人工智能的林业病虫害快速分析系统
CN114926702B (zh) 一种基于深度注意力度量的小样本图像分类方法
CN116681961A (zh) 基于半监督方法和噪声处理的弱监督目标检测方法
CN107291813B (zh) 基于语义分割场景的示例搜索方法
CN111507243B (zh) 一种基于格拉斯曼流形分析的人体行为识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant