CN110147798A - 一种可用于网络信息检测的语义相似度学习方法 - Google Patents

一种可用于网络信息检测的语义相似度学习方法 Download PDF

Info

Publication number
CN110147798A
CN110147798A CN201910311317.XA CN201910311317A CN110147798A CN 110147798 A CN110147798 A CN 110147798A CN 201910311317 A CN201910311317 A CN 201910311317A CN 110147798 A CN110147798 A CN 110147798A
Authority
CN
China
Prior art keywords
network
function
image
text
follows
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910311317.XA
Other languages
English (en)
Other versions
CN110147798B (zh
Inventor
徐征
杨恩好
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Biwei Network Technology Co Ltd
Original Assignee
Beijing Biwei Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Biwei Network Technology Co Ltd filed Critical Beijing Biwei Network Technology Co Ltd
Priority to CN201910311317.XA priority Critical patent/CN110147798B/zh
Publication of CN110147798A publication Critical patent/CN110147798A/zh
Application granted granted Critical
Publication of CN110147798B publication Critical patent/CN110147798B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24143Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种可用于网络信息检测的语义相似度学习方法,对于文本数据,包括:步骤1、基于潜在狄利克雷分布模型对文本数据建模;步骤2、导出编码数据语义信息的特征映射来表征网络文本信息;步骤3、导出概率相似度函数,用于网络文本数据检测。对于图像数据,包括:步骤1、基于高斯混合模型对图像数据建模;步骤2、导出编码数据语义信息的特征映射来表征网络图像信息;步骤3、导出概率相似度函数,用于网络图像信息检测。本发明方法采用概率相似度函数区别于传统相似度函数之处在于,是网络信息数据、隐变量和产生式模型参数的函数,可以更好地适应数据分布。

Description

一种可用于网络信息检测的语义相似度学习方法
技术领域
本发明涉及一种可用于网络信息检测的语义相似度学习方法,可广泛应用于网络信息检测、识别、监测等领域。属于机器学习和网络信息处理领域。
背景技术
随着互联网技术的快速发展,海量的数据在互联网上产生,如何快速准确地检测出感兴趣的网络信息成为近来的研究热点。相似度度量是网络信息检测中的重要关键技术之一,传统的方法常采用预先定义的相似度度量,如欧式距离、马氏距离和高斯核函数等来衡量网络信息之间的相似度。这类度量方式,没有考虑网络信息的数据分布,因此对数据的分布缺乏适应能力。为了更好地从网络数据中学习中高层语义信息,采用机器学习的方法学习相似度度量。
概率相似度是其中一类基于机器学习获取相似度度量的方法,该类方法最近受到越来越多研究者的青睐。概率相似度的学习方法充分考虑了数据的概率分布,使用产生式概率模型对数据分布进行建模,并从该模型中导出显式的特征映射,基于特征映射定义概率相似度函数用于检测。导出的概率相似度函数是隐变量和模型参数的函数,而隐变量编码了数据内容相关的隐信息,这些信息在网络信息检测和识别中非常有效。基于此,本发明提出一种可用于网络信息检测的语义相似度的学习方法。
发明内容
本发明的目的在于针对现有方法的不足,提出一种可用于网络信息检测的语义相似度的学习方法,该方法从数据的概率分布出发,从网络数据中学习出编码了数据分布的概率相似度。本发明可应用于两种网络数据,文本和图像。
对于文本数据,本发明一种可用于网络信息检测的语义相似度学习方法通过下述技术方案来实现。
步骤1-1、基于潜在狄利克雷分布模型对文本数据建模。
假设网络文本信息用词袋模型表示,令w={w1,…,wM}是文件,M是文件中单词的数目,是指示向量,表示所有V项的第j项被选做文件的第i个单词。令是主题的指示向量,表示所有K个主题的第k个主题被第i个单词选择。潜在狄利克雷分配模型按照下述过程生成每个文档:
S11根据狄利克雷分布选择一个文件d=(d1,…dl),该分布的参数为η,可表示为如下形式:
其中,η=(η1,…,ηl)是狄利克雷分布的参数,Γ是Gamma函数。
S12对于M个单词中的每个单词wi,选择一个主题zi,该主题服从多项式分布,参数为d,可表示成如下形式:
S13从条件多项式分布P(wi|zi,μ)中选择一个单词wi,该条件多项式分布参数为μ,可表示成如下形式:
潜在狄利克雷分布的联合概率密度函数可以表示为如下形式:
步骤1-2、导出编码数据语义信息的特征映射来表征网络文本信息。
P(w,z,d|η,μ)的似然函数变分下界可以由下式给出:
根据公式(5)的下界,可得FESS分数函数,即为变分下界的成分:
完整的FESS特征映射是公式(6)成分的组合:
步骤1-3、导出概率相似度函数,用于网络文本数据检测。
有了公式(7)的特征映射,可将用于网络文本数据检测的相似度函数定义为如下形式:
其中,ti和tj是不同的文本,是文本ti的特征映射,是文本tj的特征映射,W’是对角权值矩阵,对角线上的每个元素衡量了的相应维度对概率相似度的重要程度,也就是说,权值大的维度比权值小的维度重要。
对于图像数据,本发明一种可用于网络信息检测的语义相似度学习方法通过下述技术方案来实现。
步骤2-1、基于高斯混合模型对图像数据建模。
设x∈R是表征图像的底层特征,可为颜色特征、纹理特征、SIFT特征等,其维度设为D。高斯混合模型GMMs(Gaussian Mixture Models)是观测变量、隐变量和模型参数的函数,该模型采样过程如下:(1)随机选择一个混合中心;(2)从该混合中心对应的高斯分布中采样。该过程由m=(m1,…,mL)T指示,即:如果没选择第l个混合中心,则ml=0,否则ml=1。指示因子m服从以下多项式分布:其中,βl=EP(m)[ml],βl∈[0,1],
关于m的条件概率分布可以表示为:
其中,是混合中心对应的高斯分布的均值和方差,是整个模型的参数。
高斯混合模型的概率密度函数可以表示为:
步骤2-2、导出编码数据语义信息的特征映射来表征网络图像信息。
似然函数P(x|θ)=ΣmP(x,m|θ)无法直接求解,采用变分期望最大化算法求解。该算法分为两个步骤,其一:关于后验分布在训练集上最大化似然函数,此为推断步骤;其二,关于模型参数在训练集上最大化似然函数,此为参数估计步骤。两个步骤在训练集上交替进行。假设Q(m)是m的后验分布的近似,可得:
由推断步骤更新隐变量的后验,可得:
由参数估计步骤更新高斯混合模型的参数,可得:
其中,uk是高斯混合模型的加权均值和方差,衡量样本xc对第k个混合中心的贡献程度。
基于公式(11)的下界,可得Fisher分数函数:
完整的Fisher特征映射是以上函数的组合:
步骤2-3、导出概率相似度函数,用于网络图像信息检测
归一化后的概率相似度函数可以定义为如下形式:
其中,Ii和Ij是两幅不同的图像,Φi是图像Ii的特征映射,Φj是图像Ij的特征映射,W是对角权值矩阵,对角线上的每个元素衡量了Φ的相应维度对概率相似度的重要程度,也就是说,权值大的维度比权值小的维度重要。
与现有方法相比,本发明的优越性体现在:采用概率产生式模型对网络数据建模,从该模型中学习出编码了网络数据语义内容的中高层特征,并基于该特征映射定义概率相似度函数。该概率相似度函数区别于传统相似度函数之处在于,是网络信息数据、隐变量和产生式模型参数的函数,可以更好地适应数据分布。
附图说明
图1基于语义相似度的网络图像信息检测方法流程图。
图2基于语义相似度的网络文本信息检测方法流程图
具体实施方式
以下结合具体实施例和附图对本发明的技术方案做更详细的阐述,以下实施例以本发明技术方案为前提下进行实施,分别给出了图像数据(比文本的处理过程复杂)以及文本处理的详细实施方式和过程,但本发明的保护范围不限于下述的实施例。
本发明的具体实施例(一):从在线照片共享平台Flickr上下载25000幅图片,其中,15000幅图片被用作训练集,剩余的10000幅图片用作测试集。从测试集中随机选取1000幅图片作为查询图像,剩余的24000幅图片作为图片集合。
下面结合附图1对本发明的实施方式做更具体的说明,详述如下(使用Visual C++编程实现):
1、图像底层特征提取。
四种颜色SIFT特征被用来表示图像的底层特征,包括OpponentSIFT,C-SIFT,rgSIFT和RGB-SIFT,使用密集采样和Harris-Laplace点采样将四种颜色SIFT特征结合起来。
2、使用高斯混合模型对网络图像数据建模。
设x∈R是上述步骤提取出的图像的底层特征,其维度设为D。高斯混合模型GMMs(Gaussian Mixture Models)是观测变量、隐变量和模型参数的函数,该模型采样过程如下:(1)随机选择一个混合中心;(2)从该混合中心对应的高斯分布中采样。该过程由m=(m1,…,mL)T指示,即:如果没选择第l个混合中心,则ml=0,否则ml=1。指示因子m服从以下多项式分布:
其中,βl=EP(m)[ml],βl∈[0,1],
高斯混合模型的概率密度函数可以表示为:
其中,是混合中心对应的高斯分布的均值和方差,是整个模型的参数。
3、基于高斯混合模型导出特征映射。
假设Q(m)是m的后验分布的近似,可得:
由推断步骤更新隐变量的后验,可得:
由参数估计步骤更新高斯混合模型的参数,可得:
其中,uk是高斯混合模型的加权均值和方差,衡量样本xc对第k个混合中心的贡献程度。
基于上述下界,可得Fisher分数函数:
完整的Fisher特征映射是以上函数的组合:
4、定义概率相似度,完成网络图像检测。
假设Ii是查询图像,Ij是数据库中的任意一幅图像,归一化后的概率相似度函数可以定义为如下形式:
其中,Φi是图像Ii的特征映射,Φj是图像Ij的特征映射,W是对角权值矩阵。
为了验证本发明的有效性,在实施例上和图像检测领域的传统方法做了比较。这些方法包括(1)欧式距离,该方法采用欧式距离作为相似度度量;(2)传统方法1:该方法是大裕度最近邻分类算法,其从有标签样本中学习马氏距离用于k-近邻分类;(3)传统方法2:该方法是一种判别式成分分析方法,它通过使用非对等性约束将相对成分分析进行扩展。根据交叉验证,该实施例上的参数设置为:高斯混合模型混合中心的数目为40。测试了30轮,最后给出平均结果。实施例上识别准确率对比结果如下:基准方法(即欧式距离)检测平均准确率为63.4%,传统方法1检测平均准确率为81%,传统方法2检测平均准确率为80%,本发明方法检测平均准确率为92%,本发明方法在检测准确率上一致地优于所对比的方法。
本发明具体实施例(二):从20组不同的新闻中获取约20000条文本信息,每条信息采用词袋模型表示。构建的识别任务是:Sci:sci.electronics vs.sci.med。对于该任务,选择1800个样本来平衡两个标签。下面结合附图2对本发明的具体实施方式进行说明。
步骤1、提取文本信息的词袋特征。
步骤2、基于潜在狄利克雷分布模型对文本数据建模。
令w={w1,…,wM}是文件,M是文件中单词的数目,是指示向量,表示所有V项的第j项被选做文件的第i个单词。令是主题的指示向量,表示所有K个主题的第k个主题被第i个单词选择。潜在狄利克雷分配模型按照下述过程生成每个文档:
(1)根据狄利克雷分布选择一个文件d=(d1,…dl),该分布的参数为η,可表示为如下形式:
其中,η=(η1,…,ηl)是狄利克雷分布的参数,Γ是Gamma函数。
(2)对于M个单词中的每个单词wi,选择一个主题zi,该主题服从多项式分布,参数为d,可表示成如下形式:
(3)从条件多项式分布P(wi|zi,μ)中选择一个单词wi,该多项式分布参数为μ,可表示成如下形式:
潜在狄利克雷分布的联合概率密度函数可以表示为如下形式:
步骤3、导出编码数据语义信息的特征映射来表征网络文本信息。
P(w,z,d|η,μ)的似然函数变分下界可以由下式给出:
根据上式的下界,可得分数函数,即为变分下界的成分:
完整的特征映射是上述三项成分的组合:
步骤4、导出概率相似度函数,用于网络文本数据检测。
可将用于网络文本数据检测的相似度函数定义为如下形式:
为了验证本发明的有效性,在实施例上和文本识别领域的传统方法做了比较。这些方法包括(1)传统方法1:该方法基于支持向量机实现;(2)传统方法2:该方法是一种基于加权置信度的学习方法,是文本分类的最新的方法。测试了20轮,最后给出平均结果。实施例上识别准确率对比结果如下:传统方法1检测平均准确率为85%,传统方法2检测平均准确率为90%,本发明方法检测平均准确率为93%,本发明方法在检测准确率上一致地优于所对比的方法。

Claims (8)

1.一种可用于网络信息检测的语义相似度学习方法,可应用于文本和图像两种网络数据,其特征在于:其中对于文本数据,该方法具体包括如下步骤:
步骤1、基于潜在狄利克雷分布模型对文本数据建模;
步骤2、导出编码数据语义信息的特征映射来表征网络文本信息;
步骤3、导出概率相似度函数,用于网络文本数据检测。
2.根据权利要求1所述的一种可用于网络信息检测的语义相似度学习方法,其特征在于:所述步骤1具体过程如下:
假设网络文本信息用词袋模型表示,令w={w1,…,wM}是文件,M是文件中单词的数目,是指示向量,表示所有V项的第j项被选做文件的第i个单词;令是主题的指示向量,表示所有K个主题的第k个主题被第i个单词选择;潜在狄利克雷分配模型按照下述过程生成每个文档:
S11、根据狄利克雷分布选择一个文件d=(d1,…dl),该分布的参数为η,可表示为如下形式:
其中,η=(η1,…,ηl)是狄利克雷分布的参数,Γ是Gamma函数;
S12、对于M个单词中的每个单词wi,选择一个主题zi,该主题服从多项式分布,参数为d,可表示成如下形式:
S13、从条件多项式分布P(wi|zi,μ)中选择一个单词wi,该条件多项式分布参数为μ,可表示成如下形式:
潜在狄利克雷分布的联合概率密度函数可以表示为如下形式:
3.根据权利要求1所述的一种可用于网络信息检测的语义相似度学习方法,其特征在于:所述步骤2具体过程如下:
P(w,z,d|η,μ)的似然函数变分下界可以由下式给出:
根据公式(5)的下界,可得FESS分数函数,即为变分下界的成分:
完整的FESS特征映射是公式(6)成分的组合:
4.根据权利要求1所述的一种可用于网络信息检测的语义相似度学习方法,其特征在于:所述步骤3具体过程如下:
有了公式(7)的特征映射,可将用于网络文本数据检测的相似度函数定义为如下形式:
其中,ti和tj是不同的文本,是文本ti的特征映射,是文本tj的特征映射,W’是对角权值矩阵,对角线上的每个元素衡量了的相应维度对概率相似度的重要程度,也就是说,权值大的维度比权值小的维度重要。
5.一种可用于网络信息检测的语义相似度学习方法,可应用于文本和图像两种网络数据,其特征在于:其中对于图像数据,该方法具体包括如下步骤:
步骤1、基于高斯混合模型对图像数据建模;
步骤2、导出编码数据语义信息的特征映射来表征网络图像信息;
步骤3、导出概率相似度函数,用于网络图像信息检测。
6.根据权利要求5所述的一种可用于网络信息检测的语义相似度学习方法,其特征在于:所述步骤1具体过程如下:
设x∈R是表征图像的底层特征,可为颜色特征、纹理特征、SIFT特征,其维度设为D;高斯混合模型GMMs采样过程如下:首先,随机选择一个混合中心;其次,从该混合中心对应的高斯分布中采样;该过程由m=(m1,…,mL)T指示,即:如果没选择第l个混合中心,则ml=0,否则ml=1;指示因子m服从以下多项式分布:其中,βl=EP(m)[ml],βl∈[0,1],
关于m的条件概率分布可以表示为:
其中,是混合中心对应的高斯分布的均值和方差,是整个模型的参数;
高斯混合模型的概率密度函数可以表示为:
7.根据权利要求5所述的一种可用于网络信息检测的语义相似度学习方法,其特征在于:所述步骤2具体过程如下:
似然函数P(x|θ)=ΣmP(x,m|θ)无法直接求解,采用变分期望最大化算法求解,该算法分为两个步骤,其一:关于后验分布在训练集上最大化似然函数,此为推断步骤;其二,关于模型参数在训练集上最大化似然函数,此为参数估计步骤;两个步骤在训练集上交替进行,假设Q(m)是m的后验分布的近似,可得:
由推断步骤更新隐变量的后验,可得:
由参数估计步骤更新高斯混合模型的参数,可得:
其中,uk是高斯混合模型的加权均值和方差,衡量样本xc对第k个混合中心的贡献程度;
基于公式(11)的下界,可得Fisher分数函数:
完整的Fisher特征映射是以上函数的组合:
8.根据权利要求5所述的一种可用于网络信息检测的语义相似度学习方法,其特征在于:所述步骤3具体过程如下:
归一化后的概率相似度函数可以定义为如下形式:
其中,Ii和Ij是两幅不同的图像,Φi是图像Ii的特征映射,Φj是图像Ij的特征映射,W是对角权值矩阵,对角线上的每个元素衡量了Φ的相应维度对概率相似度的重要程度,也就是说,权值大的维度比权值小的维度重要。
CN201910311317.XA 2019-04-18 2019-04-18 一种可用于网络信息检测的语义相似度学习方法 Active CN110147798B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910311317.XA CN110147798B (zh) 2019-04-18 2019-04-18 一种可用于网络信息检测的语义相似度学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910311317.XA CN110147798B (zh) 2019-04-18 2019-04-18 一种可用于网络信息检测的语义相似度学习方法

Publications (2)

Publication Number Publication Date
CN110147798A true CN110147798A (zh) 2019-08-20
CN110147798B CN110147798B (zh) 2020-06-30

Family

ID=67589624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910311317.XA Active CN110147798B (zh) 2019-04-18 2019-04-18 一种可用于网络信息检测的语义相似度学习方法

Country Status (1)

Country Link
CN (1) CN110147798B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108460390A (zh) * 2018-02-27 2018-08-28 北京中晟信达科技有限公司 一种基于特征学习的敏感图像识别方法
CN111553893A (zh) * 2020-04-24 2020-08-18 成都飞机工业(集团)有限责任公司 一种飞机线束自动布线切断标识识别方法
CN111950840A (zh) * 2020-06-19 2020-11-17 国网山东省电力公司 一种计量检定装置智能运维知识检索方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279929A (zh) * 2010-06-13 2011-12-14 中国科学院电子学研究所 一种基于对象语义树模型的遥感人造地物目标识别方法
US20120265094A1 (en) * 2004-04-21 2012-10-18 Acclarent, Inc. Endoscopic Methods and Devices for Transnasal Procedures
CN104298776A (zh) * 2014-11-04 2015-01-21 苏州大学 基于lda模型的搜索引擎结果优化系统
CN106056573A (zh) * 2016-04-26 2016-10-26 武汉科技大学 一种活动轮廓模型中能量泛函的优化方法及其应用
CN106327501A (zh) * 2016-08-31 2017-01-11 西北民族大学 一种有参考型唐卡图像修复后质量评价方法
US20170024458A1 (en) * 2015-07-22 2017-01-26 International Business Machines Corporation Access and presentation of files based on semantic proximity to current interests
CN108460390A (zh) * 2018-02-27 2018-08-28 北京中晟信达科技有限公司 一种基于特征学习的敏感图像识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120265094A1 (en) * 2004-04-21 2012-10-18 Acclarent, Inc. Endoscopic Methods and Devices for Transnasal Procedures
CN102279929A (zh) * 2010-06-13 2011-12-14 中国科学院电子学研究所 一种基于对象语义树模型的遥感人造地物目标识别方法
CN104298776A (zh) * 2014-11-04 2015-01-21 苏州大学 基于lda模型的搜索引擎结果优化系统
US20170024458A1 (en) * 2015-07-22 2017-01-26 International Business Machines Corporation Access and presentation of files based on semantic proximity to current interests
CN106056573A (zh) * 2016-04-26 2016-10-26 武汉科技大学 一种活动轮廓模型中能量泛函的优化方法及其应用
CN106327501A (zh) * 2016-08-31 2017-01-11 西北民族大学 一种有参考型唐卡图像修复后质量评价方法
CN108460390A (zh) * 2018-02-27 2018-08-28 北京中晟信达科技有限公司 一种基于特征学习的敏感图像识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈燕 等: "《大数据技术及其应用》", 31 December 2015, 大连海事大学出版社 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108460390A (zh) * 2018-02-27 2018-08-28 北京中晟信达科技有限公司 一种基于特征学习的敏感图像识别方法
CN111553893A (zh) * 2020-04-24 2020-08-18 成都飞机工业(集团)有限责任公司 一种飞机线束自动布线切断标识识别方法
CN111950840A (zh) * 2020-06-19 2020-11-17 国网山东省电力公司 一种计量检定装置智能运维知识检索方法及系统

Also Published As

Publication number Publication date
CN110147798B (zh) 2020-06-30

Similar Documents

Publication Publication Date Title
Farcomeni et al. Robust methods for data reduction
CN104040561B (zh) 通过质谱术和分数规整识别微生物的方法
CN113360701B (zh) 一种基于知识蒸馏的素描图处理方法及其系统
CN109739844B (zh) 基于衰减权重的数据分类方法
CN110147798A (zh) 一种可用于网络信息检测的语义相似度学习方法
Gwo et al. Plant identification through images: Using feature extraction of key points on leaf contours1
CN113299346B (zh) 分类模型训练和分类方法、装置、计算机设备和存储介质
CN109190698B (zh) 一种网络数字虚拟资产的分类识别系统及方法
CN114332544B (zh) 一种基于图像块评分的细粒度图像分类方法和装置
CN113761259A (zh) 一种图像处理方法、装置以及计算机设备
CN112270596A (zh) 基于用户画像构建的风险控制系统及方法
CN108629373A (zh) 一种图像分类方法、系统、设备及计算机可读存储介质
CN106570015A (zh) 图像搜索方法和装置
CN111860671A (zh) 分类模型训练方法、装置、终端设备和可读存储介质
Bittmann et al. Decision‐making method using a visual approach for cluster analysis problems; indicative classification algorithms and grouping scope
CN101996326A (zh) 多类目标的检测装置及检测方法
CN106649264A (zh) 一种基于篇章信息的中文水果品种信息抽取方法及装置
CN115408527B (zh) 文本分类方法、装置、电子设备及存储介质
CN110096708A (zh) 一种定标集确定方法及装置
CN111931229B (zh) 一种数据识别方法、装置和存储介质
CN109815889A (zh) 一种基于特征表示集的跨分辨率人脸识别方法
CN114021716A (zh) 一种模型训练的方法、系统及电子设备
Gontar et al. Characterizing the shape patterns of dimorphic yeast pseudohyphae
CN113627522A (zh) 基于关系网络的图像分类方法、装置、设备及存储介质
Rahman et al. Measuring classification complexity of image databases: a novel approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant