CN115186775B - 一种图像描述文字的匹配度检测方法、装置及电子设备 - Google Patents
一种图像描述文字的匹配度检测方法、装置及电子设备 Download PDFInfo
- Publication number
- CN115186775B CN115186775B CN202211106998.4A CN202211106998A CN115186775B CN 115186775 B CN115186775 B CN 115186775B CN 202211106998 A CN202211106998 A CN 202211106998A CN 115186775 B CN115186775 B CN 115186775B
- Authority
- CN
- China
- Prior art keywords
- target
- matching degree
- determining
- matrix
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 239000011159 matrix material Substances 0.000 claims abstract description 195
- 239000013598 vector Substances 0.000 claims description 81
- 238000012512 characterization method Methods 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012546 transfer Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 241000190070 Sarracenia purpurea Species 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本公开提供了一种图像描述文字的匹配度检测方法、装置及电子设备,通过获取目标图像以及对应的待检测描述文字;识别目标图像中包括的目标物体特征矩阵,以及待检测描述文字中包括的目标词语表征矩阵;确定目标物体特征矩阵与目标词语表征矩阵之间的第一相似度;根据第一相似度,确定目标图像与待检测描述文字之间的第一匹配度;基于目标图像对应的预设基准描述文字集合,确定目标物体特征矩阵与目标词语表征矩阵之间的第二相似度;根据第二相似度,确定目标图像与待检测描述文字之间的第二匹配度;根据第一匹配度和第二匹配度,确定目标图像与待检测描述文字之间的目标匹配度。可以准确检测图像内容与对应的描述文字之间的匹配程度。
Description
技术领域
本公开涉及图像识别技术领域,具体而言,涉及一种图像描述文字的匹配度检测方法、装置及电子设备。
背景技术
随着互联网技术的高速发展,越来越多的社交网络平台随之出现,人们在社交平台上可以分享自己的日常生活,找到志同道合的朋友,极大的方便了人们的社交需求,但同时,在社交平台上流通的图片、视频等数据也带来了许多违规隐患。基于社交网络平台极大用户基础,图像内容可以在社交网络平台的快速发酵,爆炸式传播。若不合规的图像肆意在社交网络平台传播,将会给社会安定带来极大威胁。
目前,将图像内容转化成图像描述文字是当前智能化审核系统主要的趋势,原因是相比较于图像内容审核,文字内容审核更容易被机器理解且能缓解机器硬件的算力压力。然而,如何评估图像转化后的图像描述文字与图像之间的匹配程度是当前审核系统的亟待解决的问题。
发明内容
本公开实施例至少提供一种图像描述文字的匹配度检测方法、装置及电子设备,可以准确检测图像内容与对应的描述文字之间的匹配程度。
本公开实施例提供了一种图像描述文字的匹配度检测方法,所述方法包括:
获取目标图像以及对应的待检测描述文字;
识别所述目标图像中包括的目标物体特征矩阵,以及所述待检测描述文字中包括的目标词语表征矩阵;
确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度;
根据所述第一相似度,确定所述目标图像与所述待检测描述文字之间的第一匹配度;
基于所述目标图像对应的预设基准描述文字集合,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度;
根据所述第二相似度,确定所述目标图像与所述待检测描述文字之间的第二匹配度;
根据所述第一匹配度和所述第二匹配度,确定所述目标图像与所述待检测描述文字之间的目标匹配度。
一种可选的实施方式中,所述识别所述目标图像中包括的目标物体特征矩阵,具体包括:
识别所述目标图像中包括的全部物体类别,并确定每个所述物体类别对应的物体特征向量以及像素面积信息;
在全部所述物体类别中,筛选所述像素面积信息大于预设面积阈值的目标物体类别;
由全部所述目标物体类别对应的目标物体特征向量构成所述目标物体特征矩阵。
一种可选的实施方式中,基于以下步骤识别所述待检测描述文字中包括的目标词语特征矩阵:
将所述待检测描述文字划分为多个描述词语,确定每个所述描述词语对应的词性信息;
过滤所述词性信息为介词的所述描述词语,确定过滤后的所述描述词语对应的目标词语表征向量;
由全部所述目标词语表征向量构成所述目标词语表征矩阵。
一种可选的实施方式中,所述确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度,具体包括:
确定所述目标物体特征矩阵中包括的目标物体特征向量,与所述目标词语表征矩阵中包括的目标词语表征向量之间的向量距离;
根据所述向量距离以及预设的转移矩阵,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度。
一种可选的实施方式中,所述基于所述目标图像对应的预设基准描述文字集合,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度,具体包括:
基于所述预设基准描述文字集合,为所述目标物体特征向量配置对应的物体特征权重,以及,为所述目标词语表征向量配置对应的词语表征权重;
根据所述向量距离、所述转移矩阵、所述物体特征权重以及所述词语表征权重,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度。
一种可选的实施方式中,所述根据所述第一匹配度和所述第二匹配度,确定所述目标图像与所述待检测描述文字之间的目标匹配度,具体包括:
分别为所述第一匹配度和所述第二匹配度配置对应的预设权重系数;
根据所述预设权重系数,将所述第一匹配度和所述第二匹配度加权求和,确定所述目标图像与所述待检测描述文字之间的目标匹配度。
一种可选的实施方式中,在所述根据所述第一匹配度和所述第二匹配度,确定所述目标图像与所述待检测描述文字之间的目标匹配度之后,所述方法还包括:
判断所述目标匹配度是否大于预设的匹配度阈值;
若大于,则确定所述待检测描述文字针对所述目标图像的图像内容描述准确;若小于,则确定所述待检测描述文字针对所述目标图像的图像内容描述不准确。
本公开实施例还提供一种图像描述文字的匹配度检测装置,所述装置包括:
获取模块,用于获取目标图像以及对应的待检测描述文字;
识别模块,用于识别所述目标图像中包括的目标物体特征矩阵,以及所述待检测描述文字中包括的目标词语表征矩阵;
第一相似度确定模块,用于确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度;
第一匹配度确定模块,用于根据所述第一相似度,确定所述目标图像与所述待检测描述文字之间的第一匹配度;
第二相似度确定模块,用于基于所述目标图像对应的预设基准描述文字集合,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度;
第二匹配度确定模块,用于根据所述第二相似度,确定所述目标图像与所述待检测描述文字之间的第二匹配度;
目标匹配度确定模块,用于根据所述第一匹配度和所述第二匹配度,确定所述目标图像与所述待检测描述文字之间的目标匹配度。
一种可选的实施方式中,所述识别模块具体用于:
识别所述目标图像中包括的全部物体类别,并确定每个所述物体类别对应的物体特征向量以及像素面积信息;
在全部所述物体类别中,筛选所述像素面积信息大于预设面积阈值的目标物体类别;
由全部所述目标物体类别对应的目标物体特征向量构成所述目标物体特征矩阵。
一种可选的实施方式中,所述识别模块具体用于:
将所述待检测描述文字划分为多个描述词语,确定每个所述描述词语对应的词性信息;
过滤所述词性信息为介词的所述描述词语,确定过滤后的所述描述词语对应的目标词语表征向量;
由全部所述目标词语表征向量构成所述目标词语表征矩阵。
一种可选的实施方式中,所述第一相似度确定模块具体用于:
确定所述目标物体特征矩阵中包括的目标物体特征向量,与所述目标词语表征矩阵中包括的目标词语表征向量之间的向量距离;
根据所述向量距离以及预设的转移矩阵,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度。
一种可选的实施方式中,所述第二相似度确定模块具体用于:
基于所述预设基准描述文字集合,为所述目标物体特征向量配置对应的物体特征权重,以及,为所述目标词语表征向量配置对应的词语表征权重;
根据所述向量距离、所述转移矩阵、所述物体特征权重以及所述词语表征权重,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度。
一种可选的实施方式中,所述目标匹配度确定模块具体用于:
分别为所述第一匹配度和所述第二匹配度配置对应的预设权重系数;
根据所述预设权重系数,将所述第一匹配度和所述第二匹配度加权求和,确定所述目标图像与所述待检测描述文字之间的目标匹配度。
一种可选的实施方式中,所述装置还包括评估模块,所述评估模块用于:
判断所述目标匹配度是否大于预设的匹配度阈值;
若大于,则确定所述待检测描述文字针对所述目标图像的图像内容描述准确;若小于,则确定所述待检测描述文字针对所述目标图像的图像内容描述不准确。
本公开实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述图像描述文字的匹配度检测方法,或上述图像描述文字的匹配度检测方法中任一种可能的实施方式中的步骤。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述图像描述文字的匹配度检测方法,或上述图像描述文字的匹配度检测方法中任一种可能的实施方式中的步骤。
本公开实施例还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序、指令被处理器执行时实现上述图像描述文字的匹配度检测方法,或上述图像描述文字的匹配度检测方法中任一种可能的实施方式中的步骤。
本公开实施例提供的一种图像描述文字的匹配度检测方法、装置及电子设备,通过获取目标图像以及对应的待检测描述文字;识别目标图像中包括的目标物体特征矩阵,以及待检测描述文字中包括的目标词语表征矩阵;确定目标物体特征矩阵与目标词语表征矩阵之间的第一相似度;根据第一相似度,确定目标图像与待检测描述文字之间的第一匹配度;基于目标图像对应的预设基准描述文字集合,确定目标物体特征矩阵与目标词语表征矩阵之间的第二相似度;根据第二相似度,确定目标图像与待检测描述文字之间的第二匹配度;根据第一匹配度和第二匹配度,确定目标图像与待检测描述文字之间的目标匹配度。可以准确检测图像内容与对应的描述文字之间的匹配程度。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种图像描述文字的匹配度检测方法的流程图;
图2示出了本公开实施例所提供的另一种图像描述文字的匹配度检测方法的流程图;
图3示出了本公开实施例所提供的一种图像描述文字的匹配度检测装置的示意图;
图4示出了本公开实施例所提供的一种电子设备的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
经研究发现,目前,将图像内容转化成图像描述文字是当前智能化审核系统主要的趋势,原因是相比较于图像内容审核,文字内容审核更容易被机器理解且能缓解机器硬件的算力压力。然而,如何评估图像转化后的图像描述文字与图像之间的匹配程度是当前审核系统的亟待解决的问题。
基于上述研究,本公开提供了一种图像描述文字的匹配度检测方法、装置及电子设备,通过获取目标图像以及对应的待检测描述文字;识别目标图像中包括的目标物体特征矩阵,以及待检测描述文字中包括的目标词语表征矩阵;确定目标物体特征矩阵与目标词语表征矩阵之间的第一相似度;根据第一相似度,确定目标图像与待检测描述文字之间的第一匹配度;基于目标图像对应的预设基准描述文字集合,确定目标物体特征矩阵与目标词语表征矩阵之间的第二相似度;根据第二相似度,确定目标图像与待检测描述文字之间的第二匹配度;根据第一匹配度和第二匹配度,确定目标图像与待检测描述文字之间的目标匹配度。可以准确检测图像内容与对应的描述文字之间的匹配程度。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种图像描述文字的匹配度检测方法进行详细介绍,本公开实施例所提供的图像描述文字的匹配度检测方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该图像描述文字的匹配度检测方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
参见图1所示,为本公开实施例提供的一种图像描述文字的匹配度检测方法的流程图,所述方法包括步骤S101~S107,其中:
S101、获取目标图像以及对应的待检测描述文字。
在具体实施中,获取需要进行审核的目标图像,以及根据该目标图像的图像内容识别出的用于进行图像审核的描述性文字作为待检测描述文字。
这里,待检测描述文字是通过预设的图像-文字转换系统针对目标图像进行识别后,生成的一段针对目标图像中所展示的内容进行描述的文字,例如:图像中包含了一张桌子、两把椅子和一个水杯,两把椅子在桌子的两侧,水杯在桌子上。
S102、识别所述目标图像中包括的目标物体特征矩阵,以及所述待检测描述文字中包括的目标词语表征矩阵。
在具体实施中,可以采用预先训练好的特征提取器,首先提取目标图像中包括的全部物体,形成目标图像中全部物体的特征向量集合,并利用预设的物体特征分类器,针对目标图像中全部物体的特征向量进行分类,得到目标图像中所包含的全部物体类别的特征向量集合,其中,n代表目标图像中包含的物体类别个数,On代表第n个物体类别,之后在全部物体类别中筛选出重要性较高的目标物体类别,由目标物体类别对应的目标物体特征向量构成目标物体特征矩阵。
这里,目标物体特征矩阵由在目标图像中包括的全部物体种类中,筛选出的对图像审核重要性较高的目标物体类别对应的目标物体特征向量构成,优选的,可以选用目标图像中所占像素面积较大的物体类别作为目标物体类别。
其中,用于提取目标图像中包括的全部物体的特征提取器,可以事先采用预设的样本图像以及对应的训练标签进行训练,训练标签可以为样本图像中包括的物体名称信息,以及对应的物体位置信息。
作为一种可能的实施方式,可以通过以下方法识别目标图像中包括的目标物体特征矩阵:识别所述目标图像中包括的全部物体类别,并确定每个所述物体类别对应的物体特征向量以及像素面积信息;在全部所述物体类别中,筛选所述像素面积信息大于预设面积阈值的目标物体类别;由全部所述目标物体类别对应的目标物体特征向量构成所述目标物体特征矩阵。
这里,在识别目标图像中包括的全部物体类别的同时,还可以确定目标图像中包含的每个物体对应的位置信息,其中,位置信息包括物体在目标图像中的坐标位置信息(包括横坐标信息以及纵坐标信息)、以及物体在目标图像中所占的宽度值与高度值。根据物体在目标图像中所占的宽度值与高度值计算出每个物体在目标图像中所占的像素面积信息,将全部物体类别按照像素面积信息进行由大到小的排序,仅保留像素面积信息大于预设面积阈值的物体类别作为目标物体类别,进而由全部目标物体类别对应的目标物体特征向量构成目标物体特征矩阵。
需要说明的是,预设面积阈值可以根据实际需要进行选择,在此不作具体限制。
进一步的,针对目标图像对应的待检测描述文字,将待检测描述文字划分为多个描述词语,基于描述词语对应的目标词语表征向量构建待检测描述文字对应的目标词语表征矩阵,例如,设话语中包含q个词语,每个词在词向量空间的表征维度为m,则目标词语表征矩阵可以表示为:,其中,,代表目标词语表征矩阵中的第q个目标词语表征向量。
作为一种可能的实施方式,可以基于以下方法识别所述待检测描述文字中包括的目标词语特征矩阵:将所述待检测描述文字划分为多个描述词语,确定每个所述描述词语对应的词性信息;过滤所述词性信息为介词的所述描述词语,确定过滤后的所述描述词语对应的目标词语表征向量;由全部所述目标词语表征向量构成所述目标词语表征矩阵。
这里,根据综合经验积累,待检测描述文字中词性为介词的描述词语对文本理解没有很大的积极影响,相反,会负面影响目标词语表征矩阵的复杂度,因此,针对待检测描述文字中划分好的多个描述词语,将词性为介词的描述词语过滤掉之后,由剩余的描述词语对应的目标词语表征向量构成目标词语表征矩阵。
可选的,可以采用预设的介词表,在待检测描述文字中过滤词性信息为介词的所述描述词语。
S103、确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度。
在具体实施中,在评估待检测描述文字与目标图像中的内容的匹配度时,首先需要确定表征目标图像中所包括的物体的特征的目标物体特征矩阵,与表征待检测描述文字中各个描述词汇的目标词语表征矩阵之间的第一相似度。
需要说明的是,第一相似度反映的是目标物体特征矩阵中包括的各个目标物体特征向量,与目标词语表征矩阵中包括的各个目标词语表征之间的相似性。
作为一种可能的实施方式,可以基于以下方法确定目标物体特征矩阵与目标词语表征矩阵之间的第一相似度:确定所述目标物体特征矩阵中包括的目标物体特征向量,与所述目标词语表征矩阵中包括的目标词语表征向量之间的向量距离;根据所述向量距离以及预设的转移矩阵,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度。
具体的,可以通过以下公式计算目标物体特征矩阵与目标词语表征矩阵之间的第一相似度:
其中,S(X,D)代表第一相似度;X代表目标物体特征矩阵;D代表目标词语表征矩阵;n’代表目标图像中包括的目标物体类别的数目;q’代表待检测描述文字中,除词性为介词之外的描述词汇的数目;W代表预设的转移矩阵;fi代表目标物体特征矩阵中第i个目标物体特征向量;dj代表目标词语表征矩阵中第j个目标词语表征向量;代表目标物体特征矩阵中包括的目标物体特征向量,与目标词语表征矩阵中包括的目标词语表征向量之间的向量距离;Wij代表目标物体特征向量与目标词语表征向量之间的最短向量距离。
需要说明的是,预设的转移矩阵可以根据实际需要进行选择,在此不做具体限制。
S104、根据所述第一相似度,确定所述目标图像与所述待检测描述文字之间的第一匹配度。
在具体实施中,根据目标物体特征矩阵与目标词语表征矩阵之间的第一相似度,构建用于评估待检测描述文字所描述的内容,与目标图像中所显示的内容之间匹配性的第一匹配度。
这里,第一匹配度仅反映目标物体特征矩阵与目标词语表征矩阵,两者自身之间的匹配性,可以表现为一种无监督评估指数,用于初步评判目标图像中的图像内容转化成待检测描述文字的匹配性。
具体的,可以通过以下公式计算目标图像与待检测描述文字之间的第一匹配度:
其中,Q代表第一匹配度;S(X,D)代表第一相似度;X代表目标物体特征矩阵;D代表目标词语表征矩阵;e代表自然常数。
S105、基于所述目标图像对应的预设基准描述文字集合,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度。
在具体实施中,在确定出初步评判目标图像中的图像内容转化成待检测描述文字的匹配性的第一匹配度之后,本申请方案引入预设基准描述文字集合作为深度评判的参考指标,针对目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度进行更新,以确定出在预设基准描述文字集合的指导下,目标物体特征矩阵与目标词语表征矩阵之间的第二相似度。
这里,预设基准描述文字集合优选的,可以由不同的真人对该目标图像的图像内容进行描述的描述话语或描述文字构成,例如,针对同一目标图像,人物A对该图像进行描述的描述话语或描述文字可以表示为t1;人物B对该图像进行描述的描述话语或描述文字可以表示为t2;人物C对该图像进行描述的描述话语或描述文字可以表示为t3,那么基准描述文字集合T即可表示为T={ t1,t2,t3,…,tn}。
作为一种可能的实施方式,可以通过以下方法确定目标物体特征矩阵与目标词语表征矩阵之间的第二相似度:基于所述预设基准描述文字集合,为所述目标物体特征向量配置对应的物体特征权重,以及,为所述目标词语表征向量配置对应的词语表征权重;根据所述向量距离、所述转移矩阵、所述物体特征权重以及所述词语表征权重,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度。
具体的,可以通过以下公式为目标物体特征向量配置对应的物体特征权重:
其中,代表物体特征权重;ta代表预设基准描述文字集合中的第a段预设基准描述文字;代表预设基准描述文字集合;r代表预设基准描述文字集合中包括的预设基准描述文字总数;f代表目标物体特征矩阵中包括的目标物体特征向量。
进一步的,可以通过以下公式为目标词语表征向量配置对应的词语表征权重:
其中,代表词语表征权重;ta代表预设基准描述文字集合中的第a段预设基准描述文字;代表预设基准描述文字集合;r代表预设基准描述文字集合中包括的预设基准描述文字总数;d代表目标词语表征矩阵中包括目标词语表征向量。
进一步的,可以通过以下公式法确定目标物体特征矩阵与目标词语表征矩阵之间的第二相似度:
其中,代表第二相似度;X代表目标物体特征矩阵;D代表目标词语表征矩阵;n’代表目标图像中包括的目标物体类别的数目;q’代表待检测描述文字中,除词性为介词之外的描述词汇的数目;W代表预设的转移矩阵;fi代表目标物体特征矩阵中第i个目标物体特征向量;dj代表目标词语表征矩阵中第j个目标词语表征向量;代表目标物体特征矩阵中包括的目标物体特征向量,与目标词语表征矩阵中包括的目标词语表征向量之间的向量距离;Wij代表目标物体特征向量与目标词语表征向量之间的最短向量距离;代表物体特征权重;代表词语表征权重。
S106、根据所述第二相似度,确定所述目标图像与所述待检测描述文字之间的第二匹配度。
在具体实施中,根据目标物体特征矩阵与目标词语表征矩阵之间的第二相似度,构建用于评估待检测描述文字所描述的内容,与目标图像中所显示的内容之间匹配性的第二匹配度。
这里,第二匹配度反映了目标物体特征矩阵与目标词语表征矩阵,在引入了预设基准描述文字集合作为深度评判的参考指标之后,两者之间的匹配性,可以表现为一种监督型强化评估指数,用于深度评判目标图像中的图像内容转化成待检测描述文字的匹配性。
具体的,可以通过以下公式计算目标图像与待检测描述文字之间的第二匹配度:
其中,Q’代表第二匹配度;S’(X,D)代表第二相似度;X代表目标物体特征矩阵;D代表目标词语表征矩阵;e代表自然常数。
S107、根据所述第一匹配度和所述第二匹配度,确定所述目标图像与所述待检测描述文字之间的目标匹配度。
具体的,分别为所述第一匹配度和所述第二匹配度配置对应的预设权重系数;根据所述预设权重系数,将所述第一匹配度和所述第二匹配度加权求和,确定所述目标图像与所述待检测描述文字之间的目标匹配度。
需要说明的是,预设权重系数可以根据实际需要进行选择,则此不做具体限制。
在具体实施中,可以通过以下公式计算目标图像与待检测描述文字之间的目标匹配度:
本公开实施例提供的一种图像描述文字的匹配度检测方法,通过获取目标图像以及对应的待检测描述文字;识别目标图像中包括的目标物体特征矩阵,以及待检测描述文字中包括的目标词语表征矩阵;确定目标物体特征矩阵与目标词语表征矩阵之间的第一相似度;根据第一相似度,确定目标图像与待检测描述文字之间的第一匹配度;基于目标图像对应的预设基准描述文字集合,确定目标物体特征矩阵与目标词语表征矩阵之间的第二相似度;根据第二相似度,确定目标图像与待检测描述文字之间的第二匹配度;根据第一匹配度和第二匹配度,确定目标图像与待检测描述文字之间的目标匹配度。可以准确检测图像内容与对应的描述文字之间的匹配程度。
参见图2所示,为本公开实施例提供的另一种图像描述文字的匹配度检测方法的流程图,所述方法包括步骤S201~S208,其中:
S201、获取目标图像以及对应的待检测描述文字。
S202、识别所述目标图像中包括的目标物体特征矩阵,以及所述待检测描述文字中包括的目标词语表征矩阵。
S203、确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度。
S204、根据所述第一相似度,确定所述目标图像与所述待检测描述文字之间的第一匹配度。
S205、基于所述目标图像对应的预设基准描述文字集合,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度。
S206、根据所述第二相似度,确定所述目标图像与所述待检测描述文字之间的第二匹配度。
S207、根据所述第一匹配度和所述第二匹配度,确定所述目标图像与所述待检测描述文字之间的目标匹配度。
这里,步骤S201-步骤S207,与步骤S101-步骤S107实质相同,具有相同的实施方式并且可以达到相同的技术效果,对此不再进行赘述。
S208、判断所述目标匹配度是否大于预设的匹配度阈值;若大于,则确定所述待检测描述文字针对所述目标图像的描述准确;若小于,则确定所述待检测描述文字针对所述目标图像的描述不准确。
在具体实施中,在针对目标图像所展示的内容与对应的图像描述文字之间是否匹配进行检测,也就是评估图像描述文字所描述的内容相较于目标图像中所展示的内容是否准确的过程中,可以采用本申请实施例所提供的目标匹配度。当目标匹配度大于预设的匹配度阈值时,则说明目标图像所展示的内容与对应的图像描述文字之间的匹配性较好,即图像描述文字针对目标图像内容的描述较为准确;反之,若目标匹配度小于预设的匹配度阈值时,则说明目标图像所展示的内容与对应的图像描述文字之间的匹配性较差,即图像描述文字针对目标图像内容的描述不准确。
需要说明的是,预设的匹配度阈值可以根据实际需要进行选择,在此不做具体限制。
本公开实施例提供的一种图像描述文字的匹配度检测方法,通过获取目标图像以及对应的待检测描述文字;识别目标图像中包括的目标物体特征矩阵,以及待检测描述文字中包括的目标词语表征矩阵;确定目标物体特征矩阵与目标词语表征矩阵之间的第一相似度;根据第一相似度,确定目标图像与待检测描述文字之间的第一匹配度;基于目标图像对应的预设基准描述文字集合,确定目标物体特征矩阵与目标词语表征矩阵之间的第二相似度;根据第二相似度,确定目标图像与待检测描述文字之间的第二匹配度;根据第一匹配度和第二匹配度,确定目标图像与待检测描述文字之间的目标匹配度。可以准确检测图像内容与对应的描述文字之间的匹配程度。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与图像描述文字的匹配度检测方法对应的图像描述文字的匹配度检测装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述图像描述文字的匹配度检测方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图3,图3为本公开实施例提供的一种图像描述文字的匹配度检测装置的示意图。如图3中所示,本公开实施例提供的匹配度检测装置300包括:
获取模块310,用于获取目标图像以及对应的待检测描述文字;
识别模块320,用于识别所述目标图像中包括的目标物体特征矩阵,以及所述待检测描述文字中包括的目标词语表征矩阵;
第一相似度确定模块330,用于确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度;
第一匹配度确定模块340,用于根据所述第一相似度,确定所述目标图像与所述待检测描述文字之间的第一匹配度;
第二相似度确定模块350,用于基于所述目标图像对应的预设基准描述文字集合,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度;
第二匹配度确定模块360,用于根据所述第二相似度,确定所述目标图像与所述待检测描述文字之间的第二匹配度;
目标匹配度确定模块370,用于根据所述第一匹配度和所述第二匹配度,确定所述目标图像与所述待检测描述文字之间的目标匹配度。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
本公开实施例提供的一种图像描述文字的匹配度检测装置,通过获取目标图像以及对应的待检测描述文字;识别目标图像中包括的目标物体特征矩阵,以及待检测描述文字中包括的目标词语表征矩阵;确定目标物体特征矩阵与目标词语表征矩阵之间的第一相似度;根据第一相似度,确定目标图像与待检测描述文字之间的第一匹配度;基于目标图像对应的预设基准描述文字集合,确定目标物体特征矩阵与目标词语表征矩阵之间的第二相似度;根据第二相似度,确定目标图像与待检测描述文字之间的第二匹配度;根据第一匹配度和第二匹配度,确定目标图像与待检测描述文字之间的目标匹配度。可以准确检测图像内容与对应的描述文字之间的匹配程度。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
对应于图1与图2中的图像描述文字的匹配度检测方法,本公开实施例还提供了一种电子设备400,如图4所示,为本公开实施例提供的电子设备400结构示意图,包括:
处理器41、存储器42、和总线43;存储器42用于存储执行指令,包括内存421和外部存储器422;这里的内存421也称内存储器,用于暂时存放处理器41中的运算数据,以及与硬盘等外部存储器422交换的数据,处理器41通过内存421与外部存储器422进行数据交换,当所述电子设备400运行时,所述处理器41与所述存储器42之间通过总线43通信,使得所述处理器41执行图1与图2中的图像描述文字的匹配度检测方法的步骤。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的图像描述文字的匹配度检测方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机程序产品包括有计算机指令,所述计算机指令被处理器执行时可以执行上述方法实施例中所述的图像描述文字的匹配度检测方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。
Claims (8)
1.一种图像描述文字的匹配度检测方法,其特征在于,包括:
获取目标图像以及对应的待检测描述文字,其中,待检测描述文字是通过预设的图像-文字转换系统针对目标图像进行识别后,生成的一段针对目标图像中所展示的内容进行描述的文字;
识别所述目标图像中包括的目标物体特征矩阵,以及所述待检测描述文字中包括的目标词语表征矩阵;
确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度;
根据所述第一相似度,确定所述目标图像与所述待检测描述文字之间的第一匹配度;
基于所述目标图像对应的预设基准描述文字集合,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度,其中,预设基准描述文字集合由不同的真人对该目标图像的图像内容进行描述的描述话语或描述文字构成;
根据所述第二相似度,确定所述目标图像与所述待检测描述文字之间的第二匹配度;
根据所述第一匹配度和所述第二匹配度,确定所述目标图像与所述待检测描述文字之间的目标匹配度;
所述确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度,具体包括:
确定所述目标物体特征矩阵中包括的目标物体特征向量,与所述目标词语表征矩阵中包括的目标词语表征向量之间的向量距离;
根据所述向量距离以及预设的转移矩阵,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度;
所述基于所述目标图像对应的预设基准描述文字集合,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度,具体包括:
基于所述预设基准描述文字集合,为所述目标物体特征向量配置对应的物体特征权重,以及,为所述目标词语表征向量配置对应的词语表征权重;
根据所述向量距离、所述转移矩阵、所述物体特征权重以及所述词语表征权重,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度。
2.根据权利要求1所述的方法,其特征在于,所述识别所述目标图像中包括的目标物体特征矩阵,具体包括:
识别所述目标图像中包括的全部物体类别,并确定每个所述物体类别对应的物体特征向量以及像素面积信息;
在全部所述物体类别中,筛选所述像素面积信息大于预设面积阈值的目标物体类别;
由全部所述目标物体类别对应的目标物体特征向量构成所述目标物体特征矩阵。
3.根据权利要求1所述的方法,其特征在于,基于以下方法识别所述待检测描述文字中包括的目标词语特征矩阵:
将所述待检测描述文字划分为多个描述词语,确定每个所述描述词语对应的词性信息;
过滤所述词性信息为介词的所述描述词语,确定过滤后的所述描述词语对应的目标词语表征向量;
由全部所述目标词语表征向量构成所述目标词语表征矩阵。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一匹配度和所述第二匹配度,确定所述目标图像与所述待检测描述文字之间的目标匹配度,具体包括:
分别为所述第一匹配度和所述第二匹配度配置对应的预设权重系数;
根据所述预设权重系数,将所述第一匹配度和所述第二匹配度加权求和,确定所述目标图像与所述待检测描述文字之间的目标匹配度。
5.根据权利要求1所述的方法,其特征在于,在所述根据所述第一匹配度和所述第二匹配度,确定所述目标图像与所述待检测描述文字之间的目标匹配度之后,所述方法还包括:
判断所述目标匹配度是否大于预设的匹配度阈值;
若大于,则确定所述待检测描述文字针对所述目标图像的图像内容描述准确;若小于,则确定所述待检测描述文字针对所述目标图像的图像内容描述不准确。
6.一种图像描述文字的匹配度检测装置,其特征在于,包括:
获取模块,用于获取目标图像以及对应的待检测描述文字,其中,待检测描述文字是通过预设的图像-文字转换系统针对目标图像进行识别后,生成的一段针对目标图像中所展示的内容进行描述的文字;
识别模块,用于识别所述目标图像中包括的目标物体特征矩阵,以及所述待检测描述文字中包括的目标词语表征矩阵;
第一相似度确定模块,用于确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度;
第一匹配度确定模块,用于根据所述第一相似度,确定所述目标图像与所述待检测描述文字之间的第一匹配度;
第二相似度确定模块,用于基于所述目标图像对应的预设基准描述文字集合,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度,其中,预设基准描述文字集合由不同的真人对该目标图像的图像内容进行描述的描述话语或描述文字构成;
第二匹配度确定模块,用于根据所述第二相似度,确定所述目标图像与所述待检测描述文字之间的第二匹配度;
目标匹配度确定模块,用于根据所述第一匹配度和所述第二匹配度,确定所述目标图像与所述待检测描述文字之间的目标匹配度;
所述第一相似度确定模块具体用于:
确定所述目标物体特征矩阵中包括的目标物体特征向量,与所述目标词语表征矩阵中包括的目标词语表征向量之间的向量距离;
根据所述向量距离以及预设的转移矩阵,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第一相似度;
所述第二相似度确定模块具体用于:
基于所述预设基准描述文字集合,为所述目标物体特征向量配置对应的物体特征权重,以及,为所述目标词语表征向量配置对应的词语表征权重;
根据所述向量距离、所述转移矩阵、所述物体特征权重以及所述词语表征权重,确定所述目标物体特征矩阵与所述目标词语表征矩阵之间的第二相似度。
7.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至5中任一项所述的图像描述文字的匹配度检测方法的步骤。
8.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至5中任一项所述的图像描述文字的匹配度检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211106998.4A CN115186775B (zh) | 2022-09-13 | 2022-09-13 | 一种图像描述文字的匹配度检测方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211106998.4A CN115186775B (zh) | 2022-09-13 | 2022-09-13 | 一种图像描述文字的匹配度检测方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115186775A CN115186775A (zh) | 2022-10-14 |
CN115186775B true CN115186775B (zh) | 2022-12-16 |
Family
ID=83524298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211106998.4A Active CN115186775B (zh) | 2022-09-13 | 2022-09-13 | 一种图像描述文字的匹配度检测方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115186775B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147457A (zh) * | 2019-02-28 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 图文匹配方法、装置、存储介质及设备 |
CN110851644A (zh) * | 2019-11-04 | 2020-02-28 | 泰康保险集团股份有限公司 | 图像检索方法及装置、计算机可读存储介质、电子设备 |
CN111898544A (zh) * | 2020-07-31 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 文字图像匹配方法、装置和设备及计算机存储介质 |
CN112035671A (zh) * | 2020-11-05 | 2020-12-04 | 腾讯科技(深圳)有限公司 | 状态检测方法、装置、计算机设备及存储介质 |
CN113516143A (zh) * | 2020-11-26 | 2021-10-19 | 腾讯科技(深圳)有限公司 | 文本图像匹配方法、装置、计算机设备及存储介质 |
CN113837257A (zh) * | 2021-09-15 | 2021-12-24 | 支付宝(杭州)信息技术有限公司 | 一种目标检测方法及装置 |
WO2022121171A1 (zh) * | 2020-12-10 | 2022-06-16 | 平安科技(深圳)有限公司 | 相似文本匹配方法、装置、电子设备及计算机存储介质 |
CN114741581A (zh) * | 2022-04-20 | 2022-07-12 | 平安科技(深圳)有限公司 | 一种图像分类方法、装置、计算机设备及介质 |
-
2022
- 2022-09-13 CN CN202211106998.4A patent/CN115186775B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147457A (zh) * | 2019-02-28 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 图文匹配方法、装置、存储介质及设备 |
CN110851644A (zh) * | 2019-11-04 | 2020-02-28 | 泰康保险集团股份有限公司 | 图像检索方法及装置、计算机可读存储介质、电子设备 |
CN111898544A (zh) * | 2020-07-31 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 文字图像匹配方法、装置和设备及计算机存储介质 |
CN112035671A (zh) * | 2020-11-05 | 2020-12-04 | 腾讯科技(深圳)有限公司 | 状态检测方法、装置、计算机设备及存储介质 |
CN113516143A (zh) * | 2020-11-26 | 2021-10-19 | 腾讯科技(深圳)有限公司 | 文本图像匹配方法、装置、计算机设备及存储介质 |
WO2022121171A1 (zh) * | 2020-12-10 | 2022-06-16 | 平安科技(深圳)有限公司 | 相似文本匹配方法、装置、电子设备及计算机存储介质 |
CN113837257A (zh) * | 2021-09-15 | 2021-12-24 | 支付宝(杭州)信息技术有限公司 | 一种目标检测方法及装置 |
CN114741581A (zh) * | 2022-04-20 | 2022-07-12 | 平安科技(深圳)有限公司 | 一种图像分类方法、装置、计算机设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115186775A (zh) | 2022-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109302410B (zh) | 一种内部用户异常行为检测方法、系统及计算机存储介质 | |
CN109117480A (zh) | 词预测方法、装置、计算机设备及存储介质 | |
CN110287311B (zh) | 文本分类方法及装置、存储介质、计算机设备 | |
CN112468659A (zh) | 应用于电话客服的质量评价方法、装置、设备及存储介质 | |
CN113032584B (zh) | 一种实体关联方法、装置、电子设备及存储介质 | |
CN113191787A (zh) | 电信数据的处理方法、装置电子设备及存储介质 | |
CN113094478B (zh) | 表情回复方法、装置、设备及存储介质 | |
CN111221960A (zh) | 文本检测方法、相似度计算方法、模型训练方法及装置 | |
CN112347223A (zh) | 文档检索方法、设备及计算机可读存储介质 | |
CN110717407A (zh) | 基于唇语密码的人脸识别方法、装置及存储介质 | |
CN115062186A (zh) | 一种视频内容检索方法、装置、设备以及存储介质 | |
CN111694954A (zh) | 图像分类方法、装置和电子设备 | |
CN113435531B (zh) | 零样本图像分类方法、系统、电子设备及存储介质 | |
CN117763126A (zh) | 知识检索方法、设备、存储介质及装置 | |
CN115186775B (zh) | 一种图像描述文字的匹配度检测方法、装置及电子设备 | |
CN111930885A (zh) | 文本话题的抽取方法、装置及计算机设备 | |
CN109492396B (zh) | 基于语义分割的恶意软件基因快速检测方法和装置 | |
CN113011503B (zh) | 一种电子设备的数据取证方法、存储介质及终端 | |
CN111611394B (zh) | 一种文本分类方法、装置、电子设备及可读存储介质 | |
CN113836297A (zh) | 文本情感分析模型的训练方法及装置 | |
CN113627542A (zh) | 一种事件信息处理方法、服务器及存储介质 | |
CN113343699A (zh) | 日志安全风险的监测方法、装置、电子设备及介质 | |
CN111708884A (zh) | 文本分类方法、装置及电子设备 | |
CN116029299B (zh) | 一种基于多义词的命名实体识别方法、系统和存储介质 | |
CN118035454B (zh) | 表情包分类识别方法、装置、计算机设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |