CN117315301B

CN117315301B - 一种基于图像识别的藏品信息匹配系统和方法

Info

Publication number: CN117315301B
Application number: CN202311288205.XA
Authority: CN
Inventors: 王之乐; 才华
Original assignee: Changchun University of Science and Technology
Current assignee: Changchun University of Science and Technology
Priority date: 2023-10-07
Filing date: 2023-10-07
Publication date: 2024-04-09
Anticipated expiration: 2043-10-07
Also published as: CN117315301A

Abstract

本发明公开了一种基于图像识别的藏品信息匹配系统和方法，涉及藏品图像识别技术领域，先将待识别图片、以及CNN分类模型中与待识别图片属于同一类别的对比图片的哈希值转化为字符串，再提取对比图片的字符串位数N、对比图片和待识别图片的字符串在对应位置上的不同字符个数n、以及对比图片和待识别图片在对应位置上的字符间字符差值X_i，以此通过在汉明距离的基础上引入不同字符个数n和字符串位数N的比值、以及字符差值X_i来计算相似性评估系数XSpg，提高对待识别图片和对比图片相似性评估的精准性，还通过输出一个对应藏品图片和多个相似藏品图片的设置提供多个藏品以供游客参考，丰富游客观展的选择。

Description

一种基于图像识别的藏品信息匹配系统和方法

技术领域

本发明涉及藏品图像识别技术领域，具体为一种基于图像识别的藏品信息匹配系统和方法。

背景技术

人们对于精神食粮的需求越来越高，各处旅游景点的传统实体博物馆由于场地，保护展品等原因所导致的展品较少已经成为了一个普遍的问题。如何提高观众可阅览的展品数量以及查询效率，并完整地还原展品的信息成为了一个值得我们关注并探讨的问题。在现实生活中，人们可能因为某个精美的展品慕名而来，却由于种种原因而无法阅览，这种信息差让人们对出行的规划不得不更加谨慎。对于这一问题，博物馆大多采用图像识别的方式建立“物-人-数据”相互连接的信息通道，如先通过CNN对不同的藏品进行图像分类，再通过均值哈希算法计算图像相似度，以此锁定游客所要阅览的展品，再提取该产品的信息以确定其是否在馆。因此，通过均值哈希算法计算图像相似度以此锁定游客所要阅览的展品这一步骤尤为重要。

现有技术中，公开号为“CN115546773A”的一种均值哈希算法二次精确识别方法，包括以下步骤：

步骤一：商家预先对商品进行拍照；步骤二：将商品照片上传至基于均值哈希算法的图像识别系统的数据库中进行保存并计算出图片的特征指纹字符串，通过设置的均值哈希算法系统，对图像识别系统处理后的商品图像进行算法识别对比，大大增加了对顾客拍摄的商品的识别准确率，通过生成图片特征指纹，对比图片特征指纹，使图像的系统化对比更加高效且准确，避免了目前在通过普通的AI图像识别技术对商品进行识别时，通常只能简单的识别商品的种类，无法根据商品的大小和颜色等对同一种类的商品进行精细化区分的问题。

但现有技术仍存在较大缺陷，如：现有技术中仅仅是通过简单的“汉明距离”来比较两张图片是否相似，这一判断较为简单武断，存在较大的判断误差，且现有技术对于图片只能通过一对一进行判断分析，在应用到本申请中时，无法根据用户提供的图片筛选出多个相似图片以供用户选择参考来丰富游客观展的可选择性。

发明内容

本发明的目的在于提供一种基于图像识别的藏品信息匹配系统和方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种基于图像识别的藏品信息匹配方法，包括如下步骤：

S1，构建CNN训练模型，收集若干不同类别的藏品的第一图片，对第一图片进行分类标记，通过标记好的第一图片对CNN训练模型进行训练，获取CNN分类模型，构建藏品图片数据库，藏品图片数据库内包括藏品图片和对应图片的藏品信息；

S2，采集待识别图片，送入CNN分类模型中进行识别以确定其所属类别信息；

S3，计算待识别图片、以及CNN分类模型中与待识别图片属于同一类别的所有图片的哈希值，并将哈希值转化为字符串；

S4，将CNN分类模型中与待识别图片属于同一类别的所有图片作为对比图片组，并将对比图片组的对比图片与待识别图片进行一一对比，提取对比图片的字符串位数N、对比图片和待识别图片的字符串在对应位置上的不同字符个数n、以及对比图片和待识别图片在对应位置上的字符间字符差值X_i，i表示字符串上不同位置的字符编号，i＝1、2、3、……、N；

S5，根据字符串位数N、不同字符个数n以及字符差值X_i生成相似性评估系数XSpg；

S6，将相似性评估系数XSpg和相似性评估阈值XSyz进行对比，若XSpg<XSyz则将该对比图片纳入待识别图片的相似藏品图片组中；

S7，将相似藏品图片组中相似性评估系数最低的对比图片作为对应藏品图片，并输出对应藏品图片所指代的对应藏品的信息，并将相似藏品图片组中其他的对比图片作为相似藏品图片，并输出相似藏品图片所指代的相似藏品的信息。

优选的，S1，构建CNN训练模型，收集若干不同类别的藏品的第一图片，对第一图片进行分类标记，通过标记好的第一图片对CNN训练模型进行训练，获取CNN分类模型，构建藏品图片数据库，藏品图片数据库内包括藏品图片和对应图片的藏品信息，具体包括：

S11，导入藏品的原始图片数据；

S12，读取图片像素并将其转化为像素矩阵并进行分类标记；

S13，将像素矩阵作为训练数据并进行分类；

S14，将训练数据输入至CNN神经网络中进行训练并保存训练后的CNN分类模型；

优选的，S12，读取图片像素并将其转化为像素矩阵并进行分类标记，具体包括：

S121，读取图片像素，使其大小变为128*128；

S122，将图像像素转化为像素矩阵并进行分类标记。

优选的，S2，采集待识别图片，送入CNN分类模型中进行识别以确定其所属类别信息，具体包括：

S21，将待识别图片的像素矩阵输入至卷积层中预先构建的卷积网络进行卷积，得到输出矩阵；

S22，将输出矩阵输入至池化层中进行池化，得到池化结果；

S23，将池化结果输入至全连接层，得到与待识别图片对应的识别结果以确定待识别图片所属类别。

优选的，S3，计算待识别图片、以及CNN分类模型中与待识别图片属于同一类别的所有图片的哈希值，并将哈希值转化为字符串，具体包括：

将图片缩放为32*32，并进行图片灰度化，计算灰度值的平均值，并根据平均值将每个像素二值化，大于平均值为1，小于平均值为0，之后将每八个比特为一个十六进制值，转换成字符串，生成哈希值。

优选的，S5，根据字符串位数N、不同字符个数n以及字符差值X_i生成相似性评估系数XSpg，具体包括：

其中，a₁、a₂、a₃分别为n、X_i的预设比例系数，且a₁>a2>a3，且a₁+a3＝e。

优选的，S7，将相似藏品图片组中相似性评估系数最低的对比图片作为对应藏品图片，并输出对应藏品图片所指代的对应藏品的信息，并将相似藏品图片组中其他的对比图片作为相似藏品图片，并输出相似藏品图片所指代的相似藏品的信息，具体包括：

对应藏品的信息包括藏品名称、藏品年代、展架编号以及是否在展，相似藏品的信息包括藏品名称、藏品年代以及展架编号。

一种基于图像识别的藏品信息匹配系统，用于上述的基于图像识别的藏品信息匹配方法，包括：

CNN训练模型构建单元，所述CNN训练模型构建单元构建CNN训练模型并通过训练获取CNN分类模型；

CNN分类模型单元，所述CNN分类模型单元对待识别图片进行识别以确定其所属类别；

哈希值计算单元，所述哈希值计算单元计算待识别图片、以及CNN分类模型中与待识别图片属于同一类别的所有图片的哈希值，并将哈希值转化为字符串；

数据提取单元，所述数据提取单元将CNN分类模型中与待识别图片属于同一类别的所有图片作为对比图片组，并将对比图片组的对比图片与待识别图片进行一一对比，提取对比图片的字符串位数N、对比图片和待识别图片的字符串在对应位置上的不同字符个数n、以及对比图片和待识别图片在对应位置上的字符间字符差值X_i；

相似性评估系数计算单元，所述相似性评估系数计算单元根据字符串位数N、不同字符个数n以及字符差值X_i生成相似性评估系数XSpg；

相似藏品统计单元，所述相似藏品统计单元将相似性评估系数XSpg和相似性评估阈值XSyz进行对比，若XSpg<XSyz则将该对比图片纳入待识别图片的相似藏品图片组中；

藏品信息输出单元，所述藏品信息输出单元将相似藏品图片组中相似性评估系数最低的对比图片作为对应藏品图片，并输出对应藏品图片所指代的对应藏品的信息，并将相似藏品图片组中其他的对比图片作为相似藏品图片，并输出相似藏品图片所指代的相似藏品的信息。

与现有技术相比，本发明的有益效果是：

本发明的基于图像识别的藏品信息匹配系统和方法，在评估待识别图片和对比图片的相似性时，通过在汉明距离的基础上引入不同字符个数n和字符串位数N的比值、以及字符差值X_i来计算相似性评估系数XSpg，提高对待识别图片和对比图片相似性评估的精准性，并通过输出一个对应藏品图片和多个相似藏品图片的设置提供多个藏品以供游客参考，丰富游客观展的选择。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明基于图像识别的藏品信息匹配方法流程图；

图2为本发明基于图像识别的藏品信息匹配系统的模块单元图；

图3为本发明的基于图像识别的藏品信息匹配系统实际应用时控制台工作示意图；

图4为图3中控制台根据待识别图片输出藏品在展示意图；

图5为图3中控制台根据待识别图片输出藏品不在展示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，对本发明进一步详细说明。

需要说明的是，除非另外定义，本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变后，则该相对位置关系也可能相应地改变。

本发明提供一实施例的基于图像识别的藏品信息匹配方法，包括如下步骤：

S1，构建CNN训练模型，收集若干不同类别的藏品的第一图片，对第一图片进行分类标记，通过标记好的第一图片对CNN训练模型进行训练，获取CNN分类模型，构建藏品图片数据库，藏品图片数据库内包括藏品图片和对应图片的藏品信息，包括如下步骤：

S11，导入藏品的原始图片数据；

S12，读取图片像素并将其转化为像素矩阵并进行分类标记，包括如下步骤：

S121，读取图片像素，使其大小变为128*128；

S122，将图像像素转化为像素矩阵并进行分类标记；

S13，将像素矩阵作为训练数据并进行分类，在本实施方式中将藏品分为人像动物像、容器、首饰和画供四大类；

通过标记好的第一图像对CNN分类模型进行训练的具体方法为：

将标记好的第一图像按照8:1:1的比例划分为训练集、验证集和测试集输入CNN分类模型，并采用冻结训练的方式对CNN分类模型进行训练，冻结训练方式指的是在冻结的训练世代内，主干特征提取网络的参数不发生更新，只更新预测网络的参数，在解冻之后，继续对主干特征提取网络以及预测网络的参数进行更新，这样能够防止训练初期权值被破坏，控制训练速度；

S2，采集待识别图片，送入CNN分类模型中进行识别以确定其所属类别信息，包括如下步骤：

S21，将将待识别图片的像素矩阵输入至卷积层中预先构建的卷积网络进行卷积，得到输出矩阵；

其中，卷积的主要目的是提取图片的特征，卷积运算保持像素之间的空间关系，将每张图片当作是一个包含每个像素值的矩阵，通过卷积核从上到下，从左到右移动并依次进行卷积运算，得到输出矩阵；

S22，将输出矩阵输入至池化层中进行池化，得到池化结果；

其中，池化层能减小下一层的输入大小，减小计算量和参数个数，减小卷积层参数误差造估计均值的偏移，在本实施方式的设计中采用了最大池化层，使用2*2的窗口对该窗口内的特征图提取最大元素；

S23，将池化结果输入至全连接层，得到与待识别图片对应的识别结果以确定待识别图片所属类别；

其中，全连接层是一个传统的多层感知器，它在输出层使用一个softmax激活函数，其作用是将前面的卷积层提取的特征结合在一起然后进行分类；

S3，计算待识别图片、以及CNN分类模型中与待识别图片属于同一类别的所有图片的哈希值，并将哈希值转化为字符串，具体方法为：

将图片缩放为32*32，并进行图片灰度化，计算灰度值的平均值，并根据平均值将每个像素二值化，大于平均值为1，小于平均值为0，之后将每八个比特为一个十六进制值，转换成字符串，生成哈希值；

S4，将CNN分类模型中与待识别图片属于同一类别的所有图片作为对比图片组，并将对比图片组的对比图片与待识别图片进行一一对比，对比图片和待识别图片的字符串位数相同、且字符一一对应，提取对比图片的字符串位数N、对比图片和待识别图片的字符串在对应位置上的不同字符个数n、以及对比图片和待识别图片在对应位置上的字符间字符差值X_i，i表示字符串上不同位置的字符编号，i＝1、2、3、……、N；

S5，根据字符串位数N、不同字符个数n以及字符差值X_i生成相似性评估系数XSpg，计算公式如下：

其中，a₁、a₂、a₃分别为n、X_i的预设比例系数，且a₁>a2>a3，且a₁+a3＝e，不同字符个数n、字符差值X_i越大，代表待识别图片和对比图片间的区别越大，相似性评估系数XSpg也就越大，通过在汉明距离的基础上引入不同字符个数n和字符串位数N的比值、以及对比图片和待识别图片的字符在对应位置上的字符差值X_i，提高对待识别图片和对比图片相似性评估的精准性；

S6将相似性评估系数XSpg和相似性评估阈值XSyz进行对比，若XSpg<XSyz则将该对比图片纳入待识别图片的相似藏品图片组中，若XSpg≥XSyz则不将该对比图片纳入待识别图片的相似藏品图片组中；

S7，将相似藏品图片组中相似性评估系数最低的对比图片作为对应藏品图片，并输出对应藏品图片所指代的对应藏品的信息，并将相似藏品图片组中其他的对比图片作为相似藏品图片，并输出相似藏品图片所指代的相似藏品的信息；

其中，对应藏品的信息包括藏品名称、藏品年代、展架编号以及是否在展，相似藏品的信息包括藏品名称、藏品年代以及展架编号。

本发明还提供另一实施例的基于图像识别的藏品信息匹配系统，包括：

CNN训练模型构建单元，CNN训练模型构建单元构建CNN训练模型并通过训练获取CNN分类模型；

CNN分类模型单元，CNN分类模型单元对待识别图片进行识别以确定其所属类别；

哈希值计算单元，哈希值计算单元计算待识别图片、以及CNN分类模型中与待识别图片属于同一类别的所有图片的哈希值，并将哈希值转化为字符串；

数据提取单元，数据提取单元将CNN分类模型中与待识别图片属于同一类别的所有图片作为对比图片组，并将对比图片组的对比图片与待识别图片进行一一对比，提取对比图片的字符串位数N、对比图片和待识别图片的字符串在对应位置上的不同字符个数n、以及对比图片和待识别图片在对应位置上的字符间字符差值X_i；

相似性评估系数计算单元，相似性评估系数计算单元根据字符串位数N、不同字符个数n以及字符差值X_i生成相似性评估系数XSpg；

相似藏品统计单元，相似藏品统计单元将相似性评估系数XSpg和相似性评估阈值XSyz进行对比，若XSpg<XSyz则将该对比图片纳入待识别图片的相似藏品图片组中，若XSpg≥XSyz则不将该对比图片纳入待识别图片的相似藏品图片组中；

藏品信息输出单元，藏品信息输出单元将相似藏品图片组中相似性评估系数最低的对比图片作为对应藏品图片，并输出对应藏品图片所指代的对应藏品的信息，并将相似藏品图片组中其他的对比图片作为相似藏品图片，并输出相似藏品图片所指代的相似藏品的信息。

上述实施例，可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时，上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质。半导体介质可以是固态硬盘。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种航道水下地形变化分析系统及方法逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

最后：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所作的任何修改等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于图像识别的藏品信息匹配方法，其特征在于，包括如下步骤：

S5，根据字符串位数N、不同字符个数n以及字符差值X_i生成相似性评估系数XSpg，具体包括：

其中，a₁、a₂、a₃分别为n、X_i的预设比例系数，且a₁＞a2＞a3，且a₁+a3＝e；

2.根据权利要求1所述的基于图像识别的藏品信息匹配方法，其特征在于：S1，构建CNN训练模型，收集若干不同类别的藏品的第一图片，对第一图片进行分类标记，通过标记好的第一图片对CNN训练模型进行训练，获取CNN分类模型，构建藏品图片数据库，藏品图片数据库内包括藏品图片和对应图片的藏品信息，具体包括：

S11，导入藏品的原始图片数据；

S12，读取图片像素并将其转化为像素矩阵并进行分类标记；

S13，将像素矩阵作为训练数据并进行分类；

S14，将训练数据输入至CNN神经网络中进行训练并保存训练后的CNN分类模型。

3.根据权利要求2所述的基于图像识别的藏品信息匹配方法，其特征在于：S12，读取图片像素并将其转化为像素矩阵并进行分类标记，具体包括：

S121，读取图片像素，使其大小变为128*128；

S122，将图像像素转化为像素矩阵并进行分类标记。

4.根据权利要求1所述的基于图像识别的藏品信息匹配方法，其特征在于：S2，采集待识别图片，送入CNN分类模型中进行识别以确定其所属类别信息，具体包括：

S22，将输出矩阵输入至池化层中进行池化，得到池化结果；

5.根据权利要求1所述的基于图像识别的藏品信息匹配方法，其特征在于：S3，计算待识别图片、以及CNN分类模型中与待识别图片属于同一类别的所有图片的哈希值，并将哈希值转化为字符串，具体包括：

6.根据权利要求1所述的基于图像识别的藏品信息匹配方法，其特征在于：S7，将相似藏品图片组中相似性评估系数最低的对比图片作为对应藏品图片，并输出对应藏品图片所指代的对应藏品的信息，并将相似藏品图片组中其他的对比图片作为相似藏品图片，并输出相似藏品图片所指代的相似藏品的信息，具体包括：

7.一种基于图像识别的藏品信息匹配系统，用于上述权利要求1-6任意一项所述的基于图像识别的藏品信息匹配方法，其特征在于，包括：

相似性评估系数计算单元，所述相似性评估系数计算单元根据字符串位数N、不同字符个数n以及字符差值X_i生成相似性评估系数XSpg，具体包括：