CN115796980A - 一种基于物联网的新型智慧城市大数据管理方法 - Google Patents

一种基于物联网的新型智慧城市大数据管理方法 Download PDF

Info

Publication number
CN115796980A
CN115796980A CN202310076587.3A CN202310076587A CN115796980A CN 115796980 A CN115796980 A CN 115796980A CN 202310076587 A CN202310076587 A CN 202310076587A CN 115796980 A CN115796980 A CN 115796980A
Authority
CN
China
Prior art keywords
category
image
user
similarity
dictionary matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310076587.3A
Other languages
English (en)
Other versions
CN115796980B (zh
Inventor
曾二林
陈斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Shenchuang Photoelectric Technology Co ltd
Original Assignee
Guangdong Shenchuang Photoelectric Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Shenchuang Photoelectric Technology Co ltd filed Critical Guangdong Shenchuang Photoelectric Technology Co ltd
Priority to CN202310076587.3A priority Critical patent/CN115796980B/zh
Publication of CN115796980A publication Critical patent/CN115796980A/zh
Application granted granted Critical
Publication of CN115796980B publication Critical patent/CN115796980B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据处理领域,具体涉及一种基于物联网的新型智慧城市大数据管理方法,包括:获取用户输入图像;根据大数据库中各个图像之间的图像相似度得到大数据库的各个类别以及类别中心图像;根据各个类别字典矩阵与用户字典矩阵之间的匹配列得到各个第一类别;获取用户字典矩阵的各个特征组合方式以及各个类别字典矩阵的各个特征组合方式;对各个第一类别对应的各个特征组合方式进行更新;根据各个第一类别更新后的特征组合方式得到各个第二类别;根据各个第二类别中各个图像的纯度得到各个第二类别的推荐图像;根据用户评分对各个推荐图像进行更新,得到最终的目标推荐图像。本发明可以根据用户自身需求有针对性地对用户进行产品推荐。

Description

一种基于物联网的新型智慧城市大数据管理方法
技术领域
本发明涉及数据处理领域,具体涉及一种基于物联网的新型智慧城市大数据管理方法。
背景技术
零售业作为智慧城市建设过程中的基础,传统零售创新成为了实体零售发展、智慧城市建设的必经之路,物联网的发展为智慧超市提供了新的理念和技术,为智慧超市的发展和实现起到了强有力的支撑作用。
通过线上购物等方法购买到自己需要的产品已经逐渐成为大众的一种消费习惯,但是由于产品多种多样,当用户想要购买一个产品,往往是先通过拍摄一个与想要购买的产品外观最接近的产品图像,然后使用搜索引擎将采集的产品图像与大数据库的众多的数据的比较,进而找到对应的产品对用户进行推荐,但是由于不同用户自身需求存在差异,根据大数据对用户进行的产品推荐有时并不能满足用户需求,或推荐的产品不能很好地贴合用户需求,导致用户体验感下降,降低了用户的购买积极性。
发明内容
本发明提供一种基于物联网的新型智慧城市大数据管理方法,以解决现有的问题。
本发明的一种基于物联网的新型智慧城市大数据管理方法采用如下技术方案:
本发明一个实施例提供了一种基于物联网的新型智慧城市大数据管理方法,该方法包括以下步骤:
获取用户输入图像;
根据大数据库中各个图像之间的图像相似度对各个图像进行初步分类,得到各个初始类别;根据大数据库中各个图像与各个初始类别之间的相似度得到大数据库的各个类别以及各个类别的类别中心图像;根据各个类别中心图像的各列像素得到各个类别的类别字典矩阵以及类别稀疏矩阵;根据用户输入图像的各列像素得到用户字典矩阵以及用户稀疏矩阵;通过对各个类别字典矩阵与用户字典矩阵之间的列进行匹配操作得到各个第一类别;
根据用户稀疏矩阵中的元素值获取用户字典矩阵的各个特征组合方式;根据各个第一类别对应的类别稀疏矩阵中的元素值获取各个类别字典矩阵的各个特征组合方式;根据用户字典矩阵的各个特征组合方式对各个第一类别对应的各个特征组合方式进行更新;根据各个第一类别更新后的特征组合方式进行划分,得到各个第二类别,每个第二类别中包含多个第一类别;
获取各个第二类别中各个图像的纯度,将各个第二类别中纯度最大的图像作为对应第二类别的推荐图像,得到各个推荐图像;根据用户评分对各个推荐图像进行更新,得到最终的目标推荐图像。
优选的,所述各个初始类别的获取方法为:
获取大数据库中各个图像的图像熵,计算任意两个图像的图像熵之间差值的绝对值以及所述两个图像的图像熵之间的均值,将所述绝对值与所述均值之间的比值进行负相关映射,将所得映射结果作为所述两个图像之间的图像相似度,并将所述两个图像记为一个匹配对;获取大数据库中各个匹配对的图像相似度;
将大数据库中所有匹配对的图像相似度进行从小到大排列,得到图像相似度序列;获取图像相似度序列中各个图像相似度对应的不同匹配对的个数;当图像相似度序列中首次出现一个图像相似度对应的不同匹配对的个数大于预设匹配对数量时,将该图像相似度对应的各个不同匹配对作为各个初始类别。
优选的,所述大数据库的各个类别以及各个类别的类别中心图像的获取方法为:
将大数据库中各个图像与各个初始类别所包含的所有图像之间的图像相似度的均值,将所得均值作为所述各个图像与各个初始类别的相似度,将所述各个图像划分到最大相似度对应的初始类别中,依次对大数据库中的各个图像进行划分,得到大数据库中的各个类别;
将计算各个类别中各个图像与其他图像之间图像相似度的累加和,将最大的累加和作为各个类别中各个图像的代表性,将各个类别中代表性最大的图像作为所述各个类别的类别中心图像。
优选的,所述通过对各个类别字典矩阵与用户字典矩阵之间的列进行匹配操作得到各个第一类别方法为:
计算用户字典矩阵中的各个列向量与单个类别字典矩阵的所有列向量之间的余弦相似度,获取用户字典矩阵中各个列向量对应的所有余弦相似度中的最大余弦相似度,当最大余弦相似度大于等于预设列相似度阈值时,将该类别字典矩阵中最大余弦相似度对应的列向量作为用户字典矩阵中所述各个列向量的匹配列;获取用户字典矩阵中存在匹配列的列向量个数,将所述列向量个数与用户字典矩阵包含的列向量的总个数之间的比值作为用户字典矩阵与该类别字典矩阵的矩阵相似度;
当所得矩阵相似度大于预设矩阵相似度阈值时,将该类别字典矩阵所对应的类别作为一个第一类别;根据用户字典矩阵与各个类别字典矩阵之间的匹配列,得到各个第一类别。
优选的,所述用户字典矩阵的各个特征组合方式的获取方法为:
获取用户字典矩阵中每个列向量的列号;获取用户稀疏矩阵每一列中所有值为1的元素的各个位置序号;将用户字典矩阵中所有列号存在于所述各个位置序号中的列向量构成了用户字典矩阵的一种特征组合方式;用户稀疏矩阵中包含元素值为1的每一列均对应一种特征组合方式。
优选的,所述对各个第一类别对应的各个特征组合方式进行更新的方法为:
各个第一类别对应的各个特征组合方式中,如果各个特征组合方式中所有元素均为匹配列中的元素时,对该特征组合方式进行保留,否则对其进行剔除,依次对各个第一类别对应的各个特征组合方式进行保留或剔除处理,保留处理过程和剔除处理过程即为对各个第一类别对应的各个特征组合方式进行更新的过程。
优选的,所述各个第二类别的获取方法为:
将具有完全相同的特征组合方式的各个第一类别划分为一组,每一组对应一个第二类别,每个第二类别中包含多个第一类别。
优选的,所述各个第二类别中各个图像的纯度的获取方法为:
对各个第二类别中各个图像转化为向量格式,将每个图像对应的向量格式记为一个输入向量,使用因子分析对各个第二类别中的所有输入向量下进行处理,得到各个第二类别的公共因子向量以及各个特殊因子向量,其中,每个输入向量对应一个特殊因子向量;
分别对公共因子向量以及各个特殊因子向量进行整形化,获取整形化后的公共因子向量的熵值以及各个特殊因子向量的熵值,将公共因子向量对应的熵值与公共因子向量与各个特殊因子向量熵值之和作比,所得比值作为所述各个第二类别中各个图像的纯度。
优选的,所述根据用户评分对各个推荐图像进行更新,得到目标推荐图像的方法为:
获取各个推荐图像的用户评分与最大用户评分之间的比值,以及各个用户评分的平均值,将用户评分小于所述平均值的推荐图像进行剔除;对于用户评分大于等于所述平均值的各个推荐图像进行更新,即选取此时各个推荐图像对应的第二类别中纯度值等于所述比值的各个图像,计算所述各个图像与所述第二类别中其他图像之间图像相似度的累加和,将最大累加和对应的图像作为所述第二类别更新后的推荐图像;重复此操作,当只有一个推荐图像时,该推荐图像即为目标推荐图像。
本发明的有益效果是:首先对大数据库中的各个图像进行初步分类,得到大数据库中的各个类别,根据各个类别的类别字典矩阵与用户字典矩阵之间的匹配列得到与用户输入图像整体特征相似的各个第一类别,然后通过各个第一类别的类别稀疏矩阵获取各个第一类别的独特性,从而将各个第一类别的细节信息与用户输入图像的细节信息进行对比,进一步得到细节信息也贴近于用户输入图像的各个第二类别,然后获取各个第二类别的推荐图像;结合用户对各个推荐图像的评分,对推荐图像进行更新,通过多次的推荐的更新,使得用户可以选取到更加符合心意的物品,提高用户体验的同时,增加用户的购买积极性。与传统方法相比,本方法更加具有针对性,可以根据不同用户自身需求,自动推荐更加符合用户需求的产品,进而可以在较短时间内帮每个用户选到更加满意的产品图像。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种基于物联网的新型智慧城市大数据管理方法的步骤流程图;
图2为本发明的一种基于物联网的新型智慧城市大数据管理方法的K-SVD原理示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于物联网的新型智慧城市大数据管理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于物联网的新型智慧城市大数据管理方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种基于物联网的新型智慧城市大数据管理方法的步骤流程图,该方法包括以下步骤:
步骤S001:获取用户输入图像。
在spark搜索引擎中采用本实施例中的方法。对应场景为:当某个用户通过图像对想要的物品进行搜索时,使用spark搜索引擎在大数据库中进行检索。例如:用户看到一个产品,但对该产品的某些特征不满意,想要搜索一个相近的满意的产品,然后采集这个产品的图像进行采集,使用spark搜索引擎在大数据库中进行检索,则在本发明中将用户采集的产品图像记为用户输入图像。
步骤S002:根据大数据库中各个图像之间的图像相似度得到各个初始类别;根据大数据库中各个图像与各个初始类别之间的相似度得到大数据库的所有类别以及类别中心图像。
由于大数据库中包含的数据量较大,为了减少计算量,本实施例首先根据大数据库中各个产品图像之间的相似度对大数据库中的各个产品图像进行分类,后续只需对各个类别中的少量数据进行分析即可,有助于后续的产品推荐,避免用户在海量数据中进行一一查看。
首先将大数据库中的各个图像转换为灰度图像,根据各个灰度图像中各个灰度级出现的频率计算各个灰度图像的图像熵,图像熵的获取方法为公知技术,此处不作赘述。其中对于大数据库中的任意两个图像,这两个图像之间的图像相似度可表示为T可表示为:
Figure SMS_1
式中,
Figure SMS_2
为这两个图像的图像熵之间差值的绝对值,
Figure SMS_3
为以自然常数为底的指数函数。
由于图像的图像熵可以表征图像中所包含的平均信息量,本发明使用两个图像之间图像熵差值的绝对值表示两个图像之间的差异,差异越小,两个图像之间越相似,即
Figure SMS_4
越接近于0,
Figure SMS_5
越接近于1,此时这两个图像的图像相似度越高,这两个图像是同一类产品的概率越大,反之则两个图像之间的图像相似度越低,这两个图像是同一类产品的概率越大。
由此得到大数据库中任意两个图像之间的图像相似度,为了便于描述,本实施例将大数据库中的任意两个图像称为一个匹配对,则这两个图像之间的图像相似度称为该匹配对的图像相似度,本发明中,对每个匹配对之间的图像相似度保留两位小数。
将大数据库中所有匹配对的图像相似度按从大到小进行排序,得到图像相似度序列,将该序列中的图像相似度分别记为第一相似度,第二相似度,…,第M相似度;预设匹配对数量k=100,依次判断各种图像相似度对应的匹配对的个数是否大于k,获取图像相似度序列中各个图像相似度对应的不同匹配对的个数,其中不同匹配对是指每个匹配对之间不存在匹配关系,例如,对于①,②,③,④,⑤,⑥六个图像,其中只有①②,①③,④⑤,②⑥四个匹配对的图像相似度为第M相似度,由于①分别与②、③存在匹配关系,而②与⑥之间也存在匹配关系,由此可以推得①与⑥之间也存在匹配关系,即①,②,③,⑥之间均存在匹配关系,而①,②,③,⑥与④,⑤之间不存在匹配关系,故本实施例中①②,①③和②⑥为一种匹配对,④⑤为一种匹配对,即认为第M相似度对应的不同匹配对个数为2;
当首次出现一种图像相似度对应的不同匹配对的个数大于k时,将该图像相似度对应的各个不同匹配对分别作为一个初始类别,例如,当第一相似度对应的匹配对的个数大于k时,将第一相似度对应的各个不同匹配对作为各个初始类别;否则依次判断后续的各种图像相似度,直到出现一种图像相似度对应的匹配对的数量超过k,将该图像相似度对应的各个不同匹配对作为各个初始类别;
然后计算大数据库中各个图像与各个初始类别的相似度,即计算大数据库中每个图像与某个初始类别包含的所有图像之间的图像相似度的均值,将所得均值作为该图像与该初始类别的相似度,获取该图像与各个初始类别之间的图像相似度,将最大相似度所对应的初始类别作为该图像的归属类别,将该图像划分到最大相似度对应的初始类别中。同理,根据大数据库中的各个图像与各个初始类别之间的相似度确定各个图像的归属类别,得到大数据库中的各个类别。
对于大数据库的一个类别,如果该类别中的一个图像与其他图像之间的图像相似度越高,该图像越具有代表性,即该图像越可以表征该类别中的所有图像数据,因此本发明将大数据库的各个类别中各个图像与对应类别中其他图像之间图像相似度的累加和作为各个图像的代表性,将各个类别中,代表性最大的图像作为对应类别的类别中心图像,后续只需对各个类别的类别中心图像进行分析即可。
步骤S003:获取各个类别的类别字典矩阵以及类别稀疏矩阵;获取用户输入图像的用户字典矩阵以及用户稀疏矩阵;对各个类别字典矩阵与用户字典矩阵之间的列得进行匹配操作到各个第一类别。
考虑到使用常规方法对产品推荐时,往往是根据大数据库中各个图像与用户输入图像之间的整体相似度对用户进行推荐,并未考虑图像的细节信息,为了对用户进行精准推荐,需要对细节信息进行分析,而K-SVD是一种对图像特征进行提取的方法,提取后的特征可以更好的表示图像的细节特征。例如:香椿芽和刺嫩芽通过外观难以区分,即香椿芽与刺嫩芽的整体相似度较高,但是二者的细节信息存在差异,使用K-SVD对香椿芽与刺嫩芽的细节信息进行特征提取,然后在大数据库的各个类别中选择拥有这些细节特征的类别,有助于筛选掉很多的相似产品,提高检索速度的同时提高检索结果的匹配度。同样地,由于很多时候,用户对自己想要的产品只是有一个模糊的形象,或者有一个大致图像,只是需要其中的某些特征,某些特征不需要,通过K-SVD特征提取的方法进行筛选有助于快速筛选到具有不同特征的图像,作为推荐图像,然后结合用户的评分,使得每次推荐的产品图像越来越符合用户的需求。具体过程如下:
分别以各个类别中心图像的各列像素为样本数据,通过K-SVD对各个样本数据进行分解,得到各个类别中心图像的类别字典矩阵,并且各个类别中心图像的每列像素均得到一个稀疏向量,各个类别中心图像的所有稀疏向量构成了各个类别中心图像的类别稀疏矩阵;其中,每个类别中心图像的类别稀疏矩阵也是该类别中心图像所属类别的类别稀疏矩阵,即每个类别对应一个类别中心图像,每个类别中心图像对应一个类别字典矩阵。
同理,根据用户输入图像的各列像素得到用户输入图像的用户字典矩阵以及用户稀疏矩阵;其中使用K-SVD分解后得到的字典矩阵的列数等于稀疏矩阵的行数,如图2是本实施例中K-SVD原理示意图。
由于字典矩阵中的每一列都表示一种特征,要想选出更贴近用户输入图像的产品图像,需要根据用户字典矩阵中与各个类别字典矩阵之间的矩阵相似度,根据矩阵相似度判断大数据库的所有类别中,与用户输入图像更贴近的各个类别,因此本实施例分别计算用户字典矩阵中的每个列向量与单个类别字典矩阵的所有列向量之间的余弦相似度,获取用户字典矩阵中每个列向量对应的所有余弦相似度中的最大余弦相似度,预设列相似度阈值为0.8,当最大余弦相似度大于等于预设列相似度阈值时,认为该用户字典矩阵中的列向量与类别字典矩阵中最大余弦相似度对应的列向量相匹配,此时将类别字典矩阵中最大余弦相似度对应的列向量记为一个匹配列;
例如,对于用户字典矩阵中的一个列向量A,计算该列向量A与一个类别字典矩阵中所有列向量之间的余弦相似度,将最大余弦相似度在该类别字典矩阵中对应的列向量记为B,当最大余弦相似度的值大于预设列相似度阈值时,认为用户字典矩阵的列向量A与该类别字典矩阵中的列向量B相匹配,则B即为A的匹配列,否则认为列向量A 在该类别字典矩阵中不存在匹配列;依次判断用户字典矩阵中的各个列向量是否存在匹配列,获取用户字典矩阵中存在匹配列的列向量的个数n,将存在匹配列的列向量的个数n与用户字典矩阵包含的列向量的总个数N之间的比值作为用户字典矩阵与该类别字典矩阵的矩阵相似度,预设矩阵相似度阈值为0.8,当所得矩阵相似度大于0.8时,将该类别字典矩阵所对应的类别作为一个第一类别;重复上述方法,计算用户字典矩阵与各个类别字典矩阵的矩阵相似度,得到各个第一类别,此时,每个第一类别中的图像均与用户输入图像具有较高的相似性。
步骤S004:获取用户字典矩阵的各个特征组合方式以及各个第一类别的类别字典矩阵的各个特征组合方式;对各个第一类别对应的特征组合方式进行更新;根据各个第一类别更新后的特征组合方式得到各个第二类别。
字典矩阵中的列可以表示不同的特征,稀疏矩阵可以表示字典矩阵中不同特征的组合方式,通过不同图像不同特征的组合方式之间的差异表征不同图像的独特性,由于稀疏矩阵的每列中的元素值只有0和非0两种,为了便于描述,本实施例中将所有稀疏矩阵中的非0元素的值修改为1,即本实施例中各个类别系数矩阵以及用户稀疏矩阵中元素值只有0和1两种,然今通过特征组合方式的相近性,将具有相近的特征组合方式的各个第一类别进一步划分,得到各个第二类别。获取各个第二类别的具体过程如下:
首先获取用户字典矩阵中每个列向量的列号,根据用户稀疏矩阵每一列中值为1的元素所处位置,得到用户字典矩阵中不同列向量的特征组合方式。例如:用户字典矩阵的列号分别为d1、d2、d3,对于用户稀疏矩阵中的第一列,假设该列中在第一个和第三个位置上的元素的值为1,则用户字典矩阵的一种特征组合方式为第一列和第三列特征的组合,即[d1,d3]特征组合,如图2所示。根据用户稀疏矩阵每一列中值为1的元素所在位置得到用户字典矩阵的各种特征组合方式,其中用户稀疏矩阵的每一列对应一种特征组合方式;根据各个第一类别的类别稀疏矩阵的每一列中值为1的元素所在位置得到对应类别字典矩阵的各种特征组合方式。
由于各个第一类别的类别字典矩阵均与用户字典矩阵具有较高的矩阵相似度,即各个第一类别中所包含的各个图像均与用户输入图像之间的整体特征较为相似,各个图像与用户输入图像之间的区别在于细节信息的差异性,而不同的特征组合可以表征不同图像的独特性,因此不同的特征组合可以用来表征不同图像的细节信息,为了找到更符合用户心意的产品,需要找到细节最接近用户输入图像的各个产品,也就是根据用户字典矩阵的各个特征组合方式与各个第一类别对应的类别字典矩阵的各个特征组合方式之间的差异进行细节更接近用户输入图像的类别筛选,当某个第一类别对应的一个特征组合方式中,所有元素均为匹配列中的元素时,对该特征组合方式进行保留,否则对其进行剔除,依次对该第一类别对应的各个特征组合方式进行处理,从而保留该类别对应的各个特征组合方式中与用户的特征组合方式相同的特征组合方式,完成对该第一类别对应的特征组合方式的更新,同理,对各个第一类别进行特征组合方式的更新。将具有相同的特征组合方式的第一类别划分为一个第二类别,每个第二类别包含多个第一类别。
步骤S005:获取各个第二类别中所包含的各个图像的纯度,将各个第二类别中纯度最大的图像作为对应第二类别的推荐图像,得到各个推荐图像;
由于每个第二类别对应一种特征组合方式,每个第二类别均可以表示原始图像的整体特征和部分细节特征,为了选择可以表征每个第二类别的图像,选择每种特征组合方式中纯度最大的图像作为此种特征组合方式的代表图像,也是此种特征组合方式对应的第二类别的代表图像,其中纯度最大的图像是指该图像中除了该特征组合方式对应的信息,其它信息很少。例如:对于一幅图像来说,往往具有多种特征,二次元风格特征和仙侠特征,其中当某个风格占主导时,图像中该风格对应的特征纯度较大。
因子分析是一种对多个输入向量的共有信息和独立信息进行提取的方法,由于第二类别中的图像的整体特征相近,特征组合方式也相近,因此共有信息占比越大的图像的纯度越高。计算得到各个第二类别中各个图像的纯度的过程如下:
将各个第二类别中的每张图像转化为向量格式,按照从左到右、从上到下的顺序将一个图像中各个元素的灰度值作为向量的一个维度,由此将一个图像转化为一个向量,然后将各个第二类别的所有向量作为因子分析的输入向量,通过因子分析,得到各个第二类别的公共因子向量和特殊因子向量,公共因子向量是指所有输入向量的共同特征,特殊因子向量是每个输入向量的独立特征,其中,各个第二类别中的各个图像对应一个输入向量,各个第二类别中的每个输入向量对应一个特殊因子向量,各个第二类别的所有的输入向量对应一个公共因子向量。
对于一个第二类别的每个输入向量,为了避免计算熵值时的值域问题,将每个输入向量中的每个元素进行整形化,即选择每个元素值最邻近的整数,得到公共因子向量对应的整数序列,然后计算各个整数序列的熵值,将所得熵值作为对应的公共因子向量的熵值,同理,计算该第二类别对应的各个特殊因子向量的熵值;计算该第二类别的公共因子向量的熵值与公共因子向量熵与每个特殊因子向量熵之和的比值,将所得各个比值作为该第二类别中各个图像的纯度,纯度越大,表示该图像越可以代表该第二类别,依次计算该第二类别中各个图像的纯度,将最大纯度对应的图像作为该第二类别的代表图像;重复该方法,得到各个第二类别的代表图像,后续将各个第二类别的代表图像作为对用户推荐的产品图像,因此各个代表图像也称为各个推荐图像。
步骤S006:根据用户评分对各个推荐图像进行更新,得到目标推荐图像。
将各个推荐图像推荐给用户后,用户对每个推荐图像进行评分,根据用户评分对推荐图像进行更新,具体更新过程如下:
获取用户对各个推荐图像进行评分后以及所有评分的评分均值,例如,用户评分范围为1-10,则最大用户评分为10;将用户评分小于评分均值的推荐图像进行删除,并在后续的推荐图像中不再考虑对应类别。
对于大于等于评分均值的推荐图像,获取各个推荐图像的用户评分与最大用户评分的比值,由于纯度是指图像中某种特征的纯度,用户在评分时也是根据其想要的产品的特征进行评分的,例如:用户理想的图片中有a,b,c三种特征,每种特征的占比分别为:0.6、0.3、0.1,首先给出的推荐图片中有a、b、c特征纯度分别为1的图片,用户给a评分0.6,在所有图片中选择a特征纯度为0.6的图片,给b评分0.3,选择b纯度为0.3的图片,给c评分为0.1,选择c纯度为0.1的图片。由于根据纯度得到的推荐图片更能表示用户对不同特征的需求,例如:用户希望某个图片中a特征占比0.6,b特征占比0.3,c特征占比0.1,外在表现为当某个图片满足要求时,往往会给予接近占比的评分,因此本发明选择各个推荐图像对应的第二类别中纯度等于该比值的各个图像,然后计算这些图像两两之间的图像相似度,并计算各个图像与其他图像之间图像相似度的累加和,将累加和最大的图像作为该第二类别更新后的推荐图像。
通过多次的推荐图像更新和多次用户评分,逐渐对各个推荐图像进行剔除或者更新,当只有一个推荐图像时,该推荐图像即为用户最满意的目标推荐图像。
通过以上步骤,完成对更贴合用户需求的产品推荐。
本发明首先对大数据库中的各个图像进行初步分类,得到大数据库中的各个类别,根据各个类别的类别字典矩阵与用户字典矩阵之间的矩阵相似度得到与用户输入图像整体特征相似的各个第一类别,然后通过各个第一类别的类别稀疏矩阵获取各个第一类别的独特性,从而将各个第一类别的细节信息与用户输入图像的细节信息进行对比,进一步得到细节信息也贴近于用户输入图像的各个第二类别,然后获取各个第二类别的推荐图像;结合用户对各个推荐图像的评分,对推荐图像进行更新,通过多次的推荐的更新,使得用户可以选取到更加符合心意的物品,提高用户体验的同时,增加用户的购买积极性。与传统方法相比,本方法更加具有针对性,可以根据不同用户自身需求,自动推荐更加符合用户需求的产品,进而可以在较短时间内帮每个用户选到更加满意的产品图像。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于物联网的新型智慧城市大数据管理方法,其特征在于,该方法包括以下步骤:
获取用户输入图像;
根据大数据库中各个图像之间的图像相似度对各个图像进行初步分类,得到各个初始类别;根据大数据库中各个图像与各个初始类别之间的相似度得到大数据库的各个类别以及各个类别的类别中心图像;根据各个类别中心图像的各列像素得到各个类别的类别字典矩阵以及类别稀疏矩阵;根据用户输入图像的各列像素得到用户字典矩阵以及用户稀疏矩阵;通过对各个类别字典矩阵与用户字典矩阵之间的列进行匹配操作得到各个第一类别;
根据用户稀疏矩阵中的元素值获取用户字典矩阵的各个特征组合方式;根据各个第一类别对应的类别稀疏矩阵中的元素值获取各个类别字典矩阵的各个特征组合方式;根据用户字典矩阵的各个特征组合方式对各个第一类别对应的各个特征组合方式进行更新;根据各个第一类别更新后的特征组合方式进行划分,得到各个第二类别,每个第二类别中包含多个第一类别;
获取各个第二类别中各个图像的纯度,将各个第二类别中纯度最大的图像作为对应第二类别的推荐图像,得到各个推荐图像;根据用户评分对各个推荐图像进行更新,得到最终的目标推荐图像。
2.根据权利要求1所述的一种基于物联网的新型智慧城市大数据管理方法,其特征在于,所述各个初始类别的获取方法为:
获取大数据库中各个图像的图像熵,计算任意两个图像的图像熵之间差值的绝对值以及所述两个图像的图像熵之间的均值,将所述绝对值与所述均值之间的比值进行负相关映射,将所得映射结果作为所述两个图像之间的图像相似度,并将所述两个图像记为一个匹配对;获取大数据库中各个匹配对的图像相似度;
将大数据库中所有匹配对的图像相似度进行从小到大排列,得到图像相似度序列;获取图像相似度序列中各个图像相似度对应的不同匹配对的个数;当图像相似度序列中首次出现一个图像相似度对应的不同匹配对的个数大于预设匹配对数量时,将该图像相似度对应的各个不同匹配对作为各个初始类别。
3.根据权利要求1所述的一种基于物联网的新型智慧城市大数据管理方法,其特征在于,所述大数据库的各个类别以及各个类别的类别中心图像的获取方法为:
将大数据库中各个图像与各个初始类别所包含的所有图像之间的图像相似度的均值,将所得均值作为所述各个图像与各个初始类别的相似度,将所述各个图像划分到最大相似度对应的初始类别中,依次对大数据库中的各个图像进行划分,得到大数据库中的各个类别;
将计算各个类别中各个图像与其他图像之间图像相似度的累加和,将最大的累加和作为各个类别中各个图像的代表性,将各个类别中代表性最大的图像作为所述各个类别的类别中心图像。
4.根据权利要求1所述的一种基于物联网的新型智慧城市大数据管理方法,其特征在于,所述通过对各个类别字典矩阵与用户字典矩阵之间的列进行匹配操作得到各个第一类别方法为:
计算用户字典矩阵中的各个列向量与单个类别字典矩阵的所有列向量之间的余弦相似度,获取用户字典矩阵中各个列向量对应的所有余弦相似度中的最大余弦相似度,当最大余弦相似度大于等于预设列相似度阈值时,将该类别字典矩阵中最大余弦相似度对应的列向量作为用户字典矩阵中所述各个列向量的匹配列;获取用户字典矩阵中存在匹配列的列向量个数,将所述列向量个数与用户字典矩阵包含的列向量的总个数之间的比值作为用户字典矩阵与该类别字典矩阵的矩阵相似度;
当所得矩阵相似度大于预设矩阵相似度阈值时,将该类别字典矩阵所对应的类别作为一个第一类别;根据用户字典矩阵与各个类别字典矩阵之间的匹配列,得到各个第一类别。
5.根据权利要求1所述的一种基于物联网的新型智慧城市大数据管理方法,其特征在于,所述用户字典矩阵的各个特征组合方式的获取方法为:
获取用户字典矩阵中每个列向量的列号;获取用户稀疏矩阵每一列中所有值为1的元素的各个位置序号;将用户字典矩阵中所有列号存在于所述各个位置序号中的列向量构成了用户字典矩阵的一种特征组合方式;用户稀疏矩阵中包含元素值为1的每一列均对应一种特征组合方式。
6.根据权利要求1所述的一种基于物联网的新型智慧城市大数据管理方法,其特征在于,所述对各个第一类别对应的各个特征组合方式进行更新的方法为:
各个第一类别对应的各个特征组合方式中,如果各个特征组合方式中所有元素均为匹配列中的元素时,对该特征组合方式进行保留,否则对其进行剔除,依次对各个第一类别对应的各个特征组合方式进行保留或剔除处理,保留处理过程和剔除处理过程即为对各个第一类别对应的各个特征组合方式进行更新的过程。
7.根据权利要求1所述的一种基于物联网的新型智慧城市大数据管理方法,其特征在于,所述各个第二类别的获取方法为:
将具有完全相同的特征组合方式的各个第一类别划分为一组,每一组对应一个第二类别,每个第二类别中包含多个第一类别。
8.根据权利要求1所述的一种基于物联网的新型智慧城市大数据管理方法,其特征在于,所述各个第二类别中各个图像的纯度的获取方法为:
对各个第二类别中各个图像转化为向量格式,将每个图像对应的向量格式记为一个输入向量,使用因子分析对各个第二类别中的所有输入向量下进行处理,得到各个第二类别的公共因子向量以及各个特殊因子向量,其中,每个输入向量对应一个特殊因子向量;
分别对公共因子向量以及各个特殊因子向量进行整形化,获取整形化后的公共因子向量的熵值以及各个特殊因子向量的熵值,将公共因子向量对应的熵值与公共因子向量与各个特殊因子向量熵值之和作比,所得比值作为所述各个第二类别中各个图像的纯度。
9.根据权利要求1所述的一种基于物联网的新型智慧城市大数据管理方法,其特征在于,所述根据用户评分对各个推荐图像进行更新,得到目标推荐图像的方法为:
获取各个推荐图像的用户评分与最大用户评分之间的比值,以及各个用户评分的平均值,将用户评分小于所述平均值的推荐图像进行剔除;对于用户评分大于等于所述平均值的各个推荐图像进行更新,即选取此时各个推荐图像对应的第二类别中纯度值等于所述比值的各个图像,计算所述各个图像与所述第二类别中其他图像之间图像相似度的累加和,将最大累加和对应的图像作为所述第二类别更新后的推荐图像;重复此操作,当只有一个推荐图像时,该推荐图像即为目标推荐图像。
CN202310076587.3A 2023-02-08 2023-02-08 一种基于物联网的新型智慧城市大数据管理方法 Active CN115796980B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310076587.3A CN115796980B (zh) 2023-02-08 2023-02-08 一种基于物联网的新型智慧城市大数据管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310076587.3A CN115796980B (zh) 2023-02-08 2023-02-08 一种基于物联网的新型智慧城市大数据管理方法

Publications (2)

Publication Number Publication Date
CN115796980A true CN115796980A (zh) 2023-03-14
CN115796980B CN115796980B (zh) 2023-04-25

Family

ID=85430303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310076587.3A Active CN115796980B (zh) 2023-02-08 2023-02-08 一种基于物联网的新型智慧城市大数据管理方法

Country Status (1)

Country Link
CN (1) CN115796980B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116579588A (zh) * 2023-07-12 2023-08-11 江苏慧远智能科技有限公司 一种基于路况特征抽取的运输任务智能分配方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170031918A1 (en) * 2015-07-27 2017-02-02 Style Hunter LLC Techniques for graph-based recommendations
EP3166020A1 (en) * 2015-11-06 2017-05-10 Thomson Licensing Method and apparatus for image classification based on dictionary learning
CN107274462A (zh) * 2017-06-27 2017-10-20 哈尔滨理工大学 基于熵和几何方向的分类多字典学习磁共振图像重建方法
CN110705636A (zh) * 2019-09-29 2020-01-17 重庆邮电大学 一种基于多样本字典学习和局部约束编码的图像分类方法
CN112115961A (zh) * 2020-07-02 2020-12-22 河海大学 一种基于稀疏图正则化的高光谱遥感影像分类方法
CN113269223A (zh) * 2021-03-16 2021-08-17 重庆市地理信息和遥感应用中心 一种基于空间文化模因分析的城市风格分类方法
CN114511718A (zh) * 2022-04-19 2022-05-17 山东诚祥建设集团股份有限公司 一种建筑施工用物料智能管理方法及系统
CN114661988A (zh) * 2022-03-17 2022-06-24 平安国际智慧城市科技股份有限公司 基于图像识别的推荐方法、装置、设备及存储介质
CN114741581A (zh) * 2022-04-20 2022-07-12 平安科技(深圳)有限公司 一种图像分类方法、装置、计算机设备及介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170031918A1 (en) * 2015-07-27 2017-02-02 Style Hunter LLC Techniques for graph-based recommendations
EP3166020A1 (en) * 2015-11-06 2017-05-10 Thomson Licensing Method and apparatus for image classification based on dictionary learning
CN107274462A (zh) * 2017-06-27 2017-10-20 哈尔滨理工大学 基于熵和几何方向的分类多字典学习磁共振图像重建方法
CN110705636A (zh) * 2019-09-29 2020-01-17 重庆邮电大学 一种基于多样本字典学习和局部约束编码的图像分类方法
CN112115961A (zh) * 2020-07-02 2020-12-22 河海大学 一种基于稀疏图正则化的高光谱遥感影像分类方法
CN113269223A (zh) * 2021-03-16 2021-08-17 重庆市地理信息和遥感应用中心 一种基于空间文化模因分析的城市风格分类方法
CN114661988A (zh) * 2022-03-17 2022-06-24 平安国际智慧城市科技股份有限公司 基于图像识别的推荐方法、装置、设备及存储介质
CN114511718A (zh) * 2022-04-19 2022-05-17 山东诚祥建设集团股份有限公司 一种建筑施工用物料智能管理方法及系统
CN114741581A (zh) * 2022-04-20 2022-07-12 平安科技(深圳)有限公司 一种图像分类方法、装置、计算机设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116579588A (zh) * 2023-07-12 2023-08-11 江苏慧远智能科技有限公司 一种基于路况特征抽取的运输任务智能分配方法
CN116579588B (zh) * 2023-07-12 2023-09-19 江苏慧远智能科技有限公司 一种基于路况特征抽取的运输任务智能分配方法

Also Published As

Publication number Publication date
CN115796980B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
Vasconcelos Image indexing with mixture hierarchies
CA3066029A1 (en) Image feature acquisition
CN112417306B (zh) 基于知识图谱的推荐算法性能优化的方法
CN109033172B (zh) 一种深度学习与近似目标定位的图像检索方法
CN110866896B (zh) 基于k-means与水平集超像素分割的图像显著性目标检测方法
CN108563690B (zh) 一种基于面向对象聚类的协同过滤推荐方法
CN109684506B (zh) 一种视频的标签化处理方法、装置和计算设备
Champ et al. A comparative study of fine-grained classification methods in the context of the LifeCLEF plant identification challenge 2015
CN103186538A (zh) 一种图像分类方法和装置、图像检索方法和装置
CN109934258B (zh) 特征加权和区域整合的图像检索方法
CN108846047A (zh) 一种基于卷积特征的图片检索方法及系统
CN115796980A (zh) 一种基于物联网的新型智慧城市大数据管理方法
CN108427745A (zh) 基于优化的视觉词典与自适应软分配的图像检索方法
CN110188625B (zh) 一种基于多特征融合的视频精细结构化方法
CN111859004A (zh) 检索图像的获取方法、装置、设备及可读存储介质
CN109886281A (zh) 一种基于四元数超限学习机彩色图像识别方法
CN116541607A (zh) 基于商品检索数据分析的智能推荐方法
JP2002183171A (ja) 文書データ・クラスタリングシステム
CN114092819B (zh) 一种图像分类方法及装置
CN113011444B (zh) 一种基于神经网络频域注意力机制的图像识别方法
CN106951501B (zh) 一种基于多图匹配的三维模型检索方法
CN113449200A (zh) 物品推荐方法、装置及计算机存储介质
JP2004192555A (ja) 情報管理方法、情報管理装置及び情報管理プログラム
Gorisse et al. IRIM at TRECVID 2010: semantic indexing and instance search
CN110796134A (zh) 一种强噪声复杂背景图像中的汉字组词方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A New Smart City Big Data Management Method Based on the Internet of Things

Effective date of registration: 20230727

Granted publication date: 20230425

Pledgee: Ping An Bank Co.,Ltd. Dongguan Branch

Pledgor: GUANGDONG SHENCHUANG PHOTOELECTRIC TECHNOLOGY CO.,LTD.

Registration number: Y2023980050003

PE01 Entry into force of the registration of the contract for pledge of patent right