CN109242030A - 画单生成方法及装置,电子设备,计算机可读存储介质 - Google Patents
画单生成方法及装置,电子设备,计算机可读存储介质 Download PDFInfo
- Publication number
- CN109242030A CN109242030A CN201811105767.5A CN201811105767A CN109242030A CN 109242030 A CN109242030 A CN 109242030A CN 201811105767 A CN201811105767 A CN 201811105767A CN 109242030 A CN109242030 A CN 109242030A
- Authority
- CN
- China
- Prior art keywords
- paintings
- data
- feature vector
- clustering algorithm
- cluster result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23211—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with adaptive number of clusters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种画单生成方法及装置,电子设备,计算机可读存储介质。一种画单生成方法包括:获取画作数据和用户行为数据;利用预先设置的聚类算法组对所述画作数据和所述用户行为数据进行聚类,得到聚类结果;根据所述聚类结果生成画单。可见,本实施例中,由于增加了用户行为数据,可以基于用户的喜好来确定画单,有利于提高推荐效率。本实施例中利用(包括多个聚类算法的)聚类算法组对画作数据进行聚类,提高生成画单的效率和准确率。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种画单生成方法及装置,电子设备,计算机可读存储介质。
背景技术
画作资源日趋丰富,现有的推荐系统中针对画作间的关联度可以得到画单,并然后向用户推荐画单,从而可以提升推荐效率。另外,对于线上的画作欣赏与交易平台以及线下的画作展览,生成画单可有效地确立主题和展区,可以对平台的结构和展览的流程起到指导性作用。
现在的画单生成方法,需要人工检阅与标注主题(或关键词),然后可以对标注内容进行处理,从而得到画单。然而,由于画作信息包括图像、文本、矩阵等多种数据,导致生成画单的难度较大。
发明内容
本发明提供一种画单生成方法及装置,电子设备,计算机可读存储介质,以解决相关技术中由于画作信息复杂而导致画单生成难度较大的问题。
根据本发明实施例的第一方面,提供一种画单生成方法,包括:
获取画作数据和用户行为数据;
利用预先设置的聚类算法组对所述画作数据和所述用户行为数据进行聚类,得到聚类结果;
根据所述聚类结果生成画单。
可选地,所述聚类算法组至少包括多个采用不同原理的聚类算法和对所述采用不同原理的聚类算法的聚类结果进行融合的融合聚类算法,利用预先设置的聚类算法组对所述画作数据和所述用户行为数据进行聚类,得到聚类结果包括:
对所述画作数据和所述用户行为数据进行处理,得到降维后的特征向量;
针对所述多个采用不同原理的聚类算法中的每一个算法,将所述降维后的特征向量输入到所述聚类算法,得到用于表征画作间关联关系的中间聚类结果;
将所述每个聚类算法的中间聚类结果输入到所述融合聚类算法,得到最终的聚类结果。
可选地,所述多个采用不同原理的聚类算法至少包括以下两种:
基于划分的聚类、基于层次的聚类、基于密度的聚类和基于模型的聚类。
可选地,对所述画作数据和所述用户行为数据进行处理,得到降维后的特征向量包括:
根据所述画作数据和所述用户行为数据提取出基于物品的特征向量;
融合所述基于物品的特征向量,得到融合特征向量;
利用主成份分析法将所述融合特征向量转换为降维后的特征向量。
可选地,根据所述画作数据和所述用户行为数据提取出基于物品的特征向量包括:
针对所述画作数据中的画作图像信息,利用栈式自编码器逐层提取特征,并将所提取的特征进行降维处理,得到所述画作数据对应的高阶特征向量;
针对所述画作数据中的画作特征信息,利用独热编码对类别特征进行编码,并对所述数值特征进行归一化处理,得到第一画作特征向量;
针对所述用户行为数据中的结构化的行为数据,利用交替最小二乘法分解所述结构化的行为数据,得到第二画作特征向量;
针对所述用户行为数据中的非结构化的行为数据,利用文档主题生成模型提取所述非结构化的行为数据中隐含主题概率向量;
所述高阶特征向量、所述第一画作特征向量、所述第二画作特征向量和所述隐含主题概率向量为所述基于物品的特征向量。
可选地,将所述每个聚类算法的中间聚类结果输入到所述融合聚类算法,得到最终的聚类结果包括:
建立画作集间的两两关联矩阵,所述关联矩阵中各元素的初值为0;
利用所述融合聚类算法依次扫描所述多个中间聚类结果中各中间聚类结果;
若所述各中间聚类结果中存在两幅画作被划分至同一个类簇中,则将所述两幅画作的关联矩阵中对应元素值增加1;
在完成扫描后,若所述关联矩阵中各元素值大于预先设置的元素值阈值,则所述两幅画作划分到同一类簇中,得到最终的聚类结果。
可选地,所述画作数据至少包括:画作图像信息和画作特征信息;其中,所述画作特征信息包括以下至少一种:类别、主题、尺寸、作者、年份和材质。
可选地,所述用户行为数据至少包括结构化的行为数据和非结构化的行为数据;结构化的行为数据包括以下至少一种:购买行为、评分记录、浏览历史和推送记录;非结构化的行为数据包括以下至少一种:搜索内容、评论及分享内容。
根据本发明实施例的第二方面,提供一种画单生成装置,包括输入层、聚类算法层和输出层;其中,
所述输入层用于获取画作数据和用户行为数据;
所述聚类算法层用于利用预先设置的聚类算法组对所述画作数据和所述用户行为数据进行聚类,得到聚类结果;
所述输出层用于根据所述聚类结果生成画单。
可选地,所述聚类算法层包括特征向量获取模块、中间聚类结果获取模块和融合聚类结果获取模块;
所述特征向量获取模块,用于对所述画作数据和所述用户行为数据进行处理,得到降维后的特征向量;
所述中间聚类结果获取模块,用于针对所述多个采用不同原理的聚类算法中的每一个算法,将所述降维后的特征向量输入到所述聚类算法,得到用于表征画作间关联关系的中间聚类结果;
所述融合聚类结果获取模块,用于将所述每个聚类算法的中间聚类结果输入到所述融合聚类算法,得到最终的聚类结果。
可选地,所述特征向量获取模块包括:
物品特征向量提取单元,用于根据所述画作数据和所述用户行为数据提取出基于物品的特征向量;
融合特征向量获取单元,用于融合所述基于物品的特征向量,得到融合特征向量;
特征向量转换单元,用于利用主成份分析法将所述融合特征向量转换为降维后的特征向量。
可选地,所述物品特征向量提取单元包括:
高阶特征向量获取子单元,用于针对所述画作数据中的画作图像信息,利用栈式自编码器逐层提取特征,并将所提取的特征进行降维处理,得到所述画作数据对应的高阶特征向量;
第一画作向量获取子单元,用于针对所述画作数据中的画作特征信息,利用独热编码对类别特征进行编码,并对所述数值特征进行归一化处理,得到第一画作特征向量;
第二画作向量获取子单元,用于针对所述用户行为数据中的结构化的行为数据,利用交替最小二乘法分解所述结构化的行为数据,得到第二画作特征向量;
隐含主题概率向量获取子单元,用于针对所述用户行为数据中的非结构化的行为数据,利用文档主题生成模型提取所述非结构化的行为数据中隐含主题概率向量;
所述高阶特征向量、所述第一画作特征向量、所述第二画作特征向量和所述隐含主题概率向量为所述基于物品的特征向量。
可选地,所述融合聚类结果获取模块包括:
关联矩阵建立单元,用于建立画作集间的两两关联矩阵,所述关联矩阵中各元素的初值为0;
中间聚类结果扫描单元,用于利用所述融合聚类算法依次扫描所述多个中间聚类结果中各中间聚类结果;
关联矩阵元素值调整单元,用于在所述各中间聚类结果中存在两幅画作被划分至同一个类簇中时,调整所述两幅画作的关联矩阵中对应的元素值;所述两幅画作的关联矩阵预先设置;
画作划分单元,用于在完成扫描且所述关联矩阵中各元素值大于预先设置的元素值阈值时,所述两幅画作划分到同一类簇中,得到最终的聚类结果。
根据本发明实施例的第三方面,提供一种电子设备,包括第二方面所述的画单生成装置。
根据本发明实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现第一方面所述方法的步骤。
可见,本实施例中,由于增加了用户行为数据,可以基于用户的喜好来确定画单,有利于提高推荐效率。本实施例中利用聚类算法组(包括多个聚类算法的)对画作数据进行聚类,提高生成画单的效率和准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是本发明实施例示出的一种画单生成方法的流程示意图;
图2是本发明实施例示出的一种画单生成方法的数据流向图;
图3是本发明实施例示出的获取降维后的特征向量的流程示意图;
图4是本发明实施例示出的获取最终的聚类结果的流程示意图;
图5是本发明实施例示出的融合中间聚类结果得到最终聚类结果的流程示意图;
图6~图10是本发明实施例示出的一种画单生成装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
画作资源日趋丰富,现有的推荐系统中针对画作间的关联度可以得到画单,并然后向用户推荐画单,从而可以提升推荐效率。另外,对于线上的画作欣赏与交易平台以及线下的画作展览,生成画单可有效地确立主题和展区,可以对平台的结构和展览的流程起到指导性作用。
现在的画单生成方法,需要人工检阅与标注主题(或关键词),然后可以对标注内容进行处理,从而得到画单。然而,由于画作信息包括图像、文本、矩阵等多种数据,导致生成画单的难度较大。
为此,本发明实施例提供了一种画单生成方法,其构思之一在于,本实施例中除了把能够反映画作的特征的画作数据作为输入数据;针对画作数据,至少包括:画作图像信息和画作特征信息。画作图像信息即画作图像的内容;画作特征信息包括以下至少一种:类别、主题、尺寸、作者、年份和材质。
本实施例中还获取用户行为数据作为输入数据;针对用户行为数据,至少包括:结构化的行为数据和非结构化的行为数据。其中,结构化的行为数据是指以矩阵形式等方式存储的行为数据,例如可以包括以下至少一种:购买行为、评分记录、浏览历史和推送记录;非结构化的行为数据是指以文本形式等方式存储的行为数据,例如可以包括以下至少一种:搜索内容、评论及分享内容。这样,基于上述输入数据,本实施例中一方面可以通过画作数据反应出画作的自身特征,另一方面可以通过用户行为数据可以反应出用户喜好的主观特征。换言之,本实施例中综合考虑画作和用户喜好,从而有利于匹配出更符合各用户喜好的画作清单。
然后,本实施例提供的一种画单生成方法,其构思之二在于,预先设置了聚类算法组,该聚类算法组至少包括多个采用不同原理的聚类算法和对采用不同原理的聚类算法的聚类结果进行融合的融合聚类算法。其中,多个采用不同原理的聚类算法至少包括以下两种:基于划分的聚类、基于层次的聚类、基于密度的聚类和基于模型的聚类。最后,本实施例中根据聚类算法组得到聚类结果可以生成画单,以提供了用户。这样,本实施例中可以解决相关技术中单一聚类算法无法聚类出画单,仅能采用人工标注,导致画单生成难度比较大的问题。换言之,本实施例中通过聚类算法组可以降低画单生成难度,提升生成效率。
至此,本实施例中,由于增加了用户行为数据,可以基于用户的喜好来确定画单,有利于提高推荐效率。并且,本实施例中利用(包括多个聚类算法的)聚类算法组对画作数据进行聚类,提高生成画单的效率和准确率。
图1是本发明实施例示出的一种画单生成方法的流程示意图,可以应用于如个人计算机、智能手机等电子设备,为方便描述,后续以电子设备为执行该画单生成方法的主体进行说明。图2是本发明实施例示出的一种画单生成方法的数据流向图。参见图1和图2,一种画单生成方法包括步骤101~步骤103,其中:
101,获取画作数据和用户行为数据。
参见图2,本实施例中,电子设备可以包括输入层,用于获取画作数据和用户行为数据。该输入层可以为与外部服务器连接的通信接口,还可以为指定位置(例如存储器、缓存或者移动硬盘等)。
在一实施例中,电子设备可以获取画作数据。若画作数据存储在指定位置,电子设备可以从指定位置获取画作数据。若画作数据存储在服务器,电子设备可以通过与服务器通信,从服务器下载画作数据。
在一实施例中,电子设备还可以获取用户行为数据。若用户行为数据和画作数据存储在相同的位置,例如指定位置或者服务器,则可以在获取画作数据的同时获取到各画作的用户行为数据。若画作数据和用户行为数据分开,例如画作数据在服务器而用户行为数据在电子设备,则可以基于画作数据的标识对应的位置获取到用户行为数据。
102,利用预先设置的聚类算法组对所述画作数据和所述用户行为数据进行聚类,得到聚类结果。
参见图2,本实施例中,电子设备可以特征处理层和聚类算法层。其中,特征处理层,特征处理层用于从画作数据和用户行为数据中提取出降维后的特征向量,而述聚类算法层用于利用预先设置的聚类算法组对所述画作数据和所述用户行为数据进行聚类,得到聚类结果。其中降维后的特征向量为一组线性独立且降维后的特征向量,后续会进行描述。
本实施例中,聚类算法组可以预先设置在电子设备中的指定位置,还可以存储在服务器。
电子设备可以在获取画作数据和用户行为数据之前、之后或者同时调用聚类算法组,由聚类算法组对画作数据和用户行为数据进行聚类,从而可以得到聚类结果。
在一实施例中,为方便更好的聚类,参见图3,电子设备先处理画作数据和用户行为数据,以得到基于物品的特征向量(对应步骤301),包括:
针对画作数据中的画作图像信息,利用栈式自编码器(Stacked Auto-Encoder)逐层提取特征,并将所提取的特征进行降维处理,得到所述画作数据对应的高阶特征向量。此过程实现了将高像素的画作图像数据转化成一系列简单的高阶特征向量。
针对画作数据中的画作特征信息,利用独热编码(One-Hot Encoder)对类别特征进行编码,并对数值特征进行归一化处理,得到第一画作特征向量。
针对用户行为数据中的结构化的行为数据,利用交替最小二乘法(AlternatingLeast Squares)分解结构化的行为数据,如下式所示:
式中,m为用户数量,n为画作数量,k为隐含特征数量,取In×k作为表征用户购买及评分行为相似度的画作特征向量,Um×k表征表示用户-隐含特征,即用户偏好。本实施例中,由于隐含特征为这个维度的Um×k和In×k共用,所以在In×k中,在两幅画作的特征向量相似度较高,说明对应的用户偏好向量相似度也比较高。
本实施例中,由于A是个稀疏矩阵,而交替最小二乘法的目的是为了推测缺失项,其思路是找到U和I来近似逼近A(算误差的时候只取所有非空项),通过迭代训练降低误差,最终找到最优解。由于误差是有下界的,所以公式中采用约等于号。
针对用户行为数据中的非结构化的行为数据,利用文档主题生成模型(LatentDirichlet Allocation)提取非结构化的行为数据中隐含主题概率向量。
需要说明的是,本实施例中,高阶特征向量、第一画作特征向量、第二画作特征向量和隐含主题概率向量统称为基于物品的特征向量。
本实施例中,继续参见图3,电子设备将之前获取的基于物品的特征向量进行融合,可以得到融合特征向量(对应步骤302)。例如,将多个基于特征的特征向量拼接为一个维度相同,但是包含元素数量不同的向量,如:对于画作p,假设第一画作特征向量为[f1,…,fi],第二画作特征向量为[fi+1,…,fj],则这两个向量的融合特征向量即为[f1,…,fi,fi+1,…,fj],以此类推至多个向量的情况。然后,电子设备利用主成份分析法将融合特征向量转换为降维后的特征向量(对应步骤303)。
本实施例中,参见图4,电子设备在获取到降维后的特征向量(对应步骤401)后,将降维后的特征向量依次输入到聚类算法组中多个采用不同原理的聚类算法,各聚类算法会得到一个中间聚类结果(对应步骤402),包括:
(1)基于划分的聚类算法,如K-means算法或K-medoids算法:将降维后的特征向量中样本集取为N个类簇。首先,先挑选N个样本作为初始中心,然后,采用启发式算法将样本集划分入最近的中心,调整中心位置,反复迭代重置,直到达到“类内样本距离足够近,类间样本距离足够远”的效果,得到一个中间聚类结果。
(2)基于层次的聚类算法,如BIRCH算法:采用自底向上的方法,初始每个样本自成一类。每次通过合并最相似的类来形成上一层的聚类,直到满足终止条件(如剩余N个类簇)结束。或者,采用自顶向下的方法,初始所有样本包含在一个类中,每次将父类分裂为若干子聚类,直到满足终止条件结束。这样,可以得到一个中间聚类结果。
(3)基于密度的聚类,如DBSCAN算法或OPTICS算法:定义领域半径和密度两个参数,然后采用启发式算法遍历样本集,当某个样本邻近区域的密度(一般指落在领近区域内的其他样本数量)超过某个阈值,则将这些样本聚类,最后形成密度集中的若干类簇,得到一个中间聚类结果。
(4)基于模型的聚类,如GMM算法或SOM算法:假设样本集是根据潜在的概率分布生成的,采用混合概率生成模型寻找样本集针对该模型的最佳拟合,最终满足同一类的样本集属于同一种概率分布。
这样,电子设备可以得到与聚类算法组中多个采用不同原理的聚类算法中聚类算法数量相同的中间聚类结果。
之后,电子设备将多个中间聚类结果输入到聚类算法组中的融合聚类算法,得到最终的聚类结果(对应步骤403)。参见图5,聚类过程包括:
501,建立画作集中任意两幅画作之间的两两关联矩阵C_(n×n),各元素初始值设为0,n表示参与生成画单的画作数量。
502,依次扫描各中间聚类结果,若画作Ii、Ij在某个中间聚类结果中被划分到同一个类簇中,则关联矩阵中相应位置C_(i,j)的值加1。
503,所有中间聚类结果扫描结束后,依次统计关联矩阵C_(n×n)中的每个元素最终值。若最终值大于预先设置的元素值阈值,则将该元素对应的两帧画作划分到同一类簇中。
504,根据步骤503的类簇划分结果得到最终的聚类结果。
103,根据所述聚类结果生成画单。
本实施例中,电子设备的输出层根据最终端的聚类结果生成画单,同聚类结果中同一个类簇内的画作集作为一个画单。
至此,本实施例中,由于增加了用户行为数据,可以基于用户的喜好来确定画单,有利于提高推荐效率。并且,本实施例中利用(包括多个聚类算法的)聚类算法组对画作数据进行聚类,提高生成画单的效率和准确率。
图6是本发明实施例示出的一种画单生成装置,参见图6,包括输入层601、聚类算法层602和输出层603;其中,
所述输入层601用于获取画作数据和用户行为数据;
所述聚类算法层602用于利用预先设置的聚类算法组对所述画作数据和所述用户行为数据进行聚类,得到聚类结果;
所述输出层603用于根据所述聚类结果生成画单。
在一实施例中,在图6所示画单生成装置的基础上,参见图7,所述聚类算法层602包括特征向量获取模块701、中间聚类结果获取模块702和融合聚类结果获取模块703;
所述特征向量获取模块701,用于对所述画作数据和所述用户行为数据进行处理,得到降维后的特征向量;
所述中间聚类结果获取模块702,用于针对所述多个采用不同原理的聚类算法中的每一个算法,将所述降维后的特征向量输入到所述聚类算法,得到用于表征画作间关联关系的中间聚类结果;
所述融合聚类结果获取模块703,用于将所述每个聚类算法的中间聚类结果输入到所述融合聚类算法,得到最终的聚类结果。
在一实施例中,在图7所示画单生成装置的基础上,参见图8,所述特征向量获取模块701包括:
物品特征向量提取单元801,用于根据所述画作数据和所述用户行为数据提取出基于物品的特征向量;
融合特征向量获取单元802,用于融合所述基于物品的特征向量,得到融合特征向量;
特征向量转换单元803,用于利用主成份分析法将所述融合特征向量转换为降维后的特征向量。
在一实施例中,在图8所示画单生成装置的基础上,参见图9,所述物品特征向量提取单元801包括:
高阶特征向量获取子单元901,用于针对所述画作数据中的画作图像信息,利用栈式自编码器逐层提取特征,并将所提取的特征进行降维处理,得到所述画作数据对应的高阶特征向量;
第一画作向量获取子单元902,用于针对所述画作数据中的画作特征信息,利用独热编码对类别特征进行编码,并对所述数值特征进行归一化处理,得到第一画作特征向量;
第二画作向量获取子单元903,用于针对所述用户行为数据中的结构化的行为数据,利用交替最小二乘法分解所述结构化的行为数据,得到第二画作特征向量;
隐含主题概率向量获取子单元94,用于针对所述用户行为数据中的非结构化的行为数据,利用文档主题生成模型提取所述非结构化的行为数据中隐含主题概率向量;
所述高阶特征向量、所述第一画作特征向量、所述第二画作特征向量和所述隐含主题概率向量为所述基于物品的特征向量。
在一实施例中,在图7所示画单生成装置的基础上,参见图10,所述融合聚类结果获取模块703包括:
关联矩阵建立单元1001,用于建立画作集间的两两关联矩阵,所述关联矩阵中各元素的初值为0;
中间聚类结果扫描单元1002,用于利用所述融合聚类算法依次扫描所述多个中间聚类结果中各中间聚类结果;
关联矩阵元素值调整单元1003,用于在所述各中间聚类结果中存在两幅画作被划分至同一个类簇中时,调整所述两幅画作的关联矩阵中对应的元素值;所述两幅画作的关联矩阵预先设置;
画作划分单元,用于在完成扫描且所述关联矩阵中各元素值大于预先设置的元素值阈值时,所述两幅画作划分到同一类簇中,得到最终的聚类结果。
本发明实施例还提供了一种电子设备,包括图7~图10所述的画单生成装置。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现图1~图5所述方法的步骤。
需要说明的是,计算机可读存储介质可以应用于成像设备、电子装置等,技术人员可以根据具体场景进行选择,在此不作限定。
在本发明中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上,除非另有明确的限定。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (15)
1.一种画单生成方法,其特征在于,包括:
获取画作数据和用户行为数据;
利用预先设置的聚类算法组对所述画作数据和所述用户行为数据进行聚类,得到聚类结果;
根据所述聚类结果生成画单。
2.根据权利要求1所述的画单生成方法,其特征在于,所述聚类算法组至少包括多个采用不同原理的聚类算法和对所述采用不同原理的聚类算法的聚类结果进行融合的融合聚类算法,利用预先设置的聚类算法组对所述画作数据和所述用户行为数据进行聚类,得到聚类结果包括:
对所述画作数据和所述用户行为数据进行处理,得到降维后的特征向量;
针对所述多个采用不同原理的聚类算法中的每一个算法,将所述降维后的特征向量输入到所述聚类算法,得到用于表征画作间关联关系的中间聚类结果;
将所述每个聚类算法的中间聚类结果输入到所述融合聚类算法,得到最终的聚类结果。
3.根据权利要求2所述的画单生成方法,其特征在于,所述多个采用不同原理的聚类算法至少包括以下两种:
基于划分的聚类、基于层次的聚类、基于密度的聚类和基于模型的聚类。
4.根据权利要求2所述的画单生成方法,其特征在于,对所述画作数据和所述用户行为数据进行处理,得到降维后的特征向量包括:
根据所述画作数据和所述用户行为数据提取出基于物品的特征向量;
融合所述基于物品的特征向量,得到融合特征向量;
利用主成份分析法将所述融合特征向量转换为降维后的特征向量。
5.根据权利要求4所述的画单生成方法,其特征在于,根据所述画作数据和所述用户行为数据提取出基于物品的特征向量包括:
针对所述画作数据中的画作图像信息,利用栈式自编码器逐层提取特征,并将所提取的特征进行降维处理,得到所述画作数据对应的高阶特征向量;
针对所述画作数据中的画作特征信息,利用独热编码对类别特征进行编码,并对所述数值特征进行归一化处理,得到第一画作特征向量;
针对所述用户行为数据中的结构化的行为数据,利用交替最小二乘法分解所述结构化的行为数据,得到第二画作特征向量;
针对所述用户行为数据中的非结构化的行为数据,利用文档主题生成模型提取所述非结构化的行为数据中隐含主题概率向量;
所述高阶特征向量、所述第一画作特征向量、所述第二画作特征向量和所述隐含主题概率向量为所述基于物品的特征向量。
6.根据权利要求2所述的画单生成方法,其特征在于,将所述每个聚类算法的中间聚类结果输入到所述融合聚类算法,得到最终的聚类结果包括:
建立画作集间的两两关联矩阵,所述关联矩阵中各元素的初值为0;
利用所述融合聚类算法依次扫描所述多个中间聚类结果中各中间聚类结果;
若所述各中间聚类结果中存在两幅画作被划分至同一个类簇中,则将所述两幅画作的关联矩阵中对应元素值增加1;
在完成扫描后,若所述关联矩阵中各元素值大于预先设置的元素值阈值,则所述两幅画作划分到同一类簇中,得到最终的聚类结果。
7.根据权利要求1所述的画单生成方法,其特征在于,所述画作数据至少包括:画作图像信息和画作特征信息;其中,所述画作特征信息包括以下至少一种:类别、主题、尺寸、作者、年份和材质。
8.根据权利要求1所述的画单生成方法,其特征在于,所述用户行为数据至少包括结构化的行为数据和非结构化的行为数据;其中,
结构化的行为数据包括以下至少一种:购买行为、评分记录、浏览历史和推送记录;
非结构化的行为数据包括以下至少一种:搜索内容、评论及分享内容。
9.一种画单生成装置,其特征在于,包括输入层、聚类算法层和输出层;其中,
所述输入层用于获取画作数据和用户行为数据;
所述聚类算法层用于利用预先设置的聚类算法组对所述画作数据和所述用户行为数据进行聚类,得到聚类结果;
所述输出层用于根据所述聚类结果生成画单。
10.根据权利要求9所述的画单生成装置,其特征在于,所述聚类算法层包括特征向量获取模块、中间聚类结果获取模块和融合聚类结果获取模块;
所述特征向量获取模块,用于对所述画作数据和所述用户行为数据进行处理,得到降维后的特征向量;
所述中间聚类结果获取模块,用于针对所述多个采用不同原理的聚类算法中的每一个算法,将所述降维后的特征向量输入到所述聚类算法,得到用于表征画作间关联关系的中间聚类结果;
所述融合聚类结果获取模块,用于将所述每个聚类算法的中间聚类结果输入到所述融合聚类算法,得到最终的聚类结果。
11.根据权利要求10所述的画单生成装置,其特征在于,所述特征向量获取模块包括:
物品特征向量提取单元,用于根据所述画作数据和所述用户行为数据提取出基于物品的特征向量;
融合特征向量获取单元,用于融合所述基于物品的特征向量,得到融合特征向量;
特征向量转换单元,用于利用主成份分析法将所述融合特征向量转换为降维后的特征向量。
12.根据权利要求11所述的画单生成装置,其特征在于,所述物品特征向量提取单元包括:
高阶特征向量获取子单元,用于针对所述画作数据中的画作图像信息,利用栈式自编码器逐层提取特征,并将所提取的特征进行降维处理,得到所述画作数据对应的高阶特征向量;
第一画作向量获取子单元,用于针对所述画作数据中的画作特征信息,利用独热编码对类别特征进行编码,并对所述数值特征进行归一化处理,得到第一画作特征向量;
第二画作向量获取子单元,用于针对所述用户行为数据中的结构化的行为数据,利用交替最小二乘法分解所述结构化的行为数据,得到第二画作特征向量;
隐含主题概率向量获取子单元,用于针对所述用户行为数据中的非结构化的行为数据,利用文档主题生成模型提取所述非结构化的行为数据中隐含主题概率向量;
所述高阶特征向量、所述第一画作特征向量、所述第二画作特征向量和所述隐含主题概率向量为所述基于物品的特征向量。
13.根据权利要求10所述的画单生成装置,其特征在于,所述融合聚类结果获取模块包括:
关联矩阵建立单元,用于建立画作集间的两两关联矩阵,所述关联矩阵中各元素的初值为0;
中间聚类结果扫描单元,用于利用所述融合聚类算法依次扫描所述多个中间聚类结果中各中间聚类结果;
关联矩阵元素值调整单元,用于在所述各中间聚类结果中存在两幅画作被划分至同一个类簇中时,调整所述两幅画作的关联矩阵中对应的元素值;所述两幅画作的关联矩阵预先设置;
画作划分单元,用于在完成扫描且所述关联矩阵中各元素值大于预先设置的元素值阈值时,所述两幅画作划分到同一类簇中,得到最终的聚类结果。
14.一种电子设备,其特征在于,包括权利要求9~13任一项所述的画单生成装置。
15.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1~8任一项所述方法的步骤。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811105767.5A CN109242030A (zh) | 2018-09-21 | 2018-09-21 | 画单生成方法及装置,电子设备,计算机可读存储介质 |
US16/623,327 US20210295109A1 (en) | 2018-09-21 | 2019-05-10 | Method and device for generating painting display sequence, and computer storage medium |
PCT/CN2019/086426 WO2020057145A1 (en) | 2018-09-21 | 2019-05-10 | Method and device for generating painting display sequence, and computer storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811105767.5A CN109242030A (zh) | 2018-09-21 | 2018-09-21 | 画单生成方法及装置,电子设备,计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109242030A true CN109242030A (zh) | 2019-01-18 |
Family
ID=65056458
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811105767.5A Pending CN109242030A (zh) | 2018-09-21 | 2018-09-21 | 画单生成方法及装置,电子设备,计算机可读存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210295109A1 (zh) |
CN (1) | CN109242030A (zh) |
WO (1) | WO2020057145A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020057145A1 (en) * | 2018-09-21 | 2020-03-26 | Boe Technology Group Co., Ltd. | Method and device for generating painting display sequence, and computer storage medium |
CN110990568A (zh) * | 2019-11-26 | 2020-04-10 | 北京中科汇联科技股份有限公司 | 一种短文本聚类方法、装置、电子设备及存储介质 |
CN114817753A (zh) * | 2022-06-29 | 2022-07-29 | 京东方艺云(杭州)科技有限公司 | 一种艺术画作的推荐方法及装置 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111859221B (zh) * | 2020-07-27 | 2023-05-30 | 中国联合网络通信集团有限公司 | 一种项目推荐方法及装置 |
CN113743506A (zh) * | 2021-09-06 | 2021-12-03 | 联想(北京)有限公司 | 数据处理方法、装置及电子设备 |
CN116342739B (zh) * | 2023-02-22 | 2023-09-26 | 深圳前海深蕾半导体有限公司 | 基于人工智能生成多幅绘画图像的方法、电子设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103093394A (zh) * | 2013-01-23 | 2013-05-08 | 广东电网公司信息中心 | 一种基于用户用电负荷数据细分的聚类融合方法 |
CN106446947A (zh) * | 2016-09-22 | 2017-02-22 | 华南理工大学 | 基于随机子空间的高维数据软硬聚类集成方法 |
CN107894998A (zh) * | 2017-10-24 | 2018-04-10 | 迅雷计算机(深圳)有限公司 | 视频推荐方法及装置 |
CN108205682A (zh) * | 2016-12-19 | 2018-06-26 | 同济大学 | 一种用于个性化推荐的融合内容和行为的协同过滤方法 |
CN108509457A (zh) * | 2017-02-28 | 2018-09-07 | 阿里巴巴集团控股有限公司 | 一种视频数据的推荐方法和装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6401121B2 (ja) * | 2015-07-29 | 2018-10-03 | 富士フイルム株式会社 | リコメンド装置、リコメンド方法、プログラムおよび記録媒体 |
TWI582626B (zh) * | 2015-10-20 | 2017-05-11 | 數位左右有限公司 | 餐飲環境圖像自動分類系統與其方法 |
CN108510373A (zh) * | 2018-04-12 | 2018-09-07 | 京东方科技集团股份有限公司 | 画作推荐方法、画作推荐装置、设备及存储介质 |
CN108537286B (zh) * | 2018-04-18 | 2020-11-24 | 北京航空航天大学 | 一种基于关键区域检测的复杂目标精准识别方法 |
CN109242030A (zh) * | 2018-09-21 | 2019-01-18 | 京东方科技集团股份有限公司 | 画单生成方法及装置,电子设备,计算机可读存储介质 |
-
2018
- 2018-09-21 CN CN201811105767.5A patent/CN109242030A/zh active Pending
-
2019
- 2019-05-10 WO PCT/CN2019/086426 patent/WO2020057145A1/en active Application Filing
- 2019-05-10 US US16/623,327 patent/US20210295109A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103093394A (zh) * | 2013-01-23 | 2013-05-08 | 广东电网公司信息中心 | 一种基于用户用电负荷数据细分的聚类融合方法 |
CN106446947A (zh) * | 2016-09-22 | 2017-02-22 | 华南理工大学 | 基于随机子空间的高维数据软硬聚类集成方法 |
CN108205682A (zh) * | 2016-12-19 | 2018-06-26 | 同济大学 | 一种用于个性化推荐的融合内容和行为的协同过滤方法 |
CN108509457A (zh) * | 2017-02-28 | 2018-09-07 | 阿里巴巴集团控股有限公司 | 一种视频数据的推荐方法和装置 |
CN107894998A (zh) * | 2017-10-24 | 2018-04-10 | 迅雷计算机(深圳)有限公司 | 视频推荐方法及装置 |
Non-Patent Citations (1)
Title |
---|
韩伟森: "聚类集成研究与应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020057145A1 (en) * | 2018-09-21 | 2020-03-26 | Boe Technology Group Co., Ltd. | Method and device for generating painting display sequence, and computer storage medium |
CN110990568A (zh) * | 2019-11-26 | 2020-04-10 | 北京中科汇联科技股份有限公司 | 一种短文本聚类方法、装置、电子设备及存储介质 |
CN114817753A (zh) * | 2022-06-29 | 2022-07-29 | 京东方艺云(杭州)科技有限公司 | 一种艺术画作的推荐方法及装置 |
CN114817753B (zh) * | 2022-06-29 | 2022-09-09 | 京东方艺云(杭州)科技有限公司 | 一种艺术画作的推荐方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US20210295109A1 (en) | 2021-09-23 |
WO2020057145A1 (en) | 2020-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109242030A (zh) | 画单生成方法及装置,电子设备,计算机可读存储介质 | |
US20090289942A1 (en) | Image learning, automatic annotation, retrieval method, and device | |
CN110378731A (zh) | 获取用户画像的方法、装置、服务器及存储介质 | |
Bedeli et al. | Clothing identification via deep learning: forensic applications | |
Kim et al. | Disjoint multi-task learning between heterogeneous human-centric tasks | |
CN111666400B (zh) | 消息获取方法、装置、计算机设备及存储介质 | |
CN106651544A (zh) | 最少用户交互的会话式推荐系统 | |
CN111461175B (zh) | 自注意与协同注意机制的标签推荐模型构建方法及装置 | |
CN113761359B (zh) | 数据包推荐方法、装置、电子设备和存储介质 | |
CN114491077A (zh) | 文本生成方法、装置、设备及介质 | |
CN112380453A (zh) | 物品推荐方法、装置、存储介质及设备 | |
CN110119479A (zh) | 一种餐馆推荐方法、装置、设备及可读存储介质 | |
Kumar et al. | Word semantics based 3-d convolutional neural networks for news recommendation | |
CN111522979B (zh) | 图片排序推荐方法、装置、电子设备、存储介质 | |
CN114298122A (zh) | 数据分类方法、装置、设备、存储介质及计算机程序产品 | |
CN113239159A (zh) | 基于关系推理网络的视频和文本的跨模态检索方法 | |
CN116977457A (zh) | 一种数据处理方法、设备以及计算机可读存储介质 | |
CN113408282B (zh) | 主题模型训练和主题预测方法、装置、设备及存储介质 | |
Pertusa et al. | MirBot: A collaborative object recognition system for smartphones using convolutional neural networks | |
CN112818213A (zh) | 多媒体业务数据推送方法、装置、设备及存储介质 | |
CN116756363A (zh) | 一种由信息量引导的强相关性无监督跨模态检索方法 | |
WO2023000811A1 (zh) | 一种饮用酒制作方式的共享方法、装置及服务器 | |
CN115129902B (zh) | 媒体数据处理方法、装置、设备及存储介质 | |
CN116955599A (zh) | 一种类目确定的方法、相关装置、设备以及存储介质 | |
CN117009577A (zh) | 一种视频数据处理方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210526 Address after: Room 2305, luguyuyuan venture building, 27 Wenxuan Road, high tech Development Zone, Changsha City, Hunan Province, 410005 Applicant after: BOE Yiyun Technology Co.,Ltd. Address before: 100015 No. 10, Jiuxianqiao Road, Beijing, Chaoyang District Applicant before: BOE TECHNOLOGY GROUP Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190118 |
|
RJ01 | Rejection of invention patent application after publication |