CN115080865B - 基于多维数据分析的电商数据运营管理系统 - Google Patents
基于多维数据分析的电商数据运营管理系统 Download PDFInfo
- Publication number
- CN115080865B CN115080865B CN202210995658.5A CN202210995658A CN115080865B CN 115080865 B CN115080865 B CN 115080865B CN 202210995658 A CN202210995658 A CN 202210995658A CN 115080865 B CN115080865 B CN 115080865B
- Authority
- CN
- China
- Prior art keywords
- characteristic
- image
- data
- channel
- commodities
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 20
- 238000000605 extraction Methods 0.000 claims abstract description 30
- 238000012216 screening Methods 0.000 claims abstract description 19
- 238000005070 sampling Methods 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 33
- 238000000034 method Methods 0.000 claims description 24
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000008447 perception Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 3
- 230000001953 sensory effect Effects 0.000 claims description 3
- 239000010410 layer Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 206010048909 Boredom Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18105—Extraction of features or characteristics of the image related to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及电商数据运营管理技术领域,具体涉及基于多维数据分析的电商数据运营管理系统。系统包括:数据采集模块:用于获取用户的浏览记录信息;特征提取模块:用于获取浏览图像中的文字区域和图画区域,基于特征提取编码器每次下采样之后的特征图像对应的各特征通道图像中文字特征像素点集合和图画特征像素点集合中像素点的通道值,获得纹理风格特征指标;基于图画区域像素点在各通道的值,得到色彩分布特征;管理推荐模块:用于从数据库中的商品中筛选出候选商品构建候选商品库;基于浏览图像的图像特征和候选商品库中各商品的图像特征,从候选商品库中筛选出待推荐商品。本发明能够提高商品的推荐精度。
Description
技术领域
本发明涉及电商数据运营管理技术领域,具体涉及基于多维数据分析的电商数据运营管理系统。
背景技术
电子商务的竞争越来越激烈,激烈的竞争促进了电子商务推荐系统的发展,且电子商务推荐系统因其具有个性、针对性等优点受到越来越多的关注。现有的电子商务推荐系统判断用户的喜好的方法大致有两种,第一种为利用用户对商品的打分信息,基于协同过滤的方法寻找具有相似打分行为的邻居,并将该邻居喜欢的商品推荐给用户;第二种为利用用户的注册信息和商品基本信息,通过内容的推荐方法,为用户推荐商品。目前,各个网站在推荐方法上都较为相似,即首先分析商品相关数据源,并计算用户对各商品的喜好程度,在需要向用户推荐商品时,获取用户对商品的偏好矩阵,给定推荐数目,将偏好值最高的商品推荐给用户。现有的商品推荐系统对用户和商品之间的喜好挖掘不够充分,往往只能挖掘表层特征为用户推荐商品,因此推荐给用户的商品与用户真正喜欢的商品之间存在较大差距,长期以往会增加用户的厌烦度,降低平台的收益。因此如何基于用户近期的浏览记录对用户的喜好进行准确的评估,进而自适应的给用户推荐真正喜欢的商品是一个重要的问题。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种基于多维数据分析的电商数据运营管理系统,所采用的技术方案具体如下:
本发明提供了一种基于多维数据分析的电商数据运营管理系统,该系统包括:
数据采集模块:用于获取预设历史时间段内用户的浏览记录信息,所述浏览记录信息包括商品类型、浏览图像;
特征提取模块:用于获取浏览图像中的文字区域和图画区域,所述浏览图像中的文字区域和图画区域是基于语义分割网络得到的;基于特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中文字特征像素点集合中各像素点的通道值,得到各特征通道图像对应的文字特征向量,基于所述文字特征向量获得文字区域对应的纹理风格特征指标;基于浏览图像在特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中图画特征像素点集合中各像素点的通道值,得到各特征通道图像对应的图画特征向量,基于所述图画特征向量,得到图画区域对应的纹理风格特征指标;基于所述图画区域中各像素点在R、G、B通道的值,得到图画区域的色彩分布特征;
管理推荐模块:用于从数据库中的商品中筛选出候选商品构建候选商品库,所述候选商品是基于预设历史时间段内用户浏览商品对应的访问数据类型筛选出的;所述访问数据类型包括:感知数据、意向数据、吸引数据以及偏好数据;基于预设历史时间段内用户浏览图像对应的图像特征和候选商品库中各商品的图像对应的图像特征,从所述候选商品库中筛选出待推荐商品;所述图像特征包括:所述文字区域对应的纹理风格特征指标、所述图画区域对应的纹理风格特征指标和所述图画区域的色彩分布特征。
优选的,各特征通道图像中文字特征像素点集合的获取,包括:
获取特征图像中各像素点的感受野与浏览图像中文字区域的重叠程度;
对所述重叠程度进行归一化处理,将特征图像中归一化重叠程度高于重叠程度阈值的像素点作为文字特征像素点,基于所述文字特征像素点获得特征图像对应的各特征通道图像中文字特征像素点集合。
优选的,所述基于特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中文字特征像素点集合中各像素点的通道值,得到各特征通道图像对应的文字特征向量,包括:
对于任一特征图像:
获取该特征图像对应的各特征通道图像,选取任一特征通道图像作为目标通道图像,根据所述目标通道图像中文字特征像素点集合中各像素点的通道值,构建目标特征通道图像对应的文字特征向量。
优选的,所述基于所述文字特征向量获得文字区域对应的纹理风格特征指标,包括:
对于任一特征图像:基于该特征图像对应的各特征通道图像中的各文字特征向量之间的内积,构建该特征图像中文字特征像素点集合对应的纹理风格特征矩阵;
根据各特征图像中文字特征像素点集合对应的纹理风格特征矩阵,得到文字区域对应的纹理风格特征指标。
优选的,所述基于所述图画区域中各像素点在R、G、B通道的值,得到图画区域的色彩分布特征,包括:
分别将色彩空间各通道的通道值量化为预设数量个通道等级,根据图画区域中各像素点在R、G、B通道的值,得到各通道对应的直方图;
根据所述各通道对应的直方图,得到图画区域的色彩分布特征。
优选的,所述感知数据为用户没有进行主动搜索,仅基于界面跳出的内容进行点击且没有购买过的商品数据;所述意向数据为用户在搜索框中进行主动搜索且没有购买的商品数据;所述吸引数据为用户在搜索框中进行搜索且近期内购买过一次的商品数据;所述偏好数据为用户在近期内多次有效购买的商品数据。
优选的,所述从数据库中的商品中筛选出候选商品构建候选商品库,包括:
获取数据库中的各商品对应的访问数据类型;
将数据库中意向数据、吸引数据以及偏好数据对应的商品作为候选商品,基于所述候选商品构建候选商品库。
优选的,所述基于预设历史时间段内用户浏览图像对应的图像特征和候选商品库中各商品的图像对应的图像特征,从所述候选商品库中筛选出待推荐商品,包括:
获取候选商品库中各商品对应的图像特征与标准特征库中各浏览图像对应的图像特征之间的差异度;
将所述差异度小于等于差异度阈值的候选商品库中的对应商品作为待推荐商品。
本发明具有如下有益效果:
1、本发明获取了预设历史时间段内用户的浏览记录信息,提取浏览图像中的文字区域和图画区域,基于文字区域和图画区域分析用户的喜好风格,排除了无关因素的影响,高效地提取了预设历史时间段内用户浏览图像对应的图像特征,同时获取了预设历史时间段内用户浏览商品对应的访问数据类型,基于预设历史时间段内用户浏览图像对应的图像特征和访问数据类型,对数据库中的商品进行双重筛选,提高了商品的筛选精度,提升了用户在电商平台的体验感。
2、考虑到用户的喜好能够通过文字和图画来体现,因此本发明在提取预设历史时间段内用户浏览图像对应的图像特征时,分别对浏览图像中的文字区域和图画区域进行了分析,基于各特征通道图像中文字特征像素点集合中各像素点的通道值获得了文字区域对应的纹理风格特征指标,基于各特征通道图像中图画特征像素点集合中各像素点的通道值获得了图画区域对应的纹理风格特征指标;考虑到用户的喜好也能体现在图像的色彩信息上,因此本发明又基于浏览图像中像素点在R、G、B通道的值,得到了图画区域的色彩分布特征;基于文字区域对应的纹理风格特征指标、图画区域对应的纹理风格特征指标和图画区域的色彩分布特征对用户的历史行为信息进行了充分地分析,对用户的偏好取向以及潜在兴趣进行了准确地评估,进而能够有效地降低推荐给用户的商品与用户真正喜欢的商品之间的差异。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明提供的基于多维数据分析的电商数据运营管理系统的系统框图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于多维数据分析的电商数据运营管理系统进行详细说明如下。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于多维数据分析的电商数据运营管理系统的具体方案。
基于多维数据分析的电商数据运营管理系统实施例:
本实施例提供了基于多维数据分析的电商数据运营管理系统,通过大数据获取消费者在预设历史时间段内的浏览数据,提取浏览图像的ROI区域,基于ROI区域分析消费者喜好风格,建立ROI区域特征提取模型,获取消费者的意向商品种类特征参数,同时获取消费者的访问数据特征参数,用于对消费者进行自适应推荐商品。
如图1所示,本实施例的基于多维数据分析的电商数据运营管理系统包括数据采集模块、特征提取模块和管理推荐模块,接下来分别对各模块进行介绍。
Ⅰ.数据采集模块
本实施例的数据采集模块用于获取预设历史时间段内用户的浏览记录信息,所述浏览记录信息包括商品类型、浏览图像。
为了对用户的喜好风格进行分析,本实施例将对用户预设历史时间段内的浏览记录进行分析,通过大数据获取用户的浏览记录对应的浏览图像,基于对浏览图像的分析提取相应的ROI区域,并获取ROI区域的风格特征参数,同时,对用户的访问数据类型进行分析,分析用户对于每种商品的喜好程度,综合评估用户的喜好风格。
本实施例通过底层数据获取用户在预设历史时间段内的浏览记录信息,所述底层数据为相应电商平台公司内部的数据,通过后台大数据进行提取,用于基于多维数据对用户的喜好进行分析,所述浏览记录信息包括商品类型、浏览图像。本实施例设置预设历史时间段为近半年,在具体应用中,实施者可自行设置。
Ⅱ.特征提取模块
本实施例的特征提取模块用于获取浏览图像中的文字区域和图画区域,所述浏览图像中的文字区域和图画区域是基于语义分割网络得到的;基于特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中文字特征像素点集合中各像素点的通道值,得到各特征通道图像对应的文字特征向量,基于所述文字特征向量获得文字区域对应的纹理风格特征指标;基于浏览图像在特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中图画特征像素点集合中各像素点的通道值,得到各特征通道图像对应的图画特征向量,基于所述图画特征向量,得到图画区域对应的纹理风格特征指标;基于所述图画区域中各像素点在R、G、B通道的值,得到图画区域的色彩分布特征。
对于浏览图像,考虑到目前的广告图像中大多会包含各种各样的信息,存在较多无关信息对图像对应的商品风格识别造成干扰,而浏览图像中的关键信息主要为文字部分以及图画部分,因此为了提高数据分析精度,将文字区域以及图画区域作为本实施例重点分析的ROI区域,对浏览图像的ROI区域进行提取,以便识别浏览图像对应的商品风格类型。通过语义分割网络对ROI区域进行提取,语义分割网络采用现有的语义分割网络模型,网络输入为用户的浏览图像,网络输出为语义分割图,输入图像经特征提取编码器进行特征提取。需要说明的是,特征提取编码器为多层卷积层结构,对输入图像不断进行下采样完成特征提取操作,每一次下采样使得特征图像中的像素点在原始图像中的感受野变大,特征提取解码器对提取到的特征图像进行上采样得到与输入图像等大的语义分割图;网络的训练数据为浏览图像,对训练数据图像中像素点的像素值进行人工标注:将浏览图像中的文字部分像素点的像素值标记为1,图画部分像素点的像素值标记为2,其余区域像素点的像素值标记为0,得到标签数据;语义分割网络的损失函数采用交叉熵函数,语义分割网络的训练过程为现有技术,此处不再阐述。
对于预设历史时间段内的任一浏览图像:
将该浏览图像输入到训练好的语义分割网络中,得到该浏览图像中的ROI区域,所述ROI区域包括文字区域和图画区域。接下来将分别对浏览图像中的ROI区域的风格特征进行提取,所述风格特征用于表征ROI区域的纹理结构分布规律,纹理风格特征的提取将基于特征编码器对各部分提取的特征进行获取,考虑到语义分割网络的特征提取编码器每次采样时都是对浏览图像中的纹理结构特征的提取,因此,本实施例将基于各部分像素点的位置信息对各部分的风格特征进行提取,以获取各部分的特征参数。
获得浏览图像在特征提取编码器中每次下采样之后所对应的特征图像,对于任一特征图像,获取该特征图像中每个像素点在浏览图像中的感受野,记为,为了实现对文字部分风格特征的准确提取,本实施例将在该特征图像中获取能够体现文字部分风格特征的像素点集合,首先,获取该特征图像中位置的像素点的感受野与文字区域的重叠部分的大小:,用于表征该特征图像中位置的像素点的感受野与浏览图像中的文字部分的重叠程度,数值越大,表示该位置像素点的像素值越能反映文字部分的特征;本实施例对进行归一化处理,保证函数值处于[0,1],设置重叠程度阈值,将该特征图像中重叠部分高于的像素点作为文字特征像素点,获取该特征图像中所有的文字特征像素点,将其作为一个文字特征像素点集合,用于从特征图像中提取文字部分的特征信息。基于上述方法能够得到每张特征图像对应的文字特征像素点集合,即,其中,为第1张特征图像对应的文字特征像素点集合,为第2张特征图像对应的文字特征像素点集合,为第L张特征图像对应的文字特征像素点集合,L为特征提取编码器中卷积层的层数,也即特征图像的数量;每个集合所包含的像素点数量记为,,即第1张特征图像对应的文字特征像素点集合所包含的像素点数量为,第2张特征图像对应的文字特征像素点集合所包含的像素点数量为,第L张特征图像对应的文字特征像素点集合所包含的像素点数量为。在具体应用中,实施者可自行设置的值。
考虑到特征提取编码器所提取的特征图像均为多通道图像,本实施例对每张特征图像对应的文字特征像素点集合进行单独分析,以第j张特征图像对应的文字特征像素点集合为例进行纹理风格特征的提取,记第j张特征图像对应的通道数量为;获取每个通道所对应的特征通道图像,即,其中,为第j张特征图像对应的第1张特征通道图像,为第j张特征图像对应的第2张特征通道图像,为第j张特征图像对应的第张特征通道图像;获取每个特征通道图像中文字特征像素点集合中各像素点对应的通道值,然后基于各通道值获取每个特征通道图像对应的文字特征向量,对于第k个特征通道图像,其对应的文字特征向量,其中,为第j个文字特征像素点集合,为第j个文字特征像素点集合中的第个像素点,k为第k个特征通道图像,为第k个特征通道图像中第j个文字特征像素点集合对应的文字特征向量,为第k个特征通道图像中第j个文字特征像素点集合中第1个像素点对应的特征通道值,为第k个特征通道图像中第j个文字特征像素点集合中第2个像素点对应的特征通道值,为第k个特征通道图像中第j个文字特征像素点集合中第个像素点对应的特征通道值。
采用上述方法,能够得到特征图像对应的各特征通道图像对应的文字特征向量,。为了表征文字部分的结构特征,本实施例基于特征图像对应的各特征通道图像中的各文字特征向量之间的内积,获取各通道之间的特征关系,构建浏览图像中文字区域的像素点在该特征图像中的纹理风格矩阵:
其中,为第1个特征通道图像对应的文字特征向量和第1个特征通道图像对应的文字特征向量的内积,为第1个特征通道图像对应的文字特征向量和第个特征通道图像对应的文字特征向量的内积,为第个特征通道图像对应的文字特征向量和第1个特征通道图像对应的文字特征向量的内积,为第个特征通道图像对应的文字特征向量和第个特征通道图像对应的文字特征向量的内积,为文字特征像素点集合对应的纹理风格特征矩阵,用于对文字部分的结构特征进行表征。
采用上述方法获得每张特征图像中文字特征像素点集合对应的纹理风格特征矩阵,进而得到文字区域对应的纹理风格特征指标,,其中,为文字特征像素点集合对应的纹理风格特征矩阵,为文字特征像素点集合对应的纹理风格特征矩阵,为文字特征像素点集合对应的纹理风格特征矩阵;同样的,通过本实施例所提供的方法获取图画区域对应的纹理风格特征指标,用于对用户的喜好风格特征进行分析评估。
考虑到用户对某个商品的喜欢也能体现在色彩信息上,因此,本实施例将进一步对图画区域的色彩特征进行提取,以便准确分析用户近期的商品喜好(包括商品类型、商品色彩等信息)。具体的,对浏览图像中的图画区域进行R、G、B通道分离,以获取各通道的图像数据,获取图画区域中各像素点在R、G、B通道的值,然后将色彩空间的每个通道的通道值分别量化为q个通道等级,本实施例设置通道等级q的值8,在具体应用中,实施者可根据实际情况自行设置;统计图画区域在各通道图像中各通道等级的分布状况,得到各通道对应的直方图,将其作为色彩分布特征:,为R通道对应的直方图,为G通道对应的直方图,为B通道对应的直方图,色彩分布特征用于对浏览图像中图画区域的色彩分布进行分析。所述直方图的具体获取方法为现有公知技术,此处不再阐述。
为了实现对用户进行自适应的精准推荐,本实施例将进一步对用户访问数据的类型进行分析,以便准确分析用户的喜好风格,所述访问数据类型为:感知数据,意向数据,吸引数据以及偏好数据,其中,感知数据为用户没有进行主动搜索,仅基于界面跳出的内容进行点击且没有购买过的商品数据;意向数据为用户在搜索框中进行主动搜索且没有购买的商品数据;吸引数据为用户在搜索框中进行搜索且近期内购买过一次的商品数据;偏好数据为用户在近期内多次有效购买的商品数据。
至此,得到了浏览图像的文字区域对应的纹理风格特征指标、图画区域对应的纹理风格特征指标、图画区域的色彩分布特征,以及浏览商品对应的访问数据类型。
Ⅲ.管理推荐模块
本实施例的管理推荐模块用于从数据库中的商品中筛选出候选商品构建候选商品库,所述候选商品是基于预设历史时间段内用户浏览商品对应的访问数据类型筛选出的;所述访问数据类型包括:感知数据、意向数据、吸引数据以及偏好数据;基于预设历史时间段内用户浏览图像对应的图像特征和候选商品库中各商品的图像对应的图像特征,从所述候选商品库中筛选出待推荐商品;所述图像特征包括:所述文字区域对应的纹理风格特征指标、所述图画区域对应的纹理风格特征指标和所述图画区域的色彩分布特征。
基于特征提取模块获得了用户预设历史时间段内浏览的商品的特征参数以及浏览的产品对应的访问数据类型,本实施例接下来将基于用户预设历史时间段内的访问数据类型对数据库中的商品进行初步筛选,以获取用户的候选商品。
具体的,对于数据库内的商品,首先根据本实施例上述访问数据分类过程分析其属于哪种类型的访问数据,然后分别获取数据库中感知数据、意向数据、吸引数据以及偏好数据对应的商品,将感知数据对应的商品进行滤除,将意向数据、吸引数据以及偏好数据对应的商品作为候选商品,基于候选商品构建候选商品库,以便对用户进行针对性的分析推荐。
本实施例将进一步基于文字区域对应的纹理风格特征指标、图画区域对应的纹理风格特征指标和图画区域的色彩分布特征对候选商品库中的商品进行再次筛选,再次筛选的过程具体为:获取预设历史时间段内用户的浏览数据,得到预设历史时间段内用户所有浏览图像对应的图像特征(文字区域对应的纹理风格特征指标、图画区域对应的纹理风格特征指标、图画区域的色彩分布特征),并将其作为标准特征库,用于对用户近期的喜好风格进行分析;然后,本实施例获取候选商品库中的商品的图像对应的图像特征(文字区域对应的纹理风格特征指标、图画区域对应的纹理风格特征指标、图画区域的色彩分布特征),获取候选商品库中各商品对应的图像特征与标准特征库中各浏览图像对应的图像特征之间的差异度,所述差异度为对应特征指标之间的距离,在具体应用中,实施者可自行定义差异度度量函数,在本实施例中,对于文字区域对应的纹理风格特征指标和图画区域对应的纹理风格特征指标采用候选商品库与标准库对应特征指标之间的欧氏距离之和,对于图画区域的色彩分布特征(色彩通道直方图),采用候选商品库与标准库对应色彩通道直方图之间对应通道等级直方图差值之和,以得到最终的差异度,基于上述方法,能够得到候选商品库中各商品的图像对应的图像特征与标准特征库中各浏览图像对应的图像特征之间的差异度,并对其进行归一化处理,本实施例设置差异度阈值,当差异度大于时,判定候选商品库内的对应商品与用户的喜好风格偏差过大,当差异度小于等于时,判定候选商品库内的对应商品与用户的喜好风格一致,将候选商品库中的该商品筛选出来,作为待推荐商品。至此,得到多个待推荐商品。本实施例设置的值为0.5,在具体应用中,实施者可自行设置。
为了提高用户的浏览满意度,本实施例基于差异度对待推荐商品的推荐顺序进行设置,以便对用户的浏览界面上推送的商品进行规划,差异度越小的商品对应的排序指标越大,排序指标越大商品推荐顺序越靠前,实施者也可根据实际情况进行自行设置,本实施例不做相关的阐述。
至此,即可通过本实施例提供的系统获取用户的访问数据,获取用户的喜好风格,同时基于所提取的特征参数对用户的待推荐商品进行双重筛选,以准确获取与用户偏好相对应的商品,自适应的为用户推荐商品,并基于待推荐商品与用户预设历史时间段内浏览商品的差异度,对待推荐商品的推荐顺序进行设置,以有效提高用户的购物满意度,提高电商运营数据的管理效率,保证高效、准确地对电商运营数据进行管理分析。
本实施例获取了预设历史时间段内用户的浏览记录信息,提取浏览图像中的文字区域和图画区域,基于文字区域和图画区域分析用户的喜好风格,排除了无关因素的影响,高效地提取了预设历史时间段内用户浏览图像对应的图像特征,同时获取了预设历史时间段内用户浏览商品对应的访问数据类型,基于预设历史时间段内用户浏览图像对应的图像特征和访问数据类型,对数据库中的商品进行双重筛选,提高了商品的筛选精度,提升了用户在电商平台的体验感。考虑到用户的喜好能够通过文字和图画来体现,因此本实施例在提取预设历史时间段内用户浏览图像对应的图像特征时,分别对浏览图像中的文字区域和图画区域进行了分析,基于各特征通道图像中文字特征像素点集合中各像素点的通道值获得了文字区域对应的纹理风格特征指标,基于各特征通道图像中图画特征像素点集合中各像素点的通道值获得了图画区域对应的纹理风格特征指标;考虑到用户的喜好也能体现在图像的色彩信息上,因此本实施例又基于浏览图像中像素点在R、G、B通道的值,得到了图画区域的色彩分布特征;基于文字区域对应的纹理风格特征指标、图画区域对应的纹理风格特征指标和图画区域的色彩分布特征对用户的历史行为信息进行了充分地分析,对用户的偏好取向以及潜在兴趣进行了准确地评估,进而能够有效地降低推荐给用户的商品与用户真正喜欢的商品之间的差异。
需要说明的是:以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于多维数据分析的电商数据运营管理系统,其特征在于,该系统包括:
数据采集模块:用于获取预设历史时间段内用户的浏览记录信息,所述浏览记录信息包括商品类型、浏览图像;
特征提取模块:用于获取浏览图像中的文字区域和图画区域,所述浏览图像中的文字区域和图画区域是基于语义分割网络得到的;基于特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中文字特征像素点集合中各像素点的通道值,得到各特征通道图像对应的文字特征向量,基于所述文字特征向量获得文字区域对应的纹理风格特征指标;基于浏览图像在特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中图画特征像素点集合中各像素点的通道值,得到各特征通道图像对应的图画特征向量,基于所述图画特征向量,得到图画区域对应的纹理风格特征指标;基于所述图画区域中各像素点在R、G、B通道的值,得到图画区域的色彩分布特征;
管理推荐模块:用于从数据库中的商品中筛选出候选商品构建候选商品库,所述候选商品是基于预设历史时间段内用户浏览商品对应的访问数据类型筛选出的;所述访问数据类型包括:感知数据、意向数据、吸引数据以及偏好数据;基于预设历史时间段内用户浏览图像对应的图像特征和候选商品库中各商品的图像对应的图像特征,从所述候选商品库中筛选出待推荐商品;所述图像特征包括:所述文字区域对应的纹理风格特征指标、所述图画区域对应的纹理风格特征指标和所述图画区域的色彩分布特征;所述感知数据为用户没有进行主动搜索,仅基于界面跳出的内容进行点击且没有购买过的商品数据;所述意向数据为用户在搜索框中进行主动搜索且没有购买的商品数据;所述吸引数据为用户在搜索框中进行搜索且近期内购买过一次的商品数据;所述偏好数据为用户在近期内多次有效购买的商品数据。
2.根据权利要求1所述的基于多维数据分析的电商数据运营管理系统,其特征在于,各特征通道图像中文字特征像素点集合的获取,包括:
获取特征图像中各像素点的感受野与浏览图像中文字区域的重叠程度;
对所述重叠程度进行归一化处理,将特征图像中归一化重叠程度高于重叠程度阈值的像素点作为文字特征像素点,基于所述文字特征像素点获得特征图像对应的各特征通道图像中文字特征像素点集合。
3.根据权利要求1所述的基于多维数据分析的电商数据运营管理系统,其特征在于,所述基于特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中文字特征像素点集合中各像素点的通道值,得到各特征通道图像对应的文字特征向量,包括:
对于任一特征图像:
获取该特征图像对应的各特征通道图像,选取任一特征通道图像作为目标通道图像,根据所述目标通道图像中文字特征像素点集合中各像素点的通道值,构建目标特征通道图像对应的文字特征向量。
4.根据权利要求1所述的基于多维数据分析的电商数据运营管理系统,其特征在于,所述基于所述文字特征向量获得文字区域对应的纹理风格特征指标,包括:
对于任一特征图像:基于该特征图像对应的各特征通道图像中的各文字特征向量之间的内积,构建该特征图像中文字特征像素点集合对应的纹理风格特征矩阵;
根据各特征图像中文字特征像素点集合对应的纹理风格特征矩阵,得到文字区域对应的纹理风格特征指标。
5.根据权利要求1所述的基于多维数据分析的电商数据运营管理系统,其特征在于,所述基于所述图画区域中各像素点在R、G、B通道的值,得到图画区域的色彩分布特征,包括:
分别将色彩空间各通道的通道值量化为预设数量个通道等级,根据图画区域中各像素点在R、G、B通道的值,得到各通道对应的直方图;
根据所述各通道对应的直方图,得到图画区域的色彩分布特征。
6.根据权利要求1所述的基于多维数据分析的电商数据运营管理系统,其特征在于,所述从数据库中的商品中筛选出候选商品构建候选商品库,包括:
获取数据库中的各商品对应的访问数据类型;
将数据库中意向数据、吸引数据以及偏好数据对应的商品作为候选商品,基于所述候选商品构建候选商品库。
7.根据权利要求1所述的基于多维数据分析的电商数据运营管理系统,其特征在于,所述基于预设历史时间段内用户浏览图像对应的图像特征和候选商品库中各商品的图像对应的图像特征,从所述候选商品库中筛选出待推荐商品,包括:
获取候选商品库中各商品对应的图像特征与标准特征库中各浏览图像对应的图像特征之间的差异度;
将所述差异度小于等于差异度阈值的候选商品库中的对应商品作为待推荐商品。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210995658.5A CN115080865B (zh) | 2022-08-19 | 2022-08-19 | 基于多维数据分析的电商数据运营管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210995658.5A CN115080865B (zh) | 2022-08-19 | 2022-08-19 | 基于多维数据分析的电商数据运营管理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115080865A CN115080865A (zh) | 2022-09-20 |
CN115080865B true CN115080865B (zh) | 2022-11-04 |
Family
ID=83244286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210995658.5A Active CN115080865B (zh) | 2022-08-19 | 2022-08-19 | 基于多维数据分析的电商数据运营管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115080865B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115471302B (zh) * | 2022-11-14 | 2023-02-14 | 山东智豆数字科技有限公司 | 基于大数据分析的电子营销数据处理方法 |
CN117611245B (zh) * | 2023-12-14 | 2024-05-31 | 浙江博观瑞思科技有限公司 | 用于电商运营活动策划的数据分析管理系统及方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009251850A (ja) * | 2008-04-04 | 2009-10-29 | Albert:Kk | 類似画像検索を用いた商品推薦システム |
CN107292642A (zh) * | 2016-03-31 | 2017-10-24 | 苏宁云商集团股份有限公司 | 一种基于图像的商品推荐方法及系统 |
CN107679960A (zh) * | 2017-10-12 | 2018-02-09 | 东北大学 | 一种基于服装图像和标签文本双模态内容分析的个性化服装的推荐方法 |
CN107730343A (zh) * | 2017-09-15 | 2018-02-23 | 广州唯品会研究院有限公司 | 一种基于图片属性提取的用户商品信息推送方法及设备 |
KR101896404B1 (ko) * | 2017-09-29 | 2018-09-07 | 오명운 | 컴퓨터 비전을 이용한 상품 추천 시스템 |
CN112256891A (zh) * | 2020-10-26 | 2021-01-22 | 北京达佳互联信息技术有限公司 | 多媒体资源的推荐方法、装置、电子设备及存储介质 |
CN113450178A (zh) * | 2021-05-13 | 2021-09-28 | 孙昊盛 | 一种基于互联网的电商精准营销系统 |
CN114494763A (zh) * | 2021-12-17 | 2022-05-13 | 浙江大学 | 基于特征融合的商品详情图版式分类方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9898773B2 (en) * | 2014-11-18 | 2018-02-20 | Microsoft Technology Licensing, Llc | Multilingual content based recommendation system |
CN104881798A (zh) * | 2015-06-05 | 2015-09-02 | 北京京东尚科信息技术有限公司 | 基于商品图像特征的个性化搜索装置及方法 |
JP6450473B2 (ja) * | 2015-11-27 | 2019-01-09 | 株式会社イーシーバード | 商品/サービスの購入支援方法及びシステム並びにプログラム |
CN105787770A (zh) * | 2016-04-27 | 2016-07-20 | 上海遥薇(集团)有限公司 | 一种基于nmf算法的大数据商品及服务推荐方法及系统 |
CN107862561A (zh) * | 2017-09-15 | 2018-03-30 | 广州唯品会研究院有限公司 | 一种基于图片属性提取建立用户兴趣库的方法及设备 |
-
2022
- 2022-08-19 CN CN202210995658.5A patent/CN115080865B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009251850A (ja) * | 2008-04-04 | 2009-10-29 | Albert:Kk | 類似画像検索を用いた商品推薦システム |
CN107292642A (zh) * | 2016-03-31 | 2017-10-24 | 苏宁云商集团股份有限公司 | 一种基于图像的商品推荐方法及系统 |
CN107730343A (zh) * | 2017-09-15 | 2018-02-23 | 广州唯品会研究院有限公司 | 一种基于图片属性提取的用户商品信息推送方法及设备 |
KR101896404B1 (ko) * | 2017-09-29 | 2018-09-07 | 오명운 | 컴퓨터 비전을 이용한 상품 추천 시스템 |
CN107679960A (zh) * | 2017-10-12 | 2018-02-09 | 东北大学 | 一种基于服装图像和标签文本双模态内容分析的个性化服装的推荐方法 |
CN112256891A (zh) * | 2020-10-26 | 2021-01-22 | 北京达佳互联信息技术有限公司 | 多媒体资源的推荐方法、装置、电子设备及存储介质 |
CN113450178A (zh) * | 2021-05-13 | 2021-09-28 | 孙昊盛 | 一种基于互联网的电商精准营销系统 |
CN114494763A (zh) * | 2021-12-17 | 2022-05-13 | 浙江大学 | 基于特征融合的商品详情图版式分类方法 |
Non-Patent Citations (1)
Title |
---|
面向电商的多模态商品检索引擎设计;潘巍等;《智能计算机与应用》;20220731;第12卷(第7期);第202-205页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115080865A (zh) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115080865B (zh) | 基于多维数据分析的电商数据运营管理系统 | |
Cetinic et al. | A deep learning perspective on beauty, sentiment, and remembrance of art | |
Diem et al. | cBAD: ICDAR2017 competition on baseline detection | |
CN106682108A (zh) | 一种基于多模态卷积神经网络的视频检索方法 | |
US20130101209A1 (en) | Method and system for extraction and association of object of interest in video | |
US12019707B2 (en) | Systems, methods, and storage media for training a model for image evaluation | |
CN106446015A (zh) | 一种基于用户行为偏好的视频内容访问预测与推荐方法 | |
Cetinic et al. | Learning the principles of art history with convolutional neural networks | |
Romero et al. | Using complexity estimates in aesthetic image classification | |
Lee et al. | Style classification and visualization of art painting’s genre using self-organizing maps | |
CN108447064B (zh) | 一种图片处理方法及装置 | |
CN107247919A (zh) | 一种视频情感内容的获取方法及系统 | |
CN113761253A (zh) | 视频标签确定方法、装置、设备及存储介质 | |
CN111339439A (zh) | 一种融合评论文本与时序效应的协同过滤推荐方法和装置 | |
Zhang et al. | Contrast preserving image decolorization combining global features and local semantic features | |
CN113762138A (zh) | 伪造人脸图片的识别方法、装置、计算机设备及存储介质 | |
CN112199582A (zh) | 一种内容推荐方法、装置、设备及介质 | |
CN112528058A (zh) | 基于图像属性主动学习的细粒度图像分类方法 | |
CN117746143A (zh) | 基于aigc的图像描述文本的生成方法及装置、存储介质 | |
CN111581435A (zh) | 一种视频封面图像生成方法、装置、电子设备及存储介质 | |
CN116862626B (zh) | 一种多模态商品对齐方法 | |
Jayanthiladevi et al. | Text, images, and video analytics for fog computing | |
CN112464106B (zh) | 对象推荐方法及装置 | |
Zujovic et al. | Effective and efficient subjective testing of texture similarity metrics | |
WO2023248061A1 (en) | Furniture recommendation method and system using artificial intelligence and augmented reality |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |