CN115080865B - 基于多维数据分析的电商数据运营管理系统 - Google Patents

基于多维数据分析的电商数据运营管理系统 Download PDF

Info

Publication number
CN115080865B
CN115080865B CN202210995658.5A CN202210995658A CN115080865B CN 115080865 B CN115080865 B CN 115080865B CN 202210995658 A CN202210995658 A CN 202210995658A CN 115080865 B CN115080865 B CN 115080865B
Authority
CN
China
Prior art keywords
characteristic
image
data
channel
commodities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210995658.5A
Other languages
English (en)
Other versions
CN115080865A (zh
Inventor
孙晓琛
葛强
车礼聚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Zhidou Digital Technology Co ltd
Original Assignee
Shandong Zhidou Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Zhidou Digital Technology Co ltd filed Critical Shandong Zhidou Digital Technology Co ltd
Priority to CN202210995658.5A priority Critical patent/CN115080865B/zh
Publication of CN115080865A publication Critical patent/CN115080865A/zh
Application granted granted Critical
Publication of CN115080865B publication Critical patent/CN115080865B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18105Extraction of features or characteristics of the image related to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及电商数据运营管理技术领域,具体涉及基于多维数据分析的电商数据运营管理系统。系统包括:数据采集模块:用于获取用户的浏览记录信息;特征提取模块:用于获取浏览图像中的文字区域和图画区域,基于特征提取编码器每次下采样之后的特征图像对应的各特征通道图像中文字特征像素点集合和图画特征像素点集合中像素点的通道值,获得纹理风格特征指标;基于图画区域像素点在各通道的值,得到色彩分布特征;管理推荐模块:用于从数据库中的商品中筛选出候选商品构建候选商品库;基于浏览图像的图像特征和候选商品库中各商品的图像特征,从候选商品库中筛选出待推荐商品。本发明能够提高商品的推荐精度。

Description

基于多维数据分析的电商数据运营管理系统
技术领域
本发明涉及电商数据运营管理技术领域,具体涉及基于多维数据分析的电商数据运营管理系统。
背景技术
电子商务的竞争越来越激烈,激烈的竞争促进了电子商务推荐系统的发展,且电子商务推荐系统因其具有个性、针对性等优点受到越来越多的关注。现有的电子商务推荐系统判断用户的喜好的方法大致有两种,第一种为利用用户对商品的打分信息,基于协同过滤的方法寻找具有相似打分行为的邻居,并将该邻居喜欢的商品推荐给用户;第二种为利用用户的注册信息和商品基本信息,通过内容的推荐方法,为用户推荐商品。目前,各个网站在推荐方法上都较为相似,即首先分析商品相关数据源,并计算用户对各商品的喜好程度,在需要向用户推荐商品时,获取用户对商品的偏好矩阵,给定推荐数目,将偏好值最高的商品推荐给用户。现有的商品推荐系统对用户和商品之间的喜好挖掘不够充分,往往只能挖掘表层特征为用户推荐商品,因此推荐给用户的商品与用户真正喜欢的商品之间存在较大差距,长期以往会增加用户的厌烦度,降低平台的收益。因此如何基于用户近期的浏览记录对用户的喜好进行准确的评估,进而自适应的给用户推荐真正喜欢的商品是一个重要的问题。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种基于多维数据分析的电商数据运营管理系统,所采用的技术方案具体如下:
本发明提供了一种基于多维数据分析的电商数据运营管理系统,该系统包括:
数据采集模块:用于获取预设历史时间段内用户的浏览记录信息,所述浏览记录信息包括商品类型、浏览图像;
特征提取模块:用于获取浏览图像中的文字区域和图画区域,所述浏览图像中的文字区域和图画区域是基于语义分割网络得到的;基于特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中文字特征像素点集合中各像素点的通道值,得到各特征通道图像对应的文字特征向量,基于所述文字特征向量获得文字区域对应的纹理风格特征指标;基于浏览图像在特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中图画特征像素点集合中各像素点的通道值,得到各特征通道图像对应的图画特征向量,基于所述图画特征向量,得到图画区域对应的纹理风格特征指标;基于所述图画区域中各像素点在R、G、B通道的值,得到图画区域的色彩分布特征;
管理推荐模块:用于从数据库中的商品中筛选出候选商品构建候选商品库,所述候选商品是基于预设历史时间段内用户浏览商品对应的访问数据类型筛选出的;所述访问数据类型包括:感知数据、意向数据、吸引数据以及偏好数据;基于预设历史时间段内用户浏览图像对应的图像特征和候选商品库中各商品的图像对应的图像特征,从所述候选商品库中筛选出待推荐商品;所述图像特征包括:所述文字区域对应的纹理风格特征指标、所述图画区域对应的纹理风格特征指标和所述图画区域的色彩分布特征。
优选的,各特征通道图像中文字特征像素点集合的获取,包括:
获取特征图像中各像素点的感受野与浏览图像中文字区域的重叠程度;
对所述重叠程度进行归一化处理,将特征图像中归一化重叠程度高于重叠程度阈值的像素点作为文字特征像素点,基于所述文字特征像素点获得特征图像对应的各特征通道图像中文字特征像素点集合。
优选的,所述基于特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中文字特征像素点集合中各像素点的通道值,得到各特征通道图像对应的文字特征向量,包括:
对于任一特征图像:
获取该特征图像对应的各特征通道图像,选取任一特征通道图像作为目标通道图像,根据所述目标通道图像中文字特征像素点集合中各像素点的通道值,构建目标特征通道图像对应的文字特征向量。
优选的,所述基于所述文字特征向量获得文字区域对应的纹理风格特征指标,包括:
对于任一特征图像:基于该特征图像对应的各特征通道图像中的各文字特征向量之间的内积,构建该特征图像中文字特征像素点集合对应的纹理风格特征矩阵;
根据各特征图像中文字特征像素点集合对应的纹理风格特征矩阵,得到文字区域对应的纹理风格特征指标。
优选的,所述基于所述图画区域中各像素点在R、G、B通道的值,得到图画区域的色彩分布特征,包括:
分别将色彩空间各通道的通道值量化为预设数量个通道等级,根据图画区域中各像素点在R、G、B通道的值,得到各通道对应的直方图;
根据所述各通道对应的直方图,得到图画区域的色彩分布特征。
优选的,所述感知数据为用户没有进行主动搜索,仅基于界面跳出的内容进行点击且没有购买过的商品数据;所述意向数据为用户在搜索框中进行主动搜索且没有购买的商品数据;所述吸引数据为用户在搜索框中进行搜索且近期内购买过一次的商品数据;所述偏好数据为用户在近期内多次有效购买的商品数据。
优选的,所述从数据库中的商品中筛选出候选商品构建候选商品库,包括:
获取数据库中的各商品对应的访问数据类型;
将数据库中意向数据、吸引数据以及偏好数据对应的商品作为候选商品,基于所述候选商品构建候选商品库。
优选的,所述基于预设历史时间段内用户浏览图像对应的图像特征和候选商品库中各商品的图像对应的图像特征,从所述候选商品库中筛选出待推荐商品,包括:
获取候选商品库中各商品对应的图像特征与标准特征库中各浏览图像对应的图像特征之间的差异度;
将所述差异度小于等于差异度阈值的候选商品库中的对应商品作为待推荐商品。
本发明具有如下有益效果:
1、本发明获取了预设历史时间段内用户的浏览记录信息,提取浏览图像中的文字区域和图画区域,基于文字区域和图画区域分析用户的喜好风格,排除了无关因素的影响,高效地提取了预设历史时间段内用户浏览图像对应的图像特征,同时获取了预设历史时间段内用户浏览商品对应的访问数据类型,基于预设历史时间段内用户浏览图像对应的图像特征和访问数据类型,对数据库中的商品进行双重筛选,提高了商品的筛选精度,提升了用户在电商平台的体验感。
2、考虑到用户的喜好能够通过文字和图画来体现,因此本发明在提取预设历史时间段内用户浏览图像对应的图像特征时,分别对浏览图像中的文字区域和图画区域进行了分析,基于各特征通道图像中文字特征像素点集合中各像素点的通道值获得了文字区域对应的纹理风格特征指标,基于各特征通道图像中图画特征像素点集合中各像素点的通道值获得了图画区域对应的纹理风格特征指标;考虑到用户的喜好也能体现在图像的色彩信息上,因此本发明又基于浏览图像中像素点在R、G、B通道的值,得到了图画区域的色彩分布特征;基于文字区域对应的纹理风格特征指标、图画区域对应的纹理风格特征指标和图画区域的色彩分布特征对用户的历史行为信息进行了充分地分析,对用户的偏好取向以及潜在兴趣进行了准确地评估,进而能够有效地降低推荐给用户的商品与用户真正喜欢的商品之间的差异。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明提供的基于多维数据分析的电商数据运营管理系统的系统框图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于多维数据分析的电商数据运营管理系统进行详细说明如下。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于多维数据分析的电商数据运营管理系统的具体方案。
基于多维数据分析的电商数据运营管理系统实施例:
本实施例提供了基于多维数据分析的电商数据运营管理系统,通过大数据获取消费者在预设历史时间段内的浏览数据,提取浏览图像的ROI区域,基于ROI区域分析消费者喜好风格,建立ROI区域特征提取模型,获取消费者的意向商品种类特征参数,同时获取消费者的访问数据特征参数,用于对消费者进行自适应推荐商品。
如图1所示,本实施例的基于多维数据分析的电商数据运营管理系统包括数据采集模块、特征提取模块和管理推荐模块,接下来分别对各模块进行介绍。
Ⅰ.数据采集模块
本实施例的数据采集模块用于获取预设历史时间段内用户的浏览记录信息,所述浏览记录信息包括商品类型、浏览图像。
为了对用户的喜好风格进行分析,本实施例将对用户预设历史时间段内的浏览记录进行分析,通过大数据获取用户的浏览记录对应的浏览图像,基于对浏览图像的分析提取相应的ROI区域,并获取ROI区域的风格特征参数,同时,对用户的访问数据类型进行分析,分析用户对于每种商品的喜好程度,综合评估用户的喜好风格。
本实施例通过底层数据获取用户在预设历史时间段内的浏览记录信息,所述底层数据为相应电商平台公司内部的数据,通过后台大数据进行提取,用于基于多维数据对用户的喜好进行分析,所述浏览记录信息包括商品类型、浏览图像。本实施例设置预设历史时间段为近半年,在具体应用中,实施者可自行设置。
Ⅱ.特征提取模块
本实施例的特征提取模块用于获取浏览图像中的文字区域和图画区域,所述浏览图像中的文字区域和图画区域是基于语义分割网络得到的;基于特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中文字特征像素点集合中各像素点的通道值,得到各特征通道图像对应的文字特征向量,基于所述文字特征向量获得文字区域对应的纹理风格特征指标;基于浏览图像在特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中图画特征像素点集合中各像素点的通道值,得到各特征通道图像对应的图画特征向量,基于所述图画特征向量,得到图画区域对应的纹理风格特征指标;基于所述图画区域中各像素点在R、G、B通道的值,得到图画区域的色彩分布特征。
对于浏览图像,考虑到目前的广告图像中大多会包含各种各样的信息,存在较多无关信息对图像对应的商品风格识别造成干扰,而浏览图像中的关键信息主要为文字部分以及图画部分,因此为了提高数据分析精度,将文字区域以及图画区域作为本实施例重点分析的ROI区域,对浏览图像的ROI区域进行提取,以便识别浏览图像对应的商品风格类型。通过语义分割网络对ROI区域进行提取,语义分割网络采用现有的语义分割网络模型,网络输入为用户的浏览图像,网络输出为语义分割图,输入图像经特征提取编码器进行特征提取。需要说明的是,特征提取编码器为多层卷积层结构,对输入图像不断进行下采样完成特征提取操作,每一次下采样使得特征图像中的像素点在原始图像中的感受野变大,特征提取解码器对提取到的特征图像进行上采样得到与输入图像等大的语义分割图;网络的训练数据为浏览图像,对训练数据图像中像素点的像素值进行人工标注:将浏览图像中的文字部分像素点的像素值标记为1,图画部分像素点的像素值标记为2,其余区域像素点的像素值标记为0,得到标签数据;语义分割网络的损失函数采用交叉熵函数,语义分割网络的训练过程为现有技术,此处不再阐述。
对于预设历史时间段内的任一浏览图像:
将该浏览图像输入到训练好的语义分割网络中,得到该浏览图像中的ROI区域,所述ROI区域包括文字区域
Figure 529324DEST_PATH_IMAGE001
和图画区域
Figure 37666DEST_PATH_IMAGE002
。接下来将分别对浏览图像中的ROI区域的风格特征进行提取,所述风格特征用于表征ROI区域的纹理结构分布规律,纹理风格特征的提取将基于特征编码器对各部分提取的特征进行获取,考虑到语义分割网络的特征提取编码器每次采样时都是对浏览图像中的纹理结构特征的提取,因此,本实施例将基于各部分像素点的位置信息对各部分的风格特征进行提取,以获取各部分的特征参数。
接下来对文字区域
Figure 214438DEST_PATH_IMAGE001
进行特征提取,具体过程为:
获得浏览图像在特征提取编码器中每次下采样之后所对应的特征图像,对于任一特征图像,获取该特征图像中每个像素点
Figure 212350DEST_PATH_IMAGE003
在浏览图像中的感受野,记为
Figure 608827DEST_PATH_IMAGE004
,为了实现对文字部分风格特征的准确提取,本实施例将在该特征图像中获取能够体现文字部分风格特征的像素点集合,首先,获取该特征图像中
Figure 920860DEST_PATH_IMAGE003
位置的像素点的感受野与文字区域
Figure 217718DEST_PATH_IMAGE001
的重叠部分的大小:
Figure 589793DEST_PATH_IMAGE005
Figure 207988DEST_PATH_IMAGE006
用于表征该特征图像中
Figure 323711DEST_PATH_IMAGE003
位置的像素点的感受野与浏览图像中的文字部分的重叠程度,数值越大,表示该位置像素点的像素值越能反映文字部分的特征;本实施例对
Figure 475076DEST_PATH_IMAGE006
进行归一化处理,保证函数值处于[0,1],设置重叠程度阈值
Figure 565523DEST_PATH_IMAGE007
,将该特征图像中重叠部分高于
Figure 920281DEST_PATH_IMAGE008
的像素点作为文字特征像素点,获取该特征图像中所有的文字特征像素点,将其作为一个文字特征像素点集合,用于从特征图像中提取文字部分的特征信息。基于上述方法能够得到每张特征图像对应的文字特征像素点集合,即
Figure 94822DEST_PATH_IMAGE009
,其中,
Figure 585846DEST_PATH_IMAGE010
为第1张特征图像对应的文字特征像素点集合,
Figure 847194DEST_PATH_IMAGE011
为第2张特征图像对应的文字特征像素点集合,
Figure 954828DEST_PATH_IMAGE012
为第L张特征图像对应的文字特征像素点集合,L为特征提取编码器中卷积层的层数,也即特征图像的数量;每个集合所包含的像素点数量记为
Figure 396042DEST_PATH_IMAGE013
Figure 7152DEST_PATH_IMAGE014
,即第1张特征图像对应的文字特征像素点集合所包含的像素点数量为
Figure 908243DEST_PATH_IMAGE015
,第2张特征图像对应的文字特征像素点集合所包含的像素点数量为
Figure 237593DEST_PATH_IMAGE016
,第L张特征图像对应的文字特征像素点集合所包含的像素点数量为
Figure 748078DEST_PATH_IMAGE017
。在具体应用中,实施者可自行设置
Figure 761164DEST_PATH_IMAGE008
的值。
考虑到特征提取编码器所提取的特征图像均为多通道图像,本实施例对每张特征图像对应的文字特征像素点集合进行单独分析,以第j张特征图像对应的文字特征像素点集合
Figure 82424DEST_PATH_IMAGE018
为例进行纹理风格特征的提取,记第j张特征图像对应的通道数量为
Figure 882759DEST_PATH_IMAGE019
;获取每个通道所对应的特征通道图像,即
Figure 478825DEST_PATH_IMAGE020
,其中,
Figure 815260DEST_PATH_IMAGE021
为第j张特征图像对应的第1张特征通道图像,
Figure 307421DEST_PATH_IMAGE022
为第j张特征图像对应的第2张特征通道图像,
Figure 347051DEST_PATH_IMAGE023
为第j张特征图像对应的第
Figure 231961DEST_PATH_IMAGE019
张特征通道图像;获取每个特征通道图像中文字特征像素点集合中各像素点对应的通道值,然后基于各通道值获取每个特征通道图像对应的文字特征向量,对于第k个特征通道图像
Figure 734487DEST_PATH_IMAGE024
,其对应的文字特征向量
Figure 115658DEST_PATH_IMAGE025
,其中,
Figure 454367DEST_PATH_IMAGE018
为第j个文字特征像素点集合,
Figure 595498DEST_PATH_IMAGE026
为第j个文字特征像素点集合中的第
Figure 405060DEST_PATH_IMAGE013
个像素点,k为第k个特征通道图像,
Figure 973445DEST_PATH_IMAGE027
为第k个特征通道图像中第j个文字特征像素点集合对应的文字特征向量,
Figure 737133DEST_PATH_IMAGE028
为第k个特征通道图像中第j个文字特征像素点集合中第1个像素点对应的特征通道值,
Figure 681955DEST_PATH_IMAGE029
为第k个特征通道图像中第j个文字特征像素点集合中第2个像素点对应的特征通道值,
Figure 142761DEST_PATH_IMAGE030
为第k个特征通道图像中第j个文字特征像素点集合中第
Figure 882047DEST_PATH_IMAGE013
个像素点对应的特征通道值。
采用上述方法,能够得到特征图像对应的各特征通道图像对应的文字特征向量
Figure 929768DEST_PATH_IMAGE027
Figure 667829DEST_PATH_IMAGE031
。为了表征文字部分的结构特征,本实施例基于特征图像对应的各特征通道图像中的各文字特征向量之间的内积,获取各通道之间的特征关系,构建浏览图像中文字区域的像素点在该特征图像中的纹理风格矩阵:
Figure 937137DEST_PATH_IMAGE032
其中,
Figure 598056DEST_PATH_IMAGE033
为第1个特征通道图像对应的文字特征向量和第1个特征通道图像对应的文字特征向量的内积,
Figure 382341DEST_PATH_IMAGE034
为第1个特征通道图像对应的文字特征向量和第
Figure 918234DEST_PATH_IMAGE019
个特征通道图像对应的文字特征向量的内积,
Figure 307627DEST_PATH_IMAGE035
为第
Figure 405027DEST_PATH_IMAGE019
个特征通道图像对应的文字特征向量和第1个特征通道图像对应的文字特征向量的内积,
Figure 879871DEST_PATH_IMAGE036
为第
Figure 953875DEST_PATH_IMAGE019
个特征通道图像对应的文字特征向量和第
Figure 197774DEST_PATH_IMAGE019
个特征通道图像对应的文字特征向量的内积,
Figure 466076DEST_PATH_IMAGE037
为文字特征像素点集合
Figure 162636DEST_PATH_IMAGE018
对应的纹理风格特征矩阵,用于对文字部分的结构特征进行表征。
采用上述方法获得每张特征图像中文字特征像素点集合对应的纹理风格特征矩阵,进而得到文字区域对应的纹理风格特征指标
Figure 837069DEST_PATH_IMAGE038
Figure 686207DEST_PATH_IMAGE039
,其中,
Figure 109099DEST_PATH_IMAGE040
为文字特征像素点集合
Figure 801943DEST_PATH_IMAGE010
对应的纹理风格特征矩阵,
Figure 765219DEST_PATH_IMAGE041
为文字特征像素点集合
Figure 734444DEST_PATH_IMAGE011
对应的纹理风格特征矩阵,
Figure 328236DEST_PATH_IMAGE042
为文字特征像素点集合
Figure 45394DEST_PATH_IMAGE012
对应的纹理风格特征矩阵;同样的,通过本实施例所提供的方法获取图画区域对应的纹理风格特征指标
Figure 31936DEST_PATH_IMAGE043
,用于对用户的喜好风格特征进行分析评估。
考虑到用户对某个商品的喜欢也能体现在色彩信息上,因此,本实施例将进一步对图画区域的色彩特征进行提取,以便准确分析用户近期的商品喜好(包括商品类型、商品色彩等信息)。具体的,对浏览图像中的图画区域
Figure 104934DEST_PATH_IMAGE002
进行R、G、B通道分离,以获取各通道的图像数据,获取图画区域
Figure 384474DEST_PATH_IMAGE002
中各像素点在R、G、B通道的值,然后将色彩空间的每个通道的通道值分别量化为q个通道等级,本实施例设置通道等级q的值8,在具体应用中,实施者可根据实际情况自行设置;统计图画区域在各通道图像中各通道等级的分布状况,得到各通道对应的直方图,将其作为色彩分布特征:
Figure 542923DEST_PATH_IMAGE044
Figure 333156DEST_PATH_IMAGE045
为R通道对应的直方图,
Figure 260661DEST_PATH_IMAGE046
为G通道对应的直方图,
Figure 711102DEST_PATH_IMAGE047
为B通道对应的直方图,色彩分布特征用于对浏览图像中图画区域的色彩分布进行分析。所述直方图的具体获取方法为现有公知技术,此处不再阐述。
为了实现对用户进行自适应的精准推荐,本实施例将进一步对用户访问数据的类型进行分析,以便准确分析用户的喜好风格,所述访问数据类型为:感知数据,意向数据,吸引数据以及偏好数据,其中,感知数据为用户没有进行主动搜索,仅基于界面跳出的内容进行点击且没有购买过的商品数据;意向数据为用户在搜索框中进行主动搜索且没有购买的商品数据;吸引数据为用户在搜索框中进行搜索且近期内购买过一次的商品数据;偏好数据为用户在近期内多次有效购买的商品数据。
至此,得到了浏览图像的文字区域对应的纹理风格特征指标、图画区域对应的纹理风格特征指标、图画区域的色彩分布特征,以及浏览商品对应的访问数据类型。
Ⅲ.管理推荐模块
本实施例的管理推荐模块用于从数据库中的商品中筛选出候选商品构建候选商品库,所述候选商品是基于预设历史时间段内用户浏览商品对应的访问数据类型筛选出的;所述访问数据类型包括:感知数据、意向数据、吸引数据以及偏好数据;基于预设历史时间段内用户浏览图像对应的图像特征和候选商品库中各商品的图像对应的图像特征,从所述候选商品库中筛选出待推荐商品;所述图像特征包括:所述文字区域对应的纹理风格特征指标、所述图画区域对应的纹理风格特征指标和所述图画区域的色彩分布特征。
基于特征提取模块获得了用户预设历史时间段内浏览的商品的特征参数以及浏览的产品对应的访问数据类型,本实施例接下来将基于用户预设历史时间段内的访问数据类型对数据库中的商品进行初步筛选,以获取用户的候选商品。
具体的,对于数据库内的商品,首先根据本实施例上述访问数据分类过程分析其属于哪种类型的访问数据,然后分别获取数据库中感知数据、意向数据、吸引数据以及偏好数据对应的商品,将感知数据对应的商品进行滤除,将意向数据、吸引数据以及偏好数据对应的商品作为候选商品,基于候选商品构建候选商品库,以便对用户进行针对性的分析推荐。
本实施例将进一步基于文字区域对应的纹理风格特征指标、图画区域对应的纹理风格特征指标和图画区域的色彩分布特征对候选商品库中的商品进行再次筛选,再次筛选的过程具体为:获取预设历史时间段内用户的浏览数据,得到预设历史时间段内用户所有浏览图像对应的图像特征(文字区域对应的纹理风格特征指标、图画区域对应的纹理风格特征指标、图画区域的色彩分布特征),并将其作为标准特征库,用于对用户近期的喜好风格进行分析;然后,本实施例获取候选商品库中的商品的图像对应的图像特征(文字区域对应的纹理风格特征指标、图画区域对应的纹理风格特征指标、图画区域的色彩分布特征),获取候选商品库中各商品对应的图像特征与标准特征库中各浏览图像对应的图像特征之间的差异度,所述差异度为对应特征指标之间的距离,在具体应用中,实施者可自行定义差异度度量函数,在本实施例中,对于文字区域对应的纹理风格特征指标和图画区域对应的纹理风格特征指标采用候选商品库与标准库对应特征指标之间的欧氏距离之和
Figure 904317DEST_PATH_IMAGE048
,对于图画区域的色彩分布特征(色彩通道直方图),采用候选商品库与标准库对应色彩通道直方图之间对应通道等级直方图差值之和
Figure 950771DEST_PATH_IMAGE049
,以得到最终的差异度
Figure 253488DEST_PATH_IMAGE050
,基于上述方法,能够得到候选商品库中各商品的图像对应的图像特征与标准特征库中各浏览图像对应的图像特征之间的差异度,并对其进行归一化处理,本实施例设置差异度阈值
Figure 422301DEST_PATH_IMAGE051
,当差异度
Figure 837233DEST_PATH_IMAGE052
大于
Figure 936645DEST_PATH_IMAGE051
时,判定候选商品库内的对应商品与用户的喜好风格偏差过大,当差异度
Figure 635480DEST_PATH_IMAGE052
小于等于
Figure 663610DEST_PATH_IMAGE051
时,判定候选商品库内的对应商品与用户的喜好风格一致,将候选商品库中的该商品筛选出来,作为待推荐商品。至此,得到多个待推荐商品。本实施例设置
Figure 283947DEST_PATH_IMAGE051
的值为0.5,在具体应用中,实施者可自行设置。
为了提高用户的浏览满意度,本实施例基于差异度对待推荐商品的推荐顺序进行设置,以便对用户的浏览界面上推送的商品进行规划,差异度越小的商品对应的排序指标越大,排序指标越大商品推荐顺序越靠前,实施者也可根据实际情况进行自行设置,本实施例不做相关的阐述。
至此,即可通过本实施例提供的系统获取用户的访问数据,获取用户的喜好风格,同时基于所提取的特征参数对用户的待推荐商品进行双重筛选,以准确获取与用户偏好相对应的商品,自适应的为用户推荐商品,并基于待推荐商品与用户预设历史时间段内浏览商品的差异度,对待推荐商品的推荐顺序进行设置,以有效提高用户的购物满意度,提高电商运营数据的管理效率,保证高效、准确地对电商运营数据进行管理分析。
本实施例获取了预设历史时间段内用户的浏览记录信息,提取浏览图像中的文字区域和图画区域,基于文字区域和图画区域分析用户的喜好风格,排除了无关因素的影响,高效地提取了预设历史时间段内用户浏览图像对应的图像特征,同时获取了预设历史时间段内用户浏览商品对应的访问数据类型,基于预设历史时间段内用户浏览图像对应的图像特征和访问数据类型,对数据库中的商品进行双重筛选,提高了商品的筛选精度,提升了用户在电商平台的体验感。考虑到用户的喜好能够通过文字和图画来体现,因此本实施例在提取预设历史时间段内用户浏览图像对应的图像特征时,分别对浏览图像中的文字区域和图画区域进行了分析,基于各特征通道图像中文字特征像素点集合中各像素点的通道值获得了文字区域对应的纹理风格特征指标,基于各特征通道图像中图画特征像素点集合中各像素点的通道值获得了图画区域对应的纹理风格特征指标;考虑到用户的喜好也能体现在图像的色彩信息上,因此本实施例又基于浏览图像中像素点在R、G、B通道的值,得到了图画区域的色彩分布特征;基于文字区域对应的纹理风格特征指标、图画区域对应的纹理风格特征指标和图画区域的色彩分布特征对用户的历史行为信息进行了充分地分析,对用户的偏好取向以及潜在兴趣进行了准确地评估,进而能够有效地降低推荐给用户的商品与用户真正喜欢的商品之间的差异。
需要说明的是:以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于多维数据分析的电商数据运营管理系统,其特征在于,该系统包括:
数据采集模块:用于获取预设历史时间段内用户的浏览记录信息,所述浏览记录信息包括商品类型、浏览图像;
特征提取模块:用于获取浏览图像中的文字区域和图画区域,所述浏览图像中的文字区域和图画区域是基于语义分割网络得到的;基于特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中文字特征像素点集合中各像素点的通道值,得到各特征通道图像对应的文字特征向量,基于所述文字特征向量获得文字区域对应的纹理风格特征指标;基于浏览图像在特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中图画特征像素点集合中各像素点的通道值,得到各特征通道图像对应的图画特征向量,基于所述图画特征向量,得到图画区域对应的纹理风格特征指标;基于所述图画区域中各像素点在R、G、B通道的值,得到图画区域的色彩分布特征;
管理推荐模块:用于从数据库中的商品中筛选出候选商品构建候选商品库,所述候选商品是基于预设历史时间段内用户浏览商品对应的访问数据类型筛选出的;所述访问数据类型包括:感知数据、意向数据、吸引数据以及偏好数据;基于预设历史时间段内用户浏览图像对应的图像特征和候选商品库中各商品的图像对应的图像特征,从所述候选商品库中筛选出待推荐商品;所述图像特征包括:所述文字区域对应的纹理风格特征指标、所述图画区域对应的纹理风格特征指标和所述图画区域的色彩分布特征;所述感知数据为用户没有进行主动搜索,仅基于界面跳出的内容进行点击且没有购买过的商品数据;所述意向数据为用户在搜索框中进行主动搜索且没有购买的商品数据;所述吸引数据为用户在搜索框中进行搜索且近期内购买过一次的商品数据;所述偏好数据为用户在近期内多次有效购买的商品数据。
2.根据权利要求1所述的基于多维数据分析的电商数据运营管理系统,其特征在于,各特征通道图像中文字特征像素点集合的获取,包括:
获取特征图像中各像素点的感受野与浏览图像中文字区域的重叠程度;
对所述重叠程度进行归一化处理,将特征图像中归一化重叠程度高于重叠程度阈值的像素点作为文字特征像素点,基于所述文字特征像素点获得特征图像对应的各特征通道图像中文字特征像素点集合。
3.根据权利要求1所述的基于多维数据分析的电商数据运营管理系统,其特征在于,所述基于特征提取编码器中每次下采样之后对应的特征图像对应的各特征通道图像中文字特征像素点集合中各像素点的通道值,得到各特征通道图像对应的文字特征向量,包括:
对于任一特征图像:
获取该特征图像对应的各特征通道图像,选取任一特征通道图像作为目标通道图像,根据所述目标通道图像中文字特征像素点集合中各像素点的通道值,构建目标特征通道图像对应的文字特征向量。
4.根据权利要求1所述的基于多维数据分析的电商数据运营管理系统,其特征在于,所述基于所述文字特征向量获得文字区域对应的纹理风格特征指标,包括:
对于任一特征图像:基于该特征图像对应的各特征通道图像中的各文字特征向量之间的内积,构建该特征图像中文字特征像素点集合对应的纹理风格特征矩阵;
根据各特征图像中文字特征像素点集合对应的纹理风格特征矩阵,得到文字区域对应的纹理风格特征指标。
5.根据权利要求1所述的基于多维数据分析的电商数据运营管理系统,其特征在于,所述基于所述图画区域中各像素点在R、G、B通道的值,得到图画区域的色彩分布特征,包括:
分别将色彩空间各通道的通道值量化为预设数量个通道等级,根据图画区域中各像素点在R、G、B通道的值,得到各通道对应的直方图;
根据所述各通道对应的直方图,得到图画区域的色彩分布特征。
6.根据权利要求1所述的基于多维数据分析的电商数据运营管理系统,其特征在于,所述从数据库中的商品中筛选出候选商品构建候选商品库,包括:
获取数据库中的各商品对应的访问数据类型;
将数据库中意向数据、吸引数据以及偏好数据对应的商品作为候选商品,基于所述候选商品构建候选商品库。
7.根据权利要求1所述的基于多维数据分析的电商数据运营管理系统,其特征在于,所述基于预设历史时间段内用户浏览图像对应的图像特征和候选商品库中各商品的图像对应的图像特征,从所述候选商品库中筛选出待推荐商品,包括:
获取候选商品库中各商品对应的图像特征与标准特征库中各浏览图像对应的图像特征之间的差异度;
将所述差异度小于等于差异度阈值的候选商品库中的对应商品作为待推荐商品。
CN202210995658.5A 2022-08-19 2022-08-19 基于多维数据分析的电商数据运营管理系统 Active CN115080865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210995658.5A CN115080865B (zh) 2022-08-19 2022-08-19 基于多维数据分析的电商数据运营管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210995658.5A CN115080865B (zh) 2022-08-19 2022-08-19 基于多维数据分析的电商数据运营管理系统

Publications (2)

Publication Number Publication Date
CN115080865A CN115080865A (zh) 2022-09-20
CN115080865B true CN115080865B (zh) 2022-11-04

Family

ID=83244286

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210995658.5A Active CN115080865B (zh) 2022-08-19 2022-08-19 基于多维数据分析的电商数据运营管理系统

Country Status (1)

Country Link
CN (1) CN115080865B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115471302B (zh) * 2022-11-14 2023-02-14 山东智豆数字科技有限公司 基于大数据分析的电子营销数据处理方法
CN117611245B (zh) * 2023-12-14 2024-05-31 浙江博观瑞思科技有限公司 用于电商运营活动策划的数据分析管理系统及方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009251850A (ja) * 2008-04-04 2009-10-29 Albert:Kk 類似画像検索を用いた商品推薦システム
CN107292642A (zh) * 2016-03-31 2017-10-24 苏宁云商集团股份有限公司 一种基于图像的商品推荐方法及系统
CN107679960A (zh) * 2017-10-12 2018-02-09 东北大学 一种基于服装图像和标签文本双模态内容分析的个性化服装的推荐方法
CN107730343A (zh) * 2017-09-15 2018-02-23 广州唯品会研究院有限公司 一种基于图片属性提取的用户商品信息推送方法及设备
KR101896404B1 (ko) * 2017-09-29 2018-09-07 오명운 컴퓨터 비전을 이용한 상품 추천 시스템
CN112256891A (zh) * 2020-10-26 2021-01-22 北京达佳互联信息技术有限公司 多媒体资源的推荐方法、装置、电子设备及存储介质
CN113450178A (zh) * 2021-05-13 2021-09-28 孙昊盛 一种基于互联网的电商精准营销系统
CN114494763A (zh) * 2021-12-17 2022-05-13 浙江大学 基于特征融合的商品详情图版式分类方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9898773B2 (en) * 2014-11-18 2018-02-20 Microsoft Technology Licensing, Llc Multilingual content based recommendation system
CN104881798A (zh) * 2015-06-05 2015-09-02 北京京东尚科信息技术有限公司 基于商品图像特征的个性化搜索装置及方法
JP6450473B2 (ja) * 2015-11-27 2019-01-09 株式会社イーシーバード 商品/サービスの購入支援方法及びシステム並びにプログラム
CN105787770A (zh) * 2016-04-27 2016-07-20 上海遥薇(集团)有限公司 一种基于nmf算法的大数据商品及服务推荐方法及系统
CN107862561A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种基于图片属性提取建立用户兴趣库的方法及设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009251850A (ja) * 2008-04-04 2009-10-29 Albert:Kk 類似画像検索を用いた商品推薦システム
CN107292642A (zh) * 2016-03-31 2017-10-24 苏宁云商集团股份有限公司 一种基于图像的商品推荐方法及系统
CN107730343A (zh) * 2017-09-15 2018-02-23 广州唯品会研究院有限公司 一种基于图片属性提取的用户商品信息推送方法及设备
KR101896404B1 (ko) * 2017-09-29 2018-09-07 오명운 컴퓨터 비전을 이용한 상품 추천 시스템
CN107679960A (zh) * 2017-10-12 2018-02-09 东北大学 一种基于服装图像和标签文本双模态内容分析的个性化服装的推荐方法
CN112256891A (zh) * 2020-10-26 2021-01-22 北京达佳互联信息技术有限公司 多媒体资源的推荐方法、装置、电子设备及存储介质
CN113450178A (zh) * 2021-05-13 2021-09-28 孙昊盛 一种基于互联网的电商精准营销系统
CN114494763A (zh) * 2021-12-17 2022-05-13 浙江大学 基于特征融合的商品详情图版式分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向电商的多模态商品检索引擎设计;潘巍等;《智能计算机与应用》;20220731;第12卷(第7期);第202-205页 *

Also Published As

Publication number Publication date
CN115080865A (zh) 2022-09-20

Similar Documents

Publication Publication Date Title
CN115080865B (zh) 基于多维数据分析的电商数据运营管理系统
Cetinic et al. A deep learning perspective on beauty, sentiment, and remembrance of art
Diem et al. cBAD: ICDAR2017 competition on baseline detection
CN106682108A (zh) 一种基于多模态卷积神经网络的视频检索方法
US20130101209A1 (en) Method and system for extraction and association of object of interest in video
US12019707B2 (en) Systems, methods, and storage media for training a model for image evaluation
CN106446015A (zh) 一种基于用户行为偏好的视频内容访问预测与推荐方法
Cetinic et al. Learning the principles of art history with convolutional neural networks
Romero et al. Using complexity estimates in aesthetic image classification
Lee et al. Style classification and visualization of art painting’s genre using self-organizing maps
CN108447064B (zh) 一种图片处理方法及装置
CN107247919A (zh) 一种视频情感内容的获取方法及系统
CN113761253A (zh) 视频标签确定方法、装置、设备及存储介质
CN111339439A (zh) 一种融合评论文本与时序效应的协同过滤推荐方法和装置
Zhang et al. Contrast preserving image decolorization combining global features and local semantic features
CN113762138A (zh) 伪造人脸图片的识别方法、装置、计算机设备及存储介质
CN112199582A (zh) 一种内容推荐方法、装置、设备及介质
CN112528058A (zh) 基于图像属性主动学习的细粒度图像分类方法
CN117746143A (zh) 基于aigc的图像描述文本的生成方法及装置、存储介质
CN111581435A (zh) 一种视频封面图像生成方法、装置、电子设备及存储介质
CN116862626B (zh) 一种多模态商品对齐方法
Jayanthiladevi et al. Text, images, and video analytics for fog computing
CN112464106B (zh) 对象推荐方法及装置
Zujovic et al. Effective and efficient subjective testing of texture similarity metrics
WO2023248061A1 (en) Furniture recommendation method and system using artificial intelligence and augmented reality

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant