CN113643101A - 一种基于图数据库的商品热度计算方法及系统 - Google Patents
一种基于图数据库的商品热度计算方法及系统 Download PDFInfo
- Publication number
- CN113643101A CN113643101A CN202111001895.7A CN202111001895A CN113643101A CN 113643101 A CN113643101 A CN 113643101A CN 202111001895 A CN202111001895 A CN 202111001895A CN 113643101 A CN113643101 A CN 113643101A
- Authority
- CN
- China
- Prior art keywords
- commodity
- data
- heat
- user
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 32
- 238000013499 data model Methods 0.000 claims abstract description 29
- 230000004931 aggregating effect Effects 0.000 claims abstract description 7
- 238000004458 analytical method Methods 0.000 claims abstract description 6
- 239000002360 explosive Substances 0.000 claims description 32
- 238000011156 evaluation Methods 0.000 claims description 27
- 239000000463 material Substances 0.000 claims description 16
- 230000002349 favourable effect Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 230000006399 behavior Effects 0.000 claims description 6
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000013500 data storage Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 4
- 230000002085 persistent effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000002355 dual-layer Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于图数据库的商品热度计算方法及系统。该方法包括:构建关于商品、用户与至少两个业务模块之间的实体关系的图数据模型并导入图数据库;抽取并聚合业务数据库中的原始业务数据,形成物化视图,使物化视图中的数据与图数据模型中的顶点和边建立对应关系,并将物化视图中的数据导入图数据库;从图数据库中调取与商品实体具有实体关系的业务模块实体和用户实体关联的业务数据,并按照预设逻辑计算该商品的商品热度。本发明提供的技术方案,利用图数据库的数据存储特点,有效的利用商品与各个业务模块与商品的关联关系,构建了一种利用全部业务模块数据的统一商品热度分析方法,提高了商品热度计算值的科学性与准确性。
Description
技术领域
本发明涉及软件工程,具体属于图数据库应用领域。
背景技术
随着电商领域的快速发展与繁荣,线上消费成为大众购买商品的主流方式。面对海量的商品信息与瞬息万变的消费流行趋势,科学有效的判断时下最流行的商品,针对商品热度形成量化的评分体系成为了电商行业一个重要的业务需求。现有的电商平台上会通过设置多个业务模块,各个业务模块以不同的形式和侧重点来推荐商品,例如,以更加侧重优惠的价格信息来推荐商品的业务模块,通过提供深度的评测文章内容来推荐商品的业务模块,以及通过提供规范化的商品信息数据来推荐商品的业务模块等。
技术方案现状方面,有一些独立的计算商品热度的方法,例如,通过采集分析商品相关的评测文章的点赞、收藏、评论的数量进行商品热度的评估;又如,专利研究方面,专利申请号为:CN201710389131.7的《一种基于时间和空间的电商热度排名的方法和装置》研究了商品热度与时间、地理位置之间的关系;申请号为:CN202010468105.5的《一种基于排序学习的商品热度排名方法》使用了机器学习的方法来预测未来商品的热度。
以上现有的技术方案均局限于利用单个业务模块内的数据进行商品热度分析,没有和其他业务模块的数据进行结合,会出现热度评估值相对局限的情况。例如,根据某一业务模块中的评测文章计算得到的热度评估值比较高,但是这个热度不能反映另一业务模块的价格敏感的商品热度情况。并且,由于平台中的业务数据一般基于关系型数据库存储,不同业务模块的数据存储比较分散,查询跨业务模块的查询需要关联多张表,存在性能瓶颈问题。
发明内容
为克服相关技术中存在的问题,本发明提供一种基于图数据库的商品热度计算方法及系统,利用图数据库的数据存储特点,有效的利用商品与好价、社区、百科三个模块与商品的关联关系,构建了一个利用全站数据的热度计算算法,可以有效的解决跨业务模块的商品热度计算困难的问题。
根据本发明实施例的第一方面,提供一种基于图数据库的商品热度计算方法,包括:
构建关于商品、用户与至少两个业务模块之间的实体关系的图数据模型并导入图数据库;
抽取并聚合业务数据库中的原始业务数据,形成物化视图,使所述物化视图中的数据与所述图数据模型中的顶点和边建立对应关系,并将所述物化视图中的数据导入所述图数据库;
从所述图数据库中调取与商品实体具有实体关系的业务模块实体和用户实体关联的业务数据,并按照预设逻辑计算该商品的商品热度。
进一步,所述业务模块包括百科、好价和社区三个业务模块,所述图数据模型由商品、用户、百科、好价和社区五个实体的顶点及各个顶点之间的边构成,其中,百科、好价、社区三个顶点与商品顶点之间的边,定义为“推荐”关系,百科、好价、社区三个顶点与作为创作者的用户顶点之间的边,定义为“创作”关系。
进一步,所述从所述图数据库中调取与商品具有实体关系的业务模块的业务数据,并按照预设逻辑计算该商品的商品热度,具体包括:
分析百科的口碑数据,好价的点值、收藏、评论数据,社区好文的点赞、收藏、评论数据;通过以上数据构建商品热度计算算法,利用商品、用户和三个业务模块之间的关联关系分别计算用户口碑评测分数、好价爆料热度指数和社区文章热度指数;根据所述用户口碑评测分数、好价爆料热度指数和社区文章热度指数进行商品热度值计算。
进一步,所述用户口碑评测分数的计算过程,具体包括:
针对与商品顶点具有“推荐”关系的百科业务顶点,使用百科业务中的商品口碑数据作为商品热度计算的指标,商品的用户口碑评测分数等于单个评论贡献度分值的累加和,单个评论贡献度分值=score1*时间衰减系数,其中score1是[0,1]区间中的数值,通过对评论的内容进行情感分析计算得出,0代表最负面的评价,1代表最正面的评价,时间衰减系数为:1/(log(t+1)+1),其中t为当前年份与评论年份的差值。
进一步,所述好价爆料热度指数的计算过程,具体包括:
针对与商品顶点具有“推荐”关系的好价业务顶点,使用好价爆料的用户行为数据与作者评级数据作为商品热度计算指标,商品的好价爆料热度等于所有与该商品关联的好价爆料热度累加和,一篇好价爆料的好价爆料热度指数=score2*时间衰减系数,其中score2=(点值数+收藏数+评论数)*创作者用户权重系数;其中创作者用户权重系数通过与百科、好价、社区业务顶点具有“创作”关系的边所对应的用户顶点构成的集合中查询出,是根据用户等级与粉丝数进行归一化处理后的[0,1]区间中的数值;时间衰减系数为:1/(log(t+1)+1),其中t为当前日期与好价爆料日期的差值。
进一步,所述好价爆料热度指数的计算过程,具体包括:
针对与商品顶点具有“推荐”关系的社区业务顶点,使用社区文章的用户行为数据与作者评级数据作为商品热度计算指标,社区文章热度等于所有与该商品关联的社区文章热度累加和,一篇社区文章热度指数=score3*时间衰减系数,其中score3=(点赞数+收藏数+评论数)*创作者用户权重系数;其中创作者用户权重系数通过与百科、好价、社区业务顶点具有“创作”关系的边所对应的用户顶点构成的集合中查询出,是根据用户等级与粉丝数进行归一化处理后的[0,1]区间中的数值;时间衰减系数为:1/(log(t+1)+1),其中t为当前月份与文章发布月份的差值。
进一步,所述根据所述用户口碑评测分数、好价爆料热度指数和社区文章热度指数进行商品热度值计算,具体包括:
将所述用户口碑评测分数、好价爆料热度指数和社区文章热度指数相加,得出最终的商品热度计算值结果。
根据本发明实施例的第二方面,提供一种基于图数据库的商品热度计算系统,包括:
图数据模型模块,用于构建关于商品、用户与至少两个业务模块之间的实体关系的图数据模型并导入图数据库;
数据同步模块,用于抽取并聚合业务数据库中的原始业务数据,形成物化视图,使所述物化视图中的数据与所述图数据模型中的顶点和边建立对应关系,并将所述物化视图中的数据导入所述图数据库;
商品热度计算模块,用于从所述图数据库中调取与商品实体具有实体关系的业务模块实体和用户实体关联的业务数据,并按照预设逻辑计算该商品的商品热度。
根据本发明实施例的第三方面,提供一种终端设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
根据本发明实施例的第四方面,提供一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
本发明的实施例提供的技术方案可以包括以下有益效果:
利用图数据库的数据存储特点,有效的利用商品与各个业务模块与商品的关联关系,构建了一种利用全部业务模块数据的统一商品热度分析方法,提高了商品热度计算值的科学性与准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
通过结合附图对本发明示例性实施方式进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,其中,在本发明示例性实施方式中,相同的参考标号通常代表相同部件。
图1是根据本发明一示例性实施例示出的一种基于图数据库的商品热度计算方法的流程示意图;
图2是本发明实施例示出的图数据模型的示意图。
具体实施方式
下面将参照附图更详细地描述本发明的优选实施方式。虽然附图中显示了本发明的优选实施方式,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以下结合附图详细描述本发明实施例的技术方案。
图1是根据本发明一示例性实施例示出的一种基于图数据库的商品热度计算方法的流程示意图。
参见图1,该方法包括:
110、构建关于商品、用户与至少两个业务模块之间的实体关系的图数据模型并导入图数据库。
具体的,该步骤中,首先根据商品属性业务逻辑,可抽象出实体关系模型中的实体,如图2所示,该实体关系模型中包含五个实体:百科、好价、社区、商品、用户。进一步,根据商品属性业务逻辑,还可进一步抽象出实体关系模型中的关系,具体的,如图2所示,建立百科、好价、社区三个实体与商品实体之间的边,定义为“推荐”;建立百科、好价、社区三个实体与创作者用户之间的边,定义为“创作”。最后,将上述的实体与关系使用Groovy语言进行描述,保存于model.groovy文件。初始化hugegraph图数据库,导入model.groovy中保存的图模型。
120、抽取并聚合业务数据库中的原始业务数据,形成物化视图,使所述物化视图中的数据与所述图数据模型中的顶点和边建立对应关系,并将所述物化视图中的数据导入所述图数据库。
具体的,该步骤中,首先需要在关系型业务数据库与hugegraph图数据的同步工具loader之间建立jdbc连接。然后,在关系型业务数据库中创建物化视图,聚合原始业务数据。最后,通过loader工具装载物化视图中的数据到图数据库中,完成数据的初始化。
这里的关系型数据库可采用Doris,这是一个有着MPP架构的分析型数据库产品,对于PB数量级、结构化数据可以做到亚秒级查询响应,使用上兼容MySQL协议,语法是标准的SQL。具体见收藏夹栏。
130、从所述图数据库中调取与商品实体具有实体关系的业务模块实体和用户实体关联的业务数据,并按照预设逻辑计算该商品的商品热度。
具体的,该步骤具体包括:分析百科的口碑数据,好价的点值、收藏、评论数据,社区好文的点赞、收藏、评论数据;通过以上数据构建商品热度计算算法,利用商品、用户和三个业务模块之间的关联关系分别计算用户口碑评测分数、好价爆料热度指数和社区文章热度指数;根据所述用户口碑评测分数、好价爆料热度指数和社区文章热度指数进行商品热度值计算。
可选地,在该实施例中,用户口碑评测分数、好价爆料热度指数和社区文章热度指数的具体计算过程如下:
A、通过商品顶点为起点,查询具有“推荐”关系的边所对应的百科、好价、社区业务顶点,记为集合S,由集合S进一步查询具有“创作”关系的边所对应的用户顶点,记为集合U。
B、针对集合S中的百科业务顶点,使用百科业务中商品口碑数据作为商品热度计算的指标:商品的用户口碑评测分数等于单个评论贡献度分值的累加和。单个评论贡献度分值=score1*时间衰减系数。其中score1是[0,1]区间中的数值,通过对评论的内容进行情感分析计算得出,0代表最负面的评价,1代表最正面的评价,时间衰减系数为:1/(log(t+1)+1),其中t为当前年份与评论年份的差值。
C、针对集合S中的好价业务顶点,使用好价爆料的用户行为数据与作者评级数据作为商品热度计算指标:商品的好价爆料热度等于所有与该商品关联的好价爆料热度累加和。一篇好价爆料热度指数=score2*时间衰减系数。其中score2=(点值数+收藏数+评论数)*创作者用户权重系数;其中创作者用户权重系数通过上文的U集合中查询出,是根据用户等级与粉丝数进行归一化处理后的[0,1]区间中的数值;时间衰减系数为:1/(log(t+1)+1),其中t为当前日期与好价爆料日期的差值。
D、针对集合S中的社区业务顶点,使用社区文章的用户行为数据与作者评级数据作为商品热度计算指标:社区文章热度等于所有与该商品关联的社区文章热度累加和。一篇社区文章热度指数=score3*时间衰减系数。其中score3=(点赞数+收藏数+评论数)*创作者用户权重系数;其中创作者用户权重系数通过上文关的U集合中查询出,是根据用户等级与粉丝数进行归一化处理后的[0,1]区间中的数值;时间衰减系数为:1/(log(t+1)+1),其中t为当前月份与文章发布月份的差值。
E、将B、C、D中的计算结果相加,得出最终的商品热度计算值结果。
可选地,在该实施例中,为方便各业务方进行调用,如图1所示,该方法还包括:
140、根据用户请求提供实时的商品热度查询与计算服务。
具体的,该步骤可通过搭建微服务模块的方式来实现,具体可按照以下步骤进行:
A、搭建Springboot服务,基于图数据库的java客户端封装查询接口。
B、封装查询单个商品热度值的服务,输入单个商品的id,返回该商品的热度值;封装查询多个商品热度值排名的服务,输入商品id的列表,返回该列表中商品热度的排序关系列表;封装查询top100热度值商品的服务,输入商品的分类id,输出该分类id下的top100热度值的商品列表。
与上述方法实施例相对应地,本发明示例性实施例提供一种基于图数据库的商品热度计算系统,包括:
图数据模型模块,用于构建关于商品、用户与至少两个业务模块之间的实体关系的图数据模型并导入图数据库;
数据同步模块,用于抽取并聚合业务数据库中的原始业务数据,形成物化视图,使所述物化视图中的数据与所述图数据模型中的顶点和边建立对应关系,并将所述物化视图中的数据导入所述图数据库;
商品热度计算模块,用于从所述图数据库中调取与商品实体具有实体关系的业务模块实体和用户实体关联的业务数据,并按照预设逻辑计算该商品的商品热度。
可选地,该系统还包括:
微服务模块,用于根据用户请求提供实时的商品热度查询与计算服务。
关于上述实施例中的系统,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
根据本发明的方法可以实现为一种计算设备,包括存储器和处理器。
处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。其中,ROM可以存储处理器或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
存储器上存储有可执行代码,当可执行代码被处理器处理时,可以使处理器执行上文述及的方法中的部分或全部。
此外,根据本发明的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本发明的上述方法中部分或全部步骤的计算机程序代码指令。
或者,本发明还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质),其上存储有可执行代码(或计算机程序、或计算机指令代码),当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或计算设备、服务器等)的处理器执行时,使所述处理器执行根据本发明的上述方法的各个步骤的部分或全部。
上文中已经参考附图详细描述了本发明的方案。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。本领域技术人员也应该知悉,说明书中所涉及的动作和模块并不一定是本发明所必须的。另外,可以理解,本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减,本发明实施例装置中的模块可以根据实际需要进行合并、划分和删减。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。
附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (10)
1.一种基于图数据库的商品热度计算方法,其特征在于,包括:
构建关于商品、用户与至少两个业务模块之间的实体关系的图数据模型并导入图数据库;
抽取并聚合业务数据库中的原始业务数据,形成物化视图,使所述物化视图中的数据与所述图数据模型中的顶点和边建立对应关系,并将所述物化视图中的数据导入所述图数据库;
从所述图数据库中调取与商品实体具有实体关系的业务模块实体和用户实体关联的业务数据,并按照预设逻辑计算该商品的商品热度。
2.根据权利要求1所述的方法,其特征在于,所述业务模块包括百科、好价和社区三个业务模块,所述图数据模型由商品、用户、百科、好价和社区五个实体的顶点及各个顶点之间的边构成,其中,百科、好价、社区三个顶点与商品顶点之间的边,定义为“推荐”关系,百科、好价、社区三个顶点与作为创作者的用户顶点之间的边,定义为“创作”关系。
3.根据权利要求2所述的方法,其特征在于,所述从所述图数据库中调取与商品具有实体关系的业务模块的业务数据,并按照预设逻辑计算该商品的商品热度,具体包括:
分析百科的口碑数据,好价的点值、收藏、评论数据,社区好文的点赞、收藏、评论数据;通过以上数据构建商品热度计算算法,利用商品、用户和三个业务模块之间的关联关系分别计算用户口碑评测分数、好价爆料热度指数和社区文章热度指数;根据所述用户口碑评测分数、好价爆料热度指数和社区文章热度指数进行商品热度值计算。
4.根据权利要求3所述的方法,其特征在于,所述用户口碑评测分数的计算过程,具体包括:
针对与商品顶点具有“推荐”关系的百科业务顶点,使用百科业务中的商品口碑数据作为商品热度计算的指标,商品的用户口碑评测分数等于单个评论贡献度分值的累加和,单个评论贡献度分值=score1*时间衰减系数,其中score1是[0,1]区间中的数值,通过对评论的内容进行情感分析计算得出,0代表最负面的评价,1代表最正面的评价,时间衰减系数为:1/(log(t+1)+1),其中t为当前年份与评论年份的差值。
5.根据权利要求3所述的方法,其特征在于,所述好价爆料热度指数的计算过程,具体包括:
针对与商品顶点具有“推荐”关系的好价业务顶点,使用好价爆料的用户行为数据与作者评级数据作为商品热度计算指标,商品的好价爆料热度等于所有与该商品关联的好价爆料热度累加和,一篇好价爆料的好价爆料热度指数=score2*时间衰减系数,其中score2=(点值数+收藏数+评论数)*创作者用户权重系数;其中创作者用户权重系数通过与百科、好价、社区业务顶点具有“创作”关系的边所对应的用户顶点构成的集合中查询出,是根据用户等级与粉丝数进行归一化处理后的[0,1]区间中的数值;时间衰减系数为:1/(log(t+1)+1),其中t为当前日期与好价爆料日期的差值。
6.根据权利要求3所述的方法,其特征在于,所述好价爆料热度指数的计算过程,具体包括:
针对与商品顶点具有“推荐”关系的社区业务顶点,使用社区文章的用户行为数据与作者评级数据作为商品热度计算指标,社区文章热度等于所有与该商品关联的社区文章热度累加和,一篇社区文章热度指数=score3*时间衰减系数,其中score3=(点赞数+收藏数+评论数)*创作者用户权重系数;其中创作者用户权重系数通过与百科、好价、社区业务顶点具有“创作”关系的边所对应的用户顶点构成的集合中查询出,是根据用户等级与粉丝数进行归一化处理后的[0,1]区间中的数值;时间衰减系数为:1/(log(t+1)+1),其中t为当前月份与文章发布月份的差值。
7.根据权利要求3-6任一项所述的方法,其特征在于,所述根据所述用户口碑评测分数、好价爆料热度指数和社区文章热度指数进行商品热度值计算,具体包括:
将所述用户口碑评测分数、好价爆料热度指数和社区文章热度指数相加,得出最终的商品热度计算值结果。
8.一种基于图数据库的商品热度计算系统,其特征在于,包括:
图数据模型模块,用于构建关于商品、用户与至少两个业务模块之间的实体关系的图数据模型并导入图数据库;
数据同步模块,用于抽取并聚合业务数据库中的原始业务数据,形成物化视图,使所述物化视图中的数据与所述图数据模型中的顶点和边建立对应关系,并将所述物化视图中的数据导入所述图数据库;
商品热度计算模块,用于从所述图数据库中调取与商品实体具有实体关系的业务模块实体和用户实体关联的业务数据,并按照预设逻辑计算该商品的商品热度。
9.一种终端设备,其特征在于,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。
10.一种非暂时性机器可读存储介质,其上存储有可执行代码,其特征在于,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111001895.7A CN113643101A (zh) | 2021-08-30 | 2021-08-30 | 一种基于图数据库的商品热度计算方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111001895.7A CN113643101A (zh) | 2021-08-30 | 2021-08-30 | 一种基于图数据库的商品热度计算方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113643101A true CN113643101A (zh) | 2021-11-12 |
Family
ID=78424473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111001895.7A Pending CN113643101A (zh) | 2021-08-30 | 2021-08-30 | 一种基于图数据库的商品热度计算方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113643101A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105096152A (zh) * | 2014-05-20 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 一种基于商品热度的操作执行方法及装置 |
CN110489651A (zh) * | 2019-08-23 | 2019-11-22 | 武汉美之修行信息科技有限公司 | 基于用户行为的商品热度评测方法及装置 |
CN111275514A (zh) * | 2020-01-07 | 2020-06-12 | 载信软件(上海)有限公司 | 一种智能采购方法及系统、存储介质和电子装置 |
KR20200088131A (ko) * | 2019-01-14 | 2020-07-22 | 카페24 주식회사 | 그래프 데이터베이스를 이용한 상품 추천 방법 및 장치 |
CN111723251A (zh) * | 2020-06-19 | 2020-09-29 | 浪潮电子信息产业股份有限公司 | 一种图数据库数据导入的方法、系统及设备 |
CN112258301A (zh) * | 2020-12-08 | 2021-01-22 | 北京天通慧智科技有限公司 | 商品推荐方法、装置、系统、可读存储介质及电子设备 |
CN112330427A (zh) * | 2021-01-05 | 2021-02-05 | 中智关爱通(南京)信息科技有限公司 | 用于商品排序的方法、电子设备和存储介质 |
-
2021
- 2021-08-30 CN CN202111001895.7A patent/CN113643101A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105096152A (zh) * | 2014-05-20 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 一种基于商品热度的操作执行方法及装置 |
KR20200088131A (ko) * | 2019-01-14 | 2020-07-22 | 카페24 주식회사 | 그래프 데이터베이스를 이용한 상품 추천 방법 및 장치 |
CN110489651A (zh) * | 2019-08-23 | 2019-11-22 | 武汉美之修行信息科技有限公司 | 基于用户行为的商品热度评测方法及装置 |
CN111275514A (zh) * | 2020-01-07 | 2020-06-12 | 载信软件(上海)有限公司 | 一种智能采购方法及系统、存储介质和电子装置 |
CN111723251A (zh) * | 2020-06-19 | 2020-09-29 | 浪潮电子信息产业股份有限公司 | 一种图数据库数据导入的方法、系统及设备 |
CN112258301A (zh) * | 2020-12-08 | 2021-01-22 | 北京天通慧智科技有限公司 | 商品推荐方法、装置、系统、可读存储介质及电子设备 |
CN112330427A (zh) * | 2021-01-05 | 2021-02-05 | 中智关爱通(南京)信息科技有限公司 | 用于商品排序的方法、电子设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
李锐等: "《UEP Cloud实训教程》", 31 January 2019, 华南理工大学出版社, pages: 19 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230316442A1 (en) | Document term recognition and analytics | |
US20130297382A1 (en) | Network transaction platform and processing method thereof | |
US10122811B2 (en) | Method for determining identities between users | |
CN106557480B (zh) | 查询改写的实现方法及装置 | |
CN107633416B (zh) | 一种业务对象的推荐方法、装置和系统 | |
US8799193B2 (en) | Method for training and using a classification model with association rule models | |
US9639848B1 (en) | Diffusion prediction based on indicator scoring | |
US11367117B1 (en) | Artificial intelligence system for generating network-accessible recommendations with explanatory metadata | |
WO2017148272A1 (zh) | 一种目标用户的识别方法和装置 | |
CN110929109A (zh) | 用于数据中台的数据查询方法及装置 | |
JP6199958B2 (ja) | ユーザー推奨方法および装置 | |
CN107679186B (zh) | 基于实体库进行实体搜索的方法及装置 | |
KR20190081671A (ko) | 온라인 쇼핑몰 통합 관리 시스템에서의 유사상품을 검색하는 방법 및 그 서버 | |
CN110874786A (zh) | 虚假交易团伙识别方法、设备及计算机可读介质 | |
US20180232750A1 (en) | Systems and methods for predicting customer behavior from social media activity | |
CN110427545B (zh) | 一种信息推送方法及系统 | |
JP7261095B2 (ja) | ビジネスマッチング支援装置、及びビジネスマッチング支援方法 | |
Cherednichenko et al. | Towards improving the search quality on the trading platforms | |
CN113643101A (zh) | 一种基于图数据库的商品热度计算方法及系统 | |
CN111125499A (zh) | 数据查询方法及装置 | |
CN113609175A (zh) | 一种基于图数据库的电商商品属性数据处理方法及装置 | |
Cherednichenko et al. | Information technology for intellectual analysis of item descriptions in e-commerce | |
CN114723354A (zh) | 一种针对供应商的线上商机挖掘方法、设备及介质 | |
CN111582905A (zh) | 一种目标对象获取方法、装置、电子设备以及存储介质 | |
CN110750706A (zh) | 搜索热词确定方法、装置、系统及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |