CN113836442A - 趋势商品查询方法及其装置、设备、介质、产品 - Google Patents
趋势商品查询方法及其装置、设备、介质、产品 Download PDFInfo
- Publication number
- CN113836442A CN113836442A CN202111128902.XA CN202111128902A CN113836442A CN 113836442 A CN113836442 A CN 113836442A CN 202111128902 A CN202111128902 A CN 202111128902A CN 113836442 A CN113836442 A CN 113836442A
- Authority
- CN
- China
- Prior art keywords
- commodity
- social
- trend
- subject
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000004590 computer program Methods 0.000 claims description 22
- 238000013507 mapping Methods 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 16
- 238000003860 storage Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 10
- 230000001960 triggered effect Effects 0.000 claims description 8
- 230000006855 networking Effects 0.000 claims description 4
- 230000002441 reversible effect Effects 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 94
- 238000000605 extraction Methods 0.000 description 26
- 238000007418 data mining Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 12
- 230000006854 communication Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000010276 construction Methods 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 230000001174 ascending effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000000546 chi-square test Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000013065 commercial product Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
- G06Q30/0627—Directed, with specific intent or strategy using item specifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开一种趋势商品查询方法及其装置、设备、介质、产品,所述方法包括:响应商家实例的趋势商品查询请求,确定该商家实例的商品数据库中各商品对象相对应的多个商品主题词;根据所述商品对象的每个商品主题词与社交网络信息中的社交主题词之间的相似度数据及所述社交主题词在预设历史时期间所表现的趋势指标,确定每个商品对象中各个商品主题词相对应的趋势评分;根据每个商品对象的各个商品主题词相对应的趋势评分确定为该商品对象的流行度评分;选取流行度评分最高的若干个商品对象构造出所述商家实例相对应的趋势商品列表。本申请为商品对象的流行趋势做出有效预测的目标,方便商家实例对商品对象进行选品。
Description
技术领域
本申请涉及电商信息技术领域,尤其涉及一种趋势商品查询方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。
背景技术
电商平台中,特别是基于独立站的电商平台,各个商家之间的商品数据互相独立,无法直接利用一个商家的用户行为数据为另一商家提供决策参考,因此,对于“冷启动”,也即对于首次启用或上线的商家或商品而言,对相关商品进行推荐、排序、广告投放等,缺乏选品决策所需的参考信息,不利于自家商铺的营销。为了解决这一问题,现有技术中,可以参考一些排行榜来为这些商家或商品提供选品所需的参考信息,从而帮助商家实现冷启动。
然而,无论是基于用户行为数据还是排行榜数据,均来自于历史数据,这些数据尽管紧跟最近时期,但一方面,其在性质上只能代表用户在过去一段时间的行为表现,未能体现出商品的市场趋势;另一方面,信息来源比较单一,未能体现人们日常社会活动中的参考信息,因此,据此提取的信息,往往价值有限。
有鉴于此,电商平台中的商品选品相关的技术仍有挖掘的空间,本申请人专注于相关领域的研发,因而对此做出相应的探索。
发明内容
本申请的首要目的在于解决上述问题至少之一而提供一种趋势商品查询方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。
为满足本申请的各个目的,本申请采用如下技术方案:
适应本申请的目的之一而提供的一种趋势商品查询方法,包括如下步骤:
响应商家实例的趋势商品查询请求,确定该商家实例的商品数据库中各商品对象相对应的多个商品主题词;
根据所述商品对象的每个商品主题词与社交网络信息中的社交主题词之间的相似度数据及所述社交主题词在预设历史时期间所表现的趋势指标,确定每个商品对象中各个商品主题词相对应的趋势评分;
根据每个商品对象的各个商品主题词相对应的趋势评分确定为该商品对象的流行度评分;
选取流行度评分最高的若干个商品对象构造出所述商家实例相对应的趋势商品列表。
深化的实施例中,响应商家实例的趋势商品查询请求之前,包括如下步骤:
遍历商家实例的商品数据库中的商品对象,以为其提取商品主题词;
根据各个商品对象的商品信息提取出其相对应的多个商品主题词,所述商品信息包括商品对象的标题文本、详情文本、图片或视频;
根据每个商品对象的商品主题词搜索获取与其相匹配的社交网络信息;
构造社交信息库,以存储所述社交网络信息及从所述社交网络信息中提取的多个社交主题词;
构造相似度信息库,用于存储所述商品对象的每个商品主题词与社交信息库中的每个社交主题词之间的相似度数据。
具体化的实施例中,构造社交信息库,包括如下步骤:
创建所述社交信息库,将所述社交网络信息存储其中;
从所述社交网络信息中提取出多个社交主题词;
根据给定时间段,统计每个社交主题词在对应的历史时期内的出现频度;
将每个社交主题词的出现频度数据进行线性拟合后求导,获得每个社交主题词相对应的趋势指标;
将所述社交主题词与其趋势指标之间的映射关系数据存储至所述社交信息库中。
具体化的实施例中,构造相似度信息库,包括如下步骤:
分别将所述商品主题词与所述社交主题词编码为文本向量;
根据余弦相似度计算每个商品主题词与每个社交主题词之间的相似度数据;
创建相似度信息库,用于存储每个商品主题词与各个社交主题词之间的相似度数据。
较佳的实施例中,根据每个商品对象的商品主题词搜索获取与其相匹配的社交网络信息的步骤被定期触发,并导致更新所述的社交信息库及所述的相似度信息库。
深化的实施例中,选取流行度评分最高的若干个商品对象构造出趋势商品列表,包括如下步骤:
根据流行度评分对所有商品对象进行倒排序;
对于流行度评分相同的商品对象随机留一实现过滤;
选取设定数量的若干个流行度评分靠前的目标商品对象;
创建趋势商品列表,用于存储所述的目标商品对象;
应答所述趋势商品查询请求而推送该趋势商品列表。
适应本申请的目的之一而提供的一种趋势商品查询装置,包括:
请求响应模块,用于响应商家实例的趋势商品查询请求,确定该商家实例的商品数据库中各商品对象相对应的多个商品主题词;
趋势确定模块,用于根据所述商品对象的每个商品主题词与社交网络信息中的社交主题词之间的相似度数据及所述社交主题词在预设历史时期间所表现的趋势指标,确定每个商品对象中各个商品主题词相对应的趋势评分;
流行评分模块,用于根据每个商品对象的各个商品主题词相对应的趋势评分确定为该商品对象的流行度评分;
列表生成模块,用于选取流行度评分最高的若干个商品对象构造出所述商家实例相对应的趋势商品列表。
深化的实施例中,本申请的趋势商品查询装置还包括:
遍历启动模块,用于遍历商家实例的商品数据库中的商品对象,以为其提取商品主题词;
商品提取模块,用于根据各个商品对象的商品信息提取出其相对应的多个商品主题词,所述商品信息包括商品对象的标题文本、详情文本、图片或视频;
社交搜索模块,用于根据每个商品对象的商品主题词搜索获取与其相匹配的社交网络信息;
社交构造模块,用于构造社交信息库,以存储所述社交网络信息及从所述社交网络信息中提取的多个社交主题词;
相似构造模块,用于构造相似度信息库,以存储所述商品对象的每个商品主题词与社交信息库中的每个社交主题词之间的相似度数据。
具体化的实施例中,所述社交搜索模块包括:
趋势库创建子模块,用于创建所述社交信息库,将所述社交网络信息存储其中;
社交提取子模块,用于从所述社交网络信息中提取出多个社交主题词;
社交统计子模块,用于根据给定时间段,统计每个社交主题词在对应的历史时期内的出现频度;
趋势量化子模块,用于将每个社交主题词的出现频度数据进行线性拟合后求导,获得每个社交主题词相对应的趋势指标;
趋势指标存储子模块,用于将所述社交主题词与其趋势指标之间的映射关系数据存储至所述社交信息库中。
具体化的实施例中,所述社交构造模块包括:
主题编码子模块,用于分别将所述商品主题词与所述社交主题词编码为文本向量;
相似计算子模块,用于根据余弦相似度计算每个商品主题词与每个社交主题词之间的相似度数据;
相似库创建子模块,用于创建相似度信息库,用于存储每个商品主题词与各个社交主题词之间的相似度数据。
较佳的实施例中,所述社交搜索模块被定期触发,并导致更新所述的社交信息库及所述的相似度信息库。
深化的实施例中,所述列表生成模块包括:
评分倒排子模块,用于根据流行度评分对所有商品对象进行倒排序;
过滤留一子模块,用于对于流行度评分相同的商品对象随机留一实现过滤;
商品优选子模块,用于选取设定数量的若干个流行度评分靠前的目标商品对象;
列表创建子模块,用于创建趋势商品列表,用于存储所述的目标商品对象;
应答推送子模块,用于应答所述趋势商品查询请求而推送该趋势商品列表。
适应本申请的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的趋势商品查询方法的步骤。
适应本申请的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的趋势商品查询方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
适应本申请的另一目的而提供的一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本申请任意一种实施例中所述方法的步骤。
相对于现有技术,本申请的优势如下:
本申请在社交网络信息的基础上做数据挖掘,预先制备了社交网络信息中的各个与商品对象的商品主题词相匹配的社交主题词的趋势指标,该趋势指标表征了相应的社交主题词在一段历史时期以来所呈现的趋势特征,具有商品流行趋势的代表性,据此,本申请根据商品对象的商品主题词与社交网络信息中的社交主题词之间的相似程度,利用与商品对象的每个商品主题词相似的社交主题词的趋势指标来计算每个商品主题词相应的趋势评分,在各个商品主题词的趋势评分中优选出最大值作为相应的商品对象的流行度评分,由此可见,趋势评分、流行度评分相继转换并表征了社交网络信息中的各个社交主题词的综合趋势特征,因此,通过数据挖掘获得所述的流行度评分之后,便可利用各个商品对象相对应的流行度评分优选出多个商品对象用于构造趋势商品列表,为商家实例提供商品对象推荐、排序、广告投放等活动所需的参考信息,特别有利于电商平台中为商家解决商品“冷启动”上线的问题。
本申请进行挖掘的数据,主要是两个来源,其一是当前商家实例自身的商品对象相对应的商品信息,由其确定商品主题词;其二是各种社交网络中的公开数据,由其确定社交主题词。其中,社交网络的公开数据,是人们交流过程中形成的,是真实社会活动的载体之一,而人们在社交网络中关于商品的表达和交流自然会隐含商品对象的流行趋势,因此,采用社交网络作为信息源,所挖掘出来的数据更有参考价值,使得最终所匹配出的趋势商品列表更匹配商品的实际潮流走势,既高效又精准。
本申请所采用的数据挖掘方式,基于对社交主题词的简单统计获得趋势指标,然后结合相似度运算便可确定趋势评分,经简单运算即获得商品对象的流行度评分,据此制备趋势商品列表,这一过程,运算量少,运算效率高,占用系统资源低,而运算结果快速高效,对于电商平台的后台服务而言,非常经济易部署。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的趋势商品查询方法的典型实施例的流程示意图;
图2为本申请实施例中对社交网络信息进行预处理的过程的流程示意图;
图3为本申请实施例中构造社交信息库的过程的流程示意图;
图4为本申请实施例中构造相似度信息库的过程的流程示意图;
图5为本申请实施例中构造趋势商品列表的过程的流程示意图;
图6为本申请的趋势商品查询装置的原理框图;
图7为本申请所采用的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
本申请所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本申请的技术方案所调用即可。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
本申请的一种趋势商品查询方法,可被编程为计算机程序产品,部署于客户端或服务器中运行而实现,例如在本申请的电商平台应用场景中,一般部署在服务器中实施,藉此可以通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程进行人机交互而执行该方法。
请参阅图1,本申请的趋势商品查询方法在其典型实施例中,包括如下步骤:
步骤S1100、响应商家实例的趋势商品查询请求,确定该商家实例的商品数据库中各商品对象相对应的多个商品主题词:
当每一家商家实例完成其商品数据库的数据更新时,或者当商家实例的管理用户下达相关指令时,或者电商平台在后台为各商家实例自动启动趋势商品查询时,均可触发针对所述商家实施例的趋势商品查询请求。所述趋势商品查询请求用于获得一个趋势商品列表,该趋势商品列表中包含多个经数据挖掘表明具有流行趋势的商品对象,这些商品对象是该商家实例的商品数据库内的商品对象。
所述的商家实例,是电商平台中的一家商铺在后台计算机程序层面的体现,在基于独立站的电商平台中,一般对应一个独立站,即一个独立站用于运营一个商家实例。
每个所述的商品数据库用于存储其对应的商家实例的商铺网站内的商品对象的商品信息,所述的商品信息包括但不限于用于描述其相应的商品对象的商品图片、标题文本、详情文本、属性数据、视频文件等。
在为一个商家实例响应所述的趋势商品查询请求之后,后台服务器便会为该商家实例确定其商品数据训中的各个商品对象相对应的商品主题词。
商品对象的商品主题词,可以借助多种技术从商品信息中进行提取,包括但不限于如下几种方式:
1、采用自然语言技术中的关键词抽取的方式,借助经预训练的文本特征提取模型之类的神经网络模型从商品对象的文本类信息中提取出文本特征信息并获得相应的关键词,例如从商品对象的标题文本、详情文本、属性数据中提取出关键词,作为所述的商品主题词。典型的文本特征提取模型诸如时下较为流行的Bert模型等。当然,也可采用基于统计的其他公知的机器学习手段来提取相关商品主题词。应当理解,任何现有技术中的关键词抽取方式,以及任何未来产生的适于从商品信息的文本类型信息中提取出相关商品主题词的方式,均可应用于本申请的技术方案,而不影响本申请的创造精神的体现。
2、采用图像、视频识别技术,借助经预训练的卷积神经网络,将商品信息中商品图片、视频文件的深层语义特征信息映射到各个分类标签,根据其映射的最大概率的分类标签确定出其商品分类属性,从而将这些商品分类属性确定为相应的商品主题词,典型的,所述的卷积神经网络如HTC、Resnet、CNN、ViT等。应当理解,任何现有技术中的基于图像实现关键词提取的方式,以及任何未来产生的适于从商品信息的图片、视频中提取出相关商品主题词的方式,均可应用于本申请的技术方案,而不影响本申请的创造精神的体现。
3、采用多种神经网络模型相结合,以协同的方式从商品对象的多种商品信息中提取其相应的商品主题词的方式,这种方式一般适用于较为复杂的场景,例如,先采用第一神经网络架构从作为商品信息的视频文件中提取出其中的文本类型信息,然后采用前文第1种方式对其中的文本类型信息进行商品主题词的提取等。
综上所归纳和示例可知,本申请允许以本领域技术人员灵活采用各种传统技术为所述的商品对象从其商品信息中提取出商品主题词,以供本申请后续之用。
每个商品对象均获得其相应的商品主题词之后,相当于实现了商品对象的数据画像,商品主题词也就起到画像标签的作用,因此,每个商品对象与其商品主题词之间便成了映射关系数据,可以将其存储以便调用。
步骤S1200、根据所述商品对象的每个商品主题词与社交网络信息中的社交主题词之间的相似度数据及所述社交主题词在预设历史时期间所表现的趋势指标,确定每个商品对象中各个商品主题词相对应的趋势评分:
本典型实施例中,所述社交信息库已经事先预备,该社交信息库用于存储社交网络信息及相关趋势指标,所述社交网络信息可以通过接口调用或者其他公知方式从电商平台的自建社交网络媒体页面或外部社交网络媒体网站中搜索获取,包括但不限于各种文本信息、图片信息、视频信息等,然后以与前一步骤同理的方式,从这些社交网络信息中提取出多个社交主题词。较佳的实施例中,所述的社交网络信息可以根据商品对象的商品主题词进行搜索匹配,以净化社交网络信息,以提升商品主题词与社交主题词之间的关联度。
为了确定每个商品对象中各个商品主题词相对应的趋势评分,可以预先为所述社交信息库中的社交网络信息执行数据挖掘,而挖掘出其相应的社交主题词。概要而言,预先利用给定的一个历史时间段,例如过去十天、半月或一月等,然后逐日统计每个所述的社交主题词在该历史时间范围之内的各日的社交网络信息中的出现频度,根据每个社交主题词在该历史时期间的出现频度进行数据拟合并求导,将求导所获得的数值作为该社交主题词的趋势指标,用于表征其处于上升或下降趋势以及相应幅度。每个社交主题词均可获得相应的趋势指标,将各个社交主题词及其趋势指标的映射关系数据存储于所述社交信息库中,便可在此处供调用。本申请将在后续的一个实施例中详细揭示所述社交信息库的构造过程,此处暂且不表。
除了对所述趋势指标的引用,本典型实施例中,也要求事先预备每个商品主题词与社交信息库中的各个社交主题词之间的相似度数据。该相似度数据的制备,后续将通过其他实施例进一步揭示,此处概要而言:可分别将所述商品主题词与所述社交主题词均转换为嵌入向量,根据余弦相似度算法原理,定义商品主题词的嵌入向量与社交主题词的嵌入向量之间的点积为彼此的相似度数据,由此,通过计算嵌入向量之间的点积,便可获得每个商品主题词与一个社交主题词之间的相似度数据。实践中,可对这一相似度数据进行归一化处理,采用一个Softmax函数映射每个商品主题词到所有社交主题词的分类概率,所有这些分类概率的和值为1,由此,对于每个商品主题词而言,各个分类概率便是该商品主题词映射到相应的社交主题词的归一化后的相似度数据。
根据事先关于所述趋势指标和相似度数据的预备,本步骤便可为每个商品主题词计算其相应的趋势评分。
概要而言,对于每个商品对象中的每个商品主题词,以其与各个社交主题词相对应的相似度数据作为权重,将各个社交主题词自身的趋势指标作为趋势基础分,每个社交主题词的趋势基础分乘以其相应的权重,即得该社交主题词自身相对应的单一趋势评分,然后,将每个商品主题词所映射的所有社交主题词相对应的单一趋势评分进行求和,由此便可获得每个商品主题词相应的所述趋势评分。该趋势评分继承了每个社交主题词的根据出现频度统计的趋势指标,并且根据相似度数据调节了各个社交主题词的趋势指标的权重,最终实现综合,因此,最终所得的趋势评分是一个科学体现社交网络信息所隐含的趋势参考价值的结果。
对于每个商品对象而言,一般会提取出多个所述的商品主题词,本申请针对其中每个商品主题词均可确定其相应的趋势评分,以便使商品对象能够根据自身的多个信息维度来实现对社交网络信息的数据挖掘。
步骤S1300、根据每个商品对象的各个商品主题词相对应的趋势评分确定为该商品对象的流行度评分:
针对每个商品对象的每一个商品主题词,均会获得其相对应的趋势评分,由于同一商品对象的多个商品主题词对应的趋势评分均是对同一社交信息库的社交主题词的数据挖掘结果,因此,各个趋势评分所引用的信息价值维度是相同的,对此,可以根据各个商品主题词的趋势评分,采用通过多种方式融合确定商品对象最终的流行度评分。
一个实施例中,采取趋势乐观策略,对每个商品对象的多个商品主题词相对应的多个趋势评分求取最大值,将其中的最大趋势评分确定为相应的商品对象的流行度评分。
另一实施例中,采取趋势保守策略,将每个商品对象的多个商品主题词相对应的多个趋势评分进行加和求均值,将求得的平均趋势评分确定为相应的商品对象的流行度评分。
再一实施例中,采取趋势均衡策略,将每个商品对象的多个商品主题词相对应的多个趋势评分进行加权求平均,各个趋势评分的权重可依各个商品主题词的信息价值由本领域技术人员事先调节,将加权平均后获得的平均趋势评分确定为相应的商品对象的流行度评分。
可见,在获得每个商品对象的各个商品主题词相对应的趋势评分的基础上,可以根据实际情况,按需灵活确定最能代表商品对象的趋势价值的流行度评分。与所述趋势评分同理,流行度评分代表了商品对象参考社交网络信息进行数据挖掘之后获得的流行趋势,对于商品对象的推荐排序起关键作用。
步骤S1400、选取流行度评分最高的若干个商品对象构造出所述商家实例相对应的趋势商品列表:
每个商品对象均确定出其相应的流行度评分之后,便可从商品数据库中选取出所述流行度评分最高的若干个商品对象,具体的数量可以根据实际需要灵活确定,将这些商品对象构造为趋势商品列表,然后将其推送给该商家实例的终端设备,或者关联存储至该商家实例的商品数据库中,以完成对所述的趋势商品查询请求的响应。
本申请在社交网络信息的基础上做数据挖掘,预先制备了社交网络信息中的各个与商品对象的商品主题词相匹配的社交主题词的趋势指标,该趋势指标表征了相应的社交主题词在一段历史时期以来所呈现的趋势特征,具有商品流行趋势的代表性,据此,本申请根据商品对象的商品主题词与社交网络信息中的社交主题词之间的相似程度,利用与商品对象的每个商品主题词相似的社交主题词的趋势指标来计算每个商品主题词相应的趋势评分,在各个商品主题词的趋势评分中优选出最大值作为相应的商品对象的流行度评分,由此可见,趋势评分、流行度评分相继转换并表征了社交网络信息中的各个社交主题词的综合趋势特征,因此,通过数据挖掘获得所述的流行度评分之后,便可利用各个商品对象相对应的流行度评分优选出多个商品对象用于构造趋势商品列表,为商家实例提供商品对象推荐、排序、广告投放等活动所需的参考信息,特别有利于电商平台中为商家解决商品“冷启动”上线的问题。
本申请进行挖掘的数据,主要是两个来源,其一是当前商家实例自身的商品对象相对应的商品信息,由其确定商品主题词;其二是各种社交网络中的公开数据,由其确定社交主题词。其中,社交网络的公开数据,是人们交流过程中形成的,是真实社会活动的载体之一,而人们在社交网络中关于商品的表达和交流自然会隐含商品对象的流行趋势,因此,采用社交网络作为信息源,所挖掘出来的数据更有参考价值,使得最终所匹配出的趋势商品列表更匹配商品的实际潮流走势,既高效又精准。
本申请所采用的数据挖掘方式,基于对社交主题词的简单统计获得趋势指标,然后结合相似度运算便可确定趋势评分,经简单运算即获得商品对象的流行度评分,据此制备趋势商品列表,这一过程,运算量少,运算效率高,占用系统资源低,而运算结果快速高效,对于电商平台的后台服务而言,非常经济易部署。
请参阅图2,深化的实施例中,所述步骤S1100、响应商家实例的趋势商品查询请求之前,包括如下步骤:
步骤S1110、遍历商家实例的商品数据库中的商品对象,以为其提取商品主题词:
一般而言,是对商家实例相对应的商品数据库中的全量商品对象进行遍历,以便为各个商品对象提取商品主题词。除此之外,也可事先设定一个对商品数据库中的商品对象进行过滤的步骤,排除掉无需提取商品主题词的商品对象,获得一个目标商品对象列表,从该目标商品对象列表中启动遍历。过滤的方式和条件可以灵活设定,例如,可由商家实例自定义需要排除遍历的商品对象,或者由后台按照某种预设条件进行筛选,例如排除三个月前上线的商品对象等。对此,本领域技术人员可灵活实施。
针对每个商家实施的商品数据库中被过滤好的商品对象,均需执行这样的遍历,以便确保每个被遍历的商品对象均能够获得其相应的商品主题词。
步骤S1120、根据各个商品对象的商品信息提取出其相对应的多个商品主题词,所述商品信息包括商品对象的标题文本、详情文本、图片或视频:
本实施例中,优选从商品对象的标题文本,详情文本、图片、视频等信息内容中提取相关关键词,其中,对于文本类型信息即标题文本、详情文本等,可以应用自然语言技术的关键词抽取方式来实现。对于图片,可以采用多种基于CNN的神经网络模型来分类。对于视频,可以结合更复杂的网络架构,在结合自然语言技术相应的文本特征提取模型和基于CNN的图像特征提取模型来实现,可由本领域技术人员灵活选用。
请参阅本申请典型实施例中的描述,可以调用诸如预先训练的Bert模型从每个商品对象的商品信息中的文本类型信息进行文本特征提取,实现分词和关键词提取,这些关键词即为所述的商品主题词。公知的自然语言技术中,存在多种其他用于从文本中抽取关键词的方式,例如TD-IDF、TextRank、LDA、Word2Vec、信息增益关键词提取、互信息关键词提取、卡方检验关键词提取、基于树模型的关键词提取等等、本领域技术人员可灵活应用。
对于图片和视频等,也可采用前文所揭示的相应方式来实现商品主题词的提取。
步骤S1130、根据每个商品对象的商品主题词搜索获取与其相匹配的社交网络信息:
为了获取所述的社交网络信息,可以采用搜索匹配的手段,根据各个商品主题词对社交网络媒体中的社交网络信息进行检索获取。对于社交网络媒体中的社交网络信息的获取,可以调用社交网络媒体网站开放的接口进行搜索,也可以公开合法的方式采用爬虫技术进行抓取。社交网络媒体网站可以是电商平台自有的,也可以是第三方提供的。
所述的社交网络信息,主要包括社交网络媒体用户所发布的标题、帖文、图片、点赞数、评论等不同内容,各类内容可以综合提供同一参考信息,例如,一个用于表扬某种产品质量良好的帖文,其帖文中的文本会给出产品的评述文本,其图片用于展示产品的外观形状,其点赞数往往表征该产品或该用户的影响范围,其评论作为对该产品的评价信息的参考。据此,可以通过预设算法,将这些社交网络信息进行综合以便进行过滤。
例如,如果某一社交网络信息中,即用户发布的一个帖中,其中的图片被判定为商品,则可以被收录,否则可以直接过滤;其中的点赞数达到预定数量,则可以被收录,否则直接过滤;其中的帖文内容包含商品、品牌的描述,可以收录,否则过滤。
进一步,可以联立多个条件对搜索匹配的社交网络信息进行过滤,例如,选取时间在最近半月的社交网络信息进行收录,同时,要求其中的点赞数必须达到预定数量,诸如此类,本领域技术人员可以灵活实施,以便对所获取的社交网络信息进行适度的过滤,以提升信息参考价值。
步骤S1140、构造社交信息库,以存储所述社交网络信息及从所述社交网络信息中提取的多个社交主题词:
进而,为所获取的社交网络信息构造一个社交信息库,以便缓存所述的社交网络信息,以及存储其中的社交主题词。关于社交网络信息中提取出社交主题词的具体过程,请参阅本申请的典型实施例所揭示,其与从商品对象的商品信息中提取出商品主题词同理,可根据信息类型不同而同理采用相关技术手段来实施,针对文本、图片、视频等不同类型的信息采用其相应的技术手段,均可确保从社交网络信息中获得相应的社交主题词。对此,后续也将通过另一具体实施例做更深入的说明。
针对社交主题词的提取,可以适应每条社交网络信息即社交网络媒体中发布的每个帖进行提取后再合并相同项,也可以在社交网络信息进行聚类之后针对每一类进行提取再合并相同项,或者对所获取的全量的社交网络信息集中进行关键词提取,总之,最终可获得多个具有唯一性的社交主题词,以便针对每个社交主题词进行出现频度的统计。
由于事先给定了一个历史期间,例如前述的半个月,因此,在此基础上,可以针对每个社交主题词在该半个月期间的每一天里所出现的频度,即出现频度,然后根据这一出现频度获得趋势指标以供后用。每个社交主题词与其相应的趋势指标之间的映射关键数据也可被存储于所述的社交信息库中,以便调用。
可以理解,通过采用社交信息库对所获取的社交网络信息和所提取的社交主题词进行缓存,方便数据的维护更新,能够避免频繁搜索数据,且能提升访问响应速率。
步骤S1150、构造相似度信息库,用于存储所述商品对象的每个商品主题词与社交信息库中的每个社交主题词之间的相似度数据:
为了建立商品主题词与社交主题词之间的关联,进一步构造一个相似度信息库,以便存储每个商品主题词映射到每个社交主题词之间的相似度数据。
本实施例中,计算两个关键词之间的相似度的可用方式多种多样,包括但不限于如下任意方式:最小编辑距离算法、欧氏距离算法、余弦相似度算法、杰卡德(交并比)相似度算法、海明距离算法等。利用任意一种公知算法计算获得每个商品主题词映射到每个社交主题词之间的相似度算法之后,可将相应的相似度数据存储于所述相似度信息库中,以方便调用。
所述相似度信息库,可采用数据列表的方式来表示,例如被表示为用于存储所述相似度数据构造的向量矩阵,其行坐标和列坐标分别用于对应商品主题词,每个元素用于表示其所在的行坐标的商品主题词与其所在的列坐标的社交主题词之间的相似度数据,由此方便提升运算效率。
本实施例基于商品主题词搜索到社交网络信息并对其进行数据清洗净化之后,进行存储,为此而提供一个社交信息库,该社交信息库一方面可以存储所述的社交网络信息,另一方面可以存储所述的社交主题词,后续只需定期重新针对每个商品主题词搜索获取社交网络信息进行更新,便可触发对所述的社交信息库的更新,实现社交主题词的更新与商品主题词之间的解耦。
而对于所述相似度信息库而言,由于其本质上是单纯存储一个映射关系数据表格,也可在每次社交信息库中的社交主题词被更新后进行关联更新,由于其数据列表的特点,可以理解,对其访问的响应也将非常迅速,从而全面提升更新效率,提升访问速度。由此可以理解,所述步骤S1130可以由后台任务定期触发,在其被触发之后,便相应更新所述的社交信息库及所述的相似度信息库。
请参阅图3,具体化的实施例中,所述步骤S1140、构造社交信息库,包括如下步骤:
步骤S1141、创建所述社交信息库,将所述社交网络信息存储其中:
所述的社交信息库,可以采用数据库系统来支持,该社交信息库一经创建,后续只需执行数据更新维护即可,无需重建。如前所述,社交信息库首先用于存储从社交媒体网站获取的与每个商品主题词相匹配的社交网络信息,所述社交网络信息一般为用户发帖相对应的内容。社交网络信息被获取后,可以按需进行适度的数据清洗,以提升其与商品主题词的匹配度,删除其中的无效信息,对此,本领域技术人员均能理解。初始创建的社交信息库为一个空的数据库,后续的各种社交网络信息及社交主题词可以通过在其中合理组织各种数据表来实现存储。
步骤S1142、从所述社交网络信息中提取出多个社交主题词:
对社交网络信息中的社交主题词进行提取,本质上对其中的文本类型信息进行分词和聚类,或者对其中的图像类型信息进行分类映射,以获得相应的社交主题词,因此,对其所采用的实现方式可以与所述商品主题词的提取同理。
例如,对于文本类型信息,包括社交网络信息中以文本存在的,以及从图片经OCR识别出来的,或者从视频字幕中提取出来的,均可应用这种方式:公知的自然语言技术中,存在多种其他用于从文本中抽取关键词的方式,例如Bert、TD-IDF、TextRank、LDA、Word2Vec、信息增益关键词提取、互信息关键词提取、卡方检验关键词提取、基于树模型的关键词提取等等、本领域技术人员可灵活采用其中之一用于实施社交主题词的提取。
至于从图片和视频的图像信息中提取出相关的关键词,即所述的社交主题词,则主要采用CNN网络结合分类器的方式,用于将图片、视频映射到相关分类标签,然后将这些分类标签对应的文本,采用文本类型信息相同的方式进行社交主题词提取。
步骤S1143、根据给定时间段,统计每个社交主题词在对应的历史时期内的出现频度:
所述给定时间段,本实施例中,一般是三个月内,即自当天回溯三个月的时间,理论上,给定时间越长,信息量越丰富;给定时间越短,对于趋势的体现的信息越不足。但给定时间也不宜过长,否则将包含更多过时信息。因此,本实施例推荐在一周至三个月之间任意取值。
在所述给定时间段内,所述的社交网络信息中,每一天均可能出现所述的社交主题词,每一天出现一个社交主题词的频度,在某种程度上表示了该社交主题词在公众社会活动中的活跃程度,而该社交主题词在该给定时间段内各天的出现频度的变化,则体现出一个变化趋势,这一变化趋势一经量化,便可用于指导本申请的趋势商品列表的制备。
故此,针对每个社交主题词,可以在给定时间段所指示的历史时期内,简单按天统计其出现频度,针对每个社交主题词获得一个频度数据序列,该频度数据序列中,按照时间顺序排列该社交主题词各天的出现频度。比如以天为统计周期,某一个社交主题词在N天内的使用频度C1…N如下:
日期 | N-1天前 | … | 2天前 | 1天前 | 当天 |
使用频度 | C<sub>1</sub> | … | C<sub>N-2</sub> | C<sub>N-1</sub> | C<sub>N</sub> |
步骤S1144、将每个社交主题词的出现频度数据进行线性拟合后求导,获得每个社交主题词相对应的趋势指标:
对于该频数数据序列,可以进行线性拟合,关于线性拟合的技术本领域技术人员均已知晓,恕不赘述。C1…N经线性拟合后,获得一条表示为Y=a+b*X的直线,据此,对该直线求导,也即取该直线的斜率b作为该社交主题词的趋势指标。不难理解,该趋势指标指示该直线是提上升趋势还是下降趋势,并且也指示了其上升或下降的幅值,代表相应的社交主题词在公众社会活动特别是社交网络媒体中讨论程度的趋势走向,可供本申请引用作为商品主题词的流行趋势走向的参考。
步骤S1145、将所述社交主题词与其趋势指标之间的映射关系数据存储至所述社交信息库中:
每个社交主题词均获得其相应的趋势指标之后,便可将两者组织为映射关系数据存储到所述的社交信息库的一个数据表格中。示例而言,当实现社交信息库的数据库中Key-Value架构时,可以将社交主题词及其趋势指标存储为Key-Value对,如:{“某商品”:0.8889},其中“某商品”为社交主题词,数值“0.8889”为其对应的趋势指标,表示“某商品”在社交网络信息中的活跃程度有较高的可能性会继续攀升。
至此,可以理解,针对社交信息库中的社交主题词,可以获得如下的一个社交主题词-趋势指标序列:
社交主题词 | S<sub>1</sub> | S<sub>2</sub> | … | S<sub>M-1</sub> | S<sub>M</sub> |
趋势指标 | b<sub>1</sub> | b<sub>2</sub> | … | b<sub>M-1</sub> | b<sub>M</sub> |
其中,S1…N表示第N个社交主题词,b1…N表示第N个社交主题词相对应的趋势指标的具体数值。
本实施例在本申请其他实施的基础上,实现从社交网络信息到社交主题词的提取,以及实现为每个社交主题词确定其相应的趋势指标,通过数据挖掘实现对社交网络信息中的价值信息的有效表示,将每个社交主题词在社交网络信息中出现频度所携带的趋势信息量化体现为相应的趋势指标,使得本申请能够据以实现商品对象的流行趋势的判断,因此,具有非常重要的基础作用。
请参阅图4,具体化的实施例中,所述步骤S1150、构造相似度信息库,包括如下步骤:
S1151、分别将所述商品主题词与所述社交主题词编码为文本向量:
本实施例示例性地给出利用余弦相似度算法来计算商品主题词与社交主题词之间的相似度数据,为了计算商品主题词与社交主题词之间的相似度,可以分别将商品主题词序列和社交主题词序列编码为文本向量,具体而言,采用一个预设的词典,逐一查询各个商品主题词在其中对应的向量值,按序组织好这些向量值,构成一个第一文本向量;同理,社交主题词也被以相同的方式构造出第二文本向量。
S1152、根据余弦相似度计算每个商品主题词与每个社交主题词之间的相似度数据:
根据余弦相似度算法原理,可以将两个文本向量之间的元素之间相乘获得的点积定义为对应的一个商品主题词与对应的一个社交主题词之间的相似度数据,由此,便可获得一个相似度矩阵,该相似度矩阵中的每个元素,存储其行坐标所指向的商品主题词到其列坐标所指向的社交主题词之间的相似度数据。
在具体计算时,可采用Softmax函数来实现相似度数据的归一化计算,获得如下所示的结果:
社交主题词 | S<sub>1</sub> | S<sub>2</sub> | … | S<sub>M-1</sub> | S<sub>M</sub> |
相似度数据 | w<sub>i,1</sub> | w<sub>i,2</sub> | … | W<sub>i,M-1</sub> | w<sub>i,M</sub> |
该示例表格表示一个商品主题词与每一个社交主题词之间的相似度数据的映射关系,其中,根据Softmax函数的原理可知:
wi,1+wi,2+…+wi,M-1+wi,M=1
可见,各个相似度数据是归一化后的相似度数据,能够在彼此之间基于同一尺度衡量数量间的强弱程度。
S1153、创建相似度信息库,用于存储每个商品主题词与各个社交主题词之间的相似度数据:
所述的相似度矩阵,本质上是一个数据列表,因此也可将其视为一个相似度信息库,在诸如Key-Value架构的数据库中创建相似度信息库后存储该相似度矩阵,以便实现对应存储。至此,便完成了相似度信息库的构造。
本实施例应用余弦相似度原理,实现了对每个商品主题词与每个社交主题词之间的相似度数据的计算方式,体现了数据挖掘所应用的算法的精妙,能够提升运算效率,便于为每个商品主题词确定其相应的相似社交主题词提供关联关系信息。
在此基础上,结合本申请前文各个实施例可以理解,参考社交主题词的趋势指标的表示:{b1,b2,…,bM},据此,每个商品主题词的趋势评分Ti采用如下方法计算即可:
Ti=wi,1*b1+wi,2*b2+…+wi,M*bM
不难理解,对于一个商品主题词而言,该公式中所述的相似度数据wi,M起到了权重的作用,对每个社交主题词趋势指标bM起到了加权调节的作用。
进而,针对一个商品对象而言,由于其拥有多个商品主题词,因而将得到多个趋势评分,这些趋势评分所参考的信息体系均相同,因此可考虑对其进行平均,具体化的一个实施例中,可以采用求取均值的方式来确定出相应的流行度评分,对商家实例的任一商品对象,假设其对应的商品主题词趋势评分序列为{T1,T2,…,TK},则该商品的流行度P通过如下方法计算:
P=max{T1,T2,…,TK}
也即针对每个商品对象中多个商品主题词的趋势评分求取其中最大趋势评分,作为该商品对象的流行度评分。
请参阅图5,深化的实施例中,所述步骤S1400、选取流行度评分最高的若干个商品对象构造出趋势商品列表,包括如下步骤:
步骤S1410、根据流行度评分对所有商品对象进行倒排序:
根据本申请前文各实施例确定了每个商品对象相对应的流行度评分后,可以根据该流行度评分对商品数据库中的商品对象进行倒排序,以便从中择优选取出一个趋势商品列表。
步骤S1420、对于流行度评分相同的商品对象随机留一实现过滤:
由于某些同类商品对象所拥有的商品主题词可能高度相同,因此,可能出现部分商品对象的流行度评分相同,针对这种情况,在这些流行度评分相同的商品对象中,仅随机选取其中之一留用即可,余者可以过滤。
步骤S1430、选取设定数量的若干个流行度评分靠前的目标商品对象:
实现过滤后的商品对象列表中,可以按照预设数量,选定其中排序靠前,也即流行度评分最大的若干个商品对象作为趋势商品列表所采用的目标商品对象。所述预设数量可以默认设置,也可由商家实例个性化定制。
步骤S1440、创建趋势商品列表,用于存储所述的目标商品对象:
创建一个趋势商品列表,将以上选取出的目标商品对象添加到其中即可。由于该趋势商品列表短期内相对固定,固也可将其缓存到服务器中以备调用。
步骤S1450、应答所述趋势商品查询请求而推送该趋势商品列表:
对于商家实例的管理用户触发所述趋势商品查询请求的情况,可以调用该趋势商品列表,将其推送给该商家实例的管理用户的终端设备,以便供其根据该趋势商品列表确定需要进行广告投放或者用户推荐的选品。
本实施例实现了为商家实例提供趋势商品列表的交互过程,方便商家选取和设定用于广告投放或者推荐给用户的商品。
请参阅图6,适应本申请的目的之一而提供的一种趋势商品查询装置,是对本申请的趋势商品查询方法的功能化体现,该装置包括:请求响应模块1100、趋势确定模块1200、流行评分模块1300,以及列表生成模块1400,其中,所述请求响应模块1100,用于响应商家实例的趋势商品查询请求,确定该商家实例的商品数据库中各商品对象相对应的多个商品主题词;所述趋势确定模块1200,用于根据所述商品对象的每个商品主题词与社交网络信息中的社交主题词之间的相似度数据及所述社交主题词在预设历史时期间所表现的趋势指标,确定每个商品对象中各个商品主题词相对应的趋势评分;所述流行评分模块1300,用于根据每个商品对象的各个商品主题词相对应的趋势评分确定为该商品对象的流行度评分;所述列表生成模块1400,用于选取流行度评分最高的若干个商品对象构造出所述商家实例相对应的趋势商品列表。
深化的实施例中,本申请的趋势商品查询装置还包括:遍历启动模块,用于遍历商家实例的商品数据库中的商品对象,以为其提取商品主题词;商品提取模块,用于根据各个商品对象的商品信息提取出其相对应的多个商品主题词,所述商品信息包括商品对象的标题文本、详情文本、图片或视频;社交搜索模块,用于根据每个商品对象的商品主题词搜索获取与其相匹配的社交网络信息;社交构造模块,用于构造社交信息库,以存储所述社交网络信息及从所述社交网络信息中提取的多个社交主题词;相似构造模块,用于构造相似度信息库,以存储所述商品对象的每个商品主题词与社交信息库中的每个社交主题词之间的相似度数据。
具体化的实施例中,所述社交搜索模块包括:趋势库创建子模块,用于创建所述社交信息库,将所述社交网络信息存储其中;社交提取子模块,用于从所述社交网络信息中提取出多个社交主题词;社交统计子模块,用于根据给定时间段,统计每个社交主题词在对应的历史时期内的出现频度;趋势量化子模块,用于将每个社交主题词的出现频度数据进行线性拟合后求导,获得每个社交主题词相对应的趋势指标;趋势指标存储子模块,将所述社交主题词与其趋势指标之间的映射关系数据存储至所述社交信息库中。
具体化的实施例中,所述社交构造模块包括:主题编码子模块,用于分别将所述商品主题词与所述社交主题词编码为文本向量;相似计算子模块,用于根据余弦相似度计算每个商品主题词与每个社交主题词之间的相似度数据;相似库创建子模块,用于创建相似度信息库,用于存储每个商品主题词与各个社交主题词之间的相似度数据。
较佳的实施例中,所述社交搜索模块被定期触发,并导致更新所述的社交信息库及所述的相似度信息库。
深化的实施例中,所述列表生成模块1400包括:评分倒排子模块,用于根据流行度评分对所有商品对象进行倒排序;过滤留一子模块,用于对于流行度评分相同的商品对象随机留一实现过滤;商品优选子模块,用于选取设定数量的若干个流行度评分靠前的目标商品对象;列表创建子模块,用于创建趋势商品列表,用于存储所述的目标商品对象;应答推送子模块,用于应答所述趋势商品查询请求而推送该趋势商品列表。
为解决上述技术问题,本申请实施例还提供计算机设备。如图7所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种趋势商品查询方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本申请的趋势商品查询方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图6中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本申请的趋势商品查询装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本申请任一实施例的趋势商品查询方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被一个或多个处理器执行时实现本申请任一实施例所述方法的步骤。
本领域普通技术人员可以理解实现本申请上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等计算机可读存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请借助数据挖掘手段,对社交网络信息进行数据挖掘,以其中的社交主题词的活跃频度为商品对象流行趋势的参考信息,实现为商品对象的流行趋势做出有效预测的目标,方便商家实例对商品对象进行选品。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种趋势商品查询方法,其特征在于,包括如下步骤:
响应商家实例的趋势商品查询请求,确定该商家实例的商品数据库中各商品对象相对应的多个商品主题词;
根据所述商品对象的每个商品主题词与社交网络信息中的社交主题词之间的相似度数据及所述社交主题词在预设历史时期间所表现的趋势指标,确定每个商品对象中各个商品主题词相对应的趋势评分;
根据每个商品对象的各个商品主题词相对应的趋势评分确定为该商品对象的流行度评分;
选取流行度评分最高的若干个商品对象构造出所述商家实例相对应的趋势商品列表。
2.根据权利要求1所述的趋势商品查询方法,其特征在于,响应商家实例的趋势商品查询请求之前,包括如下步骤:
遍历商家实例的商品数据库中的商品对象,以为其提取商品主题词;
根据各个商品对象的商品信息提取出其相对应的多个商品主题词,所述商品信息包括商品对象的标题文本、详情文本、图片或视频;
根据每个商品对象的商品主题词搜索获取与其相匹配的社交网络信息;
构造社交信息库,以存储所述社交网络信息及从所述社交网络信息中提取的多个社交主题词;
构造相似度信息库,用于存储所述商品对象的每个商品主题词与社交信息库中的每个社交主题词之间的相似度数据。
3.根据权利要求2所述的趋势商品查询方法,其特征在于,构造社交信息库,包括如下步骤:
创建所述社交信息库,将所述社交网络信息存储其中;
从所述社交网络信息中提取出多个社交主题词;
根据给定时间段,统计每个社交主题词在对应的历史时期内的出现频度;
将每个社交主题词的出现频度数据进行线性拟合后求导,获得每个社交主题词相对应的趋势指标;
将所述社交主题词与其趋势指标之间的映射关系数据存储至所述社交信息库中。
4.根据权利要求2所述的趋势商品查询方法,其特征在于,构造相似度信息库,包括如下步骤:
分别将所述商品主题词与所述社交主题词编码为文本向量;
根据余弦相似度计算每个商品主题词与每个社交主题词之间的相似度数据;
创建相似度信息库,用于存储每个商品主题词与各个社交主题词之间的相似度数据。
5.根据权利要求2所述的趋势商品查询方法,其特征在于,根据每个商品对象的商品主题词搜索获取与其相匹配的社交网络信息的步骤被定期触发,并导致更新所述的社交信息库及所述的相似度信息库。
6.根据权利要求1至5中任意一项所述的趋势商品查询方法,其特征在于,选取流行度评分最高的若干个商品对象构造出趋势商品列表,包括如下步骤:
根据流行度评分对所有商品对象进行倒排序;
对于流行度评分相同的商品对象随机留一实现过滤;
选取设定数量的若干个流行度评分靠前的目标商品对象;
创建趋势商品列表,用于存储所述的目标商品对象;
应答所述趋势商品查询请求而推送该趋势商品列表。
7.一种趋势商品查询装置,其特征在于,包括:
请求响应模块,用于响应商家实例的趋势商品查询请求,确定该商家实例的商品数据库中各商品对象相对应的多个商品主题词;
趋势确定模块,用于根据所述商品对象的每个商品主题词与社交网络信息中的社交主题词之间的相似度数据及所述社交主题词在预设历史时期间所表现的趋势指标,确定每个商品对象中各个商品主题词相对应的趋势评分;
流行评分模块,用于根据每个商品对象的各个商品主题词相对应的趋势评分确定为该商品对象的流行度评分;
列表生成模块,用于选取流行度评分最高的若干个商品对象构造出所述商家实例相对应的趋势商品列表。
8.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的步骤。
9.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至7中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至7任意一项中所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111128902.XA CN113836442B (zh) | 2021-09-26 | 2021-09-26 | 趋势商品查询方法及其装置、设备、介质、产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111128902.XA CN113836442B (zh) | 2021-09-26 | 2021-09-26 | 趋势商品查询方法及其装置、设备、介质、产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113836442A true CN113836442A (zh) | 2021-12-24 |
CN113836442B CN113836442B (zh) | 2024-04-05 |
Family
ID=78970421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111128902.XA Active CN113836442B (zh) | 2021-09-26 | 2021-09-26 | 趋势商品查询方法及其装置、设备、介质、产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113836442B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8762326B1 (en) * | 2010-09-23 | 2014-06-24 | Google Inc. | Personalized hot topics |
US20140244361A1 (en) * | 2013-02-25 | 2014-08-28 | Ebay Inc. | System and method of predicting purchase behaviors from social media |
CN108346075A (zh) * | 2017-01-24 | 2018-07-31 | 北京京东尚科信息技术有限公司 | 信息推荐方法和装置 |
CN111815413A (zh) * | 2020-07-09 | 2020-10-23 | 湖南数客星球信息技术有限公司 | 一种基于热点事件的大数据商品预测系统及方法 |
CN112116415A (zh) * | 2020-08-20 | 2020-12-22 | 苏宁云计算有限公司 | 一种商品信息的推送方法、装置及系统 |
KR102280223B1 (ko) * | 2020-03-06 | 2021-07-21 | 주식회사 해든앰앤씨 | 빅데이터 기반의 상품구매 의사결정 지원 서비스 제공 방법 및 이를 위한 시스템 |
CN113327151A (zh) * | 2021-06-03 | 2021-08-31 | 广州华多网络科技有限公司 | 商品对象推荐方法、装置、计算机设备及存储介质 |
-
2021
- 2021-09-26 CN CN202111128902.XA patent/CN113836442B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8762326B1 (en) * | 2010-09-23 | 2014-06-24 | Google Inc. | Personalized hot topics |
US20140244361A1 (en) * | 2013-02-25 | 2014-08-28 | Ebay Inc. | System and method of predicting purchase behaviors from social media |
CN108346075A (zh) * | 2017-01-24 | 2018-07-31 | 北京京东尚科信息技术有限公司 | 信息推荐方法和装置 |
KR102280223B1 (ko) * | 2020-03-06 | 2021-07-21 | 주식회사 해든앰앤씨 | 빅데이터 기반의 상품구매 의사결정 지원 서비스 제공 방법 및 이를 위한 시스템 |
CN111815413A (zh) * | 2020-07-09 | 2020-10-23 | 湖南数客星球信息技术有限公司 | 一种基于热点事件的大数据商品预测系统及方法 |
CN112116415A (zh) * | 2020-08-20 | 2020-12-22 | 苏宁云计算有限公司 | 一种商品信息的推送方法、装置及系统 |
CN113327151A (zh) * | 2021-06-03 | 2021-08-31 | 广州华多网络科技有限公司 | 商品对象推荐方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113836442B (zh) | 2024-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114238573B (zh) | 基于文本对抗样例的信息推送方法及装置 | |
CN109684538A (zh) | 一种基于用户个人特征的推荐方法及推荐系统 | |
CN110532479A (zh) | 一种信息推荐方法、装置及设备 | |
CN110717093B (zh) | 一种基于Spark的电影推荐系统及方法 | |
WO2018040069A1 (zh) | 信息推荐系统及方法 | |
CN111259263A (zh) | 一种物品推荐方法、装置、计算机设备及存储介质 | |
CN111723292B (zh) | 基于图神经网络的推荐方法、系统、电子设备及存储介质 | |
CN112364204B (zh) | 视频搜索方法、装置、计算机设备及存储介质 | |
CN113627995B (zh) | 商品推荐列表更新方法及其装置、设备、介质、产品 | |
CN110795613B (zh) | 商品搜索方法、装置、系统及电子设备 | |
CN114663197A (zh) | 商品推荐方法及其装置、设备、介质、产品 | |
CN103309869A (zh) | 数据对象的展示关键词推荐方法及系统 | |
CN116521906B (zh) | 元描述生成方法及其装置、设备、介质 | |
CN114186013A (zh) | 实体识别模型热更新方法及其装置、设备、介质、产品 | |
CN114693409A (zh) | 产品匹配方法、装置、计算机设备、存储介质和程序产品 | |
CN111310462A (zh) | 用户属性的确定方法、装置、设备及存储介质 | |
CN114169418A (zh) | 标签推荐模型训练方法及装置、标签获取方法及装置 | |
CN116089723A (zh) | 一种推荐系统推荐方法及其设备 | |
US20220408155A1 (en) | System and method for providing media content | |
Ali et al. | Identifying and Profiling User Interest over time using Social Data | |
CN114971766A (zh) | 商品推荐方法及其装置、设备、介质、产品 | |
CN113836442B (zh) | 趋势商品查询方法及其装置、设备、介质、产品 | |
CN115293818A (zh) | 广告投放选品方法及其装置、设备、介质 | |
US20240054552A1 (en) | Intelligent Computer Search Engine Removal Of Search Results | |
KR20230059364A (ko) | 언어 모델을 이용한 여론조사 시스템 및 운영 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |