CN111489245B - 数据处理方法、装置、计算机设备和可读存储介质 - Google Patents
数据处理方法、装置、计算机设备和可读存储介质 Download PDFInfo
- Publication number
- CN111489245B CN111489245B CN202010347492.7A CN202010347492A CN111489245B CN 111489245 B CN111489245 B CN 111489245B CN 202010347492 A CN202010347492 A CN 202010347492A CN 111489245 B CN111489245 B CN 111489245B
- Authority
- CN
- China
- Prior art keywords
- merchant
- processed
- rich
- data
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 24
- 238000012216 screening Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000000034 method Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 244000269722 Thea sinensis Species 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 239000008267 milk Substances 0.000 description 5
- 210000004080 milk Anatomy 0.000 description 5
- 235000013336 milk Nutrition 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 235000013353 coffee beverage Nutrition 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- MIDXCONKKJTLDX-UHFFFAOYSA-N 3,5-dimethylcyclopentane-1,2-dione Chemical compound CC1CC(C)C(=O)C1=O MIDXCONKKJTLDX-UHFFFAOYSA-N 0.000 description 1
- 241000195940 Bryophyta Species 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 1
- 240000004922 Vigna radiata Species 0.000 description 1
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 1
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 235000015116 cappuccino Nutrition 0.000 description 1
- 235000013736 caramel Nutrition 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 235000015243 ice cream Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 235000020282 macchiato Nutrition 0.000 description 1
- 235000011929 mousse Nutrition 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0621—Item configuration or customization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供了一种数据处理方法、装置、计算机设备和可读存储介质,涉及电商技术领域,数据处理方法应用于服务器,服务器存储有商家订单数据表,商家订单数据表包括商家标识,数据处理方法包括:获取待处理商家数据组;通过比对商家标识和待处理商家标识,对待处理商家数据组进行更新;根据预设条件对更新后的待处理商家数据组进行筛选处理,得到丰富商家数据组;根据丰富商家数据,分析得到丰富商家数据包括的丰富商品的分布数据;根据丰富商家标识和丰富商品的分布数据,构建目标商家数据组,能够将线上商家的数据处理为可参考的目标商家数据组。
Description
技术领域
本申请涉及电商技术领域,具体而言,涉及一种数据处理方法、装置、计算机设备和可读存储介质。
背景技术
目前,随着电商行业的发展,越来越多的线上商店被开设。
然而各个线上商店之间的数据一般是隔离的,并不能直接进行相互参考,因此想要通过参考其他线上商店进行商品推荐十分的困难。然而想要从现有的数据中获取能够参考的数据,如果直接从真实的线上商店通过人工进行逐个分析数据十分的不便,会占用大量人力物力;如果从现有的电子商务相关的开源数据库中获取的数据,获取的数据也不能直接使用,无法满足需求。
有鉴于此,如何提供一种能够将线上商家的数据处理为可参考数据的方案,是本领域技术人员需要考虑的。
发明内容
本申请提供了一种数据处理方法、装置、计算机设备和可读存储介质。
本申请的实施例可以这样实现:
第一方面,实施例提供一种数据处理方法,应用于服务器,所述服务器存储有商家订单数据表,所述商家订单数据表包括商家标识,所述方法包括:
获取待处理商家数据组,所述待处理商家数据组包括待处理商家标识和所述待处理商家标识对应的待处理商家数据;
通过比对所述商家标识和所述待处理商家标识,对所述待处理商家数据组进行更新;
根据预设条件对更新后的待处理商家数据组进行筛选处理,得到丰富商家数据组,所述丰富商家数据组包括丰富商家标识和所述丰富商家标识对应的丰富商家数据;
根据所述丰富商家数据,分析得到所述丰富商家数据包括的丰富商品的分布数据;
根据所述丰富商家标识和所述丰富商品的分布数据,构建目标商家数据组。
在可选的实施方式中,所述待处理商家数据包括待处理产品列表和待处理订单列表,所述商家订单数据表还包括商品标识和订单标识;
所述通过比对所述商家标识和所述待处理商家标识,对所述待处理商家数据组进行更新的步骤,包括:
比对所述商家标识和所述待处理商家标识;
当所述商家标识中出现与所述待处理商家标识不相同的待添加商家标识时,从所述商家订单数据表中获取所述待添加商家标识对应的待添加商品标识和待添加订单标识;
根据所述待添加商品标识构建待添加产品列表;
根据所述待添加订单标识构建待添加订单列表;
根据所述待添加产品列表和所述待添加订单列表得到所述待添加商家标识对应的待添加商家数据;
当所述商家标识中出现与所述待处理商家标识相同的待更新商家标识时,从所述商家订单数据表中获取所述待更新商家标识对应的待更新商品标识和待更新订单标识;
将所述待更新商品标识加入所述待处理产品列表,并将所述待更新订单标识加入待处理订单列表得到更新后的待处理商家数据;
根据所述待添加商家标识和所述待添加商家数据和/或所述待更新商家标识和所述更新后的待处理商家数据,更新所述待处理商家数据组。
在可选的实施方式中,所述服务器还包括商品数据表,所述商品数据表包括商品详细数据;
所述将所述待更新商品标识加入所述待处理产品列表的步骤包括:
根据所述待更新商品标识,从所述商品数据表中获取所述待更新商品标识对应的商品详细数据;
将所述待更新商品标识和所述商品详细数据加入所述待处理产品列表。
在可选的实施方式中,所述预设条件为:
len(P)×α≤len(O)whereα>1
其中,len(P)为待处理产品列表的待处理商品数,len(O)为待处理订单的待处理订单数,α为预设调节系数。
在可选的实施方式中,所述丰富商家数据包括丰富商家产品列表;
所述根据所述丰富商家数据,分析得到所述丰富商家数据包括的丰富商品的分布数据的步骤,包括:
根据所述丰富商家产品列表,获取所述丰富商家产品列表中包括的丰富商品类别,并获取所述丰富商品类别的数目;
将所述丰富商品类别和所述丰富商品类别的数目作为所述分布数据。
在可选的实施方式中,在所述根据所述丰富商家数据,分析得到所述丰富商家数据包括的丰富商品的分布数据的步骤之前,所述方法还包括:
获取所述丰富商家产品列表,并根据所述丰富商家产品列表得到所述丰富商家产品列表包括的丰富商家产品数量;
判断所述丰富商家产品数量是否超过预设数量阈值;
若是,则将所述丰富商家数据保留;
若否,则将所述丰富商家数据删除。
第二方面,实施例提供一种数据处理装置,应用于服务器,所述服务器存储有商家订单数据表,所述商家订单数据表包括商家标识,所述装置包括:
获取模块,用于获取待处理商家数据组,所述待处理商家数据组包括待处理商家标识和所述待处理商家标识对应的待处理商家数据;
比对模块,用于通过比对所述商家标识和所述待处理商家标识,对所述待处理商家数据组进行更新;
筛选模块,用于根据预设条件对更新后的待处理商家数据组进行筛选处理,得到丰富商家数据组,所述丰富商家数据组包括丰富商家标识和所述丰富商家标识对应的丰富商家数据;
分析模块,用于根据所述丰富商家数据,分析得到所述丰富商家数据包括的丰富商品的分布数据;
构建模块,用于根据所述丰富商家标识和所述丰富商品的分布数据,构建目标商家数据组。
在可选的实施方式中,所述待处理商家数据包括待处理产品列表和待处理订单列表,所述商家订单数据表还包括商品标识和订单标识;
所述比对模块具体用于:
比对所述商家标识和所述待处理商家标识;当所述商家标识中出现与所述待处理商家标识不相同的待添加商家标识时,从所述商家订单数据表中获取所述待添加商家标识对应的待添加商品标识和待添加订单标识;根据所述待添加商品标识构建待添加产品列表;根据所述待添加订单标识构建待添加订单列表;根据所述待添加产品列表和所述待添加订单列表得到所述待添加商家标识对应的待添加商家数据;当所述商家标识中出现与所述待处理商家标识相同的待更新商家标识时,从所述商家订单数据表中获取所述待更新商家标识对应的待更新商品标识和待更新订单标识;将所述待更新商品标识加入所述待处理产品列表,并将所述待更新订单标识加入待处理订单列表得到更新后的待处理商家数据;根据所述待添加商家标识和所述待添加商家数据和/或所述待更新商家标识和所述更新后的待处理商家数据,更新所述待处理商家数据组。
第三方面,实施例提供一种计算机设备,所述计算机设备包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述计算机设备执行前述实施方式中任意一项所述的数据处理方法。
第四方面,实施例提供一种可读存储介质,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在计算机设备执行前述实施方式中任意一项所述的数据处理方法。
本申请实施例的有益效果包括,例如:
采用本申请实施例提供的数据处理方法、装置、计算机设备和可读存储介质,通过获取待处理商家数据组,进而比对所述商家标识和所述待处理商家标识,对所述待处理商家数据组进行更新;然后根据预设条件对更新后的待处理商家数据组进行筛选处理,得到丰富商家数据组,再根据所述丰富商家数据,分析得到所述丰富商家数据包括的丰富商品的分布数据;最后根据所述丰富商家标识和所述丰富商品的分布数据,构建目标商家数据组,能够将线上商家的数据处理为可参考的目标商家数据组。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种线上商城的应用场景示意图;
图2为本申请实施例提供的一种数据处理方法的步骤流程示意图;
图3为本申请实施例提供的一种服务器的结构示意图;
图4为本申请实施例提供的另一种数据处理方法的步骤流程示意图;
图5为本申请实施例提供的另一种数据处理方法的步骤流程示意图;
图6为本申请实施例提供的另一种数据处理方法的步骤流程示意图;
图7为本申请实施例提供的另一种数据处理方法的步骤流程示意图;
图8为本申请实施例提供的一种数据处理装置的结构示意框图;
图9为本申请实施例提供的一种计算机设备的结构示意框图。
图标:100-计算机设备;110-数据处理装置;1101-获取模块;1102-比对模块;1103-筛选模块;1104-分析模块;1105-构建模块;111-存储器;112-处理器;113-通信单元。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。
随着电商行业的发展,各种微商城、线上商城也随之开设,而新开设的线上商城,一般是没有太多商品相关数据(用户购买行为数据等)的,又由于各个线上商城之间的数据并不是互通的,因此想要参考其他已经有较多商品相关数据的线上商城比较困难,如图1所示,同一用户在线上商城1和在线上商城2上的数据并不互通,相互之间难以关联。在现有技术中,若直接人工从其他线上商城中获取数据,整个过程会消耗大量的人力物力,若从电商相关的开源数据库中获取数据,获取的数据也并不能直接使用,不具备参考价值。基于此,本申请实施例提供了一种数据处理方法,应用于服务器,服务器存储有商家订单数据表,商家订单数据表包括商家标识,如图2所示,数据处理方法包括步骤201至步骤205。
步骤201,获取待处理商家数据组。
其中,待处理商家数据组包括待处理商家标识和待处理商家标识对应的待处理商家数据。
步骤202,通过比对商家标识和待处理商家标识,对待处理商家数据组进行更新。
步骤203,根据预设条件对更新后的待处理商家数据组进行筛选处理,得到丰富商家数据组。
其中,丰富商家数据组包括丰富商家标识和丰富商家标识对应的丰富商家数据。
步骤204,根据丰富商家数据,分析得到丰富商家数据包括的丰富商品的分布数据。
步骤205,根据丰富商家标识和丰富商品的分布数据,构建目标商家数据组。
请参照图3,本申请实施例中服务器可以是Kaggle(数据发掘和预测竞赛)平台,在本申请实施例中可以将olist_order_items_dataset(商家订单相关数据表)作为orderitems(即商家订单数据表),在本申请实施例中,获取到处理商家数据组的方式可以是维护待处理商家dictionary(字典),维护待处理商家dictionary的key(键)可以是seller id(即待处理商家标识),而value(值)可以是一个seller对象(即待处理商家标识对应的待处理商家数据)。
在前述基础上,待处理商家数据包括待处理产品列表和待处理订单列表,商家订单数据表还包括商品标识和订单标识。本申请实施例还提供一种通过比对商家标识和待处理商家标识,对待处理商家数据组进行更新的示例,可如图4所示,以通过步骤202-1至步骤202-8实现。
步骤202-1,比对商家标识和待处理商家标识。
步骤202-2,当商家标识中出现与待处理商家标识不相同的待添加商家标识时,从商家订单数据表中获取待添加商家标识对应的待添加商品标识和待添加订单标识。
步骤202-3,根据待添加商品标识构建待添加产品列表。
步骤202-4,根据待添加订单标识构建待添加订单列表。
步骤202-5,根据待添加产品列表和待添加订单列表得到待添加商家标识对应的待添加商家数据。
步骤202-6,当商家标识中出现与待处理商家标识相同的待更新商家标识时,从商家订单数据表中获取待更新商家标识对应的待更新商品标识和待更新订单标识。
步骤202-7,将待更新商品标识加入待处理产品列表,并将待更新订单标识加入待处理订单列表得到更新后的待处理商家数据。
步骤202-8,根据待添加商家标识和待添加商家数据和/或待更新商家标识和更新后的待处理商家数据,更新待处理商家数据组。
请再次参考图3,order items还可以包括product id(即商品标识)和order id(即订单标识),其中,product id可以用于表示是哪一件商品,而order id可以用于表示是哪一个订单,在本申请实施例中,seller对象可以封装了seller id的products列表(待处理产品列表)以及seller id的order列表(待处理订单列表)。在本申请实施例中,products列表中包括的每个值可以是item对象(商品对象)的封装,而item对象内部可以封装商品的外观数据、商品名称等信息。在本申请实施例中,可以遍历order items表,而order items表中每个订单可以对应一个order id、product id和seller id(例如一个订单,可以对应该订单的订单号、订单中包括的商品名称以及该订单属于哪个商家),在遍历order items表时,可以将order items表中的seller id(即商家标识)和待处理商家dictionary中已有的key(即待处理商家标识)进行比对。
当order items表中出现待处理商家dictionary中的key不包括的seller id时(即家标识中出现与待处理商家标识不相同的待添加商家标识时),可以在待处理商家dictionary中新增加一个key,该key即为order items表中待处理商家dictionary中的key不包括的seller id,可以为其初始化新的seller对象(即根据待添加商品标识构建待添加产品列表和根据待添加订单标识构建待添加订单列表),构建完成后,有了两个空的列表,然后便可以将该seller id对应的order id加入待添加订单列表,将该seller id对应的product id加入待添加产品列表。例如,在遍历order items表时,有一seller id为商家A,该seller id在待处理商家dictionary中的key并未出现,那么可以将商家A作为新的key在待处理商家dictionary中构建,同时初始化行的seller对象,得到待添加产品列表和待添加订单列表,然后将商家A对应的商品A加入待添加产品列表,将商家A对应的订单A加入待添加订单列表。
而当order items表中出现待处理商家dictionary中的key包括的seller id时(即当商家标识中出现与待处理商家标识相同的待更新商家标识时),可以从order items表中获取该seller id对应的product id和order id(即待更新商品标识和待更新订单标识),并将待更新商品标识和待更新订单标识分别加入该seller id对应的待处理产品列表和待处理订单列表中。例如,待处理商家dictionary中的一个key为商家B,在遍历orderitems表时有一seller id也是商家B,可以将order items表中商家B对应的商品B加入在待处理商家dictionary中key为商家B对应的待处理产品列表中,将order items表中商家B对应的订单B加入待处理商家dictionary中key为商家B对应的待处理订单列表中。
通过上述流程,能够根据将order items表中的seller id是否已经在待处理商家dictionary中作为key出现,对待处理商家dictionary进行对应的更新。
在此基础上,服务器还包括商品数据表,商品数据表包括商品详细数据。本申请实施例提供一种将待更新商品标识加入待处理产品列表的示例,可以由以下步骤实现,请参考图5。
步骤202-7-1,根据待更新商品标识,从商品数据表中获取待更新商品标识对应的商品详细数据。
步骤202-7-2,将待更新商品标识和商品详细数据加入待处理产品列表。
Kaggle平台中还包括olist_products_dataset,其包括了商品更为详细的信息,可以作为product表(即商品数据表)。应当理解的是,在对待处理商家dictionary进行更新时,当order items表中出现待处理商家dictionary中的key包括的seller id时,还可以从product表中获取该seller id对应的product id(即待更新商品标识)所对应的商品详细数据,然后将更新商品标识和其商品详细数据加入order items表中出现待处理商家dictionary中的key包括的seller id对应的seller对象中。例如,product表中有商品C的外观参数、历史价格商品详细数据,而待处理商家dictionary中的一个key也为商家C,在遍历order items表时,便可以将,product表中商家C对应的商品C的外观参数、历史价格商品详细数据也加入待处理商家dictionary中key为商家C对应的待处理产品列表中。通过上述的步骤,可以从order items表中获取更加详细的商品信息更新至待处理商家dictionary中。
在此基础上,本申请实施例提供的预设条件为:
len(P)×α≤len(O)whereα>1
其中,len(P)为待处理产品列表的待处理商品数,len(O)为待处理订单的待处理订单数,α为预设调节系数。
在进行筛选的过程中,可以通过上述条件进行筛选。例如,更新后的待处理商家dictionary中,有kay为商家D,可以获取商家D对应的products列表和order列表,然后获取商家D对应的products列表中的待处理商品数(即商家D拥有的商品种类数量)和商家D对应的order列表中的待处理订单数,商家D对应的products列表中的待处理商品数可以是10种,商家D对应的order列表中的待处理订单数可以是152个,预设调节系数α可以设置为10,此时len(P)×α即10×10=100,小于152,可以认为商家D为丰富商家,在将待处理商家dictionary中每个key都经过预设条件过滤后,便能够得到丰富商家数据组。在本申请实施例的其他实施方式中,预设调节系数α可以根据具体的商品种类进行调节,通过上述步骤,能够根据待处理商品数和待处理订单数来对待处理商家dictionary中的商家数据进行清洗,将行为数据较为丰富的商家数据保留下来,即丰富商家数据dictionary。
除了上述方案,在根据丰富商家数据,分析得到丰富商家数据包括的丰富商品的分布数据的步骤之前,本申请实施例提供一种丰富商家筛选示例,可以通过以下步骤实现,请参考图6。
步骤301,获取丰富商家产品列表,并根据丰富商家产品列表得到丰富商家产品列表包括的丰富商家产品数量。
步骤302,判断丰富商家产品数量是否超过预设数量阈值。
若是,则执行步骤303。
若否,则执行步骤304。
步骤303,将丰富商家数据保留。
步骤304,将丰富商家数据删除。
在获得了丰富商家数据dictionary后,还可以进行进一步地筛除工作,可以将丰富商家数据dictionary中各个key对应的products列表(丰富商家产品列表)获取,然后判断丰富商家产品数量是否超过预设数量阈值,即各个key对应的商品数量是否足够多,由于最终获取的数据可以被用于训练来解决现有技术中从开源数据平台中获取的数据无法直接使用的问题,太少的数据不利于训练,且少量数据测试具有偶然性,因此会将商品数量不超过预设数量阈值的seller id(即key)以及其对应的seller对象从丰富商家数据dictionary中删除,将商品数量超过预设数量阈值的seller id(即key)以及其对应的seller对象在丰富商家数据dictionary中保留。
在上述基础上,丰富商家数据包括丰富商家产品列表。本申请实施例还提供一种根据丰富商家数据,分析得到丰富商家数据包括的丰富商品的分布数据的示例,可以通过以下步骤实现,如图7所示。
步骤204-1,根据丰富商家产品列表,获取丰富商家产品列表中包括的丰富商品类别,并获取丰富商品类别的数目。
步骤204-2,将丰富商品类别和丰富商品类别的数目作为分布数据。
在经过前述的筛除步骤之后,可以得到目标商家数据组,目标商家数据组可以认为是新维护的一个字典,目标商家数据dictionary,其中,由经过筛选后的待处理商家dictionary中的key作为目标商家数据dictionary的key,而目标商家数据dictionary的value则可以是每个key(即seller id,商家)包含的category(即目标商家数据)的分布结果,其中category的分布结果具体可以是指每个目标商品的富商品类别(set)和目标商品类别的数目(dict)。例如,目标商家数据dictionary的有key为商户E,商户E对应的products列表包括奶茶、蛋糕和咖啡,其中奶茶包括红枣奶茶和珍珠奶茶,蛋糕包括慕斯蛋糕、奶油蛋糕、抹茶蛋糕、原味蛋糕、绿豆蛋糕、冰淇淋蛋糕和草莓蛋糕,咖啡包括卡布奇诺和焦糖玛奇朵,那么对于商户E的category的分布结果,包括set为3,其中,奶茶对应的dict为2,蛋糕对应的dict为7,咖啡对应的dict为2。通过上述步骤,便能获取目标商家数据包括的目标商品的分布数据,能够将获取的数据用于给新开设的线上商城进行商品推荐等操作。
本申请实施例还提供一种数据处理装置110,如图8所示,应用于服务器,服务器存储有商家订单数据表,商家订单数据表包括商家标识,装置包括:
获取模块1101,用于获取待处理商家数据组,待处理商家数据组包括待处理商家标识和待处理商家标识对应的待处理商家数据。
比对模块1102,用于通过比对商家标识和待处理商家标识,对待处理商家数据组进行更新。
筛选模块1103,用于根据预设条件对更新后的待处理商家数据组进行筛选处理,得到丰富商家数据组,丰富商家数据组包括丰富商家标识和丰富商家标识对应的丰富商家数据。
分析模块1104,用于根据丰富商家数据,分析得到丰富商家数据包括的丰富商品的分布数据。
构建模块1105,用于根据丰富商家标识和丰富商品的分布数据,构建目标商家数据组。
进一步地,待处理商家数据包括待处理产品列表和待处理订单列表,商家订单数据表还包括商品标识和订单标识;
比对模块1102具体用于:
比对商家标识和待处理商家标识;当商家标识中出现与待处理商家标识不相同的待添加商家标识时,从商家订单数据表中获取待添加商家标识对应的待添加商品标识和待添加订单标识;根据待添加商品标识构建待添加产品列表;根据待添加订单标识构建待添加订单列表;根据待添加产品列表和待添加订单列表得到待添加商家标识对应的待添加商家数据;当商家标识中出现与待处理商家标识相同的待更新商家标识时,从商家订单数据表中获取待更新商家标识对应的待更新商品标识和待更新订单标识;将待更新商品标识加入待处理产品列表,并将待更新订单标识加入待处理订单列表得到更新后的待处理商家数据;根据待添加商家标识和待添加商家数据和/或待更新商家标识和更新后的待处理商家数据,更新待处理商家数据组。
进一步地,服务器还包括商品数据表,商品数据表包括商品详细数据;
比对模块1102进一步具体用于:
根据待更新商品标识,从商品数据表中获取待更新商品标识对应的待更新商品标识;将待更新商品标识和待更新商品标识加入待处理产品列表。
进一步地,预设条件为:
len(P)×α≤len(O)whereα>1
其中,len(P)为待处理产品列表的待处理商品数,len(O)为待处理订单的待处理订单数,α为预设调节系数。
进一步地,丰富商家数据包括丰富商家产品列表;
分析模块1104具体用于:
根据丰富商家产品列表,获取丰富商家产品列表中包括的丰富商品类别,并获取丰富商品类别的数目;将丰富商品类别和丰富商品类别的数目作为分布数据。
进一步地,获取模块1101具体还用于:
获取丰富商家产品列表,并根据丰富商家产品列表得到丰富商家产品列表包括的丰富商家产品数量;判断丰富商家产品数量是否超过预设数量阈值;若是,则将丰富商家数据保留;若否,则将丰富商家数据删除。
本申请实施例提供一种计算机设备,计算机设备100包括处理器及存储有计算机指令的非易失性存储器,计算机指令被处理器执行时,计算机设备100执行前述的数据处理方法。如图9所示,图9为本申请实施例提供的计算机设备100的结构框图。计算机设备100包括数据处理装置110、存储器111、处理器112及通信单元113。
为实现数据的传输或交互,存储器111、处理器112以及通信单元113各元件相互之间直接或间接地电性连接。例如,可通过一条或多条通讯总线或信号线实现这些元件相互之间电性连接。数据处理装置110包括至少一个可以软件或固件(firmware)的形式存储于存储器111中或固化在计算机设备100的操作系统(operating system,OS)中的软件功能模块。处理器112用于执行存储器111中存储的可执行模块,例如数据处理装置110所包括的软件功能模块及计算机程序等。
本申请实施例提供一种可读存储介质,可读存储介质包括计算机程序,计算机程序运行时控制可读存储介质所在计算机设备执行前述的数据处理方法。
综上所述,本申请实施例提供了一种数据处理方法、装置、计算机设备和可读存储介质,通过获取待处理商家数据组,进而比对所述商家标识和所述待处理商家标识,对所述待处理商家数据组进行更新;然后根据预设条件对更新后的待处理商家数据组进行筛选处理,得到丰富商家数据组,再根据所述丰富商家数据,分析得到所述丰富商家数据包括的丰富商品的分布数据;最后根据所述丰富商家标识和所述丰富商品的分布数据,构建目标商家数据组,能够将线上商家的数据处理为可参考的目标商家数据组。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (8)
1.一种数据处理方法,其特征在于,应用于服务器,所述服务器存储有商家订单数据表,所述商家订单数据表包括商家标识、商品标识和订单标识,所述方法包括:
获取待处理商家数据组,所述待处理商家数据组包括待处理商家标识和所述待处理商家标识对应的待处理商家数据;
通过比对所述商家标识和所述待处理商家标识,对所述待处理商家数据组进行更新;
根据预设条件对更新后的待处理商家数据组进行筛选处理,得到丰富商家数据组,所述丰富商家数据组包括丰富商家标识和所述丰富商家标识对应的丰富商家数据;
根据所述丰富商家数据,分析得到所述丰富商家数据包括的丰富商品的分布数据;
根据所述丰富商家标识和所述丰富商品的分布数据,构建目标商家数据组;
其中,所述待处理商家数据包括待处理产品列表和待处理订单列表,所述通过比对所述商家标识和所述待处理商家标识,对所述待处理商家数据组进行更新的步骤,包括:
比对所述商家标识和所述待处理商家标识;
当所述商家标识中出现与所述待处理商家标识不相同的待添加商家标识时,从所述商家订单数据表中获取所述待添加商家标识对应的待添加商品标识和待添加订单标识;
根据所述待添加商品标识构建待添加产品列表;
根据所述待添加订单标识构建待添加订单列表;
根据所述待添加产品列表和所述待添加订单列表得到所述待添加商家标识对应的待添加商家数据;
当所述商家标识中出现与所述待处理商家标识相同的待更新商家标识时,从所述商家订单数据表中获取所述待更新商家标识对应的待更新商品标识和待更新订单标识;
将所述待更新商品标识加入所述待处理产品列表,并将所述待更新订单标识加入待处理订单列表得到更新后的待处理商家数据;
根据所述待添加商家标识和所述待添加商家数据和/或所述待更新商家标识和所述更新后的待处理商家数据,更新所述待处理商家数据组。
2.根据权利要求1所述的方法,其特征在于,所述服务器还包括商品数据表,所述商品数据表包括商品详细数据;
所述将所述待更新商品标识加入所述待处理产品列表的步骤包括:
根据所述待更新商品标识,从所述商品数据表中获取所述待更新商品标识对应的商品详细数据;
将所述待更新商品标识和所述商品详细数据加入所述待处理产品列表。
3.根据权利要求1所述的方法,其特征在于,所述预设条件为:
len(P)×α≤len(O) where α>1
其中,len(P)为待处理产品列表的待处理商品数,len(O)为待处理订单的待处理订单数,α为预设调节系数。
4.根据权利要求1所述的方法,其特征在于,所述丰富商家数据包括丰富商家产品列表;
所述根据所述丰富商家数据,分析得到所述丰富商家数据包括的丰富商品的分布数据的步骤,包括:
根据所述丰富商家产品列表,获取所述丰富商家产品列表中包括的丰富商品类别,并获取所述丰富商品类别的数目;
将所述丰富商品类别和所述丰富商品类别的数目作为所述分布数据。
5.根据权利要求4所述的方法,其特征在于,在所述根据所述丰富商家数据,分析得到所述丰富商家数据包括的丰富商品的分布数据的步骤之前,所述方法还包括:
获取所述丰富商家产品列表,并根据所述丰富商家产品列表得到所述丰富商家产品列表包括的丰富商家产品数量;
判断所述丰富商家产品数量是否超过预设数量阈值;
若是,则将所述丰富商家数据保留;
若否,则将所述丰富商家数据删除。
6.一种数据处理装置,其特征在于,应用于服务器,所述服务器存储有商家订单数据表,所述商家订单数据表包括商家标识、商品标识和订单标识,所述装置包括:
获取模块,用于获取待处理商家数据组,所述待处理商家数据组包括待处理商家标识和所述待处理商家标识对应的待处理商家数据;
比对模块,用于通过比对所述商家标识和所述待处理商家标识,对所述待处理商家数据组进行更新;
筛选模块,用于根据预设条件对更新后的待处理商家数据组进行筛选处理,得到丰富商家数据组,所述丰富商家数据组包括丰富商家标识和所述丰富商家标识对应的丰富商家数据;
分析模块,用于根据所述丰富商家数据,分析得到所述丰富商家数据包括的丰富商品的分布数据;
构建模块,用于根据所述丰富商家标识和所述丰富商品的分布数据,构建目标商家数据组;
其中,所述待处理商家数据包括待处理产品列表和待处理订单列表,所述比对模块具体用于:
比对所述商家标识和所述待处理商家标识;当所述商家标识中出现与所述待处理商家标识不相同的待添加商家标识时,从所述商家订单数据表中获取所述待添加商家标识对应的待添加商品标识和待添加订单标识;根据所述待添加商品标识构建待添加产品列表;根据所述待添加订单标识构建待添加订单列表;根据所述待添加产品列表和所述待添加订单列表得到所述待添加商家标识对应的待添加商家数据;当所述商家标识中出现与所述待处理商家标识相同的待更新商家标识时,从所述商家订单数据表中获取所述待更新商家标识对应的待更新商品标识和待更新订单标识;将所述待更新商品标识加入所述待处理产品列表,并将所述待更新订单标识加入待处理订单列表得到更新后的待处理商家数据;根据所述待添加商家标识和所述待添加商家数据和/或所述待更新商家标识和所述更新后的待处理商家数据,更新所述待处理商家数据组。
7.一种计算机设备,其特征在于,所述计算机设备包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述计算机设备执行权利要求1-5中任意一项所述的数据处理方法。
8.一种可读存储介质,其特征在于,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在计算机设备执行权利要求1-5中任意一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010347492.7A CN111489245B (zh) | 2020-04-28 | 2020-04-28 | 数据处理方法、装置、计算机设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010347492.7A CN111489245B (zh) | 2020-04-28 | 2020-04-28 | 数据处理方法、装置、计算机设备和可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111489245A CN111489245A (zh) | 2020-08-04 |
CN111489245B true CN111489245B (zh) | 2023-05-05 |
Family
ID=71795498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010347492.7A Active CN111489245B (zh) | 2020-04-28 | 2020-04-28 | 数据处理方法、装置、计算机设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111489245B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112215315B (zh) * | 2020-10-23 | 2022-07-08 | 拉扎斯网络科技(上海)有限公司 | 输出时间获取方法、装置、计算机设备及可读存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295951A (zh) * | 2016-07-25 | 2017-01-04 | 北京七加二科技股份有限公司 | 用于实体店的收银方法、装置及erp系统 |
CN107464177A (zh) * | 2017-08-23 | 2017-12-12 | 北京惠赢天下网络技术有限公司 | 一种订单的处理方法及订单处理服务器 |
CN108694672A (zh) * | 2018-05-15 | 2018-10-23 | 中国平安人寿保险股份有限公司 | 订单处理方法、装置、计算机设备及存储介质 |
CN108932640A (zh) * | 2017-05-18 | 2018-12-04 | 北京京东尚科信息技术有限公司 | 用于处理订单的方法和装置 |
CN109389461A (zh) * | 2018-09-07 | 2019-02-26 | 深圳市广和通无线通信软件有限公司 | 商品信息处理方法、装置、计算机设备和存储介质 |
CN109934618A (zh) * | 2019-01-31 | 2019-06-25 | 北京三快在线科技有限公司 | 一种广告投放区域推荐方法、装置、设备及可读存储介质 |
CN109978470A (zh) * | 2019-04-03 | 2019-07-05 | 深圳威狮物流网络科技有限公司 | 一种物流信息确定方法、装置、设备及介质 |
CN110348868A (zh) * | 2018-04-04 | 2019-10-18 | 阿里巴巴集团控股有限公司 | 服务信息获取方法和装置 |
CN110490691A (zh) * | 2019-07-24 | 2019-11-22 | 深圳市梦想家联盟科技有限公司 | 信息推荐方法、装置、计算机设备及存储介质 |
CN110503498A (zh) * | 2018-05-16 | 2019-11-26 | 北京三快在线科技有限公司 | 一种订单推荐方法及装置 |
CN111028060A (zh) * | 2019-12-11 | 2020-04-17 | 上海风秩科技有限公司 | 商品推荐方法、装置、计算机设备和可读存储介质 |
-
2020
- 2020-04-28 CN CN202010347492.7A patent/CN111489245B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295951A (zh) * | 2016-07-25 | 2017-01-04 | 北京七加二科技股份有限公司 | 用于实体店的收银方法、装置及erp系统 |
CN108932640A (zh) * | 2017-05-18 | 2018-12-04 | 北京京东尚科信息技术有限公司 | 用于处理订单的方法和装置 |
CN107464177A (zh) * | 2017-08-23 | 2017-12-12 | 北京惠赢天下网络技术有限公司 | 一种订单的处理方法及订单处理服务器 |
CN110348868A (zh) * | 2018-04-04 | 2019-10-18 | 阿里巴巴集团控股有限公司 | 服务信息获取方法和装置 |
CN108694672A (zh) * | 2018-05-15 | 2018-10-23 | 中国平安人寿保险股份有限公司 | 订单处理方法、装置、计算机设备及存储介质 |
CN110503498A (zh) * | 2018-05-16 | 2019-11-26 | 北京三快在线科技有限公司 | 一种订单推荐方法及装置 |
CN109389461A (zh) * | 2018-09-07 | 2019-02-26 | 深圳市广和通无线通信软件有限公司 | 商品信息处理方法、装置、计算机设备和存储介质 |
CN109934618A (zh) * | 2019-01-31 | 2019-06-25 | 北京三快在线科技有限公司 | 一种广告投放区域推荐方法、装置、设备及可读存储介质 |
CN109978470A (zh) * | 2019-04-03 | 2019-07-05 | 深圳威狮物流网络科技有限公司 | 一种物流信息确定方法、装置、设备及介质 |
CN110490691A (zh) * | 2019-07-24 | 2019-11-22 | 深圳市梦想家联盟科技有限公司 | 信息推荐方法、装置、计算机设备及存储介质 |
CN111028060A (zh) * | 2019-12-11 | 2020-04-17 | 上海风秩科技有限公司 | 商品推荐方法、装置、计算机设备和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111489245A (zh) | 2020-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108694658A (zh) | 一种商品信息推送方法、相关装置及存储介质 | |
US7194428B2 (en) | Online wardrobe | |
CN110580649B (zh) | 一种商品潜力值的确定方法和装置 | |
JP2023523341A (ja) | 在庫およびプロファイル情報を安全管理するための方法およびシステム | |
CN114219558B (zh) | 基于数据挖掘的农产品智能推荐系统 | |
KR20200096182A (ko) | 빅데이터 기반의 낚시용품 추천 정보 제공 장치 및 방법 | |
US12100036B2 (en) | Removing purchases from online containers | |
CN111489245B (zh) | 数据处理方法、装置、计算机设备和可读存储介质 | |
CN112529666B (zh) | 商品推荐方法、系统、计算机设备及存储介质 | |
US20140129386A1 (en) | Computerized real-time value scoring of vehicles | |
CN116091149A (zh) | 菜谱推荐方法、装置、设备及计算机可读存储介质 | |
US20050160121A1 (en) | Import and export expense calculation apparatus | |
KR20160059583A (ko) | 딜 정보 관리 장치, 방법 및 컴퓨터 프로그램 | |
US11907267B2 (en) | User interface for frequent pattern analysis | |
CN111311351A (zh) | 文案推荐方法、装置、计算机设备和可读存储介质 | |
CN111753181A (zh) | 基于图像的搜索方法、装置、服务器、客户端及介质 | |
WO2016011452A1 (en) | System for aggregating, comparing and acquiring collectibles, methods and uses thereof | |
CN114372451A (zh) | 数据处理方法、装置、设备、计算机存储介质及程序产品 | |
CN114461918A (zh) | 物品推荐方法、装置、电子设备和存储介质 | |
CN111639274B (zh) | 线上商品智能排序方法、装置、计算机设备和存储介质 | |
US20210073883A1 (en) | Server apparatus, stock management system, and stock management method | |
US20160019622A1 (en) | System for aggregating, comparing and acquiring collectibles, methods and uses thereof | |
WO2019090619A1 (zh) | 一种基于智能终端的商品推荐方法及商品推荐系统 | |
CN113159727A (zh) | 商品检测方法和装置、电子设备及存储介质 | |
KR20010093522A (ko) | 인터넷을 이용한 디자인정보 제공방법 및 그 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231123 Address after: 200,030 Unit 5B03, Floor 5, Building 2, No. 277, Longlan Road, Xuhui District, Shanghai Patentee after: SHANGHAI SECOND PICKET NETWORK TECHNOLOGY CO.,LTD. Address before: Floors 4, 5 and 6, No. 3, Lane 1473, Zhenguang Road, Putuo District, Shanghai, 200333 Patentee before: Shanghai Fengzhi Technology Co.,Ltd. |
|
TR01 | Transfer of patent right |