CN113610563A - 商品相关性挖掘方法、装置、电子设备和可读存储介质 - Google Patents
商品相关性挖掘方法、装置、电子设备和可读存储介质 Download PDFInfo
- Publication number
- CN113610563A CN113610563A CN202110812093.8A CN202110812093A CN113610563A CN 113610563 A CN113610563 A CN 113610563A CN 202110812093 A CN202110812093 A CN 202110812093A CN 113610563 A CN113610563 A CN 113610563A
- Authority
- CN
- China
- Prior art keywords
- commodity
- sales
- correlation
- determining
- order data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005065 mining Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 65
- 239000013598 vector Substances 0.000 claims abstract description 108
- 238000012545 processing Methods 0.000 claims description 6
- 238000013461 design Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 4
- 238000009412 basement excavation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种商品相关性挖掘方法、装置、电子设备和可读存储介质,方法包括:确定销售信息,其中销售信息包括N个商品品类中,每个商品品类对应的品类名称信息和品类销量信息,其中N为大于1的整数;对销售信息进行向量化处理,得到包含品类名称信息和品类销售信息的文本向量;根据文本向量,确定N个商品品类中的每个商品品类的销量和每个商品品类在销售信息中的出现次数;根据出现次数确定任两个商品品类之间的共现相关性;根据销量确定任两个商品品类之间的销量相关性;根据共现相关性和销量相关性,确定任两个商品品类之间的总相关性。本申请的方法能够实现针对多维度的商品相关性计算。
Description
技术领域
本发明涉及商品相关性领域,具体而言,涉及一种商品相关性挖掘方法、装置、电子设备和可读存储介质。
背景技术
在相关技术中,目前针对商品品类相关性的计算主要是基于订单的模式,而不支持多维度的相关性计算,无法从除订单外的其他方向进行商品相关性的挖掘。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。
为此,本发明第一方面提供了一种商品相关性挖掘方法。
本发明第二方面提供了一种商品相关性挖掘装置。
本发明第三方面提供了一种电子设备。
本发明第四方面提供了一种可读存储介质。
有鉴于此,本发明第一方面提出了一种商品相关性挖掘方法,包括:确定销售信息,其中销售信息包括N个商品品类中,每个商品品类对应的品类名称信息和品类销量信息,其中N为大于1的整数;对销售信息进行向量化处理,得到包含品类名称信息和品类销售信息的文本向量;根据文本向量,确定N个商品品类中的每个商品品类的销量和每个商品品类在销售信息中的出现次数;根据出现次数确定任两个商品品类之间的共现相关性;根据销量确定任两个商品品类之间的销量相关性;根据共现相关性和销量相关性,确定任两个商品品类之间的总相关性。
本发明提供的商品相关性挖掘方法,首先确定需要的销售信息,并对销售信息进行处理,得到包含商品的品类名称和品类销售信息的文本向量,然后根据文本向量确定不同商品品类之间的共现相关性和销量相关性,进而根据共现相关性和销量相关性确定商品品类之间的总相关性。
具体地,根据文本向量能够确定每个商品品类的销量和每个商品品类在销售信息中出现的次数,根据出现次数能够确定不同商品品类之间的共现相关性,根据销量能够确定不同商品品类之间的销量相关性。综合考虑共现相关性和销量相关性,就能够得到不同商品品类的总相关性。
进一步地,可以根据共现相关性和销量相关性之间的比值,确定不同商品品类的总相关性。
商品可以从大的品类层面划分成为不同的商品品类,也可以从库存保持单元层面(stocking keeping unit,SKU),也即商品的最小分类层面划分。
通过共现相关性和销量相关性的综合评判,在导入不同的销售信息时,能够从不同维度对商品的相关性进行分析,进而实现多维度的商品相关性挖掘。
根据本发明上述技术方案的商品相关性挖掘方法,还可以具有以下附加技术特征:
在一种可能的设计中,确定销售信息,具体包括:获取与N个商品品类相关的订单数据,其中订单数据包括订单对应的下单账户、下单时刻和销量;在订单数据中确定第一订单数据、第二订单数据和第三订单数据,根据第一订单数据、第二订单数据或第三订单数据中的至少一个确定销售信息;其中,第一订单数据为每个下单账户对应的订单数据,第二订单数据为对应的下单时刻处于预设的时间段内的订单数据,第三订单数据为对应的销量处于预设销量范围内的订单数据。
在该设计中,可以根据订单数据确定不同的销售信息,进而根据不同的销售信息实现不同维度的商品相关性挖掘。具体地,订单数据可以包括订单对应的下单账户、下单时刻和销量。根据下单账户能够确定每个下单账户对应的第一订单数据,通过第一订单数据能够从商品与人的关系这个维度对商品品类相关性进行挖掘。根据下单时刻能够确定处于预设的时间段内的第二订单数据,通过第二订单数据能够从时间维度对对商品品类相关性进行挖掘。根据销量能够确定处于预设销量范围内的第三订单数据,通过第三订单数据能够从销量维度对商品品类相关性进行挖掘。
进一步地,还可以根据订单数据确定其他的数据信息,进而实现在其他维度的商品品类相关性挖掘。通过对销售信息的确定,实现了多个不同维度的商品相关性的分析。使挖掘计算更灵活,挖掘结果更有针对性。
在一种可能的设计中,根据出现次数确定任两个商品品类之间的共现相关性,具体包括:根据任一商品品类的出现次数,和文本向量的数量,确定任一商品品类的第一权重;根据任两个商品品类中,每个商品品类对应的第一权重的和,确定任两个商品品类的第二权重;确定任两个商品品类同时出现的共现次数;确定共现次数与文本向量的数量的比值,根据比值确定任两个商品品类之间的共现次数权重;根据共现次数权重和第二权重,确定共现相关性。
在该设计中,可以根据出现次数确定任两个商品品类的共现次数,进而确定任两个商品品类的共现次数权重,也就是商品出售机会相关性,再根据出现次数权重来确定共现相关性。具体地,根据任一商品的出现次数和文本向量的数量,能够确定该商品品类在所有文本向量中出现的权重,也就是第一权重。对两个商品的第一权重进行求和操作,得到这两个商品的第二权重。确定两个商品同时出现的次数,也就是共现次数,以共现次数与文本向量的数量的比值作为这两个商品品类的共现次数权重,也就是商品出售机会相关性。最后根据共现次数权重和第二权重确定共现相关性。
例如,文本向量共有89条,其中A商品品类分别出现在第1个向量和第10个向量中;B商品品类分别出现在第1个向量、第10个向量、第17个向量和第81个向量中。C商品品类分别出现在第1个向量、第10个向量、第67个向量、第83个向量中和第88个向量中。此时以A商品品类出现的次数与文本向量的数量之间的比值2/89作为A商品品类的第一权重;同理可以确定B商品品类的第一权重为4/89;C商品品类的第一权重为5/89。对A商品品类的第一权重和B商品品类的第一权重进行求和操作,得到A商品品类和B商品品类的第二权重为2/89+4/89=6/89。同理可以得到A商品品类和C商品品类的第二权重为2/89+5/89=7/89。
根据A商品品类和B商品品类同时出现在第1个向量和第10个向量中,因此确定A商品品类和B商品品类同时出现的共现次数为2。以共现次数2与文本向量的数量89的比值2/89作为这两个商品品类的共现次数权重,也就是共现次数权重(商品出售机会相关性)为2/89。同理,确定A商品品类和C商品品类同时出现的共现次数为2,共现次数权重(商品出售机会相关性)为2/89。
最后根据共现次数权重和第二权重确定共现相关性,将A商品品类和B商品品类之间的共现次数权重2/89与第二权重6/89之间的比值作为共现相关性,也就是(2/89)÷(6/89)=0.33……,A商品品类和B商品品类之间的共现相关性为0.33。
在一种可能的设计中,根据销量确定任两个商品品类之间的销量相关性,具体包括:确定任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,并在销售信息中确定所有商品品类的总销量;根据第一销量、第二销量和总销量,分别确定第一商品品类的第一销量权重和第二商品品类的第二销量权重;根据第一销量权重和第二销量权重,确定任两个商品品类之间的销量相关性。
在该设计中,可以根据任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,以及所有商品品类的总销量,来确定任两个商品品类之间的销量相关性。具体地,首先确定任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,以及销售信息中所有商品品类的总销量。然后根据第一销量和总销量确定第一销量权重,根据第二销量和总销量确定第二销量权重。最后根据第一销量权重和第二销量权重确定这两个商品品类之间的销量相关性。
例如,文本向量共有89条,根据这89条文本信息能够确定所有商品品类的总销量为1180,并且根据文本向量能够确定A商品品类的第一销量为16,B商品品类的第二销量为12,C商品品类的第二销量为110。然后以A商品品类的第一销量和所有商品品类的总销量之间的比值作为A商品品类的第一销量权重,即12÷1180=0.010。同理,能够确定B商品品类的第二销量权重为16÷1180=0.013。
根据A商品品类的第一销量权重和B商品品类的第二销量权重,确定A商品品类和B商品品类之间的相关性。具体地,以A商品品类的第一销量权重和B商品品类的第二销量权重之间的比值,作为A商品品类和B商品品类之间的销量相关性,即0.010÷0.013=0.769×100%=76.9%。
同理能够C商品品类的销量的权重为110÷1180=0.093,进而确定A商品品类和C商品品类之间的销量相关性为0.010÷0.093=0.1075×100%=10.75%。
本发明第二方面提出了一种商品相关性挖掘装置,包括:获取单元,用于确定销售信息,其中销售信息包括N个商品品类中,每个商品品类对应的品类名称信息和品类销量信息,其中N为大于1的整数;获取单元还用于,对销售信息进行向量化处理,得到包含品类名称信息和品类销售信息的文本向量;运算单元,用于根据文本向量,确定N个商品品类中的每个商品品类的销量和每个商品品类在销售信息中的出现次数;所述运算单元还用于,根据出现次数确定任两个商品品类之间的共现相关性;所述运算单元还用于,根据销量确定任两个商品品类之间的销量相关性;所述运算单元还用于,根据共现相关性和销量相关性,确定任两个商品品类之间的总相关性。
本发明提供的商品相关性挖掘装置,包括获取单元和运算单元。首先通过获取单元确定需要的销售信息,并对销售信息进行处理,得到包含商品的品类名称和品类销售信息的文本向量。然后通过运算单元来根据文本向量确定不同商品品类之间的共现相关性和销量相关性,进而根据共现相关性和销量相关性确定商品品类之间的总相关性。
具体地,运算单元能够根据文本向量确定每个商品品类的销量和每个商品品类在销售信息中出现的次数,根据出现次数确定不同商品品类之间的共现相关性,根据销量能够确定不同商品品类之间的销量相关性。综合考虑共现相关性和销量相关性,就能够得到不同商品品类的总相关性。
进一步地,可以根据共现相关性和销量相关性之间的比值,确定不同商品品类的总相关性。
商品可以从大的品类层面划分成为不同的商品品类,也可以从库存保持单元层面(stocking keeping unit,SKU),也即商品的最小分类层面划分。
通过共现相关性和销量相关性的综合评判,在导入不同的销售信息时,能够从不同维度对商品的相关性进行分析,进而实现多维度的商品相关性挖掘。
根据本发明上述技术方案的商品相关性挖掘装置,还可以具有以下附加技术特征:
在一种可能的设计中,获取单元具体用于:获取与N个商品品类相关的订单数据,其中订单数据包括订单对应的下单账户、下单时刻和销量;在订单数据中确定第一订单数据、第二订单数据和第三订单数据,根据第一订单数据、第二订单数据或第三订单数据中的至少一个确定销售信息;其中,第一订单数据为每个下单账户对应的订单数据,第二订单数据为对应的下单时刻处于预设的时间段内的订单数据,第三订单数据为对应的销量处于预设销量范围内的订单数据。
在该设计中,获取单元可以根据订单数据确定不同的销售信息,进而根据不同的销售信息实现不同维度的商品相关性挖掘。具体地,订单数据可以包括订单对应的下单账户、下单时刻和销量。根据下单账户能够确定每个下单账户对应的第一订单数据,通过第一订单数据能够从商品与人的关系这个维度对商品品类相关性进行挖掘。根据下单时刻能够确定处于预设的时间段内的第二订单数据,通过第二订单数据能够从时间维度对对商品品类相关性进行挖掘。根据销量能够确定处于预设销量范围内的第三订单数据,通过第三订单数据能够从销量维度对商品品类相关性进行挖掘。
进一步地,获取单元还可以根据订单数据确定其他的数据信息,进而实现在其他维度的商品品类相关性挖掘。通过对销售信息的确定,实现了多个不同维度的商品相关性的分析。使挖掘计算更灵活,挖掘结果更有针对性。
在一种可能的设计中,运算单元包括第一运算子单元,用于根据出现次数确定任两个商品品类之间的共现相关性,具体包括:根据任一商品品类的出现次数,和文本向量的数量,确定任一商品品类的第一权重;根据任两个商品品类中,每个商品品类对应的第一权重的和,确定任两个商品品类的第二权重;确定任两个商品品类同时出现的共现次数;确定共现次数与文本向量的数量的比值,根据比值确定任两个商品品类之间的共现次数权重;根据共现次数权重和第二权重,确定共现相关性。
在该设计中,计算单元包括第一计算子单元,第一计算子单元可以根据出现次数确定任两个商品品类的共现次数,进而确定任两个商品品类的共现次数权重,也就是商品出售机会相关性,再根据出现次数权重来确定共现相关性。具体地,根据任一商品的出现次数和文本向量的数量,能够确定该商品品类在所有文本向量中出现的权重,也就是第一权重。对两个商品的第一权重进行求和操作,得到这两个商品的第二权重。确定两个商品同时出现的次数,也就是共现次数,以共现次数与文本向量的数量的比值作为这两个商品品类的共现次数权重,也就是商品出售机会相关性。最后根据共现次数权重和第二权重确定共现相关性。
例如,文本向量共有89条,其中A商品品类分别出现在第1个向量和第10个向量中;B商品品类分别出现在第1个向量、第10个向量、第17个向量和第81个向量中。C商品品类分别出现在第1个向量、第10个向量、第67个向量、第83个向量和第88个向量中。此时以A商品品类出现的次数与文本向量的数量之间的比值2/89作为A商品品类的第一权重;同理可以确定B商品品类的第一权重为4/89;C商品品类的第一权重为5/89。对A商品品类的第一权重和B商品品类的第一权重进行求和操作,得到A商品品类和B商品品类的第二权重为2/89+4/89=6/89。同理可以得到A商品品类和C商品品类的第二权重为2/89+5/89=7/89。
根据A商品品类和B商品品类同时出现在第1个向量和第10个向量中,因此确定A商品品类和B商品品类同时出现的共现次数为2。以共现次数2与文本向量的数量89的比值2/89作为这两个商品品类的共现次数权重,也就是共现次数权重(商品出售机会相关性)为2/89。同理,确定A商品品类和C商品品类同时出现的共现次数为2,共现次数权重(商品出售机会相关性)为2/89。
最后根据共现次数权重和第二权重确定共现相关性,将A商品品类和B商品品类之间的共现次数权重2/89与第二权重6/89之间的比值作为共现相关性,也就是(2/89)÷(6/89)=0.33……,A商品品类和B商品品类之间的共现相关性为0.33。
在一种可能的设计中,运算单元还包括第二运算子单元,用于根据销量确定任两个商品品类之间的销量相关性,具体包括:确定任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,并在销售信息中确定所有商品品类的总销量;根据第一销量、第二销量和总销量,分别确定第一商品品类的第一销量权重和第二商品品类的第二销量权重;根据第一销量权重和第二销量权重,确定任两个商品品类之间的销量相关性。
在该设计中,计算单元还包括第二计算子单元,第二计算子单元可以根据任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,以及所有商品品类的总销量,来确定任两个商品品类之间的销量相关性。具体地,首先确定任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,以及销售信息中所有商品品类的总销量。然后根据第一销量和总销量确定第一销量权重,根据第二销量和总销量确定第二销量权重。最后根据第一销量权重和第二销量权重确定这两个商品品类之间的销量相关性。
例如,文本向量共有89条,根据这89条文本信息能够确定所有商品品类的总销量为1180,并且根据文本向量能够确定A商品品类的第一销量为16,B商品品类的第二销量为12,C商品品类的第二销量为110。然后以A商品品类的第一销量和所有商品品类的总销量之间的比值作为A商品品类的第一销量权重,即12÷1180=0.010。同理,能够确定B商品品类的第二销量权重为16÷1180=0.013。
根据A商品品类的第一销量权重和B商品品类的第二销量权重,确定A商品品类和B商品品类之间的相关性。具体地,以A商品品类的第一销量权重和B商品品类的第二销量权重之间的比值,作为A商品品类和B商品品类之间的销量相关性,即0.010÷0.013=0.769×100%=76.9%。
同理能够C商品品类的销量的权重为110÷1180=0.093,进而确定A商品品类和C商品品类之间的销量相关性为0.010÷0.093=0.1075×100%=10.75%。
本发明第三方面提出了一种电子设备,包括处理器和存储器,处理器用于执行存储器中存储的程序或指令时实现如本发明第一方面的任一设计的商品相关性挖掘方法的步骤。
本发明提供的电子设备,包括存储器和处理器。其中存储器能够存储程序,而处理器能够执行存储器所存储的程序,以实现如上述第一方面的任一设计的商品相关性挖掘方法的步骤,因而具备该商品相关性挖掘方法的全部有益效果,在此不再赘述。
本发明的第四方面提出了一种可读存储介质,其上存储有程序或指令,程序或指令被处理器执行时实现如上述第一方面的任一设计的商品相关性挖掘方法的步骤,因而具备该商品相关性挖掘方法的全部有益效果,在此不再赘述。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了本发明第一方面一个实施例的商品相关性挖掘方法的流程图;
图2示出了本发明第一方面另一个实施例的商品相关性挖掘方法的流程图;
图3示出了本发明第一方面另一个实施例的商品相关性挖掘方法的流程图;
图4示出了本发明第一方面另一个实施例的商品相关性挖掘方法的流程图;
图5示出了本发明第一方面另一个实施例的商品相关性挖掘方法的流程图;
图6示出了本发明第一方面另一个实施例的商品相关性挖掘方法的流程图;
图7示出了本发明第一方面另一个实施例的商品相关性挖掘方法的流程图;
图8示出了本发明第一方面另一个实施例的商品相关性挖掘方法的流程图;
图9示出了本发明第二方面一个实施例的商品相关性挖掘装置的结构框图;
图10示出了本发明第三方面一个实施例的电子设备的结构框图。
其中,图9和图10中附图标记与部件名称之间的对应关系为:
100商品相关性挖掘装置,110获取单元;120运算单元;122第一运算子单元;124第二运算子单元;200电子设备,210处理器,220存储器。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
如图1所示,本发明的第一方面的一个实施例提出了一种商品相关性挖掘方法,该方法包括:
S102,确定销售信息,其中销售信息包括N个商品品类中,每个商品品类对应的品类名称信息和品类销量信息,其中N为大于1的整数;
S104,对销售信息进行向量化处理,得到包含品类名称信息和品类销售信息的文本向量;
S106,根据文本向量,确定N个商品品类中的每个商品品类的销量和每个商品品类在销售信息中的出现次数;
S108,根据出现次数确定任两个商品品类之间的共现相关性;
S110,根据销量确定任两个商品品类之间的销量相关性;
S112,根据共现相关性和销量相关性,确定任两个商品品类之间的总相关性。
该实施例提出的商品相关性挖掘方法,首先确定需要的销售信息,并对销售信息进行处理,得到包含商品的品类名称和品类销售信息的文本向量,然后根据文本向量确定不同商品品类之间的共现相关性和销量相关性,进而根据共现相关性和销量相关性确定商品品类之间的总相关性。
具体地,根据文本向量能够确定每个商品品类的销量和每个商品品类在销售信息中出现的次数,根据出现次数能够确定不同商品品类之间的共现相关性,根据销量能够确定不同商品品类之间的销量相关性。综合考虑共现相关性和销量相关性,就能够得到不同商品品类的总相关性。
进一步地,可以根据共现相关性和销量相关性之间的比值,确定不同商品品类的总相关性。
商品可以从大的品类层面划分成为不同的商品品类,也可以从库存保持单元层面(stocking keeping unit,SKU),也即商品的最小分类层面划分。
通过共现相关性和销量相关性的综合评判,在导入不同的销售信息时,能够从不同维度对商品的相关性进行分析,进而实现多维度的商品相关性挖掘。
图2示出了本发明第一方面的另一个实施例的商品相关性挖掘方法,如图所示,该方法包括:
S202,将销售信息导入,得到文本向量;
S204,根据文本向量,计算两个商品品类名称的相关性;
S206,得到两个商品品类之间的商品出售机会相关性和销量相关性,并计算总相关性。
在该实施例中,首先将销售信息导入,并对导入的销售信息进行向量化处理,得到包含每个商品品类对应的品类名称信息和品类销量信息的文本向量。然后根据文本向量,计算两个商品品类名称之间的相关性。再计算得到两个商品品类之间的商品出售机会相关性(也即共现次数权重)和销量相关性。最后根据出售机会相关性和销量相关性确定这两个商品之间的总相关性,具体地,根据出售机会相关性确定共现相关性,再根据共现相关性和销量相关性来确定总相关性。
在一些实施例中,确定销售信息,具体包括:获取与N个商品品类相关的订单数据,其中订单数据包括订单对应的下单账户、下单时刻和销量;在订单数据中确定第一订单数据、第二订单数据和第三订单数据,根据第一订单数据、第二订单数据或第三订单数据中的至少一个确定销售信息;其中,第一订单数据为每个下单账户对应的订单数据,第二订单数据为对应的下单时刻处于预设的时间段内的订单数据,第三订单数据为对应的销量处于预设销量范围内的订单数据。
图3示出了本发明第一方面另一个实施例的商品相关性挖掘方法的流程图,该方法包括:
S302,获取与N个商品品类相关的订单数据,其中订单数据包括订单对应的下单账户、下单时刻和销量;
S304,在订单数据中确定第一订单数据、第二订单数据和第三订单数据,根据第一订单数据、第二订单数据或第三订单数据中的至少一个确定销售信息。
在该实施例中,可以根据订单数据确定不同的销售信息,进而根据不同的销售信息实现不同维度的商品相关性挖掘。具体地,订单数据可以包括订单对应的下单账户、下单时刻和销量。根据下单账户能够确定每个下单账户对应的第一订单数据,通过第一订单数据能够从商品与人的关系这个维度对商品品类相关性进行挖掘。根据下单时刻能够确定处于预设的时间段内的第二订单数据,通过第二订单数据能够从时间维度对对商品品类相关性进行挖掘。根据销量能够确定处于预设销量范围内的第三订单数据,通过第三订单数据能够从销量维度对商品品类相关性进行挖掘。
进一步地,还可以根据订单数据确定其他的数据信息,进而实现在其他维度的商品品类相关性挖掘。通过对销售信息的确定,实现了多个不同维度的商品相关性的分析。使挖掘计算更灵活,挖掘结果更有针对性。
图4示出了本发明第一方面的另一个实施例的商品相关性挖掘方法,如图所示,该方法包括:
S402,导入每个客户的订单购买商品品类,将每个购买人的第一订单数据作为一个文本向量;
S404,得到基于购买人维度的商品品类相关性。
在该实施例中,订单数据包括订单对应的下单账户(也即客户),根据下单账户能够确定每个下单账户对应的第一订单数据,然后根据第一订单数据能够确定需要的销售信息。导入销售信息,其中销售信息包含了带有每个下单账户的第一订单数据,其中第一订单数据包含了每个下单账户的订单中的购买商品品类,将每个订单账户的第一订单数据处理为一个文本向量,然后根据每个文本向量,确定基于订单账户也就是购买者的维度的商品品类相关性,也即从商品与人的关系这个维度对商品品类相关性进行挖掘。
图5示出了本发明第一方面的另一个实施例的商品相关性挖掘方法,如图所示,该方法包括:
S502,导入特定时间购买商品品类,将每个时期的第二订单数据作为一个文本向量;
S504,得到基于时间维度的商品品类相关性。
在该实施例中,订单数据包括订单对应的下单时刻,根据下单时刻能够确定处于预设时间段内的第二订单数据,然后根据第二订单数据能够确定需要的销售信息。导入销售信息,其中销售信息包含了带有下单时刻的第二订单数据,其中第二订单数据包含了预设时间段内的订单中的购买商品品类,将每个预设时间段内的第二订单数据处理为一个文本向量,然后根据每个文本向量,确定基于时间维度也的商品品类相关性,也即从时间这个维度对商品品类相关性进行挖掘。
图6示出了本发明第一方面的另一个实施例的商品相关性挖掘方法,如图所示,该方法包括:
S602,导入特定销量区间的商品品类;
S604,得到基于销量的商品品类相关性。
在该实施例中,订单数据包括订单对应的销量,根据销量能够确定处于预设销量范围内的第三订单数据,然后根据第三订单数据能够确定需要的销售信息。导入销售信息,其中销售信息包含了带有销量的第三订单数据,其中第三订单数据包含了预设销量范围内的订单中的购买商品品类,将每个预设销量范围内的第三订单数据处理为一个文本向量,然后根据每个文本向量,确定基于销量维度也的商品品类相关性,也即从销量这个维度对商品品类相关性进行挖掘。
在一些实施例中,根据出现次数确定任两个商品品类之间的共现相关性,具体包括:根据任一商品品类的出现次数,和文本向量的数量,确定任一商品品类的第一权重;根据任两个商品品类中,每个商品品类对应的第一权重的和,确定任两个商品品类的第二权重;确定任两个商品品类同时出现的共现次数;确定共现次数与文本向量的数量的比值,根据比值确定任两个商品品类之间的共现次数权重;根据共现次数权重和第二权重,确定共现相关性。
图7示出了本发明第一方面另一个实施例的商品相关性挖掘方法的流程图,该方法包括:
S702,根据任一商品品类的出现次数,和文本向量的数量,确定任一商品品类的第一权重;
S704,根据任两个商品品类中,每个商品品类对应的第一权重的和,确定任两个商品品类的第二权重;
S706,确定任两个商品品类同时出现的共现次数;
S708,确定共现次数与文本向量的数量的比值,根据比值确定任两个商品品类之间的共现次数权重;
S710,根据共现次数权重和第二权重,确定共现相关性。
在该实施例中,可以根据出现次数确定任两个商品品类的共现次数,进而确定任两个商品品类的共现次数权重,也就是商品出售机会相关性,再根据出现次数权重来确定共现相关性。具体地,根据任一商品的出现次数和文本向量的数量,能够确定该商品品类在所有文本向量中出现的权重,也就是第一权重。对两个商品的第一权重进行求和操作,得到这两个商品的第二权重。确定两个商品同时出现的次数,也就是共现次数,以共现次数与文本向量的数量的比值作为这两个商品品类的共现次数权重,也就是商品出售机会相关性。最后根据共现次数权重和第二权重确定共现相关性。
例如,文本向量共有89条,其中A商品品类分别出现在第1个向量和第10个向量中;B商品品类分别出现在第1个向量、第10个向量、第17个向量和第81个向量中。C商品品类分别出现在第1个向量、第10个向量、第67个向量、第83个向量和第88个向量中。此时以A商品品类出现的次数与文本向量的数量之间的比值2/89作为A商品品类的第一权重;同理可以确定B商品品类的第一权重为4/89;C商品品类的第一权重为5/89。对A商品品类的第一权重和B商品品类的第一权重进行求和操作,得到A商品品类和B商品品类的第二权重为2/89+4/89=6/89。同理可以得到A商品品类和C商品品类的第二权重为2/89+5/89=7/89。
根据A商品品类和B商品品类同时出现在第1个向量和第10个向量中,因此确定A商品品类和B商品品类同时出现的共现次数为2。以共现次数2与文本向量的数量89的比值2/89作为这两个商品品类的共现次数权重,也就是共现次数权重(商品出售机会相关性)为2/89。同理,确定A商品品类和C商品品类同时出现的共现次数为2,共现次数权重(商品出售机会相关性)为2/89。
最后根据共现次数权重和第二权重确定共现相关性,将A商品品类和B商品品类之间的共现次数权重2/89与第二权重6/89之间的比值作为共现相关性,也就是(2/89)÷(6/89)=0.33……,A商品品类和B商品品类之间的共现相关性为0.33。
图8示出了本发明第一方面另一个实施例的商品相关性挖掘方法的流程图,该方法包括:
S802,确定任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,并在销售信息中确定所有商品品类的总销量;
S804,根据第一销量、第二销量和总销量,分别确定第一商品品类的第一销量权重和第二商品品类的第二销量权重;
S806,根据第一销量权重和第二销量权重,确定任两个商品品类之间的销量相关性。
在该实施例中,可以根据任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,以及所有商品品类的总销量,来确定任两个商品品类之间的销量相关性。具体地,首先确定任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,以及销售信息中所有商品品类的总销量。然后根据第一销量和总销量确定第一销量权重,根据第二销量和总销量确定第二销量权重。最后根据第一销量权重和第二销量权重确定这两个商品品类之间的销量相关性。
例如,文本向量共有89条,根据这89条文本信息能够确定所有商品品类的总销量为1180,并且根据文本向量能够确定A商品品类的第一销量为16,B商品品类的第二销量为12,C商品品类的第二销量为110。然后以A商品品类的第一销量和所有商品品类的总销量之间的比值作为A商品品类的第一销量权重,即12÷1180=0.010。同理,能够确定B商品品类的第二销量权重为16÷1180=0.013。
根据A商品品类的第一销量权重和B商品品类的第二销量权重,确定A商品品类和B商品品类之间的相关性。具体地,以A商品品类的第一销量权重和B商品品类的第二销量权重之间的比值,作为A商品品类和B商品品类之间的销量相关性,即0.010÷0.013=0.769×100%=76.9%。
同理能够C商品品类的销量的权重为110÷1180=0.093,进而确定A商品品类和C商品品类之间的销量相关性为0.010÷0.093=0.1075×100%=10.75%。
本发明第二方面的一个实施例提出了一种商品相关性挖掘装置100,包括:获取单元110,用于确定销售信息,其中销售信息包括N个商品品类中,每个商品品类对应的品类名称信息和品类销量信息,其中N为大于1的整数;获取单元110还用于,对销售信息进行向量化处理,得到包含品类名称信息和品类销售信息的文本向量;运算单元120,用于根据文本向量,确定N个商品品类中的每个商品品类的销量和每个商品品类在销售信息中的出现次数;所述运算单元120还用于,根据出现次数确定任两个商品品类之间的共现相关性;所述运算单元120还用于,根据销量确定任两个商品品类之间的销量相关性;所述运算单元120还用于,根据共现相关性和销量相关性,确定任两个商品品类之间的总相关性。
该实施例提出的商品相关性挖掘装置100,包括获取单元110和运算单元120。首先通过获取单元110确定需要的销售信息,并对销售信息进行处理,得到包含商品的品类名称和品类销售信息的文本向量。然后通过运算单元120来根据文本向量确定不同商品品类之间的共现相关性和销量相关性,进而根据共现相关性和销量相关性确定商品品类之间的总相关性。
具体地,运算单元120能够根据文本向量确定每个商品品类的销量和每个商品品类在销售信息中出现的次数,根据出现次数确定不同商品品类之间的共现相关性,根据销量能够确定不同商品品类之间的销量相关性。综合考虑共现相关性和销量相关性,就能够得到不同商品品类的总相关性。
进一步地,可以根据共现相关性和销量相关性之间的比值,确定不同商品品类的总相关性。
商品可以从大的品类层面划分成为不同的商品品类,也可以从库存保持单元层面(stocking keeping unit,SKU),也即商品的最小分类层面划分。
通过共现相关性和销量相关性的综合评判,在导入不同的销售信息时,能够从不同维度对商品的相关性进行分析,进而实现多维度的商品相关性挖掘。
在一些实施例中,获取单元110具体用于:获取与N个商品品类相关的订单数据,其中订单数据包括订单对应的下单账户、下单时刻和销量;在订单数据中确定第一订单数据、第二订单数据和第三订单数据,根据第一订单数据、第二订单数据或第三订单数据中的至少一个确定销售信息;其中,第一订单数据为每个下单账户对应的订单数据,第二订单数据为对应的下单时刻处于预设的时间段内的订单数据,第三订单数据为对应的销量处于预设销量范围内的订单数据。
在该实施例中,获取单元110可以根据订单数据确定不同的销售信息,进而根据不同的销售信息实现不同维度的商品相关性挖掘。具体地,订单数据可以包括订单对应的下单账户、下单时刻和销量。根据下单账户能够确定每个下单账户对应的第一订单数据,通过第一订单数据能够从商品与人的关系这个维度对商品品类相关性进行挖掘。根据下单时刻能够确定处于预设的时间段内的第二订单数据,通过第二订单数据能够从时间维度对对商品品类相关性进行挖掘。根据销量能够确定处于预设销量范围内的第三订单数据,通过第三订单数据能够从销量维度对商品品类相关性进行挖掘。
进一步地,获取单元110还可以根据订单数据确定其他的数据信息,进而实现在其他维度的商品品类相关性挖掘。通过对销售信息的确定,实现了多个不同维度的商品相关性的分析。使挖掘计算更灵活,挖掘结果更有针对性。
在一些实施例中,运算单元120包括第一运算子单元122,用于根据出现次数确定任两个商品品类之间的共现相关性,具体包括:根据任一商品品类的出现次数,和文本向量的数量,确定任一商品品类的第一权重;根据任两个商品品类中,每个商品品类对应的第一权重的和,确定任两个商品品类的第二权重;确定任两个商品品类同时出现的共现次数;确定共现次数与文本向量的数量的比值,根据比值确定任两个商品品类之间的共现次数权重;根据共现次数权重和第二权重,确定共现相关性。
在该实施例中,计算单元包括第一计算子单元,第一计算子单元可以根据出现次数确定任两个商品品类的共现次数,进而确定任两个商品品类的共现次数权重,也就是商品出售机会相关性,再根据出现次数权重来确定共现相关性。具体地,根据任一商品的出现次数和文本向量的数量,能够确定该商品品类在所有文本向量中出现的权重,也就是第一权重。对两个商品的第一权重进行求和操作,得到这两个商品的第二权重。确定两个商品同时出现的次数,也就是共现次数,以共现次数与文本向量的数量的比值作为这两个商品品类的共现次数权重,也就是商品出售机会相关性。最后根据共现次数权重和第二权重确定共现相关性。
例如,文本向量共有89条,其中A商品品类分别出现在第1个向量和第10个向量中;B商品品类分别出现在第1个向量、第10个向量、第17个向量和第81个向量中。C商品品类分别出现在第1个向量、第10个向量、第67个向量、第83个向量和第88个向量中。此时以A商品品类出现的次数与文本向量的数量之间的比值2/89作为A商品品类的第一权重;同理可以确定B商品品类的第一权重为4/89;C商品品类的第一权重为5/89。对A商品品类的第一权重和B商品品类的第一权重进行求和操作,得到A商品品类和B商品品类的第二权重为2/89+4/89=6/89。同理可以得到A商品品类和C商品品类的第二权重为2/89+5/89=7/89。
根据A商品品类和B商品品类同时出现在第1个向量和第10个向量中,因此确定A商品品类和B商品品类同时出现的共现次数为2。以共现次数2与文本向量的数量89的比值2/89作为这两个商品品类的共现次数权重,也就是共现次数权重(商品出售机会相关性)为2/89。同理,确定A商品品类和C商品品类同时出现的共现次数为2,共现次数权重(商品出售机会相关性)为2/89。
最后根据共现次数权重和第二权重确定共现相关性,将A商品品类和B商品品类之间的共现次数权重2/89与第二权重6/89之间的比值作为共现相关性,也就是(2/89)÷(6/89)=0.33……,A商品品类和B商品品类之间的共现相关性为0.33。
在一些实施例中,运算单元120还包括第二运算子单元124,用于根据销量确定任两个商品品类之间的销量相关性,具体包括:确定任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,并在销售信息中确定所有商品品类的总销量;根据第一销量、第二销量和总销量,分别确定第一商品品类的第一销量权重和第二商品品类的第二销量权重;根据第一销量权重和第二销量权重,确定任两个商品品类之间的销量相关性。
在该实施例中,计算单元还包括第二计算子单元,第二计算子单元可以根据任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,以及所有商品品类的总销量,来确定任两个商品品类之间的销量相关性。具体地,首先确定任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,以及销售信息中所有商品品类的总销量。然后根据第一销量和总销量确定第一销量权重,根据第二销量和总销量确定第二销量权重。最后根据第一销量权重和第二销量权重确定这两个商品品类之间的销量相关性。
例如,文本向量共有89条,根据这89条文本信息能够确定所有商品品类的总销量为1180,并且根据文本向量能够确定A商品品类的第一销量为16,B商品品类的第二销量为12,C商品品类的第二销量为110。然后以A商品品类的第一销量和所有商品品类的总销量之间的比值作为A商品品类的第一销量权重,即12÷1180=0.010。同理,能够确定B商品品类的第二销量权重为16÷1180=0.013。
根据A商品品类的第一销量权重和B商品品类的第二销量权重,确定A商品品类和B商品品类之间的相关性。具体地,以A商品品类的第一销量权重和B商品品类的第二销量权重之间的比值,作为A商品品类和B商品品类之间的销量相关性,即0.010÷0.013=0.769×100%=76.9%。
同理能够C商品品类的销量的权重为110÷1180=0.093,进而确定A商品品类和C商品品类之间的销量相关性为0.010÷0.093=0.1075×100%=10.75%。
图9示出了本发明第二方面的另一个实施例提出了一种商品相关性挖掘装置100,包括获取单元110和计算单元,其中计算单元包括第一计算子单元和第二计算子单元。具体地,获取单元110能够确定销售信息,并对销售信息进行处理,得到文本向量。计算单元能够文本向量确定不同商品品类的共现相关性和销量相关性,进而根据共现相关性和销量相关性确定总相关性。计算单元包括第一计算子单元和第二计算子单元,其中第一计算子单元能够根据文本向量确定共现相关性,第二计算子单元能够根据文本向量确定销量相关性。
如图10所示,本发明第三方面的一个实施例提出了一种电子设备200,包括处理器210和存储器220,处理器210用于执行存储器220中存储的程序或指令时实现如本发明第一方面的任一设计的商品相关性挖掘方法的步骤。
该实施例提供的电子设备200,包括存储器220和处理器210。其中存储器220能够存储程序,而处理器210能够执行存储器220所存储的程序,以实现如上述第一方面的任一设计的商品相关性挖掘方法的步骤,因而具备该商品相关性挖掘方法的全部有益效果,在此不再赘述。
本发明第四方面的实施例提供了一种可读存储介质,其上存储有程序或指令,程序或指令被处理器执行时实现如上述第一方面的任一实施例的商品相关性挖掘方法的步骤,因而具备该商品相关性挖掘方法的全部有益效果,在此不再赘述。
可读存储介质可以包括能够存储或传输信息的任何介质。可读存储介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的网络被下载。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者计算机设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者计算机设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者计算机设备中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和计算机设备的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种商品相关性挖掘方法,其特征在于,包括:
确定销售信息,其中所述销售信息包括N个商品品类中,每个商品品类对应的品类名称信息和品类销量信息,其中N为大于1的整数;
对所述销售信息进行向量化处理,得到包含所述品类名称信息和所述品类销售信息的文本向量;
根据所述文本向量,确定所述N个商品品类中的每个商品品类的销量和所述每个商品品类在所述销售信息中的出现次数;
根据所述出现次数确定所述任两个商品品类之间的共现相关性;
根据所述销量确定所述任两个商品品类之间的销量相关性;
根据所述共现相关性和所述销量相关性,确定所述任两个商品品类之间的总相关性。
2.根据权利要求1所述的商品相关性挖掘方法,其特征在于,所述确定销售信息,具体包括:
获取与所述N个商品品类相关的订单数据,其中所述订单数据包括所述订单对应的下单账户、下单时刻和销量;
在所述订单数据中确定第一订单数据、第二订单数据和第三订单数据,根据所述第一订单数据、所述第二订单数据或所述第三订单数据中的至少一个确定所述销售信息;
其中,所述第一订单数据为每个所述下单账户对应的订单数据,所述第二订单数据为对应的所述下单时刻处于预设的时间段内的订单数据,所述第三订单数据为对应的所述销量处于预设销量范围内的订单数据。
3.根据权利要求1所述的商品相关性挖掘方法,其特征在于,所述根据所述出现次数确定所述任两个商品品类之间的共现相关性,具体包括:
根据任一商品品类的出现次数,和所述文本向量的数量,确定所述任一商品品类的第一权重;
根据所述任两个商品品类中,每个商品品类对应的第一权重的和,确定所述任两个商品品类的第二权重;
确定所述任两个商品品类同时出现的共现次数;
确定所述共现次数与所述文本向量的数量的比值,根据所述比值确定所述任两个商品品类之间的共现次数权重;
根据所述共现次数权重和所述第二权重,确定所述共现相关性。
4.根据权利要求1所述的商品相关性挖掘方法,其特征在于,所述根据所述销量确定所述任两个商品品类之间的销量相关性,具体包括:
确定所述任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,并在所述销售信息中确定所有商品品类的总销量;
根据所述第一销量、所述第二销量和所述总销量,分别确定所述第一商品品类的第一销量权重和所述第二商品品类的第二销量权重;
根据所述第一销量权重和所述第二销量权重,确定所述任两个商品品类之间的所述销量相关性。
5.一种商品相关性挖掘装置,其特征在于,包括:
获取单元,用于确定销售信息,其中所述销售信息包括N个商品品类中,每个商品品类对应的品类名称信息和品类销量信息,其中N为大于1的整数;
所述获取单元还用于,对所述销售信息进行向量化处理,得到包含所述品类名称信息和所述品类销售信息的文本向量;
运算单元,用于根据所述文本向量,确定所述N个商品品类中的每个商品品类的销量和所述每个商品品类在所述销售信息中的出现次数;
所述运算单元还用于,根据所述出现次数确定所述任两个商品品类之间的共现相关性;
所述运算单元还用于,根据所述销量确定所述任两个商品品类之间的销量相关性;
所述运算单元还用于,根据所述共现相关性和所述销量相关性,确定所述任两个商品品类之间的总相关性。
6.根据权利要求5所述的商品相关性挖掘装置,其特征在于,所述获取单元具体用于:
获取与所述N个商品品类相关的订单数据,其中所述订单数据包括所述订单对应的下单账户、下单时刻和销量;
在所述订单数据中确定第一订单数据、第二订单数据和第三订单数据,根据所述第一订单数据、所述第二订单数据或所述第三订单数据中的至少一个确定所述销售信息;
其中,所述第一订单数据为每个所述下单账户对应的订单数据,所述第二订单数据为对应的所述下单时刻处于预设的时间段内的订单数据,所述第三订单数据为对应的所述销量处于预设销量范围内的订单数据。
7.根据权利要求5所述的商品相关性挖掘装置,其特征在于,所述运算单元包括第一运算子单元,用于:
根据任一商品品类的出现次数,和所述文本向量的数量,确定所述任一商品品类的第一权重;
根据所述任两个商品品类中,每个商品品类对应的第一权重的和,确定所述任两个商品品类的第二权重;
确定所述任两个商品品类同时出现的共现次数;
确定所述共现次数与所述文本向量的数量的比值,根据所述比值确定所述任两个商品品类之间的共现次数权重;
根据所述共现次数权重和所述第二权重,确定所述共现相关性。
8.根据权利要求5所述的商品相关性挖掘装置,其特征在于,所述运算单元还包括第二运算子单元,用于:
确定所述任两个商品品类中,第一商品品类的第一销量和第二商品品类的第二销量,并在所述销售信息中确定所有商品品类的总销量;
根据所述第一销量、所述第二销量和所述总销量,分别确定所述第一商品品类的第一销量权重和所述第二商品品类的第二销量权重;
根据所述第一销量权重和所述第二销量权重,确定所述任两个商品品类之间的所述销量相关性。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的程序或指令时实现如权利要求1至4中任一项所述的商品相关性挖掘方法的步骤。
10.一种可读存储介质,其上存储有程序或指令,其特征在于,所述程序或指令被处理器执行时实现如权利要求1至4中任一项所述的商品相关性挖掘方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110812093.8A CN113610563A (zh) | 2021-07-19 | 2021-07-19 | 商品相关性挖掘方法、装置、电子设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110812093.8A CN113610563A (zh) | 2021-07-19 | 2021-07-19 | 商品相关性挖掘方法、装置、电子设备和可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113610563A true CN113610563A (zh) | 2021-11-05 |
Family
ID=78337845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110812093.8A Pending CN113610563A (zh) | 2021-07-19 | 2021-07-19 | 商品相关性挖掘方法、装置、电子设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113610563A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103839172A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 商品推荐方法及系统 |
CN108346063A (zh) * | 2017-01-24 | 2018-07-31 | 北京京东尚科信息技术有限公司 | 挖掘商品的方法、装置、电子设备和可读存储介质 |
CN110580649A (zh) * | 2018-06-08 | 2019-12-17 | 北京京东尚科信息技术有限公司 | 一种商品潜力值的确定方法和装置 |
-
2021
- 2021-07-19 CN CN202110812093.8A patent/CN113610563A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103839172A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 商品推荐方法及系统 |
CN108346063A (zh) * | 2017-01-24 | 2018-07-31 | 北京京东尚科信息技术有限公司 | 挖掘商品的方法、装置、电子设备和可读存储介质 |
CN110580649A (zh) * | 2018-06-08 | 2019-12-17 | 北京京东尚科信息技术有限公司 | 一种商品潜力值的确定方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109242633B (zh) | 一种基于二部图网络的商品推送方法和装置 | |
Elrod | Choice map: Inferring a product-market map from panel data | |
US9846885B1 (en) | Method and system for comparing commercial entities based on purchase patterns | |
US20080114778A1 (en) | System and method for generating a display of tags | |
CN109064293B (zh) | 商品推荐方法、装置、计算机设备及存储介质 | |
KR20200108058A (ko) | 추천 장치 및 방법 | |
CN112200601B (zh) | 物品推荐方法、装置及可读存储介质 | |
CN108090807B (zh) | 信息推荐方法及装置 | |
CN111292164A (zh) | 一种商品推荐方法、装置、电子设备及可读存储介质 | |
US20220180379A1 (en) | Transaction-based information processing system, method, and article | |
CN111080409A (zh) | 一种推送信息的计算机装置、方法、设备及介质 | |
KR20150121281A (ko) | 고객의 상품에 대한 선호도에 기초하여 상품을 추천하기 위한 방법 및 그 방법을 수행하기 위한 명령어가 저장된 컴퓨터 판독가능한 기록매체 | |
CN110866191A (zh) | 推荐召回方法、设备和存储介质 | |
JP2023052120A (ja) | 顧客個人化制御ユニット、システム、および方法 | |
EP2720154A1 (en) | Pattern extraction device and method | |
JPWO2019049856A1 (ja) | 材料仕様情報サーバ、材料選択支援方法及び材料選択支援システム | |
Cumby et al. | Building intelligent shopping assistants using individual consumer models | |
CN113610563A (zh) | 商品相关性挖掘方法、装置、电子设备和可读存储介质 | |
CN107943943B (zh) | 用户相似度的确定方法、装置、电子设备及存储介质 | |
EP4120144A1 (en) | Reducing sample selection bias in a machine learning-based recommender system | |
CN110852846A (zh) | 用于推荐对象的处理方法及装置、电子设备、存储介质 | |
CN112015970A (zh) | 产品推荐方法、相关设备及计算机存储介质 | |
CN115239413A (zh) | 一种商品推荐方法、装置、设备及存储介质 | |
CN112700279A (zh) | 基于用户标签的交叉营销方法及系统 | |
JP4671428B2 (ja) | マーケティングリサーチ支援サーバ及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |