CN113807957A - 基于机器学习确定数据对象的类别 - Google Patents

基于机器学习确定数据对象的类别 Download PDF

Info

Publication number
CN113807957A
CN113807957A CN202011587184.8A CN202011587184A CN113807957A CN 113807957 A CN113807957 A CN 113807957A CN 202011587184 A CN202011587184 A CN 202011587184A CN 113807957 A CN113807957 A CN 113807957A
Authority
CN
China
Prior art keywords
data
determining
categories
transaction data
amounts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011587184.8A
Other languages
English (en)
Inventor
C.伍德
B.阮
V.怀科夫
P.R.塔蒂尼
N.方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SAP SE
Original Assignee
SAP SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SAP SE filed Critical SAP SE
Publication of CN113807957A publication Critical patent/CN113807957A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0253During e-commerce, i.e. online transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Technology Law (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一些实施例提供了存储程序的非暂时性机器可读介质。程序从存储装置中检索多个交易数据。多个交易数据中的每个交易数据包括项目和与该项目相关联的金额。基于多个交易数据,程序还确定金额范围集。基于金额范围集和数据对象集,程序还确定类别集。数据对象集中的每个数据对象属于类别集中的一类别。

Description

基于机器学习确定数据对象的类别
技术领域
本申请涉及数据分类技术,更具体地涉及基于机器学习确定数据对象的类别的技术。
背景技术
机器学习(ML)是涉及对通过经验来自动改进的计算机算法的研究的人工智能的子集。例如,ML算法可以基于样本数据(也被称为训练数据)建立数学模型,以便在没有被明确编程的情况下进行预测或决策。这些类型的ML算法通常被称为监督学习ML算法。另一类型的ML算法在没有预先存在的标签且几乎没有人监督的情况下,识别数据集中的隐藏模式。这些类型的ML算法通常被称为无监督学习ML算法。ML算法有多种不同的应用。例如,ML算法可以用于电子邮件过滤、情感分析、欺诈检测、计算机视觉、手写辨识、搜索引擎等。
发明内容
在一些实施例中,非暂时性机器可读介质存储可由设备的至少一个处理单元执行的程序。程序从存储装置(storage)中检索多个交易数据。多个交易数据中的每个交易数据包括项目(item)和与项目相关联的金额(amount)。基于多个交易数据,程序还确定金额范围集。基于金额范围集和数据对象集,程序还确定类别集。数据对象集中的每个数据对象属于类别集中的类别。
在一些实施例中,确定金额范围集可以包括使用贝叶斯块(Bayesian Block)算法来确定金额范围集。程序还可以基于多个交易数据中的金额,确定唯一金额集(set ofunique amounts);从最小到最大对唯一金额集排序;对于唯一金额集中的每对连续唯一金额(each pair of successive unique amounts),确定该对连续唯一金额之间的中点;并且使用该中点作为贝叶斯块算法的输入。
在一些实施例中,确定类别集可以包括使用分层的基于密度的聚类选择(hierarchical density-based cluster selection,HDBSCAN)算法。数据对象集可以包括用户集。程序还可以从客户端设备接收对针对用户的多个推荐项目的请求;确定与用户相关联的类别;识别与用户集相关联的交易数据,其中用户集中的每个用户可以与类别相关联;确定在所识别的交易数据中具有最多实例的定义数量的项目;并将定义数量的项目提供给客户端设备。
在一些实施例中,数据对象集可以包括与第一租户相关联的用户集,多个交易数据可以是与第一租户相关联的第一多个交易数据,金额范围集可以是第一金额范围集,并且类别集可以是第一类别集。程序还可以从存储装置中检索与第二租户相关联的第二多个交易数据。第二多个交易数据中的每个交易数据包括项目和与项目相关联的金额。基于第二多个交易数据,程序还可以确定第二金额范围集。基于第二金额范围集和与第二租户相关联的第二数据对象集,程序还可以确定第二类别集。第二数据对象集中的每个数据对象可以属于第二类别集中的类别。确定类别集还可以基于活动数据集。
在一些实施例中,一种方法从存储装置中检索多个交易数据。多个交易数据中的每个交易数据包括项目和与项目相关联的金额。基于多个交易数据,该方法还确定金额范围集。基于金额范围集和数据对象集,该方法还确定类别集。数据对象集中的每个数据对象属于类别集中的类别。
在一些实施例中,确定金额范围集可以包括使用贝叶斯块算法来确定金额范围集。该方法还可以基于多个交易数据中的金额,确定唯一金额集;从最小到最大对唯一金额集排序;对于唯一金额集中的每对连续唯一金额,确定该对连续唯一金额之间的中点;并且使用该中点作为贝叶斯块算法的输入。
在一些实施例中,确定类别集可以包括使用分层的基于密度的聚类选择(HDBSCAN)算法。数据对象集可以包括用户集。方法还可以从客户端设备接收对针对用户的多个推荐项目的请求;确定与用户相关联的类别;识别与用户集相关联的交易数据,其中用户集中的每个用户可以与类别相关联;确定在所识别的交易数据中具有最多实例的定义数量的项目;并将定义数量的项目提供给客户端设备。
在一些实施例中,数据对象集可以包括与第一租户相关联的用户集,多个交易数据可以是与第一租户相关联的第一多个交易数据,金额范围集可以是第一金额范围集,并且类别集可以是第一类别集。方法还可以从存储装置中检索与第二租户相关联的第二多个交易数据。第二多个交易数据中的每个交易数据可以包括项目和与项目相关联的金额。基于第二多个交易数据,方法还可以确定第二金额范围集。基于第二金额范围集和与第二租户相关联的第二数据对象集,方法还可以确定第二类别集。第二数据对象集中的每个数据对象属于第二类别集中的类别。确定类别集还可以基于活动数据集。
在一些实施例中,系统包括一组处理单元和存储指令的非暂时性机器可读介质。指令使得至少一个处理单元从存储装置中检索多个交易数据。多个交易数据中的每个交易数据包括项目和与项目相关联的金额。基于多个交易数据,指令还使得至少一个处理单元确定金额范围集。基于金额范围集和数据对象集,指令还使得至少一个处理单元确定类别集,其中数据对象集中的每个数据对象属于类别集中的类别。
在一些实施例中,确定金额范围集可以包括使用贝叶斯块算法来确定金额范围集。指令还可以使得至少一个处理单元基于多个交易数据中的金额来确定唯一金额集;从最小到最大对唯一金额集排序;对于唯一金额集中的每对连续唯一金额,确定该对连续唯一金额之间的中点;并且使用该中点作为贝叶斯块算法的输入。
在一些实施例中,确定类别集可以包括使用分层的基于密度的聚类选择(HDBSCAN)算法。数据对象集可以包括用户集。指令还可以使得至少一个处理单元从客户端设备接收对用户的多个推荐项目的请求;确定与用户相关联的类别;识别与用户集相关联的交易数据,其中用户集中的每个用户与类别相关联;确定在所识别的交易数据中具有最多实例的定义数量的项目;并将定义数量的项目提供给客户端设备。
在一些实施例中,数据对象集可以包括与第一租户相关联的用户集,多个交易数据可以是与第一租户相关联的第一多个交易数据,金额范围集可以是第一金额范围集,并且类别集可以是第一类别集。指令还可以使得至少一个处理单元从存储装置中检索与第二租户相关联的第二多个交易数据。第二多个交易数据中的每个交易数据可以包括项目和与该项目相关联的金额。基于第二多个交易数据,指令还可以使至少一个处理单元确定第二金额范围集。基于第二金额范围集和与第二租户相关联的第二数据对象集,指令还可以使得至少一个处理单元确定第二类别集。第二数据对象集中的每个数据对象可以属于第二类别集中的类别。
以下详细描述和附图提供了对本公开的各种实施例的性质和优点的更好理解。
附图说明
图1示出了根据一些实施例的用于确定数据对象的类别的系统。
图2示出了根据一些实施例的通过图1所示的系统的示例数据流。
图3示出了根据一些实施例的包括对用户的示例项目推荐的图形用户界面。
图4示出了根据一些实施例的用于确定类别的过程。
图5示出了可以实现各种实施例的示例性计算机系统。
图6示出了可以实现各种实施例的示例性计算设备。
图7示出了可以实现各种实施例的示例性系统。
具体实施方式
在以下描述中,出于解释的目的,阐述了多个示例和具体细节,以便提供对本公开的透彻理解。然而,对于本领域的技术人员来说清楚的是,由权利要求限定的本公开的各种实施例可以包括这些示例中的特征中的一些或全部,或者与下面描述的其他特征相结合,并且还可以包括本文所描述的特征和概念的修改和等同物。
本文描述了基于机器学习确定数据对象的类别的技术。在一些实施例中,计算系统可以接收与在生产环境中发生的交易相关联的交易数据,例如,诸如通过电子商务网站提供的对项目的用户购买。计算系统还可以接收与产品环境中的活动相关联的活动数据,例如,诸如用户访问电子商务网站的次数、在电子商务网站的各个页面上花费的时间等。基于交易数据,计算系统可以确定用户做出的购买金额范围集。接下来,计算系统使用该购买金额范围集和活动数据来确定类别集。每个类别指定一个或多个用户。然后,对于每个类别,计算系统基于被分配了该类别的用户的购买历史来确定推荐项目集。现在,当用户访问电子商务网站时,计算系统可以基于用户的类别确定对用户的推荐项目集。电子商务网站可以向用户提供该推荐集。
图1示出了根据一些实施例的用于确定数据对象的类别的系统100。如图所示,系统100包括客户端设备105a-n和计算系统110。客户端设备105a-n被配置为与计算系统110通信和交互。例如,客户端设备105的用户可以访问计算系统110以与电子商务网站(未示出)交互并购买由电子商务网站提供的项目。在一些情况下,当客户端设备105的用户向计算系统110发送访问电子商务网站的网页的请求时,客户端设备105接收该网页以及与该用户相关联的推荐项目列表。
如图1所示,计算系统110包括生产环境管理器115、数据分仓(binning)管理器120、聚类引擎125、推荐管理器130和存储装置135-155。用户交易存储装置135被配置为存储经由电子商务网站发生的用户的交易。例如,对于每个用户,这样的交易可以包括通过电子商务网站提供的已购买项目的历史。每个已购买项目可以包括项目和为该项目支付的金额。用户活动存储装置140存储与电子商务网站相关联的用户活动。对于每个用户,用户活动的示例包括,用户访问电子商务网站的次数、执行不同类型的动作(例如,搜索项目,点击特定类型的用户界面(UI)元素等)、用户执行不同类型的动作所花费的时间等。推荐数据存储装置145被配置为存储针对不同用户的推荐列表。推荐列表可以包括推荐项目列表。用户聚类存储装置150存储用户聚类。每个用户聚类可以与类别相关联。生产数据存储装置155存储与生产环境(未示出)相关联的数据。在一些实施例中,电子商务网站经由生产环境提供。生产数据的示例包括用户活动数据、用户交易数据、用户简档数据、用户许可数据等。在一些实施例中,存储装置135-155在单个物理存储装置中实现,而在其他实施例中,存储装置135-155可以跨几个物理存储装置实现。尽管图1将存储装置135-155示为计算系统110的部分,本领域的普通技术人员将理解,但是在一些实施例中,用户交易存储装置135、用户活动存储装置140、推荐数据存储装置145、用户聚类存储装置150和/或生产数据存储装置155可以在计算系统110的外部。
生产环境管理器115充当生产环境(未示出)的接口。在一些实施例中,生产环境包括在计算系统110中。在其他实施例中,生产环境托管在单独的计算系统上。生产环境管理器115还管理与生产环境相关联的数据。例如,生产环境管理器115可以监控与生产环境相关联的数据并将其存储在生产数据存储装置155中。如上所述,生产数据的示例可以包括用户活动数据、用户交易数据、用户简档数据、用户许可数据等。生产环境管理器115可以提供应用编程接口(API)集,通过这些接口可以访问生产数据。在一些情况下,由生产环境管理器115管理的生产环境可以接收对与用户相关联的推荐项目列表的请求。作为响应,生产环境管理器115将该请求转发给推荐管理器130。转而,生产环境管理器115接收与用户相关联的推荐项目列表,并将其转发给生产环境,生产环境将其转发给用户使用的客户端设备105。
数据分仓管理器120负责确定数据仓集。在一些实施例中,数据仓是数据值的定义范围。例如,以定义的间隔(例如,一小时一次、一天一次、一周一次等),数据分仓管理器120可以从用户交易存储装置135中检索电子商务网站的用户的交易数据,对于每个用户,该交易数据包括通过电子商务网站(例如,由生产环境管理器115管理的生产环境提供的电子商务网站)提供的已购买项目的历史。每个已购买项目可以包括项目和为该项目支付的金额。然后,数据分仓管理器120基于用户通过电子商务网站为购买的物品支付的金额,生成金额范围集。在一些实施例中,数据分仓管理器120使用贝叶斯块算法来确定金额范围集。在一些这样的实施例中,数据分仓管理器120通过确定唯一金额集来确定该金额范围集,从最小到最大对该金额范围集排序,确定每对连续唯一金额之间的中点,并且使用该中点作为贝叶斯块算法的输入。一旦数据分仓管理器120确定了该金额范围集,数据分仓管理器120将它们发送到聚类引擎125以进行处理。
聚类引擎125被配置为确定用户聚类。例如,当聚类引擎125从数据分仓管理器120接收金额范围集时,聚类引擎125检索与电子商务网站的用户相关联的活动数据,该金额范围集是针对该电子商务网站的用户确定的。接下来,聚类引擎125基于该金额范围集和活动数据来确定用户聚类集。在一些实施例中,聚类引擎125使用分层的基于密度的聚类选择(HDBSCAN)算法来确定聚类集。HDBSCAN算法确定类别集。每个类别指定一个或多个用户。特定用户只能属于类别集中的一个类别。因此,类别集充当用户聚类集。聚类引擎125将用户聚类集存储在用户聚类存储装置150中。
推荐管理器130负责确定对用户的推荐列表。例如,推荐管理器130可以从生产环境管理器115接收对与用户相关联的推荐项目列表的请求。响应于该请求,推荐管理器130访问用户聚类存储装置150,以识别与用户相关联的类别,并识别在该类别中指定的所有用户。接下来,推荐管理器130访问用户交易存储装置135,以检索与在该类别中指定的每个用户相关联的交易数据。然后,推荐管理器130访问生产数据存储装置155,以检索与用户相关联的用户许可。推荐管理器130基于用户许可过滤掉用户不被允许访问的项目。根据用户被允许访问的项目,推荐管理器130基于与在类别中指定的用户相关联的交易数据,确定在所识别的交易数据中具有最多实例的定义数量项目(例如,五个项目、十个项目、十五个项目等),并将它们发送到生产环境管理器115。此外,推荐管理器130将推荐项目列表存储在推荐数据存储装置145中,使得该列表可以针对对电子商务网站的后续访问而被提供给用户。
图2示出了根据一些实施例的通过系统100的示例数据流。数据流开始于客户端设备105a-n在202-206与由生产环境管理器115管理的生产环境提供的电子商务网站进行交互。交互可以包括由客户端设备105a-n的用户完成的交易以及客户端设备105a-n的用户的活动数据。在208,生产环境管理器将这些交互存储在生产数据存储装置155中。计算系统110可以经由通过生产环境管理器115提供的API集来访问交易数据,并将数据存储在用户交易存储装置135中。类似地,计算系统110访问活动数据并将它们存储在用户活动存储装置140中。
以定义的时间间隔,数据分仓管理器120在210访问用户交易存储装置135,并在212检索电子商务网站的用户的交易数据,该交易数据包括通过电子商务网站提供的已购买项目和为该项目支付的金额。接下来,数据分仓管理器120使用贝叶斯块算法、基于为项目支付的金额生成金额范围集。对于该示例,数据分仓管理器120确定唯一金额集,从最小到最大对该唯一金额集排序,确定每对连续唯一金额之间的中点,并且使用该中点作为贝叶斯块算法的输入。然后,数据分仓管理器120在214向聚类引擎125发送金额范围集。
一旦从数据分仓管理器120接收到金额范围集,聚类引擎125在216访问用户活动存储装置140,并在218检索与电子商务网站的用户相关联的活动数据。然后,聚类引擎125通过使用HDBSCAN算法、基于金额范围集和活动数据来确定类别集,其中每个类别指定一个或多个用户,并且每个用户只能属于该类别集中的一个类别。接下来,在220,聚类引擎125将用户聚类集存储在用户聚类存储装置150中。
在该示例中,在稍后的某个时间点,由生产环境管理器115管理的生产环境在222接收对与客户端设备105b的用户相关联的推荐项目列表的请求。作为响应,生产环境管理器115将该请求转发给推荐管理器130。在接收到来自生产环境管理器115的请求时,推荐管理器130在224访问用户聚类存储装置150,以在226检索与用户相关联的类别和在该类别中指定的所有用户。然后,推荐管理器130在228访问用户交易存储装置135,以在230检索与在类别中指定的每个用户相关联的交易数据。接下来,推荐管理器130访问生产数据存储装置155以检索与用户相关联的用户许可,然后使用该用户许可来过滤掉用户不被允许访问的项目。根据用户被允许访问的项目,推荐管理器130基于与在类别中指定的用户相关联的交易数据,确定在所识别的交易数据中具有最多的实例的定义数量的项目(例如,五个项目、十个项目、十五个项目等),并且在232,将它们存储在推荐数据存储装置145中。接下来,推荐管理器130向生产环境管理器115发送项目。生产环境管理器115将推荐项目列表转发给生产环境,生产环境在234经由客户端设备105b将其转发给用户。
图3示出了根据一些实施例的图形用户界面(GUI)300,其包括针对用户的示例项目推荐。对于该示例,由生产环境管理器115管理的生产环境向用户使用的客户端设备105提供GUI 300。如图所示,GUI 300包括推荐项目列表305和可选UI项目335-365。在该示例中,推荐项目列表305与用户相关联。如图所示,推荐项目列表305包括项目315-325和可选项目330。项目315-325中的每一个都包括相应项目的价格。当被选择时,项目330使得GUI300滚动推荐项目列表305中的项目,以显示附加的推荐项目。可选UI项目335-365每个表示一类项目。用户可选UI项目335-365中的每一个在被选择时,使得GUI 300导航到列出属于相应的类别的项目的页面。
图4示出了根据一些实施例的用于确定类别的过程400。在一些实施例中,计算系统110执行过程400。过程400开始于在410从存储装置中检索多个交易数据。多个交易数据中的每个交易数据包括项目和与该项目相关联的金额。参考图2作为示例,数据分仓管理器120可以访问用户交易存储装置135,并检索电子商务网站的用户的交易数据,该交易数据包括通过电子商务网站提供的已购买项目和为该项目支付的金额。
接下来,过程400在420基于多个交易数据确定金额范围集。参考图2并继续上面的示例,数据分仓管理器120使用贝叶斯块算法、基于为项目支付的金额生成金额范围集。例如,数据分仓管理器120可以确定唯一金额集,从最小到最大对该唯一金额集排序,确定每对连续唯一金额之间的中点,并且使用该中点作为贝叶斯块算法的输入。
最后,过程400在430基于金额范围集和数据对象集来确定类别集。该数据对象集中的每个数据对象属于该类别集中的类别。参考图2并继续上面的示例,聚类引擎125访问用户活动存储装置140并检索与电子商务网站的用户相关联的活动数据。然后,聚类引擎125通过使用HDBSCAN算法、基于金额范围集和活动数据来确定类别集。
上述实施例和示例涉及电子商务网站的用户。然而,在一些实施例中,计算系统110可以是支持多个不同租户的多租户系统,每个租户都具有自己的用户。例如,计算系统110可以包括多个生产环境,每个生产环境为单独的用户集提供单独的电子商务网站。在这样的示例中,计算系统110保持与每个租户(例如,每个电子商务网站)相关联的用户数据(例如,用户交易数据、用户活动数据、用户简档数据等)分开。对于每个租户,计算系统110利用本文所描述的技术。这样,计算系统110可以为与不同租户相关联的用户确定不同的范围集、不同的类别集和不同的推荐。
图5示出了用于实现上述各种实施例的示例性计算机系统500。例如,计算机系统500可以用于实现客户端设备105a-n和计算系统110。计算机系统500可以是台式计算机、膝上型计算机、服务器计算机或任何其他类型的计算机系统或其组合。生产环境管理器115、数据分仓管理器120、聚类引擎125、推荐管理器130或其组合的一些或所有元件可以包括在计算机系统500中或在计算机系统500中实现。此外,计算机系统500可以实现上述操作、方法和/或过程(例如,过程400)中的多个。如图5所示,计算机系统500包括处理子系统502,其经由总线子系统526与输入/输出(I/O)子系统508、存储子系统510和通信子系统524通信。
总线子系统526被配置为便于计算机系统500的各种组件和子系统之间的通信。尽管总线子系统526在图5中被示为单个总线,但是本领域普通技术人员将理解,总线子系统526可以被实现为多个总线。总线子系统526可以是使用各种总线架构中的任何一种的几种类型的总线结构中的任何一种(例如,存储器总线或存储器控制器、外围总线、本地总线等)。总线架构的示例可以包括工业标准架构(ISA)总线、微通道架构(MCA)总线、增强型ISA(EISA)总线、视频电子标准协会(VESA)本地总线、外围组件互连(PCI)总线、通用串行总线(USB)等。
可以被实现为一个或多个集成电路(例如,传统的微处理器或微控制器)的处理子系统502,控制计算机系统500的操作。处理子系统502可以包括一个或多个处理器504。每个处理器504可以包括一个处理单元506(例如,诸如处理器504-1的单核处理器)或几个处理单元506(例如,诸如处理器504-2的多核处理器)。在一些实施例中,处理子系统502的处理器504可以被实现为独立的处理器,而在其他实施例中,处理子系统502的处理器504可以被实现为集成到单个芯片或多个芯片中的多个处理器。而且,在一些实施例中,处理子系统502的处理器504可以被实现为独立处理器和集成到单个芯片或多个芯片中的多个处理器的组合。
在一些实施例中,处理子系统502可以响应于程序代码执行各种程序或进程,并且可以维护多个同时执行的程序或进程。在任何给定时间,要执行的程序代码中的一些或所有可以驻留在处理子系统502和/或存储子系统510中。通过适当的编程,处理子系统502可以提供各种功能,诸如上面参考过程400所描述的功能。
I/O子系统508可以包括任何数量的用户界面输入设备和/或用户界面输出设备。用户界面输入设备可以包括键盘、定点设备(例如,鼠标、轨迹球等)、触摸板、结合到显示器中的触摸屏、滚轮、点击转盘、拨号盘、按钮、开关、小键盘、具有语音辨识系统的音频输入设备、麦克风、图像/视频捕获设备(例如,网络摄像机,图像扫描仪,条形码阅读器等)、运动感测设备、手势辨识设备、眼睛姿势(例如眨眼)辨识设备、生物测定输入设备和/或任何其他类型的输入设备。
用户界面输出设备可以包括视觉输出设备(例如,显示子系统、指示灯等)、音频输出设备(例如,扬声器、耳机等)等。显示子系统的示例可以包括阴极射线管(CRT)、平板设备(例如,液晶显示器(LCD)、等离子显示器等)、投影设备、触摸屏、和/或用于从计算机系统500向用户或另一设备(例如,打印机)输出信息的任何其他类型的设备和机制。
如图5所示,存储子系统510包括系统存储器512、计算机可读存储介质520和计算机可读存储介质读取器522。系统存储器512可以被配置为存储可由处理子系统502加载和执行的程序指令形式的软件以及在程序指令执行期间生成的数据。在一些实施例中,系统存储器512可以包括易失性存储器(例如,随机访问存储器(RAM))和/或非易失性存储器(例如,只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、闪存等)。系统存储器512可以包括不同类型的存储器,诸如静态随机访问存储器(SRAM)和/或动态随机访问存储器(DRAM)。系统存储器512可以包括基本输入/输出系统(BIOS),在一些实施例中,其被配置为存储基本例程,以便于在计算机系统500内的元件之间传送信息(例如,在启动期间)。这种BIOS可以被存储在ROM(例如,ROM芯片)、闪存或可以被配置为存储BIOS的任何其他类型的存储器中。
如图5所示,系统存储器512包括应用程序514、程序数据516和操作系统(OS)518。OS 518可以是微软Windows、苹果Mac OS、苹果OS X、苹果macOS和/或Linux操作系统、各种商业上可获得的UNIX或类似UNIX的操作系统(包括但不限于各种GNU/Linux操作系统、谷歌
Figure BDA0002867486790000111
OS等)和/或移动操作系统(诸如苹果iOS、Windows手机、Windows移动、Android、黑莓OS、黑莓10和Palm OS、WebOS操作系统)的各种版本之一。
计算机可读存储介质520可以是被配置为存储软件(例如,程序、代码模块、数据结构、指令等)的非暂时性计算机可读介质。上述组件(例如,生产环境管理器115、数据分仓管理器120、聚类引擎125和推荐管理器130)和/或过程(例如,过程400)中的多个可以被实现为软件,所述软件当由处理器或处理单元(例如,处理子系统502的处理器或处理单元)执行时,执行这些组件和/或过程的操作。存储子系统510还可以存储用于软件的执行的数据或在软件的执行期间生成的数据。
存储子系统510还可以包括被配置为与计算机可读存储介质520通信的计算机可读存储介质读取器522。计算机可读存储介质520可以与系统存储器512一起、并且可选地与系统存储器512相结合地,全面地表示远程、本地、固定和/或可移动存储设备以及用于临时和/或更永久地包含、存储、传输和检索计算机可读信息的存储介质。
计算机可读存储介质520可以是本领域已知或使用的任何合适的介质,包括存储介质,诸如以用于对信息的存储和/或传输的任何方法或技术实现的易失性、非易失性、可移动、不可移动介质。这种存储介质的示例包括RAM、ROM、EEPROM、闪存或其他存储器技术、光盘只读存储器(CD-ROM)、数字多功能盘(DVD)、蓝光盘(BD)、盒式磁带、磁带、磁盘存储器(例如硬盘驱动器)、Zip驱动器、固态驱动器(SSD)、闪存卡(例如安全数字(SD)卡、压缩闪存卡等)、USB闪存驱动器或任何其他类型的计算机可读存储介质或设备。
通信子系统524用作从其他设备、计算机系统和网络接收数据和向其他设备、计算机系统和网络发送数据的接口。例如,通信子系统524可以允许计算机系统500经由网络(例如,个人区域网(PAN)、局域网(LAN)、存储区域网(SAN)、校园网(CAN)、城域网(MAN)、广域网(WAN)、全球区域网(GAN)、内联网、互联网、任何数量的不同类型网络的网络等)连接到一个或多个设备。通信子系统524可以包括任何数量的不同通信组件。这样的组件的示例可以包括用于(例如,使用诸如2G、3G、4G、5G等的蜂窝技术、诸如Wi-Fi、蓝牙、ZigBee等的无线数据技术或其任意组合)接入无线语音和/或数据网络的射频(RF)收发器组件、全球定位系统(GPS)接收器组件和/或其他组件。在一些实施例中,除了为无线通信配置的组件之外或代替为无线通信配置的组件,通信子系统524可以提供为有线通信配置的组件(例如,以太网)。
本领域普通技术人员将认识到,图5所示的架构只是计算机系统500的示例架构,并且计算机系统500可以具有比所示更多或更少的组件,或者不同的组件配置。图5所示的各种组件可以用硬件、软件、固件或其任意组合来实现,包括一个或多个信号处理和/或专用集成电路。
图6示出了用于实现上述各种实施例的示例性计算设备600。例如,计算设备600可以用于实现设备客户端设备105a-n。计算设备600可以是电话、智能电话、可穿戴设备、活动跟踪器或管理器、平板电脑、个人数字助理(PDA)、媒体播放器或任何其他类型的移动计算设备或其组合。如图6所示,计算设备600包括处理系统602、输入/输出(I/O)系统608、通信系统618和存储系统620。这些组件可以通过一条或多条通信总线或信号线耦合。
可以被实现为一个或多个集成电路(例如,传统的微处理器或微控制器)的处理系统602控制计算设备600的操作。如图所示,处理系统602包括一个或多个处理器604和存储器606。处理器604被配置为运行或执行存储在存储器606中的各种软件和/或指令集,以执行计算设备600的各种功能并处理数据。
处理器604中的每个处理器可以包括一个处理单元(例如,单核处理器)或几个处理单元(例如,多核处理器)。在一些实施例中,处理系统602的处理器604可以被实现为独立的处理器,而在其他实施例中,处理系统602的处理器604可以被实现为集成到单个芯片中的多个处理器。而且,在一些实施例中,处理系统602的处理器604可以被实现为独立处理器和集成到单个芯片中的多个处理器的组合。
存储器606可以被配置为接收并存储可由处理器604加载和执行的程序指令的形式(例如,来自存储系统620的操作系统622、应用624、I/O模块626、通信模块628等)的软件,以及在程序指令的执行期间生成的数据。在一些实施例中,存储器606可以包括易失性存储器(例如,随机访问存储器(RAM))、非易失性存储器(例如,只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、闪存等),或者它们的组合。
I/O系统608负责通过各种组件接收输入,并通过各种组件提供输出。如该示例所示,I/O系统608包括显示器610、一个或多个传感器612、扬声器614和麦克风616。显示器610被配置为输出视觉信息(例如,由处理器604生成和/或渲染的图形用户界面(GUI))。在一些实施例中,显示器610是被配置为也接收基于触摸的输入的触摸屏。显示器610可以使用液晶显示(LCD)技术、发光二极管(LED)技术、有机LED(OLED)技术、有机电致发光(OEL)技术或任何其他类型的显示技术来实现。传感器612可以包括用于测量物理量(例如,温度、力、压力、加速度、方位、光、辐射等)的任何数量的不同类型的传感器。扬声器614被配置为输出音频信息,并且麦克风616被配置为接收音频输入。本领域普通技术人员将理解,I/O系统608可以包括任何数量的附加的、更少的和/或不同的组件。例如,I/O系统608可以包括用于接收输入的键盘或小键盘,用于发送数据、接收数据和/或电力和/或与另一设备或组件通信的端,、用于捕获照片和/或视频的图像捕捉组件等。
通信系统618用作从其他设备、计算机系统和网络接收数据和向其他设备、计算机系统和网络发送数据的接口。例如,通信系统618可以允许计算设备600经由网络(例如,个人区域网(PAN)、局域网(LAN)、存储区域网(SAN)、校园网(CAN)、城域网(MAN)、广域网(WAN)、全球区域网(GAN)、内联网、互联网、任何数量的不同类型网络的网络等)连接到一个或多个设备。通信系统618可以包括任何数量的不同通信组件。这样的组件的示例可以包括用于(例如,使用诸如2G、3G、4G、5G等的蜂窝技术、诸如Wi-Fi、蓝牙、ZigBee等的无线数据技术或其任意组合)接入无线语音和/或数据网络的射频(RF)收发器组件、全球定位系统(GPS)接收器组件和/或其他组件。在一些实施例中,除了为无线通信配置的组件之外或代替为无线通信配置的组件,通信系统618可以提供为有线通信配置的组件(例如,以太网)。
存储系统620为计算设备600处理对数据的存储和管理。存储系统620可以由被配置为存储软件(例如,程序、代码模块、数据结构、指令等)的一个或多个非暂时性机器可读介质来实现,并且存储用于软件的执行的数据或在软件的执行期间生成的数据。
在该示例中,存储系统620包括操作系统622、一个或多个应用624、I/O模块626和通信模块628。操作系统622包括用于控制和管理一般系统任务(例如,存储器管理、存储设备控制、电源管理等)的各种程序、指令集、软件组件和/或驱动器,并且促进各种硬件和软件组件之间的通信。操作系统622可以是微软Windows、苹果Mac OS、苹果OS X、苹果macOS和/或Linux操作系统、各种商业上可获得的UNIX或类似UNIX的操作系统(包括但不限于各种GNU/Linux操作系统、谷歌
Figure BDA0002867486790000141
OS等)和/或移动操作系统(诸如苹果iOS、Windows手机、Windows移动、Android、黑莓OS、黑莓10和Palm OS、WebOS操作系统)的各种版本之一。
应用624可以包括安装在计算设备600上的任意数量的不同应用。这样的应用的示例可以包括浏览器应用、地址簿应用、联系人列表应用、电子邮件应用、即时消息应用、文字处理应用、支持JAVA的应用、加密应用、数字版权管理应用、语音辨识应用、位置确定应用、地图应用、音乐播放器应用等。
I/O模块626管理经由输入组件(例如,显示器610、传感器612和麦克风616)接收到的信息和要经由输出组件(例如,显示器610和扬声器614)输出的信息。通信模块628促进经由通信系统618与其他设备的通信,并且包括用于处理从通信系统618接收到的数据的各种软件组件。
本领域的普通技术人员将认识到,图6所示的架构仅是计算设备600的示例架构,并且计算设备600可以具有比所示更多或更少的组件,或者不同的组件配置。图6所示的各种组件可以用硬件、软件、固件或其任意组合来实现,包括一个或多个信号处理和/或专用集成电路。
图7示出了用于实现上述各种实施例的示例性系统700。例如,客户端设备702-708可以用于实现客户端设备105a-n,并且云计算系统712可以用于实现计算系统110。如图所示,系统700包括客户端设备702-708、一个或多个网络710以及云计算系统712。云计算系统712被配置为经由网络710向客户端设备702-708提供资源和数据。在一些实施例中,云计算系统700向任意数量的不同用户(例如,客户、租户、组织等)提供资源。云计算系统712可以由一个或多个计算机系统(例如,服务器)、在计算机系统上操作的虚拟机或其组合来实现。
如图所示,云计算系统712包括一个或多个应用714、一个或多个服务716以及一个或多个数据库718。云计算系统700可以以自助、基于订阅、可弹性扩展、可靠、高度可用和安全的方式向任意数量的不同客户提供应用714、服务716和数据库718。
在一些实施例中,云计算系统700可以适于自动供应、管理和跟踪客户对云计算系统700提供的服务的订阅。云计算系统700可以经由不同的部署模型提供云服务。例如,可以在公共云模型下提供云服务,其中云计算系统700由销售云服务的组织拥有,并且云服务对普通公众或不同的行业企业可用。作为另一示例,可以在私有云模型下提供云服务,其中云计算系统700仅针对单个组织操作,并且可以为该组织内的一个或多个实体提供云服务。也可以在社区云模型下提供云服务,其中云计算系统700和由云计算系统700提供的云服务由相关社区中的几个组织共享。还可以在混合云模型下提供云服务,混合云模型是上述不同模型中的两个或多个的组合。
在一些情况下,经由网络710从云计算系统700向客户端设备702-708提供的应用714、服务716和数据库718中的任何一个被称为“云服务”。通常,构成云计算系统700的服务器和系统不同于客户的内部服务器(on-premises server)和系统。例如,云计算系统700可以托管应用,并且客户端设备702-708之一的用户可以经由网络710订购和使用该应用。
应用714可以包括被配置为在云计算系统712(例如,计算机系统或在计算机系统上操作的虚拟机)上执行并经由客户端设备702-708被访问、控制、管理等的软件应用。在一些实施例中,应用714可以包括服务器应用和/或中间层应用(例如,超文本传输协议(HTTP)服务器应用、文件传输协议(FTP)服务器应用、通用网关接口(CGI)服务器应用、JAVA服务器应用等)。服务716是被配置为在云计算系统712上执行并经由网络710向客户端设备702-708提供功能的软件组件、模块、应用等。服务716可以是基于web的服务或按需的云服务。
数据库718被配置为存储和/或管理由应用714、服务716和/或客户端设备702-708访问的数据。例如,一个或多个存储装置135-155可以被存储在数据库718中。数据库718可以驻留在云计算系统712本地的(和/或驻留在其中的)非暂时性存储介质上、存储区域网络(SAN)中、位于远离云计算系统712的本地非暂时性存储介质上。在一些实施例中,数据库718可以包括由关系数据库管理系统(RDBMS)管理的关系数据库。数据库718可以是列取向(column-oriented)的数据库、行取向(row-oriented)的数据库或它们的组合。在一些实施例中,数据库718中的一些或所有是内存(in-memory)数据库。也就是说,在一些这样的实施例中,在存储器(例如,随机访问存储器(RAM))中存储和管理数据库718的数据。
客户端设备702-708被配置为执行和操作经由网络710与应用714、服务716和/或数据库718通信的客户端应用(例如,web浏览器、专有客户端应用等)。这样,当应用714、服务716和数据库718在云计算系统700上操作(例如托管)时,客户端设备702-708可以访问由应用714、服务716和数据库718提供的各种功能。客户端设备702-708可以是计算机系统500或计算设备600,如上分别参考图5和图6所述。尽管系统700被示为具有四个客户端设备,但是可以支持任何数量的客户端设备。
网络710可以是被配置为使用各种网络协议中的任何一种来促进客户端设备702-708和云计算系统712之间的数据通信的任何类型的网络。网络710可以是个人区域网(PAN)、局域网(LAN)、存储区域网(SAN)、校园网(CAN)、城域网(MAN)、广域网(WAN)、全球区域网(GAN)、内联网、互联网、任何数量的不同类型网络的网络等。
以上描述示出了本公开的各种实施例以及如何实现本公开的各方面的示例。上述示例和实施例不应被认为是仅有的实施例,并且被呈现来说明由所附权利要求限定的本公开的各种实施例的灵活性和优点。基于以上公开和所附权利要求,其他布置、实施例、实现方式和等同物对于本领域技术人员来说是清楚的,并且可以在不脱离由权利要求限定的本公开的精神和范围的情况下使用。

Claims (20)

1.一种存储可由设备的至少一个处理单元执行的程序的非暂时性机器可读介质,所述程序包括指令集,所述指令集用于:
从存储装置中检索多个交易数据,所述多个交易数据中的每个交易数据包括项目和与所述项目相关联的金额;
基于所述多个交易数据,确定金额范围集;以及
基于所述金额范围集和数据对象集,确定类别集,其中,所述数据对象集中的每个数据对象属于所述类别集中的类别。
2.根据权利要求1所述的非暂时性机器可读介质,其中,确定所述金额范围集包括使用贝叶斯块算法来确定所述金额范围集。
3.根据权利要求2所述的非暂时性机器可读介质,其中,所述程序还包括指令集,所述指令集用于:
基于所述多个交易数据中的金额,确定唯一金额集;
从最小到最大对所述唯一金额集排序;
对于所述唯一金额集中的每对连续唯一金额,确定所述对连续唯一金额之间的中点;以及
使用所述中点作为贝叶斯块算法的输入。
4.根据权利要求1所述的非暂时性机器可读介质,其中,确定所述类别集包括使用分层的基于密度的聚类选择(HDBSCAN)算法。
5.根据权利要求4所述的非暂时性机器可读介质,其中,所述数据对象集包括用户集,其中,所述程序还包括指令集,所述指令集用于:
从客户端设备接收对用户的多个推荐项目的请求;
确定与所述用户相关联的类别;
识别与用户集相关联的交易数据,其中,所述用户集中的每个用户与所述类别相关联;
确定在所识别的交易数据中具有最多实例的定义数量的项目;以及
向所述客户端设备提供所述定义数量的项目。
6.根据权利要求1所述的非暂时性机器可读介质,其中,所述数据对象集包括与第一租户相关联的用户集,其中,所述多个交易数据是与所述第一租户相关联的第一多个交易数据,其中,所述金额范围集是第一金额范围集,其中,所述类别集是第一类别集,其中,所述程序还包括指令集,所述指令集用于:
从所述存储装置中检索与第二租户相关联的第二多个交易数据,所述第二多个交易数据中的每个交易数据包括项目和与所述项目相关联的金额;
基于所述第二多个交易数据,确定第二金额范围集;以及
基于所述第二金额范围集和与所述第二租户相关联的第二数据对象集,确定第二类别集,其中,所述第二数据对象集中的每个数据对象属于所述第二类别集中的类别。
7.根据权利要求1所述的非暂时性机器可读介质,其中,确定所述类别集还基于活动数据集。
8.一种方法,包括:
从存储装置中检索多个交易数据,所述多个交易数据中的每个交易数据包括项目和与所述项目相关联的金额;
基于所述多个交易数据,确定金额范围集;以及
基于所述金额范围集和数据对象集,确定类别集,其中,所述数据对象集中的每个数据对象属于所述类别集中的类别。
9.根据权利要求8所述的方法,其中,确定所述金额范围集包括使用贝叶斯块算法来确定所述金额范围集。
10.根据权利要求9所述的方法,还包括:
基于所述多个交易数据中的金额,确定唯一金额集;
从最小到最大对所述唯一金额集排序;
对于所述唯一金额集中的每对连续唯一金额,确定所述对连续唯一金额之间的中点;以及
使用所述中点作为贝叶斯块算法的输入。
11.根据权利要求8所述的方法,其中,确定所述类别集包括使用分层的基于密度的聚类选择(HDBSCAN)算法。
12.根据权利要求11所述的方法,其中,所述数据对象集包括用户集,其中,所述方法还包括:
从客户端设备接收对用户的多个推荐项目的请求;
确定与所述用户相关联的类别;
识别与用户集相关联的交易数据,其中,所述用户集中的每个用户与所述类别相关联;
确定在所识别的交易数据中具有最多实例的定义数量的项目;以及
向所述客户端设备提供所述定义数量的项目。
13.根据权利要求8所述的方法,其中,所述数据对象集包括与第一租户相关联的用户集,其中,所述多个交易数据是与所述第一租户相关联的第一多个交易数据,其中,所述金额范围集是第一金额范围集,其中,所述类别集是第一类别集,其中,所述方法还包括:
从所述存储装置中检索与第二租户相关联的第二多个交易数据,所述第二多个交易数据中的每个交易数据包括项目和与所述项目相关联的金额;
基于所述第二多个交易数据,确定第二金额范围集;以及
基于所述第二金额范围集和与所述第二租户相关联的第二数据对象集,确定第二类别集,其中,所述第二数据对象集中的每个数据对象属于所述第二类别集中的类别。
14.根据权利要求8所述的方法,其中,确定所述类别集还基于活动数据集。
15.一种系统,包括:
处理单元集;以及
存储指令的非暂时性机器可读介质,所述指令当被所述处理单元集中的至少一个处理单元执行时,使得所述至少一个处理单元:
从存储装置中检索多个交易数据,所述多个交易数据中的每个交易数据包括项目和与所述项目相关联的金额;
基于所述多个交易数据,确定金额范围集;以及
基于所述金额范围集和数据对象集,确定类别集,其中,所述数据对象集中的每个数据对象属于所述类别集中的类别。
16.根据权利要求15所述的系统,其中,确定所述金额范围集包括使用贝叶斯块算法来确定所述金额范围集。
17.根据权利要求16所述的系统,其中,所述指令还使得所述至少一个处理单元:
基于所述多个交易数据中的金额,确定唯一金额集;
从最小到最大对所述唯一金额集排序;
对于所述唯一金额集中的每对连续唯一金额,确定所述对连续唯一金额之间的中点;以及
使用所述中点作为贝叶斯块算法的输入。
18.根据权利要求15所述的系统,其中,确定所述类别集包括使用分层的基于密度的聚类选择(HDBSCAN)算法。
19.根据权利要求18所述的系统,其中,所述数据对象集包括用户集,其中,所述指令还使得所述至少一个处理单元:
从客户端设备接收对用户的多个推荐项目的请求;
确定与所述用户相关联的类别;
识别与用户集相关联的交易数据,其中,所述用户集中的每个用户与所述类别相关联;
确定在所识别的交易数据中具有最多实例的定义数量的项目;以及
向所述客户端设备提供所述定义数量的项目。
20.根据权利要求15所述的系统,其中,所述数据对象集包括与第一租户相关联的用户集,其中,所述多个交易数据是与所述第一租户相关联的第一多个交易数据,其中,所述金额范围集是第一金额范围集,其中,所述类别集是第一类别集,其中,所述指令还使得所述至少一个处理单元:
从所述存储装置中检索与第二租户相关联的第二多个交易数据,所述第二多个交易数据中的每个交易数据包括项目和与所述项目相关联的金额;
基于所述第二多个交易数据,确定第二金额范围集;以及
基于所述第二金额范围集和与所述第二租户相关联的第二数据对象集,确定第二类别集,其中,所述第二数据对象集中的每个数据对象属于所述第二类别集中的类别。
CN202011587184.8A 2020-06-11 2020-12-29 基于机器学习确定数据对象的类别 Pending CN113807957A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/899,434 2020-06-11
US16/899,434 US20210390436A1 (en) 2020-06-11 2020-06-11 Determining Categories For Data Objects Based On Machine Learning

Publications (1)

Publication Number Publication Date
CN113807957A true CN113807957A (zh) 2021-12-17

Family

ID=74884802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011587184.8A Pending CN113807957A (zh) 2020-06-11 2020-12-29 基于机器学习确定数据对象的类别

Country Status (3)

Country Link
US (1) US20210390436A1 (zh)
EP (1) EP3923227A1 (zh)
CN (1) CN113807957A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528374A (zh) * 2014-10-21 2016-04-27 苏宁云商集团股份有限公司 一种电子商务中的商品推荐方法及其系统
CN108388630A (zh) * 2018-02-13 2018-08-10 北京奇虎科技有限公司 一种购物信息推送方法、装置及电子设备
CN108665329A (zh) * 2017-03-29 2018-10-16 北京京东尚科信息技术有限公司 一种基于用户浏览行为的商品推荐方法
CN108876537A (zh) * 2018-06-15 2018-11-23 重庆知遨科技有限公司 一种用于网上商场系统的混合推荐方法
CN109242654A (zh) * 2018-11-15 2019-01-18 中国联合网络通信集团有限公司 一种物品推荐方法及系统
CN109299992A (zh) * 2018-07-16 2019-02-01 深圳市谷熊网络科技有限公司 一种向用户推荐信息的方法、装置及终端
CN109558533A (zh) * 2018-10-29 2019-04-02 广东奥博信息产业股份有限公司 一种基于多重聚类的个性化内容推荐方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008130404A1 (en) * 2007-04-19 2008-10-30 Leviathan Entertainment Advertisement in a database of documents
US20160086222A1 (en) * 2009-01-21 2016-03-24 Truaxis, Inc. Method and system to remind users of targeted offers in similar categories
US11074495B2 (en) * 2013-02-28 2021-07-27 Z Advanced Computing, Inc. (Zac) System and method for extremely efficient image and pattern recognition and artificial intelligence platform
US8938686B1 (en) * 2013-10-03 2015-01-20 Palantir Technologies Inc. Systems and methods for analyzing performance of an entity
US11179066B2 (en) * 2018-08-13 2021-11-23 Facebook Technologies, Llc Real-time spike detection and identification
US11036811B2 (en) * 2018-03-16 2021-06-15 Adobe Inc. Categorical data transformation and clustering for machine learning using data repository systems

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528374A (zh) * 2014-10-21 2016-04-27 苏宁云商集团股份有限公司 一种电子商务中的商品推荐方法及其系统
CN108665329A (zh) * 2017-03-29 2018-10-16 北京京东尚科信息技术有限公司 一种基于用户浏览行为的商品推荐方法
CN108388630A (zh) * 2018-02-13 2018-08-10 北京奇虎科技有限公司 一种购物信息推送方法、装置及电子设备
CN108876537A (zh) * 2018-06-15 2018-11-23 重庆知遨科技有限公司 一种用于网上商场系统的混合推荐方法
CN109299992A (zh) * 2018-07-16 2019-02-01 深圳市谷熊网络科技有限公司 一种向用户推荐信息的方法、装置及终端
CN109558533A (zh) * 2018-10-29 2019-04-02 广东奥博信息产业股份有限公司 一种基于多重聚类的个性化内容推荐方法及装置
CN109242654A (zh) * 2018-11-15 2019-01-18 中国联合网络通信集团有限公司 一种物品推荐方法及系统

Also Published As

Publication number Publication date
US20210390436A1 (en) 2021-12-16
EP3923227A1 (en) 2021-12-15

Similar Documents

Publication Publication Date Title
US11263241B2 (en) Systems and methods for predicting actionable tasks using contextual models
US11238223B2 (en) Systems and methods for intelligently predicting accurate combinations of values presentable in data fields
CN110268409B (zh) 用于电力欺诈检测的新型非参数统计行为识别生态系统
CN111241387B (zh) 提高搜索结果的相关性
US11915195B2 (en) Systems and methods for intelligent field matching and anomaly detection
US20200128051A1 (en) Machine-learning processing at native-location storage system to generate collections action plan
CA3002232A1 (en) Machine learning artificial intelligence system for predicting hours of operation
US11449773B2 (en) Enhanced similarity detection between data sets with unknown prior features using machine-learning
US20240037111A1 (en) Intelligent Analytics For Cloud Computing Applications
US20190272202A1 (en) Processing state changes to applications
US10778638B2 (en) Searching contact data based on product data
EP3923227A1 (en) Determining categories for data objects based on machine learning
US20210201237A1 (en) Enhanced user selection for communication workflows using machine-learning techniques
US11030253B2 (en) Managing data feeds from different applications for users
US11763240B2 (en) Alerting system for software applications
US20230073643A1 (en) Predicting Events Based On Time Series Data
US20220398263A1 (en) Clustering of data objects based on data object attributes
US11720569B2 (en) Determining threshold values based on sampled data
US20240143641A1 (en) Classifying data attributes based on machine learning
US11403268B2 (en) Predicting types of records based on amount values of records
EP4024227A1 (en) Machine identification of original transaction in large transaction datasets
US20230062012A1 (en) Managing query models based on shared objects
US20240070671A1 (en) Systems and methods for detecting fraudulent activity
US20230075018A1 (en) Configuring A Software Service For Processing Time Data
US20230222575A1 (en) Systems and methods for exchanging user data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination