CN109416761A - 使用图社区的机器学习和预测 - Google Patents

使用图社区的机器学习和预测 Download PDF

Info

Publication number
CN109416761A
CN109416761A CN201780042953.6A CN201780042953A CN109416761A CN 109416761 A CN109416761 A CN 109416761A CN 201780042953 A CN201780042953 A CN 201780042953A CN 109416761 A CN109416761 A CN 109416761A
Authority
CN
China
Prior art keywords
node
community
user
prediction
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201780042953.6A
Other languages
English (en)
Inventor
T·哈利斯
C·奥康奈尔
T·安杰洛斯
T·科罗列夫斯卡亚
Y·李
T·索耶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Visa International Service Association
Original Assignee
Visa International Service Association
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Visa International Service Association filed Critical Visa International Service Association
Publication of CN109416761A publication Critical patent/CN109416761A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的实施例是针对用于预测交互的方法和装置。一个实施例是针对一种包括以下操作的方法:由一个或多个计算机接收用于资源提供商与用户之间的多个已知交互的交互数据;和基于所述多个已知交互创建拓扑图。所述方法可进一步包括由所述一个或多个计算机确定多个社区以形成预测模型,和接收对预测的请求。另外,所述方法可包括:由所述一个或多个计算机通过识别所述多个社区中对应于所述请求的社区将所述请求应用于所述预测模型;确定所识别社区内的节点;和提供关于所述节点的信息作为所请求的预测。

Description

使用图社区的机器学习和预测
相关申请交叉引用
本申请要求2016年7月11日申请的临时专利申请62/360,799的优先权,所述申请出于所有目的以全文引用的方式并入本文中。
技术领域
背景技术
在当今技术环境中,移动装置可用于定位可能吸引用户的附近餐馆、酒吧、服装店等。移动装置可使用存储的应用程序,以便通过数据库查询搜索餐厅,以获得可能被视为相关信息的信息。举例来说,用户可在其移动装置手机上打开Google MapsTM且输入文字“墨西哥食物”,且接着会向用户展示显示附近的墨西哥卷饼摊位或与所述用户相距某一距离的标记有关键字“墨西哥食物”的任何其它附近的饭店的地图。然而,此类查询的结果可能不一定吸引用户,因为每个用户都可能具有此应用程序可能发现难以预期的特定偏好。举例来说,相比于较昂贵的餐厅,一些用户通常可能偏好快餐或反之亦然。一些用户通常可能偏好较流行的餐馆,这些餐馆会吸引相同年龄群或人口统计内的其它用户。
本发明的实施例单独地且共同地解决这些问题和其它问题。
发明内容
本发明的实施例是针对用于预测交互的方法和装置。一个实施例是针对一种包括以下操作的方法:由一个或多个计算机接收用于资源提供商与用户之间的多个已知交互的交互数据;和基于所述多个已知交互创建拓扑图。所述方法可进一步包括由所述一个或多个计算机确定多个社区以形成预测模型和接收对预测的请求。另外,所述方法可包括:通过识别所述多个社区中对应于所述请求的社区来由所述一个或多个计算机将所述请求应用于所述预测模型;确定所识别社区内的节点;和提供关于所述节点的信息作为所请求的预测。
在一个实施例中,通过计算所述拓扑图中每一边缘的权重且基于所述边缘中的每一个的所计算权重计算所述拓扑图中的每一节点的权重来确定所述多个社区。可通过生成按权重递减顺序包括所述节点的队列、从所述队列选择种子节点和生成包括所述种子节点的社区来进一步确定所述社区,所述种子节点是所述队列中权重最高的节点。接着,可通过计算不包含在所述社区中的每一节点的交互概率、基于所述交互概率确定最高优先级节点、确定所述最高优先级节点是否符合预定义准则和如果确定所述最高优先级符合所述预定义准则,则将所述最高优先级节点添加到所述社区来确定所述社区。从所述图确定社区的过程可通过重复先前步骤继续直到确定所述最高优先级候选节点不符合所述预定义准则为止。一旦已构建社区,那么所述方法可进一步包括输出所述社区、从所述队列移除包含在所述社区中的节点和重复先前步骤直到清空所述队列为止。
其它实施例是针对用于实施以上方法的计算机和用户装置。
附图说明
图1展示用于在网络中获得交互数据的系统图。
图2展示根据一实施例的用于产生预测的处理计算机的框图。
图3展示用于从先前交互数据预测未来交互的方法的流程图。
图4展示根据一实施例的拓扑图的说明。
图5展示用于将预测递送给请求用户的系统图。
图6展示机器学习过程的图。
具体实施方式
在论述本发明的具体实施例之前,可详细地描述一些术语。
“用户”可指个人。在一些实施例中,用户可与数据相关联。数据可与一个或多个个人账户和/或用户装置相关联。用户可由其数据、个人账户和/或装置识别。
“用户装置”可包含可由用户操作的任何装置。用户装置可称为通信装置,其可允许与一个或多个计算机通信。如果移动装置具有远程地传达数据的能力,那么通信装置可称为移动装置。
“移动装置”可包括用户可运送和操作的任何电子装置,所述装置还可提供通过网络远程通信的能力。远程通信能力的实例包含使用移动电话(无线)网络、无线数据网络(例如,3G、4G或类似网络)、Wi-Fi、Wi-Max或可提供例如互联网或专用网络之类的网络访问的任何其它通信介质。移动装置的实例包含移动电话(例如,蜂窝电话)、PDA、平板计算机、上网本、膝上型计算机、个人音乐播放器、手持式专用读取器等。移动装置的其它实例包含可穿戴装置,例如智能手表、健身手环、脚链、戒指、耳环等,以及具有远程通信能力的汽车。移动装置可包括用于执行此类功能的任何合适的硬件和软件,且还可包含多个装置或组件(例如,当装置通过系固到另一装置而远程访问网络时,即,使用另一装置作为调制解调器,一起使用的两个装置可被认为是单个移动装置)。移动装置可进一步包括用于确定/生成位置数据的构件。举例来说,移动装置可包括用于与全球定位系统(例如GPS)通信的构件。
“应用程序”可为存储在计算机可读介质(例如,存储器元件或安全元件)上的计算机代码或其它数据,所述计算机代码或其它数据能由处理器执行以完成任务。
“资源提供商”可以是可提供例如商品、服务、信息和/或访问的资源的实体。资源提供商的实例包含商家、访问装置、安全数据访问点等。“商家”通常可以是参与交易并且可出售商品或服务或提供对商品或服务的访问的实体。
“访问装置”可以是提供对远程系统的访问的任何合适装置。访问装置还可用于与商家计算机、交易处理计算机、认证计算机或任何其它合适的系统通信。访问装置通常可位于任何合适的位置处,例如位于商家所在位置处。访问装置可采用任何合适形式。访问装置的一些实例包含POS或销售点装置(例如,POS终端)、蜂窝电话、PDA、个人计算机(PC)、平板PC、手持式专用读取器、机顶盒、电子现金出纳机(ECR)、自动柜员机(ATM)、虚拟现金出纳机(VCR)、营业亭、安全系统、访问系统等。访问装置可使用任何合适的接触或非接触操作模式,以向用户移动装置发送或从其接收数据或者与用户移动装置相关联。在访问装置可包括POS终端的一些实施例中,可使用任何合适的POS终端并且任何合适的POS终端可包含读取器、处理器和计算机可读介质。读取器可包含任何合适的接触或非接触操作模式。举例来说,示例性读卡器可包含射频(RF)天线、光学扫描器、条形码读取器或磁条读取器,以与支付装置和/或移动装置交互。在一些实施例中,用作POS终端的蜂窝电话、平板计算机或其它专用无线装置可被称为移动销售点或“mPOS”终端。
“传送计算机”可指可传送数据的中间计算机。传送计算机可以是收单方的计算机。“收单方”可以是可代表资源提供商处理交互的实体。举例来说,收单方可以是商业实体(例如,商业银行),其与资源提供商建立关系使得所述资源提供商可符合交易处理要求。一些实体可执行发行方和收单方功能两者。一些实施例可涵盖此类单个实体发行方-收单方。
“授权计算机”可以是授权实体的计算机。“授权实体”可以是对交互授权的实体。授权实体的实例可以是发行方、政府机构、文档存储库、访问管理员等。“发行方”通常可指维持用户的账户的商业实体(例如,银行)。发行方还可向用户,例如用户账户,发出凭证。
“授权请求消息”可以是请求对交互授权的电子消息。根据一些实施例的授权请求消息可符合ISO8583,其是用于交换与使用发布的用户账户的用户相关联的电子交互信息的系统的标准。授权请求消息可包含可与用户账户相关联的发行方账户标识符。授权请求消息还可包括对应于“识别信息”的额外数据要素,包含(仅作为实例):服务代码、卡验证值(CVV)、主账号(PAN)、令牌、用户名、有效期等。授权请求消息还可包括“交互信息”,例如与当前交互相关联的任何信息,例如交互位置、交易金额、资源提供商标识符、资源提供商位置、银行识别号(BIN)、商家种类代码(MCC)、识别所提供/交换的资源等的信息,以及可用于确定是否识别和/或授权交互的任何其它信息。
“授权响应消息”可以是响应于授权请求的消息。仅作为实例,授权响应消息可包含以下状态指示符中的一个或多个:批准-交易被批准;拒绝-交易不被批准;或呼叫中心-响应未决的更多信息,商家呼叫免费授权电话号码。授权响应消息还可包含授权代码。代码可充当交互授权的证据。
“服务器计算机”可包含功能强大的计算机或计算机集群。举例来说,服务器计算机可以是大型主机、小型计算机集群或充当单元的一组服务器。在一个实例中,服务器计算机可以是连接到网络服务器的数据库服务器。服务器计算机可连接到数据库,并且可包含用于服务于来自一个或多个客户端计算机的请求的任何硬件、软件、其它逻辑或前述内容的组合。服务器计算机可包括一个或多个计算设备,并且可使用多种计算结构、布置和编译中的任一种来服务于来自一个或多个客户端计算机的请求。
“图形处理单元”或“GPU”可指被设计用于创建旨在用于输出到显示装置的图像的电子电路。显示装置可以是屏幕,且GPU可通过迅速地操纵及变更存储器来加速在帧缓冲器中创建图像。GPU可具有并行结构,其使得所述GPU比用于并行完成数据的较大块的处理的算法的通用CPU更有效。GPU的实例可包含RadeonTM HD 6000系列、PolarisTM 11、NVIDIAGeForceTM 900系列、NVIDIA PascalTM等。
“拓扑图”可指在边缘连接的不同顶点的平面中的图的表示。拓扑图中的不同顶点可称作“节点”。每一节点可表示事件的特定信息或可表示实体或对象的资料档案的特定信息。节点可通过一组边缘E彼此相关。“边缘”可被描述为由作为图G=(V,E)的子集的两个节点构成的无序对,其中G是包括由一组边缘E连接的一组顶点(节点)V的图。举例来说,拓扑图可表示交易网络,其中表示交易的节点可通过边缘连接到与交易相关的一个或多个节点,例如表示装置的信息、用户、交易类型等的节点。边缘可与被称作“权重”的数值相关联,所述数值可分配到两个节点之间的成对连接。边缘权重可被识别为两个节点之间的连接强度和/或可与距离成本相关,因为其常常表示从一个节点移动到下一节点所需的数量。
术语“人工智能模型”或“AI模型”可指可用于预测结果以便达成预定义目标的模型。AI模型可使用学习算法来开发,其中训练数据基于已知的或推断的模式来分类。AI模型还可被称作“机器学习模型”或“预测模型”。
“子图”可指由较大图的要素的子集形成的图。要素可包含顶点和连接边缘,且子集可以是在用于较大图的节点和边缘的整个集合当中选择的节点和边缘的集合。举例来说,多个子图可通过随机地取样图数据形成,其中随机样本中的每一个可以是子图。每一子图可与由相同较大图形成的另一子图重叠。
“社区”可指图中的在群组内密集地连接的节点的群组/集合。社区可以是子图或其部分/衍生物且子图可以是或可以不是社区和/或包括一个或多个社区。社区可使用图学习算法,例如用于映射蛋白质复合物的图学习算法,从图识别。使用历史数据识别的社区可用于对用于进行预测的新的数据进行分类。举例来说,识别社区可用作机器学习过程的一部分,其中关于信息要素的预测可基于其彼此的关系进行。
“数据集”可指由单独的要素构成的相关信息集的集合,所述要素可作为一单元由计算机操控。数据集可包括已知的数据,其可视为过去的数据或“历史数据”。还未被收集的数据可称作未来数据或“未知数据”。当在稍后时间点接收未来数据并加以记录时,所述未来数据可称为“新的已知数据”或“最近已知的”数据,且可与初始的已知数据组合以形成较大历史。
“不受监督的学习”可指用于通过标注输入和/或输入群组而对数据集中的信息进行分类的学习算法类型。一种不受监督的学习的方法可以是群集分析,其可用于找到数据中的隐藏模式或分组。群集可使用类似性的量度来建模,所述类似性的量度可使用一个或度量来定义,例如欧几里得距离。
“机器学习”可指人工智能过程,其中软件应用程序可被训练以通过学习进行准确预测。预测可通过将输入数据应用于预测模型而生成,所述预测模型由对聚集的数据执行统计分析形成。图6展示描绘机器学习过程的高级图。根据过程600,模型630可使用训练数据来训练,使得模型可用于进行准确预测。举例来说,预测可以是图像的分类(例如识别互联网上的猫的图像)或作为另一实例,可以是建议(例如用户可能喜欢的电影或消费者可能喜欢的餐馆)。
训练数据可被收集为现有记录610。现有记录610可以是可确定模式所根据的任何数据。这些模式接着可在稍后时间点应用于新的数据以进行预测。现有记录610可以是例如通过网络收集的用户数据,例如用户浏览器历史或用户消费历史。使用现有记录610作为训练数据,训练可通过学习模块620执行。学习模块620可包括学习算法,其可用于构建模型630。
模型630可以是统计模型,其可用于从已知的信息预测未知信息。举例来说,学习模块620可以是用于从训练数据生成回归线(受监督的学习)的指令集或用于基于类似性、连接性和/或数据点之间的距离将数据分组成数据的不同分类的群集(不受监督的学习)的指令集。回归线或数据群集接着可用作用于从已知的信息预测未知信息的模型。一旦从学习模块620构建了模型630,那么模型630可用于从新的请求640生成预测的输出650。新的请求640可以是对与呈现的数据相关联的预测的请求。举例来说,新的请求640可以是用于对图像进行分类或用于用户的建议的请求。
新的请求640可包括请求预测所针对的数据。举例来说,新的请求640可包括用于待分类的图像的像素数据或可包括可用于确定适当建议的用户信息(例如名字、位置、用户历史等)。为了从新的请求640生成预测的输出650,包含于新的请求640中的数据可与模型630进行比较。举例来说,接收在图上的新的请求640中的数据的位置可与回归线进行比较以预测其下一状态(亦即根据趋势)。在另一实例中,标绘在拓扑图上的数据的位置可用于确定其分类(例如基于用户的线上交互预测其口味和偏好)。
本发明的实施例是针对用于预测对于普通观测者来说可能并不直观或明显的交互的方法和装置。预测的交互可来源于与数个不同资源提供商相关联的数据。图1展示用于在网络中获得交互数据的系统图。在实施例中,用于与资源提供商进行的交互的数据可由一个或多个处理计算机处理。系统100可包括多个资源提供商计算机,例如资源提供商计算机1-111、资源提供商计算机2-112、资源提供商计算机3-113和资源提供商计算机N-114。所述多个资源提供商计算机中的每一资源提供商计算机可链接到与用户交互的资源提供商。举例来说,资源提供商计算机可以是商家的计算机,其用于与希望用资金交换例如商品或服务的资源的用户进行交易(即支付交易)。
系统100可进一步包括多个传送计算机,例如传送计算机A 121、传送计算机B 122和传送计算机C 123。所述多个传送计算机中的每一传送计算机可以是用于在交互期间将从资源提供商计算机接收的数据传送到例如处理计算机130的处理计算机的计算机。处理计算机130可以是用于处理交互的一个或多个计算机(例如服务器计算机)。处理计算机130可进一步包括用于分析系统100中的交互数据的分析引擎135。
系统100可另外包括多个授权计算机,例如第一授权计算机141、第二授权计算机142和/或第三授权计算机143。所述多个授权计算机中的每一授权计算机可授权根据系统100进行的多个交互。举例来说,第一授权计算机141可以是可发出用户账户和/或用户凭证的实体(例如将向用户发出支付账户的银行,或发出访问凭证的安全机构)的计算机。根据实施例,交互数据可从资源提供商计算机发送到传送计算机,且接着可由处理计算机接收。处理计算机可记录且分析交互数据,且接着可将交互数据转发到授权计算机使得可授权交互。在一个实施例中,交互数据(例如,数据要素中的任一个,例如上文在授权请求消息中所描述的PAN、令牌、交易金额、CVV等)可通过授权请求消息传输到每一计算机。在另一实施例中,交互的确定的授权的指示可包含在授权响应消息中(例如应拒绝或批准用户访问建筑物的指示或用户具有充分资金来进行交易的指示)。
在实施例中,可由处理计算机130访问的交互数据可通过分析引擎135分析以用于生成由用户请求的预测。在一实施例中,交互数据可包括用于用户与资源提供商(例如内容提供商、商家等)的交互的数据,且请求的预测可包含预测用户将在稍后时间点进行的未来交互。预测的未来交易可呈建议的形式递送到用户。在实施例中,预测可使用预测模型生成。在一个实施例中,预测模型可以是包括密集(即频繁)交互的社区的预测模型。在一实施例中,预测模型可包括用于特定类型的用户且用于与所述特定类型的用户频繁地交互/具有高交互概率的特定的资源提供商的节点的确定社区(即群集)。
图2展示根据一实施例的用于生成预测的处理计算机的框图。在一实施例中,处理计算机200A可以是图1的处理计算机130。处理计算机200A可包括一个或多个处理器,例如处理器210。处理器210可包含用于执行指令(例如代码)的任何数目的处理器。举例来说,处理器210可包含中央处理单元(CPU)及多个图形处理单元(GPU)。处理计算机200A可进一步包括网络接口220。网络接口220可以是用于通过网络接收数据的接口,所述数据例如待处理及分析的交互数据。举例来说,交互数据可以是通过网络接口220接收的交易数据。
2017年6月30日申请的美国专利申请第15/639,094号中可发现合适处理计算机体系结构及相关联方法,所述申请出于所有目的以全文引用的方式并入本文中。
处理计算机200A可进一步包括用于存储指令的计算机可读介质230。在实施例中,计算机可读介质230可以是一个或多个存储器存储装置,其包括代码模块,例如通信模块230A、数据库访问模块230B和分析引擎230C。通信模块230A可包括用于接收、生成、发送和重新格式化数据消息的代码。数据库访问模块230B可包括用于存储、更新和查询例如聚合数据数据库200B和图数据库200C的一个或多个数据库中的数据的代码。
分析引擎230C可包括用于分析交互数据以生成预测的代码。分析引擎230C可包括用于从用于多个交互的交互数据生成拓扑图的图生成模块231C。分析引擎230C可进一步包括用于执行学习算法的学习模块232C,所述学习算法可用于生成且训练预测模型。在实施例中,学习算法可以是用于从节点和边缘的拓扑图确定多个社区的图学习算法。分析引擎230C可另外包括用于响应于用户的请求而生成预测的预测响应模块233C。举例来说,预测响应模块233C可包括用于将请求中的数据应用于包括多个社区的预测模型的代码。所述数据可包含用户的账户标识符、用户的位置、用户所搜寻的资源提供商的类型和/或用户输入的文本。在将数据应用于多个社区后,处理器210即可执行用于确定对应社区、识别社区中的充分节点和将节点信息递送到请求用户的预测响应模块233C的指令。
在实施例中,处理计算机200A可访问一个或多个数据库,例如聚合数据数据库200B和图数据库200C。聚合数据数据库200B可包括交互数据和与交互数据相关的元信息。举例来说,交互数据可包括与在特定时间、地点、商家且针对特定产品进行的用户交易有关的数据,且元信息可包括互联网元数据,所述互联网元数据对应于特定时间、地点、商家和特定产品(例如介质标签、产品数据、商家评论、社交介质数据等)。根据实施例,交互数据和元信息可聚合且用作用构建预测模型的训练数据。举例来说,用于为消费者生成餐馆建议的预测模型可使用存储在聚合数据数据库200B中的数据借助于不受监督的学习算法生成且被训练,所述不受监督的学习算法基于消费者交易历史将消费者分组成不同消费社区。在实施例中,预测模型可包括图数据,所述图数据可存储在图数据库200C中且从所述图数据库检索。
根据实施例,处理计算机200A可用于生成用户请求的预测。所述预测可使用包括从交互数据确定的多个社区的预测模型而生成。
在一些实施例中,处理计算机200A的计算机可读介质230包括用于使处理器210执行包括以下操作的方法的代码:a)接收用于资源提供商与用户之间的多个已知交互的交互数据;b)基于所述多个已知交互创建拓扑图,所述拓扑图包括节点和边缘;c)确定多个社区以形成预测模型,每一社区包括由边缘连接的节点的密集集合;d)接收对预测的请求;e)通过识别所述多个社区中对应于所述请求的社区而将所述请求应用于预测模型;f)确定所识别社区内的节点;和g)提供关于节点的信息作为请求的预测。
在一些实施例中,处理计算机200A的计算机可读介质230包括用于确定多个社区的代码。此类代码可存在于学习模块232C中。所述代码能由处理器210执行以实施包括以下操作的方法:计算拓扑图中的每一边缘的权重;基于所述边缘中的每一个的所计算权重计算拓扑图中的每一节点的权重;生成按权重递减顺序包括所述节点的队列;从所述队列选择种子节点;生成包括种子节点的社区;计算不包含在社区中的每一候选节点的交互概率;基于交互概率确定最高优先级节点;确定最高优先级节点是否符合预定义准则;如果确定最高优先级符合预定义准则,则将最高优先级节点添加到社区;反复添加节点直到确定最高优先级节点不符合预定义准则为止;输出社区;从队列移除包含在社区中的节点;和重复始于种子选择的整个过程直到清空队列为止。
图3展示由处理计算机200A执行以用于从先前交互数据预测未来交互的方法的流程图。在流程图300的步骤S301处,可接收用于多个已知交互的交互数据。交互数据可由例如图2的处理计算机200A的一个或多个处理计算机接收。交互数据可以是例如用于在用户与资源提供商之间进行的多个交易的交易数据。在实施例中,当用户与资源提供商交互时,包括多个信息要素的交互数据可由资源提供商计算机(例如由图1的资源提供商计算机N-114)生成和/或接收且可由一个或多个处理计算机处理且记录。交互数据中的信息要素的实例可包含:交易ID、用于交互用户的账户的账户ID(例如账号、令牌、用户名等)、用于交互资源提供商的标识符(例如商家名称、终端号等)、交易金额、交互位置、交易/交互类型(例如,例如磁条、电子商务、非接触、接触等的交易模式)、资源提供商类型(例如商家种类代码或“MCC”)等。交互数据可从源自多个资源提供商的多个授权请求消息来确定。
在步骤S302处,图可从交互数据创建。在实施例中,图可以是包括节点和边缘的拓扑图(参见图4)。在一实施例中,用于在多个所接收交互数据当中接收的每一不同信息要素的节点可在所创建图上生成且标绘。举例来说,可生成且标绘用于每一用户账户标识符、资源提供商标识符、MCC代码、交易位置、交易类型、交易金额等的节点。接着,所标绘节点可通过表示节点之间的关系/链接的边缘而彼此连接。每一边缘可与量化边缘的两个节点之间的交互的权重相关联。举例来说,用于特定用户的账户标识符的节点可连接到用于特定资源提供商的资源提供商标识符的节点。两个节点之间的连接边缘的权重可反映特定资源提供商与用户之间的交互(交易)数量。举例来说,用户可在资源提供商处进行5次交易,这可导致节点之间的边缘具有权重5。此外,用户账户标识符节点和资源提供商标识符节点可与包含在交易数据中的其它不同信息要素相关。举例来说,用于资源提供商标识符的节点可连接到用于与资源提供商有关的商家种类代码的节点(例如5651-家庭服装店)。在另一实例中,用于用户标识符节点的账户标识符的节点可连接到用于可进行交易的交易位置的节点(例如94110-旧金山)。因此,节点可表示彼此不同的数据,和/或节点可在特定的一般性水平上表征基础数据(例如,商家ID可表示特定商家,但MCC可表示特定商家所属的种类)。
在一个实施例中,具有极少或无交互数据的新节点可通过将新节点的元信息与所标绘节点的元信息进行比较以确定新节点在图中的位置而标绘在图上。举例来说,用于新的资源提供商的社交介质数据(例如来自互联网页面的文本或提及新的餐馆的社交介质帖子)可从聚合的数据检索。社交介质数据接着可用于查询图以找到与类似资源提供商有关的成双节点,所述类似资源提供商与相同或类似社交介质数据相关联(例如与相同文本或关键词相关联的餐馆)。表示新的资源提供商的新节点接着可通过复制用于类似资源提供商的交互数据中的至少一些且接着根据所复制的交互数据标绘新节点(即复制成双节点和其入射边缘)而生成且标绘在所述图上。
在实施例中,权重还可与‘距离’相关,因为两个节点相对于彼此的位置可表达为欧几里得距离,其中节点之间的边缘具有量化其关系的特定长度。举例来说,两个节点之间的关系可被测量为权重,其中较高相关性由较高权重给定,或所述关系可被测量为距离,其中较高相关性由较短距离给定。在后一状况下,彼此频繁交互的高度连接的节点可密集地填充在所述图中(即在所述图的不同区内彼此接近)。在一个实施例中,边缘的长度可与其权重成反比。
在实施例中,路径可被定义为可被横穿以从第一节点移动到第二节点的一个或多个边缘。在一个实施例中,路径的长度可被确定为包含在所述路径中的边缘的总长度。举例来说,路径可包括边缘[a,b]、[b,c]和[c,d],所述边缘可各自分别包括边缘长度2、3和4。路径的长度接着可通过对沿着路径的边缘进行求和而得出且可等于‘2+3+4=9’。在另一实施例中,路径的长度可被确定为沿着路径的边缘的数目。举例来说,从节点a到d的路径可包括三个边缘:[a,b]、[b,c]和[c,d],且路径的长度接着可等于“3”。
在步骤S303处,社区可从所创建图来确定。所述社区可以是高度连接(由权重/距离给定)的节点的群组且可具有彼此交互的高概率。这些社区接着可用于对传入数据进行分类且生成用于传入数据的预测的结果(例如预测的交互)。在一实施例中,社区可使用不受监督的学习算法生成,所述不受监督的学习算法将节点聚集成不同且密集填充的群组。此外,学习算法可以是生成会重叠的社区(即其中节点可属于多于一个社区)的算法。举例来说,可使用用于在交互网络中映射节点群组的图学习算法,如下文在所述描述中进一步详细描述。一旦已确定所述社区,那么其可在图数据库(例如图2的图数据库200C)中累积且被记录以形成预测模型。举例来说,每一社区可由唯一社区ID识别,所述唯一社区ID可进一步与用于包含在社区中的每一节点的唯一标识符相关联。社区信息可存储在图数据库中,且在稍后时间点,在对预测的请求中接收的数据接着可与所确定的社区进行比较以对数据进行分类且生成所请求的预测。
在步骤S304处,可接收对预测的请求。在实施例中,所述请求可由一个或多个处理计算机从请求预测的用户的用户装置接收。举例来说,所述预测可以是预测符合请求用户的所要准则的对于资源提供商的建议。所述请求可包含可与预测模型进行比较以用于生成预测的数据。在一实施例中,包含在请求中的数据可包括请求用户的账户标识符、用户的位置、正由用户请求的资源提供商的类型和/或用户输入的文本。举例来说,请求可由用户从用户装置生成,用户运用用户装置能够选择或手动地输入所要搜索查询。用户可选择例如一系列“附近的建议”,这可提示用户装置生成用于预测(建议)的请求。所述请求可包括用于用户的支付账户的账户标识符和用户的当前位置,其可应用于预测模型以推荐与用户紧密接近的资源提供商,如下文进一步解释。用户装置接着可将请求发送到处理计算机,所述处理计算机可接收请求且可基于所接收的数据生成所请求的预测。
在步骤S305处,所述请求可应用于预测模型以识别对应于所述请求中的数据的社区。在实施例中,预测模型可包括多个社区,所述多个社区包括表示特定信息要素的多个节点。接着可识别包括用于所述请求中的数据中的至少一些的节点的社区,以便对所述请求进行分类且生成所得预测。举例来说,所述请求可包括用于‘用户X’的账户标识符和‘邮政编码:94110’的位置,且用于‘用户X’的节点401(参见图4)和用于‘位置:94110-旧金山’的节点405可被识别以包含在‘社区A’410中。处理计算机接着可将‘社区A’410识别为有可能在‘社区A’内发生‘用户X’与资源提供商之间的交互的社区。
在步骤S306处,可确定所识别社区中的充分节点。举例来说,可确定用于资源提供商的在所识别社区内(例如在‘社区A’内)高度连接的节点。在一个实施例中,可通过横穿包括所识别社区中的节点的路径直到已经横穿充分节点为止来执行此确定。举例来说,参考图4,对于请求用户,‘用户X’的账户标识符,横穿可在输入节点401处开始。所述横穿可通过沿着输入节点的入射边缘(即沿着连接节点的边缘)朝向邻近节点移动而继续。举例来说,被横穿的入射边缘可以是连接到‘用户X’的输入节点的高权重的入射边缘407。被横穿的边缘407可连接到用于先前与‘用户X’频繁进行交易的商家的资源提供商标识符RP-1 403的邻近节点。横穿接着可沿着邻近边缘继续直到已确定充分节点为止。举例来说,横穿可在社区内从邻近节点RP-1 403继续到用于不同账户标识符402的节点。不同账户标识符可以是用于另一用户,‘用户Y’的账户标识符,所述用户也与由节点403识别的资源提供商交互(即也在商家处交易)。横穿接着可从用于不同账户标识符的节点继续到用于不同资源提供商标识符的节点RP-2 404。不同资源提供商标识符可用于与‘用户Y’频繁交互但尚未与‘用户X’交互的资源提供商(例如在用户的社区内受欢迎的新餐馆)。用于不同资源提供商标识符的节点接着可被确定为满足所请求的预测的准则的充分节点(即为高度连接到社区内的用户/与社区的用户具有高交互概率的资源提供商)。充分节点接着可以是被横穿的最后一个节点,且所述横穿可终止。用于充分节点的标识符接着可被输出使得可(例如从聚合数据数据库)查询与充分节点有关的信息且将其提供于预测中。
在步骤S307处,与充分节点有关的信息可被提供作为所请求的预测。举例来说,在步骤S306处确定的充分节点可以是用于餐馆的标识符(例如餐馆名称)的节点,且提交到用户的预测接着可以是餐馆名称、位置(例如地址)和任何其它相关信息(例如网站、评论、经营时间、销售品等)。信息接着可发送到用户的供请求预测的用户装置。所述信息接着可由用户装置接收且显示给用户。举例来说,所述信息可作为聚合列表的一部分或作为可与用户交互的图像显示给用户。
图5展示用于将预测递送给请求用户的系统图。系统500可包括由多个用户操作的多个用户装置(用户装置501、502、503、504、505等)。多个用户装置可连接到网络520。网络520可以是例如根据任何合适协议,例如TCP/IP、BSMAP、DTAP、SMSTP、FTP、VoIP等操作的无线网络。一个或多个处理计算机530也可连接到网络520,所述一个或多个处理计算机可访问一个或多个数据库,例如图数据库530C和聚合数据数据库530B。在一个实施例中,处理计算机530可以是图2的处理计算机200A。
根据实施例,用户可使用用户装置来通过网络520接收预测。每一用户可使用其用户装置以生成对预测的请求(例如用于有可能与用户交互的资源提供商的建议)。在实施例中,用户可使用用户装置的一个或多个输入元件以生成请求,所述输入元件例如键盘、触摸屏、麦克风等。所述请求可包含数据,例如用户的账户标识符、用户或用户装置的位置、资源提供商的类型和/或用户输入的文本。所述请求可通过网络520发送且由处理计算机530接收。处理计算机530接着可通过将请求中的数据应用于预测模型而生成预测。预测模型可包括存储在图数据库530C中的多个社区,且生成所述预测可包括:识别对应于所述请求的社区;识别所识别社区内的充分节点(例如所述社区内的资源提供商节点);和接着从聚合数据数据库530B检索充分节点的信息。充分节点的信息接着可通过网络520发送到请求所源自的用户装置,作为对所接收请求的响应(预测)。
如先前在描述中所提及,在一个实施例中,形成预测模型的多个社区可使用图学习算法来确定。图学习算法可以是用于生成用于交互网络的重叠社区的不受监督的学习算法。根据实施例,交互网络可表示为无向的简单图G(V,E),其具有如节点(即顶点)V的交互数据的唯一信息要素和如边缘E的节点之间的交互。每一边缘可具有给定长度和/或权重,其可量化已连接节点之间的交互的状态。
在一个实施例中,彼此频繁地交互和/或彼此具有高交互概率的节点可通过短距离分隔开且可密集地填充在图G的给定区内。举例来说,用户可每7天在第一商家处进行一次交易(频繁交互),且用户的节点与第一商家的节点之间的边缘的长度可以是5。同时,用户可每30天在第二商家处进行一次交易(不频繁交互),且用户的节点与第二商家的节点之间的边缘的长度可以是10。作为另一实例,从用户节点到用于用户的邻域或住宅区内的资源提供商的节点的路径可能较短,且相比于将用户节点链接到位于用户很少访问的区域中的资源提供商的路径,可能需要较少要横穿的边缘。
在另一实施例中,彼此频繁地交互和/或彼此具有较强的相关性程度的节点可通过高权重/强边缘连接。举例来说,用于供应咖啡且在早晨时间期间最忙的资源提供商的节点可通过权重20的强边缘连接到用于10:00:00的节点,但可通过权重1的弱边缘连接到用于18:00:00的节点。作为另一实例,用于售卖昂贵消费型电子装置的资源提供商的节点可通过具有高权重的强边缘连接到用于交易金额$100的节点,且可通过低权重的弱边缘连接到用于交易金额$1的节点。
根据实施例,图G的节点可分组成社区K。每一不同社区K可包括密集填充的节点,其相比于不同社区的节点彼此更频繁地交互。此外,社区可具有直径,其可描述社区的范围。在一个实施例中,社区的直径可标示为SP(K),且可被定义为K中的任何两个节点之间的任何最短路径的最大长度。举例来说,社区K可包括节点A、B、C和D,且每对节点之间的最短可能路径可以是‘AB:1’、、‘AC:3’、‘AD:4’、‘BC:2’、‘BD:3’和‘CD:1’。在此实例中,直径SP(K)将等于4,因为最大的最短路径为‘AD:4’。在另一实施例中,社区K的直径可标示为ASP(K),且可被定义为K中的每对节点之间的所有最短路径的平均长度。举例来说,包括节点‘A’、‘B’、‘C’和‘D’的社区可具有最短路径‘AB:1’、‘AC:3’、‘AD:4’、‘BC:2’、‘BD:3’和‘CD:1’。接着ASP(K)可被计算为‘(1+3+4+2+3+1)/6=2.333’。
2017年5月9日申请的美国专利申请第15/590,988号中可发现用于确定图中的最短路径的合适方法,所述申请出于所有目的以全文引用的方式并入本文中。
具有相同直径的社区可具有非常不同的拓扑。为了区分具有相同直径的社区的不同拓扑,可定义另一控制参数。对于较密集社区,节点可连接到社区中的大多数其它节点。另一方面,对于较稀疏社区,节点可连接到社区内的仅少数节点。为了测量节点v在社区K中的连接强度,节点v与社区K的交互概率INvK可由以下等式限定,其中
其中mvK是在节点v与包含在K中的节点之间共享的边缘的数目,且其中nK是包含在K中的节点的数目。
加权节点
根据实施例,对于每一社区,为了从图确定多个社区,图中的每一边缘可被分配一权重。类似于识别蛋白质复合物算法(IPCA)的方法可用于形成社区。在一个实施例中,对于输入图G=(V,E),分配到节点u与v之间的边缘的权重[u,v]可被定义为由节点u和v共享的相邻节点(邻近节点)的数目。举例来说,节点u可连接到节点a、b、c、x、y和z。同时,节点v可连接到节点x、y和z。因此,分配到边缘的权重[u,v]可以是3,因为节点u和v共用三个相邻节点(节点x、y和z)。在另一实施例中,每一边缘的权重可基于包括通过边缘连接的两个节点的交互的数量来计算。举例来说,用于用户和资源提供商的节点之间的边缘的权重可以是5,其可表示用户在资源提供商处进行的5次交易。作为另一实例,用于资源提供商的节点与用于MCC代码的节点之间的边缘的权重可具有权重100,所述MCC代码存在于在资源提供商处进行的每次交易中。同时,连接资源提供商节点与用于10%的资源供应商的交易所出现的营业时间的节点的边缘可具有权重10。
在实施例中,还可计算用于图中的每一节点的权重。在一个实施例中,每一节点的权重可被计算为其入射边缘的权重的总和。举例来说,节点可连接到5个邻近节点且连接所述节点与5个邻近节点的入射边缘的权重可以是‘3、3、4、6、9’。节点的权重接着可被计算为‘3+3+4+6+9=25’。在实施例中,在所有节点已经被指派权重之后,节点可按权重递减顺序进行排序,且存储在队列Sq中。
选择种子
在一个实施例中,待构建的每一社区可源自种子节点。种子节点可充当正生成的社区中的第一节点,且所述社区可通过基于附近节点是否符合预定义准则而从第一节点扩展社区而进一步加以构建。下文进一步描述用于添加附近节点的预定义准则。在一个实施例中,队列Sq中的权重最高的节点可被选定为每一社区的种子节点。在一实施例中,为了开始从图确定社区的过程,队列Sq中的第一节点(即最高权重节点)可被选定为种子节点以增加新社区。
扩展社区
根据实施例,可通过扩展社区K以包含连接到包含在社区中的一个或多个节点的附近节点(相邻节点)而从种子节点构建新社区。在一个实施例中,新社区K可通过根据优先级递归地添加来自其相邻社区的节点而扩展。在一个实施例中,可通过值INvK、v与新社区K的节点之间的交互概率确定K的相邻项v的优先级。在一实施例中,与K具有最高交互概率的节点可被选定为具有最高优先级的相邻节点。
在实施例中,通过测试v是否是(K,Tin,d)-顶点的扩展-判断测试来确定是否将高优先级相邻节点v添加到新社区。下文描述用于在延伸-判断测试中评估的(K,Tin,d)-顶点的预定义准则。在一实施例中,如果候选节点v是(K,Tin,d)-顶点,则候选节点v可添加到新社区。一旦新节点v添加到社区,可更新社区,即,新社区的相邻社区可从图G重新构建,且新社区的相邻社区的优先级可重新计算。
扩展-判断
在一实施例中,候选节点(相邻节点)v是否添加到社区K可通过两个条件来确定。首先,可计算候选节点与社区的交互概率INvK。在一实施例中,如果值INvK小于预定阈值Tin,则候选节点将不会添加到社区。在一个实施例中,预定阈值Tin可以是0与1之间的预定值。在实施例中,可选择预定阈值Tin以控制包含在每一社区中的节点的数目以及所生成的社区的总数目。举例来说,较大Tin值可产生较大数目的社区以及每一社区中的较少节点。同时,较低Tin值可产生较少社区,其中每一社区包括较大数目的节点。这可进一步影响模型的输出预测,因为具有较多社区的模型可具有较大分辨率且可产生较精确预测(例如较少错误肯定);然而,包括包含大量节点的社区的模型可能够预测如果社区变得更小,那么将可能会错过的交互(例如仍可发生的具有较低概率的交互)。因此,Tin值可基于这些结果之间的平衡来选择,且可根据所要结果调整。
根据实施例,如果候选节点v通过此第一测试,那么可计算扩展的社区的直径K+v。如上文所描述,社区的直径可被计算为社区中的任何两个节点之间的任何最短路径的最大长度(即最大可能长度)SP(K),或可被计算为社区中的每对节点之间的所有最短可能路径的平均长度ASP(K)。在一实施例中,可计算图K+v的直径且将其与参数d进行比较,所述参数d可以是用于正被构建的社区的预先建立的边界。如果K+v的直径的所计算值受d限定,那么顶点v可添加到社区(即K=K+v)。参数d可基于正被使用的交互数据的性质来设定。举例来说,可确定对于用户和资源提供商的交互网络,95%的交互在彼此相距仅5或更少连接的用户与资源提供商之间进行,且参数d可设定为‘5’。如果节点v无法符合预定义准则中的任一个,那么测试社区的下一最高优先级相邻社区等等。一旦社区的所有剩余的相邻社区无法符合预定义准则,那么社区无法进一步扩展,且可完全确定社区K的节点。接着,包含在彻底构建的社区K中的节点可在选择队列Sq中的下一节点之前从所述队列移除。
一旦完成了社区的构建,那么包含在所述社区中的所有节点可从队列Sq移除,且队列Sq中剩余的第一节点(权重最高的节点)可被选定为用于下一社区的种子,下一社区接着可根据以上过程来扩展。可重复选择种子、扩展社区和扩展-判断过程直到完全清空队列Sq为止。
因此,此方法可生成重叠社区,因为所生成的社区的节点仅从队列Sq移除,但不从原始图G移除,所述候选节点在扩展社区过程期间从所述原始图G选择。此外,所述过程可保证将无任何两个相同的所生成社区,因为可选择用于新社区的种子节点使得种子节点不属于先前建构的社区中的任一个。上文提及的特征的技术优势包含进行预测时任何给定节点的多个特点的表达。这允许可针对特定位置、天数等定制的较准确预测,且因此可说明任何给定节点的大范围的质量。举例来说,用于预测交互的先前方法仅可将节点分类成单一社区,而当前呈现的方法说明节点属于多个社区。这例如在预测属于多于一个社区且其交互随条件改变而变化的的用户与资源提供商之间的交互时可为有益的。此外,所述方法允许在多个层级下映射交互。这对于预测用户与资源提供商之间的交互特别适用,因为用户与资源提供商之间的相关性(即通过账号和名称)以及与用户和资源提供商有关的概念之间的非直观相关性(例如位置和MCC代码)在每一社区中表达。另外,可表达与交互自身有关的概念之间的相关性,例如所进行的交互的时间和性质(例如如由交易金额和由进行交易所通过的方式表达)。
参考图4,可容易地看到所描述方法的益处。举例来说,用户X 401和用户Y 402可以是属于两个不同消费社区的两个不同消费者。用户X 401可属于社区A 410,其可包括与年轻消费者年龄22到35有关、吸引年轻消费者年龄22到35的商家且与年轻消费者年龄22到35进行的交易的类型有关的节点。举例来说,社区A 410可包括用于较年轻的消费者的支付账号的节点和用于商家的节点,所述商家例如受较年轻的消费者欢迎且频繁使用支付账号的酒吧、服装店和餐馆。社区A 410还可包含用于描述商家的主要业务(例如餐馆、酒吧等)的商家种类代码的节点、用于通常可找到那些类型的商家的位置(例如城市区域、与夜生活相关联的街道等)且用于通常针对每次交易进行的交易金额(例如平均$20)的节点。相反地,用户Y 402可属于社区B 420,其可包括与面向家庭的商家和通常在所述商家处进行交易的在40到70的年龄之间的消费者有关的节点。举例来说,社区B 420可包含用于家庭早午餐餐馆的节点、用于家庭娱乐类型机构(例如保龄球场、主题公园、电影院等)的MCC代码、所述机构所在的位置(例如中等收入家族居住的郊区附近),和用于这些机构处的交易可通常进行的时间(例如星期六或星期天上午11点左右)的节点。图4中所展示的社区A 410和社区B 420重叠的RP-1 403可以是用于商家的节点,所述商家取决于某些条件可吸引年轻的消费者(例如用户X 401)和面向家庭的消费者(例如用户Y 402)。举例来说,RP-1 403可以是在白天期间供应家庭早午餐且还在夜晚充当受欢迎的酒吧的餐馆。本文中所描述的方法可允许在预测模型中考虑RP-1 403的两种表达,且可对还具有多个表达、目的、客户群等的其它商家进行相同的考虑。这可产生使消费者和商家两者都极大地受益的较准确建议。举例来说,用户Y可从他的装置请求用于供应他的家庭在做完礼拜之后可享用的早午餐的地点的建议,且处理计算机可返回用于RP-1 403的信息,因为RP-1 403是市区的通常与夜生活相关联的受欢迎的酒吧,所述RP-1 403可能是非直观的结果。因此,所描述的方法可使用交互数据以确定每一资源提供商的多个表达,从而可使将资源提供商连接到可与其容易地交互的用户的过程加速。
应理解,如上文所描述的本发明可通过模块化或一体化方式使用计算机软件(存储在有形的物体介质中)以控制逻辑的形式实施。基于本公开和本文中所提供的教示,所属领域的普通技术人员将知道并且了解使用硬件和硬件与软件的组合来实施本发明的其它方式和/或方法。
本文中所描述的任何软件组件或功能可实施为由处理器使用任何合适的计算机语言(例如Java、C++或Perl)、使用例如常规或面向对象的技术执行的软件代码。软件代码可被存储为计算机可读介质,例如,随机存取存储器(RAM)、只读存储器(ROM)、例如硬盘驱动器或软盘的磁性介质,或例如CD-ROM的光学介质上的一系列指令或命令。任何此类计算机可读介质可驻留在单个计算设备上或内部,并且可存在于系统或网络中的不同计算设备上或内部。
以上描述是说明性的而不是限制性的。在所属领域的技术人员阅读了本公开之后,本发明的许多变化将变得显而易见。因此,本发明的范围不应参考以上描述来确定,而是应参考待决的权利要求书以及其完整范围或等效物来确定。
在不脱离本发明的范围的情况下,任何实施例的一个或多个特征可与任何其它实施例的一个或多个特征组合。
除非具体地相反指示,否则“一(a/an)”或“所述(the)”的叙述打算意指“一个或多个”。
上文所提及的所有专利、专利申请、公开案和描述都出于所有目的以其全文引用的方式并入本文中。不承认它们为现有技术。

Claims (20)

1.一种方法,其包括:
a)由一个或多个计算机接收用于资源提供商与用户之间的多个已知交互的交互数据;
b)由所述一个或多个计算机基于所述多个已知交互创建拓扑图,所述拓扑图包括节点和边缘;
c)由所述一个或多个计算机确定多个社区以形成预测模型,每一社区包括通过边缘连接的节点的密集集合;
d)由所述一个或多个计算机接收对预测的请求;
e)由所述一个或多个计算机通过识别所述多个社区中对应于所述请求的社区将所述请求应用于所述预测模型;
f)由所述一个或多个计算机确定所识别社区内的节点;以及
g)由所述一个或多个计算机提供关于所述节点的信息作为所请求的预测。
2.根据权利要求1所述的方法,其中所述多个社区在步骤c)中通过以下操作来确定:
h)计算所述拓扑图中的每一边缘的权重;
i)基于所述边缘中的每一个的所计算权重计算所述拓扑图中的每一节点的权重;
j)生成按权重递减顺序包括所述节点的队列;
k)从所述队列选择种子节点,所述种子节点是所述队列中权重最高的节点;
l)生成包括所述种子节点的社区;
m)计算不包含在所述社区中的每一候选节点的交互概率,所述交互概率是不包含在所述社区中的节点与包含在所述社区中的节点交互的概率;
n)基于在步骤m)中计算的所述交互概率确定最高优先级节点;
o)确定所述最高优先级节点是否符合预定义准则;
p)如果在步骤o)处确定所述最高优先级符合所述预定义准则,则将所述最高优先级节点添加到所述社区;
q)重复步骤m)到p)直到在步骤o)处确定所述最高优先级节点不符合所述预定义准则为止;
r)输出所述社区,所述社区包括用于所述社区的唯一标识符和用于包含在所述社区中的所述节点的标识符;
s)从所述队列移除包含在所述社区中的所述节点;以及
t)重复步骤k)到s)直到所述队列清空为止,在步骤r)处输出的每一社区为所述多个社区中形成所述预测模型的社区。
3.根据权利要求2所述的方法,其中在步骤m)处计算的每一候选节点的所述交互概率被计算为:在所述候选节点与包含在所述社区中的所述节点之间共享的边缘的总数目除以包含在所述社区中的节点的数目。
4.根据权利要求2所述的方法,其中在步骤p)处确定所述最高优先级节点是否符合所述预定义准则包括:
确定所述最高优先级节点的所述交互概率是否大于或等于添加到所述社区所需的预定阈值。
5.根据权利要求4所述的方法,其中确定所述最高优先级节点是否符合所述预定义准则进一步包括:
确定将所述最高优先级节点添加到所述社区是否将使所述社区的直径或包含在所述社区中的节点之间的最短路径的平均长度增加到超过预先建立的边界。
6.根据权利要求1所述的方法,其中对所述预测的所述请求包含包括以下中的一个或多个的数据:用户的账户标识符、所述用户的位置、资源提供商的类型和用户输入的文本。
7.根据权利要求6所述的方法,其中在步骤f)中确定所述所识别社区内的所述节点包括:
确定包括所述所识别社区中通过边缘连接的节点的路径,所述路径包含用于所述用户的所述账户标识符的节点;
横穿始于用于所述用户的所述账户标识符的所述节点的所述路径;
在横穿与包含在对所述预测的所述请求中的所述数据相关联的最后一个被横穿节点后,即终止所述横穿;以及
输出用于与所述数据相关联的所述最后一个被横穿节点的标识符。
8.根据权利要求1所述的方法,其进一步包括:
接收用于第一资源提供商的元信息;
查询所述拓扑图以找到用于与所述元信息相关联的第二资源提供商的成双节点;以及
生成与用于所述成双节点的交互数据有关的新节点。
9.一种计算机,其包括:
处理器;
网络接口;以及
计算机可读介质,所述计算机可读介质包括能由所述处理器执行的代码,所述代码指示所述计算机:
a)接收用于资源提供商与用户之间的多个已知交互的交互数据;
b)基于所述多个已知交互创建拓扑图,所述拓扑图包括节点和边缘;
c)确定多个社区以形成预测模型,每一社区包括通过边缘连接的节点的密集集合;
d)接收对预测的请求;
e)通过识别所述多个社区中对应于所述请求的社区而将所述请求应用于所述预测模型;
f)确定所识别社区内的节点;以及
g)提供关于所述节点的信息作为所请求的预测。
10.根据权利要求9所述的计算机,其中用以确定多个社区以形成预测模型的所述指令包括包含以下步骤的方法:
h)计算所述拓扑图中每一边缘的权重;
i)基于所述边缘中的每一个的所计算权重计算所述拓扑图中的每一节点的权重;
j)生成按权重递减顺序包括所述节点的队列;
k)从所述队列选择种子节点,所述种子节点是所述队列中权重最高的节点;
l)生成包括所述种子节点的社区;
m)计算不包含在所述社区中的每一候选节点的交互概率,所述交互概率是不包含在所述社区中的节点与包含在所述社区中的节点交互的概率;
n)基于在步骤m)中计算的所述交互概率确定最高优先级节点;
o)确定所述最高优先级节点是否符合预定义准则;
p)如果在步骤o)处确定所述最高优先级符合所述预定义准则,则将所述最高优先级节点添加到所述社区;
q)重复步骤m)到p)直到在步骤o)处确定所述最高优先级节点不符合所述预定义准则为止;
r)输出所述社区,所述社区包括用于所述社区的唯一标识符和用于包含在所述社区中的所述节点的标识符;
s)从所述队列移除包含在所述社区中的所述节点;以及
t)重复步骤k)到s)直到所述队列清空为止,在步骤r)处输出的每一社区为所述多个社区中形成所述预测模型的社区。
11.根据权利要求10所述的计算机,其中在步骤m)处计算的每一候选节点的所述交互概率被计算为:在所述候选节点与包含在所述社区中的所述节点之间共享的边缘的总数目除以包含在所述社区中的节点的数目。
12.根据权利要求10所述的计算机,其中在步骤p)处确定所述最高优先级节点是否符合所述预定义准则包括:
确定所述最高优先级节点的所述交互概率是否大于或等于添加到所述社区所需的预定阈值。
13.根据权利要求12所述的计算机,其中确定所述最高优先级节点是否符合所述预定义准则的所述方法进一步包括:
确定将所述最高优先级节点添加到所述社区是否将使所述社区的直径或包含在所述社区中的节点之间的最短路径的平均长度增加到超过预先建立的边界。
14.根据权利要求9所述的计算机,其中对所述预测的所述请求包含包括以下中的一个或多个的数据:用户的账户标识符、所述用户的位置、资源提供商的类型和用户输入的文本。
15.根据权利要求14所述的计算机,其中在步骤f)中确定所述所识别社区内的所述节点包括:
确定包括所述所识别社区中通过边缘连接的节点的路径,所述路径包含用于所述用户的所述账户标识符的节点;
横穿始于用于所述用户的所述账户标识符的所述节点的所述路径;
在横穿与包含在对所述预测的所述请求中的所述数据相关联的最后一个被横穿节点后,即终止所述横穿;以及
输出用于与所述数据相关联的所述最后一个被横穿节点的标识符。
16.根据权利要求9所述的计算机,其中能由所述处理器执行的所述代码进一步包括用以进行以下操作的指令:
接收用于第一资源提供商的元信息;
查询所述拓扑图以找到用于与所述元信息相关联的第二资源提供商的成双节点;以及
生成与用于所述成双节点的交互数据有关的新节点。
17.一种用户装置,其包括:
处理器;
网络接口;
一个或多个输入元件;
显示器;以及
计算机可读介质,所述计算机可读介质包括能由所述处理器执行的代码,所述代码指示所述用户装置:
从所述用户装置的用户接收与对预测的请求有关的一个或多个输入,所述一个或多个输入通过所述一个或多个输入元件由所述用户装置接收并处理;
基于来自所述用户的所述一个或多个输入生成对所述预测的所述请求;
通过所述网络接口将对所述预测的所述请求发送到一个或多个计算机;
通过所述网络接口接收所请求的预测的数据,所述预测的所述数据是通过将所述请求应用于从所述用户和其它用户装置的其它用户的交互数据生成的预测模型而由所述一个或多个计算机生成的;以及
使用所述显示器向所述用户显示所述所请求的预测的所述数据。
18.根据权利要求17所述的用户装置,其中从所述用户和所述其它用户的所述交互数据生成的所述预测模型是使用包括以下操作的方法生成的:
h)计算从所述交互数据生成的拓扑图中的每一边缘的权重;
i)基于所述边缘中的每一个的所计算权重计算所述拓扑图中的每一节点的权重;
j)生成按权重递减顺序包括所述节点的队列;
k)从所述队列选择种子节点,所述种子节点是所述队列中权重最高的节点;
l)生成包括所述种子节点的社区;
m)计算不包含在所述社区中的每一候选节点的交互概率,所述交互概率是不包含在所述社区中的节点与包含在所述社区中的节点交互的概率;
n)基于在步骤m)中计算的所述交互概率确定最高优先级节点;
o)确定所述最高优先级节点是否符合预定义准则;
p)如果在步骤o)处确定所述最高优先级符合所述预定义准则,则将所述最高优先级节点添加到所述社区;
q)重复步骤m)到p)直到在步骤o)处确定所述最高优先级节点不符合所述预定义准则为止;
r)输出所述社区,所述社区包括用于所述社区的唯一标识符和用于包含在所述社区中的所述节点的标识符;
s)从所述队列移除包含在所述社区中的所述节点;以及
t)重复步骤k)到s)直到所述队列清空为止,在步骤r)处输出的每一社区是多个社区中形成所述预测模型的社区,所述预测模型用于应用来自所述用户装置的所述请求并将所请求的预测递送到所述用户。
19.根据权利要求17所述的用户装置,其中对所述预测的所述请求包含包括以下中的一个或多个的数据:所述用户的账户标识符、所述用户的位置、资源提供商的类型和用户输入的文本。
20.根据权利要求18所述的用户装置,其中显示给所述用户的所述预测的所述数据包括用于所述多个社区中与所述请求有关的社区中的一个或多个节点的信息,且其中用于所述一个或多个节点的所述信息作为聚合列表或图像显示给所述用户。
CN201780042953.6A 2016-07-11 2017-07-11 使用图社区的机器学习和预测 Withdrawn CN109416761A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662360799P 2016-07-11 2016-07-11
US62/360,799 2016-07-11
PCT/US2017/041537 WO2018013566A1 (en) 2016-07-11 2017-07-11 Machine learning and prediction using graph communities

Publications (1)

Publication Number Publication Date
CN109416761A true CN109416761A (zh) 2019-03-01

Family

ID=60953302

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780042953.6A Withdrawn CN109416761A (zh) 2016-07-11 2017-07-11 使用图社区的机器学习和预测

Country Status (4)

Country Link
US (2) US10872298B2 (zh)
EP (1) EP3482353A4 (zh)
CN (1) CN109416761A (zh)
WO (1) WO2018013566A1 (zh)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9143468B1 (en) 2013-01-08 2015-09-22 Twitter, Inc. Identifying relevant messages in a conversation graph
US9965797B1 (en) * 2016-10-22 2018-05-08 Capital One Services, Llc System and method for generating user customized order interface
WO2019143360A1 (en) * 2018-01-19 2019-07-25 Visa International Service Association Data security using graph communities
CN111191021A (zh) * 2018-11-14 2020-05-22 北京嘀嘀无限科技发展有限公司 职业预测方法、装置、设备及计算机可读存储介质
US10681056B1 (en) 2018-11-27 2020-06-09 Sailpoint Technologies, Inc. System and method for outlier and anomaly detection in identity management artificial intelligence systems using cluster based analysis of network identity graphs
US10341430B1 (en) 2018-11-27 2019-07-02 Sailpoint Technologies, Inc. System and method for peer group detection, visualization and analysis in identity management artificial intelligence systems using cluster based analysis of network identity graphs
US11474943B2 (en) 2018-12-21 2022-10-18 Home Box Office, Inc. Preloaded content selection graph for rapid retrieval
US11474974B2 (en) 2018-12-21 2022-10-18 Home Box Office, Inc. Coordinator for preloading time-based content selection graphs
US11475092B2 (en) 2018-12-21 2022-10-18 Home Box Office, Inc. Preloaded content selection graph validation
US11829294B2 (en) * 2018-12-21 2023-11-28 Home Box Office, Inc. Preloaded content selection graph generation
US11269768B2 (en) 2018-12-21 2022-03-08 Home Box Office, Inc. Garbage collection of preloaded time-based graph data
US11204924B2 (en) 2018-12-21 2021-12-21 Home Box Office, Inc. Collection of timepoints and mapping preloaded graphs
US11687795B2 (en) 2019-02-19 2023-06-27 International Business Machines Corporation Machine learning engineering through hybrid knowledge representation
US10523682B1 (en) 2019-02-26 2019-12-31 Sailpoint Technologies, Inc. System and method for intelligent agents for decision support in network identity graph based identity management artificial intelligence systems
US10554665B1 (en) 2019-02-28 2020-02-04 Sailpoint Technologies, Inc. System and method for role mining in identity management artificial intelligence systems using cluster based analysis of network identity graphs
US11222061B2 (en) * 2019-03-28 2022-01-11 Facebook, Inc. Generating digital media clusters corresponding to predicted distribution classes from a repository of digital media based on network distribution history
CN110310122B (zh) * 2019-06-27 2023-09-01 上海麦克风文化传媒有限公司 一种基于图结构的iOS代充风险控制方法
US12062103B2 (en) * 2019-10-23 2024-08-13 Honeywell International Inc. Predicting identity-of-interest data structures based on incident-identification data
US11983186B2 (en) 2019-10-23 2024-05-14 Honeywell International Inc. Predicting potential incident event data structures based on multi-modal analysis
US11516155B1 (en) 2019-12-20 2022-11-29 Twitter, Inc. Hard and soft ranking messages of conversation graphs in a messaging platform
US11057322B1 (en) 2019-12-20 2021-07-06 Twitter, Inc. Ranking messages of conversation graphs in a messaging platform using machine-learning signals
US10951560B1 (en) * 2019-12-20 2021-03-16 Twitter, Inc. Ranking messages of conversation graphs in a messaging platform using predictive outcomes
US11461677B2 (en) 2020-03-10 2022-10-04 Sailpoint Technologies, Inc. Systems and methods for data correlation and artifact matching in identity management artificial intelligence systems
US11893256B2 (en) * 2020-03-11 2024-02-06 International Business Machines Corporation Partitioning of deduplication domains in storage systems
US11620665B2 (en) * 2020-04-01 2023-04-04 Intuit Inc. Methods and systems using and constructing merchant communities based on financial transaction data
US10862928B1 (en) 2020-06-12 2020-12-08 Sailpoint Technologies, Inc. System and method for role validation in identity management artificial intelligence systems using analysis of network identity graphs
CN111881366A (zh) * 2020-07-31 2020-11-03 深圳市万物云科技有限公司 一种基于图机器学习的用户社区发现方法及相关组件
US10938828B1 (en) 2020-09-17 2021-03-02 Sailpoint Technologies, Inc. System and method for predictive platforms in identity management artificial intelligence systems using analysis of network identity graphs
US20220101161A1 (en) * 2020-09-25 2022-03-31 LayerFive, Inc Probabilistic methods and systems for resolving anonymous user identities based on artificial intelligence
US11196775B1 (en) * 2020-11-23 2021-12-07 Sailpoint Technologies, Inc. System and method for predictive modeling for entitlement diffusion and role evolution in identity management artificial intelligence systems using network identity graphs
US11295241B1 (en) 2021-02-19 2022-04-05 Sailpoint Technologies, Inc. System and method for incremental training of machine learning models in artificial intelligence systems, including incremental training using analysis of network identity graphs
CN113283925B (zh) * 2021-04-13 2022-08-02 支付宝(杭州)信息技术有限公司 网络实验分流、节点关系预测方法、装置以及设备
CN113487427B (zh) * 2021-04-20 2024-06-25 微梦创科网络科技(中国)有限公司 一种交易风险识别方法、装置及系统
US11227055B1 (en) 2021-07-30 2022-01-18 Sailpoint Technologies, Inc. System and method for automated access request recommendations
CN114491261B (zh) * 2022-01-27 2024-05-14 北京有竹居网络技术有限公司 用于获得推荐解释的方法、设备和计算机可读介质
US20240061829A1 (en) * 2022-08-19 2024-02-22 Oracle International Corporation System and methods for enhancing data from disjunctive sources

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8560471B2 (en) * 2009-08-10 2013-10-15 Yaacov Shama Systems and methods for generating leads in a network by predicting properties of external nodes
US20130138479A1 (en) * 2010-05-24 2013-05-30 Telefonaktiebolaget Lm Ericsson (Publ) Classification of network users based on corresponding social network behavior
US8645312B2 (en) 2011-03-29 2014-02-04 Manyworlds, Inc. Expertise discovery methods and systems
US8170971B1 (en) 2011-09-28 2012-05-01 Ava, Inc. Systems and methods for providing recommendations based on collaborative and/or content-based nodal interrelationships
US8793255B1 (en) 2012-05-11 2014-07-29 Google Inc. Generating a reputation score based on user interactions
WO2014159540A1 (en) * 2013-03-14 2014-10-02 Indiana University Research And Technology Corporation Systems and methods for predicting meme virality based on network structure
US9477755B2 (en) 2013-04-09 2016-10-25 International Business Machines Corporation Question-related identification of relevant social communities
US10242374B2 (en) * 2014-12-09 2019-03-26 Facebook, Inc. Providing insights to a merchant
US10255358B2 (en) * 2014-12-30 2019-04-09 Facebook, Inc. Systems and methods for clustering items associated with interactions
US10097973B2 (en) * 2015-05-27 2018-10-09 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device

Also Published As

Publication number Publication date
US10872298B2 (en) 2020-12-22
WO2018013566A1 (en) 2018-01-18
EP3482353A4 (en) 2019-07-24
US20190362263A1 (en) 2019-11-28
EP3482353A1 (en) 2019-05-15
US20210073283A1 (en) 2021-03-11

Similar Documents

Publication Publication Date Title
CN109416761A (zh) 使用图社区的机器学习和预测
US20230162071A1 (en) Autonomous learning platform for novel feature discovery
WO2004044808A1 (en) Method and apparatus for dynamic rule and/or offer generation
CN112215500B (zh) 账号关系识别方法及装置
CN105528387A (zh) 分割发现、评估和实施平台
US11107109B2 (en) Method and system for personalizing offers
WO2023011382A1 (zh) 推荐方法、推荐模型训练方法及相关产品
Abbasimehr et al. A new framework for predicting customer behavior in terms of RFM by considering the temporal aspect based on time series techniques
Chen et al. An effective matching algorithm with adaptive tie-breaking strategy for online food delivery problem
Leng et al. Interpretable recommender system with heterogeneous information: A geometric deep learning perspective
CN108572988A (zh) 一种房产评估数据生成方法和装置
CN110276677A (zh) 基于大数据平台的还款预测方法、装置、设备及存储介质
CN109902823A (zh) 一种基于生成对抗网络的模型训练方法及设备
WO2020113208A1 (en) System, method, and computer program product for generating embeddings for objects
CN110362594A (zh) 一种信息处理方法和系统
Guo et al. Harnessing the power of the general public for crowdsourced business intelligence: a survey
Alves Gomes et al. Will this online shopping session succeed? predicting customer's purchase intention using embeddings
CN110992194A (zh) 一种基于含属性的多进程采样图表示学习模型的用户参考指数算法
Poo et al. Multi-Label Classification with Deep Learning for Retail Recommendation
CN118071400A (zh) 基于图计算技术在信息消费领域的应用方法及系统
CN110348947A (zh) 对象推荐方法及装置
CN112465593A (zh) 通过图神经网络实现时尚套装推荐的方法
Yang et al. Sequential clustering and classification approach to analyze sales performance of retail stores based on point-of-sale data
US12067570B2 (en) System, method, and computer program product for predicting a specified geographic area of a user
Leng et al. Geometric deep learning based recommender system and an interpretable decision support system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20190301