CN112765230A - 基于互联网金融的支付大数据分析方法及大数据分析系统 - Google Patents

基于互联网金融的支付大数据分析方法及大数据分析系统 Download PDF

Info

Publication number
CN112765230A
CN112765230A CN202011604964.9A CN202011604964A CN112765230A CN 112765230 A CN112765230 A CN 112765230A CN 202011604964 A CN202011604964 A CN 202011604964A CN 112765230 A CN112765230 A CN 112765230A
Authority
CN
China
Prior art keywords
payment
service
user
target
payment service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011604964.9A
Other languages
English (en)
Other versions
CN112765230B (zh
Inventor
陈非
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Qianhe Information Technology Co ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110809275.XA priority Critical patent/CN113590679A/zh
Priority to CN202011604964.9A priority patent/CN112765230B/zh
Priority to CN202110808598.7A priority patent/CN113590678A/zh
Publication of CN112765230A publication Critical patent/CN112765230A/zh
Application granted granted Critical
Publication of CN112765230B publication Critical patent/CN112765230B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种基于互联网金融的支付大数据分析方法及系统,通过对支付用户聚类和支付业务聚类进行数据分析挖掘,根据目标支付用户对应的用户画像特征以及业务画像特征分别在所述支付用户聚类中获取拓展支付用户以拓展支付业务,然后计算所述目标支付用户与所述目标支付业务序列中每个支付业务之间的匹配概率值,并根据所述匹配概率值在所述目标支付业务序列中选择与所述目标支付用户对应的推荐支付业务,以用于对所述目标支付用户进行支付业务的推荐。如此,可利于对目标支付用户进行支付业务的推荐,并改善推荐效果,可以提升用户在使用互联网金融平台时的使用体验。

Description

基于互联网金融的支付大数据分析方法及大数据分析系统
技术领域
本发明涉及大数据分析技术领域,具体而言,涉及一种基于互联网金融的支付大数据分析方法及大数据分析系统。
背景技术
随着互联网技术的飞速发展,互联网金融平台上与支付有关的数据量正以指数级而迅猛增长,相应的提供各种互联网金融服务的供应商也如雨后春笋般不断诞生。如此,现在以及不久的将来,在互联网金融网络中逐渐累积的数据将是巨量的、因此所以如何挖掘对这些海量的金融支付数据进行挖掘分析,以改善各供应商对用户提供的金融服务质量,则显得尤为重要。
发明内容
基于现有设计的不足,第一方面,本发明实施例提供一种基于互联网金融的支付大数据分析方法,应用于大数据分析服务器,所述方法包括:
获取通过对预先收集的支付用户样本集中每个支付用户对应的用户画像特征进行聚类分析得到的支付用户聚类和通过对预先收集的支付业务样本集中每个支付业务对应的业务画像特征进行聚类分析得到的支付业务聚类;
根据目标支付用户对应的用户画像特征,在所述目标支付用户对应的支付用户聚类中获取与所述目标支付用户之间的匹配度满足第一匹配条件的支付用户,作为所述目标支付用户对应的拓展支付用户;
将所述目标支付用户在预设时间周期内操作的支付业务和所述拓展支付用户在预设时间周期内操作的支付业务作为目标支付业务加入目标支付业务序列中;
根据所述目标支付业务对应的业务画像特征,在所述目标支付业务对应的支付业务聚类中获取与所述目标支付业务之间的匹配度满足第二匹配条件的支付业务,作为所述目标支付业务对应的拓展支付业务,添加到所述目标支付业务序列中;
计算所述目标支付用户与所述目标支付业务序列中每个支付业务之间的匹配概率值,并根据所述匹配概率值在所述目标支付业务序列中选择与所述目标支付用户对应的推荐支付业务,以用于对所述目标支付用户进行支付业务的推荐。
根据第一方面的一种实施方式,所述根据目标支付用户对应的用户画像特征,在所述目标支付用户对应的支付用户聚类中获取与所述目标支付用户之间的匹配度满足第一匹配条件的支付用户,作为所述目标支付用户对应的拓展支付用户,包括:
将目标支付用户对应的支付用户聚类中所述目标支付用户以外的支付用户,确定为备选支付用户,并获取所述目标支付用户与所述备选支付用户分别对应的用户画像特征;
获取所述目标支付用户与所述备选支付用户之间的交叉支付业务,并根据所述目标支付用户与所述备选支付用户分别对应的用户画像特征中与所述交叉支付业务匹配的业务标签的第一平均操作热度、所述目标支付用户与所述备选支付用户分别对应的用户画像特征中所有业务标签的第二平均操作热度,计算所述目标支付用户与所述备选支付用户之间的支付用户匹配度;所述交叉支付业务是指所述目标支付用户操作的支付业务与所述备选支付用户操作的支付业务之间的交集;
根据所述支付用户匹配度对所有所述备选支付用户进行排序,并根据排序结果选择预设数量个所述备选支付用户确定为满足第一匹配条件的支付用户,作为所述目标支付用户对应的拓展支付用户。
根据第一方面的一种实施方式,所述根据所述目标支付业务对应的业务画像特征,在所述目标支付业务对应的支付业务聚类中获取与所述目标支付业务之间的匹配度满足第二匹配条件的支付业务,作为所述目标支付业务对应的拓展支付业务,包括:
将所述目标支付业务对应的支付业务聚类中所述目标支付业务以外的支付业务,确定为待匹配支付业务,并获取所述目标支付业务与所述待匹配支付业务分别对应的业务画像特征;
获取所述目标支付业务与所述待匹配支付业务之间的业务标签组合,并根据所述目标支付业务与所述待匹配支付业务分别对应的业务画像特征中与所述业务标签组合中匹配的业务标签,计算所述目标支付业务与所述待匹配支付业务之间的支付业务匹配度;所述业务标签组合是指所述目标支付业务对应的支付业务属性与所述待匹配支付业务对应的支付业务属性之间的并集;
根据所述支付业务匹配度对所有所述待匹配支付业务进行排序,根据排序结果选择预设数量个待匹配支付业务确定为满足第二匹配条件的支付业务,并将满足第二匹配条件的支付业务确定为所述目标支付业务对应的拓展支付业务。
根据第一方面的一种实施方式,所述计算所述目标支付用户与所述目标支付业务序列中每个支付业务之间的匹配概率值,并根据所述匹配概率值在所述目标支付业务序列中选择与所述目标支付用户对应的推荐支付业务,包括:
将所述目标支付业务序列中的每个支付业务作为待推荐支付业务;
计算所述目标支付用户与每个所述待推荐支付业务之间的匹配概率值;
按照所述匹配概率值对所有所述待推荐支付业务进行排序,并根据排序结果选择多个待推荐支付业务作为所述目标支付用户对应的推荐支付业务。
根据第一方面的一种实施方式,所述计算所述目标支付用户与每个所述待推荐支付业务之间的匹配概率值,包括:
获取所述拓展支付用户针对所述目标支付业务序列中每个支付业务在所述预设时间周期内的第一操作次数;
根据所述第一操作次数计算每个支付业务被所有拓展支付用户在所述预设时间周期内被操作的第一总次数;
获取所述目标支付用户针对所述目标支付业务序列中每个支付业务在所述预设时间周期内的第二操作次数;
根据所述第二操作次数计算每个支付业务被所述目标支付用户在所述预设时间周期内被操作的第二总次数;
根据所述目标支付业务序列中每个支付业务对应的第一操作次数、第一总次数以及第二操作次数、第二总次数计算得到所述目标支付用户与该支付业务的匹配概率值;具体包括:
计算每个支付业务对应的第一操作次数与第一总次数的比值,得到每个支付业务对应的第一百分比;
计算每个支付业务对应的第二操作次数与第二总次数的比值,得到每个支付业务对应的第二百分比;
获取预设的与第一百分比对应的第一权重以及与第二百分比对应的第二权重;
根据所述第一百分比、第二百分比、第一权重、第二权重,计算得到所述目标支付用户与每个支付业务的匹配概率值,具体包括:将每个支付业务对应的第一百分比与第一权重相乘得到第一概率值,将第二百分比与第二权重相乘得到第二概率值,然后将第一概率值与第二概率值之和作为所述目标支付用户与该支付业务的匹配概率值。
根据第一方面的一种实施方式,所述方法还包括:
根据所述目标支付用户在预设时间周期内操作的支付业务,建立所述目标支付用户对应的业务热度分布;所述业务热度分布包括所述目标支付用户操作的支付业务的对应的操作热度值;
根据预设的时间热度关系函数以及所述业务热度分布计算得到所述目标支付用户操作的支付业务对应的热度特征分布集合;
根据所述热度特征分布集合计算得到所述目标支付用户对应的用户画像特征。
根据第一方面的一种实施方式,所述方法还包括:
获取所述目标支付用户在所述预设时间周期内操作的各支付业务的操作热度值;
根据所述操作热度值选择多个支付业务作为待选支付业务;
根据所述待选支付业务在所述预先收集的支付业务样本集对应的支付业务标签集合中获取与所述待选支付业务匹配的的业务标签,并根据所述待选支付业务匹配的业务标签得到所述目标支付业务对应的业务画像特征。
根据第一方面的一种实施方式,所述方法还包括:
根据预设的多个第一聚类特征表示,计算所述预先收集的支付用户样本集中每个支付用户对应的用户画像特征与所述多个第一聚类特征表示之间的第一特征差异;
根据所述第一特征差异,确定各用户画像特征与各第一聚类特征表示之间的匹配关系,并将匹配相同的第一聚类特征表示的用户画像特征所对应的支付用户归入相同的支付用户聚类;其中,所述支付用户聚类的数量与所述第一聚类特征表示的数量相同;
根据预设的多个第二聚类特征表示,计算所述预先收集的支付业务样本集中每个支付业务对应的业务画像特征与所述多个第二聚类特征表示之间的第二特征差异;
根据所述第二特征差异,确定各业务画像特征与各第二聚类特征表示之间的匹配关系,并将匹配相同的第二聚类特征表示的业务画像特征所对应的支付业务归入相同的支付业务聚类中;其中,所述支付业务聚类的数量与所述第二聚类特征表示的数量相同。
根据第一方面的一种实施方式,所述将所述目标支付用户在预设时间周期内操作的支付业务和所述拓展支付用户在预设时间周期内操作的支付业务作为目标支付业务加入目标支付业务序列中,包括:
根据所述目标支付用户以及所述拓展支付用户的各自的用户信息在所述大数据分析服务器中存储的支付数据中获取与所述用户信息匹配的且在所述预设时间周期内产生的支付数据;
采用预设数据清洗算法对所述支付数据进行数据清洗,去除所述支付数据中的无效数据;
从清洗后的支付数据中提取出该支付数据中包含的所有支付业务的业务标识信息;
对提取出的所有业务标识信息进行去重处理,将去重后的业务标识加入预设的数据序列中,得到所述目标支付业务序列。
根据本发明实施例的第二方面,还提供一种大数据分析系统,包括大数据分析服务器以及与所述大数据分析服务器通信连接的分别由多个支付用户对应的多个支付终端,所述大数据分析服务器包括大数据分析装置、处理器以及机器可读存储介质,所述机器可读存储介质和所述处理器连接,所述机器可读存储介质用于所述大数据分析装置包括的存储程序、指令或代码;其中,所述大数据分析装置包括:
聚类获取模块,用于获取通过对预先收集的支付用户样本集中每个支付用户对应的用户画像特征进行聚类分析得到的支付用户聚类和通过对预先收集的支付业务样本集中每个支付业务对应的业务画像特征进行聚类分析得到的支付业务聚类;
拓展用户确定模块,用于根据目标支付用户对应的用户画像特征,在所述目标支付用户对应的支付用户聚类中获取与所述目标支付用户之间的匹配度满足第一匹配条件的支付用户,作为所述目标支付用户对应的拓展支付用户;
业务序列生成模块,用于将所述目标支付用户在预设时间周期内操作的支付业务和所述拓展支付用户在预设时间周期内操作的支付业务作为目标支付业务加入目标支付业务序列中;
拓展业务添加模块,用于根据所述目标支付业务对应的业务画像特征,在所述目标支付业务对应的支付业务聚类中获取与所述目标支付业务之间的匹配度满足第二匹配条件的支付业务,作为所述目标支付业务对应的拓展支付业务,添加到所述目标支付业务序列中;以及
推荐业务计算模块,用于计算所述目标支付用户与所述目标支付业务序列中每个支付业务之间的匹配概率值,并根据所述匹配概率值在所述目标支付业务序列中选择与所述目标支付用户对应的推荐支付业务,以用于对所述目标支付用户进行支付业务的推荐。
综上所述,相较于现有技术,本发明实施例提供的基于互联网金融的支付大数据分析方法及大数据分析系统,基于聚类挖掘的方法,实现对目标支付用户进行支付业务的推荐,可以提升用户在使用互联网金融平台时的使用体验。同时,通过聚类的数据挖掘方法,对金融平台可提供的支付业务向用户进行精准推送,可以提升平台各支付业务的使用率,有助于提升平台的用户流量,并改善金融服务质量。
进一步地,本发明实施例根据目标支付用户对应的用户画像特征,在目标支付用户对应的支付用户聚类中获取与目标支付用户之间的匹配度满足第一匹配条件的支付用户,作为目标支付用户对应的拓展支付用户,然后将目标支付用户操作的支付业务和拓展支付用户操作的支付业务作为目标支付业务,用于作为支付业务推荐的数据支撑,使得目标支付业务序列不仅可以包括拓展支付用户操作的支付业务,还可以包括目标支付业务对应的拓展支付业务。如此,即便在支付用户操作的支付业务的数量过少的情况下,也可以通过目标支付业务对应的拓展支付业务增加目标支付业务序列中的支付业务数量,再对目标支付用户进行支付业务的推荐计算,进而可以提高针对目标用户的支付业务推荐的准确性以及推荐效果。同时,上述拓展支付用户为与目标支付用户具有相似特征的支付用户,然后在目标支付用户所在的支付用户聚类中查找拓展支付用户,可以缩小索引范围,进而减少相关的计算量,提升运算效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,针对本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例提供的一种大数据分析系统的网络架构示意图。
图2是本发明实施例提供的基于互联网金融的支付大数据分析方法的流程示意图。
图3是图2中步骤S12的子步骤流程示意图。
图4是图2中步骤S14的子步骤流程示意图。
图5是图2中步骤S15计算匹配概率值的具体实现流程示意图。
图6是图1中的大数据分析服务器的方框示意图。
图7是图6中支付大数据分析装置的功能模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对实施例中的技术方案进行清楚、完整地描述,附图中类似的组件标号代表类似的组件。显然,以下将描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
此外,本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或多步操作。
为解决前述背景技术所描述的问题,本发明实施例创新性地提供一种基于互联网金融的支付大数据分析方法及大数据分析系统,下面结合附图对本发明的可替代实施例进行具体介绍。
请参见图1,是本发明实施例提供的一种大数据分析系统的网络架构示意图。该大数据分析系统可以包括大数据分析服务器100和多个支付终端200。所述大数据分析服务器100可以是用于提供支付业务服务的互联网金融平台提供的服务器,也可以是独立于该服务器之外的单独用作大数据分析的一种服务器。所述支付终端200可以是个人电脑、智能手机、智能穿戴式设备等。各种支付用户可使用所述支付终端200使用互联网金融平台提供的各种支付业务,本实施例所述的支付业务可以是任何与支付有关的业务,与支付有关的业务可以是已完成支付的业务、未完成支付的业务、曾经操作过的相关业务,具体与是否完成支付动作无关,例如支付业务可以是,但不限于,电商产品、保险、贷款、股票、基金、咨询服务等任意和支付有关的业务均可被看作是本发明实施例所述的支付业务。大数据分析服务器100可以分别与每个支付终端200进行网络连接,每个支付终端200均可以实施相应的支付业务,并产生相应的支付数据发送至大数据分析服务器100,大数据分析服务器100可以根据所有支付终端200的支付数据进行数据挖掘分析。
进一步的,再参见图2,是本发明实施例提供的基于互联网金融的支付大数据分析方法的流程示意图。本实施例中,上述方法由所述大数据分析服务器100执行。下面将结合附图对所述方法的详细步骤进行具体描述和说明。
步骤S11,获取通过对预先收集的支付用户样本集中每个支付用户对应的用户画像特征进行聚类分析得到的支付用户聚类和通过对预先收集的支付业务样本集中每个支付业务对应的业务画像特征进行聚类分析得到的支付业务聚类。
本实施例中,所述支付用户聚类可以包括多个不同用户类别对应的聚类(可以理解为一个“聚类簇”),每个用户类别对应的聚类可以包括具有相应的用户类别属性的支付用户。例如,用户类别可以根据支付用户在各个维度的类别划分对所述支付用户样本集中的大量支付用户样本进行聚类分析或集群分析的方式而得到,例如,不同维度的用户类别属性可以是支付用户的年临段、职业、消费水平、性别等等,本实施例不对此进行具体的限定。
相应地,所述支付业务聚类可以是包括多个不同业务类别的聚类,每个业务类别对应的聚类可以包括具有相应的业务类别属性的支付业务。例如,业务类别可以根据支付业务在各个维度的类别划分对所述支付业务样本集中的大量支付业务样本进行聚类分析或集群分析的方式而得到。例如,不同维度的业务类别属性可以根据支付业务的不同功能或业务类型进行划分,例如可以包括现金类业务、保险类业务、购物类业务等等,本实施例不对此进行具体限定。
步骤S12,根据目标支付用户对应的用户画像特征,在所述目标支付用户对应的支付用户聚类中获取与所述目标支付用户之间的匹配度满足第一匹配条件的支付用户,作为所述目标支付用户对应的拓展支付用户。
本实施例中,所述用户画像特征可以通过以下方式预先得到,具体说明如下。
例如,可根据所述目标支付用户在预设时间周期内操作的支付业务,建立所述目标支付用户对应的业务热度分布。所述业务热度分布包括所述目标支付用户操作的支付业务的对应的操作热度值。
然后,根据预设的时间热度关系函数以及所述业务热度分布计算得到所述目标支付用户操作的支付业务对应的热度特征分布集合。
最后,根据所述热度特征分布集合计算得到所述目标支付用户对应的用户画像特征。
详细地,本实施例中,所述时间热度关系函数可以是一个热度随时间衰减的热度衰减函数,如此可以将支付用户对支付业务的操作热度和随时间衰减的因素考虑进来再进行相应的用户画像,使得画像更准确且可用性更好。此外,可以将所述热度特征分布集合输入到一个预先训练得到的网络模型进行计算,得到所述支付用户对应的用户画像特征。所述热度特征分布集合可以包括目标支付用户在所述预设时间周期内操作的支付业务以及各支付业务对应的操作热度系数,所述操作热度系数可以根据每个支付业务的操作频率计算得到,或者由该操作频率表示,具体方式不做限定。
进一步地,所述业务画像特征可以通过以下方式预先得到,具体说明如下。
首先,获取所述目标支付用户在所述预设时间周期内操作的各支付业务的操作热度值。
然后,根据所述操作热度值选择多个支付业务作为待选支付业务。
最后,根据所述待选支付业务在所述预先收集的支付业务样本集对应的支付业务标签集合中获取与所述待选支付业务匹配的的业务标签,并根据所述待选支付业务匹配的业务标签得到所述目标支付业务对应的业务画像特征。
详细地,可以根据每个支付业务的属性特征,例如支付金额、业务类型等对支付业务样本集中的每个支付业务样本进行相似度匹配,将满足相似度匹配条件的支付业务样本对应的业务标签作为对应的目标支付业务的业务标签,最后可以将多个目标支付业务的标签进行组合得到所述目标支付业务对应的业务画像特征。
步骤S13,将所述目标支付用户在预设时间周期内操作的支付业务和所述拓展支付用户在预设时间周期内操作的支付业务作为目标支付业务加入目标支付业务序列中。如此,目标支付业务序列不仅考虑了目标支付用户对应的支付业务,还考虑了目标支付用户画像类似的拓展支付用户的支付业务,用于后续作为目标支付用户的业务推荐的数据支撑。这样,可以在目标支付用户的支付业务数量较少的情况下,对可用于进行业务推荐的历史支付业务数量进行扩展,使得后续的业务推荐能够更精准,效果更佳,推荐范围更广。
详细地,本实施例中,可首先根据所述目标支付用户以及所述拓展支付用户的各自的用户信息在所述大数据分析服务器100中存储的支付数据中获取与所述用户信息匹配的且在所述预设时间周期内产生的支付数据;然后,采用预设数据清洗算法对所述支付数据进行数据清洗,去除所述支付数据中的无效数据;例如,可以通过数据清洗去除无实际支付操作的支付数据、在相应支付业务对应的操作页面停留时间低于预设时间的支付数据、重复数据、属性标签缺失的数据;接着,从清洗后的支付数据中提取出该支付数据中包含的所有支付业务的业务标识信息;最后,再对提取出的所有业务标识信息进行去重处理,将去重后的业务标识加入预设的数据序列中,得到所述目标支付业务序列。
步骤S14,根据所述目标支付业务对应的业务画像特征,在所述目标支付业务对应的支付业务聚类中获取与所述目标支付业务之间的匹配度满足第二匹配条件的支付业务,作为所述目标支付业务对应的拓展支付业务,添加到所述目标支付业务序列中。如此,目标支付业务序列不仅考虑了目标支付用户以及与目标支付用户画像类似的拓展支付用户的支付业务,进一步拓展其他支付用户的支付业务与目标支付业务的业务画像特征类似的支付业务,用于后续作为目标支付用户的业务推荐的数据支撑。这样,可以在目标支付用户的支付业务数量较少的情况下,对可用于进行业务推荐的历史支付业务数量进行扩展,使得后续的业务推荐能够更精准,效果更佳,推荐范围更广。
步骤S15,计算所述目标支付用户与所述目标支付业务序列中每个支付业务之间的匹配概率值,并根据所述匹配概率值在所述目标支付业务序列中选择与所述目标支付用户对应的推荐支付业务,以用于对所述目标支付用户进行支付业务的推荐。
本实施例中,上述步骤S11中的支付用户聚类以及支付业务聚类可以通过以下所描述的方法实现,具体描述如下。
首先,根据预设的多个第一聚类特征表示,计算所述预先收集的支付用户样本集中每个支付用户对应的用户画像特征与所述多个第一聚类特征表示之间的第一特征差异。
然后,根据所述第一特征差异,确定各用户画像特征与各第一聚类特征表示之间的匹配关系,并将匹配相同的第一聚类特征表示的用户画像特征所对应的支付用户归入相同的支付用户聚类;其中,所述支付用户聚类的数量可以与所述第一聚类特征表示的数量相同。详细地,本实施例中,所述第一聚类特征表示可以是一种特征向量的表现形式,可以是预先设置的一种中心特征向量,每个用户画像特征也可以以特征向量的形式进行表示,所述第一特征差异则是所述主题画像特征与每个第一聚类特征之间的向量差异,例如可以通过欧式距离、曼哈顿距离等进行表示,具体不做限定。
其次,根据预设的多个第二聚类特征表示,计算所述预先收集的支付业务样本集中每个支付业务对应的业务画像特征与所述多个第二聚类特征表示之间的第二特征差异。
最后,根据所述第二特征差异,确定各业务画像特征与各第二聚类特征表示之间的匹配关系,并将匹配相同的第二聚类特征表示的业务画像特征所对应的支付业务归入相同的支付业务聚类中;其中,所述支付业务聚类的数量可以与所述第二聚类特征表示的数量相同。详细地,本实施例中,所述第二聚类特征表示也可以是一种特征向量的表现形式,可以是预先设置的一种中心特征向量,每个业务画像特征也可以以特征向量的形式进行表示,所述第二特征差异则是所述主题画像特征与每个第二聚类特征之间的向量差异,例如也可以通过欧式距离、曼哈顿距离等进行表示,具体不做限定。
进一步地,如图3所示,本实施例中,上述步骤S12,可以通过如下所述的子步骤完成,具体说明如下。
子步骤S121,将目标支付用户对应的支付用户聚类中所述目标支付用户以外的支付用户,确定为备选支付用户,并获取所述目标支付用户与所述备选支付用户分别对应的用户画像特征。
子步骤S122,获取所述目标支付用户与所述备选支付用户之间的交叉支付业务,并根据所述目标支付用户与所述备选支付用户分别对应的用户画像特征中与所述交叉支付业务匹配的业务标签的第一平均操作热度、所述目标支付用户与所述备选支付用户分别对应的用户画像特征中所有业务标签的第二平均操作热度,计算所述目标支付用户与所述备选支付用户之间的支付用户匹配度。本实施例中,所述交叉支付业务可以是指所述目标支付用户操作的支付业务与所述备选支付用户操作的支付业务之间的交集。此外,可以将第一平均操作热度与第二平均操作热度值比值作为所述支付用户匹配度。如此,可以根据目标支付用户与拓展支付用户对相应的支付业务的操作热度的相似程度来计算匹配度。
子步骤S123,根据所述支付用户匹配度对所有所述备选支付用户进行排序,并根据排序结果选择预设数量个所述备选支付用户确定为满足第一匹配条件的支付用户,作为所述目标支付用户对应的拓展支付用户。
详细地,本实施例中可以根据所述支付用户匹配度按照从大到小的顺序对所述备选支付用户进行排序,然后根据排序结果选择排序序号较小的预设数量个备选支付用户作为满足所述第一匹配条件的支付用户作为拓展支付用户。
请参阅图4所示,在上述步骤S14中,所述根据所述目标支付业务对应的业务画像特征,在所述目标支付业务对应的支付业务聚类中获取与所述目标支付业务之间的匹配度满足第二匹配条件的支付业务,作为所述目标支付业务对应的拓展支付业务,具体的实现方式可以描述如下。
子步骤S141,将所述目标支付业务对应的支付业务聚类中所述目标支付业务以外的支付业务,确定为待匹配支付业务,并获取所述目标支付业务与所述待匹配支付业务分别对应的业务画像特征。
子步骤S142,获取所述目标支付业务与所述待匹配支付业务之间的业务标签组合,并根据所述目标支付业务与所述待匹配支付业务分别对应的业务画像特征中与所述业务标签组合中匹配的业务标签,计算所述目标支付业务与所述待匹配支付业务之间的支付业务匹配度。本实施例中,所述业务标签组合可以是指所述目标支付业务对应的支付业务属性与所述待匹配支付业务对应的支付业务属性之间的并集。举例而言,可以根据目标支付业务的业务画像特征得到目标支付业务与所述业务标签组合中匹配的业务标签的第一标签数量,根据待匹配支付业务的业务画像特征与所述业务标签组合匹配的业务标签的第二标签数量,然后将第一标签数量与第二标签数量的比值作为所述支付业务匹配度。
子步骤S143,根据所述支付业务匹配度对所有所述待匹配支付业务进行排序,根据排序结果选择预设数量个待匹配支付业务确定为满足第二匹配条件的支付业务,并将满足第二匹配条件的支付业务确定为所述目标支付业务对应的拓展支付业务。例如,本实施例中,可以根据所述支付业务匹配度从大到小的顺序将所述待匹配支付业务进行排序,然后根据排序结果选择排序序号较小的预设属两个待匹配支付业务作为所述拓展支付业务。
上述步骤S15中计算所述目标支付用户与所述目标支付业务序列中每个支付业务之间的匹配概率值,并根据所述匹配概率值在所述目标支付业务序列中选择与所述目标支付用户对应的推荐支付业务,的具体实现方式示例性描述如下。
首先,计算所述目标支付用户与每个所述待推荐支付业务之间的匹配概率值。
然后,按照所述匹配概率值对所有所述待推荐支付业务进行排序,并根据排序结果选择多个待推荐支付业务作为所述目标支付用户对应的推荐支付业务。例如,可以根据匹配概率值从高到底的顺序进行排列,将排列在前N个的待推荐支付业务作为所述目标支付用户的推荐支付业务,N为预设的正整数。
进一步地,请参考图5,上述步骤S15中计算所述目标支付用户与所述目标支付业务序列中每个支付业务之间的匹配概率值的具体实现方式可以参考图5所示的步骤流程来实现,具体描述如下。
步骤S61,获取所述拓展支付用户针对所述目标支付业务序列中每个支付业务在所述预设时间周期内的第一操作次数。
步骤S62,根据所述第一操作次数计算每个支付业务被所有拓展支付用户在所述预设时间周期内被操作的第一总次数。
步骤S63,获取所述目标支付用户针对所述目标支付业务序列中每个支付业务在所述预设时间周期内的第二操作次数。
步骤S64,根据所述第二操作次数计算每个支付业务被所述目标支付用户在所述预设时间周期内被操作的第二总次数。
步骤S65,根据所述目标支付业务序列中每个支付业务对应的第一操作次数、第一总次数以及第二操作次数、第二总次数计算得到所述目标支付用户与该支付业务的匹配概率值。详细地,首先,可以计算每个支付业务对应的第一操作次数与第一总次数的比值,得到每个支付业务对应的第一百分比;然后,计算每个支付业务对应的第二操作次数与第二总次数的比值,得到每个支付业务对应的第二百分比;接着,获取预设的与第一百分比对应的第一权重以及与第二百分比对应的第二权重;最后,根据所述第一百分比、第二百分比、第一权重、第二权重,计算得到所述目标支付用户与每个支付业务的匹配概率值。例如,可以将每个支付业务对应的第一百分比与第一权重相乘得到第一概率值,将第二百分比与第二权重相乘得到第二概率值,然后将第一概率值与第二概率值之和作为所述目标支付用户与该支付业务的匹配概率值。上述的操作次数可以是指对任何支付业务进行的支付操作、咨询操作、浏览操作、进入页面等操作的任何操作类型的次数加总,具体可根据实际情况而定,此处不做具体限制。
在以上步骤的基础上,可以获得针对目标支付用户的推荐支付业务清单,接下来可以基于推荐支付业务清单进行支付业务推送,在进一步的实施方式中,本申请实施例的方法还可以包括以下步骤:
步骤S16,获取针对目标支付用户的推荐支付业务清单,所述推荐支付业务清单包括多个针对目标支付用户的大数据用户画像而得到的多个待推荐支付业务。
本实施例中,所述推荐支付业务清单可以通过上述获得多个待推荐支付业务而得到。
步骤S17,获取所述推荐支付业务清单中的每个待推荐支付业务的第一权重特征,以及所述大数据分析服务器提供的支付业务的展示页面上的每个页面支付业务的第二权重特征。本实施例中,所述第一权重特征包括用于确定所述待推荐支付业务的展示优先级的权重系数,所述第二权重特征包括用于确定所述页面支付业务的展示优先级的权重系数。所述页面支付业务是指所述展示页面上展示的或者将要展示的支付业务,在页面上展示的支付业务可以是指在页面上展示的支付业务对应的操作选项。
步骤S18,根据每个所述待推荐支付业务的第一权重特征以及每个所述页面支付业务的第二权重特征,在所述支付业务的展示页面上对所述推荐支付业务清单中的待推荐支付业务进行展示,以实现对所述待推荐支付业务的推荐。
详细地,本实施例中,在步骤S17中,所述待推荐支付业务的所述第一权重特征可以通过以下可替代的示例性方案实现,具体描述如下:
首先,针对每个所述待推荐支付业务,获取所述待推荐支付业务的第一权重系数,其中,所述第一权重系数为所述待推荐支付业务上一次被展示时对应的权重值。例如,针对支付业务,在最初时,可以预先设置一个第一权重系数,在后续的业务使用过程中,可以根据支付业务的使用情况,根据预先指定相关算法对第一权重系数进行更新。例如,对于每个待推荐支付业务,在上一次被展示时,可根据其在前一个周期中被操作的频次而得到一个加权系数,将该加权系数与前一次的第一权重系数相乘得到的权重值即可被更新为所述待推荐支付业务上一次被展示时对应的第一权重系数。
然后,确定每个所述第一权重系数在所述推荐支付业务清单中对应的第一加权系数,并将所述第一权重系数和所述第一加权系数作为所述待推荐支付业务的第一权重特征。示例性地,所述第一加权系数可以如上所述根据对应的待推荐支付业务在前一个周期被操作的频次而确定。可替代地,本实施例中,所述第一加权系数根据所述待推荐支付业务清单中各待推荐支付业务的排列顺序而定,例如若所述推荐支付业务清单中包括A1、A2、A3三个待推荐支付业务,且依次顺序排列,A1对应的第一加权系数可以为2.0,A2对应的第一加权系数可以为1.8,A3对应的第一加权系数可以为1.5。本实施例中,第一加权系数值越大,可以表示对应的待推荐支付项目的推荐优先级越高,而应被优先推荐。
其次,所述页面支付业务的所述第二权重特征可以通过以下示例性的方案而得到,具体描述如下。
首先,针对每个所述页面支付业务,获取所述页面支付业务的第二权重系数,其中,所述第二权重系数为所述页面支付业务上一次被展示时对应的权重值。关于所述第二权重系数的含义与上述第一权重系数的含义相同,此处不再赘述。
然后,确定所述第二权重系数对应的第二加权系数,并将所述第二权重系数和所述第二加权系数作为所述第二权重特征,其中,每个所述页面支付业务的第二加权系数相同且小于任意一个所述待推荐支付业务的所述第一加权系数,所述待推荐支付业务清单中各待推荐支付业务分别对应的第一加权系数按照各待推荐支付业务的排列顺序依次减小。本实施例中,不同的业务支付业务对应的所述第二加权系数可以相同可以可以不同,本实施例中,可以根据各页面支付业务在页面上的展示顺序依次确定各第二加权系数。
详细地,本实施例中,在步骤S18中,根据每个所述待推荐支付业务的第一权重特征以及每个所述页面支付业务的第二权重特征,在所述支付业务的展示页面上对所述推荐支付业务清单中的待推荐支付业务进行展示,一种可替代的实施方式示例性描述如下。
首先,根据所述第一权重特征确定所述待推荐支付业务的第一展示优先级参数,并根据所述第二权重特征确定所述页面支付业务的第二展示优先级参数。
然后,根据所述第一展示优先级参数和所述第二展示优先级参数确定所述待推荐支付业务的最终展示优先级参数,并根据所述最终展示优先级参数将所述待推荐支付业务清单中的待推荐支付业务在所述支付业务的展示页面进行展示。
示例性地,上述根据所述第一权重特征确定所述待推荐支付业务的第一展示优先级参数,并根据所述第二权重特征确定所述页面支付业务的第二展示优先级参数,具体的实现方式可以示例性描述如下。
首先,针对每个所述待推荐支付业务,将所述待推荐支付业务的第一权重系数与对应的第一加权系数的乘积作为所述第一展示优先级参数。
然后,针对每个所述页面支付业务,将所述页面支付业务的第二权重系数与对应的第二加权系数的乘积作为所述第二展示优先级参数。
在上述的基础上,上述的根据所述第一展示优先级参数和所述第二展示优先级参数确定所述待推荐支付业务的最终展示优先级参数,并根据所述最终展示优先级参数将所述待推荐支付业务清单中的待推荐支付业务在所述支付业务的展示页面进行展示,一种具体的可替代实现方式可以举例描述如下。
首先,可以将各所述待推荐支付业务分别对应的第一展示优先级参数以及各所述页面支付业务的分别对应的第二展示优先级参数按照从大到小的顺序进行排序,根据排序结果将各待推荐支付业务的排序序号作为各待推荐支付业务的最终展示优先级参数以及将各页面支付业务的排序序号作为各页面支付业务的最终展示优先级参数。
然后,将各待推荐支付业务展示在对应的最终展示优先级参数对应的页面位置以及将各页面支付业务展示在各页面支付业务的最终展示优先级参数对应的展示位置,其中,所述支付业务的展示页面包括多个展示位置,每个展示位置具有与一个支付业务的最终展示优先级参数对应的位置标识。
进一步地,在另一种可替代的实施方式中,上述根据所述第一展示优先级参数和所述第二展示优先级参数确定所述待推荐支付业务的最终展示优先级参数,并根据所述最终展示优先级将所述待推荐支付业务在所述支付业务的展示页面进行展示,示例性描述如下。
首先,针对每个待推荐支付业务,根据所述待推荐支付业务的业务标签,从预设的多个业务序列中查询与所述业务标签匹配的第一目标业务序列,并将所述待推荐支付业务加入所述匹配的第一目标业务序列中。其中,每个所述业务序列中包括多个支付业务,每个业务序列对应所述展示页面上的一个展示区域。本实施例中,所述业务标签可以是每个待推荐支付业务的属性ID,可以为根据各支付业务的类型预先配置的属性信息,此处不做具体限定。
然后,当每个待推荐支付业务被添加到对应匹配的第一目标业务序列之后,针对每个第一目标业务序列中的支付业务,按照所述第一展示优先级参数以及所述第二展示优先级参数从大到小的顺序进行排序,将所述第一目标业务序列中各支付业务的排序序号作为所述各支付业务分别对应的最终展示优先级参数。应当理解,当每个待推荐支付业务被添加到对应匹配的第一目标业务序列之后,所述第一目标业务序列中的支付业务则包括被添加的所述待推荐支付业务以及所述第一目标业务序列中原有的支付业务。
最后,在每个所述第一目标业务序列对应的展示区域,按照所述第一目标业务序列中各支付业务的最终展示优先级参数将各支付业务展示在所述展示区域中对应的展示位置。所述展示区域包括多个展示位置,每个展示位置具有与一个支付业务的最终展示优先级参数相对应的位置标识。
示例性地,假如待推荐支付业务包括A1、A2、A3三个业务类型,分别对应的第一权重系数为a1、a2、a3,分别对应的第一加权系数为x1、x2、x3。其中,A1被加入的第一目标业务序列之前具有B1、B2、B3、B4四个页面支付业务,别对应的第二权重系数为b1、b2、b3、b4,分别对应的第二加权系数位y1、y2、y3、y4。经过计算,第一目标业务序列中的各支付业务对应的最终展示优先级参数的排列顺序为[b1*y1、a1*x1、b2*y2、b3*y3、b4*y4]。那么,最终,在所述第一目标业务序列对应的展示区域中,各支付业务的最终展示顺序为:B1、A1、B2、B3、B4。
综上所述的业务推荐方法,可以根据待推荐支付业务其第一权重特征与页面上各页面支付业务对应的第二权重特征进行比较进行待推荐支付业务的推荐展示。由于第一权重特征中加入了比第二权重特征的第二加权系数大的第一加权系数,可以使得待推荐支付业务的推荐展示顺序适当往更重要的展示位置(靠前)移动,达到了业务推荐的目的,同时,还参考了页面上其他重要的页面支付业务的,而不至于在推荐的同时,相较于常用的一刀切的将较为重要的页面支付业务全部放到待推荐支付业务之后的次要位置进行展示,这种推荐方式更符合业务实际。
进一步地,请参阅图6,图6是本发明实施例提供的大数据分析服务器100的方框示意图。本实施例中,所述大数据分析服务器100可以包括大数据分析装置110、机器可读存储介质120以及处理器130。所述机器可读存储介质120和所述处理器130连接,所述机器可读存储介质120用于所述大数据分析装置包括的存储程序、指令或代码,例如所述大数据分析装置110所包括的各种软件功能模块所对应的指令或代码。
本实施例中,请参阅图7,所述大数据分析装置110可以包括聚类获取模块111、拓展用户确定模块112、业务序列生成模块113、拓展业务添加模块114以及推荐业务计算模块115。关于上述各功能模块的具体描述如下。
所述聚类获取模块111,用于获取通过对预先收集的支付用户样本集中每个支付用户对应的用户画像特征进行聚类分析得到的支付用户聚类和通过对预先收集的支付业务样本集中每个支付业务对应的业务画像特征进行聚类分析得到的支付业务聚类。可以理解,关于该聚类获取模块111的更多实现方式及内容,可以参考上述针对步骤S11的相关具体描述,此处不再赘述。
所述拓展用户确定模块112,用于根据目标支付用户对应的用户画像特征,在所述目标支付用户对应的支付用户聚类中获取与所述目标支付用户之间的匹配度满足第一匹配条件的支付用户,作为所述目标支付用户对应的拓展支付用户。可以理解,关于该拓展用户确定模块112的更多实现方式及内容,可以参考上述针对步骤S12的相关具体描述,此处不再赘述。
所述业务序列生成模块113,用于将所述目标支付用户在预设时间周期内操作的支付业务和所述拓展支付用户在预设时间周期内操作的支付业务作为目标支付业务加入目标支付业务序列中。可以理解,关于该业务序列生成模块113的更多实现方式及内容,可以参考上述针对步骤S13的相关具体描述,此处不再赘述。
所述拓展业务添加模块114,用于根据所述目标支付业务对应的业务画像特征,在所述目标支付业务对应的支付业务聚类中获取与所述目标支付业务之间的匹配度满足第二匹配条件的支付业务,作为所述目标支付业务对应的拓展支付业务,添加到所述目标支付业务序列中。可以理解,关于该拓展业务添加模块114的更多实现方式及内容,可以参考上述针对步骤S14的相关具体描述,此处不再赘述。
所述推荐业务计算模块115,用于计算所述目标支付用户与所述目标支付业务序列中每个支付业务之间的匹配概率值,并根据所述匹配概率值在所述目标支付业务序列中选择与所述目标支付用户对应的推荐支付业务,以用于对所述目标支付用户进行支付业务的推荐。可以理解,关于推荐业务计算模块115的更多实现方式及内容,可以参考上述针对步骤S15的相关具体描述,此处不再赘述。
本实施例中,机器可读存储介质120与处理器130可以位于大数据分析服务器100中并分离设置。然而,应当理解的是,机器可读存储介质120也可以是独立于大数据分析服务器100之外,且可以由处理器130通过总线接口来访问。可替换地,机器可读存储介质120也可以集成到处理器130中,例如,可以是高速缓存和/或通用寄存器。
由于本发明实施例提供的大数据分析服务器100是上述方法实施例的另一种实现形式,且大数据分析服务器100可用于执行上述方法实施例提供的各方法步骤,因此其所能获得的技术效果可参考上述方法实施例,在此不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供的方法、系统、或计算机程序产品,可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
综上所述,本发明实施例提供的基于互联网金融的支付大数据分析方法及大数据分析系统,可基于聚类分析及挖掘的方法,实现对目标支付用户进行支付业务的推荐,可以提升用户在使用互联网金融平台时的使用体验。同时,通过聚类的数据挖掘方法,对金融平台可提供的支付业务向用户进行精准推送,可以提升平台各支付业务的使用率,有助于提升平台的用户流量,并改善金融服务质量。
进一步地,本发明实施例根据目标支付用户对应的用户画像特征,在目标支付用户对应的支付用户聚类中获取与目标支付用户之间的匹配度满足第一匹配条件的支付用户,作为目标支付用户对应的拓展支付用户,然后将目标支付用户操作的支付业务和拓展支付用户操作的支付业务作为目标支付业务,用于作为支付业务推荐的数据支撑,使得目标支付业务序列不仅可以包括拓展支付用户操作的支付业务,还可以包括目标支付业务对应的拓展支付业务。如此,即便在支付用户操作的支付业务的数量过少的情况下,也可以通过目标支付业务对应的拓展支付业务增加目标支付业务序列中的支付业务数量,再对目标支付用户进行支付业务的推荐计算,进而可以提高支付业务推荐的准确性以及推荐效果。同时,上述拓展支付用户为与目标支付用户具有相似特征的支付用户,然后在目标支付用户所在的支付用户聚类中查找拓展支付用户,可以缩小索引范围,进而减少相关的计算量,提升运算效率。
以上所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。通常在附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,在附图中提供的本发明的实施例的详细描述并非旨在限制本发明的保护范围,而仅仅是表示本发明的选定实施例。因此,本发明的保护范围应以权利要求的保护范围为准。此外,基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下可获得的多个其它实施例,都应属于本发明保护的范围。

Claims (10)

1.一种基于互联网金融的支付大数据分析方法,其特征在于,应用于所述大数据分析服务器,所述方法包括:
获取通过对预先收集的支付用户样本集中每个支付用户对应的用户画像特征进行聚类分析得到的支付用户聚类和通过对预先收集的支付业务样本集中每个支付业务对应的业务画像特征进行聚类分析得到的支付业务聚类;
根据目标支付用户对应的用户画像特征,在所述目标支付用户对应的支付用户聚类中获取与所述目标支付用户之间的匹配度满足第一匹配条件的支付用户,作为所述目标支付用户对应的拓展支付用户;
将所述目标支付用户在预设时间周期内操作的支付业务和所述拓展支付用户在预设时间周期内操作的支付业务作为目标支付业务加入目标支付业务序列中;
根据所述目标支付业务对应的业务画像特征,在所述目标支付业务对应的支付业务聚类中获取与所述目标支付业务之间的匹配度满足第二匹配条件的支付业务,作为所述目标支付业务对应的拓展支付业务,添加到所述目标支付业务序列中;
计算所述目标支付用户与所述目标支付业务序列中每个支付业务之间的匹配概率值,并根据所述匹配概率值在所述目标支付业务序列中选择与所述目标支付用户对应的推荐支付业务,以用于对所述目标支付用户进行支付业务的推荐。
2.如权利要求1所述的基于互联网金融的支付大数据分析方法,其特征在于,所述根据目标支付用户对应的用户画像特征,在所述目标支付用户对应的支付用户聚类中获取与所述目标支付用户之间的匹配度满足第一匹配条件的支付用户,作为所述目标支付用户对应的拓展支付用户,包括:
将目标支付用户对应的支付用户聚类中所述目标支付用户以外的支付用户,确定为备选支付用户,并获取所述目标支付用户与所述备选支付用户分别对应的用户画像特征;
获取所述目标支付用户与所述备选支付用户之间的交叉支付业务,并根据所述目标支付用户与所述备选支付用户分别对应的用户画像特征中与所述交叉支付业务匹配的业务标签的第一平均操作热度、所述目标支付用户与所述备选支付用户分别对应的用户画像特征中所有业务标签的第二平均操作热度,计算所述目标支付用户与所述备选支付用户之间的支付用户匹配度;所述交叉支付业务是指所述目标支付用户操作的支付业务与所述备选支付用户操作的支付业务之间的交集;
根据所述支付用户匹配度对所有所述备选支付用户进行排序,并根据排序结果选择预设数量个所述备选支付用户确定为满足第一匹配条件的支付用户,作为所述目标支付用户对应的拓展支付用户。
3.如权利要求1所述的基于互联网金融的支付大数据分析方法,其特征在于,所述根据所述目标支付业务对应的业务画像特征,在所述目标支付业务对应的支付业务聚类中获取与所述目标支付业务之间的匹配度满足第二匹配条件的支付业务,作为所述目标支付业务对应的拓展支付业务,包括:
将所述目标支付业务对应的支付业务聚类中所述目标支付业务以外的支付业务,确定为待匹配支付业务,并获取所述目标支付业务与所述待匹配支付业务分别对应的业务画像特征;
获取所述目标支付业务与所述待匹配支付业务之间的业务标签组合,并根据所述目标支付业务与所述待匹配支付业务分别对应的业务画像特征中与所述业务标签组合中匹配的业务标签,计算所述目标支付业务与所述待匹配支付业务之间的支付业务匹配度;所述业务标签组合是指所述目标支付业务对应的支付业务属性与所述待匹配支付业务对应的支付业务属性之间的并集;
根据所述支付业务匹配度对所有所述待匹配支付业务进行排序,根据排序结果选择预设数量个待匹配支付业务确定为满足第二匹配条件的支付业务,并将满足第二匹配条件的支付业务确定为所述目标支付业务对应的拓展支付业务。
4.如权利要求1所述的基于互联网金融的支付大数据分析方法,其特征在于,所述计算所述目标支付用户与所述目标支付业务序列中每个支付业务之间的匹配概率值,并根据所述匹配概率值在所述目标支付业务序列中选择与所述目标支付用户对应的推荐支付业务,包括:
将所述目标支付业务序列中的每个支付业务作为待推荐支付业务;
计算所述目标支付用户与每个所述待推荐支付业务之间的匹配概率值;
按照所述匹配概率值对所有所述待推荐支付业务进行排序,并根据排序结果选择多个待推荐支付业务作为所述目标支付用户对应的推荐支付业务。
5.如权利要求4所述的基于互联网金融的支付大数据分析方法,其特征在于,所述计算所述目标支付用户与每个所述待推荐支付业务之间的匹配概率值,包括:
获取所述拓展支付用户针对所述目标支付业务序列中每个支付业务在所述预设时间周期内的第一操作次数;
根据所述第一操作次数计算每个支付业务被所有拓展支付用户在所述预设时间周期内被操作的第一总次数;
获取所述目标支付用户针对所述目标支付业务序列中每个支付业务在所述预设时间周期内的第二操作次数;
根据所述第二操作次数计算每个支付业务被所述目标支付用户在所述预设时间周期内被操作的第二总次数;
根据所述目标支付业务序列中每个支付业务对应的第一操作次数、第一总次数以及第二操作次数、第二总次数计算得到所述目标支付用户与该支付业务的匹配概率值;具体包括:
计算每个支付业务对应的第一操作次数与第一总次数的比值,得到每个支付业务对应的第一百分比;
计算每个支付业务对应的第二操作次数与第二总次数的比值,得到每个支付业务对应的第二百分比;
获取预设的与第一百分比对应的第一权重以及与第二百分比对应的第二权重;
根据所述第一百分比、第二百分比、第一权重、第二权重,计算得到所述目标支付用户与每个支付业务的匹配概率值,具体包括:将每个支付业务对应的第一百分比与第一权重相乘得到第一概率值,将第二百分比与第二权重相乘得到第二概率值,然后将第一概率值与第二概率值之和作为所述目标支付用户与该支付业务的匹配概率值。
6.如权利要求1所述的基于互联网金融的支付大数据分析方法,其特征在于,还包括:
根据预设的多个第一聚类特征表示,计算所述预先收集的支付用户样本集中每个支付用户对应的用户画像特征与所述多个第一聚类特征表示之间的第一特征差异;
根据所述第一特征差异,确定各用户画像特征与各第一聚类特征表示之间的匹配关系,并将匹配相同的第一聚类特征表示的用户画像特征所对应的支付用户归入相同的支付用户聚类;
根据预设的多个第二聚类特征表示,计算所述预先收集的支付业务样本集中每个支付业务对应的业务画像特征与所述多个第二聚类特征表示之间的第二特征差异;
根据所述第二特征差异,确定各业务画像特征与各第二聚类特征表示之间的匹配关系,并将匹配相同的第二聚类特征表示的业务画像特征所对应的支付业务归入相同的支付业务聚类中。
7.如权利要求1-6任意一项所述的基于互联网金融的支付大数据分析方法,其特征在于,还包括:
根据所述目标支付用户在预设时间周期内操作的支付业务,建立所述目标支付用户对应的业务热度分布;所述业务热度分布包括所述目标支付用户操作的支付业务的对应的操作热度值;
根据预设的时间热度关系函数以及所述业务热度分布计算得到所述目标支付用户操作的支付业务对应的热度特征分布集合;
根据所述热度特征分布集合计算得到所述目标支付用户对应的用户画像特征。
8.如权利要求1-7任意一项所述的基于互联网金融的支付大数据分析方法,其特征在于,还包括:
获取所述目标支付用户在所述预设时间周期内操作的各支付业务的操作热度值;
根据所述操作热度值选择多个支付业务作为待选支付业务;
根据所述待选支付业务在所述预先收集的支付业务样本集对应的支付业务标签集合中获取与所述待选支付业务匹配的的业务标签,并根据所述待选支付业务匹配的业务标签得到所述目标支付业务对应的业务画像特征。
9.如权利要求1所述的基于互联网金融的支付大数据分析方法,其特征在于,将所述目标支付用户在预设时间周期内操作的支付业务和所述拓展支付用户在预设时间周期内操作的支付业务作为目标支付业务加入目标支付业务序列中,包括:
根据所述目标支付用户以及所述拓展支付用户各自的用户信息在所述大数据分析服务器中存储的支付数据中获取与所述用户信息匹配的且在所述预设时间周期内产生的支付数据;
采用预设数据清洗算法对所述支付数据进行数据清洗,去除所述支付数据中的无效数据;
从清洗后的支付数据中提取出该支付数据中包含的所有支付业务的业务标识信息;
对提取出的所有业务标识信息进行去重处理,将去重后的业务标识加入预设的数据序列中,得到所述目标支付业务序列。
10.一种大数据分析系统,其特征在于,包括大数据分析服务器以及与所述大数据分析服务器通信连接的分别与多个支付用户对应的多个支付终端,所述大数据分析服务器包括大数据分析装置、处理器以及机器可读存储介质,所述机器可读存储介质和所述处理器连接,所述机器可读存储介质用于所述大数据分析装置包括的存储程序、指令或代码,其中,所述大数据分析装置包括:
聚类获取模块,用于获取通过对预先收集的支付用户样本集中每个支付用户对应的用户画像特征进行聚类分析得到的支付用户聚类和通过对预先收集的支付业务样本集中每个支付业务对应的业务画像特征进行聚类分析得到的支付业务聚类;
拓展用户确定模块,用于根据目标支付用户对应的用户画像特征,在所述目标支付用户对应的支付用户聚类中获取与所述目标支付用户之间的匹配度满足第一匹配条件的支付用户,作为所述目标支付用户对应的拓展支付用户;
业务序列生成模块,用于将所述目标支付用户在预设时间周期内操作的支付业务和所述拓展支付用户在预设时间周期内操作的支付业务作为目标支付业务加入目标支付业务序列中;
拓展业务添加模块,用于根据所述目标支付业务对应的业务画像特征,在所述目标支付业务对应的支付业务聚类中获取与所述目标支付业务之间的匹配度满足第二匹配条件的支付业务,作为所述目标支付业务对应的拓展支付业务,添加到所述目标支付业务序列中;以及
推荐业务计算模块,用于计算所述目标支付用户与所述目标支付业务序列中每个支付业务之间的匹配概率值,并根据所述匹配概率值在所述目标支付业务序列中选择与所述目标支付用户对应的推荐支付业务,以用于对所述目标支付用户进行支付业务的推荐。
CN202011604964.9A 2020-12-30 2020-12-30 基于互联网金融的支付大数据分析方法及大数据分析系统 Active CN112765230B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110809275.XA CN113590679A (zh) 2020-12-30 2020-12-30 基于互联网金融的聚类分析方法以及大数据分析服务器
CN202011604964.9A CN112765230B (zh) 2020-12-30 2020-12-30 基于互联网金融的支付大数据分析方法及大数据分析系统
CN202110808598.7A CN113590678A (zh) 2020-12-30 2020-12-30 基于互联网金融的画像分析方法以及大数据分析服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011604964.9A CN112765230B (zh) 2020-12-30 2020-12-30 基于互联网金融的支付大数据分析方法及大数据分析系统

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CN202110808598.7A Division CN113590678A (zh) 2020-12-30 2020-12-30 基于互联网金融的画像分析方法以及大数据分析服务器
CN202110809275.XA Division CN113590679A (zh) 2020-12-30 2020-12-30 基于互联网金融的聚类分析方法以及大数据分析服务器

Publications (2)

Publication Number Publication Date
CN112765230A true CN112765230A (zh) 2021-05-07
CN112765230B CN112765230B (zh) 2021-09-21

Family

ID=75697346

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202110809275.XA Withdrawn CN113590679A (zh) 2020-12-30 2020-12-30 基于互联网金融的聚类分析方法以及大数据分析服务器
CN202110808598.7A Withdrawn CN113590678A (zh) 2020-12-30 2020-12-30 基于互联网金融的画像分析方法以及大数据分析服务器
CN202011604964.9A Active CN112765230B (zh) 2020-12-30 2020-12-30 基于互联网金融的支付大数据分析方法及大数据分析系统

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN202110809275.XA Withdrawn CN113590679A (zh) 2020-12-30 2020-12-30 基于互联网金融的聚类分析方法以及大数据分析服务器
CN202110808598.7A Withdrawn CN113590678A (zh) 2020-12-30 2020-12-30 基于互联网金融的画像分析方法以及大数据分析服务器

Country Status (1)

Country Link
CN (3) CN113590679A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434770A (zh) * 2021-07-08 2021-09-24 广州康乾信息科技有限公司 电子商务与大数据结合的业务画像分析方法及系统
CN114968246A (zh) * 2022-08-01 2022-08-30 深圳市明源云科技有限公司 数据分析组件生成方法、设备及计算机可读存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114417405B (zh) * 2022-01-11 2022-10-14 中软数智信息技术(武汉)有限公司 一种基于人工智能的隐私业务数据分析方法及服务器

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685458A (zh) * 2008-09-27 2010-03-31 华为技术有限公司 一种基于协同过滤的推荐方法和系统
CN105095256A (zh) * 2014-05-07 2015-11-25 阿里巴巴集团控股有限公司 基于用户之间相似度进行信息推送的方法及装置
US20160089608A1 (en) * 2014-09-30 2016-03-31 International Business Machines Corporation Computer-implemented method for determining game mechanics in business process gamification
US20180096410A1 (en) * 2015-05-25 2018-04-05 Alibaba Group Holding Limited Method and Apparatus for Providing Matching Information of Business Object
CN108052639A (zh) * 2017-12-21 2018-05-18 中国联合网络通信集团有限公司 基于运营商数据的行业用户推荐方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685458A (zh) * 2008-09-27 2010-03-31 华为技术有限公司 一种基于协同过滤的推荐方法和系统
CN105095256A (zh) * 2014-05-07 2015-11-25 阿里巴巴集团控股有限公司 基于用户之间相似度进行信息推送的方法及装置
US20160089608A1 (en) * 2014-09-30 2016-03-31 International Business Machines Corporation Computer-implemented method for determining game mechanics in business process gamification
US20180096410A1 (en) * 2015-05-25 2018-04-05 Alibaba Group Holding Limited Method and Apparatus for Providing Matching Information of Business Object
CN108052639A (zh) * 2017-12-21 2018-05-18 中国联合网络通信集团有限公司 基于运营商数据的行业用户推荐方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冉蹬: "基于用户画像的手机游戏用户个性化内容推荐研究", 《中国优秀硕士学位论文全文库》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434770A (zh) * 2021-07-08 2021-09-24 广州康乾信息科技有限公司 电子商务与大数据结合的业务画像分析方法及系统
CN114968246A (zh) * 2022-08-01 2022-08-30 深圳市明源云科技有限公司 数据分析组件生成方法、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN112765230B (zh) 2021-09-21
CN113590678A (zh) 2021-11-02
CN113590679A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN112765230B (zh) 基于互联网金融的支付大数据分析方法及大数据分析系统
CN108960719B (zh) 选品方法和装置以及计算机可读存储介质
CN110008973B (zh) 一种模型训练方法、基于模型确定目标用户的方法及装置
CN110008397B (zh) 一种推荐模型训练方法及装置
KR101782120B1 (ko) 상담정보 및 군집화에 기반한 금융상품추천장치 및 방법
CN111736940A (zh) 智能柜台的业务界面展示方法及装置
CN111861605A (zh) 业务对象推荐方法
CN111680213B (zh) 信息推荐方法、数据处理方法及装置
CN112328869A (zh) 一种用户贷款意愿的预测方法、装置及计算机系统
JPH06119309A (ja) 購入見込み度合予測方法及び顧客管理システム
CN118193806A (zh) 一种目标检索方法、装置、电子设备及存储介质
CN113327132A (zh) 多媒体推荐方法、装置、设备及存储介质
CN113792134A (zh) 一种基于数字孪生技术的用户服务方法及系统
CN113205338A (zh) 基于人工智能的外汇业务处理方法及装置
CN111553685B (zh) 确定交易路由通道的方法、装置、电子设备和存储介质
CN112699168B (zh) 基于互联网金融和大数据的业务推荐方法及系统
CN108984777B (zh) 客户服务方法、装置和计算机可读存储介质
CN116362895A (zh) 理财产品推荐方法、装置及存储介质
CN115167965A (zh) 交易进度条的处理方法及装置
CN115018576A (zh) 金融数据处理方法、装置、设备及存储介质
CN113297472A (zh) 发布视频内容、商品对象信息的方法、装置及电子设备
CN112597376A (zh) 信息查询方法及装置
CN117217852B (zh) 一种基于行为识别购买意愿度预测方法及装置
CN113592606B (zh) 基于多重决策的产品推荐方法、装置、设备及存储介质
CN116383735A (zh) 推荐模型的推荐方法、推荐设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210830

Address after: 518000 room 506, floor 5, block C, building 5, Shenzhen software industry base, high tech Zone, Nanshan District, Shenzhen, Guangdong

Applicant after: SHENZHEN QIANHE INFORMATION TECHNOLOGY Co.,Ltd.

Address before: Room 619-621, 6th floor, No.13 office building, Jinding Science Park, 690 Xuefu Road, Wuhua District, Kunming, Yunnan 650000

Applicant before: Chen Fei

GR01 Patent grant
GR01 Patent grant