CN110335061B - 交易模式画像建立方法、装置、介质及电子设备 - Google Patents
交易模式画像建立方法、装置、介质及电子设备 Download PDFInfo
- Publication number
- CN110335061B CN110335061B CN201910435803.2A CN201910435803A CN110335061B CN 110335061 B CN110335061 B CN 110335061B CN 201910435803 A CN201910435803 A CN 201910435803A CN 110335061 B CN110335061 B CN 110335061B
- Authority
- CN
- China
- Prior art keywords
- cluster
- feature
- account
- clusters
- accounts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本公开涉及用户画像领域,揭示了一种交易模式画像建立方法、装置、介质及电子设备。该方法包括:获取包括多个中间账户和与每一中间账户对应的特征值组的样本集;根据特征值组,在预设的特征组中,获取聚类特征;获取与聚类特征对应的特征值,作为聚类特征值;基于聚类特征值,对中间账户进行聚类,将中间账户划分为多个簇;根据簇内中间账户的聚类特征值,确定簇对应的交易模式;当接收到对目标中间账户的交易模式画像建立请求,获取目标中间账户的特征值组;基于目标中间账户特征值组中与聚类特征对应的特征值和每一簇对应的交易模式,确定目标中间账户的交易模式。此方法下,保证了交易模式画像的精度,提高了刻画交易模式画像的细致程度。
Description
技术领域
本公开涉及用户画像技术领域,特别涉及一种交易模式画像建立方法、装置、介质及电子设备。
背景技术
随着移动支付等移动互联网应用的普及,利用数据对为用户建立交易模式画像变得愈发重要,好的交易模型画像可以帮助互联网公司了解用户偏好,实现精细化运营,提高服务水平。
在现有技术的实现中,仅仅针对的是用户注册时提交的数据进行分析,比如年龄、性别、职业等数据。由于这些数据可能与互联网公司的实际业务关联性不大,导致这些数据在帮助提升实际业务方面作用不大。
现有技术的缺陷在于,利用现有的大数据分析方法对用户的交易习惯刻画得不够细致,为用户建立的交易模式画像太过粗糙,交易模式画像对用户特征的表达精度较低。
发明内容
在用户画像技术领域,为了解决上述技术问题,本公开的目的在于提供一种交易模式画像建立方法、装置、介质及电子设备。
根据本申请的一方面,提供了一种交易模式画像建立方法,所述方法包括:
获取包括多个中间账户以及与每一中间账户对应的特征值组的样本集,其中,所述特征值组包括多个特征值,与每一中间账户对应的特征值组中的每一特征值与预设的特征组中的每一特征对应;
根据与各中间账户对应的特征值组,在预设的特征组中的多个特征中,获取聚类特征;
在与各中间账户对应的特征值组中,获取与所述聚类特征对应的特征值,作为聚类特征值;
基于针对所述样本集中各中间账户获取的聚类特征值,对所述多个中间账户进行聚类,以将所述多个中间账户划分为多个簇,其中,每一中间账户仅属于一个簇;
根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式;
当接收到对目标中间账户的交易模式画像建立请求,获取所述目标中间账户的特征值组,其中,所述特征值组中的每一特征值与所述预设的特征组中的每一特征对应;
基于所述目标中间账户的特征值组中与所述聚类特征对应的特征值以及所述多个簇中每一簇对应的交易模式,确定所述目标中间账户的交易模式。
根据本申请的另一方面,提供了一种交易模式画像建立装置,所述装置包括:
第一获取模块,被配置为获取包括多个中间账户以及与每一中间账户对应的特征值组的样本集,其中,所述特征值组包括多个特征值,与每一中间账户对应的特征值组中的每一特征值与预设的特征组中的每一特征对应;
第二获取模块,被配置为根据与各中间账户对应的特征值组,在预设的特征组中的多个特征中,获取聚类特征;
第三获取模块,被配置为在与各中间账户对应的特征值组中,获取与所述聚类特征对应的特征值,作为聚类特征值;
聚类模块,被配置为基于针对所述样本集中各中间账户获取的聚类特征值,对所述多个中间账户进行聚类,以将所述多个中间账户划分为多个簇,其中,每一中间账户仅属于一个簇;
第一确定模块,被配置为根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式;
第四获取模块,被配置为当接收到对目标中间账户的交易模式画像建立请求,获取所述目标中间账户的特征值组,其中,所述特征值组中的每一特征值与所述预设的特征组中的每一特征对应;
第二确定模块,被配置为基于所述目标中间账户的特征值组中与所述聚类特征对应的特征值以及所述多个簇中每一簇对应的交易模式,确定所述目标中间账户的交易模式。
根据本申请的另一方面,提供了一种计算机可读程序介质,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行如前所述的方法。
根据本申请的另一方面,提供了一种电子设备,所述电子设备包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如前所述的方法。
本发明的实施例提供的技术方案可以包括以下有益效果:
本发明所提供的交易模式画像建立方法包括如下步骤:获取包括多个中间账户以及与每一中间账户对应的特征值组的样本集,其中,所述特征值组包括多个特征值,与每一中间账户对应的特征值组中的每一特征值与预设的特征组中的每一特征对应;根据与各中间账户对应的特征值组,在预设的特征组中的多个特征中,获取聚类特征;在与各中间账户对应的特征值组中,获取与所述聚类特征对应的特征值,作为聚类特征值;基于针对所述样本集中各中间账户获取的聚类特征值,对所述多个中间账户进行聚类,以将所述多个中间账户划分为多个簇,其中,每一中间账户仅属于一个簇;根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式;当接收到对目标中间账户的交易模式画像建立请求,获取所述目标中间账户的特征值组,其中,所述特征值组中的每一特征值与所述预设的特征组中的每一特征对应;基于所述目标中间账户的特征值组中与所述聚类特征对应的特征值以及所述多个簇中每一簇对应的交易模式,确定所述目标中间账户的交易模式。
此方法下,通过首先利用获取样本集中各中间账户的聚类特征值对中间账户进行聚类,将聚类得到的每一簇包含的中间账户的共同特性暴露了出来,然后根据簇中的聚类特征值为簇确定交易模式,将簇的特点与交易模式关联了起来,最后根据簇对应的交易模式,确定目标中间账户的交易模式,使得建立的交易模式画像对目标中间账户的用户实现了更为细致的刻画,提高了交易模式画像对用户特征的表达精度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种交易模式画像建立方法的应用场景示意图;
图2是根据一示例性实施例示出的一种交易模式画像建立方法的流程图;
图3是根据图2对应实施例示出的一实施例的步骤240和步骤270的细节的流程图;
图4是根据一示例性实施例示出的一种交易模式画像建立装置的框图;
图5是根据一示例性实施例示出的一种实现上述交易模式画像建立方法的电子设备示例框图;
图6是根据一示例性实施例示出的一种实现上述交易模式画像建立方法的计算机可读存储介质。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。
本公开的实施终端可以是任何具有运算、处理以及通信功能的设备,该设备可与外部设备相连,用于接收或者发出信息,可以是便携移动设备,例如智能手机、平板电脑、笔记本电脑、PDA(Personal Digital Assistant)等,也可以是固定式设备,例如,计算机设备、现场终端、台式电脑、服务器、工作站等,还可以是多个设备的集合,比如服务器集群或者云计算的物理基础设施等。
优选地,本公开的实施终端可以为服务器、服务器集群或者云计算的物理基础设施。
图1是根据一示例性实施例示出的一种交易模式画像建立方法的应用场景示意图。如图1所示,包括服务器和与该服务器之间通过通信链路相连的多个终端,这些终端可以包括:笔记本电脑、智能手机、平板电脑、台式计算机等,其中,连接服务器和各个终端的通信链路可以是多种多样的,例如可以是有线通信链路,比如基于光纤、同轴电缆、双绞线等媒介建立的通信链路,还可以是无线通信线路,例如蜂窝网络、无线局域网下的通信链路。各个终端和服务器进行连接后,可以建立B/S(浏览器/服务器)或者C/S(客户端/服务器)形式的架构网络;在该架构下,各个终端和服务器进行通信时,会产生各种数据,这些数据中有一部分会存储在服务器或者服务器控制的数据库之中;当用户使用终端第一次登录服务器时,服务器会为其分配一个账户,之后当用户的终端与服务器进行交互产生数据要存储在服务器时,会将这些数据与该账户对应存储。比如,当用户使用智能手机安装了支付宝App并第一次使用该App时,支付宝App的服务器会为该用户分配一个账号,与该账号有一个对应的余额支付账户,该账号下与支付宝App的服务器进行交互的各种数据会与该账号对应保存到支付宝App的服务器上,这些数据表现了用户的行为,能够在一定程度上刻画用户特征。所以本公开的目的就在于,对账号的数据进行聚类处理,然后根据聚类结果为账号的用户建立交易模式画像,其中交易模式画像可以是对与有金钱行为的账号对应的用户画像的一种称呼,是一种与交易有关的用户画像,本质上是通过判断出账号的交易模式从而得到用户画像。通过建立交易模式画像可以实现精准营销,还可以在交易模式画像基础上挖掘潜在的商业价值。
图2是根据一示例性实施例示出的一种交易模式画像建立方法的流程图。如图2所示,包括以下步骤:
步骤210,获取包括多个中间账户以及与每一中间账户对应的特征值组的样本集。
其中,所述特征值组包括多个特征值,与每一中间账户对应的特征值组中的每一特征值与预设的特征组中的每一特征对应。
中间账户是银行卡账户之外的账户,可以是理财账户,比如平安金管家平台上的旺财账户、支付宝的余额宝账户、微信的零钱通账户等,还可以是仅有中间转存功能的账户,比如支付宝的余额账户等,每一中间账户可以是通过邮箱、身份证号、手机号等用户身份标识来实现唯一的标识的。本公开对中间账户的实际形式不作限定。与每一中间账户对应的特征值组中的每一特征值与预设的特征组中的每一特征对应是指,与每一中间账户对应的特征值组中特征值和预设的特征组中的特征是一一对应的关系,与每一中间账户对应的特征值组中的特征值的数目都与预设的特征组中的特征的数目一致,对于预设的特征组中的任意一个特征,所有的特征值组中都有唯一的一个特征值与该特征对应。
特征可以是对任何与中间账户有关的某一维度或者方面的性质的数据的描述,也可以将特征称之为属性;而特征值则是特征的取值,是一个中间账户在相应特征上的实际数据的内容。特征值可以是是中间账户在使用过程中直接产生的数据,也可以是在中间账户直接产生的数据的基础上统计得出的数据,中间账户的每一特征值能在某一层面上表现该中间账户的特征的具体指标或者能用数值化的形式表现不同中间账户的关系。
在一个实施例中,获取中间账户的特征值组是有时间范围限制的,比如获取中间账户由在固定时间段产生的特征值构成的特征值组,例如一个特征值为中间账户转出金额,因为每一时间段的中间账户转出金额可能都是不同的,所以要为特征值的获取限定时间范围。
在一个实施例中,获取中间账户的特征值组的时间范围是当前时间之前所有时间范围内的产生特征值构成的特征值组。本实施例的好处在于,提高了特征值组的获取广度和覆盖范围。
在一个实施例中,获取中间账户的特征值组的时间范围是预定时间范围内,例如当前时间前一周时间范围内。这样做的好处在于,由于不同账号的注册时间不同,所以即使是都是获取中间账户在历史上所有时间段,不同中间账户的特征值组差异也会是很显著的,这样做的好处在于,避免了由于注册时间不同导致的特征值组差异过大的缺陷,提高了获取的特征值组的准确率。
在一个实施例中,中间账户是与手机号对应关联的,即每一手机号对应一个中间账户。
在一个实施例中,特征组是在多个中间账户产生的特征值组的基础上统计出来的。比如,与特征值组中的每一特征值对应的特征是事先已知的,针对与一个中间账户对应的特征值组中的每一特征值对应的特征,当所有中间账户的特征值组中都有与该特征对应的特征值时,就将该特征提取出来,直到针对与该中间账户对应的特征值组中的每一特征值对应所有特征都进行了判断,并根据判断结果相应地提取出了特征,此时获得的所有特征就可以组成特征组。
在一个实施例中,中间账户为平安金管家平台上的旺财账户,中间账户对应的特征值组可以包括下列特征值:手机号对应的旺财账户转入转出的次数之和、手机号对应的旺财账户转入次数、手机号对应的旺财账户转出次数、手机号对应的旺财账户转入转出的金额之和、手机号对应的旺财账户转入金额、手机号对应的旺财账户转出金额、旺财账户收到银行卡转账的次数、手机号对应的旺财账户收到群红包的次数、手机号对应旺财账户从活动收到红包的次数、手机号对应的旺财账户向外转账的次数、手机号对应旺财账户发红包的次数、旺财账户转出方向为电商平台的次数、资金转出方向为保险投资的次数、银行卡转入旺财账户的金额、旺财账户从群中获得的红包金额之和、手机号对应旺财账户从活动收到红包的金额之和、旺财转出的金额之和、手机号对应旺财账户发红包的金额、旺财账户转出方向为电商平台的金额、资金转出方向为保险投资的金额、银行卡转入旺财账户的次数与旺财账户收到所有转账的次数之比、旺财账户通过群红包方式收到进账的次数与旺财账户收到进账的次数之比、旺财账户通过活动收到进账的次数与旺财账户收到进账的次数之比、手机号对应旺财账户的出账次数与手机号对应所有账户的出账次数之比、旺财账户通过发红包方式转账的次数与旺财账户所有向外转账的次数之比、旺财账户向外转账时转出方向为电商平台的次数与旺财账户向外转账的所有次数之比、旺财账户向外转账时转出方向为保险投资的次数与旺财账户向外转账的所有次数之比、银行卡转入旺财账户的金额和旺财账户收到的所有进账金额之比、旺财账户从群红包收到的进账金额和旺财账户收到的所有进账金额之比、旺财账户通过活动收到的进账金额和旺财账户收到的所有进账金额之比、手机号对应旺财账户的出账金额与手机号对应所有账户的出账金额之比、旺财账户通过发红包方式转账的金额与旺财账户所有向外转账的金额之比、旺财账户向外转账时转出方向为电商平台的金额与旺财账户向外转账的所有金额之比、旺财账户向外转账时转出方向为保险投资的金额与旺财账户向外转账的所有金额之比。
应当理解的是,由于特征值只有与相应的特征关联才有意义,因此,上述列举的中间账户对应的特征值组中的特征值是仅为方便描述特征值本身而做出的类似特征的描述,因此上述的特征值也可以等同于预设的特征组。
在另一个实施例中,中间账户为平安金管家平台上的旺财账户,中间账户对应的特征值组可以包括下列特征值:每次手机号对应的旺财账户转入转出的记录、每次手机号对应的旺财账户转入记录等。可以看出的是,本实施例与前述实施例中数据项的不同在于,两者特征值的形式不同,在本实施例中,提供的特征值是尚未经过加工的原始值,而在前述实施例中,提供的特征值是原始值基础上经过处理加工后的得到的值。经过处理加工后的值固然可以直接应用于下述的技术方案,但如果利用本实施例中的原始值的特征值,对其进一步处理计算,也可以应用于下述的技术方案,因此本公开对特征值组中特征值的具体内容以及表现形式不作任何限定,本公开的保护范围也不应因此而受到任何限制。
步骤220,根据与各中间账户对应的特征值组,在预设的特征组中的多个特征中,获取聚类特征。
在一个实施例中,根据与各中间账户对应的特征值组,在预设的特征组中的多个特征中,获取聚类特征,包括:针对预设的特征组中的每一特征,获取所有中间账户对应的特征值组中与该特征对应的特征值的方差;对所有特征按照针对各特征获取的特征值的方差从大到小的顺序排序;获取排序在前预定数目的特征,作为聚类特征。由于特征对应的特征值方差越大,说明特征值变化越剧烈,即对应的特征对各中间账户的分类作用越大。
在一个实施例中,根据与各中间账户对应的特征值组,在预设的特征组中的多个特征中,获取聚类特征,包括:针对预设的特征组中的每一特征,获取所有中间账户对应的特征值组中与该特征对应的特征值的方差;对所有特征按照针对各特征获取的特征值的方差从小到大的顺序排序;获取参与排序的特征的数目;计算90%与所述数目的乘积;获取小于所述乘积的最大整数;获取排序在排序为所述最大整数的特征之前的预定数目个特征,聚类特征。这样做的好处在于,降低了由于个别特征对应的特征值出现极端值导致形成了冒尖的方差,进而使得获取的特征对应的特征值区分度较低的可能性。
在一个实施例中,获取的聚类特征可以包括下列特征:银行卡转入旺财账户的次数与旺财账户收到所有转账的次数之比、旺财账户通过群红包方式收到进账的次数与旺财账户收到进账的次数之比、旺财账户通过活动收到进账的次数与旺财账户收到进账的次数之比、手机号对应旺财账户的出账次数与手机号对应所有账户的出账次数之比、旺财账户通过发红包方式转账的次数与旺财账户所有向外转账的次数之比、旺财账户向外转账时转出方向为电商平台的次数与旺财账户向外转账的所有次数之比、旺财账户向外转账时转出方向为保险投资的次数与旺财账户向外转账的所有次数之比,则与每一数据项对应的聚类变量值可以为每一数据项的值。
步骤230,在与各中间账户对应的特征值组中,获取与所述聚类特征对应的特征值,作为聚类特征值。
聚类特征值是特征值中的特例,与每一中间账户对应的特征值组中的每一特征值都与一个特征对应,而聚类特征值是与每一中间账户对应的特征值组的特征值中与所述聚类特征对应的特征值。
步骤240,基于针对所述样本集中各中间账户获取的聚类特征值,对所述多个中间账户进行聚类,以将所述多个中间账户划分为多个簇。
其中,每一中间账户仅属于一个簇。
簇是对中间账户在逻辑上的划分,每一簇与一个集合类似。通过将多个中间账户划归为多个簇,可以使得每一簇中的中间账户的有近似的特点,因而可以以簇为单位来为簇中的中间账户勾勒画像。
在一个实施例中,通过下列方式对中间账户的聚类特征值进行聚类:所述预设的特征组中的每一特征按照预定顺序排序,首先根据各聚类特征在预设的特征组中的排序,对每一中间账户的聚类特征值进行排序;将各中间账户的排序后的聚类特征值作为一个坐标,将其看作多维空间的一个数据点,使用DBSCAN(Density-Based Spatial Clusteringof Applications with Noise,基于密度的聚类算法)算法进行聚类。首先确定聚类扫描半径r和最小包含点数m,标记所有点为未访问,从一个没有被访问过的任意数据点开始,先标记该点为已访问,判断以这个点为中心,r为聚类扫描半径的范围内包含的点的数量是否大于或等于m;如果大于或等于m,则创建一个簇,将所述中心点加入该簇,获取该中心点的以r为聚类扫描半径的范围内除了该中心点的所有数据点,加入到对象集合中;在对象集合任取一数据点,判断该点是否已访问,如果否,标记该点为已访问,然后以这个点为中心,r为聚类扫描半径的范围内包含的点的数量是否大于或等于m;如果是,判断该点是否属于一个簇;如果否,就将该点加入所述簇之中;不断访问所有没有被标记的数据点,并执行上述步骤,直到所有数据点都被标记为已访问。本实施例的好处在于,聚类速度快,可以发现任意形状的空间聚类,且不需要输入簇的数目。步骤250,根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式。
在一个实施例中,根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式,包括:
针对属于所述多个簇中每一簇的中间账户的聚类特征值,获取所述聚类特征值所满足的条件,所述条件与交易模式对应;
根据所述聚类特征值所满足的条件,确定对应的所述簇的交易模式。
在一个实施例中,所述条件是预设的规则条件。
例如,一个预设的规则条件可以是旺财账户向外转账时转出方向为电商平台的次数与旺财账户向外转账的所有次数之比大于或等于0.9。当簇中每一中间账户的聚类特征值都满足该条件时,就确认该簇的交易模式为电商消费型。
在一个实施例中,事先根据经验建立了条件和交易模式的对应关系表,通过查表获得与所述聚类变量值所满足的条件对应的交易模式,作为对应的所述簇的交易模式。
在一个实施例中,所述条件包括条件阈值,在根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式之后,所述方法还包括:针对每一交易模式的簇,为所述簇中的中间账户设定簇标记;获取初始条件阈值;基于所述初始条件阈值建立初始条件;针对所述多个簇中的每一簇,获取满足所述初始条件的中间账户的数目;确定交易模式为和与所述初始条件对应的条件对应的交易模式的簇,作为目标簇;获取所述目标簇的所述数目,为第一数目,获取所述多个簇中除所述目标簇之外的簇的所述数目之和,作为第二数目;确定所述第二数目和所述第一数目的比值,作为第一比值;当所述第一比值小于预定阈值,将所述多个簇中除所述目标簇之外的簇中满足所述初始条件的中间账户的簇标记置为所述目标簇中已包含的中间账户的簇标记。
簇标记是用于标记簇对应的交易模式的符号类型的标记。例如交易模式包括电商消费类型、保险投资类型等,则可以将电商消费类型标记为1,将保险投资类型标记为2。
初始条件阈值是用于设定条件的数值,根据该数值可以判断一个条件是否成立。可以根据聚类特征和初始条件阈值建立初始条件。比如初始条件阈值为0.9,则对应建立的初始条件可以为银行卡转入旺财账户的次数与旺财账户收到所有转账的次数之比大于或等于0.9。
例如,一个聚类特征为:旺财账户向外转账时转出方向为保险投资的次数与旺财账户向外转账的所有次数之比,对应建立的初始条件为旺财账户向外转账时转出方向为保险投资的次数与旺财账户向外转账的所有次数之比大于0.9,对应的交易模式为保险投资类型。
中间账户满足初始条件,说明该中间账户本应该被聚到目标簇中,但被误聚到了其他簇之中,所以本实施例的好处在于,在某些情况下,对中间账户聚类得到的簇可能不够精准,导致为中间账户建立的交易模式画像与中间账户的实际情况不够切合,本实施例为对聚类结果进行修正提供了可能,提高了建立的交易模式画像的准确度。
在一个实施例中,在当所述第一比值小于预定阈值,将所述多个簇中除所述目标簇之外的簇中满足所述初始条件的中间账户的簇标记置为所述目标簇中已包含的中间账户的簇标记之后,所述方法还包括:当所述第一比值不小于预定阈值,每次将初始条件阈值改变预定步长,基于改变预定步长后的初始条件阈值,重新确定所述第二数目和所述第一数目的比值,作为第二比值;如果所述第二比值小于预定阈值,将所述多个簇中除所述目标簇之外的簇中满足所述初始条件的中间账户的簇标记置为所述目标簇中已包含的中间账户的簇标记。
当第一比值不小于预定阈值时,说明以该阈值作为修正簇标记的基准是不够可靠的,所以本实施例的好处在于,通过对初始条件阈值多次改变预定步长,然后确定能否对中间账户所处的簇进行修正,使得为中间账户建立的交易模式画像更为精准。
在一个实施例中,根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式,包括:
针对每一聚类特征,确定每一簇内所有中间账户的与该聚类特征对应的聚类特征值的平均值;然后根据每一聚类特征,判断各个簇的该聚类特征对应的聚类特征值的平均值在所有簇之间的大小关系;根据判断结果确定每一簇对应的交易模式。
在一个实施例中,聚类特征值以及对应的聚类特征都是预定数目个,对应地,针对中间账户聚类所得到的簇的数目也是预定数目。
比如,在一个实施例中,获取的聚类特征分别是:银行卡转入旺财账户的次数与旺财账户收到所有转账的次数之比、旺财账户通过群红包方式收到进账的次数与旺财账户收到进账的次数之比、旺财账户通过活动收到进账的次数与旺财账户收到进账的次数之比、手机号对应旺财账户的出账次数与手机号对应所有账户的出账次数之比、旺财账户通过发红包方式转账的次数与旺财账户所有向外转账的次数之比、旺财账户向外转账时转出方向为电商平台的次数与旺财账户向外转账的所有次数之比、旺财账户向外转账时转出方向为保险投资的次数与旺财账户向外转账的所有次数之比;因此对中间账户进行聚类时可以针对每一中间账户利用对应的上述的七个聚类特征对应的聚类特征值进行聚类,可以设定聚成7个类,则每一类中各个中间账户的各个聚类特征值相比其余6个类来说是有特定的大小关系的,利用这些大小关系可以得到每一类的交易模式。例如,一个聚类特征为:旺财账户向外转账时转出方向为保险投资的次数与旺财账户向外转账的所有次数之比,针对每一聚类得到的每一簇,获取该簇下该聚类特征对应的聚类特征值的平均值;然后对所有簇获得的与该聚类特征对应的聚类特征值的平均值从大到小进行排序,获得排序在最前的簇,确定该簇的交易模式为保险投资类型。
在一个实施例中,在本步骤之后,该方法还包括:针对所述多个簇中的每一簇,确定为确定该簇的交易模式所根据的聚类特征值;针对为所述多个簇中的每一簇确定出的聚类特征值,对所有簇中每一簇的多个中间账户,按照所述聚类特征值从大到小进行排序;根据所述排序,确定所述多个簇中每一簇对应的交易模式的信任度。
在一个实施例中,确定簇的交易模式所根据的聚类特征值对应的簇为所述聚类特征值的基准簇,所述根据所述排序,确定所述多个簇中每一簇对应的交易模式的信任度,包括:在所述基准簇内的按照与所述基准簇对应的所述聚类特征值从大到小进行排序的多个中间账户中,获取排序满足预定条件的中间账户,作为信任度基准中间账户;获取在所述基准簇内的按照与所述基准簇对应的所述聚类特征值从大到小进行排序的多个中间账户的所述信任度基准中间账户的排序,作为基准排序;针对所述多个簇中除所述基准簇之外的每一簇中的多个中间账户按照与所述基准簇对应的所述聚类特征值从大到小进行排序的多个中间账户中的排序,确定若将所述信任度基准中间账户加入到所述多个中间账户之中并按照所述聚类特征值从大到小重新进行排序后,所述信任度基准中间账户的排序,作为参考排序;基于所述多个簇中除所述基准簇之外的每一簇对应的参考排序和所述基准排序,确定所述基准簇对应的交易模式的信任度。
在本实施例中,通过为每一簇确定信任度,可以获得为簇内中间账户建立的用户画像可靠性依据。
步骤260,当接收到对目标中间账户的交易模式画像建立请求,获取所述目标中间账户的特征值组。
其中,所述特征值组中的每一特征值与所述预设的特征组中的每一特征对应。
目标中间账户的特征值组与中间账户的特征值组类似,其中的每一特征值都与所述预设的特征组中的每一特征对应,目标中间账户与获取的样本集中的中间账户的区别在于目标中间账户的交易模式尚未确定,目标中间账户可以是新产生的账户,也可以是已有的账户。
接收到的对目标中间账户的交易模式画像建立请求可以是传统意义上的基于各种网络协议的请求,比如可以是HTTP/HTTPS协议下的请求,还可以是根据指令主动触发的请求,比如程序跳转到特定的代码然后需要执行建立目标中间账户的交易模式画像的操作。
在一个实施例中,每一中间账户的标识与对应的特征值组对应存储在数据库中,接收到的对目标中间账户的交易模式画像建立请求中携带有目标中间账户的标识,利用所述标识在数据中获取与所述标识对应存储的特征值组,作为目标中间账户的特征值组。
步骤270,基于所述目标中间账户的特征值组中与所述聚类特征对应的特征值以及所述多个簇中每一簇对应的交易模式,确定所述目标中间账户的交易模式。
在一个实施例中,基于所述目标中间账户的特征值组中与所述聚类特征对应的特征值以及所述多个簇中每一簇对应的交易模式,确定所述目标中间账户的交易模式,包括:基于所述目标中间账户的特征值组中与所述聚类特征对应的特征值,对所述目标中间账户和所述多个簇中的每一簇重新进行聚类,以将所述多个中间账户和所述目标中间账户划分为多个簇;根据所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式;确定所述目标中间账户所属的簇;将所述目标中间账户所属的簇对应的交易模式,作为所述目标中间账户的交易模式。
综上所述,在图2所示出的实施例中,本申请的发明人别出心裁地提出了这样一种技术方案,通过根据中间账户的特征值组对中间进行聚类,将多个中间账户分成了多个簇,然后建立交易画像,由于每一簇的特征值近似,所以可以为每一簇的中间账户单独建立一个画像,只有特征值相似的中间账户才会被划归为一类,这样就保证了建立的交易模式画像的精度,提高了刻画出的交易模式画像的细致程度。
图3是根据图2对应实施例示出的一实施例的步骤240和步骤270的细节的流程图。如图3所示,包括以下步骤:
步骤241,根据针对所述样本集中各中间账户获取的聚类特征值,为所述样本集中的每一中间账户建立聚类向量。
在一个实施例中,预设的特征组中的每一特征按照预定顺序排序,针对为每一中间账户获取的聚类特征值,按照对应的聚类特征在预设的特征组中的先后顺序进行排序,得到每一中间账户的聚类向量。
步骤242,利用为每一中间账户建立的聚类向量,使用K-means算法对所述多个中间账户进行聚类,以将所述多个中间账户划分为多个簇。
K-means算法一般流程为:从n个中间账户任意选择k个中间账户作为初始聚类中心;计算所有中间账户与k个聚类中心的距离,距离哪个中心最近就将该中间账户划归为哪个聚类中心所代表的簇;重新确定簇的中心;用重新确定的簇的中心进行迭代聚类直至聚类不再变化或者迭代次数达到预定阈值。
步骤271,根据所述目标中间账户的特征值组中与所述聚类特征对应的特征值,建立所述目标中间账户的聚类向量,作为目标聚类向量。
在一个实施例中,获取聚类时聚类向量中聚类特征值对应的聚类特征的排序;然后将目标中间账户确定出的聚类特征值按照所述排序建立所述目标账户的聚类向量。
步骤272,获取所述多个簇中每一簇的中心向量。
在一个实施例中,针对每一簇内中间账户的聚类向量,获取该簇的聚类向量下的每一聚类特征对应聚类变量值的平均值;然后根据针对每一聚类特征确定的对应聚类特征值的平均值按照聚类向量中聚类特征值对应的聚类特征的排序进行排序,得到中心向量。
步骤273,确定所述目标聚类向量和所述多个簇中每一簇的中心向量之间的欧式距离。
步骤274,将和与所述目标聚类向量之间的欧式距离最小的中心向量所属的簇对应的交易模式,作为所述目标中间账户的交易模式。
在一个实施例中,通过冒泡排序的第一轮排序对目标聚类向量与每一中心向量之间的欧式距离进行排序,得到与所述目标聚类向量之间的欧式距离最小的中心向量。
图3所示出的实施例的好处在于,对如何对聚类向量进行聚类以及如何根据聚类来确定目标中间账户的交易模式提供了一个较佳的解决方案,能在一定程度上提高建立交易模式画像的精度。
本公开还提供了一种交易模式画像建立装置,以下是本公开的装置实施例。
图4是根据一示例性实施例示出的一种交易模式画像建立装置的框图。如
图4所示,装置400包括:
第一获取模块410,被配置为获取包括多个中间账户以及与每一中间账户对应的特征值组的样本集,其中,所述特征值组包括多个特征值,与每一中间账户对应的特征值组中的每一特征值与预设的特征组中的每一特征对应;
第二获取模块420,被配置为根据与各中间账户对应的特征值组,在预设的特征组中的多个特征中,获取聚类特征;
第三获取模块430,被配置为在与各中间账户对应的特征值组中,获取与所述聚类特征对应的特征值,作为聚类特征值;
聚类模块440,被配置为基于针对所述样本集中各中间账户获取的聚类特征值,对所述多个中间账户进行聚类,以将所述多个中间账户划分为多个簇,其中,每一中间账户仅属于一个簇;
第一确定模块450,被配置为根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式;
第四获取模块460,被配置为当接收到对目标中间账户的交易模式画像建立请求,获取所述目标中间账户的特征值组,其中,所述特征值组中的每一特征值与所述预设的特征组中的每一特征对应;
第二确定模块470,被配置为基于所述目标中间账户的特征值组中与所述聚类特征对应的特征值以及所述多个簇中每一簇对应的交易模式,确定所述目标中间账户的交易模式。
据本公开的第三方面,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图5来描述根据本发明的这种实施方式的电子设备500。图5显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:上述至少一个处理单元510、上述至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元510执行,使得所述处理单元510执行本说明书上述“实施例方法”部分中描述的根据本发明各种示例性实施方式的步骤。
存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)521和/或高速缓存存储单元522,还可以进一步包括只读存储单元(ROM)523。
存储单元520还可以包括具有一组(至少一个)程序模块525的程序/实用工具524,这样的程序模块525包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备500也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备500交互的设备通信,和/或与使得该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口550进行。并且,电子设备500还可以通过网络适配器560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器560通过总线530与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
根据本公开的第四方面,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
参考图6所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品600,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (8)
1.一种交易模式画像建立方法,其特征在于,所述方法包括:
获取包括多个中间账户以及与每一中间账户对应的特征值组的样本集,其中,所述特征值组包括多个特征值,与每一中间账户对应的特征值组中的每一特征值与预设的特征组中的每一特征对应,所述中间账户为理财账户或者具有中间转存功能的账户;
根据与各中间账户对应的特征值组,在预设的特征组中的多个特征中,获取聚类特征;所述根据与各中间账户对应的特征值组,在预设的特征组中的多个特征中,获取聚类特征,包括:针对预设的特征组中的每一特征,获取所有中间账户对应的特征值组中与该特征对应的特征值的方差;对所有特征按照针对各特征获取的特征值的方差从大到小的顺序排序;获取排序在前预定数目的特征,作为聚类特征;或者,针对预设的特征组中的每一特征,获取所有中间账户对应的特征值组中与该特征对应的特征值的方差;对所有特征按照针对各特征获取的特征值的方差从小到大的顺序排序;获取参与排序的特征的数目;计算90%与所述数目的乘积;获取小于所述乘积的最大整数;获取排序在排序为所述最大整数的特征之前的预定数目个特征,作为聚类特征;
在与各中间账户对应的特征值组中,获取与所述聚类特征对应的特征值,作为聚类特征值;
根据针对所述样本集中各中间账户获取的聚类特征值,为所述样本集中的每一中间账户建立聚类向量;
利用为每一中间账户建立的聚类向量,使用K-means算法对所述多个中间账户进行聚类,以将所述多个中间账户划分为多个簇,其中,每一中间账户仅属于一个簇;
根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式,所述交易模式包括电商消费类型、保险投资类型;所述根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式,包括:针对属于所述多个簇中每一簇的中间账户的聚类特征值,获取所述聚类特征值所满足的条件,所述条件与交易模式对应;根据所述聚类特征值所满足的条件,确定对应的所述簇的交易模式;或者,针对每一聚类特征,确定每一簇内所有中间账户的与该聚类特征对应的聚类特征值的平均值;然后根据每一聚类特征,判断各个簇的该聚类特征对应的聚类特征值的平均值在所有簇之间的大小关系;根据判断结果确定每一簇对应的交易模式;
当接收到对目标中间账户的交易模式画像建立请求,获取所述目标中间账户的特征值组,其中,所述特征值组中的每一特征值与所述预设的特征组中的每一特征对应;
根据所述目标中间账户的特征值组中与所述聚类特征对应的特征值,建立所述目标中间账户的聚类向量,作为目标聚类向量;
获取所述多个簇中每一簇的中心向量;
确定所述目标聚类向量和所述多个簇中每一簇的中心向量之间的欧式距离;
将和与所述目标聚类向量之间的欧式距离最小的中心向量所属的簇对应的交易模式,作为所述目标中间账户的交易模式。
2.根据权利要求1所述的方法,其特征在于,所述条件包括条件阈值,在根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式之后,所述方法还包括:
针对每一交易模式的簇,为所述簇中的中间账户设定簇标记;
获取初始条件阈值;
基于所述初始条件阈值建立初始条件;
针对所述多个簇中的每一簇,获取满足所述初始条件的中间账户的数目;
确定目标簇,所述目标簇的交易模式和条件相对应,所述条件与所述初始条件对应;
获取所述目标簇的所述数目,为第一数目,获取所述多个簇中除所述目标簇之外的簇的所述数目之和,作为第二数目;
确定所述第二数目和所述第一数目的比值,作为第一比值;
当所述第一比值小于预定阈值,将所述多个簇中除所述目标簇之外的簇中满足所述初始条件的中间账户的簇标记置为所述目标簇中已包含的中间账户的簇标记。
3.根据权利要求2所述的方法,其特征在于,在当所述第一比值小于预定阈值,将所述多个簇中除所述目标簇之外的簇中满足所述初始条件的中间账户的簇标记置为所述目标簇中已包含的中间账户的簇标记之后,所述方法还包括:
当所述第一比值不小于预定阈值,每次将初始条件阈值改变预定步长,基于改变预定步长后的初始条件阈值,重新确定所述第二数目和所述第一数目的比值,作为第二比值;
如果所述第二比值小于预定阈值,将所述多个簇中除所述目标簇之外的簇中满足所述初始条件的中间账户的簇标记置为所述目标簇中已包含的中间账户的簇标记。
4.根据权利要求1所述的方法,其特征在于,在根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式之后,所述方法还包括:
针对所述多个簇中的每一簇,确定为确定该簇的交易模式所根据的聚类特征值;
针对为所述多个簇中的每一簇确定出的聚类特征值,对所有簇中每一簇的多个中间账户,按照所述聚类特征值从大到小进行排序;
根据所述排序,确定所述多个簇中每一簇对应的交易模式的信任度。
5.根据权利要求4所述的方法,其特征在于,确定簇的交易模式所根据的聚类特征值对应的簇为所述聚类特征值的基准簇,所述根据所述排序,确定所述多个簇中每一簇对应的交易模式的信任度,包括:
在所述基准簇内的按照与所述基准簇对应的所述聚类特征值从大到小进行排序的多个中间账户中,获取排序满足预定条件的中间账户,作为信任度基准中间账户;
获取在所述基准簇内的按照与所述基准簇对应的所述聚类特征值从大到小进行排序的多个中间账户的所述信任度基准中间账户的排序,作为基准排序;
针对所述多个簇中除所述基准簇之外的每一簇中的多个中间账户按照与所述基准簇对应的所述聚类特征值从大到小进行排序的多个中间账户中的排序,确定若将所述信任度基准中间账户加入到所述多个中间账户之中并按照所述聚类特征值从大到小重新进行排序后,所述信任度基准中间账户的排序,作为参考排序;
基于所述多个簇中除所述基准簇之外的每一簇对应的参考排序和所述基准排序,确定所述基准簇对应的交易模式的信任度。
6.一种交易模式画像建立装置,其特征在于,所述装置包括:
第一获取模块,被配置为获取包括多个中间账户以及与每一中间账户对应的特征值组的样本集,其中,所述特征值组包括多个特征值,与每一中间账户对应的特征值组中的每一特征值与预设的特征组中的每一特征对应,所述中间账户为理财账户或者具有中间转存功能的账户;
第二获取模块,被配置为根据与各中间账户对应的特征值组,在预设的特征组中的多个特征中,获取聚类特征;所述根据与各中间账户对应的特征值组,在预设的特征组中的多个特征中,获取聚类特征,包括:针对预设的特征组中的每一特征,获取所有中间账户对应的特征值组中与该特征对应的特征值的方差;对所有特征按照针对各特征获取的特征值的方差从大到小的顺序排序;获取排序在前预定数目的特征,作为聚类特征;或者,针对预设的特征组中的每一特征,获取所有中间账户对应的特征值组中与该特征对应的特征值的方差;对所有特征按照针对各特征获取的特征值的方差从小到大的顺序排序;获取参与排序的特征的数目;计算90%与所述数目的乘积;获取小于所述乘积的最大整数;获取排序在排序为所述最大整数的特征之前的预定数目个特征,作为聚类特征;
第三获取模块,被配置为在与各中间账户对应的特征值组中,获取与所述聚类特征对应的特征值,作为聚类特征值;
聚类模块,被配置为根据针对所述样本集中各中间账户获取的聚类特征值,为所述样本集中的每一中间账户建立聚类向量;利用为每一中间账户建立的聚类向量,使用K-means算法对所述多个中间账户进行聚类,以将所述多个中间账户划分为多个簇,其中,每一中间账户仅属于一个簇;
第一确定模块,被配置为根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式,所述交易模式包括电商消费类型、保险投资类型;所述根据属于所述多个簇中每一簇的中间账户的聚类特征值,确定每一簇对应的交易模式,包括:针对属于所述多个簇中每一簇的中间账户的聚类特征值,获取所述聚类特征值所满足的条件,所述条件与交易模式对应;根据所述聚类特征值所满足的条件,确定对应的所述簇的交易模式;或者,针对每一聚类特征,确定每一簇内所有中间账户的与该聚类特征对应的聚类特征值的平均值;然后根据每一聚类特征,判断各个簇的该聚类特征对应的聚类特征值的平均值在所有簇之间的大小关系;根据判断结果确定每一簇对应的交易模式;
第四获取模块,被配置为当接收到对目标中间账户的交易模式画像建立请求,获取所述目标中间账户的特征值组,其中,所述特征值组中的每一特征值与所述预设的特征组中的每一特征对应;
第二确定模块,被配置为根据所述目标中间账户的特征值组中与所述聚类特征对应的特征值,建立所述目标中间账户的聚类向量,作为目标聚类向量;获取所述多个簇中每一簇的中心向量;确定所述目标聚类向量和所述多个簇中每一簇的中心向量之间的欧式距离;将和与所述目标聚类向量之间的欧式距离最小的中心向量所属的簇对应的交易模式,作为所述目标中间账户的交易模式。
7.一种计算机可读程序介质,其特征在于,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行根据权利要求1至5中任一项所述的方法。
8.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910435803.2A CN110335061B (zh) | 2019-05-23 | 2019-05-23 | 交易模式画像建立方法、装置、介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910435803.2A CN110335061B (zh) | 2019-05-23 | 2019-05-23 | 交易模式画像建立方法、装置、介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110335061A CN110335061A (zh) | 2019-10-15 |
CN110335061B true CN110335061B (zh) | 2023-07-21 |
Family
ID=68139177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910435803.2A Active CN110335061B (zh) | 2019-05-23 | 2019-05-23 | 交易模式画像建立方法、装置、介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110335061B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110879816A (zh) * | 2019-10-30 | 2020-03-13 | 支付宝(杭州)信息技术有限公司 | 关联账户识别方法及装置和电子设备 |
CN115134665B (zh) * | 2021-03-22 | 2024-03-01 | 中国电信股份有限公司 | 基于机顶盒的数据处理方法及装置、存储介质、电子设备 |
CN114418752B (zh) * | 2022-03-28 | 2022-07-12 | 北京芯盾时代科技有限公司 | 无类型标签用户数据的处理方法、装置、电子设备和介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105809448A (zh) * | 2014-12-30 | 2016-07-27 | 阿里巴巴集团控股有限公司 | 账户交易的聚类方法及其系统 |
WO2017118306A1 (zh) * | 2016-01-04 | 2017-07-13 | 阿里巴巴集团控股有限公司 | 业务回退方法及装置 |
CN108830603A (zh) * | 2018-07-03 | 2018-11-16 | 成都四方伟业软件股份有限公司 | 交易识别方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100306029A1 (en) * | 2009-06-01 | 2010-12-02 | Ryan Jolley | Cardholder Clusters |
-
2019
- 2019-05-23 CN CN201910435803.2A patent/CN110335061B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105809448A (zh) * | 2014-12-30 | 2016-07-27 | 阿里巴巴集团控股有限公司 | 账户交易的聚类方法及其系统 |
WO2017118306A1 (zh) * | 2016-01-04 | 2017-07-13 | 阿里巴巴集团控股有限公司 | 业务回退方法及装置 |
CN108830603A (zh) * | 2018-07-03 | 2018-11-16 | 成都四方伟业软件股份有限公司 | 交易识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110335061A (zh) | 2019-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110335061B (zh) | 交易模式画像建立方法、装置、介质及电子设备 | |
CN110909222B (zh) | 基于聚类的用户画像建立方法、装置、介质及电子设备 | |
CN108376364B (zh) | 一种支付系统对账的方法、设备及终端设备 | |
CN107305637B (zh) | 基于K-Means算法的数据聚类方法和装置 | |
US20180248879A1 (en) | Method and apparatus for setting access privilege, server and storage medium | |
WO2019056496A1 (zh) | 图片复审概率区间生成方法及图片复审判定方法 | |
CN107977876B (zh) | 用于处理订单信息的方法及装置 | |
CN112734352A (zh) | 一种基于数据维度的单据审核方法和装置 | |
CN112162762A (zh) | 灰度发布方法、灰度发布装置和电子设备 | |
CN113779346A (zh) | 用于识别一人多账号的方法及装置 | |
CN111415168A (zh) | 一种交易告警的方法和装置 | |
CN111245815A (zh) | 数据处理方法、装置、存储介质及电子设备 | |
JP6835680B2 (ja) | 情報処理装置および信用度算出方法 | |
CN111046894B (zh) | 识别马甲账号的方法和装置 | |
CN114374595A (zh) | 事件节点归因分析方法、装置、电子设备及存储介质 | |
CN113436001A (zh) | 信用卡的推送方法、装置、设备、存储介质和程序产品 | |
CN113111133A (zh) | 用户分类的方法和装置 | |
CN113452648A (zh) | 检测网络攻击的方法、装置、设备和计算机可读介质 | |
CN111401137A (zh) | 证件栏位识别的方法和装置 | |
CN113760521B (zh) | 一种虚拟资源的分配方法和装置 | |
CN110874386A (zh) | 建立类目映射关系的方法和装置 | |
CN115119192B (zh) | 网络接入方法和装置 | |
CN113554041B (zh) | 一种对用户标记标签的方法和装置 | |
CN114298203B (zh) | 数据分类的方法、装置、设备和计算机可读介质 | |
CN112819018A (zh) | 生成样本的方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |