关联账户查找方法、装置、计算机设备以及存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种关联账户查找方法、装置、计算机设备以及存储介质。
背景技术
随着消费信贷业务不断发展,机构也承受着较大的催收压力,尤其在贷后逾期催收过程中失联率较高,催收人员无法有效联系逾期客户,导致逾期贷款无法有效催回。
目前大多数信息修复手段均直接采用第三方信息接入、采集等简单手段,效果不佳,对第三方的依赖度高。
发明内容
基于此,现有信息修复手段对第三方数据依赖性高的问题,提供一种不需要依赖第三方信息的关联账户查找方法、装置、计算机设备以及存储介质。
一种关联账户查找方法,所述方法包括:
获取失联账户的路由特征数据,所述路由特征数据包括路由器地址;
根据所述失联账户对应的路由器地址,查找所述失联账户的各配对账户,获取各配对账户的路由特征数据;
根据失联账户的路由特征数据以及所述各配对账户的路由特征数据,获取所述失联账户与各关联账户的关联评分;
根据所述关联评分以及预设关联评分阈值,确定所述各配对账户中与失联账户对应的关联账户。
在其中一个实施例中,所述根据失联账户的路由特征数据以及所述各配对账户的路由特征数据,获取所述失联账户与各关联账户的关联评分包括:
根据所述失联账户的路由特征数据以及所述各配对账户的路由特征数据,获取各配对账户对应的特征变量数据;
将所述特征变量数据输入预设关联评分决策树模型,获取所述失联账户与各关联账户的关联评分,所述预设关联评分决策树模型由预设训练数据以及与所述预设训练数据对应的目标标签,对初始决策树模型进行有监督训练获得。
在其中一个实施例中,所述将失联账户的路由特征数据以及所述各配对账户的路由特征数据输入预设关联评分决策树模型,获取所述失联账户与各失联账户的关联评分之前,还包括:
获取预设训练数据以及训练目标标签,将所述预设训练数据输入初始决策树模型,获取输出的训练关联评分;
对比所述训练关联评分与训练目标标签,获取所述初始决策树模型的训练评分合格率;
通过网格搜索遍历调节所述初始决策树模型的模型参数,根据所述训练目标标签,获取模型参数调整后的各初始决策树模型对所述预设训练数据的训练评分合格率;
获取预设测试数据以及测试目标标签,将所述预设测试数据输入所述各初始决策树模型,根据所述测试目标标签,获取所述各初始决策树模型对所述预设测试数据的测试评分合格率;
将训练评分合格率与测试评分合格率之和最高的初始决策树模型作为预设关联评分决策树模型。
在其中一个实施例中,所述获取预设训练数据以及目标标签,将所述预设训练数据输入初始决策树模型,获取输出的训练关联评分之前,还包括:
确定训练失联账户以及训练配对账户,查找所述训练失联账户的路由特征数据与所述训练账户的路由特征数据;
根据所述训练失联账户的路由特征数据与所述训练账户的路由特征数据,生成预设训练数据;
根据所述训练失联账户对应紧急联系人信息与所述训练配对账户的账户信息,确定目标标签。
在其中一个实施例中,所述根据所述关联评分以及预设关联评分阈值,确定所述各配对账户中与失联账户对应的关联账户之前包括:
获取预设关联评分决策树模型对预设训练数据的训练关联评分,获取所述预设训练数据对应的联系有效率;
根据所述联系有效率以及所述训练关联评分获取预设关联评分阈值。
在其中一个实施例中,所述获取失联账户的路由特征数据之前,还包括:
获取所述失联账户的账户信息,清洗所述账户信息中的无用字段,更新所述账户信息,获得所述失联账户的路由特征数据。
一种关联账户查找装置,所述装置包括:
特征数据查找模块,用于获取失联账户的路由特征数据,所述路由特征数据包括路由器地址;
设备配对模块,用于根据所述失联账户对应的路由器地址,查找所述失联账户的各配对账户,获取各配对账户的路由特征数据;
关联评分获取模块,用于根据失联账户的路由特征数据以及所述各配对账户的路由特征数据,获取所述失联账户与各关联账户的关联评分;
关联账户查找模块,用于根据所述关联评分以及预设关联评分阈值,确定所述各配对账户中与失联账户对应的关联账户。
在其中一个实施例中,所述关联评分获取模块具体用于:
根据所述失联账户的路由特征数据以及所述各配对账户的路由特征数据,获取各配对账户对应的特征变量数据;
将所述特征变量数据输入预设关联评分决策树模型,获取所述失联账户与各关联账户的关联评分,所述预设关联评分决策树模型由预设训练数据以及与所述预设训练数据对应的目标标签,对初始决策树模型进行有监督训练获得。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取失联账户的路由特征数据,所述路由特征数据包括路由器地址;
根据所述失联账户对应的路由器地址查找所述失联账户的各配对账户,获取各配对账户的路由特征数据;
根据失联账户的路由特征数据以及所述各配对账户的路由特征数据,获取所述失联账户与各关联账户的关联评分;
根据所述关联评分,确定所述配对账户中失联账户对应的关联账户。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取失联账户的路由特征数据,所述路由特征数据包括路由器地址;
根据所述失联账户对应的路由器地址查找所述失联账户的各配对账户,获取各配对账户的路由特征数据;
根据失联账户的路由特征数据以及所述各配对账户的路由特征数据,获取所述失联账户与各关联账户的关联评分;
根据所述关联评分,确定所述配对账户中失联账户对应的关联账户。
上述关联账户查找方法、装置、计算机设备以及存储介质,服务器首先获取失联账户的路由特征数据,路由特征数据包括路由器地址;根据失联账户对应的路由器地址查找失联账户的各配对账户,获取各配对账户的路由特征数据;根据失联账户的路由特征数据以及各配对账户的路由特征数据,获取失联账户与各关联账户的关联评分;根据关联评分,确定配对账户中失联账户对应的关联账户。本申请的关联账户查找方法通过借助路由特征数据来查找目标账户的关联账户,结合了客户之间相似的行为模式或者行为依赖来进行信息修复,而无需借助第三方信息,关联账户查找效率高。
附图说明
图1为一个实施例中关联账户查找方法的应用环境图;
图2为一个实施例中关联账户查找方法的流程示意图;
图3为一个实施例中图2的步骤S600的子流程示意图;
图4为另一个实施例中图2的步骤S600的子流程示意图;
图5为一个实施例中关联账户查找装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的关联账户查找方法,可以应用于如图1所示的应用环境中,其中,服务器104通过网络与终端102通信,服务器104可以接收终端102提供的失联账户的路由特征数据,根据失联账户对应的路由器地址,查找失联账户的各配对账户,获取各配对账户的路由特征数据;根据失联账户的路由特征数据以及各配对账户的路由特征数据,获取失联账户与各关联账户的关联评分;根据关联评分以及预设关联评分阈值,确定各配对账户中与失联账户对应的关联账户。终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑。
如图2所示,在其中一个实施例中,本申请的关联账户查找方法,通过服务器实现,具体包括以下步骤:
S200,获取失联账户的路由特征数据,路由特征数据包括路由器地址。
失联账户的失联是指:通过账户对应用户提供的联系方式无法与该用户建立有效联系。而路由特征数据是指该账户在登录相关应用时的路由器的数据,路由特征数据具体包括了,账户登录所用路由器的路由地址、登录时间段、登录各个路由器的次数等等特征。首先在账户失联之后,服务器查找账户登录中所用到路由器的路由特征数据。
S400,根据失联账户对应的路由器地址,查找失联账户的各配对账户,获取各配对账户的路由特征数据。
配对账户具体是指与失联账户通过相同的路由器来进行登录的账户,可以通过失联账户所用到的所有路由器地址,查找曾经通过这些路由器地址登录过的其他账户,把这些账户作为配对账户,并查找这些配对账户的路由特征数据。
S600,根据失联账户的路由特征数据以及各配对账户的路由特征数据,获取失联账户与各关联账户的关联评分。
可以根据失联账户的路由特征数据以及各配对账户的路由特征数据,确定失联账户与各配对账户的关联程度,而后通过关联评分将关联程度表现出来。比如在一个实施例中,可以失联账户与各关联账户共有多少个的路由器数量、失联账户与各关联账户共同登录的次数以及失联账户与各关联账户共同登录的时长或者频率等数据来确定失联账户与各配对账户的关联程度。
S800,根据关联评分以及预设关联评分阈值,确定各配对账户中与失联账户对应的关联账户。
关联账户是指可能与失联账户存在联系的账户,通过关联账户对应的用户联系上失联账户对应的账户,可以通过关联账户来对失联账户进行信息修复。可以通过关联评分来体现失联账户与各配对账户的关联程度,而后可以基于这些关联评分是否大于预设关联评分阈值来确定配对账户中失联账户对应的关联账户。可以将大于预设关联评分阈值全部视为与失联账户对应的关联账户。
上述关联账户查找方法,服务器首先获取失联账户的路由特征数据,路由特征数据包括路由器地址;根据失联账户对应的路由器地址查找失联账户的各配对账户,获取各配对账户的路由特征数据;根据失联账户的路由特征数据以及各配对账户的路由特征数据,获取失联账户与各关联账户的关联评分;根据关联评分,确定配对账户中失联账户对应的关联账户。本申请的关联账户查找方法通过借助路由特征数据来查找目标账户的关联账户,结合了客户之间相似的行为模式或者行为依赖来进行信息修复,而无需借助第三方信息,关联账户查找效率高。
如图3所示,在其中一个实施例中,步骤S600包括:
S610,根据失联账户的路由特征数据以及各配对账户的路由特征数据,获取各配对账户对应的特征变量数据;
S630,将特征变量数据输入预设关联评分决策树模型,获取失联账户与各关联账户的关联评分,预设关联评分决策树模型由预设训练数据以及与预设训练数据对应的目标标签对初始决策树模型进行有监督训练获得。
特征变量数据是指可以表征失联账户与配对账户关联性的数据,具体可以包含失联账户与各关联账户共有多少个的路由器数量、失联账户与各关联账户共同登录的次数以及失联账户与各关联账户共同登录的时长或者频率等数据。而预设关联评分决策树模型具体为决策树的集成模型,根据其集成方法的不同,可分为随机森林、AdaBoost、GradientBoosting、Xgboost等多种模型,通过构建多棵决策树来消除偏差的方式来进行有监督训练。通过将特征变量数据输预设关联评分决策树模型可以更加准确地获得当前的失联账户与各个关联账户的关联评分。
如图4所示,在其中一个实施例中,S630之前还包括:
S621,获取预设训练数据以及训练目标标签,将预设训练数据输入初始决策树模型,获取输出的训练关联评分;
S623,对比训练关联评分与训练目标标签,获取初始决策树模型的训练评分合格率;
S625,通过网格搜索遍历调节初始决策树模型的模型参数,根据训练目标标签,获取模型参数调整后的各初始决策树模型对预设训练数据的训练评分合格率;
S627,获取预设测试数据以及测试目标标签,将预设测试数据输入各初始决策树模型,根据测试目标标签,获取各初始决策树模型对预设测试数据的测试评分合格率;
S629,将训练评分合格率与测试评分合格率之和最高的初始决策树模型作为预设关联评分决策树模型。
其中对预设关联评分决策树模型的训练过程包括,首先获取预设训练数据以及目标标签,预设训练数据与模型使用过程中的特征变量数据对应,但是预设训练数据存在对应的目标数据,即目标标签。预设训练数据包含了多组数据。不同组数据中的好坏样本比例不相同,用于比较当前的关联评分决策树模型的性能。首先将测试数据输入初始决策树模型,获得评分结果,而后将评分结果与预期的目标标签进行比对,获取当前关联评分决策树模型的训练评分合格率。评分是否合格通过判定当前评分是否大于合格评分阈值确定。合体评分阈值具体可以通过目标标签确定哪些预设训练数据是好样本数据,那些数据是坏样本数据,而后确定好样本数据的评分范围以及坏样本数据的评分范围,当训练关联评分落入预设测试数据对应的评分范围时,判定评分合格,反则判定评分不合格。而后可以使用网格搜索的方法来进行调参,遍历参数的范围取值和参数组合的方式,来进行参数调试。调试的参数包括学习率、树的个数、深度等等。通过不同的参数取值来改变原有的初始决策树模型,并获取参数调整后的各初始决策树模型对应的训练评分合格率,同时还可以通过将输入的训练数据替换为新的测试数据,来确定各初始决策树模型对应的测试评分合格率,通过测试评分合格率来判断各个参数调整后的初始决策树模型的稳定性。将训练评分合格率与测试评分合格率之和最高的初始决策树模型作为可用的预设关联评分决策树模型。通过网格搜索以及有监督训练可以提高模型评分的准确性,提高模型的应用效果。
在其中一个实施例中,S621之前还包括:
确定训练失联账户以及训练配对账户,查找训练失联账户的路由特征数据与训练账户的路由特征数据;
根据训练失联账户的路由特征数据与训练账户的路由特征数据,生成预设训练数据;
根据训练失联账户对应紧急联系人信息与训练配对账户的账户信息,确定目标标签。
获取预设训练数据的过程与关联评分获取过程中,获取特征变量数据的过程类似,首先获取用于测试的训练失联账户的路由特征数据以及训练配对账户的路由特征数据,而后根据这些路由特征数据,确定包含训练失联账户与各训练失联账户共有多少个的路由器数量、失联账户与各关联账户共同登录的次数以及失联账户与各关联账户共同登录的时长或者频率等数据,来生成预设训练数据。而目标标签则可以通过训练失联账户所留下的紧急联系人信息,而后判断训练配对账户的账户信息对应的联系人是否是训练失联账户对应的紧急联系人。如果是的话,则可以认为该训练配对账户与当前的训练失联账户是有效联系人配对,目标标签标识为可以联系上。而如果不是的话,则可以认为该训练配对账户与当前的训练失联账户不是有效联系人配对,目标标签标识为不可以联系上。在其中一个实施例中,可以通过查找历史数据,来确定训练失联账户以及训练配对账户,并确定对应的预设训练数据以及目标标签。通过对预设训练数据以及目标标签的整理,可以提高模型训练的效率。
在其中一个实施例中,S800之前包括:
获取预设关联评分决策树模型对预设训练数据的训练关联评分,获取预设训练数据对应的联系有效率;
根据联系有效率以及训练关联评分获取预设关联评分阈值。
首先获取目标的联系有效率,而后通过预设训练数据进行实际联系,判断哪些预设数据是可以通过关联账户联系上失联账户的,通过对海量测试数据的实际联系,可以获取这些数据对应的联系有效率。一般联系有效率会随着训练关联评分的降低而降低,通过获取目标的联系有效率对应的训练关联评分,而后将该训练关联评分作为预设关联评分阈值。通过测试训练数据可以准确定位关联评分的阈值,保证关联账户查找的有效性。
在其中一个实施例中,步骤S200之前,还包括:
获取失联账户的账户信息,删除清洗账户信息中的无用字段,更新账户信息,获得失联账户的路由特征数据。
其中账户信息具体包括了账户对应的包含账户号、操作的时间、操作渠道、操作的类型(点击、浏览、输入)、操作的对象控件类型(输入框、按钮)、操作的经纬度、操作的IP、路由器地址、账户对应的手机设备号、sim卡号、Imei码、手机型号、手机制造商、账户的紧急联系人等等。这些数据中有些字段的数据可以在关联账户查找中使用,如账户号、路由器地址以及操作时间等,而有些是不需要的,如手机型号、手机制造商等等信息,可以通过数据清洗,清洗掉其中的无用数据,获取可用于关联账户查找的路由特征数据,有利于提高关联账户查找的速度以及有效性。
在其中一个实施例中,本申请的关联账户查找方法包括:获取失联账户的账户信息,清洗账户信息中的无用字段,更新账户信息,获得失联账户的路由特征数据。获取失联账户的路由特征数据,路由特征数据包括路由器地址;根据失联账户对应的路由器地址,查找失联账户的各配对账户,获取各配对账户的路由特征数据;根据失联账户的路由特征数据以及各配对账户的路由特征数据,获取各配对账户对应的特征变量数据。确定训练失联账户以及训练配对账户,查找训练失联账户的路由特征数据与训练账户的路由特征数据;根据训练失联账户的路由特征数据与训练账户的路由特征数据,获取生成预设训练数据;根据训练失联账户对应紧急联系人信息与训练配对账户的账户信息,确定目标标签。获取预设训练数据以及训练目标标签,将预设训练数据输入初始决策树模型,获取输出的训练关联评分;对比训练关联评分与训练目标标签,获取初始决策树模型的训练评分合格率;通过网格搜索遍历调节初始决策树模型的模型参数,根据训练目标标签,获取模型参数调整后的各初始决策树模型对预设训练数据的训练评分合格率;获取预设测试数据以及测试目标标签,将预设测试数据输入各初始决策树模型,根据测试目标标签,获取各初始决策树模型对预设测试数据的测试评分合格率;将训练评分合格率与测试评分合格率之和最高的初始决策树模型作为预设关联评分决策树模型。将特征变量数据输入预设关联评分决策树模型,获取失联账户与各关联账户失联账户的关联评分。获取预设关联评分决策树模型对预设训练数据的训练关联评分,获取预设训练数据对应的联系有效率;根据联系有效率以及训练关联评分获取预设关联评分阈值。根据关联评分以及预设关联评分阈值,确定各配对账户中与失联账户对应的关联账户。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图5所示,本申请还提供一种关联账户查找装置,装置包括:
特征数据查找模块200,用于获取失联账户的路由特征数据,路由特征数据包括路由器地址;
设备配对模块400,用于根据失联账户对应的路由器地址,查找失联账户的各配对账户,获取各配对账户的路由特征数据;
关联评分获取模块600,用于根据失联账户的路由特征数据以及各配对账户的路由特征数据,获取失联账户与各关联账户的关联评分;
关联账户查找模块800,用于根据关联评分以及预设关联评分阈值,确定各配对账户中与失联账户对应的关联账户。
在其中一个实施例中,关联评分获取模块600具体用于:根据失联账户的路由特征数据以及各配对账户的路由特征数据,获取各配对账户对应的特征变量数据;将特征变量数据输入预设关联评分决策树模型,获取失联账户与各关联账户的关联评分,预设关联评分决策树模型由预设训练数据以及与预设训练数据对应的目标标签,对初始决策树模型进行有监督训练获得。
在其中一个实施例中,还包括模型训练模块,用于获取预设训练数据以及训练目标标签,将预设训练数据输入初始决策树模型,获取输出的训练关联评分;对比训练关联评分与训练目标标签,获取初始决策树模型的训练评分合格率;通过网格搜索遍历调节初始决策树模型的模型参数,根据训练目标标签,获取模型参数调整后的各初始决策树模型对预设训练数据的训练评分合格率;获取预设测试数据以及测试目标标签,将预设测试数据输入各初始决策树模型,根据测试目标标签,获取各初始决策树模型对预设测试数据的测试评分合格率;将训练评分合格率与测试评分合格率之和最高的初始决策树模型作为预设关联评分决策树模型。
在其中一个实施例中,模型训练模块还用于:确定训练失联账户以及训练配对账户,查找训练失联账户的路由特征数据与训练账户的路由特征数据;根据训练失联账户的路由特征数据与训练账户的路由特征数据,生成预设训练数据;根据训练失联账户对应紧急联系人信息与训练配对账户的账户信息,确定目标标签。
在其中一个实施例中,还包括评分阈值获取模块,用于获取预设关联评分决策树模型对预设训练数据的训练关联评分,获取预设训练数据对应的联系有效率;根据联系有效率以及训练关联评分获取预设关联评分阈值。
在其中一个实施例中,还包括数据清洗模块,用于获取失联账户的账户信息,清洗账户信息中的无用字段,更新账户信息,获得失联账户的路由特征数据。
关于关联账户查找装置的具体限定可以参见上文中对于关联账户查找方法的限定,在此不再赘述。上述关联账户查找装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口以及数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种关联账户查找方法。该计算机设备的数据库用于存放账户的账户信息。账户信息包括了各账户的路由特征数据。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取失联账户的路由特征数据,路由特征数据包括路由器地址;
根据失联账户对应的路由器地址,查找失联账户的各配对账户,获取各配对账户的路由特征数据;
根据失联账户的路由特征数据以及各配对账户的路由特征数据,获取失联账户与各关联账户的关联评分;
根据关联评分以及预设关联评分阈值,确定各配对账户中与失联账户对应的关联账户。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据失联账户的路由特征数据以及各配对账户的路由特征数据,获取各配对账户对应的特征变量数据;将特征变量数据输入预设关联评分决策树模型,获取失联账户与各关联账户的关联评分,预设关联评分决策树模型由预设训练数据以及与预设训练数据对应的目标标签,对初始决策树模型进行有监督训练获得。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取预设训练数据以及训练目标标签,将预设训练数据输入初始决策树模型,获取输出的训练关联评分;对比训练关联评分与训练目标标签,获取初始决策树模型的训练评分合格率;通过网格搜索遍历调节初始决策树模型的模型参数,根据训练目标标签,获取模型参数调整后的各初始决策树模型对预设训练数据的训练评分合格率;获取预设测试数据以及测试目标标签,将预设测试数据输入各初始决策树模型,根据测试目标标签,获取各初始决策树模型对预设测试数据的测试评分合格率;将训练评分合格率与测试评分合格率之和最高的初始决策树模型作为预设关联评分决策树模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:确定训练失联账户以及训练配对账户,查找训练失联账户的路由特征数据与训练账户的路由特征数据;根据训练失联账户的路由特征数据与训练账户的路由特征数据,生成预设训练数据;根据训练失联账户对应紧急联系人信息与训练配对账户的账户信息,确定目标标签。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取预设关联评分决策树模型对预设训练数据的训练关联评分,获取预设训练数据对应的联系有效率;根据联系有效率以及训练关联评分获取预设关联评分阈值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取失联账户的账户信息,清洗账户信息中的无用字段,更新账户信息,获得失联账户的路由特征数据。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取失联账户的路由特征数据,路由特征数据包括路由器地址;
根据失联账户对应的路由器地址,查找失联账户的各配对账户,获取各配对账户的路由特征数据;
根据失联账户的路由特征数据以及各配对账户的路由特征数据,获取失联账户与各关联账户的关联评分;
根据关联评分以及预设关联评分阈值,确定各配对账户中与失联账户对应的关联账户。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据失联账户的路由特征数据以及各配对账户的路由特征数据,获取各配对账户对应的特征变量数据;将特征变量数据输入预设关联评分决策树模型,获取失联账户与各关联账户的关联评分,预设关联评分决策树模型由预设训练数据以及与预设训练数据对应的目标标签,对初始决策树模型进行有监督训练获得。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取预设训练数据以及训练目标标签,将预设训练数据输入初始决策树模型,获取输出的训练关联评分;对比训练关联评分与训练目标标签,获取初始决策树模型的训练评分合格率;通过网格搜索遍历调节初始决策树模型的模型参数,根据训练目标标签,获取模型参数调整后的各初始决策树模型对预设训练数据的训练评分合格率;获取预设测试数据以及测试目标标签,将预设测试数据输入各初始决策树模型,根据测试目标标签,获取各初始决策树模型对预设测试数据的测试评分合格率;将训练评分合格率与测试评分合格率之和最高的初始决策树模型作为预设关联评分决策树模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:确定训练失联账户以及训练配对账户,查找训练失联账户的路由特征数据与训练账户的路由特征数据;根据训练失联账户的路由特征数据与训练账户的路由特征数据,生成预设训练数据;根据训练失联账户对应紧急联系人信息与训练配对账户的账户信息,确定目标标签。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取预设关联评分决策树模型对预设训练数据的训练关联评分,获取预设训练数据对应的联系有效率;根据联系有效率以及训练关联评分获取预设关联评分阈值。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取失联账户的账户信息,清洗账户信息中的无用字段,更新账户信息,获得失联账户的路由特征数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。