具体实施方式
请参考图1,假定用户A在某网络平台注册了账号a,则用户A可以通过在该网络平台上登录账号a,实现该网络平台提供的操作功能。那么,当用户A希望基于该网络平台获取用户M(图中未示出)处的文件或其他物品时,需要将自身的地址1提供至用户M,以顺利实现相应的物流运输,且该物流运输的接收方地址为用户A的地址1。
而当账号a被用户B通过非法手段盗用时,用户B可以掩饰自己的真实身份,但用户B需要获得来自用户M的物品时,必须提供一物流运输地址,用户M才能够顺利实施物流运输。然而,如果用户B直接将自己的地址2提供给用户M,则会为自己的非法行为留下证据,因而用户B更加可能向用户M提供一地址3,而该地址3可能是虚假地址或范围模糊的地址(比如公园、广场等公共设施),以达到混淆视听的目的。
因此,基于非法行为的上述特点,本申请提出了对可能存在盗用等风险的用户账号进行识别的技术方案;为对本申请进行进一步说明,提供下列实施例:
图2示出了根据本申请一示例性实施例的一种账号风险的识别方法的流程图,如图2所示,该方法应用于服务器侧,可以包括以下步骤:
步骤202,提取对应于待识别账号的物流接收方地址。
在本实施例中,假定待识别账号为图1所示的账号a,则用户A或用户B需要通过网络平台将物流接收方地址的信息告知用户M,而网络平台即可通过对历史数据的查询,提取出已使用过且对应于账号a的物流接收方地址。或者,网络平台可以将用户通过账号a创建的物流接收方地址记录为账号a的用户信息,则网络平台可以从账号a的用户信息中提取出物流接收方地址。
在本实施例中,待识别账号可能存在多个对应的物流接收方地址,则每个物流接收方地址均可以采用本申请的技术方案进行处理,以用于确定账号a的风险状况。
步骤204,将所述物流接收方地址与预设的地址信息数据库进行匹配,得到所述物流接收方地址对应的有效性等级和类别信息。
在本实施例中,有效性等级与物流接收方地址的精确程度相关:如果在地址信息数据库内未匹配到物流接收方地址,则说明该地址可能为虚假地址,有效性最低;如果匹配到物流接收方地址,则可以进一步确定该物流接收方地址的精确程度,且越精确的物流接收方地址对应的有效性等级越高,比如地址X为“北京市海淀区XX大街XX大厦X层X号”、地址Y为“北京市海淀区XX大厦”,则地址X显然比地址Y更为精确,对应的有效性等级也更高。同时,用户往往会尽可能地提供详细的地址信息,并反复对地址进行校对,以便顺利收到物流运输的物品;而当物流接收方地址的有效性等级较低时,即物流接收方地址无效或不精确,说明提供该物流接收方地址的用户很可能是故意提供了不正确或模糊的物流接收方地址,从而希望后续通过与物流人员电话协商交接地点等方式,避免为自己的非法行为留下证据。
在本实施例中,可以预先设置多种地址类别,并根据物流接收方地址与地址信息数据库的匹配情况,确定物流接收方地址对应的类别信息,比如“公共设施”、“公司企业”或“住宅”等。类别信息可以表现出物流接收方地址的可投递性,比如当物流接收方地址为“公共设施”时,例如“XX广场”,这显然并非正常的用户地址,存在非法行为的风险。
在本实施例中,通过同时获取物流接收方地址的有效性等级和类别信息,可以使风险判断结果更为准确。比如当物流接收方地址的有效性等级较高的情况下,如果地址类别为“住宅”,说明该物流接收方地址存在非法行为的风险较低,而当地址类别为“公共设施”时,说明该物流接收方地址存在非法行为的风险较高。
步骤206,根据预定义的风险值与有效性等级、类别信息之间的映射关系,获取所述物流接收方地址的风险值,其中所述映射关系是根据每个有效性等级分别对应的第一风险发生率和每个类别信息分别对应的第二风险发生率训练得到。
在本实施例中,根据单独统计出的每个有效性等级和每个类别信息对应的风险发生率,可以训练得到综合有效性等级和类别信息的情况下,每个地址对应的风险值。
在本实施例中,风险值对应于风险发生率,该风险值可以直接为风险发生率,也可以为与风险发生率相关的其他参数,比如基于风险发生率和所有地址的平均风险发生率得到的风险倍数。
步骤208,根据所述物流接收方地址的风险值,确定所述待识别账号的风险状况。
在本实施例中,当待识别账号下仅存在一个物流接收方地址时,可以直接根据该物流接收方地址的风险值,确定该待识别账号的风险状况,比如当该风险值大于或等于预设风险值时,判定待识别账号存在被盗用或欺诈风险,否则判定不存在风险。当待识别账号下存在多个物流接收方地址时,可以根据各物流接收方地址的权重值,对多个物流接收方地址的风险值进行综合计算,从而确定该待识别账号的风险状况,比如当综合计算的风险值大于或等于预设风险值时,判定待识别账号存在被盗用或欺诈风险,否则判定不存在风险。
在本实施例中,当判定待识别账号存在较高风险时,可以对该待识别账号或其预设操作功能进行冻结,比如对于“淘宝”账号,可以冻结账号资金;同时,还可以根据待识别账号绑定的安全电话号码或安全邮箱,自动向用户发送提示信息,以便用户及时实施对账号安全状况的验证等操作。
由上述实施例可知,本申请通过对物流接收方地址的分析,可以确定该地址的有效性和类别信息,从而准确得到该物流接收方地址的风险值,并进而得到相应账号的风险状况。
请参考图3,图3示出了根据本申请一示例性实施例的另一种账号风险的识别方法的流程图,可以包括下述步骤:
1、预先建立风险决策树
作为一示例性实施方式,可以采用风险决策树的方式,表现出图2中步骤206所述的“风险值与有效性等级、类别信息之间的映射关系”,而本领域技术人员应该理解的是,其他形式的映射关系显然也可以应用于本申请的技术方案中,本申请对此并不作限制。
(1)对应于有效性等级的风险发生率(比如统称为“第一风险发生率”)
步骤302A,创建有效性等级。
在本实施例中,基于预先创建的地址信息数据库,可以根据物流接收方地址与该地址信息数据库之间可能的匹配结果和精确程度,建立多个有效性等级。
作为一示例性实施方式,比如有效性等级可以为5个级别:当匹配结果为未匹配成功时,对应于级别最低的等级5;当匹配结果为匹配成功时,按照物流接收方地址的精确程度由低到高,分别对应于等级4至等级1。
步骤304A,计算每个有效性等级对应的风险发生率。
在本实施例中,可以基于已知的账号盗用、诈骗等事件的发生状况,得到已经发生了非法事件的地址正样本和已知为正常地址的地址负样本,并根据各样本地址对应的有效性等级,统计出每个有效性等级对应的风险发生率,即非法事件的发生率。
表1
比如表1示出了一示例性实施例的所有有效性等级以及各个有效性等级对应的风险状况。其中,“风险发生率”为相应的有效性等级下的物流接收方地址可能发生非法事件的概率,具体可以为“正样本数量”与“总样本(相应有效性等级下的正样本和负样本)数量”的比值;“平均风险发生率”为任一物流接收方地址可能发生非法事件的概率,具体可以为所有有效性等级下的“正样本数量”与所有有效性等级下的“总样本数量”的比值;“风险倍数”与所属有效性等级下的“风险发生率”相对应,具体可以为“风险发生率”与“平均风险发生率”的比值。
(2)对应于类别信息的风险发生率(比如统称为“第二风险发生率”)
步骤302B,创建地址类别。
在本实施例中,基于预先创建的地址信息数据库,可以根据物流接收方地址与该地址信息数据库之间可能的匹配结果,建立多个地址类别。
作为一示例性实施方式,比如地址类别可以分为表2所示的20种,或者也可以采用其他分类方式,或者形成其他数量的地址类别,本申请并不对此进行限制。
表2
步骤304B,计算每个地址类别对应的风险发生率。
在本实施例中,与步骤304A相类似地,可以基于已知的账号盗用、诈骗等事件的发生状况,得到已经发生了非法事件的地址正样本和已知为正常地址的地址负样本,并根据各样本地址对应的类别信息,统计出每个地址类别对应的风险发生率,即非法事件的发生率。
比如表2示出了一示例性实施例的所有地址类别以及各个地址类别对应的风险状况。其中,“风险发生率”为相应的地址类别下的物流接收方地址可能发生非法事件的概率,具体可以为“正样本数量”与“总样本(相应地址类别下的正样本和负样本)数量”的比值;“平均风险发生率”为任一物流接收方地址可能发生非法事件的概率,具体可以为所有地址类别下的“正样本数量”与所有地址类别下的“总样本数量”的比值;“风险倍数”与所属地址类别下的“风险发生率”相对应,具体可以为“风险发生率”与“平均风险发生率”的比值。
需要说明的是:对于步骤302A和步骤304A中对于各个有效性等级下的风险发生率统计计算过程,与步骤302B和步骤304B中对于各个地址类别下的风险发生率统计计算过程,具体可以采用贝叶斯算法来实现,且两个计算过程相互独立,并不存在必然的先后顺序。
步骤306,根据每个有效性等级对应的第一风险发生率,以及每个地址类别对应的第二风险发生率,利用决策树算法构建风险决策树。
在本实施例中,基于对有效性等级、地址类别以及风险发生率的统计计算,可以得到如图4所示的风险决策树,用于对需要识别风险状况的物流接收方地址进行风险判定。具体在图4所示的风险决策树中,将风险值线性地划分为0、0.25、0.5、0.75和1等数值,使得最终的用户账号风险概率与该风险值的数值呈线性关系。
步骤308,根据当前选取的待识别账号,获取其中的物流接收方地址,作为待识别地址。
步骤310,根据已建立的风险决策树,确定待识别地址的风险值。
在本实施例中,以图4所示的风险决策树为例。首先,通过将待识别地址与预设的地址信息数据库进行匹配,确定该待识别地址对应的有效性等级和类别信息。然后,将确定的有效性等级和类别信息输入图4所示的风险决策树,即可确定对应的风险值。
比如当待识别地址的有效性等级为4或5时,说明地址信息十分模糊或存在错误,可以直接确定对应的风险值为0.5或1。当待识别地址的有效性等级为1、2或3时,说明该地址具有一定的精确度,需要结合类别信息实现进一步判断;其中,当类别信息为公共设施时,说明地址信息虽然精确,比如待识别地址为“北京市海淀区颐和园昆明湖”时,但不具有确实的可投递性,因而具有较大的风险,对应于风险值0.75,而当类别信息为其他地址类别时,可以根据该地址类别对应的风险倍数进行划分,其中风险倍数大于1时的风险值为0.25,风险倍数小于1时的风险值为0。
步骤312,根据待识别地址的风险值,计算待识别账号的风险概率。
在本实施例中,如果该待识别账号中仅包含一个物流接收方地址,则可以将该地址的风险值直接转换为风险概率,比如该地址的风险值为0.25时,表明该待识别账号的风险概率为25%。如果该待识别账号中包含多个物流接收方地址,则可以对所有地址的风险值进行统计计算,比如:获取待识别账号对应的每个所述物流接收方地址的权重值,其中权重值的大小与物流接收方地址的已创建时长呈负相关;根据权重值,计算所有的物流接收方地址的风险值的加权和,并将加权和转换为待识别账号的风险概率。
图5示出了根据本申请的一示例性实施例的电子设备的示意结构图。请参考图5,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成账号风险的识别装置。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
请参考图6,在软件实施方式中,该账号风险的识别装置可以包括提取单元、匹配单元、获取单元和确定单元。其中:
提取单元,提取对应于待识别账号的物流接收方地址;
匹配单元,将所述物流接收方地址与预设的地址信息数据库进行匹配,得到所述物流接收方地址对应的有效性等级和类别信息;
获取单元,根据预定义的风险值与有效性等级、类别信息之间的映射关系,获取所述物流接收方地址的风险值,其中所述映射关系是根据每个有效性等级分别对应的第一风险发生率和每个类别信息分别对应的第二风险发生率训练得到;
确定单元,根据所述物流接收方地址的风险值,确定所述待识别账号的风险状况。
可选的,
若所述地址信息数据库内不存在所述物流接收方地址,则所述物流接收方地址对应于最低有效性等级;
若所述地址信息数据库内存在所述物流接收方地址,则所述物流接收方地址对应的有效性等级与所述物流接收方地址的准确程度呈正相关。
可选的,
所述第一风险发生率由贝叶斯算法根据属于每个有效性等级的预设样本地址和每个所述样本地址的样本类型计算得到,其中所述样本类型包括已发生风险事件的正样本类型和未发生风险事件的负样本类型;
所述第二风险发生率由贝叶斯算法根据属于每个类别的所述样本地址和每个所述样本地址的样本类型计算得到。
可选的,所述映射关系由决策树算法根据每个有效性等级分别对应的第一风险发生率和每个类别信息分别对应的第二风险发生率训练得到。
可选的,所述确定单元具体用于:
获取所述待识别账号对应的每个所述物流接收方地址的权重值,其中所述权重值的大小与所述物流接收方地址的已创建时长呈负相关;
根据所述权重值,计算所述物流接收方地址的风险值的加权和;
将所述加权和转换为所述待识别账号的风险概率。
因此,本申请通过对物流接收方地址的分析,可以确定该地址的有效性和类别信息,从而准确得到该物流接收方地址的风险值,并进而得到相应账号的风险状况。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。