CN110852080A - 订单地址的识别方法、系统、设备和存储介质 - Google Patents

订单地址的识别方法、系统、设备和存储介质 Download PDF

Info

Publication number
CN110852080A
CN110852080A CN201810865098.5A CN201810865098A CN110852080A CN 110852080 A CN110852080 A CN 110852080A CN 201810865098 A CN201810865098 A CN 201810865098A CN 110852080 A CN110852080 A CN 110852080A
Authority
CN
China
Prior art keywords
address
order
addr
terms
hierarchy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810865098.5A
Other languages
English (en)
Inventor
赵孝松
罗尚勇
游正朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201810865098.5A priority Critical patent/CN110852080A/zh
Publication of CN110852080A publication Critical patent/CN110852080A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种订单地址的识别方法、系统、设备和存储介质,其中,识别方法包括:按照地址层级将待识别的订单地址切分为多个地址词项;分别统计每一地址词项对应的目标订单的数量;判断地址层级较低的地址词项对应的目标订单的数量是否大于地址层级较高的地址词项对应的目标订单的数量;若是,则确定所述订单地址是恶意地址。本发明中的恶意地址的识别模式能够更加稳健、全面的识别出恶意地址,并且不需要构建恶意地址库,且可以适用于任何需要识别恶意地址的场景。

Description

订单地址的识别方法、系统、设备和存储介质
技术领域
本发明涉及互联网技术领域,尤其涉及一种订单地址的识别方法、系统、设备和存储介质。
背景技术
在B2C(Business to Customer,商对客电子商务模式)等经营方式中,为了达到营销效果,店家或者平台往往会推出众多惠及普通消费者的优惠促销活动。但是,许多具有恶意企图的用户为了不法牟利,通常通过大量抢占低价商品资源,再以高价卖出的方式,来实施作弊行为。通过识别恶意下单所生成的订单中的恶意地址,以实现对恶意下单行为的拦截,这种从恶意地址识别角度出发进行反作弊的方式称为地址反作弊方法。
CN106296344号专利公开了一种基于模板匹配的恶意地址识别方法及装置,该方法主要包括:当获取到订单的订单地址后,对该地址进行分词处理,得到多个字符;然后基于这些字符获得目标地址匹配模板;再将该目标地址匹配模板与存储的恶意地址模板库进行比对,如果有至少一个存在的恶意地址模板与该目标地址模板匹配,则判定该订单地址为恶意地址。
但是,上述基于模板匹配的恶意地址识别方法在创建恶意地址库模板的时候,需要输入大量的恶意地址模板,否则会漏掉很多恶意地址,正确率无法保证。并且,在该方法中,维护和更新恶意地址库的成本开销比较大,如果库更新不及时,同样会漏掉很多恶意地址。此外,该种方法可能会误杀正常用户的订单地址。
发明内容
本发明要解决的技术问题是为了克服现有技术中基于模板匹配来识别恶意地址的方式成本高且效果欠佳的缺陷,提供一种订单地址的识别方法、系统、设备和存储介质。
本发明是通过下述技术方案来解决上述技术问题:
一种订单地址的识别方法,其特点在于,所述识别方法包括:
按照地址层级将待识别的订单地址切分为多个地址词项;
分别统计每一地址词项对应的目标订单的数量;
判断地址层级较低的地址词项对应的目标订单的数量是否大于地址层级较高的地址词项对应的目标订单的数量;
若是,则确定所述订单地址是恶意地址。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特点在于,所述处理器执行所述计算机程序时实现上述任一种订单地址的识别方法。
一种计算机可读存储介质,其上存储有计算机程序,其特点在于,所述计算机程序被处理器执行时实现上述任一种订单地址的识别方法的步骤。
一种订单地址的识别系统,其特点在于,所述识别系统包括:
切分模块,用于按照地址层级将待识别的订单地址切分为多个地址词项;
第一统计模块,用于分别统计每一地址词项对应的目标订单的数量;
第一判断模块,用于判断地址层级较低的地址词项对应的目标订单的数量是否大于地址层级较高的地址词项对应的目标订单的数量;
识别模块,用于在所述第一判断模块判断为是时,确定所述订单地址是恶意地址。
本发明的积极进步效果在于:本发明基于对大量订单数据的分析所得到的恶意地址表现模式,通过判断同一订单抽取特征前提下,订单地址各地址词项所对应的订单数量是否呈现出低层级地址词项的订单数量大于高层级地址词项的订单数量这一模式来判断该订单地址是否为恶意地址,这种恶意地址的识别模式能够更加稳健、全面的识别出恶意地址,并且不需要构建恶意地址库,也就避免了恶意地址库泄露所带来的安全风险以及为了维护恶意地址库所耗费的成本,可以适用于任何需要识别恶意地址的场景。
附图说明
图1为根据本发明实施例1的订单地址的识别方法的流程图。
图2为根据本发明实施例2的电子设备的硬件结构示意图。
图3为根据本发明实施例4的订单地址的识别方法的部分流程图。
图4为根据本发明实施例7的订单地址的识别方法的部分流程图。
图5为根据本发明实施例10的订单地址的识别方法的部分流程图。
图6为根据本发明实施例13的订单地址的识别系统的模块示意图。
图7为根据本发明实施例14的订单地址的识别系统的模块示意图。
图8为根据本发明实施例15的订单地址的识别系统的模块示意图。
图9为根据本发明实施例16的订单地址的识别系统的模块示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
本实施例提供一种订单地址的识别方法,图1示出了本实施例的流程图。参见图1,本实施例的识别方法包括:
S1、设置至少一个订单查询条件;
S2、根据订单查询条件进行订单查询;
具体地,订单可以包括:下单账户、下单IP、下单时间、订单地址、收货电话、收货人姓名、SPU(Standard Product Unit,标准产品单位)、SKU(Stock Keeping Unit,库存计量单位)等订单维度特征,订单查询条件可以包括单个订单维度特征,或者多个订单维度特征的组合,例如,订单区域&收货电话&SKU可以组成一个订单查询条件,下单账户&下单IP&时间区间可以组成另一个订单查询条件。通过这种方式,可以获得至少一个订单查询条件Vj(j=1、2…M,M是正整数)的订单查询条件集合
Figure BDA0001750712160000031
Figure BDA0001750712160000032
分别根据订单查询条件Vj进行查询,从而,获得与订单查询条件Vj匹配的多个目标订单。
S3、按照地址层级将待识别的订单地址切分为多个地址词项;
地址层级按照由高到低的顺序可以为:一级地址,包括省、自治区、直辖市等;二级地址,包括地级市、自治州等;三级地址,包括市辖区、县、自治县、县级市等;四级地址,包括镇、乡、街道、区公所等;五级地址,包括路等;六级地址,包括街(巷)、里(弄)等;七级地址,包括门牌号码(建筑物名称)等;再往下,还可以包括在建筑物中的具体楼层、座号等。
在本实施例中,可以按照“省|市|县|区|镇|村|街|道|路|段|巷|组|弄|号|號|苑|院|…”这种地址层级进行切分,例如,对“重庆市江津区德感镇大悦城XX栋XX号”进行切分后,得到的地址词项集合为:{重庆、江津、德感、大悦城、XX栋、XX号}。这种切分订单地址的方式,可以获得包括多个地址词项addri(i=1、2…N,N是正整数)的地址词项集合
Figure BDA0001750712160000041
S4、分别统计每一地址词项对应的目标订单的数量;
具体地,在步骤S4中,将订单查询条件集合
Figure BDA0001750712160000042
与地址词项集合
Figure BDA0001750712160000043
进行笛卡尔积,得到组合特征维度
Figure BDA0001750712160000044
分别统计每一组合特征维度下的目标订单的数量向量
Figure BDA0001750712160000045
其中,
Figure BDA0001750712160000046
表示在订单查询条件Vj下,地址词项addri对应的目标订单的数量,也即,其地址信息中包括地址词项addri的目标订单的数量。
S5、判断地址层级较低的地址词项对应的目标订单的数量是否大于地址层级较高的地址词项对应的目标订单的数量;
若是,则转至步骤S6;
S6、确定订单地址是恶意地址。
应当理解,就正常地址而言,随着地址层级的降低,地址词项呈树状分布,也即,地址层级较高的单个地址词项对应于地址层级较低的多个地址词项,例如,上海市可以对应于徐汇区、浦东新区等。相应地,地址层级较高的地址词项对应的目标订单的数量应当大于地址层级较低的地址词项对应的目标订单的数量
具体地,在步骤S5和S6中判断,在
Figure BDA0001750712160000051
中是否存在cij>ci‘j(i′=1、2…N,N是正整数,并且i’<i)的情形,若存在,则可以确定该订单地址中,存在地址层级较低的地址词项对应的目标订单的数量大于地址层级较高的地址词项对应的目标订单的数量的情形,进而也就存在地址层级较低的地址词项对应于多个地址层级较高的地址词项的情形,这有悖于正常的地址模式,从而可以确定该订单地址是恶意地址。
更具体地,在步骤S5之前,本实施例的识别方法还可以包括按照地址层级由高到低的顺序对所述多个地址词项进行排序的步骤。
此外,在本实施例中,i-i’=1,也即,地址层级较低cij的地址词项与地址层级较高ci‘j的地址词项是在顺序上相邻的两个地址词项。
在本实施例中,若在步骤S1中设置多个订单查询条件,则分别对各个订单查询条件进行相同处理,也即,对于多个订单查询条件中的每一个,分别进行上述步骤S2-S6的操作,以确定各订单查询条件下的恶意地址。
在本实施例中,基于恶意地址可以表现为不符合地址层级较高的单个地址词项对应于地址层级较低的多个地址词项这种模式,通过判断同一订单抽取特征前提下,订单地址各地址词项所对应的订单数量是否呈现出低层级地址词项的订单数量大于高层级地址词项的订单数量来判断该订单地址是否为恶意地址,这种恶意地址的识别模式能够更加稳健、全面的识别出恶意地址,并且不需要构建恶意地址库,也就避免了恶意地址库泄露所带来的安全风险以及为了维护恶意地址库所耗费的成本,可以适用于任何需要识别恶意地址的场景。
实施例2
本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例1提供的订单地址的识别方法。
图2示出了本实施例的硬件结构示意图,如图2所示,电子设备9具体包括:
至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93,其中:
总线93包括数据总线、地址总线和控制总线。
存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1所提供的订单地址的识别方法。
电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例3
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1提供的订单地址的识别方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1中的订单地址的识别方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
实施例4
本实施例提供的订单地址的识别方法是对实施例1的进一步改进,参见图3,本实施例较之实施例1的区别在于,在步骤S5判断为是之后,本实施例的识别方法还包括:
S71、统计与订单查询条件Vj匹配的目标订单的数量oj
具体地,对订单查询条件集合
Figure BDA0001750712160000071
中的每一个订单查询条件Vj统计目标订单的数量,得到各订单查询条件Vj下目标订单的数量向量
Figure BDA0001750712160000072
其中,表示在订单查询条件Vj对应的目标订单的数量。
S72、根据下式计算地址词项addri在订单查询条件Vj下的风险程度值dValue(addri|Vj):
dValue(addri|Vj)=NormRate(addri|Vj)-NormRate(addri-1|Vj),其中,
Figure BDA0001750712160000074
S73、判断风险程度值dValue(addri|Vj)的最大值是否大于第一阈值;
若是,则转至步骤S6。
在本实施例中,i>1,对相邻的地址词项的目标订单占比进行差分,如果dValue(addri|Vj)>0,则说明addri-1和addri不符合地址层级较高的单个地址词项对应于地址层级较低的多个地址词项这种正常的地址模式,如果dValue(addri|Vj)接近1,则说明该订单地址严重不符合正常的地址模式,可以根据实际需要对第一阈值进行设置,以筛选出不同风险程度的恶意地址。此外,如果dValue(addri|Vj)<0,则说明该订单地址符合正常的地址模式。
本实施例在实施例1的基础上,提供一种对恶意地址的风险程度进行量化的方法,能够更加稳健、全面的识别出恶意地址。
实施例5
本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例4提供的订单地址的识别方法。
实施例6
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例4提供的订单地址的识别方法的步骤。
实施例7
本实施例提供的订单地址的识别方法是对实施例1的进一步改进,参见图4,本实施例较之实施例1的区别在于,在步骤S5判断为是之后,本实施例的识别方法还包括:
S81、统计与订单查询条件Vj匹配的目标订单的数量oj
具体地,对订单查询条件集合
Figure BDA0001750712160000081
中的每一个订单查询条件Vj统计目标订单的数量,得到各订单查询条件Vj下目标订单的数量向量
Figure BDA0001750712160000082
其中,表示在订单查询条件Vj对应的目标订单的数量。
S82、统计与订单查询条件Vj匹配的目标订单中的不同地址数aj
具体地,在订单查询条件集合中的每一个订单查询条件Vj下,对不同的订单地址的数量进行统计,得到各订单查询条件Vj下目标订单中的不同地址数向量
Figure BDA0001750712160000091
其中,
Figure BDA0001750712160000092
表示在订单查询条件Vj对应的目标订单中的不同地址数。
S83、根据下式计算地址词项addri在订单查询条件Vj下的风险程度值dValue(addri|Vj):
dValue(addri|Vj)=NormRate(addri|Vj)-NormRate(addri-1|Vj),其中,
S84、根据下式计算地址词项addri在订单查询条件Vj下的线性风险值risk(addri|Vj):
risk(addri|Vj)=(cij*dValue(addri|Vj))*(αj)*(βj),其中,
Figure BDA0001750712160000094
Figure BDA0001750712160000095
具体地,βj用于表征在订单查询条件Vj下dValue为最大dValue的地址词项的个数。
S85、判断线性风险值risk(addri|Vj)的最大值是否大于第二阈值;
若是,则转至步骤S6。
本实施例在计算线性风险值时,还引入了辅助因子αj、βj来调节线性风险值,使得线性风险值变得更鲁棒。可以根据实际需要来设置第二阈值,以筛选出处于不同线性风险值范围的恶意地址。从而,本实施例在实施例1的基础上,提供一种对恶意地址的风险值进行量化的方法,能够更加稳健、全面的识别出恶意地址。
实施例8
本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例7提供的订单地址的识别方法。
实施例9
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例7提供的订单地址的识别方法的步骤。
实施例10
本实施例提供的订单地址的识别方法是对实施例1的进一步改进,参见图5,本实施例较之实施例1的区别在于,在步骤S5判断为是之后,本实施例的识别方法还包括:
S91、统计与订单查询条件Vj匹配的目标订单的数量oj
具体地,对订单查询条件集合
Figure BDA0001750712160000101
中的每一个订单查询条件Vj统计目标订单的数量,得到各订单查询条件Vj下目标订单的数量向量其中,
Figure BDA0001750712160000103
表示在订单查询条件Vj对应的目标订单的数量。
S92、统计与订单查询条件Vj匹配的目标订单中的不同地址数aj
具体地,在订单查询条件集合
Figure BDA0001750712160000104
中的每一个订单查询条件Vj下,对不同的订单地址的数量进行统计,得到各订单查询条件Vj下目标订单中的不同地址数向量
Figure BDA0001750712160000105
其中,
Figure BDA0001750712160000106
表示在订单查询条件Vj对应的目标订单中的不同地址数。
S93、根据下式计算地址词项addri在订单查询条件Vj下的风险程度值dValue(addri|Vj):
dValue(addri|Vj)=NormRate(addri|Vj)-NormRate(addri-1|Vj),其中,
Figure BDA0001750712160000107
S94、根据下式计算地址词项addri在订单查询条件Vj下的线性风险值risk(addri|Vj):
risk(addri|Vj)=(cij*dValue(addri|Vj))*(αj)*(βj),其中,
Figure BDA0001750712160000108
Figure BDA0001750712160000109
具体地,βj用于表征在订单查询条件Vj下dValue为最大dValue的地址词项的个数。
S95、根据下式计算地址词项addri在订单查询条件Vj下的非线性风险值risk_tanh(addri|Vj):
S96、判断非线性风险值risk_tanh(addri|Vj)的最大值是否大于第三阈值;
若是,则转至步骤S6。
在本实施例中,对双曲函数
Figure BDA0001750712160000112
进行了适当改造,其中,γ可以进一步取值为1.2,来计算非线性风险值。
此外,本实施例在计算风险值时,还引入了辅助因子αj、βj来调节风险值,使得风险值变得更鲁棒。可以根据实际需要来设置第三阈值,以筛选出处于不同非线性风险值范围的恶意地址。从而,本实施例在实施例1的基础上,提供一种对恶意地址的风险值进行量化的方法,能够更加稳健、全面的识别出恶意地址。
实施例11
本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例10提供的订单地址的识别方法。
实施例12
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例10提供的订单地址的识别方法的步骤。
实施例13
本实施例提供一种订单地址的识别系统,图6示出了本实施例的模块示意图。参见图6,本实施例的识别系统包括:
设置模块1,用于设置至少一个订单查询条;
查询模块2,用于根据订单查询条件进行订单查询;
具体地,订单可以包括:下单账户、下单IP、下单时间、订单地址、收货电话、收货人姓名、SPU(Standard Product Unit,标准产品单位)、SKU(Stock Keeping Unit,库存计量单位)等订单维度特征,订单查询条件可以包括单个订单维度特征,或者多个订单维度特征的组合,例如,订单区域&收货电话&SKU可以组成一个订单查询条件,下单账户&下单IP&时间区间可以组成另一个订单查询条件。通过这种方式,可以获得至少一个订单查询条件Vj(j=1、2…M,M是正整数)的订单查询条件集合分别根据订单查询条件Vj进行查询,从而,获得与订单查询条件Vj匹配的多个目标订单。
切分模块3,用于按照地址层级将待识别的订单地址切分为多个地址词项;
地址层级按照由高到低的顺序可以为:一级地址,包括省、自治区、直辖市等;二级地址,包括地级市、自治州等;三级地址,包括市辖区、县、自治县、县级市等;四级地址,包括镇、乡、街道、区公所等;五级地址,包括路等;六级地址,包括街(巷)、里(弄)等;七级地址,包括门牌号码(建筑物名称)等;再往下,还可以包括在建筑物中的具体楼层、座号等。
在本实施例中,切分模块2可以按照“省|市|县|区|镇|村|街|道|路|段|巷|组|弄|号|號|苑|院|…”这种地址层级进行切分,例如,对“重庆市江津区德感镇大悦城XX栋XX号”进行切分后,得到的地址词项集合为:{重庆、江津、德感、大悦城、XX栋、XX号}。这种切分订单地址的方式,可以获得包括多个地址词项addri(i=1、2…N,N是正整数)的地址词项集合
Figure BDA0001750712160000122
第一统计模块4,用于分别统计每一地址词项对应的目标订单的数量;
具体地,将订单查询条件集合
Figure BDA0001750712160000123
与地址词项集合
Figure BDA0001750712160000124
进行笛卡尔积,得到组合特征维度
Figure BDA0001750712160000125
分别统计每一组合特征维度下的目标订单的数量向量
Figure BDA0001750712160000126
其中,表示在订单查询条件Vj下,地址词项addri对应的目标订单的数量,也即,其地址信息中包括地址词项addri的目标订单的数量。
第一判断模块5用于判断地址层级较低的地址词项对应的目标订单的数量是否大于地址层级较高的地址词项对应的目标订单的数量;
识别模块6,用于在第一判断模块5判断为是时,确定订单地址是恶意地址。
应当理解,就正常地址而言,随着地址层级的降低,地址词项呈树状分布,也即,地址层级较高的单个地址词项对应于地址层级较低的多个地址词项,例如,上海市可以对应于徐汇区、浦东新区等。相应地,地址层级较高的地址词项对应的目标订单的数量应当大于地址层级较低的地址词项对应的目标订单的数量
具体地,第一判断模块5判断在
Figure BDA0001750712160000131
中是否存在cij>ci‘j(i′=1、2…N,N是正整数,并且i’<i)的情形,若存在,则可以确定该订单地址中,存在地址层级较低的地址词项对应的目标订单的数量大于地址层级较高的地址词项对应的目标订单的数量的情形,进而也就存在地址层级较低的地址词项对应于多个地址层级较高的地址词项的情形,这有悖于正常的地址模式,从而识别模块6可以确定该订单地址是恶意地址。
更具体地,本实施例的识别系统还可以包括排序模块,用于按照地址层级由高到低的顺序对所述多个地址词项进行排序。
此外,在本实施例中,i-i’=1,也即,地址层级较低cij的地址词项与地址层级较高ci‘j的地址词项是在顺序上相邻的两个地址词项。
在本实施例中,若设置模块1设置多个订单查询条件,则分别对各个订单查询条件进行相同处理,也即,对于多个订单查询条件中的每一个,分别适用上述模块,以确定各订单查询条件下的恶意地址。
在本实施例中,基于恶意地址可以表现为不符合地址层级较高的单个地址词项对应于地址层级较低的多个地址词项这种模式,通过判断同一订单抽取特征前提下,订单地址各地址词项所对应的订单数量是否呈现出低层级地址词项的订单数量大于高层级地址词项的订单数量来判断该订单地址是否为恶意地址,这种恶意地址的识别模式能够更加稳健、全面的识别出恶意地址,并且不需要构建恶意地址库,也就避免了恶意地址库泄露所带来的安全风险以及为了维护恶意地址库所耗费的成本,可以适用于任何需要识别恶意地址的场景。
实施例14
本实施例提供的订单地址的识别系统是对实施例13的进一步改进,参见图7,本实施例较之实施例13的区别在于,本实施例的识别系统还包括:
第二统计模块141,用于统计与订单查询条件Vj匹配的目标订单的数量oj
具体地,对订单查询条件集合
Figure BDA0001750712160000141
中的每一个订单查询条件Vj统计目标订单的数量,得到各订单查询条件Vj下目标订单的数量向量
Figure BDA0001750712160000142
其中,
Figure BDA0001750712160000143
表示在订单查询条件Vj对应的目标订单的数量。
第一计算模块142,用于当第一判断模块5判断为是时,根据下式计算地址词项addri在订单查询条件Vj下的风险程度值dValue(addri|Vj):
dValue(addri|Vj)=NormRate(addri|Vj)-NormRate(addri-1|Vj),其中,
第二判断模块143,用于判断风险程度值dValue(addri|Vj)的最大值是否大于第一阈值;
识别模块6用于在第二判断模块143判断为是时,确定订单地址是恶意地址。
在本实施例中,i>1,对相邻的地址词项的目标订单占比进行差分,如果dValue(addri|Vj)>0,则说明addri-1和addri不符合地址层级较高的单个地址词项对应于地址层级较低的多个地址词项这种正常的地址模式,如果dValue(addri|Vj)接近1,则说明该订单地址严重不符合正常的地址模式,可以根据实际需要对第一阈值进行设置,以筛选出不同风险程度的恶意地址。此外,如果dValue(addri|Vj)<0,则说明该订单地址符合正常的地址模式。
本实施例在实施例13的基础上,提供一种对恶意地址的风险程度进行量化的系统,能够更加稳健、全面的识别出恶意地址。
实施例15
本实施例提供的订单地址的识别系统是对实施例13的进一步改进,参见图8,本实施例较之实施例13的区别在于,本实施例的识别系统还包括:
第二统计模块151,用于统计与订单查询条件Vj匹配的目标订单的数量oj
具体地,对订单查询条件集合
Figure BDA0001750712160000159
中的每一个订单查询条件Vj统计目标订单的数量,得到各订单查询条件Vj下目标订单的数量向量
Figure BDA0001750712160000151
其中,
Figure BDA0001750712160000152
表示在订单查询条件Vj对应的目标订单的数量。
第三统计模块152,用于统计与订单查询条件Vj匹配的目标订单中的不同地址数aj
具体地,在订单查询条件集合中的每一个订单查询条件Vj下,对不同的订单地址的数量进行统计,得到各订单查询条件Vj下目标订单中的不同地址数向量
Figure BDA0001750712160000154
其中,
Figure BDA0001750712160000155
表示在订单查询条件Vj对应的目标订单中的不同地址数。
第一计算模块153,用于当第一判断模块5判断为是时,根据下式计算地址词项addri在订单查询条件Vj下的风险程度值dValue(addri|Vj):
dValue(addri|Vj)=NormRate(addri|Vj)-NormRate(addri-1|Vj),其中,
Figure BDA0001750712160000156
第二计算模块154,用于根据下式计算地址词项addri在订单查询条件Vj下的线性风险值risk(addri|Vj):
risk(addri|Vj)=(cij*dValue(addri|Vj))*(αj)*(βj),其中,
Figure BDA0001750712160000157
Figure BDA0001750712160000158
具体地,βj用于表征在订单查询条件Vj下dValue为最大dValue的地址词项的个数。
第三判断模块155,用于判断线性风险值risk(addri|Vj)的最大值是否大于第二阈值;
识别模块6用于在第三判断模块155判断为是时,确定订单地址是恶意地址。
本实施例在计算线性风险值时,还引入了辅助因子αj、βj来调节线性风险值,使得线性风险值变得更鲁棒。可以根据实际需要来设置第二阈值,以筛选出处于不同线性风险值范围的恶意地址。从而,本实施例在实施例13的基础上,提供一种对恶意地址的风险值进行量化的系统,能够更加稳健、全面的识别出恶意地址。
实施例16
本实施例提供的订单地址的识别系统是对实施例13的进一步改进,参见图9,本实施例较之实施例13的区别在于,本实施例的识别系统还包括:
第二统计模块161,用于统计与订单查询条件Vj匹配的目标订单的数量oj
具体地,对订单查询条件集合中的每一个订单查询条件Vj统计目标订单的数量,得到各订单查询条件Vj下目标订单的数量向量
Figure BDA0001750712160000162
其中,
Figure BDA0001750712160000163
表示在订单查询条件Vj对应的目标订单的数量。
第三统计模块162,用于统计与订单查询条件Vj匹配的目标订单中的不同地址数aj
具体地,在订单查询条件集合
Figure BDA0001750712160000164
中的每一个订单查询条件Vj下,对不同的订单地址的数量进行统计,得到各订单查询条件Vj下目标订单中的不同地址数向量
Figure BDA0001750712160000165
其中,
Figure BDA0001750712160000166
表示在订单查询条件Vj对应的目标订单中的不同地址数。
第一计算模块163,用于当第一判断模块5判断为是时,根据下式计算地址词项addri在订单查询条件Vj下的风险程度值dValue(addri|Vj):
dValue(addri|Vj)=NormRate(addri|Vj)-NormRate(addri-1|Vj),其中,
Figure BDA0001750712160000171
第二计算模块164,用于根据下式计算地址词项addri在订单查询条件Vj下的线性风险值risk(addri|Vj):
risk(addri|Vj)=(cij*dValue(addri|Vj))*(αj)*(βj),其中,
Figure BDA0001750712160000172
Figure BDA0001750712160000173
具体地,βj用于表征在订单查询条件Vj下dValue为最大dValue的地址词项的个数。
第三计算模块165,用于根据下式计算地址词项addri在订单查询条件Vj下的非线性风险值risk_tanh(addri|Vj):
Figure BDA0001750712160000174
第四判断模块166,用于判断非线性风险值risk_tanh(addri|Vj)的最大值是否大于第三阈值;
识别模块6用于在第四判断模块166判断为是时,确定订单地址是恶意地址。
在本实施例中,对双曲函数
Figure BDA0001750712160000175
进行了适当改造,其中,γ可以进一步取值为1.2,来计算非线性风险值。
此外,本实施例在计算风险值时,还引入了辅助因子αj、βj来调节风险值,使得风险值变得更鲁棒。可以根据实际需要来设置第三阈值,以筛选出处于不同非线性风险值范围的恶意地址。从而,本实施例在实施例13的基础上,提供一种对恶意地址的风险值进行量化的系统,能够更加稳健、全面的识别出恶意地址。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (12)

1.一种订单地址的识别方法,其特征在于,所述识别方法包括:
按照地址层级将待识别的订单地址切分为多个地址词项;
分别统计每一地址词项对应的目标订单的数量;
判断地址层级较低的地址词项对应的目标订单的数量是否大于地址层级较高的地址词项对应的目标订单的数量;
若是,则确定所述订单地址是恶意地址。
2.如权利要求1所述的订单地址的识别方法,其特征在于,在所述按照地址层级将待识别的订单地址切分为多个地址词项的步骤之前,所述识别方法还包括:
设置至少一个订单查询条件;
根据所述订单查询条件进行订单查询,得到多个目标订单。
3.如权利要求2所述的订单地址的识别方法,其特征在于,在所述判断地址层级较低的地址词项对应的目标订单的数量是否大于地址层级较高的地址词项对应的目标订单的数量的步骤之前,所述识别方法还包括:
按照地址层级由高到低的顺序对所述多个地址词项进行排序;
其中,所述地址层级较低的地址词项与所述地址层级较高的地址词项是在顺序上相邻的两个地址词项。
4.如权利要求3所述的订单地址的识别方法,其特征在于,令所述订单查询条件为Vj(j=1、2…M,M是正整数),所述待识别的订单地址按照地址层级被切分为多个地址词项addri(i=1、2…N,N是正整数),在订单查询条件Vj下,地址词项addri对应的目标订单的数量为cij,所述识别方法还包括:
统计与订单查询条件Vj匹配的目标订单的数量oj
当判断地址层级较低的地址词项所对应的目标订单的数量大于地址层级较高的地址词项所对应的目标订单的数量时,所述识别方法还包括:
根据下式计算地址词项addri在订单查询条件Vj下的风险程度值dValue(addri|Vj):
dValue(addri|Vj)=NormRate(addri|Vj)-NormRate(addri-1|Vj),其中,
判断风险程度值dValue(addri|Vj)的最大值是否大于第一阈值;
若是,则确定所述订单地址是恶意地址。
5.如权利要求2所述的订单地址的识别方法,其特征在于,所述订单查询条件包括单个订单维度特征,或者多个订单维度特征的组合。
6.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-5中任一项所述的订单地址的识别方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的订单地址的识别方法的步骤。
8.一种订单地址的识别系统,其特征在于,所述识别系统包括:
切分模块,用于按照地址层级将待识别的订单地址切分为多个地址词项;
第一统计模块,用于分别统计每一地址词项对应的目标订单的数量;
第一判断模块,用于判断地址层级较低的地址词项对应的目标订单的数量是否大于地址层级较高的地址词项对应的目标订单的数量;
识别模块,用于在所述第一判断模块判断为是时,确定所述订单地址是恶意地址。
9.如权利要求8所述的订单地址的识别系统,其特征在于,所述识别系统还包括:
设置模块,用于设置至少一个订单查询条件;
查询模块,用于根据所述订单查询条件进行订单查询,得到多个目标订单。
10.如权利要求9所述的订单地址的识别系统,其特征在于,所述识别系统还包括排序模块,用于按照地址层级由高到低的顺序对所述多个地址词项进行排序;
其中,所述地址层级较低的地址词项与所述地址层级较高的地址词项是在顺序上相邻的两个地址词项。
11.如权利要求10所述的订单地址的识别系统,其特征在于,令所述订单查询条件为Vj(j=1、2…M,M是正整数),所述待识别的订单地址按照地址层级被切分为多个地址词项addri(i=1、2…N,N是正整数),在订单查询条件Vj下,地址词项addri对应的目标订单的数量为cij,所述识别系统还包括:
第二统计模块,用于统计与订单查询条件Vj匹配的目标订单的数量oj
第一计算模块,用于当所述第一判断模块判断为是时,根据下式计算地址词项addri在订单查询条件Vj下的风险程度值dValue(addri|Vj):
dValue(addri|Vj)=NormRate(addri|Vj)-NormRate(addri-1|Vj),其中,
Figure FDA0001750712150000031
第二判断模块,用于判断风险程度值dValue(addri|Vj)的最大值是否大于第一阈值;
所述识别模块用于在所述第二判断模块判断为是时,确定所述订单地址是恶意地址。
12.如权利要求9所述的订单地址的识别系统,其特征在于,所述订单查询条件包括单个订单维度特征,或者多个订单维度特征的组合。
CN201810865098.5A 2018-08-01 2018-08-01 订单地址的识别方法、系统、设备和存储介质 Pending CN110852080A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810865098.5A CN110852080A (zh) 2018-08-01 2018-08-01 订单地址的识别方法、系统、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810865098.5A CN110852080A (zh) 2018-08-01 2018-08-01 订单地址的识别方法、系统、设备和存储介质

Publications (1)

Publication Number Publication Date
CN110852080A true CN110852080A (zh) 2020-02-28

Family

ID=69594385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810865098.5A Pending CN110852080A (zh) 2018-08-01 2018-08-01 订单地址的识别方法、系统、设备和存储介质

Country Status (1)

Country Link
CN (1) CN110852080A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113112323A (zh) * 2021-03-16 2021-07-13 中国平安财产保险股份有限公司 基于数据分析的异常订单识别方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389722A (zh) * 2015-11-20 2016-03-09 小米科技有限责任公司 恶意订单识别方法及装置
CN106251202A (zh) * 2016-07-29 2016-12-21 北京小米移动软件有限公司 恶意订单识别方法及装置
CN106959961A (zh) * 2016-01-11 2017-07-18 阿里巴巴集团控股有限公司 一种地址识别方法及装置
CN107203522A (zh) * 2016-03-16 2017-09-26 北京京东尚科信息技术有限公司 一种恶意订单地址的判定方法和装置
WO2018040944A1 (zh) * 2016-08-31 2018-03-08 阿里巴巴集团控股有限公司 恶意地址/恶意订单的识别系统、方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389722A (zh) * 2015-11-20 2016-03-09 小米科技有限责任公司 恶意订单识别方法及装置
CN106959961A (zh) * 2016-01-11 2017-07-18 阿里巴巴集团控股有限公司 一种地址识别方法及装置
CN107203522A (zh) * 2016-03-16 2017-09-26 北京京东尚科信息技术有限公司 一种恶意订单地址的判定方法和装置
CN106251202A (zh) * 2016-07-29 2016-12-21 北京小米移动软件有限公司 恶意订单识别方法及装置
WO2018040944A1 (zh) * 2016-08-31 2018-03-08 阿里巴巴集团控股有限公司 恶意地址/恶意订单的识别系统、方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113112323A (zh) * 2021-03-16 2021-07-13 中国平安财产保险股份有限公司 基于数据分析的异常订单识别方法、装置、设备及介质
CN113112323B (zh) * 2021-03-16 2023-06-27 中国平安财产保险股份有限公司 基于数据分析的异常订单识别方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN107945024B (zh) 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质
US20140172681A1 (en) Process for Verifying Data Identity for Lending Decisions
WO2019061994A1 (zh) 电子装置、保险产品推荐方法、系统及计算机可读存储介质
US20160306808A1 (en) Computer-implemented method for determining roof age of a structure
CN111125343A (zh) 适用于人岗匹配推荐系统的文本解析方法及装置
CN110704572A (zh) 疑似非法集资风险的预警方法、装置、设备和存储介质
CN111460312A (zh) 空壳企业识别方法、装置及计算机设备
CN109255000B (zh) 一种标签数据的维度管理方法及装置
CN110533521B (zh) 动态贷后预警方法、装置、设备及可读存储介质
CN108241867B (zh) 一种分类方法及装置
CN113361963A (zh) 识别企业风险性的方法及装置
CN113538154A (zh) 风险对象的识别方法、装置、存储介质和电子设备
CN113177700A (zh) 一种风险评估方法、系统、电子设备及存储介质
CN110825817B (zh) 一种企业疑似关联关系判定方法及系统
CN110555713A (zh) 一种确定销量预测模型的方法和装置
US20150193881A1 (en) Computer-implemented method for determining roof age of a structure
CN111681050B (zh) 一种广告推送方法、装置、设备和存储介质
CN110852080A (zh) 订单地址的识别方法、系统、设备和存储介质
CN110688995A (zh) 地图查询的处理方法,计算机可读存储介质和移动终端
CN113112323B (zh) 基于数据分析的异常订单识别方法、装置、设备及介质
CN115809930A (zh) 基于数据融合匹配的反欺诈分析方法、装置、设备及介质
CN116342141A (zh) 一种空壳企业识别方法、装置和设备
CN114219630A (zh) 服务风险预测方法、装置、设备及介质
KR20220090382A (ko) 주택 현황 데이터의 최적화 모델링을 이용한 주택 담보 가치 추정 시스템
CN113591881A (zh) 基于模型融合的意图识别方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination