CN114757201A - 收货地址的识别方法、存储介质和处理器 - Google Patents

收货地址的识别方法、存储介质和处理器 Download PDF

Info

Publication number
CN114757201A
CN114757201A CN202210391025.3A CN202210391025A CN114757201A CN 114757201 A CN114757201 A CN 114757201A CN 202210391025 A CN202210391025 A CN 202210391025A CN 114757201 A CN114757201 A CN 114757201A
Authority
CN
China
Prior art keywords
address
receiving address
order
probability
shipping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210391025.3A
Other languages
English (en)
Inventor
竺晨曦
毛锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202210391025.3A priority Critical patent/CN114757201A/zh
Publication of CN114757201A publication Critical patent/CN114757201A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders
    • G06Q30/0637Approvals

Abstract

本发明公开了一种收货地址的识别方法、存储介质和处理器。其中,该方法包括:获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。本发明解决了对收货地址进行识别的准确度低的技术问题。

Description

收货地址的识别方法、存储介质和处理器
技术领域
本发明涉及计算机领域,具体而言,涉及一种收货地址的识别方法、存储介质和处理器。
背景技术
目前,存在通过编写无法送达的虚假或对抗的收货地址,以达到欺诈商家物品或造成平台资金损失的目的。
为减少由于上述原因导致买家或平台产生损失,在相关技术中,通常是通过一些简单的规则来识别收货地址,存在对收货地址进行识别的准确度低的技术问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种收货地址的识别方法、存储介质和处理器,以至少解决对收货地址进行识别的准确度低的技术问题。
根据本发明实施例的一个方面,提供了一种收货地址的识别方法。该方法可以包括:获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
根据本发明实施例的一个方面,提供了另一种收货地址的识别方法。该方法可以包括:从电商平台获取待处理的订单;在订单中获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态;响应于收货地址处于异常状态,向电商平台输出提示信息,其中,提示信息用于表示订单下单失败。
根据本发明实施例的一个方面,提供了另一种收货地址的识别方法。该方法可以包括:响应作用于操作界面上的输入指令,在操作界面上显示待识别的订单信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;响应作用于操作界面上的识别指令,在操作界面上显示收货地址的识别结果,其中,识别结果用于表示收货地址是否处于异常状态,且在收货地址的异常概率大于概率阈值时,基于目标收货地址确定得到,异常概率为基于订单信息的语义信息确定得到,且用于表示收货地址处于异常状态的可能性,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
根据本发明实施例的一个方面,提供了另一种收货地址的识别方法。该方法可以包括:通过调用第一接口获取待识别的订单信息的语义信息,其中,第一接口包括第一参数,第一参数的参数值为语义信息,订单信息至少包括:用于表征订单中记录的收货地址;基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;响应于异常概率大于概率阈值,基于目标收货地址确定识别结果,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态,识别结果用于表示收货地址是否处于异常状态;通过调用第二接口输出识别结果,其中,第二接口包括第二参数,第二参数的参数值为识别结果。
根据本发明实施例的一个方面,提供了一种收货地址的识别装置。该装置可以包括:第一获取单元,用于获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;第一确定单元,用于基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;第一识别单元,用于响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
根据本发明实施例的一个方面,提供了另一种收货地址的识别装置。该装置可以包括:第二获取单元,用于:从电商平台获取待处理的订单;第三获取单元,用于在订单中获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;第二确定单元,用于基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;第二识别单元,用于响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态;第一输出单元,用于响应于收货地址处于异常状态,向电商平台输出提示信息,其中,提示信息用于表示订单下单失败。
根据本发明实施例的一个方面,提供了另一种收货地址的识别装置。该装置可以包括:第一显示单元,用于响应作用于操作界面上的输入指令,在操作界面上显示待识别的订单信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;第二显示单元,用于响应作用于操作界面上的识别指令,在操作界面上显示收货地址的识别结果,其中,识别结果用于表示收货地址是否处于异常状态,且在收货地址的异常概率大于概率阈值时,基于目标收货地址确定得到,异常概率为基于订单信息的语义信息确定得到,且用于表示收货地址处于异常状态的可能性,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
根据本发明实施例的一个方面,提供了另一种收货地址的识别装置。该装置可以包括:第四获取单元,用于通过调用第一接口获取待识别的订单信息的语义信息,其中,第一接口包括第一参数,第一参数的参数值为语义信息,订单信息至少包括:用于表征订单中记录的收货地址;第三确定单元,用于基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;第四确定单元,用于响应于异常概率大于概率阈值,基于目标收货地址确定识别结果,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态,识别结果用于表示收货地址是否处于异常状态;第二输出单元,用于通过调用第二接口输出识别结果,其中,第二接口包括第二参数,第二参数的参数值为识别结果。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述任意一项的收货地址的识别方法。
根据本发明实施例的另一方面,还提供了一种处理器处理器用于运行程序,其中,程序运行时执行上述任意一项的收货地址的识别方法。
在本发明实施例中,获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。也就是说,本发明通过根据收货地址中的语义信息,确定收货地址的异常概率,进而通过目标收货地址对收货地址进行识别,以确定收货地址是否处于异常状态,由于本发明是在收货地址的语义层面上有效地进行识别,从而实现了提高对收货地址进行识别的准确度的技术效果,进而解决了对收货地址进行识别的准确度低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种收货地址的识别方法的计算机终端(或移动设备)的硬件结构框图;
图2是根据本发明实施例的一种收货地址的识别方法的流程图;
图3是根据本发明实施例的另一种收货地址的识别方法的流程图;
图4是根据本发明实施例的另一种收货地址的识别方法的流程图;
图5是根据本发明实施例的另一种收货地址的识别方法的流程图;
图6是根据本发明实施例的一种虚假对抗地址判定方法的流程图;
图7是根据本发明实施例的一种语言模型预测的示意图;
图8是根据本发明实施例的一种语言模型预训练的示意图;
图9是根据本发明实施例的一种拉近词语向量距离的示意图;
图10是根据本发明实施例的一种收货地址的识别装置的示意图;
图11是根据本发明实施例的另一种收货地址的识别装置的示意图;
图12是根据本发明实施例的另一种收货地址的识别装置的示意图;
图13是根据本发明实施例的另一种收货地址的识别装置的示意图;
图14是根据本发明实施例的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
实数向量(embed),可以为固定长度的实数向量,可以用0-1编码表示,通过将汉字用实数向量表示,以使得向量之间可以进行比较;
余弦距离(cosine距离),可以通过余弦距离评估实数向量之间的远近关系,越大则说明越接近;
统计语言模型(n-gram),n元模型编码,用于将一个句子或词,拆分为更小粒度的n元组的组合;
资损,由于产品设计缺陷、产品实现异常、员工操作错误等,导致公司或者公司客户蒙受直接或间接的资金损失;
对抗地址,随机选取的地址,从而难以确定真实地址信息;
虚假地址,不存在的虚假的地址。
实施例1
根据本发明实施例,还提供了一种收货地址的识别方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现收货地址的识别方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他收货地址的识别电路在本文中通常可以被称为“收货地址的识别电路”。该收货地址的识别电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,收货地址的识别电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该收货地址的识别电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的收货地址的识别方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及收货地址的识别,即实现上述的应用程序的收货地址的识别方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算机设备(或移动设备)可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备(或移动设备)中的部件的类型。
在图1所示的运行环境下,本申请提供了如图2所示的收货地址的识别方法。需要说明的是,该实施例的收货地址的识别方法可以由图1所示实施例的移动终端执行。
图2是根据本发明实施例一的收货地址的识别方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S202,获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址。
在本发明上述步骤S202提供的技术方案中,获取待识别的订单信息,从订单信息中确定语义信息,其中,语义信息可以表征订单信息中记录的收货地址。
可选地,获取待识别的订单信息,比如,可以从用户终端中获取用户的订单记录;基于订单记录的语义信息,确定收货地址。
步骤S204,基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性。
在本发明上述步骤S204提供的技术方案中,可以对语义信息进行判断,确定待识别的订单信息中收货地址的异常概率,其中,异常概率可以为虚假性概率(p(fake)),可以用于表示收货地址处于异常状态的可能性。
可选地,可以将语义信息送入语言模型,语言模型对语义信息进行判断,以确定收货地址的异常概率,需要说明的是,此处不对处理语义信息的模型做具体限值。
可选地,语言模型可以通过字符级别来对异常概率进行判定,从而避免特殊原因造成语言模型失效的问题,比如,用户为了对抗绕过而造成的语言模型失效问题。
步骤S206,响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
在本发明上述步骤S206提供的技术方案中,确定异常概率是否大于概率阈值,响应于异常概率大于概率阈值,则基于目标收货地址对收货地址进行识别,判断收货地址是否处于异常状态,其中,概率阈值可以为根据实际情况设定的值,目标收货地址可以为正常状态下的收货地址,比如,近期输入的正常状态下的地址;也可以为与订单的下单时间与收货地址对应的订单的下单时间相关联的地址信息。
可选地,目标收货地址可以为状态为正常状态下的地址信息,将基于语义信息确定的收货地址与目标收货地址进行比较,确定收货地址的异常概率,响应于异常概率大于预先根据实际需求设定的概率阈值,则判断收货地址处于异常状态,可以为不正常状态下的地址信息,比如,对抗地址信息。
可选地,目标收货地址可以为对应订单的下单时间与收货地址对应的订单的下单时间相关联的地址信息,将基于语义信息确定的收货地址与目标收货地址进行比较,确定收货地址的异常概率,响应于异常概率大于预先根据实际需求设定的概率阈值,则判断收货地址处于异常状态,可以为随机选取的地址,不真实的地址信息,比如,虚假地址信息。
需要说明的是,本发明实施例并不要限制于上述两种情况,此处仅作举例说明,不做具体限定。
通过本申请上述步骤S202至步骤S206,获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。也就是说,本发明通过根据收货地址中的语义信息,确定收货地址的异常概率,进而通过目标收货地址对收货地址进行识别,以确定收货地址是否处于异常状态,由于本发明是在收货地址的语义层面上有效地进行识别,从而实现了提高对收货地址进行识别的准确度的技术效果,进而解决了对收货地址进行识别的准确度低的技术问题。
下面对该实施例的上述方法进行进一步地介绍。
作为一种可选的实施方式,步骤S206,基于目标收货地址识别收货地址是否处于异常状态,包括:基于收货地址的向量和目标收货地址,识别收货地址是否处于异常状态。
在该实施例中,确定收货地址的向量和目标收货地址,其中,收货地址的向量可以用于进行地址的聚合与过滤,可以为实数向量(embed);将收货地址的向量与目标收货地址进行聚合或匹配过滤,以判断收货地址是否处于异常状态。
作为一种可选的实施方式,基于收货地址的向量和目标收货地址,识别收货地址是否处于异常状态,包括:将收货地址的向量和第一收货地址的向量与进行聚合,得到聚合结果,其中,目标收货地址包括第一收货地址,第一收货地址对应的订单的下单时间与收货地址对应的订单的下单时间之差在时间阈值内,聚合结果用于表示与收货地址相聚合的第一收货地址的数量;响应于聚合结果大于聚合阈值,确定收货地址处于异常状态。
在该实施例中,将收货地址的向量与第一收货地址的向量进行聚合,得到聚合结果,确定聚合结果是否大于聚合阈值,响应与聚合结果大于聚合阈值,确定收货地址处于异常状态,其中,第一收货地址可以为目标收货地址中的收货地址对应的订单的下单时间与所述收货地址对应的订单的下单时间相关联中的收货地址,第一收货地址对应的订单的下单时间与收货地址对应的订单的下单时间之差在时间阈值,可以为近期输入地址、聚合具有对抗痕迹的地址;聚合结果用于表示与收货地址相聚合的第一收货地址的数量。
可选地,生成收货地址的向量后,可以通过收货地址的向量的余弦距离,与第一收货地址的向量(比如,近期几个小时内同时下单的不同用户的不同输入地址)进行聚合,得到聚合结果,若聚合数量大于聚合阈值,则可以判定该地址的状态为异常,存在对抗绕过风控的情况,判定为对抗地址,其中,聚合阈值可以为根据实际情况设定的阈值。
作为一种可选的实施方式,基于收货地址的向量和目标收货地址,识别收货地址是否处于异常状态,包括:将收货地址的向量和第二收货地址的向量进行匹配,得到匹配结果,其中,目标收货地址包括第二收货地址,第二收货地址处于正常状态,匹配结果用于表示第二收货地址与收货地址之间的相似度;响应于匹配结果大于匹配阈值,确定收货地址处于正常状态。
在该实施例中,确定收货地址的向量,将收货地址的向量和第二收货地址的向量进行匹配,得到匹配结果,确定匹配结果是否大于匹配阈值,响应于匹配结果大于匹配阈值,确定收货地址处于正常状态,其中,正常状态可以指的是可以被正常发货的状态;第二收货地址可以为目标收货地址中收货地址为正常状态的地址,可以为白地址。
可选地,可以将收货地址的向量于第二收货地址(比如,白地址)的向量进行匹配过滤,即,与所有可以正常发货的地址进行匹配,得到收货地址的向量与第二收货地址向量之间的相似度,响应于相似度大于匹配阈值,则可以判定该收货地址处于正常状态,可以被正常发货,其中,匹配阈值可以为根据实际情况设定的阈值。
作为一种可选的实施方式,基于向量生成模型生成收货地址的向量,其中,向量生成模型为基于第一收货地址样本中的词进行训练得到,词由多元模型编码表示。
在该实施例中,可以基于第一收货地址样本中的词对模型进行训练,得到向量生成模型,其中,第一收货地址样本中的词可以由多元模型编码(ngram)表示;第一收货地址样本可以为大量的地址数据(比如,可以为大量的对抗数据样本)。
可选地,可以通过第一收货地址样本中的词来预测上下文词,以完成对向量生成模型的预训练,在本发明实施例中,词的表示并非是用词本身的映射表示,而是通过多元模型编码为组合形成词进行表示,从而有效的避免了可能存在的对抗问题。
本发明实施例中,为了将收货地址的向量与第一收货地址的向量进行聚合和将收货地址的向量和第二收货地址的向量进行匹配,在对模型进行训练的过程中使有变异对抗或笔误变化的指向同一地点的地址余弦距离尽可能接近,非指向同一地点的地址余弦距离尽可能拉远。
作为一种可选的实施方式,确定第一收货地址样本中的词的上下文词;基于上下文词训练得到向量生成模型。
在该实施例中,确定第一收货地址样本中的词的上下文词,基于上下文词训练得到向量生成模型,以实现通过训练字符级的地址的向量,有效的建模地址语义层面的相似度。
本发明实施例通过字符级别的模型,与分类模型相比,有效的避免了由于样本不足以及空间变化无限导致的准确率下降的问题。
作为一种可选的实施方式,步骤S204,基于语义信息确定收货地址的异常概率,包括:获取语义信息的多个字符;基于多个字符确定异常概率。
在该实施例中,获取语义信息的多个字符,通过对多个字符进行判断,基于多个字符确定异常概率。
作为一种可选的实施方式,基于多个字符确定异常概率,包括:对多个字符进行组合,得到组合结果;基于组合结果所表示的收货地址为完整收货地址的概率,确定异常概率。
在该实施例中,获取语义信息的多个字符,对多个字符进行组合,得到组合结果,基于组合结果所表示的收货地址为完整收货地址的概率,确定异常概率,其中,完整收货地址的概率可以为多个字符能够串联起来形成一个完整地址的概率。
可选地,获取语义信息的多个字符,对多个字符进行组合,通过字符判断这些字符能够串联起来形成一个完整地址的概率值,确定异常概率。
作为一种可选的实施方式,对多个字符进行组合,得到组合结果,包括:基于语言模型对多个字符进行组合,得到组合结果,其中,语言模型为基于第二收货地址样本中的字符进行训练得到。
在该实施例中,基于第二收货地址样本中的字符对语言模型进行训练,得到训练后的语言模型,基于语言模型对多个字符进行组合,得到组合结果,其中第二收货地址样本可以为已送达的真实地址。
可选地,可以将已送达的真实地址作为预训练数据,对模型来进行预训练,得到完整的语言模型,在本发明实施例中,字符级别的语言模型,避免了由于样本不足以及空间变化无限导致的准确率下降的问题。
本发明实施例还提供了另一种收货地址的识别方法。
图3是根据本发明实施例的另一种收货地址的识别方法流程图。如图3所示,该方法可以包括以下步骤。
步骤S302,从电商平台获取待处理的订单。
步骤S304,在订单中获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址。
步骤S306,基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性。
步骤S308,响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
步骤S310,响应于收货地址处于异常状态,向电商平台输出提示信息,其中,提示信息用于表示订单下单失败。
在本发明上述步骤S310提供的技术方案中,确定收货的异常概率是否大于概率阈值,响应于异常概率大于概率阈值,则基于目标收货地址识别收货地址是否处于异常状态,响应与收货地址处于异常状态,则向电商平台输出提示信息,其中,提示信息可以用于表示订单下单失败,可以为显示在电商平台的一组件,上面显示“订单失败”的信息。
本发明实施例还提供了另一种收货地址的识别方法。
图4是根据本发明实施例的另一种收货地址的识别方法流程图。如图4所示,该方法可以包括以下步骤。
步骤S402,响应作用于操作界面上的输入指令,在操作界面上显示待识别的订单信息,其中,订单信息至少包括:用于表征订单中记录的收货地址。
在本发明上述步骤S402提供的技术方案中,输入操作指令可以由用户触发,用于在操作界面上显示待识别的订单信息,从而该实施例响应作用于交互界面上的输入操作指令,从而显示待识别的订单信息,其中,订单信息至少包括:用于表征订单中记录的收货地址。
步骤S404,响应作用于操作界面上的识别指令,在操作界面上显示收货地址的识别结果,其中,识别结果用于表示收货地址是否处于异常状态,且在收货地址的异常概率大于概率阈值时,基于目标收货地址确定得到,异常概率为基于订单信息的语义信息确定得到,且用于表示收货地址处于异常状态的可能性,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
在本发明上述步骤S404提供的技术方案中,响应作用于交互界面上的操作界面上的识别指令,从而对收货地址进行识别,基于订单信息的语义信息和目标收货地址确定收货地址处于异常状态的可能性,得到识别结果,并且将识别结果显示在交互界面上,其中,识别结果用于表示收货地址是否处于异常状态,在收货地址的异常概率大于概率阈值时可以确定收货地址异常;目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
本发明实施例还提供了另一种收货地址的识别方法。
图5是根据本发明实施例的另一种收货地址的识别方法流程图。如图5所示,该方法可以包括以下步骤。
步骤S502,通过调用第一接口获取待识别的订单信息的语义信息,其中,第一接口包括第一参数,第一参数的参数值为语义信息,订单信息至少包括:用于表征订单中记录的收货地址。
在本发明上述步骤S502提供的技术方案中,第一接口可以是服务器与客户端之间进行数据交互的接口。客户端可以将至少一个待识别的订单信息的语义信息传入第一接口,作为第一接口的一个第一参数,实现将待识别的订单信息的语义信息上传至服务器的目的。
步骤S504,基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性。
步骤S506,响应于异常概率大于概率阈值,基于目标收货地址确定识别结果,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态,识别结果用于表示收货地址是否处于异常状态。
步骤S508,通过调用第二接口输出识别结果,其中,第二接口包括第二参数,第二参数的参数值为识别结果。
在本发明上述步骤S508提供的技术方案中,第二接口可以是服务器与客户端之间进行数据交互的接口,服务器可以将识别结果传入第二接口,作为第二接口的一个参数,实现将识别结果下发至客户端的目的。可选地,平台通过调用第二接口输出识别结果,其中,第二接口用于将识别结果通过互联网部署及接入待测量系统中,从而输出识别结果。
本发明实施例通过根据收货地址中的语义信息,确定收货地址的异常概率,进而通过目标收货地址对收货地址进行识别,以确定收货地址是否处于异常状态,由于本发明是在收货地址的语义层面上有效地进行识别,从而实现了提高对收货地址进行识别的准确度的技术效果,进而解决了对收货地址进行识别的准确度低的技术问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
下面对该实施例的上述方法的优选实施方式进行进一步介绍,具体以一种基于语义和聚集性的虚假对抗地址判定方法进行说明。
目前,在电子商务中,存在通过撰写物流无法送达的虚假或对抗收货地址的不良行为,比如,在红包欺诈、黄牛购票中,通过上述行为对卖方存在严重所害,比如,卖方未注意到虚假地址而选择直接发货的话,会导致货品发送到当地后无法配送只能就地销毁,造成卖方的资损,同时,也会绕过电商平台的风控策略,造成电商平台的资金资损,比如,通过填写对抗收货地址绕过风控策略收取红包,造成平台营销资金资损,因此,由于收货地址作为下单的最后一环,对于虚假地址和对抗地址进行有效识别并配合风控处理,有着重要的作用。
在一些国外电商平台,只是设置一些简单的规则进行识别,同时依靠较大的处置粒度来对地址信息进行识别,但该方法并没有通过算法从根本上解决虚假地址和对抗地址识别准确率低的问题;在一些国内电商平台,一般会通过让用户进行街道选择加地图定位等方式,但是该方法在无完善的地址数据的情况下无法使用,存在使用范围下的问题。
在相关技术中,对于虚假地址的识别,通常采用分类模型的方式来进行区分,但由于虚假地址的空间变化是无限的,很容易找到分类模型中的错误点对抗攻击掉;且分类模型也很难把样本收集完全,因而,仍存在对收货地址进行识别的准确度低的技术问题;对于对抗地址的识别,通常会将地址归一化方法或最小哈希法(minhash),但是对地址进行归一化需要进行归一地址的建设和挖掘,工作量大,且无法响应不断更迭的新地址和新的变化形式;最小哈希法方法虽然用起来比较简单,但是却仅考虑字符级别的相似,而忽略了语义级别的相似,导致出现很多虽然能分辨是相似的对抗地址,但使用最小哈希法方法却被绕过的情况,仍存在对收货地址进行识别的准确度低的技术问题。
本发明实施例提出通过建立语义判别模型和地址库的有效匹配,在单地址的语义层面有效的识别出虚假地址,同时,通过基于对抗训练的地址表征,有效聚合具有对抗痕迹的地址,从而提升对抗地址识别效果。
下面对该实施例的上述方法进行进一步地介绍。
图6是根据本发明实施例的一种虚假对抗地址判定方法的流程图,如图6所示,该实施例包括如下步骤。
步骤S601,输入地址。
输入待识别的地址,对地址进行识别。
步骤S602,对语义的虚假性进行判定。
由于通过语义字面来直接进行初步判定,容易出现漏过一些长得很像正常地址的对抗地址,且误命中一些比较罕见的白地址,因而,首先根据语义对输入地址的虚假性进行判断,比如,为识别乱码类虚假地址,实现对异常较少出现的地址进行感知打分。
在该实施例中,对语义的虚假性进行判定,可以通过语言模型来进行实现的,图7是根据本发明实施例的一种语言模型预测的示意图,如图7所示,语言模型通过输入的字符判断这些字符能够串联起来形成一个完整地址的概率值,得到预测结果。
可选地,在训练阶段,将所有已送达的真实地址作为预训练数据,对语言模型来进行预训练,得到完整的语言模型。
可选地,训练完模型后,可以利用模型对输入地址进行预测,可以将整段地址送入该模型进行计算,可以通过公式确定输入地址的虚假性概率。
可选地,本发明实施例与普通的语言模型所不同的地方是,本发明实施例的语言模型通过字符级别来进行判定,以有效的避免用户为了对抗绕过而造成的语言模型失效问题,同时通过对于长度进行平滑,以保证不同长度的地,因此本发明实施例的语言模型可以将模型给出的分数之上的地址判定为虚假地址,从而更有效的识别出乱码类的虚假地址。
步骤S603,生成地址的实数向量(embed)。
在该实施例中,为了后续流程的对近期输入地址进行聚合和与白地址进行匹配过滤,生成地址的实数向量。
可选地,通过对语言模型进行期望训练,实现有变异对抗或笔误变化的指向同一地点的地址余弦距离尽可能接近,非指向同一地点的地址余弦距离尽可能拉远。
可选地,通过利用大量的地址数据,通过当前词来预测上下文词进行预训练,完成对模型的训练,其中,词的表示并非是用词本身的映射表示,而是通过模型编码(ngram)组合形成词的表示,以有效的避免了可能存在的对抗问题。
可选地,图8是根据本发明实施例的一种语言模型预训练的示意图,如图8所示,输入当前单词的模型编码11、模型编码12、模型编码31和模型编码32,语言模型对输入数据进行处理,生成地址的实数向量,对生成地址的实数向量进行聚合,得到最终的预测地址。
可选地,图9是根据本发明实施例的一种拉近词语向量距离的示意图,如图9所示,通过对比学习,确定向量之间的相似性,利用对抗知识生成经过变异后的地址样本作为正例,缩小对抗词与正常词之间的向量距离(embed距离),同时取出地图数据中非同一地点的数据作为负例,拉远对抗词语正常词之间的向量距离。
步骤S604,与近期输入地址进行聚合,并对白地址进行匹配过滤。
在该实施例中,在生成实数向量(embed)后,可以通过实数向量的余弦距离,与近期几个小时内同时下单的不同用户的不同输入地址进行聚合,若发现聚合数量大于某一阈值,则可以判定该地址存在对抗绕过风控的情况,判定为对抗地址;可以与白地址进行匹配过滤,与所有可以正常发货的地址进行匹配,若发现相似度大于某一阈值,则可以判定该地址可以被正常发货。
步骤S605,对虚假对抗地址进行判定。
在该实施例中,通过语义虚假性判定、输入地址聚合和白地址匹配过滤,确定虚假对抗地址判定结果,得到切实可信的风控结论。
可选地,对于虚假地址,本发明实施例通过字符级别的语言模型,与分类模型相比,表1是根据本发明实施例的相同召回率下的准确率对比结果,如表1所示,本发明实施例极大的提高了非虚假地址识别的准确率,有效的避免了由于样本不足以及空间变化无限导致的准确率下降。
表1是根据本发明实施例的相同召回率下的准确率对比结果
虚假地址对比 准确率
分类方法 81.45%
本方法 94.69%
可选地,对于对抗地址,本发明实施例通过训练字符级embed,利用建模地址语义层面的相似度,而并非单纯的比较字面相似度,表2是根据本发明实施例的相似度的对比结果,如表2所示,通过该虚假对抗地址判定结果,可以相比未用该结果,在相同准确率下,可以提升约20%的召回率。
表2是根据本发明实施例的相似度的对比结果
虚假地址对比 AUC
minhash方法 0.67
本方法 0.76
本发明实施例通过根据收货地址中的语义信息,确定收货地址的异常概率,进而通过目标收货地址对收货地址进行识别,以确定收货地址是否处于异常状态,由于本发明是在收货地址的语义层面上有效地进行识别,从而实现了提高对收货地址进行识别的准确度的技术效果,进而解决了对收货地址进行识别的准确度低的技术问题。
实施例3
根据本发明实施例,还提供了一种用于实施上述图2所示的收货地址的识别方法的收货地址的识别装置。
图10是根据本发明实施例的一种收货地址的识别装置的示意图,如图10所示,该收货地址的识别装置1000可以包括:第一获取单元1002、第一确定单元1004和第一识别单元1006。
第一获取单元1002,用于获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址。
第一确定单元1004,用于基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性。
第一识别单元1006,用于响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
此处需要说明的是,上述第一获取单元1002、第一确定单元1004和第一识别单元1006对应于实施例1中的步骤S202至步骤S206,三个单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述单元作为装置的一部分可以运行在实施例一提供的计算机终端10中。
根据本发明实施例,还提供了一种用于实施上述图3所示的收货地址的识别方法的收货地址的识别装置。
图11是根据本发明实施例的另一种收货地址的识别装置的示意图,如图11所示,该收货地址的识别装置1100可以包括:第二获取单元1102、第三获取单元1104、第二确定单元1106、第二识别单元1108和第一输出单元1110。
第二获取单元1102,用于:从电商平台获取待处理的订单。
第三获取单元1104,用于在订单中获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址。
第二确定单元1106,用于基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性。
第二识别单元1108,用于响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
第一输出单元1110,用于响应于收货地址处于异常状态,向电商平台输出提示信息,其中,提示信息用于表示订单下单失败。
此处需要说明的是,上述第二获取单元1102、第三获取单元1104、第二确定单元1106、第二识别单元1108和第一输出单元1110对应于实施例1中的步骤S302至步骤S310,五个单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述单元作为装置的一部分可以运行在实施例一提供的计算机终端10中。
根据本发明实施例,还提供了一种用于实施上述图4所示的收货地址的识别方法的收货地址的识别装置。
图12是根据本发明实施例的另一种收货地址的识别装置的示意图。如图12所示,该收货地址的识别装置1200可以包括:第一显示单元1202和第二显示单元1204。
第一显示单元1202,用于响应作用于操作界面上的输入指令,在操作界面上显示待识别的订单信息,其中,订单信息至少包括:用于表征订单中记录的收货地址。
第二显示单元1204,用于响应作用于操作界面上的识别指令,在操作界面上显示收货地址的识别结果,其中,识别结果用于表示收货地址是否处于异常状态,且在收货地址的异常概率大于概率阈值时,基于目标收货地址确定得到,异常概率为基于订单信息的语义信息确定得到,且用于表示收货地址处于异常状态的可能性,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态
此处需要说明的是,上述第一显示单元1202和第二显示单元1204对应于实施例1中的步骤S402至步骤S404,两个单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述单元作为装置的一部分可以运行在实施例一提供的计算机终端10中。
根据本发明实施例,还提供了一种用于实施上述图5所示的收货地址的识别方法的收货地址的识别装置。
图13是根据本发明实施例的另一种收货地址的识别装置的示意图。如图13所示,该收货地址的识别装置1300可以包括:第四获取单元1302、第三确定单元1304、第四确定单元1306和第二输出单元1308。
第四获取单元1302,用于通过调用第一接口获取待识别的订单信息的语义信息,其中,第一接口包括第一参数,第一参数的参数值为语义信息,订单信息至少包括:用于表征订单中记录的收货地址。
第三确定单元1304,用于基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性。
第四确定单元1306,用于响应于异常概率大于概率阈值,基于目标收货地址确定识别结果,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态,识别结果用于表示收货地址是否处于异常状态。
第二输出单元1308,用于通过调用第二接口输出识别结果,其中,第二接口包括第二参数,第二参数的参数值为识别结果。
此处需要说明的是,上述第四获取单元1302、第三确定单元1304、第四确定单元1306和第二输出单元1308对应于实施例1中的步骤S502至步骤S508,四个单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述单元作为装置的一部分可以运行在实施例一提供的计算机终端10中。
在该实施例的收货地址的识别装置中,通过根据收货地址中的语义信息,确定收货地址的异常概率,进而通过目标收货地址对收货地址进行识别,以确定收货地址是否处于异常状态,由于本发明是在收货地址的语义层面上有效地进行识别,从而实现了提高对收货地址进行识别的准确度的技术效果,进而解决了对收货地址进行识别的准确度低的技术问题。
实施例4
本发明的实施例可以提供一种收货地址的识别系统,该收货地址的识别系统可以包括计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行收货地址的识别方法中以下步骤的程序代码:获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
可选地,图14是根据本发明实施例的一种计算机终端的结构框图。如图14所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器1402、存储器1404、以及传输装置1406。
其中,存储器可用于存储软件程序以及模块,如本发明实施例中的收货地址的识别方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及收货地址的识别,即实现上述的收货地址的识别方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
可选的,上述处理器还可以执行如下步骤的程序代码:基于收货地址的向量和目标收货地址,识别收货地址是否处于异常状态。
可选的,上述处理器还可以执行如下步骤的程序代码:将收货地址的向量和第一收货地址的向量与进行聚合,得到聚合结果,其中,目标收货地址包括第一收货地址,第一收货地址对应的订单的下单时间与收货地址对应的订单的下单时间之差在时间阈值内,聚合结果用于表示与收货地址相聚合的第一收货地址的数量;响应于聚合结果大于聚合阈值,确定收货地址处于异常状态。
可选的,上述处理器还可以执行如下步骤的程序代码:将收货地址的向量和第二收货地址的向量进行匹配,得到匹配结果,其中,目标收货地址包括第二收货地址,第二收货地址处于正常状态,匹配结果用于表示第二收货地址与收货地址之间的相似度;响应于匹配结果大于匹配阈值,确定收货地址处于正常状态。
可选的,上述处理器还可以执行如下步骤的程序代码:基于向量生成模型生成收货地址的向量,其中,向量生成模型为基于第一收货地址样本中的词进行训练得到,词由多元模型编码表示。
可选的,上述处理器还可以执行如下步骤的程序代码:确定第一收货地址样本中的词的上下文词;基于上下文词训练得到向量生成模型。
可选的,上述处理器还可以执行如下步骤的程序代码:基于语义信息确定收货地址的异常概率,包括:获取语义信息的多个字符;基于多个字符确定异常概率。
可选的,上述处理器还可以执行如下步骤的程序代码:对多个字符进行组合,得到组合结果;基于组合结果所表示的收货地址为完整收货地址的概率,确定异常概率。
可选的,上述处理器还可以执行如下步骤的程序代码:在基于语言模型对多个字符进行组合,得到组合结果,其中,语言模型为基于第二收货地址样本中的字符进行训练得到。
作为一种可选的示例,处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:从电商平台获取待处理的订单;在订单中获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态;响应于收货地址处于异常状态,向电商平台输出提示信息,其中,提示信息用于表示订单下单失败。
作为一种可选的示例,处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:响应作用于操作界面上的输入指令,在操作界面上显示待识别的订单信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;响应作用于操作界面上的识别指令,在操作界面上显示收货地址的识别结果,其中,识别结果用于表示收货地址是否处于异常状态,且在收货地址的异常概率大于概率阈值时,基于目标收货地址确定得到,异常概率为基于订单信息的语义信息确定得到,且用于表示收货地址处于异常状态的可能性,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
作为一种可选的示例,处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:通过调用第一接口获取待识别的订单信息的语义信息,其中,第一接口包括第一参数,第一参数的参数值为语义信息,订单信息至少包括:用于表征订单中记录的收货地址;基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;响应于异常概率大于概率阈值,基于目标收货地址确定识别结果,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态,识别结果用于表示收货地址是否处于异常状态;通过调用第二接口输出识别结果,其中,第二接口包括第二参数,第二参数的参数值为识别结果。
本发明实施例,提供了一种收货地址的识别方法,通过根据收货地址中的语义信息,确定收货地址的异常概率,进而通过目标收货地址对收货地址进行识别,以确定收货地址是否处于异常状态,由于本发明是在收货地址的语义层面上有效地进行识别,从而实现了提高对收货地址进行识别的准确度的技术效果,进而解决了对收货地址进行识别的准确度低的技术问题。
本领域普通技术人员可以理解,图14所示的结构仅为示意,计算机终端A也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图14其并不对上述计算机终端A的结构造成限定。例如,计算机终端A还可包括比图14中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图14所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例5
本发明的实施例还提供了一种计算机可读存储介质。可选地,在本实施例中,上述计算机可读存储介质可以用于保存上述实施例一所提供的收货地址的识别方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
可选的,上述计算机可读存储介质还可以执行如下步骤的程序代码:确定目标通讯协议的协议格式;基于协议格式确定目标通讯协议所关联的目标控制信号。
可选的,上述计算机可读存储介质还可以执行如下步骤的程序代码:基于收货地址的向量和目标收货地址,识别收货地址是否处于异常状态。
可选的,上述计算机可读存储介质还可以执行如下步骤的程序代码:将收货地址的向量和第一收货地址的向量与进行聚合,得到聚合结果,其中,目标收货地址包括第一收货地址,第一收货地址对应的订单的下单时间与收货地址对应的订单的下单时间之差在时间阈值内,聚合结果用于表示与收货地址相聚合的第一收货地址的数量;响应于聚合结果大于聚合阈值,确定收货地址处于异常状态。
可选的,上述计算机可读存储介质还可以执行如下步骤的程序代码:将收货地址的向量和第二收货地址的向量进行匹配,得到匹配结果,其中,目标收货地址包括第二收货地址,第二收货地址处于正常状态,匹配结果用于表示第二收货地址与收货地址之间的相似度;响应于匹配结果大于匹配阈值,确定收货地址处于正常状态。
可选的,上述计算机可读存储介质还可以执行如下步骤的程序代码:基于向量生成模型生成收货地址的向量,其中,向量生成模型为基于第一收货地址样本中的词进行训练得到,词由多元模型编码表示。
可选的,上述计算机可读存储介质还可以执行如下步骤的程序代码:确定第一收货地址样本中的词的上下文词;基于上下文词训练得到向量生成模型。
可选的,上述计算机可读存储介质还可以执行如下步骤的程序代码:基于语义信息确定收货地址的异常概率,包括:获取语义信息的多个字符;基于多个字符确定异常概率。
可选的,上述计算机可读存储介质还可以执行如下步骤的程序代码:对多个字符进行组合,得到组合结果;基于组合结果所表示的收货地址为完整收货地址的概率,确定异常概率。
可选的,上述计算机可读存储介质还可以执行如下步骤的程序代码:基于语言模型对多个字符进行组合,得到组合结果,其中,语言模型为基于第二收货地址样本中的字符进行训练得到。
作为一种可选的示例,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:从电商平台获取待处理的订单;在订单中获取待识别的订单信息的语义信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;响应于异常概率大于概率阈值,基于目标收货地址识别收货地址是否处于异常状态,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态;响应于收货地址处于异常状态,向电商平台输出提示信息,其中,提示信息用于表示订单下单失败。
作为一种可选的示例,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:响应作用于操作界面上的输入指令,在操作界面上显示待识别的订单信息,其中,订单信息至少包括:用于表征订单中记录的收货地址;响应作用于操作界面上的识别指令,在操作界面上显示收货地址的识别结果,其中,识别结果用于表示收货地址是否处于异常状态,且在收货地址的异常概率大于概率阈值时,基于目标收货地址确定得到,异常概率为基于订单信息的语义信息确定得到,且用于表示收货地址处于异常状态的可能性,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态。
作为一种可选的示例,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:通过调用第一接口获取待识别的订单信息的语义信息,其中,第一接口包括第一参数,第一参数的参数值为语义信息,订单信息至少包括:用于表征订单中记录的收货地址;基于语义信息确定收货地址的异常概率,其中,异常概率用于表示收货地址处于异常状态的可能性;响应于异常概率大于概率阈值,基于目标收货地址确定识别结果,其中,目标收货地址对应的订单的下单时间与收货地址对应的订单的下单时间相关联,和/或,目标收货地址的状态为正常状态,识别结果用于表示收货地址是否处于异常状态;通过调用第二接口输出识别结果,其中,第二接口包括第二参数,第二参数的参数值为识别结果。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (14)

1.一种收货地址的识别方法,其特征在于,包括:
获取待识别的订单信息的语义信息,其中,所述订单信息至少包括:用于表征订单中记录的收货地址;
基于所述语义信息确定所述收货地址的异常概率,其中,所述异常概率用于表示所述收货地址处于异常状态的可能性;
响应于所述异常概率大于概率阈值,基于目标收货地址识别所述收货地址是否处于所述异常状态,其中,所述目标收货地址对应的订单的下单时间与所述收货地址对应的订单的下单时间相关联,和/或,所述目标收货地址的状态为正常状态。
2.根据权利要求1所述的方法,其特征在于,基于目标收货地址识别所述收货地址是否处于所述异常状态,包括:
基于所述收货地址的向量和所述目标收货地址,识别所述收货地址是否处于所述异常状态。
3.根据权利要求2所述的方法,其特征在于,基于所述收货地址的向量和所述目标收货地址,识别所述收货地址是否处于所述异常状态,包括:
将所述收货地址的向量和第一收货地址的向量与进行聚合,得到聚合结果,其中,所述目标收货地址包括所述第一收货地址,所述第一收货地址对应的订单的下单时间与所述收货地址对应的订单的下单时间之差在时间阈值内,所述聚合结果用于表示与所述收货地址相聚合的所述第一收货地址的数量;
响应于所述聚合结果大于聚合阈值,确定所述收货地址处于所述异常状态。
4.根据权利要求2所述的方法,其特征在于,基于所述收货地址的向量和所述目标收货地址,识别所述收货地址是否处于所述异常状态,包括:
将所述收货地址的向量和第二收货地址的向量进行匹配,得到匹配结果,其中,所述目标收货地址包括所述第二收货地址,所述第二收货地址处于所述正常状态,所述匹配结果用于表示所述第二收货地址与所述收货地址之间的相似度;
响应于所述匹配结果大于匹配阈值,确定所述收货地址处于所述正常状态。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
基于向量生成模型生成所述收货地址的向量,其中,所述向量生成模型为基于第一收货地址样本中的词进行训练得到,所述词由多元模型编码表示。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
确定所述第一收货地址样本中的词的上下文词;
基于所述上下文词训练得到所述向量生成模型。
7.根据权利要求1所述的方法,其特征在于,基于所述语义信息确定所述收货地址的异常概率,包括:
获取所述语义信息的多个字符;
基于所述多个字符确定所述异常概率。
8.根据权利要求7所述的方法,其特征在于,基于所述多个字符确定所述异常概率,包括:
对所述多个字符进行组合,得到组合结果;
基于所述组合结果所表示的收货地址为完整收货地址的概率,确定所述异常概率。
9.根据权利要求8所述的方法,其特征在于,对所述多个字符进行组合,得到组合结果,包括:
基于语言模型对所述多个字符进行组合,得到所述组合结果,其中,所述语言模型为基于第二收货地址样本中的字符进行训练得到。
10.一种收货地址的识别方法,其特征在于,包括:
从电商平台获取待处理的订单;
在所述订单中获取待识别的订单信息的语义信息,其中,所述订单信息至少包括:用于表征所述订单中记录的收货地址;
基于所述语义信息确定所述收货地址的异常概率,其中,所述异常概率用于表示所述收货地址处于异常状态的可能性;
响应于所述异常概率大于概率阈值,基于目标收货地址识别所述收货地址是否处于所述异常状态,其中,所述目标收货地址对应的订单的下单时间与所述收货地址对应的订单的下单时间相关联,和/或,所述目标收货地址的状态为正常状态;
响应于所述收货地址处于所述异常状态,向所述电商平台输出提示信息,其中,所述提示信息用于表示所述订单下单失败。
11.一种收货地址的识别方法,其特征在于,包括:
响应作用于操作界面上的输入指令,在所述操作界面上显示待识别的订单信息,其中,所述订单信息至少包括:用于表征订单中记录的收货地址;
响应作用于所述操作界面上的识别指令,在所述操作界面上显示所述收货地址的识别结果,其中,所述识别结果用于表示所述收货地址是否处于异常状态,且在所述收货地址的异常概率大于概率阈值时,基于目标收货地址确定得到,所述异常概率为基于所述订单信息的语义信息确定得到,且用于表示所述收货地址处于所述异常状态的可能性,所述目标收货地址对应的订单的下单时间与所述收货地址对应的订单的下单时间相关联,和/或,所述目标收货地址的状态为正常状态。
12.一种收货地址的识别方法,其特征在于,包括:
通过调用第一接口获取待识别的订单信息的语义信息,其中,所述第一接口包括第一参数,所述第一参数的参数值为所述语义信息,所述订单信息至少包括:用于表征订单中记录的收货地址;
基于所述语义信息确定所述收货地址的异常概率,其中,所述异常概率用于表示所述收货地址处于异常状态的可能性;
响应于所述异常概率大于概率阈值,基于目标收货地址确定识别结果,其中,所述目标收货地址对应的订单的下单时间与所述收货地址对应的订单的下单时间相关联,和/或,所述目标收货地址的状态为正常状态,所述识别结果用于表示所述收货地址是否处于所述异常状态;
通过调用第二接口输出所述识别结果,其中,所述第二接口包括第二参数,所述第二参数的参数值为所述识别结果。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序被处理器运行时控制所述计算机可读存储介质所在设备执行权利要求1至12中任意一项所述的方法。
14.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至12中任意一项所述的方法。
CN202210391025.3A 2022-04-14 2022-04-14 收货地址的识别方法、存储介质和处理器 Pending CN114757201A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210391025.3A CN114757201A (zh) 2022-04-14 2022-04-14 收货地址的识别方法、存储介质和处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210391025.3A CN114757201A (zh) 2022-04-14 2022-04-14 收货地址的识别方法、存储介质和处理器

Publications (1)

Publication Number Publication Date
CN114757201A true CN114757201A (zh) 2022-07-15

Family

ID=82330339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210391025.3A Pending CN114757201A (zh) 2022-04-14 2022-04-14 收货地址的识别方法、存储介质和处理器

Country Status (1)

Country Link
CN (1) CN114757201A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116503849A (zh) * 2023-06-29 2023-07-28 中关村科学城城市大脑股份有限公司 异常地址识别方法、装置、电子设备与计算机可读介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116503849A (zh) * 2023-06-29 2023-07-28 中关村科学城城市大脑股份有限公司 异常地址识别方法、装置、电子设备与计算机可读介质
CN116503849B (zh) * 2023-06-29 2023-09-19 中关村科学城城市大脑股份有限公司 异常地址识别方法、装置、电子设备与计算机可读介质

Similar Documents

Publication Publication Date Title
US11164238B1 (en) Cross selling recommendation engine
CN106469276B (zh) 数据样本的类型识别方法及装置
CN109345417B (zh) 基于身份认证的业务人员的在线考核方法及终端设备
CN105868878B (zh) Mac地址的风险识别方法及装置
CN111090807A (zh) 一种基于知识图谱的用户识别方法及装置
CN111562965A (zh) 基于决策树的页面数据校验方法和装置
CN111476653A (zh) 一种风险信息识别、确定、模型训练方法及装置
US20230072086A1 (en) Heuristic credit risk assessment engine
CN114143049A (zh) 异常流量检测方法、装置、存储介质以及电子设备
CN116090867A (zh) 指标规则生成方法、装置、电子设备及存储介质
CN114757201A (zh) 收货地址的识别方法、存储介质和处理器
CN117114901A (zh) 基于人工智能的投保数据处理方法、装置、设备及介质
US10621208B2 (en) Category name extraction device, category name extraction method, and category name extraction program
CN112001792B (zh) 配置信息一致性检测方法及装置
CN110070383A (zh) 基于大数据分析的异常用户识别方法及装置
CN113837836A (zh) 模型推荐方法、装置、设备及存储介质
CN108510071B (zh) 数据的特征提取方法、装置及计算机可读存储介质
CN114330339B (zh) 文本处理方法、计算机可读存储介质及计算机设备
US20220261666A1 (en) Leveraging big data, statistical computation and artificial intelligence to determine a likelihood of object renunciation prior to a resource event
CN110414186B (zh) 数据资产切分校验方法以及装置
CN109727143A (zh) 有效保额计算方法、装置、设备及计算机可读存储介质
CN117541193A (zh) 业务审核方法、装置、计算机设备和存储介质
CN117435978A (zh) 异构云数据处理方法、装置及电子设备
CN116402354A (zh) 评估参数确定方法、装置、介质与电子设备
CN117078444A (zh) 资金数据的核对方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination