CN114820003A - 定价信息异常识别方法、装置、电子设备及存储介质 - Google Patents
定价信息异常识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114820003A CN114820003A CN202110065084.7A CN202110065084A CN114820003A CN 114820003 A CN114820003 A CN 114820003A CN 202110065084 A CN202110065084 A CN 202110065084A CN 114820003 A CN114820003 A CN 114820003A
- Authority
- CN
- China
- Prior art keywords
- pricing
- target
- deviation
- order
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
- G06Q30/0635—Processing of requisition or of purchase orders
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种定价信息异常识别方法、装置、电子设备及计算机可读存储介质。该定价信息异常识别方法包括:获取待识别订单的目标实际定价,以及与所述待识别订单定价关联的目标特征数据;根据所述目标特征数据和预设的定价策略,确定所述待识别订单的目标预测定价;根据所述目标实际定价与所述目标预测定价,确定所述待识别订单的目标定价偏差;根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常。本申请中可以准确、快速地识别出订单定价的异常。
Description
技术领域
本申请涉及数据管理技术领域,具体涉及一种定价信息异常识别方法、装置、电子设备及计算机可读存储介质。
背景技术
互联网信息时代的来临使得越来越多的企业和个人通过各种信息系统线上管理订单信息,包括ERP和电商平台等。订单定价的准确性是用户比较关注的一个信息点,很多企业和个人因为订单定价的输入异常而给自己带来严重的损失。
然而,一方面,当订单数据量较大时,难以从大量的订单中快速地筛选出定价异常的订单。另一方面,由于同一订单分类的多个订单可能有个体差异如有不同的折扣,难以准确地衡量同一订单分类的多个订单的定价是否异常。
发明内容
本申请提供一种定价信息异常识别方法、装置、电子设备及计算机可读存储介质,旨在解决难以准确、快速地识别出订单定价的异常问题。
第一方面,本申请提供一种定价信息异常识别方法,所述方法包括:
获取待识别订单的目标实际定价,以及与所述待识别订单定价关联的目标特征数据;
根据所述目标特征数据和预设的定价策略,确定所述待识别订单的目标预测定价;
根据所述目标实际定价与所述目标预测定价,确定所述待识别订单的目标定价偏差;
根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常。
在本申请一种可能的实现方式中,所述异常界定方式包括n倍标准差法、比例差检测法和基于单分类机器学习的异常检测模型检测法中的至少一种。
在本申请一种可能的实现方式中,所述异常界定方式包括n倍标准差法的情况下,所述根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常,包括:
获取订单集合中每个参考订单的实际参考定价,并获取每个所述参考订单的预测参考定价,其中,所述参考订单包括预先采集订单、所述待识别订单中的至少一者;
根据所述实际参考定价和所述预测参考定价,确定每个所述参考订单的参考定价偏差,得到所述订单集合对应的偏差集合;
确定所述偏差集合的偏差平均值、以及偏差标准差;
若所述目标定价偏差小于第一偏差阈值或所述目标定价偏差大于第二偏差阈值,则确定所述目标实际定价异常,其中,所述第一偏差阈值是指所述偏差平均值与n倍的所述偏差标准差之差,所述第二偏差阈值是指所述偏差平均值与n倍的所述偏差标准差之和。
在本申请一种可能的实现方式中,所述异常界定方式包括比例差检测法的情况下,所述根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常,包括:
将所述目标预测定价与预设比例系数之间的乘积确定为偏差异常界定值;
若所述目标定价偏差大于所述偏差异常界定值,则确定所述目标实际定价异常。
在本申请一种可能的实现方式中,所述异常界定方式包括基于单分类机器学习的异常检测模型检测法的情况下,所述根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常,包括:
调用训练好的异常检测模型,检测所述目标定价偏差是否为异常值,其中,所述异常检测模型通过预设偏差集合训练得到;
当检测到所述目标定价偏差为异常值时,确定所述目标实际定价异常。
在本申请一种可能的实现方式中,所述定价策略包括采用定价预测模型预测定价,所述方法还包括:
获取样本数据集,其中,所述样本数据集包括样本订单的样本特征数据和样本实际定价;
根据所述样本数据集构建定价预测模型,所述定价预测模型用于根据订单的特征数据预测订单的定价。
在本申请一种可能的实现方式中,所述定价策略包括采用定价预测模型预测定价,所述方法还包括:
获取测试集合中的每个测试订单的特征数据以及所述测试集合的多个测试分类;
调用所述定价预测模型,根据所述测试集合中每个所述测试订单的特征数据确定每个所述测试分类的拟合度;
获取所述拟合度大于预设阈值的目标测试分类,其中,所述待识别订单的订单分类与所述目标测试分类相同。
第二方面,本申请提供一种定价信息异常识别装置,所述定价信息异常识别装置包括:
获取单元,用于获取待识别订单的目标实际定价,以及与所述待识别订单定价关联的目标特征数据;
处理单元,用于根据所述目标特征数据和预设的定价策略,确定所述待识别订单的目标预测定价;
所述处理单元,还用于根据所述目标实际定价与所述目标预测定价,确定所述待识别订单的目标定价偏差;
所述处理单元,还用于根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常。
在本申请一种可能的实现方式中,所述异常界定方式包括n倍标准差法、比例差检测法和基于单分类机器学习的异常检测模型检测法中的至少一种,所述处理单元具体用于:
根据所述目标定价偏差,以及n倍标准差法、比例差检测法和基于单分类机器学习的异常检测模型检测法中的至少一种,确定所述目标实际定价是否异常。
在本申请一种可能的实现方式中,所述异常界定方式包括n倍标准差法的情况下,所述处理单元具体用于:
获取订单集合中每个参考订单的实际参考定价,并获取每个所述参考订单的预测参考定价,其中,所述参考订单包括预先采集订单、所述待识别订单中的至少一者;
根据所述实际参考定价和所述预测参考定价,确定每个所述参考订单的参考定价偏差,得到所述订单集合对应的偏差集合;
确定所述偏差集合的偏差平均值、以及偏差标准差;
若所述目标定价偏差小于第一偏差阈值或所述目标定价偏差大于第二偏差阈值,则确定所述目标实际定价异常,其中,所述第一偏差阈值是指所述偏差平均值与n倍的所述偏差标准差之差,所述第二偏差阈值是指所述偏差平均值与n倍的所述偏差标准差之和。
在本申请一种可能的实现方式中,所述异常界定方式包括比例差检测法的情况下,所述处理单元具体用于:
将所述目标预测定价与预设比例系数之间的乘积确定为偏差异常界定值;
若所述目标定价偏差大于所述偏差异常界定值,则确定所述目标实际定价异常。
在本申请一种可能的实现方式中,所述异常界定方式包括基于单分类机器学习的异常检测模型检测法的情况下,所述处理单元具体用于:
调用训练好的异常检测模型,检测所述目标定价偏差是否为异常值,其中,所述异常检测模型通过预设的偏差集合训练得到;
当检测到所述目标定价偏差为异常值时,确定所述目标实际定价异常。
在本申请一种可能的实现方式中,所述定价策略包括采用定价预测模型预测定价,所述定价信息异常识别装置还包括构建单元,所述构建单元具体用于:
获取样本数据集,其中,所述样本数据集包括样本订单的样本特征数据和样本实际定价;
根据所述样本数据集构建定价预测模型,所述定价预测模型用于根据订单的特征数据预测订单的定价。
在本申请一种可能的实现方式中,所述定价策略包括采用定价预测模型预测定价,所述定价信息异常识别装置还包括分类单元,所述分类单元具体用于:
获取测试集合中的每个测试订单的特征数据以及所述测试集合的多个测试分类;
调用所述定价预测模型,根据所述测试集合中每个所述测试订单的特征数据确定每个所述测试分类的拟合度;
获取所述拟合度大于预设阈值的目标测试分类,其中,所述待识别订单的订单分类与所述目标测试分类相同。
第三方面,本申请还提供一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行本申请提供的任一种定价信息异常识别方法中的步骤。
第四方面,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行所述的定价信息异常识别方法中的步骤。
本申请通过根据与定价关联的特征数据预测出待识别订单的目标预测定价;根据待识别订单的目标实际定价与目标预测定价之间的目标定价偏差、以及预设的异常界定方式,确定目标实际定价是否异常。第一方面,由于待识别订单的目标预测定价是根据与定价关联的特征数据预测得到,可以作为衡量待识别订单的目标实际定价是否异常的一个参考基准。第二方面,以目标预测定价与目标实际定价之间的目标定价偏差、及预设的异常界定方式,而不是以是否高于或低于某个固定定价作为实际定价是否异常的评判方式,针对同一订单分类的多个订单有不同折扣的情况,也可以更准确地衡量待识别订单的目标实际定价是否出现偏低或偏高等异常,一定程度上抓取了定价系统自动定价出错的情况以及人工定价不合理的情况。第三方面,由于可以对批量的待识别订单同时判别,即使订单数量较大的情况下,也可以快速地筛选出定价出现偏低或偏高等异常的订单。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例所提供的定价信息异常识别系统的场景示意图;
图2是本申请实施例提供的定价信息异常识别方法的一种流程示意图;
图3是本申请实施例中提供的步骤204的一个实施例流程示意图;
图4是本申请实施例中提供的步骤204的另一个实施例流程示意图;
图5是本申请实施例中提供的步骤204的又一个实施例流程示意图;
图6是本申请实施例中提供的定价信息异常识别装置的一个实施例结构示意图;
图7是本申请实施例中提供的电子设备的一个实施例结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请实施例的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
为了使本领域任何技术人员能够实现和使用本申请,给出了以下描述。在以下描述中,为了解释的目的而列出了细节。应当明白的是,本领域普通技术人员可以认识到,在不使用这些特定细节的情况下也可以实现本申请。在其它实例中,不会对公知的过程进行详细阐述,以避免不必要的细节使本申请实施例的描述变得晦涩。因此,本申请并非旨在限于所示的实施例,而是与符合本申请实施例所公开的原理和特征的最广范围相一致。
首先,在介绍本申请实施例之前,先介绍下本申请实施例关于应用背景的相关内容。
定价系统一直是物流公司最核心的系统之一。然而这样重要的核心系统却缺乏一个可推广的有监管能力的异常检测流程。由于影响定价的因素较多,涉及的业务场景较为复杂,并且人工干预的部分(例如折扣)也有很大的影响力,因此很难用简单的模型或者单一的手法去界定如此复杂的定价是否合理。因此,也就很难在众多订单定价中找到定价偏移程度较高的运单。
基于现有的相关技术存在的上述缺陷,本申请实施例提供了定价信息异常识别方法,至少在一定程度上克服现有的相关技术所存在的缺陷。
本申请实施例定价信息异常识别方法的执行主体可以为本申请实施例提供的定价信息异常识别装置,或者集成了该定价信息异常识别装置的服务器设备、物理主机或者用户设备(User Equipment,UE)等不同类型的电子设备,其中,定价信息异常识别装置可以采用硬件或者软件的方式实现,UE具体可以为智能手机、平板电脑、笔记本电脑、掌上电脑、台式电脑或者个人数字助理(Personal Digital Assistant,PDA)等终端设备。
该电子设备可以采用单独运行的工作方式,或者也可以采用设备集群的工作方式,通过应用本申请实施例提供的定价信息异常识别方法,可以准确、快速地识别出订单定价的异常。
参见图1,图1是本申请实施例所提供的定价信息异常识别系统的场景示意图。其中,该定价信息异常识别系统可以包括电子设备100,电子设备100中集成有定价信息异常识别装置。例如,该电子设备可以获取待识别订单的目标实际定价,以及与所述待识别订单定价关联的目标特征数据;根据所述目标特征数据和预设的定价策略,确定所述待识别订单的目标预测定价;根据所述目标实际定价与所述目标预测定价,确定所述待识别订单的目标定价偏差;根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常。
另外,如图1所示,该定价信息异常识别系统还可以包括存储器200,用于存储数据,如存储图像数据、视频数据。
需要说明的是,图1所示的定价信息异常识别系统的场景示意图仅仅是一个示例,本申请实施例描述的定价信息异常识别系统以及场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着定价信息异常识别系统的演变和新业务场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。
下面,开始介绍本申请实施例提供的定价信息异常识别方法,本申请实施例中以电子设备作为执行主体,为了简化与便于描述,后续方法实施例中将省略该执行主体。
参照图2,图2是本申请实施例提供的定价信息异常识别方法的一种流程示意图。需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。该定价信息异常识别方法包括步骤201~204,其中:
201、获取待识别订单的目标实际定价,以及与所述待识别订单定价关联的目标特征数据。
待识别订单可以是多种类型的订单,示例性的,包括:物流运单、线上购物订单等等。在实际业务场景中,订单的实际定价是已确定的,订单的实际定价可以是通过定价系统按照一定的计价规则自动确定,也可以是人工按照一定的计价规则计算得到。此处,订单的实际定价的确定方式仅为举例,不以此为限。
其中,目标实际定价是指待识别订单的实际价格。
目标特征数据是指与待识别订单定价关联的订单数据。以待识别订单是物流运单为例,则目标特征数据可以是物流运单的地址、时效类型、重量等数据。
获取待识别订单的目标实际定价的方式有多种,示例性的,包括:
(1)电子设备与预设的定价系统建立通信连接,当定价系统对一个新订单生成定价时,电子设备从定价系统中获取新订单的定价,以作为待识别订单的目标实际定价。其中,预设的定价系统是实际业务场景中使用定价系统。
(2)待识别订单的目标实际定价可以预先设定存储至数据库中,需要识别待识别订单的目标实际定价是否异常时,就从数据库中获取目标实际定价。
202、根据所述目标特征数据和预设的定价策略,确定所述待识别订单的目标预测定价。
其中,目标预测定价是根据预设的定价策略所预测得到的待识别订单的预测价格。
步骤202中,根据所述目标特征数据和预设的定价策略,确定所述待识别订单的目标预测定价的实现方式有多种,示例性的,包括:
(1)电子设备可以直接根据目标特征数据和预设的定价策略,确定待识别订单的目标预测定价。
(2)电子设备可以将目标特征数据发送至其他设备上,以使得其他设备根据目标特征数据和预设的定价策略,确定待识别订单的目标预测定价;电子设备回调其他设备所确定的目标预测定价。其中,其他设备可以是服务器设备、物理主机或者用户设备等不同类型的设备。
其中,预设的定价策略是指预测订单的价格的方式。预设的定价策略有多种,例如,可以通过训练好的定价预测模型预测定价。
定价预测模型是拟合模型,定价模型可以采用的单分类算法模型可以有多种,比如,可以是开源的XGBoosting模型,或者是神经网络模型。下面以定价预测模型是XGBoosting模型为例,先介绍定价预测模型的训练过程:
(1)获取样本数据集。
其中,所述样本数据集包括样本订单的样本特征数据和样本实际定价。
其中,样本实际定价是样本订单的实际价格。
样本特征数据是指与样本订单定价关联的订单数据。
基于以下三个方面的考虑,本申请实施例中,会对样本订单的样本特征数据进行降维处理:
第一方面,订单的特征数据有多个维度,比如,物流运单包括重量、寄件地址、收件地址、时效要求、增值服务等多个维度特征数据。并且每个维度特征数据又划分为多个细致子维度,如重量有1kg、2kg、3kg、4kg、...kg。
第二方面,多种特征数据中每种特征数据对订单的定价重要程度不同,例如物流运单包括重量、寄件地址、收件地址、时效要求、增值服务等与物流运单定价关联的多种特征数据,其中重量和时效要求对比,重量对订单的定价重要程度相对较高、时效要求对订单的定价重要程度相对较低。
第三方面,实际业务场景中,一个订单的实际定价是否出现偏低或偏高等异常,针对同一订单分类比较才具有意义。比如,其他特征均一样,但重量分别为1kg和10kg的两个物流运单,较难衡量两者的实际定价是否出现偏高或偏低等异常。订单分类的数量越多,数据处理量也越大。
因此,本申请实施例中会将用于输入至待训练的XGBoosting模型的样本特征数据进行降维处理。
本申请实施例中对样本订单的样本特征数据进行降维处理的方式有多种,示例性的,包括:
a、利用XGBoosting模型中的feature importance功能,从所输入的多个维度特征数据中找出与定价关联重要程度超过预设程度阈值的特征数据,如超过1的特征数据。
b、利用PCA模型对样本特征数据进行降维处理。
c、人工总结减少订单分类的数量。例如,用始发地区价位级别代替直接输入始发地。原始数据中常见始发地区有60多个,根据地区同城件价格水平分类后,始发地区可以缩减为高物价、中物价、低物价3类,大幅的减少了字段中的分类数量。
d、此外,还可以将一些特殊类型或者样本数量较少的样本订单及其样本特征数据。
(2)根据所述样本数据集构建定价预测模型。
其中,所述定价预测模型用于根据订单的特征数据预测订单的定价。
具体地,可以将参数为默认值的开源XGBoosting模型,作为待训练的定价预测模型。然后,采用(1)中获取的样本数据集作为训练集,对待训练的定价预测模型进行训练,使得定价预测模型根据样本订单的样本特征数据和样本实际定价进行拟合,得到训练后的定价预测模型。此时,定价预测模型可以根据订单的特征数据预测出订单的实际定价是正常值,还是异常值。
定价预测模型训练完成之后,可以将目标特征数据输入至异常检测模型中,以使得定价预测模型根据目标特征数据拟合出待识别订单的目标预测定价。
在本申请实施例中假设定价预测模型的模拟精度较高,但是,实际场景中定价预测模型并不是在每一订单分类中的精度表现都一致。很多情况下,定价预测模型会在某些订单分类中呈现高精度、某些订单分类中呈现低精度。
因此,进一步地,本申请实施例中会筛选出定价预测模型模拟精度较高的目标订单分类,在实际采用定价预测模型预测定价时,只针对目标订单分类的订单进行定价预测。
示例性的,可以通过如下方式筛选出定价预测模型模拟精度较高的目标订单分类:获取测试集合中的每个测试订单的特征数据以及所述测试集合的多个测试分类;调用所述定价预测模型,根据所述测试集合中每个所述测试订单的特征数据确定每个所述测试分类的拟合度;获取所述拟合度大于预设阈值的目标测试分类。
其中,所述待识别订单的订单分类与所述目标测试分类相同。目标测试分类是定价预测模型模拟精度较高的目标订单分类。
测试订单是指用于测试定价预测模型的模拟精度的订单。测试集合是指多个测试订单的集合。
多个测试分类是指测试集合中的测试订单所划分得到的多个订单分类。
一个测试分类的拟合度用于指示定价预测模型在该测试分类的模拟精度。测试分类的拟合度越高,定价预测模型在该测试分类的模拟精度也越高。
例如,物流运单分为了1kg以下、1kg到3kg、3kg到5kg、5kg以上共4个测试分类。首先,先去除数据量严重不足的测试分类,或者合并数值上相近低数据量的两个测试分类为一个测试分类。然后,采用Adjusted R-Square作为分数指标计算每个测试分类在定价预测模型中的表现,得到每个测试分类的分数,以作为每个测试分类的拟合度。最后,去除分数较低(即拟合度小于等于预设阈值)的测试分类;例如分数小于等于0.5的,代表拟合程度非常低。只保留分数达标的分类,例如分数大于0.5的(即拟合度大于预设阈值)的测试分类,以作为目标测试分类。
203、确定所述目标实际定价与所述目标预测定价的目标定价偏差。
目标定价偏差是待识别订单的目标实际定价与目标预测定价之差的绝对值。例如,目标实际定价是50元,目标预测定价是48元,则目标定价偏差是2元。又如,目标实际定价是48元,目标预测定价是52元,则目标定价偏差是4元。
204、根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常。
预设的异常界定方式是指定价偏差是否为异常值的判别方式。预设的异常界定方式有多种,示例性的,包括:所述异常界定方式包括n倍标准差法、比例差检测法和基于单分类机器学习的异常检测模型检测法中的至少一种。
在步骤204中,根据目标定价偏差和预设的异常界定方式,确定目标实际定价是否异常的方式有多种,示例性的,包括:
(1)电子设备可以直接根据目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常。
(2)电子设备可以将目标定价偏差发送至其他设备上,以使得其他设备根据目标定价偏差和预设的异常界定方式,确定目标实际定价是否异常,得到目标实际定价的异常检测结果;电子设备回调其他设备所确定的异常检测结果,从而确定目标实际定价是否异常。其中,其他设备可以是服务器设备、物理主机或者用户设备等不同类型的设备。
当确定目标实际定价异常时,即可将待识别订单筛选出来,实现对定价出现偏低或偏高等异常的订单的筛选。
上述步骤201~204中,待识别订单可以是一个或多个。即除了可以针对单个订单的实际定价进行异常识别外,还可以一次对批量订单的实际定价进行异常识别。
在实际业务场景中,同一订单分类的多个订单如地址、重量、时效类型等均相同或相近的两个物流订单,可能会出现定价不一致的情况。为了规范同一订单分类订单的定价,可以通过人工筛选出定价出现偏低或偏高等异常的订单。但是,一方面,当订单数据量较大时,难以从大量的订单中快速地筛选出定价异常的订单。另一方面,由于同一订单分类的多个订单可能有不同的折扣,难以衡量同一订单分类的多个订单的定价是否异常。
本申请实施例中,通过根据与定价关联的特征数据预测出待识别订单的目标预测定价;根据待识别订单的目标实际定价与目标预测定价之间的目标定价偏差、以及预设的异常界定方式,确定目标实际定价是否异常。第一方面,由于待识别订单的目标预测定价是根据与定价关联的特征数据预测得到,可以作为衡量待识别订单的目标实际定价是否异常的一个参考基准。第二方面,以目标预测定价与目标实际定价之间的目标定价偏差、及预设的异常界定方式,而不是以是否高于或低于某个固定定价作为实际定价是否异常的评判方式,针对同一订单分类的多个订单有不同折扣的情况,也可以更准确地衡量待识别订单的目标实际定价是否出现偏低或偏高等异常,一定程度上抓取了定价系统自动定价出错的情况以及人工定价不合理的情况。第三方面,由于可以对批量的待识别订单同时判别,即使订单数量较大的情况下,也可以快速地筛选出定价出现偏低或偏高等异常的订单。
本申请实施例中,异常界定方式有多种实现方式,例如可以是n倍标准差法、比例差检测法和基于单分类机器学习的异常检测模型检测法等中的一个或多个,下面分别举例进行说明。
(一)异常界定方式包括n倍标准差法。
本申请实施例中,n倍标准差法是指为了剔除定价偏差的异常值,通过判别每个定价偏差是否处于一组定价偏差测量数据的(平均值±n倍标准差)范围内,确定每个定价偏差是否为异常值。其中,n倍标准差法可以有多种实现方式,示例性的,包括1倍标准差法、2倍标准差法、3倍标准差法。1倍标准差法、2倍标准差法、3倍标准差法、...、n倍标准差法的具体实现方式类似,后文将详细介绍具体实现方式;不同的是,每种倍数的标准差法将一组定价偏差测量数据中视为异常值的比例不同。
例如,1倍标准差法会将一组定价偏差测量数据中的大约68%视为正常值,而这68%的定价偏差数据会处于如下区间范围内:μ-σ≤X≤μ+σ,其中,X表示定价偏差,μ表示这组定价偏差测量数据的平均值,σ表示这组定价偏差测量数据的标准差。
例如,2倍标准差法会将一组定价偏差测量数据中的大约95%视为正常值,而这95%的定价偏差数据会处于如下区间范围内:μ-2σ≤X≤μ+2σ,其中,X表示定价偏差,μ表示这组定价偏差测量数据的平均值,σ表示这组定价偏差测量数据的标准差。
例如,3倍标准差法会将一组定价偏差测量数据中的大约99.7%视为正常值,而这99.7%的定价偏差数据会处于如下区间范围内:μ-3σ≤X≤μ+3σ,其中,X表示定价偏差,μ表示这组定价偏差测量数据的平均值,σ表示这组定价偏差测量数据的标准差。
由以上内容可以看出,不同倍数的标准差法可以用于抓取不同比例的异常值,在实际业务场景中,可以根据需求选用哪种倍数的标准差法。例如,当认为一批订单中存在实际定价异常的订单数较多时,则可以采用1倍标准差法。又如,当认为一批订单中大部分订单的实际定价是无异常时,可以采用3倍标准差法。
当异常界定方式包括n倍标准差法时,如图3所示,步骤204具体可以包括步骤2041A~2045A:
2041A、获取订单集合中每个参考订单的实际参考定价,并获取每个所述参考订单的预测参考定价。
其中,所述参考订单包括预先采集订单、所述待识别订单中的至少一者。
订单集合中的多个订单是同一订单分类的订单。订单集合中的多个订单是如地址、重量、时效类型等均相同或相近的多个物流订单。
预先采集订单是除待识别订单外的订单。
实际参考定价是指参考订单的实际价格。预测参考定价是根据预设的定价策略所预测得到的参考订单的预测价格。
为了判别目标定价偏差是否异常,本申请实施例中采集一个订单集合的定价偏差(即每个订单的实际定价与预测定价的偏差)作为一组定价偏差测试数据,以确定异常值与正常值的界定范围。为此,首先需要通过步骤2041A获取包括多个参考订单的订单集合、以及每个参考订单的实际参考定价和预测参考定价。
步骤2041A的实现方式有多种,示例性地,包括:
(1)订单集合是多个预先采集订单的集合。首先,获取多个预先采集订单,得到包括多个参考订单的订单集合,其中,每个预先采集订单作为一个参考订单。同时,获取每个预先采集的实际定价作为每个参考订单的实际参考定价,并获取每个参考订单的特征数据。然后,调用上述步骤202构建好的定价预测模型根据每个参考订单的特征数据预测出每个参考订单的预测参考定价。
(2)待识别订单包括多个,此时,订单集合是多个待识别订单的集合,其中,每个待识别订单作为一个参考订单。可以直接将步骤2012中获取的每个待识别订单的目标实际定价作为每个参考订单的实际参考定价,将步骤202中确定的每个待识别订单的目标预测定价作为每个参考订单的预测参考定价。
(3)订单集合是多个预先采集订单、以及待识别订单的集合。此时,可以可以按照(1)或(2)示例中的方式,分别获取每个预先采集订单的实际定价作为对应的每个参考订单的实际参考定价,获取每个待识别订单的实际定价作为对应的每个参考订单的实际参考定价。
2042A、根据所述实际参考定价和所述预测参考定价,确定每个所述参考订单的参考定价偏差,得到所述订单集合对应的偏差集合。
其中,每个参考订单的参考定价偏差是指每个参考订单的实际参考定价与预测参考定价之差的绝对值。
其中,偏差集合是多个参考订单的参考定价偏差的集合。
例如,订单集合包括:参考订单1、2、3、4、5,分别对应的实际参考定价为:10、8、9、12、8,分别对应的预测参考定价为:9、9、9、10、9。则可以确定参考订单1、2、3、4、5的参考定价偏差分别为:1、1、0、2、1,得到订单集合对应的偏差集合{1、1、0、2、1}。
进一步地,为了提升数据处理效率,步骤2042A中确定每个参考订单的参考定价偏差时,若某个参考订单是待识别订单,则可以直接将步骤203中所确定的待识别订单的目标定价偏差作为该参考订单的参考定价偏差。
2043A、确定所述偏差集合的偏差平均值、以及偏差标准差。
其中,偏差平均值是偏差集合中的多个参考定价偏差的平均值。偏差标准差是偏差集合中的多个参考定价偏差的标准差。
2044A、若所述目标定价偏差小于第一偏差阈值或所述目标定价偏差大于第二偏差阈值,则确定所述目标实际定价异常。
2045A、若所述目标定价偏差大于等于第一偏差阈值且小于等于第二偏差阈值,则确定所述目标实际定价正常。
其中,所述第一偏差阈值是指所述偏差平均值与n倍的所述偏差标准差之差,所述第二偏差阈值是指所述偏差平均值与n倍的所述偏差标准差之和。
当确定偏差集合的偏差平均值和偏差标准差之后,可以根据实际的业务场景需求,确定异常值与正常值的界定范围。
在一些实施例中,n倍标准差法是1倍标准差法,以处于偏差集合的1倍标准差内的目标定价偏差作为正常值、处于偏差集合的1倍标准差外的目标定价偏差作为异常值。若目标定价偏差处于如下区间范围内:μ-σ≤X≤μ+σ,则确定目标定价偏差为正常值;此时,可以确定该目标定价偏差对应的待识别订单的目标实际定价正常。若目标定价偏差处于如下区间范围内:X<μ-σ,或者X>μ+σ,则确定目标定价偏差为异常值;此时,可以确定该目标定价偏差对应的待识别订单的目标实际定价异常。其中,X表示目标定价偏差,μ表示偏差集合的偏差平均值,σ表示偏差集合的偏差标准差。此时,第一偏差阈值是(μ-σ),第二偏差阈值是(μ+σ)。
在一些实施例中,n倍标准差法是2倍标准差法,以处于偏差集合的2倍标准差内的目标定价偏差作为正常值、处于偏差集合的2倍标准差外的目标定价偏差作为异常值。若目标定价偏差处于如下区间范围内:μ-2σ≤X≤μ+2σ,则确定目标定价偏差为正常值;此时,可以确定该目标定价偏差对应的待识别订单的目标实际定价正常。若目标定价偏差处于如下区间范围内:X<μ-2σ,或者X>μ+2σ,则确定目标定价偏差为异常值;此时,可以确定该目标定价偏差对应的待识别订单的目标实际定价异常。其中,X表示目标定价偏差,μ表示偏差集合的偏差平均值,σ表示偏差集合的偏差标准差。此时,第一偏差阈值是(μ-2σ),第二偏差阈值是(μ+2σ)。
在一些实施例中,n倍标准差法是3倍标准差法,以处于偏差集合的3倍标准差内的目标定价偏差作为正常值、处于偏差集合的3倍标准差外的目标定价偏差作为异常值。若目标定价偏差处于如下区间范围内:μ-3σ≤X≤μ+3σ,则确定目标定价偏差为正常值;此时,可以确定该目标定价偏差对应的待识别订单的目标实际定价正常。若目标定价偏差处于如下区间范围内:X<μ-3σ,或者X>μ+3σ,则确定目标定价偏差为异常值;此时,可以确定该目标定价偏差对应的待识别订单的目标实际定价异常。其中,X表示目标定价偏差,μ表示偏差集合的偏差平均值,σ表示偏差集合的偏差标准差。此时,第一偏差阈值是(μ-3σ),第二偏差阈值是(μ+3σ)。
通过n倍标准差法可以根据实际业务需求,抓取一定比例定价偏差的异常值,进而可以抓取一定比例存在定价偏低或偏高等异常的订单。
(二)异常界定方式包括比例差检测法。
在本申请实施例中,当订单的实际定价与预测定价之差的绝对值大于预测定价的预设比例,如大于20%时,将订单的实际定价视为异常值,以抓取存在定价偏低或偏高等异常的订单。
当异常界定方式包括比例差检测法时,如图4所示,步骤204具体可以包括步骤2041B~2043B:
2041B、将所述目标预测定价与预设比例系数之间的乘积确定为偏差异常界定值。
其中,偏差异常界定值是目标预测定价与预设比例系数之间的乘积。比如,目标预测定价是20元,预设比例系数为20%,则偏差异常界定值为4元。此处,预设比例系数仅为举例,具体可以根据实际需求而调整,不以此为限。
2042B、若所述目标定价偏差大于所述偏差异常界定值,则确定所述目标实际定价异常。
具体地,首先,检测目标定价偏差是否大于偏差异常界定值。若目标定价偏差大于偏差异常界定值,则确定目标定价偏差为异常值,此时,可以进一步确定该目标定价偏差对应的待识别订单的目标实际定价异常。
例如,偏差异常界定值为4元,若目标定价偏差为5元,则确定待识别订单的目标实际定价异常。
2043B、若所述目标定价偏差小于或等于所述偏差异常界定值,则确定所述目标实际定价正常。
若目标定价偏差小于或等于偏差异常界定值,则确定目标定价偏差为正常值,此时,可以进一步确定该目标定价偏差对应的待识别订单的目标实际定价正常。
例如,偏差异常界定值为4元,若目标定价偏差为3元,则确定待识别订单的目标实际定价正常。
通过比例差检测法,可以精准快速地抓取定价偏差的异常值,进而可以精准快速地抓取实际定价与预测定价之差的绝对值大于预测定价的预设比例的订单。
(三)异常界定方式包括基于单分类机器学习的异常检测模型检测法。
当异常界定方式包括基于单分类机器学习的异常检测模型检测法时,如图5所示,步骤204具体可以包括步骤2041C~2043C:
2041C、调用训练好的异常检测模型,检测所述目标定价偏差是否为异常值。
其中,所述异常检测模型通过预设偏差集合训练得到。
相对于定价偏差的正常值,由于定价偏差的异常值不易于确定,在本申请实施例中,异常检测模型采用单分类算法模型。本申请实施例可以采用的单分类算法模型可以有多种,比如,可以是开源的One-Class-SVM模型,以及未来出现的其他单分类算法模型。下面以异常检测模型是One-Class-SVM模型为例,先介绍异常检测模型的训练过程:
(1)获取待训练的异常检测模型。
具体地,可以将参数为默认值的开源One-Class-SVM模型,作为待训练的异常检测模型。
One-Class-SVM模型的算法思路是:寻找一个最小的超平面将训练集中的正常值圈出来,预测就是用这个超平面做决策,在超平面内的样本就认为是正常值。One-Class-SVM模型的训练集不包含异常值,因为若包含异常值模型在寻找超平面时可能会去匹配这些异常值。
(2)确定预设偏差集合。
首先,获取实际定价是正常值的多个订单,以及每个订单的实际定价和预测定价。其中,多个订单是同一订单分类,每个订单的预测定价可以参照上述步骤202的方式确定,此处不再赘述。然后,根据每个订单的实际定价和预测定价,确定每个订单的定价偏差,得到预设偏差集合。其中,预设偏差集合包括同一订单分类的多个订单的定价偏差。
(3)采用(2)中确定的预设偏差集合作为训练集,对(1)中所获取的待训练的异常检测模型进行训练,使得异常检测模型寻找出圈出预设偏差集合的最小目标超平面,得到训练后的异常检测模型。此时,异常检测模型可以根据订单的实际定价与预测定价之间的偏差,预测出订单的实际定价是正常值,还是异常值。
异常检测模型训练完成之后,可以将目标定价偏差输入至异常检测模型中,以使得异常检测模型检测目标定价偏差是否处于最小目标超平面内。当异常检测模型检测到目标定价偏差处于最小目标超平面内,则可以确定目标定价偏差为正常值。当异常检测模型检测到目标定价偏差处于最小目标超平面外,则可以确定目标定价偏差为异常值。
2042C、当检测到所述目标定价偏差为异常值时,确定所述目标实际定价异常。
具体地,当检测到目标定价偏差为异常值时,可以进一步确定该目标定价偏差对应的待识别订单的目标实际定价异常。
2043C、当检测到所述目标定价偏差为正常值时,确定所述目标实际定价正常。
具体地,当检测到目标定价偏差为正常值时,可以进一步确定该目标定价偏差对应的待识别订单的目标实际定价正常。
通过基于单分类机器学习的异常检测模型检测法,由于针对多个待识别订单是否出现异常同时进行识别,可以精准快速地抓取定价偏差的异常值,进而可以精准快速地抓取实际定价与预测定价之差的绝对值大于预测定价的预设比例的订单。
进一步地,为了提高定价信息异常识别的准确性,还可以联合n倍标准差法、比例差检测法、以及基于单分类机器学习的异常检测模型检测法中的两者或三者联合确定目标实际定价是否异常。当所联合的每种异常界定方式均确定目标实际定价异常时,才最终确定目标实际定价异常。当所联合的至少一种异常界定方式均确定目标实际定价正常时,最终确定目标实际定价正常。
例如,联合n倍标准差法、比例差检测法、以及基于单分类机器学习的异常检测模型检测法三者确定目标实际定价是否异常。当n倍标准差法确定目标实际定价异常、比例差检测法确定目标实际定价异常、且基于单分类机器学习的异常检测模型检测法确定目标实际定价异常时,才最终确定目标实际定价异常。当n倍标准差法确定目标实际定价正常、比例差检测法确定目标实际定价异常、且基于单分类机器学习的异常检测模型检测法确定目标实际定价异常时,最终确定目标实际定价正常。
进一步地,为了提高定价信息异常识别的全面性,还可以联合n倍标准差法、比例差检测法、以及基于单分类机器学习的异常检测模型检测法中的两者或三者联合确定目标实际定价是否异常。当所联合的至少一种异常界定方式均确定目标实际定价异常时,最终确定目标实际定价异常。当所联合的每种异常界定方式均确定目标实际定价正常时,才最终确定目标实际定价正常。
为了更好实施本申请实施例中定价信息异常识别方法,在定价信息异常识别方法基础之上,本申请实施例中还提供一种定价信息异常识别装置,如图6所示,为本申请实施例中定价信息异常识别装置的一个实施例结构示意图,该定价信息异常识别装置600包括:
获取单元601,用于获取待识别订单的目标实际定价,以及与所述待识别订单定价关联的目标特征数据;
处理单元602,用于根据所述目标特征数据和预设的定价策略,确定所述待识别订单的目标预测定价;
所述处理单元602,还用于根据所述目标实际定价与所述目标预测定价,确定所述待识别订单的目标定价偏差;
所述处理单元602,还用于根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常。
在本申请一种可能的实现方式中,所述异常界定方式包括n倍标准差法、比例差检测法和基于单分类机器学习的异常检测模型检测法中的至少一种,所述处理单元602具体用于:
根据所述目标定价偏差,以及n倍标准差法、比例差检测法和基于单分类机器学习的异常检测模型检测法中的至少一种,确定所述目标实际定价是否异常。
在本申请一种可能的实现方式中,所述异常界定方式包括n倍标准差法的情况下,所述处理单元602具体用于:
获取订单集合中每个参考订单的实际参考定价,并获取每个所述参考订单的预测参考定价,其中,所述参考订单包括预先采集订单、所述待识别订单中的至少一者;
根据所述实际参考定价和所述预测参考定价,确定每个所述参考订单的参考定价偏差,得到所述订单集合对应的偏差集合;
确定所述偏差集合的偏差平均值、以及偏差标准差;
若所述目标定价偏差小于第一偏差阈值或所述目标定价偏差大于第二偏差阈值,则确定所述目标实际定价异常,其中,所述第一偏差阈值是指所述偏差平均值与n倍的所述偏差标准差之差,所述第二偏差阈值是指所述偏差平均值与n倍的所述偏差标准差之和。
在本申请一种可能的实现方式中,所述异常界定方式包括比例差检测法的情况下,所述处理单元602具体用于:
将所述目标预测定价与预设比例系数之间的乘积确定为偏差异常界定值;
若所述目标定价偏差大于所述偏差异常界定值,则确定所述目标实际定价异常。
在本申请一种可能的实现方式中,所述异常界定方式包括基于单分类机器学习的异常检测模型检测法的情况下,所述处理单元602具体用于:
调用训练好的异常检测模型,检测所述目标定价偏差是否为异常值,其中,所述异常检测模型通过预设的偏差集合训练得到;
当检测到所述目标定价偏差为异常值时,确定所述目标实际定价异常。
在本申请一种可能的实现方式中,所述定价策略包括采用定价预测模型预测定价,所述定价信息异常识别装置600还包括构建单元(图中未示出),所述构建单元具体用于:
获取样本数据集,其中,所述样本数据集包括样本订单的样本特征数据和样本实际定价;
根据所述样本数据集构建定价预测模型,所述定价预测模型用于根据订单的特征数据预测订单的定价。
在本申请一种可能的实现方式中,所述定价策略包括采用定价预测模型预测定价,所述定价信息异常识别装置600还包括分类单元(图中未示出),所述分类单元具体用于:
获取测试集合中的每个测试订单的特征数据以及所述测试集合的多个测试分类;
调用所述定价预测模型,根据所述测试集合中每个所述测试订单的特征数据确定每个所述测试分类的拟合度;
获取所述拟合度大于预设阈值的目标测试分类,其中,所述待识别订单的订单分类与所述目标测试分类相同。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
由于该定价信息异常识别装置可以执行本申请如图1至图6对应任意实施例中定价信息异常识别方法中的步骤,因此,可以实现本申请如图1至图6对应任意实施例中定价信息异常识别方法所能实现的有益效果,详见前面的说明,在此不再赘述。
此外,为了更好实施本申请实施例中定价信息异常识别方法,在定价信息异常识别方法基础之上,本申请实施例还提供一种电子设备,参阅图7,图7示出了本申请实施例电子设备的一种结构示意图,具体的,本申请实施例提供的电子设备包括处理器701,处理器701用于执行存储器702中存储的计算机程序时实现如图1至图5对应任意实施例中定价信息异常识别方法的各步骤;或者,处理器701用于执行存储器702中存储的计算机程序时实现如图6对应实施例中各单元的功能。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器702中,并由处理器701执行,以完成本申请实施例。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
电子设备可包括,但不仅限于处理器701、存储器702。本领域技术人员可以理解,示意仅仅是电子设备的示例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如电子备还可以包括输入输出设备、网络接入设备、总线等,处理器701、存储器702、输入输出设备以及网络接入设备等通过总线相连。
处理器701可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分。
存储器702可用于存储计算机程序和/或模块,处理器701通过运行或执行存储在存储器702内的计算机程序和/或模块,以及调用存储在存储器702内的数据,实现计算机装置的各种功能。存储器702可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据(比如音频数据、视频数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的定价信息异常识别装置、电子设备及其相应单元的具体工作过程,可以参考如图1至图5对应任意实施例中定价信息异常识别方法的说明,具体在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请如图1至图5对应任意实施例中定价信息异常识别方法中的步骤,具体操作可参考如图1至图5对应任意实施例中定价信息异常识别方法的说明,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请如图1至图5对应任意实施例中定价信息异常识别方法中的步骤,因此,可以实现本申请如图1至图5对应任意实施例中定价信息异常识别方法所能实现的有益效果,详见前面的说明,在此不再赘述。
以上对本申请实施例所提供的一种定价信息异常识别方法、装置、电子设备及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种定价信息异常识别方法,其特征在于,所述方法包括:
获取待识别订单的目标实际定价,以及与所述待识别订单定价关联的目标特征数据;
根据所述目标特征数据和预设的定价策略,确定所述待识别订单的目标预测定价;
根据所述目标实际定价与所述目标预测定价,确定所述待识别订单的目标定价偏差;
根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常。
2.根据权利要求1所述的定价信息异常识别方法,其特征在于,所述异常界定方式包括n倍标准差法、比例差检测法和基于单分类机器学习的异常检测模型检测法中的至少一种。
3.根据权利要求2所述的定价信息异常识别方法,其特征在于,所述异常界定方式包括n倍标准差法的情况下,所述根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常,包括:
获取订单集合中每个参考订单的实际参考定价,并获取每个所述参考订单的预测参考定价,其中,所述参考订单包括预先采集订单、所述待识别订单中的至少一者;
根据所述实际参考定价和所述预测参考定价,确定每个所述参考订单的参考定价偏差,得到所述订单集合对应的偏差集合;
确定所述偏差集合的偏差平均值、以及偏差标准差;
若所述目标定价偏差小于第一偏差阈值或所述目标定价偏差大于第二偏差阈值,则确定所述目标实际定价异常,其中,所述第一偏差阈值是指所述偏差平均值与n倍的所述偏差标准差之差,所述第二偏差阈值是指所述偏差平均值与n倍的所述偏差标准差之和。
4.根据权利要求2所述的定价信息异常识别方法,其特征在于,所述异常界定方式包括比例差检测法的情况下,所述根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常,包括:
将所述目标预测定价与预设比例系数之间的乘积确定为偏差异常界定值;
若所述目标定价偏差大于所述偏差异常界定值,则确定所述目标实际定价异常。
5.根据权利要求2所述的定价信息异常识别方法,其特征在于,所述异常界定方式包括基于单分类机器学习的异常检测模型检测法的情况下,所述根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常,包括:
调用训练好的异常检测模型,检测所述目标定价偏差是否为异常值,其中,所述异常检测模型通过预设偏差集合训练得到;
当检测到所述目标定价偏差为异常值时,确定所述目标实际定价异常。
6.根据权利要求1所述的定价信息异常识别方法,其特征在于,所述定价策略包括采用定价预测模型预测定价,所述方法还包括:
获取样本数据集,其中,所述样本数据集包括样本订单的样本特征数据和样本实际定价;
根据所述样本数据集构建定价预测模型,所述定价预测模型用于根据订单的特征数据预测订单的定价。
7.根据权利要求1-6任一项所述的定价信息异常识别方法,其特征在于,所述定价策略包括采用定价预测模型预测定价,所述方法还包括:
获取测试集合中的每个测试订单的特征数据以及所述测试集合的多个测试分类;
调用所述定价预测模型,根据所述测试集合中每个所述测试订单的特征数据确定每个所述测试分类的拟合度;
获取所述拟合度大于预设阈值的目标测试分类,其中,所述待识别订单的订单分类与所述目标测试分类相同。
8.一种定价信息异常识别装置,其特征在于,所述定价信息异常识别装置包括:
获取单元,用于获取待识别订单的目标实际定价,以及与所述待识别订单定价关联的目标特征数据;
处理单元,用于根据所述目标特征数据和预设的定价策略,确定所述待识别订单的目标预测定价;
所述处理单元,还用于根据所述目标实际定价与所述目标预测定价,确定所述待识别订单的目标定价偏差;
所述处理单元,还用于根据所述目标定价偏差和预设的异常界定方式,确定所述目标实际定价是否异常。
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至7任一项所述的定价信息异常识别方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行权利要求1至7任一项所述的定价信息异常识别方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110065084.7A CN114820003A (zh) | 2021-01-18 | 2021-01-18 | 定价信息异常识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110065084.7A CN114820003A (zh) | 2021-01-18 | 2021-01-18 | 定价信息异常识别方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114820003A true CN114820003A (zh) | 2022-07-29 |
Family
ID=82525055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110065084.7A Pending CN114820003A (zh) | 2021-01-18 | 2021-01-18 | 定价信息异常识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114820003A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116011912A (zh) * | 2022-12-30 | 2023-04-25 | 广州联雅网络科技有限公司 | 跨境电商智能发货方法及装置、设备、存储介质 |
-
2021
- 2021-01-18 CN CN202110065084.7A patent/CN114820003A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116011912A (zh) * | 2022-12-30 | 2023-04-25 | 广州联雅网络科技有限公司 | 跨境电商智能发货方法及装置、设备、存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108647891B (zh) | 数据异常归因分析方法及装置 | |
WO2020062702A9 (zh) | 短信发送的方法、装置、计算机设备和存储介质 | |
CN108898418A (zh) | 用户账号检测方法、装置、计算机设备和存储介质 | |
CN107679734A (zh) | 一种用于无标签数据分类预测的方法和系统 | |
CN109191133B (zh) | 支付渠道的选择方法及终端设备 | |
WO2023056723A1 (zh) | 故障诊断的方法、装置、电子设备及存储介质 | |
JP6920378B2 (ja) | 再修理用基板の検出装置、方法およびコンピュータ読み取り可能な記憶媒体 | |
CN111242318B (zh) | 基于异构特征库的业务模型训练方法及装置 | |
CN111340086A (zh) | 无标签数据的处理方法、系统、介质及终端 | |
CN107622326A (zh) | 用户分类、可用资源预测方法、装置及设备 | |
CN114764768A (zh) | 缺陷检测分类方法、装置、电子设备及存储介质 | |
CN113313538A (zh) | 用户消费能力预测方法、装置、电子设备和存储介质 | |
CN111860698A (zh) | 确定学习模型的稳定性的方法和装置 | |
CN114595765A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN114820003A (zh) | 定价信息异常识别方法、装置、电子设备及存储介质 | |
CN114298547A (zh) | 用户忠诚度的评分方法、装置、设备及可读存储介质 | |
CN111275071B (zh) | 预测模型训练、预测方法、装置及电子设备 | |
CN111784053A (zh) | 交易风险检测方法、设备及可读存储介质 | |
CN110795308A (zh) | 一种服务器检验方法、装置、设备及存储介质 | |
CN116245630A (zh) | 一种反欺诈检测方法、装置、电子设备及介质 | |
CN108629506A (zh) | 风控模型的建模方法、装置、计算机设备和存储介质 | |
CN112395179B (zh) | 一种模型训练方法、磁盘预测方法、装置及电子设备 | |
CN112926991B (zh) | 一种套现团伙严重等级划分方法及系统 | |
CN110570301B (zh) | 风险识别方法、装置、设备及介质 | |
CN111597934A (zh) | 用于为统计应用处理训练数据的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |