CN112581181A - 申报价格的异常挖掘方法、装置、电子设备及可读介质 - Google Patents
申报价格的异常挖掘方法、装置、电子设备及可读介质 Download PDFInfo
- Publication number
- CN112581181A CN112581181A CN202011562987.8A CN202011562987A CN112581181A CN 112581181 A CN112581181 A CN 112581181A CN 202011562987 A CN202011562987 A CN 202011562987A CN 112581181 A CN112581181 A CN 112581181A
- Authority
- CN
- China
- Prior art keywords
- price
- declared
- target
- historical
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000005065 mining Methods 0.000 title claims abstract description 52
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 49
- 238000007667 floating Methods 0.000 claims description 65
- 239000006185 dispersion Substances 0.000 claims description 13
- 238000000926 separation method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 10
- 125000000205 L-threonino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])[C@](C([H])([H])[H])([H])O[H] 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000009412 basement excavation Methods 0.000 description 4
- 238000007689 inspection Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0278—Product appraisal
Abstract
本公开实施例提供一种申报价格的异常挖掘方法、装置、电子设备及可读介质,该方法包括:获取目标申报物品的目标申报价格;根据所述目标申报物品的历史申报价格序列确定所述目标申报物品的参考价格;根据预设数据集确定所述目标申报物品的参考价格对应的容差范围;若根据所述目标申报物品的参考价格和所述容差范围确定所述目标申报物品的目标申报价格异常时,根据所述目标申报物品生成报警提示信息。本公开实施例提供的申报价格的异常挖掘方法、装置、电子设备及可读介质,能够根据参考价格和自适应的容差范围快速挖掘异常申报价格,提高快件通关作业的效率。
Description
技术领域
本公开涉及反快件通关欺瞒领域,尤其涉及一种申报价格的异常挖掘方法、装置、电子设备及计算机可读介质。
背景技术
在快件通关领域,以价格计价的产品,如钢铁制品或一些工业原材料等,价格多报和少报都会对进口报关税金产生影响,申报单位很有可能出于逃税避税的目的而虚报价格。海关查验工作主要解决申报“单货不符”问题,关员需要对每个报关单中的物品判断申报价格是否存在异常后方能安排通关。然而,每日的报关单数量多达上万件,且申报物品种类繁多,远超出人力能够处理的范围,而只能进行抽查,存在费时费力、低效低能等问题。
因此,快件通关需要一种能够快速识别哪些物品可能存在价格异常情况的方法。价格异常指对于同一个物品,不同申报人提供的一系列价格申报数据中与其它数据不相符的数据点。当大量数据无法手动标记异常值,自动异常挖掘显得至关重要。
现有的异常挖掘方法通常仅针对某一条数据集,采用统计指标对价格序列进行分析,利用方差寻找其中可能的异常值,进行剔除。但并没有深入研究该商品的正常参考标准,在实际使用中不简便可行。对于不同时期、不同人申报的相同商品而言,需要反复将其申报价与历史数据合并计算,判断其是否为异常值。并且,报关商品的种类极多,每日报关的商品数量也多达上万件,这显然无法满足报关单价格估计的应用要求。
因此,需要一种新的申报价格的异常挖掘方法、装置、电子设备及计算机可读介质。
在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本公开实施例提供一种申报价格的异常挖掘方法、装置、电子设备及计算机可读介质,能够根据参考价格和自适应的容差范围快速挖掘异常申报价格,提高快件通关作业的效率。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的第一方面,提出一种申报价格的异常挖掘方法,该方法包括:获取目标申报物品的目标申报价格;根据所述目标申报物品的历史申报价格序列确定所述目标申报物品的参考价格;根据预设数据集确定所述目标申报物品的参考价格对应的容差范围;若根据所述目标申报物品的参考价格和所述容差范围确定所述目标申报物品的目标申报价格异常时,根据所述目标申报物品生成报警提示信息。
在本公开的一种示例性实施例中,根据所述目标申报物品的历史申报价格序列确定所述目标申报物品的参考价格包括:确定所述历史申报价格序列中出现的不同价格值和不同价格值的个数;根据所述不同价格值和所述不同价格值的个数确定所述目标申报物品的参考价格。
在本公开的一种示例性实施例中,根据所述不同价格值和所述不同价格值的个数确定所述目标申报物品的参考价格包括:若所述不同价格值的个数为1,则确定所述不同价格值为所述目标申报物品的参考价格;若所述不同价格值的个数为2,则根据所述不同价格值中的较大价格值和较小价格值在所述历史申报价格序列中出现次数的占比确定所述目标申报物品的参考价格;若所述不同价格值的个数大于或等于3,则根据所述历史申报价格序列的离散系数、偏度系数、所述历史申报价格序列的平均值、四分之一分位数和四分之三分位数确定所述目标申报物品的参考价格。
在本公开的一种示例性实施例中,根据所述历史申报价格序列的离散系数、偏度系数、所述历史申报价格序列的平均值、所述不同价格值中的较大价格值和较小价格值确定所述目标申报物品的参考价格包括:若所述离散系数小于或等于离散系数阈值,则根据所述历史申报价格序列的平均值确定所述目标申报物品的参考价格;若所述离散系数大于离散系数阈值,则根据所述历史申报价格序列的离散系数、偏度系数、所述不同价格值中的最大价格值和最小价格值剔除所述历史申报价格序列的异常值,以根据剔除后的所述历史申报价格序列的平均值确定为所述目标申报物品的参考价格。
在本公开的一种示例性实施例中,根据预设数据集确定所述目标申报物品的参考价格对应的容差范围包括:确定所述预设数据集中各个历史物品的参考价格;根据所述各个历史物品的参考价格对所述各个历史物品进行分箱,获得价格分箱;根据所述目标申报物品的参考价格确定所述目标申报物品在所述价格分箱中的目标价格分箱;确定所述目标价格分箱的阈值上限系数和阈值下限系数;根据所述目标价格分箱的阈值上限系数和阈值下限系数、以及所述目标申报物品的参考价格确定所述目标申报物品的容差范围。
在本公开的一种示例性实施例中,确定所述目标价格分箱的阈值上限系数和阈值下限系数包括:根据所述各个历史物品的参考价格和所述各个历史物品的历史申报价格序列中小于所述参考价格的申报价格确定所述各个历史物品的下限平均浮动程度;根据所述各个历史物品的参考价格和所述各个历史物品的历史申报价格序列中大于或等于所述参考价格的申报价格确定所述各个历史物品的上限平均浮动程度;根据所述各个历史物品的下限平均浮动程度对所述各个历史物品进行分箱,获得第一浮动程度分箱;根据所述各个历史物品的上限平均浮动程度对所述各个历史物品进行分箱,获得第二浮动程度分箱;将每一第一浮动程度分箱中,落入所述目标价格分箱的历史物品的个数与所述每一第一浮动程度分箱中历史物品的个数的比值确定为所述每一第一浮动程度分箱的比例;将每一第二浮动程度分箱中,落入所述目标价格分箱的历史物品的个数与所述每一第二浮动程度分箱中历史物品的个数的比值确定为所述每一第二浮动程度分箱的比例;根据所述每一第一浮动程度分箱的比例和所述每一第一浮动程度分箱的右区间值确定所述目标价格分箱的阈值上限系数;根据所述每一第二浮动程度分箱的比例和所述每一第二浮动程度分箱的右区间值确定所述目标价格分箱的阈值下限系数。
在本公开的一种示例性实施例中,所述方法还包括:根据与所述目标申报物品的税号相同的历史申报事件生成所述预设数据集;或根据与所述目标申报物品的品牌相同的历史申报事件生成所述预设数据集。
根据本公开实施例的第二方面,提出一种申报价格的异常挖掘装置,该装置包括:价格获取模块,配置为获取目标申报物品的目标申报价格;参考价格模块,配置为根据所述目标申报物品的历史申报价格序列确定所述目标申报物品的参考价格;容差范围模块,配置为根据预设数据集确定所述目标申报物品的参考价格对应的容差范围;异常报警模块,配置为若根据所述目标申报物品的参考价格和所述容差范围确定所述目标申报物品的目标申报价格异常时,根据所述目标申报物品生成报警提示信息。
根据本公开实施例的第三方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一项所述的申报价格的异常挖掘方法。
根据本公开实施例的第四方面,提出一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述任一项所述的申报价格的异常挖掘方法。
根据本公开某些实施例提供的申报价格的异常挖掘方法、装置、电子设备及计算机可读介质,根据目标申报物品的历史申报价格序列确定目标申报物品的参考价格,能够基于历史申报数据,确定各物品的参考价格值,构建物品价格标准库,为快件通关提供决策支持,避免同一物品的历史价格序列不同带来的价格混乱的情况。根据预设数据集确定目标申报物品的参考价格对应的容差范围,能够综合考虑不同物品的价格特点,基于预设数据集构建不同价格区间的具有自适应特性的容差系数,生成每件物品价格正常的容差范围,避免当申报物品之间的价格差异较大时,采用相同的阈值会存在误差或者造成与实际不符的情况。根据目标申报物品的参考价格和容差范围确定目标申报物品的目标申报价格异常时,根据目标申报物品生成报警提示信息,提高快件通关作业的效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。下面描述的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种申报价格的异常挖掘方法及装置的系统框图。
图2是根据一示例性实施例示出的一种申报价格的异常挖掘方法的流程图。
图3是根据一示例性实施例示出的一种申报价格的异常挖掘方法的流程图。
图4是根据一示例性实施例示出的一种申报价格的异常挖掘方法的流程图。
图5是根据一示例性实施例示出的一种申报价格的异常挖掘方法的流程图。
图6是根据一示例性实施例示出的一种申报价格的异常挖掘方法的流程图。
图7是根据一示例性实施例示出的分箱示意图。
图8是根据一示例性实施例示出的一种申报价格的异常挖掘方法的流程图。
图9是根据另一示例性实施例示出的一种申报价格的异常挖掘方法的流程图。
图10是根据另一示例性实施例示出的一种申报价格的异常挖掘方法的流程图。
图11是根据一示例性实施例示出的一种申报价格的异常挖掘装置的框图。
图12示意性示出本公开一个示例性实施例中一种电子设备的方框图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本发明的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而省略特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图仅为本发明的示意性图解,图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和步骤,也不是必须按所描述的顺序执行。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
报关单价格异常挖掘算法需要针对上万种不同类别的物品。不同类别物品的申报价格数据特征也各不相同,需要综合使用统计学指标分析、机器学习算法分析不同商品的价格数据,由点到面,建立各类商品的价格仓库。考虑到实际应用中,允许申报人填写的价格存在一定的误差范围,还需根据商品的税号、品牌等不同划分方式,确定一个阈值范围,在此正常范围之外的才会被列入重点布控对象。
下面结合附图对本发明示例实施方式进行详细说明。
图1是根据一示例性实施例示出的一种申报价格的异常挖掘方法及装置的系统框图。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所进行操作的申报价格的异常挖掘系统提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的申报价格的异常挖掘请求等数据进行分析等处理,并将处理结果(例如参考范围、容差范围、报警提示信息--仅为示例)反馈给终端设备。
服务器105可例如获取目标申报物品的目标申报价格;服务器105可例如根据目标申报物品的历史申报价格序列确定目标申报物品的参考价格;服务器105可例如根据预设数据集确定目标申报物品的参考价格对应的容差范围。服务器105可例如若根据目标申报物品的参考价格和容差范围确定目标申报物品的目标申报价格异常时,根据目标申报物品生成报警提示信息。
服务器105可以是一个实体的服务器,还可例如为多个服务器组成,服务器105中的一部分可例如作为本公开中的申报价格的异常挖掘任务提交系统,用于获取将要执行申报价格的异常挖掘命令的任务;以及服务器105中的一部分还可例如作为本公开中的申报价格的异常挖掘系统,用于获取目标申报物品的目标申报价格;根据所述目标申报物品的历史申报价格序列确定所述目标申报物品的参考价格;根据预设数据集确定所述目标申报物品的参考价格对应的容差范围;若根据所述目标申报物品的参考价格和所述容差范围确定所述目标申报物品的目标申报价格异常时,根据所述目标申报物品生成报警提示信息。。
图2是根据一示例性实施例示出的一种申报价格的异常挖掘方法的流程图。本公开实施例提供的申报价格的异常挖掘方法可以由任意具备计算处理能力的电子设备执行,例如终端设备101、102、103和/或服务器105,在下面的实施例中,以服务器执行方法为例进行举例说明,但本公开并不限定于此。本公开实施例提供的申报价格的异常挖掘方法20可以包括步骤S202至S208。
如图2所示,在步骤S202中,获取目标申报物品的目标申报价格。
本公开实施例中,可在接收到新的申报请求时,从该申报请求中获得目标申报物品的目标申报价格。其中,该目标申报物品可包括但不限于物品名称、税号、申报人、申报价格等数据。
在步骤S204中,根据目标申报物品的历史申报价格序列确定目标申报物品的参考价格。
本公开实施例中,目标申报物品的历史申报价格序列可为历史申报事件中申报物品与目标申报物品相同的申报事件中的申报价格组成的序列。例如,可按照申报物品对历史申报事件进行聚类,并将聚类后同一类历史申报事件中的申报价格生成历史申报价格序列。
其中,为避免同一申报人多次重复申报同一物品导致的价格参考偏差,可对价格数据进行预处理。例如,当某一物品的品名、品牌、规格、税号、原产国、申报单位、发件人信息均相同时,若该物品相同价格的申报次数>1,则统一为2,否则为1。
在步骤S206中,根据预设数据集确定目标申报物品的参考价格对应的容差范围。
本公开实施例中,可根据预设数据集确定不同价格区间的容差系数,以将目标申报物品的参考价格对应的价格区间的容差系数确定为目标申报物品的参考价格对应的容差范围。其中,容差范围为目标申报物品的申报价格偏离参考价格的最大范围。可根据目标申报物品的参考价格和容差范围确定目标申报物品的目标申报价格的正常参考范围。例如,参考价格为W,容差范围为:[a,b],其中a为上限,b为下限,a<0,b>0,则目标申报价格的正常参考范围可表示为[W+a,W+b]。其中,预设数据集可为数据库中的全量申报事件的数据集合。在示例性实施例中,还可根据与目标申报物品的税号相同的历史申报事件生成预设数据集;或根据与目标申报物品的品牌相同的历史申报事件生成预设数据集。
在步骤S208中,若根据目标申报物品的参考价格和容差范围确定目标申报物品的目标申报价格异常时,根据目标申报物品生成报警提示信息。
本公开实施例中,可在目标申报物品的目标申报价格未落入根据目标申报物品的参考价格和容差范围确定的正常参考范围时,确认目标申报物品的目标申报价格异常。
根据本公开实施例提供的申报价格的异常挖掘方法,根据目标申报物品的历史申报价格序列确定目标申报物品的参考价格,能够基于历史申报数据,确定各物品的参考价格值,构建物品价格标准库,为快件通关提供决策支持,避免同一物品的历史价格序列不同带来的价格混乱的情况。根据预设数据集确定目标申报物品的参考价格对应的容差范围,能够综合考虑不同物品的价格特点,基于预设数据集构建不同价格区间的具有自适应特性的容差系数,生成每件物品价格正常的容差范围,避免当申报物品之间的价格差异较大时,采用相同的阈值会存在误差或者造成与实际不符的情况。根据目标申报物品的参考价格和容差范围确定目标申报物品的目标申报价格异常时,根据目标申报物品生成报警提示信息,提高快件通关作业的效率。
图3是根据一示例性实施例示出的一种申报价格的异常挖掘方法的流程图。本公开实施例提供申报价格的异常挖掘方法在根据目标申报物品的历史申报价格序列确定目标申报物品的参考价格时,可以包括步骤S302至S304。
如图3所示,在步骤S302中,确定历史申报价格序列中出现的不同价格值和不同价格值的个数。
本公开实施例中,历史申报价格序列中不同价格值是指出现在该历史申报价格序列中的数值不同的价格值。例如,对于历史申报价格序列:(1,1,3,3,4,5),其不同价格值为:1、3、4、5,不同价格值的个数为4。
在步骤S304中,根据不同价格值和不同价格值的个数确定目标申报物品的参考价格。
本公开实施例中,若不同价格值的个数为1,则可确定不同价格值为目标申报物品的参考价格。其中,当不同价格值的个数为1,说明该历史申报价格序列中只存在一个价格值,则可将该唯一的不同价格值确定为目标申报物品的参考价格。该示例可参见附图4的不同价格值的个数counts_num==1的分支步骤,当不同价格值的个数counts_num==1,则参考价格ref_num=num_list[0],其中,num_list为该目标申报物品的历史申报价格序列,num_list[0]为该历史申报价格序列的第一个元素值。
若不同价格值的个数为2,则根据不同价格值中的较大价格值和较小价格值在历史申报价格序列中出现次数的占比确定目标申报物品的参考价格。其中,参见附图4的不同价格值counts_num==2的分支步骤,历史申报价格序列中存在2个不同价格值,假设分别为W0(2个不同价格值中的较小价格值)、W1(较大价格值)。比较2个不同价格值的在历史申报价格序列中出现次数的占比(即不同价格值的申报次数的占比),当出现次数占比之差大于占比阈值时,出现次数占比较大的不同价格值为参考价格。例如,历史申报价格序列中约20%的值为W0(较小价格值),80%为W1(较大价格值),占比阈值为百分比形式的40%,由于80%-20%>40%,则参考价格为W1(较大价格值)。
又例如,当2个不同价格值的出现次数的占比之差小于或等于占比阈值,且W0小于W1的十分之一时,W1(较大价格值)即为参考价格。除此之外的情况可采用价格序列的平均值作为参考价格。
若不同价格值的个数大于或等于3,则根据历史申报价格序列的离散系数、偏度系数、历史申报价格序列的平均值、四分之一分位数和四分之三分位数确定目标申报物品的参考价格。其中,参见附图5的不同价格值counts_num>=3的分支步骤,此时,价格序列中存在多个不同的值,计算价格序列的统计学特征:离散系数cv,偏度系数skew,四分之一分位数q1,最大价格值q3。当离散系数小于或等于离散系数阈值时,即图5中的cv≤0.1的分支步骤,可认为该历史申报价格序列中价格分布集中,可根据历史申报价格序列的平均值确定目标申报物品的参考价格。
当离散系数大于离散系数阈值时,即图5中的cv>0.1的分支步骤,即历史申报价格序列中有极值存在或历史申报价格序列数据分布较为分散时,可根据历史申报价格序列的离散系数、偏度系数、四分之一分位数和四分之三分位数剔除历史申报价格序列的异常值,例如采用最大类间方差算法(otsu算法)挖掘历史申报价格序列中的异常值。在结合偏度系数、四分之一分位数与四分之三分位数之比等统计学指标将异常值从历史申报价格序列中剔除后,在根据剔除后的历史申报价格序列的平均值作为参考价格。
例如图5所示,在离散系数cv满足0.1≤cv≤0.3时,认为数值的数值分布相对集中,但仍存在极值。在该情况下,当偏度系数skew小于0时,可通过如下步骤获得参照价格:S501、利用otsu算法计算获得历史申报价格序列的分割阈值thres_otsu;S502、将历史申报价格序列num_list中,大于或等于thres_otsu的价格值划分为inlier_list,小于thres_otsu的价格值划分为outlier_list;S503、若inlier_list仅有两个不同价格值,则调用图4中的get_price_ref_num_with_2_element的方法获得参考价格;S504、否则参考价格等于inlier_list的平均值。
又例如,在图5中离散系数cv满足0.1≤cv≤0.3的分支步骤中,若偏度系数skew大于等于0时,参考重量等于历史申报重量序列num_list的平均值。
在图5离散系数cv满足cv>0.3的分支步骤中,认为数据的数值分布较为分散,或存在极值。在该情况下,若偏度系数skew<0,则可通过如下步骤获得参考价格:S505、利用otsu算法计算获得历史申报价格序列的分割阈值thres_otsu;S506、将历史申报价格序列num_list中,大于或等于thres_otsu的价格值划分为inlier_list,小于thres_otsu的价格值划分为outlier_list;S507、若inlier_list仅有两个不同价格值,则调用图4中的get_price_ref_num_with_2_element的方法获得参考价格;S508、否则参考价格等于inlier_list的平均值。
在图5离散系数cv满足cv>0.3的分支步骤中,若skew≥0,则可通过如下步骤获得参考价格:S509、利用otsu算法计算获得历史申报价格序列的分割阈值thres_otsu;S510、将历史申报价格序列num_list中,小于或等于thres_otsu的价格值划分为inlier_list,大于thres_otsu的价格值划分为outlier_list;S511、若outlier_list中不同价格值的个数大于1且大于等于inlier_list中不同价格值的个数,且outlier_list的序列长度大于等于inlier_list的序列长度的3/4,则将outlier_list和inlier_list交换;S512、若inlier_list仅有两个不同价格值,则调用图4中的get_price_ref_num_with_2_element的方法获得参考价格;S513、否则参考价格等于inlier_list的平均值。
图6是根据一示例性实施例示出的一种申报价格的异常挖掘方法的流程图。本公开实施例提供申报价格的异常挖掘方法在根据预设数据集确定目标申报物品的参考价格对应的容差范围时,可包括步骤S602至S610。
在步骤S602中,确定预设数据集中各个历史物品的参考价格。
本公开实施例中,各个历史物品的参考价格的确定方式可采用与图3、图4和图5中类似的步骤,此处不再赘述。
在步骤S604中,根据各个历史物品的参考价格对各个历史物品进行分箱,获得价格分箱。
本公开实施例中,分箱结果的示例图可如图7所示。如图7所示的分箱结果示例中,参考价格在[0,3)(单位例如图7所示的元)范围内的历史物品D、E、J为一个价格分箱,参考价格在[3,5)范围内的历史物品C、H、J为一个价格分箱,参考价格在[5,8)范围内的历史物品A、B、G、F为一个价格分箱。
在步骤S606中,根据目标申报物品的参考价格确定目标申报物品在价格分箱中的目标价格分箱。
本公开实施例中,可将目标申报物品的参考价格落入的价格范围对应的价格分箱确定为目标价格分箱。以图7为例,假设目标申报物品的参考价格为3.8元,则其落入[3,5)范围的价格分箱。
在步骤S608中,确定目标价格分箱的阈值上限系数和阈值下限系数。
本公开实施例中,可预先计算获得目标价格分箱对应的阈值上限系数和阈值下限系数。又例如,可计算获得每个价格分箱对应的阈值上限系数和阈值下限系数,以便在目标申报物品的参考价格落入任一价格分箱时,确定该价格分箱对应的阈值上限系数和阈值下限系数。
在步骤S610中,根据目标价格分箱的阈值上限系数和阈值下限系数、以及目标申报物品的参考价格确定目标申报物品的容差范围。
本公开实施例中,假设阈值上限系数表示为αhigh,阈值下限系数表示为αlow,目标申报物品的参考价格表示为Wref,则该目标申报物品的容差范围可表示为:[Wref*(1-αlow),Wref*(1+αhigh)]。
图8是根据一示例性实施例示出的一种申报价格的异常挖掘方法的流程图。本公开实施例提供申报价格的异常挖掘方法在确定目标价格分箱的阈值上限系数和阈值下限系数时,可包括步骤S802至S810。
在步骤S802中,根据各个历史物品的参考价格和各个历史物品的历史申报价格序列中小于参考价格的申报价格确定各个历史物品的下限平均浮动程度。
本公开实施例中,历史物品的历史申报价格序列可为历史申报事件中申报物品与该历史物品相同的申报事件中的申报价格组成的序列。历史物品的下限平均浮动程度为该历史申报价格序列中小于参考价格的各元素与该历史物品的参考价格的浮动程度的平均值的绝对值。例如,对于历史申报价格序列(s1,s2,s3,s4)=(1,2,3,4),假设其参考价格为w=2.5,则该历史申报价格序列中各元素的浮动程度fi可计算为fi=|si-W|/w,i=1,2,3,4。该历史物品的下限平均浮动程度g1可计算为g1(∑si<wfi)/k,其中,k为历史申报价格序列中小于参考价格的元素的个数。例如,在历史申报价格序列(1,2,3,4)中,由于w=2.5,其下限平均浮动程度
在步骤S804中,根据各个历史物品的参考价格和各个历史物品的历史申报价格序列中大于或等于参考价格的申报价格确定各个历史物品的上限平均浮动程度。
本公开实施例中,历史物品的上限平均浮动程度为该历史申报价格序列中大于或等于参考价格的各元素与该历史物品的参考价格的浮动程度的平均值的绝对值。例如,对于历史申报价格序列(s1,s2,s3,s4)=(1,2,3,4),假设其参考价格w=2.5,则该历史物品的上限平均浮动程度f2可计算为f2=(∑si≥wfi)/k,其中,k为历史申报价格序列中大于或等于参考价格的元素的个数。例如,在历史申报价格序列(1,2,3,4)中,由于w=2.5,其上限平均浮动程度
在步骤S806中,根据各个历史物品的下限平均浮动程度对各个历史物品进行分箱,获得第一浮动程度分箱。
本公开实施例中,第一浮动程度分箱的示意图可如图7所示。其中,下限平均浮动程度位于(0,0.05]范围内的历史物品A、B、C、D、E位于同一第一浮动程度分箱,同理,F、G、H位于同一第一浮动程度分箱,I、J位于同一第一浮动程度分箱。
在步骤S808中,根据各个历史物品的上限平均浮动程度对各个历史物品进行分箱,获得第二浮动程度分箱。
本公开实施例中,上限平均浮动程度分箱结果与下限平均浮动程度分箱的结果类似,此处不再赘述。
在步骤S810中,将每一第一浮动程度分箱中,落入目标价格分箱的历史物品的个数与每一第一浮动程度分箱中历史物品的个数的比值确定为每一第一浮动程度分箱的比例。
本公开实施例中,假设目标价格分箱为(3,5]的价格分箱,以第一浮动程度分箱为(0,0.05]为例,其中包括历史物品A、B、C、D、E,其中落入目标价格分箱的历史物品为A、B,则(0,0.05]的第一浮动程度分箱的比例pct1计算为:2/5=0.4。同理可计算获得(0.05,0.1]、(0.1,0.15]等第一浮动程度分箱的比例。
在步骤S812中,将每一第二浮动程度分箱中,落入目标价格分箱的历史物品的个数与每一第二浮动程度分箱中历史物品的个数的比值确定为每一第二浮动程度分箱的比例。
本公开实施例中,第二浮动程度分箱的比例的计算方式与第一浮动程度分箱的比例的计算方式类似,此处不再赘述。
在步骤S814中,根据每一第一浮动程度分箱的比例和每一第一浮动程度分箱的右区间值确定目标价格分箱的阈值上限系数。
本公开实施例中,可将各第一浮动程度分箱的比例生成为比例向量,将各第一浮动程度分箱的右区间生成为右区间向量,则目标价格分箱的阈值上限系数可计算为比例向量和右区间向量的内积。阈值上限系数的计算方式表示为:α1=∑pct1i*i1。其中,i1为第一浮动程度分箱的右区间,pct1i为相应的第一浮动程度分箱的比例。在另一些实施例中,可根据经验将阈值上限系数设置为2α1。
在步骤S816中,根据每一第二浮动程度分箱的比例和每一第二浮动程度分箱的右区间值确定目标价格分箱的阈值下限系数。
本公开实施例中,阈值下限系数的计算方式可采取与阈值上限系数类似的方式,例如,阈值下限系数的计算方式表示为:α2=∑pct2i*i2。其中,i2为第二浮动程度分箱的右区间,pct2i为相应的第二浮动程度分箱的比例。在另一些实施例中,可根据经验将阈值上限系数设置为2α2。
阈值上下限系数随参考价格分箱的变化可如表1所示。
表1阈值上下限系数随价格分箱的变化
W(价格分箱) | α<sub>low</sub>(阈值下限系数) | α<sub>high</sub>(阈值上限系数) |
50 | 0.244 | 0.252 |
100 | 0.223 | 0.235 |
150 | 0.219 | 0.231 |
200 | 0.233 | 0.255 |
300 | 0.241 | 0.256 |
400 | 0.235 | 0.256 |
500 | 0.249 | 0.269 |
1000 | 0.234 | 0.258 |
2000 | 0.222 | 0.22 |
3000 | 0.179 | 0.221 |
4000 | 0.193 | 0.207 |
>4000 | 0.1 | 0.1 |
其中,价格分箱50指(0,50]的价格分箱,价格分箱100指(50,100]的价格分箱。
在另一些实施例中,当预设数据集为根据与目标申报物品的税号相同的历史申报事件生成时,可首先按照税号对历史物品进行分类后,按照上述步骤计算获得不同税号对应的阈值上限系数和阈值下限系数。对于大量缺失值的税号类别的平均浮动程度,可采用全部样本的平均浮动值替代。ii.税号为1的样本(食品类),其参考价格>4000的分箱样本数均为1,为了避免偶然性,假设当参考价格>4000时,参考价格上下限阈值为0.2。其它税号的样本的低价格区间缺失值,采用0.3填充,高价格区间的缺失值采用0.1填充。
经分析后,该方案的参考价格阈值如下表。其中,1_α、4_α、9_α、10_α、11_α、22_α、27_α、其他分别代表不同税号的预设数据集。
表2阈值下限系数随价格分箱的变化
价格分箱 | 1_α | 4_α | 9_α | 10_α | 11_α | 22_α | 27_α | 其它 |
50 | 0.233 | 0.45 | 0.238 | 0.3 | 0.252 | 0.3 | 0.223 | 0.244 |
100 | 0.201 | 0.212 | 0.235 | 0.3 | 0.202 | 0.2 | 0.227 | 0.223 |
150 | 0.222 | 0.175 | 0.222 | 0.3 | 0.159 | 0.1 | 0.208 | 0.219 |
200 | 0.234 | 0.3 | 0.228 | 0.3 | 0.2 | 0.125 | 0.223 | 0.233 |
300 | 0.24 | 0.267 | 0.18 | 0.267 | 0.16 | 0.3 | 0.133 | 0.241 |
400 | 0.232 | 0.28 | 0.2 | 0.2 | 0.167 | 0.2 | 0.1 | 0.235 |
500 | 0.239 | 0.412 | 0.2 | 0.4 | 0.1 | 0.233 | 0.1 | 0.249 |
1000 | 0.234 | 0.1 | 0.1 | 0.2 | 0.1 | 0.1 | 0.1 | 0.234 |
2000 | 0.223 | 0.1 | 0.133 | 0.1 | 0.1 | 0.1 | 0.1 | 0.222 |
3000 | 0.225 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.179 |
4000 | 0.238 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.193 |
>4000 | 0.2 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 |
表3阈值上限系数随价格分箱的变化
价格分箱 | 1_α | 4_α | 9_α | 10_α | 11_α | 22_α | 27_α | 其它 |
50 | 0.225 | 0.3 | 0.256 | 0.3 | 0.295 | 0.4 | 0.227 | 0.252 |
100 | 0.208 | 0.212 | 0.241 | 0.3 | 0.195 | 0.325 | 0.241 | 0.235 |
150 | 0.23 | 0.191 | 0.224 | 0.3 | 0.138 | 0.1 | 0.217 | 0.231 |
200 | 0.242 | 0.331 | 0.226 | 0.3 | 0.2 | 0.2 | 0.223 | 0.255 |
300 | 0.251 | 0.3 | 0.185 | 0.367 | 0.218 | 0.233 | 0.2 | 0.256 |
400 | 0.251 | 0.28 | 0.175 | 0.2 | 0.133 | 0.2 | 0.1 | 0.256 |
500 | 0.259 | 0.225 | 0.4 | 0.4 | 0.1 | 0.167 | 0.1 | 0.269 |
1000 | 0.245 | 0.1 | 0.1 | 0.4 | 0.1 | 0.1 | 0.1 | 0.258 |
2000 | 0.218 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.22 |
3000 | 0.275 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.221 |
4000 | 0.256 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.207 |
>4000 | 0.2 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 | 0.1 |
在另一些实施例中,当预设数据集为根据与目标申报物品的品牌相同的历史申报事件生成时,可首先按照品牌对历史物品进行分类后,按照上述步骤计算获得不同品牌对应的阈值上限系数和阈值下限系数。对于品牌为空的数据,可采用“其它”进行填充,作为一类处理。假设0.1≤α≤0.3,样本共3834种商品品牌,阈值下限系数和阈值上限系数根据各品牌的价格序列的浮动程度计算。
在本公开另一示例性实施例提供的申报价格的异常挖掘方法中,可分析某下半年的快件报关单数据,经预处理后得到各历史物品的价格序列数据。基于各历史物品的历史申报价格序列进行参考价格的计算,建立物品的价格标准库,部分结果如表4所示。
表4物品价格标准库(部分)
确定物品参考价格后,采用基于税号的方案确定商品的阈值上下限系数,并计算每一个物品的正常价格范围,部分结果如表4所示。在获取到目标申报物品的目标申报价格后,可执行如下步骤:1)整理每个历史申报物品的历史申报价格序列W(W1,W2,…,Wn),作升序排列,并进行前述提及的价格数据的预处理。2)采用ostu算法去除历史申报价格序列W(W1,W2,…,Wn)中的异常值,得到新的正常价格序列Winlier(W1,W2,…,Wm),计算价格序列Winlier中不同价格值出现的次数count,价格序列Winlier的长度length。3)若count=1,则价格阈值为[0.7Wref,1.3Wref],取0.3的阈值是由于绝大部分物品的价格浮动程度在0~0.3之间,出于放宽阈值的需求,将阈值定为0.3。4)若count=2,即价格序列中不重复的值为W1,W2,计算W1与W2的比值pct_value_W1,计算W1在价格序列中出现次数的比例pct_count_W1,并可根据附图9的判断条件计算容差范围。5)若count>2,计算价格序列Winlier(W1,W2,…,Wm)的离散系数cv,四分之一分位数q1,四分之三分位数q3,并根据附图10的判断条件计算容差范围。
在图9所示实施例中,在步骤S902中,对于价格序列Winlier(W1,W2),W1与W2的比值为pct_value_W1,W1在价格序列中出现次数的比例为pct_count_W1。
在步骤S904中,若pct_value_W1≥0.5,或0.1<pct_value_W1<0.5且pct_count_W1>0.4,则容差范围为[min(W1,(1-αlow)Wref),max(W2,(1+αhigh)Wref)]。
在步骤S906中,若pct_value_W1≤0.1时,或0.1<pct_value_W1<0.5且pct_count_W1≤0.4时,则容差范围为[(1-αlow)Wref,max(W2,(1+αhigh)Wref)]。
在图10所示实施例中,在步骤S1002中,对于价格序列Winlier(W1,W2,...,Wm),离散系数为cv,偏度系数为skew,四分之一分位数为q1,四分之三分位数q3。
在步骤S1004中,若cv≤0.1时,或0.1<cv≤0.3且skew≤0时,则容差范围为[min(W1,(1-αlow)Wref),max(Wm,(1+αhigh)Wref)]。
在步骤S1006中,若cv>0.3时,则容差范围为[(1-αlow)Wref,(1+αhigh)Wref]。
在步骤S1008中,若0.1<cv≤0.3且skew>0时,则容差范围为[min(q1,(1-αlow)Wref),max(q3,(1+αhigh)Wref)]。
本公开实施例的申报价格的异常挖掘方法,通过分析历史报关单的申报数据,确定物品的参考价格,物品正常的价格浮动范围,建立物品价格标准库信息,实现对历史报关单中积累的物品申报信息进行整合。并根据价格标准库信息,结合异常挖掘技术分析各类物品的申报价格序列中是否存在异常、哪些物品是发生异常的重点类别,需要重点布控等,可以更好的提高快件通关作业的效率。
将异常挖掘的理念和技术引入反快件通关欺瞒领域,研究快件价格异常挖掘的方法。可以在申报单填写完毕后,人工通关检查未执行前提前发现可能存在虚报谎报的货物,有效解决人工查验的低效、抽查问题,是保障快件通关的一项重要举措。
本公开实施例提出了一种申报价格的异常挖掘方法,从快件的历史申报价格中确定各物品的价格参考值,构建物品价格标准库,为快件通关提供决策支持。提出了自适应的价格阈值计算方法,避免当申报物品之间的价格差异较大时,采用相同的阈值会存在误差或者造成与实际不符的情况。
应清楚地理解,本公开描述了如何形成和使用特定示例,但本公开的原理不限于这些示例的任何细节。相反,基于本公开公开的内容的教导,这些原理能够应用于许多其它实施例。
本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由中央处理器(Central Processing Unit,CPU)执行的计算机程序。在该计算机程序被中央处理器CPU执行时,执行本公开提供的上述方法所限定的上述功能。的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
此外,需要注意的是,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图11是根据一示例性实施例示出的一种申报价格的异常挖掘装置的框图。参照图11,本公开实施例提供的申报价格的异常挖掘装置1100可以包括:价格获取模块1102、参考价格模块1104、容差范围模块1106和异常报警模块1108。
在申报价格的异常挖掘装置1100中,价格获取模块1102可配置为获取目标申报物品的目标申报价格。
参考价格模块1104可配置为根据目标申报物品的历史申报价格序列确定目标申报物品的参考价格。
容差范围模块1106可配置为根据预设数据集确定目标申报物品的参考价格对应的容差范围。
异常报警模块1108可配置为若根据目标申报物品的参考价格和容差范围确定目标申报物品的目标申报价格异常时,根据目标申报物品生成报警提示信息。
根据本公开实施例提供的申报价格的异常挖掘装置,根据目标申报物品的历史申报价格序列确定目标申报物品的参考价格,能够基于历史申报数据,确定各物品的参考价格值,构建物品价格标准库,为快件通关提供决策支持,避免同一物品的历史价格序列不同带来的价格混乱的情况。根据预设数据集确定目标申报物品的参考价格对应的容差范围,能够综合考虑不同物品的价格特点,基于预设数据集构建不同价格区间的具有自适应特性的容差系数,生成每件物品价格正常的容差范围,避免当申报物品之间的价格差异较大时,采用相同的阈值会存在误差或者造成与实际不符的情况。根据目标申报物品的参考价格和容差范围确定目标申报物品的目标申报价格异常时,根据目标申报物品生成报警提示信息,提高快件通关作业的效率。
下面参照图12来描述根据本发明的这种实施方式的电子设备1200。图12显示的电子设备1200仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图12所示,电子设备1200以通用计算设备的形式表现。电子设备1200的组件可以包括但不限于:上述至少一个处理单元1210、上述至少一个存储单元1220、连接不同系统组件(包括存储单元1220和处理单元1210)的总线1230。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1210执行,使得所述处理单元1210执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元1210可以执行如图1中所示的步骤S202,获取目标申报物品的目标申报价格;步骤S204:根据目标申报物品的历史申报价格序列确定目标申报物品的参考价格;步骤S206:根据预设数据集确定目标申报物品的参考价格对应的容差范围;步骤S208:若根据目标申报物品的参考价格和容差范围确定目标申报物品的目标申报价格异常时,根据目标申报物品生成报警提示信息。存储单元1220还可用于存储包括价格标准数据库,该价格标准数据库可存储分析获取的历史申报物品的物品名称、规格、参考价格、容差范围等信息。
存储单元1220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)12201和/或高速缓存存储单元12202,还可以进一步包括只读存储单元(ROM)12203。
存储单元1220还可以包括具有一组(至少一个)程序模块12205的程序/实用工具12204,这样的程序模块12205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1200也可以与一个或多个外部设备1300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1200交互的设备通信,和/或与使得该电子设备1200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1250进行。并且,电子设备1200还可以通过网络适配器1260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1260通过总线1230与电子设备1200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和构思由权利要求指出。
Claims (10)
1.一种申报价格的异常挖掘方法,其特征在于,包括:
获取目标申报物品的目标申报价格;
根据所述目标申报物品的历史申报价格序列确定所述目标申报物品的参考价格;
根据预设数据集确定所述目标申报物品的参考价格对应的容差范围;
若根据所述目标申报物品的参考价格和所述容差范围确定所述目标申报物品的目标申报价格异常时,根据所述目标申报物品生成报警提示信息。
2.如权利要求1所述的方法,其特征在于,根据所述目标申报物品的历史申报价格序列确定所述目标申报物品的参考价格包括:
确定所述历史申报价格序列中出现的不同价格值和不同价格值的个数;
根据所述不同价格值和所述不同价格值的个数确定所述目标申报物品的参考价格。
3.如权利要求1所述的方法,其特征在于,根据所述不同价格值和所述不同价格值的个数确定所述目标申报物品的参考价格包括:
若所述不同价格值的个数为1,则确定所述不同价格值为所述目标申报物品的参考价格;
若所述不同价格值的个数为2,则根据所述不同价格值中的较大价格值和较小价格值在所述历史申报价格序列中出现次数的占比确定所述目标申报物品的参考价格;
若所述不同价格值的个数大于或等于3,则根据所述历史申报价格序列的离散系数、偏度系数、所述历史申报价格序列的平均值、四分之一分位数和四分之三分位数确定所述目标申报物品的参考价格。
4.如权利要求3所述的方法,其特征在于,根据所述历史申报价格序列的离散系数、偏度系数、所述历史申报价格序列的平均值、所述不同价格值中的较大价格值和较小价格值确定所述目标申报物品的参考价格包括:
若所述离散系数小于或等于离散系数阈值,则根据所述历史申报价格序列的平均值确定所述目标申报物品的参考价格;
若所述离散系数大于离散系数阈值,则根据所述历史申报价格序列的离散系数、偏度系数、所述不同价格值中的最大价格值和最小价格值剔除所述历史申报价格序列的异常值,以根据剔除后的所述历史申报价格序列的平均值确定为所述目标申报物品的参考价格。
5.如权利要求1所述的方法,其特征在于,根据预设数据集确定所述目标申报物品的参考价格对应的容差范围包括:
确定所述预设数据集中各个历史物品的参考价格;
根据所述各个历史物品的参考价格对所述各个历史物品进行分箱,获得价格分箱;
根据所述目标申报物品的参考价格确定所述目标申报物品在所述价格分箱中的目标价格分箱;
确定所述目标价格分箱的阈值上限系数和阈值下限系数;
根据所述目标价格分箱的阈值上限系数和阈值下限系数、以及所述目标申报物品的参考价格确定所述目标申报物品的容差范围。
6.如权利要求5所述的方法,其特征在于,确定所述目标价格分箱的阈值上限系数和阈值下限系数包括:
根据所述各个历史物品的参考价格和所述各个历史物品的历史申报价格序列中小于所述参考价格的申报价格确定所述各个历史物品的下限平均浮动程度;
根据所述各个历史物品的参考价格和所述各个历史物品的历史申报价格序列中大于或等于所述参考价格的申报价格确定所述各个历史物品的上限平均浮动程度;
根据所述各个历史物品的下限平均浮动程度对所述各个历史物品进行分箱,获得第一浮动程度分箱;
根据所述各个历史物品的上限平均浮动程度对所述各个历史物品进行分箱,获得第二浮动程度分箱;
将每一第一浮动程度分箱中,落入所述目标价格分箱的历史物品的个数与所述每一第一浮动程度分箱中历史物品的个数的比值确定为所述每一第一浮动程度分箱的比例;
将每一第二浮动程度分箱中,落入所述目标价格分箱的历史物品的个数与所述每一第二浮动程度分箱中历史物品的个数的比值确定为所述每一第二浮动程度分箱的比例;
根据所述每一第一浮动程度分箱的比例和所述每一第一浮动程度分箱的右区间值确定所述目标价格分箱的阈值上限系数;
根据所述每一第二浮动程度分箱的比例和所述每一第二浮动程度分箱的右区间值确定所述目标价格分箱的阈值下限系数。
7.如权利要求1或5所述的方法,其特征在于,还包括:
根据与所述目标申报物品的税号相同的历史申报事件生成所述预设数据集;或
根据与所述目标申报物品的品牌相同的历史申报事件生成所述预设数据集。
8.一种申报价格的异常挖掘装置,其特征在于,包括:
价格获取模块,配置为获取目标申报物品的目标申报价格;
参考价格模块,配置为根据所述目标申报物品的历史申报价格序列确定所述目标申报物品的参考价格;
容差范围模块,配置为根据预设数据集确定所述目标申报物品的参考价格对应的容差范围;
异常报警模块,配置为若根据所述目标申报物品的参考价格和所述容差范围确定所述目标申报物品的目标申报价格异常时,根据所述目标申报物品生成报警提示信息。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011562987.8A CN112581181A (zh) | 2020-12-25 | 2020-12-25 | 申报价格的异常挖掘方法、装置、电子设备及可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011562987.8A CN112581181A (zh) | 2020-12-25 | 2020-12-25 | 申报价格的异常挖掘方法、装置、电子设备及可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112581181A true CN112581181A (zh) | 2021-03-30 |
Family
ID=75139657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011562987.8A Pending CN112581181A (zh) | 2020-12-25 | 2020-12-25 | 申报价格的异常挖掘方法、装置、电子设备及可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112581181A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116109364A (zh) * | 2023-02-16 | 2023-05-12 | 北京青萌数海科技有限公司 | 一种价格评估方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120143721A1 (en) * | 2010-12-02 | 2012-06-07 | John Hutchinson | Methods and systems to maintain, check, report, and audit contract and historical pricing in electronic procurement |
CN105808655A (zh) * | 2016-02-26 | 2016-07-27 | 广州品唯软件有限公司 | 一种海量数据异常检查的处理方法、装置及系统 |
CN111798264A (zh) * | 2020-05-25 | 2020-10-20 | 北京齐尔布莱特科技有限公司 | 一种异常信息识别方法及计算设备 |
CN111861032A (zh) * | 2020-07-29 | 2020-10-30 | 广州海关技术中心 | 基于深度学习的大宗资源类矿产品放行风险预测方法 |
-
2020
- 2020-12-25 CN CN202011562987.8A patent/CN112581181A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120143721A1 (en) * | 2010-12-02 | 2012-06-07 | John Hutchinson | Methods and systems to maintain, check, report, and audit contract and historical pricing in electronic procurement |
CN105808655A (zh) * | 2016-02-26 | 2016-07-27 | 广州品唯软件有限公司 | 一种海量数据异常检查的处理方法、装置及系统 |
CN111798264A (zh) * | 2020-05-25 | 2020-10-20 | 北京齐尔布莱特科技有限公司 | 一种异常信息识别方法及计算设备 |
CN111861032A (zh) * | 2020-07-29 | 2020-10-30 | 广州海关技术中心 | 基于深度学习的大宗资源类矿产品放行风险预测方法 |
Non-Patent Citations (1)
Title |
---|
任尔伟等: "数据挖掘技术在海关查验和价格瞒骗辅助决策中的应用", 上海海关高等专科学校学报, no. 3, pages 58 - 61 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116109364A (zh) * | 2023-02-16 | 2023-05-12 | 北京青萌数海科技有限公司 | 一种价格评估方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108734344B (zh) | 订单配送预测方法、装置、设备及计算机可读存储介质 | |
AU2012203348B2 (en) | High-risk procurement analytics and scoring system | |
Delen et al. | Measuring firm performance using financial ratios: A decision tree approach | |
CN111401777B (zh) | 企业风险的评估方法、装置、终端设备及存储介质 | |
Chor et al. | The global production line position of Chinese firms | |
CN102870129A (zh) | 动态自适应进程发现和遵守 | |
Bargshady et al. | Business Inteligence Technology Implimentation Readiness Factors | |
Jung et al. | Model validation and diagnostics | |
CN112581181A (zh) | 申报价格的异常挖掘方法、装置、电子设备及可读介质 | |
CN110619400A (zh) | 用于生成订单信息的方法和装置 | |
CN112419030A (zh) | 财务舞弊风险评估的方法、系统及设备 | |
CN111666191A (zh) | 数据质量监控方法、装置、电子设备及存储介质 | |
US20140297359A1 (en) | Risk management device | |
KR20180004739A (ko) | 비즈니스의 운영을 모니터링하는데 사용되는 시스템 및 방법 | |
CN115062687A (zh) | 企业信用监控方法、装置、设备及存储介质 | |
Ramsey et al. | Labor dynamics and supply chain disruption in food manufacturing | |
CN112598354A (zh) | 申报重量的异常挖掘方法、装置、电子设备及可读介质 | |
Fajri et al. | Implementation of Business Intelligence to Determine Evaluation of Activities (Case Study Indonesia Stock Exchange). | |
US8712738B2 (en) | Determining ill conditioning in square linear system of equations | |
US20200265521A1 (en) | Multimedia risk summarizer | |
CN113743752A (zh) | 一种数据处理方法及装置 | |
Youssef | Measuring the Intensity Level of Just‐in‐Time Activities and Its Impacton Quality | |
CN112906723A (zh) | 一种特征选择的方法和装置 | |
Gafner et al. | Efficiency measurement of grocery retail warehouses with DEA | |
Kubenka et al. | Implementation of standards into predictors of financial stability |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |