CN109919357B - 一种数据确定方法、装置、设备及介质 - Google Patents

一种数据确定方法、装置、设备及介质 Download PDF

Info

Publication number
CN109919357B
CN109919357B CN201910094498.5A CN201910094498A CN109919357B CN 109919357 B CN109919357 B CN 109919357B CN 201910094498 A CN201910094498 A CN 201910094498A CN 109919357 B CN109919357 B CN 109919357B
Authority
CN
China
Prior art keywords
characteristic
value
actual
target event
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910094498.5A
Other languages
English (en)
Other versions
CN109919357A (zh
Inventor
周扬
于君泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN201910094498.5A priority Critical patent/CN109919357B/zh
Publication of CN109919357A publication Critical patent/CN109919357A/zh
Priority to PCT/CN2019/119344 priority patent/WO2020155788A1/zh
Application granted granted Critical
Publication of CN109919357B publication Critical patent/CN109919357B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例公开了一种数据确定方法、装置、设备及介质,数据确定方法包括:确定目标事件的各个特征的参考特征值以及实际特征值;根据一个或多个特征的实际特征值确定目标数据的预测结果;根据一个或多个特征的实际特征值与参考特征值确定所述预测结果是否符合条件;若符合,则将所述预测结果作为所述目标数据的实际结果。

Description

一种数据确定方法、装置、设备及介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据确定方法、装置、设备及介质。
背景技术
现有技术中,很多情况下还需要人工确定需要得到的数据,例如在交通费报销情景下,需要人工确定交通行程的始发地和目的地。采用人工确定数据的方式往往耗费时间长,效率也比较低。
有鉴于此,需要更高效的数据确定方案。
发明内容
本说明书实施例提供一种数据确定方法、装置、设备及介质,用以解决如何更高效地确定数据的技术问题。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供一种数据确定方法,包括:
确定目标事件的各个特征的参考特征值以及实际特征值;
根据一个或多个特征的实际特征值确定目标数据的预测结果;
根据一个或多个特征的实际特征值与参考特征值确定所述预测结果是否符合条件;
若符合,则将所述预测结果作为所述目标数据的实际结果。
本说明书实施例提供一种数据确定装置,包括:
值确定模块,用于确定目标事件的各个特征的参考特征值以及实际特征值;
预测模块,用于根据一个或多个特征的实际特征值确定目标数据的预测结果;
判断模块,用于根据一个或多个特征的实际特征值与参考特征值确定所述预测结果是否符合条件;
结果确定模块,用于若所述预测结果符合条件,则将所述预测结果作为所述目标数据的实际结果。
本说明书实施例提供一种数据确定设备,包括:
至少一个处理器;
以及,
与所述至少一个处理器通信连接的存储器;
其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
确定目标事件的各个特征的参考特征值以及实际特征值;
根据一个或多个特征的实际特征值确定目标数据的预测结果;
根据一个或多个特征的实际特征值与参考特征值确定所述预测结果是否符合条件;
若符合,则将所述预测结果作为所述目标数据的实际结果。
本说明书实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如下的步骤:
确定目标事件的各个特征的参考特征值以及实际特征值;
根据一个或多个特征的实际特征值确定目标数据的预测结果;
根据一个或多个特征的实际特征值与参考特征值确定所述预测结果是否符合条件;
若符合,则将所述预测结果作为所述目标数据的实际结果。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过一个或多个特征的实际特征值来自动确定目标数据的预测结果,预测速度快,效率高,效果好;根据一个或多个特征的实际特征值与参考特征值自动确定预测结果是否符合条件,进一步保证了预测结果的准确性;在预测结果符合条件的情况下,自动将预测结果作为目标数据的实际结果,能够更快速、更高效地确定目标数据的实际结果,且保障了目标数据的实际结果的准确性。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对本说明书实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书第一个实施例中数据确定系统的工作示意图。
图2是本说明书第二个实施例中数据确定方法的流程示意图。
图3是本说明书第二个实施例中的数据确定过程示意图。
图4是本说明书第二个实施例中的数据确定流程图。
图5是本说明书第三个实施例中的聚类示意图。
图6是本说明书第三个实施例中的兴趣点确定示意图。
图7是本说明书第四个实施例中数据确定装置的结构示意图。
图8是本说明书第四个实施例中数据确定装置的另一种结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
如图1所示,本说明书第一个实施例提供了一种数据确定系统,具体的,数据确定系统确定目标事件的各个特征的参考特征值以及实际特征值;数据确定系统根据一个或多个特征的实际特征值确定目标数据的预测结果;数据确定系统根据一个或多个特征的实际特征值与参考特征值确定所述预测结果是否符合条件;若符合,则数据确定系统将所述预测结果作为所述目标数据的实际结果。
在本实施例中,通过一个或多个特征的实际特征值来自动确定目标数据的预测结果,预测速度快,效率高,效果好;根据一个或多个特征的实际特征值与参考特征值自动确定预测结果是否符合条件,进一步保证了预测结果的准确性;在预测结果符合条件的情况下,自动将预测结果作为目标数据的实际结果,能够更快速、更高效地确定目标数据的实际结果,且保障了目标数据的实际结果的准确性。
从程序角度而言,上述流程的执行主体可以为计算机或者服务器或者相应的数据确定系统等。另外,也可以由第三方应用客户端协助所述执行主体执行上述流程。
图2是本说明书第二个实施例中的数据确定方法的流程示意图,图3是本实施例中的数据确定过程示意图,图4是本实施例中的数据确定流程示意图,结合图2、图3和图4,本实施例中数据确定方法包括:
S101:确定目标事件的各个特征的参考特征值以及实际特征值。
在本实施例中,所述的“目标事件”可以是任何事件,而不必然区分事件类型、事件时间或者其他条件等。可以指定任何事件为目标事件,也可指定目标事件所需要符合的条件。本实施例中目标数据的确定可以针对一个或多个目标事件进行,所针对的这一个或多个目标事件可以称为对象事件。
在本实施例中,可以确定目标事件(即对象事件)所具有或应该具有的特征,例如地理位置特征、时间特征等(这里的特征也可以作为上述的目标事件所需要符合的条件,即将具有所确定的特征的事件作为目标事件)。确定特征既可以在目标事件发生之前,也可以在目标事件发生之后,且不同的目标事件(例如不同时间、不同地点、不同类型的目标事件)所确定的特征的内容以及数量等可能相同或不同。
在本实施例中,在确定了目标事件(即对象事件)的特征后,可以确定目标事件的各个特征的参考特征值以及实际特征值。具体的,确定目标事件的各个特征的参考特征值可以采用的方式包括但不限于:
S1011、对目标事件的任一特征,确定该特征的历史值或样本值;
对目标事件(即对象事件)的任一特征,不妨记为特征A,可以确定特征A的历史值或样本值。例如相同的目标事件可能已经发生过,并且在过去的一次或多次目标事件中都可以确定出特征A,则特征A在这过去的一次或多次目标事件中的特征值即可作为对象事件中特征值A的历史值或样本值。
S1012、根据所述历史值或样本值确定该特征的参考特征值。
确定了特征A的历史值或样本值之后,就可以根据历史值或样本值确定特征A的参考特征值。具体的,根据所述历史值或样本值确定特征的参考特征值可以采用的方式包括但不限于:
1.1、将特征的历史值或样本值的均值或中值或平均值作为该特征的参考特征值。
沿用特征A,若确定了特征A的历史值或样本值包括A1、……Ai,则可将A1、……Ai的均值或中值或平均值作为特征A的参考特征值。
1.2、对特征的历史值或样本值进行聚类得到各个类别,将每类别的平均值作为特征该类别的参考特征值。
沿用特征A,若确定了其历史值或样本值包括A1、……Ai,则可对若确定了其历史值或样本值包括A1、……Ai进行聚类,从而可以得到一个或多个类别。对于每个类别,可以将该类别中的历史值或样本值的平均值作为该类别的参考特征值,也就是特征A的参考特征值。例如某类别中包含Am,……,An(均为特征A的历史值或样本值,1≤m≤n≤i),则可将Am,……,An的平均值作为该类别的参考特征值,也就是特征A的参考特征值。可见,通过该方式,若特征A的历史值或样本值被分成了多个类别,则特征A就可以有多个参考特征值。
在本实施例中,还可以确定特征A的实际特征值,特征A的实际特征值为目标事件(即对象事件)中特征A所确定的实际的特征值;例如若特征A是时间特征,则特征A的实际特征值即为目标事件(即对象事件)的实际发生时间;若特征A是地理位置特征,则特征A的实际特征值即为目标事件(即对象事件)的实际发生地理位置。
S102:根据一个或多个特征的实际特征值确定目标数据的预测结果。
在本实施例中,所述的“目标数据”可以是任何数据,而不必然区分数据类型、数据时间或者其他条件等。可以指定任何数据为目标数据,也可指定目标数据所需要符合的条件。
在本实施例中,可以利用一个或多个特征的实际特征值来确定目标数据的预测结果。具体的,根据一个或多个特征的实际特征值确定目标数据的预测结果可以采用的方式包括但不限于:
S1021:选定一个或多个特征,且对于任一选定的特征,确定该特征的参考特征值中与实际特征值对应的参考特征值。
可以从目标事件(即对象事件)的特征中选定一个或多个特征,且对于任一选定的特征,从该特征的参考特征值中确定该特征的实际特征值对应的参考特征值。不妨假定特征B为目标事件(即对象事件)在本步骤中被选定的特征中的任意一个,特征B的实际特征值为b,参考特征值有B1、……、Bj(j≥1),则可以从B1、……、Bj中确定特征B的实际特征值b对应的特征B的参考特征值。
S1022:根据所述选定的一个或多个特征的实际特征值对应的参考特征值确定目标数据的预测结果。
对于S1021中被选定的一个或多个特征来说,通过这些被选定的特征的实际特征值可以找到对应的参考特征值,然后通过这些对应的参考特征值可以确定目标数据的预测结果。比如,可以将这些对应的参考特征值作为目标数据的预测结果。
S103:根据一个或多个特征的实际特征值与参考特征值确定所述预测结果是否符合条件。
在本实施例中,可以利用一个或多个特征的实际特征值与参考特征值确定目标数据的预测结果是否符合条件。具体的,根据一个或多个特征的实际特征值与参考特征值确定所述预测结果是否符合条件可以采用的方式包括但不限于:
S1031:选定一个或多个特征,且对于任一选定的特征,确定该特征的参考特征值中与实际特征值对应的参考特征值。
过程同S1021,但是本步骤中选定的特征数与A1021中选定的特征数不一定相同或不同,同时这里假定特征C为目标事件(即对象事件)在本步骤中被选定的特征中的任意一个,并假定特征C的实际特征值为c,c对应的参考特征值为Co。
S1032:对于任一S1031中选定的特征,确定该特征的实际特征值与对应的参考特征值的差值是否超出该特征对应的预设范围。
沿用特征C,可以确定特征C的实际特征值c与c对应的参考特征值Co的差值是否超出特征C对应的预设范围(简称特征C是否超范围)。
S1033:在S1031选定的特征中:若实际特征值与对应参考特征值的差值不超范围的特征数等于或大于第一阈值,则所述预测结果符合条件;
和/或,
若实际特征值与对应参考特征值的差值超范围的特征数等于或小于第二阈值,则所述预测结果符合条件;
和/或,
若实际特征值与对应参考特征值的差值不超范围的特征数等于或小于第三阈值,则所述预测结果不符合条件;
和/或,
若实际特征值与对应参考特征值的差值超范围的特征数等于或大于第四阈值,则所述预测结果不符合条件。
即,在S1031选定的一个或多个特征中,若不超范围的特征数等于或大于第一阈值,则所述预测结果符合条件;
和/或,
若超范围的特征数等于或小于第二阈值,则所述预测结果符合条件;
和/或,
若不超范围的特征数等于或小于第三阈值,则所述预测结果不符合条件;
和/或,
如超范围的特征数等于或大于第四阈值,则所述预测结果不符合条件。
上述的第一阈值、第二阈值、第三阈值、第四阈值可以根据需要确定或者变化,例如可以取S1031中选定的特征数。上述的第一阈值、第二阈值、第三阈值、第四阈值可以结合使用,但不可出现冲突,比如比如若不超范围的特征数等于或大于第一阈值,则所述预测结果符合条件与若不超范围的特征数等于或小于第三阈值,则所述预测结果不符合条件两者同时使用时,第一阈值和第三阈值不可相同。
在本实施例中,若采用1.2的方式确定特征的参考特征值,则对于任一选定的特征,确定该特征的实际特征值对应的参考特征值可以采用的方式包括但不限于:
对于任一选定的特征,确定该特征的实际特征值所属的由历史值或样本值聚类后的类别,并将所属类别的参考特征值作为与实际特征值对应的参考特征值。沿用特征B(特征C同理可得),在对特征B的历史值或样本值聚类后,可以得到每类别的参考特征值;确定特征B的实际特征值b所属的由特征B的历史值或样本值聚类后的类别,并将实际特征值b所属类别的参考特征值作为与实际特征值b对应的参考特征值。
上述确定实际特征值对应的参考特征值的方式对S1021和S1031均适用。
另外,在S1031中还可以采用以下方式确定实际特征值对应的参考特征值:
前面已经说明,每个特征的参考特征值可能有多个,则可以确定特征之间的参考特征值的对应关系。例如特征D有参考特征值D1、……、Dp,特征E有参考特征值E1、……、Eq,则可以确定特征D和特征E之间参考特征值的对应关系,例如D1对应E1,D2对应E2,……。这样,可以确定各个特征之间的参考特征值的对应关系。
假设,对于S1021中被选定的任一特征B,已确定了该特征的实际特征值对应的参考特征值Bj,则对于S1031中被选定的任一特征C来说,若特征C的参考特征值中与Bj对应的为Co,则在S1031中将Co作为特征C的实际特征值对应的参考特征值。
特别的,在本实施例中,S102中用于确定目标数据的预测结果的实际特征值与S103中用于确定预测结果是否符合条件的实际特征值分属不同的特征,也即,S1021中被选定的一个或多个特征与S1031中被选定的一个或多个特征不相同,从而可以进一步保证结果预测与预测结果评判之间的相对独立性,提高结果评判的准确性。
S104:若预测结果符合条件,则将所述预测结果作为所述目标数据的实际结果。
在本实施例中,若预测结果符合条件,则可以将预测结果作为目标数据的实际结果。例如,若目标事件是交易时间,目标数据是消费金额,预测结果是100元,且预测结果符合条件,则可以将预测结果作为目标数据的实际结果。
在本实施例中,通过一个或多个特征的实际特征值来自动确定目标数据的预测结果,预测速度快,效率高;确定预测结果时还结合了实际特征值与参考特征值的对应关系,使得预测结果不仅依赖于实际特征值,还依赖于参考特征值,能够提高预测结果的准确性和效果;根据一个或多个特征的实际特征值与参考特征值自动确定预测结果是否符合条件,从而实现了对预测结果的评判,且对预测结果的评判同样结合了实际特征值与参考特征值的对应关系,使得预测结果评判不仅依赖于实际特征值,还依赖于参考特征值,进一步保证了预测结果以及预测结果评判的准确性;在预测结果符合条件的情况下,自动将预测结果作为目标数据的实际结果,能够更快速、更高效地确定目标数据的实际结果,且预测结果的准确性也保障了目标数据的实际结果的准确性。
本说明书的第三个实施例提供了一种具体情景下的数据确定方法。其中,所述的具体情景为交通费用报销情景。在本实施例中,目标事件可以确定为交通出行事件(本实施例中为可以报销的交通出行事件),所确定的目标事件的特征可以包括交通出行的始发地、目的地、耗时以及金额。始发地、目的地特征又可以统称为位置特征,位置特征的实际特征值和参考特征值可以是经纬度数据;耗时特征和金额特征的实际特征值和参考特征值可以是具体的耗时值和金额值。一般在进行交通费用报销时,需要在报销备注栏填写始发地和目的地,这里的始发地和目的地为具体地点的文字表示(如XX广场),此可作为目标事件需要确定的目标数据。
本实施例中的数据确定方法可以包括:
S301:确定目标事件的各个特征的参考特征值以及实际特征值。
对于某员工来说,假定所要确定的目标数据是针对其某一次或多次交通出行事件的,这一次或多次交通出行事件即可作为对象事件。可以确定对象事件的各个特征的参考特征值以及实际特征值,例如,该员工在对象事件发生之前已经有过一次或多次交通出行事件,不妨称为历史事件,则每次历史事件都可以确定始发地、目的地、耗时以及金额等特征,从而针对其中的每一个特征,可以确定该特征在历史事件(可以是过去所有历史事件,也可以是选定的历史事件)中的值,作为该特征的历史值或样本值。假设该员工的历史事件以及历史事件中各个特征的具体值如表1所示:
Figure GDA0002497862030000101
表1
LBS:基于位置服务;其中,耗时和金额特征的值可以通过对出行发票进行OCR识别(也可以采用其他方式)得到。由于出租车发票等票据的模板固定,则标注了需要识别的范围后,即可以通过OCR在票据上识别到时间和金额等信息。
通过各个特征的历史值或样本值,可以确定各个特征的参考特征值。对于始发地和目的地特征来说,参考特征值也可以是经纬度数据;对于耗时和金额特征来说,参考特征值即为数值。
在本实施例中,始发地特征和目的地特征的参考特征值的计算可以采用第二个实施例中1.1或1.2的方式。若是采用1.2的方式,则具体的,可以利用dbscan聚类(也可以使用其他聚类算法或方式)获取员工历史事件中始发地和目的地特征的历史值或样本值的LBS类簇(相当于类别),例如可以如图5所示的类簇;对于始发地类簇,取每个类簇的簇新作为类簇的中心,簇新的计算方法为(经度平均值、维度平均值),即对每个类簇,将该类簇的经度平均值和维度平均值作为中心;该中心即为类簇的参考特征值,也即始发地特征的参考特征值(目的地类簇同理可得参考特征值)。
若始发地特征有多个类簇,则始发地特征可以有多个参考特征值,同样的,若目的地特征有多个类簇,则目的地特征可以有多个参考特征值。在本实施例中,可以使用Geocoding服务(从经纬度反向编码到兴趣点的名称的服务)将参考特征值转换为地理兴趣点(为地标在地理位置挖掘领域的书面表达),例如XX广场,XX大厦,W小区,Z广场,如图6所示。地理兴趣点与参考特征值是相通的。前述的目标数据也属于地理兴趣点的形式。
耗时和金额特征的参考特征值的计算可以采用第二个实施例中1.1或1.2的方式。例如可以通过历史值或样本值的均值、中值或平均值等方式计算得到,或者也可以通过聚类得到。另外,还可以计算各个特征的历史值或样本值的方差。
假设本实施例中各个特征均有两个参考特征值,且参考特征值如表2所示(耗时均值即为耗时特征的参考特征值;金额均值即为金额特征的参考特征值;始发地和目的地特征的参考特征值用兴趣点表示):
Figure GDA0002497862030000111
Figure GDA0002497862030000121
表2
在本实施例中,各个特征之间的参考特征值可以是对应的,比如员工始发地兴趣点和目的地兴趣点为X广场和Y大厦时,耗时特征的参考特征值为60min,金额特征的参考特征值为141.12元,则通过始发地兴趣点和目的地兴趣点为X广场和Y大厦,可以得到对应的耗时特征和金额特征的参考特征值分别为60min和141.12元;若员工始发地兴趣点和目的地兴趣点为W小区和Z广场时,耗时特征的参考特征值为70min,金额特征的参考特征值为160元,则通过始发地兴趣点和目的地兴趣点为W小区和Z广场,可以得到对应的耗时特征和金额特征的参考特征值分别为70min和160元。这体现除了各个特征之间的参考特征值的可对应性。
假如对象事件是上述员工最近的一次交通出行事件,可以确定该对象事件的各个特征的实际特征值,可以如表3所示:
Figure GDA0002497862030000122
表3
S302:根据一个或多个特征的实际特征值确定目标数据的预测结果。
由于本实施例中目标数据是始发地和目的地数据,因而可以选定始发地和目的地特征来确定目标数据的预测结果。假设对象事件中各个特征的实际特征值如表4所示:
Figure GDA0002497862030000123
则对于始发地和目的地特征,确定实际特征值对应的参考特征值(即属于哪个类簇)。本实施例中,始发地的实际特征值属于X广场所在的类簇,即对应X广场所在类簇的参考特征值(即X广场的经纬度数据);目的地的实际特征值属于Y大厦所在的类簇,即对应Y大厦所在类簇的参考特征值(即Y大厦的经纬度数据),则可以将X广场和Y大厦作为目标数据的预测结果,即预测上述员工在对象事件中的始发地为X广场,目的地为Y大厦。
S303:根据一个或多个特征的实际特征值与参考特征值确定所述预测结果是否符合条件。
在本实施例中,可以选定耗时特征和金额特征来确定上述预测结果是否符合条件。具体的,对于耗时和金额特征,确定实际特征值对应的参考特征值。这里确定实际特征值对应的参考特征值可以同始发地和目的地特征,看实际特征值所属的类簇,或者由于目标事件的各个特征之间的参考特征值可以有对应关系,则确定了始发地和目的地特征的实际特征值对应的参考特征值分别为X广场和Y大厦后,利用特征之间参考特征值的对应关系,确定耗时和金额特征的实际特征值对应的参考特征值分别为60min和141.12元。
对于耗时特征或金额特征,确定其实际特征值与对应的参考特征值的差值是否超出其对应的预设范围。具体的,对于耗时特征,实际特征值63与对应的参考特征值60的差值为3,可以利用表2中耗时的方差来验证差值是否超范围,差值3/方差5=0.6,可以设定条件,例如若差值与方差的比值小于和/或小于等于第五阈值则耗时特征不超范围;同样的,对于金额特征,实际特征值144.12与对应的参考特征值141.12的差值为3,可以利用表2中金额的方差来验证差值是否超范围,差值3/方差10=0.3,可以设定条件,例如若差值与方差的比值小于和/或小于等于第六阈值则金额特征不超范围。
判断预测结果是否符合条件可以采用的方式包括但不限于:
若实际特征值与对应参考特征值的差值不超范围的特征数等于或大于第一阈值,则所述预测结果符合条件;
和/或,
若实际特征值与对应参考特征值的差值超范围的特征数等于或小于第二阈值,则所述预测结果符合条件;
和/或,
若实际特征值与对应参考特征值的差值不超范围的特征数等于或小于第三阈值,则所述预测结果不符合条件;
和/或,
若实际特征值与对应参考特征值的差值超范围的特征数等于或大于第四阈值,则所述预测结果不符合条件。
S304:若预测结果符合条件,则将所述预测结果作为所述目标数据的实际结果。
本实施例中,假设采用“若实际特征值与对应参考特征值的差值不超范围的特征数等于第一阈值,则所述预测结果符合条件”这个方式,且第一阈值取2。假设耗时和金额特征均不超范围,则可以确定预测结果符合条件,从而可以确定上述员工在对象事件中的始发地为X广场,目的地为Y大厦,即确定了目标数据的实际结果。
在本实施例中,若预测结果符合条件,则可以提交预测结果,以根据预测结果进行处理,例如根据预测结果对目标事件进行结算处理,包括但不限于结算报销费用。提交预测结果与S304没有绝对的先后顺序。
在本实施例中,通过一个或多个特征的实际特征值来自动确定目标数据的预测结果,预测速度快,效率高;确定预测结果时还结合了实际特征值与参考特征值的对应关系,使得预测结果不仅依赖于实际特征值,还依赖于参考特征值,能够提高预测结果的准确性和效果;根据一个或多个特征的实际特征值与参考特征值自动确定预测结果是否符合条件,从而实现了对预测结果的评判,且对预测结果的评判同样结合了实际特征值与参考特征值的对应关系,使得预测结果评判不仅依赖于实际特征值,还依赖于参考特征值,进一步保证了预测结果以及预测结果评判的准确性;在预测结果符合条件的情况下,自动将预测结果作为目标数据的实际结果,能够更快速、更高效地确定目标数据的实际结果,且预测结果的准确性也保障了目标数据的实际结果的准确性。
本实施例还可以用作校验作用,可以使用本实施例得到的始发地和目的地对员工提供的始发地和目的地进行校验。
如图7所示,本说明书第四个实施例提供了一种数据确定装置,包括:
值确定模块401,用于确定目标事件的各个特征的参考特征值以及实际特征值;
预测模块402,用于根据一个或多个特征的实际特征值确定目标数据的预测结果;
判断模块403,用于根据一个或多个特征的实际特征值与参考特征值确定所述预测结果是否符合条件;
结果确定模块404,用于若所述预测结果符合条件,则将所述预测结果作为所述目标数据的实际结果。
可选的,确定目标事件的各个特征的参考特征值包括:
对目标事件的任一特征,确定该特征的历史值或样本值;
根据所述历史值或样本值确定该特征的参考特征值。
可选的,根据所述历史值或样本值确定该特征的参考特征值包括:
将该特征的所述历史值或样本值的均值或中值或平均值作为该特征的参考特征值;
或,
对该特征的所述历史值或样本值进行聚类,将每类别的平均值作为该特征该类别的参考特征值。
可选的,根据一个或多个特征的实际特征值确定目标数据的预测结果包括:
选定一个或多个特征,且对于任一选定的特征,确定该特征的参考特征值中与实际特征值对应的参考特征值;
根据所述选定的一个或多个特征的实际特征值对应的参考特征值确定目标数据的预测结果。
可选的,根据一个或多个特征的实际特征值与参考特征值确定所述预测结果是否符合条件包括:
选定一个或多个特征,且对于任一选定的特征,确定该特征的参考特征值中与实际特征值对应的参考特征值;
对于任一选定的特征,确定该特征的实际特征值与对应的参考特征值的差值是否超出该特征对应的预设范围;
若实际特征值与对应参考特征值的差值不超范围的特征数等于或大于第一阈值,则所述预测结果符合条件;
和/或,
若实际特征值与对应参考特征值的差值超范围的特征数等于或小于第二阈值,则所述预测结果符合条件;
和/或,
若实际特征值与对应参考特征值的差值不超范围的特征数等于或小于第三阈值,则所述预测结果不符合条件;
和/或,
若实际特征值与对应参考特征值的差值超范围的特征数等于或大于第四阈值,则所述预测结果不符合条件。
可选的,确定目标事件的各个特征的参考特征值包括:
对目标事件的任一特征,确定该特征的历史值或样本值;
对该特征的所述历史值或样本值进行聚类,将每类别的平均值作为该特征该类别的参考特征值;
对于任一选定的特征,确定该特征的实际特征值对应的参考特征值包括:
对于任一选定的特征,确定该特征的实际特征值所属的由历史值或样本值聚类后的类别,并将所属类别的参考特征值作为与实际特征值对应的参考特征值。
可选的,所述特征包括位置特征,所述实际特征值和/或参考特征值包括经纬度数据。
可选的,所述目标数据包括地理兴趣点。
可选的,根据一个或多个特征的实际特征值确定目标数据的预测结果包括:
根据Geocoding将位置特征的实际经纬度数据转换为地理兴趣点。
可选的,用于确定目标数据的预测结果的实际特征值与用于确定所述预测结果是否符合条件的实际特征值分属不同的特征。
可选的,如图8所示,所述装置还包括:
提交模块,用于若所述预测结果符合条件,则提交所述预测结果,以根据所述预测结果对目标事件进行结算处理。进行结算处理的可以是结算模块或者装置或者设备等。
本说明书第五个实施例提供了一种数据确定设备,包括:
至少一个处理器;
以及,
与所述至少一个处理器通信连接的存储器;
其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
确定目标事件的各个特征的参考特征值以及实际特征值;
根据一个或多个特征的实际特征值确定目标数据的预测结果;
根据一个或多个特征的实际特征值与参考特征值确定所述预测结果是否符合条件;
若符合,则将所述预测结果作为所述目标数据的实际结果。
本说明书第六个实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如下的步骤:
确定目标事件的各个特征的参考特征值以及实际特征值;
根据一个或多个特征的实际特征值确定目标数据的预测结果;
根据一个或多个特征的实际特征值与参考特征值确定所述预测结果是否符合条件;
若符合,则将所述预测结果作为所述目标数据的实际结果。
上述各实施例可以结合使用。
上述对本说明书特定实施例进行了描述,其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,附图中描绘的过程不一定必须按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书实施例提供的装置、设备、非易失性计算机可读存储介质与方法是对应的,因此,装置、设备、非易失性计算机存储介质也具有与对应方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述对应装置、设备、非易失性计算机存储介质的有益技术效果。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware DescrlP地址tion Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescrlP地址tion Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Descr IP地址tion Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Descr IP地址tion Language)等,目前最普遍使用的是VHDL(Very-High-Speed lntegrated Circuit Hardware DescrIP地址tion Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microch IP地址PIC18F26K20以及Silicone LabsC8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书实施例可提供为方法、系统、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (19)

1.一种数据确定方法,其特征在于,
确定目标事件的各个特征的参考特征值以及实际特征值;其中,所述目标事件为交通出行事件,所述特征包括始发地特征、目的地特征、耗时特征以及金额特征;
根据目标事件始发地特征和目标事件目的地特征的实际特征值确定目标数据的预测结果;
根据目标事件耗时特征和目标事件金额特征的实际特征值与参考特征值确定所述预测结果是否符合条件;
若符合,则将所述预测结果作为所述目标数据的实际结果;
其中,确定目标事件的各个特征的参考特征值包括:
对目标事件的任一特征,使用聚类算法获取历史交通出行事件中该特征的历史值或样本值的类簇,将该特征的每个所述类簇的中心作为该特征的参考特征值;使用Geocoding服务将始发地特征和目的地特征的参考特征值转换为地理兴趣点;其中,使用OCR识别历史交通出行事件的票据,得到历史交通出行事件中耗时特征和金额特征的历史值或样本值;
其中,根据目标事件始发地特征和目标事件目的地特征的实际特征值确定目标数据的预测结果包括:
所述目标事件的始发地LBS为目标事件始发地特征的实际特征值,所述目标事件的目的地LBS为目标事件目的地特征的实际特征值,确定目标事件始发地特征的实际特征值所在的始发地特征类簇,确定目标事件目的地特征的实际特征值所在的目的地特征类簇;
将目标事件始发地特征的实际特征值所在的始发地特征类簇的参考特征值所转换得到的所述地理兴趣点,和目标事件目的地特征的实际特征值所在的目的地特征类簇的参考特征值所转换得到的所述地理兴趣点作为目标数据的预测结果;
其中,使用OCR识别所述目标事件的票据,得到目标事件耗时特征和目标事件金额特征的实际特征值;根据目标事件耗时特征和目标事件金额特征的实际特征值与参考特征值确定所述预测结果是否符合条件包括:
确定目标事件耗时特征的实际特征值所在的耗时特征类簇,确定目标事件金额特征的实际特征值所在的金额特征类簇;
确定目标事件耗时特征的实际特征值所在的耗时特征类簇的参考特征值,并作为目标事件耗时特征的实际特征值对应的参考特征值;确定目标事件金额特征的实际特征值所在的金额特征类簇的参考特征值,并作为目标事件金额特征的实际特征值对应的参考特征值;或,确定目标事件始发地特征的实际特征值所在的始发地特征类簇的参考特征值,确定目标事件目的地特征的实际特征值所在的目的地特征类簇的参考特征值,利用各所述特征之间参考特征值的对应关系,确定目标事件耗时特征的实际参考值对应的参考特征值和目标事件金额特征的实际参考值对应的参考特征值;
对于目标事件耗时特征或目标事件金额特征,确定该特征的实际特征值与对应的参考特征值的差值是否超出该特征对应的预设范围;若该特征的实际特征值与对应的参考特征值的差值不超范围的特征数等于或大于第一阈值,则所述预测结果符合条件;和/或,若该特征的实际特征值与对应的参考特征值的差值超范围的特征数等于或小于第二阈值,则所述预测结果符合条件;和/或,若该特征的实际特征值与对应的参考特征值的差值不超范围的特征数等于或小于第三阈值,则所述预测结果不符合条件;和/或,若该特征的实际特征值与对应的参考特征值的差值超范围的特征数等于或大于第四阈值,则所述预测结果不符合条件。
2.如权利要求1所述的方法,其特征在于,确定目标事件的各个特征的参考特征值包括:
对目标事件的任一特征,确定该特征的历史值或样本值;
根据所述历史值或样本值确定该特征的参考特征值。
3.如权利要求2所述的方法,其特征在于,根据所述历史值或样本值确定该特征的参考特征值包括:
将该特征的所述历史值或样本值的均值或中值作为该特征的参考特征值;
或,
对该特征的所述历史值或样本值进行聚类得到各个类别,将每类别的平均值作为该特征该类别的参考特征值。
4.如权利要求1所述的方法,其特征在于,确定目标事件的各个特征的参考特征值包括:
对目标事件的任一特征,确定该特征的历史值或样本值;
对该特征的所述历史值或样本值进行聚类得到各个类别,将每类别的平均值作为该特征该类别的参考特征值;
对于任一选定的特征,确定该特征的实际特征值对应的参考特征值包括:
对于任一选定的特征,确定该特征的实际特征值所属的由历史值或样本值聚类后的类别,并将所属类别的参考特征值作为与实际特征值对应的参考特征值。
5.如权利要求1所述的方法,其特征在于,所述特征包括位置特征,所述位置特征包括始发地特征和目的地特征,所述实际特征值和/或参考特征值包括经纬度数据。
6.如权利要求5所述的方法,其特征在于,所述目标数据包括地理兴趣点。
7.如权利要求6所述的方法,其特征在于,根据目标事件始发地特征和目标事件目的地特征的实际特征值确定目标数据的预测结果包括:
根据Geocoding将位置特征的实际经纬度数据转换为地理兴趣点。
8.如权利要求1至7中任一项所述的方法,其特征在于,
用于确定目标数据的预测结果的实际特征值与用于确定所述预测结果是否符合条件的实际特征值分属不同的特征。
9.如权利要求1至7中任一项所述的方法,其特征在于,所述方法还包括:若所述预测结果符合条件,则提交所述预测结果,以根据所述预测结果对目标事件进行结算处理。
10.一种数据确定装置,其特征在于,包括:
值确定模块,用于确定目标事件的各个特征的参考特征值以及实际特征值;其中,所述目标事件为交通出行事件,所述特征包括始发地特征、目的地特征、耗时特征以及金额特征;
其中,确定目标事件的各个特征的参考特征值包括:
对目标事件的任一特征,使用聚类算法获取历史交通出行事件中该特征的历史值或样本值的类簇,将该特征的每个所述类簇的中心作为该特征的参考特征值;使用Geocoding服务将始发地特征和目的地特征的参考特征值转换为地理兴趣点;其中,使用OCR识别历史交通出行事件的票据,得到历史交通出行事件中耗时特征和金额特征的历史值或样本值;
预测模块,用于根据目标事件始发地特征和目标事件目的地特征的实际特征值确定目标数据的预测结果;
其中,根据目标事件始发地特征和目标事件目的地特征的实际特征值确定目标数据的预测结果包括:
所述目标事件的始发地LBS为目标事件始发地特征的实际特征值,所述目标事件的目的地LBS为目标事件目的地特征的实际特征值,确定目标事件始发地特征的实际特征值所在的始发地特征类簇,确定目标事件目的地特征的实际特征值所在的目的地特征类簇;
将目标事件始发地特征的实际特征值所在的始发地特征类簇的参考特征值所转换得到的所述地理兴趣点,和目标事件目的地特征的实际特征值所在的目的地特征类簇的参考特征值所转换得到的所述地理兴趣点作为目标数据的预测结果;
判断模块,用于根据目标事件耗时特征和目标事件金额特征的实际特征值与参考特征值确定所述预测结果是否符合条件;
其中,使用OCR识别所述目标事件的票据,得到目标事件耗时特征和目标事件金额特征的实际特征值;根据目标事件耗时特征和目标事件金额特征的实际特征值与参考特征值确定所述预测结果是否符合条件包括:
确定目标事件耗时特征的实际特征值所在的耗时特征类簇,确定目标事件金额特征的实际特征值所在的金额特征类簇;
确定目标事件耗时特征的实际特征值所在的耗时特征类簇的参考特征值,并作为目标事件耗时特征的实际特征值对应的参考特征值;确定目标事件金额特征的实际特征值所在的金额特征类簇的参考特征值,并作为目标事件金额特征的实际特征值对应的参考特征值;或,确定目标事件始发地特征的实际特征值所在的始发地特征类簇的参考特征值,确定目标事件目的地特征的实际特征值所在的目的地特征类簇的参考特征值,利用各所述特征之间参考特征值的对应关系,确定目标事件耗时特征的实际参考值对应的参考特征值和目标事件金额特征的实际参考值对应的参考特征值;
对于目标事件耗时特征或目标事件金额特征,确定该特征的实际特征值与对应的参考特征值的差值是否超出该特征对应的预设范围;若该特征的实际特征值与对应的参考特征值的差值不超范围的特征数等于或大于第一阈值,则所述预测结果符合条件;和/或,若该特征的实际特征值与对应的参考特征值的差值超范围的特征数等于或小于第二阈值,则所述预测结果符合条件;和/或,若该特征的实际特征值与对应的参考特征值的差值不超范围的特征数等于或小于第三阈值,则所述预测结果不符合条件;和/或,若该特征的实际特征值与对应的参考特征值的差值超范围的特征数等于或大于第四阈值,则所述预测结果不符合条件;
结果确定模块,用于若所述预测结果符合条件,则将所述预测结果作为所述目标数据的实际结果。
11.如权利要求10所述的装置,其特征在于,确定目标事件的各个特征的参考特征值包括:
对目标事件的任一特征,确定该特征的历史值或样本值;
根据所述历史值或样本值确定该特征的参考特征值。
12.如权利要求11所述的装置,其特征在于,根据所述历史值或样本值确定该特征的参考特征值包括:
将该特征的所述历史值或样本值的均值或中值作为该特征的参考特征值;
或,
对该特征的所述历史值或样本值进行聚类,将每类别的平均值作为该特征该类别的参考特征值。
13.如权利要求10所述的装置,其特征在于,确定目标事件的各个特征的参考特征值包括:
对目标事件的任一特征,确定该特征的历史值或样本值;
对该特征的所述历史值或样本值进行聚类,将每类别的平均值作为该特征该类别的参考特征值;
对于任一选定的特征,确定该特征的实际特征值对应的参考特征值包括:
对于任一选定的特征,确定该特征的实际特征值所属的由历史值或样本值聚类后的类别,并将所属类别的参考特征值作为与实际特征值对应的参考特征值。
14.如权利要求10所述的装置,其特征在于,所述特征包括位置特征,所述位置特征包括始发地特征和目的地特征,所述实际特征值和/或参考特征值包括经纬度数据;所述目标数据包括地理兴趣点。
15.如权利要求14所述的装置,其特征在于,根据目标事件始发地特征和目标事件目的地特征的实际特征值确定目标数据的预测结果包括:
根据Geocoding将位置特征的实际经纬度数据转换为地理兴趣点。
16.如权利要求10至15中任一项所述的装置,其特征在于,
用于确定目标数据的预测结果的实际特征值与用于确定所述预测结果是否符合条件的实际特征值分属不同的特征。
17.如权利要求10至15中任一项所述的装置,其特征在于,所述装置还包括:
提交模块,用于若所述预测结果符合条件,则提交所述预测结果,以根据所述预测结果对目标事件进行结算处理。
18.一种数据确定设备,其特征在于,包括:
至少一个处理器;
以及,
与所述至少一个处理器通信连接的存储器;
其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
确定目标事件的各个特征的参考特征值以及实际特征值;其中,所述目标事件为交通出行事件,所述特征包括始发地特征、目的地特征、耗时特征以及金额特征;
根据目标事件始发地特征和目标事件目的地特征的实际特征值确定目标数据的预测结果;
根据目标事件耗时特征和目标事件金额特征的实际特征值与参考特征值确定所述预测结果是否符合条件;
若符合,则将所述预测结果作为所述目标数据的实际结果;
其中,确定目标事件的各个特征的参考特征值包括:
对目标事件的任一特征,使用聚类算法获取历史交通出行事件中该特征的历史值或样本值的类簇,将该特征的每个所述类簇的中心作为该特征的参考特征值;使用Geocoding服务将始发地特征和目的地特征的参考特征值转换为地理兴趣点;其中,使用OCR识别历史交通出行事件的票据,得到历史交通出行事件中耗时特征和金额特征的历史值或样本值;
其中,根据目标事件始发地特征和目标事件目的地特征的实际特征值确定目标数据的预测结果包括:
所述目标事件的始发地LBS为目标事件始发地特征的实际特征值,所述目标事件的目的地LBS为目标事件目的地特征的实际特征值,确定目标事件始发地特征的实际特征值所在的始发地特征类簇,确定目标事件目的地特征的实际特征值所在的目的地特征类簇;
将目标事件始发地特征的实际特征值所在的始发地特征类簇的参考特征值所转换得到的所述地理兴趣点,和目标事件目的地特征的实际特征值所在的目的地特征类簇的参考特征值所转换得到的所述地理兴趣点作为目标数据的预测结果;
其中,使用OCR识别所述目标事件的票据,得到目标事件耗时特征和目标事件金额特征的实际特征值;根据目标事件耗时特征和目标事件金额特征的实际特征值与参考特征值确定所述预测结果是否符合条件包括:
确定目标事件耗时特征的实际特征值所在的耗时特征类簇,确定目标事件金额特征的实际特征值所在的金额特征类簇;
确定目标事件耗时特征的实际特征值所在的耗时特征类簇的参考特征值,并作为目标事件耗时特征的实际特征值对应的参考特征值;确定目标事件金额特征的实际特征值所在的金额特征类簇的参考特征值,并作为目标事件金额特征的实际特征值对应的参考特征值;或,确定目标事件始发地特征的实际特征值所在的始发地特征类簇的参考特征值,确定目标事件目的地特征的实际特征值所在的目的地特征类簇的参考特征值,利用各所述特征之间参考特征值的对应关系,确定目标事件耗时特征的实际参考值对应的参考特征值和目标事件金额特征的实际参考值对应的参考特征值;
对于目标事件耗时特征或目标事件金额特征,确定该特征的实际特征值与对应的参考特征值的差值是否超出该特征对应的预设范围;若该特征的实际特征值与对应的参考特征值的差值不超范围的特征数等于或大于第一阈值,则所述预测结果符合条件;和/或,若该特征的实际特征值与对应的参考特征值的差值超范围的特征数等于或小于第二阈值,则所述预测结果符合条件;和/或,若该特征的实际特征值与对应的参考特征值的差值不超范围的特征数等于或小于第三阈值,则所述预测结果不符合条件;和/或,若该特征的实际特征值与对应的参考特征值的差值超范围的特征数等于或大于第四阈值,则所述预测结果不符合条件。
19.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,其特征在于,所述计算机可执行指令被处理器执行时实现如下的步骤:
确定目标事件的各个特征的参考特征值以及实际特征值;其中,所述目标事件为交通出行事件,所述特征包括始发地特征、目的地特征、耗时特征以及金额特征;
根据目标事件始发地特征和目标事件目的地特征的实际特征值确定目标数据的预测结果;
根据目标事件耗时特征和目标事件金额特征的实际特征值与参考特征值确定所述预测结果是否符合条件;
若符合,则将所述预测结果作为所述目标数据的实际结果;
其中,确定目标事件的各个特征的参考特征值包括:
对目标事件的任一特征,使用聚类算法获取历史交通出行事件中该特征的历史值或样本值的类簇,将该特征的每个所述类簇的中心作为该特征的参考特征值;使用Geocoding服务将始发地特征和目的地特征的参考特征值转换为地理兴趣点;其中,使用OCR识别历史交通出行事件的票据,得到历史交通出行事件中耗时特征和金额特征的历史值或样本值;
其中,根据目标事件始发地特征和目标事件目的地特征的实际特征值确定目标数据的预测结果包括:
所述目标事件的始发地LBS为目标事件始发地特征的实际特征值,所述目标事件的目的地LBS为目标事件目的地特征的实际特征值,确定目标事件始发地特征的实际特征值所在的始发地特征类簇,确定目标事件目的地特征的实际特征值所在的目的地特征类簇;
将目标事件始发地特征的实际特征值所在的始发地特征类簇的参考特征值所转换得到的所述地理兴趣点,和目标事件目的地特征的实际特征值所在的目的地特征类簇的参考特征值所转换得到的所述地理兴趣点作为目标数据的预测结果;
其中,使用OCR识别所述目标事件的票据,得到目标事件耗时特征和目标事件金额特征的实际特征值;根据目标事件耗时特征和目标事件金额特征的实际特征值与参考特征值确定所述预测结果是否符合条件包括:
确定目标事件耗时特征的实际特征值所在的耗时特征类簇,确定目标事件金额特征的实际特征值所在的金额特征类簇;
确定目标事件耗时特征的实际特征值所在的耗时特征类簇的参考特征值,并作为目标事件耗时特征的实际特征值对应的参考特征值;确定目标事件金额特征的实际特征值所在的金额特征类簇的参考特征值,并作为目标事件金额特征的实际特征值对应的参考特征值;或,确定目标事件始发地特征的实际特征值所在的始发地特征类簇的参考特征值,确定目标事件目的地特征的实际特征值所在的目的地特征类簇的参考特征值,利用各所述特征之间参考特征值的对应关系,确定目标事件耗时特征的实际参考值对应的参考特征值和目标事件金额特征的实际参考值对应的参考特征值;
对于目标事件耗时特征或目标事件金额特征,确定该特征的实际特征值与对应的参考特征值的差值是否超出该特征对应的预设范围;若该特征的实际特征值与对应的参考特征值的差值不超范围的特征数等于或大于第一阈值,则所述预测结果符合条件;和/或,若该特征的实际特征值与对应的参考特征值的差值超范围的特征数等于或小于第二阈值,则所述预测结果符合条件;和/或,若该特征的实际特征值与对应的参考特征值的差值不超范围的特征数等于或小于第三阈值,则所述预测结果不符合条件;和/或,若该特征的实际特征值与对应的参考特征值的差值超范围的特征数等于或大于第四阈值,则所述预测结果不符合条件。
CN201910094498.5A 2019-01-30 2019-01-30 一种数据确定方法、装置、设备及介质 Active CN109919357B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910094498.5A CN109919357B (zh) 2019-01-30 2019-01-30 一种数据确定方法、装置、设备及介质
PCT/CN2019/119344 WO2020155788A1 (zh) 2019-01-30 2019-11-19 一种数据确定方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910094498.5A CN109919357B (zh) 2019-01-30 2019-01-30 一种数据确定方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN109919357A CN109919357A (zh) 2019-06-21
CN109919357B true CN109919357B (zh) 2021-01-22

Family

ID=66961215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910094498.5A Active CN109919357B (zh) 2019-01-30 2019-01-30 一种数据确定方法、装置、设备及介质

Country Status (2)

Country Link
CN (1) CN109919357B (zh)
WO (1) WO2020155788A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919357B (zh) * 2019-01-30 2021-01-22 创新先进技术有限公司 一种数据确定方法、装置、设备及介质
CN115795342B (zh) * 2022-11-15 2024-02-06 支付宝(杭州)信息技术有限公司 一种业务场景分类的方法、装置、存储介质及电子设备
CN117057162B (zh) * 2023-10-10 2024-01-09 之江实验室 一种任务执行方法、装置、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105674995A (zh) * 2015-12-31 2016-06-15 百度在线网络技术(北京)有限公司 一种基于用户出行轨迹获取通勤路线的方法及装置
CN106162544A (zh) * 2015-04-21 2016-11-23 阿里巴巴集团控股有限公司 一种地理围栏的生成方法和设备
CN106934696A (zh) * 2017-03-15 2017-07-07 深圳大学 一种基于用户地理位置信息的产品推荐方法及系统
CN108376155A (zh) * 2018-02-07 2018-08-07 链家网(北京)科技有限公司 一种地理位置信息确定方法及装置
CN108615186A (zh) * 2018-05-11 2018-10-02 深圳市口袋网络科技有限公司 一种报销方法及其装置、设备和存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714063B (zh) * 2012-09-28 2017-08-04 国际商业机器公司 数据分析方法及其系统
CN105426915A (zh) * 2015-11-20 2016-03-23 北京大学深圳研究生院 基于支持向量机的预测方法及系统
CN107193824B (zh) * 2016-03-14 2020-07-28 阿里巴巴集团控股有限公司 异常数据检测方法及装置
CN106227859B (zh) * 2016-07-29 2019-07-23 四川大学 从gps数据中识别交通工具的方法
CN111858937B (zh) * 2016-12-14 2024-04-30 创新先进技术有限公司 一种虚假地址信息识别的方法及装置
CN107644102B (zh) * 2017-10-13 2020-11-03 北京京东尚科信息技术有限公司 数据特征构造方法及装置、存储介质、电子设备
CN107679680A (zh) * 2017-11-21 2018-02-09 北京锐安科技有限公司 一种金融走势预测方法、装置、设备及存储介质
CN109919357B (zh) * 2019-01-30 2021-01-22 创新先进技术有限公司 一种数据确定方法、装置、设备及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106162544A (zh) * 2015-04-21 2016-11-23 阿里巴巴集团控股有限公司 一种地理围栏的生成方法和设备
CN105674995A (zh) * 2015-12-31 2016-06-15 百度在线网络技术(北京)有限公司 一种基于用户出行轨迹获取通勤路线的方法及装置
CN106934696A (zh) * 2017-03-15 2017-07-07 深圳大学 一种基于用户地理位置信息的产品推荐方法及系统
CN108376155A (zh) * 2018-02-07 2018-08-07 链家网(北京)科技有限公司 一种地理位置信息确定方法及装置
CN108615186A (zh) * 2018-05-11 2018-10-02 深圳市口袋网络科技有限公司 一种报销方法及其装置、设备和存储介质

Also Published As

Publication number Publication date
WO2020155788A1 (zh) 2020-08-06
CN109919357A (zh) 2019-06-21

Similar Documents

Publication Publication Date Title
CN108595157B (zh) 区块链数据的处理方法、装置、设备和存储介质
CN109919357B (zh) 一种数据确定方法、装置、设备及介质
CN113282659A (zh) 一种基于区块链的数据处理方法及设备
CN110852503B (zh) 一种支付渠道的选择方法和设备、支付渠道路由
CN111522838A (zh) 地址相似度计算方法及相关装置
CN108364192B (zh) 一种用户挖掘方法、装置以及电子设备
WO2020164331A1 (zh) 理赔业务的处理方法及装置
CN114943307B (zh) 一种模型训练的方法、装置、存储介质以及电子设备
CN109615171B (zh) 特征阈值确定方法及装置、问题对象确定方法及装置
CN110650531A (zh) 一种基站坐标标定方法、系统、存储介质及设备
CN110175084B (zh) 数据变化的监控方法及装置
CN116578877B (zh) 一种模型训练及二次优化打标的风险识别的方法及装置
CN105430031B (zh) 一种拼车信息传递方法及装置
CN110008252B (zh) 数据核对方法及装置
CN116308738A (zh) 一种模型训练的方法、业务风控的方法及装置
CN107943923B (zh) 电报码数据库的构建方法、电报码识别方法及装置
CN115758141A (zh) 一种模型训练和业务风控的方法及装置
CN115905266A (zh) 图结构数据的处理方法和用于图结构数据的存储引擎
CN110245136B (zh) 数据检索方法及装置、设备及存储设备
CN109903165B (zh) 一种模型合并方法和装置
CN111967769B (zh) 一种风险识别方法、装置、设备及介质
CN111242195B (zh) 模型、保险风控模型训练方法、装置及电子设备
CN109325127B (zh) 一种风险识别方法和装置
CN107645541B (zh) 数据存储方法、装置及服务器
CN113344590A (zh) 一种模型训练以及投诉率预估的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201015

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201015

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant