CN115374713B - 一种gps真伪识别模型的训练方法 - Google Patents

一种gps真伪识别模型的训练方法 Download PDF

Info

Publication number
CN115374713B
CN115374713B CN202211306373.2A CN202211306373A CN115374713B CN 115374713 B CN115374713 B CN 115374713B CN 202211306373 A CN202211306373 A CN 202211306373A CN 115374713 B CN115374713 B CN 115374713B
Authority
CN
China
Prior art keywords
data
gps
spatial
model
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211306373.2A
Other languages
English (en)
Other versions
CN115374713A (zh
Inventor
汪劲松
吴枭
王渊
吕文勇
周智杰
金秋
刘曦月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu New Hope Finance Information Co Ltd
Original Assignee
Chengdu New Hope Finance Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu New Hope Finance Information Co Ltd filed Critical Chengdu New Hope Finance Information Co Ltd
Priority to CN202211306373.2A priority Critical patent/CN115374713B/zh
Publication of CN115374713A publication Critical patent/CN115374713A/zh
Application granted granted Critical
Publication of CN115374713B publication Critical patent/CN115374713B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • Finance (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Medical Informatics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Remote Sensing (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

本申请提供一种GPS真伪识别模型的训练方法,根据基础空间数据以及由基础空间数据解析得到的空间信息,进行特征衍生及特征筛选,从而根据筛选后特征及样本标签,进行模型训练,得到训练后的GPS真伪识别模型。该方法基于基础空间数据的特征衍生及特征筛选,能够得到带有业务理解的筛选后特征,根据这些筛选后特征进行训练得到的GPS真伪识别模型,依靠训练后的GPS真伪识别模型对各个特征的综合判断,具有较高的鲁棒性,并且,更加准确判断设备GPS信息的真伪,提高了识别正确率。

Description

一种GPS真伪识别模型的训练方法
技术领域
本申请涉及定位系统技术领域,具体而言,涉及一种GPS真伪识别模型的训练方法。
背景技术
移动互联网时代,设备GPS信息有举足轻重的作用,而修改GPS信息会对正常生产秩序带来巨大影响。很多不法分子通过修改GPS信息至想要的位置实现其利益。如上班打卡中通过修改GPS信息至打卡区域可实现人不在公司即打卡;互联网金融中通过修改GPS信息违规操作(如在银行所在地外违规贷款,违规领取城市消费券);AR游戏中修改GPS信息可作弊获取利益等;判断设备GPS信息的真伪是业务特别是金融业务中的重要需求。
伪造GPS的本质在于使用非原生方式替换设备GPS定位模块的定位结果,使得设备的GPS信息来源于不为其原本的定位模块。而直接判断设备GPS信息来源是否为其原本定位模块是十分困难的。现有识别GPS信息真伪的技术方案大都为间接识别方案,可分为两大类。
第一类方案是识别设备当前是否有伪造GPS的方式;假定有伪造GPS方式的设备是进行了伪造GPS的设备。该类方法通常的做法有:检测设备是否root, 是否越狱,是否安装Magisk等框架,是否为虚拟机,设备安装APP中是否包含修改GPS信息的APP,设备是否处于开发者调试模式中,设备是否连接PC等。
第二类方案是比对设备的GPS与其他信息表现是否矛盾或是其他信息本身有异常; 认为当GPS信息与其他信息矛盾或其他信息有异常时设备的GPS信息为伪造。该类方案通常的做法有:比对设备的GPS信息与IP信息,比对设备的GPS信息与用户征信信息, 比对设备GPS信息与第三方平台搜集的用户信息(如地图类APP提供用户轨迹画像),观察的其他空间参数(海拔等非经纬度参数)是否出现异常, 是否出现异常的单一设备聚集等。
但是以上第一类方案和第二类方案均属于间接识别GPS真伪的方案,其在一些复杂的应用场景下无法准确判断设备GPS信息的真伪,导致识别的正确率低。
发明内容
以上间接识别GPS真伪的方案中,第一类方案的缺点主要有:1. 设备是否有伪造GPS方式无法被检测或难以被检测(root类特别是Magisk等安卓框架有避免自身被检测的功能); 2.识别伪造GPS方式的手段不通用,(如在微信小程序下权限受限采集不到信息,iOS操作系统下APP权限受限采集不到相关信息);3.设备有伪造GPS方式不代表设备伪造了GPS。
第二类方法的缺点主要有 1. 设备GPS信息与其他信息(如IP)矛盾不一定是伪造GPS信息(可能是使用了代理IP或用户处于行政区划交界处等);2. 其他信息是有限的,可能在能搜集到有限的信息中无法找到比对矛盾信息; 3. 目前绝大多数比对方案仅仅进行了截面数据的比对;4. 其他信息异常如设备聚集会出现漏过一部分伪造信息设备的问题。
本申请实施例的目的在于提供一种GPS真伪识别模型的训练方法,用以解决现有的间接识别GPS真伪的方案,无法准确判断设备GPS信息的真伪,识别正确率低的问题。
本申请实施例提供的一种GPS真伪识别模型的训练方法,包括:
获取以设定采样频率采集的基础空间数据;
根据基础空间数据,解析得到空间信息;
根据基础空间数据和空间信息,进行特征衍生,得到初始特征;
对初始特征进行特征筛选,得到筛选后特征;
根据筛选后特征,进行模型训练,得到训练后的GPS真伪识别模型。
上述技术方案中,根据基础空间数据以及由基础空间数据解析得到的空间信息,进行特征衍生及特征筛选,从而根据筛选后特征及样本标签,进行模型训练,得到训练后的GPS真伪识别模型。该方法基于基础空间数据的特征衍生及特征筛选,能够得到带有业务理解的筛选后特征,根据这些筛选后特征进行训练得到的GPS真伪识别模型,依靠训练后的GPS真伪识别模型对各个特征的综合判断,具有较高的鲁棒性,并且,更加准确判断设备GPS信息的真伪,提高了识别正确率。
在一些可选的实施方式中,基础空间数据包括:
时间数据、经度数据、纬度数据、GPS水平精度数据、GPS高度数据、GPS垂直精度数据、IP地址数据和网络类型数据中的至少一个。
在一些可选的实施方式中,解析得到空间信息,包括:利用第三方解析服务对基础空间数据进行解析得到GPS位置哈希值数据、GPS解析地址数据和IP解析地址数据中的至少一个。
在一些可选的实施方式中,根据基础空间数据和空间信息,进行特征衍生,得到初始特征,包括:
将GPS解析地址数据拆解出GPS字段数据;其中,GPS字段数据包括省份数据、GPS城市数据或GPS区域数据;
将IP解析地址数据拆解出IP字段数据;其中,IP字段数据包括省份数据、IP城市数据或IP区域数据;
将GPS字段数据与相应的IP字段数据分别指示的位置之间的距离作为一个初始特征。
上述技术方案中,将GPS字段数据与相应的IP字段数据分别指示的位置之间的距离作为一个初始特征,避免了设备处于省份与省份的交界处,或城市与城市的交界处,或区域与区域交界处时,直接对比GPS与IP是否一致的僵硬属性,其原因是若设备处于省份A与省份B的交界处,GPS与IP可能存在一个显示省份A,另一个显示省份B的情况,此时不能判断出存在伪造GPS的情况,若是直接对比GPS与IP是否一致,则会导致设备GPS真伪识别的误判。
在一些可选的实施方式中,根据基础空间数据和空间信息,进行特征衍生,得到初始特征,包括:
将经度数据和/或纬度数据和/或GPS高度数据的小数位数是否发生变化作为一个初始特征。
上述技术方案中,设备中的经度数据和/或纬度数据和/或GPS高度数据的小数位数通常是固定的,而设备GPS伪造时,通常会强行给到设备固定数值的经度数据,固定数值的纬度数据,和固定数值的GPS高度数据,而这些伪造数据的小数位数极有可能与设备真实数据的小数位数不同,因此,可以将经度数据和/或纬度数据和/或GPS高度数据的小数位数是否发生变化作为一个初始特征。
在一些可选的实施方式中,根据基础空间数据和空间信息,进行特征衍生,得到初始特征,包括:
将相邻两次采集的不为缓存数据的经度数据和/或纬度数据和/或GPS高度数据是否发生变化作为一个初始特征。
上述技术方案中,在GPS来源为设备原本的GPS系统时,设备GPS每次采集的值应是变动的(物理测量不可能100%准确,一定会存在一定的误差),故正常的GPS信号数值会围绕设备真实位置进行小范围布朗运动,而伪造的GPS由于通过外部手段替换了原生GPS采集信号数值,会’固定’在特定数值上,因此只要相邻两次采集的不为缓存数据的经度数据和/或纬度数据和/或GPS高度数据的数值未发生变化,则设备极有可能存在伪造GPS的情况。
在一些可选的实施方式中,对初始特征进行特征筛选,得到筛选后特征,包括:
使用ChiMerge方法进行分箱校验并依托事前确定的标签进行IV值计算,在初始特征中筛选出IV值超过设定值的特征,得到筛选后特征。
上述技术方案中,使用ChiMerge方法进行分箱校验并依托事前确定的标签进行IV值计算,其中,IV值(Information Value)主要用来对输入变量进行编码和预测能力评估,特征变量IV值的大小即表示该变量预测能力的强弱,筛选出IV值超过设定值的特征即为筛选出预测能力足够强的特征。
在一些可选的实施方式中,得到训练后的GPS真伪识别模型之后,还包括:
获取用户的实际基础空间数据;
根据实际基础空间数据,解析得到实际空间信息;
根据实际基础空间数据和实际空间信息,进行对应于筛选后特征的特征衍生,得到模型的输入;
根据模型的输入,利用训练后的GPS真伪识别模型进行模型预测,得到模型的输出;其中,模型的输出用于判断GPS真伪。
上述技术方案中,搜集目标用户一段时间的实际基础空间数据,根据实际基础空间数据,利用第三方解析服务(例如电子地图等)得到实际空间信息,进行对应与筛选后特征的特征衍生,得到模型的输入,将模型的输入数据输入训练后的GPS真伪识别模型,得到模型的输出,根据模型的输出数据判断是否存在伪造设备GPS的情况,能够更加准确判断设备GPS信息的真伪,提高了识别正确率。
本申请实施例提供的一种电子设备,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如以上任一所述的方法。
本申请实施例提供的一种计算机可读存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如以上任一所述的方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种GPS真伪识别模型的训练方法步骤流程图;
图2为本申请实施例提供的四类特征衍生的示意图;
图3为本申请实施例提供的特征重要性IV值的示意图;
图4为本申请实施例提供的真伪识别方法;
图5为本申请实施例提供的电子设备的结构示意图。
图标:1-处理器,2-存储器,3-通信接口,4-通信总线。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
请参照图1,图1为本申请实施例提供的一种GPS真伪识别模型的训练方法步骤流程图,具体包括:
步骤100、获取以设定采样频率采集的基础空间数据;其中,基础空间数据是设备与空间位置相关的数据,通过一定的采样频率采集基础空间数据汇聚为数据流。
步骤200、根据基础空间数据,解析得到空间信息;其中,空间信息是根据基础空间数据结合电子地图来得到的类似省份、城市等信息的空间信息。
步骤300、根据基础空间数据和空间信息,进行特征衍生,得到初始特征;其中,特征衍生是指通过将基础空间数据和空间信息结合业务理解,来衍生得到能够体现业务理解的特征。
步骤400、对初始特征进行特征筛选,得到筛选后特征;其中,特征筛选是根据特征的重要性来进行筛选。
步骤500、根据筛选后特征,进行模型训练,得到训练后的GPS真伪识别模型。其中,模型可以选用XGBoost模型,模型在训练时需要用到事前确定的案例标签,其生产中搜集,其标签判断方式为通过人工调查团队进行回访。
本申请实施例中,根据基础空间数据以及由基础空间数据解析得到的空间信息,进行特征衍生及特征筛选,从而根据筛选后特征及样本标签,进行模型训练,得到训练后的GPS真伪识别模型。该方法基于基础空间数据的特征衍生及特征筛选,能够得到带有业务理解的筛选后特征,根据这些筛选后特征进行训练得到的GPS真伪识别模型,依靠训练后的GPS真伪识别模型对各个特征的综合判断,具有较高的鲁棒性,并且,更加准确判断设备GPS信息的真伪,提高了识别正确率。
在一些可选的实施方式中,基础空间数据包括:时间数据、经度数据、纬度数据、GPS水平精度数据、GPS高度数据、GPS垂直精度数据、IP地址数据和网络类型数据。
本实施例的步骤100,以较小频率(采样间隔小于2分钟,例如30秒)采集目标用户设备的基础空间数据,并将基础空间数据进行汇聚存储为空间信息流,基础空间数据包含的指标如表1:
表1、基础空间数据示例
参数英文名 参数中文名 参数类型与标准 参数样例
create_time 时间 datetime "2021-08-26 17:58:47"
longitude 经度 float32(gcj-02) 112.9388726977
latitude 纬度 float32(gcj-02) 28.2282519245
GPS_accuracy GPS 水平精度 int 5
altitude GPS 高度 float32 327.4328205729
vertical_accuracy GPS 垂直精度 int 30
IP IP 地址 string(ip-v4) "140.243.246.152"
network_type 网络类型 string "WiFi"
在一些可选的实施方式中,解析得到空间信息,包括:利用第三方解析服务对基础空间数据进行解析得到GPS位置哈希值数据、GPS解析地址数据和IP解析地址数据。
本实施例的步骤200,通过算法与通用的第三方解析服务(如电子地图)对采集到的基础空间数据进行合理解析,解析得到的空间信息参数见下表2:
表2、空间信息示例
参数英文名 参数中文名 参数来源 参数样例
GPS_geohash GPS 位置哈希值 经纬度 -Geohash 算法 "wt029fz9"
GPS_addr GPS 解析地址 经纬度 - 三方解析 吉林省长春市南关区临河街道昆山路 33 号富腾天下城
IP_addr IP 解析地址 IP 地址 - 三方解析 吉林省长春市
在一些可选的实施方式中,步骤300中,根据基础空间数据和空间信息,进行特征衍生,得到初始特征,主要包括以下ABCD四类特征衍生:
A) 参数拆解:该方式主要对参数属性进行的带属性含义的分解,例如GPS解析地址拆解出GPS省份,GPS城市,GPS区域等,而后将完成A类型衍生的特征进行B、C、D三类方式的衍生;
B)参数比对:该方式主要对参数与其他参数进行比对并获取对应的布尔值变量,例如对比网络类型是否为WiFi等;
C) 参数编码:该方式主要将非数值型参数转化为数值型变量,例如将GPS省份映射为省份编码,将相邻的GPS坐标转化为距离差等;
D)序列统计:该方式主要对特定变量在时间序列上的表现进行统计,例如计算特征的变化统计量(距离,速度的最大最小均值方差等)及特定变量(如GPS省份)的是否变化,变化次数等。
本实施例的四类特征衍生如图2所示,其中,本实施例的参数拆解为:将“GPS地址:吉林省长春市南关区…”拆解为“GPS省份:吉林省”、“GPS城市:长春市”和“GPS区域:南关区”。
本实施例的参数比对为:由于网络类型为4g,那么,判断网络类型是否为wifi为false;由于GPS省份是四川省,而IP省份是陕西省,那么判断GPS省份与IP省份是否一致为false。
本实施例的参数编码为将“GPS城市:上海市”编码为“GPS城市层级:1”。
本实施例的序列统计为:根据“GPS城市序列:上海市、北京市、上海市、上海市”可以看出城市序列经过了上海市改变为北京市,以及北京市改变为上海市两次变动,那么,统计为:城市序列改变为true,城市序列改变次数为2,城市序列不同城市数量为2。根据GPS经纬度序列,统计出GPS总移动距离和GPS最大相邻移动距离。
具体的,步骤300的一些特征衍生方式,例如:
第一种特征衍生方式:将GPS解析地址数据拆解出GPS字段数据;其中,GPS字段数据包括省份数据、GPS城市数据或GPS区域数据;将IP解析地址数据拆解出IP字段数据;其中,IP字段数据包括省份数据、IP城市数据或IP区域数据;将GPS字段数据与相应的IP字段数据分别指示的位置之间的距离作为一个初始特征。
在第一种特征衍生方式中,将GPS字段数据与相应的IP字段数据分别指示的位置之间的距离作为一个初始特征,避免了设备处于省份与省份的交界处,或城市与城市的交界处,或区域与区域交界处时,直接对比GPS与IP是否一致的僵硬属性,其原因是若设备处于省份A与省份B的交界处,GPS与IP可能存在一个显示省份A,另一个显示省份B的情况,此时不能判断出存在伪造GPS的情况,若是直接对比GPS与IP是否一致,则会导致设备GPS真伪识别的误判。
第二种特征衍生方式:将经度数据和/或纬度数据和/或GPS高度数据的小数位数是否发生变化作为一个初始特征。
在第二种特征衍生方式中,设备中的经度数据和/或纬度数据和/或GPS高度数据的小数位数通常是固定的,而设备GPS伪造时,通常会强行给到设备固定数值的经度数据,固定数值的纬度数据,和固定数值的GPS高度数据,而这些伪造数据的小数位数极有可能与设备真实数据的小数位数不同,因此,可以将经度数据和/或纬度数据和/或GPS高度数据的小数位数是否发生变化作为一个初始特征。
第三种特征衍生方式:将相邻两次采集的不为缓存数据的经度数据和/或纬度数据和/或GPS高度数据是否发生变化作为一个初始特征。
在第三种特征衍生方式中,在GPS来源为设备原本的GPS系统时,设备GPS每次采集的值应是变动的(物理测量不可能100%准确,一定会存在一定的误差),故正常的GPS信号数值会围绕设备真实位置进行小范围布朗运动,而伪造的GPS由于通过外部手段替换了原生GPS采集信号数值,会’固定’在特定数值上,因此只要相邻两次采集的不为缓存数据的经度数据和/或纬度数据和/或GPS高度数据的数值未发生变化,则设备极有可能存在伪造GPS的情况。
在一些可选的实施方式中,步骤400中,对初始特征进行特征筛选,得到筛选后特征,包括:使用ChiMerge方法进行分箱校验并依托事前确定的标签进行IV值计算,在初始特征中筛选出IV值超过设定值的特征,得到筛选后特征。
本申请实施例中,使用ChiMerge方法(ChiMerge是利用卡方统计量对连续性变量进行离散化)进行分箱校验并依托事前确定的标签进行IV值计算,其中,IV值(InformationValue)主要用来对输入变量进行编码和预测能力评估,特征变量IV值的大小即表示该变量预测能力的强弱,筛选出IV值超过设定值的特征即为筛选出预测能力足够强的特征。本实施例的多个特征的IV值如图3所示,其中代表特征重要性的IV值大于0.3的特征只有左侧的三个特征,将其中IV值大于0.3的这三个特征筛选出来,作为输入模型的特征。
请参照图4,图4为本申请实施例提供的真伪识别方法。该真伪识别方法在步骤500得到训练后的GPS真伪识别模型之后,具体包括:
步骤600、获取用户的实际基础空间数据;
步骤700、根据实际基础空间数据,解析得到实际空间信息;
步骤800、根据实际基础空间数据和实际空间信息,进行对应于筛选后特征的特征衍生,得到模型的输入;
步骤900、根据模型的输入,利用训练后的GPS真伪识别模型进行模型预测,得到模型的输出;其中,模型的输出用于判断GPS真伪。
本申请实施例中,搜集目标用户一段时间的实际基础空间数据,根据实际基础空间数据,利用第三方解析服务(例如电子地图等)得到实际空间信息,进行对应与筛选后特征的特征衍生,得到模型的输入,将模型的输入数据输入训练后的GPS真伪识别模型,得到模型的输出,根据模型的输出数据判断是否存在伪造设备GPS的情况,能够更加准确判断设备GPS信息的真伪,提高了识别正确率。
图5示出了本申请实施例提供的电子设备的一种可能的结构。参照图5,电子设备包括:处理器1、存储器2和通信接口3,这些组件通过通信总线4和/或其他形式的连接机构(未示出)互连并相互通讯。
其中,存储器2包括一个或多个(图中仅示出一个),其可以是,但不限于,随机存取存储器(Random Access Memory,简称RAM),只读存储器(Read Only Memory,简称ROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),电可擦除可编程只读存储器(Electric Erasable Programmable Read-Only Memory,简称EEPROM)等。处理器1以及其他可能的组件可对存储器2进行访问,读和/或写其中的数据。
处理器1包括一个或多个(图中仅示出一个),其可以是一种集成电路芯片,具有信号的处理能力。上述的处理器1可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、微控制单元(Micro Controller Unit,简称MCU)、网络处理器(NetworkProcessor,简称NP)或者其他常规处理器;还可以是专用处理器,包括神经网络处理器(Neural-network Processing Unit,简称NPU)、图形处理器(Graphics Processing Unit,简称GPU)、数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuits,简称ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。并且,在处理器1为多个时,其中的一部分可以是通用处理器,另一部分可以是专用处理器。
通信接口3包括一个或多个(图中仅示出一个),可以用于和其他设备进行直接或间接地通信,以便进行数据的交互。通信接口3可以包括进行有线和/或无线通信的接口。
在存储器2中可以存储一个或多个计算机程序指令,处理器1可以读取并运行这些计算机程序指令,以实现本申请实施例提供的方法。
可以理解的,图5所示的结构仅为示意,电子设备还可以包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的结构。图5中所示的各组件可以采用硬件、软件或其组合实现。电子设备可能是实体设备,例如PC机、笔记本电脑、平板电脑、手机、服务器、嵌入式设备等,也可能是虚拟设备,例如虚拟机、虚拟化容器等。并且,电子设备也不限于单台设备,也可以是多台设备的组合或者大量设备构成的集群。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被计算机的处理器读取并运行时,执行本申请实施例提供的方法。例如,计算机可读存储介质可以实现为图5中电子设备中的存储器2。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (7)

1.一种GPS真伪识别模型的训练方法,其特征在于,包括:
获取以设定采样频率采集的基础空间数据;
根据所述基础空间数据,解析得到空间信息;
根据所述基础空间数据和空间信息,进行特征衍生,得到初始特征;
对所述初始特征进行特征筛选,得到筛选后特征;
根据所述筛选后特征,进行模型训练,得到训练后的GPS真伪识别模型;
所述基础空间数据包括:时间数据、经度数据、纬度数据、GPS水平精度数据、GPS高度数据、GPS垂直精度数据、IP地址数据和网络类型数据中的至少一个;
所述解析得到空间信息,包括:利用第三方解析服务对所述基础空间数据进行解析得到GPS位置哈希值数据、GPS解析地址数据和IP解析地址数据中的至少一个;
所述根据所述基础空间数据和空间信息,进行特征衍生,得到初始特征,包括:将所述GPS解析地址数据拆解出GPS字段数据;其中,所述GPS字段数据包括省份数据、GPS城市数据或GPS区域数据;将所述IP解析地址数据拆解出IP字段数据;其中,所述IP字段数据包括省份数据、IP城市数据或IP区域数据;将所述GPS字段数据与相应的IP字段数据分别指示的位置之间的距离作为一个所述初始特征。
2.如权利要求1所述的方法,其特征在于,所述根据所述基础空间数据和空间信息,进行特征衍生,得到初始特征,包括:
将所述经度数据和/或纬度数据和/或GPS高度数据的小数位数是否发生变化作为一个所述初始特征。
3.如权利要求1所述的方法,其特征在于,所述根据所述基础空间数据和空间信息,进行特征衍生,得到初始特征,包括:
将相邻两次采集的不为缓存数据的经度数据和/或纬度数据和/或GPS高度数据是否发生变化作为一个初始特征。
4.如权利要求1所述的方法,其特征在于,所述对所述初始特征进行特征筛选,得到筛选后特征,包括:
使用ChiMerge方法进行分箱校验并依托事前确定的标签进行IV值计算,在初始特征中筛选出IV值超过设定值的特征,得到筛选后特征。
5.如权利要求1所述的方法,其特征在于,所述得到训练后的GPS真伪识别模型之后,还包括:
获取用户的实际基础空间数据;
根据所述实际基础空间数据,解析得到实际空间信息;
根据所述实际基础空间数据和实际空间信息,进行对应于所述筛选后特征的特征衍生,得到模型的输入;
根据所述模型的输入,利用训练后的GPS真伪识别模型进行模型预测,得到模型的输出;其中,所述模型的输出用于判断GPS真伪。
6.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器中存储有程序指令,所述处理器运行所述程序指令时,执行权利要求1-5中任一项所述方法中的步骤。
7.一种存储介质,其特征在于,所述存储介质中存储有计算机程序指令,所述计算机程序指令被一处理器运行时,执行权利要求1-5任一项所述方法中的步骤。
CN202211306373.2A 2022-10-25 2022-10-25 一种gps真伪识别模型的训练方法 Active CN115374713B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211306373.2A CN115374713B (zh) 2022-10-25 2022-10-25 一种gps真伪识别模型的训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211306373.2A CN115374713B (zh) 2022-10-25 2022-10-25 一种gps真伪识别模型的训练方法

Publications (2)

Publication Number Publication Date
CN115374713A CN115374713A (zh) 2022-11-22
CN115374713B true CN115374713B (zh) 2022-12-27

Family

ID=84072846

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211306373.2A Active CN115374713B (zh) 2022-10-25 2022-10-25 一种gps真伪识别模型的训练方法

Country Status (1)

Country Link
CN (1) CN115374713B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113094482A (zh) * 2021-03-29 2021-07-09 中国地质大学(北京) 轻量化语义智能服务适配训练演化方法及系统
CN115081641A (zh) * 2022-07-13 2022-09-20 平安科技(深圳)有限公司 模型训练方法、评估结果的预测方法、设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150149091A1 (en) * 2013-11-25 2015-05-28 PlaceIQ, Inc. Apparatus and Method for Determining the Quality or Accuracy of Reported Locations
CN111858937B (zh) * 2016-12-14 2024-04-30 创新先进技术有限公司 一种虚假地址信息识别的方法及装置
CN109525930A (zh) * 2017-09-18 2019-03-26 腾讯科技(北京)有限公司 一种识别定位信息真伪的方法、装置和存储介质
US11500109B2 (en) * 2019-01-10 2022-11-15 Raytheon Company Detection of spoofing and meaconing for geolocation positioning system signals
CN113163327B (zh) * 2021-05-11 2022-12-09 南京大学 一种移动应用中定位数据真伪辨别的方法和系统
CN114066606B (zh) * 2021-11-17 2024-07-19 四川新网银行股份有限公司 一种基于文本转义为gps距离的资料虚假识别系统及方法
CN115018596B (zh) * 2022-08-03 2022-11-15 浙江口碑网络技术有限公司 虚假定位识别及模型训练方法、装置、设备、介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113094482A (zh) * 2021-03-29 2021-07-09 中国地质大学(北京) 轻量化语义智能服务适配训练演化方法及系统
CN115081641A (zh) * 2022-07-13 2022-09-20 平安科技(深圳)有限公司 模型训练方法、评估结果的预测方法、设备及存储介质

Also Published As

Publication number Publication date
CN115374713A (zh) 2022-11-22

Similar Documents

Publication Publication Date Title
CN109816397B (zh) 一种欺诈判别方法、装置及存储介质
US10795964B2 (en) Text address processing method and apparatus
Jurgens et al. Geolocation prediction in twitter using social networks: A critical analysis and review of current practice
Tao et al. Spatial cluster detection in spatial flow data
Delmelle et al. Uncertainty in geospatial health: challenges and opportunities ahead
CN113158189B (zh) 一种恶意软件分析报告生成方法、装置、设备和介质
CN114066606B (zh) 一种基于文本转义为gps距离的资料虚假识别系统及方法
CN113468520A (zh) 应用于区块链业务的数据入侵检测方法及大数据服务器
CN111400695B (zh) 一种设备指纹生成方法、装置、设备和介质
CN113961764A (zh) 诈骗电话的识别方法、装置、设备及存储介质
CN114036531A (zh) 一种基于多尺度代码度量的软件安全漏洞检测方法
Selay et al. Adaptive random testing for image comparison in regression web testing
CN111639857A (zh) 订单智能审核方法、装置、电子设备及存储介质
CN114462040A (zh) 一种恶意软件检测模型训练、恶意软件检测方法及装置
CN112163019B (zh) 基于区块链的可信电子批记录处理方法及区块链服务平台
CN115374713B (zh) 一种gps真伪识别模型的训练方法
CN111738290B (zh) 图像检测方法、模型构建和训练方法、装置、设备和介质
CN113434542A (zh) 数据关系识别方法、装置、电子设备及存储介质
KR102110350B1 (ko) 비표준화 데이터베이스를 위한 도메인 판별 장치 및 방법
CN112632469A (zh) 业务交易数据的异常检测方法、装置及计算机设备
CN115168848B (zh) 基于大数据分析拦截的拦截反馈处理方法
CN111274240A (zh) 审核土地卫片执法检查数据的方法、设备及存储介质
Khokhlov et al. Data security and quality evaluation framework: Implementation empirical study on android devices
CN116245630A (zh) 一种反欺诈检测方法、装置、电子设备及介质
CN109584041A (zh) 信贷欺诈分析方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant