发明内容
基于此,有必要针对上述技术问题,提供一种准确的限制对象识别方法、装置、计算机设备和存储介质。
一种限制对象识别方法,所述方法包括:
接收用户终端上传的定位数据;
对所述定位数据进行基于线性可逆函数的编码,获得位置编码;
识别所述位置编码所属编码格子;
从预设编码格子数据库读取所述所属编码格子对应的标签,所述预设编码格子数据库存储有多个编码格子以及各所述编码格子对应的标签,所述标签用于表征编码格子对应位置区域为限制区域的可能性程度;
根据所述标签,识别用户是否为限制对象。
在其中一个实施例中,所述对所述定位数据进行基于线性可逆函数的编码,获得位置编码包括:
通过GeoHash算法对所述定位数据进行编码,获得位置编码。
在其中一个实施例中,所述从预设编码格子数据库读取所述所属编码格子对应的标签之前,还包括:
获取历史记录中目标类型用户位置分布数据;
根据历史记录中目标类型用户位置分布数据,确定目标类型用户的位置信息;
对所述目标类型用户的位置信息进行基于线性可逆函数的编码,获得样本位置编码;
将所述样本位置编码映射至划设有编码格子的编码地图中;
获取各编码格子对应的目标类型用户数量;
根据各编码格子对应的目标类型用户数量设定标签;
记录各编码格子的身份标识以及对应的已设定标签,构建预设编码格子数据库。
在其中一个实施例中,所述根据各编码格子对应的目标类型用户数量设定标签包括:
获取各编码格子中用户数量和目标类型用户数量;
计算各编码格子中目标类型用户数量占比;
根据预设占比-标签对应关系表,设定各编码格子对应的标签。
在其中一个实施例中,所述获取各编码格子中用户数量包括:
采用Hash算法在Trie树中查找各编码格子对应的位置编码数据;
根据各编码格子中查找到的位置编码数据,获取各编码格子中用户数量。
在其中一个实施例中,所述根据所述标签,识别用户是否为限制对象之后,还包括:
当识别用户为限制对象时,对所述用户对应的账号信息添加限制标识。
在其中一个实施例中,所述根据所述标签,识别用户是否为限制对象之后,还包括:
将所述用户的受限类型识别结果以及所述位置编码所属编码格子更新至所述预设编码格子数据库。
一种限制对象识别装置,所述装置包括:
接收模块,用于接收用户终端上传的定位数据;
编码模块,用于对所述定位数据进行基于线性可逆函数的编码,获得位置编码;
编码格子识别模块,用于识别所述位置编码所属编码格子;
标签读取模块,用于从预设编码格子数据库读取所述所属编码格子对应的标签,所述预设编码格子数据库存储有多个编码格子以及各所述编码格子对应的标签,所述标签用于表征编码格子对应位置区域为限制区域的可能性程度;
对象识别模块,用于根据所述标签,识别用户是否为限制对象。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的方法的步骤。
上述限制对象识别方法、装置、计算机设备和存储介质,对用户终端上传的定位数据进行基于线性可逆函数的编码,获得位置编码,识别出位置编码所属编码格子,从存储有多个编码格子以及各所述编码格子对应的标签的预设编码格子数据库中读取所属编码格子对应的标签,基于标签来识别用户是否为限制对象,整个过程中,一方面基于用户终端上传的定位数据进行处理,减少由于用户手动填写地址导致位置数据错误的情况,另一方面,针对定位数据进行基于线性可逆函数的编码,识别位置编码所属编码格子,通过获取该编码格子对应标签的方式来识别用户是否为处于限制区域内的限制对象,实现限制对象的准确识别。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的限制对象识别方法,可以应用于如图1所示的应用环境中。其中,用户终端102通过网络与服务器104通过网络进行通信。用户终端102中定位组件(例如GPS(Global Positioning System,全球定位系统)定位模块)生成定位数据,用户终端102将该定位数据上传至服务器104,服务器104接收用户终端上传的定位数据,对定位数据进行基于线性可逆函数的编码,获得位置编码;识别位置编码所属编码格子;从预设编码格子数据库读取所属编码格子对应的标签,预设编码格子数据库存储有多个编码格子以及各编码格子对应的标签,标签用于表征编码格子对应位置区域为限制区域的可能性程度;根据标签,识别用户是否为限制对象。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种限制对象识别方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S100:接收用户终端上传的定位数据。
用户终端中定位组件生成定位数据,发送定位数据至服务器,服务器接收到该定位数据。具体来说,用户终端中定位组件可以为GPS,即用户终端上传当前GPS坐标至服务器,服务器接收到这部分数据。
S200:对定位数据进行基于线性可逆函数的编码,获得位置编码。
可以通过多种算法或公式实现基于线性可逆函数的编码。非必要的,可以GeoHash算法对定位数据进行编码,获得位置编码。通过GeoHash算法的编码方式其数据处理代价最小,能够高效得到位置编码。
S300:识别位置编码所属编码格子。
对整个地理地图中各个位置进行基于线性可逆函数的编码,得到整个编码地图,再对编码地图进行网格划分即得到编码格子。即在编码地图中设置有多个编码格子,每个编码格子对应真实地理位置一片区域范围。在得到用户对应的位置编码后,识别该位置编码所属编码格子,即识别用户所处位置区域。
S400:从预设编码格子数据库读取所属编码格子对应的标签,预设编码格子数据库存储有多个编码格子以及各编码格子对应的标签,标签用于表征编码格子对应位置区域为限制区域的可能性程度。
在预设编码格子数据库中存储有各个编码格子以及对应的标签,根据步骤S300识别得到的所属编码格子,在预设编码格子数据库中进行查找,即可得到对应的标签,即得到用户所处区域对应的标签。具体来说,预设编码格子数据库中存储有多个编码格子以及各编码格子对应的标签,其对应的标签是基于各个编码格子对应区域中历史存在限制对象设定的,具体可以是根据限制对象数量与总用户数量比值设定。标签用于表征编码格子与受限类型的关联程度,即表征编码格子对应的位置区域为限制区域的关联程度。标签具体可以为无可能性、低可能性、中可能性、高可能性。
S500:根据标签,识别用户是否为限制对象。
根据标签,判断用户所处区域与限制区域的可能性程度,进而识别用户是否为限制对象。若用户所处区域高可能性为限制区域,则判定用户为限制对象,需要限制对用户提供服务,包括提供通信服务、支付服务等。进一步的,可以根据预设标签-受限对照关系表,确定用户是否为限制对象,该预设标签-受限对照关系表为预先设定,且支持管理者修改,具体可以设定为无可能性与低可能性对应非受限类型,中可能性和高可能性确定为受限类型。
上述限制对象识别方法,对用户终端上传的定位数据进行基于线性可逆函数的编码,获得位置编码,识别出位置编码所属编码格子,从存储有多个编码格子以及各编码格子对应的标签的预设编码格子数据库中读取所属编码格子对应的标签,基于标签来识别用户是否为限制对象,整个过程中,一方面基于用户终端上传的定位数据进行处理,减少由于用户手动填写地址导致位置数据错误的情况,另一方面,针对定位数据进行基于线性可逆函数的编码,识别位置编码所属编码格子,通过获取该编码格子对应标签的方式来识别用户是否为处于限制区域内的限制对象,实现限制对象的准确识别。
下面将以限制骗贷团伙为实际应用场景并结合图3,详细解释上述限制对象识别方法。在该应用场景中,是为了识别出用户所处区域是否可能为骗贷团伙所处区域,若为骗贷团伙所处区域,则认定用户为限制对象,限制用户操作,例如用户在该区域内无法拨打电话和接收电话收发消息等。在该应用场景中具体包括以下处理过程:
1)、用户X手机上传用户GPS坐标至服务器,输入客户GPS坐标,通过GeoHash算法对用户进行编码得到位置编码,并且在编码地图中查找位置编码所属编码格子A。
2)、从预设编码格子数据库中读取所属编码格子A的标签为S。
3)针对标签S进行风险识别,从而判断用户X是否为限制对象,当标签S为高可能性(高风险)时,则所属编码格子A对应的位置区域极有可能为骗贷团伙所处位置区域,则识别用户X当前为限制对象,限制用户X操作;当标签S为低可能性(低风险)时,则所属编码格子A对应的位置区域为骗贷团伙所处位置可能性较低,则识别用户X为非限制对象,不限制用户X操作。
4)非必要的,在得到用户A对应的编码格子A以及标签S之后,获取(采集)用户A的信息,将用户A的信息、用户A的GPS坐标写入到预设编码格子数据库中,以更新该数据库中针对所属编码格子A对应的数据。
在其中一个实施例中,从预设编码格子数据库读取所属编码格子对应的标签之前,还包括:
获取历史记录中目标类型用户位置分布数据;根据历史记录中目标类型用户位置分布数据,确定目标类型用户的位置信息;对目标类型用户的位置信息进行基于线性可逆函数的编码,获得样本位置编码;将样本位置编码映射至划设有编码格子的编码地图中;获取各编码格子对应的目标类型用户数量;根据各编码格子对应的目标类型用户数量设定标签;记录各编码格子的身份标识以及对应的已设定标签,构建预设编码格子数据库。
预设编码格子数据库是预先构建的,其数据库构建数据基础是历史记录中目标类型用户位置分布数据,基于该数据可以确定在历史记录中目标类型用户的分布情况和具体位置信息,同样的针对该位置信息进行线性可逆函数的编码得到样本位置编码,将样本编码映射至编码地图中,在该编码地图中划设有编码格子,基于映射后的编码地图,可以获得每个编码格子对应的目标类型用户数量,根据目标类型用户数量设定各个编码格子对应的标签、并记录,最终构建预设编码格子数据库。以骗贷团伙成为目标类型用户为例,数据库在构建之初,获取历史记录中骗贷团伙的位置分布数据,获取骗贷团伙成员具体位置信息,针对这些位置信息进行线性可逆函数的编码得到样本位置编码,将样本编码映射至编码地图中,得到每个编码格子对应的骗贷团伙成员数量,再根据该数量设定标签,具体可以根据骗贷团伙成员数据占整个编码格子对应区域内用户总数量占比设定标签,标签具体可以低风险(低可能性)、中风险(中可能性)以及高风险(高可能性)。
在其中一个实施例中,根据各编码格子对应的目标类型用户数量设定标签包括:
获取各编码格子中用户数量和目标类型用户数量;计算各编码格子中目标类型用户数量占比;根据预设占比-标签对应关系表,设定各编码格子对应的标签。
例如占比小于0.05%设定为无可能性标签、占比小于0.1%(大于0.05%)设定为低可能性标签、占比大于0.5%(小于1%)设定为中可能性标签、占比大于1%设定为高可能标签。在具体应用中,以团贷用户识别为例,由于可能性与该地区存在金融风险成正相关,因此,标签可以进一步具体为无风险、低风险、中风险以及高风险。
在其中一个实施例中,获取各编码格子中用户数量包括:
采用Hash算法在Trie树中查找各编码格子对应的位置编码数据;根据各编码格子中查找到的位置编码数据,获取各编码格子中用户数量。
Trie树是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。在本实施例中,采用Hash算法在Trie树中查找各编码格子对应的位置编码数据,可以高效且准确查找到各编码格子对应的位置编码数据,进而更进一步提高识别效率。
如图4所示,在其中一个实施例中,步骤S500之后,还包括:
S600:当识别用户为限制对象时,对用户对应的账号信息添加限制标识。
当识别用户为限制对象时,需要对用户对应的账号信息添加限制标识,该限制标识用于标示限制响应操作。例如当时别出用户X为限制对象时,对用户X在终端(例如智能手机)上操作限制和使用功能限制,例如限制用户X购买商品、充值话费、转账等。
在其中一个实施例中,根据标签,识别用户是否为限制对象之后,还包括:将用户的受限类型识别结果以及位置编码所属编码格子更新至预设编码格子数据库。
用户的受限类型识别结果包括限制对象和非限制对象,将该结果数据以及位置编码所属编码格子更新至预设编码格子数据库,以更新预设编码格子数据库。
应该理解的是,虽然图2和图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图5所示,一种限制对象识别装置,装置包括:
接收模块100,用于接收用户终端上传的定位数据;
编码模块200,用于对定位数据进行基于线性可逆函数的编码,获得位置编码;
编码格子识别模块300,用于识别位置编码所属编码格子;
标签读取模块400,用于从预设编码格子数据库读取所属编码格子对应的标签,预设编码格子数据库存储有多个编码格子以及各编码格子对应的标签,标签用于表征编码格子对应位置区域为限制区域的可能性程度;
对象识别模块500,用于根据标签,识别用户是否为限制对象。
上述限制对象识别装置,对用户终端上传的定位数据进行基于线性可逆函数的编码,获得位置编码,识别出位置编码所属编码格子,从存储有多个编码格子以及各编码格子对应的标签的预设编码格子数据库中读取所属编码格子对应的标签,基于标签来识别用户是否为限制对象,整个过程中,一方面基于用户终端上传的定位数据进行处理,减少由于用户手动填写地址导致位置数据错误的情况,另一方面,针对定位数据进行基于线性可逆函数的编码,识别位置编码所属编码格子,通过获取该编码格子对应标签的方式来识别用户是否为处于限制区域内的限制对象,实现限制对象的准确识别。
在其中一个实施例中,编码模块200还用于通过GeoHash算法对定位数据进行编码,获得位置编码。
在其中一个实施例中,上述限制对象识别装置还包括数据库构建模块,用于获取历史记录中目标类型用户位置分布数据;根据历史记录中目标类型用户位置分布数据,确定目标类型用户的位置信息;对目标类型用户的位置信息进行基于线性可逆函数的编码,获得样本位置编码;将样本位置编码映射至划设有编码格子的编码地图中;获取各编码格子对应的目标类型用户数量;根据各编码格子对应的目标类型用户数量设定标签;记录各编码格子的身份标识以及对应的已设定标签,构建预设编码格子数据库。
在其中一个实施例中,数据库构建模块还用于获取各编码格子中用户数量和目标类型用户数量;计算各编码格子中目标类型用户数量占比;根据预设占比-标签对应关系表,设定各编码格子对应的标签。
在其中一个实施例中,数据库构建模块还用于采用Hash算法在Trie树中查找各编码格子对应的位置编码数据;根据各编码格子中查找到的位置编码数据,获取各编码格子中用户数量。
在其中一个实施例中,上述限制对象识别装置还包括限制模块,用于当识别用户为限制对象时,对用户对应的账号信息添加限制标识。
在其中一个实施例中,上述限制对象识别装置还包括更新模块,用于将用户的受限类型识别结果以及位置编码所属编码格子更新至预设编码格子数据库。
关于限制对象识别装置的具体限定可以参见上文中对于限制对象识别方法的限定,在此不再赘述。上述限制对象识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储预设编码格子数据库等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种限制对象识别方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
接收用户终端上传的定位数据;
对定位数据进行基于线性可逆函数的编码,获得位置编码;
识别位置编码所属编码格子;
从预设编码格子数据库读取所属编码格子对应的标签,预设编码格子数据库存储有多个编码格子以及各编码格子对应的标签,标签用于表征编码格子对应位置区域为限制区域的可能性程度;
根据标签,识别用户是否为限制对象。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
通过GeoHash算法对定位数据进行编码,获得位置编码。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取历史记录中目标类型用户位置分布数据;根据历史记录中目标类型用户位置分布数据,确定目标类型用户的位置信息;对目标类型用户的位置信息进行基于线性可逆函数的编码,获得样本位置编码;将样本位置编码映射至划设有编码格子的编码地图中;获取各编码格子对应的目标类型用户数量;根据各编码格子对应的目标类型用户数量设定标签;记录各编码格子的身份标识以及对应的已设定标签,构建预设编码格子数据库。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取各编码格子中用户数量和目标类型用户数量;计算各编码格子中目标类型用户数量占比;根据预设占比-标签对应关系表,设定各编码格子对应的标签。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
采用Hash算法在Trie树中查找各编码格子对应的位置编码数据;根据各编码格子中查找到的位置编码数据,获取各编码格子中用户数量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
当识别用户为限制对象时,对用户对应的账号信息添加限制标识。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将用户的受限类型识别结果以及位置编码所属编码格子更新至预设编码格子数据库。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
接收用户终端上传的定位数据;
对定位数据进行基于线性可逆函数的编码,获得位置编码;
识别位置编码所属编码格子;
从预设编码格子数据库读取所属编码格子对应的标签,预设编码格子数据库存储有多个编码格子以及各编码格子对应的标签,标签用于表征编码格子对应位置区域为限制区域的可能性程度;
根据标签,识别用户是否为限制对象。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
通过GeoHash算法对定位数据进行编码,获得位置编码。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取历史记录中目标类型用户位置分布数据;根据历史记录中目标类型用户位置分布数据,确定目标类型用户的位置信息;对目标类型用户的位置信息进行基于线性可逆函数的编码,获得样本位置编码;将样本位置编码映射至划设有编码格子的编码地图中;获取各编码格子对应的目标类型用户数量;根据各编码格子对应的目标类型用户数量设定标签;记录各编码格子的身份标识以及对应的已设定标签,构建预设编码格子数据库。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取各编码格子中用户数量和目标类型用户数量;计算各编码格子中目标类型用户数量占比;根据预设占比-标签对应关系表,设定各编码格子对应的标签。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
采用Hash算法在Trie树中查找各编码格子对应的位置编码数据;根据各编码格子中查找到的位置编码数据,获取各编码格子中用户数量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
当识别用户为限制对象时,对用户对应的账号信息添加限制标识。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将用户的受限类型识别结果以及位置编码所属编码格子更新至预设编码格子数据库。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。