CN114418175A - 一种人员管理方法、装置、电子设备及存储介质 - Google Patents

一种人员管理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114418175A
CN114418175A CN202111521764.1A CN202111521764A CN114418175A CN 114418175 A CN114418175 A CN 114418175A CN 202111521764 A CN202111521764 A CN 202111521764A CN 114418175 A CN114418175 A CN 114418175A
Authority
CN
China
Prior art keywords
data
probability
preset
credit
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111521764.1A
Other languages
English (en)
Inventor
吴涛
汪昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Unisinsight Technology Co Ltd
Original Assignee
Chongqing Unisinsight Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Unisinsight Technology Co Ltd filed Critical Chongqing Unisinsight Technology Co Ltd
Priority to CN202111521764.1A priority Critical patent/CN114418175A/zh
Publication of CN114418175A publication Critical patent/CN114418175A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供了一种人员管理方法、装置、电子设备及存储介质,用于对人员的信访行为进行预测和管理,降低信访事件发生率。所述方法包括:获取目标对象基于时间序列的定位数据和交通出行数据;根据所述定位数据和交通出行数据确定预设多个特征参数中每个特征参数对应的特征值;其中,所述多个特征参数为对信访产生影响的多个事件对应的参数;通过训练好的预测模型中的第一子模型基于所述每个特征参数对应的特征值预测所述目标对象的第一信访概率;若所述第一信访概率大于第一预设阈值,则基于所述第一信访概率生成第一管理指令;其中,所述第一管理指令用于指示管理人员对所述目标对象采取管控措施。

Description

一种人员管理方法、装置、电子设备及存储介质
技术领域
本发明涉及大数据技术领域,尤其涉及一种人员管理方法、装置、电子设 备及存储介质。
背景技术
传统的管控方式很多是投入大量的警员人力去收集管控人员的日常活动 信息,如查看大量视频监控获取其地点信息并做分析,人为的跟踪和监控等。 这种方式既耗费人员精力而且容易产生人为的疏忽和业务经验老化等问题,而 且对于某些反侦察能力强的管控人员,在脱离管控的束缚之后就更容易产生违 法违规等不受控制的行为,从而导致管控的效果不佳。
发明内容
本申请实施例提供了一种人员管理方法、装置、电子设备及存储介质,用 于对人员的信访行为进行预测和管理,降低信访事件发生率。
第一方面,提供一种人员管理方法,所述方法包括:
获取目标对象基于时间序列的定位数据和交通出行数据;
根据所述定位数据和交通出行数据确定预设多个特征参数中每个特征参 数对应的特征值;其中,所述多个特征参数为对信访产生影响的多个事件对应 的参数;
通过训练好的预测模型中的第一子模型基于所述每个特征参数对应的特 征值预测所述目标对象的第一信访概率;其中,所述第一子模型为通过第一训 练数据集对回归模型进行拟合得到的,所述第一训练数据集包括所述多个特征 参数中每个特征参数对应的多个特征值;
若所述第一信访概率大于第一预设阈值,则基于所述第一信访概率生成第 一管理指令;其中,所述第一管理指令用于指示管理人员对所述目标对象采取 管控措施。
可选的,所述多个特征参数包括异常轨迹类别、预设事件最近一次发生的 时刻与当前时刻的间隔时长、所述预设事件在第一预设时长内出现的次数和最 近一次定位信号消失的持续时长,所述异常轨迹类别用于指示预设区域的敏感 等级,所述预设事件包括出现在所述预设区域、购票、安检、所述目标对象与 其它管控对象同行、所述目标对象与所述其它管控对象聚集和定位信号消失中 的至少一种。
可选的,所述通过训练好的预测模型中的第一子模型基于所述每个特征参 数对应的特征值预测所述目标对象的第一信访概率,包括:
确定每个特征值对应的特征分数;
通过第一预设值减去所述每个特征值对应的特征分数,得到第一差值;其 中,所述第一预设值为所述多个特征参数对应的全量分数集合中的最大值;
确定所述第一差值与所述第一预设值之间的第二差值,以及所述第一预设 值和第二预设值之间的第三差值;其中,所述第二预设值为所述全量分数集合 中的最小值;
根据所述第二差值和所述第三差值之间的比值预测所述第一信访概率。
可选的,所述方法还包括:
若所述第一信访概率小于第二预设阈值,则基于所述第一信访概率生成第 二管理指令;其中,所述第二预设阈值小于所述第一预设阈值,所述第二管理 指令用于指示所述管理人员对所述目标对象进行观察。
可选的,所述方法还包括:
若所述第一信访概率大于所述第二预设阈值且小于所述第一预设阈值,则 获取所述目标对象的历史信访数据和情报文本数据;其中,所述情报文本数据 为管理人员收集并记录的所述目标对象的行为的数据;
根据所述历史信访数据和情报文本数据预测所述目标对象的第二信访概 率;
根据所述第一信访概率和所述第二信访概率确定所述目标对象的目标信 访概率,并基于所述目标信访概率生成管理指令。
可选的,所述根据所述历史信访数据和情报文本数据预测所述目标对象的 第二信访概率,包括:
通过训练好的语言模型对所述情报文本数据进行语义分析;
按照预定义信访类别对语义分析结果进行分类;其中,所述预定义信访类 别包括明确会信访、大概率会信访、小概率会信访、明确不会信访和信访无关 事件;
确定第二预设时长内每个信访类别对应的事件次数;
根据所述历史信访数据确定所述目标对象在第三预设时长内的历史信访 次数;
通过所述预测模型中的第二子模型基于所述每个信访类别对应的事件次 数和所述历史信访次数分别对应的特征值预测所述第二信访概率;其中,所述 第二子模型为通过第二训练数据集对所述回归模型进行拟合得到的,所述第二 训练数据集包括所述每个信访类别对应的事件次数和所述历史信访次数分别 对应的多个特征值。
可选的,所述预测模型通过以下方式获得:
获取训练样本集;其中,所述训练样本集包括所有管控对象基于时间序列 的定位数据、交通出行数据、历史信访数据和情报文本数据;
基于所述训练样本集,分别统计所述所有管控对象中每个管控对象的时长 类别数据、次数类别数据和异常轨迹类别;其中,所述时长类别数据包括预设 事件中每个事件最近一次发生的时刻与当前时刻的间隔时长、最近一次定位信 号消失的持续时长,所述次数类别数据包括所述每个事件在第一预设时长内出 现的次数、第二预设时长内每个信访类别对应的事件次数和第三预设时长内的 历史信访次数;
对所述时长类别数据和次数类别数据按照预设规则进行区间量化,得到区 间量化值;
根据所述区间量化值和所述异常轨迹类别对应的特征值确定第一训练数 据集和第二训练数据集;
分别基于所述第一训练数据集和第二训练数据集对所述回归模型进行训 练,得到所述预测模型。
第二方面,提供一种人员管理装置,所述装置包括:
获取模块,用于获取目标对象基于时间序列的定位数据和交通出行数据;
处理模块,用于根据所述定位数据和交通出行数据确定预设多个特征参数 中每个特征参数对应的特征值;其中,所述多个特征参数为对信访产生影响的 多个事件对应的参数;
所述处理模块,还用于通过训练好的预测模型中的第一子模型基于所述每 个特征参数对应的特征值预测所述目标对象的第一信访概率;其中,所述第一 子模型为通过第一训练数据集对回归模型进行拟合得到的,所述第一训练数据 集包括所述多个特征参数中每个特征参数对应的多个特征值;
所述处理模块,还用于在所述第一信访概率大于第一预设阈值时,基于所 述第一信访概率生成第一管理指令;其中,所述第一管理指令用于指示管理人 员对所述目标对象采取管控措施。
可选的,所述多个特征参数包括异常轨迹类别、预设事件最近一次发生的 时刻与当前时刻的间隔时长、所述预设事件在第一预设时长内出现的次数和最 近一次定位信号消失的持续时长,所述异常轨迹类别用于指示预设区域的敏感 等级,所述预设事件包括出现在所述预设区域、购票、安检、所述目标对象与 其它管控对象同行、所述目标对象与所述其它管控对象聚集和定位信号消失中 的至少一种。
可选的,所述处理模块,具体用于:
确定每个特征值对应的特征分数;
通过第一预设值减去所述每个特征值对应的特征分数,得到第一差值;其 中,所述第一预设值为所述多个特征参数对应的全量分数集合中的最大值;
确定所述第一差值与所述第一预设值之间的第二差值,以及所述第一预设 值和第二预设值之间的第三差值;其中,所述第二预设值为所述全量分数集合 中的最小值;
根据所述第二差值和所述第三差值之间的比值预测所述第一信访概率。
可选的,所述处理模块,还用于:
在所述第一信访概率小于第二预设阈值时,基于所述第一信访概率生成第 二管理指令;其中,所述第二预设阈值小于所述第一预设阈值,所述第二管理 指令用于指示所述管理人员对所述目标对象进行观察。
可选的,所述获取模块,还用于:
在所述第一信访概率大于所述第二预设阈值且小于所述第一预设阈值时, 获取所述目标对象的历史信访数据和情报文本数据;其中,所述情报文本数据 为管理人员收集并记录的所述目标对象的行为的数据;
所述处理模块,还用于:
根据所述历史信访数据和情报文本数据预测所述目标对象的第二信访概 率;
根据所述第一信访概率和所述第二信访概率确定所述目标对象的目标信 访概率,并基于所述目标信访概率生成管理指令。
可选的,所述处理模块,具体用于:
通过训练好的语言模型对所述情报文本数据进行语义分析;
按照预定义信访类别对语义分析结果进行分类;其中,所述预定义信访类 别包括明确会信访、大概率会信访、小概率会信访、明确不会信访和信访无关 事件;
确定第二预设时长内每个信访类别对应的事件次数;
根据所述历史信访数据确定所述目标对象在第三预设时长内的历史信访 次数;
通过所述预测模型中的第二子模型基于所述每个信访类别对应的事件次 数和所述历史信访次数分别对应的特征值预测所述第二信访概率;其中,所述 第二子模型为通过第二训练数据集对所述回归模型进行拟合得到的,所述第二 训练数据集包括所述每个信访类别对应的事件次数和所述历史信访次数分别 对应的多个特征值。
可选的,所述人员管理装置还包括模型训练模块,用于:
获取训练样本集;其中,所述训练样本集包括所有管控对象基于时间序列 的定位数据、交通出行数据、历史信访数据和情报文本数据;
基于所述训练样本集,分别统计所述所有管控对象中每个管控对象的时长 类别数据、次数类别数据和异常轨迹类别;其中,所述时长类别数据包括预设 事件中每个事件最近一次发生的时刻与当前时刻的间隔时长、最近一次定位信 号消失的持续时长,所述次数类别数据包括所述每个事件在第一预设时长内出 现的次数、第二预设时长内每个信访类别对应的事件次数和第三预设时长内的 历史信访次数;
对所述时长类别数据和次数类别数据按照预设规则进行区间量化,得到区 间量化值;
根据所述区间量化值和所述异常轨迹类别对应的特征值确定第一训练数 据集和第二训练数据集;
分别基于所述第一训练数据集和第二训练数据集对所述回归模型进行训 练,得到所述预测模型。
第三方面,提供一种电子设备,所述电子设备包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执 行第一方面中任一所述的方法包括的步骤。
第四方面,提供一种计算可读存储介质,所述计算可读存储介质存储有计 算机可执行指令,所述计算机可执行指令用于使计算机执行第一方面中任一所 述的方法包括的步骤。
第五方面,提供一种包含指令的计算机程序产品,当所述计算机程序产品 在计算机上运行时,使得计算机执行上述各种可能的实现方式中所描述的人员 管理方法。
在本申请实施例中,首先获取目标对象基于时间序列的定位数据和交通出 行数据,并根据获取的定位数据和交通出行数据确定预设多个特征参数中每个 特征参数对应的特征值(即根据获取的定位数据和交通出行数据确定可能对信 访产生影响的多个事件对应的参数),然后通过训练好的预测模型中的第一子 模型基于每个特征参数对应的特征值预测目标对象的第一信访概率;若第一信 访概率大于第一预设阈值,则基于第一信访概率生成用于指示管理人员对目标 对象采取管控措施的第一管理指令。其中,基于时间序列的定位数据和交通出 行数据相对于人为收集信息更具客观性,使得对管控人员的信访行为预测更准 确,从而可以有效降低信访事件发生率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施 例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅 仅是本申请的一些实施例。
图1为本申请实施例提供的一种主模型预测信访概率的流程图;
图2为本申请实施例提供的一种辅模型预测信访概率的流程图;
图3为本申请实施例提供的一种人员管理方法的流程图;
图4为本申请实施例提供的一种人脸图像质量评估装置的结构框图;
图5为本发明实施例中的计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下面将结合本申请实 施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然, 所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申 请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所 有其他实施例,都属于本申请保护的范围。在不冲突的情况下,本申请中的实 施例及实施例中的特征可以相互任意组合。并且,虽然在流程图中示出了逻辑 顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请的说明书和权利要求书及上述附图中的术语“第一”和“第二”是 用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任 何变形,意图在于覆盖不排他的保护。例如包含了一系列步骤或单元的过程、 方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括 没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固 有的其它步骤或单元。本申请中的“多个”可以表示至少两个,例如可以是两 个、三个或者更多个,本申请实施例不做限制。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示 可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A 和B,单独存在B这三种情况。另外,本文中字符“/”,在不做特别说明的情 况下,一般表示前后关联对象是一种“或”的关系。
为了便于理解,下面先对本发明实施例的技术背景进行介绍。
目前,基于传统的管控方式耗费人员精力而且容易产生人为的疏忽和业务 经验老化的问题,有一种方案是通过采集涉稳人员的公安系统信息数据如:基 础身份信息数据、出行、电子围栏、住宿等数据,然后进行简单的特征变换后 做数据关联碰撞和数据预处理,最后作为机器学习Xgboost算法模型的输入进 行预测。其中,由于从历史数据能获取的信访时间的正例标签数量较少,存在 标签严重不均衡的情况,因此,只基于历史数据建模,得到的模型准确性较低。
另一种方案是通过对样本数据做聚类的预处理,并用降维的方法减少特征 数,将数据输入机器学习中的线性模型进行训练,优化参数后得到动态积分模 型,并将动态积分模型与经典积分模型进行加权求和得到最终的评估结果。其 中,由于该方案仍然存在标签不均衡的情况,因此最终得到评估结果的准确性 也较低。
鉴于此,本申请实施例提供了一种人员管理方法,通过获取目标对象基于 时间序列的定位数据和交通出行数据,并根据获取的定位数据和交通出行数据 确定预设多个特征参数中每个特征参数对应的特征值然后根据每个特征参数 对应的特征值确定目标对象的第一信访概率,若第一信访概率大于第一预设阈 值,则基于第一信访概率生成用于指示管理人员对目标对象采取管控措施的第 一管理指令。其中,本申请考虑到管控人员在进行非法信访的过程中,可以通 过其轨迹数据捕捉到异常情况,因此通过对管控人员基于时间序列的定位数据 和交通出行数据对其轨迹进行分析,基于该分析结果预测信访概率,可以使得 预测结果更准确。
下面结合说明书附图对本申请实施例提供的人员管理方法进行介绍。
在本申请实施例中,可以通过模型对管控人员的信访行为进行预测,其中, 管控人员是公安系统中记录的存在非法信访动机人员,为了避免管控人员的非 法信访行为对区、市甚至国家和社会造成负面的影响,公安机关需要对其进行 有效的管控。而考虑到针对真实信访场景,从历史数据能获取到的信访事件的 正例标签较少,存在标签严重不均衡的情况,因此为了避免样本不均衡的问题, 可以对能反映信访真实场景的特征数据进行构建,以覆盖各个信访概率区间, 并将构建的数据和获取的历史信访数据作为模型训练的数据集对模型进行训 练,其中,考虑到数据构建的方式趋近于积分模型的规则引擎,以及数据规模 和结构化的特点,在本申请实施例中使用的模型为回归模型,优选的,使用的 模型为Ridge回归模型。需要说明的是,本申请是基于公安系统所采集到的数 据对能反映信访真实场景的特征数据进行构建,采集的数据包括管控人员(即 管控对象)的人员基本信息数据(例如,姓名、身份证号等数据)、基于时间 序列的定位数据(例如是4G信号定位数据、人脸人体抓拍定位数据(例如, 交通路口监控抓拍的图像数据)、异常轨迹数据)、情报文本数据、交通出行数 据(例如铁路、民航和客运的购票、安检等数据)和历史信访数据。
其中,历史信访数据和情报文本数据具有较强的主观不确定性,而基于时 间序列的定位数据和交通出行数据具有较强的实时性和客观性,因此本申请将 基于时间序列的定位数据和交通出行数据,与历史信访数据和情报文本数据分 别分别作为回归模型的训练数据集进行模型训练,得到预测模型,其中,该预 测模型包括第一子模型(即主模型)和第二子模型(即辅模型),且由于基于 时间序列的定位数据和交通出行数据具有较强的实时性和客观性,因此将其作 为数据集进行模型训练得到的模型为主模型,而将历史信访数据和情报文本数 据作为数据集进行模型训练得到的模型为辅模型,在主模型预测的信访概率属 于预设范围时(例如,预测的概率大于第二预设阈值且小于第一预设阈值), 将辅模型的预测结果与主模型的预测结果进行融合。
主模型预测信访概率的流程如图1所示:
步骤101:获取主模型训练数据;
如前所述,对主模型进行模型训练的数据集包括基于时间序列的定位数据 和交通出行数据。在本申请实施例中,可以基于4G信号定位数据和人脸人体 抓拍定位数据对每个管控人员的轨迹数据和定位信号(即4G信号)消失统计 数据进行统计,以及基于铁路、民航和客运的购票、安检等数据和每个管控人 员与其它管控人员同行、聚集等数据对每个管控人员的交通出行数据进行统计, 其中,同行和聚集类的数据可以根据购票数据和定位数据等方式获取,轨迹数 据例如可以包括异常轨迹类别特征(其中,异常轨迹类别用于指示预设区域的 敏感等级,例如也可以说是异常轨迹的敏感等级)、管控人员最近一次出现在敏感区域(即预设区域)的时刻与当前时刻的间隔时长(即管控人员最近一次 出现在敏感区域的距今时长),4G信号消失统计数据例如可以包括4G信号在 近期(例如是距今一个月内)消失的次数、4G信号最近一次消失的持续时长 和4G信号最近一次消失的距今时长,交通出行数据例如可以包括近期购票和/ 或安检次数、最近一次购票和/或安检的距今时长、近期与其它管控人员同行和 /或聚集的次数和近期与其它管控人员最近一次同行和/或聚集的距今时长。
其中,对每个管控人员的轨迹数据进行统计的过程中,可以将每个管控人 员的轨迹数据分为在京轨迹统计数据、市级轨迹统计数据和区级轨迹统计数据; 并分别基于在京轨迹统计数据、市级轨迹统计数据和区级轨迹统计数据对每个 管控人员的轨迹进行异常检测,得到管控人员的轨迹异常类别特征。
具体的,可以结合管控人员在进行非法信访过程中会达到的敏感区域,例 如政府机构、公检法区域、汽车站、火车/高铁站、机场等区域对每个管控人员 的轨迹进行异常检测,若管控人员1的在京轨迹涉及到政府机构,则认为管控 人员1的在京轨迹异常。其中,对管控人员的轨迹进行异常检测时,可以基于 单类支持向量机(One-Class Support VectorMachine,OCSVM)无监督机器学 习算法获取异常轨迹的定位数据(例如是敏感区域的区域位置信息),然后将 获取到的异常轨迹的定位数据与管控人员在进行非法信访过程中会到达的敏 感区域(如表1所示的区域)做时空碰撞,获取异常轨迹的敏感等级,例如, 通过OCSVM无监督机器学习算法获取管控人员1的异常轨迹的定位数据为区 政府,将其与敏感区域做时空碰撞,得到管控人员1的异常轨迹的敏感等级为 四级。
Figure BDA0003407753010000111
Figure BDA0003407753010000121
表1
其中,区域类别可以覆盖管控人员的整个活动区域,敏感等级从一级到七 级对应的敏感程度越来越高。
步骤102:将获取的主模型数据转化为同类型的结构化数据;
如前所述,本申请实施例中使用的模型为Ridge回归模型,该模型能识别 的数据类型为结构化数据,即输入模型的数据需要为同类型的结构化数据,因 此,需要将获取到的数据类型转换为同类型的结构化数据(例如是数值类结构 化数据),即将结构化数据、非结构化数据、半结构化数据通过特征工程做转 换,生成模型能够识别的同类型的结构化数据,例如,4G信号定位数据和人 脸人体抓拍数据原始只是经纬度数据,对其预处理之后,得到数值类数据。
其中,如表1所示,异常轨迹的敏感等级为数值类数据,因此,不需要对 异常轨迹的敏感等级进行数据类型的转换,可以直接根据敏感等级确定输入模 型的异常轨迹类别数值(即异常轨迹类别对应的特征值),需要说明的是,本 申请实施例中异常轨迹类别数值与异常轨迹的敏感等级负相关,即异常轨迹类 别的数值越小,异常轨迹敏感等级越高,且异常轨迹类别数值越小,对主模型 预测信访概率的贡献度越高,异常轨迹类别数值与异常轨迹的敏感等级的具体 关系如表2所示:
Figure BDA0003407753010000122
Figure BDA0003407753010000131
表2
而获取的管控人员最近一次出现在敏感区域的距今时长、4G信号在近期 消失的次数、4G信号最近一次消失的持续时长、4G信号最近一次消失的距今 时长、近期购票和/或安检次数、最近一次购票和/或安检的距今时长、近期与 其它管控人员同行和/或聚集的次数和近期与其它管控人员最近一次同行和/或 聚集的距今时长等次数和时长类的数据为连续值,获取的次数和时长类的数据 如表3所示:
Figure BDA0003407753010000132
表3
由于连续值不能直接输入模型,因此本申请实施例中基于一种特征和标签 全覆盖性的区间量化方法进一步构建进行模型训练的数据集,具体的,对时长 和次数类的数据进行如表4所示区间量化(也叫“分桶”),表4中仅以4G信 号近期消失次数、4G信号最近一次消失持续时长和4G信号最近一次消失距今 时长进行举例。
Figure BDA0003407753010000133
Figure BDA0003407753010000141
表4
其中,区间量化值即每个特征对应的特征值,在本申请实施例中,不同的 特征类型(例如,异常轨迹涉及的敏感区域、购票、安检、同行和聚集等特征 类型)需要定义的量化区间长度可以根据该特征的实际情况进行定义,例如, “最近一次在北京区域距今时长”和“最近一次在市行政机构距今时长”按照 表1中的敏感等级,其定义的区间长度应该也有差异,其中,最近一次在北京 区域对主模型预测信访概率的贡献度相对于市行政机构更高,所以对最近一次 出现在北京区域定义的区间相对于最近一次出现在市行政机构的区间更短。
在本申请实施例中,确定异常轨迹类别数值、根据基于时间序列的定位数 据和交通出行数据统计得到的时长类别数据和次数类别数据分别对应的区间 量化值为第一训练数据集。
步骤103:基于同类型的结构化数据进行信访概率预测;
将获取的数据转化为同类型的结构数据之后(即得到第一训练数据集之 后),还可以获取每个特征的全量覆盖数据,例如,将“异常轨迹”相关数据 做笛卡尔积,即获取表2中的“异常轨迹类别数值”集合X={1,2,3,…,x},以 及“最近一次出现在敏感区域的距今时长(最近一次异常轨迹点距今时长)” 对应的区间量化值集合Y={1,2,3,…,y},基于笛卡尔积公式X×Y= {(x,y)|x∈X∪y∈Y},可得到:
AT={(1,1),(1,2),(1,3),…,(1,y),(2,2),(2,3),…,(2,y),…,(x,y)} (1)
其中,元素max(x,y)越小,代表该特征对信访概率的贡献越大,即产生信 访的概率也就越大。
例如,还可以将“4G信号消失”相关数据做笛卡尔积,即分别获取表4 中的三个特征对应的区间量化值集合,得到“4G信号消失”的笛卡尔积FG, 再对AT和FG做笛卡尔积,依次按照上述方法整合所有特征,最终形成全量特征 的全量覆盖数据。
基于上述步骤构建了每个特征对应的特征值(异常轨迹类别数值和区间量 化值)之后,还需要构建对应的风险分数以达到模拟数据标注的功能,具体构 建风险分数的方法如下:以特征为单位,取每个特征中max(x,y,p,q,…)最小 值对应的特征进行全量组合,组合后的特征对应的风险分数赋予最高分,例如 100分,之后的每条数据中每个特征增加一个数级则按照对应的削减分值减小 风险分数,其中,部分特征区间量化值和对应削减分值如表5所示:
Figure BDA0003407753010000151
表5
其中,每个特征值区间对应每个特征的削减值需要根据该特征对信访概率 的影响程度进行设定,即该特征会导致管控人员信访行为发生的概率越大,该 特征对应的分值削减程度越高,例如,“异常轨迹类别数值”对信访概率的影 响程度最大,因此相同的特征值区间,“异常轨迹类别数值”对应的分数削减 值也越大。
在一种可能的实施方式中,最终得到的全量特征风险分数可能存在负数, 因此可以基于公式(2)将最终得到的全量特征风险分数转换为0%到100%的 一个概率分值,公式(2)如下:
Figure BDA0003407753010000161
其中,S为全量特征风险分数集合,s∈S,round(x,4)表示取x的小数点 后4位,max(S)为每个特征中最小值对应的特征进行全量组合后对应的风险 分数,min(S)为将所有特征值都按照最大削减分值进行削减之后的最低风险分 数,P为信访概率。
辅模型预测信访概率的流程如图2所示:
步骤201:获取辅模型训练数据;
如前所述,对辅模型进行模型训练的数据集包括历史信访数据和情报文本 数据。在本申请实施例中,历史信访数据可以从公安系统中保存的信访记录获 取,情报文本数据主要通过每个管控人员对应的管理人员(例如是民警)做情 报手机然后录入数据库的数据,数据类型为人为组织的纯文本数据,录入数据 库的情报文本数据如表6所示:
Figure BDA0003407753010000162
表6
历史信访数据如表7所示,在本申请实施例中,可以历史信访数据划分为 历史进京信访数据、历史市级信访数据和历史区级信访数据。
Figure BDA0003407753010000171
表7
步骤202:将获取的辅模型数据转化为同类型的结构化数据;
由于历史信访数据的数据类型与表3中的数据类型相同,因此对表7中数 据类型的转化方式与对表3中的数据类型的转化方式相同,再此不再赘述,而 对于情报文本数据,由于其是文本类数据,属于非结构化数据,不能与前述的 数据类型共用,也不能直接输入模型,因此需要基于自然语言处理技术对其进 行处理。
对于情报文本数据进行处理时,首先可以对情报文本数据进行分类,得到 的类别转换为对辅模型有贡献的特征,例如,定义指定数量的标签。在本申请 实施例中,可以定义5个标签,分别是:①明确会信访、②有大概率会信访、 ③有小概率会信访、④明确不会信访和⑤信访无关事件,五个事件标签的定义 原则是相互独立,若用数值量化可分别对应到该事件描述的管控人员在近期进 行信访的概率从100%到0%不等。
其中,对情报文本数据做分类需要用到自然语言处理(Natural LanguageProcessing,NLP)较前沿的预训练模型BERT(Bidirectional Encoder Representationsfrom Transformers),基于该模型的特点,需要在已经预训练过 的语言模型基础上,加入少量如softmax网络层即可完成具体的情报文本数据 分类任务。且对情报文本数据进行文本分类任务之前,还需要通过训练好的语 言模型对情报文本数据进行语义分析,以对情报文本数据进行标注,如6中的 3条示例数据,分别标注为标签:①②④,然后将标注好的标签输入到BERT 模型中进行训练,并结合每个标签和事件日期,构造如表8的新特征,需要说明的是,标签⑤对应的情报文本数据对辅模型预测的信访概率既不产生正贡献 也不产生负贡献。
Figure BDA0003407753010000181
表8
其中,由于标签⑤对应的情报文本数据对辅模型预测的信访概率既不产生 正贡献也不产生负贡献,因此,可以不对标签⑤的数量进行统计,且标签①② 对应的信访的可能性较大,而标签③④对应的信访的可能性较小,因此在统计 标签数量时,可以将标签①②和标签③④进行组合,辅模型在预测信访概率时, 标签①②对应的情报文本数据对辅模型预测的信访概率产生正贡献,标签③④ 对应的情报文本数据对辅模型预测的信访概率产生负贡献。得到表8的数据之 后,将表8中的数据按照表3中的数据转化方式进行区间量化,得到标签①② 对应的事件次数、标签③④对应的事件次数和历史信访次数分别对应的区间量 化值,即第二训练数据集。
步骤203:基于同类型的结构化数据进行信访概率预测;
在本申请实施例中,辅模型选择特征的原理与主模型选择特征的原理相反, 辅模型生成的预测数据(信访概率)与主模型生成的预测数据不同,如步骤202 所述,辅模型在预测信访概率时,标签①②对应的情报文本数据对辅模型预测 的信访概率产生正贡献,标签③④对应的情报文本数据对辅模型预测的信访概 率产生负贡献,且由于辅模型相对于主模型起辅助作用,所以输出的数值是以 0%为中心值的“正贡献”或“负贡献”对应的百分数值,对主模型预测的信 访概率值做增减,从而达到主辅模型融合的效果。需要说明的是,若主模型预 测的信访概率值的范围若属于预设范围,例如,满足40%≤Score≥90%,则将辅模型的预测数据与主模型的预测数据融合,将融合数据作为最终预测的信 访概率输出,若主模型预测的信访概率值不属于预设范围,则不需要辅模型的 预测数据与主模型的预测数据融合,直接将主模型预测的数据作为最终预测的 信访概率输出。
在一些其它的实施例中,可以按照预设周期(例如是每10分钟)将最终 预测的信访概率发送给相关人员进行现场研判,相关人员根据真实情况反馈预 测结果是否准确,若预测结果准确,则每隔一段时间基于新增的现场反馈数据 迭代训练模型,若根据现场真实情况反馈预测结果不准确,则相关人员根据现 场真实情况给出正确的概率,每隔一段时间基于新增的现场反馈数据迭代训练 模型。
模型训练完成之后,可以基于该模型进行信访概率预测,并基于预测结果 进行人员管理。请参见图3所示,本申请实施例中的人员管理方法的流程描述 如下:
步骤301:获取目标对象基于时间序列的定位数据和交通出行数据;
其中,目标对象是管控人员中的任意一个对象,本申请实施例中获取目标 对象基于时间序列的定位数据和交通出行数据的方法与步骤101所述的方法相 同,在此不再赘述。
在本申请实施例中,获取的目标对象的基于时间序列的定位数据和交通出 行数据如表9所示:
Figure BDA0003407753010000191
表9
步骤302:根据定位数据和交通出行数据确定预设多个特征参数中每个特 征参数对应的特征值;
其中,预设多个特征参数包括异常轨迹类别(例如也可以称作是异常轨迹 的敏感等级),用于指示预设区域的敏感等级、预设事件最近一次发生的时刻 与当前时刻的间隔时长、预设事件在第一预设时长内出现的次数和最近一次定 位信号消失持续时长,所述预设事件包括出现在预设区域、购票、安检、目标 对象与其它管控对象同行和目标对象与其它管控对象聚集中的至少一种。“异 常轨迹的敏感等级”对应的特征值为表2所示的“异常轨迹类别数值”,预设 事件最近一次发生的时刻与当前时刻的间隔时长、预设事件在第一预设时长内 出现的次数和最近一次定位信号消失持续时长对应的特征值为表4所述的区间 量化值。
在本申请实施例中,可以将获取的基于时间序列的定位数据和交通出行数 据(即表9中的数据)与根据表2和表4进行比对,获得每个特征参数对应的 特征值。
步骤303:通过训练好的预测模型中的第一子模型基于每个特征参数对应 的特征值预测目标对象的第一信访概率;
获得每个特征参数对应的特征值之后,可以将每个参数对应的特征值输入 前述的主模型,通过主模型预测第一信访概率,例如,主模型基于表5的内容 确定每个特征值对应的分数(即前述的削减分值),通过第一预设值减去每个 特征值对应的特征分数,得到第一差值(即步骤103中的s),其中,第一预设 值为多个特征参数对应的全量分数集合中的最大值(即步骤103中每个特征中 最小值对应的特征进行全量组合后对应的风险分数,即max(S)),然后,确定 第一差值和第一预设值之间的第二差值,以及第一预设值和第二预设值之间的 第三差值,其中,第二预设值为多个特征参数对应的全量分数集合中的最小值 (即将所有特征值都按照最大削减分值进行削减之后的最低风险分数,即 min(S)),根据第二差值和第三差值之间的比值确定第一信访概率。
具体的,得到第一差值之后,将第一差值、第一预设值、第二预设值代入 公式(2),得到目标对象的第一信访概率。
步骤304:若第一信访概率大于第一预设阈值,则基于所述第一信访概率 生成第一管理指令。
其中,第一管理指令用于指示管理人员对目标对象采取管控措施,例如拦 截等措施。在本申请实施例中,若第一信访概率大于第一预设阈值(例如是大 于90%),则表明目标对象信访的概率非常高,此时需要管理人员对目标对象 进行管控,因此基于第一信访概率生成第一管理指令。
在一些其它的实施例中,若第一信访概率小于第二预设阈值(例如是小于 20%),则表明目标对象信访的概率非常低,此时不需要管理人员对目标对象 进行管控,因此可以基于第一信访概率生成用于指示管理人员对目标对象进行 观察的第二管理指令。
在一些其它的实施例中,若第一信访概率大于第二预设阈值且小于第一预 设阈值,则还需要获取目标对象的历史信访数据和情报文本数据,根据历史信 访数据和情报文本数据预测目标对象的第二信访概率。
具体的,通过训练好的语言模型对情报文本数据进行语义分析,并按照预 定义信访类别(即步骤202中所述的标签)对语义分析结果进行分类,确定第 二预设时长内(例如是半个月内)每个信访类别对应的事件次数,优选的,按 照标签①②和标签③④的组合形式确定每个组合对应的事件次数;以及根据历 史信访数据确定目标对象在第三预设时长内(例如是距今3个月内)的历史信 访次数,获取每个组合对应的事件次数和历史信访次数分别对应的区间量化值, 将每个组合对应的事件次数和历史信访次数分别对应的区间量化值输入辅模 型,通过辅模型预测第二信访概率。
在预测得到第一信访概率和第二信访概率之后,将第一信访概率和第二信 访概率进行融合,得到目标信访概率(即根据第一信访概率和第二信访概率确 定目标对象的目标信访概率),基于目标信访概率生成对应的管理指令(例如 是拦截或观察等管理指令)在一种可能的实施方式中,第一信访概率和第二信 访概率进行融合时,可以基于预设权重进行融合。
基于同一发明构思,本申请实施例提供了一种人员管理装置,该人员管理 装置能够实现前述的人员管理方法对应的功能。该人员管理装置可以是硬件结 构、软件模块、或硬件结构加软件模块。该人员管理装置可以由芯片系统实现, 芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。请参见图4所示, 该人员管理装置包括获取模块401、处理模块402和模型训练模块403。其中:
获取模块401,用于获取目标对象基于时间序列的定位数据和交通出行数 据;
处理模块402,用于根据所述定位数据和交通出行数据确定预设多个特征 参数中每个特征参数对应的特征值;其中,所述多个特征参数为对信访产生影 响的多个事件对应的参数;
所述处理模块402,还用于通过训练好的预测模型中的第一子模型基于所 述每个特征参数对应的特征值预测所述目标对象的第一信访概率;其中,所述 第一子模型为通过第一训练数据集对回归模型进行拟合得到的,所述第一训练 数据集包括所述多个特征参数中每个特征参数对应的多个特征值;
所述处理模块402,还用于在所述第一信访概率大于第一预设阈值时,基 于所述第一信访概率生成第一管理指令;其中,所述第一管理指令用于指示管 理人员对所述目标对象采取管控措施。
可选的,所述多个特征参数包括异常轨迹类别、预设事件最近一次发生的 时刻与当前时刻的间隔时长、所述预设事件在第一预设时长内出现的次数和最 近一次定位信号消失的持续时长,所述异常轨迹类别用于指示预设区域的敏感 等级,所述预设事件包括出现在所述预设区域、购票、安检、所述目标对象与 其它管控对象同行、所述目标对象与所述其它管控对象聚集和定位信号消失中 的至少一种。
可选的,所述处理模块402,具体用于:
确定每个特征值对应的特征分数;
通过第一预设值减去所述每个特征值对应的特征分数,得到第一差值;其 中,所述第一预设值为所述多个特征参数对应的全量分数集合中的最大值;
确定所述第一差值与所述第一预设值之间的第二差值,以及所述第一预设 值和第二预设值之间的第三差值;其中,所述第二预设值为所述全量分数集合 中的最小值;
根据所述第二差值和所述第三差值之间的比值预测所述第一信访概率。
可选的,所述处理模块402,还用于:
在所述第一信访概率小于第二预设阈值时,基于所述第一信访概率生成第 二管理指令;其中,所述第二预设阈值小于所述第一预设阈值,所述第二管理 指令用于指示所述管理人员对所述目标对象进行观察。
可选的,所述获取模块401,还用于:
在所述第一信访概率大于所述第二预设阈值且小于所述第一预设阈值时, 获取所述目标对象的历史信访数据和情报文本数据;其中,所述情报文本数据 为管理人员收集并记录的所述目标对象的行为的数据;
所述处理模块402,还用于:
根据所述历史信访数据和情报文本数据预测所述目标对象的第二信访概 率;
根据所述第一信访概率和所述第二信访概率确定所述目标对象的目标信 访概率,并基于所述目标信访概率生成管理指令。
可选的,所述处理模块402,具体用于:
通过训练好的语言模型对所述情报文本数据进行语义分析;
按照预定义信访类别对语义分析结果进行分类;其中,所述预定义信访类 别包括明确会信访、大概率会信访、小概率会信访、明确不会信访和信访无关 事件;
确定第二预设时长内每个信访类别对应的事件次数;
根据所述历史信访数据确定所述目标对象在第三预设时长内的历史信访 次数;
通过所述预测模型中的第二子模型基于所述每个信访类别对应的事件次 数和所述历史信访次数分别对应的特征值预测所述第二信访概率;其中,所述 第二子模型为通过第二训练数据集对所述回归模型进行拟合得到的,所述第二 训练数据集包括所述每个信访类别对应的事件次数和所述历史信访次数分别 对应的多个特征值。
可选的,所述人员管理装置还包括模型训练模块403,用于:
获取训练样本集;其中,所述训练样本集包括所有管控对象基于时间序列 的定位数据、交通出行数据、历史信访数据和情报文本数据;
基于所述训练样本集,分别统计所述所有管控对象中每个管控对象的时长 类别数据、次数类别数据和异常轨迹类别;其中,所述时长类别数据包括预设 事件中每个事件最近一次发生的时刻与当前时刻的间隔时长、最近一次定位信 号消失的持续时长,所述次数类别数据包括所述每个事件在第一预设时长内出 现的次数、第二预设时长内每个信访类别对应的事件次数和第三预设时长内的 历史信访次数;
对所述时长类别数据和次数类别数据按照预设规则进行区间量化,得到区 间量化值;
根据所述区间量化值和所述异常轨迹类别对应的特征值确定第一训练数 据集和第二训练数据集;
分别基于所述第一训练数据集和第二训练数据集对所述回归模型进行训 练,得到所述预测模型。
前述的人员管理方法的实施例涉及的各步骤的所有相关内容均可援引到 本申请施例中的人员管理装置所对应的功能模块的功能描述,在此不再赘述。
本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实 际实现时可以有另外的划分方式,另外,在本申请各个实施例中的各功能模块 可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上模 块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采 用软件功能模块的形式实现。
基于同一发明构思,本申请实施例提供一种电子设备。请参见图5所示, 该电子设备包括至少一个处理器501,以及与至少一个处理器连接的存储器502, 本申请实施例中不限定处理器501与存储器502之间的具体连接介质,图5中 是以处理器501和存储器502之间通过总线500连接为例,总线500在图5中 以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。 总线500可以分为地址总线、数据总线、控制总线等,为便于表示,图5中仅 用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
在本申请实施例中,存储器502存储有可被至少一个处理器501执行的指 令,至少一个处理器501通过执行存储器502存储的指令,可以执行前述的人 员管理方法中所包括的步骤。
其中,处理器501是电子设备的控制中心,可以利用各种接口和线路连接 整个电子设备的各个部分,通过运行或执行存储在存储器502内的指令以及调 用存储在存储器502内的数据,电子设备的各种功能和处理数据,从而对电子 设备进行整体监控。可选的,处理器501可包括一个或多个处理单元,处理器 501可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系 统和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调 制解调处理器也可以不集成到处理器501中。在一些实施例中,处理器501和 存储器502可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯 片上分别实现。
处理器501可以是通用处理器,例如中央处理器(CPU)、数字信号处理 器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者 晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各 方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。 结合本申请实施例所公开的人员管理方法的步骤可以直接体现为硬件处理器 执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器502作为一种非易失性计算机可读存储介质,可用于存储非易失性 软件程序、非易失性计算机可执行程序以及模块。存储器502可以包括至少一 种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机 访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可 编程只读存储器(Electrically Erasable Programmable Read-OnlyMemory, EEPROM)、磁性存储器、磁盘、光盘等等。存储器502是能够用于携带或存 储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其 他介质,但不限于此。本申请实施例中的存储器502还可以是电路或者其它任 意能够实现存储功能的装置,用于存储程序指令和/或数据。
通过对处理器501进行设计编程,可以将前述实施例中介绍的人员管理方 法所对应的代码固化到芯片内,从而使芯片在运行时能够执行前述的人员管理 方法的步骤,如何对处理器501进行设计编程为本领域技术人员所公知的技术, 这里不再赘述。
基于同一发明构思,本申请实施例还提供一种计算可读存储介质,该计算 可读存储介质存储有计算机指令,当该计算机指令在计算机上运行时,使得计 算机执行如前述的人员管理方法的步骤。
在一些可能的实施方式中,本申请提供的人员管理方法的各个方面还可以 实现为一种程序产品的形式,其包括程序代码,当程序产品在电子设备上运行 时,程序代码用于使该检测设备执行本说明书上述描述的根据本申请各种示例 性实施方式的人员管理方法中的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计 算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结 合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包 含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流 程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方 框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框 的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理 机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其 他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程 或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设 备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中 的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个 流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使 得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处 理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个 流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申 请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及 其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种人员管理方法,其特征在于,所述方法包括:
获取目标对象基于时间序列的定位数据和交通出行数据;
根据所述定位数据和交通出行数据确定预设多个特征参数中每个特征参数对应的特征值;其中,所述多个特征参数为对信访产生影响的多个事件对应的参数;
通过训练好的预测模型中的第一子模型基于所述每个特征参数对应的特征值预测所述目标对象的第一信访概率;其中,所述第一子模型为通过第一训练数据集对回归模型进行拟合得到的,所述第一训练数据集包括所述多个特征参数中每个特征参数对应的多个特征值;
若所述第一信访概率大于第一预设阈值,则基于所述第一信访概率生成第一管理指令;其中,所述第一管理指令用于指示管理人员对所述目标对象采取管控措施。
2.如权利要求1所述的方法,其特征在于,所述多个特征参数包括异常轨迹类别、预设事件最近一次发生的时刻与当前时刻的间隔时长、所述预设事件在第一预设时长内出现的次数和最近一次定位信号消失的持续时长,所述异常轨迹类别用于指示预设区域的敏感等级,所述预设事件包括出现在所述预设区域、购票、安检、所述目标对象与其它管控对象同行、所述目标对象与所述其它管控对象聚集和定位信号消失中的至少一种。
3.如权利要求1所述的方法,其特征在于,所述通过训练好的预测模型中的第一子模型基于所述每个特征参数对应的特征值预测所述目标对象的第一信访概率,包括:
确定每个特征值对应的特征分数;
通过第一预设值减去所述每个特征值对应的特征分数,得到第一差值;其中,所述第一预设值为所述多个特征参数对应的全量分数集合中的最大值;
确定所述第一差值与所述第一预设值之间的第二差值,以及所述第一预设值和第二预设值之间的第三差值;其中,所述第二预设值为所述全量分数集合中的最小值;
根据所述第二差值和所述第三差值之间的比值预测所述第一信访概率。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
若所述第一信访概率小于第二预设阈值,则基于所述第一信访概率生成第二管理指令;其中,所述第二预设阈值小于所述第一预设阈值,所述第二管理指令用于指示所述管理人员对所述目标对象进行观察。
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
若所述第一信访概率大于所述第二预设阈值且小于所述第一预设阈值,则获取所述目标对象的历史信访数据和情报文本数据;其中,所述情报文本数据为管理人员收集并记录的所述目标对象的行为的数据;
根据所述历史信访数据和情报文本数据预测所述目标对象的第二信访概率;
根据所述第一信访概率和所述第二信访概率确定所述目标对象的目标信访概率,并基于所述目标信访概率生成管理指令。
6.如权利要求5所述的方法,其特征在于,所述根据所述历史信访数据和情报文本数据预测所述目标对象的第二信访概率,包括:
通过训练好的语言模型对所述情报文本数据进行语义分析;
按照预定义信访类别对语义分析结果进行分类;其中,所述预定义信访类别包括明确会信访、大概率会信访、小概率会信访、明确不会信访和信访无关事件;
确定第二预设时长内每个信访类别对应的事件次数;
根据所述历史信访数据确定所述目标对象在第三预设时长内的历史信访次数;
通过所述预测模型中的第二子模型基于所述每个信访类别对应的事件次数和所述历史信访次数分别对应的特征值预测所述第二信访概率;其中,所述第二子模型为通过第二训练数据集对所述回归模型进行拟合得到的,所述第二训练数据集包括所述每个信访类别对应的事件次数和所述历史信访次数分别对应的多个特征值。
7.如权利要求1-6任一项所述的方法,其特征在于,所述预测模型通过以下方式获得:
获取训练样本集;其中,所述训练样本集包括所有管控对象基于时间序列的定位数据、交通出行数据、历史信访数据和情报文本数据;
基于所述训练样本集,分别统计所述所有管控对象中每个管控对象的时长类别数据、次数类别数据和异常轨迹类别;其中,所述时长类别数据包括预设事件中每个事件最近一次发生的时刻与当前时刻的间隔时长、最近一次定位信号消失的持续时长,所述次数类别数据包括所述每个事件在第一预设时长内出现的次数、第二预设时长内每个信访类别对应的事件次数和第三预设时长内的历史信访次数;
对所述时长类别数据和次数类别数据按照预设规则进行区间量化,得到区间量化值;
根据所述区间量化值和所述异常轨迹类别对应的特征值确定第一训练数据集和第二训练数据集;
分别基于所述第一训练数据集和第二训练数据集对所述回归模型进行训练,得到所述预测模型。
8.一种人员管理装置,其特征在于,所述装置包括:
获取模块,用于获取目标对象基于时间序列的定位数据和交通出行数据;
处理模块,用于根据所述定位数据和交通出行数据确定预设多个特征参数中每个特征参数对应的特征值;其中,所述多个特征参数为对信访产生影响的多个事件对应的参数;
所述处理模块,还用于通过训练好的预测模型中的第一子模型基于所述每个特征参数对应的特征值预测所述目标对象的第一信访概率;其中,所述第一子模型为通过第一训练数据集对回归模型进行拟合得到的,所述第一训练数据集包括所述多个特征参数中每个特征参数对应的多个特征值;
所述处理模块,还用于在所述第一信访概率大于第一预设阈值时,基于所述第一信访概率生成第一管理指令;其中,所述第一管理指令用于指示管理人员对所述目标对象采取管控措施。
9.一种电子设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行权利要求1-7任一项所述的方法包括的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时,使所述计算机执行如权利要求1-7任一项所述的方法。
CN202111521764.1A 2021-12-13 2021-12-13 一种人员管理方法、装置、电子设备及存储介质 Pending CN114418175A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111521764.1A CN114418175A (zh) 2021-12-13 2021-12-13 一种人员管理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111521764.1A CN114418175A (zh) 2021-12-13 2021-12-13 一种人员管理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114418175A true CN114418175A (zh) 2022-04-29

Family

ID=81264621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111521764.1A Pending CN114418175A (zh) 2021-12-13 2021-12-13 一种人员管理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114418175A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114637884A (zh) * 2022-05-16 2022-06-17 深圳前海中电慧安科技有限公司 一种电像计算时空轨迹与道路网的匹配方法、装置及设备
CN115345390A (zh) * 2022-10-19 2022-11-15 武汉大数据产业发展有限公司 一种行为轨迹预测方法、装置、电子设备及存储介质
CN116089808A (zh) * 2023-02-06 2023-05-09 迪爱斯信息技术股份有限公司 一种特征选择方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114637884A (zh) * 2022-05-16 2022-06-17 深圳前海中电慧安科技有限公司 一种电像计算时空轨迹与道路网的匹配方法、装置及设备
CN114637884B (zh) * 2022-05-16 2022-08-23 深圳前海中电慧安科技有限公司 一种电像计算时空轨迹与道路网的匹配方法、装置及设备
CN115345390A (zh) * 2022-10-19 2022-11-15 武汉大数据产业发展有限公司 一种行为轨迹预测方法、装置、电子设备及存储介质
CN116089808A (zh) * 2023-02-06 2023-05-09 迪爱斯信息技术股份有限公司 一种特征选择方法及装置

Similar Documents

Publication Publication Date Title
Kuang et al. Predicting duration of traffic accidents based on cost-sensitive Bayesian network and weighted K-nearest neighbor
Yu et al. Probabilistic prediction of bus headway using relevance vector machine regression
CN114418175A (zh) 一种人员管理方法、装置、电子设备及存储介质
CN109492945A (zh) 企业风险识别监控方法、装置、设备及存储介质
US20210192586A1 (en) Systems and Methods for Detecting and Responding to Anomalous Traffic Conditions
CN110417721A (zh) 安全风险评估方法、装置、设备及计算机可读存储介质
Nguyen et al. Automatic classification of traffic incident's severity using machine learning approaches
Shashaani et al. Multi-stage prediction for zero-inflated hurricane induced power outages
CN104050361A (zh) 一种监狱服刑人员危险性倾向的智能分析预警方法
CN109615280A (zh) 员工数据处理方法、装置、计算机设备和存储介质
CN108647743A (zh) 驾驶人安全画像系统
Gore et al. Congestion index and reliability-based freeway level of service
Saha et al. Deep learning approach for predictive analytics to support diversion during freeway incidents
CN111160959A (zh) 一种用户点击转化预估方法及装置
Sun et al. Financial distress prediction based on similarity weighted voting CBR
CN113706291A (zh) 欺诈风险预测方法、装置、设备及存储介质
CN112990989B (zh) 价值预测模型输入数据生成方法、装置、设备和介质
KR102423530B1 (ko) 정형/비정형 이벤트의 시간-인과관계 모델링을 통한 부동산시장의 가격변동 예측방법
Lao et al. Fuzzy logic–based mapping algorithm for improving animal-vehicle collision data
Rodríguez-Rueda et al. Origin–Destination matrix estimation and prediction from socioeconomic variables using automatic feature selection procedure-based machine learning model
CN115034686A (zh) 作业行为量化方法、装置、计算机设备和存储介质
Castro et al. Predicting Crime by Exploiting Supervised Learning on Heterogeneous Data.
Xu et al. Tcpmodel: A short-term traffic congestion prediction model based on deep learning
Lin et al. Analysis and Prediction of Overloaded Extra‐Heavy Vehicles for Highway Safety Using Machine Learning
CN112163964A (zh) 风险预测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination