CN112016769B - 管理相对人风险预测以及信息推荐方法及装置 - Google Patents

管理相对人风险预测以及信息推荐方法及装置 Download PDF

Info

Publication number
CN112016769B
CN112016769B CN202011114719.XA CN202011114719A CN112016769B CN 112016769 B CN112016769 B CN 112016769B CN 202011114719 A CN202011114719 A CN 202011114719A CN 112016769 B CN112016769 B CN 112016769B
Authority
CN
China
Prior art keywords
data
risk
case
management
risk case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011114719.XA
Other languages
English (en)
Other versions
CN112016769A (zh
Inventor
王锡辉
房学
苏巧运
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mengtianmen Technology Co ltd
Original Assignee
Beijing Mengtianmen Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mengtianmen Technology Co ltd filed Critical Beijing Mengtianmen Technology Co ltd
Priority to CN202011114719.XA priority Critical patent/CN112016769B/zh
Publication of CN112016769A publication Critical patent/CN112016769A/zh
Application granted granted Critical
Publication of CN112016769B publication Critical patent/CN112016769B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

本发明实施例提供一种管理相对人风险预测以及信息推荐方法,包括:获取管理相对人信息数据,建立用户画像;根据用户画像以及聚类算法建立用户群组画像;根据用户画像预测管理相对人发生风险案件的类型和概率;获取风险案例信息数据,并获取包含用于表征所述风险案例信息的内容属性的标签集合;根据用户画像,从风险案例信息数据中确定与管理相对人相匹配的目标风险案例信息,进行个性化案例推荐;根据用户群组画像,从风险案例信息数据中确定与管理相对人群组相匹配的目标风险案例信息,进行群体化案例推荐。该方法通过建立用户画像以及用户群组画像,预测管理相对人发生风险按件的类型及风险,并实现信息的精准推荐,并极大的提高了监管效率。

Description

管理相对人风险预测以及信息推荐方法及装置
技术领域
本发明涉及执法监管领域,尤其是涉及一种管理相对人风险预测以及信息推荐方法及装置。
背景技术
在监管过程中可分为行政主体和管理相对人,行政主体是执行行政管理的机关、单位等,管理相对人是指在监管过程中被管理一方的当事人,包括公民、法人和其他组织。行政主体对管理相对人监管的根本目的在于消除风险隐患,保障企业能够正常经营,保证企业为其服务用户提供安全合法的服务。在监管过程中,除了对相对人进行监督排查外,还需要对相对人进行风险预警和管理,降低相对人发生风险的可能性。因此对管理相对人发生风险案件的概率预测及有效预防成为亟需解决的问题。
目前对于相对人的风险发生概率预测方法还不成熟,主要分为主观概率估计和客观概率估计。在主观概率估计中,多依赖于个人经验、知识、类似事件对比等,通过主观判断估算风险发生的概率。主观概率多由熟悉该风险因素的现状和发展趋势的专家组成小组进行估计,并经过多次讨论才能产生合理的意见,所以对于经济和时间上的消耗较多,且无法做到实时性。在客观概率估计中,多根据实际发生概率,通过对历史统计数据分析以及实验来确定。其方法主要通过将主事件分解为多个子事件,通过计算子事件发生的概率得到主事件的概率。但是这种方法对数据量的要求较高,依赖足够的信息,若数据不可得,则易产生数据稀疏或冷启动问题。
针对上述方法中的不足,本项目根据目前企业风险监管情况,借助大数据和人工智能中的关键技术,提出一种管理相对人风险预测以及信息推荐方法及装置。通过构建管理相对人的画像,提高对管理相对人的了解程度,发现管理相对人的特征及活动特性,挖掘管理相对人产生风险案件的影响因素,并能够预测风险案件发生的概率和发展动向,并为管理相对人推荐科学的防范措施,降低风险案件发生的可能性。
发明内容
本发明的目的在于改变现有的监管管理相对人方法中的不足,提供了一种管理相对人风险预测以及信息推荐方法及装置。
一方面,本发明实施例提供了一种管理相对人风险预测以及信息推荐方法,包括:
获取管理相对人信息数据,建立管理相对人的用户画像;
根据用户画像以及聚类算法建立管理相对人群组的用户群组画像;
根据用户画像预测管理相对人发生风险案件的类型和概率;
获取风险案例信息数据,并获取包含用于表征所述风险案例信息的内容属性的标签集合;
根据用户画像,从风险案例信息数据中确定与管理相对人相匹配的目标风险案例信息,进行个性化案例推荐;
根据用户群组画像,从风险案例信息数据中确定与管理相对人群组相匹配的目标风险案例信息,进行群体化案例推荐。
进一步地,管理相对人信息数据包括管理相对人的基本信息数据,管理相对人活动数据,监管调查数据,以及相关风险案件数据。
进一步地,建立管理相对人用户画像,具体包括:
将管理相对人信息数据进行查询和数据清洗,并获取管理相对人的静态画像,静态画像包括管理相对人的基本信息数据;
根据管理相对人的基本信息数据,管理相对人活动数据,监管调查数据和相关风险案件数据的数据特征以及回归预测算法,获得用户的动态画像。
进一步地,根据管理相对人的基本信息数据,管理相对人活动数据,监管调查数据和相关风险案件数据的数据特征以及回归预测算法,获得用户的动态画像,具体包括:
分别将管理相对人的基本信息数据标记为用户属性类标签,将管理相对人活动数据标记为行为类标签,将监管调查数据标记为监管类标签,以及将相关风险案件数据标记为风险类标签;
针对上述数据进行特征提取,采用回归预测算法分别计算用户属性类标签,行为类标签以及监管类标签对应风险类标签的相关权重。
进一步地,根据用户画像预测管理相对人发生风险案件的类型和概率,具体包括:
确定相关风险案件数据中各类型风险案件的案发时间,案发地点,案发天气以及案发数量以及案发频率;
确定管理相对人活动数据,包括活动时间,活动轨迹以及天气;
确定不同类型风险案件之间的关联关系;
针对上述数据进行特征提取,并根据所述用户画像,采用机器学习算法预测风险案件发生的类型和概率。
进一步地,根据用户画像,从风险案例信息数据中确定与管理相对人相匹配的目标风险案例信息,进行个性化案例推荐,具体包括:
确定用户画像对应的风险案件的类型与标签集合的第一相似度;
根据第一相似度,从风险案例信息数据中确定与管理相对人相匹配的目标风险案例信息;
选择第一相似度高于第一阈值的目标风险案例信息,进行个性化案例推荐。
进一步地,根据用户群组画像,从风险案例信息数据中确定与管理相对人群组相匹配的目标风险案例信息,进行群体化案例推荐,具体包括:
确定用户群组画像对应的风险案件的类型与标签集合的第二相似度;
根据第二相似度,从风险案例信息数据中确定与管理相对人群组相匹配的目标风险案例信息;
选择第二相似度高于第二阈值的目标风险案例信息,进行群体化案例推荐。
另一方面,本发明实施例还提供了一种管理相对人风险预测以及信息推荐装置,包括:
第一数据获取模块,用于获取管理相对人信息数据,建立管理相对人的用户画像;
分类处理模块,用于根据用户画像以及聚类算法建立管理相对人群组的用户群组画像;
预测处理模块,用于根据用户画像预测管理相对人发生风险案件的类型,概率以及行为走向;
第二数据获取模块,用于获取风险案例信息数据,并获取包含用于表征风险案例信息的内容属性的标签集合;
个性化推荐模块,用于根据用户画像,从风险案例信息数据中确定与管理相对人相匹配的目标风险案例信息,进行个性化案例推荐;
群体化推荐模块,用于根据用户群组画像,从风险案例信息数据中确定与管理相对人群组相匹配的目标风险案例信息,进行群体化案例推荐。
另一方面,本发明实施例还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述各方面的管理相对人风险预测以及信息推荐方法的步骤。
另一方面,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序包括程序指令,当程序指令被处理器执行时,执行上述各方面的管理相对人风险预测以及信息推荐方法的步骤。
上述技术方案具有如下有益效果:本发明提出的管理相对人风险预测以及信息推荐方法及装置,分别构建管理相对人的个人画像以及群组画像,能够多维度的对管理相对人进行分析,根据管理相对人活动特性,挖掘管理相对人产生风险案件的影响因素,预测风险案件发生的概率和发展动向,并实现个性化推荐与群组推荐,有针对性地推荐内容,有效的降低风险案件发生的可能性,大大提高了监管效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是示出根据本发明一个实施例的管理相对人风险预测以及信息推荐方法的流程图;
图2是示出根据本发明一个实施例的管理相对人风险预测以及信息推荐装置的示意图;
图3是示出根据本发明一个实施例的一种计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了更好地理解本发明,下面结合图1至图3对本发明实施例提供的管理相对人风险预测以及信息推荐方法及装置进行详细描述。应注意,这些实施例并不是用来限制本发明公开的范围。
本发明提供了一种医疗废弃物在线监控与预测方法,如图1所示,图1为本发明实施例提供的管理相对人风险预测以及信息推荐方法的流程图,该方法具体可以包括:
步骤S101:获取管理相对人信息数据,建立管理相对人的用户画像。其中,管理相对人信息数据可以包括管理相对人的基本信息数据,管理相对人活动数据,监管调查数据,以及相关风险案件数据。
可选的,在本方案中,步骤S101具体可以包括:
将管理相对人信息数据进行查询和数据清洗,并获取管理相对人的静态画像,静态画像包括管理相对人的基本信息数据。具体地,可以根据内容的需要,对数据集的不同要素、类型、大小按照一定标准或规则进行处理。例如为了丰富数据内容,可以合并数据集和记录,或导出新的属性;为去除数据噪声,删除或替换空白值或缺失值;为训练优化预测和推荐算法,选择数据子集样本,对数据进行排序保留其序列性,分为训练和测试数据集等。
根据管理相对人的基本信息数据,管理相对人活动数据,监管调查数据和相关风险案件数据的数据特征以及回归预测算法,获得用户的动态画像。
可选地,获得用户的动态画像具体可以包括:
分别将所述管理相对人的基本信息数据标记为用户属性类标签,将所述管理相对人活动数据标记为行为类标签,将所述监管调查数据标记为监管类标签,将所述相关风险案件数据标记为风险类标签。具体地:用户属性标签可以包括性别,年龄,户籍以及职业;行为标签可以包括管理相对人活动时间,活动地点以及活动轨迹;监管标签可以包括处罚类型,处罚次数;风险标签可以包括案件类型,案发时间,案发地点,案发天气,不同类型所述风险案件案发数量以及案发频率。
针对上述数据进行特征提取,采用回归预测算法分别计算用户属性类标签,行为类标签以及监管类标签对应风险类标签的相关权重。具体地,获取样本数据,可以包括管理相对人的基本信息数据,管理相对人活动数据,监管调查数据,以及样本数据对应的预测数据,可以包括相关风险案件数据,根据所获取的数据对预设回归预测模型进行训练,由预设回归预测模型学习样本数据与相关风险案件数据的对应关系,得到样本数据中各类标签数据的权重。
可选的,回归预测算法可以为多元线性回归预测算法,具体可以为FM(factorization machine,因子分解机)算法。
具体可以包括:
(1)根据提取的特征数据,进行数据预处理,主要包括数据清洗、数据统计以及数据标注等工作。
(2)划分训练集和测试集,利用训练数据进行FM模型训练,将测试集的预测结果和实际结果进行比较。具体地,通过对FM模型训练及测试,得到描述管理相对人用户画像所对应的各类标签的相关权重,并得到各类标签数据特征之间的相关性,以及各类标签数据输入FM模型后得到对应风险类标签以及评分,为后续预测及推荐提供数据基础。
(3)训练过程采用均方误差MSE作为模型的性能度量,根据均方误差MSE进行参数调节,经过多次迭代得到相对较优的模型参数。
(4)对预测结果进行评估,以均方误差MSE值作为评估系数,其MSE值越小,模型拟合效果越好。
(5)进行线上测试,根据测试结果进行相应的调整。
步骤S102:根据用户画像以及聚类算法建立管理相对人群组的用户群组画像。
具体地,根据用户画像所描述的对应的相关风险案件数据,对管理相对人进行分类,根据不同类型将管理相对人分成若干管理相对人群组。可以根据相关风险案件数据所包括的风险案件类型和/或案发概率作为分类特征进行分类,所述聚类算法可以为K-MEANS分类算法。
步骤S103:根据用户画像预测管理相对人发生风险案件的类型和概率。
可选的,在本方案中,步骤S103具体可以包括:
确定相关风险案件数据中各类型风险案件的案发时间,案发地点,案发天气以及案发数量以及案发频率。
确定管理相对人活动数据,包括活动时间,活动轨迹以及天气。具体的,可对管理相对人的行为活动进行定期监察,并更新数据,也可以实时监控管理相对人的行为活动,并实时获取管理相对人活动数据。
确定不同类型风险案件之间的关联关系。具体的,通过计算各类型风险案件之间的相关系数确定不同类型风险按件的相关性。
针对上述数据进行特征提取,并根据所述用户画像,采用预设的机器学习算法预测风险案件发生的类型和概率。具体地,针对风险按件发生的类型以及概率,可以通过用户画像以及管理相对人当前的行为数据,确定的对应风险类标签以及评分可以预测管理相对人可能发生的风险案件类型,并通过将所求得的评分归一化,再求取百分数,得到管理相对人对应各类型风险案件的概率。
还可以针对案发数量以及案发频率,可通过回归预测算法利用历史数据,分别从时间周期性,地域性等方面预测各类型风险案件的分布趋势,并作为预测管理相对人行为走向的参考因素。可选的,回归预测算法可以为LR(Logistic Regression,逻辑回归)。
确定各类型风险案件的数据特征,包括案发时间,案发地点,案发天气,区域分布以及案发频率,各类型风险案件之间的关系性,并根据管理相对人当前的行为数据的数据特征,通过预设的机器学习算法预测管理相对人对应各类型风险案件发生的概率。
可选的,机器学习算法可以为GBDT算法。
具体可以包括:
(1)根据提取的特征数据,进行数据预处理,主要包括数据清洗、数据统计以及数据标注等工作。
(2)采用单特征训练进行特征选择,选择影响较大的特征进行模型训练。
(3)划分验证集,训练模型,先以默认参数进行模型训练,再采用网格搜索法对模型超参数进行调节,迭代训练得到相对较优的模型。
(4)模型验证,以决定系数R2和均方误差MSE值作为模型评估系数,并利用验证集进行模型验证,其中R2值越大,MSE值越小,模型拟合效果越好;
(5)进行线上测试,根据测试结果进行相应的调整。
步骤S104:获取风险案例信息数据,并获取包含用于表征风险案例信息的内容属性的标签集合。
步骤S105:根据用户画像,从风险案例信息数据中确定与管理相对人相匹配的目标风险案例信息,进行个性化案例推荐。
可选的,在本方案中,步骤S105具体可以包括:
确定用户画像对应的风险案件的类型与标签集合的第一相似度。
具体地,第一相似度可以通过如下公式(1)计算:
Figure 721417DEST_PATH_IMAGE001
(1)
其中,w 1ij 为用户画像对应的风险案件的类型标签i与标签集合的中的内容标签j的第一相似度,|N(i)|为包含类型标签i的案例数,|N(j)|为包含内容标签j的案例数, |N(i)∩N(j)|为同时包含类型标签i和内容标签j的案例数。
根据第一相似度,从风险案例信息数据中确定与管理相对人相匹配的目标风险案例信息。
选择第一相似度高于第一阈值的目标风险案例信息,进行个性化案例推荐。具体地,可以将计算得到的第一相似度由高到低进行排序,并生成推荐列表,将相似度最高的目标风险案例信息进行优先个性化推荐。
具体地,生成推荐列表可以通过如下公式(2)计算:
Figure 966453DEST_PATH_IMAGE002
(2)
其中,P 1ui 为风险案例u包含类型标签i的可能性,|N(u)|为风险案例u包含内容标签j的标签集合,S 1(j,k)为和内容标签j最相似的k个标签集合(i是这个集合中的某一个类型标签),w 1ij 为用户画像对应的风险案件的类型标签i与标签集合的中的内容标签j的第一相似度, r uj为风险案例u包含内容标签j的可能性。可选的,r uj为可以简化为1。
可以通过对P 1ui 进行由高到低的排序,将相似度最高的目标风险案例信息进行优先个性化推荐。
步骤S106:根据用户群组画像,从风险案例信息数据中确定与管理相对人群组相匹配的目标风险案例信息,进行群体化案例推荐。
可选的,在本方案中,步骤S106具体可以包括:
确定用户群组画像对应的风险案件的类型与标签集合的第二相似度。
具体地,第二相似度可以通过如下公式(3)计算:
Figure 74086DEST_PATH_IMAGE003
(3)
其中,w 2ij 为用户群组画像对应的风险案件的类型标签f与标签集合的中的内容标签j的第二相似度,|N(f)|为包含类型标签f的案例数,|N(f)∩N(j)|为同时包含类型标签f和内容标签j的案例数。
根据第二相似度,从风险案例信息数据中确定与管理相对人群组相匹配的目标风险案例信息。
选择第二相似度高于第二阈值的目标风险案例信息,进行群体化案例推荐。具体地,可以将计算得到的第二相似度由高到低进行排序,并生成推荐列表,将相似度最高的目标风险案例信息进行优先群体化推荐。
具体地,生成推荐列表可以通过如下公式(4)计算:
Figure 797192DEST_PATH_IMAGE004
(4)
其中,P 2uf 为风险案例u包含类型标签f的可能性, S2(j,k)为和内容标签j最相似的k个标签集合(f是这个集合中的某一个类型标签),w 2fj 为用户群组画像对应的风险案件的类型标签f与标签集合的中的内容标签j的第二相似度。
可以通过对P 2uf 进行由高到低的排序,将相似度最高的目标风险案例信息进行优先个性化推荐。
参见图2,本发明还提供了一种管理相对人风险预测以及信息推荐装置1,包括:
第一数据获取模块10,用于获取管理相对人信息数据,建立管理相对人的用户画像;
分类处理模块20,用于根据所述用户画像以及聚类算法建立管理相对人群组的用户群组画像;
预测处理模块30,用于根据所述用户画像预测所述管理相对人发生风险案件的类型,概率以及行为走向;
第二数据获取模块40,用于获取风险案例信息数据,并获取包含用于表征所述风险案例信息的内容属性的标签集合;
个性化推荐模块50,用于根据所述用户画像,从所述风险案例信息数据中确定与所述管理相对人相匹配的目标风险案例信息,进行个性化案例推荐;
群体化推荐模块60,用于根据所述用户群组画像,从所述风险案例信息数据中确定与所述管理相对人群组相匹配的目标风险案例信息,进行群体化案例推荐。
根据本发明实施例的管理相对人风险预测以及信息推荐方法及装置,通过建立管理相对人用户画像以及用户群组画像,能够精准的推算出管理相对人对应各类型风险案件的潜在风险,并针对管理相对人监控的行为数据,有效的预测管理相对人发生风险案件的类型及概率,并针对各种类型的风险案件,分别进行个性化推送以及群体化推送相关案例信息,在有效的降低风险案件发生的同时,也提高了监管的效率。
参见图3,是本申请实施例提供的一种计算机设备的结构示意图。如图3所示,该计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口 1003可以包括显示屏 (Dis play)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1004可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图3所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在如图3所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取管理相对人信息数据,建立管理相对人的用户画像;
根据用户画像以及聚类算法建立管理相对人群组的用户群组画像;
根据用户画像预测管理相对人发生风险案件的类型和概率;
获取风险案例信息数据,并获取包含用于表征所述风险案例信息的内容属性的标签集合;
根据用户画像,从风险案例信息数据中确定与管理相对人相匹配的目标风险案例信息,进行个性化案例推荐;
根据用户群组画像,从风险案例信息数据中确定与管理相对人群组相匹配的目标风险案例信息,进行群体化案例推荐。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图1所对应实施例中对管理相对人风险预测以及信息推荐方法的描述,也可执行前文图2所对应实施例中对管理相对人风险预测以及信息推荐装置1的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且计算机可读存储介质中存储有前文提及的管理相对人风险预测以及信息推荐装置1所执行的计算机程序,且计算机程序包括程序指令,当处理器执行程序指令时,能够执行前文图1所对应实施例中对管理相对人风险预测以及信息推荐方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。作为示例,程序指令可被部署在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行,分布在多个地点且通过通信网络互连的多个计算设备可以组成区块链系统。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储存储器(Read-Only Memory,ROM)或随机存储存储器(Random Access Memory,
RAM)等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包括在本发明的保护范围之内。

Claims (4)

1.一种管理相对人风险预测以及信息推荐方法,其特征在于,所述方法包括:
获取管理相对人信息数据,建立管理相对人的用户画像;
其中,所述管理相对人信息数据,具体包括所述管理相对人的基本信息数据,管理相对人活动数据,监管调查数据,以及相关风险案件数据;
其中,所述建立管理相对人用户画像,具体包括:
将所述管理相对人信息数据进行查询和数据清洗,并获取管理相对人的静态画像,所述静态画像包括所述管理相对人的基本信息数据;
根据所述管理相对人的基本信息数据,所述管理相对人活动数据,所述监管调查数据,和所述相关风险案件数据的数据特征以及回归预测算法,获得用户的动态画像;具体包括:
分别将所述管理相对人的基本信息数据标记为用户属性类标签,将所述管理相对人活动数据标记为行为类标签,将所述监管调查数据标记为监管类标签,将所述相关风险案件数据标记为风险类标签;
针对上述数据进行特征提取,采用所述回归预测算法分别计算所述用户属性类标签,所述行为类标签以及所述监管类标签对应所述风险类标签的相关权重;其中,回归预测算法包括多元线性回归预测算法,具体可以为因子分解机FM算法;具体包括:
根据提取的特征数据,进行数据预处理,主要包括数据清洗、数据统计以及数据标注工作;
划分训练集和测试集,利用训练数据进行FM模型训练,将测试集的预测结果和实际结果进行比较;具体地,通过对FM模型训练及测试,得到描述管理相对人用户画像所对应的各类标签的相关权重,并得到各类标签数据特征之间的相关性,以及各类标签数据输入FM模型后得到对应风险类标签以及评分,为后续预测及推荐提供数据基础;
训练过程采用均方误差MSE作为模型的性能度量,根据均方误差MSE进行参数调节,经过多次迭代得到相对较优的模型参数;
对预测结果进行评估,以均方误差MSE值作为评估系数,其MSE值越小,模型拟合效果越好;
进行线上测试,根据测试结果进行相应的调整;
根据所述用户画像以及聚类算法建立管理相对人群组的用户群组画像;具体包括:
根据用户画像所描述的对应的相关风险案件数据,对管理相对人进行分类,根据不同类型将管理相对人分成若干管理相对人群组;根据相关风险案件数据所包括的风险案件类型和/或案发概率作为分类特征进行分类,聚类算法为K-MEANS分类算法;
根据所述用户画像预测所述管理相对人发生风险案件的类型和概率;具体包括:
确定所述相关风险案件数据中各类型所述风险案件的案发时间,案发地点,案发天气以及案发数量以及案发频率;
确定所述管理相对人活动数据,包括活动时间,活动轨迹以及天气;
确定不同类型所述风险案件之间的关联关系;
针对上述数据进行特征提取,并根据所述用户画像,采用机器学习算法预测所述风险案件发生的类型和概率;具体包括:
针对风险案件发生的类型以及概率,通过用户画像以及管理相对人当前的行为数据,确定的对应风险类标签以及评分预测管理相对人可能发生的风险案件类型,并通过将所求得的评分归一化,再求取百分数,得到管理相对人对应各类型风险案件的概率;
针对案发数量以及案发频率,通过回归预测算法利用历史数据,分别从时间周期性,地域性方面预测各类型风险案件的分布趋势,并作为预测管理相对人行为走向的参考因素;其中,回归预测算法可以为逻辑回归LR算法;
确定各类型风险案件的数据特征,包括案发时间,案发地点,案发天气,区域分布以及案发频率,各类型风险案件之间的关系性,并根据管理相对人当前的行为数据的数据特征,通过预设的机器学习算法预测管理相对人对应各类型风险案件发生的概率;
其中,机器学习算法包括GBDT算法;具体包括:
根据提取的特征数据,进行数据预处理,主要包括数据清洗、数据统计以及数据标注工作;
采用单特征训练进行特征选择,选择影响较大的特征进行模型训练;
划分验证集,训练模型,先以默认参数进行模型训练,再采用网格搜索法对模型超参数进行调节,迭代训练得到相对较优的模型;
模型验证,以决定系数R2和均方误差MSE值作为模型评估系数,并利用验证集进行模型验证,其中R2值越大,MSE值越小,模型拟合效果越好;
进行线上测试,根据测试结果进行相应的调整;
获取风险案例信息数据,并获取包含用于表征所述风险案例信息的内容属性的标签集合;
根据所述用户画像,从所述风险案例信息数据中确定与所述管理相对人相匹配的目标风险案例信息,进行个性化案例推荐;具体包括:
确定所述用户画像对应的所述风险案件的类型与所述标签集合的第一相似度;
根据所述第一相似度,从所述风险案例信息数据中确定与所述管理相对人相匹配的目标风险案例信息;
选择所述第一相似度高于第一阈值的所述目标风险案例信息,进行个性化案例推荐;
根据所述用户群组画像,从所述风险案例信息数据中确定与所述管理相对人群组相匹配的目标风险案例信息,进行群体化案例推荐;具体包括:
确定所述用户群组画像对应的所述风险案件的类型与所述标签集合的第二相似度;
根据所述第二相似度,从所述风险案例信息数据中确定与所述管理相对人群组相匹配的目标风险案例信息;
选择所述第二相似度高于第二阈值的所述目标风险案例信息,进行群体化案例推荐。
2.一种管理相对人风险预测以及信息推荐装置,其特征在于,所述装置包括:
第一数据获取模块,用于获取管理相对人信息数据,建立管理相对人的用户画像;
其中,所述管理相对人信息数据,具体包括所述管理相对人的基本信息数据,管理相对人活动数据,监管调查数据,以及相关风险案件数据;
其中,所述建立管理相对人用户画像,具体包括:
将所述管理相对人信息数据进行查询和数据清洗,并获取管理相对人的静态画像,所述静态画像包括所述管理相对人的基本信息数据;
根据所述管理相对人的基本信息数据,所述管理相对人活动数据,所述监管调查数据,和所述相关风险案件数据的数据特征以及回归预测算法,获得用户的动态画像;具体包括:
分别将所述管理相对人的基本信息数据标记为用户属性类标签,将所述管理相对人活动数据标记为行为类标签,将所述监管调查数据标记为监管类标签,将所述相关风险案件数据标记为风险类标签;
针对上述数据进行特征提取,采用所述回归预测算法分别计算所述用户属性类标签,所述行为类标签以及所述监管类标签对应所述风险类标签的相关权重;其中,回归预测算法包括多元线性回归预测算法,具体可以为因子分解机FM算法;具体包括:
根据提取的特征数据,进行数据预处理,主要包括数据清洗、数据统计以及数据标注工作;
划分训练集和测试集,利用训练数据进行FM模型训练,将测试集的预测结果和实际结果进行比较;具体地,通过对FM模型训练及测试,得到描述管理相对人用户画像所对应的各类标签的相关权重,并得到各类标签数据特征之间的相关性,以及各类标签数据输入FM模型后得到对应风险类标签以及评分,为后续预测及推荐提供数据基础;
训练过程采用均方误差MSE作为模型的性能度量,根据均方误差MSE进行参数调节,经过多次迭代得到相对较优的模型参数;
对预测结果进行评估,以均方误差MSE值作为评估系数,其MSE值越小,模型拟合效果越好;
进行线上测试,根据测试结果进行相应的调整;
分类处理模块,用于根据所述用户画像以及聚类算法建立管理相对人群组的用户群组画像;具体包括:
根据用户画像所描述的对应的相关风险案件数据,对管理相对人进行分类,根据不同类型将管理相对人分成若干管理相对人群组;根据相关风险案件数据所包括的风险案件类型和/或案发概率作为分类特征进行分类,聚类算法为K-MEANS分类算法;
预测处理模块,用于根据所述用户画像预测所述管理相对人发生风险案件的类型和概率;具体包括:
确定所述相关风险案件数据中各类型所述风险案件的案发时间,案发地点,案发天气以及案发数量以及案发频率;
确定所述管理相对人活动数据,包括活动时间,活动轨迹以及天气;
确定不同类型所述风险案件之间的关联关系;
针对上述数据进行特征提取,并根据所述用户画像,采用机器学习算法预测所述风险案件发生的类型和概率;具体包括:
针对风险案件发生的类型以及概率,通过用户画像以及管理相对人当前的行为数据,确定的对应风险类标签以及评分预测管理相对人可能发生的风险案件类型,并通过将所求得的评分归一化,再求取百分数,得到管理相对人对应各类型风险案件的概率;
针对案发数量以及案发频率,通过回归预测算法利用历史数据,分别从时间周期性,地域性方面预测各类型风险案件的分布趋势,并作为预测管理相对人行为走向的参考因素;其中,回归预测算法可以为逻辑回归LR算法;
确定各类型风险案件的数据特征,包括案发时间,案发地点,案发天气,区域分布以及案发频率,各类型风险案件之间的关系性,并根据管理相对人当前的行为数据的数据特征,通过预设的机器学习算法预测管理相对人对应各类型风险案件发生的概率;
其中,机器学习算法包括GBDT算法;具体包括:
根据提取的特征数据,进行数据预处理,主要包括数据清洗、数据统计以及数据标注工作;
采用单特征训练进行特征选择,选择影响较大的特征进行模型训练;
划分验证集,训练模型,先以默认参数进行模型训练,再采用网格搜索法对模型超参数进行调节,迭代训练得到相对较优的模型;
模型验证,以决定系数R2和均方误差MSE值作为模型评估系数,并利用验证集进行模型验证,其中R2值越大,MSE值越小,模型拟合效果越好;
进行线上测试,根据测试结果进行相应的调整;
第二数据获取模块,用于获取风险案例信息数据,并获取包含用于表征所述风险案例信息的内容属性的标签集合;
个性化推荐模块,用于根据所述用户画像,从所述风险案例信息数据中确定与所述管理相对人相匹配的目标风险案例信息,进行个性化案例推荐;具体包括:
确定所述用户画像对应的所述风险案件的类型与所述标签集合的第一相似度;
根据所述第一相似度,从所述风险案例信息数据中确定与所述管理相对人相匹配的目标风险案例信息;
选择所述第一相似度高于第一阈值的所述目标风险案例信息,进行个性化案例推荐;
群体化推荐模块,用于根据所述用户群组画像,从所述风险案例信息数据中确定与所述管理相对人群组相匹配的目标风险案例信息,进行群体化案例推荐;具体包括:
确定所述用户群组画像对应的所述风险案件的类型与所述标签集合的第二相似度;
根据所述第二相似度,从所述风险案例信息数据中确定与所述管理相对人群组相匹配的目标风险案例信息;
选择所述第二相似度高于第二阈值的所述目标风险案例信息,进行群体化案例推荐。
3.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1所述管理相对人风险预测以及信息推荐方法的步骤。
4.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,执行如权利要求1所述管理相对人风险预测以及信息推荐方法的步骤。
CN202011114719.XA 2020-10-19 2020-10-19 管理相对人风险预测以及信息推荐方法及装置 Active CN112016769B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011114719.XA CN112016769B (zh) 2020-10-19 2020-10-19 管理相对人风险预测以及信息推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011114719.XA CN112016769B (zh) 2020-10-19 2020-10-19 管理相对人风险预测以及信息推荐方法及装置

Publications (2)

Publication Number Publication Date
CN112016769A CN112016769A (zh) 2020-12-01
CN112016769B true CN112016769B (zh) 2022-04-08

Family

ID=73528293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011114719.XA Active CN112016769B (zh) 2020-10-19 2020-10-19 管理相对人风险预测以及信息推荐方法及装置

Country Status (1)

Country Link
CN (1) CN112016769B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159419A (zh) * 2021-04-21 2021-07-23 成都卫士通信息产业股份有限公司 一种群体特征画像分析方法、装置、设备及可读存储介质
CN113570388A (zh) * 2021-07-30 2021-10-29 广东电网有限责任公司 一种远程反窃电检查方法、装置、计算机设备和存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10768002B2 (en) * 2017-10-26 2020-09-08 International Business Machines Corporation Assessing personalized risk for a user on a journey
CN108062375B (zh) * 2017-12-12 2021-12-10 百度在线网络技术(北京)有限公司 一种用户画像的处理方法、装置、终端和存储介质
CN110555578B (zh) * 2018-06-01 2024-04-16 北京京东尚科信息技术有限公司 一种销量预测方法和装置
CN110363390A (zh) * 2019-06-18 2019-10-22 中国平安人寿保险股份有限公司 基于大数据的风险预测方法、系统、设备及存储介质

Also Published As

Publication number Publication date
CN112016769A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
WO2021184630A1 (zh) 基于知识图谱定位排污对象的方法及相关设备
CN108038627B (zh) 一种对象评估方法及装置
CN112016769B (zh) 管理相对人风险预测以及信息推荐方法及装置
CN110291542B (zh) 主要原因估计装置、主要原因估计系统以及主要原因估计方法
US11562262B2 (en) Model variable candidate generation device and method
CN113379313B (zh) 一种具有智能化的预防性试验作业管控系统
CN112488716A (zh) 一种异常事件检测系统
KR101625124B1 (ko) 특허 정량분석을 이용한 기술평가 방법
CN112966259A (zh) 电力监控系统运维行为安全威胁评估方法及设备
Al-Rasheed Identification of important features and data mining classification techniques in predicting employee absenteeism at work.
CN111612491A (zh) 状态分析模型构建方法、分析方法及装置
CN112990989A (zh) 价值预测模型输入数据生成方法、装置、设备和介质
CN116865994A (zh) 一种基于大数据的网络数据安全预测方法
KR20160121132A (ko) 소셜 빅데이터 기반의 상품 트랜드 및 매출 분석 장치 및 방법
CN115619539A (zh) 贷前风险评价方法以及装置
Chang Software risk modeling by clustering project metrics
Malhotra et al. A neuro-fuzzy classifier for website quality prediction
CN113537759A (zh) 一种基于权重自适应的用户体验度量模型
Romeu On operations research and statistics techniques: Keys to quantitative data mining
Severiukhina et al. Segment-wise Users' Response Prediction based on Activity Traces in Online Social Networks
CN110569277A (zh) 一种配置数据信息自动识别与归类方法及系统
Silva et al. Detecting possible persons of interest in a physical activity program using step entries: Including a web‐based application for outlier detection and decision‐making
CN114036293B (zh) 数据处理方法、装置及电子设备
CN112749990B (zh) 一种基于游客身份的数据分析方法及系统
CN115982646B (zh) 一种基于云平台的多源测试数据的管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant