CN114791970A - 一种用户属性的预测方法、装置、设备及存储介质 - Google Patents

一种用户属性的预测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114791970A
CN114791970A CN202210272300.XA CN202210272300A CN114791970A CN 114791970 A CN114791970 A CN 114791970A CN 202210272300 A CN202210272300 A CN 202210272300A CN 114791970 A CN114791970 A CN 114791970A
Authority
CN
China
Prior art keywords
user
attribute
description
abnormal
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210272300.XA
Other languages
English (en)
Inventor
郑开发
史帅
尚程
杨满智
王杰
傅强
梁彧
田野
金红
陈晓光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eversec Beijing Technology Co Ltd
Original Assignee
Eversec Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eversec Beijing Technology Co Ltd filed Critical Eversec Beijing Technology Co Ltd
Priority to CN202210272300.XA priority Critical patent/CN114791970A/zh
Publication of CN114791970A publication Critical patent/CN114791970A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/908Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Library & Information Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种用户属性的预测方法、装置、设备及存储介质。该方法包括获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签;其中,所述描述维度包括下述至少一项:身份描述维度、关联实体描述维度以及关联大数据描述维度;将各所述属性衡量标签转换为匹配的属性衡量向量,得到与所述目标用户对应的属性衡量向量集;将所述属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性。本发明实施例的技术方案精确对用户属性的预测,以便提供相应的应对策略。

Description

一种用户属性的预测方法、装置、设备及存储介质
技术领域
本发明实施例涉及计算机技术,尤其涉及一种用户属性的预测方法、装置、设备及存储介质。
背景技术
随着计算机网络的日益发展,属性预测的应用场景的占比规模越来越大,属性预测技术越来越复杂,导致出现各种恶意用户、异常用户和异常行为的可能性增多。当网络中出现大量人物或者行为,怎样快速对属性进行预测,产生相应的预警,进一步进行精细化的属性分析,就显得尤为重要。
发明人在实现本发明的过程中,发现现有技术主要存在如下缺陷:现有技术对用户属性预测不全面,导致无法提供更合适的应对策略。
发明内容
本发明实施例提供了一种用户属性的预测方法、装置、设备及存储介质,精确对用户属性的预测,以便提供相应的应对策略。
第一方面,本发明实施例提供了一种用户属性的预测方法,该方法包括:
获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签;
其中,所述描述维度包括下述至少一项:身份描述维度、关联实体描述维度以及关联大数据描述维度;
将各所述属性衡量标签转换为匹配的属性衡量向量,得到与所述目标用户对应的属性衡量向量集;
将所述属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性;所述预测用户属性包括:预测身份特征、预测行为特征及预测风险等级。
第二方面,本发明实施例还提供了一种用户属性的预测装置,该装置包括:
属性衡量标签获取模块,用于获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签;
其中,所述描述维度包括下述至少一项:身份描述维度、关联实体描述维度以及关联大数据描述维度;
属性衡量向量集获取模块,用于将各所述属性衡量标签转换为匹配的属性衡量向量,得到与所述目标用户对应的属性衡量向量集;
用户属性预测模块,用于将所述属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性;所述预测用户属性包括:预测身份特征、预测行为特征及预测风险等级。
第三方面,本发明实施例还提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的一种用户属性的预测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如本发明任意实施例所述的一种用户属性的预测方法。
本发明实施例通过获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签;其中,所述描述维度包括下述至少一项:身份描述维度、关联实体描述维度以及关联大数据描述维度;将各所述属性衡量标签转换为匹配的属性衡量向量,得到与所述目标用户对应的属性衡量向量集;将所述属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性,所述预测用户属性包括:预测身份特征、预测行为特征及预测风险等级,解决现有技术对用户属性预测不全面的问题,精确对用户属性的预测,以便提供相应的应对策略。
附图说明
图1为本发明实施例一提供的一种用户属性的预测方法的流程图;
图2为本发明实施例二提供的另一种用户属性的预测方法的流程图;
图2a为本发明实施例二提供了一种用户属性的具体预测流程示意图;
图3为本发明实施例三提供的一种用户属性的预测装置的结构示意图;
图4为本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。本发明应用于合法监督平台,数据均通过合法渠道获得。
实施例一
图1为本发明实施例一提供的一种用户属性的预测方法的流程图,本实施例可适用于对用户的属性进行预测的情况,该方法可以由一种用户属性的预测装置来执行,该装置可以通过软件和/或硬件的方式实现,并一般可以集成在服务器中。参考图1,该方法具体包括如下步骤:
S110、获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签。
其中,目标用户可以是指待预测属性的用户。
描述维度可以包括下述至少一项:身份描述维度、关联实体描述维度以及关联大数据描述维度,其中,身份描述维度可以是指描述目标用户身份的信息所匹配的维度,关联实体描述维度可以是指描述目标用户所使用物品相关信息所匹配的维度,关联大数据维度可以是指目标用户的电信数据、时空数据和社会数据等信息所匹配的维度。
属性衡量标签可以是指目标用户在各描述维度下的具体信息内容。
描述项可以是指每种描述维度下,对目标用户进行具体描述的项目。例如,身份描述维度下的描述项可以包括姓名、性别、年龄和职业等,关联实体描述维度下的描述项可以包括实体名称、实体型号和实体来源等,关联大数据描述维度下的描述项可以包括电信信息、时空轨迹和社会倾向等。
在本实施例中,可以获取目标用户在多个描述维度下多个描述项的具体信息,如身份特征、行为偏好、时空轨迹、关系网络和社会倾向等信息。
S120、将各所述属性衡量标签转换为匹配的属性衡量向量,得到与所述目标用户对应的属性衡量向量集。
其中,属性衡量向量可以是指属性衡量标签的数字表示形式。属性衡量向量集可以是包含多个属性衡量向量的集合,目标用户在各描述维度下的各描述项对应的信息均可以转换为匹配的属性衡量向量,即,目标用户可以具有多个匹配的属性衡量向量。
在本发明实施例中,可以将目标用户的可用属性衡量标签转换为匹配的属性衡量向量,从而构建与目标用户对应的属性衡量向量集。
S130、将所述属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性。
其中,用户属性预测模型可以通过大量训练样本经过至少一轮的训练获得,该用户属性预测模型可以基于深度学习构建,示例性的,可以构建K-means模型。预测用户属性可以包括:预测身份特征、预测行为特征及预测风险等级。
本发明实施例的技术方案,通过获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签;其中,所述描述维度包括下述至少一项:身份描述维度、关联实体描述维度以及关联大数据描述维度;将各所述属性衡量标签转换为匹配的属性衡量向量,得到与所述目标用户对应的属性衡量向量集;将所述属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性;所述预测用户属性包括:预测身份特征、预测行为特征及预测风险等级,解决了现有技术对用户属性预测不全面的问题,精确了对用户属性的预测,以便提供相应的应对策略。
实施例二
图2为本发明实施例二提供的另一种用户属性的预测方法的流程图,本实施例在上述各实施例的基础上,优选是在获取所述目标用户的至少一个预测用户属性之后进一步增加操作。参考图2,该方法具体包括如下步骤:
S210、获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签。
S220、将各所述属性衡量标签转换为匹配的属性衡量向量,得到与所述目标用户对应的属性衡量向量集。
S230、将所述属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性。
S240、获取与异常预测场景匹配的目标评分规则。
其中,异常预测场景可以是指对目标用户进行属性预测所处的情景,例如,国家电信平台预测目标用户的电信信息相关风险等级。目标评分规则可以是指在某个属性下对目标用户的评分规则,例如,对目标用户的各用户属性加权求和。不同异常预测场景下,对用户的评分规则存在区别。
在本发明实施例中,得到目标用户的预测用户属性之后,可以获取与异常预测场景匹配的目标评分规则。
S250、根据各所述预测用户属性,以及所述目标评分规则,获取所述目标用户在所述异常预测场景中的异常评分值。
其中,异常评分值可以表示在异常预测场景中,目标用户的异常程度。异常评分值越大,表示该目标用户在当前异常预测场景中异常程度越高,反之,异常评分值越小,表示该目标用户在当前异常预测场景中的异常程度越低。
在本发明实施例中,可以根据目标用户的预测用户属性,以及获取的目标评分规则,计算目标用户在异常预测场景中的异常评分值。
S260、如果确定所述异常评分值满足预设的门限阈值条件,则将所述目标用户识别为所述异常预测场景下的异常用户。
其中,预设的门限阈值可以是指异常评分值的上限值。
在本发明实施例中,若目标用户在异常预测场景中的异常评分值达到预设的门限阈值,则可以将当前的目标用户识别为当前异常预测场景下的异常用户。例如,在电信诈骗场景下,设定异常评分值超过75分的用户为涉诈用户,目标用户的电信诈骗场景下的异常评分值为80分,满足涉诈用户的识别条件,将当前目标用户确定为涉诈用户。
S270、对所述目标用户进行用户行为数据的监控,并在确定所述用户行为数据满足与所述异常预测场景匹配的异常行为条件时,对所述目标用户进行用户行为预警。
其中,用户行为数据可以是指表示用户行为的数据。异常行为条件可以是指用户确定用户行为发生异常的条件。
示例性的,在电信诈骗场景下,设定连续一周内,用户主叫次数占比超过80%,主叫时间集中在晚8时后,认为用户行为异常。当前处理目标用户在识别为异常用户的前提下,且满足设定的异常行为条件,则针对当前处理的目标用户进行用户行为预警。
在本发明实施例中,可以对识别为异常用户的目标用户进行后续的用户行为数据监控,在确定目标用户的用户行为数据满足与异常预测场景匹配的异常行为条件时,可以针对目标用户进行用户行为预警。
这样设置的好处在于,通过提前预警,可以确定相应的应对策略,避免异常行为的发生。
本发明实施例的技术方案,通过获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签;将各所述属性衡量标签转换为匹配的属性衡量向量,得到与目标用户对应的属性衡量向量集;将属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性;获取与异常预测场景匹配的目标评分规则;根据各预测用户属性,以及目标评分规则,获取目标用户在异常预测场景中的异常评分值;如果确定异常评分值满足预设的门限阈值条件,则将目标用户识别为异常预测场景下的异常用户;对目标用户进行用户行为数据的监控,并在确定用户行为数据满足与异常预测场景匹配的异常行为条件时,对所述目标用户进行用户行为预警,解决了现有技术在不同场景下对用户属性预测不准确的问题,提供一种用户属性预测的方式,有效提高用户属性的预测准确率。
在上述技术方案的基础上,优选可以在获取所述目标用户的至少一个预测用户属性之后,进一步按照所述预测用户属性,对多个用户进行用户聚类,得到多个用户群体;获取与异常预测场景匹配的标准用户属性,并根据各用户群体的聚类中心,以及所述标准用户属性,在各所述用户群体中识别异常用户群体;根据所述异常用户群体里中包括的用户数量,预测与所述异常预测场景匹配的异常事件的发生概率。
其中,标准用户属性可以是指在异常预测场景中,用户的标准属性,该标准用户属性可以根据多个用户所对应用户属性,具体评判获得。示例性的,可以计算两两用户的用户属性之间的相似性,将具有邻居用户最多的用户所对应的用户属性确定为标准用户属性。异常用户群体可以是指多个用户群体中,满足异常群体条件的某个或者某些用户群体。
具体的,可以基于预测用户属性,将多个用户进行聚类,从而得到多个用户群体,并获取各用户群体的聚类中心。根据与异常预测场景匹配的标准用户属性与各聚类中心,从各用户群体中识别异常用户群体。进而可以根据异常用户群体中的用户数量在异常预测场景中当前全部用户数量中所占比重,预测与异常预测场景匹配的异常事件的发生概率。
这样设置的好处在于,可以通过聚类操作,预测异常预测场景中异常事件发生概率,为避免异常事件发生提供相应的基础保障。
在上述技术方案的基础上,优选在将所述属性衡量向量集输入至预先训练的用户属性预测模型中之前,还可以包括:获取训练样本数据,将所述训练样本数据输入至预先建立的预测模型;对所述预测模型进行优化训练,确定所述预测模型的模型参数,得到所述用户属性预测模型。
其中,训练样本数据可以是指预先收集的用户属性数据。模型参数可以是指预先建立的预测模型的参数,例如,属性预测项和属性预测数量等。
具体的,可以通过大量训练样本数据,训练预先建立的预测模型,确定该预测模型的模型参数,从而得到用户属性预测模型。
可选的,获取训练样本数据,可以包括:配置数据获取任务;根据所述数据获取任务,从源用户属性数据集中提取属于同一目标用户的全部维度属性衡量信息;根据预设数据模板,从所述全部维度属性衡量信息中筛选目标维度属性衡量信息,生成与目标用户匹配的标准训练样本数据;其中,所述预设数据模板包括训练样本身份标识及与训练样本匹配的多维度属性衡量信息标识。
其中,数据获取任务可以是指从预先构建的数据库中获取训练样本数据这一操作所对应的任务。源用户属性数据集可以是指预先构建的用户属性数据库,源用户属性数据集可以包含用户在历史时间内的全部属性数据,并且该源用户属性数据集可以根据预设时间间隔不断进行更新。标准训练样本数据可以是指与当前训练模型所需数据格式匹配的数据。训练样本身份标识例如可以是“姓名”等标识。
具体的,可以根据模型所需数据的格式配置相应的数据获取任务,根据该数据获取任务,从源用户属性数据集中提取属于同一目标用户的全部维度属性衡量信息,根据数据获取任务中的预设数据模板,从全部维度属性衡量信息中筛选目标维度属性衡量信息,对预设数据模板的训练样本身份标识及与训练样本匹配的多维度属性衡量信息标识进行填充,生成标准训练样本数据。
这样设置的好处在于,可以灵活配置训练样本数据格式,以提高预测模型的预测准确率。
可选的,在获取所述目标用户的至少一个预测用户属性之后,还可以包括:根据所述预测用户属性,确定所述用户属性预测模型的预测精确率及召回率;根据所述精确率及召回率,返回执行获取训练样本数据,将所述训练样本数据输入至预先建立的预测模型的操作,迭代更新所述用户属性预测模型的模型参数,直至所述精确率及召回率达到预设阈值。
这样设置的好处在于,可以迭代更新用户属性预测模型的模型参数,以提高用户属性预测模型的预测精确率。
示例性的,图2a为本发明实施例二提供了一种用户属性的具体预测流程示意图。根据预设数据模板将源用户属性数据生成训练样本数据,将训练样本数据输入预先的构建的预测模型,对预测模型进行训练。根据预设数据模板生成测试样本数据批量输入训练后的用户属性预测模型,获取与测试样本数据对应的用户属性数据。进而可以根据与测试样本数据对应的用户属性数据,优化用户属性预测模型的模型参数,更新用户属性预测模型。
需要再次强调的是,本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
实施例三
图3为本发明实施例三提供的一种用户属性的预测装置的结构示意图,该装置可以执行上述各实施例涉及到的用户属性的预测方法。参考图3,该装置可以包括:属性衡量标签获取模块310、属性衡量向量集获取模块320和用户属性预测模块330。其中:
属性衡量标签获取模块310,用于获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签;
其中,所述描述维度包括下述至少一项:身份描述维度、关联实体描述维度以及关联大数据描述维度;
属性衡量向量集获取模块320,用于将各所述属性衡量标签转换为匹配的属性衡量向量,得到与所述目标用户对应的属性衡量向量集;
用户属性预测模块330,用于将所述属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性;所述预测用户属性包括:预测身份特征、预测行为特征及预测风险等级。
本发明实施例的技术方案,通过获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签;其中,所述描述维度包括下述至少一项:身份描述维度、关联实体描述维度以及关联大数据描述维度;将各所述属性衡量标签转换为匹配的属性衡量向量,得到与所述目标用户对应的属性衡量向量集;将所述属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性;所述预测用户属性包括:预测身份特征、预测行为特征及预测风险等级,解决了现有技术对用户属性预测不全面的问题,精确了对用户属性的预测,以便提供相应的应对策略。
上述装置中,可选的是,还包括,异常用户识别模块,用于在获取所述目标用户的至少一个预测用户属性之后:
获取与异常预测场景匹配的目标评分规则;
根据各所述预测用户属性,以及所述目标评分规则,获取所述目标用户在所述异常预测场景中的异常评分值;
如果确定所述异常评分值满足预设的门限阈值条件,则将所述目标用户识别为所述异常预测场景下的异常用户。
上述装置中,可选的是,还包括,行为预警模块,用于在将所述目标用户识别为所述异常预测场景下的异常用户之后:
对所述目标用户进行用户行为数据的监控,并在确定所述用户行为数据满足与所述异常预测场景匹配的异常行为条件时,对所述目标用户进行用户行为预警。
上述装置中,可选的是,还包括,概率预测模块,用于在获取所述目标用户的至少一个预测用户属性之后:
按照所述预测用户属性,对多个用户进行用户聚类,得到多个用户群体;
获取与异常预测场景匹配的标准用户属性,并根据各用户群体的聚类中心,以及所述标准用户属性,在各所述用户群体中识别异常用户群体;
根据所述异常用户群体里中包括的用户数量,预测与所述异常预测场景匹配的异常事件的发生概率。
上述装置中,可选的是,还包括,用户属性预测模型获取模块,用于在将所述属性衡量向量集输入至预先训练的用户属性预测模型中之前,包括:
训练样本输入单元,用于获取训练样本数据,将所述训练样本数据输入至预先建立的预测模型;
用户属性预测模型获取单元,用于对所述预测模型进行优化训练,确定所述预测模型的模型参数,得到所述用户属性预测模型。
上述装置中,可选的是,训练样本输入单元,可以具体用于:
配置数据获取任务;
根据所述数据获取任务,从源用户属性数据集中提取属于同一目标用户的全部维度属性衡量信息;
根据预设数据模板,从所述全部维度属性衡量信息中筛选目标维度属性衡量信息,生成与目标用户匹配的标准训练样本数据;
其中,所述预设数据模板包括训练样本身份标识及与训练样本匹配的多维度属性衡量信息标识。
上述装置中,可选的是,还包括,模型参数更新模块,用于在获取所述目标用户的至少一个预测用户属性之后:
根据所述预测用户属性,确定所述用户属性预测模型的预测精确率及召回率;
根据所述精确率及召回率,返回执行获取训练样本数据,将所述训练样本数据输入至预先建立的预测模型的操作,迭代更新所述用户属性预测模型的模型参数,直至所述精确率及召回率达到预设阈值。
本发明实施例所提供的用户属性的预测装置可执行本发明任意实施例所提供的用户属性的预测方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的一种电子设备的结构示意图,如图4所示,该设备包括处理器410、存储装置420、输入装置430和输出装置440;设备中处理器410的数量可以是一个或多个,图4中以一个处理器410为例;设备中的处理器410、存储装置420、输入装置430和输出装置440可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储装置420作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的用户属性的预测方法对应的程序指令/模块(例如,用户属性的预测装置中的属性衡量标签获取模块310、属性衡量向量集获取模块320和用户属性预测模块330)。处理器410通过运行存储在存储装置420中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的用户属性的预测方法,该方法可以包括:
获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签;
其中,所述描述维度包括下述至少一项:身份描述维度、关联实体描述维度以及关联大数据描述维度;
将各所述属性衡量标签转换为匹配的属性衡量向量,得到与所述目标用户对应的属性衡量向量集;
将所述属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性;所述预测用户属性包括:预测身份特征、预测行为特征及预测风险等级。
存储装置420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储装置420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储装置420可进一步包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置430可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置440可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在由处理器执行时用于执行一种用户属性的预测方法,该方法可以包括:
获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签;
其中,所述描述维度包括下述至少一项:身份描述维度、关联实体描述维度以及关联大数据描述维度;
将各所述属性衡量标签转换为匹配的属性衡量向量,得到与所述目标用户对应的属性衡量向量集;
将所述属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性;所述预测用户属性包括:预测身份特征、预测行为特征及预测风险等级。
当然,本发明实施例所提供的一种计算机可读存储介质,其上存储有计算机程序,其计算机程序不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的用户属性的预测方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述用户属性的预测装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种用户属性的预测方法,其特征在于,包括:
获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签;
其中,所述描述维度包括下述至少一项:身份描述维度、关联实体描述维度以及关联大数据描述维度;
将各所述属性衡量标签转换为匹配的属性衡量向量,得到与所述目标用户对应的属性衡量向量集;
将所述属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性;所述预测用户属性包括:预测身份特征、预测行为特征及预测风险等级。
2.根据权利要求1所述的方法,其特征在于,在获取所述目标用户的至少一个预测用户属性之后,还包括:
获取与异常预测场景匹配的目标评分规则;
根据各所述预测用户属性,以及所述目标评分规则,获取所述目标用户在所述异常预测场景中的异常评分值;
如果确定所述异常评分值满足预设的门限阈值条件,则将所述目标用户识别为所述异常预测场景下的异常用户。
3.根据权利要求2所述的方法,其特征在于,在将所述目标用户识别为所述异常预测场景下的异常用户之后,还包括:
对所述目标用户进行用户行为数据的监控,并在确定所述用户行为数据满足与所述异常预测场景匹配的异常行为条件时,对所述目标用户进行用户行为预警。
4.根据权利要求1所述的方法,其特征在于,在获取所述目标用户的至少一个预测用户属性之后,还包括:
按照所述预测用户属性,对多个用户进行用户聚类,得到多个用户群体;
获取与异常预测场景匹配的标准用户属性,并根据各用户群体的聚类中心,以及所述标准用户属性,在各所述用户群体中识别异常用户群体;
根据所述异常用户群体里中包括的用户数量,预测与所述异常预测场景匹配的异常事件的发生概率。
5.根据权利要求1-4任一项所述的方法,其特征在于,在将所述属性衡量向量集输入至预先训练的用户属性预测模型中之前,还包括:
获取训练样本数据,将所述训练样本数据输入至预先建立的预测模型;
对所述预测模型进行优化训练,确定所述预测模型的模型参数,得到所述用户属性预测模型。
6.根据权利要求5所述的方法,其特征在于,获取训练样本数据,包括:
配置数据获取任务;
根据所述数据获取任务,从源用户属性数据集中提取属于同一目标用户的全部维度属性衡量信息;
根据预设数据模板,从所述全部维度属性衡量信息中筛选目标维度属性衡量信息,生成与目标用户匹配的标准训练样本数据;
其中,所述预设数据模板包括训练样本身份标识及与训练样本匹配的多维度属性衡量信息标识。
7.根据权利要求1所述的方法,其特征在于,在获取所述目标用户的至少一个预测用户属性之后,还包括:
根据所述预测用户属性,确定所述用户属性预测模型的预测精确率及召回率;
根据所述精确率及召回率,返回执行获取训练样本数据,将所述训练样本数据输入至预先建立的预测模型的操作,迭代更新所述用户属性预测模型的模型参数,直至所述精确率及召回率达到预设阈值。
8.一种用户属性的预测装置,其特征在于,包括:
属性衡量标签获取模块,用于获取目标用户在多个描述维度下的属性衡量标签,每个描述维度中包括多个描述项,每个描述项对应匹配的属性衡量标签;
其中,所述描述维度包括下述至少一项:身份描述维度、关联实体描述维度以及关联大数据描述维度;
属性衡量向量集获取模块,用于将各所述属性衡量标签转换为匹配的属性衡量向量,得到与所述目标用户对应的属性衡量向量集;
用户属性预测模块,用于将所述属性衡量向量集输入至预先训练的用户属性预测模型中,获取所述目标用户的至少一个预测用户属性;所述预测用户属性包括:预测身份特征、预测行为特征及预测风险等级。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的一种用户属性的预测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的一种用户属性的预测方法。
CN202210272300.XA 2022-03-18 2022-03-18 一种用户属性的预测方法、装置、设备及存储介质 Pending CN114791970A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210272300.XA CN114791970A (zh) 2022-03-18 2022-03-18 一种用户属性的预测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210272300.XA CN114791970A (zh) 2022-03-18 2022-03-18 一种用户属性的预测方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114791970A true CN114791970A (zh) 2022-07-26

Family

ID=82460252

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210272300.XA Pending CN114791970A (zh) 2022-03-18 2022-03-18 一种用户属性的预测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114791970A (zh)

Similar Documents

Publication Publication Date Title
CN111475804B (zh) 一种告警预测方法及系统
CN110417721B (zh) 安全风险评估方法、装置、设备及计算机可读存储介质
CN107566358B (zh) 一种风险预警提示方法、装置、介质及设备
CN110287316A (zh) 一种告警分类方法、装置、电子设备及存储介质
CN111796957B (zh) 基于应用日志的交易异常根因分析方法及系统
CN111931809A (zh) 数据的处理方法、装置、存储介质及电子设备
CN112329811A (zh) 异常账号识别方法、装置、计算机设备和存储介质
CN112989332B (zh) 一种异常用户行为检测方法和装置
CN111310139A (zh) 行为数据识别方法、装置及存储介质
CN112686521B (zh) 一种风控规则调优方法和系统
CN112765003B (zh) 一种基于app行为日志的风险预测方法
CN109685255A (zh) 一种预测用户流失的方法和装置
CN115619245A (zh) 一种基于数据降维方法的画像构建和分类方法及系统
CN110046245A (zh) 一种数据监控方法及装置、一种计算设备及存储介质
CN115396324A (zh) 一种网络安全态势感知预警处理系统
CN110414591A (zh) 一种数据处理方法以及设备
CN114238402A (zh) 告警数据处理方法、装置、存储介质以及电子设备
CN115858606A (zh) 时序数据的异常检测方法、装置、设备及存储介质
CN115514581B (zh) 一种用于工业互联网数据安全平台的数据分析方法及设备
CN110704614B (zh) 对应用中的用户群类型进行预测的信息处理方法及装置
CN117216713A (zh) 故障定界方法、装置、电子设备和存储介质
CN111985226A (zh) 标注数据生成方法及装置
CN115660101A (zh) 一种基于业务节点信息的数据服务提供方法及装置
CN114791970A (zh) 一种用户属性的预测方法、装置、设备及存储介质
CN115484048A (zh) 一种基于云环境的入侵行为检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination