CN112860808A - 基于数据标签的用户画像分析方法、装置、介质和设备 - Google Patents
基于数据标签的用户画像分析方法、装置、介质和设备 Download PDFInfo
- Publication number
- CN112860808A CN112860808A CN202011612215.0A CN202011612215A CN112860808A CN 112860808 A CN112860808 A CN 112860808A CN 202011612215 A CN202011612215 A CN 202011612215A CN 112860808 A CN112860808 A CN 112860808A
- Authority
- CN
- China
- Prior art keywords
- label
- tag
- user
- data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 20
- 238000001914 filtration Methods 0.000 claims abstract description 8
- 230000004044 response Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 10
- 208000024891 symptom Diseases 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 230000036541 health Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000003703 image analysis method Methods 0.000 claims 1
- 238000010191 image analysis Methods 0.000 abstract description 5
- 230000002776 aggregation Effects 0.000 abstract description 4
- 238000004220 aggregation Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 27
- 238000004891 communication Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24554—Unary operations; Data partitioning operations
- G06F16/24556—Aggregation; Duplicate elimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于数据标签的用户画像分析方法、装置、介质和设备,该方法包括:导入标签模型:从数据源中导入实体表,所述实体表对应有标签模型;抽取标签实体属性:从所述标签模型中选择多个字段,抽取出所述标签模型的实体属性;创建数据标签:对所述标签模型设置标签分层规则;计算标签人群:根据设置的标签分层规则,过滤形成相应的标签人群分层数据;创建用户分群:将每个标签的标签人群分层数据作为单独的标签用户群;用户画像分析:将每个标签用户群与其实体属性进行组合,获得用户画像。本发明实施例以标签模型进行数据聚合,根据数据特性实现自动化数据标签能力,根据标签组合能力进行用户分群,对目标群体进行多维画像分析。
Description
技术领域
本发明涉及数据治理领域,尤其涉及一种基于数据标签的用户画像分析方法、装置、介质和设备。
背景技术
当前数据治理现状中,政务数据面临以下痛点:
由于政府管理过程中对各部门对业务分化、权力分割,导致数据因部门管理碎片化而分散。造成各部门容易出现“数据不知道,数据找不到”等问题。例如:
对不同业务对同一数据的描述不同,对表和字段的定义混乱;
数据标准的分类问题,数据分类多样化,对主题、行业、服务分类会出现标准分类重复、分错情况;
数据标准的编码规范问题,业务数据代码不统一,使数据可信性低;
数据标准的命名规范问题,对表和字段的命名随意性强,同一英文字段名对应多个中文名,反之也存在中文的一对多;
数据标准的属性规范问题,同一业务元素会对应多种数据类型和长度;
缺少数据标准的应用建议,对数据制定数据标准时,缺乏规范标准应用。
针对目前数据资源现状,缺乏提供多样化服务,没有从基于数据使用、数据同步、数据比对、应用开发、数据库等方面进行计划和思考。导致无法测算预测资源服务压力,无法提高服务质量和工作效率,无法提高主动和针对性服务水平。无法提供预见性的服务,最终出现服务规划不精准的问题;对目标群体进行多维画像分析。
发明内容
有鉴于此,本发明提供一种基于数据标签的用户画像分析方法、装置、介质和设备,解决现有技术中存在的无法对目标群体进行多维画像分析的技术问题。
为达上述目的,第一方面,提供一种基于数据标签的用户画像分析方法,其包括:
导入标签模型:从数据源中导入实体表,所述实体表对应有标签模型;
抽取标签实体属性:从所述标签模型中选择多个字段,抽取出所述标签模型的实体属性;
创建数据标签:对所述标签模型设置标签分层规则;
计算标签人群:根据设置的标签分层规则,过滤形成相应的标签人群分层数据;
创建用户分群:将每个标签的标签人群分层数据作为单独的标签用户群;
用户画像分析:将每个标签用户群与其实体属性进行组合,获得用户画像。
在一些可能的实施方式中,所述抽取标签实体属性步骤,具体包括:
从所述标签模型中选择包括姓名、身份证号码、联系地址、手机号码、有无症状的指示信息、是否接触过患者的指示信息、性别、患者来源区域、以及患者当前所处区域在内的多个字段,抽取出所述标签模型的实体属性。
在一些可能的实施方式中,所述创建数据标签步骤,具体包括:
设置基础信息,所述设置基础信息包括:响应于输入操作,将所述标签模型设置为待分析的模型;响应于输入操作,将所述标签模型的更新方式设置为手动更新或者例行更新;响应于输入操作,将创建数据标签的执行周期设置为分钟、小时、天、月、年中的一种;响应于用户的输入操作,将所述标签模型的调度策略设置为每隔预设时长执行一次;
设置标签分层规则,所述设置标签分层规则包括:将人群划分为多个分层,每个分层与配置的多个条件相关联。
在一些可能的实施方式中,所述的将人群划分为多个分层,每个分层与配置的多个条件相关联,具体包括:
将人群划分为至少两个分层;其中一个分层代表第一地区患者人群,其中另一个分层代表第二地区患者人群;
每个分层与配置的至少两个条件同时满足相关联,所述至少两个条件包括:第一条件是健康状况等于异常;以及,第二条件是来自区域等于第一地区或第二地区。
在一些可能的实施方式中,所述用户画像分析步骤具体包括:
将每个标签用户群与其实体属性进行组合,获得多个维度的用户画像;其中,第一维度的用户画像为指示患者当前去向的分布图,第二维度的用户画像为指示患者的来源区域的分布图。
第二方面,提供一种基于数据标签的用户画像分析装置,其包括:
标签模型导入模块,用于从数据源中导入实体表,所述实体表对应有标签模型;
标签实体属性抽取模块,用于从所述标签模型中选择多个字段,抽取出所述标签模型的实体属性;
数据标签创建模块,用于对所述标签模型设置标签分层规则;
标签人群计算模块,用于根据设置的标签分层规则,过滤形成相应的标签人群分层数据;
用户分群创建模块,用于将每个标签的标签人群分层数据作为单独的标签用户群;
用户画像分析模块,用于将每个标签用户群与其实体属性进行组合,获得用户画像。
在一些可能的实施方式中,所述标签实体属性抽取模块,具体用于:从所述标签模型中选择包括姓名、身份证号码、联系地址、手机号码、有无症状的指示信息、是否接触过患者的指示信息、性别、患者来源区域、以及患者当前所处区域在内的多个字段,抽取出所述标签模型的实体属性。
在一些可能的实施方式中,所述数据标签创建模块,具体用于:
设置基础信息,所述设置基础信息包括:响应于输入操作,将所述标签模型设置为待分析的模型;响应于输入操作,将所述标签模型的更新方式设置为手动更新或者按例行更新;响应于输入操作,将创建数据标签的执行周期设置为分钟、小时、天、月、年中的一种;响应于用户的输入操作,将所述标签模型的调度策略设置为每隔预设时长执行一次;
设置标签分层规则,所述设置标签分层规则包括:将人群划分为多个分层,每个分层与配置的多个条件相关联。
第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的任意一种基于数据标签的用户画像分析方法。
第四方面,提供一种计算机设备,其包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的任意一种基于数据标签的用户画像分析方法。
上述技术方案的有益技术效果:
为了提高数据资源使用效率,本发明实施例以标签模型进行数据聚合,根据数据特性实现自动化数据标签能力,根据标签组合能力进行用户分群,对目标群体进行多维画像分析。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例的一种基于数据标签的用户画像分析方法的流程图;
图2是本发明实施例作为一个举例的导入标签模型的软件界面图;
图3是本发明实施例作为一个举例的抽取实体属性的软件界面图;
图4A是本发明实施例作为一个举例的创建数据标签的软件界面图一;
图4B是本发明实施例作为一个举例的创建数据标签的软件界面图二;
图5是本发明实施例作为一个举例的查看标签结果的软件界面图;
图6是本发明实施例作为一个举例的查看标签人群的软件界面图;
图7是本发明实施例作为一个举例的查看用户个体画像的软件界面图;
图8是本发明实施例作为一个举例的创建用户分群的软件界面图;
图9是本发明实施例作为一个举例的查看用户分群的软件界面图;
图10A是本发明实施例作为一个举例的创建用户画像的软件界面图一;
图10B是本发明实施例作为一个举例的创建用户画像的软件界面图二;
图10C是本发明实施例作为一个举例的查看画像的软件界面图;
图11是本发明实施例提供的一种基于数据标签的用户画像分析装置的功能框图;
图12是本发明实施例的一种计算机设备的功能框图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。
需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合;并且,基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
实施例一
图1是本发明实施例的一种基于数据标签的用户画像分析方法的流程图。
如图1所示,该方法S100包括如下步骤:
S110、导入标签模型:从数据源中导入实体表,所述实体表对应有标签模型。
S120、抽取标签实体属性:从所述标签模型中选择多个字段,抽取出所述标签模型的实体属性。
S130、创建数据标签:对所述标签模型设置标签分层规则。
S140、计算标签人群:根据设置的标签分层规则,过滤形成相应的标签人群分层数据。
S150、创建用户分群:将每个标签的标签人群分层数据作为单独的标签用户群。
S160、用户画像分析:将每个标签用户群与其实体属性进行组合,获得用户画像。
在一些实施例中,所述S120抽取标签实体属性步骤,具体可以包括:
从所述标签模型中选择包括姓名、身份证号码、联系地址、手机号码、有无症状的指示信息、是否接触过患者的指示信息、性别、患者来源区域、以及患者当前所处区域在内的多个字段,抽取出所述标签模型的实体属性。
在一些实施例中,所述S130创建数据标签步骤,具体可以包括如下步骤:
设置基础信息,所述设置基础信息包括:响应于输入操作,将所述标签模型设置为待分析的模型;响应于输入操作,将所述标签模型的更新方式设置为手动更新或者例行更新;响应于输入操作,将创建数据标签的执行周期设置为分钟、小时、天、月、年中的一种;响应于用户的输入操作,将所述标签模型的调度策略设置为每隔预设时长执行一次;
设置标签分层规则,所述设置标签分层规则包括:将人群划分为多个分层,每个分层与配置的多个条件相关联。
在一些实施例中,所述的将人群划分为多个分层,每个分层与配置的多个条件相关联,具体可以包括:
将人群划分为至少两个分层;其中一个分层代表第一地区患者人群,其中另一个分层代表第二地区患者人群;
每个分层与配置的至少两个条件同时满足相关联,所述至少两个条件包括:第一条件是健康状况等于异常;以及,第二条件是来自区域等于第一地区或第二地区。
在一些实施例中,所述S160用户画像分析步骤具体可以包括:
将每个标签用户群与其实体属性进行组合,获得多个维度的用户画像;其中,第一维度的用户画像为指示患者当前去向的分布图,第二维度的用户画像为指示患者的来源区域的分布图。
以下对上述方法进行更加详细的描述:
为了提高数据资源使用效率,本发明以标签模型进行数据聚合,根据数据特性实现自动化数据标签能力,根据标签组合能力进行用户分群,对目标群体进行多维画像分析。
数据标签逻辑流程,包括如下步骤:
导入标签模型:从数据源中导入实体表,作为打标的对象。
抽取标签属性:从标签模型中,选择字段,抽取出打标对象的实体属性,作为打标的维度和依据。
创建数据标签:设置标签分层分类规则、调度计划,选择模型以及属性进行自由组合。
计算标签人群:根据标签规则,过滤形成相应的分组数据。
用户群画像逻辑流程,包括如下步骤:
创建数据标签、计算标签人群:通过创建标签,计算筛选出标签人群;
创建用户分群:将某个标签的分层计算结果保存为单独的标签用户群;
用户画像分析:将某一标签用户群,根据其实体属性进行组合,进行一维或二维角度的统计分析。
以下结合实际案例进行举例说明:
图2是本发明实施例作为一个举例的导入标签模型的软件界面图;在图2 中,作为一个举例,数据源名称可设置为演示或治理,数据表可以采用但不限于住院信息表。图3是本发明实施例作为一个举例的抽取实体属性的软件界面图;如图3所示,表名可以为进入C地区信息表,列信息可包括七个字段或七个属性,例如为:属性名“xm”、“sfzmhm”、“lxdz”、“sjhm”、“zz”、“jchz”、“sex”,显示名分别相应地为:姓名、身份证号码、联系地址、手机号码、症状(0为无症状,1为有症状)、接触患者信息(0为否,1为是)、性别。图4A是本发明实施例作为一个举例的创建数据标签的软件界面图一;如图4A所示,在设置基础信息界面中,标签名称设置为患者标签,模型是上述的进入C地区信息表,更新方式被配置为例行更新,执行周期为按分钟执行,调度策略被设置为每隔15分钟执行一次。图4B是本发明实施例作为一个举例的创建数据标签的软件界面图二;如图4B所示,在设置标签规则界面中,在全部用户中,将满足以下条件的用户分为2个分层,例如A地区患者、B地区患者;但不限于2个分层,可根据需要添加分层。作为举例,当满足健康状况等于异常,并且来自区域等于A地区时,满足上述两个条件的人群处于A地区患者分层中。系统会按照上述自定义分层的顺序进行用户匹配,同一用户会被优先匹配在顺序靠前的分层中。图5是本发明实施例作为一个举例的查看标签结果的软件界面图;如图5所示,在执行病情是否来源A地区分析中,分类为2类,一类是来源A地区,一类是来源其他地区。图6是本发明实施例作为一个举例的查看标签人群的软件界面图;图7是本发明实施例作为一个举例的查看用户个体画像的软件界面图;图8是本发明实施例作为一个举例的创建用户分群的软件界面图;图9是本发明实施例作为一个举例的查看用户分群的软件界面图;
图10A是本发明实施例作为一个举例的创建用户画像的软件界面图一;图10B 是本发明实施例作为一个举例的创建用户画像的软件界面图二;图10C是本发明实施例作为一个举例的查看画像的软件界面图。如图10C所示,用户画像包括人群去向的用户画像和病患来源的用户画像。
实施例二
图11是本发明实施例提供的一种基于数据标签的用户画像分析装置的功能框图。如图11所示,该装置200包括:
标签模型导入模块210,用于从数据源中导入实体表,所述实体表对应有标签模型;
标签实体属性抽取模块220,用于从所述标签模型中选择多个字段,抽取出所述标签模型的实体属性;
数据标签创建模块230,用于对所述标签模型设置标签分层规则;
标签人群计算模块240,用于根据设置的标签分层规则,过滤形成相应的标签人群分层数据;
用户分群创建模块250,用于将每个标签的标签人群分层数据作为单独的标签用户群;
用户画像分析模块260,用于将每个标签用户群与其实体属性进行组合,获得用户画像。
在一些实施例中,所述标签实体属性抽取模块220,可以具体用于:从所述标签模型中选择包括姓名、身份证号码、联系地址、手机号码、有无症状的指示信息、是否接触过患者的指示信息、性别、患者来源区域、以及患者当前所处区域在内的多个字段,抽取出所述标签模型的实体属性。
在一些实施例中,所述数据标签创建模块230,可以具体用于:
设置基础信息,所述设置基础信息包括:响应于输入操作,将所述标签模型设置为待分析的模型;响应于输入操作,将所述标签模型的更新方式设置为手动更新或者按例行更新;响应于输入操作,将创建数据标签的执行周期设置为分钟、小时、天、月、年中的一种;响应于用户的输入操作,将所述标签模型的调度策略设置为每隔预设时长执行一次;
设置标签分层规则,所述设置标签分层规则包括:将人群划分为多个分层,每个分层与配置的多个条件相关联。
该装置可以提高数据资源使用效率,本发明以标签模型进行数据聚合,根据数据特性实现自动化数据标签能力,根据标签组合能力进行用户分群,能够对目标群体进行多维画像分析。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
实施例三
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的任意一种基于数据标签的用户画像分析方法。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。当然,还有其他方式的可读存储介质,例如量子存储器、石墨烯存储器等等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
实施例四
本发明实施例还提供了一种计算机设备,如图12所示,包括一个或多个处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现:
导入标签模型:从数据源中导入实体表,所述实体表对应有标签模型;
抽取标签实体属性:从所述标签模型中选择多个字段,抽取出所述标签模型的实体属性;
创建数据标签:对所述标签模型设置标签分层规则;
计算标签人群:根据设置的标签分层规则,过滤形成相应的标签人群分层数据;
创建用户分群:将每个标签的标签人群分层数据作为单独的标签用户群;
用户画像分析:将每个标签用户群与其实体属性进行组合,获得用户画像。
在一种可能的设计中,处理器301的处理中,所述抽取标签实体属性步骤,具体包括:
从所述标签模型中选择包括姓名、身份证号码、联系地址、手机号码、有无症状的指示信息、是否接触过患者的指示信息、性别、患者来源区域、以及患者当前所处区域在内的多个字段,抽取出所述标签模型的实体属性。
在一种可能的设计中,处理器301的处理中,所述创建数据标签步骤,具体包括:
设置基础信息,所述设置基础信息包括:响应于输入操作,将所述标签模型设置为待分析的模型;响应于输入操作,将所述标签模型的更新方式设置为手动更新或者例行更新;响应于输入操作,将创建数据标签的执行周期设置为分钟、小时、天、月、年中的一种;响应于用户的输入操作,将所述标签模型的调度策略设置为每隔预设时长执行一次;
设置标签分层规则,所述设置标签分层规则包括:将人群划分为多个分层,每个分层与配置的多个条件相关联。
在一种可能的设计中,处理器301的处理中,所述的将人群划分为多个分层,每个分层与配置的多个条件相关联,具体包括:
将人群划分为至少两个分层;其中一个分层代表第一地区患者人群,其中另一个分层代表第二地区患者人群;
每个分层与配置的至少两个条件同时满足相关联,所述至少两个条件包括:第一条件是健康状况等于异常;以及,第二条件是来自区域等于第一地区或第二地区。
在一种可能的设计中,处理器301的处理中,所述用户画像分析步骤具体包括:
将每个标签用户群与其实体属性进行组合,获得多个维度的用户画像;其中,第一维度的用户画像为指示患者当前去向的分布图,第二维度的用户画像为指示患者的来源区域的分布图。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit, ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于数据标签的用户画像分析方法,其特征在于,包括:
导入标签模型:从数据源中导入实体表,所述实体表对应有标签模型;
抽取标签实体属性:从所述标签模型中选择多个字段,抽取出所述标签模型的实体属性;
创建数据标签:对所述标签模型设置标签分层规则;
计算标签人群:根据设置的标签分层规则,过滤形成相应的标签人群分层数据;
创建用户分群:将每个标签的标签人群分层数据作为单独的标签用户群;
用户画像分析:将每个标签用户群与其实体属性进行组合,获得用户画像。
2.根据权利要求1所述的方法,其特征在于,所述抽取标签实体属性步骤,具体包括:
从所述标签模型中选择包括姓名、身份证号码、联系地址、手机号码、有无症状的指示信息、是否接触过患者的指示信息、性别、患者来源区域、以及患者当前所处区域在内的多个字段,抽取出所述标签模型的实体属性。
3.根据权利要求1所述的方法,其特征在于,所述创建数据标签步骤,具体包括:
设置基础信息,所述设置基础信息包括:响应于输入操作,将所述标签模型设置为待分析的模型;响应于输入操作,将所述标签模型的更新方式设置为手动更新或者例行更新;响应于输入操作,将创建数据标签的执行周期设置为分钟、小时、天、月、年中的一种;响应于用户的输入操作,将所述标签模型的调度策略设置为每隔预设时长执行一次;
设置标签分层规则,所述设置标签分层规则包括:将人群划分为多个分层,每个分层与配置的多个条件相关联。
4.根据权利要求3所述的方法,其特征在于,所述的将人群划分为多个分层,每个分层与配置的多个条件相关联,具体包括:
将人群划分为至少两个分层;其中一个分层代表第一地区患者人群,其中另一个分层代表第二地区患者人群;
每个分层与配置的至少两个条件同时满足相关联,所述至少两个条件包括:第一条件是健康状况等于异常;以及,第二条件是来自区域等于第一地区或第二地区。
5.根据权利要求2所述的方法,其特征在于,所述用户画像分析步骤具体包括:
将每个标签用户群与其实体属性进行组合,获得多个维度的用户画像;其中,第一维度的用户画像为指示患者当前去向的分布图,第二维度的用户画像为指示患者的来源区域的分布图。
6.一种基于数据标签的用户画像分析装置,其特征在于,包括:
标签模型导入模块,用于从数据源中导入实体表,所述实体表对应有标签模型;
标签实体属性抽取模块,用于从所述标签模型中选择多个字段,抽取出所述标签模型的实体属性;
数据标签创建模块,用于对所述标签模型设置标签分层规则;
标签人群计算模块,用于根据设置的标签分层规则,过滤形成相应的标签人群分层数据;
用户分群创建模块,用于将每个标签的标签人群分层数据作为单独的标签用户群;
用户画像分析模块,用于将每个标签用户群与其实体属性进行组合,获得用户画像。
7.根据权利要求6所述的装置,其特征在于,所述标签实体属性抽取模块,具体用于:从所述标签模型中选择包括姓名、身份证号码、联系地址、手机号码、有无症状的指示信息、是否接触过患者的指示信息、性别、患者来源区域、以及患者当前所处区域在内的多个字段,抽取出所述标签模型的实体属性。
8.根据权利要求6所述的装置,其特征在于,所述数据标签创建模块,具体用于:
设置基础信息,所述设置基础信息包括:响应于输入操作,将所述标签模型设置为待分析的模型;响应于输入操作,将所述标签模型的更新方式设置为手动更新或者按例行更新;响应于输入操作,将创建数据标签的执行周期设置为分钟、小时、天、月、年中的一种;响应于用户的输入操作,将所述标签模型的调度策略设置为每隔预设时长执行一次;
设置标签分层规则,所述设置标签分层规则包括:将人群划分为多个分层,每个分层与配置的多个条件相关联。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任意一项所述的基于数据标签的用户画像分析方法。
10.一种计算机设备,其特征在于,其包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-5中任一所述的基于数据标签的用户画像分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011612215.0A CN112860808A (zh) | 2020-12-30 | 2020-12-30 | 基于数据标签的用户画像分析方法、装置、介质和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011612215.0A CN112860808A (zh) | 2020-12-30 | 2020-12-30 | 基于数据标签的用户画像分析方法、装置、介质和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112860808A true CN112860808A (zh) | 2021-05-28 |
Family
ID=75998596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011612215.0A Pending CN112860808A (zh) | 2020-12-30 | 2020-12-30 | 基于数据标签的用户画像分析方法、装置、介质和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112860808A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113641697A (zh) * | 2021-08-13 | 2021-11-12 | 网银在线(北京)科技有限公司 | 人群生成方法、装置、电子设备和存储介质 |
CN114022177A (zh) * | 2021-09-27 | 2022-02-08 | 上海画龙信息科技有限公司 | 一种客户数据的智能分群方法、装置和电子设备 |
TWI812018B (zh) * | 2022-02-18 | 2023-08-11 | 正修學校財團法人正修科技大學 | 多元工作指派方法 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040049542A1 (en) * | 2002-09-09 | 2004-03-11 | Hamid Ould-Brahim | SVC-L2 VPNs: flexible on demand switched MPLS/IP layer-2 VPNs for ethernet SVC, ATM and frame relay |
CN106304015A (zh) * | 2015-05-28 | 2017-01-04 | 中兴通讯股份有限公司 | 用户设备的确定方法及装置 |
CN108764663A (zh) * | 2018-05-15 | 2018-11-06 | 广东电网有限责任公司信息中心 | 一种电力客户画像生成管理的方法及系统 |
CN109101652A (zh) * | 2018-08-27 | 2018-12-28 | 宜人恒业科技发展(北京)有限公司 | 一种标签创建和管理系统 |
CN109118288A (zh) * | 2018-08-22 | 2019-01-01 | 中国平安人寿保险股份有限公司 | 基于大数据分析的目标用户获取方法及装置 |
US20190034557A1 (en) * | 2017-07-27 | 2019-01-31 | Robert Bosch Gmbh | Visual analytics system for convolutional neural network based classifiers |
CN109785034A (zh) * | 2018-11-13 | 2019-05-21 | 北京码牛科技有限公司 | 用户画像生成方法、装置、电子设备及计算机可读介质 |
CN109978608A (zh) * | 2019-03-05 | 2019-07-05 | 广州海晟科技有限公司 | 目标用户画像的营销标签分析提取方法及系统 |
CN110490729A (zh) * | 2019-08-16 | 2019-11-22 | 南京汇银迅信息技术有限公司 | 一种基于用户画像模型的金融用户分类方法 |
CN110751261A (zh) * | 2018-07-23 | 2020-02-04 | 第四范式(北京)技术有限公司 | 神经网络模型的训练方法和系统以及预测方法和系统 |
CN111062750A (zh) * | 2019-12-13 | 2020-04-24 | 中国平安财产保险股份有限公司 | 用户画像标签建模和分析方法、装置、设备及存储介质 |
CN111177544A (zh) * | 2019-12-24 | 2020-05-19 | 浙江禾连网络科技有限公司 | 一种基于用户行为数据和用户画像数据的运营系统及方法 |
CN111309936A (zh) * | 2019-12-27 | 2020-06-19 | 上海大学 | 一种电影用户画像的构建方法 |
CN111400599A (zh) * | 2020-03-17 | 2020-07-10 | 苏宁金融科技(南京)有限公司 | 一种用户群画像生成方法、装置及系统 |
CN111881175A (zh) * | 2020-07-07 | 2020-11-03 | 腾讯科技(深圳)有限公司 | 一种标签模型验证方法、装置及设备 |
-
2020
- 2020-12-30 CN CN202011612215.0A patent/CN112860808A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040049542A1 (en) * | 2002-09-09 | 2004-03-11 | Hamid Ould-Brahim | SVC-L2 VPNs: flexible on demand switched MPLS/IP layer-2 VPNs for ethernet SVC, ATM and frame relay |
CN106304015A (zh) * | 2015-05-28 | 2017-01-04 | 中兴通讯股份有限公司 | 用户设备的确定方法及装置 |
US20190034557A1 (en) * | 2017-07-27 | 2019-01-31 | Robert Bosch Gmbh | Visual analytics system for convolutional neural network based classifiers |
CN108764663A (zh) * | 2018-05-15 | 2018-11-06 | 广东电网有限责任公司信息中心 | 一种电力客户画像生成管理的方法及系统 |
CN110751261A (zh) * | 2018-07-23 | 2020-02-04 | 第四范式(北京)技术有限公司 | 神经网络模型的训练方法和系统以及预测方法和系统 |
CN109118288A (zh) * | 2018-08-22 | 2019-01-01 | 中国平安人寿保险股份有限公司 | 基于大数据分析的目标用户获取方法及装置 |
CN109101652A (zh) * | 2018-08-27 | 2018-12-28 | 宜人恒业科技发展(北京)有限公司 | 一种标签创建和管理系统 |
CN109785034A (zh) * | 2018-11-13 | 2019-05-21 | 北京码牛科技有限公司 | 用户画像生成方法、装置、电子设备及计算机可读介质 |
CN109978608A (zh) * | 2019-03-05 | 2019-07-05 | 广州海晟科技有限公司 | 目标用户画像的营销标签分析提取方法及系统 |
CN110490729A (zh) * | 2019-08-16 | 2019-11-22 | 南京汇银迅信息技术有限公司 | 一种基于用户画像模型的金融用户分类方法 |
CN111062750A (zh) * | 2019-12-13 | 2020-04-24 | 中国平安财产保险股份有限公司 | 用户画像标签建模和分析方法、装置、设备及存储介质 |
CN111177544A (zh) * | 2019-12-24 | 2020-05-19 | 浙江禾连网络科技有限公司 | 一种基于用户行为数据和用户画像数据的运营系统及方法 |
CN111309936A (zh) * | 2019-12-27 | 2020-06-19 | 上海大学 | 一种电影用户画像的构建方法 |
CN111400599A (zh) * | 2020-03-17 | 2020-07-10 | 苏宁金融科技(南京)有限公司 | 一种用户群画像生成方法、装置及系统 |
CN111881175A (zh) * | 2020-07-07 | 2020-11-03 | 腾讯科技(深圳)有限公司 | 一种标签模型验证方法、装置及设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113641697A (zh) * | 2021-08-13 | 2021-11-12 | 网银在线(北京)科技有限公司 | 人群生成方法、装置、电子设备和存储介质 |
CN114022177A (zh) * | 2021-09-27 | 2022-02-08 | 上海画龙信息科技有限公司 | 一种客户数据的智能分群方法、装置和电子设备 |
CN114022177B (zh) * | 2021-09-27 | 2023-08-18 | 上海画龙信息科技有限公司 | 一种客户数据的智能分群方法、装置和电子设备 |
TWI812018B (zh) * | 2022-02-18 | 2023-08-11 | 正修學校財團法人正修科技大學 | 多元工作指派方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112860808A (zh) | 基于数据标签的用户画像分析方法、装置、介质和设备 | |
CN111061758B (zh) | 数据存储方法、装置及存储介质 | |
US20170068723A1 (en) | Organization categorization system and method | |
CN111352794B (zh) | 异常检测方法、装置、计算机装置及存储介质 | |
CN112306700A (zh) | 一种异常rpc请求的诊断方法和装置 | |
CN110535686B (zh) | 异常事件处理方法和装置 | |
CN115408381A (zh) | 数据处理方法及相关设备 | |
CN110837511B (zh) | 一种数据处理方法、系统及相关设备 | |
CN111628974A (zh) | 差分隐私保护方法、装置、电子设备和存储介质 | |
CN114741392A (zh) | 数据查询方法、装置、电子设备及存储介质 | |
US9465678B2 (en) | Event correlation | |
CN109145109B (zh) | 基于社交网络的用户群体消息传播异常分析方法及装置 | |
CN112100177A (zh) | 数据存储方法、装置、计算机设备及存储介质 | |
CN110737691B (zh) | 用于处理访问行为数据的方法和装置 | |
CN111737206A (zh) | 一种文件重删处理方法、系统、终端及存储介质 | |
CN111414395A (zh) | 数据处理方法、系统和计算机设备 | |
CN110489732A (zh) | 报表数据处理方法及设备 | |
CN114495137B (zh) | 票据异常检测模型生成方法与票据异常检测方法 | |
CN116245580A (zh) | 数据资产价值获取方法、装置、设备、介质和程序产品 | |
US20150213098A1 (en) | Business Rules Influenced Quasi-Cubes with Higher Diligence of Data Optimization | |
CN113778996A (zh) | 一种大数据流数据处理方法、装置、电子设备及存储介质 | |
CN110414813B (zh) | 指标曲线的构建方法、装置及设备 | |
CN114140241A (zh) | 一种交易监控指标的异常识别方法及装置 | |
CN111131393A (zh) | 用户活跃度数据统计方法、电子装置及存储介质 | |
CN109086309A (zh) | 一种指标维度关系定义方法、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |