CN112507204A - 一种利用数据分析自动组建用户画像的方法 - Google Patents

一种利用数据分析自动组建用户画像的方法 Download PDF

Info

Publication number
CN112507204A
CN112507204A CN201910871257.7A CN201910871257A CN112507204A CN 112507204 A CN112507204 A CN 112507204A CN 201910871257 A CN201910871257 A CN 201910871257A CN 112507204 A CN112507204 A CN 112507204A
Authority
CN
China
Prior art keywords
user
data
characteristic
behavior
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910871257.7A
Other languages
English (en)
Inventor
刘海峰
蒋子鹏
黄溅华
黄中媛
马昌治
李翔
曹郎鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhilian Yunhai Technology Co ltd
Original Assignee
Beijing Zhilian Yunhai Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhilian Yunhai Technology Co ltd filed Critical Beijing Zhilian Yunhai Technology Co ltd
Priority to CN201910871257.7A priority Critical patent/CN112507204A/zh
Publication of CN112507204A publication Critical patent/CN112507204A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种利用数据分析自动组建用户画像的方法,包括:S1、根据业务端的若干个目标标签及所述若干个目标标签间的逻辑关系生成语义树,根据所述语义树生成查询代码;S2、将所述查询代码发送给数据端,以供数据端基于所述查询代码对储存在所述数据端中的用户画像数据进行查询,并获取目标数据;S3、将目标数据进行数据编码,生成个性化的用户标签;本方法通过对用户的基础数据及与基础数据对应的用户行为日志分别进行分类和分析,能较好地建立用户分类模型和用户行为模型,进行分析并获取不同用户的用户画像。

Description

一种利用数据分析自动组建用户画像的方法
技术领域
本发明涉及智能数据分析技术领域,具体涉及一种利用数据分析 自动组建用户画像的方法。
背景技术
移动互联网的进步,为人们的生活方式和消费模式带来了巨大转 变,商家的营销方式也必须同步升级才能在巨变中求得生存。随着大 数据技术的深入研究与应用,商家的专注点日益聚焦于大数据精准营 销、深入挖掘潜商业价值上,因此,基于大数据技术的“用户画像” 概念,也日渐被商家关注和提及。
在科技资源供需对接中,供方的科技成果与需方的科技需求都是 庞大的,对于供方而言,其科技资源数据是详细的、庞大的,作为科 技成果展示是明确清晰的,但是作为科技成果输出是乏力的,这是科 技资源供需对接方式决定的。大多数情况下,科技资源供需双方需求 并不能匹配。其主要原因在于供需双方拥有信息不对等,一方面,供 方未能根据市场需求细分占有的科技资源,也无法快速得知需方的意 愿;另一方面,需方对自己需求描述不够详尽或描述的需求特征与供 方设想相差较大。这导致了当前供需双方科技资源对接极为困难。当 供需双方完成充足准备工作的结果时,才能完成科技资源对接,这大 大降低了科技资源供需对接效率。即使没有充足的准备工作,需方也 需要经过多次搜索调研才能知道想要的供方信息,同时,在需方不断 检索中,其使用的检索式是由供方提供的,该检索式细分度不够,同 时索引构建并非遵从需方意愿,对需方并不友好,这样的科技资源供 需对接是极不便捷的。
用户画像,即用户信息标签化,就是通过收集与分析消费者社会 属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一 个用户的商业全貌。当基于用户需求去推送信息时,用户的接受度最 大化,精准营销也能以最大程度达到其目的,故而基于用户画像的供 需对接已成为营销模式的必修课。
发明内容
本发明实施例提供了一种利用数据分析自动组建用户画像的方 法,实现了业务方自主取数,降低了业务方与用户画像方的需求沟通 成本,释放了用户画像方的数据查询压力,提高了用户画像取数效率, 通过对用户的基础数据及与基础数据对应的用户行为日志分别进行 分类和分析,能较好地建立用户分类模型和用户行为模型,进行分析 并获取不同用户的用户画像。
为实现上述目的,本发明提出的技术方案是:一种利用数据分析 自动组建用户画像的方法,其特征在于,包括:
S1、根据业务端的若干个目标标签及所述若干个目标标签间的逻 辑关系生成语义树,根据所述语义树生成查询代码;
S2、将所述查询代码发送给数据端,以供数据端基于所述查询代 码对储存在所述数据端中的用户画像数据进行查询,并获取目标数据;
S3、将目标数据进行数据编码,生成个性化的用户标签;
S4、分别将各所述用户特征中的每一个用户特征作为当前用户特 征,以所述当前用户特征为自变量,以所述用户信用模型的输出值为 因变量,确定所述当前用户特征与所述用户信用模型的映射关系;
S4、判断所述映射关系是否为指定映射关系,
若是,则将所述当前用户特征分类为指定用户特征;
若否,则将所述当前用户特征分类为非指定用户特征;
S5、将用户画像的标签集合发送给控制端,以使得应用所述业务 端的人员能够基于所述用户画像标签集合确定若干个目标标签及所 述若干个目标标签间的逻辑关系;
S6、接收所述业务端返回的所述若干个目标标签及若干个目标标 签间的逻辑关系,并根据目标数据的逻辑关系构建用户数据模型;
S6、将用户数据模型进行解析,解析出用户数据模型偏好数据;
S7、计算出现相同所述目标标签影响数据的频率,如果所述频率 大于预设的频率阈值,则将所述用户环境影响数据作为用户偏好数据, 反之,则不将所述用户环境影响数据作为用户偏好数据。
进一步的,在步骤S4之前,还对用户分类模型进行优化,具体 步骤为:实时采集用户资源供求行为数据,首先,根据用户初始行为 模型将用户资源供求行为数据进行归类分析,得到各类型用户集的行 为特征,根据各类型用户的行为特征演变对用户分类模型进行修正; 其次,根据行为特征将用户资源供求行为数据进行归类分析,得到行 为特征值,根据行为特征值对用户进行分类,进而对用户分类模型进 行修正。
进一步的,所述用户信用模型包括线性处理模块和非线性处理模 块,所述线性处理模块用于将所述指定用户特征集合中各指定用户特 征的用户特征数据进行线性映射,所述非线性处理模块用于将所述非 指定用户特征集合中各非指定用户特征的用户特征数据进行非线性 处理。
本发明的有益效果:
1、实现了业务方自主取数,降低了业务方与用户画像方的需求 沟通成本,释放了用户画像方的数据查询压力,提高了用户画像取数 效率。
2、通过对用户的基础数据及与基础数据对应的用户行为日志分 别进行分类和分析,能较好地建立用户分类模型和用户行为模型,进 行分析并获取不同用户的用户画像。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发 明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明 的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的 具体实施方式。
具体实施方式
以下对本发明实施例作进一步描述,实施例的描述仅为便于理解和应用 本发明,而非对本发明保护的限制。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、 “连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也 可以是可拆卸连接,或成一体;可以是直接相连,也可以通过中间媒 介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。 对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在 本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征 之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括 第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。 而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特 征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第 二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一 特征在第二特征正下方和斜下方,或仅仅表示第一特征水平高度小于 第二特征。
一种利用数据分析自动组建用户画像的方法,其特征在于,包括:
S1、根据业务端的若干个目标标签及所述若干个目标标签间的逻 辑关系生成语义树,根据所述语义树生成查询代码;
S2、将所述查询代码发送给数据端,以供数据端基于所述查询代 码对储存在所述数据端中的用户画像数据进行查询,并获取目标数据;
S3、将目标数据进行数据编码,生成个性化的用户标签;
S4、分别将各所述用户特征中的每一个用户特征作为当前用户特 征,以所述当前用户特征为自变量,以所述用户信用模型的输出值为 因变量,确定所述当前用户特征与所述用户信用模型的映射关系;
S4、判断所述映射关系是否为指定映射关系,
若是,则将所述当前用户特征分类为指定用户特征;
若否,则将所述当前用户特征分类为非指定用户特征;
S5、将用户画像的标签集合发送给控制端,以使得应用所述业务 端的人员能够基于所述用户画像标签集合确定若干个目标标签及所 述若干个目标标签间的逻辑关系;
S6、接收所述业务端返回的所述若干个目标标签及若干个目标标 签间的逻辑关系,并根据目标数据的逻辑关系构建用户数据模型;
S6、将用户数据模型进行解析,解析出用户数据模型偏好数据;
S7、计算出现相同所述目标标签影响数据的频率,如果所述频率 大于预设的频率阈值,则将所述用户环境影响数据作为用户偏好数据, 反之,则不将所述用户环境影响数据作为用户偏好数据。
进一步的,在步骤S4之前,还对用户分类模型进行优化,具体 步骤为:实时采集用户资源供求行为数据,首先,根据用户初始行为 模型将用户资源供求行为数据进行归类分析,得到各类型用户集的行 为特征,根据各类型用户的行为特征演变对用户分类模型进行修正; 其次,根据行为特征将用户资源供求行为数据进行归类分析,得到行 为特征值,根据行为特征值对用户进行分类,进而对用户分类模型进 行修正。
进一步的,所述用户信用模型包括线性处理模块和非线性处理模 块,所述线性处理模块用于将所述指定用户特征集合中各指定用户特 征的用户特征数据进行线性映射,所述非线性处理模块用于将所述非 指定用户特征集合中各非指定用户特征的用户特征数据进行非线性 处理。
该方法提供了一种利用数据分析自动组建用户画像的方法,实现 了业务方自主取数,降低了业务方与用户画像方的需求沟通成本,释 放了用户画像方的数据查询压力,提高了用户画像取数效率,通过对 用户的基础数据及与基础数据对应的用户行为日志分别进行分类和 分析,能较好地建立用户分类模型和用户行为模型,进行分析并获取 不同用户的用户画像。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不 脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于 本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些 改动和变型在内。

Claims (3)

1.一种利用数据分析自动组建用户画像的方法,其特征在于,包括:
S1、根据业务端的若干个目标标签及所述若干个目标标签间的逻辑关系生成语义树,根据所述语义树生成查询代码;
S2、将所述查询代码发送给数据端,以供数据端基于所述查询代码对储存在所述数据端中的用户画像数据进行查询,并获取目标数据;
S3、将目标数据进行数据编码,生成个性化的用户标签;
S4、分别将各所述用户特征中的每一个用户特征作为当前用户特征,以所述当前用户特征为自变量,以所述用户信用模型的输出值为因变量,确定所述当前用户特征与所述用户信用模型的映射关系;
S4、判断所述映射关系是否为指定映射关系,
若是,则将所述当前用户特征分类为指定用户特征;
若否,则将所述当前用户特征分类为非指定用户特征;
S5、将用户画像的标签集合发送给控制端,以使得应用所述业务端的人员能够基于所述用户画像标签集合确定若干个目标标签及所述若干个目标标签间的逻辑关系;
S6、接收所述业务端返回的所述若干个目标标签及若干个目标标签间的逻辑关系,并根据目标数据的逻辑关系构建用户数据模型;
S6、将用户数据模型进行解析,解析出用户数据模型偏好数据;
S7、计算出现相同所述目标标签影响数据的频率,如果所述频率大于预设的频率阈值,则将所述用户环境影响数据作为用户偏好数据,反之,则不将所述用户环境影响数据作为用户偏好数据。
2.根据权利要求1所述的一种利用数据分析自动组建用户画像的方法,其特征在于:在步骤S4之前,还对用户分类模型进行优化,具体步骤为:实时采集用户资源供求行为数据,首先,根据用户初始行为模型将用户资源供求行为数据进行归类分析,得到各类型用户集的行为特征,根据各类型用户的行为特征演变对用户分类模型进行修正;其次,根据行为特征将用户资源供求行为数据进行归类分析,得到行为特征值,根据行为特征值对用户进行分类,进而对用户分类模型进行修正。
3.根据权利要求1所述的一种利用数据分析自动组建用户画像的方法,其特征在于:所述用户信用模型包括线性处理模块和非线性处理模块,所述线性处理模块用于将所述指定用户特征集合中各指定用户特征的用户特征数据进行线性映射,所述非线性处理模块用于将所述非指定用户特征集合中各非指定用户特征的用户特征数据进行非线性处理。
CN201910871257.7A 2019-09-16 2019-09-16 一种利用数据分析自动组建用户画像的方法 Pending CN112507204A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910871257.7A CN112507204A (zh) 2019-09-16 2019-09-16 一种利用数据分析自动组建用户画像的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910871257.7A CN112507204A (zh) 2019-09-16 2019-09-16 一种利用数据分析自动组建用户画像的方法

Publications (1)

Publication Number Publication Date
CN112507204A true CN112507204A (zh) 2021-03-16

Family

ID=74923785

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910871257.7A Pending CN112507204A (zh) 2019-09-16 2019-09-16 一种利用数据分析自动组建用户画像的方法

Country Status (1)

Country Link
CN (1) CN112507204A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106997472A (zh) * 2016-01-25 2017-08-01 阿里巴巴集团控股有限公司 用户信用模型的用户特征分类方法、用户信用评估方法及装置
CN108388572A (zh) * 2018-01-10 2018-08-10 链家网(北京)科技有限公司 一种用户画像取数方法
CN108460100A (zh) * 2018-02-02 2018-08-28 方欣科技有限公司 一种用户画像构建方法及装置
CN108564364A (zh) * 2018-03-12 2018-09-21 重庆小富农康农业科技服务有限公司 一种基于区块链技术和用户精准画像的农村养殖大数据征信系统
CN108647729A (zh) * 2018-05-11 2018-10-12 广东省科技基础条件平台中心 一种用户画像获取方法
CN108764984A (zh) * 2018-05-17 2018-11-06 国网冀北电力有限公司电力科学研究院 一种基于大数据的电力用户画像构建方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106997472A (zh) * 2016-01-25 2017-08-01 阿里巴巴集团控股有限公司 用户信用模型的用户特征分类方法、用户信用评估方法及装置
CN108388572A (zh) * 2018-01-10 2018-08-10 链家网(北京)科技有限公司 一种用户画像取数方法
CN108460100A (zh) * 2018-02-02 2018-08-28 方欣科技有限公司 一种用户画像构建方法及装置
CN108564364A (zh) * 2018-03-12 2018-09-21 重庆小富农康农业科技服务有限公司 一种基于区块链技术和用户精准画像的农村养殖大数据征信系统
CN108647729A (zh) * 2018-05-11 2018-10-12 广东省科技基础条件平台中心 一种用户画像获取方法
CN108764984A (zh) * 2018-05-17 2018-11-06 国网冀北电力有限公司电力科学研究院 一种基于大数据的电力用户画像构建方法及系统

Similar Documents

Publication Publication Date Title
CN105095272B (zh) 基于图像识别的问答处理方法、装置及系统
CN105279672A (zh) 线索推荐
CN109344998A (zh) 一种基于医疗美容场景的客户违约概率预测方法
CN111026853B (zh) 目标问题的确定方法、装置、服务器和客服机器人
CN102421062A (zh) 应用信息推送方法和系统
CN109344655A (zh) 一种基于人脸识别的信息获取方法及系统
CN105488039A (zh) 一种问询方法及装置
CN103970804A (zh) 一种信息查询方法及装置
CN114331512B (zh) 一种可视化数据建模及大数据画像的方法
CN113538070B (zh) 用户生命价值周期检测方法、装置和计算机设备
CN112364622B (zh) 对话文本分析方法、装置、电子装置及存储介质
CN114090755A (zh) 基于知识图谱的回复语句确定方法、装置及电子设备
CN116308497A (zh) 数据处理方法及装置
CN105404681A (zh) 直播情感分类方法及装置
CN117455430B (zh) 基于ai的简历信息处理方法、装置、设备及存储介质
CN109635138B (zh) 一种基于相似相貌的社交关系建立方法与系统
CN111079894B (zh) Bp神经网络模型构建、商家评价方法与装置
CN117217710A (zh) 一种虚拟商品与快捷服务的智能化管理方法及系统
CN112507204A (zh) 一种利用数据分析自动组建用户画像的方法
CN116757855A (zh) 一种智能保险服务方法、装置、设备及存储介质
CN106204207A (zh) 一种账单生成方法和装置
CN115049456A (zh) 金融产品组合的推荐方法及其装置、电子设备
CN112365189A (zh) 案件分配方法及装置
CN113327154A (zh) 基于大数据的电商用户讯息推送方法及系统
CN112328871A (zh) 一种基于rpa模块的回复生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination