CN110276012A - 一种可视化用户画像的生成方法、装置和计算设备 - Google Patents

一种可视化用户画像的生成方法、装置和计算设备 Download PDF

Info

Publication number
CN110276012A
CN110276012A CN201910560384.5A CN201910560384A CN110276012A CN 110276012 A CN110276012 A CN 110276012A CN 201910560384 A CN201910560384 A CN 201910560384A CN 110276012 A CN110276012 A CN 110276012A
Authority
CN
China
Prior art keywords
user
browsing
content
clue
website
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910560384.5A
Other languages
English (en)
Inventor
罗龙
范辰杰
陈述
王奕雯
田德山
黄文珂
韩曙
何倩
杨朦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Chezhiyi Communication Information Technology Co Ltd
Original Assignee
Hainan Chezhiyi Communication Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan Chezhiyi Communication Information Technology Co Ltd filed Critical Hainan Chezhiyi Communication Information Technology Co Ltd
Priority to CN201910560384.5A priority Critical patent/CN110276012A/zh
Publication of CN110276012A publication Critical patent/CN110276012A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种可视化用户画像的生成方法,适于在计算设备中执行,该方法包括步骤:基于用户行为日志生成网站用户的用户特征,该用户特征包括属性特征、价值特征和需求特征,且每种特征按照预定规则划分为多个级别;收集线索用户在不同浏览阶段的浏览行为和浏览内容,所述线索用户指在网站中留下意向线索的用户;对不同浏览阶段的浏览行为和浏览内容进行机器学习,得到行为预测模型,并根据该行为预测模型预测网站用户的当前浏览阶段;以及将属性特征、价值特征和需求特征作为三个坐标轴参数生成三维可视模型,并在该模型中标记各网站用户的用户特征和当前浏览阶段。本发明还一并公开了相应的可视化用户画像的生成装置和计算设备。

Description

一种可视化用户画像的生成方法、装置和计算设备
技术领域
本发明涉及计算机及互联网技术领域,尤其涉及一种可视化用户画像的生成方法、装置和计算设备。
背景技术
随着互联网技术的快速发展和电子商务的日渐普及,网络信息资源的数量急剧增长,内容提供商总是希望能够为用户推荐更多感兴趣或者需要的商品资源。在进行内容推广时,如果能够得到网站用户们的三维可视画像,将用户画像进行网页级的可视化呈现,则可大大方便使用者对用户们的数据直观分析,提高推广内容和用户的匹配度。但目前还比较缺少这种用户画像的三维可视化呈现方案,该领域中也缺少可直接应用的技术。
发明内容
为此,本发明提供一种可视化用户画像的生成方法、装置和计算设备,以力图解决或至少缓解上面存在的问题。
根据本发明的一个方面,提供一种可视化用户画像的生成方法,适于在计算设备中执行,该方法包括步骤:基于用户行为日志生成网站用户的用户特征,其中用户特征包括属性特征、价值特征和需求特征,且每种特征按照预定规则划分为多个级别;收集线索用户在不同浏览阶段的浏览行为和浏览内容,其中线索用户指在网站中留下意向线索的用户;对不同浏览阶段的浏览行为和浏览内容进行机器学习,得到行为预测模型,并根据该行为预测模型预测网站用户的当前浏览阶段;以及将属性特征、价值特征和需求特征作为三个坐标轴参数生成三维可视模型,并在该模型中标记各网站用户的用户特征和当前浏览阶段。
可选地,在根据本发明的方法中,还包括步骤:分析线索用户在不同浏览阶段的浏览行为和浏览内容,得到不同浏览阶段的关键影响内容和内容形式;以及结合网站用户的用户特征、当前浏览阶段、以及不同浏览阶段的关键影响内容和内容形式,向网站用户推荐匹配程度高的内容。
可选地,在根据本发明的方法中,属性特征包括城市级别和年龄代际,价值特征包括家庭收入,需求特征包括产品属性偏好和产品价位偏好。
可选地,在根据本发明的方法中,三维可视模型由多个单元立方体组成,且其每个坐标轴的单位刻度和最大刻度分别为对应特征的单个级别和最大级别。
可选地,在根据本发明的方法中,还包括步骤:统计用户特征定位在各单元立方体的用户数量;将所有单元立方体按照用户数量进行降序排序,并为每个单元立方体生成一个与排序相对应的索引号;以及将具有最大用户数量的单元立方体的透明度设置为1,并将其他单元立方体的透明度设置为其用户数量与最大用户数量的比值。
可选地,在根据本发明的方法中,还包括步骤:计算每个单元立方体所包括的用户数量在所有立方体所包括的用户数量的比例,作为对应单元立方体的占比;以及对所有单元立方体按照预定梯度值进行梯度聚类处理,分别得到核心人群占比在前n%(0≤n≤100)的立方体群体。
可选地,在根据本发明的方法中,还包括步骤:结合各单元立方体的占比和相邻单元立方体之间的距离,将多个单元立方体聚合为多个族群;以及为每个族群生成一种显色标记,并标记每个族群的人群特征,该人群特征为族群的主要用户特征。
可选地,在根据本发明的方法中,相邻单元立方体之间的距离为相邻单元立方体的用户特征的相似度。
可选地,在根据本发明的方法中,还包括步骤:综合族群中所有单元立方体的占比来计算族群的占比,并将多个族群按照族群的占比进行降序排序,以分别显示具有不同占比的族群。
可选地,在根据本发明的方法中,价值特征还包括价值观,需求特征还包括产品特点偏好、产品国别偏好、产品系列偏好、栏目偏好、竞品偏好、内容偏好中的一种或多种。
可选地,在根据本发明的方法中,生成网站用户的用户特征的步骤包括:综合网站用户对具有不同需求特征的内容的浏览时长和浏览行为,计算网站用户对不同需求特征的偏好度,并将该偏好度与对应的需求特征关联存储。
可选地,在根据本发明的方法中,收集线索用户在不同浏览阶段的浏览行为和浏览内容的步骤包括:生成线索用户宽表,该线索用户宽表包括线索用户的标识、联系方式、以及留下意向线索时的时间、产品和厂家;以及根据线索用户的标识查找线索用户的行为日志,得到线索用户在不同浏览阶段的浏览行为和浏览内容。
可选地,在根据本发明的方法中,浏览阶段包括关注期、粗选期、兴趣期、偏好期和意向期中的一种或多种;浏览行为包括点赞、收藏、主动搜索和对某产品留下联系方式中的一种或多种;以及关键影响内容包括行业入门性内容、产品介绍性内容、竞品比较性内容、价格计算性内容中的一种或多种。
可选地,在根据本发明的方法中,网站用户的价值观适于根据以下方法获取:通过对调研用户的多个价值观问题的回答语句进行分析得到调研用户的价值观;以及将该价值观作为与调研用户具有其他相同或相似用户特征的网站用户的价值观。
根据本发明的另一个方面,提供一种可视化用户画像的生成装置,适于驻留在计算设备中,该装置包括:特征生成模块,适于基于用户行为日志生成网站用户的用户特征,所述用户特征包括属性特征、价值特征和需求特征,且每种特征按照预定规则划分为多个级别;内容收集模块,适于收集线索用户在不同浏览阶段的浏览行为和浏览内容,其中线索用户指在网站中留下意向线索的用户;阶段预测模块,适于对线索用户在不同浏览阶段的浏览行为和浏览内容进行机器学习,得到行为预测模型,并根据该行为预测模型预测网站用户的当前浏览阶段;以及可视化模块,适于将属性特征、价值特征和需求特征作为三个坐标轴参数生成三维可视模型,并在该三维可视模型中标记各网站用户的用户特征和当前浏览阶段。
可选地,在根据本发明的装置中,还包括内容推荐模块,适于:分析所述线索用户在不同浏览阶段的浏览行为和浏览内容,得到不同浏览阶段的关键影响内容和内容形式;以及结合网站用户的用户特征、当前浏览阶段、以及不同浏览阶段的关键影响内容和内容形式,向网站用户推荐匹配程度高的内容。
可选地,在根据本发明的装置中,属性特征包括城市级别和年龄代际,价值特征包括家庭收入,需求特征包括产品属性偏好和产品价位偏好。
可选地,在根据本发明的装置中,三维可视模型由多个单元立方体组成,且其每个坐标轴的单位刻度和最大刻度分别为对应特征的单个级别和最大级别。
根据本发明的又一个方面,提供一种计算设备,包括:一个或多个处理器;存储器;以及一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,该一个或多个程序被处理器执行时实现如上所述的可视化用户画像的生成方法的步骤。
根据本发明的又一个方面,提供一种存储一个或多个程序的计算机可读存储介质,该一个或多个程序包括指令,该指令当由计算设备执行时实现如上所述的可视化用户画像的生成方法的步骤。
根据本发明的技术方案,能够得到网站的属性特征U、价值特征V和需求特征N等用户特征,并预测各网站用户当前所处的浏览阶段B。之后,以用户的UVN三个维度来生成用户画像的三维可视模型,该模型中包括用户的用户特征和当前浏览阶段。这种三维呈现方式能够帮助厂商直观地发现其目标用户的分布、主要分群和核心人群占比筛选等,以便进行针对性的内容推荐。
进一步地,本发明还可以结合该网站用户的用户特征来向该用户推荐与其当前浏览阶段最为匹配的内容。该方案能够进行更精准的推广投放,提高用户打开内容到实际线索全过程的转化效率,达到用户、媒体平台和投放客户的三方最佳匹配。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的计算设备100的结构框图;
图2示出了根据本发明一个实施例的可视化用户画像的生成方法200的流程图;
图3和图4分别示出了根据本发明一个实施例的UVN-B三维可视模型的示意图;以及
图5示出了根据本发明一个实施例的可视化用户画像的生成装置500的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1是根据本发明一个实施例的计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。程序数据124包括指令,在根据本发明的计算设备100中,程序数据124包含用于执行可视化用户画像的生成方法200的指令。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备100可以实现为服务器,例如文件服务器、数据库服务器、应用程序服务器和WEB服务器等,也可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中,计算设备100被配置为执行可视化用户画像的生成方法200。
图2示出了根据本发明一个实施例的可视化用户画像的生成方法200的流程示意图。方法200在计算设备中执行,如在计算设备100中执行,以便对网站用户进行特征行为分析,从而进行用户画像的三维可视化展示。
如图2所示,方法200始于步骤S210。在步骤S210中,基于用户行为日志生成网站用户的用户特征。
其中,用户行为日志例如可以是媒体平台浏览行为日志,该日志中还可包含用户所浏览的每页内容的页面内容标记(也就是企业定义的文章内容的唯一ID),根据该页面内容标记可以关联出文章内容的分类标签信息,如该页面内容中所包含的产品系列、内容所在栏目、产品价格、产品所属国别等。
用户特征通常包括属性特征U、价值特征V和需求特征N,每种特征都可以预定规则划分为多个级别。属性特征可以包括城市级别和年龄代际,价值特征例如包括家庭收入和价值观,需求特征例如包括产品属性偏好和产品价位偏好。这些单个特征也同样可以分为多个级别。存在多种划分特征级别的方式,本发明都不受限于此,所有可以进行有效级别划分的方式都在本发明的保护范围之内。
对于属性特征U而言,城市级别可以划分一线城市至六线城市这六个级别,年龄代际可以将用户分为70前、70后、80后、90后和00后等,当然均不限于此,还可以划分为其他级别或按其他标准划分。这样属性特征U的多个级别可以如图3中所示,U4.6级别代表四线城市70前,U3.6级别代表三线城市70前,U2.8级别代表二线城市80后,U1.9级别代表一线城市90后。应当理解的是,图3中将属性特征分为22个级别,其中考虑购买需求的因素忽略了五线和六线城市的70前,实际在数据统计时也可以将两种客户群体加上。
对于价值特征V而言,家庭收入可以划分多个级别(如五个级别),其中V1级别可代表10万以内,V2级别代表10-20万,V3级别代表20-30万,V4级别代表30-40万,V5级别代表50万以上。当然不限于此,也可进行其他标准划分。对应于家庭收入值,还可以将网站用户划分为蓝领、白领、中产、精英等层级。另外,在进行价值特征分级时还可以加入对价值观的考虑,如用户属于保守型消费还是刺激型消费,用户更追求舒适度、宽敞性、实用性还是更追求外观。将家庭收入和用户的价值观结合起来进行价值特征分级,其具体结合及分级方法本领域技术人员可以根据需要自行设定,本发明对此不作限制。例如,V1代表10万以内保守型消费群,V2代表10万以内刺激型消费群,等等。
根据一个实施例,可以根据以下方法获取网站用户的价值观:通过对调研用户的多个价值观问题的回答语句进行分析得到调研用户的价值观,并将该价值观作为与调研用户具有其他相同或相似用户特征的网站用户的价值观。其中,调研用户是指完成了调研问卷的用户,该问卷中包含多个价值观问题,通过对这些答案进行语句和情感分析,能大致得到用户的消费观价值观。这样,若某个网站用户与某调研用户在其他用户特征方面都比较相同或相似,就可将该调研用户的价值观作为该网站用户的价值观。
对于需求特征N而言,产品价格偏好可以根据产品本身的行业价格高低值来划分第一级别、第二级别、第三级别等等。比如汽车行业可以划为分8万以下车型、8-10万车型、10-15万车型、15-20万车型、20-25万车型、25-30万车型、30-50万车型、50万以上车型等,对应的可分别标识为N0级别、N8级别、N10级别、N15级别、N20级别、N30级别和N50级别。当然也可以选择其他数值划分标准,本发明对此不作限制。产品属性偏好代表该产品的属性,如汽车产品可分为SUV型车和轿车,空调产品可分为壁挂式空调和立柜式空调,等等。因此,可以相应地在价位级别后加上该产品的属性,如N20.S代表20-25万SUV,N20.C代表20-25万轿车。
此外,需求特征还可以包括产品级别偏好、产品特点偏好、产品国别偏好、产品系列偏好、栏目偏好、竞品偏好和内容偏好中的一种或多种。其中,产品级别偏好可以划分为低端产品、中端产品、和高端产品等级别,还可以加入中低端产品、中高端产品这两个过渡级别,当然不限于此。产品级别偏好也可以认为是产品型号偏好,如微型产品、小型产品、紧凑型产品、中型产品、中大型产品、大型产品等。产品特点偏好也就是用户最关心的产品的卖点,例如汽车类产品用户的产品特点偏好包括外观、品牌、动力、油耗、排气量、优惠比例、用户口碑等。产品系列偏好是指用户更偏好产品的哪一系列,栏目偏好例如包括咨讯类栏目偏好、测评类栏目偏好、一级栏目、二级栏目等,竞品偏好即用户同时在看的一种或两种竞品产品,内容偏好即用户更偏好文章里包含哪些内容。
根据一个实施例,可以对各项需求特征进行打分,来计算用户对各项需求的偏好度。具体地,可以综合网站用户对具有不同需求特征(如某内容更偏好某品牌或更偏好外观等)的内容的浏览时长和浏览行为,来计算网站用户对不同需求特征的偏好度,并将该偏好度与对应的需求特征关联存储。其中,浏览行为例如可以包括点赞、收藏、主动搜索和对某产品留下联系方式等。对于需求特征的打分方式,本领域技术人员可以根据需要自行设定,本发明不作限制。例如,浏览时长每超过30s,分值加1;每发生一次浏览行为(如点赞),分值加2。若一篇内容中代表的是中端产品、动力型、咨询类文章,用户浏览时长2分钟,点赞1次、收藏1次,则该内容中这三种偏好的分值均为8。将该用户所浏览的所有内容中具有同类需求特征偏好的分值进行合并,即可计算得到该用户对某需求特征的偏好度。
此外,每个网站用户的用户特征可以用数据元组形式存储,例如用(Ua,Vb,Nc)表示,其中,a、b、c分别代表对应特征的级别数值。(U2.8,V3,N20.C)代表用户为二线城市80后、家庭收入20-30万,偏好20-25万轿车。此外,该元组中还可以包括用户对不同需求特征的偏好度,如产品特点偏好度P1、产品国别偏好度P2、产品系列偏好度P3、栏目偏好度P4、竞品偏好度P5等等,得到(Ua,Vb,Nc,P1,P2,P3……)。而且,每种偏好度中可以把同类的偏好度都统计出来,也可以只统计偏好度最大的那一项,如产品特点偏好度P1可以把动力偏好度、品牌偏好度、油耗偏好度等都写入到用户特征表达中,也可以只写入这些产品特点中偏好度最大的一项。
随后,在步骤S220中,收集线索用户在不同浏览阶段的浏览行为和浏览内容。
这里,线索用户指在网站中留下意向线索的用户,具体是指完成了所有浏览阶段并留下了意向线索的用户,意向线索一般指产生了询价操作、预约实体操作或留下联系方式等,留下意向线索也可以称之为下线索。例如,用户经过多个浏览阶段后最终对某款X型车进行了预约试驾操作,则该用户为线索用户。通过回溯线索用户的过往浏览行为和浏览内容,可以将用户的浏览阶段划分为关注期、粗选期、兴趣期、偏好期和意向期,比如关注期开始关注相关产品,粗选期是对相关产品的粗略选择期,兴趣器对某些相似的竞品产品比较感兴趣,偏好期更偏好某些特定产品,完成意向期一般代表用户比较具有购买意向。另外,不同浏览阶段可以用不同的标识表示,如分别用B1-B5表示。
根据一个实施例,可以将线索用户下线索时的时间、联系方式、产品和厂家、线索分发情况、以及该线索用户的标识记录下来,生成线索用户宽表。其中,根据线索用户的标识可以关联到后台数据库,提炼出线索用户在下线索之前的行为。也就是,可以根据线索用户的标识查找线索用户的行为日志,得到线索用户在不同浏览阶段的浏览行为和浏览内容。根据一个实施例,可以根据线索用户标识在线索表中关联到用户cookie,通过手机号获取线索用户下线索时的信息,通过cookie从浏览表中获取用户的各种浏览、评论、点赞等行为信息并处理成相应的特征。
随后,在步骤S230中,对线索用户在不同浏览阶段的浏览行为和浏览内容进行机器学习,得到行为预测模型,并根据该行为预测模型预测网站用户的当前浏览阶段。
需要说明的是,存在多种对内容进行机器学习来生成预测模型的方法,本发明都不受限于此,所有可以生成能够根据用户的浏览行为和浏览内容预测用户的浏览阶段的预测模型的方式都在本发明的保护范围之内。根据一个实施例,可以将每个浏览阶段的浏览行为和浏览内容处理为相应的行为特征,例如每个浏览阶段内每个页面内容的浏览次数、点赞次数、收藏次数和浏览时长等,进一步地还可以将这多个行为特征处理为特征向量。这样,就可以收集网站用户近期(如最近两天内)的浏览行为和浏览内容,生成对应的行为特征或特征向量后,就可输入到该预测模型中得到该网站用户的当前浏览阶段。基于此,所存储的网站用户的用户特征元组中还可以加上其当年浏览阶段B,B可以取值1-5,代表不同的浏览阶段。
结合线索用户下线索时的时间,对线索用户下线索之前的浏览行为和浏览内容进行回溯,可以划分出不同的浏览阶段,并挖掘出不同浏览阶段的关键影响内容和内容形式。该关键影响内容例如可以包括行业入门性内容、产品介绍性内容、竞品比较性内容、价格计算性内容等。该内容形式例如图文类介绍、视频类介绍等。这里,每个浏览阶段内都有用户更感兴趣的内容和形式,例如意向期用户可能更需要产品价格计算,此时其关键影响内容可以是价格计算性内容,如产品报价、贷款计算、利息介绍等内容。
根据本发明的一个实施例,还可以结合网站用户的用户特征、当前浏览阶段、以及不同浏览阶段的关键影响内容,向网站用户推荐与其匹配程度高的内容。这样就在用户和内容上同时建立了UVN-B四个维度的标签,保证内容的定制性,实现用户和内容的匹配。这样所推荐的能够最大可能的引起用户的点击和浏览兴趣,提高内容打开到线索生成的转换率。
例如,若某网站用户的用户特征为二线城市80后、家庭收入20-30万,偏好20-25万轿车、处于关注期则可以多向该用户推荐20-25万的同类型竞品轿车。当然,如果用户的特征和浏览阶段是用特征元组为(U2.8,V3,N20.C,B2)表示,则也可以直接根据该特征元组来解析对应的用户特征等,并进行内容推荐。进一步地,若该用户的用户特征还包括其各项偏好度的值,比如相应的特征元组(Ua,Vb,Nc,P1,P2,P3,……,B)为(U2.8,V3,N20.C,70%,60%,65%,……,B2),其中P1为动力偏好度,P2为德系产品偏好度,P3为五系产品偏好度,则可以多向用户推荐20-25万动力较好偏德系且与该五系产品相同或相似的产品。
接着,在步骤S240中,将属性特征、价值特征和需求特征作为三个坐标轴参数生成三维可视模型,并在该模型中标记各网站用户的用户特征和当前浏览阶段。
如图3和图4所示,以属性特征、价值特征和需求特征作为UVN坐标系的三个坐标轴参数生成网站用户的UVN-B三维可视模型,每个坐标轴的单位刻度和最大刻度分别为对应特征的单个级别和最大级别。如图3中通过交叉UVN三个维度可以得到UVN自然分布,其中V轴有五个单位刻度,最大刻度为五级。该三维可视模型由多个单元立方体组成,每个单元立方体都有其对应的用户特征。根据某用户的三维用户特征,可将该用户唯一定位在对应的单元立方体中。例如,当某用户是六线城市80后,家庭年收入在10-20万之间,偏好10-15万的紧凑型SUV,该用户就落在“六线城市-80后-V2-10-15万紧凑型SUV”的自然UVN小块中。每个单元立方体中可存储定位在该单元立方体中的网站用户的用户标识、用户特征和当前浏览阶段。
此外,UVN-B三维可视模型中的单元立方体支持根据数据做热度渲染,以透明度显示,不同的单元立方体还可以设置不同的透明度,以代表该立方体中的用户数量。具体地,可以统计用户特征定位在每个单元立方体的用户数量,将所有单元立方体按照用户数量进行降序排序。之后,将具有最大用户数量的单元立方体的透明度设置为1,并将其他单元立方体的透明度设置为其用户数量与最大用户数量的比值。其中,若计算得到的透明度小于最小值(如0.3),则将透明度设置为该最小值,也就是立方体的透明度最小不会低于0.3,以保证所有立方体都处以可以查看的程度。另外,还可以为每个单元立方体生成一个与排序相对应的索引号,方便使用者能够快速定位到高密度立方体,提高数据分析效率。
进一步地,还可以计算每个单元立方体所包括的用户数量在所有立方体所包括的用户数量的比例,作为对应单元立方体的占比,并对所有单元立方体按照预定梯度值进行梯度聚类处理,以分别得到核心人群占比在前n%(0≤n≤100)的立方体群体。其中,预定梯度值可以是10%,当然不限于此,也可以是其他数值。具体地,按照用户数量降序排序的单元立方体,其对应的也是占比的降序排序,从最大占比的块开始累计,当达到目标占比总值(如达到60%、70%、80%等)时停止,得到这些计入目标占比总值的单元立方体。
另外,本发明可以在三维可视模型中设置标尺进度条,对应多个占比总值,其可以使用canvas等常用方法绘制,结合算法实现刻度选择及动画效果。使用者选择某个占比总值时,就可显示当前全量用户中占比为该数值的群体,方便使用者进行高密度方块群的分析。例如,图4中的标尺进度条分别可以显示出核心人群占比为0%、10%、……、100%的群体,全量用户为5170699人,包含1787个单元立方体;当选择核心人群占比为70%,显示的是图4中的群体,其共有3628145人,包含120个单元立方体。
而且,本发明还支持用户战略分群,具体可结合各单元立方体的占比和相邻单元立方体之间的距离,通过聚类算法将多个单元立方体聚合为多个族群(如8-9个族群),此时还可以计算出每个族群所包含人数在总人数的占比。其中,相邻单元立方体之间的距离可以认为是相邻单元立方体的用户特征的相似度。存在多种距离计算算法和同类聚类算法,本发明不受限于这些算法的具体形式,所有可以计算相邻立方体的距离,并根据该距离和占比来实现同类族群的聚类的方法都在本发明的保护范围之内。
例如,将模型中同属于五六线城市80后、价值级别在二三级、偏好10-15万轿车且立方体占比满足某预定值的用户划分为一个族群,该族群的人群特征为低线级城市80后白领、偏好10-15万轿车。这里考虑立方体占比的因素主要是为了排除那些占比非常小、用户数量非常少的单元立方体,降低数据计算量,提高计算效率。用户分群可以根据每个用户的(Ua,Vb,Nc)特征元组来实现,具有相同或相似级别数值的用户可以划分到一个族群。在上述例子中,该族群的用户们的属性特征级别均为U5.8或U6.8,价值特征级别均为V2或V3,需求特征级别为N10.C。根据一个实施例,还可计算每种特特征的相似度,当每种特征的相似度都满足一定阈值(如85%)时可认为是同个族群。
此外,还可以为每个族群生成一种显色标记,如族群1区用红色显示,族群2区用蓝色显示,以区分显示不同的族群。进一步地,还可以标记每个族群的人群特征,该人群特征为族群的主要用户特征,如该族群的用户的主要买点偏好、价位偏好、系列偏好、栏目偏好等等。进一步地,还可以标记各用户特征的比例和处于各浏览阶段的比例,如偏好外观的有多少比例,偏好动力的有多少比例,处于关注期的有多少比例,等等。也就是,本发明将自然分布的UVN小块根据小块的密度及彼此之间的距离通过算法聚合成大的族群,并以该族群的主要特征来命名这个族群,令使用者能快速抓住主要族群的人群特征来制定营销方案,向该族群中的网站用户推荐与该族群匹配程度高的内容。
通常可以用下拉菜单的方式对主要族群进行排序显示,具体可按照族群占比进行降序排序,以分别单独显示不同族群分布。此外,还可以在下拉菜单第一栏中列入全部项,用于查看全部族群。如图3中右上角所示,第一项为全部用户,第二项为族群占比第一位的“低线级城市80后白领,偏好10-15万轿车”的族群。当用户在下拉菜单中选择某个族群后,或者当用户的鼠标焦点位于三维可视模型中某族群的显色区时,就显示出该族群的人群特征描述,该人群特征描述可在图下方区域(如图3中在左下角的“人群包基本属性”区)显示,也可以该族群的显色区旁边显示,本发明对此不作限制。
进一步地,本发明还可以设置轮盘选择器,分别对应Top1、Top2、……、Top10等族群单元的快速定位与展示,其可以使用平面几何算法,结合鼠标焦点事件来实现轮盘的前滚、回滚和定位等功能,方便使用者能够快速对核心族群进行定位和分析。
需要说明的是,本发明在进行用户分群和UVN-B三维可视模型生成时,可针对全量网站用户来实现,不同于依赖市场调研随机抽样做出的用户分群,本发明在制定用户策略时,可实际触达每个用户而达成营销落地。当然,也可以专门筛选符合预定条件的网站用户来进行用户分群和三维可视模型生成,其筛选条件可以是任何条件,可以由使用者自行定义,如“选择90天内看过某车的网站用户”、“选择80天内看过某品牌的网站用户”。根据一定的筛选条件选择符合条件的网站用户。例如,图3中圈选的是“90天看过X车的网站用户”,这些用户占全量五百多万用户的89%。线索用户可参与用户分群和三维模型的生成(如使用者主要关注转换率时),也可以不参与,本发明对此不作限制。
另外,关于三维模型的前端可视化实现过程,可以分别绘制主体容器、绘制坐标轴、绘制单元立方体并生成族群功能。主体容器是一个网格组成的长方体,一个面的网格由多条横线和多条纵线组成。定义1为一个方格的尺寸,可以根据U、V、N三个轴两两结合得出6个平面的横线和总线的数量,之后使用Three库中绘制线段的方法来绘制横线和纵线,将横线和纵线交叉出来的网格面进行定位处理,最终得到一个网格立方体。绘制坐标轴中,根据U、V、N坐标轴的数组长度,也就是确定每个轴所划分的级别数,得到坐标轴线段的长度,并将坐标轴的原点定位在立方体的左下角位置。
绘制轴标签时,可先使用canvas绘制文字,并将文字贴图应用在Three的纹理上,之后根据标签在数组中的位置确定其在坐标轴上的位置。绘制小立方体时,用单元数据中的U、V、N值去匹配UVN坐标轴中的对应索引值,得到单元立方体在容器中的具体位置,然后绘制单位为1的小立方体,并对该立方体定位在计算好的位置上。在生成族群功能时,对族群数组进行遍历,每个族群分配一个颜色,该族群所包含的所有立方体都为该颜色,且查看单个族群时,将其他族群的数据过滤掉。
这种三维可视模型使用Three库,通过算法实现三维坐标轴,根据单个数据的具体属性,将小立方体对应到相应位置,支持3D模型的放大、缩小和旋转。坐标轴支持翻转,当旋转立方体背面时,坐标轴可以进行对应的切换。模型具有可扩展性和复用性,且对计算机的性能要求较低,即使在性能不好的计算机也可以流畅显示。使用精确控制来保证3D模型的整体性能,保证在低配电脑可以稳定渲染。整个模型还可使用多种设计模式,如在观察者模式下进行全局通信交互,在策略模式下进行内容分发动作等。
图5示出了根据本发明一个实施例的可视化用户画像的生成装置500,该装置500可以包含在如图1所示的计算设备100中。如图5所示,装置500包括特征生成模块510、内容收集模块520、阶段预测模块530和可视化模块540。
特征生成模块510基于用户行为日志生成网站用户的用户特征。其中,用户特征包括属性特征、价值特征和需求特征,属性特征包括城市级别和年龄代际,价值特征包括家庭收入,需求特征包括产品属性偏好和产品价位偏好。特征生成模块510可以进行与上面在步骤S210中描述的处理相对应的处理,这里不再展开赘述。
内容收集模块520收集线索用户在不同浏览阶段的浏览行为和浏览内容。内容收集模块520可以收集线索用户的标识和联系方式生成线索用户宽表,并根据该线索用户的标识查找线索用户的行为日志,得到其在不同浏览阶段的浏览行为和浏览内容。内容收集模块520可以进行与上面在步骤S220中描述的处理相对应的处理,这里不再展开赘述。
阶段预测模块530对线索用户在不同浏览阶段的浏览行为和浏览内容进行机器学习,得到行为预测模型,并根据该行为预测模型预测网站用户的当前浏览阶段。阶段预测模块530可以进行与上面在步骤S230中描述的处理相对应的处理,这里不再展开赘述。
可视化模块540将属性特征、价值特征和需求特征作为三个坐标轴参数生成三维可视模型,并在该三维可视模型中标记各网站用户的用户特征和当前浏览阶段。可视化模块540支持透明度热度渲染、核心人群展示、不同占比展示、族群聚类颜色展示、多种设计模式展示、标尺控制条和轮盘选择器展示等,其可以进行与上面在步骤S240中描述的处理相对应的处理,这里不再展开赘述。
根据本发明的一个实施例,装置500还可以内容推荐模块(图中未示出)该内容推荐模块分析线索用户在不同浏览阶段的浏览行为和浏览内容,得到不同浏览阶段的关键影响内容和内容形式。之后,结合网站用户的用户特征、当前浏览阶段、以及不同浏览阶段的关键影响内容,向网站用户推荐与其匹配程度高的内容。该内容推荐模块的内容推荐过程已在基于图2-图4中的描述中详细公开,这里不再展开赘述。
根据本发明的技术方案,打通了线索用户和浏览用户的特征,结合线索用户的线索画像数据和网站用户的流量画像数据,建立UVN-B用户分群模型,并结合数据曝光转化的全过程链数据来优化内容推荐,支持全站所有产品的UVN-B用户微分群及数据三维可视化展现。三维热力图将三维模型进行网页级可视化,支持旋转和放大功能,同时保证视觉效果和网速体验。模型提供核心人群占比筛选和Top10人群单元的快速定位与展示,在进行战略分群展示时还包括整体属性描述与人群单元属性描述。这些都可帮助使用者直观高效的发现其目标用户的分布和主要分群,并制定相应的市场和营销策略,提高打开推广内容到实际线索全过程的转化效率,使用户、媒体平台和广告投放方达到三方共赢的状态。
A8、如A7所述的方法,其中,所述相邻单元立方体之间的距离为相邻单元立方体的用户特征的相似度。A9、如A7所述的方法,还包括步骤:综合族群中所有单元立方体的占比来计算族群的占比,并将所述多个族群按照所述族群的占比进行降序排序,以分别显示具有不同占比的族群。A10、如A1-A9中任一项所述的方法,其中,所述价值特征还包括价值观,所述需求特征还包括产品特点偏好、产品国别偏好、产品系列偏好、栏目偏好、竞品偏好、内容偏好中的一种或多种。A11、如A1-A10中任一项所述的方法,所述生成网站用户的用户特征的步骤包括:综合所述网站用户对具有不同需求特征的内容的浏览时长和浏览行为,计算所述网站用户对不同需求特征的偏好度,并将该偏好度与对应的需求特征关联存储。
A12、如A1所述的方法,所述收集线索用户在不同浏览阶段的浏览行为和浏览内容的步骤包括:生成线索用户宽表,所述线索用户宽表包括所述线索用户的标识、联系方式、以及留下意向线索时的时间、产品和厂家;以及根据线索用户的标识查找线索用户的行为日志,得到线索用户在不同浏览阶段的浏览行为和浏览内容。A13、如A1-A12中任一项所述的方法,其中,所述浏览阶段包括关注期、粗选期、兴趣期、偏好期和意向期中的一种或多种;所述浏览行为包括点赞、收藏、主动搜索和对某产品留下联系方式中的一种或多种;以及所述关键影响内容包括行业入门性内容、产品介绍性内容、竞品比较性内容、价格计算性内容中的一种或多种。A14、如A3所述的方法,其中,所述网站用户的价值观适于根据以下方法获取:通过对调研用户的多个价值观问题的回答语句进行分析得到所述调研用户的价值观;以及将该价值观作为与所述调研用户具有其他相同或相似用户特征的网站用户的价值观。
B16、如B15所述的装置,还包括内容推荐模块,适于:分析所述线索用户在不同浏览阶段的浏览行为和浏览内容,得到不同浏览阶段的关键影响内容和内容形式;以及结合所述网站用户的用户特征、当前浏览阶段、以及所述不同浏览阶段的关键影响内容和内容形式,向所述网站用户推荐匹配程度高的内容。B17、如B15所述的装置,其中,所述属性特征包括城市级别和年龄代际,所述价值特征包括家庭收入,所述需求特征包括产品属性偏好和产品价位偏好。B18、如B15所述的装置,其中,所述三维可视模型由多个单元立方体组成,且其每个坐标轴的单位刻度和最大刻度分别为对应特征的单个级别和最大级别。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的可视化用户画像的生成方法。
以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。
在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种可视化用户画像的生成方法,适于在计算设备中执行,所述方法包括步骤:
基于用户行为日志生成网站用户的用户特征,所述用户特征包括属性特征、价值特征和需求特征,且每种特征按照预定规则划分为多个级别;
收集线索用户在不同浏览阶段的浏览行为和浏览内容,所述线索用户指在网站中留下意向线索的用户;
对所述不同浏览阶段的浏览行为和浏览内容进行机器学习,得到行为预测模型,并根据所述行为预测模型预测所述网站用户的当前浏览阶段;以及
将所述属性特征、价值特征和需求特征作为三个坐标轴参数生成三维可视模型,并在该模型中标记各网站用户的用户特征和当前浏览阶段。
2.如权利要求1所述的方法,还包括步骤:
分析所述线索用户在不同浏览阶段的浏览行为和浏览内容,得到不同浏览阶段的关键影响内容和内容形式;以及
结合所述网站用户的用户特征、当前浏览阶段、以及所述不同浏览阶段的关键影响内容和内容形式,向所述网站用户推荐匹配程度高的内容。
3.如权利要求1或2所述的方法,其中,所述属性特征包括城市级别和年龄代际,所述价值特征包括家庭收入,所述需求特征包括产品属性偏好和产品价位偏好。
4.如权利要求1所述的方法,其中,所述三维可视模型由多个单元立方体组成,且其每个坐标轴的单位刻度和最大刻度分别为对应特征的单个级别和最大级别。
5.如权利要求1-4中任一项所述的方法,还包括步骤:
统计用户特征定位在各单元立方体的用户数量;
将所有单元立方体按照用户数量进行降序排序,并为每个单元立方体生成一个与排序相对应的索引号;以及
将具有最大用户数量的单元立方体的透明度设置为1,并将其他单元立方体的透明度设置为其用户数量与最大用户数量的比值。
6.如权利要求1-5中任一项所述的方法,还包括步骤:
计算每个单元立方体所包括的用户数量在所有立方体所包括的用户数量的比例,作为对应单元立方体的占比;以及
对所有单元立方体按照预定梯度值进行梯度聚类处理,分别得到核心人群占比在前n%(0≤n≤100)的立方体群体。
7.如权利要求1-6中任一项所述的方法,还包括步骤:
结合各单元立方体的占比和相邻单元立方体之间的距离,将所述多个单元立方体聚合为多个族群;以及
为每个族群生成一种显色标记,并标记每个族群的人群特征,所述人群特征为族群的主要用户特征。
8.一种可视化用户画像的生成装置,适于驻留在计算设备中,所述装置包括:
特征生成模块,适于基于用户行为日志生成网站用户的用户特征,所述用户特征包括属性特征、价值特征和需求特征,且每种特征按照预定规则划分为多个级别;
内容收集模块,适于收集线索用户在不同浏览阶段的浏览行为和浏览内容,所述线索用户指在网站中留下意向线索的用户;
阶段预测模块,适于对所述线索用户在不同浏览阶段的浏览行为和浏览内容进行机器学习,得到行为预测模型,并根据所述行为预测模型预测所述网站用户的当前浏览阶段;以及
可视化模块,适于将所述属性特征、价值特征和需求特征作为三个坐标轴参数生成三维可视模型,并在该三维可视模型中标记各网站用户的用户特征和当前浏览阶段。
9.一种计算设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序被处理器执行时实现权利要求1-7任一项所述的方法的步骤。
10.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时实现权利要求1-7任一项所述的方法的步骤。
CN201910560384.5A 2019-06-26 2019-06-26 一种可视化用户画像的生成方法、装置和计算设备 Pending CN110276012A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910560384.5A CN110276012A (zh) 2019-06-26 2019-06-26 一种可视化用户画像的生成方法、装置和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910560384.5A CN110276012A (zh) 2019-06-26 2019-06-26 一种可视化用户画像的生成方法、装置和计算设备

Publications (1)

Publication Number Publication Date
CN110276012A true CN110276012A (zh) 2019-09-24

Family

ID=67963401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910560384.5A Pending CN110276012A (zh) 2019-06-26 2019-06-26 一种可视化用户画像的生成方法、装置和计算设备

Country Status (1)

Country Link
CN (1) CN110276012A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110853144A (zh) * 2019-11-13 2020-02-28 车智互联(北京)科技有限公司 一种数据展示方法
CN110968802A (zh) * 2019-12-04 2020-04-07 上海风秩科技有限公司 一种用户特征的分析方法、分析装置及可读存储介质
CN111210201A (zh) * 2020-01-02 2020-05-29 平安科技(深圳)有限公司 职业标签建立方法、装置、电子设备及存储介质
CN111523944A (zh) * 2020-04-26 2020-08-11 北京深演智能科技股份有限公司 浏览数据处理方法、装置、非易失性存储介质和处理
CN111680121A (zh) * 2020-05-07 2020-09-18 车智互联(北京)科技有限公司 一种内容评估方法、计算设备及存储介质
CN114417021A (zh) * 2022-01-24 2022-04-29 中国电子科技集团公司第五十四研究所 一种基于时、空、义多约束融合的语义信息精准分发方法
CN116805255A (zh) * 2023-06-05 2023-09-26 深圳市瀚力科技有限公司 基于用户画像分析的广告自动优化投放系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2677758A1 (en) * 2012-06-19 2013-12-25 Thomson Licensing Mind opening content recommending system
CN106056407A (zh) * 2016-06-03 2016-10-26 北京网智天元科技股份有限公司 基于用户行为分析的网银用户画像方法及设备
CN106779788A (zh) * 2015-11-24 2017-05-31 北京易车互联信息技术有限公司 汽车服务信息推送方法和装置
CN106844787A (zh) * 2017-03-16 2017-06-13 四川大学 一种为汽车行业寻找目标用户并匹配目标产品的推荐方法
CN107332878A (zh) * 2017-06-05 2017-11-07 北京三快在线科技有限公司 信息的推送方法及装置、电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2677758A1 (en) * 2012-06-19 2013-12-25 Thomson Licensing Mind opening content recommending system
CN106779788A (zh) * 2015-11-24 2017-05-31 北京易车互联信息技术有限公司 汽车服务信息推送方法和装置
CN106056407A (zh) * 2016-06-03 2016-10-26 北京网智天元科技股份有限公司 基于用户行为分析的网银用户画像方法及设备
CN106844787A (zh) * 2017-03-16 2017-06-13 四川大学 一种为汽车行业寻找目标用户并匹配目标产品的推荐方法
CN107332878A (zh) * 2017-06-05 2017-11-07 北京三快在线科技有限公司 信息的推送方法及装置、电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘勇 等: "基于动态用户画像的信息推荐研究", 《计算机系统应用》 *
鲍彬斌: ""寒冬"之下 经销商破局之路在何方?", 《HTTPS://WWW.AUTOHOME.COM.CN/NEWS/201904/933199.HTML》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110853144A (zh) * 2019-11-13 2020-02-28 车智互联(北京)科技有限公司 一种数据展示方法
CN110968802A (zh) * 2019-12-04 2020-04-07 上海风秩科技有限公司 一种用户特征的分析方法、分析装置及可读存储介质
CN110968802B (zh) * 2019-12-04 2023-05-05 上海风秩科技有限公司 一种用户特征的分析方法、分析装置及可读存储介质
CN111210201A (zh) * 2020-01-02 2020-05-29 平安科技(深圳)有限公司 职业标签建立方法、装置、电子设备及存储介质
CN111523944A (zh) * 2020-04-26 2020-08-11 北京深演智能科技股份有限公司 浏览数据处理方法、装置、非易失性存储介质和处理
CN111680121A (zh) * 2020-05-07 2020-09-18 车智互联(北京)科技有限公司 一种内容评估方法、计算设备及存储介质
CN111680121B (zh) * 2020-05-07 2024-04-12 车智互联(北京)科技有限公司 一种内容评估方法、计算设备及存储介质
CN114417021A (zh) * 2022-01-24 2022-04-29 中国电子科技集团公司第五十四研究所 一种基于时、空、义多约束融合的语义信息精准分发方法
CN114417021B (zh) * 2022-01-24 2023-08-25 中国电子科技集团公司第五十四研究所 一种基于时、空、义多约束融合的语义信息精准分发方法
CN116805255A (zh) * 2023-06-05 2023-09-26 深圳市瀚力科技有限公司 基于用户画像分析的广告自动优化投放系统
CN116805255B (zh) * 2023-06-05 2024-04-23 深圳市瀚力科技有限公司 基于用户画像分析的广告自动优化投放系统

Similar Documents

Publication Publication Date Title
CN110276012A (zh) 一种可视化用户画像的生成方法、装置和计算设备
CN110287415A (zh) 一种内容推荐方法、装置和计算设备
US20220114199A1 (en) System and method for information recommendation
Batty et al. From cells to cities
CN106251174A (zh) 信息推荐方法及装置
CN107704485A (zh) 一种职位推荐方法及计算设备
US20230360155A1 (en) Systems and methods for facilitating parcel combination
CN104239338A (zh) 信息推荐方法及装置
CN107786943A (zh) 一种用户分群方法及计算设备
US20140358665A1 (en) Predictive Item Bundling Recommendation Systems And Methods
CN109582876A (zh) 旅游行业用户画像构造方法、装置和计算机设备
CN110147882A (zh) 神经网络模型的训练方法、人群扩散方法、装置及设备
CN104331411A (zh) 推荐项目的方法和装置
CN102486802A (zh) 基于吸引的数据可视化
WO2011087904A1 (en) Matching of advertising sources and keyword sets in online commerce platforms
WO2020150611A1 (en) Systems and methods for entity performance and risk scoring
CN111831894A (zh) 一种信息匹配方法及装置
CN104937630A (zh) 用于不动产资产的在线拍卖的估价工具
CN108563794A (zh) 基于高阶奇异值分解的上下文推荐方法及装置
CN112348300A (zh) 用于推送信息的方法和装置
CN116188052A (zh) 共享车辆的投放方法、装置、计算机设备和存储介质
CN117033760A (zh) 一种对象推荐方法、装置、设备、存储介质及程序产品
CN115238179A (zh) 项目推送方法、装置、电子设备及计算机可读存储介质
CN115049429A (zh) 增益预测方法、装置和计算机设备
CN114417161A (zh) 基于异构图的虚拟物品时序推荐方法、装置、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190924