CN110990692A - 基于画像分析的数据处理方法及装置 - Google Patents

基于画像分析的数据处理方法及装置 Download PDF

Info

Publication number
CN110990692A
CN110990692A CN201911116260.4A CN201911116260A CN110990692A CN 110990692 A CN110990692 A CN 110990692A CN 201911116260 A CN201911116260 A CN 201911116260A CN 110990692 A CN110990692 A CN 110990692A
Authority
CN
China
Prior art keywords
user
vehicle type
portrait
vehicle
query request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201911116260.4A
Other languages
English (en)
Inventor
王熙
吴峰
郭伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yidianshikong Network Co Ltd
Original Assignee
Shanghai Yidianshikong Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yidianshikong Network Co Ltd filed Critical Shanghai Yidianshikong Network Co Ltd
Priority to CN201911116260.4A priority Critical patent/CN110990692A/zh
Publication of CN110990692A publication Critical patent/CN110990692A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于画像分析的数据处理方法及装置、计算机设备及可读存储介质。该方法包括:接收用户端的车型查询请求,所述车型查询请求包括车型名称;根据所述用户端的车型查询请求,在用户画像数据库和车型画像数据库中分别调取与所述车型查询请求对应的用户画像和车型画像;将所述用户画像和所述车型画像返回至所述用户端展示。本申请解决了相关技术中由于缺少反映车型特点的精准数据导致用户做出购买决策的效率较低的问题。通过本申请,达到了获取反映车型特点的精准数据的目的,从而实现了提高用户作出购买决策的效率的技术效果。

Description

基于画像分析的数据处理方法及装置
技术领域
本申请涉及大数据分析技术领域,具体而言,涉及一种基于画像分析的数据处理方法及装置。
背景技术
通过大数据分析用户画像是辅助企业进行有效的推广,帮助用户进行购买决策的重要手段。由于我们每个人关注的事物都不一样,因此用户属性也因人而异,通过大数据分析,经过数据用户画像分析定向内容信息,向目标用户展现,而用户浏览媒体平台的内容信息,通过已建立用户行为追踪数据仓库和推荐模型,媒体平台在移动互联网媒体进行重定向,进行用户人群的比对,判断是否与信息平台的目标用户匹配,进而向访问用户展示匹配信息等。
在汽车购买服务场景,用户面对不同车型在各大渠道的成千上万条评论时,往往需要花费大量的时间成本来阅读和比较,导致用户作出购买决策的效率较低,因此针对汽车领域相关大数据的统计分析以抽取出用户画像和不同车型画像,对辅助用户做出购买决策来说尤为重要。
针对相关技术中由于缺少反映车型特点的精准数据导致用户做出购买决策的效率较低的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种基于画像分析的数据处理方法及装置、计算机设备及可读存储介质,以解决相关技术中由于缺少对汽车领域的用户画像和车型画像的数据分析导致用户做出购买决策的效率较低的问题。
为了实现上述目的,根据本申请的第一方面,提供了一种基于画像分析的数据处理方法。
根据本申请的基于画像分析的数据处理方法包括:接收用户端的车型查询请求,所述车型查询请求包括车型名称;根据所述用户端的车型查询请求,在用户画像数据库和车型画像数据库中分别调取与所述车型查询请求对应的用户画像和车型画像;将所述用户画像和所述车型画像返回至所述用户端展示。
进一步地,所述接收用户端的车型查询请求之前包括:获取用户的基本信息和车型评论信息,所述用户的基本信息包括用户ID及与所述用户ID对应的车型ID;基于所述用户的基本信息构建所述用户画像数据库;基于所述车型评论信息构建所述车型画像数据库。
进一步地,所述接收用户端的车型查询请求之前包括:在网站中爬取用户的车型评论信息;对所述车型评论信息进行语义分析,以提取与所述车型评论信息对应的关键词;基于所述关键词为所述车型评论信息对应的车型标记上车型画像标签及与所述车型画像标签对应的权重。
进一步地,所述接收用户端的车型查询请求之前包括:获取用户的属性信息,所述用户的属性信息包括车型ID、用户ID、用户性别、用户所在地和用户年龄;基于所述车型ID和所述用户ID,分别将所述用户性别、所述用户所在地和所述用户年龄在所述车型ID维度进行数量统计;基于数量统计的结果为所述车型ID标记上用户画像标签及与所述用户画像标签对应的权重。
进一步地,所述用户画像包括用户画像标签及对应的权重,所述车型画像包括车型画像标签及对应的权重,所述将所述用户画像和所述车型画像返回至所述用户端展示包括:根据用户的车型查询请求调取与所述车型查询请求对应的所述用户画像标签和所述车型画像标签;判断所述用户画像标签和/或所述车型画像标签中是否存在反义标签;如果存在,则将所述反义标签及对应的权重在所述用户端并排显示。
为了实现上述目的,根据本申请的第二方面,提供了一种基于画像分析的数据处理装置。
根据本申请的基于画像分析的数据处理装置包括:接收模块,用于接收用户端的车型查询请求,所述车型查询请求包括车型名称;调取模块,用于根据所述用户端的车型查询请求,在用户画像数据库和车型画像数据库中分别调取与所述车型查询请求对应的用户画像和车型画像;返回模块,用于将所述用户画像和所述车型画像返回至所述用户端展示。
进一步地,所述装置还包括:第一获取模块,用于获取用户的基本信息和车型评论信息,所述用户的基本信息包括用户ID及与所述用户ID对应的车型ID;第一构建模块,用于基于所述用户的基本信息构建所述用户画像数据库;第二构建模块,用于基于所述车型评论信息构建所述车型画像数据库。
进一步地,所述装置还包括:爬取模块,用于在网站中爬取用户的车型评论信息;提取模块,用于对所述车型评论信息进行语义分析,以提取与所述车型评论信息对应的关键词;第一标记模块,用于基于所述关键词为所述车型评论信息对应的车型标记上车型画像标签及与所述车型画像标签对应的权重。
为了实现上述目的,根据本申请的第三方面,提供了一种计算机设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如前所述的方法。
为了实现上述目的,根据本申请的第三方面,提供了一种计算机可读存储介质,其特征在于,其上存储有计算机指令,所述指令被处理器执行时实现如前所述方法的步骤。
在本申请实施例中,采用接收用户端的车型查询请求,所述车型查询请求包括车型名称;根据所述用户端的车型查询请求,在用户画像数据库和车型画像数据库中分别调取与所述车型查询请求对应的用户画像和车型画像的方式,通过将所述用户画像和所述车型画像返回至所述用户端展示,达到了获取反映车型特点的精准数据的目的,从而实现了提高用户作出购买决策的效率的技术效果,进而解决了相关技术中由于缺少反映车型特点的精准数据导致用户做出购买决策的效率较低的问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请第一实施例的基于画像分析的数据处理方法的流程示意图;
图2是根据本申请第二实施例的基于画像分析的数据处理方法的流程示意图;
图3是根据本申请第三实施例的基于画像分析的数据处理方法的流程示意图;
图4是根据本申请第四实施例的基于画像分析的数据处理方法的流程示意图;
图5是根据本申请第五实施例的基于画像分析的数据处理方法的流程示意图;
图6是根据本申请第一实施例的基于画像分析的数据处理装置的组成结构示意图;以及
图7是根据本申请第二实施例的基于画像分析的数据处理装置的组成结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本发明实施例,提供了一种基于画像分析的数据处理方法,如图1所示,该方法包括如下的步骤S101至步骤S103:
步骤S101,接收用户端的车型查询请求,所述车型查询请求包括车型名称。
具体实施时,用户可以通过发起车型查询请求获取相关车型的详细信息,包括该款车型的基本性能信息、价格信息及用户使用信息等,以为自己的购车决策作参考。因此首先需要获取用户端发送的车型查询请求,所述请求可以包括车型名称等信息。
步骤S102,根据所述用户端的车型查询请求,在用户画像数据库和车型画像数据库中分别调取与所述车型查询请求对应的用户画像和车型画像。
具体实施时,在得到用户发送的车型查询请求后,根据用户的请求在预设画像数据库中调取与该款车型相关的画像信息,所述预设画像数据库包括用户画像数据库和车型画像数据库,用户画像数据库是指基于使用每款车型的用户特点构建的数据库,车型画像数据库是指基于每款车型本身的性能特点构建的数据库,车型本身的性能特点可以基于用户对车型的评论数据来获得。
步骤S103,将所述用户画像和所述车型画像返回至所述用户端展示。
具体实施时,当根据用户请求查询的车型信息在数据库中调取到与之相关的用户画像和车型画像数据后,将该数据返回至用户端进行查看,以使用户通过用户画像和车型画像数据了解该款车型的受众特点和性能特点,例如,根据该款车型的受众特点了解到该款车型的受众主要为年轻的女性用户,根据该款车型的性能特点主要为油耗小、空间大等。本申请通过预先构建的画像数据库,为用户提供了精准全面的车型信息,提高了用户做出购车决策的效率。
作为本申请实施例的一种优选实施方式,如图2所示,所述接收用户端的车型查询请求之前包括如下的步骤S201至步骤S203:
步骤S201,获取用户的基本信息和车型评论信息,所述用户的基本信息包括用户ID及与所述用户ID对应的车型ID。
具体实施时,在接收用户的车型查询请求之前,需要事先构建用户画像数据库和车型画像数据库,所述用户画像数据库主要基于用户的基本信息如用户ID信息及对应的车型信息、年龄和性别信息等来构建,所述车型画像数据库主要基于海量用户针对每款车型的评论或评价数据来构建,因此首先需要获取用户基本信息及车型评论信息。
步骤S202,基于所述用户的基本信息构建所述用户画像数据库。
具体实施时,在得到用户的基本信息如用户ID信息及对应的车型信息、年龄和性别信息之后,基于用户的ID信息及与用户ID对应的车型ID,对每个车型在年龄和性别等维度的用户数据分别进行统计,以抽离出每款车型的用户画像数据,基于每款车型的用户画像数据形成用户画像数据库。
步骤S203,基于所述车型评论信息构建所述车型画像数据库。
具体实施时,在得到用户针对每款车型的评论或评价信息后,对这些信息进行一系列如语义分析、提取关键词、标记标签等处理后,以抽离出每款车型的画像数据,基于每款车型的画像数据形成车型画像数据库。
作为本申请实施例的一种优选实施方式,如图3所示,所述接收用户端的车型查询请求之前包括如下的步骤S301至步骤S303:
步骤S301,在网站中爬取用户的车型评论信息。
具体实施时,在构建车型画像数据库时,首先需要从各大汽车网站的车系评论区爬取相关的用户评论数据,或者在各大社交网络、媒体、搜索引擎中爬取对应的评论内容,还可以在各种汽车应用程序中获取用户的评价信息。当然车型评论信息的具体来源不限于此,本领域技术人员可以根据实际需求进行灵活选择,在此不做赘述。
步骤S302,对所述车型评论信息进行语义分析,以提取与所述车型评论信息对应的关键词。
具体实施时,在收集到海量的车型评论数据后,需要先对这些评论数据进行预处理,包括数据清洗、数据筛选等,然后对与处理后得到的评论数据进行语义分析,进行分词处理,提取出每款车型每条评论的关键词信息。
步骤S303,基于所述关键词为所述车型评论信息对应的车型标记上车型画像标签及与所述车型画像标签对应的权重。
具体实施时,在得到每款车型每条评论的关键词信息后,需要对关键词信息进行统计汇总,根据统计汇总后的结果为每款车型标记上对应的画像标签,并基于关键词的统计结果设置每个画像标签的权重大小,例如,“奥迪A4L”车型的评论中提取出的关键词为“空间大”、“省油”、“空间大”,则对关键词汇总后,将“空间大”这一关键词对应的标签的权重设置为2,将“省油”这一关键词对应的标签的权重设置为1。
作为本申请实施例的一种优选实施方式,如图4所示,所述接收用户端的车型查询请求之前包括如下的步骤S401至步骤S403:
步骤S401,获取用户的属性信息,所述用户的属性信息包括车型ID、用户ID、用户性别、用户所在地和用户年龄。
具体实施时,在构建用户画像数据库时,首先需要获取用户的属性信息,例如用户的性别、年龄及地区信息,以作为后续反映每款车型用户画像的不同维度。
步骤S402,基于所述车型ID和所述用户ID,分别将所述用户性别、所述用户所在地和所述用户年龄在所述车型ID维度进行数量统计。
具体实施时,在得到上述多个维度的用户属性信息后,需要建立每个属性与用户ID和车型ID的关联关系,之后统计每款车型用户性别分布、用户所在地分布及用户年龄分布情况。例如,在统计奥迪A4L车系的用户分布情况时发现,购买和使用奥迪A4L车系的用户主要分布在上海地区、年龄在30-40岁之间的男性用户群体中。
步骤S403,基于数量统计的结果为所述车型ID标记上用户画像标签及与所述用户画像标签对应的权重。
具体实施时,在对每款车型的用户分布情况进行统计之后,根据用户的年年龄分布、性别分布及用户所在地分布情况分别为每款车型标记上用户画像标签及对应的权重大小。例如,经统计,“奥迪A4L”车型的用户年龄分布主要集中在30-40岁,则为其打上“年轻用户群体”的标签,性别分布主要集中在男性用户中,则为其打上“男性用户群体”的标签等,并根据统计结果分别设置每个标签的权重大小。
作为本申请实施例的一种优选实施方式,如图5所示,所述用户画像包括用户画像标签及对应的权重,所述车型画像包括车型画像标签及对应的权重,所述将所述用户画像和所述车型画像返回至所述用户端展示包括如下的步骤S501至步骤S503:
步骤S501,根据用户的车型查询请求调取与所述车型查询请求对应的所述用户画像标签和所述车型画像标签。
具体实施时,在接收到用户发送的车型查询请求后,根据用户的请求在预设画像数据库中调取与该车型相关的用户画像标签和车型画像标签,以使用户了解该车型的用户群体特点和性能特点。
步骤S502,判断所述用户画像标签和/或所述车型画像标签中是否存在反义标签。
具体实施时,在调取到与用户所要查询的车型信息相关的用户画像标签和车型画像标签后,需要进一步判断标签中是否存在反义标签,例如“空间大”和“空间小”即为一组反义标签。
步骤S503,如果存在,则将所述反义标签及对应的权重在所述用户端并排显示。
具体实施时,如果与用户所要查询的车型相关的用户画像标签或车型画像标签中存在反义标签,则将反义标签并排在用户端进行显示,以方便用户进行比对,例如将“空间大”这一标签及对应的权重10与“空间小”这一标签及对应的权重1排在一起,用户可以直接确定该款车型更倾向于“空间大”这一画像标签。
从以上的描述中,可以看出,本发明实现了如下技术效果:本申请基于用户评论和用户数据,构建了不同车型的评论画像标签和用户画像标签,使得购车用户可以一目了然地确定该车型的全部画像信息,不再需要花大量时间成本去逐一分析和归纳,提高了用户的购车决策效率。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,还提供了一种用于实施上述基于画像分析的数据处理方法的装置,如图6所示,该装置包括:接收模块1、调取模块2和返回模块3。
本申请实施例的接收模块1,用于接收用户端的车型查询请求,所述车型查询请求包括车型名称。
具体实施时,用户可以通过发起车型查询请求获取相关车型的详细信息,包括该款车型的基本性能信息、价格信息及用户使用信息等,以为自己的购车决策作参考。因此首先需要通过接收模块获取用户端发送的车型查询请求,所述请求可以包括车型名称等信息。
本申请实施例的调取模块2,用于根据所述用户端的车型查询请求,在用户画像数据库和车型画像数据库中分别调取与所述车型查询请求对应的用户画像和车型画像。
具体实施时,在得到用户发送的车型查询请求后,通过调取模块根据用户的请求在预设画像数据库中调取与该款车型相关的画像信息,所述预设画像数据库包括用户画像数据库和车型画像数据库,用户画像数据库是指基于使用每款车型的用户特点构建的数据库,车型画像数据库是指基于每款车型本身的性能特点构建的数据库,车型本身的性能特点可以基于用户对车型的评论数据来获得。
本申请实施例的返回模块3,用于将所述用户画像和所述车型画像返回至所述用户端展示。
具体实施时,当根据用户请求查询的车型信息在数据库中调取到与之相关的用户画像和车型画像数据后,通过返回模块将该数据返回至用户端进行查看,以使用户通过用户画像和车型画像数据了解该款车型的受众特点和性能特点,例如,根据该款车型的受众特点了解到该款车型的受众主要为年轻的女性用户,根据该款车型的性能特点主要为油耗小、空间大等。本申请通过预先构建的画像数据库,为用户提供了精准全面的车型信息,提高了用户做出购车决策的效率。
作为本申请实施例的一种优选实施方式,如图7所示,所述装置还包括:第一获取模块4、第一构建模块5和第二构建模块6。
本申请实施例的第一获取模块4,用于获取用户的基本信息和车型评论信息,所述用户的基本信息包括用户ID及与所述用户ID对应的车型ID。
具体实施时,在接收用户的车型查询请求之前,需要事先构建用户画像数据库和车型画像数据库,所述用户画像数据库主要基于用户的基本信息如用户ID信息及对应的车型信息、年龄和性别信息等来构建,所述车型画像数据库主要基于海量用户针对每款车型的评论或评价数据来构建,因此首先需要通过第一获取模块获取用户基本信息及车型评论信息。
本申请实施例的第一构建模块5,用于基于所述用户的基本信息构建所述用户画像数据库。
具体实施时,在得到用户的基本信息如用户ID信息及对应的车型信息、年龄和性别信息之后,基于用户的ID信息及与用户ID对应的车型ID,通过第一构建模块对每个车型在年龄和性别等维度的用户数据分别进行统计,以抽离出每款车型的用户画像数据,基于每款车型的用户画像数据形成用户画像数据库。
本申请实施例的第二构建模块6,用于基于所述车型评论信息构建所述车型画像数据库。
具体实施时,在得到用户针对每款车型的评论或评价信息后,通过第二构建模块对这些信息进行一系列如语义分析、提取关键词、标记标签等处理后,以抽离出每款车型的画像数据,基于每款车型的画像数据形成车型画像数据库。
作为本申请实施例的一种优选实施方式,所述装置还包括:爬取模块,用于在网站中爬取用户的车型评论信息;提取模块,用于对所述车型评论信息进行语义分析,以提取与所述车型评论信息对应的关键词;第一标记模块,用于基于所述关键词为所述车型评论信息对应的车型标记上车型画像标签及与所述车型画像标签对应的权重。
作为本申请实施例的一种优选实施方式,所述装置包括:第二获取模块,获取用户的属性信息,所述用户的属性信息包括车型ID、用户ID、用户性别、用户所在地和用户年龄;统计模块,用于基于所述车型ID和所述用户ID,分别将所述用户性别、所述用户所在地和所述用户年龄在所述车型ID维度进行数量统计;第二标记模块,用于基于数量统计的结果为所述车型ID标记上用户画像标签及与所述用户画像标签对应的权重。
作为本申请实施例的一种优选实施方式,所述返回模块包括:调取单元,用于根据用户的车型查询请求调取与所述车型查询请求对应的所述用户画像标签和所述车型画像标签;判断单元,用于判断所述用户画像标签和/或所述车型画像标签中是否存在反义标签;显示单元,用于如果存在,则将所述反义标签及对应的权重在所述用户端并排显示。
上述各模块和各单元的具体连接关系及所发挥的作用请参照方法部分的具体描述,在此不做赘述。
根据本发明实施例,还提供了一种计算机设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如前所述的方法。
根据本发明实施例,还提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被处理器执行时实现如前所述方法的步骤。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于画像分析的数据处理方法,其特征在于,包括:
接收用户端的车型查询请求,所述车型查询请求包括车型名称;
根据所述用户端的车型查询请求,在用户画像数据库和车型画像数据库中分别调取与所述车型查询请求对应的用户画像和车型画像;
将所述用户画像和所述车型画像返回至所述用户端展示。
2.根据权利要求1所述的基于画像分析的数据处理方法,其特征在于,所述接收用户端的车型查询请求之前包括:
获取用户的基本信息和车型评论信息,所述用户的基本信息包括用户ID及与所述用户ID对应的车型ID;
基于所述用户的基本信息构建所述用户画像数据库;
基于所述车型评论信息构建所述车型画像数据库。
3.根据权利要求1所述的基于画像分析的数据处理方法,其特征在于,所述接收用户端的车型查询请求之前包括:
在网站中爬取用户的车型评论信息;
对所述车型评论信息进行语义分析,以提取与所述车型评论信息对应的关键词;
基于所述关键词为所述车型评论信息对应的车型标记上车型画像标签及与所述车型画像标签对应的权重。
4.根据权利要求1所述的基于画像分析的数据处理方法,其特征在于,所述接收用户端的车型查询请求之前包括:
获取用户的属性信息,所述用户的属性信息包括车型ID、用户ID、用户性别、用户所在地和用户年龄;
基于所述车型ID和所述用户ID,分别将所述用户性别、所述用户所在地和所述用户年龄在所述车型ID维度进行数量统计;
基于数量统计的结果为所述车型ID标记上用户画像标签及与所述用户画像标签对应的权重。
5.根据权利要求1所述的基于画像分析的数据处理方法,其特征在于,所述用户画像包括用户画像标签及对应的权重,所述车型画像包括车型画像标签及对应的权重,所述将所述用户画像和所述车型画像返回至所述用户端展示包括:
根据用户的车型查询请求调取与所述车型查询请求对应的所述用户画像标签和所述车型画像标签;
判断所述用户画像标签和/或所述车型画像标签中是否存在反义标签;
如果存在,则将所述反义标签及对应的权重在所述用户端并排显示。
6.一种基于画像分析的数据处理装置,其特征在于,包括:
接收模块,用于接收用户端的车型查询请求,所述车型查询请求包括车型名称;
调取模块,用于根据所述用户端的车型查询请求,在用户画像数据库和车型画像数据库中分别调取与所述车型查询请求对应的用户画像和车型画像;
返回模块,用于将所述用户画像和所述车型画像返回至所述用户端展示。
7.根据权利要求6所述的基于画像分析的数据处理装置,其特征在于,还包括:
第一获取模块,用于获取用户的基本信息和车型评论信息,所述用户的基本信息包括用户ID及与所述用户ID对应的车型ID;
第一构建模块,用于基于所述用户的基本信息构建所述用户画像数据库;
第二构建模块,用于基于所述车型评论信息构建所述车型画像数据库。
8.根据权利要求6所述的基于画像分析的数据处理装置,其特征在于,还包括:
爬取模块,用于在网站中爬取用户的车型评论信息;
提取模块,用于对所述车型评论信息进行语义分析,以提取与所述车型评论信息对应的关键词;
第一标记模块,用于基于所述关键词为所述车型评论信息对应的车型标记上车型画像标签及与所述车型画像标签对应的权重。
9.一种计算机设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至5中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机指令,所述指令被处理器执行时实现如权利要求1至5中任一项所述方法的步骤。
CN201911116260.4A 2019-11-13 2019-11-13 基于画像分析的数据处理方法及装置 Withdrawn CN110990692A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911116260.4A CN110990692A (zh) 2019-11-13 2019-11-13 基于画像分析的数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911116260.4A CN110990692A (zh) 2019-11-13 2019-11-13 基于画像分析的数据处理方法及装置

Publications (1)

Publication Number Publication Date
CN110990692A true CN110990692A (zh) 2020-04-10

Family

ID=70084366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911116260.4A Withdrawn CN110990692A (zh) 2019-11-13 2019-11-13 基于画像分析的数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN110990692A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732446A (zh) * 2021-01-15 2021-04-30 腾讯科技(深圳)有限公司 一种任务处理方法、装置及存储介质
CN116962971A (zh) * 2023-07-11 2023-10-27 重庆大学 基于终端信令的汽车行业用户画像构建方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106296368A (zh) * 2016-08-19 2017-01-04 北京好车轰轰电子商务有限公司 一种车型推荐系统和方法
CN107870990A (zh) * 2017-10-17 2018-04-03 北京德塔精要信息技术有限公司 一种汽车推荐方法及装置
CN108537596A (zh) * 2018-04-16 2018-09-14 北京车慧互动广告有限公司 搜索框内车型推荐的方法、装置、系统及存储器
CN108932645A (zh) * 2017-05-26 2018-12-04 车伯乐(北京)信息科技有限公司 一种用户选车系统
CN110298521A (zh) * 2018-03-21 2019-10-01 天津五八到家货运服务有限公司 用车推荐方法及装置
CN110298684A (zh) * 2019-05-22 2019-10-01 平安科技(深圳)有限公司 车型匹配方法、装置、计算机设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106296368A (zh) * 2016-08-19 2017-01-04 北京好车轰轰电子商务有限公司 一种车型推荐系统和方法
CN108932645A (zh) * 2017-05-26 2018-12-04 车伯乐(北京)信息科技有限公司 一种用户选车系统
CN107870990A (zh) * 2017-10-17 2018-04-03 北京德塔精要信息技术有限公司 一种汽车推荐方法及装置
CN110298521A (zh) * 2018-03-21 2019-10-01 天津五八到家货运服务有限公司 用车推荐方法及装置
CN108537596A (zh) * 2018-04-16 2018-09-14 北京车慧互动广告有限公司 搜索框内车型推荐的方法、装置、系统及存储器
CN110298684A (zh) * 2019-05-22 2019-10-01 平安科技(深圳)有限公司 车型匹配方法、装置、计算机设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732446A (zh) * 2021-01-15 2021-04-30 腾讯科技(深圳)有限公司 一种任务处理方法、装置及存储介质
CN112732446B (zh) * 2021-01-15 2022-07-12 腾讯科技(深圳)有限公司 一种任务处理方法、装置及存储介质
CN116962971A (zh) * 2023-07-11 2023-10-27 重庆大学 基于终端信令的汽车行业用户画像构建方法及装置

Similar Documents

Publication Publication Date Title
WO2019095417A1 (zh) 广告实时推荐方法、装置、终端设备及存储介质
US20080103893A1 (en) System and method for generating forecasted bids for advertisement keywords
CN109325179A (zh) 一种内容推广的方法及装置
WO2014018781A1 (en) Data refining engine for high performance analysis system and method
KR20130083838A (ko) 임팩트 분석 및 영향 트랙킹을 포함한 복수의 미디어에 대한 데이터 수집, 트랙킹 및 분석
CN109840782A (zh) 点击率预测方法、装置、服务器以及存储介质
CN112380859A (zh) 舆情信息的推荐方法、装置、电子设备及计算机存储介质
CN111209400B (zh) 一种数据分析的方法及装置
CN112269805A (zh) 数据处理方法、装置、设备及介质
CN103605715A (zh) 用于多个数据源的数据整合处理方法和装置
CN108229999B (zh) 竞品评估方法及装置
CN106202371B (zh) 媒体文件的处理方法、装置和广告分析方法
CN111737443B (zh) 答案文本的处理方法和装置、关键文本的确定方法
CN110502687B (zh) 一种网站优化方法和装置
CN110990692A (zh) 基于画像分析的数据处理方法及装置
CN104077288B (zh) 网页内容推荐方法和网页内容推荐设备
US10331713B1 (en) User activity analysis using word clouds
CA2850883A1 (en) Image processing
CN106383857A (zh) 一种信息处理方法及电子设备
CN113469752A (zh) 内容推荐方法、装置、存储介质及电子设备
CN112561636A (zh) 一种推荐方法、装置、终端设备及介质
KR100939907B1 (ko) 밸류 포인트를 이용한 광고 노출 방법 및 시스템
CN112685618A (zh) 用户特征识别方法、装置、计算设备及计算机存储介质
US20200120059A1 (en) Method for selecting second messages for online inserting said second messages in social network content
CN106815196B (zh) 软文展现次数统计方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200410