CN113312564A - 点评数据排序方法、装置、电子设备及存储介质 - Google Patents

点评数据排序方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113312564A
CN113312564A CN202110607881.3A CN202110607881A CN113312564A CN 113312564 A CN113312564 A CN 113312564A CN 202110607881 A CN202110607881 A CN 202110607881A CN 113312564 A CN113312564 A CN 113312564A
Authority
CN
China
Prior art keywords
user
comment
data
page
comment data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110607881.3A
Other languages
English (en)
Inventor
尹宇飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Securities Co Ltd
Original Assignee
Ping An Securities Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Securities Co Ltd filed Critical Ping An Securities Co Ltd
Priority to CN202110607881.3A priority Critical patent/CN113312564A/zh
Publication of CN113312564A publication Critical patent/CN113312564A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及大数据领域,揭露了一种点评数据排序方法,包括:基于用户在页面点评区域的浏览记录,采集用户的属性信息,并对属性信息进行去异常处理,生成用户标签;根据用户标签,构建用户的用户画像,并根据用户画像,识别用户的用户类型;获取用户在页面点评区域的点评数据,对点评数据进行点评分析,根据点评分析的结果和用户类型,对点评数据进行排序,并将排序后的点评数据返回至页面点评区域。此外,本发明还涉及区块链技术,所述浏览记录可存储于区块链中。另外,本发明还提供了一种点评数据排序装置、电子设备及存储介质。本发明可以实现点评数据排序的灵活性,提高点评数据的排序质量。

Description

点评数据排序方法、装置、电子设备及存储介质
技术领域
本发明涉及大数据领域,尤其涉及一种点评数据排序方法、装置、电子设备及计算机可读存储介质。
背景技术
随着互联网的日益更新,信息量出现井喷式爆炸的同时,各种冗余、重复、无价值的信息也越来越多,面对如此巨大的信息量,信息质量、价值愈加难以甄别。尤其在各大页面点评区域中的恶意作弊现象也日趋严重,导致真正的用户逐渐流失,最终影响提供业务的平台。
目前页面点评区域下点评数据通常是采用单一指标(如点赞/踩数、发布时间)的升序或降序进行排序,并没有考虑发表点评数据对应的用户类型,同时在点评数据排序时缺乏对点评数据进行内容质量筛选,导致有些不具有什么价值的点评数据依然排在页面点评区域的靠前位置,这样容易造成点评数据排序较为单一的现象,从而影响点评数据的排序质量。
发明内容
本发明提供一种点评数据排序方法、装置、电子设备及计算机可读存储介质,其主要目的在于实现点评数据排序的灵活性,以提高点评数据的排序质量。
为实现上述目的,本发明提供的一种点评数据排序方法,包括:
基于用户在页面点评区域的浏览记录,采集所述用户的属性信息,并对所述属性信息进行去异常处理,生成用户标签;
根据所述用户标签,构建所述用户的用户画像,并根据所述用户画像,识别所述用户的用户类型;
获取所述用户在所述页面点评区域的点评数据,对所述点评数据进行点评分析,根据所述点评分析的结果和所述用户类型,对所述点评数据进行排序,并将排序后的点评数据返回至所述页面点评区域。
可选地,所述基于用户在页面点评区域的浏览记录,采集所述用户的属性信息,包括:
获取所述浏览记录对应页面点评区域的url地址,并对所述浏览记录进行字符标识;
根据所述url地址,获取所述浏览记录的页面点评区域信息;
根据所述字符标识,从所述页面点评区域信息中获取用户的属性信息。
可选地,所述对所述属性信息进行去异常处理,生成用户标签,包括:
将所述属性信息转换为字段信息,计算所述字段信息的平均值与标准差;
根据所述标准差,设置所述字段信息的标准差范围,并计算所述字段信息与所述平均值的差值;
若所述差值不在所述标准差范围内,删除所述字段信息对应的属性信息后生成用户标签;
若所述差值在所述标准差范围内,保留所述字段信息对应的属性信息后生成用户标签。
可选地,所述根据所述用户画像,识别所述用户的用户类型,包括:
通过遍历操作计算所述用户画像中任意两个用户标签的距离值;
根据所述距离值判断所述用户标签是否为相似用户标签;
若所述用户标签为相似用户标签,将所述用户标签进行合并后构建聚类中心点;
若所述用户标签为不相似用户标签,根据所述用户标签,构建对应的聚类中心点;
计算所述用户画像中的用户标签在所述聚类中心点的占比,根据所述占比生成用户类型。
可选地,所述通过遍历操作计算所述用户画像中任意两个用户标签的距离值,包括:
利用下述公式计算所述用户画像中任意两个用户标签的距离值:
Figure BDA0003094709860000021
Jaccard(OA,OB)表示距离值,OA∩OB表示所述任意两个用户标签中相同字段词语的个数,OA∪OB表示将所述任意两个用户标签中相同字段进行合并后所有词语的总个数。
可选地,所述对所述点评数据进行点评分析,包括:
对所述点评数据中的词语进行重复率分析,得到所述点评数据的词语重复率;
对所述点评数据进行字数分析,得到所述点评数据的字数;
对所述点评数据进行敏感词分析,得到所述点评数据的敏感词;
根据所述词语重复率、字数以及敏感词,得到所述点评数据的点评分析的结果。
可选地,所述根据所述点评分析的结果和所述用户类型,对所述点评数据进行排序,包括:
根据所述点评分析的结果,计算所述点评数据的重要度;
根据所述重要度,对所述点评数据进行重要度排序,得到所述点评数据的重要度排序列表;
根据所述用户类型,将所述重要度排序列表中有效用户的点评数据顺序排在无效用户的点评数据之前,得到所述点评数据的排序结果。
为了解决上述问题,本发明还提供一种点评数据排序装置,所述装置包括:
用户标签生成模块,用于基于用户在页面点评区域的浏览记录,采集所述用户的属性信息,并对所述属性信息进行去异常处理,生成用户标签;
用户类型识别模块,用于根据所述用户标签,构建所述用户的用户画像,并根据所述用户画像,识别所述用户的用户类型;
点评数据排序模块,用于获取所述用户在所述页面点评区域的点评数据,对所述点评数据进行点评分析,根据所述点评分析的结果和所述用户类型,对所述点评数据进行排序,并将排序后的点评数据返回至所述页面点评区域。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以实现上述所述的点评数据排序方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的点评数据排序方法。
本发明实施例首先对采集用户的属性信息进行去异常处理,生成用户标签,根据所述用户标签,构建所述用户的用户画像,并根据所述用户画像,识别所述用户的用户类型,可以区分出采集的用户属于有效用户还是无效用户,从而可以识别出用户的身份信息重要度,并结合对用户在页面点评区域的点评数据进行点评分析,可以识别出点评数据的重要度,根据用户的身份信息重要度和点评数据的重要程度,对点评数据进行排序,可以避免所述点评数据排序的单一性,实现点评数据的灵活排序,从而可以提高点评数据的排序质量。因此,本发明提出的一种点评数据排序方法、装置、电子设备以及存储介质可以实现点评数据排序的灵活性,提高点评数据的排序质量。
附图说明
图1为本发明一实施例提供的点评数据排序方法的流程示意图;
图2为本发明第一实施例中图1提供的点评数据排序方法其中一个步骤的详细流程示意图;
图3为本发明一实施例提供的点评数据排序装置的模块示意图;
图4为本发明一实施例提供的实现点评数据排序方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种点评数据排序方法。所述点评数据排序方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述点评数据排序方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
参照图1所示,为本发明一实施例提供的点评数据排序方法的流程示意图。在本发明实施例中,所述点评数据排序方法包括:
S1、基于用户在页面点评区域的浏览记录,采集所述用户的属性信息,并对所述属性信息进行去异常处理,生成用户标签。
本发明实施例中,所述页面点评区域包括:APP中应用软件的页面帖子,如小红书APP,公众号的页面帖子,如平安产险公众号的帖子;网页中的页面帖子,例如微博帖子。所述浏览记录是指用户在所述页面点评区域的浏览信息,如浏览时间、浏览次数以及浏览内容等等。
本发明的其中一个实施例,所述基于用户在页面点评区域的浏览记录,采集所述用户的属性信息,包括:
获取所述浏览记录对应页面点评区域的url地址,并对所述浏览记录进行字符标识,根据所述url地址,获取所述浏览记录的页面点评区域信息,根据所述字符标识,从所述页面点评区域信息中获取用户的属性信息。
其中,所述页面点评区域信息包括:用户识别码、IP地址、请求时间、点击时间、在线浏览时间以及页面点评区域主题等,由于所述属性信息基于所述页面点评区域信息得到,因此可以理解的是,所述属性信息也包括:用户识别码、IP地址、请求时间、点击时间、在线浏览时间以及页面点评区域主题等。所述用户识别码指的是用户唯一性标识信息,用于连接用户的行为以及属性;所述IP地址用于标识出用户的地址位置信息;所述请求时间/点击时间用于记录用户操作相关页面点评区域的时间戳信息;所述在线浏览时间用于通过分析用户浏览页面点评区域在线停留时间及统计出用户浏览页面频率;所述页面点评区域主题,用于记录相关页面点评区域标签。
基于所述采集的属性信息,可以表征出用户的浏览页面点评区域的详细信息,用于为后续用户画像提供准确的浏览数据,保障用户画像生成的全面性。
进一步地,为保障所述浏览记录的隐私性和安全性,所述浏览记录还可存储于一区块链节点中。
进一步地,由于获取的属性信息会出现许多异常信息,例如用户的实际点击时间为早上八点,但采集的点击时间为早上九点,导致采集的点击时间出现错误;用户访问页面点评区域的IP段地址实际为:192.110.168,但采集的IP地址却为:192.101.168,导致采集的IP段地址出现错误,因此,本发明实施例通过对所述属性信息进行去异常处理,保障采集的属性信息的准确性,提高后续用户画像分析的可靠性。
具体的,所述对所述属性信息进行去异常处理,生成用户标签,包括:将所述属性信息转换为字段信息,计算所述字段信息的平均值与标准差,根据所述标准差,设置所述字段信息的标准差范围;计算所述字段信息与所述平均值的差值;若所述差值不在所述标准差范围内,删除所述字段信息对应的属性信息后生成用户标签;若所述差值在所述标准差范围内,保留所述字段信息对应的属性信息后生成用户标签。
一个可选实施例中,所述字段信息的标准差范围通过3积法设置,即将所述标准差乘3,例如所述标准差为σ,则将所述标准差乘以3,得到标准差范围为:σ~3σ。
S2、根据所述用户标签,构建所述用户的用户画像,并根据所述用户画像,识别所述用户的用户类型。
本发明地其中一个实施例,所述根据所述用户标签,构建所述用户的用户画像,包括:查询所述用户是否存在历史标签,若不存在历史标签,标记所述用户标签的用户id,生成用户画像;若存在历史标签,删除所述历史标签与用户标签的重复标签后标记所述用户标签及历史标签的用户id,生成用户画像。
进一步地,所述标记用户id指的是将用户身份信息与用户标签建立关联,形成用户特征信息,用于实现用户标签与用户身份一对一的映射关系。
进一步地,所述根据所述用户画像,识别所述用户的用户类型,包括:通过遍历操作计算所述用户画像中任意两个用户标签的距离值;根据所述距离值判断所述用户标签是否为相似用户标签;若所述用户标签为相似用户标签,将所述用户标签进行合并后构建聚类中心点;若所述用户标签为不相似用户标签,根据所述用户标签,构建对应的聚类中心点;计算所述用户画像中的用户标签在所述聚类中心点的占比,根据所述占比生成用户类型。
一个可选实施例中,利用下述公式计算所述用户画像中任意两个用户标签的距离值:
Figure BDA0003094709860000061
Jaccard(OA,OB)表示距离值,OA∩OB表示所述任意两个用户标签中相同字段词语的个数,OA∪OB表示将所述任意两个用户标签中相同字段进行合并后所有词语的总个数。
一个可选实施例中,将所述距离值与预设的阈值进行比较判断所述任意两个用户标签是否为相似用户标签,即所述Jaccard(OA,OB)距离值大于预设的阈值时,判断所述两个用户标签为相似用户标签,若所述Jaccard(OA,OB)距离值不大于预设的阈值时,判断所述两个用户标签为不相似用户标签。可选地,所述预设的阈值为0.85。
一个可选实施例中,所述用户标签在所述聚类中心点的占比通过计算所述用户画像中所有用户标签与对应聚类中心点的距离值得到,例如,所述用户画像存在10个用户标签,其中,用户画像中的在线浏览时间在聚类中心点中占比最大,则生成对应的用户类型标记为在线用户类型。
一个可选实施例中,所述用户类型包括有效用户和无效用户,所述有效用户是指用户在对应页面点评区域的用户标签具有一定的价值,所述无效用户是指用户在对应页面点评区域的用户标签不具有一定的价值。
S3、获取所述用户在所述页面点评区域的点评数据,对所述点评数据进行点评分析,根据所述点评分析的结果和所述用户类型,对所述点评数据进行排序,并将排序后的点评数据返回至所述页面点评区域。
本发明实施例中,所述点评数据包括:点评文本、点赞数以及踩赞数等。其中,所述点评文本是指对所述页面点评区域的点评内容,所述点赞数是指对所述点评文本的赞同数量,所述踩赞数是指对所述点评文本的不赞同数量。
本发明的其中一个实施例,所述对所述点评数据进行点评分析,包括:对所述点评数据中的词语进行重复率分析,得到所述点评数据的词语重复率,对所述点评数据进行字数分析,得到所述点评数据的字数,对所述点评数据进行敏感词分析,得到所述点评数据的敏感词,根据所述词语重复率、字数以及敏感词,得到点评分析的结果。
其中,所述重复率分析指的是所述点评数据中出现相同词语的概率,所述字数分析指的是所述点评数据中的字数数量,所述敏感词分析指的是所述点评数据中是否出现敏感词以及出现敏感词数量所占比例。
进一步地,参阅图2所示,所述根据所述点评分析的结果和所述用户类型,对所述点评数据进行排序,包括:
S20、根据所述点评分析的结果,计算所述点评数据的重要度;
S21、根据所述重要度,对所述点评数据进行重要度排序,得到所述点评数据的重要度排序列表;
S22、根据所述用户类型,将所述重要度排序列表中有效用户的点评数据顺序排在无效用户的点评数据之前,得到所述点评数据的排序结果。
一个可选实施例中,所述重要度的计算根据实际业务场景进行设置,比如设置所述点评分析的结果中词语重复率的重要度占比30%,所述点评分析的结果中字数的重要度占比为30%,所述点评分析的结果中敏感词的重要度占比为40%。
一个可选实施例中,所述根据所述重要度,对所述点评数据进行重要度排序,包括:获取所述点评数据的点赞数及踩赞数,根据所述点赞数及踩赞数,计算所述点评数据的点赞占比及踩赞占比,根据所述点赞占比、踩赞占比以及重要度,计算所述点评数据的权值,根据所述权值,执行所述点评数据的重要度排序,即将权值越高的点评数据排在位置越靠前的位置。其中,所述点评数据的权重基于实际业务场景划分,例如,划分所述踩赞占比在权值中的比例为20%,划分所述点赞占比在权值中的比例为30%,划分所述重要度在权值中的比例为50%,即Q=0.2*X+0.3*Y+0.5*Z,Q表示权值,X表示踩赞占比,Y表示点赞占比,Z表示重要度。
进一步地,本发明实施例将排序后的点评数据返回至所述页面点评区域,以展现所述页面点评区域重要度排序后的点评数据,可以直观的了解到点评数据的重要程度,从而可以帮助用户筛选出高质量点评数据。
进一步地,本发明又一可选实施中,所述将排序后的点评数据返回至所述页面点评区域之后还包括:采用个性化推荐算法所述页面点评区域中位置排序靠前的点评数据推荐给对应用户的相似用户,即当用户A浏览页面点评区域中某个点评数据时,优先找到与所述用户A具有相似用户画像的用户B,并将用户B的点评数据优先展示给用户A,以提高用户浏览页面点评区域中点评数据的体验感以及舒适感。一个可选实施例中,所述个性化推荐算法为协同过滤算法。
本发明实施例首先对采集用户的属性信息进行去异常处理,生成用户标签,根据所述用户标签,构建所述用户的用户画像,并根据所述用户画像,识别所述用户的用户类型,可以区分出采集的用户属于有效用户还是无效用户,从而可以识别出用户的身份信息重要度,并结合对用户在页面点评区域的点评数据进行点评分析,可以识别出点评数据的重要度,根据用户的身份信息重要度和点评数据的重要程度,对点评数据进行排序,可以避免所述点评数据排序的单一性,实现点评数据的灵活排序,从而可以提高点评数据的排序质量。因此,本发明提出的一种点评数据排序方法可以实现点评数据排序的灵活性,提高点评数据的排序质量。
如图3所示,是本发明点评数据排序装置的功能模块图。
本发明所述点评数据排序装置100可以安装于电子设备中。根据实现的功能,所述点评数据排序装置可以包括用户标签生成模块101、用户类型识别模块102以及点评数据排序模块103。本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述用户标签生成模块101,用于基于用户在页面点评区域的浏览记录,采集所述用户的属性信息,并对所述属性信息进行去异常处理,生成用户标签;
所述用户类型识别模块102,用于根据所述用户标签,构建所述用户的用户画像,并根据所述用户画像,识别所述用户的用户类型;
所述点评数据排序模块103,用于获取所述用户在所述页面点评区域的点评数据,对所述点评数据进行点评分析,根据所述点评分析的结果和所述用户类型,对所述点评数据进行排序,并将排序后的点评数据返回至所述页面点评区域。
详细地,本发明实施例中所述点评数据排序装置100中的所述各模块在使用时采用与上述的图1及图2中所述的点评数据排序方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
如图4所示,是本发明实现点评数据排序方法的电子设备的结构示意图。
所述电子设备可以包括处理器10、存储器11、通信总线12以及通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如点评数据排序程序。
其中,所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行点评数据排序程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如点评数据排序程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述通信总线12可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
所述通信接口13用于上述电子设备与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
图4仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图4示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备中的所述存储器11存储的点评数据排序程序是多个计算机程序的组合,在所述处理器10中运行时,可以实现:
基于用户在页面点评区域的浏览记录,采集所述用户的属性信息,并对所述属性信息进行去异常处理,生成用户标签;
根据所述用户标签,构建所述用户的用户画像,并根据所述用户画像,识别所述用户的用户类型;
获取所述用户在所述页面点评区域的点评数据,对所述点评数据进行点评分析,根据所述点评分析的结果和所述用户类型,对所述点评数据进行排序,并将排序后的点评数据返回至所述页面点评区域。
具体地,所述处理器10对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个非易失性计算机可读取存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
基于用户在页面点评区域的浏览记录,采集所述用户的属性信息,并对所述属性信息进行去异常处理,生成用户标签;
根据所述用户标签,构建所述用户的用户画像,并根据所述用户画像,识别所述用户的用户类型;
获取所述用户在所述页面点评区域的点评数据,对所述点评数据进行点评分析,根据所述点评分析的结果和所述用户类型,对所述点评数据进行排序,并将排序后的点评数据返回至所述页面点评区域。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种点评数据排序方法,其特征在于,所述方法包括:
基于用户在页面点评区域的浏览记录,采集所述用户的属性信息,并对所述属性信息进行去异常处理,生成用户标签;
根据所述用户标签,构建所述用户的用户画像,并根据所述用户画像,识别所述用户的用户类型;
获取所述用户在所述页面点评区域的点评数据,对所述点评数据进行点评分析,根据所述点评分析的结果和所述用户类型,对所述点评数据进行排序,并将排序后的点评数据返回至所述页面点评区域。
2.如权利要求1所述的点评数据排序方法,其特征在于,所述基于用户在页面点评区域的浏览记录,采集所述用户的属性信息,包括:
获取所述浏览记录对应页面点评区域的url地址,并对所述浏览记录进行字符标识;
根据所述url地址,获取所述浏览记录的页面点评区域信息;
根据所述字符标识,从所述页面点评区域信息中获取用户的属性信息。
3.如权利要求1所述的点评数据排序方法,其特征在于,所述对所述属性信息进行去异常处理,生成用户标签,包括:
将所述属性信息转换为字段信息,计算所述字段信息的平均值与标准差;
根据所述标准差,设置所述字段信息的标准差范围,并计算所述字段信息与所述平均值的差值;
若所述差值不在所述标准差范围内,删除所述字段信息对应的属性信息后生成用户标签;
若所述差值在所述标准差范围内,保留所述字段信息对应的属性信息后生成用户标签。
4.如权利要求1所述的点评数据排序方法,其特征在于,所述根据所述用户画像,识别所述用户的用户类型,包括:
通过遍历操作计算所述用户画像中任意两个用户标签的距离值;
根据所述距离值判断所述用户标签是否为相似用户标签;
若所述用户标签为相似用户标签,将所述用户标签进行合并后构建聚类中心点;
若所述用户标签为不相似用户标签,根据所述用户标签,构建对应的聚类中心点;
计算所述用户画像中的用户标签在所述聚类中心点的占比,根据所述占比生成用户类型。
5.如权利要求4所述的点评数据排序方法,其特征在于,所述通过遍历操作计算所述用户画像中任意两个用户标签的距离值,包括:
利用下述公式计算所述用户画像中任意两个用户标签的距离值:
Figure FDA0003094709850000021
Jaccard(OA,OB)表示距离值,OA∩OB表示所述任意两个用户标签中相同字段词语的个数,OA∪OB表示将所述任意两个用户标签中相同字段进行合并后所有词语的总个数。
6.如权利要求1至5中任意一项所述的点评数据排序方法,其特征在于,所述对所述点评数据进行点评分析,包括:
对所述点评数据中的词语进行重复率分析,得到所述点评数据的词语重复率;
对所述点评数据进行字数分析,得到所述点评数据的字数;
对所述点评数据进行敏感词分析,得到所述点评数据的敏感词;
根据所述词语重复率、字数以及敏感词,得到所述点评数据的点评分析的结果。
7.如权利要求6所述的点评数据排序方法,其特征在于,所述根据所述点评分析的结果和所述用户类型,对所述点评数据进行排序,包括:
根据所述点评分析的结果,计算所述点评数据的重要度;
根据所述重要度,对所述点评数据进行重要度排序,得到所述点评数据的重要度排序列表;
根据所述用户类型,将所述重要度排序列表中有效用户的点评数据顺序排在无效用户的点评数据之前,得到所述点评数据的排序结果。
8.一种点评数据排序装置,其特征在于,所述装置包括:
用户标签生成模块,用于基于用户在页面点评区域的浏览记录,采集所述用户的属性信息,并对所述属性信息进行去异常处理,生成用户标签;
用户类型识别模块,用于根据所述用户标签,构建所述用户的用户画像,并根据所述用户画像,识别所述用户的用户类型;
点评数据排序模块,用于获取所述用户在所述页面点评区域的点评数据,对所述点评数据进行点评分析,根据所述点评分析的结果和所述用户类型,对所述点评数据进行排序,并将排序后的点评数据返回至所述页面点评区域。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的点评数据排序方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的点评数据排序方法。
CN202110607881.3A 2021-06-01 2021-06-01 点评数据排序方法、装置、电子设备及存储介质 Pending CN113312564A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110607881.3A CN113312564A (zh) 2021-06-01 2021-06-01 点评数据排序方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110607881.3A CN113312564A (zh) 2021-06-01 2021-06-01 点评数据排序方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113312564A true CN113312564A (zh) 2021-08-27

Family

ID=77376921

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110607881.3A Pending CN113312564A (zh) 2021-06-01 2021-06-01 点评数据排序方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113312564A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108090228A (zh) * 2018-01-09 2018-05-29 上海创图网络科技股份有限公司 一种通过文化云平台进行互动的方法及装置
CN108205572A (zh) * 2016-12-20 2018-06-26 百度在线网络技术(北京)有限公司 一种搜索方法、装置及设备
CN111210201A (zh) * 2020-01-02 2020-05-29 平安科技(深圳)有限公司 职业标签建立方法、装置、电子设备及存储介质
CN111666280A (zh) * 2020-04-27 2020-09-15 百度在线网络技术(北京)有限公司 评论的排序方法、装置、设备和计算机存储介质
CN112686552A (zh) * 2020-12-31 2021-04-20 青岛海尔科技有限公司 待办任务推送方法、装置、电子设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108205572A (zh) * 2016-12-20 2018-06-26 百度在线网络技术(北京)有限公司 一种搜索方法、装置及设备
CN108090228A (zh) * 2018-01-09 2018-05-29 上海创图网络科技股份有限公司 一种通过文化云平台进行互动的方法及装置
CN111210201A (zh) * 2020-01-02 2020-05-29 平安科技(深圳)有限公司 职业标签建立方法、装置、电子设备及存储介质
CN111666280A (zh) * 2020-04-27 2020-09-15 百度在线网络技术(北京)有限公司 评论的排序方法、装置、设备和计算机存储介质
CN112686552A (zh) * 2020-12-31 2021-04-20 青岛海尔科技有限公司 待办任务推送方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN112380859A (zh) 舆情信息的推荐方法、装置、电子设备及计算机存储介质
CN111860377A (zh) 基于人工智能的直播方法、装置、电子设备及存储介质
CN112115145A (zh) 数据采集方法、装置、电子设备及存储介质
CN113489704A (zh) 基于流量的敏感数据识别方法、装置、电子设备及介质
CN111159183B (zh) 报表生成方法、电子装置及计算机可读存储介质
CN113792089A (zh) 基于人工智能的非法行为检测方法、装置、设备及介质
CN114550076A (zh) 区域异常行为监控方法、装置、设备及存储介质
CN114612194A (zh) 产品推荐方法、装置、电子设备及存储介质
CN112631731A (zh) 数据查询方法、装置、电子设备及存储介质
CN113886204A (zh) 用户行为数据收集方法、装置、电子设备及可读存储介质
CN114911479A (zh) 基于配置化的界面生成方法、装置、设备及存储介质
CN115238179A (zh) 项目推送方法、装置、电子设备及计算机可读存储介质
CN114841165A (zh) 用户数据分析及展示方法、装置、电子设备及存储介质
CN114662005A (zh) 用户行为轨迹的消息推送方法、装置、设备及存储介质
CN113312564A (zh) 点评数据排序方法、装置、电子设备及存储介质
CN114547696A (zh) 文件脱敏方法、装置、电子设备及存储介质
CN113935663A (zh) 一种面板产品的设备组合分析方法、装置、设备及介质
CN113987206A (zh) 异常用户的识别方法、装置、设备及存储介质
CN114491196A (zh) 基于信息粒度的信息导出方法、装置、设备及介质
CN113469649A (zh) 项目进度分析方法、装置、电子设备及存储介质
CN113360505B (zh) 基于时序数据的数据处理方法、装置、电子设备及可读存储介质
CN114357534B (zh) 基于区块链的课室实训平台构建方法、装置、设备及介质
CN114625442A (zh) 冷启动推荐方法、装置、电子设备及可读存储介质
CN113051475A (zh) 内容推荐方法、装置、电子设备及可读存储介质
CN112632345A (zh) 数据过滤方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210827

RJ01 Rejection of invention patent application after publication