CN110134763B - 一种陌生人社交活动的评价信息分类显示方法与系统 - Google Patents

一种陌生人社交活动的评价信息分类显示方法与系统 Download PDF

Info

Publication number
CN110134763B
CN110134763B CN201910341596.4A CN201910341596A CN110134763B CN 110134763 B CN110134763 B CN 110134763B CN 201910341596 A CN201910341596 A CN 201910341596A CN 110134763 B CN110134763 B CN 110134763B
Authority
CN
China
Prior art keywords
evaluation
reply
confidence
display
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910341596.4A
Other languages
English (en)
Other versions
CN110134763A (zh
Inventor
陈俊华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Feichi Network Technology Co ltd
Original Assignee
Hangzhou Feichi Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Feichi Network Technology Co ltd filed Critical Hangzhou Feichi Network Technology Co ltd
Priority to CN201910341596.4A priority Critical patent/CN110134763B/zh
Publication of CN110134763A publication Critical patent/CN110134763A/zh
Application granted granted Critical
Publication of CN110134763B publication Critical patent/CN110134763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种陌生人社交活动的评价信息分类显示方法与系统。本发明针对社交网络平台发布的陌生人社交活动,允许用户进行文字评价以及回复评价;进而,本发明针对每条文字评价或者回复评价在多个方面的权重因素,测算每条文字评价或者回复评价的置信分值;根据文字评价或者回复评价的置信分值,本发明对评价进行分类;并且针对不同类型的文字评价和回复评价,适应性地设置与其匹配的显示区域格式与排列顺序。

Description

一种陌生人社交活动的评价信息分类显示方法与系统
技术领域
本发明涉及陌生人社交相关的计算机系统领域,尤其涉及一种陌生人社交活动的评价信息分类显示方法与系统。
背景技术
社交是指社会上人与人的交际往来,是人们运用一定的方式(工具)传递信息、交流思想的意识,以达到某种目的的社会各项活动。随着科学技术的发展和互联网资源在生活中的应用,人与人之间的交往开始借助互联网来实现,陌生人之间也可以通过互联网进行社交,实现进一步发展自己和扩充自己的目的。例如,现有技术中已经出现了一些主打陌生人社交服务的互联网平台和服务,例如搜索附近的人进行线上对话、传送网络漂流瓶等。
现有技术中最新出现的一种陌生人社交平台是由活动组织者在该平台上发布一个在预定时间和地点举办的社交活动(例如聚餐、郊游、做游戏等),并设定参与该社交活动需要符合的条件(例如性别、年龄等);其他用户可以在该平台上搜索自己感兴趣且自身符合条件的社交活动,平台也可以向其他用户推荐所发布的社交活动。其他用户可以基于自身意愿对搜索到或者被推荐的陌生人社交活动进行线上报名,进而作为活动参与者按时赴预定地点参与该社交活动。
评价功能是互联网平台的一项基本功能,例如在购物网络平台、约车平台、招聘网络平台、交友平台等,用户都可以通过评价功能发表对所选购商品、出租司机、应聘职位以及交往对象发表评价意见,这些意见不但被评价对象可以看到,其他第三方用户也可以看到,从而增进对被评价对象的了解。现有的评价方式包括文字评价、星级评价、计分评价等;其中星级评价和计分评价是为被评价对象标注星级或者输入分数,该评价方式属于数值化评价,结果可量化,直观性强;而文字评价则是由用户通过输入评价留言的方式实现评价,这种评价方式允许用户发表更为具体的评价意见。通常会给予用户两种或者更多的评价方式,并且一般来说评价人数越多则反映评价结论越客观。
在陌生人社交平台中,可以针对每项陌生人社交活动设置上述评价功能,从而允许用户利用文字评价、星级评价、计分评价等方式对每项陌生人社交活动展开评价。通过获取评价信息,陌生人社交活动的组织者参照这些信息可以对当前社交活动的组织进行必要的调整;第三方用户可以参照评价信息决策自己是否报名参与该社交活动;社交平台也可以通过监控评价信息掌握陌生人社交活动情况,必要的时候给予推荐和干预。
但是,目前在陌生人社交活动的平台上,文字评价的显示方式仍然存在不足之处。首先,考虑到显示页面布局的整齐,一般为每一条文字评价分配长度和高度固定的一块显示区域,将该条文字评价填入该显示区域内,当文字评价字数较多时,该默认大小的显示区域往往不能完整显示,观看者需要单独点击一个下拉按钮扩大该显示区域,以便阅读完整的文字评价内容,增加了操作的步骤和延迟,影响第一时间对文字评价的阅读。第二,针对某一用户发布的文字评价,其他用户(例如社交活动组织者和参与者、其他第三方用户)有可能要对该评价进行回复,目前通常在文字评价的所述显示区域设立一个回复按钮,用户点击该按钮后显示区域扩大,下拉显示出一个对话框,用于输入回复文字;如果针对该文字评价已有回复文字,点击该回复按钮则显示区域扩大,一并下拉显示出已有的回复文字以及所述对话框。面向回复功能的上述显示方式也存在操作步骤繁琐、延迟大的缺陷,而且已有回复文字被遮盖,只能点击回复按钮方可阅见,导致回复文字极易被忽视。第三,文字评价往往按照用户发布该评价信息的时间顺序排列,导致撰写详实、信息含量大的文字评价被淹没在一些简短、无明确含义的评论信息之内,无法为用户有效获得。另外具有较多回复的文字评价也往往承载对于社交活动来说较为重要的信息,以上显示和排序方式下更加容易被淹没。另外少数用户在文字评价中发布与评价对象毫无关系的文字,例如广告等。以上情况干扰了社交活动组织者、用户以及平台通过评价准确获取信息。
发明内容
鉴于上述现有技术中存在的以上问题,本发明目的在于提供一种陌生人社交活动的评价信息分类显示方法与系统。
本发明针对社交网络平台发布的陌生人社交活动,允许用户进行文字评价以及回复评价;进而,本发明针对每条文字评价或者回复评价在多个方面的权重因素,测算每条文字评价或者回复评价的置信分值;根据文字评价或者回复评价的置信分值,本发明对评价进行分类;并且针对不同类型的文字评价和回复评价,适应性地设置与其匹配的显示区域格式与排列顺序。
为了达到上述目标,本发明提供了一种陌生人社交活动的评价信息分类显示方法,其特征在于,包括以下步骤:
获取用户针对发布的一项陌生人社交活动的每条文字评价或回复评价的文本信息;
针对每条文字评价或回复评价的文本信息,根据其与正、负置信样本库的重合度,计算该文本信息的置信度;并根据该文本信息的置信度和其发布者、文字数量、回复数量等评分因素,计算该条文字评价或回复评价的置信分值;
根据所述置信分值,确定每条文字评价或回复评价的类型;
根据每条文字评价及其关联的回复评价的类型,在社交活动展示界面当中设置与其匹配的显示区域格式与排列顺序,以及设置回复评价显示区域的展开格式;并且,根据每条回复评价的类型,在回复评价显示区域当中设置与其匹配的显示区域格式。
优选的是,针对所获得的每条文字评价或者回复评价,根据其与正、负置信样本库的重合度,计算该条文字评价或回复评价的文本信息的置信度,具体包括:对每条文字评价经过分词、词停用处理,获得该文字评价的关键词序列;建立正负置信样本库,正负置信样本库具体包括正置信样本库和负置信样本库;对于正置信样本库或者负置信样本库中的每一个关键词序列,进行序列扩展;计算正置信样本库和负置信样本库当中每个序列扩展后的样本关键词序列的置信度;对于每条文字评价或者回复评价经过分词、词停用等处理后形成的关键词序列,计算该文字评价或者回复评价的关键词序列与正、负置信样本库当中每个序列扩展后的样本关键词序列的相似度,取其中相似度最高的正置信样本或者负置信样本作为该条文字评价或者回复评价的匹配样本,进而将匹配样本的置信度作为该条文字评价或者回复评价的置信度。
优选的是,根据该条文字评价或者回复评价的置信度和其发布者、文字数量、回复数量等评分因素,计算该条文字评价或者回复评价的置信分值,具体包括:设定标准评价分值,并且将文字评价或者回复评价的置信分值设为所述标准评价分值与一个基于置信度和其发布者、文字数量、回复数量决定的系数值的乘积;根据该条文字评价或者回复评价的置信度决定该系数值的初步取值;根据发布者和/或文字数量和/或回复数量对该系数值的初步取值加上或者减去一个调整系数值,从而获得所述置信分值。
优选的是,所述正置信样本为有效信息文字占评价总字数的比例大于等于比例阈值的文字评价样本或者回复评价样本;所述负置信评价为有效信息文字占评价总字数的比例小于比例阈值的文字评价样本或者回复评价样本。
优选的是,根据所述置信分值,确定每条文字评价或回复评价的类型,具体包括:根据该条文字评价或者回复评价的置信分值所在的数值区间,将每条文字评价或回复评价划入与数值区间对应的类型;所述类型包括:低有效性评价、中等有效性评价以及高有效性评价。
优选的是,在社交活动展示界面当中,在每个社交活动下方提供一个文字评价的显示区域,在该显示区域内展示针对本社交活动的文字评价;如果一条文字评价具有相关联的回复评价的,在该条文字评价的下方提供一个回复评价显示区域,用于显示该条文字评价相关联的各条回复评价;在文字评价和回复评价的显示区域中,各条评价的文本信息被分配在显示区域中划出的一个子区域内显示;并且每条文字评价或者回复信息在显示区域的显示格式包括完整展示、默认展示以及压缩展示,以及所述回复评价显示区域的格式包括完全展开、部分展开以及完全收折。
优选的是,根据每条文字评价及其关联的回复评价的类型,在社交活动展示界面的显示区域当中设置该条文字评价对应的子区域的显示格式是采取完整展示、默认展示还是压缩展示。
优选的是,在文字评价的子区域采用完整展示或者默认展示的前提下,再根据其关联的回复评价的类型,设置回复评价显示区域的展开格式是完全展开、部分展开还是完全收折;在文字评价的子区域采用压缩展示的情况下,该文字评价对应的回复评价显示区域的展开格式为完全收折。
优选的是,对于回复评价显示区域当中各个回复评价对应的子区域,根据该回复评价的类型,如果回复评价属于高有效性评价,则将该条回复评价对应的子区域的显示格式设定为完整展示;如果回复评价本身属于中等有效性评价,则设定为默认展示;如果回复评价属于低有效性评价,则采用压缩展示。
本发明进而提供了一种陌生人社交活动的评价信息分类显示系统,其特征在于,包括:
评价获取模块,用于获取用户针对发布的一项陌生人社交活动的每条文字评价或回复评价的文本信息;
置信计算模块,用于针对每条文字评价或回复评价的文本信息,根据其与正、负置信样本库的重合度,计算该文本信息的置信度;并根据该文本信息的置信度和其发布者、文字数量、回复数量等评分因素,计算该条文字评价或回复评价的置信分值;
类型确定模块,用于根据所述置信分值,确定每条文字评价或回复评价的类型;
分类显示模块,用于根据每条文字评价及其关联的回复评价的类型,在社交活动展示界面当中设置与其匹配的显示区域格式与排列顺序,以及设置回复评价显示区域的展开格式;并且,根据每条回复评价的类型,在回复评价显示区域当中设置与其匹配的显示区域格式。
可见,本发明允许用户对陌生人社交平台上发布的社交活动给出文字评价以及回复评价,并且通过测算每条文字评价或者回复评价的置信分值,对评价进行分类,进而针对不同类型的文字评价和回复评价,适应性地设置与其匹配的显示区域格式与排列顺序,从而使得针对每条文字评价和回复评价的显示格式、区域面积以及排列顺序与该评价的有效信息相对应,实现对评价显示区域面积的优化分配,可以吸引用户关注信息有效性高的评价,以及简化操作,提高浏览效率。
说明书附图
图1是本发明所述陌生人社交活动的评价展示界面示意图;
图2是本发明所述陌生人社交活动的评价信息分类显示方法的整体流程图;
图3是本发明所述评价信息分类显示方法的置信分值计算流程图;
图4是本发明所述陌生人社交活动的评价信息分类显示系统的结构图。
具体实施方式
下面通过实施例,对本发明的技术方案做进一步具体的说明。
本发明应用于陌生人社交平台,对于由活动组织者在该平台上发布的一个在预定时间和地点举办的社交活动(例如聚餐、郊游、一起看电影、做游戏等),该平台可以在社交活动展示界面以列表、卡片等方式对每个社交活动的编号、类型、名称、时间、地点、组织者、报名参加者等内容进行展示,如图1所示。
并且,可以针对每项陌生人社交活动设置评价功能,从而允许用户在该社交活动展示界面之上对每个社交活动发表评价;评价社交活动的用户包括活动组织者、报名参加活动的用户以及其他未报名参加该活动的第三方用户;并且作为评价对象的社交活动可以是正在报名的活动,也可以是报名完成的活动,或者是已经结束举行的历史活动。本发明允许的评价方式包括文字评价,也包括评分、给出星级等数值化评价。本发明主要针对其中的文字评价的评价信息分类显示给予改进和优化。
首先,如图1所示,社交活动展示界面当中在每个社交活动下方提供文字评价和数值化评价的途径。数值化评价指的是由用户对社交活动给出一个量化分值从而实现评价,可以采用星级评价、计分评价等方式展开所述数值化评价;例如,所述社交活动展示界面上在每个社交活动下方提供星级选择菜单(例如一星到五星)或者分值输入菜单(例如0分至100分),用户可以利用以上菜单输入自己认为适当的星级或者分值,从而完成数值化评价;平台统计所有做出数值化评价的用户给出的量化分值的平均值,并且在社交活动展示界面上在每个社交活动下方同样以星级或者分值的形式显示出该平均值。
并且,社交活动展示界面当中在每个社交活动下方提供文本框,供用户键入自己的文字评价。用户键入的文字可以发表对活动的预期、自己的体验等,因此文字评价携带的有价值信息量更大。另外,针对任一用户键入的评价文字,社交活动组织者和参与者、其他第三方用户以及该发表评价的用户都可以继续对该评价进行回复评价,从而提供有效的沟通途径。
图2是本发明所述陌生人社交活动的评价信息分类显示方法,其特征在于,包括以下步骤:
S1:获取用户针对发布的一项陌生人社交活动的每条文字评价或回复评价的文本信息;
S2:针对每条文字评价或回复评价的文本信息,根据其与正、负置信样本库的重合度,计算该文本信息的置信度;并根据该文本信息的置信度和其发布者、文字数量、回复数量等评分因素,计算该条文字评价或回复评价的置信分值;
S3:根据所述置信分值,确定每条文字评价或回复评价的类型;
S4:根据每条文字评价及其关联的回复评价的类型,在社交活动展示界面当中设置与其匹配的显示区域格式与排列顺序,以及设置回复评价显示区域的展开格式;并且,根据每条回复评价的类型,在回复评价显示区域当中设置与其匹配的显示区域格式。
下面对以上步骤进行具体说明。首先,针对平台上发布的任意一个社交活动,如图1,在显示该社交活动信息的页面下方提供文本框,供用户输入针对该社交活动的文字评价。步骤S1当中,本发明所述的陌生人社交平台能够获得每一个对该活动作出评价的用户所提交的每一条文字评价的文本信息。并且,本发明的陌生人社交平台允许任何用户针对自身或者任何其他用户输入的文字评价进行回复评价,陌生人社交平台能够获得每一个用户所提交的回复评价的文本信息。
步骤S2当中,针对所获得的每条文字评价或者回复评价,根据其与正、负置信样本库的重合度,计算该条文字评价或回复评价的文本信息的置信度。并根据该条文字评价或者回复评价的置信度和其发布者、文字数量、回复数量等评分因素,计算该条文字评价或者回复评价的置信分值。
S2的具体执行过程如图3所示。对于互联网评论功能当中常见的文字类型的评价来说,其中虽不乏几十字甚至一、二百字的长文本,但是绝大多数的文字评论属于十余字或者更短的一句话形成的短文本;短文本再经过分词、词停用等处理之后,提取出来的关键词难以适用频率统计等分析方法进行量化评估,另外其缺失上下文,因此也难以基于上下文关系对该文字评价进行分析。为了解决这一矛盾,本发明在步骤S2中如下对文字评价或者回复评价的文本信息进行处理:首先,步骤S201,对每条文字评价或者回复评价的文本信息经过分词、词停用处理,获得该文字评价的关键词;分词就是将作为文字评价的一句话或者一个短语按照语义特性分成若干个词语;词停用是利用词停用表对分词获得的词语进行过滤,去除其中的介词、虚词、人称代词等不承载语义的词语;分词和词停用处理属于本领域常规的技术手段;经以上处理之后,提取的词作为关键词进行后续的步骤。将一条文字评价或者回复评价的文本信息经过分词和词停用处理后的关键词序列为K={k1,k2,...kn},其中k1至kn表示关键词。进而,步骤S202,建立正负置信样本库,正负置信样本库具体包括正置信样本库和负置信样本库;本步骤中,从社交平台搜集一定数量的文字评价作为样本,并且根据每条文字评价的实际语义包含的有效信息量,确定该文字评价属于充分承载有效信息的正置信评价,还是未充分承载有效信息的负置信评价;更具体来说,我们从海量用户提交到社交平台的文字评价当中随机选取一定数量的文字评价(例如选择5000-10000条文字评价)作为样本,并人工标注每条文字评价当中有效信息文字,进而计算有效信息文字占文字评价总字数的比例,并设置一比例阈值,将所述比例大于等于比例阈值的文字评价样本作为正置信评价,而将该比例低于比例阈值的文字评价样本作为负置信评价。例如,一条文字评价为“太好了太好了太好了太好了太好了太好了太好了太好了太好了太好了”,则人工标注其有效信息文字为“太好了”三个文字,则有效信息文字占文字评价总字数的比例为10%;另一文字评价为“为这次聚餐点赞,饭店格调很好哦,菜品味道也很独特哦,哈哈”,人工标注其有效信息文字为“为这次聚餐点赞”、“饭店格调很好”以及“菜品味道也很独特”,有效信息文字占文字评价总字数的比例为85%;假设比例阈值为70%,则第一条文字评价作为负置信评价,第二条文字评价作为正置信评价。对属于正置信评价的文字评价提取其关键词序列后加入所述正置信样本库,对于属于负置信评价的文字评价提取其关键词序列后加入所述负置信样本库,直至正、负置信样本库达到预期的样本数量,例如各自具有1000个关键词序列。步骤S203中,对于正置信样本库或者负置信样本库中的每一个关键词序列,进行序列扩展,具体来说,例如,对于同属于正置信样本库(或者同属于负置信样本库)的两个关键词序列Ki={k1,k2,...kn}和K′j={k′1,k′2,...k′m},计算Ki和K′j的相似度S:
Figure BDA0002040883800000101
其中
Figure BDA0002040883800000102
其中num(kp)表示该正置信样本库(或者负置信样本库)当中含该关键词kp的关键词序列的数量,num(k′q)表示该正置信样本库(或者负置信样本库)当中含该关键词k′q的关键词序列的数量,num(kp,k′q)表示该正置信样本库(或者负置信样本库)当中同时含该关键词kp和关键词k′q的关键词序列的数量;N为正置信样本库(或者负置信样本库)当中样本数量,即上文提到的1000。设置阈值ξ,如果S大于ξ则说明两个关键词序列相似度高,可以将相似度高的两个关键词序列以合并的方式实现序列扩展,例如Ki={k1,k2,=…kn}和K′j={k′1,k′2,...k′m}相似度高,则二者的序列扩展为
Kw={k1,k2,...kn,k′1,k′2,...k′m}。
进而,步骤S204,计算正置信样本库和负置信样本库当中每个序列扩展后的样本关键词序列的置信度
Figure BDA0002040883800000111
其中,αt和βt值分别为每个关键词的置信权重;可以通过查询词典确定每个关键词的词性,进而根据每个关键词的词性设定其对应的权重,例如对于序列中的形容词、动词给与更高的权重,而对于序列中的名词给与较低的权重。
步骤S205中,对于步骤S1中获取的每条文字评价或者回复评价,对于该条文字评价或者回复评价的文本信息,经过分词、词停用等处理后形成的关键词序列Kp,计算该关键词序列与正、负置信样本库当中每个序列扩展后的样本关键词序列的相似度S,取其中相似度最高的正置信样本或者负置信样本作为该条文字评价或者回复评价的匹配样本Kw,进而将匹配样本的置信度C(Kw)作为该条文字评价或者回复评价的置信度C(Kp),即C(Kp)=C(Kw)。步骤S206中,根据该条文字评价或者回复评价的置信度C(Kp)和其发布者、文字数量、回复数量等评分因素,计算该条文字评价或回复评价的置信分值;具体来说,设定标准评价分值A,则该条文字评价或回复评价的置信分值为
Figure BDA0002040883800000121
例如,标准评价分值A为100,
Figure BDA0002040883800000122
表示基于这些因素确定的一个系数值,取值范围为0-1;该系数值是C(Kp),U,Z,R这些参数的函数;其中,首先根据置信度C(Kp)的值决定系数
Figure BDA0002040883800000123
的初步取值
Figure BDA0002040883800000124
Figure BDA0002040883800000125
的取值与置信度C(Kp)的关系为:当该文字评价或回复评价与正置信样本匹配时,
Figure BDA0002040883800000126
的取值范围为0.5-1,且与置信度C(Kp)的数值呈正比,即置信度数值越高则
Figure BDA0002040883800000127
的取值越接近1;反之,当该文字评价或回复评价与负置信样本匹配时,
Figure BDA0002040883800000128
的取值范围为0-0.5,且与置信度C(Kp)的数值呈反比,即置信度数值越高则
Figure BDA0002040883800000129
的取值越接近0;在根据置信度C(Kp)确定
Figure BDA00020408838000001210
初步取值之后,再根据U,Z,R这些参量,对
Figure BDA00020408838000001211
的初步取值进行调整,获得最终的系数值
Figure BDA00020408838000001212
其中,U表示提交该文字评价或者回复评价的用户的信息,如果用户是报名参与该社交活动的用户,则在
Figure BDA00020408838000001213
的基础上修正为
Figure BDA00020408838000001214
Figure BDA0002040883800000131
的取值为0.1,且当文字评价或回复评价与正置信样本匹配时修正后的系数为
Figure BDA0002040883800000132
当文字评价或回复评价与负置信样本匹配时修正后的系数
Figure BDA0002040883800000133
同理,可以根据该文字评价或回复评价的字数Z对
Figure BDA0002040883800000134
的初步取值进行调整,如果文字评价或回复评价的字数大于一个字数阈值(例如25字),则在
Figure BDA0002040883800000135
的基础上修正为
Figure BDA0002040883800000136
Figure BDA0002040883800000137
的取值为0.1,且当文字评价或回复评价与正置信样本匹配时修正后的系数为
Figure BDA0002040883800000138
当文字评价或回复评价与负置信样本匹配时修正后的系数
Figure BDA0002040883800000139
还可以根据该文字评价或回复评价相关联的回复评价数量(任一用户针对一条回复评价继续发布的回复评价即为与被回复的回复评价相关联的回复评价)R对
Figure BDA00020408838000001310
的初步取值进行调整,如果文字评价或回复评价的回复数量大于一个阈值(例如5条),则在
Figure BDA00020408838000001311
的基础上修正为
Figure BDA00020408838000001312
Figure BDA00020408838000001313
的取值为0.1或者与回复数量呈正比,且当文字评价或回复评价与正置信样本匹配时修正后的系数为
Figure BDA00020408838000001314
当文字评价或回复评价与负置信样本匹配时修正后的系数
Figure BDA00020408838000001315
最终,步骤S206中根据每条文字评价或回复评价的置信度C(Kp)和其发布者、文字数量、回复数量等评分因素计算出该条文字评价的置信分值。
步骤S3当中,根据所述置信分值,确定每条文字评价或回复评价的类型。如上文所述,步骤S2中针对某项社交活动所获得的每条文字评价或者回复评价,计算了该条文字评价或者回复评价的置信分值,且该置信分值是一个0-100范围内取值的数值。进而,可以根据置信分值所在的数值区间,将每条文字评价或回复评价划入与数值区间对应的类型。例如,可以将置信分值划分为三个数值区间,例如0-20、21-80、81-100,如果一条文字评价或者回复评价的置信分值为第一数值区间(0-20),则认为该评价的类型为第一类型(低有效性评价);同理,一条文字评价或者回复评价的置信分值为第二数值区间(21-80),则认为该评价的类型为第二类型(中等有效性评价);一条文字评价或者回复评价的置信分值为第三数值区间(81-100),则认为该评价的类型为第三类型(高有效性评价)。
S4:根据每条文字评价及其关联的回复评价的类型,在社交活动展示界面当中设置与其匹配的显示区域格式与排列顺序,以及设置回复评价显示区域的展开格式;并且,根据每条回复评价的类型,在回复评价显示区域当中设置与其匹配的显示区域格式。
具体来说,如图1所示,在社交活动展示界面当中,在每个社交活动下方提供一个文字评价的显示区域,在该显示区域内展示针对本社交活动的文字评价;其中,如果一条文字评价具有相关联的回复评价的,在该条文字评价的下方提供一个回复评价显示区域,用于显示该条文字评价相关联的各条回复评价。在文字评价显示区域的下方提供一个文本框,供用户键入自己的文字评价或者回复评价。在文字评价和回复评价的显示区域中,各条评价的文本信息被分配在显示区域中划出的一个子区域内显示,通常如图1所示以列表的形式各子区域由上到下依次排列显示。本发明中,每条文字评价和回复评价在显示区域中占据的子区域的面积有一个默认值。
其中,每条文字评价在显示区域的显示格式包括完整展示、默认展示以及压缩展示。完整展示就是在显示区域中根据文字评价的字数划定其占据的子区域,该子区域的面积足以完整展示该条文字评价的全部文本;如果基于每条评价子区域的默认值即可以完整展示该条文字评价,则无需对子区域面积进行调整;如果基于每条评价子区域的默认值不足以完整展示该条文字评价,则增大每条评价子区域的面积至足以完整展示该条文字评价。默认展示即是以上述默认值面积的子区域展示文字评价,如果基于每条评价子区域的默认值不足以完整展示该条文字评价,则与现有技术类似,需要单独点击一个下拉按钮扩大该子区域,以便展示出来完整的文字评价。压缩展示则是按照低于该默认值的一个压缩值对应面积的子区域展示文字评价,如果不足以完整展示该条文字评价,则与现有技术类似,需要单独点击一个下拉按钮扩大该子区域,以便展示出来完整的文字评价。
回复评价显示区域的格式包括完全展开、部分展开以及完全收折。当一条文字评价具有对应的回复评价时,则在该条文字评价对应的子区域下方先设置显示一个回复评价显示区域,然后再在该回复评价显示区域的下方显示下一条文字评价的子区域。其中,在完全展开状态下,根据该条文字评价关联的全部回复评价的数量划定所述回复评价显示区域占据的面积,该面积足以展示出全部回复评价对应的显示区域子区域,其中每条回复评价按照所述默认值设定其子区域的面积。在部分展开状态下,按照一个回复显示默认值划定所述回复评价显示区域占据的面积,如果该面积不足以展示出全部回复评价对应的显示区域子区域,则需要单独点击一个下拉按钮扩大该回复评价显示区域,以便展示出来全部的回复评价的子区域。在完全收折状态下,则在文字评价的子区域下方仅仅显示该下拉按钮,而不显示出回复评价显示区域,需要单独点击该下拉按钮,点击后方才显示所述回复评价显示区域。
在回复评价显示区域当中,各条回复评价占据各自的子区域。每条回复评价在回复评价显示区域的显示格式也包括完整展示、默认展示以及压缩展示,与所述文字评价相同,在此不再赘述。
在此基础上,根据每条文字评价及其关联的回复评价的类型,在社交活动展示界面的显示区域当中设置该条文字评价对应的子区域的显示格式,是采取完整展示、默认展示还是压缩展示。如果文字评价本身或者其关联的回复评价中任一条属于高有效性评价,则将该条文字评价对应的子区域的显示格式设定为完整展示;如果文字评价本身属于中等有效性评价,则将该条文字评价对应的子区域的显示格式设定为默认展示;如果文字评价本身属于低有效性评价,但其关联的回复评价中至少一条属于中等有效性评价,则也采用默认展示;如果文字评价本身属于低有效性评价,且其关联的回复评价也均属于低有效性评价,则采用压缩展示。
在文字评价的子区域采用完整展示或者默认展示的前提下,再根据其关联的回复评价的类型,设置回复评价显示区域的展开格式是完全展开、部分展开还是完全收折。如果其关联的回复评价中一定数量以上属于高有效性评价,例如3条以上,则将回复评价显示区域的展开格式设为完全展开。如果其关联的回复评价中全部为低有效性评价,则采用完全收折。如果回复评价不属于上述两种情况,则采用部分展开的形式显示回复评价显示区域。在文字评价的子区域采用压缩展示的情况下,该文字评价对应的回复评价显示区域的展开格式为完全收折。
对于回复评价显示区域当中各个回复评价对应的子区域,则根据该回复评价的类型,如果回复评价属于高有效性评价,则将该条回复评价对应的子区域的显示格式设定为完整展示;如果回复评价本身属于中等有效性评价,则设定为默认展示;如果回复评价属于低有效性评价,则采用压缩展示。
例如,图1中,用户XXX的文字评价采用了压缩展示;用户DDD的文字评价采用了完整展示,且其对应的回复评价显示区域的展开格式是完全展开;用户YYY的文字评价则采用默认展示,并且其回复评价显示区域的展开格式是完全收折。
另外,可以根据每条文字评价的置信分值,调整该文字评价的子区域以及与该条文字评价关联的回复评价显示区域的显示排序,例如根据置信分值由高到低的顺序进行排列。对于回复评价显示区域中与各个回复评价对应的子区域,则按照回复评价的收到时间顺序进行排序,而不考虑置信分值。
图4示出了本发明所述陌生人社交活动的评价信息分类显示系统,其特征在于,包括:
评价获取模块,用于获取用户针对发布的一项陌生人社交活动的每条文字评价或回复评价的文本信息;
置信计算模块,用于针对每条文字评价或回复评价的文本信息,根据其与正、负置信样本库的重合度,计算该文本信息的置信度;并根据该文本信息的置信度和其发布者、文字数量、回复数量等评分因素,计算该条文字评价或回复评价的置信分值;
类型确定模块,用于根据所述置信分值,确定每条文字评价或回复评价的类型;
分类显示模块,用于根据每条文字评价及其关联的回复评价的类型,在社交活动展示界面当中设置与其匹配的显示区域格式与排列顺序,以及设置回复评价显示区域的展开格式;并且,根据每条回复评价的类型,在回复评价显示区域当中设置与其匹配的显示区域格式。
可见,本发明允许用户对陌生人社交平台上发布的社交活动给出文字评价以及回复评价,并且通过测算每条文字评价或者回复评价的置信分值,对评价进行分类,进而针对不同类型的文字评价和回复评价,适应性地设置与其匹配的显示区域格式与排列顺序,从而使得针对每条文字评价和回复评价的显示格式、区域面积以及排列顺序与该评价的有效信息相对应,实现对评价显示区域面积的优化分配,可以吸引用户关注信息有效性高的评价,以及简化操作,提高浏览效率。
以上实施例仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (5)

1.一种陌生人社交活动的评价信息分类显示方法,其特征在于,包括以下步骤:
获取用户针对发布的一项陌生人社交活动的每条文字评价或回复评价的文本信息;
针对每条文字评价或回复评价的文本信息,经过分词、词停用处理,获得该文字评价或回复评价的关键词序列;建立正负置信样本库,正负置信样本库具体包括正置信样本库和负置信样本库;所述正置信样本为有效信息文字占评价总字数的比例大于等于比例阈值的文字评价样本或者回复评价样本;所述负置信评价为有效信息文字占评价总字数的比例小于比例阈值的文字评价样本或者回复评价样本;对于正置信样本库或者负置信样本库中的每一个关键词序列,进行序列扩展;计算正置信样本库和负置信样本库当中每个序列扩展后的样本关键词序列的置信度;对于每条文字评价或者回复评价经过分词、词停用处理后形成的关键词序列,计算该文字评价或者回复评价的关键词序列与正、负置信样本库当中每个序列扩展后的样本关键词序列的相似度,取其中相似度最高的正置信样本或者负置信样本作为该条文字评价或者回复评价的匹配样本,进而将匹配样本的置信度作为该条文字评价或者回复评价的置信度;
设定标准评价分值,并且将文字评价或者回复评价的置信分值设为所述标准评价分值与一个基于置信度和其发布者、文字数量、回复数量决定的系数值的乘积;根据该条文字评价或者回复评价的置信度决定该系数值的初步取值;根据发布者和/或文字数量和/或回复数量对该系数值的初步取值加上或者减去一个调整系数值,从而获得所述置信分值;
根据该条文字评价或者回复评价的置信分值所在的数值区间,将每条文字评价或回复评价划入与数值区间对应的类型;所述类型包括:低有效性评价、中等有效性评价以及高有效性评价;在社交活动展示界面当中,在每个社交活动下方提供一个文字评价的显示区域,在该显示区域内展示针对本社交活动的文字评价;如果一条文字评价具有相关联的回复评价的,在该条文字评价的下方提供一个回复评价显示区域,用于显示该条文字评价相关联的各条回复评价;在文字评价和回复评价的显示区域中,各条评价的文本信息被分配在显示区域中划出的一个子区域内显示;
根据每条文字评价及其关联的回复评价的类型,在社交活动展示界面当中设置与其匹配的显示区域格式与排列顺序,以及设置回复评价显示区域的展开格式;并且,根据每条回复评价的类型,在回复评价显示区域当中设置与其匹配的显示区域格式;每条文字评价或者回复信息在显示区域的显示格式包括完整展示、默认展示以及压缩展示,以及所述回复评价显示区域的展开格式包括完全展开、部分展开以及完全收折。
2.根据权利要求1所述的评价信息分类显示方法,其特征在于,根据每条文字评价及其关联的回复评价的类型,在社交活动展示界面的显示区域当中设置该条文字评价对应的子区域的显示格式是采取完整展示、默认展示还是压缩展示。
3.根据权利要求2所述的评价信息分类显示方法,其特征在于,在文字评价的子区域采用完整展示或者默认展示的前提下,再根据其关联的回复评价的类型,设置回复评价显示区域的展开格式是完全展开、部分展开还是完全收折;在文字评价的子区域采用压缩展示的情况下,该文字评价对应的回复评价显示区域的展开格式为完全收折。
4.根据权利要求3所述的评价信息分类显示方法,其特征在于,对于回复评价显示区域当中各个回复评价对应的子区域,根据该回复评价的类型,如果回复评价属于高有效性评价,则将该条回复评价对应的子区域的显示格式设定为完整展示;如果回复评价本身属于中等有效性评价,则设定为默认展示;如果回复评价属于低有效性评价,则采用压缩展示。
5.一种陌生人社交活动的评价信息分类显示系统,其特征在于,包括:
评价获取模块,用于获取用户针对发布的一项陌生人社交活动的每条文字评价或回复评价的文本信息;
置信计算模块,用于针对每条文字评价或回复评价的文本信息,针对每条文字评价或回复评价的文本信息,经过分词、词停用处理,获得该文字评价或回复评价的关键词序列;建立正负置信样本库,正负置信样本库具体包括正置信样本库和负置信样本库;所述正置信样本为有效信息文字占评价总字数的比例大于等于比例阈值的文字评价样本或者回复评价样本;所述负置信评价为有效信息文字占评价总字数的比例小于比例阈值的文字评价样本或者回复评价样本;对于正置信样本库或者负置信样本库中的每一个关键词序列,进行序列扩展;计算正置信样本库和负置信样本库当中每个序列扩展后的样本关键词序列的置信度;对于每条文字评价或者回复评价经过分词、词停用处理后形成的关键词序列,计算该文字评价或者回复评价的关键词序列与正、负置信样本库当中每个序列扩展后的样本关键词序列的相似度,取其中相似度最高的正置信样本或者负置信样本作为该条文字评价或者回复评价的匹配样本,进而将匹配样本的置信度作为该条文字评价或者回复评价的置信度;并且,设定标准评价分值,并且将文字评价或者回复评价的置信分值设为所述标准评价分值与一个基于置信度和其发布者、文字数量、回复数量决定的系数值的乘积;根据该条文字评价或者回复评价的置信度决定该系数值的初步取值;根据发布者和/或文字数量和/或回复数量对该系数值的初步取值加上或者减去一个调整系数值,从而获得所述置信分值;
类型确定模块,用于根据该条文字评价或者回复评价的置信分值所在的数值区间,将每条文字评价或回复评价划入与数值区间对应的类型;所述类型包括:低有效性评价、中等有效性评价以及高有效性评价;
分类显示模块,用于在社交活动展示界面当中,在每个社交活动下方提供一个文字评价的显示区域,在该显示区域内展示针对本社交活动的文字评价;如果一条文字评价具有相关联的回复评价的,在该条文字评价的下方提供一个回复评价显示区域,用于显示该条文字评价相关联的各条回复评价;在文字评价和回复评价的显示区域中,各条评价的文本信息被分配在显示区域中划出的一个子区域内显示;根据每条文字评价及其关联的回复评价的类型,在社交活动展示界面当中设置与其匹配的显示区域格式与排列顺序,以及设置回复评价显示区域的展开格式;并且,根据每条回复评价的类型,在回复评价显示区域当中设置与其匹配的显示区域格式;每条文字评价或者回复信息在显示区域的显示格式包括完整展示、默认展示以及压缩展示,以及所述回复评价显示区域的展开格式包括完全展开、部分展开以及完全收折。
CN201910341596.4A 2019-04-26 2019-04-26 一种陌生人社交活动的评价信息分类显示方法与系统 Active CN110134763B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910341596.4A CN110134763B (zh) 2019-04-26 2019-04-26 一种陌生人社交活动的评价信息分类显示方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910341596.4A CN110134763B (zh) 2019-04-26 2019-04-26 一种陌生人社交活动的评价信息分类显示方法与系统

Publications (2)

Publication Number Publication Date
CN110134763A CN110134763A (zh) 2019-08-16
CN110134763B true CN110134763B (zh) 2021-06-29

Family

ID=67575149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910341596.4A Active CN110134763B (zh) 2019-04-26 2019-04-26 一种陌生人社交活动的评价信息分类显示方法与系统

Country Status (1)

Country Link
CN (1) CN110134763B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101151607A (zh) * 2004-12-14 2008-03-26 谷歌公司 用于提供产品评论的方法、系统和图形用户界面
CN103729394A (zh) * 2012-10-16 2014-04-16 索尼公司 终端装置、终端控制方法、信息处理装置和方法、程序
CN105354227A (zh) * 2015-09-30 2016-02-24 北京奇虎科技有限公司 基于搜索的提供高质量评论信息的方法及装置
CN106557948A (zh) * 2016-10-18 2017-04-05 李超 一种评论信息的展示方法及装置
CN107391729A (zh) * 2017-08-02 2017-11-24 掌阅科技股份有限公司 用户评论的排序方法、电子设备及计算机存储介质
CN109003113A (zh) * 2018-05-30 2018-12-14 浙江口碑网络技术有限公司 评价数据处理和展示的方法及装置,电子设备及存储设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101151607A (zh) * 2004-12-14 2008-03-26 谷歌公司 用于提供产品评论的方法、系统和图形用户界面
CN103729394A (zh) * 2012-10-16 2014-04-16 索尼公司 终端装置、终端控制方法、信息处理装置和方法、程序
CN105354227A (zh) * 2015-09-30 2016-02-24 北京奇虎科技有限公司 基于搜索的提供高质量评论信息的方法及装置
CN106557948A (zh) * 2016-10-18 2017-04-05 李超 一种评论信息的展示方法及装置
CN107391729A (zh) * 2017-08-02 2017-11-24 掌阅科技股份有限公司 用户评论的排序方法、电子设备及计算机存储介质
CN109003113A (zh) * 2018-05-30 2018-12-14 浙江口碑网络技术有限公司 评价数据处理和展示的方法及装置,电子设备及存储设备

Also Published As

Publication number Publication date
CN110134763A (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
CN108536852B (zh) 问答交互方法和装置、计算机设备及计算机可读存储介质
CN108628833B (zh) 原创内容摘要确定方法及装置,原创内容推荐方法及装置
US10572524B2 (en) Content categorization
JP5731250B2 (ja) 情報ストリーム中の興味深いコンテンツを推奨するためのシステムおよび方法
US20130304818A1 (en) Systems and methods for discovery of related terms for social media content collection over social networks
US20150006414A1 (en) Social network for employment search
US20130297581A1 (en) Systems and methods for customized filtering and analysis of social media content collected over social networks
US20150032751A1 (en) Methods and Systems for Utilizing Subject Matter Experts in an Online Community
CN108763362A (zh) 基于随机锚点对选择的局部模型加权融合Top-N电影推荐方法
EP3301591A1 (en) System and method for identifying related queries for languages with multiple writing systems
US20140040371A1 (en) Systems and methods for identifying geographic locations of social media content collected over social networks
US20100057577A1 (en) System And Method For Providing Topic-Guided Broadening Of Advertising Targets In Social Indexing
CN101496003A (zh) 社交网络中用户的兼容性评分
JP2009510637A (ja) 表示のための高品質レビューの選択
CN113934941B (zh) 一种基于多维度信息的用户推荐系统及方法
Okazaki et al. How to mine brand Tweets: Procedural guidelines and pretest
Hijikata et al. Social summarization of text feedback for online auctions and interactive presentation of the summary
Shayegan et al. A method for identifying personality traits in telegram
JP7333931B2 (ja) 投稿分析システム、投稿分析装置および投稿分析方法
Wu et al. Understanding customers using Facebook Pages: Data mining users feedback using text analysis
CN110134763B (zh) 一种陌生人社交活动的评价信息分类显示方法与系统
Nakajima et al. Early detection of buzzwords based on large-scale time-series analysis of blog entries
WO2023159766A1 (zh) 餐饮数据分析方法、装置、电子设备及存储介质
CN114528448B (zh) 一种全球外贸客户客户画像精准分析系统
Vasconcelos et al. Popularity dynamics of foursquare micro-reviews

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant