CN113741759B - 评论信息的展示方法、装置、计算机设备和存储介质 - Google Patents
评论信息的展示方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113741759B CN113741759B CN202111309148.XA CN202111309148A CN113741759B CN 113741759 B CN113741759 B CN 113741759B CN 202111309148 A CN202111309148 A CN 202111309148A CN 113741759 B CN113741759 B CN 113741759B
- Authority
- CN
- China
- Prior art keywords
- information
- comment
- label
- comment information
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 92
- 230000003993 interaction Effects 0.000 claims abstract description 237
- 230000002452 interceptive effect Effects 0.000 claims abstract description 45
- 238000012163 sequencing technique Methods 0.000 claims abstract description 26
- 239000013598 vector Substances 0.000 claims description 192
- 238000012545 processing Methods 0.000 claims description 80
- 238000012549 training Methods 0.000 claims description 69
- 238000006243 chemical reaction Methods 0.000 claims description 35
- 230000002996 emotional effect Effects 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 23
- 238000012552 review Methods 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 16
- 230000008451 emotion Effects 0.000 claims description 15
- 230000001960 triggered effect Effects 0.000 claims description 12
- 230000000873 masking effect Effects 0.000 claims description 11
- 230000007935 neutral effect Effects 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 8
- 230000002123 temporal effect Effects 0.000 claims description 5
- 238000011084 recovery Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 19
- 238000005516 engineering process Methods 0.000 description 14
- 238000013473 artificial intelligence Methods 0.000 description 13
- 238000013507 mapping Methods 0.000 description 13
- 230000006399 behavior Effects 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 8
- 238000003058 natural language processing Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 208000034619 Gingival inflammation Diseases 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 210000000214 mouth Anatomy 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 208000004371 toothache Diseases 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 241000976416 Isatis tinctoria subsp. canescens Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请涉及一种评论信息的展示方法、装置、计算机设备和存储介质,可应用于对文本、图片、音频、视频或其它多媒体信息进行评论的应用场景。该方法包括:响应于评论展示操作,获取待展示的评论信息和所述评论信息的交互特征;基于所述交互特征确定所述评论信息所对应的交互分值;在获得所述评论展示操作所对应操作方的标签信息的情况下,基于所述标签信息确定所述操作方对所述评论信息的点击概率;根据所述点击概率和所述交互分值对所述评论信息排序,并按照排序的先后顺序对所述评论信息进行展示。采用本方法能够提高操作方对评论信息的交互效率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种评论信息的展示方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,信息的传递变得越来越快捷,越来越多的人在社交媒体上向其他用户展示媒体信息,其他用户可以与该媒体信息进行互动,互动类型包括点赞类型、转发类型和评论类型等,在该媒体信息的评论区可以对评论类型的互动所产生的各个评论信息进行展示,以便其他用户可以与该媒体信息的评论信息进一步互动。
目前,评论信息的展示主要是基于评论信息的质量、点赞量和回复量中的任意一种进行排序展示,此种展示策略下所有用户在评论区看到的评论信息是完全相同的,无法实现评论信息对用户的个性化展示,降低了用户对评论信息的互动效率。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高与评论信息互动效率的评论信息的展示方法、装置、计算机设备和存储介质。
一种评论信息的展示方法,所述方法包括:
响应于评论展示操作,获取待展示的评论信息和所述评论信息的互动特征;
基于所述互动特征确定所述评论信息所对应的互动分数;
在获得所述评论展示操作所对应操作方的标签信息的情况下,基于所述标签信息确定所述操作方对所述评论信息的兴趣概率;
根据所述兴趣概率和所述互动分数对所述评论信息排序,并按照排序的先后顺序对所述评论信息进行展示。
一种评论信息的展示装置,所述装置包括:
信息获取模块,用于响应于评论展示操作,获取待展示的评论信息和所述评论信息的互动特征;
互动分数确定模块,用于基于所述互动特征确定所述评论信息所对应的互动分数;
兴趣概率确定模块,用于在获得所述评论展示操作所对应操作方的标签信息的情况下,基于所述标签信息确定所述操作方对所述评论信息的兴趣概率;
信息展示模块,用于根据所述兴趣概率和所述互动分数对所述评论信息排序,并按照排序的先后顺序对所述评论信息进行展示。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
响应于评论展示操作,获取待展示的评论信息和所述评论信息的互动特征;
基于所述互动特征确定所述评论信息所对应的互动分数;
在获得所述评论展示操作所对应操作方的标签信息的情况下,基于所述标签信息确定所述操作方对所述评论信息的兴趣概率;
根据所述兴趣概率和所述互动分数对所述评论信息排序,并按照排序的先后顺序对所述评论信息进行展示。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
响应于评论展示操作,获取待展示的评论信息和所述评论信息的互动特征;
基于所述互动特征确定所述评论信息所对应的互动分数;
在获得所述评论展示操作所对应操作方的标签信息的情况下,基于所述标签信息确定所述操作方对所述评论信息的兴趣概率;
根据所述兴趣概率和所述互动分数对所述评论信息排序,并按照排序的先后顺序对所述评论信息进行展示。
一种计算机程序,所述计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行以下步骤:
响应于评论展示操作,获取待展示的评论信息和所述评论信息的互动特征;
基于所述互动特征确定所述评论信息所对应的互动分数;
在获得所述评论展示操作所对应操作方的标签信息的情况下,基于所述标签信息确定所述操作方对所述评论信息的兴趣概率;
根据所述兴趣概率和所述互动分数对所述评论信息排序,并按照排序的先后顺序对所述评论信息进行展示。
上述评论信息的展示方法、装置、计算机设备和存储介质,响应于评论展示操作,获取待展示的评论信息和评论信息的互动特征,基于互动特征确定评论信息所对应的互动分数,并在获得评论展示操作所对应操作方的标签信息的情况下,基于标签信息确定操作方对评论信息的兴趣概率,从而根据兴趣概率和互动分数对评论信息排序,并按照排序的先后顺序对评论信息进行展示,使得针对不同的操作方,均可以按照操作方的喜好进行个性化展示,进而可以提高操作方对评论信息的互动效率。
一种评论信息的展示方法,所述方法包括:
在媒体展示页面展示媒体信息;所述媒体信息具有对应的评论信息;
响应于在所述媒体展示页面触发的评论展示操作,展示评论界面;
在所述评论界面中,按照所述评论信息的互动分数以及所述评论展示操作所对应的操作方对所述评论信息的兴趣概率,对所述评论信息进行按序展示;
其中,所述兴趣概率是基于所述操作方的标签信息确定的。
一种评论信息的展示装置,所述装置包括:
媒体信息展示模块,用于在媒体展示页面展示媒体信息;所述媒体信息具有对应的评论信息;
评论界面展示模块,用于响应于在所述媒体展示页面触发的评论展示操作,展示评论界面;
评论信息展示模块,用于在所述评论界面中,按照所述评论信息的互动分数以及所述评论展示操作所对应的操作方对所述评论信息的兴趣概率,对所述评论信息进行按序展示;
其中,所述兴趣概率是基于所述操作方的标签信息确定的。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
在媒体展示页面展示媒体信息;所述媒体信息具有对应的评论信息;
响应于在所述媒体展示页面触发的评论展示操作,展示评论界面;
在所述评论界面中,按照所述评论信息的互动分数以及所述评论展示操作所对应的操作方对所述评论信息的兴趣概率,对所述评论信息进行按序展示;
其中,所述兴趣概率是基于所述操作方的标签信息确定的。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
在媒体展示页面展示媒体信息;所述媒体信息具有对应的评论信息;
响应于在所述媒体展示页面触发的评论展示操作,展示评论界面;
在所述评论界面中,按照所述评论信息的互动分数以及所述评论展示操作所对应的操作方对所述评论信息的兴趣概率,对所述评论信息进行按序展示;
其中,所述兴趣概率是基于所述操作方的标签信息确定的。
一种计算机程序,所述计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行以下步骤:
在媒体展示页面展示媒体信息;所述媒体信息具有对应的评论信息;
响应于在所述媒体展示页面触发的评论展示操作,展示评论界面;
在所述评论界面中,按照所述评论信息的互动分数以及所述评论展示操作所对应的操作方对所述评论信息的兴趣概率,对所述评论信息进行按序展示;
其中,所述兴趣概率是基于所述操作方的标签信息确定的。
上述评论信息的展示方法、装置、计算机设备和存储介质,通过在媒体展示页面展示媒体信息,其中媒体信息具有对应的评论信息,并响应于在媒体展示页面触发的评论展示操作,展示评论界面,在评论界面中,按照评论信息的互动分数以及评论展示操作所对应的操作方对评论信息的兴趣概率,对评论信息进行按序展示,其中,兴趣概率是基于操作方的标签信息确定的,使得针对不同的操作方,均可以按照操作方的喜好进行个性化展示,进而可以提高操作方对评论信息的互动效率。
附图说明
图1为一个实施例中评论信息的展示方法的应用环境图;
图2为一个实施例中评论信息的展示方法的流程示意图;
图3为一个实施例中媒体信息展示页面示意图;
图4为一个实施例中DeepFM模型结构示意图;
图5为一个实施例中评论信息展示示意图;
图6为另一个实施例中评论信息展示示意图;
图7为一个实施例中Bert模型结构示意图;
图8为另一个实施例中Bert模型结构示意图;
图9为另一个实施例中评论信息的展示方法的流程示意图;
图10为另一个实施例中评论信息的展示方法的流程示意图;
图11为另一个实施例中评论信息的展示方法的流程示意图;
图12为另一个实施例中评论信息的展示方法的流程示意图;
图13为一个实施例中评论信息的展示装置的结构框图;
图14为另一个实施例中评论信息的展示装置的结构框图;
图15为另一个实施例中评论信息的展示装置的结构框图;
图16为一个实施例中计算机设备的内部结构图;
图17为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的评论信息的展示方法涉及人工智能的机器学习、自然语言处理等技术,其中:
人工智能(Artificial Intelligence, AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视角技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
自然语言处理(Nature Language processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请提供的评论信息的展示方法,可以应用于如图1所示的应用环境中。其中,终端102和终端106分别通过网络与服务器104进行通信,评论信息可以产生于终端102、终端106和其他终端的至少一个终端。该评论信息的展示方法可以通过终端(终端102或终端104)或服务器104执行,也可以通过终端和服务器104的交互来实现。以评论信息的展示方法执行于终端102为例进行说明,终端102响应于评论展示操作,从服务器104获取待展示的评论信息和评论信息的互动特征;基于互动特征确定评论信息所对应的互动分数;在获得评论展示操作所对应操作方的标签信息的情况下,基于标签信息确定操作方对评论信息的兴趣概率;根据兴趣概率和互动分数对评论信息排序,并按照排序的先后顺序对评论信息进行展示。
其中,终端可以但不限于是手机、电脑、智能语音交互设备、智能家电、车载终端等,服务器104可以是独立的物理服务器,也可以是区块链系统中的多个服务节点所组成的服务器集群,各服务节点之间形成组成点对点(P2P,Peer To Peer)网络,P2P协议是一个运行在传输控制协议(TCP,Transmission Control Protocol)协议之上的应用层协议。
此外,服务器104还可以是多个物理服务器构成的服务器集群,可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在一个实施例中,如图2所示,提供了一种评论信息的展示方法,以该方法应用于图1中的计算机设备(终端或服务器)为例进行说明,包括以下步骤:
S202,响应于评论展示操作,获取待展示的评论信息和评论信息的互动特征。
其中,评论展示操作是用于触发对评论信息进行展示的操作,具体可以是对评论展示控件的触发操作。评论信息是指对媒体信息进行评论类型互动时,所产生的用于表达观点的内容,该内容可以是文字、图片、动画、视频、语音中的至少一种。互动特征是指用户与评论信息进行互动,所产生的互动信息,具体包括点赞信息、时间信息和回复信息,点赞信息是指对评论信息进行点赞互动所产生的信息,具体包括点赞方的用户标识和评论信息累积的点赞量,点赞量是指点赞行为发生的次数,时间信息是指评论信息的发表时间或者评论信息的发表时间与当前时间之间的时间差,回复信息是指对评论信息进行评论回复所产生的信息,具体包括回复方的用户标识、回复内容和回复行为发生的次数。
媒体信息是指通过应用平台所发布的信息,包括文字、图片、声音、视频、网页和链接中的至少一种信息。可以理解的是,在自媒体时代,每个用户都可以成为媒体信息的创作者,应用平台为每个创作者提供了媒体信息的发布平台,在媒体信息发布之后,其他接收到该媒体信息的用户,可以针对该媒体信息进行互动,互动类型包括点赞类型、转发类型或评论类型等,其中,评论类型的互动会产生相应的评论信息,所产生的评论信息将被展示到该媒体信息对应的评论区,评论区即评论信息的展示界面,也称为评论界面。
例如,媒体信息为分享方对行程、路况进行直播分享的视频画面,操作方可以在车载终端或手机终端观看该直播画面,并触发对评论信息进行展示的操作,来获取该媒体信息所对应的评论信息以进行展示。
具体地,当计算机设备为终端时,终端在媒体信息展示页面展示媒体信息和评论展示控件,用户可通过点击评论展示控件触发评论展示操作,终端响应于评论展示操作,获取待展示的评论信息和评论信息的互动特征。
参考图3所示的媒体信息展示页面,在该媒体信息展示页面展示有媒体信息和评论展示控件302,该媒体信息为视频,终端响应于对评论展示控件302的触发操作,获取该媒体信息对应的待展示的评论信息、各评论信息对应的点赞量、回复量,以及各评论信息的发表时间。
在一个实施例中,当计算机设备为终端时,终端响应于评论展示操作获取所展示的媒体信息的媒体信息标识,并根据媒体信息标识生成评论信息获取请求,将所生成的评论信息获取请求发送至服务器,服务器基于所接收的评论信息获取请求从数据库中查找该媒体信息标识所对应的评论信息和该评论信息对应的互动特征,并将评论信息和评论信息的互动特征返回给终端,终端接收服务器返回的评论信息和评论信息的互动特征。
S204,基于互动特征确定评论信息所对应的互动分数。
其中,互动分数用于表征其他用户对评论信息感兴趣的程度,也可以说是评论信息在其他用户中的热度,互动分数也可以称为交互分值。可以理解的是,当互动特征为点赞信息时,点赞行为所发生的次数越多,说明其他用户对该评论信息的感兴趣的程度越大;当互动特征为回复信息时,回复行为所发生的次数越多,说明其他用户对该评论信息的感兴趣程度越大;当互动特征为时间信息时,评论信息的发表时间越早,其他用户对该评论信息的感兴趣程度越低。本申请实施例中,点赞行为所发生的次数简称为点赞量,回复行为所发生的次数简称为回复量。
在一个实施例中,计算机设备在得到各个评论信息以及各个评论信息的互动特征之后,对互动特征进行预处理,得到互动特征值;基于互动特征值确定评论信息所对应的互动分数。
其中,预处理也可以称为特征处理,预处理可以是转换处理,具体可以是指数转换处理和数值转换处理中的至少一种。指数转换处理是指对互动特征采用指数函数进行转化处理,数值转换处理是指对互动特征的数值进行调整。
具体地,计算机设备对所得到的互动特征分别进行预处理,得到预处理后的互动特征值,并将互动特征值输入互动分数确定模型,通过互动分数确定模型确定各评论信息所对应的互动分数。
在一个实施例中,互动特征包括点赞信息、时间信息和回复信息,S204具体包括以下步骤:分别对点赞信息、时间信息和回复信息进行特征处理,得到点赞特征值、时间特征值和回复特征值;基于点赞特征值、时间特征值和回复特征值,确定评论信息所对应的互动分数。
具体地,计算机设备在得到点赞信息、时间信息和回复信息之后,对点赞信息中的点赞量进行特征处理,得到点赞特征值;对时间信息进行特征处理,得到时间特征值;对回复信息中的回复量进行特征处理,得到回复特征值;探后将点赞特征值、时间特征值和回复特征值输入互动分数确定模型,通过互动分数确定模型确定各评论信息所对应的互动分数。
S206,在获得评论展示操作所对应操作方的标签信息的情况下,基于标签信息确定操作方对评论信息的兴趣概率。
其中,标签信息,即用户信息的标签化,标签信息也可以称为用户画像,具体包括用户的基础标签、消费标签、互动标签,基础标签也可以称为基础画像,消费标签也可以称为消费画像,互动标签也可以称为互动画像,基础标签包括操作方的地域、性别、年龄和学历中的至少一种;消费标签包括操作方历史观看的媒体信息的类别标签,类别标签具体可以是多级标签,例如,某个媒体信息的类别标签为“游戏-手游-飞行射击”,则“游戏”即为一级标签,“手游”即为二级标签,“飞行射击”即为三级标签;互动标签包括操作方历史发表的评论信息的评论标签、历史互动的评论信息的评论标签和互动的情感倾向中的至少一种,例如,操作方历史时刻回复或点赞了某条评论信息,则该条评论信息的标签和该条评论信息的情感倾向,即为操作方的互动标签,或者操作方历史时刻发表了一条评论信息,则该条评论信息的标签和该条评论信息的情感倾向即为操作方的互动标签,评论信息的标签可以是从评论信息中所提取出的特征词,情感倾向可以是正向情感、负向情感和中性情感的比例。
如下表所示,分别为用户A的标签信息和用户B的标签信息,可以看出用户A是年龄较大、且关注乔XX,同时他更倾向于发表或者互动正向的评论。用户B年龄稍小,且关注詹YY,同时他倾向于发表或互动负向的评论。
表1 标签信息
兴趣概率用于表征操作方对每条评论信息感兴趣的程度,也可以说是操作方与评论信息进行互动的概率,互动行为也可以称为点击行为,兴趣概率也可以称为点击概率,可以理解的是,操作方对某条评论信息感兴趣的程度越大,则操作方与该条评论信息进行互动的概率也越大。其中,操作方与该条评论所能进行的互动可以是点赞互动或回复互动。
具体地,当计算机设备为终端时,终端还可以响应于评论展示操作获取操作方的用户标识,并基于操作方的用户标识生成标签信息获取请求,并将标签信息获取请求发送至服务器,服务器基于所接收到的标签信息获取请求中的用户标识,在获得用户标识对应的用户权限的情况下,查找用户标识所对应的标签信息,并将所查找到的标签信息返回给终端,终端接收服务器所返回的标签信息,并基于标签信息和所获取的各个评论信息,确定操作方对每条评论信息的兴趣概率。
在一个实施例中,S206具体包括以下步骤:在获得评论展示操作所对应操作方的标签信息的情况下,将标签信息和评论信息输入预测模型;通过预测模型对标签信息进行特征处理,得到操作方对评论信息的兴趣概率。
其中,预测模型为神经网络模型,例如卷积神经网络(Convolutional NeuralNetworks,CNN)模型、深度神经网络(Deep Neural Networks,DNN)模型、梯度提升决策树(Gradient Boosting Decision Tree, GBDT)模型、因式分解机(Factorization Machine,FM)、基于因式分解机的深度神经网络(A Factorization Machine-based NeuralNetwork,DeepFM)模型等。
如图4所示,为一个实施例中DeepFM模型结构示意图,DeepFM模型由嵌入层、FM部分和Deep部分组成,其中嵌入层用于对标签信息和评论信息进行特征处理,得到特征向量,并将所得到的特征向量分别输入FM部分和Deep部分,FM部分会对输入的特征向量进行自动组合,以学习不同特征向量之间的交叉特征,也可以说是二阶特征或三阶特征,Deep部分会对输入的特征向量进行前馈网络学习,基于FM部分和Deep部分的输出结果,来确定操作方对评论信息的兴趣概率。
S208,根据兴趣概率和互动分数对评论信息排序,并按照排序的先后顺序对评论信息进行展示。
具体地,计算机设备在得到各个评论信息的兴趣概率和互动分数之后,针对每个评论信息,分别基于其所对应的兴趣概率和互动分数确定排序分数,并按照计算所得到的各个排序分数对各个评论信息进行排序,得到排序结果,案号排序结果对评论信息进行展示。
在一个实施例中,S208具体包括以下步骤:根据兴趣概率和互动分数确定评论信息的排序分数;基于排序分数对评论信息进行降序排列,得到操作方的按照兴趣程度从大到小排列的评论信息;将操作方的按照兴趣程度从大到小排列的评论信息进行展示。
其中,排序分数值的越大,表示操作方对相应的评论信息感兴趣的程度越大,即操作方与该评论信息进行互动的可能性越大。
例如,媒体信息对应有评论信息1、评论信息2和评论信息3,操作方A和操作方B均触发了关于该媒体信息的评论展示操作,则针对操作方A计算出,评论信息1的排序分数为50分、评论信息2的排序分数为80分、评论信息3的排序分数为60分,则对评论信息1、评论信息2和评论信息3进行排序为“评论信息2,评论信息3,评论信息1”,并在操作方A的终端的媒体信息的评论区由上至下依次展示评论信息2、评论信息3和评论信息1;针对操作方B计算出,评论信息1的排序分数为70分、评论信息2的排序分数为60分、评论信息3的排序分数为90分,则对评论信息1、评论信息2和评论信息3进行排序为“评论信息3,评论信息1,评论信息2”,并在操作方B的终端的媒体信息的评论区由上至下依次展示评论信息3、评论信息1和评论信息2.
例如,图5为用户A关于媒体信息1的评论信息展示示意图,图6用户B关于媒体信息1的评论信息展示示意图,图5中所展示的各评论信息相对于用于A的排序分数从上到下依次下降,具体为关于乔XX的正向评论排序靠前;图6中所展示的各评论信息相对于用户B的排序分数从上到下依次下降,具体为关于乔XX的负向评论排序靠前;结合图5和图6可以看出同一媒体信息的评论信息针对不同的用户可以实现个性化展示。
上述实施例中,计算机设备通过响应于评论展示操作,获取待展示的评论信息和评论信息的互动特征,基于互动特征确定评论信息所对应的互动分数,并在获得评论展示操作所对应操作方的标签信息的情况下,基于标签信息确定操作方对评论信息的兴趣概率,从而根据兴趣概率和互动分数对评论信息排序,并按照排序的先后顺序对评论信息进行展示,使得针对不同的操作方,均可以按照操作方的喜好进行个性化展示,进而可以提高操作方对评论信息的互动效率。
在一个实施例中,计算机设备分别对点赞信息、时间信息和回复信息进行特征处理,得到点赞特征值、时间特征值和回复特征值的过程具体包括以下步骤:对点赞信息进行对数转换处理,得到点赞特征值;对时间信息进行指数转换处理,并基于转换的结果和时间阈值之间的大小关系确定时间特征值;基于回复信息与回复量阈值之间的大小关系,确定回复特征值。
具体地,计算机设备对点赞信息中的点赞量进行对数转换处理,得到点赞特征值;对时间信息进行指数转换处理,得到转换结果,并将转换结果与时间阈值进行比较,并基于比较结果确定时间特征值;将回复信息中的回复量与回复量阈值进行比较,并基于比较结果确定回复特征值。
其中,时间阈值也可以称为时间转换阈值。
例如,对于点赞量,可以采用以下公式(1)对点赞量进行对数转换处理,以得到点赞特征值:
其中,Num like 为任意一条评论信息对应的点赞量,W like 为该条评论信息对应的点赞特征值。
对于时间信息,可以采用以下公式(2)对时间信息指数转换处理,得到转换结果:
其中,t表示任意一条评论信息的时间信息,value为转换结果。
在得到转换结果之后,可以利用预设的时间阈值对转换结果进行判别处理,得到对比结果,并根据对比结果确定时间特征值。具体地,可以根据以下公式进行确定时间特征值:
其中,W time 为任意一条评论信息所对应的时间特征值。
针对回复量,可以利用预设的回复量阈值对回复量进行判别处理,得到对比记过,并根据对比结果确定回复特征值。具体地,可以根据以下公式确定回复特征值:
其中,Num replay 为任意一条评论信息所对应的回复量,W replay 为该评论信息所对应的回复特征值。
上述实施例中,计算机设备基于不同互动特征的特点,分别对不同的互动特征进行相应的特征处理,从而提高特征处理的效率,并得到适用于后续步骤的点赞特征值、时间特征值和回复特征值,提高了对评论信息进行排序展示的效率。
在一个实施例中,计算机设备基于点赞特征值、时间特征值和回复特征值,确定评论信息所对应的互动分数的过程包括以下步骤:基于点赞特征值确定第一互动分数;基于时间特征值和回复特征值确定第二互动分数;根据第一互动分数和第二互动分数,确定评论信息所对应的互动分数。
具体地,计算机设备在确定出点赞特征值、时间特征值和回复特征值之后,直接将点赞特征值的数值确定为第一互动分数,并对时间特征值和回复特征值求积,将所得到的积确定为第二互动分数,并根据第一互动分数和第二互动分数确定评论信息所对应的互动分数。
在一个实施例中,计算机设备在得到第一互动分数和第二互动分数之后,直接将第一互动分数和第二互动分数相加求和,并将所得到的和确定为评论信息所对应的互动分数。具体地,互动分数可以采用以下公式进行确定:
其中,Score hudong 为任意一条评论信息所对应的互动分数,W like 为该条评论信息对应的点赞特征值,W replay 该条评论信息对应的点赞特征值,W time 为该条评论信息所对应的时间特征值。
在一个实施例中,计算机涉笔在得到第一互动分数和第二互动分数之后,获取第一互动分数所对应的权重,以及第二互动分数所对应的权重,并根据第一互动分数、第二互动分数、以及第一互动分数的权重和第二互动分数的权重,对第一互动分数和第二互动分数进行加权求和,并将所得到的加权和确定为评论信息所对应的互动分数。
上述实施例中,计算机设备通过基于点赞特征值、时间特征值和回复特征值,确定评论信息所对应的互动分数,充分考虑了评论信息在其他用户中的热度,进而在对评论信息进行排序时,可以使得评论信息的排序结果更加准确,进而可以提高操作方对评论信息的互动效率。
在一个实施例中,计算机设备基于标签信息确定操作方对评论信息的兴趣概率的过程包括以下步骤:将标签信息和评论信息向量化,得到标签特征向量和文本向量;对标签特征向量的向量值进行特征交叉处理,得到交叉标签特征向量;基于交叉标签特征向量,确定操作方对文本向量的兴趣概率。
具体地,计算机设备在得到标签信息之后,可以对标签信息进行特征处理,得到标签特征,并对所得到的标签特征进行向量化,得到标签特征向量;在得到评论信息之后,基于评论信息的类型,确定评论信息的语义内容,并对评论信息的语义内容进行向量化,得到文本向量;计算机设备得到标签特征向量和文本向量之后,一方面对标签特征向量的向量值和文本向量进行特征交叉处理,得到交叉标签特征向量,另一方面对标签特征向量进行前馈网络学习,得到高阶组合特征向量,并根据交叉标签特征向量和高阶组合特征向量确定操作方对文本向量的兴趣概率。
在一个实施例中,计算机设备通过预测模型基于标签信息确定操作方对评论信息的兴趣概率,其中预测模型为DeepFM模型,具体地,通过DeepFM模型的嵌入层对将标签信息和评论信息向量化,得到标签特征向量和文本向量,并通过DeepFM模型的FM部分对标签特征向量的向量值和文本向量进行特征交叉处理,得到交叉标签特征向量,通过DeepFM模型的Deep部分对标签特征向量进行前馈网络学习,得到高阶组合特征向量,并根据FM部分输出的交叉标签特征向量和Deep部分输出的高阶组合特征向量确定操作方对文本向量的兴趣概率。
上述实施例中,计算机设备通过将标签信息和评论信息向量化,得到标签特征向量和文本向量,对标签特征向量的向量值进行特征交叉处理,得到交叉标签特征向量,基于交叉标签特征向量,确定操作方对文本向量的兴趣概率,充分考虑了操作方的喜好来确定操作方对评论信息点击概率,进而在对评论信息进行排序时,可以使得评论信息的排序结果更加准确,进而可以提高操作方对评论信息的互动效率。
在一个实施例中,标签信息包括连续型标签信息和离散型标签信息,计算机设备对标签信息进行向量化,得到标签特征向量的过程包括:对连续型标签信息进行归一化处理,得到第一标签信息特征;对离散型标签信息进行特征编码处理,得到第二标签信息特征;对第一标签信息特征和第二标签信息特征之间的组合进行向量化,得到标签特征向量。
其中,连续型标签信息可以是数值型且在数值上连续的标签信息,例如用户的年龄即属于连续型标签信息;离散型标签信息可以是文本型的标签信息,例如用户的性别、地域、学历、类别标签、评论标签和情感倾向均属于离散型的标签信息。
归一化处理是指对连续型的标签信息的数值进行缩放处理,以使所得到的处理后的数值处于目标数值范围内。例如,本申请实施例中,具体可以采用以下公式对年龄进行归一化处理:
其中,Age为用户的年龄,W age 为用户的年龄对应的标签信息特征。
特征编码处理是指对离散性的每个标签信息分别确定其对应的编码,并将编码作为该标签信息所对应的标签信息特征。
例如,针对用户的性别,可以用编码1表示性别“男”,用编码0表示性别“女”;针对地域,可以建立地域映射表,在地域映射表中,将北京映射为“1”,上海映射为“2”、广州映射为“3”、深圳映射为“4”等,以此类推,从而对每个城市分别映射为相应的数字;针对类别标签和评论标签,也可以分别建立相应的关键词映射表,以便确定每个关键词所对应的编号,以类别标签为例,进行说明,参考以下类别标签关键词映射表,下表中分别示出了用户A和用户B的类别标签,其中,用户A的类别标签分别为“牙疼、蛀牙、孩子、牙齿、牙龈发炎、口腔”,从表中可以看出类别标签“牙疼”映射为编码“1018077”、类别标签“蛀牙”映射为编码“1021418”,类别标签“孩子”映射为编码“1000040”,类别标签“牙齿”映射为编码“1002422”,类别标签“牙齿”映射为编码“1002422”,类别标签“牙龈发炎”映射为编码“3688257”,类别标签“口腔”映射为编码“1010328”;用户B的类别标签分别为“暑运、疫情防控、旅客、疫情、成都东站、防控”,从表中可以看出用户B的类别标签依次映射为编码“200556020、256587878、1000331、1001324、99886829、108918562”。
表2 类别标签关键词映射表
此外,当类别标签为多级类别标签时,还可以针对不同级别的标签分别建立相应的类别标签关键词映射表,具体可参考下表3所示的一级类别标签关键词映射表、下表4所示的二级类别标签关键词映射表以及下表3所示的三级类别标签关键词映射表:
表3 一级类别标签关键词映射表
表4 二级类别标签关键词映射表
表5 三级类别标签关键词映射表
针对情感倾向,可以分别统计正向评论、负向评论和中性评论的比例,并将比例最高的情感倾向确定为用户的情感倾向,并对用户情感倾向进行编码。例如,用户正向评论的比例为50%、负向评论的比例为20%,中性评论的比例为30%,则确定用户的情感倾向为正向情感倾向,在对情感倾向进行编码时,可以用1表示正向情感倾向,用2表示负向情感倾向,用0表示中性情感倾向。
上述实施例中,计算机设备通过对连续型标签信息进行归一化处理,得到第一标签信息特征,对离散型标签信息进行特征编码处理,得到第二标签信息特征,对第一标签信息特征和第二标签信息特征之间的组合进行向量化,得到标签特征向量,从而提高了特征处理的效率,并得到适用于后续步骤的标签特征向量,提高了对评论信息进行排序展示的效率。
在一个实施例中,计算机设备对评论信息进行向量化,得到文本向量的过程具体包括以下步骤:确定评论信息的信息类型,按照信息类型提取评论信息的语义文本,对所提取的语义文本进行向量化,得到文本向量。
其中,评论信息的信息类型包括文字类型、图片类型、动画类型、视频类型和语音类型。
具体地,当评论信息的信息类型为文字类型时,计算机设备可以直接将评论信息的文字内容作为该评论信息的语义文本;当评论信息的类型为图片类型、动画类型或视频类型时,计算机设备通过预先训练的图像识别模型对评论信息进行识别,并根据识别结果确定该评论信息的语义文本;当评论信息的类型为语音类型时,计算机设备通过预先训练的语音识别模型对评论信息进行识别,并根据识别结果确定该评论信息的语义文本。其中图像识别模型和语音识别模型均为神经网络模型。
上述实施例中,计算机设备通过确定评论信息的信息类型,按照信息类型提取评论信息的语义文本,对所提取的语义文本进行向量化,得到文本向量,提高了特征处理的效率,并得到适用于后续步骤的文本向量,提高了对评论信息进行排序展示的效率。
在一个实施例中,计算设备在得到语义文本之后,将语义文本输入训练后的词向量模型,以通过词向量模型对语义文本进行向量化,得到文本向量。
其中,训练后的词向量模型为神经网络模型,例如卷积神经网络(CNN)模型、文本卷积神经网络(TextCNN)模型、长短期记忆人工神经网络(Long Short-Term Memory,LSTM)模型、双向编解码(Bidirectional Encoder Representations from Transformers,Bert)模型和压缩双向编解码(Tiny- Bert)模型等中的任意一种。
在一个实施例中,计算机设备采用Bert模型对语义文本进行向量化,得到文本向量。其中,Bert模型是一种基于机器学习(Machine Learning,ML)的自然语言处理(NatureLanguage processing,NLP)中的预训练模型,采用了Transformer作为模型的基础架构。
Transformer是由解码器和编码器两部分组成。其中,编码器可以由注意力机制和前向传播模块等构成。编码器也可以由注意力机制和前向传播模块等构成。编码器可以用于对输入的文本发布内容进行向量转换处理,得到文本发布内容对应的表示向量。解码器可以用于对文本发布内容对应的表示向量进行解码预测,通过表示向量还原出文本发布内容。
在一个实施例中,计算机设备在采用Bert模型对语义文本进行向量化时,可以将Bert模型的架构设置为12层Transformer,其中,每一层Transformer都可以对输入语义文本进行向量化,得到每一层对应的文本向量,并从各层对应的文本向量中选取目标文本向量,作为Bert模型的输出。
例如,如图7所示,Bert模型由12层Transformer组成。假设Bert的输入为L长度的语义文本,其中每一层的输出都为L+2,包括每个字的向量及CLS向量和SEP向量,本申请选择第四层Transformer的CLS向量拼接第十二层的CLS向量作为语义文本输入的向量结果,即输入的语义文本的文本向量。其中,CLS向量可以代表整句话的文本特征。SEP是分割向量,用于在两句话之间做分隔符。
上述实施例中,计算机设备通过词向量模型对语义文本进行向量化,从而可以得到高精确度的文本向量,从而在基于文本向量预测兴趣概率时可以提高兴趣概率预测的准确度,进而在对评论信息进行排序时,可以使得评论信息的排序结果更加准确,进而可以提高操作方对评论信息的互动效率。
在一个实施例中,上述评论信息的展示方法还包括对词向量模型进行训练的过程,该过程具体包括以下步骤:获取评论信息样本;评论信息样本包括第一训练样本和第二训练样本;基于第一训练样本对词向量模型进行预训练;对第二训练样本中的评论关键词进行掩盖处理;基于掩盖处理后的评论信息样本对预训练的词向量模型进行增量训练,得到训练后的词向量模型。
其中,词向量模型未训练好的、模型性能未达到指标的词向量模型。第一训练样本可以是历史时段获取评论语料,第二训练样本为对评论语料进行分词后所得到分词语料。
具体地,计算机设备通过第一训练样本对词向量模型进行预训练,得到预训练的词向量模型,然后对第二训练样本中的部分评论关键词进行掩盖(Mask)处理,并将掩盖处理后的第二训练样本输入预训练的词向量模型进行增量训练。
例如,第二样本包括“这”、“游戏”、“很”、“好玩”,可以将第二样本中 “游戏”Mask之后输入预训练的词向量模型进行增量训练,从而得到训练后的词向量模型。
如图8所示,为本申请实施例中,所训练的包含12层Transformer的Bert模型的结构示意图。
在一个实施例中,计算机设备可以预先建立关于评论信息的评论词典,从而在可以直接采用该评论词典对第一训练样本进行分词,以得到第二训练样本。
上述实施例中,计算机设备通过获取评论信息样本,其中评论信息样本包括第一训练样本和第二训练样本;基于第一训练样本对词向量模型进行预训练;对第二训练样本中的评论关键词进行掩盖处理,并基于掩盖处理后的评论信息样本对预训练的词向量模型进行增量训练,得到高正确率和高精确率的训练后的词向量模型,进而在通过训练后的词向量模型对语义文本进行向量化时,可以得到高精确度的文本向量。
在一个实施例中,上述评论信息的展示方法还包括对预测模型进行训练的过程,该过程具体包括以下步骤:获取预测训练样本;通过预测训练样本对预测模型进行训练,得到训练后的预测模型。
其中,预测训练样本包括标签信息样本和评论信息样本,标签信息样本包括基础标签样本、消费标签样本和互动标签样本,具体地可以获取至少一个用户的标签信息作为基础标签样本,并获取该用户在历史时段内的消费标签和互动标签分别作为消费标签样本和互动标签样本,并获取该用户在历史时段内某一子历史时段的互动评论信息,将该所获取的评论信息作为评论信息样本。
例如,获取用户A在历史30天内的观看的媒体信息、互动的评论信息的评论标签和互动的情感倾向,以及用户A在历史30天内某天互动的评论信息的评论内容,并根据用户A在历史30天内的观看的媒体信息、互动的评论信息的评论标签和互动的情感倾向确定标签信息样本,根据用户A在历史30天内某天互动的评论信息的评论内容确定评论信息样本。
具体地,计算机设备可以将所获取的标签信息样本和评论信息样本输入预测模型,通过标签信息样本和评论信息样本对预测模型进行训练,得到训练后的预测模型。
上述实施例中,计算机设备通过对预测模型进行训练,具备更好的特征提取能力的训练后的预测模型,进而在通过训练后的预测模型基于输入的特征预测兴趣概率时,可以更加准确地预测出操作方对各评论信息的兴趣概率,进而在对评论信息进行排序时,可以使得评论信息的排序结果更加准确,进而可以提高操作方对评论信息的互动效率。
在一个实施例中,计算机设备根据兴趣概率和互动分数确定评论信息的排序分数的过程包括:计算兴趣概率和兴趣权重的和,将所得到的乘积确定为评论信息的排序分数。
在一个实施例中,计算机设备根据兴趣概率和互动分数确定评论信息的排序分数的过程包括:获取兴趣概率对应的兴趣权重以及互动分数对应的互动权重,基于兴趣权重和互动权重对兴趣概率和兴趣权重进行加权求和,将求和所得的结果确定为评论信息的排序分数。
在一个实施例中,计算机设备根据兴趣概率和互动分数确定评论信息的排序分数的过程包括:计算兴趣概率和兴趣权重的乘积,将所得到的乘积确定为评论信息的排序分数。具体地,可以采用以下公式计算评论信息的排序分数:
其中,Score为任一评论信息的排序分数,Score hudong 为该评论信息的互动分数,Score model 为该评论信息的兴趣概率。
在一个实施例中,如图9所示,还提供了一种评论信息的展示方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
S902,在媒体展示页面展示媒体信息;媒体信息具有对应的评论信息。
其中,媒体信息是指通过应用平台所发布的信息,包括文字、图片、声音、视频、网页和链接中的至少一种信息。可以理解的是,在自媒体时代,每个用户都可以成为媒体信息的创作者,应用平台为每个创作者提供了媒体信息的发布平台,在媒体信息发布之后,其他接收到该媒体信息的用户,可以针对该媒体信息进行互动,互动类型包括点赞类型、转发类型或评论类型等,其中,评论类型的互动会产生相应的评论信息,所产生的评论信息将被展示到该媒体信息对应的评论区。评论信息是指对媒体信息进行评论类型互动时,所产生的用于表达观点的内容,该内容可以是文字、图片、动画、视频、语音中的至少一种。
S904,响应于在媒体展示页面触发的评论展示操作,展示评论界面。
其中,评论展示操作是用于触发对评论信息进行展示的操作,具体可以是对评论展示控件的触发操作。评论界面也可以称为评论区。
具体地,当计算机设备为终端时,终端在媒体信息展示页面展示媒体信息和评论展示控件,用户可通过点击评论展示控件触发评论展示操作,终端响应于评论展示操作,获取待展示的评论信息和评论信息的互动特征;基于互动特征确定评论信息所对应的互动分数;在获得评论展示操作所对应操作方的标签信息的情况下,基于标签信息确定操作方对评论信息的兴趣概率。
在一个实施例中,互动特征包括点赞信息、时间信息和回复信息;终端基于互动特征确定评论信息所对应的互动分数的过程包括以下步骤:分别对点赞信息、时间信息和回复信息进行特征处理,得到点赞特征值、时间特征值和回复特征值;基于点赞特征值、时间特征值和回复特征值,确定评论信息所对应的互动分数。
在一个实施例中,终端分别对点赞信息、时间信息和回复信息进行特征处理,得到点赞特征值、时间特征值和回复特征值的过程包括以下步骤:对点赞信息进行对数转换处理,得到点赞特征值;对时间信息进行指数转换处理,并基于转换的结果和时间阈值之间的大小关系确定时间特征值;基于回复信息与回复量阈值之间的大小关系,确定回复特征值。
在一个实施例中,终端基于点赞特征值、时间特征值和回复特征值,确定评论信息所对应的互动分数的过程包括以下步骤:基于点赞特征值确定第一互动分数;基于时间特征值和回复特征值确定第二互动分数;根据第一互动分数和第二互动分数,确定评论信息所对应的互动分数。
S906,在评论界面中,按照评论信息的互动分数以及评论展示操作所对应的操作方对评论信息的兴趣概率,对评论信息进行按序展示。
其中,兴趣概率是基于操作方的标签信息确定的。
在一个实施例中,终端根据兴趣概率和互动分数确定评论信息的排序分数;基于排序分数对评论信息进行降序排列,得到操作方的按照兴趣程度从大到小排列的评论信息;将操作方的按照兴趣程度从大到小排列的评论信息进行展示。
上述实施例中,终端通过在媒体展示页面展示媒体信息,其中媒体信息具有对应的评论信息,并响应于在媒体展示页面触发的评论展示操作,展示评论界面,在评论界面中,按照评论信息的互动分数以及评论展示操作所对应的操作方对评论信息的兴趣概率,对评论信息进行按序展示,其中,兴趣概率是基于操作方的标签信息确定的,使得针对不同的操作方,均可以按照操作方的喜好进行个性化展示,进而可以提高操作方对评论信息的互动效率。
在一个实施例中,媒体展示页面是社交应用中用于展示媒体信息的页面,终端还可以通过社交应用获取操作方的标签信息;基于标签信息确定操作方对评论信息的兴趣概率。
其中,标签信息,即用户信息的标签化,具体包括用户的基础标签、消费标签、互动标签,基础标签包括操作方的地域、性别、年龄和学历中的至少一种;消费标签包括操作方历史观看的媒体信息的类别标签,类别标签具体可以是多级标签,例如,某个媒体信息的类别标签为“游戏-手游-飞行射击”,则“游戏”即为一级标签,“手游”即为二级标签,“飞行射击”即为三级标签;互动标签包括操作方历史互动的评论信息的评论标签和互动的情感倾向中的至少一种,例如,操作方历史时刻回复或点赞了某条评论信息,则该条评论信息的标签和该条评论信息的情感倾向,即为操作方的互动标签,评论信息的标签可以是从评论信息中所提取出的特征词。
兴趣概率用于表征操作方对每条评论信息感兴趣的程度,也可以说是操作方与评论信息进行互动的概率,可以理解的是,操作方对某条评论信息感兴趣的程度越大,则操作方与该条评论信息进行互动的概率也越大。其中,操作方与该条评论所能进行的互动可以是点赞互动或回复互动。
在一个实施例中,终端基于标签信息确定操作方对评论信息的兴趣概率的过程包括以下步骤:将标签信息和评论信息向量化,得到标签特征向量和文本向量;对标签特征向量的向量值进行特征交叉处理,得到交叉标签特征向量;基于交叉标签特征向量,确定操作方对文本向量的兴趣概率。
在一个实施例中,标签信息包括连续型标签信息和离散型标签信息;终端对标签信息进行向量化,得到标签特征向量的过程包括以下步骤:对连续型标签信息进行归一化处理,得到第一标签信息特征;对离散型标签信息进行特征编码处理,得到第二标签信息特征;对第一标签信息特征和第二标签信息特征之间的组合进行向量化,得到标签特征向量。
在一个实施例中,文本向量是训练后的词向量模型对评论信息进行向量化所得的;上述评论信息的展示方法还包括:获取评论信息样本;评论信息样本包括第一训练样本和第二训练样本;基于第一训练样本对词向量模型进行预训练;对第二训练样本中的评论关键词进行掩盖处理;基于掩盖处理后的评论信息样本对预训练的词向量模型进行增量训练,得到训练后的词向量模型。
在一个实施例中,终端在获得评论展示操作所对应操作方的标签信息的情况下,基于标签信息确定操作方对评论信息的兴趣概率的过程包括以下步骤:在获得评论展示操作所对应操作方的标签信息的情况下,将标签信息和评论信息输入预测模型;通过预测模型对标签信息进行特征处理,得到操作方对评论信息的兴趣概率。
上述实施例中,终端通过社交应用获取操作方的标签信息,并基于标签信息确定操作方对评论信息的兴趣概率,充分考虑了操作方的喜好来确定操作方对评论信息点击概率,进而在对评论信息进行排序时,可以使得评论信息的排序结果更加准确,进而可以提高操作方对评论信息的互动效率。
在一个实施例中,如图10所示,还提供了一种评论信息的展示方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
S1002,响应于评论展示操作,获取待展示的评论信息和评论信息的互动特征;互动特征包括点赞信息、时间信息和回复信息。
S1004,对点赞信息进行对数转换处理,得到点赞特征值。
S1006,对时间信息进行指数转换处理,并基于转换的结果和时间阈值之间的大小关系确定时间特征值。
S1008,基于回复信息与回复量阈值之间的大小关系,确定回复特征值。
S1010,基于点赞特征值确定第一互动分数。
S1012,基于时间特征值和回复特征值确定第二互动分数。
S1014,根据第一互动分数和第二互动分数,确定评论信息所对应的互动分数。
S1016,在获得评论展示操作所对应操作方的标签信息的情况下,将标签信息和评论信息向量化,得到标签特征向量和文本向量。
S1018,对标签特征向量的向量值进行特征交叉处理,得到交叉标签特征向量。
S1020,基于交叉标签特征向量,确定操作方对文本向量的兴趣概率。
S1022,根据兴趣概率和互动分数确定评论信息的排序分数。
S1024,基于排序分数对评论信息进行降序排列,得到操作方的按照兴趣程度从大到小排列的评论信息。
S1026,将操作方的按照兴趣程度从大到小排列的评论信息进行展示。
本申请还提供一种应用场景,该应用场景应用上述的评论信息的展示方法。具体地,该评论信息的展示方法在该应用场景的应用如下,参考图11和图12分别所示的流程图:
1、建立用户画像
社交应用服务器在社交用户使用社交应用的过程中,在获得用户权限的情况下,获取社交用户的基础数据和行为数据,从而建立并保存用户画像。其中用户画像包括基础画像、消费画像和评论画像,基础画像包括操作方的地域、性别、年龄和学历中的至少一种;消费画像包括操作方历史观看的媒体信息的类别标签,类别标签具体可以是多级标签,例如,一级标签、二级标签和三级标签;评论画像包括操作方历史涉及的评论信息的评论标签、历史互历史涉及的评论信息的情感倾向。
2、评论特征提取
其中,评论特征即待展示的评论信息和评论信息的互动特征。
具体地,社交应用服务器响应于评论展示操作,获取待展示的评论信息和评论信息的互动特征。
其中,评论展示操作是用于触发对评论信息进行展示的操作,具体可以是对评论展示控件的触发操作。评论信息是指对媒体信息进行评论类型互动时,所产生的用于表达观点的内容,该内容可以是文字、图片、动画、视频、语音中的至少一种。互动特征是指用户与评论信息进行互动,所产生的互动信息,具体包括点赞信息、时间信息和回复信息,点赞信息是指对评论信息进行点赞互动所产生的信息,具体包括点赞方的用户标识和评论信息累积的点赞量,点赞量是指点赞行为发生的次数,时间信息是指评论信息的发表时间或者评论信息的发表时间与当前时间之间的时间差,回复信息是指对评论信息进行评论回复所产生的信息,具体包括回复方的用户标识、回复内容和回复行为发生的次数。
3、推荐模型计算
社交应用服务器通过推荐模型根据所获取的操作方的用户画像和评论特征,对评论信息进行的排序分数进行预测,得到每个评论信息的排序分数。
其中,排序分数用于表征操作方与评论信息的互动概率。操作与评论信息所能进行的互动可以是点赞或回复。
4、评论区展示排序
社交应用服务器基于推荐模型所计算出的排序分数,对各评论信息进行排序,并将排序结果返回操作方所对应的终端,以使终端基于排序结果对评论信息进行展示。
具体地,终端将操作方更容易产生互动的评论信息排在前面进行展示。
采用上述评论信息的展示方法,可以有效提高操作方对评论信息的点赞率和回复率,在一些实际的例子中,操作方点赞率提高2%,回复率提高1%,操作方在评论区时长提高0.8%。
应该理解的是,虽然图2、图9和图10的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、图9和图10中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图13所示,提供了一种评论信息的展示装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:信息获取模块1302、互动分数确定模块1304、兴趣概率确定模块1306和信息展示模块1308,其中:
信息获取模块1302,用于响应于评论展示操作,获取待展示的评论信息和评论信息的互动特征;
互动分数确定模块1304,用于基于互动特征确定评论信息所对应的互动分数;
兴趣概率确定模块1306,用于在获得评论展示操作所对应操作方的标签信息的情况下,基于标签信息确定操作方对评论信息的兴趣概率;
信息展示模块1308,用于根据兴趣概率和互动分数对评论信息排序,并按照排序的先后顺序对评论信息进行展示。
上述实施例中,通过响应于评论展示操作,获取待展示的评论信息和评论信息的互动特征,基于互动特征确定评论信息所对应的互动分数,并在获得评论展示操作所对应操作方的标签信息的情况下,基于标签信息确定操作方对评论信息的兴趣概率,从而根据兴趣概率和互动分数对评论信息排序,并按照排序的先后顺序对评论信息进行展示,使得针对不同的操作方,均可以按照操作方的喜好进行个性化展示,进而可以提高操作方对评论信息的互动效率。
在一个实施例中,互动特征包括点赞信息、时间信息和回复信息;互动分数确定模块1304,还用于:分别对点赞信息、时间信息和回复信息进行特征处理,得到点赞特征值、时间特征值和回复特征值;基于点赞特征值、时间特征值和回复特征值,确定评论信息所对应的互动分数。
在一个实施例中,互动分数确定模块1304,还用于:对点赞信息进行对数转换处理,得到点赞特征值;对时间信息进行指数转换处理,并基于转换的结果和时间阈值之间的大小关系确定时间特征值;基于回复信息与回复量阈值之间的大小关系,确定回复特征值。
在一个实施例中,互动分数确定模块1304,还用于:基于点赞特征值确定第一互动分数;基于时间特征值和回复特征值确定第二互动分数;根据第一互动分数和第二互动分数,确定评论信息所对应的互动分数。
在一个实施例中,兴趣概率确定模块1306,还用于:将标签信息和评论信息向量化,得到标签特征向量和文本向量;对标签特征向量的向量值进行特征交叉处理,得到交叉标签特征向量;基于交叉标签特征向量,确定操作方对文本向量的兴趣概率。
在一个实施例中,标签信息包括连续型标签信息和离散型标签信息;兴趣概率确定模块1306,还用于:对连续型标签信息进行归一化处理,得到第一标签信息特征;对离散型标签信息进行特征编码处理,得到第二标签信息特征;对第一标签信息特征和第二标签信息特征之间的组合进行向量化,得到标签特征向量。
在一个实施例中,文本向量是训练后的词向量模型对评论信息进行向量化所得的;如图14所示,装置还包括:
样本获取模块1310,用于获取评论信息样本;评论信息样本包括第一训练样本和第二训练样本;
预训练模块1312,用于基于第一训练样本对词向量模型进行预训练;
增量训练模块1314,用于对第二训练样本中的评论关键词进行掩盖处理;基于掩盖处理后的评论信息样本对预训练的词向量模型进行增量训练,得到训练后的词向量模型。
在一个实施例中,兴趣概率确定模块1306,还用于:在获得评论展示操作所对应操作方的标签信息的情况下,将标签信息和评论信息输入预测模型;通过预测模型对标签信息进行特征处理,得到操作方对评论信息的兴趣概率。
在一个实施例中,信息展示模块1308,还用于:根据兴趣概率和互动分数确定评论信息的排序分数;基于排序分数对评论信息进行降序排列,得到操作方的按照兴趣程度从大到小排列的评论信息;将操作方的按照兴趣程度从大到小排列的评论信息进行展示。
在一个实施例中,如图15所示,提供了一种评论信息的展示装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:媒体信息展示模块1502、评论界面展示模块1504和评论信息展示模块1506,其中:
媒体信息展示模块1502,用于在媒体展示页面展示媒体信息;媒体信息具有对应的评论信息;
评论界面展示模块1504,用于响应于在媒体展示页面触发的评论展示操作,展示评论界面;
评论信息展示模块1506,用于在评论界面中,按照评论信息的互动分数以及评论展示操作所对应的操作方对评论信息的兴趣概率,对评论信息进行按序展示;其中,兴趣概率是基于操作方的标签信息确定的。
上述实施例中,通过在媒体展示页面展示媒体信息,其中媒体信息具有对应的评论信息,并响应于在媒体展示页面触发的评论展示操作,展示评论界面,在评论界面中,按照评论信息的互动分数以及评论展示操作所对应的操作方对评论信息的兴趣概率,对评论信息进行按序展示,其中,兴趣概率是基于操作方的标签信息确定的,使得针对不同的操作方,均可以按照操作方的喜好进行个性化展示,进而可以提高操作方对评论信息的互动效率。
在一个实施例中,媒体展示页面是社交应用中用于展示媒体信息的页面;装置还包括:兴趣概率确定模块,用于通过社交应用获取操作方的标签信息;基于标签信息确定操作方对评论信息的兴趣概率。
在一个实施例中,评论信息展示模块1506,还用于:根据兴趣概率和互动分数确定评论信息的排序分数;基于排序分数对评论信息进行降序排列,得到操作方的按照兴趣程度从大到小排列的评论信息;将操作方的按照兴趣程度从大到小排列的评论信息进行展示。
关于评论信息的展示装置的具体限定可以参见上文中对于评论信息的展示方法的限定,在此不再赘述。上述评论信息的展示装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图16所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储媒体数据和用户数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种评论信息的展示方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图17所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种评论信息的展示方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图16或图17中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (26)
1.一种评论信息的展示方法,其特征在于,所述方法包括:
响应于评论展示操作,获取待展示的评论信息和所述评论信息的互动特征;
基于所述互动特征确定所述评论信息所对应的互动分数;
在获得所述评论展示操作所对应操作方的标签信息的情况下,将所述标签信息向量化,得到标签特征向量;通过训练后的词向量模型对所述评论信息向量化,得到文本向量;对所述标签特征向量的向量值进行特征交叉处理,得到交叉标签特征向量;基于所述交叉标签特征向量,确定所述操作方对所述文本向量的兴趣概率;所述标签信息包括基础标签、消费标签和互动标签,所述消费标签包括所述操作方历史观看的媒体信息的类别标签,所述类别标签为多级标签;所述互动标签包括历史发表的评论信息的评论标签、历史互动的评论信息的评论标签和互动的情感倾向中的至少一种;所述情感倾向为正向情感、负向情感和中性情感的比例;所述训练后的词向量模型通过获取评论信息样本,所述评论信息样本包括第一训练样本和第二训练样本;基于所述第一训练样本对所述词向量模型进行预训练;对所述第二训练样本中的评论关键词进行掩盖处理;基于掩盖处理后的评论信息样本对预训练的所述词向量模型进行增量训练而得到的;
根据所述兴趣概率和所述互动分数确定所述评论信息的排序分数;基于所述排序分数对所述评论信息排序,并按照排序的先后顺序对所述评论信息进行展示。
2.根据权利要求1所述的方法,其特征在于,所述互动特征包括点赞信息、时间信息和回复信息;所述基于所述互动特征确定所述评论信息所对应的互动分数,包括:
分别对所述点赞信息、所述时间信息和所述回复信息进行特征处理,得到点赞特征值、时间特征值和回复特征值;
基于所述点赞特征值、所述时间特征值和所述回复特征值,确定所述评论信息所对应的互动分数。
3.根据权利要求2所述的方法,其特征在于,所述分别对所述点赞信息、所述时间信息和所述回复信息进行特征处理,得到点赞特征值、时间特征值和回复特征值,包括:
对所述点赞信息进行对数转换处理,得到点赞特征值;
对所述时间信息进行指数转换处理,并基于转换的结果和时间阈值之间的大小关系确定时间特征值;
基于所述回复信息与回复量阈值之间的大小关系,确定回复特征值。
4.根据权利要求2所述的方法,其特征在于,所述基于所述点赞特征值、所述时间特征值和所述回复特征值,确定所述评论信息所对应的互动分数,包括:
基于所述点赞特征值确定第一互动分数;
基于所述时间特征值和所述回复特征值确定第二互动分数;
根据所述第一互动分数和所述第二互动分数,确定所述评论信息所对应的互动分数。
5.根据权利要求1所述的方法,其特征在于,所述将所述标签信息和所述评论信息向量化,得到标签特征向量和文本向量,包括:
对所述标签信息进行特征处理,得到标签特征;
对所述标签特征进行向量化,得到标签特征向量;
基于所述评论信息的类型,确定评论信息的语义内容;
对所述评论信息的语义内容进行向量化,得到文本向量。
6.根据权利要求1所述的方法,其特征在于,所述标签信息包括连续型标签信息和离散型标签信息;
所述对所述标签信息进行向量化,得到标签特征向量,包括:
对所述连续型标签信息进行归一化处理,得到第一标签信息特征;
对所述离散型标签信息进行特征编码处理,得到第二标签信息特征;
对所述第一标签信息特征和所述第二标签信息特征之间的组合进行向量化,得到标签特征向量。
7.根据权利要求1所述的方法,其特征在于,所述第一训练样本是历史时段获取评论语料,所述第二训练样本为对评论语料进行分词后所得到分词语料。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在获得所述评论展示操作所对应操作方的标签信息的情况下,将所述标签信息和所述评论信息输入预测模型;
通过所述预测模型对所述标签信息和所述评论信息向量化,得到标签特征向量和文本向量;对所述标签特征向量的向量值进行特征交叉处理,得到交叉标签特征向量;基于所述交叉标签特征向量,确定所述操作方对所述文本向量的兴趣概率。
9.根据权利要求1所述的方法,其特征在于,所述基于所述排序分数对所述评论信息排序,并按照排序的先后顺序对所述评论信息进行展示,包括:
基于所述排序分数对所述评论信息进行降序排列,得到所述操作方的按照兴趣程度从大到小排列的评论信息;
将所述操作方的按照兴趣程度从大到小排列的评论信息进行展示。
10.一种评论信息的展示方法,其特征在于,所述方法包括:
在媒体展示页面展示媒体信息;所述媒体信息具有对应的评论信息;
响应于在所述媒体展示页面触发的评论展示操作,展示评论界面;
在所述评论界面中,按照所述评论信息的互动分数以及所述评论展示操作所对应的操作方对所述评论信息的兴趣概率确定所述评论信息的排序分数;基于所述排序分数对所述评论信息进行按序展示;
其中,所述兴趣概率是基于所述操作方的标签信息确定的,基于所述操作方的标签信息确定所述兴趣概率的过程包括:将所述标签信息向量化,得到标签特征向量;通过训练后的词向量模型对所述评论信息向量化,得到文本向量;对所述标签特征向量的向量值进行特征交叉处理,得到交叉标签特征向量;基于所述交叉标签特征向量,确定所述操作方对所述文本向量的兴趣概率;所述标签信息包括基础标签、消费标签和互动标签,所述消费标签包括所述操作方历史观看的媒体信息的类别标签,所述类别标签为多级标签;所述互动标签包括历史发表的评论信息的评论标签、历史互动的评论信息的评论标签和互动的情感倾向中的至少一种;所述情感倾向为正向情感、负向情感和中性情感的比例;所述训练后的词向量模型通过获取评论信息样本,所述评论信息样本包括第一训练样本和第二训练样本;基于所述第一训练样本对所述词向量模型进行预训练;对所述第二训练样本中的评论关键词进行掩盖处理;基于掩盖处理后的评论信息样本对预训练的所述词向量模型进行增量训练而得到的。
11.根据权利要求10所述的方法,其特征在于,所述媒体展示页面是社交应用中用于展示所述媒体信息的页面;所述方法还包括:
通过所述社交应用获取所述操作方的标签信息;
基于所述标签信息确定所述操作方对所述评论信息的兴趣概率。
12.根据权利要求10所述的方法,其特征在于,所述基于所述排序分数对所述评论信息进行按序展示,包括:
基于所述排序分数对所述评论信息进行降序排列,得到所述操作方的按照兴趣程度从大到小排列的评论信息;
将所述操作方的按照兴趣程度从大到小排列的评论信息进行展示。
13.一种评论信息的展示装置,其特征在于,所述装置包括:
信息获取模块,用于响应于评论展示操作,获取待展示的评论信息和所述评论信息的互动特征;
互动分数确定模块,用于基于所述互动特征确定所述评论信息所对应的互动分数;
兴趣概率确定模块,用于在获得所述评论展示操作所对应操作方的标签信息的情况下,将所述标签信息向量化,得到标签特征向量;通过训练后的词向量模型对所述评论信息向量化,得到文本向量;对所述标签特征向量的向量值进行特征交叉处理,得到交叉标签特征向量;基于所述交叉标签特征向量,确定所述操作方对所述文本向量的兴趣概率;所述标签信息包括基础标签、消费标签和互动标签,所述消费标签包括所述操作方历史观看的媒体信息的类别标签,所述类别标签为多级标签;所述互动标签包括历史发表的评论信息的评论标签、历史互动的评论信息的评论标签和互动的情感倾向中的至少一种;所述情感倾向为正向情感、负向情感和中性情感的比例;所述训练后的词向量模型通过获取评论信息样本,所述评论信息样本包括第一训练样本和第二训练样本;基于所述第一训练样本对所述词向量模型进行预训练;对所述第二训练样本中的评论关键词进行掩盖处理;基于掩盖处理后的评论信息样本对预训练的所述词向量模型进行增量训练而得到的;
信息展示模块,用于根据所述兴趣概率和所述互动分数确定所述评论信息的排序分数;基于所述排序分数对所述评论信息排序,并按照排序的先后顺序对所述评论信息进行展示。
14.根据权利要求13所述的装置,其特征在于,所述互动特征包括点赞信息、时间信息和回复信息;所述互动分数确定模块,还用于:
分别对所述点赞信息、所述时间信息和所述回复信息进行特征处理,得到点赞特征值、时间特征值和回复特征值;
基于所述点赞特征值、所述时间特征值和所述回复特征值,确定所述评论信息所对应的互动分数。
15.根据权利要求14所述的装置,其特征在于,所述互动分数确定模块,还用于:
对所述点赞信息进行对数转换处理,得到点赞特征值;
对所述时间信息进行指数转换处理,并基于转换的结果和时间阈值之间的大小关系确定时间特征值;
基于所述回复信息与回复量阈值之间的大小关系,确定回复特征值。
16.根据权利要求14所述的装置,其特征在于,所述互动分数确定模块,还用于:
基于所述点赞特征值确定第一互动分数;
基于所述时间特征值和所述回复特征值确定第二互动分数;
根据所述第一互动分数和所述第二互动分数,确定所述评论信息所对应的互动分数。
17.根据权利要求13所述的装置,其特征在于,所述兴趣概率确定模块,还用于:
对所述标签信息进行特征处理,得到标签特征;
对所述标签特征进行向量化,得到标签特征向量;
基于所述评论信息的类型,确定评论信息的语义内容;
对所述评论信息的语义内容进行向量化,得到文本向量。
18.根据权利要求13所述的装置,其特征在于,所述标签信息包括连续型标签信息和离散型标签信息;
所述兴趣概率确定模块,还用于:
对所述连续型标签信息进行归一化处理,得到第一标签信息特征;
对所述离散型标签信息进行特征编码处理,得到第二标签信息特征;
对所述第一标签信息特征和所述第二标签信息特征之间的组合进行向量化,得到标签特征向量。
19.根据权利要求13所述的装置,其特征在于,所述第一训练样本是历史时段获取评论语料,所述第二训练样本为对评论语料进行分词后所得到分词语料。
20.根据权利要求13所述的装置,其特征在于,所述兴趣概率确定模块,还用于:
在获得所述评论展示操作所对应操作方的标签信息的情况下,将所述标签信息和所述评论信息输入预测模型;
通过所述预测模型对所述标签信息和所述评论信息向量化,得到标签特征向量和文本向量;对所述标签特征向量的向量值进行特征交叉处理,得到交叉标签特征向量;基于所述交叉标签特征向量,确定所述操作方对所述文本向量的兴趣概率。
21.根据权利要求13所述的装置,其特征在于,所述信息展示模块,还用于:
基于所述排序分数对所述评论信息进行降序排列,得到所述操作方的按照兴趣程度从大到小排列的评论信息;
将所述操作方的按照兴趣程度从大到小排列的评论信息进行展示。
22.一种评论信息的展示装置,其特征在于,所述装置包括:
媒体信息展示模块,用于在媒体展示页面展示媒体信息;所述媒体信息具有对应的评论信息;
评论界面展示模块,用于响应于在所述媒体展示页面触发的评论展示操作,展示评论界面;
评论信息展示模块,用于在所述评论界面中,按照所述评论信息的互动分数以及所述评论展示操作所对应的操作方对所述评论信息的兴趣概率确定所述评论信息的排序分数;基于所述排序分数对所述评论信息进行按序展示;
其中,所述兴趣概率是基于所述操作方的标签信息确定的,基于所述操作方的标签信息确定所述兴趣概率的过程包括:将所述标签信息向量化,得到标签特征向量;通过训练后的词向量模型对所述评论信息向量化,得到文本向量;对所述标签特征向量的向量值进行特征交叉处理,得到交叉标签特征向量;基于所述交叉标签特征向量,确定所述操作方对所述文本向量的兴趣概率;所述标签信息包括基础标签、消费标签和互动标签,所述消费标签包括所述操作方历史观看的媒体信息的类别标签,所述类别标签为多级标签;所述互动标签包括历史发表的评论信息的评论标签、历史互动的评论信息的评论标签和互动的情感倾向中的至少一种;所述情感倾向为正向情感、负向情感和中性情感的比例;所述训练后的词向量模型通过获取评论信息样本,所述评论信息样本包括第一训练样本和第二训练样本;基于所述第一训练样本对所述词向量模型进行预训练;对所述第二训练样本中的评论关键词进行掩盖处理;基于掩盖处理后的评论信息样本对预训练的所述词向量模型进行增量训练而得到的。
23.根据权利要求22所述的装置,其特征在于,所述媒体展示页面是社交应用中用于展示所述媒体信息的页面;所述装置还包括:
兴趣概率确定模块,用于通过所述社交应用获取所述操作方的标签信息;基于所述标签信息确定所述操作方对所述评论信息的兴趣概率。
24.根据权利要求22所述的装置,其特征在于,所述评论信息展示模块,还用于:
基于所述排序分数对所述评论信息进行降序排列,得到所述操作方的按照兴趣程度从大到小排列的评论信息;
将所述操作方的按照兴趣程度从大到小排列的评论信息进行展示。
25.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述的方法的步骤。
26.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111309148.XA CN113741759B (zh) | 2021-11-06 | 2021-11-06 | 评论信息的展示方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111309148.XA CN113741759B (zh) | 2021-11-06 | 2021-11-06 | 评论信息的展示方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113741759A CN113741759A (zh) | 2021-12-03 |
CN113741759B true CN113741759B (zh) | 2022-02-22 |
Family
ID=78727525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111309148.XA Active CN113741759B (zh) | 2021-11-06 | 2021-11-06 | 评论信息的展示方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113741759B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114416503A (zh) * | 2021-12-31 | 2022-04-29 | 北京五八信息技术有限公司 | 一种数据处理方法、装置、电子设备及存储介质 |
CN115062586B (zh) * | 2022-08-08 | 2023-06-23 | 山东展望信息科技股份有限公司 | 一种基于大数据和人工智能的热点话题处理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108153856A (zh) * | 2017-12-22 | 2018-06-12 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN111046941A (zh) * | 2019-12-09 | 2020-04-21 | 腾讯科技(深圳)有限公司 | 一种目标评论检测方法、装置、电子设备和存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120185455A1 (en) * | 2011-01-14 | 2012-07-19 | Aliaksandr Hedrevich | System and method of providing search query results |
CN107291780B (zh) * | 2016-04-12 | 2021-05-28 | 腾讯科技(深圳)有限公司 | 一种用户评论信息展示方法和装置 |
CN108090206A (zh) * | 2017-12-28 | 2018-05-29 | 北京小米移动软件有限公司 | 评论信息的排序方法及装置、电子设备 |
CN109492160A (zh) * | 2018-10-31 | 2019-03-19 | 北京字节跳动网络技术有限公司 | 用于推送信息的方法和装置 |
CN110287402A (zh) * | 2019-05-05 | 2019-09-27 | 江苏一乙生态农业科技有限公司 | 一种基于用户偏好的个性化评论推荐方法 |
CN111310079A (zh) * | 2020-02-14 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 评论信息排序方法、装置、存储介质及服务器 |
CN112559869A (zh) * | 2020-12-18 | 2021-03-26 | 上海众源网络有限公司 | 一种评论信息的显示方法、装置、电子设备及存储介质 |
CN113010702B (zh) * | 2021-03-03 | 2024-07-26 | 腾讯科技(深圳)有限公司 | 多媒体信息的互动处理方法、装置、电子设备及存储介质 |
-
2021
- 2021-11-06 CN CN202111309148.XA patent/CN113741759B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108153856A (zh) * | 2017-12-22 | 2018-06-12 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN111046941A (zh) * | 2019-12-09 | 2020-04-21 | 腾讯科技(深圳)有限公司 | 一种目标评论检测方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113741759A (zh) | 2021-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112084331B (zh) | 文本处理、模型训练方法、装置、计算机设备和存储介质 | |
CN110162749A (zh) | 信息提取方法、装置、计算机设备及计算机可读存储介质 | |
CN113627447B (zh) | 标签识别方法、装置、计算机设备、存储介质及程序产品 | |
CN112307351A (zh) | 用户行为的模型训练、推荐方法、装置和设备 | |
CN114565104A (zh) | 语言模型的预训练方法、结果推荐方法及相关装置 | |
CN113569001A (zh) | 文本处理方法、装置、计算机设备及计算机可读存储介质 | |
CN113741759B (zh) | 评论信息的展示方法、装置、计算机设备和存储介质 | |
CN113705313A (zh) | 文本识别方法、装置、设备及介质 | |
CN114282528A (zh) | 一种关键词提取方法、装置、设备及存储介质 | |
CN113282711A (zh) | 一种车联网文本匹配方法、装置、电子设备及存储介质 | |
CN116977701A (zh) | 视频分类模型训练的方法、视频分类的方法和装置 | |
CN112131345A (zh) | 文本质量的识别方法、装置、设备及存储介质 | |
CN113934835B (zh) | 结合关键词和语义理解表征的检索式回复对话方法及系统 | |
CN115186085A (zh) | 回复内容处理方法以及媒体内容互动内容的交互方法 | |
CN114443846A (zh) | 一种基于多层级文本异构图的分类方法、装置及电子设备 | |
CN114372454A (zh) | 文本信息抽取方法、模型训练方法、装置及存储介质 | |
CN116957128A (zh) | 业务指标预测方法、装置、设备和存储介质 | |
CN113157892B (zh) | 用户意图处理方法、装置、计算机设备及存储介质 | |
CN115129849A (zh) | 题目表示的获取方法、设备以及计算机可读存储介质 | |
CN116955599A (zh) | 一种类目确定的方法、相关装置、设备以及存储介质 | |
CN113821610A (zh) | 信息匹配方法、装置、设备及存储介质 | |
CN114817697A (zh) | 标签信息的确定方法、装置、电子设备以及存储介质 | |
CN111581335A (zh) | 一种文本表示方法及装置 | |
CN115292620B (zh) | 地域信息识别方法、装置、电子设备和存储介质 | |
CN117521674B (zh) | 对抗信息的生成方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |