CN112559869A - 一种评论信息的显示方法、装置、电子设备及存储介质 - Google Patents
一种评论信息的显示方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112559869A CN112559869A CN202011509425.7A CN202011509425A CN112559869A CN 112559869 A CN112559869 A CN 112559869A CN 202011509425 A CN202011509425 A CN 202011509425A CN 112559869 A CN112559869 A CN 112559869A
- Authority
- CN
- China
- Prior art keywords
- information
- comment
- comment information
- sample
- content vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 239000013598 vector Substances 0.000 claims abstract description 362
- 238000012163 sequencing technique Methods 0.000 claims abstract description 59
- 238000012549 training Methods 0.000 claims description 54
- 238000004891 communication Methods 0.000 claims description 19
- 230000015654 memory Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 14
- 230000003993 interaction Effects 0.000 claims description 11
- 238000012552 review Methods 0.000 claims description 11
- 230000000694 effects Effects 0.000 abstract description 14
- 230000008569 process Effects 0.000 description 10
- 238000013136 deep learning model Methods 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种评论信息的显示方法、装置、电子设备及存储介质,所述方法包括:获取目标发布信息的标题文本,并获取目标发布信息的每个评论信息及每个评论信息的操作信息;将标题文本及每个评论信息输入预先训练完成的语义向量确定模型,得到目标发布信息的信息内容向量以及每个评论信息的评论内容向量;针对每个评论信息,基于该评论信息对应的评论内容向量及目标发布信息的信息内容向量,确定该评论信息与目标发布信息之间的相关度,并基于相关度及该评论信息的操作信息,确定该评论信息的排序分数;按照排序分数对评论信息进行排序,得到排序结果,并按照排序结果显示每个评论信息。采用本发明实施例,可以提高评论信息的显示效果。
Description
技术领域
本发明涉及互联网技术领域,特别是涉及一种评论信息的显示方法、装置、电子设备及存储介质。
背景技术
用户在观看发布在网络中的视频、文章等信息时可以发布评论信息,还可以对其他用户发布的评论信息进行浏览、回复、点赞、转发等操作,以与信息发布者或者其他用户进行互动。
评论信息在显示时需要按照一定的顺序进行显示,目前一般根据评论信息的发布时间从晚到早的顺序对评论信息进行排序,然后按照排序结果显示评论信息,这样,在显示评论信息时,发布时间较晚的评论信息将会显示在用户更加容易看到的区域。
根据发布时间对评论信息进行排序后,显示在用户容易看到的区域的评论信息就是发布时间较晚的评论信息。而发布时间较晚的评论信息很可能并不是用户感兴趣的评论信息,因此,采用上述评论信息显示方式来显示评论信息时,在用户容易看到的区域的评论信息很可能并不是用户感兴趣的评论信息,那么用户与信息发布者或者其他用户进行互动的可能性也就较低,评论信息的显示效果并不理想。
发明内容
本发明实施例的目的在于提供一种评论信息的显示方法、装置、电子设备及存储介质,以提高用户与评论信息的发布者进行互动的可能性,提高评论信息的显示效果。具体技术方案如下:
第一方面,本发明实施例提供了一种评论信息的显示方法,所述方法包括:
获取目标发布信息的标题文本,并获取所述目标发布信息的每个评论信息及所述每个评论信息的操作信息;
将所述标题文本及所述每个评论信息输入预先训练完成的语义向量确定模型,得到所述目标发布信息的信息内容向量以及所述每个评论信息的评论内容向量,其中,所述语义向量确定模型为基于多个发布信息的标题文本样本及其评论信息样本训练得到的,所述语义向量确定模型包括文本与内容向量之间的对应关系;
针对每个所述评论信息,基于该评论信息对应的评论内容向量及所述目标发布信息的信息内容向量,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数,其中,所述排序分数用于标识用户对所述评论信息的感兴趣程度;
按照所述排序分数对所述评论信息进行排序,得到排序结果,并按照所述排序结果显示每个所述评论信息。
可选的,所述语义向量确定模型的训练方式,包括:
获取初始语义向量确定模型、多个发布信息样本的标题文本样本及每个所述发布信息样本的评论信息样本;
针对每个所述发布信息样本,基于该发布信息样本的标题文本样本及该发布信息样本的评论信息样本,确定该发布信息样本与其评论信息样本之间的相关度,作为第一标定标签;
针对每个所述发布信息样本,将该发布信息样本的标题文本样本及该发布信息样本的评论信息样本输入所述初始语义向量确定模型,确定该发布信息样本的信息内容向量样本以及该发布信息样本的评论信息样本的评论内容向量样本,并基于所述信息内容向量样本及所述评论内容向量样本确定该发布信息样本与其评论信息样本之间的相关度,作为第一预测标签;
基于所述第一预测标签与对应的第一标定标签之间的差异,调整所述初始语义向量确定模型的参数,直到所述初始语义向量确模型收敛,停止训练,得到所述语义向量确模型。
可选的,所述基于所述第一预测标签与对应的第一标定标签之间的差异,调整所述初始语义向量确定模型的参数的步骤,包括:
基于所述第一预测标签与对应的第一标定标签之间的差异,调整每个词汇对应的语义权重,其中,所述词汇的语义权重用于表示所述词汇在该词汇所属的文本的语义中的重要程度。
可选的,所述针对每个所述评论信息,基于该评论信息对应的评论内容向量及所述目标发布信息的信息内容向量,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数的步骤,包括:
针对每个所述评论信息,将该评论信息对应的评论内容向量、所述目标发布信息的信息内容向量及该评论信息的操作信息输入预先训练完成的第一评分模型,根据该评论信息对应的评论内容向量与所述信息内容向量之间的距离,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数;
或,
针对每个所述评论信息,基于该评论信息对应的评论内容向量与所述信息内容向量之间的距离,确定该评论信息与所述目标发布信息之间的相关度;针对每个所述评论信息,将该评论信息对应的相关度及该评论信息的操作信息输入预先训练完成的第二评分模型,确定该评论信息的排序分数。
可选的,所述第一评分模型的训练方式,包括:
获取初始第一评分模型、多个评论信息样本对应的评论内容向量样本、每个所述评论信息样本对应的发布信息样本的信息内容向量样本及每个所述评论信息样本的操作信息样本;
针对每个评论信息样本,基于该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数,作为第二标定标签;
针对每个评论信息样本,将该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数输入所述初始第一评分模型,确定该评论信息样本的排序分数,作为第二预测标签;
基于所述第二预测标签及其对应的第二标定标签之间的差异,调整所述初始第一评分模型的参数,直到所述初始第一评分模型收敛,停止训练,得到所述第一评分模型。
可选的,在按照所述排序分数对所述评论信息进行排序的步骤之前,所述方法还包括:
针对每个所述评论信息,按照预设的排序分数调整规则,对该评论信息的排序分数进行调整,得到该评论信息最终的排序分数,其中,所述排序分数调整规则为基于所述评论信息的属性设定的,所述属性包括评论发布者、评论发布时间、所述目标发布信息发布者、目标发布信息的类型、所述评论发布者与所述目标发布信息发布者的互动操作信息中的至少一种;
所述按照所述排序分数对所述评论信息进行排序,得到排序结果步骤,包括:
按照所述最终的排序分数对所述评论信息进行排序,得到排序结果。
第二方面,本发明实施例提供了一种评论信息的显示装置,所述装置包括:
信息获取模块,用于获取目标发布信息的标题文本,并获取所述目标发布信息的每个评论信息及所述每个评论信息的操作信息;
向量确定模块,用于将所述标题文本及所述每个评论信息输入预先训练完成的语义向量确定模型,得到所述目标发布信息的信息内容向量以及所述每个评论信息的评论内容向量,其中,所述语义向量确定模型为第一模型训练模块基于多个发布信息的标题文本样本及其评论信息样本训练的,所述语义向量确定模型包括文本与内容向量之间的对应关系;
分数确定模块,用于针对每个所述评论信息,基于该评论信息对应的评论内容向量及所述目标发布信息的信息内容向量,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数,其中,所述排序分数用于标识用户对所述评论信息的感兴趣程度;
信息显示模块,用于按照所述排序分数对所述评论信息进行排序,得到排序结果,并按照所述排序结果显示每个所述评论信息。
可选的,所述第一模型训练模块包括:
第一样本获取子模块,用于获取初始语义向量确定模型、多个发布信息样本的标题文本样本及每个所述发布信息样本的评论信息样本;
第一标记子模块,用于针对每个所述发布信息样本,基于该发布信息样本的标题文本样本及该发布信息样本的评论信息样本,确定该发布信息样本与其评论信息样本之间的相关度,作为第一标定标签;
第一预测子模块,用于针对每个所述发布信息样本,将该发布信息样本的标题文本样本及该发布信息样本的评论信息样本输入所述初始语义向量确定模型,确定该发布信息样本的信息内容向量样本以及该发布信息样本的评论信息样本的评论内容向量样本,并基于所述信息内容向量样本及所述评论内容向量样本确定该发布信息样本与其评论信息样本之间的相关度,作为第一预测标签;
第一参数调整子模块,用于基于所述第一预测标签与对应的第一标定标签之间的差异,调整所述初始语义向量确定模型的参数,直到所述初始语义向量确模型收敛,停止训练,得到所述语义向量确模型。
可选的,所述第一参数调整子模块包括:
第一参数调整单元,用于基于所述第一预测标签与对应的第一标定标签之间的差异,调整每个词汇对应的语义权重,其中,所述词汇的语义权重用于表示所述词汇在该词汇所属的文本的语义中的重要程度。
可选的,所述分数确定模块包括:
第一分数确定子模块,用于针对每个所述评论信息,将该评论信息对应的评论内容向量、所述目标发布信息的信息内容向量及该评论信息的操作信息输入预先训练完成的第一评分模型,根据该评论信息对应的评论内容向量与所述信息内容向量之间的距离,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数;
或,
第二分数确定子模块,用于针对每个所述评论信息,基于该评论信息对应的评论内容向量与所述信息内容向量之间的距离,确定该评论信息与所述目标发布信息之间的相关度;针对每个所述评论信息,将该评论信息对应的相关度及该评论信息的操作信息输入预先训练完成的第二评分模型,确定该评论信息的排序分数。
可选的,所述第一评分模型为预先通过第二模型训练模块训练得到的;
所述第二模型训练模块包括:
第二样本获取子模块,用于获取初始第一评分模型、多个评论信息样本对应的评论内容向量样本、每个所述评论信息样本对应的发布信息样本的信息内容向量样本及每个所述评论信息样本的操作信息样本;
第二标记子模块,用于针对每个评论信息样本,基于该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数,作为第二标定标签;
第二预测子模块,用于针对每个评论信息样本,将该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数输入所述初始第一评分模型,确定该评论信息样本的排序分数,作为第二预测标签;
第二参数调整子模块,用于基于所述第二预测标签及其对应的第二标定标签之间的差异,调整所述初始第一评分模型的参数,直到所述初始第一评分模型收敛,停止训练,得到所述第一评分模型。
可选的,所述装置还包括:
分数调整模块,用于在按照所述排序分数对所述评论信息进行排序之前,针对每个所述评论信息,按照预设的排序分数调整规则,对该评论信息的排序分数进行调整,得到该评论信息最终的排序分数,其中,所述排序分数调整规则为基于所述评论信息的属性设定的,所述属性包括评论发布者、评论发布时间、所述目标发布信息发布者、目标发布信息的类型、所述评论发布者与所述目标发布信息发布者的互动操作信息中的至少一种;
所述信息显示模块包括:
排序子模块,用于按照所述最终的排序分数对所述评论信息进行排序,得到排序结果。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的评论信息的显示方法步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的评论信息的显示方法步骤。
本发明实施例提供的方案中,电子设备可以获取目标发布信息的标题文本,并获取目标发布信息的每个评论信息及每个评论信息的操作信息;将标题文本及每个评论信息输入预先训练完成的语义向量确定模型,得到目标发布信息的信息内容向量以及每个评论信息的评论内容向量;针对每个评论信息,基于该评论信息对应的评论内容向量及目标发布信息的信息内容向量,确定该评论信息与目标发布信息之间的相关度,并基于相关度及该评论信息的操作信息,确定该评论信息的排序分数;按照排序分数对评论信息进行排序,得到排序结果,并按照排序结果显示每个评论信息。电子设备可以基于评论信息与目标发布信息之间的相关度及评论信息的操作信息,确定该评论信息的排序分数,当评论信息与目标发布信息之间的相关度越高时,评论信息的排序分数越高。由于用户对与发布信息相关性较高的评论信息更加感兴趣,所以,用户对显示在用户容易看到的区域的评论信息感兴趣的可能性较高,那么用户与评论信息的发布者进行互动的可能性也就较高,从而评论信息的显示效果也就更好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例所提供的一种评论信息的显示方法的流程图;
图2为评论信息显示区域的一种示意图;
图3为图1所示实施例中语义向量确定模型的训练方式的流程图;
图4为本发明实施例中第一评分模型的训练方式的流程图;
图5为本发明实施例所提供的一种评论信息的显示装置的结构示意图;
图6为本发明实施例中第一模型训练模块的结构示意图;
图7为本发明实施例中第二模型训练模块的结构示意图;
图8为本发明实施例所提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
为了提高用户与评论信息的发布者进行互动的可能性,提高评论信息的显示效果,本发明实施例提供了一种评论信息的显示方法、装置、电子设备、计算机可读存储介质及计算机程序产品。下面首先对本发明实施例提供的一种评论信息的显示方法进行介绍。
本发明实施例提供的一种评论信息的显示方法可以应用于任意需要显示评论信息的电子设备,例如,可以为手机、电脑、平板电脑等。为了描述清楚,后续称为电子设备。
如图1所示,一种评论信息的显示方法,所述方法包括:
S101,获取目标发布信息的标题文本,并获取所述目标发布信息的每个评论信息及所述每个评论信息的操作信息;
S102,将所述标题文本及所述每个评论信息输入预先训练完成的语义向量确定模型,得到所述目标发布信息的信息内容向量以及所述每个评论信息的评论内容向量;
其中,所述语义向量确定模型为基于多个发布信息的标题文本样本及其评论信息样本训练的,所述语义向量确定模型包括文本与内容向量之间的对应关系。
S103,针对每个所述评论信息,基于该评论信息对应的评论内容向量及所述目标发布信息的信息内容向量,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数;
其中,所述排序分数用于标识用户对所述评论信息的感兴趣程度。
S104,按照所述排序分数对所述评论信息进行排序,得到排序结果,并按照所述排序结果显示每个所述评论信息。
可见,本发明实施例所提供的方案中,电子设备可以获取目标发布信息的标题文本,并获取目标发布信息的每个评论信息及每个评论信息的操作信息;将标题文本及每个评论信息输入预先训练完成的语义向量确定模型,得到目标发布信息的信息内容向量以及每个评论信息的评论内容向量;针对每个评论信息,基于该评论信息对应的评论内容向量及目标发布信息的信息内容向量,确定该评论信息与目标发布信息之间的相关度,并基于相关度及该评论信息的操作信息,确定该评论信息的排序分数;按照排序分数对评论信息进行排序,得到排序结果,并按照排序结果显示每个评论信息。电子设备可以基于评论信息与目标发布信息之间的相关度及评论信息的操作信息,确定该评论信息的排序分数,当评论信息与目标发布信息之间的相关度越高时,评论信息的排序分数越高。由于用户对与发布信息相关性较高的评论信息更加感兴趣,所以,用户对显示在用户容易看到的区域的评论信息感兴趣的可能性较高,那么用户与评论信息的发布者进行互动的可能性也就较高,从而评论信息的显示效果也就更好。
用户浏览发布在网络中的视频、文章等发布信息时,可以针对发布信息发布评论信息,并可以对其他用户发布的评论信息进行浏览、回复等互动操作。由于用户一般会对感兴趣的评论信息进行互动操作,因此,在显示评论信息时,可以将用户感兴趣的评论信息显示在用户容易看到的区域。那么,在显示发布信息的评论信息时,便需要确定用户对于评论信息的感兴趣程度。为了确定用户对于目标发布信息的每个评论信息的感兴趣程度,在上述步骤S101中,电子设备可以获取目标发布信息的标题文本,并获取目标发布信息的每个评论信息,以及每个评论信息的操作信息。
其中,上述标题文本为表示目标发布信息的具体内容的文本信息,例如,目标发布信息MB1的具体内容为C市足球队与D市足球队之间的比赛结果为3:1,那么目标发布信息MB1的标题文本可以为“C市足球队3:1战胜D市足球队”。上述评论信息的操作信息为能够表示用户对评论信息所执行的操作的特征的信息,其中,操作信息可以包括用户对评论信息进行回复操作以及回复操作的次数、用户对评论信息进行转发操作以及转发操作的次数、用户对评论信息点赞操作以及点赞操作的次数等。
例如,网络中的用户对于评论信息P1进行回复的次数为20次、对于评论信息P1进行转发的次数为5次、对于评论信息P1点赞的次数为7次,那么评论信息P1的操作信息可以为:回复20次、转发5次、点赞7次。
在一种实施方式中,为了更加准确地确定目标发布信息的具体内容,上述标题文本不仅可以包括目标发布信息的标题,还可以包括目标发布信息的领域类型以及类型标签。在这种情况下,电子设备还可以获取目标发布信息的类型标签和目标发布信息发布者的标识。其中,类型标签用于表示目标发布信息的类型,该类型可以为预先设置的各个类型,可以包括娱乐、体育、电影、综艺、明星、故事等。例如,目标发布信息为篮球比赛的新闻,那么该目标发布信息的类型标签可以为“篮球新闻”;目标发布信息为舞蹈电影的视频片段,那么该目标发布信息的类型标签可以为“舞蹈视频”。
接下来,电子设备可以根据目标发布信息发布者的标识,确定目标发布信息发布者的历史发布信息,根据历史发布信息所涉及的领域确定目标发布信息的领域类型。例如,目标信息发布者F1发布过的历史发布信息所涉及的领域为音乐领域,那么电子设备可以确定目标信息发布者F1发布的目标发布信息的领域类型为“音乐”。然后,电子设备便可以将目标发布信息的标题、领域类型以及类型标签确定为目标发布信息的标题文本,根据包括目标发布信息的标题、领域类型以及类型标签的标题文本可以更加准确地确定目标发布信息的具体内容。
用户往往对与发布信息相关度较高的评论信息更加感兴趣,为了提高评论信息的显示效果,可以确定目标发布信息的标题文本与评论信息之间的相关度,作为目标发布信息与评论信息之间的相关度。由于文本之间的相关度可以通过文本对应的向量之间的距离确定,因此,在上述步骤S102中,电子设备可以将目标发布信息的标题文本及每个评论信息输入预先训练完成的语义向量确定模型,得到目标发布信息的信息内容向量以及每个评论信息的评论内容向量。
上述语义向量确定模型为预先基于多个发布信息的标题文本样本及其评论信息样本训练得到的,在训练过程中,可以不断调整语义向量确定模型的参数,以使语义向量确定模型的参数更加合适,从而使获得的语义向量确定模型可以输出能够准确表征输入文本语义的内容向量。训练完成的语义向量确定模型包括输入文本与内容向量之间的对应关系,输入文本也就是标题文本样本或评论信息样本,内容向量也就是标题文本样本对应的信息内容向量或评论信息样本对应的评论内容向量。
其中,上述语义向量确定模型可以为RNN(Recurrent Neural Network,循环神经网络)、基于注意力机制的长短期记忆网络(LSTM+Attention,Long Short-Term Memory+Attention)等深度学习模型,其参数可以随机初始化,在此不做具体限定。
上述信息内容向量可以表征标题文本的语义,上述评论内容向量可以表征评论信息的语义。对于内容向量a和内容向量b来说,内容向量a与内容向量b之间的余弦距离为:
其中,<a,b>为内容向量a与内容向量b之间的内积,|a|为内容向量a的长度,|b|为内容向量b的长度。当cosθ越接近1时,说明内容向量a与内容向量b之间的距离越小,内容向量a与内容向量b的方向也就越接近,那么内容向量a对应的文本与内容向量b对应的文本之间的相关度也就越高;当cosθ越接近-1时,说明内容向量a与内容向量b之间的距离越大,内容向量a与内容向量b的方向相差也就越大,那么内容向量a对应的文本与内容向量b对应的文本之间的相关度也就越低。
因此,当评论内容向量与信息内容向量之间的距离较近时,说明评论内容向量与信息内容向量比较相似,那么评论信息与目标发布信息之间的相关度也就较高;当评论内容向量与信息内容向量之间的距离较远时,说明评论内容向量与信息内容向量不太相似,那么评论信息与目标发布信息之间的相关度也就较低。
通常,用户对与目标发布信息相关度较高的评论信息以及互动操作的次数较多的评论信息的感兴趣程度较高,所以为了准确确定用户对评论信息的感兴趣程度,在上述步骤S103中,电子设备可以针对每个评论信息,基于该评论信息对应的评论内容向量及目标发布信息的信息内容向量,确定该评论信息与目标发布信息之间的相关度,并基于相关度及该评论信息的操作信息,确定该评论信息的排序分数。其中,上述排序分数用于标识用户对评论信息的感兴趣程度,当评论信息的排序分数较高时,说明用户对于该评论信息的感兴趣程度较高;当评论信息的排序分数较低时,说明用户对于该评论信息的感兴趣程度较低。
具体的,针对每个评论信息,电子设备可以确定该评论信息对应的评论内容向量及目标发布信息的信息内容向量之间的距离,作为该评论信息与目标发布信息之间的相关度,然后,电子设备可以根据评论信息与目标发布信息之间的相关度以及评论信息的操作信息,确定评论信息的排序分数。其中,上述评论内容向量及信息内容向量之间的距离的确定方式可以为余弦距离的确定方式、欧氏距离的确定方式、曼哈顿距离的确定方式、切比雪夫距离的确定方式等,在此不做具体限定及说明。
在一种实施方式中,可以预先设置回复次数、转发次数及点赞次数分别对应的权重,然后可以对回复次数、转发次数及点赞次数进行加权求和,然后将加权求和得到的结果与评论信息对应的相关度之间的乘积作为评论信息的排序分数。
例如,回复次数对应的权重为0.5,转发次数对应的权重为0.3,点赞次数对应的权重为0.2,用户对评论信息P2的点赞次数为5次,转发次数为3次,回复次数为6次,评论信息P2与目标发布信息M1之间的相关度为0.8,那么,评论信息P2的排序分数即为:(5×0.2+3×0.3+6×0.5)×0.8=3.92。
在得到每个评论信息的排序分数后,电子设备可以按照排序分数对所有评论信息进行排序,得到排序结果,并按照排序结果显示每个评论信息。具体的,由于评论信息的排序分数越高表示用户对评论信息的感兴趣程度越高,所以,电子设备可以按照排序分数由高到低的顺序对所有评论信息进行排序,得到排序结果。
在显示评论信息时,电子设备可以在预设的评论信息显示区域按照排序结果显示每个评论信息,在一种实施方式中,电子设备可以按照排序分数由高到低的顺序,在评论显示区域由上到下显示每个评论信息。这样,显示在用户容易看到的区域的评论信息被用户感兴趣的可能性也就较高,那么用户与评论信息的发布者及目标发布信息的发布者进行互动的可能性也就较高,从而评论信息的显示效果也就更好。
例如,评论信息P*1的排序分数为50、评论信息P*2的排序分数为75、评论信息P*3的排序分数为91、评论信息P*4的排序分数为32,那么评论信息P*1-P*4按照排序分数由高到低的顺序进行排序得到的排序结果为:P*3、P*2、P*1、P*4。如图2所示,电子设备可以在目标发布信息下方的评论显示区域210中按照由上到下的顺序显示评论信息P*3、P*2、P*1、P*4,其中,在评论信息显示区域210的最上方位置201显示评论信息P*3,在评论信息显示区域210由上往下的顺序的第二个位置202显示评论信息P*2,在评论信息显示区域210由上往下的顺序的第三个位置203显示评论信息P*1,在评论信息显示区域210由上往下的顺序的第四个位置204,也就是评论信息显示区域210的最下方位置显示评论信息P*4。
作为本发明实施例的一种实施方式,如图3所示,上述语义向量确定模型的训练方式,可以包括:
S301,获取初始语义向量确定模型、多个发布信息样本的标题文本样本及每个所述发布信息样本的评论信息样本;
为了获得可以准确确定文本对应的内容向量的语义向量确定模型,电子设备可以获取初始语义向量确定模型、多个发布信息样本的标题文本样本以及每个发布信息样本的评论信息样本,基于发布信息样本的标题文本样本及发布信息样本的评论信息样本对初始语义向量确定模型进行训练。
S302,针对每个所述发布信息样本,基于该发布信息样本的标题文本样本及该发布信息样本的评论信息样本,确定该发布信息样本与其评论信息样本之间的相关度,作为第一标定标签;
由于目标发布信息与评论信息之间的相关度可以通过目标发布信息的信息内容向量与评论信息的评论内容向量之间的距离表征,而内容向量与评论内容向量之间的距离取决于语义向量确定模型输出的内容向量与评论内容向量,所以为了使训练完成的语义向量确定模型能够准确的确定目标发布信息的信息内容向量和评论信息的评论内容向量,在对初始语义向量确定模型进行训练的过程中,针对每个发布信息样本,电子设备可以基于该发布信息样本的标题文本样本及该发布信息样本的评论信息样本,确定该发布信息样本与其评论信息样本之间的相关度,作为第一标定标签。
S303,针对每个所述发布信息样本,将该发布信息样本的标题文本样本及该发布信息样本的评论信息样本输入所述初始语义向量确定模型,确定该发布信息样本的信息内容向量样本以及该发布信息样本的评论信息样本的评论内容向量样本,并基于所述信息内容向量样本及所述评论内容向量样本确定该发布信息样本与其评论信息样本之间的相关度,作为第一预测标签;
在对初始语义向量确定模型进行训练的过程中,针对每个发布信息样本,电子设备可以将该发布信息样本的标题文本样本及该发布信息样本的评论信息样本输入当前的初始语义向量确定模型,确定该发布信息样本的信息内容向量样本以及该发布信息样本的评论信息样本的评论内容向量样本,并基于信息内容向量样本及评论内容向量样本,预测该发布信息样本与其评论信息样本之间的相关度,得到第一预测标签。
S304,基于所述第一预测标签与对应的第一标定标签之间的差异,调整所述初始语义向量确定模型的参数,直到所述初始语义向量确模型收敛,停止训练,得到所述语义向量确模型。
当前的初始语义向量确定模型的参数很可能不合适,基于当前的初始语义向量确定模型确定的内容向量样本和评论信息样本,还不能准确确定发布信息样本与其评论信息样本之间的相关度。因此,在得到上述第一预测标签及其对应的第一标定标签后,电子设备可以基于第一预测标签与对应的第一标定标签之间的差异,调整初始语义向量确定模型的参数,以使初始语义向量确定模型的参数更加合适。其中,调整初始语义向量确定模型的参数的方式可以为梯度下降算法、随机梯度下降算法等模型参数调整方式,在此不做具体限定及说明。
为了确定上述初始语义向量确定模型是否收敛,电子设备可以判断初始语义向量确定模型的迭代次数是否达到第一预设次数,或,初始语义向量确定模型的预测结果的准确度是否大于第一预设值。
如果初始语义向量确定模型的迭代次数达到第一预设次数,或,初始语义向量确定模型的预测结果的准确度大于第一预设值,说明初始语义向量确定模型已经收敛,也就是说,当前初始语义向量确定模型可以准确确定输入文本对应的内容向量,所以此时可以停止训练,得到语义向量确定模型。
其中,上述第一预设次数可以根据预测结果的准确度要求、模型结构等因素设定,例如,可以为6000次、9000次、12000次等,在此不做具体限定。第一预设值可以根据预测结果的准确度要求、模型结构等因素设定,例如可以为0.91、0.89、0.90等,在此不做具体限定。
如果初始语义向量确定模型的迭代次数没有达到第一预设次数,或,初始语义向量确定模型的预测结果的准确度不大于第一预设值,说明初始语义向量确定模型还未收敛,也就是说,当前初始语义向量确定模型还无法准确确定文本对应的内容向量,那么电子设备需要继续训练初始语义向量确定模型。
可见,本发明实施例所提供的方案中,电子设备可以根据上述方式对初始语义向量确定模型进行训练。这样,可以获得能够准确确定输入文本对应的内容向量的语义向量确定模型,进而可以准确地确定评论信息的评论内容向量和标题文本对应的信息内容向量。
作为本发明实施例的一种实施方式,上述基于所述第一预测标签与对应的第一标定标签之间的差异,调整所述初始语义向量确定模型的参数的步骤,可以包括:
基于第一预测标签与对应的第一标定标签之间的差异,调整每个词汇对应的语义权重。
一个文本往往包括多个词汇,每个词汇对于确定该文本的语义的重要程度往往是不同的。例如,文本中的量词、冠词等词汇对于确定该文本的语义的重要程度往往较低,而文本中的动词、名词等词汇对于确定该文本的语义的重要程度往往较高。
初始语义向量确定模型的参数可以包括每个词汇对应的语义权重,在通过初始语义向量确定模型确定输入文本对应的内容向量的过程中,首先可以确定输入文本所包括的每个词汇对应的词汇向量,然后根据每个词汇对应的词汇向量及每个词汇对应的语义权重,确定输入文本对应的内容向量。其中,上述语义权重可以表示词汇在词汇所属的文本的语义中的重要程度。
由于初始语义向量确定模型的参数中包括的语义权重很可能不合适,不能准确表示词汇在其所属的文本的语义中的重要程度,因此,电子设备可以基于第一预测标签与对应的第一标定标签之间的差异,调整每个词汇对应的语义权重,以使每个词汇对应的语义权重可以更加准确地表示该词汇在其所属的文本的语义中的重要程度,从而使得到的内容向量可以更加准确地表征输入文本的语义。其中,上述语义权重的调整方式可以为梯度下降算法、随机梯度下降算法等模型参数调整方式,在此不做具体限定及说明。
可见,本发明实施例所提供的方案中,电子设备可以基于第一预测标签与对应的第一标定标签之间的差异,调整每个词汇对应的语义权重,这样,可以使每个词汇对应的语义权重更加准确地表示该词汇的语义在其所属的文本的语义中的重要程度,从而使得到的内容向量可以更加准确地表征文本的语义。
作为本发明实施例的一种实施方式,上述针对每个所述评论信息,基于该评论信息对应的评论内容向量及所述目标发布信息的信息内容向量,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数的步骤,至少可以包括以下两种实施方式:
第一种实施方式:针对每个评论信息,将该评论信息对应的评论内容向量、目标发布信息的信息内容向量及该评论信息的操作信息输入预先训练完成的第一评分模型,根据该评论信息对应的评论内容向量与信息内容向量之间的距离,确定该评论信息与目标发布信息之间的相关度,并基于相关度及该评论信息的操作信息,确定该评论信息的排序分数。
为了确定每个评论信息的排序分数,在一种实施方式中,针对每个评论信息,电子设备可以将该评论信息对应的评论内容向量、目标发布信息的信息内容向量及该评论信息的操作信息输入预先训练完成的第一评分模型,然后,第一评分模型可以根据该评论信息对应的评论内容向量与信息内容向量之间的距离,确定该评论信息与目标发布信息之间的相关度,进而,第一评分模型可以基于相关度及该评论信息的操作信息,确定该评论信息的排序分数。
其中,上述第一评分模型为预先通过多个评论信息样本对应的评论内容向量样本、信息内容向量样本及每个评论信息样本的操作信息样本对初始第一评分模型进行训练完成的,包括评论信息样本的操作信息样本、评论内容向量样本及信息内容向量样本与评论信息样本的排序分数之间的对应关系。在训练过程中,可以不断调整初始第一评分模型的模型参数,以使初始第一评分模型的模型参数更加合适,从而得到可以准确确定评论信息样本的排序分数的第一评分模型。上述第一评分模型可以为深度神经网络模型(DNN,Deep Neural Networks)、深度卷积神经网络模型等深度学习模型,其参数可以随机初始化,在此不做具体限定。
用户通常对发布时间较晚的评论信息进行互动操作的可能性较高,对发布时间较早的评论信息进行互动操作的可能性较低,因此,在确定评论信息的排序分数时,可以参考评论信息的发布时间。针对这种情况,在一种实施方式中,电子设备可以获取评论信息的发布时间,然后将评论信息的发布时间、评论信息对应的评论内容向量、目标发布信息的信息内容向量及该评论信息的操作信息输入预先训练完成的第一评分模型,确定评论信息的排序分数。这样,可以使排序分数更加准确地表征用户对于评论信息的感兴趣程度。
由于目标发布信息的类型标签也可以表示目标发布信息的具体内容,因此,在确定评论信息的排序分数时,可以参考目标发布信息的类型标签。针对这种情况,在一种实施方式中,电子设备可以获取目标发布信息的类型标签,然后将目标发布信息的类型标签、评论信息对应的评论内容向量、目标发布信息的信息内容向量及该评论信息的操作信息输入预先训练完成的第一评分模型,确定评论信息的排序分数。这样,可以使排序分数更加准确地表征用户对于评论信息的感兴趣程度。
由于目标发布信息的领域类型也可以表示目标发布信息的具体内容,因此,在确定评论信息的排序分数时,可以参考目标发布信息的领域类型。针对这种情况,在一种实施方式中,电子设备可以获取目标发布信息发布者的标识,根据目标发布信息发布者的标识,确定目标发布信息发布者的历史发布信息,进而根据历史发布信息所涉及的领域确定目标发布信息的领域类型。然后,电子设备可以将目标发布信息的领域类型、评论信息对应的评论内容向量、目标发布信息的信息内容向量及该评论信息的操作信息输入预先训练完成的第一评分模型,确定评论信息的排序分数。这样,可以使排序分数更加准确地表征用户对于评论信息的感兴趣程度。
第二种实施方式:针对每个评论信息,基于该评论信息对应的评论内容向量与信息内容向量之间的距离,确定该评论信息与目标发布信息之间的相关度;针对每个评论信息,将该评论信息对应的相关度及该评论信息的操作信息输入预先训练完成的第二评分模型,确定该评论信息的排序分数。
针对每个评论信息,电子设备可以基于该评论信息对应的评论内容向量与信息内容向量之间的距离,确定该评论信息与目标发布信息之间的相关度,然后将该评论信息对应的相关度及该评论信息的操作信息输入预先训练完成的第二评分模型,确定该评论信息的排序分数。其中,上述评论信息对应的评论内容向量与信息内容向量之间的距离的确定方式可以为余弦距离的确定方式、欧氏距离的确定方式、曼哈顿距离的确定方式、切比雪夫距离的确定方式等,在此不做具体限定及说明。
上述第二评分模型为预先通过多个评论信息样本对应的相关度样本及其操作信息样本对初始第二评分模型进行训练完成的。在训练过程中,电子设备可以不断调整初始第二评分模型的参数,以使初始第二评分模型的参数更加合适,从而得到可以准确确定评论信息样本的排序分数的第二评分模型。其中,上述第二评分模型可以为深度神经网络模型(DNN,Deep Neural Networks)、深度卷积神经网络模型等深度学习模型,其参数可以随机初始化,在此不做具体限定。
可见,本发明实施例所提供的方案中,电子设备可以针对每个评论信息,将该评论信息对应的评论内容向量、目标发布信息的信息内容向量及该评论信息的操作信息输入预先训练完成的第一评分模型,根据该评论信息对应的评论内容向量与信息内容向量之间的距离,确定该评论信息与目标发布信息之间的相关度,并基于相关度及该评论信息的操作信息,确定该评论信息的排序分数;或,针对每个评论信息,基于该评论信息对应的评论内容向量与信息内容向量之间的距离,确定该评论信息与目标发布信息之间的相关度。这样,电子设备可以通过上述第一评分模型或第二评分模型准确地确定每个评论信息的排序分数。
作为本发明实施例的一种实施方式,如图4所示,上述第一评分模型的训练方式,可以包括:
S401,获取初始第一评分模型、多个评论信息样本对应的评论内容向量样本、每个所述评论信息样本对应的发布信息样本的信息内容向量样本及每个所述评论信息样本的操作信息样本;
为了获得可以准确确定评论信息的排序分数的第一评分模型,电子设备可以获取初始第一评分模型、多个评论信息样本对应的评论内容向量样本、每个评论信息样本对应的发布信息样本的信息内容向量样本及每个评论信息样本的操作信息样本,基于评论信息样本对应的评论内容向量样本、评论信息样本对应的发布信息样本的信息内容向量样本及评论信息样本的操作信息样本对初始第一评分模型进行训练。
S402,针对每个评论信息样本,基于该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数,作为第二标定标签;
为了使训练完成的第一评分模型能够准确确定每个评论信息的排序分数,在得到上述多个评论信息样本对应的评论内容向量样本、每个评论信息样本对应的发布信息样本的信息内容向量样本及每个评论信息样本的操作信息样本之后,针对每个评论信息样本,可以基于该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数,作为第二标定标签。
S403,针对每个评论信息样本,将该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本输入所述初始第一评分模型,确定该评论信息样本的排序分数,作为第二预测标签;
针对每个评论信息样本,电子设备可以将将该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本输入当前的初始第一评分模型,确定该评论信息样本的排序分数,作为第二预测标签。
S404,基于所述第二预测标签及其对应的第二标定标签之间的差异,调整所述初始第一评分模型的参数,直到所述初始第一评分模型收敛,停止训练,得到所述第一评分模型。
由于当前的第一评分模型的参数很可能并不合适,不能准确确定每个评论信息样本的排序分数,所以,在得到上述第二标定标签及上述第二预测标签后,电子设备可以基于第二预测标签及其对应的第二标定标签之间的差异,调整述初始第一评分模型的参数,直到初始第一评分模型收敛,停止训练,得到第一评分模型。其中,调整初始第一评分模型的参数的方式可以为梯度下降算法、随机梯度下降算法等模型参数调整方式,在此不做具体限定及说明。
为了确定上述初始第一评分模型是否收敛,电子设备可以判断初始第一评分模型的迭代次数是否达到第二预设次数,或,初始第一评分模型预测的排序分数的准确度是否大于第二预设值。
如果初始第一评分模型的迭代次数达到第二预设次数,或,初始第一评分模型预测的排序分数的准确度大于第二预设值,说明初始第一评分模型已经收敛,也就是说,当前第一评分模型可以准确确定评论信息样本的排序分数,所以此时可以停止训练,得到第一评分模型。
其中,上述第二预设次数可以根据排序分数的准确度要求、模型结构等因素设定,例如,可以为1000次、2000次、5000次等,在此不做具体限定。第二预设值可以根据排序分数的准确度要求、模型结构等因素设定,例如可以为0.90、0.85、0.92等,在此不做具体限定。
如果初始第一评分模型的迭代次数没有达到第二预设次数,或,初始第一评分模型的预测结果的准确度不大于第二预设值,说明初始第一评分模型还未收敛,也就是说,当前初始第一评分模型还无法准确确定评论信息的排序分数,那么电子设备需要继续训练初始第一评分模型。
可见,本发明实施例所提供的方案中,电子设备可以根据上述方式对初始第一评分模型进行训练。这样,可以获得能够准确确定评论信息的排序分数的第一评分模型。
作为本发明实施例的一种实施方式,上述第二评分模型的调整方式可以包括:
步骤1,获取初始第二评分模型、多个评论信息样本对应的相关度样本及每个评论信息样本的操作信息样本;
为了获得可以准确确定评论信息的排序分数的第二评分模型,电子设备可以获取初始第二评分模型、多个评论信息样本对应的相关度样本及每个评论信息样本的操作信息样本,基于评论信息样本对应的相关度样本及评论信息样本的操作信息样本对初始第二评分模型进行训练。
步骤2,针对每个评论信息样本,基于该评论信息样本对应的相关度样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数,作为第三标定标签;
为了使训练完成的第二评分模型能够准确地确定每个评论信息样本的排序分数,在得到多个评论信息样本对应的相关度样本及每个评论信息样本的操作信息样本之后,针对每个评论信息样本,可以基于该评论信息样本对应的相关度样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数,作为第三标定标签。
步骤3,针对每个评论信息样本,将该评论信息样本对应的相关度样本及该评论信息样本的操作信息样本输入所述初始第二评分模型,确定该评论信息样本的排序分数,作为第三预测标签;
针对每个评论信息样本,电子设备可以将该评论信息样本对应的相关度样本及该评论信息样本的操作信息样本输入初始第二评分模型,确定该评论信息样本的排序分数,作为第三预测标签。
步骤4,基于所述第三预测标签及其对应的第三标定标签之间的差异,调整所述初始第二评分模型的参数,直到所述初始第二评分模型收敛,停止训练,得到所述第二评分模型。
由于当前的第二评分模型的参数很可能并不合适,不能准确确定每个评论信息样本的排序分数,所以,在得到上述第三标定标签及上述第三预测标签后,电子设备可以基于第三预测标签及其对应的第三标定标签之间的差异,调整初始第二评分模型的参数,直到初始第二评分模型收敛,停止训练,得到第二评分模型。其中,调整初始第二评分模型的参数的方式可以为梯度下降算法、随机梯度下降算法等模型参数调整方式,在此不做具体限定及说明。
为了确定上述初始第二评分模型是否收敛,电子设备可以判断初始第二评分模型的迭代次数是否达到第三预设次数,或,初始第二评分模型预测的排序分数的准确度是否大于第三预设值。
如果初始第二评分模型的迭代次数达到第三预设次数,或,初始第二评分模型预测的排序分数的准确度大于第三预设值,说明初始第二评分模型已经收敛,也就是说,当前第二评分模型可以准确确定评论信息样本的排序分数,所以此时可以停止训练,得到第二评分模型。
其中,上述第三预设次数可以根据排序分数的准确度要求、模型结构等因素设定,例如,可以为2000次、2500次、3000次等,在此不做具体限定。第三预设值可以根据排序分数的准确度要求、模型结构等因素设定,例如可以为0.90、0.85、0.92等,在此不做具体限定。
如果初始第二评分模型的迭代次数没有达到第三预设次数,或,初始第二评分模型预测的排序分数的准确度不大于第三预设值,说明初始第二评分模型还未收敛,也就是说,当前初始第二评分模型还无法准确确定评论信息样本的排序分数,那么电子设备需要继续训练初始第二评分模型。
可见,本发明实施例所提供的方案中,电子设备可以根据上述方式对初始第二评分模型进行训练。这样,可以获得能够准确确定评论信息的排序分数的第二评分模型。
作为本发明实施例的一种实施方式,在按照上述排序分数对所述评论信息进行排序的步骤之前,上述方法还可以包括:
针对每个评论信息,按照预设的排序分数调整规则,对该评论信息的排序分数进行调整,得到该评论信息最终的排序分数。
在得到每个评论信息对应的排序分数后,为了使排序分数可以更加准确地表征用户对于评论信息的感兴趣程度,针对每个评论信息,电子设备可以按照预设的排序分数调整规则,对该评论信息的排序分数进行调整,得到该评论信息最终的排序分数。
其中,上述排序分数调整规则为基于评论信息的属性设定的,上述评论信息的属性可以包括评论发布者、评论发布时间、评论发布者与目标发布信息发布者的互动操作信息中的至少一种。
电子设备可以确定每个评论信息的评论发布者,并根据该评论发布者的历史评论信息的内容,确定该评论发布者发布过的评论信息为用户感兴趣的评论信息的可能性。
在一种实施方式中,上述排序分数调整规则可以设置为:将第一目标评论发布者发布的评论信息的评价分数按照预设的第一调整系数调高,将第二目标评论发布者发布的评论信息的评价分数按照预设的第二调整系数调低。其中,第一目标评论发布者为发布过用户感兴趣的评论信息的发布者,第二目标评论发布者没有发布过用户感兴趣的评论信息的发布者。上述第一调整系数和第二调整系数可以按照需求进行设置,在此不做具体限定。
例如,预设的第一调整系数为1.2、第二调整系数为0.5,评论发布者A1发布的评论信息Pl1的排序分数为30,评论发布者A2发布的评论信息Pl2的排序分数为44,评论发布者A1发布过用户感兴趣的评论信息,评论发布者A2没有发布过用户感兴趣的评论信息。那么,电子设备可以确定评论发布者A1发布的评论信息Pl1的最终的排序分数为30×1.2=36,并可以确定评论发布者A2发布的评论信息Pl2的最终的排序分数为44×0.5=22。
针对每个评论信息,电子设备还可以确定该评论信息的评论发布时间。由于用户往往对发布时间较晚的评论信息进行操作的可能性更高,因此,上述排序分数调整规则可以为:将发布时间较晚的评论信息的排序分数调高,将发布时间较早的评论信息的排序分数调低。
在一种实施方式中,可以预先设置时间阈值,上述排序分数调整规则可以为:当评论信息的发布时间早于时间阈值时,按照预设的第三调整系数将该评论信息的排序分数调低;当评论信息的发布时间不早于时间阈值时,按照预设的第四调整系数将该评论信息的排序分数调高。其中,上述时间阈值、第三调整系数和第四调整系数可以按照需求进行设置,在此不做具体限定。
例如,预设的第三调整系数为0.6,预设的第四调整系数为1.4,预设的时间阈值为2020年1月4日0时0分0秒。评论发布者A3发布的评论信息Pl3的排序分数为30,发布时间为2020年1月3日20时8分30秒,那么,电子设备可以确定评论信息Pl3的最终排序分数为30×0.6=18。
目标信息的发布者可能会与评论信息的发布者进行过互动操作,例如,目标发布信息的发布者对评论信息发布者发布的评论信息进行过回复操作、点赞操作或转发操作等。用户通常对目标发布信息的发布者进行过互动操作的评论信息的感兴趣程度更高。为了使评论信息的排序分数更加准确地表征用户对于评论信息的感兴趣程度,上述排序分数调整规则可以为:将目标发布信息发布者进行过互动操作的评论信息的评价分数调高。
在一种实施方式中,可以按照预设的第五调整系数将目标发布信息发布者进行过互动操作的评论信息的排序分数调高。其中,上述第五调整系数可以按照需求进行设置,在此不做具体限定。
例如,预设的第五调整系数为1.25,评论发布者A5发布的评论信息Pl5的排序分数为50,评论信息Pl5对应的目标发布信息的发布者对评论信息Pl5进行过回复操作,那么,电子设备可以确定评论信息Pl5的最终排序分数为50×1.25=62.5。
相应的,上述按照所述排序分数对所述评论信息进行排序,得到排序结果的步骤,可以包括:
按照最终的排序分数对所述评论信息进行排序,得到排序结果。
在根据预设的排序分数调整规则对评论信息的排序分数进行调整后,电子设备可以按照最终的排序分数,对评论信息进行排序,得到排序结果。这样,按照最终的排序分数对应的排序结果对评论信息进行展示时,可以进一步提高用户与评论信息的发布者进行互动的可能性,从而使评论信息的显示效果更好。
可见,本发明实施例所提供的方案中,电子设备可以针对每个评论信息,按照预设的排序分数调整规则,对该评论信息的排序分数进行调整,得到该评论信息最终的排序分数;按照最终的排序分数对评论信息进行排序,得到排序结果。这样,按照最终的排序分数对应的排序结果对评论信息进行展示时,可以进一步提高用户与评论信息的发布者进行互动的可能性,从而使评论信息的显示效果更好。
相应于上述评论信息的显示方法,本发明实施例还提供了一种评论信息的显示装置。下面对本发明实施例所提供的一种评论信息的显示装置进行介绍。
如图5所示,一种评论信息的显示装置,所述装置包括:
信息获取模块501,用于获取目标发布信息的标题文本,并获取所述目标发布信息的每个评论信息及所述每个评论信息的操作信息;
向量确定模块502,用于将所述标题文本及所述每个评论信息输入预先训练完成的语义向量确定模型,得到所述目标发布信息的信息内容向量以及所述每个评论信息的评论内容向量;
其中,所述语义向量确定模型为第一模型训练模块基于多个发布信息的标题文本样本及其评论信息样本训练的,所述语义向量确定模型包括文本与内容向量之间的对应关系。
分数确定模块503,用于针对每个所述评论信息,基于该评论信息对应的评论内容向量及所述目标发布信息的信息内容向量,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数;
其中,所述排序分数用于标识用户对所述评论信息的感兴趣程度。
信息显示模块504,用于按照所述排序分数对所述评论信息进行排序,得到排序结果,并按照所述排序结果显示每个所述评论信息。
可见,本发明实施例提供的方案中,电子设备可以获取目标发布信息的标题文本,并获取目标发布信息的每个评论信息及每个评论信息的操作信息;将标题文本及每个评论信息输入预先训练完成的语义向量确定模型,得到目标发布信息的信息内容向量以及每个评论信息的评论内容向量;针对每个评论信息,基于该评论信息对应的评论内容向量及目标发布信息的信息内容向量,确定该评论信息与目标发布信息之间的相关度,并基于相关度及该评论信息的操作信息,确定该评论信息的排序分数;按照排序分数对评论信息进行排序,得到排序结果,并按照排序结果显示每个评论信息。电子设备可以基于评论信息与目标发布信息之间的相关度及评论信息的操作信息,确定该评论信息的排序分数,当评论信息与目标发布信息之间的相关度越高时,评论信息的排序分数越高。由于用户对与发布信息相关性较高的评论信息更加感兴趣,所以,用户对显示在用户容易看到的区域的评论信息感兴趣的可能性较高,那么用户与评论信息的发布者进行互动的可能性也就较高,从而评论信息的显示效果也就更好。
作为本发明实施例的一种实施方式,如图6所示,上述第一模型训练模块(图5中未示出)可以包括:
第一样本获取子模块601,用于获取初始语义向量确定模型、多个发布信息样本的标题文本样本及每个所述发布信息样本的评论信息样本;
第一标记子模块602,用于针对每个所述发布信息样本,基于该发布信息样本的标题文本样本及该发布信息样本的评论信息样本,确定该发布信息样本与其评论信息样本之间的相关度,作为第一标定标签;
第一预测子模块603,用于针对每个所述发布信息样本,将该发布信息样本的标题文本样本及该发布信息样本的评论信息样本输入所述初始语义向量确定模型,确定该发布信息样本的信息内容向量样本以及该发布信息样本的评论信息样本的评论内容向量样本,并基于所述信息内容向量样本及所述评论内容向量样本确定该发布信息样本与其评论信息样本之间的相关度,作为第一预测标签;
第一参数调整子模块604,用于基于所述第一预测标签与对应的第一标定标签之间的差异,调整所述初始语义向量确定模型的参数,直到所述初始语义向量确模型收敛,停止训练,得到所述语义向量确模型。
作为本发明实施例的一种实施方式,上述第一参数调整子模块604可以包括:
第一参数调整单元(图6中未示出),用于基于所述第一预测标签与对应的第一标定标签之间的差异,调整每个词汇对应的语义权重;
其中,所述词汇的语义权重用于表示所述词汇在该词汇所属的文本的语义中的重要程度。
作为本发明实施例的一种实施方式,上述分数确定模块503可以包括:
第一分数确定子模块(图5中未示出),用于针对每个所述评论信息,将该评论信息对应的评论内容向量、所述目标发布信息的信息内容向量及该评论信息的操作信息输入预先训练完成的第一评分模型,根据该评论信息对应的评论内容向量与所述信息内容向量之间的距离,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数;
或,
第二分数确定子模块(图5中未示出),用于针对每个所述评论信息,基于该评论信息对应的评论内容向量与所述信息内容向量之间的距离,确定该评论信息与所述目标发布信息之间的相关度;针对每个所述评论信息,将该评论信息对应的相关度及该评论信息的操作信息输入预先训练完成的第二评分模型,确定该评论信息的排序分数。
作为本发明实施例的一种实施方式,上述第一评分模型为预先通过第二模型训练模块(图5中未示出)训练得到的;
如图7所示,上述第二模型训练模块可以包括:
第二样本获取子模块701,用于获取初始第一评分模型、多个评论信息样本对应的评论内容向量样本、每个所述评论信息样本对应的发布信息样本的信息内容向量样本及每个所述评论信息样本的操作信息样本;
第二标记子模块702,用于针对每个评论信息样本,基于该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数,作为第二标定标签;
第二预测子模块703,用于针对每个评论信息样本,将该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数输入所述初始第一评分模型,确定该评论信息样本的排序分数,作为第二预测标签;
第二参数调整子模块704,用于基于所述第二预测标签及其对应的第二标定标签之间的差异,调整所述初始第一评分模型的参数,直到所述初始第一评分模型收敛,停止训练,得到所述第一评分模型。
作为本发明实施例的一种实施方式,上述装置还可以包括:
分数调整模块(图5中未示出),用于在按照所述排序分数对所述评论信息进行排序之前,针对每个所述评论信息,按照预设的排序分数调整规则,对该评论信息的排序分数进行调整,得到该评论信息最终的排序分数;
其中,所述排序分数调整规则为基于所述评论信息的属性设定的,所述属性包括评论发布者、评论发布时间、所述目标发布信息发布者、目标发布信息的类型、所述评论发布者与所述目标发布信息发布者的互动操作信息中的至少一种。
上述信息显示模块504可以包括:
排序子模块(图5中未示出),用于按照所述最终的排序分数对所述评论信息进行排序,得到排序结果。
本发明实施例还提供了一种电子设备,如图8所示,包括处理器801、通信接口802、存储器803和通信总线804,其中,处理器801,通信接口802,存储器803通过通信总线804完成相互间的通信,
存储器803,用于存放计算机程序;
处理器801,用于执行存储器803上所存放的程序时,实现上述任一实施例所述的评论信息的显示方法步骤。
可见,本发明实施例提供的方案中,电子设备可以获取目标发布信息的标题文本,并获取目标发布信息的每个评论信息及每个评论信息的操作信息;将标题文本及每个评论信息输入预先训练完成的语义向量确定模型,得到目标发布信息的信息内容向量以及每个评论信息的评论内容向量;针对每个评论信息,基于该评论信息对应的评论内容向量及目标发布信息的信息内容向量,确定该评论信息与目标发布信息之间的相关度,并基于相关度及该评论信息的操作信息,确定该评论信息的排序分数;按照排序分数对评论信息进行排序,得到排序结果,并按照排序结果显示每个评论信息。电子设备可以基于评论信息与目标发布信息之间的相关度及评论信息的操作信息,确定该评论信息的排序分数,当评论信息与目标发布信息之间的相关度越高时,评论信息的排序分数越高。由于用户对与发布信息相关性较高的评论信息更加感兴趣,所以,用户对显示在用户容易看到的区域的评论信息感兴趣的可能性较高,那么用户与评论信息的发布者进行互动的可能性也就较高,从而评论信息的显示效果也就更好。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中任一所述的评论信息的显示方法。
可见,本发明实施例提供的方案中,计算机可读存储介质内存储的计算机程序被处理器执行时,可以获取目标发布信息的标题文本,并获取目标发布信息的每个评论信息及每个评论信息的操作信息;将标题文本及每个评论信息输入预先训练完成的语义向量确定模型,得到目标发布信息的信息内容向量以及每个评论信息的评论内容向量;针对每个评论信息,基于该评论信息对应的评论内容向量及目标发布信息的信息内容向量,确定该评论信息与目标发布信息之间的相关度,并基于相关度及该评论信息的操作信息,确定该评论信息的排序分数;按照排序分数对评论信息进行排序,得到排序结果,并按照排序结果显示每个评论信息。电子设备可以基于评论信息与目标发布信息之间的相关度及评论信息的操作信息,确定该评论信息的排序分数,当评论信息与目标发布信息之间的相关度越高时,评论信息的排序分数越高。由于用户对与发布信息相关性较高的评论信息更加感兴趣,所以,用户对显示在用户容易看到的区域的评论信息感兴趣的可能性较高,那么用户与评论信息的发布者进行互动的可能性也就较高,从而评论信息的显示效果也就更好。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的评论信息的显示方法。
可见,本发明实施例提供的方案中,包含指令的计算机程序产品在计算机上运行时,可以获取目标发布信息的标题文本,并获取目标发布信息的每个评论信息及每个评论信息的操作信息;将标题文本及每个评论信息输入预先训练完成的语义向量确定模型,得到目标发布信息的信息内容向量以及每个评论信息的评论内容向量;针对每个评论信息,基于该评论信息对应的评论内容向量及目标发布信息的信息内容向量,确定该评论信息与目标发布信息之间的相关度,并基于相关度及该评论信息的操作信息,确定该评论信息的排序分数;按照排序分数对评论信息进行排序,得到排序结果,并按照排序结果显示每个评论信息。电子设备可以基于评论信息与目标发布信息之间的相关度及评论信息的操作信息,确定该评论信息的排序分数,当评论信息与目标发布信息之间的相关度越高时,评论信息的排序分数越高。由于用户对与发布信息相关性较高的评论信息更加感兴趣,所以,用户对显示在用户容易看到的区域的评论信息感兴趣的可能性较高,那么用户与评论信息的发布者进行互动的可能性也就较高,从而评论信息的显示效果也就更好。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (14)
1.一种评论信息的显示方法,其特征在于,所述方法包括:
获取目标发布信息的标题文本,并获取所述目标发布信息的每个评论信息及所述每个评论信息的操作信息;
将所述标题文本及所述每个评论信息输入预先训练完成的语义向量确定模型,得到所述目标发布信息的信息内容向量以及所述每个评论信息的评论内容向量,其中,所述语义向量确定模型为基于多个发布信息的标题文本样本及其评论信息样本训练得到的,所述语义向量确定模型包括文本与内容向量之间的对应关系;
针对每个所述评论信息,基于该评论信息对应的评论内容向量及所述目标发布信息的信息内容向量,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数,其中,所述排序分数用于标识用户对所述评论信息的感兴趣程度;
按照所述排序分数对所述评论信息进行排序,得到排序结果,并按照所述排序结果显示每个所述评论信息。
2.根据权利要求1所述的方法,其特征在于,所述语义向量确定模型的训练方式,包括:
获取初始语义向量确定模型、多个发布信息样本的标题文本样本及每个所述发布信息样本的评论信息样本;
针对每个所述发布信息样本,基于该发布信息样本的标题文本样本及该发布信息样本的评论信息样本,确定该发布信息样本与其评论信息样本之间的相关度,作为第一标定标签;
针对每个所述发布信息样本,将该发布信息样本的标题文本样本及该发布信息样本的评论信息样本输入所述初始语义向量确定模型,确定该发布信息样本的信息内容向量样本以及该发布信息样本的评论信息样本的评论内容向量样本,并基于所述信息内容向量样本及所述评论内容向量样本确定该发布信息样本与其评论信息样本之间的相关度,作为第一预测标签;
基于所述第一预测标签与对应的第一标定标签之间的差异,调整所述初始语义向量确定模型的参数,直到所述初始语义向量确模型收敛,停止训练,得到所述语义向量确模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一预测标签与对应的第一标定标签之间的差异,调整所述初始语义向量确定模型的参数的步骤,包括:
基于所述第一预测标签与对应的第一标定标签之间的差异,调整每个词汇对应的语义权重,其中,所述词汇的语义权重用于表示所述词汇在该词汇所属的文本的语义中的重要程度。
4.根据权利要求1所述的方法,其特征在于,所述针对每个所述评论信息,基于该评论信息对应的评论内容向量及所述目标发布信息的信息内容向量,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数的步骤,包括:
针对每个所述评论信息,将该评论信息对应的评论内容向量、所述目标发布信息的信息内容向量及该评论信息的操作信息输入预先训练完成的第一评分模型,根据该评论信息对应的评论内容向量与所述信息内容向量之间的距离,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数;
或,
针对每个所述评论信息,基于该评论信息对应的评论内容向量与所述信息内容向量之间的距离,确定该评论信息与所述目标发布信息之间的相关度;针对每个所述评论信息,将该评论信息对应的相关度及该评论信息的操作信息输入预先训练完成的第二评分模型,确定该评论信息的排序分数。
5.根据权利要求4所述的方法,其特征在于,所述第一评分模型的训练方式,包括:
获取初始第一评分模型、多个评论信息样本对应的评论内容向量样本、每个所述评论信息样本对应的发布信息样本的信息内容向量样本及每个所述评论信息样本的操作信息样本;
针对每个评论信息样本,基于该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数,作为第二标定标签;
针对每个评论信息样本,将该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数输入所述初始第一评分模型,确定该评论信息样本的排序分数,作为第二预测标签;
基于所述第二预测标签及其对应的第二标定标签之间的差异,调整所述初始第一评分模型的参数,直到所述初始第一评分模型收敛,停止训练,得到所述第一评分模型。
6.根据权利要求1-5任一项所述的方法,其特征在于,在按照所述排序分数对所述评论信息进行排序的步骤之前,所述方法还包括:
针对每个所述评论信息,按照预设的排序分数调整规则,对该评论信息的排序分数进行调整,得到该评论信息最终的排序分数,其中,所述排序分数调整规则为基于所述评论信息的属性设定的,所述属性包括评论发布者、评论发布时间、所述目标发布信息发布者、目标发布信息的类型、所述评论发布者与所述目标发布信息发布者的互动操作信息中的至少一种;
所述按照所述排序分数对所述评论信息进行排序,得到排序结果的步骤,包括:
按照所述最终的排序分数对所述评论信息进行排序,得到排序结果。
7.一种评论信息的显示装置,其特征在于,所述装置包括:
信息获取模块,用于获取目标发布信息的标题文本,并获取所述目标发布信息的每个评论信息及所述每个评论信息的操作信息;
向量确定模块,用于将所述标题文本及所述每个评论信息输入预先训练完成的语义向量确定模型,得到所述目标发布信息的信息内容向量以及所述每个评论信息的评论内容向量,其中,所述语义向量确定模型为第一模型训练模块基于多个发布信息的标题文本样本及其评论信息样本训练的,所述语义向量确定模型包括文本与内容向量之间的对应关系;
分数确定模块,用于针对每个所述评论信息,基于该评论信息对应的评论内容向量及所述目标发布信息的信息内容向量,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数,其中,所述排序分数用于标识用户对所述评论信息的感兴趣程度;
信息显示模块,用于按照所述排序分数对所述评论信息进行排序,得到排序结果,并按照所述排序结果显示每个所述评论信息。
8.根据权利要求7所述的装置,其特征在于,所述第一模型训练模块包括:
第一样本获取子模块,用于获取初始语义向量确定模型、多个发布信息样本的标题文本样本及每个所述发布信息样本的评论信息样本;
第一标记子模块,用于针对每个所述发布信息样本,基于该发布信息样本的标题文本样本及该发布信息样本的评论信息样本,确定该发布信息样本与其评论信息样本之间的相关度,作为第一标定标签;
第一预测子模块,用于针对每个所述发布信息样本,将该发布信息样本的标题文本样本及该发布信息样本的评论信息样本输入所述初始语义向量确定模型,确定该发布信息样本的信息内容向量样本以及该发布信息样本的评论信息样本的评论内容向量样本,并基于所述信息内容向量样本及所述评论内容向量样本确定该发布信息样本与其评论信息样本之间的相关度,作为第一预测标签;
第一参数调整子模块,用于基于所述第一预测标签与对应的第一标定标签之间的差异,调整所述初始语义向量确定模型的参数,直到所述初始语义向量确模型收敛,停止训练,得到所述语义向量确模型。
9.根据权利要求8所述的装置,其特征在于,所述第一参数调整子模块包括:
第一参数调整单元,用于基于所述第一预测标签与对应的第一标定标签之间的差异,调整每个词汇对应的语义权重,其中,所述词汇的语义权重用于表示所述词汇在该词汇所属的文本的语义中的重要程度。
10.根据权利要求7所述的装置,其特征在于,所述分数确定模块包括:
第一分数确定子模块,用于针对每个所述评论信息,将该评论信息对应的评论内容向量、所述目标发布信息的信息内容向量及该评论信息的操作信息输入预先训练完成的第一评分模型,根据该评论信息对应的评论内容向量与所述信息内容向量之间的距离,确定该评论信息与所述目标发布信息之间的相关度,并基于所述相关度及该评论信息的操作信息,确定该评论信息的排序分数;
或,
第二分数确定子模块,用于针对每个所述评论信息,基于该评论信息对应的评论内容向量与所述信息内容向量之间的距离,确定该评论信息与所述目标发布信息之间的相关度;针对每个所述评论信息,将该评论信息对应的相关度及该评论信息的操作信息输入预先训练完成的第二评分模型,确定该评论信息的排序分数。
11.根据权利要求10所述的装置,其特征在于,所述第一评分模型为预先通过第二模型训练模块训练得到的;
所述第二模型训练模块包括:
第二样本获取子模块,用于获取初始第一评分模型、多个评论信息样本对应的评论内容向量样本、每个所述评论信息样本对应的发布信息样本的信息内容向量样本及每个所述评论信息样本的操作信息样本;
第二标记子模块,用于针对每个评论信息样本,基于该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数,作为第二标定标签;
第二预测子模块,用于针对每个评论信息样本,将该评论信息样本对应的评论内容向量样本、该评论信息样本对应的信息内容向量样本及该评论信息样本的操作信息样本,确定该评论信息样本的排序分数输入所述初始第一评分模型,确定该评论信息样本的排序分数,作为第二预测标签;
第二参数调整子模块,用于基于所述第二预测标签及其对应的第二标定标签之间的差异,调整所述初始第一评分模型的参数,直到所述初始第一评分模型收敛,停止训练,得到所述第一评分模型。
12.根据权利要求7-11任一项所述的装置,其特征在于,所述装置还包括:
分数调整模块,用于在按照所述排序分数对所述评论信息进行排序之前,针对每个所述评论信息,按照预设的排序分数调整规则,对该评论信息的排序分数进行调整,得到该评论信息最终的排序分数,其中,所述排序分数调整规则为基于所述评论信息的属性设定的,所述属性包括评论发布者、评论发布时间、所述目标发布信息发布者、目标发布信息的类型、所述评论发布者与所述目标发布信息发布者的互动操作信息中的至少一种;
所述信息显示模块包括:
排序子模块,用于按照所述最终的排序分数对所述评论信息进行排序,得到排序结果。
13.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6任一所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011509425.7A CN112559869A (zh) | 2020-12-18 | 2020-12-18 | 一种评论信息的显示方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011509425.7A CN112559869A (zh) | 2020-12-18 | 2020-12-18 | 一种评论信息的显示方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112559869A true CN112559869A (zh) | 2021-03-26 |
Family
ID=75031912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011509425.7A Pending CN112559869A (zh) | 2020-12-18 | 2020-12-18 | 一种评论信息的显示方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112559869A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113240177A (zh) * | 2021-05-13 | 2021-08-10 | 北京百度网讯科技有限公司 | 训练预测模型的方法、预测方法、装置、电子设备及介质 |
CN113361264A (zh) * | 2021-06-25 | 2021-09-07 | 上海哔哩哔哩科技有限公司 | 数据处理方法及装置 |
CN113515663A (zh) * | 2021-08-03 | 2021-10-19 | 广州酷狗计算机科技有限公司 | 一种评论信息的显示方法、装置、电子设备及存储介质 |
CN113741759A (zh) * | 2021-11-06 | 2021-12-03 | 腾讯科技(深圳)有限公司 | 评论信息的展示方法、装置、计算机设备和存储介质 |
US20230004593A1 (en) * | 2021-07-01 | 2023-01-05 | Beijing Dajia Internet Information Technology Co., Ltd. | Method for sorting video bullet-screen comments, server, and storage medium |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108961236A (zh) * | 2018-06-29 | 2018-12-07 | 国信优易数据有限公司 | 电路板缺陷检测模型的训练方法及装置、检测方法及装置 |
CN110674415A (zh) * | 2019-09-20 | 2020-01-10 | 北京浪潮数据技术有限公司 | 一种信息显示方法、装置及服务器 |
CN110866140A (zh) * | 2019-11-26 | 2020-03-06 | 腾讯科技(深圳)有限公司 | 图像特征提取模型训练方法、图像搜索方法及计算机设备 |
CN111310079A (zh) * | 2020-02-14 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 评论信息排序方法、装置、存储介质及服务器 |
CN111414543A (zh) * | 2020-03-25 | 2020-07-14 | 北京字节跳动网络技术有限公司 | 用于生成评论信息序列的方法、装置、电子设备和介质 |
CN111428867A (zh) * | 2020-06-15 | 2020-07-17 | 深圳市友杰智新科技有限公司 | 基于可逆分离卷积的模型训练方法、装置和计算机设备 |
-
2020
- 2020-12-18 CN CN202011509425.7A patent/CN112559869A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108961236A (zh) * | 2018-06-29 | 2018-12-07 | 国信优易数据有限公司 | 电路板缺陷检测模型的训练方法及装置、检测方法及装置 |
CN110674415A (zh) * | 2019-09-20 | 2020-01-10 | 北京浪潮数据技术有限公司 | 一种信息显示方法、装置及服务器 |
CN110866140A (zh) * | 2019-11-26 | 2020-03-06 | 腾讯科技(深圳)有限公司 | 图像特征提取模型训练方法、图像搜索方法及计算机设备 |
CN111310079A (zh) * | 2020-02-14 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 评论信息排序方法、装置、存储介质及服务器 |
CN111414543A (zh) * | 2020-03-25 | 2020-07-14 | 北京字节跳动网络技术有限公司 | 用于生成评论信息序列的方法、装置、电子设备和介质 |
CN111428867A (zh) * | 2020-06-15 | 2020-07-17 | 深圳市友杰智新科技有限公司 | 基于可逆分离卷积的模型训练方法、装置和计算机设备 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113240177A (zh) * | 2021-05-13 | 2021-08-10 | 北京百度网讯科技有限公司 | 训练预测模型的方法、预测方法、装置、电子设备及介质 |
CN113240177B (zh) * | 2021-05-13 | 2023-12-19 | 北京百度网讯科技有限公司 | 训练预测模型的方法、预测方法、装置、电子设备及介质 |
CN113361264A (zh) * | 2021-06-25 | 2021-09-07 | 上海哔哩哔哩科技有限公司 | 数据处理方法及装置 |
US20230004593A1 (en) * | 2021-07-01 | 2023-01-05 | Beijing Dajia Internet Information Technology Co., Ltd. | Method for sorting video bullet-screen comments, server, and storage medium |
CN113515663A (zh) * | 2021-08-03 | 2021-10-19 | 广州酷狗计算机科技有限公司 | 一种评论信息的显示方法、装置、电子设备及存储介质 |
CN113741759A (zh) * | 2021-11-06 | 2021-12-03 | 腾讯科技(深圳)有限公司 | 评论信息的展示方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220020056A1 (en) | Systems and methods for targeted advertising | |
CN112559869A (zh) | 一种评论信息的显示方法、装置、电子设备及存储介质 | |
US9900358B1 (en) | Organizing a stream of content | |
US20210256020A1 (en) | Method and system for presenting a search result in a search result card | |
CN106709040B (zh) | 一种应用搜索方法和服务器 | |
US10621220B2 (en) | Method and system for providing a personalized snippet | |
US8290927B2 (en) | Method and apparatus for rating user generated content in search results | |
KR101702020B1 (ko) | 온라인 소셜 네트워크용 클라이언트-측 검색 템플릿 | |
CN106446005B (zh) | 因子分解模型 | |
US20130346877A1 (en) | Recommended content for an endorsement user interface | |
US10229190B2 (en) | Latent semantic indexing in application classification | |
CN105917364B (zh) | 对问答论坛中讨论话题的排名 | |
US20190095949A1 (en) | Digital Marketing Content Control based on External Data Sources | |
US20220284054A1 (en) | Content Carousel in a Social Media Timeline | |
CN102483745A (zh) | 共同选择图像分类 | |
CN110874436B (zh) | 用于基于第三方内容的上下文课程推荐的网络系统 | |
US10997264B2 (en) | Delivery of contextual interest from interaction information | |
CN103955480B (zh) | 一种用于确定用户所对应的目标对象信息的方法与设备 | |
CN112699307A (zh) | 一种信息的生成方法及装置 | |
CN111400516A (zh) | 标签确定方法、电子设备及存储介质 | |
US20240045911A1 (en) | Method and system for webpage classification and content delivery | |
WO2022026416A1 (en) | System and method for addressing disinformation | |
WO2015042482A1 (en) | Social content distribution network | |
CN113553392A (zh) | 数据内容索引方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |