CN110347314A - 一种内容展示方法、装置、存储介质和计算机设备 - Google Patents

一种内容展示方法、装置、存储介质和计算机设备 Download PDF

Info

Publication number
CN110347314A
CN110347314A CN201810284403.1A CN201810284403A CN110347314A CN 110347314 A CN110347314 A CN 110347314A CN 201810284403 A CN201810284403 A CN 201810284403A CN 110347314 A CN110347314 A CN 110347314A
Authority
CN
China
Prior art keywords
content
words
user
publication
content type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810284403.1A
Other languages
English (en)
Other versions
CN110347314B (zh
Inventor
周子琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810284403.1A priority Critical patent/CN110347314B/zh
Publication of CN110347314A publication Critical patent/CN110347314A/zh
Application granted granted Critical
Publication of CN110347314B publication Critical patent/CN110347314B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0483Interaction with page-structured environments, e.g. book metaphor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0485Scrolling or panning

Abstract

本发明涉及一种内容展示方法、装置、存储介质和计算机设备,包括:显示与登录的用户标识对应的用户社交页面;所述用户社交页面,用于展示与所述用户标识关联的内容;接收对应于所述用户社交页面的内容筛选指令;确定所述内容筛选指令所指定的内容类别;所述内容类别,包括附加内容类别和社交内容类别中的至少一种;从与所述用户标识关联的内容中,筛选属于所述内容类别的内容;根据所述内容筛选指令在所述用户社交页面中展示筛选出的所述内容。本申请提供的方案提高查找感兴趣内容的效率。

Description

一种内容展示方法、装置、存储介质和计算机设备
技术领域
本发明涉及计算机技术领域,特别是涉及一种内容展示方法、装置、存储介质和计算机设备。
背景技术
社交应用是目前广泛应用的一种应用程序。基于社交应用,用户之间能够建立基于社交网络的社交关系,从而基于社交关系进行交互,如发送即时消息或者浏览用户发布的内容等,为人们的生活和工作提供了极大便利。
然而,用户在意图浏览这些内容时,通常是通过该用户社交页面将这些内容进行展示,用户进而浏览展示的内容中感兴趣的内容,但是,由于展示的内容可能非常多,因此用户无法快速找到感兴趣的内容。
发明内容
基于此,有必要针对目前展示内容的方式使得用户无法快速找到感兴趣内容的问题,提供一种内容展示方法、装置、存储介质和计算机设备。
一种内容展示方法,包括:
显示与登录的用户标识对应的用户社交页面;所述用户社交页面,用于展示与所述用户标识关联的内容;
接收对应于所述用户社交页面的内容筛选指令;
确定所述内容筛选指令所指定的内容类别;所述内容类别,包括社交内容类别和附加内容类别中的至少一种;
从与所述用户标识关联的内容中,筛选属于确定的所述内容类别的内容;
根据所述内容筛选指令在所述用户社交页面中展示筛选出的所述内容。
一种内容展示装置,包括:
显示模块,用于显示与登录的用户标识对应的用户社交页面;所述用户社交页面,用于展示与所述用户标识关联的内容;
接收模块,用于接收对应于所述用户社交页面的内容筛选指令;
确定模块,用于确定所述内容筛选指令所指定的内容类别;所述内容类别,包括社交内容类别和附加内容类别中的至少一种;
筛选模块,用于从与所述用户标识关联的内容中,筛选属于确定的所述内容类别的内容;
展示模块,用于根据所述内容筛选指令在所述用户社交页面中展示筛选出的内容。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
显示与登录的用户标识对应的用户社交页面;所述用户社交页面,用于展示与所述用户标识关联的内容;
接收对应于所述用户社交页面的内容筛选指令;
确定所述内容筛选指令所指定的内容类别;所述内容类别,包括社交内容类别和附加内容类别中的至少一种;
从与所述用户标识关联的内容中,筛选属于确定的所述内容类别的内容;
根据所述内容筛选指令在所述用户社交页面中展示筛选出的所述内容。
一种计算机设备,包括存储器和处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
显示与登录的用户标识对应的用户社交页面;所述用户社交页面,用于展示与所述用户标识关联的内容;
接收对应于所述用户社交页面的内容筛选指令;
确定所述内容筛选指令所指定的内容类别;所述内容类别,包括社交内容类别和附加内容类别中的至少一种;
从与所述用户标识关联的内容中,筛选属于确定的所述内容类别的内容;
根据所述内容筛选指令在所述用户社交页面中展示筛选出的所述内容。
上述内容展示方法、装置、存储介质和计算机设备,在显示与登录的用户标识对应的用户社交页面后,接收对应于该用户社交页面的内容筛选指令,继而确定该内容筛选指令所指定的内容类别,以从与当前登录的用户标识关联的内容中,筛选属于该内容类别的内容进行展示。其中,内容类别包括社交内容类别和附加内容类别中的至少一种,这样用户可通过自主选择,在意图浏览附加内容时统一展示附加内容,或者在意图浏览社交内容时统一展示社交内容,从而使得用户可以快速找到感兴趣的内容。
附图说明
图1为一个实施例中内容展示方法的应用环境图;
图2为一个实施例中内容展示方法的流程示意图;
图3A为一个实施例中用户社交页面的界面示意图;
图3B为另一个实施例中用户社交页面的界面示意图;
图4为另一个实施例中用户社交页面的界面示意图;
图5为另一个实施例中用户社交页面的界面示意图;
图6为一个实施例中终端与服务器交互的时序图;
图7为一个实施例中内容展示方法的时序图;
图8为一个实施例中内容展示装置的模块结构图;
图9为另一个实施例中内容展示装置的模块结构图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为一个实施例中内容展示方法的应用环境图。参照图1,该内容展示方法应用于资源分享系统。该内容展示系统包括终端110和服务器120。其中,终端110和服务器120通过网络连接。终端110上用于执行该内容展示方法。终端110具体可以是固定终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120具体可以是独立的服务器,也可以是多个独立的服务器组成的服务器集群。
图2为一个实施例中内容展示方法的流程示意图。本实施例主要以该方法应用于上述图1中的终端110来举例说明。参照图2,该内容展示方法具体包括如下步骤:
S202,显示与登录的用户标识对应的用户社交页面;用户社交页面,用于展示与用户标识关联的内容。
其中,用户标识用于唯一标识一个用户,可以是包括数字、字母和符号中的至少一种字符的字符串。用户标识具体可以是用户社交账号。用户社交页面是用于展示与用户标识关联的内容的页面。在用户社交页面展示的内容是在社交中产生的内容。内容可以包括文本、图片、音频或者视频中的至少一种。内容是用户发布内容,具体可以是用户发表的内容,也可以是用户对发表的内容的评论内容,还可以是用户对评论内容的回复内容。
在一个实施例中,与用户标识关联的内容可以包括通过用户标识主动发布的内容,还可以包括通过与该用户标识关联的用户标识发布的内容。其中,与该用户标识关联的用户标识,可以是与该用户标识存在社交好友关系的用户标识,也可以是第三方公众标识。
具体地,终端可检测通过用户触发的社交应用选择指令,根据该社交应用选择指令运行相应的社交应用,显示与当前登录的用户标识对应的用户社交页面。其中,社交应用包括即时通信应用、SNS(Social Network Service,社交网站)应用或者直播应用等。即时通信应用比如微信应用或者QQ应用等。
举例说明,假设社交应用为QQ应用,登录的用户标识具体可以是当前登录的QQ账号,与用户标识关联的内容具体可以是通过该QQ账号发布的说说、评论和回复,也可以是该QQ账号的好友QQ账号发布的说说、评论和回复,还可以是第三方系统账号发布的说说、评论和回复等。
S204,接收对应于用户社交页面的内容筛选指令。
其中,内容筛选指令是用于指示进行内容筛选的计算机指令。具体地,终端可检测对应于用户社交页面的预定义的触发操作,也可通过运行的社交应用检测对应于用户社交页面的预定义的触发操作。在检测到该触发操作时,终端即判定接收到内容筛选指令。触发操作可以是对用户社交页面中控件的操作,比如对控件的触控操作或者光标点击操作等。触发操作也可以是对预定义的物理按钮的点击,或者在显示用户社交页面时触发的晃动操作,或者在显示用户社交页面时触发的语音输入操作等。
S206,确定内容筛选指令所指定的内容类别;内容类别,包括社交内容类别和附加内容类别中的至少一种。
其中,内容类别是内容所属的类型。内容类别是将内容进行分类划分的依据。在本实施例中,内容类别包括社交内容类别和附加内容类别。社交内容是反映用户主观情感且不具有推广目的的信息。附加内容是投放方提供的用于推广产品的信息。附加内容比如广告或者优惠信息等。
具体地,终端在检测预定义的触发操作,以判定接收到对应于用户社交页面的内容筛选指令后,可以根据预定义的触发操作与内容类别的映射关系,将内容筛选指令所映射至的内容类别作为内容筛选指令所指定的内容类别。举例说明,比如,终端可事先建立对用户社交页面中控件的单击操作与附加内容类别的映射关系,建立对用户社交页面中控件的双击操作与社交内容类别的映射关系。这样,在检测到对用户社交页面中控件的单击操作时,即判定内容筛选指令所指定的内容类别为附加内容类别。再比如,终端还可事先建立对某一物理按键的点击操作与附加内容类别的映射关系,建立对另一物理按键的点击操作与社交内容类别的映射关系等。
在一个实施例中,终端可在用户社交页面中分别提供附加内容类别和社交内容类别的选择入口,这样通过该选择入口触发的内容筛选指令即可携带该选择入口相应的内容类别。终端则可提取内容筛选指令中所携带的内容类别,从而确定内容筛选指令所指定的内容类别。
在一个实施例中,内容筛选指令所指定的内容类别可以是附加内容类别,也可以是社交内容类别,还可以是附加内容类别和社交内容类别。当内容筛选指令所指定的内容类别是附加内容类别和社交内容类别,也就是全部内容类别。
S208,从与用户标识关联的内容中,筛选属于确定的内容类别的内容。
具体地,终端可从服务器上拉取全部与用户标识关联的内容,再根据拉取的各内容所携带的内容类别标识,从拉取的内容中筛选出携带内容筛选指令所指定的内容类别的内容类别标识的内容。
在一个实施例中,终端从服务器上拉取全部与用户标识关联的内容后,可对拉取的各内容所属的内容类别进行识别,并筛选出识别为属于内容筛选指令所指定的内容类别的内容。
在一个实施例中,内容类别标识可以是唯一的标识,也可以为两个不同的标识。可以理解,本实施例中将内容分类为附加内容和社交内容两类,当内容类别标识为唯一的标识时,也就是说,仅对一种内容类别的内容添加内容类别标识。比如,仅对附加内容类别的内容添加内容类别标识,那么没有添加内容类别标识的内容即属于社交内容类别。内容类别标识为两个不同的标识时,那这两个不同的标识分别用来标识附加内容类别和社交内容类别。
在一个实施例中,终端可将当前登录的用户标识和内容筛选指令所指定的内容类别对应发送至服务器,服务器在接收到用户标识和内容类别后,查找与该用户标识关联的内容中,筛选属于该内容类别的内容后反馈至终端。
S210,根据内容筛选指令在用户社交页面中展示筛选出的内容。
具体地,终端可将筛选出的各内容按照发布时间的先后顺序,在用户社交页面中进行展示。
举例说明,当用户选择的是社交内容类别时,那么此时在用户社交页面中展示的全部为社交内容类别的内容;当用户选择的是附加内容类别时,那么此时在用户社交页面中展示的全部为附加内容类别的内容。这样避免了目前通过采用屏蔽某个用户标识来屏蔽该用户标识发布的附加内容时,以偏概全地屏蔽了该用户标识发布的所有内容,而导致的该用户标识发布的社交内容无法被其他用户浏览到的问题。而且,通过提供附加类别,在用户意图浏览附加内容时,能够统一展示附加内容供用户选择,提升了用户体验。
上述内容展示方法,在显示与登录的用户标识对应的用户社交页面后,接收对应于该用户社交页面的内容筛选指令,继而确定该内容筛选指令所指定的内容类别,以从与当前登录的用户标识关联的内容中,筛选属于该内容类别的内容进行展示。其中,内容类别包括社交内容类别和附加内容类别中的至少一种,这样用户可通过自主选择,在意图浏览附加内容时统一展示附加内容,或者在意图浏览社交内容时统一展示社交内容,从而使得用户可以快速找到感兴趣的内容。
在一个实施例中,该内容展示方法还包括:确定内容筛选指令所指定的指令类别;当指令类别为查看内容类别时,则执行从与用户标识关联的内容中,筛选属于内容类别的内容的步骤;当指令类别为过滤内容类别时,则从与用户标识关联的内容中,筛选不属于内容类别的内容。
其中,指令类别是内容筛选指令所属的类别。指令类别用于指示根据内容筛选指令筛选出属于该内容筛选指令所指定的内容类别的内容,还是根据内容筛选指令筛选出不属于该内容筛选指令所指定的内容类别的内容。
具体地,终端在接收到内容筛选指令后,确定该内容筛选指令的指令类别是查看内容类别,还是过滤内容类别。当内容筛选指令的指令类别是查看内容类别时,表示用户意图查看属于该内容筛选指令所指定的内容类别的内容,也就是需要筛选出属于该内容筛选指令所指定的内容类别的内容;当内容筛选指令的指令类别是过滤内容类别时,表示用户意图过滤属于该内容筛选指令所指定的内容类别的内容,也就是需要筛选出不属于该内容筛选指令所指定的内容类别的内容。
在本实施例中,通过为内容筛选指令设置指令类别,这样用户即可通过指令类别和内容类别排列组合触发多样的筛选动作,丰富用户对展示内容筛选的可能性。
在一个实施例中,S204包括:在相对于用户社交页面所在视图层的顶层视图层绘制内容筛选入口;检测作用于内容筛选入口的触发操作;在检测到触发操作时,判定检测到内容筛选指令。
其中,视图层是用于进行界面内容绘制的图层。界面内容包括界面控件以及内容。内容筛选入口是可以定制显示位置和显示尺寸的界面控件。内容筛选入口所在视图层始终为顶层视图层。内容筛选入口可为矩形,也可为圆形或者不规则形状。
具体地,终端可读取内容筛选入口的显示位置,继而在相对于用户社交页面所在视图层的顶层视图层按照该显示位置绘制内容筛选入口,以悬浮显示该内容筛选入口。该内容筛选入口可包括内容类别选项。终端可继续检测作用于内容筛选入口中内容类别选项的触发操作,在检测到触发操作时,则判定检测到内容筛选指令。该内容筛选指令所指向的内容类别,即为检测到的触发操作所针对的内容类别选项对应的内容类别。
举例说明,图3A示出了一个实施例中用户社交页面的界面示意图。参考图3A,该界面包括内容筛选入口310,内容筛选入口310中包括内容类别选项311“全部、过滤广告、只看广告”供用户选择。该内容类别选项310以浮动框的形式展示。这样,终端即可检测用户对于内容类别选项311“全部、过滤广告、只看广告”的选择操作,以展示用户意图更新展示的内容。此时,若用户点击“全部”选项,则展示包括广告的全部内容;若用户点击“过滤广告”选项,则展示过滤掉广告后的剩余内容;若用户点击“只看广告”选项,则筛选出广告进行展示。
在本实施例中,分别将内容筛选入口与用户社交页面绘制在不同的视图层,使得内容筛选入口与用户社交页面相分离,这样使得内容筛选入口不影响用户社交页面中内容的布局,使得实现信息显示的扩展性有了极大地增强。
在一个实施例中,指令类别也可用于指示是否根据内容筛选指令过滤属于该内容筛选指令所指定的内容类别的内容。当内容筛选指令的指令类别是查看内容类别时,表示用户意图查看属于该内容筛选指令所指定的内容类别的内容,也就是不需要过滤掉属于该内容筛选指令所指定的内容类别的内容;当内容筛选指令的指令类别是过滤内容类别时,表示用户意图过滤属于该内容筛选指令所指定的内容类别的内容,也就是需要筛选出不属于该内容筛选指令所指定的内容类别的内容。
举例说明,图3B示出了一个实施例中用户社交页面的界面示意图。参考图3B,该界面包括内容筛选入口320,内容筛选入口320中包括内容类别选项321“看广告、不看广告”供用户选择。该内容类别选项310以浮动框的形式展示。此时,若用户点击“看广告”选项,则展示包括广告的全部内容;若用户点击“不看广告”选项,则展示过滤掉广告后的剩余内容。
在一个实施例中,内容展示方法还包括:检测对于用户社交页面的页面滚动操作;根据页面滚动操作控制用户社交页面进行滚动;在控制用户社交页面进行滚动时,隐藏内容筛选入口。
其中,页面滚动操作是用于滚动显示用户社交页面的操作。页面滚动操作具体可以是对用户社交页面中控件的操作,比如对控件的触控操作或者光标点击操作等。页面滚动操作也可以是对预定义的物理按钮(比如音量键)的按压操作,或者在显示用户社交页面时触发的晃动操作或语音输入操作等。
具体地,终端可实时检测或者通过运行的社交应用实时检测页面滚动操作,在检测到页面滚动操作时控制用户社交页面进行滚动,并在控制用户社交页面滚动时,隐藏内容筛选入口。
进一步地,终端还可在结束控制页面滚动时,重新显示内容筛选入口。
举例说明,图4示出了一个实施例中用户社交页面的界面示意图。参考图4,第一应用具体可以是QQ应用。QQ应用可检测通过用户触发的页面滚动操作,在检测到页面滚动操作时,控制用户社交页面滚动,并隐藏内容筛选入口。再参考图5,该图示出了另一个实施例中用户社交页面的界面示意图,可以看到,此时在页面滚动操作结束时,重新显示内容筛选入口510。
在本实施例中,在检测到页面滚动操作,控制页面滚动并隐藏内容筛选入口,避免了用户在触发页面滚动操作时,误触内容筛选入口而导致的误操作。
在一个实施例中,S208包括:向服务器发起内容拉取请求;内容拉取请求用于请求拉取与用户标识关联的内容;接收服务器响应于内容拉取请求反馈的内容,及内容相应的内容类别标识;从接收到的内容中,筛选出相应的内容类别标识所标识的内容类别与确定的内容类别一致的内容。
其中,内容拉取请求是用于请求拉取内容的计算机指令。内容类别标识是用于标识内容所属内容类别的标签。
具体地,内容类别标识可以是服务器在接收到通过各用户标识上传的内容后,由服务器对各内容所属的内容类别进行识别后,为各内容添加内容类别标识。内容类别标识也可以是终端在获取到用户输入的内容后,由终端本地对该内容所属的内容类别进行识别,并为该内容添加内容类别标识后,将该内容和相应添加的内容类别标识对应发送至服务器,再由服务器进行对应存储。
终端在确定内容筛选指令所指定的内容类别后,向服务器发起对应于当前登录的用户标识的内容拉取请求,服务器在接收到该内容拉取请求后,查询与该用户标识关联的内容,并将查询到的内容和相应添加的内容类别标识反馈至终端。终端再从接收到的内容中,筛选出相应添加的内容类别标识所标识的内容类别与确定的内容类别一致的内容。
在本实施例中,从服务器拉取内容后,便可根据用户的自主选择,在用户意图浏览附加内容时统一展示附加内容,或者用户在意图浏览社交内容时统一展示社交内容,从而使得用户可以快速找到感兴趣的内容。
在一个实施例中,内容展示方法还包括:获取通过用户标识发布的内容;识别发布的内容所属的内容类别;将发布的内容与识别得到的内容类别所对应的内容类别标识,对应上传至服务器。
具体地,终端可在检测到对应于输入的内容的提交指令后,获取用户在社交应用中输入的内容,并识别该内容所属的内容类别,然后为该内容添加用于标识内容类别的内容类别标识。终端再将该内容和相应添加的内容类别标识对应上传至服务器,由服务器对应存储在服务器的数据库、文件或者缓存等存储空间中。
举例说明,图6示出一个实施例中终端与服务器的交互时序图。用户在社交应用中输入内容并点击发布后,终端即在本地识别该内容所属的内容类别,再将标识该内容的内容类别的内容类别标识写入内容的透传字段中。此后,终端再将内容发送到服务器后,这样服务器即可将接收到的内容和相应的内容类别标识对应存储。
在一个实施例中,识别发布的内容所属的内容类别,包括:通过各内容类别对应的主题模型,预测发布的内容所属内容类别;根据各主题模型,确定与发布的内容对应的背景特征词集合;通过预测的内容类别所对应的主题模型,生成与发布的内容对应的候选特征词集合,及候选特征词集合中各特征词的第一权重;对发布的内容分词以构建目标特征词集合,并确定目标特征词集合中各特征词的第二权重;当背景特征词集合中特征词在候选特征词集合中占比大于预设占比时,更新存在于候选特征词集合中、且存在于背景特征词集合中的特征词的第一权重;根据候选特征词集合中各特征词及各特征词的第一权重,及目标特征词集合中各特征词及各特征词的第二权重,确定发布的内容所属的内容类别。
其中,主题模型采用词袋模型,将每一篇文档视为一个词频向量,从而将文本信息转化为易于建模的数字信息,用于识别文档中的主题。在自然语言中,主题表示的是若干词所表达的一个概念,在数学上表示为词汇表上词语的条件概率分布。一篇文档中的每个词都是按照一定概率选择了某个主题,并从选择的主题中选择了某个词这样一个过程得到的。
主题模型可采用pLSA(Probabilistic Latent Semantic Analysis)或者LDA(Latent Dirichlet Allocation),pLSA主题生成模型训练推理主要使用的是EM(期望最大化)算法;LDA主题生成模型训练推理采用的是Gibbs sampling(吉布斯采样)方法。
具体地,终端可事先收集属于各内容类别的内容,构建各内容类别相应的语料库,再根据各语料库构建相应内容类别所对应的主题模型。在本实施例中,终端分别构建了与附加内容类别对应的主题模型和与社交内容类别对应的主题模型。可以理解,各内容类别所对应的主题模型也可由服务器构建后下发至终端直接使用。
其中,对于语料库中的每篇内容,主题模型定义了如下生成过程:给定包括M篇内容的语料库,语料库中的每一篇内容与K(K通过反复试验等方法事先给定)个主题的一个多项式分布相对应,将该多项式分布记为θ。每个主题又与词汇表(语料库中的词)中的V个单词的一个多项式分布相对应,将这个多项式分布记为θ和分别是带有超参数α和β的Dirichlet先验分布。对于一篇内容m中的每一个词w,从该内容m所对应的多项式分布θ中抽取一个主题z,然后再从主题z所对应的多项分布中抽取一个词w,将这个过程重复Nm次,就产生了内容m,这里的Nm是文档m中的词总数。其中m∈[1,M],k∈[1,K]。主题模型即包括前述的多项式分布记θ及多项式分布
在一个实施例中,通过各内容类别对应的主题模型,预测发布的内容所属内容类别,包括:根据与附加内容类别对应的主题模型,确定在与附加内容类别对应的主题模型下生成发布的内容的第一条件概率和第一先验概率;根据与社交内容类别对应的主题模型,确定在与社交内容类别对应的主题模型生成发布的内容的第二条件概率和第二先验概率;当第一条件概率与第一先验概率的乘积大于第二条件概率与第二先验概率的乘积时,则预测附加内容类别为发布的内容所属的内容类别;当第一条件概率与第一先验概率的乘积小于第二条件概率与第二先验概率的乘积时,则预测社交内容类别为发布的内容所属的内容类别。
其中,生成发布的内容的第一条件概率,是指在与附加内容类别对应的主题模型规定的多项式分布下生成该内容的概率。生成发布的内容的第一先验概率,是指根据经验分析得到该内容属于附加内容类别的概率。生成发布的内容的第二条件概率,是指在与社交内容类别对应的主题模型规定的多项式分布下生成该内容的概率。生成发布的内容的第二先验概率,是指根据经验分析得到该内容属于社交内容类别的概率。
具体地,终端可将主题模型用作类条件概率,根据下式预测内容可能所属的内容类别。
其中,表示预测的内容所属的内容类别,c表示内容类别,Normal表示社交内容类别,Ad表示附加内容类别。表示在内容类别c对应的主题模型的条件下生成内容的概率,p(c)表示内容属于内容类别c的先验概率。argmax是求取使得因变量取得最大值的自变量的函数。
那么,终端在根据与附加内容类别对应的主题模型,确定生成发布的内容的第一条件概率和第一先验概率,以及根据与社交内容类别对应的主题模型,确定生成发布的内容的第二条件概率和第二先验概率后,可计算每个主题模型下,生成内容的条件概率与先验概率的乘积,选取对应最大乘积的主题模型所对应的内容类别作为内容所属内容类别的预测结果。
在本实施例中,分别建立不同内容类别所对应的主题模型,在根据不同内容类别的主题模型生成内容的条件概率以及内容属于不同内容类别的先验概率为依据,预测内容可能所属的内容类别,提高了预测准确率。
在一个实施例中,根据各主题模型,确定与发布的内容对应的背景特征词集合,包括:根据与附加内容类别对应的主题模型,确定发布的内容所属的第一主题、及与第一主题对应的第一候选特征词集合;根据与社交内容类别对应的主题模型,确定发布的内容所属的第二主题、及与第二主题对应的第二候选特征词集合;对第一候选特征词集合和第二候选特征词集合求取交集,得到背景特征词集合。
具体地,基于主题模型,存在以下公式:
其中,tag表示特征词,tags表示内容,topic表示主题,p(tag|tags)表示内容中每个特征词的出现概率,p(tag|topic)表示各个主题下的特征词的出现概率,p(topic|tags)则表示各个内容中的主题的出现概率。
特征词是将内容分词后得到的具有语义表达功能的字符或者字符序列。对于给定的语料库D={d1,d2,...,dM}(M为内容总数),语料库包括的特征词组成的词汇表V={v1,v2,...,vN}(N为词总数),每个主题与词汇表V中的N个单词的一个多项式分布相对应。那么在某一主题下,根据相应的多项式分布,可以得到词汇表V中的N个单词各自的出现概率。这样,与第一主题对应的第一候选特征词集合,即将词汇表V中的N个单词按照出现概率降序排序,选取排序靠前的预设数量个特征词组成。
本实施例中,上述公式等式左边的p(tag|tags)是已知的,可直接通过统计内容中各个特征词的词频而获得,而p(tag|topic)和p(topic|tags)是未知的,主题模型就是用大量已知的p(tag|tags)经过一系列训练,推理出p(tag|topic)和p(topic|tags)。获得p(topic|tags)后,便可以将使得p(topic|tags)最大的主题作为内容所属主题。
进一步地,终端根据与附加内容类别对应的主题模型,确定发布的内容所属的第一主题后,获取第一主题下出现概率降序排序靠前的预设数量个特征词组成第一候选特征词集合candidateAd。并在根据与社交内容类别对应的主题模型,确定发布的内容所属的第二主题后,获取第二主题下的出现概率靠前的预设数量个特征词组成第二候选特征词集合candidateNomal。终端再对第一候选特征词集合和第二候选特征词集合求取交集,得到背景特征词集合background=candidateNomal∩candidateAd
在本实施例中,由于附加内容通常包含丰富的背景领域特征,涉及较多的主题,故通过生成背景特征词集合进行后续处理来消除背景领域的影响,提高内容所属内容类别的识别准确性。
进一步地,终端可再根据预测的内容类别所对应的主题模型,确定与发布的内容对应的候选特征词集合,及候选特征词集合中各特征词各自相应的第一权重。其中,第一权重是特征词在预测的内容类别所对应的主题模型下的权重,也就是在该主题模型所对应的词汇表中的出现概率。
终端继续对发布的内容进行分词得到目标特征词集合,并确定目标特征词集合中各特征词各自相应的第二权重。其中,终端对发布的内容分词后,可去除噪声数据(特殊符号)以及停用词等,将剩余的词作为特征词构成目标特征词集合。第二权重是特征词在内容中的权重,采用TF-IDF算法、词频(Term Frequency,TF)、逆文档频率(Inverse DocumentFrequency,IDF)计算,公式具体如下:
wij=tfij×idfj=tfij×In(M/nj) (3)
其中,wij为第二权重,tfij为特征词tj在内容di中的出现概率,idfj表示特征词tj的内容倒数,M为构建主题模型时采用的内容的总数,nj为出现特征词tj的内容的数量。
预设占比是预先设置的背景特征影响阈值,若背景特征词集合中特征词在候选特征词集合中占比不超过预设占比时,则认为背景特征词影响较小,无需更新候选特征词集合中特征词对应的第二权重。若背景特征词集合中特征词在候选特征词集合中占比大于预设占比时,则认为背景特征词影响较大,需要更新候选特征词集合中特征词对应的第二权重,以消除背景特征的影响。
具体地,当背景特征词集合中特征词在候选特征词集合中占比大于预设占比时,终端将存在于候选特征词集合中、且存在于背景特征词集合中的特征词的第一权重,由在预测的内容类别所属的主题模型下的权重,更新为两个主题模型下的权重之差的绝对值。
举例说明,假设内容对应的第一候选特征词集合为{A,B,C,D},第二候选特征词集合为{A,B,E,F,G,H,I,J,K,L,M,N},预设占比为1/5,那么背景特征词集合为{A,B}。假设预设内容属于附加内容类别,那么候选特征词集合为{A,B,C,D},A的第一权重为B的第一权重为此时背景特征词集合中特征词在候选特征词集合中占比大于预设占比,则将A的第一权重更新为将B的第一权重更新为假设预设内容属于社交内容类别,那么候选特征词集合为{A,B,E,F,G,H,I,J,K,L,M,N},此时背景特征词集合中特征词在候选特征词集合中占比小于预设占比,则不需要进行权重更新。
上述实施例中,在背景特征词影响大时,更新存在与背景特征词集合中的特征词的权重,以消除背景特征的影响,提高内容所属内容类别的识别准确性。
在一个实施例中,根据候选特征词集合中各特征词及各特征词的第一权重,及目标特征词集合中各特征词及各特征词的第二权重,确定发布的内容所属的内容类别,包括:对于存在于候选特征词集合中的特征词,将该特征词对应的第一权重作为该特征词的权重;对于不存在于候选特征词集合中、但存在于目标特征词集合中的特征词,将该特征词对应的第二权重作为该特征词的权重;根据候选特征词集合和目标特征词集合中各特征词的权重生成特征向量;将特征向量作为分类模型的输入,得到分类模型输出的发布的内容所属的内容类别。
其中,终端在对内容进行分词,得到目标特征词集合后,需要通过特征词来标识内容。终端可选择向量空间模型(VSM,Vector Space Model)来表示内容。举例说明,目标特征词集合中包括n个特征词,那么内容可标识为特征向量{w1,w2,…,wn},wn指第n个特征词在内容中的第二权重。特征向量是通过数学方式来表达文本的数据。
在本实施例中,终端可将候选特征词集合中的特征词以及相应的第一权重,扩展至内容的特征向量中。具体地,对于存在于候选特征词集合中、且存在于目标特征词集合中的特征词,将该特征词对应的第一权重作为该特征词的权重。对于存在于候选特征词集合中、但不存在于目标特征词集合中的特征词,将该特征词对应的第一权重作为该特征词的权重。对于不存在于候选特征词集合中、但存在于目标特征词集合中的特征词,将该特征词对应的第二权重作为该特征词的权重。再根据各特征词及相应的权重生成特征向量。
举例说明,假设内容对应的候选特征词集合为{A,B},A的第一权重为A1,B的第一权重为B1;内容对应的目标特征词集合为{B,C},B的第二权重为B2,C的第二权重为C2;那么,对于存在于候选特征词集合中、且存在于目标特征词集合中的特征词的B,以及存在于候选特征词集合中、但不存在于目标特征词集合中的特征词的A,均选取第一权重为权;对于不存在于候选特征词集合中、但存在于目标特征词集合中的特征词C,则选取第二权重作为的权重,得到特征向量{B1,C2,A1}。
其中,分类模型是经过训练后具有分类能力的机器学习模型。机器学习英文全称为Machine Learning,简称ML。机器学习模型可通过样本学习具备分类能力。机器学习模型可采用神经网络模型、支持向量机或者逻辑回归模型等。神经网络模型比如卷积神经网络、反向传播神经网络、反馈神经网络、径向基神经网络或者自组织神经网络等。
具体地,终端可将得到的特征向量作为分类模型的输入,通过分类模型输出该特征向量对应的内容所属的内容类别。
其中,分类模型的训练过程是有监督的训练过程。具体地,终端可将构建主题模型的语料库中的内容作为训练样本,由于这些训练样本已明确所属的内容类别,则不需再通过主题模型预测所属的内容类别,可直接将所属的内容类别作为训练标签进行有监督地训练。
具体地,终端根据各训练样本所属内容类别所对应的主题模型,确定各训练样本对应的候选特征词样本集合,及各特征词样本相应的第一权重样本。终端再对各训练样本进行分词,得到各训练样本所对应的目标特征词样本集合,及各特征词样本相应的第二权重样本。对于存在于候选特征词样本集合中的特征词样本,将该特征词样本对应的第一权重样本作为该特征词的权重样本;对于不存在于候选特征词样本集合中、但存在于目标特征词样本集合中的特征词样本,将该特征词样本对应的第二权重作为该特征词样本的权重样本;再根据候选特征词样本集合和目标特征词样本集合中的各特征词样本相应的权重样本生成特征向量样本,将特征向量样本作为分类模型的输入,根据特征向量样本相应的训练样本的训练标签训练分类模型,直至满足训练结束条件为止。
上述实施例中,基于主题模型对待识别的内容进行特征扩展,并在背景特征影响较大时,通过调整特征词的权重来降低背景特征的影响,这样消除了目前内容文本特征稀疏导致的识别率较低,以及背景特征影响等方面的不足,提高了内容所属内容类别的识别精度。
图7示出了一个实施例中内容展示方法的时序图。内容展示方法所应用的设备架构包括:第一终端、第二终端和服务器。其中,第一终端用于执行该内容展示方法。第一终端为第一用户标识登录的终端,第二终端为第二用户标识登录的终端。
具体地,第一终端获取通过第一用户标识发布的第一内容,确定第一内容所属内容类别的内容类别标识,将第一内容与内容类别标识对应上传至服务器。第二终端获取通过第二用户标识发布的第二内容,确定该第二内容所属内容类别的内容类别标识,将第二内容与内容类别标识对应上传至服务器。其中,第一终端与第二终端识别内容所属的内容类别通过的主题模型与分类模型可以是服务器统一训练完成后下发的。
第一终端显示与第一用户标识对应的用户社交页面,在相对于用户社交页面所在视图层的顶层视图层绘制内容筛选入口,并从服务器拉取与第一用户标识关联的内容。第一终端可检测作用于内容筛选入口的触发操作,在检测到触发操作时,判定接收到内容筛选指令,确定所述内容筛选指令所指定的内容类别,从与第一用户标识关联的内容中,筛选属于确定的内容类别的内容,在该用户社交页面中展示筛选出的内容。
第一终端可继续检测对于用户社交页面的页面滚动操作;根据页面滚动操作控制用户社交页面进行滚动;在控制用户社交页面滚动时,隐藏内容筛选入口。在结束控制用户社交页面滚动时,重新显示内容筛选入口。
其中,与第一用户标识关联的内容,包括通过第一用户标识发布的第一内容,当第一用户标识与第二用户标识存在好友关系,或者第二用户标识为第三方公众标识时,与第一用户标识关联的内容,还包括通过第二用户标识发布的第二内容。可以理解,第二终端也可用于执行该内容展示方法。
应该理解的是,虽然上述各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图8所示,在一个实施例中,提供了一种内容展示装置800。参照图8,该内容展示装置800包括:显示模块801、接收模块802、确定模块803、筛选模块804和展示模块805。
显示模块801,用于显示与登录的用户标识对应的用户社交页面;用户社交页面,用于展示与用户标识关联的内容。
接收模块802,用于接收对应于用户社交页面的内容筛选指令。
确定模块803,用于确定内容筛选指令所指定的内容类别;内容类别,包括附加内容类别和社交内容类别中的至少一种。
筛选模块804,用于从与用户标识关联的内容中,筛选属于内容类别的内容。
展示模块805,用于根据内容筛选指令在用户社交页面中展示筛选出的内容。
在一个实施例中,确定模块803还用于确定内容筛选指令所指定的指令类别。当指令类别为查看内容类别时,筛选模块804用于执行从与用户标识关联的内容中,筛选属于内容类别的内容;当指令类别为过滤内容类别时,筛选模块804用于从与用户标识关联的内容中,筛选不属于内容类别的内容。
在一个实施例中,接收模块802还用于在相对于用户社交页面所在视图层的顶层视图层绘制内容筛选入口;检测作用于内容筛选入口的触发操作;在检测到触发操作时,判定接收到内容筛选指令。
在一个实施例中,接收模块802还用于检测对于用户社交页面的页面滚动操作;根据页面滚动操作控制用户社交页面进行滚动;在控制用户社交页面滚动时,隐藏内容筛选入口。
在一个实施例中,筛选模块804还用于向服务器发起内容拉取请求;内容拉取请求用于请求拉取与用户标识关联的内容;接收服务器响应于内容拉取请求反馈的内容,以及与内容相应的内容类别标识;从接收到的内容中,筛选出相应的内容类别标识所标识的内容类别与确定的内容类别一致的内容。
如图9所示,在一个实施例中,内容展示装置800还包括上传模块806,用于获取通过用户标识发布的内容;识别发布的内容所属的内容类别;将发布的内容与识别得到的内容类别所对应的内容类别标识,对应上传至服务器。
在一个实施例中,上传模块806还用于通过各内容类别对应的主题模型,预测发布的内容所属内容类别;根据各主题模型,确定与发布的内容对应的背景特征词集合;通过预测的内容类别所对应的主题模型,生成与发布的内容对应的候选特征词集合,及候选特征词集合中各特征词的第一权重;对发布的内容分词以构建目标特征词集合,并确定目标特征词集合中各特征词的第二权重;当背景特征词集合中特征词在候选特征词集合中占比大于预设占比时,更新存在于候选特征词集合中、且存在于背景特征词集合中的特征词的第一权重;根据候选特征词集合中各特征词及各特征词的第一权重,及目标特征词集合中各特征词及各特征词的第二权重,确定发布的内容所属的内容类别。
在一个实施例中,上传模块806还用于根据与附加内容类别对应的主题模型,确定在与附加内容类别对应的主题模型下生成发布的内容的第一条件概率和第一先验概率;根据与社交内容类别对应的主题模型,确定在与社交内容类别对应的主题模型生成发布的内容的第二条件概率和第二先验概率;当第一条件概率与第一先验概率的乘积大于第二条件概率与第二先验概率的乘积时,则预测附加内容类别为发布的内容所属的内容类别;当第一条件概率与第一先验概率的乘积小于第二条件概率与第二先验概率的乘积时,则预测社交内容类别为发布的内容所属的内容类别。
在一个实施例中,上传模块806还用于根据与附加内容类别对应的主题模型,确定发布的内容所属的第一主题、及与第一主题对应的第一候选特征词集合;根据与社交内容类别对应的主题模型,确定发布的内容所属的第二主题、及与第二主题对应的第二候选特征词集合;对第一候选特征词集合和第二候选特征词集合求取交集,得到背景特征词集合。
在一个实施例中,上传模块806还用于对于存在于候选特征词集合中的特征词,将该特征词对应的第一权重作为该特征词的权重;对于不存在于候选特征词集合中、但存在于目标特征词集合中的特征词,将该特征词对应的第二权重作为该特征词的权重;根据候选特征词集合和目标特征词集合中各特征词的权重生成特征向量;将特征向量作为分类模型的输入,得到分类模型输出的发布的内容所属的内容类别。
图10示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110。如图10所示,该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入设备和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现内容展示方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行内容展示方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏等,输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,也可以是外接的键盘、触控板或鼠标等。本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的内容展示装置可以实现为一种计算机程序的形式,计算机程序可在如图10所示的计算机设备上运行,计算机设备的非易失性存储介质可存储组成该内容展示装置的各个程序模块,比如,图8所示的显示模块801、接收模块802、确定模块803、筛选模块804和展示模块805等。各个程序模块组成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的内容展示方法中的步骤。
例如,图10所示的计算机设备可以通过如图8所示的内容展示装置800中的显示模块801显示与登录的用户标识对应的用户社交页面;用户社交页面,用于展示与用户标识关联的内容。通过接收模块802接收对应于用户社交页面的内容筛选指令。通过确定模块803确定内容筛选指令所指定的内容类别;内容类别,包括附加内容类别和社交内容类别中的至少一种。通过筛选模块804从与用户标识关联的内容中,筛选属于内容类别的内容。通过展示模块805根据内容筛选指令在用户社交页面中展示筛选出的内容。
在一个实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时,使得处理器执行以下步骤:显示与登录的用户标识对应的用户社交页面;用户社交页面,用于展示与用户标识关联的内容;接收对应于用户社交页面的内容筛选指令;确定内容筛选指令所指定的内容类别;内容类别,包括附加内容类别和社交内容类别中的至少一种;从与用户标识关联的内容中,筛选属于内容类别的内容;根据内容筛选指令在用户社交页面中展示筛选出的内容。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:确定内容筛选指令所指定的指令类别;当指令类别为查看内容类别时,则执行从与用户标识关联的内容中,筛选属于内容类别的内容的步骤;当指令类别为过滤内容类别时,则从与用户标识关联的内容中,筛选不属于内容类别的内容。
在一个实施例中,接收对应于用户社交页面的内容筛选指令,包括:在相对于用户社交页面所在视图层的顶层视图层绘制内容筛选入口;检测作用于内容筛选入口的触发操作;在检测到触发操作时,判定接收到内容筛选指令。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:检测对于用户社交页面的页面滚动操作;根据页面滚动操作控制用户社交页面进行滚动;在控制用户社交页面滚动时,隐藏内容筛选入口。
在一个实施例中,从与用户标识关联的内容中,筛选属于内容类别的内容,包括:向服务器发起内容拉取请求;内容拉取请求用于请求拉取与用户标识关联的内容;接收服务器响应于内容拉取请求反馈的内容,以及与内容相应的内容类别标识;从接收到的内容中,筛选出相应的内容类别标识所标识的内容类别与确定的内容类别一致的内容。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:获取通过用户标识发布的内容;识别发布的内容所属的内容类别;将发布的内容与识别得到的内容类别所对应的内容类别标识,对应上传至服务器。
在一个实施例中,识别发布的内容所属的内容类别,包括:通过各内容类别对应的主题模型,预测发布的内容所属内容类别;根据各主题模型,确定与发布的内容对应的背景特征词集合;通过预测的内容类别所对应的主题模型,生成与发布的内容对应的候选特征词集合,及候选特征词集合中各特征词的第一权重;对发布的内容分词以构建目标特征词集合,并确定目标特征词集合中各特征词的第二权重;当背景特征词集合中特征词在候选特征词集合中占比大于预设占比时,更新存在于候选特征词集合中、且存在于背景特征词集合中的特征词的第一权重;根据候选特征词集合中各特征词及各特征词的第一权重,及目标特征词集合中各特征词及各特征词的第二权重,确定发布的内容所属的内容类别。
在一个实施例中,通过各内容类别对应的主题模型,预测发布的内容所属内容类别,包括:根据与附加内容类别对应的主题模型,确定在与附加内容类别对应的主题模型下生成发布的内容的第一条件概率和第一先验概率;根据与社交内容类别对应的主题模型,确定在与社交内容类别对应的主题模型生成发布的内容的第二条件概率和第二先验概率;当第一条件概率与第一先验概率的乘积大于第二条件概率与第二先验概率的乘积时,则预测附加内容类别为发布的内容所属的内容类别;当第一条件概率与第一先验概率的乘积小于第二条件概率与第二先验概率的乘积时,则预测社交内容类别为发布的内容所属的内容类别。
在一个实施例中,根据各主题模型,确定与发布的内容对应的背景特征词集合,包括:根据与附加内容类别对应的主题模型,确定发布的内容所属的第一主题、及与第一主题对应的第一候选特征词集合;根据与社交内容类别对应的主题模型,确定发布的内容所属的第二主题、及与第二主题对应的第二候选特征词集合;对第一候选特征词集合和第二候选特征词集合求取交集,得到背景特征词集合。
在一个实施例中,根据候选特征词集合中各特征词及各特征词的第一权重,及目标特征词集合中各特征词及各特征词的第二权重,确定发布的内容所属的内容类别,包括:对于存在于候选特征词集合中的特征词,将该特征词对应的第一权重作为该特征词的权重;对于不存在于候选特征词集合中、但存在于目标特征词集合中的特征词,将该特征词对应的第二权重作为该特征词的权重;根据候选特征词集合和目标特征词集合中各特征词的权重生成特征向量;将特征向量作为分类模型的输入,得到分类模型输出的发布的内容所属的内容类别。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中储存有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:显示与登录的用户标识对应的用户社交页面;用户社交页面,用于展示与用户标识关联的内容;接收对应于用户社交页面的内容筛选指令;确定内容筛选指令所指定的内容类别;内容类别,包括附加内容类别和社交内容类别中的至少一种;从与用户标识关联的内容中,筛选属于内容类别的内容;根据内容筛选指令在用户社交页面中展示筛选出的内容。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:确定内容筛选指令所指定的指令类别;当指令类别为查看内容类别时,则执行从与用户标识关联的内容中,筛选属于内容类别的内容的步骤;当指令类别为过滤内容类别时,则从与用户标识关联的内容中,筛选不属于内容类别的内容。
在一个实施例中,接收对应于用户社交页面的内容筛选指令,包括:在相对于用户社交页面所在视图层的顶层视图层绘制内容筛选入口;检测作用于内容筛选入口的触发操作;在检测到触发操作时,判定接收到内容筛选指令。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:检测对于用户社交页面的页面滚动操作;根据页面滚动操作控制用户社交页面进行滚动;在控制用户社交页面滚动时,隐藏内容筛选入口。
在一个实施例中,从与用户标识关联的内容中,筛选属于内容类别的内容,包括:向服务器发起内容拉取请求;内容拉取请求用于请求拉取与用户标识关联的内容;接收服务器响应于内容拉取请求反馈的内容,以及与内容相应的内容类别标识;从接收到的内容中,筛选出相应的内容类别标识所标识的内容类别与确定的内容类别一致的内容。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:获取通过用户标识发布的内容;识别发布的内容所属的内容类别;将发布的内容与识别得到的内容类别所对应的内容类别标识,对应上传至服务器。
在一个实施例中,识别发布的内容所属的内容类别,包括:通过各内容类别对应的主题模型,预测发布的内容所属内容类别;根据各主题模型,确定与发布的内容对应的背景特征词集合;通过预测的内容类别所对应的主题模型,生成与发布的内容对应的候选特征词集合,及候选特征词集合中各特征词的第一权重;对发布的内容分词以构建目标特征词集合,并确定目标特征词集合中各特征词的第二权重;当背景特征词集合中特征词在候选特征词集合中占比大于预设占比时,更新存在于候选特征词集合中、且存在于背景特征词集合中的特征词的第一权重;根据候选特征词集合中各特征词及各特征词的第一权重,及目标特征词集合中各特征词及各特征词的第二权重,确定发布的内容所属的内容类别。
在一个实施例中,通过各内容类别对应的主题模型,预测发布的内容所属内容类别,包括:根据与附加内容类别对应的主题模型,确定在与附加内容类别对应的主题模型下生成发布的内容的第一条件概率和第一先验概率;根据与社交内容类别对应的主题模型,确定在与社交内容类别对应的主题模型生成发布的内容的第二条件概率和第二先验概率;当第一条件概率与第一先验概率的乘积大于第二条件概率与第二先验概率的乘积时,则预测附加内容类别为发布的内容所属的内容类别;当第一条件概率与第一先验概率的乘积小于第二条件概率与第二先验概率的乘积时,则预测社交内容类别为发布的内容所属的内容类别。
在一个实施例中,根据各主题模型,确定与发布的内容对应的背景特征词集合,包括:根据与附加内容类别对应的主题模型,确定发布的内容所属的第一主题、及与第一主题对应的第一候选特征词集合;根据与社交内容类别对应的主题模型,确定发布的内容所属的第二主题、及与第二主题对应的第二候选特征词集合;对第一候选特征词集合和第二候选特征词集合求取交集,得到背景特征词集合。
在一个实施例中,根据候选特征词集合中各特征词及各特征词的第一权重,及目标特征词集合中各特征词及各特征词的第二权重,确定发布的内容所属的内容类别,包括:对于存在于候选特征词集合中的特征词,将该特征词对应的第一权重作为该特征词的权重;对于不存在于候选特征词集合中、但存在于目标特征词集合中的特征词,将该特征词对应的第二权重作为该特征词的权重;根据候选特征词集合和目标特征词集合中各特征词的权重生成特征向量;将特征向量作为分类模型的输入,得到分类模型输出的发布的内容所属的内容类别。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种内容展示方法,包括:
显示与登录的用户标识对应的用户社交页面;所述用户社交页面,用于展示与所述用户标识关联的内容;
接收对应于所述用户社交页面的内容筛选指令;
确定所述内容筛选指令所指定的内容类别;所述内容类别,包括社交内容类别和附加内容类别中的至少一种;
从与所述用户标识关联的内容中,筛选属于确定的所述内容类别的内容;
根据所述内容筛选指令在所述用户社交页面中展示筛选出的所述内容。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述内容筛选指令所指定的指令类别;
当所述指令类别为查看内容类别时,则执行所述从与所述用户标识关联的内容中,筛选属于所述内容类别的内容的步骤;
当所述指令类别为过滤内容类别时,则从与所述用户标识关联的内容中,筛选不属于所述内容类别的内容。
3.根据权利要求1所述的方法,其特征在于,所述接收对应于所述用户社交页面的内容筛选指令,包括:
在相对于所述用户社交页面所在视图层的顶层视图层绘制内容筛选入口;
检测作用于所述内容筛选入口的触发操作;
在检测到所述触发操作时,判定接收到内容筛选指令。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
检测对于所述用户社交页面的页面滚动操作;
根据所述页面滚动操作控制所述用户社交页面进行滚动;
在控制所述用户社交页面滚动时,隐藏所述内容筛选入口。
5.根据权利要求1所述的方法,其特征在于,所述从与所述用户标识关联的内容中,筛选属于确定的所述内容类别的内容,包括:
向服务器发起内容拉取请求;所述内容拉取请求用于请求拉取与所述用户标识关联的内容;
接收所述服务器响应于所述内容拉取请求反馈的内容,以及与所述内容相应的内容类别标识;
从接收到的所述内容中,筛选出相应的内容类别标识所标识的内容类别与确定的所述内容类别一致的内容。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述方法还包括:
获取通过所述用户标识发布的内容;
识别所述发布的内容所属的内容类别;
将所述发布的内容与识别得到的内容类别所对应的内容类别标识,对应上传至服务器。
7.根据权利要求6所述的方法,其特征在于,所述识别所述发布的内容所属的内容类别,包括:
通过各内容类别对应的主题模型,预测所述发布的内容所属内容类别;
根据各所述主题模型,确定与所述发布的内容对应的背景特征词集合;
通过预测的所述内容类别所对应的主题模型,生成与发布的内容对应的候选特征词集合,及所述候选特征词集合中各特征词的第一权重;
对所述发布的内容分词以构建目标特征词集合,并确定所述目标特征词集合中各特征词的第二权重;
当背景特征词集合中特征词在候选特征词集合中占比大于预设占比时,更新存在于候选特征词集合中、且存在于背景特征词集合中的特征词的第一权重;
根据候选特征词集合中各特征词及各特征词的第一权重,及目标特征词集合中各特征词及各特征词的第二权重,确定发布的内容所属的内容类别。
8.根据权利要求7所述的方法,其特征在于,所述通过各内容类别对应的主题模型,预测所述发布的内容所属内容类别,包括:
根据与附加内容类别对应的主题模型,确定在与附加内容类别对应的主题模型下生成所述发布的内容的第一条件概率和第一先验概率;
根据与社交内容类别对应的主题模型,确定在与社交内容类别对应的主题模型生成所述发布的内容的第二条件概率和第二先验概率;
当第一条件概率与第一先验概率的乘积大于第二条件概率与第二先验概率的乘积时,则预测附加内容类别为所述发布的内容所属的内容类别;
当第一条件概率与第一先验概率的乘积小于第二条件概率与第二先验概率的乘积时,则预测社交内容类别为所述发布的内容所属的内容类别。
9.根据权利要求7所述的方法,其特征在于,所述根据各所述主题模型,确定与所述发布的内容对应的背景特征词集合,包括:
根据与附加内容类别对应的主题模型,确定所述发布的内容所属的第一主题、及与所述第一主题对应的第一候选特征词集合;
根据与社交内容类别对应的主题模型,确定所述发布的内容所属的第二主题、及与所述第二主题对应的第二候选特征词集合;
对所述第一候选特征词集合和所述第二候选特征词集合求取交集,得到背景特征词集合。
10.根据权利要求7所述的方法,其特征在于,所述根据候选特征词集合中各特征词及各特征词的第一权重,及目标特征词集合中各特征词及各特征词的第二权重,确定发布的内容所属的内容类别,包括:
对于存在于所述候选特征词集合中的特征词,将该特征词对应的第一权重作为该特征词的权重;
对于不存在于所述候选特征词集合中、但存在于所述目标特征词集合中的特征词,将该特征词对应的第二权重作为该特征词的权重;
根据候选特征词集合和目标特征词集合中各特征词的权重生成特征向量;
将所述特征向量作为分类模型的输入,得到所述分类模型输出的所述发布的内容所属的内容类别。
11.一种内容展示装置,包括:
显示模块,用于显示与登录的用户标识对应的用户社交页面;所述用户社交页面,用于展示与所述用户标识关联的内容;
接收模块,用于接收对应于所述用户社交页面的内容筛选指令;
确定模块,用于确定所述内容筛选指令所指定的内容类别;所述内容类别,包括社交内容类别和附加内容类别中的至少一种;
筛选模块,用于从与所述用户标识关联的内容中,筛选属于确定的所述内容类别的内容;
展示模块,用于根据所述内容筛选指令在所述用户社交页面中展示筛选出的内容。
12.根据权利要求11所述的装置,其特征在于,所述接收模块还用于在相对于所述用户社交页面所在视图层的顶层视图层绘制内容筛选入口;检测作用于所述内容筛选入口的触发操作;在检测到所述触发操作时,判定接收到内容筛选指令。
13.根据权利要求10所述的装置,其特征在于,所述装置还包括:
上传模块,用于获取通过所述用户标识发布的内容;识别所述发布的内容所属的内容类别;将所述发布的内容与识别得到的内容类别所对应的内容类别标识,对应上传至服务器。
14.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至10中任一项所述的方法的步骤。
15.一种计算机设备,包括存储器和处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至10中任一项所述的方法的步骤。
CN201810284403.1A 2018-04-02 2018-04-02 一种内容展示方法、装置、存储介质和计算机设备 Active CN110347314B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810284403.1A CN110347314B (zh) 2018-04-02 2018-04-02 一种内容展示方法、装置、存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810284403.1A CN110347314B (zh) 2018-04-02 2018-04-02 一种内容展示方法、装置、存储介质和计算机设备

Publications (2)

Publication Number Publication Date
CN110347314A true CN110347314A (zh) 2019-10-18
CN110347314B CN110347314B (zh) 2022-02-01

Family

ID=68173526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810284403.1A Active CN110347314B (zh) 2018-04-02 2018-04-02 一种内容展示方法、装置、存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN110347314B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364219A (zh) * 2020-10-26 2021-02-12 北京五八信息技术有限公司 内容发布方法、装置、电子设备及存储介质
CN112418294A (zh) * 2020-11-18 2021-02-26 青岛海尔科技有限公司 确定帐号类别的方法、装置、存储介质及电子装置
CN112506357A (zh) * 2020-12-09 2021-03-16 深圳市联谛信息无障碍有限责任公司 输入方法、电子设备和非易失性计算机可读存储介质
CN112800273A (zh) * 2021-02-05 2021-05-14 北京字节跳动网络技术有限公司 一种页面内容展示方法及终端设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015062377A1 (zh) * 2013-11-04 2015-05-07 北京奇虎科技有限公司 一种相似文本检测装置、方法以及应用
CN106126530A (zh) * 2016-06-15 2016-11-16 腾讯科技(深圳)有限公司 一种消息内容展示方法、系统及终端
CN106682008A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 朋友圈信息分类方法和装置
CN106777028A (zh) * 2016-12-08 2017-05-31 北京奇虎科技有限公司 一种基于即时通讯软件的信息筛选方法及装置
CN107688429A (zh) * 2017-08-31 2018-02-13 努比亚技术有限公司 应用控件的管理方法、移动终端和计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015062377A1 (zh) * 2013-11-04 2015-05-07 北京奇虎科技有限公司 一种相似文本检测装置、方法以及应用
CN106682008A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 朋友圈信息分类方法和装置
CN106126530A (zh) * 2016-06-15 2016-11-16 腾讯科技(深圳)有限公司 一种消息内容展示方法、系统及终端
CN106777028A (zh) * 2016-12-08 2017-05-31 北京奇虎科技有限公司 一种基于即时通讯软件的信息筛选方法及装置
CN107688429A (zh) * 2017-08-31 2018-02-13 努比亚技术有限公司 应用控件的管理方法、移动终端和计算机可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364219A (zh) * 2020-10-26 2021-02-12 北京五八信息技术有限公司 内容发布方法、装置、电子设备及存储介质
CN112418294A (zh) * 2020-11-18 2021-02-26 青岛海尔科技有限公司 确定帐号类别的方法、装置、存储介质及电子装置
CN112506357A (zh) * 2020-12-09 2021-03-16 深圳市联谛信息无障碍有限责任公司 输入方法、电子设备和非易失性计算机可读存储介质
CN112800273A (zh) * 2021-02-05 2021-05-14 北京字节跳动网络技术有限公司 一种页面内容展示方法及终端设备

Also Published As

Publication number Publication date
CN110347314B (zh) 2022-02-01

Similar Documents

Publication Publication Date Title
Medvedev et al. The anatomy of Reddit: An overview of academic research
US11093971B2 (en) Contextual discovery
US10685186B2 (en) Semantic understanding based emoji input method and device
CN105378727B (zh) 将逆算子用于在在线社交网络上查询
US20150178265A1 (en) Content Recommendation System using a Neural Network Language Model
CN110892395A (zh) 提供增强的通信会话服务的虚拟助手
CN109791680A (zh) 在线社交网络上的视频关键帧显示
EP3336776B1 (en) Method and system for classifying user processes and providing security clearance
CN107851092A (zh) 个人实体建模
US20170185601A1 (en) Identifying Content for Users on Online Social Networks
CN110347314A (zh) 一种内容展示方法、装置、存储介质和计算机设备
JP2018501584A (ja) オンライン・ソーシャル・ネットワーク上でニュース関連のコンテンツを検索するための提案キーワード
WO2014150101A1 (en) Personalized community model for surfacing commands within productivity application user interfaces
MX2015006040A (es) Modelo de gramatica para consultas de busqueda estructuradas.
CN107562939A (zh) 垂直领域新闻推荐方法、装置及可读储存介质
JP2017527881A (ja) エモティコンを識別および提案するためのシステムおよび方法
CN103473036B (zh) 一种输入法皮肤推送方法及系统
CN108804133A (zh) 虚拟资源的获取方法、系统、计算机设备和存储介质
US20210256221A1 (en) System and method for automatic summarization of content with event based analysis
CN111522940A (zh) 用于处理评论信息的方法和装置
CN112148952A (zh) 一种任务执行方法、装置、设备及计算机可读存储介质
CN107944026A (zh) 一种图集个性化推荐的方法、装置、服务器和存储介质
CN111552835A (zh) 文件推荐方法、装置及服务器
Nirmala et al. Twitter data analysis for unemployment crisis
CN111506718A (zh) 会话消息确定方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant