CN104809109A - 一种社交信息展示方法、装置及服务器 - Google Patents
一种社交信息展示方法、装置及服务器 Download PDFInfo
- Publication number
- CN104809109A CN104809109A CN201410030676.5A CN201410030676A CN104809109A CN 104809109 A CN104809109 A CN 104809109A CN 201410030676 A CN201410030676 A CN 201410030676A CN 104809109 A CN104809109 A CN 104809109A
- Authority
- CN
- China
- Prior art keywords
- information
- probable value
- social
- participle
- social information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种社交信息展示方法、装置及服务器,其中方法包括:获取所发布的社交信息,对所述社交信息进行分词操作,得到多个分词字符;根据预设的分词字符与各信息类别的概率对应关系,确定分词操作所得到的各分词字符与各信息类别的概率值;根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息类别的概率值;将所计算的概率值最大的信息类别确定为所述社交信息所属的信息类别;将所述社交信息归属到所述概率值最大的信息类别中进行展示。本发明实施例可按照信息类别,将社交信息归属到所属的信息类别中进行展示,从而使得用户可通过信息类别便捷的查找到自己感兴趣的社交信息。
Description
技术领域
本发明涉及网络信息处理技术领域,更具体地说,涉及一种社交信息展示方法、装置及服务器。
背景技术
社交网络(微博、QQ空间、人人网等)作为一种新兴的网络社交交互系统正在飞速的发展,用户越来越多,每天发布的社交信息(如用户发布的微博,用户发布的QQ空间状态,用户发布的人人网状态等)也日益增多。
社交网络的用户会收听大量其他用户发布的信息,如QQ空间的用户会收听好友所发布的QQ空间状态,微博用户会收听所关注的用户的微博消息等。目前向用户所展示的社交信息主要是以如下方式进行的:服务器按照社交网络的用户所关注的其他用户发布社交信息的时间先后顺序,对用户所关注的其他用户发布的社交信息进行排序,将社交信息按照发布时间的顺序展示给用户。
本发明的发明人在研究和实践过程中发现,现有技术至少存在以下的技术问题:现有的社交信息展示方式是按照发布时间的顺序进行展示的,那么展示给用户的社交信息是最新发布的,会忽略掉之前发布的社交信息,使得用户从所展示的社交信息中查找自己感兴趣的社交信息较为麻烦。
发明内容
有鉴于此,本发明实施例提供一种社交信息展示方法、装置及服务器,以解决按照发布时间的顺序来展示社交信息的方式所带来的用户查找自己感兴趣的社交信息较为麻烦的问题。
为实现上述目的,本发明实施例提供如下技术方案:
一种社交信息展示方法,包括:
获取所发布的社交信息,对所述社交信息进行分词操作,得到多个分词字符;
根据预设的分词字符与各信息类别的概率对应关系,确定分词操作所得到的各分词字符与各信息类别的概率值;
根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息类别的概率值;
将所计算的概率值最大的信息类别确定为所述社交信息所属的信息类别;
将所述社交信息归属到所述概率值最大的信息类别中进行展示。
本发明实施例还提供一种社交信息展示装置,包括:
概率对应关系预设模块,用于预设分词字符与各信息类别的概率对应关系;
获取模块,用于获取所发布的社交信息;
第一分词模块,用于对所述社交信息进行分词操作,得到多个分词字符;
第一概率值确定模块,用于根据预设的分词字符与各信息类别的概率对应关系,确定分词操作所得到的各分词字符与各信息类别的概率值;
第二概率值确定模块,用于根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息类别的概率值;
信息类别确定模块,用于将所述第二概率值确定模块所计算的概率值最大的信息类别确定为所述社交信息所属的信息类别;
展示模块,用于将所述社交信息归属到所述概率值最大的信息类别中进行展示。
本发明实施例还提供一种服务器,包括上述所述的社交信息展示装置。
基于上述技术方案,本发明实施例提供的社交信息展示方法可将社交信息进行分词操作后,根据预设的分词字符与各信息类别的概率对应关系,确定分词操作所得到的各分词字符与各信息类别的概率值,根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息类别的概率值,将社交信息归属到概率值最大的信息类别中进行展示,从而实现了社交信息的分类展示。相比于现有按照发布时间的顺序展示社交信息的方式,本发明实施例可按照信息类别,将社交信息归属到所属的信息类别中进行展示,从而使得用户可通过信息类别便捷的查找到自己感兴趣的社交信息,解决了用户查找自己感兴趣的社交信息较为麻烦的问题,并使得社交信息的展示具有明确的分类,使得社交信息的展示更为直观。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的社交信息展示方法的流程图;
图2为本发明实施例提供的确定预设的分词字符与各信息类别的概率对应关系的方法流程图;
图3为本发明实施例提供的确定多条社交信息对应的分词字符与各信息类别的所属概率值的方法流程图;
图4为本发明实施例提供的社交信息展示装置的结构框图;
图5为本发明实施例提供的概率对应关系预设模块的结构框图;
图6为本发明实施例提供的概率值确定单元的结构框图;
图7为本发明实施例提供的第二概率值确定模块的结构框图;
图8为本发明实施例提供的第一分词模块的结构框图;
图9为本发明实施例提供的服务器的硬件结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的社交信息展示方法的流程图,该社交信息展示方法可应用于服务器端,服务器可用于收集用户所发布的社交信息,并将所收集的社交信息通过终端设备展示给注册用户,参照图1,该方法可以包括:
步骤S100、获取所发布的社交信息,对所述社交信息进行分词操作,得到多个分词字符;
所发布的社交信息可以是用户所关注的其他用户所发布的信息,如QQ用户的好友所发布的QQ空间状态信息;可选的,服务器可定时的获取用户所发布的社交信息,如可每隔预设时间获取一次用户发布的社交信息;可选的,服务器也可获取自注册用户上次退出社交应用(如QQ空间应用)到本次登陆社交应用的这段时间之内,注册用户所关注的其他用户所发布的信息。
可选的,对所述社交信息进行分词操作的方式可以是:按照一定的分词规则将连续的字序列重新组合成词序列;如按照分词库中的字词,将连续的字序列进行分词;如还可以按照语法将连续的字序列进行分词;在重新组合成词序列后,可从词序列中去除单个字和一些常用词,得到最终的分词结果。如社交信息为:“【最守规矩的星座排行】冠军(处女座)、亚军(摩羯座)、季军(金牛座)、第4名(巨蟹座)、第5名(双鱼座)、第6名(天秤座)、第7名(天蝎座)、第8名(双子座)、第9名(水瓶座)、第10名(狮子座)、第11名(白羊座)、第12名(射手座)”。通过分词操作,可得到分词结果:“规矩星座排行冠军处女亚军摩羯座季军金牛巨蟹座双鱼座天秤座天蝎座双子座水瓶座狮子座白羊座射手”。
步骤S110、根据预设的分词字符与各信息类别的概率对应关系,确定分词操作所得到的各分词字符与各信息类别的概率值;
本发明实施例可预先设置分词字符与各信息类别的概率对应关系;信息类别可预先的设定,如可利用现有的社交网络频道类别(美女、搞笑、语录、时尚、杂谈、资讯、明星、动漫、设计、生活等);概率对应关系表示的是不同的分词字符与每个信息类别的所属概率值;以分词字符为“刘德华”,信息类别为“明星”,“生活”这两类为例,则概率对应关系中将记录“刘德华”这一分词字符属于明星这一信息类别的概率值,及“刘德华”属于“生活”这一信息类别的概率值;
在步骤S100得到社交信息的各分词字符后,可通过预设的概率对应关系,确定各分词字符与各信息类别的概率值;如分词字符为“刘德华”,信息类别为“明星”,“生活”这两类,则可从预设的概率对应关系中得到“刘德华”属于明星这一信息类别的概率值,及属于“生活”这一信息类别的概率值,多个分词字符,多个信息类别的情况可同理类推。
步骤S120、根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息类别的概率值;
步骤S130、将所计算的概率值最大的信息类别确定为所述社交信息所属的信息类别;
步骤S140、将所述社交信息归属到所述概率值最大的信息类别中进行展示。
本发明实施例提供的社交信息展示方法可将社交信息进行分词操作后,根据预设的分词字符与各信息类别的概率对应关系,确定分词操作所得到的各分词字符与各信息类别的概率值,根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息类别的概率值,将社交信息归属到概率值最大的信息类别中进行展示,从而实现了社交信息的分类展示。相比于现有按照发布时间的顺序展示社交信息的方式,本发明实施例可按照信息类别,将社交信息归属到所属的信息类别中进行展示,从而使得用户可通过信息类别便捷的查找到自己感兴趣的社交信息,解决了用户查找自己感兴趣的社交信息较为麻烦的问题,并使得社交信息的展示具有明确的分类,使得社交信息的展示更为直观。
可选的,各信息类别下的社交信息可按照发布时间的顺序进行排序。
可选的,图2示出了确定预设的分词字符与各信息类别的概率对应关系的一种可选实现方法,参照图2,该确定方法可以包括:
步骤S200、选择多条社交信息,对所选择的各条社交信息所属的信息类别进行预先判定;
可选的,本发明实施例可随机的选择多条(如几万条)社交信息作为训练集,通过人工的方式对所选择的各条社交信息所属的信息类别进行预先判定;可选的,服务器可在人工判断完成后,接收包含判断结果的信息,从而对所选择的各条社交信息所属的信息类别完成预先判定。
步骤S210、对所选择的各条社交信息进行分词操作,得到多个分词字符;
可选的,可对所选取的各条社交信息分别进行分词操作,得到各条社交信息对应的分词字符,从而得到多个分词字符。
步骤S220、通过预先判定的各条社交信息所属的信息类别,确定所述多条社交信息对应的分词字符与各信息类别的所属概率值,通过所述所属概率值确定分词字符与各信息类别的概率对应关系。
可选的,可通过哈希表记录分词字符与各信息类别的概率对应关系。
如社交信息有两条,社交信息1和社交信息2,其中社交信息1属于类别1,社交信息2属于类别2;社交信息1具有分词字符:字符1,字符2;社交信息2具有分词字符:字符3和字符4。则通过社交信息1属于类别1的预先判定,本发明实施例可计算出字符1,字符2,字符3和字符4,与类别1所属的概率值;及通过社交信息2属于类别2的预先判定,本发明实施例可计算出字符1,字符2,字符3和字符4,与类别2所属的概率值。
可选的,步骤S220中通过预先判定的各条社交信息所属的信息类别,确定多条社交信息对应的分词字符与各信息类别的所属概率值可通过图3所示方法实现,图3为本发明实施例提供的确定多条社交信息对应的分词字符与各信息类别的所属概率值的方法流程图,参照图3,该方法可以包括:
步骤S300、对于第一信息类别,若第一信息类别所属的社交信息的第一分词字符不在其他信息类别所属的社交信息中出现,则确定第一分词字符与第一信息类别的所属概率值为1;
可选的,第一信息类别可以是预定信息类别中的任一类别,其他信息类别是指预定信息类别中的非第一信息类别的信息类别,第一分词字符是指第一信息类别所属的社交信息中的任一分词字符。
步骤S310、对于第一信息类别,若第一信息类别所属的社交信息的第一分词字符,在其他信息类别所属的社交信息中出现,则将第一信息类别所属的社交信息的分词字符数的倒数作为第一概率值,将第一概率值,除以,该其他信息类别所属的社交信息的分词字符数的倒数和第一概率值的和,得到第二概率值,将第二概率值确定为第一分词字符与第一信息类别的所属概率值;
步骤S320、对于第一信息类别,若第一信息类别所不属的社交信息的第二分词字符,不在第一信息类别所属的社交信息中出现,则确定第二分词字符与第一信息类别的所属概率值为零。
第二分词字符是指第一信息类别所不属的社交信息中的任一分词字符。
通过图3所示方法可计算出所有的信息类别下,各分词字符的所属概率。
对应的,步骤S120根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息类别的概率值的实现方式可以是:将所述社交信息的各分词字符属于第一信息类别的概率值的乘积,除以,各分词字符属于其他信息类别的概率值的乘积和各分词字符属于第一信息类别的概率值的乘积的和,将所得到的值作为所述社交信息与第一信息类别的概率值。循环的执行这种实现方式,可得到社交信息与各信息类别的概率值。
为便于理解本发明实施例提供的社交信息展示方法,下面假设信息类别具有星座C1和非星座NC1这两类,社交信息具有两条,分别为社交信息1:“【心地最纯的星座】冠军(双鱼座)、亚军(天秤座)、季军(射手座)、第四名(巨蟹座)”;社交信息2:“我跑步得冠军喽”。社交信息1的分词结果为:“心地星座冠军双鱼座亚军天秤座季军射手巨蟹座”;社交信息2的分词结果为:“跑步冠军”。通过预先判定后,可确定社交信息1属于星座C1这一信息类别,社交信息2属于非星座NC1这一信息类别。
对于星座C1类别而言,社交信息2并不属于星座C1类别,由于社交信息2具有“跑步”和“冠军”两个分词字符,而分词字符“冠军”在属于星座C1类别的社交信息1中出现,因此对于“冠军”字符而言,可将社交信息1的分词字符数的倒数(1/9=0.11)作为第一概率值,将第一概率值,除以社交信息2的分词字符数的倒数(1/2=0.5)和第一概率值的和,即0.11/(0.11+0.5)=0.1692,得出第二概率值0.1692,第二概率值0.1692为“冠军”字符与星座C1类别的所属概率值;对于社交信息1中的其他分词字符“心地星座双鱼座亚军天秤座季军射手巨蟹座”由于不在非星座NC1类别所属的社交信息2中出现,而只在星座C1类别所属的社交信息1中出现,因此可确定“心地星座双鱼座亚军天秤座季军射手巨蟹座”这些字符与星座C1类别的所属概率值为1;由于社交信息2的分词字符“跑步”只在非星座NC1类别所属的社交信息2中出现,而不在星座C1类别所属的社交信息1中出现,因此可确定“跑步”与星座C1类别的所属概率值为0。对于星座C1类别下的各分词字符所属概率值的情况可通过如下哈希表进行表示:
对于非星座NC1类别而言,确定各分词字符所属概率值的方式与上述同理;由于社交信息2具有“冠军”字符,而“冠军”字符在属于星座C1类别的社交信息1中出现,因此可将社交信息2的分词字符数的倒数(1/2=0.5)作为第一概率值,将第一概率值,除以社交信息1的分词字符数的倒数(1/9=0.11)和第一概率值的和,即0.5/(0.5+0.11)=0.8197,得出第二概率值0.8197,第二概率值0.8197为冠军字符与非星座NC1类别的所属概率值;对于社交信息2中的“跑步”字符,由于“跑步”不在星座C1类别所属的社交信息1中出现,而只在非星座NC1类别所属的社交信息2中出现,因此“跑步”与非星座NC1类别的所属概率值为1;由于社交信息1中的分词字符“心地星座双鱼座亚军天秤座季军射手巨蟹座”只在星座C1类别所属的社交信息1中出现,而不在非星座NC1类别所属的社交信息2中出现,因此可确定“心地星座双鱼座亚军天秤座季军射手巨蟹座”与非星座NC1类别的概率值为0。对于非星座NC1类别下的各分词字符所属概率值的情况可通过如下哈希表进行表示:
至此,则可完成预设的分词字符与各信息类别的概率对应关系的确定。
此时若获取到社交信息:“我的星座是双鱼座”。通过本发明实施例提供的社交信息展示方法,可对“我的星座是双鱼座”进行分词操作,得到“星座”和“双鱼座”两个分词字符;根据预设的分词字符与各信息类别的概率对应关系,可确定分词操作所得到的各分词字符与各信息类别的概率值,可选的可参照上述列出的两个哈希表,可确定对于星座C1类别而言,“星座”和“双鱼座”与星座C1类别的概率值均为1,对于非星座NC1类别而言,“星座”和“双鱼座”与非星座NC1类别的概率值均为0。按照计算社交信息与各信息类别的概率值的方式:将所述社交信息的各分词字符属于第一信息类别的概率值的乘积,除以,各分词字符属于其他信息类别的概率值的乘积和各分词字符属于第一信息类别的概率值的乘积的和;则计算社交信息与星座C1类别的概率值为:将“星座”和“双鱼座”属于第一信息类别的概率值的乘积(1*1),除以,“星座”和“双鱼座”属于非星座NC1类别的概率值的乘积(0*0)和(1*1)的和,即计算(1*1)/(0*0+1*1)=1,得到社交信息与星座C1类别的概率值为1;同理,计算社交信息与非星座NC1类别的概率值为(0*0)/(1*1+0*0)=0。可知,计算社交信息与星座C1类别的概率值1,大于社交信息与非星座NC1类别的概率值0,因此可将社交信息归属到星座C1类别中,并在星座C1类别中进行展示。
本发明实施例提供的社交信息展示方法实现了社交信息的分类展示,可以使得用户通过信息类别便捷的查找到自己感兴趣的社交信息。
下面对本发明实施例提供的社交信息展示装置进行介绍,下文描述的社交信息展示装置与上文描述的社交信息展示方法可相互对应参照。
图4为本发明实施例提供的社交信息展示装置的结构框图,该社交信息展示装置可以应用于服务器端,参照图4,该社交信息展示装置可以包括:
概率对应关系预设模块100,用于预设分词字符与各信息类别的概率对应关系;
获取模块200,用于获取所发布的社交信息;
第一分词模块300,用于对所述社交信息进行分词操作,得到多个分词字符;
第一概率值确定模块400,用于根据预设的分词字符与各信息类别的概率对应关系,确定分词操作所得到的各分词字符与各信息类别的概率值;
第二概率值确定模块500,用于根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息类别的概率值;
信息类别确定模块600,用于将第二概率值确定模块500所计算的概率值最大的信息类别确定为所述社交信息所属的信息类别;
展示模块700,用于将所述社交信息归属到所述概率值最大的信息类别中进行展示。
可选的,图5示出了概率对应关系预设模块100的一种可选结构,参照图5,概率对应关系预设模块100可以包括:
选择单元110,用于选择多条社交信息;
预先判定单元120,用于对所选择的各条社交信息所属的信息类别进行预先判定;
分词单元130,用于对所选择的各条社交信息进行分词操作,得到多个分词字符;
概率值确定单元140,用于通过预先判定的各条社交信息所属的信息类别,确定所述多条社交信息对应的分词字符与各信息类别的所属概率值,通过所述所属概率值确定分词字符与各信息类别的概率对应关系。
对应的,图6示出了概率值确定单元140的一种可选结构,参照图6,概率值确定单元140可以包括:
第一确定子单元141,用于对于第一信息类别,若第一信息类别所属的社交信息的第一分词字符不在其他信息类别所属的社交信息中出现时,确定第一分词字符与第一信息类别的所属概率值为1;
第二确定子单元142,用于对于第一信息类别,若第一信息类别所属的社交信息的第一分词字符,在其他信息类别所属的社交信息中出现时,将第一信息类别所属的社交信息的分词字符数的倒数作为第一概率值,将第一概率值,除以,该其他信息类别所属的社交信息的分词字符数的倒数和第一概率值的和,得到第二概率值,将第二概率值确定为第一分词字符与第一信息类别的所属概率值;
第三确定子单元143,用于对于第一信息类别,若第一信息类别所不属的社交信息的第二分词字符,不在第一信息类别所属的社交信息中出现时,确定第二分词字符与第一信息类别的所属概率值为零。
对应的,图7示出了第二概率值确定模块500的一种可选结构,参照图7,第二概率值确定模块500可以包括:
计算单元510,用于将所述社交信息的各分词字符属于第一信息类别的概率值的乘积,除以,各分词字符属于其他信息类别的概率值的乘积和各分词字符属于第一信息类别的概率值的乘积的和,将所得到的值作为所述社交信息与第一信息类别的概率值。
可选的,图8示出了第一分词模块300的一种可选结构,参照图8,第一分词模块300可以包括:
词序列组合单元310,用于按照预定的分词规则将连续的字序列重新组合成词序列;
去除单元320,用于从所述词序列中的去除单个字和预定的常用词,得到分词结果。
可选的,展示模块700在进行社交信息展示时,可将各信息类别下的社交信息可按照发布时间的顺序进行排序。
本发明实施例提供的社交信息展示装置实现了社交信息的分类展示,可以使得用户通过信息类别便捷的查找到自己感兴趣的社交信息。
本发明实施例还提供一种服务器,包括上述所述的社交信息展示装置,社交信息展示装置的具体描述可参照图4~图8对应部分的描述,此处不在赘述。
下面对本发明实施例提供的服务器的硬件结构进行描述,图9示出了该服务器的硬件结构框图,参照图9,服务器可以包括:处理器1,通信接口2,存储器3和通信总线4;
其中处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
可选的,通信接口2可以为通信模块的接口,如GSM模块的接口;
处理器1,用于执行程序;
存储器3,用于存放程序;
程序可以包括程序代码,所述程序代码包括计算机操作指令。
处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
其中,程序可具体用于:
获取所发布的社交信息,对所述社交信息进行分词操作,得到多个分词字符;
根据预设的分词字符与各信息类别的概率对应关系,确定分词操作所得到的各分词字符与各信息类别的概率值;
根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息类别的概率值;
将所计算的概率值最大的信息类别确定为所述社交信息所属的信息类别;
将所述社交信息归属到所述概率值最大的信息类别中进行展示。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种社交信息展示方法,其特征在于,包括:
获取所发布的社交信息,对所述社交信息进行分词操作,得到多个分词字符;
根据预设的分词字符与各信息类别的概率对应关系,确定分词操作所得到的各分词字符与各信息类别的概率值;
根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息类别的概率值;
将所计算的概率值最大的信息类别确定为所述社交信息所属的信息类别;
将所述社交信息归属到所述概率值最大的信息类别中进行展示。
2.根据权利要求1所述的社交信息展示方法,其特征在于,所述预设的分词字符与各信息类别的概率对应关系的确定过程包括:
选择多条社交信息,对所选择的各条社交信息所属的信息类别进行预先判定;
对所选择的各条社交信息进行分词操作,得到多个分词字符;
通过预先判定的各条社交信息所属的信息类别,确定所述多条社交信息对应的分词字符与各信息类别的所属概率值,通过所述所属概率值确定分词字符与各信息类别的概率对应关系。
3.根据权利要求2所述的社交信息展示方法,其特征在于,所述通过预先判定的各条社交信息所属的信息类别,确定所述多条社交信息对应的分词字符与各信息类别的所属概率值包括:
对于第一信息类别,若第一信息类别所属的社交信息的第一分词字符不在其他信息类别所属的社交信息中出现,则确定第一分词字符与第一信息类别的所属概率值为1;
对于第一信息类别,若第一信息类别所属的社交信息的第一分词字符,在其他信息类别所属的社交信息中出现,则将第一信息类别所属的社交信息的分词字符数的倒数作为第一概率值,将第一概率值,除以,该其他信息类别所属的社交信息的分词字符数的倒数和第一概率值的和,得到第二概率值,将第二概率值确定为第一分词字符与第一信息类别的所属概率值;
对于第一信息类别,若第一信息类别所不属的社交信息的第二分词字符,不在第一信息类别所属的社交信息中出现,则确定第二分词字符与第一信息类别的所属概率值为零。
4.根据权利要求3所述的社交信息展示方法,其特征在于,所述根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息类别的概率值包括:
将所述社交信息的各分词字符属于第一信息类别的概率值的乘积,除以,各分词字符属于其他信息类别的概率值的乘积和各分词字符属于第一信息类别的概率值的乘积的和,将所得到的值作为所述社交信息与第一信息类别的概率值。
5.根据权利要求1-4任一项所述的社交信息展示方法,其特征在于,所述对所述社交信息进行分词操作包括:
按照预定的分词规则将连续的字序列重新组合成词序列;
从所述词序列中的去除单个字和预定的常用词,得到分词结果。
6.一种社交信息展示装置,其特征在于,包括:
概率对应关系预设模块,用于预设分词字符与各信息类别的概率对应关系;
获取模块,用于获取所发布的社交信息;
第一分词模块,用于对所述社交信息进行分词操作,得到多个分词字符;
第一概率值确定模块,用于根据预设的分词字符与各信息类别的概率对应关系,确定分词操作所得到的各分词字符与各信息类别的概率值;
第二概率值确定模块,用于根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息类别的概率值;
信息类别确定模块,用于将所述第二概率值确定模块所计算的概率值最大的信息类别确定为所述社交信息所属的信息类别;
展示模块,用于将所述社交信息归属到所述概率值最大的信息类别中进行展示。
7.根据权利要求6所述的社交信息展示装置,其特征在于,所述概率对应关系预设模块包括:
选择单元,用于选择多条社交信息;
预先判定单元,用于对所选择的各条社交信息所属的信息类别进行预先判定;
分词单元,用于对所选择的各条社交信息进行分词操作,得到多个分词字符;
概率值确定单元,用于通过预先判定的各条社交信息所属的信息类别,确定所述多条社交信息对应的分词字符与各信息类别的所属概率值,通过所述所属概率值确定分词字符与各信息类别的概率对应关系。
8.根据权利要求7所述的社交信息展示装置,其特征在于,所述概率值确定单元包括:
第一确定子单元,用于对于第一信息类别,若第一信息类别所属的社交信息的第一分词字符不在其他信息类别所属的社交信息中出现时,确定第一分词字符与第一信息类别的所属概率值为1;
第二确定子单元,用于对于第一信息类别,若第一信息类别所属的社交信息的第一分词字符,在其他信息类别所属的社交信息中出现时,将第一信息类别所属的社交信息的分词字符数的倒数作为第一概率值,将第一概率值,除以,该其他信息类别所属的社交信息的分词字符数的倒数和第一概率值的和,得到第二概率值,将第二概率值确定为第一分词字符与第一信息类别的所属概率值;
第三确定子单元,用于对于第一信息类别,若第一信息类别所不属的社交信息的第二分词字符,不在第一信息类别所属的社交信息中出现时,确定第二分词字符与第一信息类别的所属概率值为零。
9.根据权利要求8所述的社交信息展示装置,其特征在于,所述第二概率值确定模块包括:
计算单元,用于将所述社交信息的各分词字符属于第一信息类别的概率值的乘积,除以,各分词字符属于其他信息类别的概率值的乘积和各分词字符属于第一信息类别的概率值的乘积的和,将所得到的值作为所述社交信息与第一信息类别的概率值。
10.一种服务器,其特征在于,包括权利要求6-9任一项所述的社交信息展示装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410030676.5A CN104809109B (zh) | 2014-01-23 | 2014-01-23 | 一种社交信息展示方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410030676.5A CN104809109B (zh) | 2014-01-23 | 2014-01-23 | 一种社交信息展示方法、装置及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104809109A true CN104809109A (zh) | 2015-07-29 |
CN104809109B CN104809109B (zh) | 2019-12-10 |
Family
ID=53693940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410030676.5A Active CN104809109B (zh) | 2014-01-23 | 2014-01-23 | 一种社交信息展示方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104809109B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105243389A (zh) * | 2015-09-28 | 2016-01-13 | 北京橙鑫数据科技有限公司 | 公司名称的行业分类标签的确定方法和装置 |
CN105741177A (zh) * | 2016-01-29 | 2016-07-06 | 中国联合网络通信集团有限公司 | 即时通信平台社交信息显示方法及显示装置 |
CN107169523A (zh) * | 2017-05-27 | 2017-09-15 | 鹏元征信有限公司 | 自动确定机构的所属行业类别的方法、存储设备及终端 |
CN107545505A (zh) * | 2016-06-24 | 2018-01-05 | 上海壹账通金融科技有限公司 | 保险理财产品信息的识别方法及系统 |
CN107688594A (zh) * | 2017-05-05 | 2018-02-13 | 平安科技(深圳)有限公司 | 基于社交信息的风险事件的识别系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100054599A1 (en) * | 2008-08-26 | 2010-03-04 | Fuji Xerox Co., Ltd. | Document processing apparatus, document processing method, and computer readable medium |
CN101980497A (zh) * | 2010-10-20 | 2011-02-23 | 北京开心人信息技术有限公司 | 一种分类显示好友动态的方法与系统 |
CN102184262A (zh) * | 2011-06-15 | 2011-09-14 | 悠易互通(北京)广告有限公司 | 基于web的文本分类挖掘系统及方法 |
CN103136256A (zh) * | 2011-11-30 | 2013-06-05 | 阿里巴巴集团控股有限公司 | 一种在网络中实现信息检索的方法和系统 |
CN103136266A (zh) * | 2011-12-01 | 2013-06-05 | 中兴通讯股份有限公司 | 邮件分类的方法及装置 |
CN103377258A (zh) * | 2012-04-28 | 2013-10-30 | 索尼公司 | 用于对微博信息进行分类显示的方法和设备 |
-
2014
- 2014-01-23 CN CN201410030676.5A patent/CN104809109B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100054599A1 (en) * | 2008-08-26 | 2010-03-04 | Fuji Xerox Co., Ltd. | Document processing apparatus, document processing method, and computer readable medium |
CN101980497A (zh) * | 2010-10-20 | 2011-02-23 | 北京开心人信息技术有限公司 | 一种分类显示好友动态的方法与系统 |
CN102184262A (zh) * | 2011-06-15 | 2011-09-14 | 悠易互通(北京)广告有限公司 | 基于web的文本分类挖掘系统及方法 |
CN103136256A (zh) * | 2011-11-30 | 2013-06-05 | 阿里巴巴集团控股有限公司 | 一种在网络中实现信息检索的方法和系统 |
CN103136266A (zh) * | 2011-12-01 | 2013-06-05 | 中兴通讯股份有限公司 | 邮件分类的方法及装置 |
CN103377258A (zh) * | 2012-04-28 | 2013-10-30 | 索尼公司 | 用于对微博信息进行分类显示的方法和设备 |
Non-Patent Citations (1)
Title |
---|
邓擘等: "使用特征词的统计分布信息进行文本分类", 《计算机工程与应用》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105243389A (zh) * | 2015-09-28 | 2016-01-13 | 北京橙鑫数据科技有限公司 | 公司名称的行业分类标签的确定方法和装置 |
CN105741177A (zh) * | 2016-01-29 | 2016-07-06 | 中国联合网络通信集团有限公司 | 即时通信平台社交信息显示方法及显示装置 |
CN107545505A (zh) * | 2016-06-24 | 2018-01-05 | 上海壹账通金融科技有限公司 | 保险理财产品信息的识别方法及系统 |
CN107688594A (zh) * | 2017-05-05 | 2018-02-13 | 平安科技(深圳)有限公司 | 基于社交信息的风险事件的识别系统及方法 |
CN107688594B (zh) * | 2017-05-05 | 2019-07-16 | 平安科技(深圳)有限公司 | 基于社交信息的风险事件的识别系统及方法 |
US11803796B2 (en) | 2017-05-05 | 2023-10-31 | Ping An Technology (Shenzhen) Co., Ltd. | System, method, electronic device, and storage medium for identifying risk event based on social information |
CN107169523A (zh) * | 2017-05-27 | 2017-09-15 | 鹏元征信有限公司 | 自动确定机构的所属行业类别的方法、存储设备及终端 |
Also Published As
Publication number | Publication date |
---|---|
CN104809109B (zh) | 2019-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108521439B (zh) | 一种消息推送的方法和装置 | |
CN104809109A (zh) | 一种社交信息展示方法、装置及服务器 | |
CN105205146B (zh) | 一种计算微博用户影响力的方法 | |
CN104809209A (zh) | 社交网络信息流的显示方法、装置及服务器 | |
CN105389722A (zh) | 恶意订单识别方法及装置 | |
CN110033331A (zh) | 一种优惠券的发放方法、系统及终端设备 | |
CN108241677A (zh) | 一种获得商品的税收分类编码的方法及系统 | |
CN105094775B (zh) | 网页生成方法和装置 | |
CN105335409A (zh) | 一种目标用户的确定方法、设备和网络服务器 | |
CN108537586A (zh) | 基于用户画像的数据处理方法及装置 | |
CN105095179B (zh) | 对用户评价进行处理的方法及装置 | |
CN109902713A (zh) | 基于数据分析的楼盘推荐方法、设备、存储介质及装置 | |
CN105550253B (zh) | 一种类型关系的获取方法及装置 | |
CN111858922B (zh) | 服务方信息查询方法、装置、电子设备以及存储介质 | |
CN109978580A (zh) | 对象推荐方法、装置以及计算机可读存储介质 | |
CN105989107A (zh) | 一种应用推荐方法及装置 | |
CN107679883A (zh) | 广告生成的方法及系统 | |
CN103379161B (zh) | 媒体信息展示方法、系统和装置 | |
CN105989114A (zh) | 一种收藏内容推荐方法及终端 | |
CN102521713B (zh) | 数据处理装置和数据处理方法 | |
CN108710656B (zh) | 一种内容推送方法和装置 | |
CN104506636B (zh) | 一种数据同步方法及装置 | |
CN106844743B (zh) | 维吾尔语文本的情感分类方法及装置 | |
CN106844504B (zh) | 一种发送歌单标识的方法和装置 | |
CN106484702B (zh) | 目标网页访问量的展示方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |