CN107577827A - 一种互联网信息评级的方法及装置 - Google Patents
一种互联网信息评级的方法及装置 Download PDFInfo
- Publication number
- CN107577827A CN107577827A CN201711041680.1A CN201711041680A CN107577827A CN 107577827 A CN107577827 A CN 107577827A CN 201711041680 A CN201711041680 A CN 201711041680A CN 107577827 A CN107577827 A CN 107577827A
- Authority
- CN
- China
- Prior art keywords
- vector
- information
- viewpoint
- value
- reliable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明实施例提供一种互联网信息评级的方法及装置。所述方法包括获取观点信息集和观点评论集,每条观点评论至少包括用户标识和对所述观点信息的认同值;设置每个观点信息的可靠向量,同时设置每个用户标识权威向量,并得到相关矩阵;通过对可靠向量和权威向量进行迭代,以得到满足稳定性判据的可靠结果向量和权威结果向量,分别包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。本发明实施例从互联网上获取观点信息集和与观点信息相对应的观点评论集,通过分析得到了每个观点信息的可靠结果值和每个用户标识的权威结果值,从而能够更加方便、快速、客观得得到每个观点信息的可靠度和每个用户标识的权威性。
Description
技术领域
本发明实施例涉及互联网技术领域,尤其涉及一种互联网信息评级的方法及装置。
背景技术
随着互联网越来越深入到人们生活的方方面面,人们可以在互联网的各个渠道找到需要的各种信息。而互联网上的消息也亦真亦假,例如对于“银杏叶子泡水喝能长寿”、“牛奶都不能喝了”、“吃碘盐能防核辐射”这类论坛帖子,往往令人无法判断。所以对于互联网上的信息,经常需要评级。
现有存在对网页的重要程度进行评级,这就是Page Rank算法。但是对于信息的可靠程度,缺少通用的算法。还仅仅是依靠权威专家来对互联网信息打分,或者通过追溯消息的来源来对信息的可靠性进行判决。这些方法都需要利用大量的人力,且对于消息的可靠性判决也不够准确、方便。
发明内容
本发明实施例提供一种互联网信息评级的方法及装置,用以解决现有技术中对于互联网信息评级不够准确、方便和客观的问题。
第一方面,本发明实施例提供了一种互联网信息评级的方法,包括:
从互联网获取观点信息集和与每条观点信息Ai相对应的观点评论集,每条观点评论至少包括用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij;
设置每个观点信息Ai的可靠值ai组合成可靠向量同时设置每个用户标识Bj的权威值bj组合成权威向量并根据每个认同值pij得到相关矩阵M;
根据所述相关矩阵M设置所述可靠向量和权威向量的收敛迭代方程,并对所述可靠向量和权威向量进行迭代,以得到满足预设的稳定性判据,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。
第二方面,本发明实施例提供了一种互联网信息评级的装置,包括:
获取单元,用于从互联网获取观点信息集和与每条观点信息Ai相对应的观点评论集,每条观点评论至少包括用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij;
统计单元,用于设置每个观点信息Ai的可靠值ai组合成可靠向量同时设置每个用户标识Bj的权威值bj组合成权威向量并根据每个认同值pij得到相关矩阵M;
迭代单元,用于根据所述相关矩阵M设置所述可靠向量和权威向量的收敛迭代方程,并对所述可靠向量和权威向量进行迭代,以得到满足预设的稳定性判据,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。
第三方面,本发明实施例还提供了一种电子设备,包括:
处理器、存储器、通信接口和总线;其中,
所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述通信接口用于该电子设备的通信设备之间的信息传输;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:
从互联网获取观点信息集和与每条观点信息Ai相对应的观点评论集,每条观点评论至少包括用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij;
设置每个观点信息Ai的可靠值ai组合成可靠向量同时设置每个用户标识Bj的权威值bj组合成权威向量并根据每个认同值pij得到相关矩阵M;
根据所述相关矩阵M设置所述可靠向量和权威向量的收敛迭代方程,并对所述可靠向量和权威向量进行迭代,以得到满足预设的稳定性判据,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。
第四方面,本发明实施例还提供了一种计算机程序,包括程序代码,所述程序代码用于执行如下操作:
所述处理器用于调用所述存储器中的逻辑指令,以执行如下方法:
从互联网获取观点信息集和与每条观点信息Ai相对应的观点评论集,每条观点评论至少包括用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij;
设置每个观点信息Ai的可靠值ai组合成可靠向量同时设置每个用户标识Bj的权威值bj组合成权威向量并根据每个认同值pij得到相关矩阵M;
根据所述相关矩阵M设置所述可靠向量和权威向量的收敛迭代方程,并对所述可靠向量和权威向量进行迭代,以得到满足预设的稳定性判据,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。
第五方面,本发明实施例还提供了一种存储介质,用于存储如前所述的计算机程序。
本发明实施例提供的互联网信息评级的方法及装置,通过从互联网上获取观点信息集和与观点信息相对应的观点评论集,并对每个观点信息设置可靠值,对每个观点信息的用户标识设置权威值,再通过每个用户标识对每个观点信息的认可值,利用收敛迭代方程得到了每个观点信息的可靠结果值和每个用户标识的权威结果值,从而能够更加方便、快速、客观得得到每个观点信息的可靠度和每个用户标识的权威性。
附图说明
图1为本发明实施例的一种互联网信息评级的方法流程图;
图2为本发明实施例的一种互联网信息评级的装置结构示意图;
图3为本发明实施例的一种电子设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例的一种互联网信息评级的方法,如图1所示,所述方法包括:
步骤S01、从互联网获取观点信息集和与每条观点信息Ai相对应的观点评论集,每条观点评论至少包括用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij;
首先要先从互联网上收集大量的信息,以及与每条信息相对应的信息评论,并从这些大量的信息中提取出关键的观点信息Ai,其中下标i=1,2,……,n,不同的i代表不同的观点信息,所述n代表了所有观点信息的总数。将所有的观点信息存入观点信息集。与所述观点信息Ai相对应的信息评论至少包括用户标识Bj和评论内容,其中下标j=1,2,……,m,不同的j代表不同的用户标识,所述m代表了所有观点信息的用户标识的总数。根据对所述用户标识Bj相对应的评论内容的分析可以得到所述用户标识Bj对所述用观点信息Ai的认同度,并根据所述认同度设置认同值pij,对于认同值的设置方法有很多,例如将所述认同度分为同意或反对两类,分类的方法可以通过对自然语言的筛选规则的设置来判断。若所述认同度为同意,则相对应的pij=1,相反若所述认同度为反对,则相对应的pij=-1。例如也可以将认同度分为多个认同等级,例如完全认同,较认同,无偏见,较反对,完全反对,然后再分别对每个等级分别设置一个-1~1的数值。其中对于认同值的设置,可以根据具体的实际需求来进行选择,在此不作具体限定,但为了表述方便,在下面的实施例中都只以同意和反对两种认同度为例。将所述用户标识Bj和与所述用户标识Bj相对应的pij组合为观点评论,存入与所述观点信息Ai相对应的观点评论集中。若Bj对Ai无评论,则pij=0。
步骤S02、设置每个观点信息Ai的可靠值ai组合成可靠向量同时设置每个用户标识Bj的权威值bj组合成权威向量并根据每个认同值pij得到相关矩阵M;
对每条观点信息Ai设置相对应的可靠值ai,对于所述可靠值的设置方法有很多,例如设置从0~1的一个值,数值越大代表该观点信息Ai的可靠性越高,如果该观点信息为首次出现,则可以设置一个预设的初始可靠值,例如0.5。而如果所述观点信息是已经出现过的观点信息,则可以直接将该观点信息设置为已经保存的可靠值或者也可以直接将该观点信息删除,不包括在本次信息评级过程。当然具体的可靠值设置方法可以根据实际的需要来进行调整,在此不作限定。同时对每个用户标识也设置相对应的权威值bj,与设置可靠值ai相同,权威值bj也可以设置为从0~1的一个值,数值越大代表该用户标识的权威性就越大,如果该用户标识是首次出现,则可以设置一个预设的初始权威值,例如0.5。而如果所述用户标识是已经出现过的用户标识,则可以直接将该用户标识相对应的权威值设置为保存的权威值。
然后将所有观点信息的可靠值组合成可靠向量将所述有用户标识的权威值组合成权威向量同时将所有观点评论的认同值组合成观点信息和用户标识的相关矩阵M,
其中所述
其中若所述用户标识Bj没有在所述观点信息Ai的观点评论集中,则与所述Bj和Ai相对应的认同值pij为0或者为无偏见所对应的认同值。
步骤S03、根据所述相关矩阵M设置所述可靠向量和权威向量的收敛迭代方程,并对所述可靠向量和权威向量进行迭代,以得到满足预设的稳定性判据,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。
根据所述可靠向量、权威向量和相关矩阵设置所述可靠向量和权威向量的收敛迭代方程,然后通过所述收敛迭代方程,对所述可靠向量和权威向量进行迭代。
然后对每次迭代结束后得到的可靠向量和权威向量用预设的稳定性判据来判断所述可靠向量中的每个可靠值和每个权威向量中的权威值是否已经足够稳定,如果满足该稳定性判据则此时的可靠向量和权威向量分别为可靠结果向量和权威结果向量。可靠结果向量中的可靠值为相对应的观点信息的可靠结果值,而权威结果向量中的权威值为相对应的用户标识的权威结果值。如果可靠结果值越高,则可以认为相对应的观点信息可靠度越可信。如果权威结果值越高,则可以认为相对应的用户标识的权威性越高,而与该用户标识相对应的评论也越可信。
本发明实施例,通过从互联网上获取观点信息集和与观点信息相对应的观点评论集,并对每个观点信息设置可靠值,对每个观点信息的用户标识设置权威值,再通过每个用户标识对每个观点信息的认可值,利用收敛迭代方程得到了每个观点信息的可靠结果值和每个用户标识的权威结果值,从而能够更加方便、快速、客观得得到每个观点信息的可靠度和每个用户标识的权威性。
基于上述实施例,进一步地,所述步骤S03,具体为,
根据如下收敛迭代方程组,对所述可靠向量和权威向量进行迭代:
其中所述k和k-1为迭代次数,所述和分别为所述可靠向量和所述权威向量的第k次迭代结果,所述和分别为所述可靠向量和所述权威向量的第k-1次迭代结果,所述M-1为所述相关矩阵M的逆矩阵,所述α1和α2为松弛系数;
在每次迭代结束后,判断所述中的每个可靠值和所述中的每个权威值是否满足预设的稳定性判据,若满足则结束迭代;
将所述和分别作为可靠结果向量和权威结果向量,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。
由上述实施例可知,需要根据所述相关矩阵设置所述可靠向量和权威向量的收敛迭代方程,对于该方程的设计方法有很多,在本实施例中,也仅是一种方法举例。
根据所述相关矩阵M,设计所述可靠向量与所述权威向量的收敛迭代方程组如下:
其中所述k和k-1为迭代次数,k为自然数,所述和分别为所述可靠向量和所述权威向量的第k次迭代结果,所述和分别为所述可靠向量和所述权威向量的第k-1次迭代结果,所述M-1为所述相关矩阵M的逆矩阵,所述α1和α2为松弛系数。
进一步地,所述松弛系数α1和α2根据所述相关矩阵M获取。
对于所述松弛系数的设定可以根据实际的需要来进行,例如0~1之间的小数,所述松弛系数越大则所述收敛迭代方程的收敛速度就越快,但同时收敛迭代方程的稳定性就越差。也就是说如果松弛系数过小,则会导致收敛速度过慢,需要大量的迭代次数才会满足预设的稳定性判据,浪费大量的计算时间,而如果松弛系数过大,则会导致收敛迭代方程的稳定性过差,从而导致无法收敛,无法得到满意的结果。对于松弛系数的设置可以根据所述相关矩阵M来获取,通过对所述相关矩阵M的特征值的计算来获取合适的松弛系数。
然后在每次迭代结束后,根据预设的稳定性判据,例如将得到的与进行比较得到每个可靠值在此次迭代后变化量,并与所述稳定性判据进行比对;同时将得到的与进行比较得到每个权威值的变化量,并同样与稳定性判据进行比对。若存在不满足所述稳定性判据的可靠值和/或权威值,则继续进行下一次迭代。而若均满足,则和可认为分别为可靠结果向量和权威结果向量。对于所述稳定性判据的具体设定,可以根据实际的需要来进行,即可以采用与举例中的稳定性判据不同的精度,也可以采用对每个可靠值和权威值稳定性判据的精确设定,在此不作具体的限定,但为了表述方便在下面的实施例中,都只以上述举例的稳定性判据为例进行说明。可靠结果向量中的可靠值为相对应的观点信息的可靠结果值,而权威结果向量中的权威值为相对应的用户标识的权威结果值。如果可靠结果值越高,则可以认为相对应的观点信息可靠度越来越可信。如果权威结果值越高,则可以认为相对应的用户标识的权威性越高,而与该用户标识相对应的评论也越可信。
本发明实施例根据建立的收敛迭代方程组,使所述可靠向量和权威向量通过迭代满足预设的稳定性判据,以得到可靠结果向量和权威结果向量,从而方便、快速、客观得得到了每个观点消息的可靠结果值和每个用户标识的权威结果值。
基于上述实施例,进一步地,所述步骤S01具体为:
从互联网获取信息集和每条信息的信息评论集,每条信息评论至少包括用户标识Bj;
从每条信息中提取出相对应的观点信息Ai;
将与所述观点信息Ai相对应的至少一条信息的信息评论集合并为所述观点信息Ai的观点评论集,其中每条观点评论至少包括所述用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij。
在对所述观点信息集和每条观点信息相对应的观点评论的提取前,首先要先从互联网上,例如,各大微博、微信和论坛等平台,通过例如爬取的方式来收集大量的信息,以及与每条信息相对应的信息评论,在每条信息评论中都至少包括有用户标识Bj。
对每条信息进行信息提取,例如采用自然语言分析等方法,提取出每条信息中关键语言以组合成观点信息Ai。
由于网上的信息会有大量的转载等情况,所以经过信息提取后,有些观点信息Ai会对应不止一条信息。将这些与所述观点信息Ai相对应的信息的信息评论作为观点评论都合并到与所述观点信息Ai相对应的观点评论集中。同时将在同一观点评论集中具有相同用户标识Bj的信息评论合并为一条观点评论,其中所述观点评论,至少包括用户标识Bj和评论内容,不同的j代表不同的用户标识。根据对所述用户标识Bj相对应的观点评论中的评论内容的分析可以得到所述用户标识Bj对所述观点信息Ai的认同度,并根据所述认同度设置认同值pij,并记录到相对应的观点评论中。
本发明实施例,通过对所述互联网爬取到的各种信息的收集、提取和分析得到需要的观点信息集和每条观点信息的观点评论集,可以更加快速、方便、客观得根据接下来的进一步分析得到每个观点信息的可靠度和每个用户标识的权威性。
图2为本发明实施例的一种互联网信息评级的装置结构示意图,如图2所示,所述装置包括获取单元11、统计单元12和迭代单元13,其中:
所述获取单元11用于从互联网获取观点信息集和与每条观点信息Ai相对应的观点评论集,每条观点评论至少包括用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij;所述统计单元12用于根据每个观点信息Ai的可靠值ai组合成可靠向量根据每个用户标识Bj的权威值bj组合成权威向量并根据每个认同值pij得到相关矩阵M;所述迭代单元13用于所述根据所述相关矩阵M设置所述可靠向量和权威向量的收敛迭代方程,并对所述可靠向量和权威向量进行迭代,以得到满足稳定性判据的可靠结果向量和权威结果向量,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。具体地:
所述获取单元11首先要先从互联网上收集大量的信息,以及与每条信息相对应的信息评论,并从这些大量的信息中提取出关键的观点信息Ai,其中下标i=1,2,……,n,不同的i代表不同的观点信息,所述n代表了所有观点信息的总数。将所有的观点信息存入观点信息集。与所述观点信息Ai相对应的信息评论至少包括用户标识Bj和评论内容,其中下标j=1,2,……,m,不同的j代表不同的用户标识,所述m代表了所有观点信息的用户标识的总数。根据对所述用户标识Bj相对应的评论内容的分析可以得到所述用户标识Bj对所述用观点信息Ai的认同度,并根据所述认同度设置认同值pij,将所述认同度分为同意或反对两类,若所述认同度为同意,则相对应的pij=1,相反若所述认同度为反对,则相对应的pij=-1。将所述用户标识Bj和与所述用户标识Bj相对应的pij组合为观点评论,存入与所述观点信息Ai相对应的观点评论集中。所述获取单元11将得到的观点信息集以及与每条观点信息相对应的观点评论集发送给统计单元12。
所述统计单元12对每条观点信息Ai设置相对应的可靠值ai,例如设置从0~1的一个值,如果该观点信息为首次出现,则可以设置一个预设的初始可靠值,例如0.5。同时对每个用户标识也设置相对应的权威值bj,设置为从0~1的一个值,如果该用户标识是首次出现,则可以设置一个预设的初始权威值,例如0.5。而如果所述用户标识是已经出现过的用户标识,则可以直接将该用户标识相对应的权威值设置为保存的权威值。
然后将所有观点信息的可靠值组合成可靠向量将所述有用户标识的权威值组合成权威向量同时将所有观点评论的认同值组合成观点信息和用户标识的相关矩阵M,
其中所述
其中若所述用户标识Bj没有在所述观点信息Ai的观点评论集中,则与所述Bj和Ai相对应的认同值pij为0或者为无偏见所对应的认同值。统计单元12将得到的可靠向量权威向量和相关矩阵M发送给迭代单元13。
所述迭代单元13根据所述可靠向量权威向量和相关矩阵M设置所述可靠向量和权威向量的收敛迭代方程,然后通过所述收敛迭代方程,对所述可靠向量和权威向量进行迭代。
然后对每次迭代结束后得到的可靠向量和权威向量用预设的稳定性判据进行比对。当所述可靠向量中的每个可靠值在此次迭代后的变化量和所述权威向量中的每个权威值在此次迭代后的变化量均满足所述稳定性判据时,就可以认为所述可靠向量和权威向量已经稳定,此时的可靠向量和权威向量分别为可靠结果向量和权威结果向量。可靠结果向量中的可靠值为相对应的观点信息的可靠结果值,而权威结果向量中的权威值为相对应的用户标识的权威结果值。如果可靠结果值越高,则可以认为相对应的观点信息可靠度越可信。如果权威结果值越高,则可以认为相对应的用户标识的权威性越高,而与该用户标识相对应的评论也越可信。
本发明实施例提供的装置用于执行上述方法,其功能具体参考上述方法实施例,其具体方法流程在此处不再赘述。
本发明实施例,通过获取单元11从互联网上获取观点信息集和与观点信息相对应的观点评论集,并在统计单元12对每个观点信息设置可靠值,对每个观点信息的用户标识设置权威值,再通过每个用户标识对每个观点信息的认可值,最后在迭代单元13利用收敛迭代方程得到了每个观点信息的可靠结果值和每个用户标识的权威结果值,从而能够更加方便、快速、客观得得到每个观点信息的可靠度和每个用户标识的权威性。
基于上述实施例,进一步地,所述迭代单元包括计算单元、判断单元和结果单元,其中:
所述计算单元用于根据如下收敛迭代方程,对所述可靠向量和权威向量进行迭代:
其中所述k和k-1为迭代次数,所述和分别为所述可靠向量和所述权威向量的第k次迭代结果,所述M-1为所述相关矩阵M的逆矩阵,所述α1和α2为松弛系数;所述判断单元用于在每次迭代结束后,判断所述中的每个可靠值和所述中的每个权威值是否满足预设的稳定性判据,若满足则结束迭代;所述结果单元用于将所述和分别作为可靠结果向量和权威结果向量,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。具体地:
由上述实施例可知,所述计算单元需要根据所述相关矩阵设置所述可靠向量和权威向量的收敛迭代方程,对于该方程的设计方法有很多,在本实施例中,也仅是一种方法举例。
根据所述相关矩阵M,设计所述可靠向量与所述权威向量的收敛迭代方程组如下:
其中所述k和k-1为迭代次数,k为自然数,所述和分别为所述可靠向量和所述权威向量的第k次迭代结果,所述和分别为所述可靠向量和所述权威向量的第k-1次迭代结果,所述M-1为所述相关矩阵M的逆矩阵,所述α1和α2为松弛系数。
进一步地,所述松弛系数α1和α2根据所述相关矩阵M获取。
对于所述松弛系数的设定可以根据实际的需要来进行,例如0~1之间的小数,所述松弛系数越大则所述收敛迭代方程的收敛速度就越快,但同时收敛迭代方程的稳定性就越差。也就是说如果松弛系数过小,则会导致收敛速度过慢,需要大量的迭代次数才会满足预设的稳定性判据,浪费大量的计算时间,而如果松弛系数过大,则会导致收敛迭代方程的稳定性过差,从而导致无法收敛,无法得到满意的结果。对于松弛系数的设置可以根据所述相关矩阵M来获取,通过对所述相关矩阵M的特征值的计算来获取合适的松弛系数。
然后在每次迭代结束后,所述计算单元都会将得到的和发送判断单元,由所述判断单元来对与保存的进行比较得到每个可靠值在此次迭代后变化量,同时将得到的与保存的进行比较得到每个权威值的变化量,均与预设的稳定性判据进行比对。若存在不满足所述稳定性判据的可靠值和/或权威值,则向所述计算单元发送一个迭代信号,以使所述计算单元继续进行下一次迭代,并再将迭代结果发送给所述判断单元。而若均满足所述稳定性判据,则将和发送给所述结果单元。
所述结果单元将和分别作为可靠结果向量和权威结果向量。可靠结果向量中的可靠值为相对应的观点信息的可靠结果值,而权威结果向量中的权威值为相对应的用户标识的权威结果值。如果可靠结果值越高,则可以认为相对应的观点信息可靠度越来越可信。如果权威结果值越高,则可以认为相对应的用户标识的权威性越高,而与该用户标识相对应的评论也越可信。
本发明实施例提供的装置用于执行上述方法,其功能具体参考上述方法实施例,其具体方法流程在此处不再赘述。
本发明实施例根据计算单元建立的收敛迭代方程组,使所述可靠向量和权威向量通过迭代满足预设稳定性判据,以得到可靠结果向量和权威结果向量,从而方便、快速、客观得得到了每个观点消息的可靠结果值和每个用户标识的权威结果值。
基于上述实施例,进一步地,所述获取单元包括爬取单元、观点提取单元和评论提取单元,其中:
所述爬取单元用于从互联网获取信息集和每条信息的信息评论集,每条信息评论至少包括用户标识Bj;所述观点提取单元用于从每条信息中提取出相对应的观点信息Ai;所述评论提取单元用于将与所述观点信息Ai相对应的至少一条信息的信息评论集合并为所述观点信息Ai的观点评论集,其中每条观点评论至少包括所述用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij。具体地:
在对所述观点信息集和每条观点信息相对应的观点评论的提取前,首先爬取单元要先从互联网上,例如,各大微博、微信和论坛等平台,通过例如爬取的方式来收集大量的信息,以及与每条信息相对应的信息评论,在每条信息评论中都至少包括有用户标识Bj。然后所述爬取单元会将获取的所有信息发送给观点提取单元,然后将所有的信息评论发送给评论提取单元。
所述观点提取单元对每条信息进行信息提取,例如采用自然语言分析等方法,提取出每条信息中关键语言以组合成观点信息Ai。然后将得到的观点信息发送给评论提取单元。
由于网上的信息会有大量的转载等情况,所以经过信息提取后,有些观点信息Ai会对应不止一条信息。所述评论提取单元会将这些与所述观点信息Ai相对应的信息的信息评论作为观点评论都合并到与所述观点信息Ai相对应的观点评论集中。同时将在同一观点评论集中具有相同用户标识Bj的信息评论合并为一条观点评论,其中所述观点评论,至少包括用户标识Bj和评论内容,不同的j代表不同的用户标识。根据对所述用户标识Bj相对应的观点评论中的评论内容的分析可以得到所述用户标识Bj对所述观点信息Ai的认同度,并根据所述认同度设置认同值pij,并记录到相对应的观点评论中。
本发明实施例提供的装置用于执行上述方法,其功能具体参考上述方法实施例,其具体方法流程在此处不再赘述。
本发明实施例,通过爬取单元对所述互联网爬取到的各种信息的收集,利用观点提取单元和评论提取单元来进行提取和分析得到需要的观点信息集和每条观点信息的观点评论集,可以更加快速、方便、客观得根据接下来的进一步分析得到每个观点信息的可靠度和每个用户标识的权威性。
图3是示出本发明实施例的电子设备结构示意图。如图3所示,所述电子设备,包括:处理器(processor)601、存储器(memory)602和总线603;
其中,所述处理器601和所述存储器602通过所述总线603完成相互间的通信;
所述处理器601用于调用所述存储器602中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:从互联网获取观点信息集和与每条观点信息Ai相对应的观点评论集,每条观点评论至少包括用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij;设置每个观点信息Ai的可靠值ai组合成可靠向量同时设置每个用户标识Bj的权威值bj组合成权威向量并根据每个认同值pij得到相关矩阵M;根据所述相关矩阵M设置所述可靠向量和权威向量的收敛迭代方程,并对所述可靠向量和权威向量进行迭代,以得到满足稳定性判据的可靠结果向量和权威结果向量,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。
进一步地,本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:从互联网获取观点信息集和与每条观点信息Ai相对应的观点评论集,每条观点评论至少包括用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij;设置每个观点信息Ai的可靠值ai组合成可靠向量同时设置每个用户标识Bj的权威值bj组合成权威向量并根据每个认同值pij得到相关矩阵M;根据所述相关矩阵M设置所述可靠向量和权威向量的收敛迭代方程,并对所述可靠向量和权威向量进行迭代,以得到满足稳定性判据的可靠结果向量和权威结果向量,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。
进一步地,本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:从互联网获取观点信息集和与每条观点信息Ai相对应的观点评论集,每条观点评论至少包括用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij;设置每个观点信息Ai的可靠值ai组合成可靠向量同时设置每个用户标识Bj的权威值bj组合成权威向量并根据每个认同值pij得到相关矩阵M;根据所述相关矩阵M设置所述可靠向量和权威向量的收敛迭代方程,并对所述可靠向量和权威向量进行迭代,以得到满足稳定性判据的可靠结果向量和权威结果向量,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的显示装置的测试设备等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种互联网信息评级的方法,其特征在于,包括:
从互联网获取观点信息集和与每条观点信息Ai相对应的观点评论集,每条观点评论至少包括用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij;
设置每个观点信息Ai的可靠值ai组合成可靠向量同时设置每个用户标识Bj的权威值bj组合成权威向量并根据每个认同值pij得到相关矩阵M;
根据所述相关矩阵M设置所述可靠向量和权威向量的收敛迭代方程,并对所述可靠向量和权威向量进行迭代,以得到满足预设的稳定性判据的可靠结果向量和权威结果向量,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。
2.根据权利要求1所述的方法,其特征在于,所述根据所述相关矩阵M设置所述可靠向量和权威向量的收敛迭代方程,并对所述可靠向量和权威向量进行迭代,以得到满足预设的稳定性判据的可靠结果向量和权威结果向量,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值,具体为,
根据如下收敛迭代方程组,对所述可靠向量和权威向量进行迭代:
其中所述k和k-1为迭代次数,所述和分别为所述可靠向量和所述权威向量的第k次迭代结果,所述和分别为所述可靠向量和所述权威向量的第k-1次迭代结果,所述M-1为所述相关矩阵M的逆矩阵,所述α1和α2为松弛系数;
在每次迭代结束后,判断所述中的每个可靠值和所述中的每个权威值是否满足预设的稳定性判据,若满足则结束迭代;
将所述和分别作为可靠结果向量和权威结果向量,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。
3.根据权利要求1所述的方法,其特征在于,所述从互联网获取观点信息集和与每条观点信息Ai相对应的观点评论集,每条观点评论至少包括用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij,具体为:
从互联网获取信息集和每条信息的信息评论集,每条信息评论至少包括用户标识Bj;
从每条信息中提取出相对应的观点信息Ai;
将与所述观点信息Ai相对应的至少一条信息的信息评论集合并为所述观点信息Ai的观点评论集,其中每条观点评论至少包括所述用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij。
4.根据权利要求2所述的方法,其特征在于,所述松弛系数α1和α2根据所述相关矩阵M获取。
5.一种互联网信息评级的装置,其特征在于,包括:
获取单元,用于从互联网获取观点信息集和与每条观点信息Ai相对应的观点评论集,每条观点评论至少包括用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij;
统计单元,用于设置每个观点信息Ai的可靠值ai组合成可靠向量同时设置每个用户标识Bj的权威值bj组合成权威向量并根据每个认同值pij得到相关矩阵M;
迭代单元,用于根据所述相关矩阵M设置所述可靠向量和权威向量的收敛迭代方程,并对所述可靠向量和权威向量进行迭代,以得到满足预设的稳定性判据的可靠结果向量和权威结果向量,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。
6.根据权利要求1所述的装置,其特征在于,所述迭代单元包括:
计算单元,用于根据如下收敛迭代方程,对所述可靠向量和权威向量进行迭代:
其中所述k和k-1为迭代次数,所述和分别为所述可靠向量和所述权威向量的第k次迭代结果,所述和分别为所述可靠向量和所述权威向量的第k-1次迭代结果,所述M-1为所述相关矩阵M的逆矩阵,所述α1和α2为松弛系数;
判断单元,用于在每次迭代结束后,判断所述中的每个可靠值和所述中的每个权威值是否满足预设的稳定性判据,若满足则结束迭代;
结果单元,用于将所述和分别作为可靠结果向量和权威结果向量,其中所述可靠结果向量包括每个观点信息的可靠结果值,所述权威结果向量包括每个用户标识的权威结果值。
7.根据权利要求1所述的装置,其特征在于,所述获取单元包括:
爬取单元,用于从互联网获取信息集和每条信息的信息评论集,每条信息评论至少包括用户标识Bj;
观点提取单元,用于从每条信息中提取出相对应的观点信息Ai;
评论提取单元,用于将与所述观点信息Ai相对应的至少一条信息的信息评论集合并为所述观点信息Ai的观点评论集,其中每条观点评论至少包括所述用户标识Bj和所述用户标识Bj对所述观点信息Ai的认同值pij。
8.根据权利要求6所述的装置,其特征在于,所述松弛系数α1和α2根据所述相关矩阵M获取。
9.一种电子设备,其特征在于,包括存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至4任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至4任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711041680.1A CN107577827B (zh) | 2017-10-30 | 2017-10-30 | 一种互联网信息评级的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711041680.1A CN107577827B (zh) | 2017-10-30 | 2017-10-30 | 一种互联网信息评级的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107577827A true CN107577827A (zh) | 2018-01-12 |
CN107577827B CN107577827B (zh) | 2019-10-22 |
Family
ID=61040800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711041680.1A Active CN107577827B (zh) | 2017-10-30 | 2017-10-30 | 一种互联网信息评级的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107577827B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111523049A (zh) * | 2020-04-15 | 2020-08-11 | 苏州跃盟信息科技有限公司 | 对象的权威值的确定方法、装置、存储介质和处理器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101383730A (zh) * | 2008-10-30 | 2009-03-11 | 北京搜狗科技发展有限公司 | 确定权威网站的方法及装置 |
CN102214201A (zh) * | 2010-04-08 | 2011-10-12 | 微软公司 | 从产品或服务评论中得出陈述 |
CN103399916A (zh) * | 2013-07-31 | 2013-11-20 | 清华大学 | 基于产品特征的互联网评论观点挖掘方法及系统 |
CN104333596A (zh) * | 2014-11-11 | 2015-02-04 | 安徽大学 | 一种车联网环境下的信息可靠性评估方法 |
CN104809635A (zh) * | 2015-05-13 | 2015-07-29 | 苏州市千尺浪信息技术服务有限公司 | 一种互联网动态点评分析方法 |
-
2017
- 2017-10-30 CN CN201711041680.1A patent/CN107577827B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101383730A (zh) * | 2008-10-30 | 2009-03-11 | 北京搜狗科技发展有限公司 | 确定权威网站的方法及装置 |
CN102214201A (zh) * | 2010-04-08 | 2011-10-12 | 微软公司 | 从产品或服务评论中得出陈述 |
CN103399916A (zh) * | 2013-07-31 | 2013-11-20 | 清华大学 | 基于产品特征的互联网评论观点挖掘方法及系统 |
CN104333596A (zh) * | 2014-11-11 | 2015-02-04 | 安徽大学 | 一种车联网环境下的信息可靠性评估方法 |
CN104809635A (zh) * | 2015-05-13 | 2015-07-29 | 苏州市千尺浪信息技术服务有限公司 | 一种互联网动态点评分析方法 |
Non-Patent Citations (2)
Title |
---|
AHMAD KAMAL等: "Mining feature-opinion pairs and their reliability scores from web opinion sources", 《WIMS "12 PROCEEDINGS OF THE 2ND INTERNATIONAL CONFERENCE ON WEB INTELLIGENCE, MINING AND SEMANTICS》 * |
YUTAKA MATSUO等: "Finding Social Network for Trust Calculation", 《ECAI"04 PROCEEDINGS OF THE 16TH EUROPEAN CONFERENCE ON ARTIFICIAL INTELLIGENCE》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111523049A (zh) * | 2020-04-15 | 2020-08-11 | 苏州跃盟信息科技有限公司 | 对象的权威值的确定方法、装置、存储介质和处理器 |
CN111523049B (zh) * | 2020-04-15 | 2023-06-13 | 苏州跃盟信息科技有限公司 | 对象的权威值的确定方法、装置、存储介质和处理器 |
Also Published As
Publication number | Publication date |
---|---|
CN107577827B (zh) | 2019-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229156A (zh) | Url攻击检测方法、装置以及电子设备 | |
CN110489755A (zh) | 文本生成方法和装置 | |
CN108268581A (zh) | 知识图谱的构建方法及装置 | |
CN109829775A (zh) | 一种物品推荐方法、装置、设备及可读存储介质 | |
CN108363790A (zh) | 用于对评论进行评估的方法、装置、设备和存储介质 | |
CN109784381A (zh) | 标注信息处理方法、装置及电子设备 | |
CN108664897A (zh) | 票据识别方法、装置及存储介质 | |
CN109933802A (zh) | 图文匹配方法、装置及存储介质 | |
CN105389329B (zh) | 一种基于群体评论的开源软件推荐方法 | |
CN104765729B (zh) | 一种跨平台微博社区账户匹配方法 | |
CN106156372B (zh) | 一种互联网网站的分类方法及装置 | |
CN106815307A (zh) | 公共文化知识图谱平台及其使用办法 | |
CN107330750A (zh) | 一种推荐产品配图方法及装置,电子设备 | |
CN107679082A (zh) | 问答搜索方法、装置以及电子设备 | |
CN104850567A (zh) | 一种识别网络用户之间关联关系的方法和装置 | |
CN108415972A (zh) | 文本情感处理方法 | |
CN109829065B (zh) | 图像检索方法、装置、设备及计算机可读存储介质 | |
CN110032859A (zh) | 异常帐户鉴别方法与装置及介质 | |
CN107133854A (zh) | 信息推荐方法和装置 | |
CN109992781A (zh) | 文本特征的处理、装置、存储介质和处理器 | |
CN108304509A (zh) | 一种基于文本多向量表示相互学习的垃圾评论过滤方法 | |
CN104462061B (zh) | 词语提取方法及提取装置 | |
CN106650610A (zh) | 一种人脸表情数据收集方法及装置 | |
CN109359198A (zh) | 一种文本分类方法及装置 | |
CN106844671A (zh) | 医学文献智能处理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |