发明内容
本发明的目的在于提供一种基于计算机的信息评价系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于计算机的信息评价系统,所述系统包括信息获取子系统、信息可用性预测子系统、信息处理子系统和信息评价子系统;
所述信息获取子系统用于对待评价信息进行获取,并将获取的待评价信息储存至计算机数据库;
所述信息可用性预测子系统用于对储存至计算机数据库的待评价信息的可用性进行预测,根据预测结果对储存的待评价信息进行筛选,并将筛选后的待评价信息传输至信息处理子系统;
所述信息处理子系统用于对信息可用性预测子系统传输的筛选后的待评价信息进行接收,基于接收内容,对待评价信息进行处理,并将处理后的待评价信息传输至信息评价子系统;
所述信息评价子系统用于对信息处理子系统传输的处理后的待评价信息进行接收,基于接收内容,对待评价信息进行评价。
进一步的,所述信息可用性预测子系统包括判断单元、确认单元、信息完整度预测单元和信息可用性预测单元;
所述判断单元对存储至计算机数据库的待评价信息的源IP进行寻找,若待评价信息的源IP为虚拟IP,则初步判断该待评价信息不可用,若待评价信息的源IP为真实IP,则初步判断该待评价信息能够被利用,并将能够被使用的待评价信息传输至信息完整度预测单元,将初步判断不可用的待评价信息和对应待评价信息的虚拟IP传输至确认单元;
所述确认单元对判断单元传输的初步判断不可用的待评价信息和对应待评价信息的虚拟IP进行接收,确认单元通过接收的虚拟IP寻找对应信息发布设备的设备编号,基于对应设备发布的历史信息举报情况,判断对应的待评价信息是否能够被利用,并将能够被利用的待评价信息传输至信息完整度预测单元,将不可用待评价信息对应的设备编号存储至计算机系统,当下次获取的待评价信息来自对应设备编号的设备时,自动对获取信息进行拦截,进而提高系统的工作效率;
所述信息完整度预测单元对判断单元和确认单元传输的能够被使用的待评价信息进行接收,信息完整度预测单元通过对接收的待评价信息的数据包丢失率和数据包内容的完整情况进行分析,基于分析结果,对待评价信息的完整度进行预测,并将预测结果传输至信息可用性预测单元;
所述信息可用性预测单元对信息完整度预测单元传输的预测结果进行接收,基于接收内容,对待评价信息的可用性进行预测,并将预测结果传输至信息处理子系统。
进一步的,所述信息处理子系统包括信息筛选单元、信息恢复单元和信息整合单元;
所述信息筛选单元对信息可用性预测单元传输的预测结果进行接收,若预测的待评价信息的可用性高于或等于设定阈值,则将对应待评价信息进行保留,若预测的待评价信息的可用性低于设定阈值,则将对应待评价信息进行删除,并将保留的待评价信息传输至信息恢复单元;
所述信息恢复单元对信息筛选单元传输的保留的待评价信息进行接收,信息恢复单元基于接收的待评价信息的完整度、真实性和实时性分析情况,对对应待评价信息进行恢复处理,并将恢复处理后的待评价信息传输至信息整合单元;
所述信息整合单元对信息恢复单元传输的待评价信息进行接收,基于接收信息,对相似度高的待评价信息进行整合,并将整合后的待评价信息传输至信息评价子系统。
进一步的,所述信息评价子系统包括信息分类单元和信息质量评价单元;
所述信息分类单元对信息整合单元传输的待评价信息进行接收,以及按照待评价信息所属类型,将接收的待评价信息进行分类处理,并将分类处理后的待评价信息传输至信息质量评价单元;
所述信息质量评价单元对信息分类单元传输的分类处理后的待评价信息进行接收,基于接收的待评价信息的使用领域和数据库中与之相似度高的相关信息的使用频率,对对应待评价信息的综合质量进行评价。
一种基于计算机的信息评价方法,所述信息完整度预测单元对待评价信息的完整度进行预测,具体的预测方法为:
S101:待评价信息在传输过程中,基于每个数据包的数据包长度和数据包发送频率,对每个数据包的丢包率进行计算,具体的计算公式K为:
其中,j=1,2,…,m表示待评价信息中数据包对应的编号,m表示j所能取到的最大值,d
j表示待评价信息在传输过程中第j个数据包的数据包长度,r
j表示待评价信息在传输过程中第j个数据包的数据包发送频率,D表示数据包的标准长度,在此标准长度下数据包不易丢失,200表示数据包的标准发送频率值,其单位为Mbps,在此标准发送频率下数据包丢失情况可忽略不计,
表示当
时,令
当
时,令
S102:对数据包中存储的重要信息所在位置进行获取,按照重要信息的重要程度,以重要程度最高的重要信息所在位置的起点为坐标原点,构建坐标系,对各数据包内容的完整情况进行分析,具体的分析公式W为:
其中,i=1,2,…,n表示对应数据包中存储的重要信息位置对应的编号,n表示i所能取到的最大值,r=1,2,…,R表示重要信息中信息丢失位置对应的编号,R表示r所能取到的最大值,
表示编号为i的重要信息中信息结束点对应的坐标,
表示编号为i的重要信息中信息丢失结束点对应的坐标,
表示编号为i的重要信息中信息起始点对应的坐标,
表示编号为i的重要信息中信息丢失起始点对应的坐标,
用于对每个重要信息存储位置的信息丢失比例进行计算,W表示预测的数据包内容的完整程度,y≠0,通过计算数据包中重要信息的丢失比例,对数据包内容的完整情况进行分析,保证计算结果更贴合实际情况,避免由于数据包中大量不重要信息的丢失,进而判断对应数据包的待评价信息不可用,进一步提高了预测精确度;
S103:基于S102的计算结果,结合对应数据包在传输过程中的丢失率,对待评价信息的完整度进行预测,具体的预测模型Q为:
其中,Kj表示第j个数据包的丢包率,Wj表示第j个数据包的数据包内容完整程度,利用待评价信息中各数据包的丢包率和数据包内容的完整程度,对待评价信息的完整度进行预测,避免待评价信息在传输过程中由于数据包丢失,导致待评价信息在分析过程中需要耗费大量时间,且在耗费大量时间后,可能存在信息不可用的情况,进而降低了系统的工作效率。
进一步的,所述信息可用性预测单元对待评价信息的可用性进行预测,具体方法为:
S201:对信息可用性预测单元接收的待评价信息的实时性和真实性进行确定,具体的确定方法为:
①.对待评价信息的关键词进行获取,基于获取的关键词,对数据库中与待评价信息匹配度高的内容进行采集,根据采集内容的发布时间,对待评价信息的实时程度进行预测,具体的预测公式为:
其中,h=1,2,…,g表示上述采集内容对应的编号,g表示h所能取到的最大值,t
h表示编号为h的采集内容的发布时间,t′表示对应待评价信息的发布时间,t″表示信息的更新周期,T表示待评价信息的实时程度;
②.对待评价信息的逻辑关系进行确定,将确定的逻辑关系与数据库中的逻辑关系进行匹配,根据匹配程度对待评价信息的真实程度进行确定,利用待评价信息的逻辑关系对待评价信息的真实性进行确定,是因为信息的真实性主要依赖于逻辑关系是否成立,若逻辑关系不成立,则即使信息完整程度极高,信息也同样不可用,进一步了对信息的筛选效果;
S202:基于S201确定的待评价信息的真实程度和实时程度,结合S103预测的待评价信息的完整度,对待评价信息的可用性进行预测,具体的预测模型A为:
A=Q*T*S;
其中,S表示对应待评价信息的真实程度。
进一步的,所述信息恢复单元对待评价信息进行恢复处理的具体方法为:
S301:基于待评价信息的逻辑错误位置、待评价信息内容的丢失位置和信息丢失量,对待评价信息进行处理,具体的处理方法为:
a.判断待评价信息的逻辑错误位置和待评价信息内容的丢失位置是否一致,若不一致,则根据待评价信息的表述含义,对内容丢失位置的丢失信息进行恢复,恢复完成后,再根据与待评价信息逻辑关系匹配度最高的逻辑关系和信息丢失量,对恢复后的丢失信息进行调整;
b.若待评价信息的逻辑错误位置和待评价信息内容的丢失位置一致,则根据与待评价信息逻辑关系匹配度最高的逻辑关系和信息丢失量,对内容丢失位置的丢失信息进行恢复;
S302:根据预测的待评价信息的实时程度,对待评价信息中的过时表述位置进行确定,将确定的待评价信息中的过时表述与现有表述进行对比,根据对比结果,对S301处理后的待评价信息进行调整。
进一步的,所述信息整合单元对相似度高的待评价信息进行整合的具体方法为:
S401:对待评价信息在重要信息存储位置中的相关内容进行提取,并将提取的相关内容按照信息类型放置在对应的集合中;
S402:对放置在同一集合中的相关内容的相似度进行计算,基于计算结果,对相似度高的待评价信息进行获取,根据获取的待评价信息的频率,对对应待评价信息之间的相似度进行确定,基于确定结果,对待评价信息进行整合,基于待评价信息在各重要位置的相似度进行单独计算,避免待评价信息中出现的普遍用语对相似度计算结果产生影响,有利于提高信息的整合效果。
进一步的,所述信息质量评价单元对待评价信息的综合质量进行评价,具体的评价公式F为:
其中,α表示数据库中与待评价信息相似度高的相关信息的使用频率,c=1,2,…,z表示待评价信息的使用领域对应的编号,z表示c所能取到的最大值,β
c表示使用领域编号为c的待评价信息对应的重要系数,p
ij表示待评价信息中第j个数据包中编号为i的重要信息对应的信息点数量,P表示搜索软件中记载的待评价信息中第j个数据包中编号为i的重要信息的信息点平均数量,Q=1,2,…,o表示待评价信息中第j个数据包中编号为i的重要信息中的信息点对应的编号,o表示Q所能取到的最大值,l
q表示编号为Q的信息点的信息长度,L
q表示搜索软件中记载的编号为q的信息点的信息平均长度,利用
对待评价信息中各重要信息的表述深度进行计算,基于计算的表述深度对待评价信息的综合质量进行评价,有利于提高系统对待评价信息的评价精确度。
与现有技术相比,本发明所达到的有益效果是:
1.本发明通过对待评价信息的丢包率和待评价信息中各数据包内容的完整情况,对待评价信息的完整度进行预测,基于预测结果,结合预测的待评价信息的实时性和真实性,对待评价信息的可用性进行预测,在预测过程中,主要通过对待评价信息中的重要信息进行处理,以待评价信息中对应重要信息的处理结果作为待评价信息的处理结果,减少了系统的工作强度,进一步提高了系统的工作效率,且降低了系统的失误率。
2.本发明通过角度关系对待评价信息中重要信息的丢失比例进行计算,此过程无需对丢失信息的丢失长度进行计算,有效避免误差的产生,且角度关系相较于数据更加直观,有利于对计算结果进行快速复查,进一步提高了系统的计算精度。
3.本发明通过对待评价信息的所属类型进行分析,基于分析结果,利用待评价信息的使用领域和数据库中与待评价信息相似度高的相关信息的使用频率,对待评价信息中各信息点的表述深度进行计算,基于计算的表述深度对待评价信息的综合质量进行评价,有利于提高系统对待评价信息的评价精度。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供技术方案:一种基于计算机的信息评价系统,系统包括信息获取子系统、信息可用性预测子系统、信息处理子系统和信息评价子系统;
信息获取子系统用于对待评价信息进行获取,并将获取的待评价信息储存至计算机数据库;
信息可用性预测子系统用于对储存至计算机数据库的待评价信息的可用性进行预测,根据预测结果对储存的待评价信息进行筛选,并将筛选后的待评价信息传输至信息处理子系统;
信息可用性预测子系统包括判断单元、确认单元、信息完整度预测单元和信息可用性预测单元;
判断单元对存储至计算机数据库的待评价信息的源IP进行寻找,若待评价信息的源IP为虚拟IP,则初步判断该待评价信息不可用,若待评价信息的源IP为真实IP,则初步判断该待评价信息能够被利用,并将能够被使用的待评价信息传输至信息完整度预测单元,将初步判断不可用的待评价信息和对应待评价信息的虚拟IP传输至确认单元;
确认单元对判断单元传输的初步判断不可用的待评价信息和对应待评价信息的虚拟IP进行接收,确认单元通过接收的虚拟IP寻找对应信息发布设备的设备编号,基于对应设备发布的历史信息举报情况,判断对应的待评价信息是否能够被利用,并将能够被利用的待评价信息传输至信息完整度预测单元,将不可用待评价信息对应的设备编号存储至计算机系统;
信息完整度预测单元对判断单元和确认单元传输的能够被使用的待评价信息进行接收,信息完整度预测单元通过对接收的待评价信息的数据包丢失率和数据包内容的完整情况进行分析,基于分析结果,对待评价信息的完整度进行预测,并将预测结果传输至信息可用性预测单元;信息完整度预测单元对待评价信息的完整度进行预测,具体的预测方法为:
S101:待评价信息在传输过程中,基于每个数据包的数据包长度和数据包发送频率,对每个数据包的丢包率进行计算,具体的计算公式K为:
其中,j=1,2,…,m表示待评价信息中数据包对应的编号,m表示j所能取到的最大值,d
j表示待评价信息在传输过程中第j个数据包的数据包长度,r
j表示待评价信息在传输过程中第j个数据包的数据包发送频率,D表示数据包的标准长度,在此标准长度下数据包不易丢失,200表示数据包的标准发送频率值,其单位为Mbps,在此标准发送频率下数据包丢失情况可忽略不计,
表示当
时,令
当
时,令
S102:对数据包中存储的重要信息所在位置进行获取,按照重要信息的重要程度,以重要程度最高的重要信息所在位置的起点为坐标原点,构建坐标系,对各数据包内容的完整情况进行分析,具体的分析公式W为:
其中,i=1,2,…,n表示对应数据包中存储的重要信息位置对应的编号,n表示i所能取到的最大值,r=1,2,…,R表示重要信息中信息丢失位置对应的编号,R表示r所能取到的最大值,
表示编号为i的重要信息中信息结束点对应的坐标,
表示编号为i的重要信息中信息丢失结束点对应的坐标,
表示编号为i的重要信息中信息起始点对应的坐标,
表示编号为i的重要信息中信息丢失起始点对应的坐标,
用于对每个重要信息存储位置的信息丢失比例进行计算,W表示预测的数据包内容的完整程度,通过计算数据包中重要信息的丢失比例,对数据包内容的完整情况进行分析,保证计算结果更贴合实际情况,避免由于数据包中大量不重要信息的丢失,进而判断对应数据包的待评价信息不可用,进一步提高了预测精确度;
S103:基于S102的计算结果,结合对应数据包在传输过程中的丢失率,对待评价信息的完整度进行预测,具体的预测模型Q为:
其中,Kj表示第j个数据包的丢包率,Wj表示第j个数据包的数据包内容完整程度,利用待评价信息中各数据包的丢包率和数据包内容的完整程度,对待评价信息的完整度进行预测,避免待评价信息在传输过程中由于数据包丢失,导致待评价信息在分析过程中需要耗费大量时间,且在耗费大量时间后,可能存在信息不可用的情况,进而降低了系统的工作效率;
信息可用性预测单元对信息完整度预测单元传输的预测结果进行接收,基于接收内容,对待评价信息的可用性进行预测,并将预测结果传输至信息处理子系统;信息可用性预测单元对待评价信息的可用性进行预测,具体方法为:
S201:对信息可用性预测单元接收的待评价信息的实时性和真实性进行确定,具体的确定方法为:
①.对待评价信息的关键词进行获取,基于获取的关键词,对数据库中与待评价信息匹配度高的内容进行采集,根据采集内容的发布时间,对待评价信息的实时程度进行预测,具体的预测公式为:
其中,h=1,2,…,g表示上述采集内容对应的编号,g表示h所能取到的最大值,t
h表示编号为h的采集内容的发布时间,t′表示对应待评价信息的发布时间,t″表示信息的更新周期,T表示待评价信息的实时程度;
②.对待评价信息的逻辑关系进行确定,将确定的逻辑关系与数据库中的逻辑关系进行匹配,根据匹配程度对待评价信息的真实程度进行确定,利用待评价信息的逻辑关系对待评价信息的真实性进行确定,是因为信息的真实性主要依赖于逻辑关系是否成立,若逻辑关系不成立,则即使信息完整程度极高,信息也同样不可用,进一步了对信息的筛选效果;
S202:基于S201确定的待评价信息的真实程度和实时程度,结合S103预测的待评价信息的完整度,对待评价信息的可用性进行预测,具体的预测模型A为:
A=Q*T*S;
其中,S表示对应待评价信息的真实程度;
信息处理子系统用于对信息可用性预测子系统传输的筛选后的待评价信息进行接收,基于接收内容,对待评价信息进行处理,并将处理后的待评价信息传输至信息评价子系统;
信息处理子系统包括信息筛选单元、信息恢复单元和信息整合单元;
信息筛选单元对信息可用性预测单元传输的预测结果进行接收,若预测的待评价信息的可用性高于或等于设定阈值,则将对应待评价信息进行保留,若预测的待评价信息的可用性低于设定阈值,则将对应待评价信息进行删除,并将保留的待评价信息传输至信息恢复单元;
信息恢复单元对信息筛选单元传输的保留的待评价信息进行接收,信息恢复单元基于接收的待评价信息的完整度、真实性和实时性分析情况,对对应待评价信息进行恢复处理,并将恢复处理后的待评价信息传输至信息整合单元;信息恢复单元对待评价信息进行恢复处理的具体方法为:
S301:基于待评价信息的逻辑错误位置、待评价信息内容的丢失位置和信息丢失量,对待评价信息进行处理,具体的处理方法为:
a.判断待评价信息的逻辑错误位置和待评价信息内容的丢失位置是否一致,若不一致,则根据待评价信息的表述含义,对内容丢失位置的丢失信息进行恢复,恢复完成后,再根据与待评价信息逻辑关系匹配度最高的逻辑关系和信息丢失量,对恢复后的丢失信息进行调整;
b.若待评价信息的逻辑错误位置和待评价信息内容的丢失位置一致,则根据与待评价信息逻辑关系匹配度最高的逻辑关系和信息丢失量,对内容丢失位置的丢失信息进行恢复;
S302:根据预测的待评价信息的实时程度,对待评价信息中的过时表述位置进行确定,将确定的待评价信息中的过时表述与现有表述进行对比,根据对比结果,对S301处理后的待评价信息进行调整;
信息整合单元对信息恢复单元传输的待评价信息进行接收,基于接收信息,对相似度高的待评价信息进行整合,并将整合后的待评价信息传输至信息评价子系统;信息整合单元对相似度高的待评价信息进行整合的具体方法为:
S401:对待评价信息在重要信息存储位置中的相关内容进行提取,并将提取的相关内容按照信息类型放置在对应的集合中;
S402:对放置在同一集合中的相关内容的相似度进行计算,基于计算结果,对相似度高的待评价信息进行获取,根据获取的待评价信息的频率,对对应待评价信息之间的相似度进行确定,基于确定结果,对待评价信息进行整合,基于待评价信息在各重要位置的相似度进行单独计算,避免待评价信息中出现的普遍用语对相似度计算结果产生影响,有利于提高信息的整合效果。
信息评价子系统用于对信息处理子系统传输的处理后的待评价信息进行接收,基于接收内容,对待评价信息进行评价;
信息评价子系统包括信息分类单元和信息质量评价单元;
信息分类单元对信息整合单元传输的待评价信息进行接收,以及按照待评价信息所属类型,将接收的待评价信息进行分类处理,并将分类处理后的待评价信息传输至信息质量评价单元;
信息质量评价单元对信息分类单元传输的分类处理后的待评价信息进行接收,基于接收的待评价信息的使用领域和数据库中与之相似度高的相关信息的使用频率,对对应待评价信息的综合质量进行评价;信息质量评价单元对待评价信息的综合质量进行评价,具体的评价公式F为:
其中,α表示数据库中与待评价信息相似度高的相关信息的使用频率,c=1,2,…,z表示待评价信息的使用领域对应的编号,z表示c所能取到的最大值,β
c表示使用领域编号为c的待评价信息对应的重要系数,p
ij表示待评价信息中第j个数据包中编号为i的重要信息对应的信息点数量,P表示搜索软件中记载的待评价信息中第j个数据包中编号为i的重要信息的信息点平均数量,Q=1,2,…,o表示待评价信息中第j个数据包中编号为i的重要信息中的信息点对应的编号,o表示Q所能取到的最大值,l
q表示编号为Q的信息点的信息长度,L
q表示搜索软件中记载的编号为q的信息点的信息平均长度,利用
对待评价信息中各重要信息的表述深度进行计算,基于计算的表述深度对待评价信息的综合质量进行评价,有利于提高系统对待评价信息的评价精确度。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。