CN104765747A - 网页处理方法及装置 - Google Patents

网页处理方法及装置 Download PDF

Info

Publication number
CN104765747A
CN104765747A CN201410005882.0A CN201410005882A CN104765747A CN 104765747 A CN104765747 A CN 104765747A CN 201410005882 A CN201410005882 A CN 201410005882A CN 104765747 A CN104765747 A CN 104765747A
Authority
CN
China
Prior art keywords
webpage
contrasted
web page
content
page contents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410005882.0A
Other languages
English (en)
Other versions
CN104765747B (zh
Inventor
张亚龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201410005882.0A priority Critical patent/CN104765747B/zh
Publication of CN104765747A publication Critical patent/CN104765747A/zh
Application granted granted Critical
Publication of CN104765747B publication Critical patent/CN104765747B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种网页处理方法及装置,其方法包括:获取待对比的网页;获取网页内容对比项;基于获取的网页内容对比项,并按照设定的对比策略,对待对比的网页的内容进行对比分析;根据对比分析结果生成对比报告并展示。本发明可以有效查找不同网页之间的区别,提高网页内容处理效率,并为用户处理不同网页提供方便。

Description

网页处理方法及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种网页处理方法及装置。
背景技术
目前,互联网已覆盖人们的日常生活中,人们几乎每天都要浏览大量的网页新闻,收发邮件等。特别是IT从业者,每天需要以邮件形式面对大量的测试报告,而这些测试报告通常情况下只有细微的差距,如果人工查找不同测试报告之间的区别则会浪费大量时间。
发明内容
本发明实施例提供一种网页处理方法及装置,旨在有效查找不同网页之间的区别,提高网页内容处理效率。
本发明实施例提出一种网页处理方法,包括:
获取待对比的网页;
获取网页内容对比项;
基于获取的所述网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析;
根据对比分析结果生成对比报告并展示。
本发明实施例还提出一种网页处理装置,包括:
网页获取模块,用于获取待对比的网页;
对比项获取模块,用于获取网页内容对比项;
对比分析模块,用于基于获取的所述网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析;
生成展示模块,用于根据对比分析结果生成对比报告并展示。
本发明实施例提出的一种网页处理方法及装置,通过获取待对比的网页,获取网页内容对比项,基于获取的网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析;根据对比分析结果生成对比报告并展示,由此可以有效查找不同网页之间的区别,提高网页内容处理效率,并为用户处理不同网页提供方便。
附图说明
图1是本发明网页处理方法第一实施例的流程示意图;
图2是本发明实施例中网页处理的一种实例的对比结果展示示意图;
图3是本发明实施例中基于获取的所述网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析的一种流程示意图;
图4是本发明实施例中基于获取的所述网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析的另一种流程示意图;
图5是本发明网页处理方法第二实施例的流程示意图;
图6是本发明网页处理装置第一实施例的功能模块示意图;
图7是本发明网页处理装置实施例中对比分析模块的一种结构示意图;
图8是本发明网页处理装置实施例中对比分析模块的另一种结构示意图;
图9是本发明网页处理装置第二实施例的功能模块示意图。
为了使本发明的技术方案更加清楚、明了,下面将结合附图作进一步详述。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明第一实施例提出一种网页处理方法,包括:
步骤S101,获取待对比的网页;
本实施例方法运行的硬件环境可以为手机、平板电脑、PC等网络终端。在该网络终端上设置有客户端交互界面,用户可以通过操作该客户端交互界面来实现对不同的网页的选取及对比操作。
其中,网页可以为具有URL网址的普通网页,也可以为邮箱的邮件页面,或者还可以为通过网络访问的其他网络页面。
由于现有技术中,当用户需要区分不同网页时,只能对网页一个个进行核对。比如,IT从业者每天需要以邮件形式面对大量的测试报告,虽然这些测试报告通常情况下只有细微的差距,但还是需要通过人工一个个查找;或者,节日期间,用户利用网络发送祝福邮件,针对不同的对象,通常使用不同的称呼作为一种礼节,但需要重复修改邮件,显得尤为麻烦。
本实施例可以实现对不同网页之间选定的关键字内容进行快速查找,以提高网页内容的处理效率。
具体地,首先,获取待对比的两个或多个网页。
在客户端操作界面上,本实施例根据不同的网页类型设置有相应的网页对比功能选项,比如,对于普通的网页,可以设置网页对比功能选项为浏览器插件,对于邮件类网页,则可以设置网页对比功能选项为邮箱。
用户可以根据不同的网页类型,触发相应的网页对比功能,选取相应的网页进行对比。
作为一种实施方式,当用户选择的网页对比功能的类型为浏览器插件时,终端根据用户的操作指令,获取待对比的网页的网址,根据该网址导出待对比的网页。
作为另一种实施方式,当用户选择的网页对比功能的类型为邮箱时,终端根据用户的操作指令,获取待对比的邮件名称,比如用户在登陆邮箱后,勾选相应的邮件,之后,根据用户选择的邮件名称导出待对比的邮件页面。
步骤S102,获取网页内容对比项;
其中,网页内容对比项为进行网页对比的关键字,以邮件测试报告为例,在测试报告中可以选择“目录”、“更新模块”等作为对比项。因为作为网页内容,大部分都是HTML形式的网页内容,而HTML具有很清晰的结构,所以,通过不同的标签(关键字)即能够快速定位网页中的相关内容。
上述网页内容对比项可以由系统预先设置在客户端操作界面上,供用户选择,也可以由用户自定义设置网页内容对比项。
其中,供用户选择的网页内容对比项可以通过以下方式设置:
在获取到待对比的网页后,根据获取的待对比的网页的内容导出或生成文档索引(目录);然后,根据导出或生成的文档索引,整合生成关键字,作为网页内容对比项供用户选择。
步骤S103,基于获取的所述网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析;
其中,对比策略可以采用以下方式设置:
根据用户选择的条件,指定相应的检索策略,比如确定“关键字”、“检索算法”等等,以便根据此检索策略,快速准确的定位对比网页文档相关内容。
之后,对获取的网页文档相关内容进行对比分析,判断两个网页中,基于上述关键字所对应的网页文档相关内容是否相同或相似,由此,快速区分出两个或多个对比网页的内容差异。
步骤S104,根据对比分析结果生成对比报告并展示。
在通过对比分析得到分析结果后,根据此对比分析结果,在对比的网页上,可以对属于相同内容或者差异内容的网页文档相关内容进行标注,或者,对定位属于相同内容的网页文档相关内容,以及定位属于差异内容的网页文档相关内容同时进行标注,并可以采用不同的颜色进行标识。
之后,基于标注后的网页生成对比报告,在对比报告中展示指定的对比项。后续,用户即可根据该展示的对比报告对网页中的差异内容进行修改,或者根据该展示的对比报告进行深入分析,比如可以根据展示结果判定两篇网页内容是否涉及抄袭等。
下面以具体实例对本实施例方案进行详细阐述。
如图2所示,若用户需要查看百度百科和维基百科对Google的评价,并且需要对比两个网站对Google产品的介绍:
首先可以在客户端操作界面上,在对比内容中分别输入两个网页地址,由此得到两个网页的内容。
然后,在对比项选择“产品”,即可展示出以“产品”为关键字的对比结果,并生成对比报告。
本实施例通过上述方案,通过获取待对比的网页,获取网页内容对比项,基于获取的网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析;根据对比分析结果生成对比报告并展示,由此可以有效查找不同网页之间的区别,提高网页内容处理效率,并为用户处理不同网页提供方便;此外通过生成对比报告,实现了终端的人性化,提高了终端的可交互性。
更为具体地,作为一种实施方式,如图3所示,上述步骤S103:基于获取的所述网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析的过程可以包括:
步骤S1031,以获取的所述网页内容对比项作为搜索关键词,从所述待对比的网页中搜索网页文档相关内容;
步骤S1032,对多个待对比网页的对应的网页文档相关内容进行对比分析;
步骤S1033,匹配对应的网页文档相关内容基于该关键词的相似度是否达到预定阈值;如是,则进入步骤S1034;否则,进入步骤S1035;
步骤S1034,判定对比的网页文档相关内容为相同内容;
步骤S1035,判定对比的网页文档相关内容为差异内容。
具体地,以获取的网页内容对比项作为搜索关键词,从待对比的网页中搜索网页文档相关内容;然后,对多个待对比网页的对应的网页文档相关内容进行对比分析,匹配对应的网页文档相关内容基于该关键词的相似度是否达到预定阈值;如是,则判定对比的网页文档相关内容为相同内容,否则,判定对比的网页文档相关内容为差异内容。
由此,通过上述方案可以实现对待对比的网页的内容进行有效的对比分析,得到对比分析结果,后续,即可根据对比分析结果,在对比的网页上,对相同内容和/或差异内容的网页文档相关内容进行标注;然后基于标注后的网页生成对比报告并展示。
作为另一种实施方式,如图4所示,在上述步骤S1031:从待对比的网页中搜索网页文档相关内容的之后还可以包括:
步骤S1036,对所述对应的网页文档相关内容进行过滤或补全处理。
其中,对网页文档相关内容进行过滤或补全处理,主要是为了提高进行对比的多个网页内容的可对比性,进而可以提高网页对比的准确性和效率。
在对网页文档相关内容进行过滤或补全处理时,可以依据历史数据、人为经验以及外部资料等,对搜索到的网页文档相关内容进行相应处理,对不符合对比条件的内容进行过滤,对符合对比条件的内容进行补全,从而可以提高对比的多个网页内容的可对比性,进而可以提高网页对比的准确性和效率。
如图5所示,本发明第二实施例提出一种网页处理方法,在上述第一实施例的基础上,在上述步骤S103之后,还可以包括:
步骤S105,根据所述对比报告对相应的网页内容进行分析和/或修改操作。
本实施例与上述第一实施例的区别在于,本实施例还包括得到展示报告后,依据展示的对比报告对相应的网页内容进行处理的方案。
具体地,在用户得到对比报告展示的指定的对比项的对比结果后,可以根据自身需要,根据该结果进行后续的网页内容处理。比如,用户可根据该展示的对比报告对网页中的差异内容进行修改,或者根据该展示的对比报告进行深入分析,比如可以根据展示结果判定两篇网页内容是否涉及抄袭等。
由此通过上述方案,可以有效查找不同网页之间的区别,提高网页内容处理效率,并为用户处理不同网页提供方便;此外通过生成对比报告,实现了终端的人性化,提高了终端的可交互性。
如图6所示,本发明第一实施例提出一种网页处理装置,包括:网页获取模块201、对比项获取模块202、对比分析模块203及生成展示模块204,其中:
网页获取模块201,用于获取待对比的网页;
对比项获取模块202,用于获取网页内容对比项;
对比分析模块203,用于基于获取的所述网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析;
生成展示模块204,用于根据对比分析结果生成对比报告并展示。
本实施例网页处理装置可以设置在手机、平板电脑、PC等网络终端上。在该网络终端上设置有客户端交互界面,用户可以通过操作该客户端交互界面来实现对不同的网页的选取及对比操作。
其中,网页可以为具有URL网址的普通网页,也可以为邮箱的邮件页面,或者还可以为通过网络访问的其他网络页面。
由于现有技术中,当用户需要区分不同网页时,只能对网页一个个进行核对。比如,IT从业者每天需要以邮件形式面对大量的测试报告,虽然这些测试报告通常情况下只有细微的差距,但还是需要通过人工一个个查找;或者,节日期间,用户利用网络发送祝福邮件,针对不同的对象,通常使用不同的称呼作为一种礼节,但需要重复修改邮件,显得尤为麻烦。
本实施例可以实现对不同网页之间选定的关键字内容进行快速查找,以提高网页内容的处理效率。
具体地,首先,获取待对比的两个或多个网页。
在客户端操作界面上,本实施例根据不同的网页类型设置有相应的网页对比功能选项,比如,对于普通的网页,可以设置网页对比功能选项为浏览器插件,对于邮件类网页,则可以设置网页对比功能选项为邮箱。
用户可以根据不同的网页类型,触发相应的网页对比功能,选取相应的网页进行对比。
作为一种实施方式,当用户选择的网页对比功能的类型为浏览器插件时,终端根据用户的操作指令,获取待对比的网页的网址,根据该网址导出待对比的网页。
作为另一种实施方式,当用户选择的网页对比功能的类型为邮箱时,终端根据用户的操作指令,获取待对比的邮件名称,比如用户在登陆邮箱后,勾选相应的邮件,之后,根据用户选择的邮件名称导出待对比的邮件页面。
其中,网页内容对比项为进行网页对比的关键字,以邮件测试报告为例,在测试报告中可以选择“目录”、“更新模块”等作为对比项。因为作为网页内容,大部分都是HTML形式的网页内容,而HTML具有很清晰的结构,所以,通过不同的标签(关键字)即能够快速定位网页中的相关内容。
上述网页内容对比项可以由系统预先设置在客户端操作界面上,供用户选择,也可以由用户自定义设置网页内容对比项。
其中,供用户选择的网页内容对比项可以通过以下方式设置:
在获取到待对比的网页后,根据获取的待对比的网页的内容导出或生成文档索引(目录);然后,根据导出或生成的文档索引,整合生成关键字,作为网页内容对比项供用户选择。
然后,基于获取的所述网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析;
其中,对比策略可以采用以下方式设置:
根据用户选择的条件,指定相应的检索策略,比如确定“关键字”、“检索算法”等等,以便根据此检索策略,快速准确的定位对比网页文档相关内容。
之后,对获取的网页文档相关内容进行对比分析,判断两个网页中,基于上述关键字所对应的网页文档相关内容是否相同或相似,由此,快速区分出两个或多个对比网页的内容差异。
在通过对比分析得到分析结果后,根据此对比分析结果,在对比的网页上,可以对属于相同内容或者差异内容的网页文档相关内容进行标注,或者,对定位属于相同内容的网页文档相关内容,以及定位属于差异内容的网页文档相关内容同时进行标注,并可以采用不同的颜色进行标识。
之后,基于标注后的网页生成对比报告,在对比报告中展示指定的对比项。后续,用户即可根据该展示的对比报告对网页中的差异内容进行修改,或者根据该展示的对比报告进行深入分析,比如可以根据展示结果判定两篇网页内容是否涉及抄袭等。
下面以具体实例对本实施例方案进行详细阐述。
如图2所示,若用户需要查看百度百科和维基百科对Google的评价,并且需要对比两个网站对Google产品的介绍:
首先可以在客户端操作界面上,在对比内容中分别输入两个网页地址,由此得到两个网页的内容。
然后,在对比项选择“产品”,即可展示出以“产品”为关键字的对比结果,并生成对比报告。
本实施例通过上述方案,通过获取待对比的网页,获取网页内容对比项,基于获取的网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析;根据对比分析结果生成对比报告并展示,由此可以有效查找不同网页之间的区别,提高网页内容处理效率,并为用户处理不同网页提供方便;此外通过生成对比报告,实现了终端的人性化,提高了终端的可交互性。
更为具体地,如图7所示,作为一种实施方式,上述对比分析模块203可以包括:搜索单元2031、对比分析单元2032及匹配判断单元2033,其中:
搜索单元2031,用于以获取的所述网页内容对比项作为搜索关键词,从所述待对比的网页中搜索网页文档相关内容;
对比分析单元2032,用于对多个待对比网页的对应的网页文档相关内容进行对比分析;
匹配判断单元2033,用于匹配对应的网页文档相关内容基于该关键词的相似度是否达到预定阈值;如是,则判定对比的网页文档相关内容为相同内容,否则,判定对比的网页文档相关内容为差异内容。
具体地,以获取的网页内容对比项作为搜索关键词,从待对比的网页中搜索网页文档相关内容;然后,对多个待对比网页的对应的网页文档相关内容进行对比分析,匹配对应的网页文档相关内容基于该关键词的相似度是否达到预定阈值;如是,则判定对比的网页文档相关内容为相同内容,否则,判定对比的网页文档相关内容为差异内容。
由此,通过上述方案可以实现对待对比的网页的内容进行有效的对比分析,得到对比分析结果,后续,即可根据对比分析结果,在对比的网页上,对相同内容和/或差异内容的网页文档相关内容进行标注;然后基于标注后的网页生成对比报告并展示。
如图8所示,作为另一种实施方式,上述对比分析模块203还可以包括:
处理单元2034,用于对所述对应的网页文档相关内容进行过滤或补全处理。
其中,对网页文档相关内容进行过滤或补全处理,主要是为了提高进行对比的多个网页内容的可对比性,进而可以提高网页对比的准确性和效率。
在对网页文档相关内容进行过滤或补全处理时,可以依据历史数据、人为经验以及外部资料等,对搜索到的网页文档相关内容进行相应处理,对不符合对比条件的内容进行过滤,对符合对比条件的内容进行补全,从而可以提高对比的多个网页内容的可对比性,进而可以提高网页对比的准确性和效率。
如图9所示,本发明第二实施例提出一种网页处理装置,在上述第一实施例的基础上,还包括:
分析操作模块204,用于根据所述对比报告对相应的网页内容进行分析和/或修改操作。
本实施例与上述第一实施例的区别在于,本实施例还包括得到展示报告后,依据展示的对比报告对相应的网页内容进行处理的方案。
具体地,在用户得到对比报告展示的指定的对比项的对比结果后,可以根据自身需要,根据该结果进行后续的网页内容处理。比如,用户可根据该展示的对比报告对网页中的差异内容进行修改,或者根据该展示的对比报告进行深入分析,比如可以根据展示结果判定两篇网页内容是否涉及抄袭等。
由此通过上述方案,可以有效查找不同网页之间的区别,提高网页内容处理效率,并为用户处理不同网页提供方便;此外通过生成对比报告,实现了终端的人性化,提高了终端的可交互性。
本发明实施例网页处理方法及装置,通过获取待对比的网页,获取网页内容对比项,基于获取的网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析;根据对比分析结果生成对比报告并展示,由此可以有效查找不同网页之间的区别,提高网页内容处理效率,并为用户处理不同网页提供方便。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (16)

1.一种网页处理方法,其特征在于,包括:
获取待对比的网页;
获取网页内容对比项;
基于获取的所述网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析;
根据对比分析结果生成对比报告并展示。
2.根据权利要求1所述的方法,其特征在于,所述获取待对比的网页的步骤包括:
响应用户的操作指令,触发网页对比功能;
当所述网页对比功能的类型为浏览器插件时,获取待对比的网页的网址,根据所述网址导出待对比的网页;
当所述网页对比功能的类型为邮箱时,获取待对比的邮件名称,根据所述邮件名称导出待对比的邮件页面。
3.根据权利要求1所述的方法,其特征在于,所述基于获取的所述网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析的步骤包括:
以获取的所述网页内容对比项作为搜索关键词,从所述待对比的网页中搜索网页文档相关内容;
对多个待对比网页的对应的网页文档相关内容进行对比分析;
匹配对应的网页文档相关内容基于该关键词的相似度是否达到预定阈值;如是,则判定对比的网页文档相关内容为相同内容,否则,判定对比的网页文档相关内容为差异内容。
4.根据权利要求3所述的方法,其特征在于,所述从待对比的网页中搜索网页文档相关内容的步骤之后还包括:
对所述对应的网页文档相关内容进行过滤或补全处理。
5.根据权利要求3所述的方法,其特征在于,所述根据对比分析结果生成对比报告并展示的步骤包括:
根据对比分析结果,在对比的网页上,对相同内容和/或差异内容的网页文档相关内容进行标注;
基于标注后的网页生成对比报告并展示。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述获取网页内容对比项的步骤包括:
获取用户选择的网页内容对比项,或者获取用户自定义设置的网页内容对比项。
7.根据权利要求6所述的方法,其特征在于,所述获取待对比的网页的步骤之后还包括:
根据获取的待对比的网页的内容导出或生成文档索引;
根据所述导出或生成的文档索引,整合生成关键字,作为网页内容对比项供用户选择。
8.根据权利要求1-5中任一项所述的方法,其特征在于,还包括:
根据所述对比报告对相应的网页内容进行分析和/或修改操作。
9.一种网页处理装置,其特征在于,包括:
网页获取模块,用于获取待对比的网页;
对比项获取模块,用于获取网页内容对比项;
对比分析模块,用于基于获取的所述网页内容对比项,并按照设定的对比策略,对所述待对比的网页的内容进行对比分析;
生成展示模块,用于根据对比分析结果生成对比报告并展示。
10.根据权利要求9所述的装置,其特征在于,
所述网页获取模块,还用于响应用户的操作指令,触发网页对比功能;当所述网页对比功能的类型为浏览器插件时,获取待对比的网页的网址,根据所述网址导出待对比的网页;当所述网页对比功能的类型为邮箱时,获取待对比的邮件名称,根据所述邮件名称导出待对比的邮件页面。
11.根据权利要求9所述的装置,其特征在于,所述对比分析模块包括:
搜索单元,用于以获取的所述网页内容对比项作为搜索关键词,从所述待对比的网页中搜索网页文档相关内容;
对比分析单元,用于对多个待对比网页的对应的网页文档相关内容进行对比分析;
匹配判断单元,用于匹配对应的网页文档相关内容基于该关键词的相似度是否达到预定阈值;如是,则判定对比的网页文档相关内容为相同内容,否则,判定对比的网页文档相关内容为差异内容。
12.根据权利要求11所述的装置,其特征在于,所述对比分析模块还包括:
处理单元,用于对所述对应的网页文档相关内容进行过滤或补全处理。
13.根据权利要求11所述的装置,其特征在于,
所述生成展示模块,还用于根据对比分析结果,在对比的网页上,对相同内容和/或差异内容的网页文档相关内容进行标注;基于标注后的网页生成对比报告并展示。
14.根据权利要求9-13中任一项所述的装置,其特征在于,
所述对比项获取模块,还用于获取用户选择的网页内容对比项,或者获取用户自定义设置的网页内容对比项。
15.根据权利要求14所述的装置,其特征在于,
所述对比项获取模块,还用于根据获取的待对比的网页的内容导出或生成文档索引;根据所述导出或生成的文档索引,整合生成关键字,作为网页内容对比项供用户选择。
16.根据权利要求9-13中任一项所述的装置,其特征在于,还包括:
分析操作模块,用于根据所述对比报告对相应的网页内容进行分析和/或修改操作。
CN201410005882.0A 2014-01-06 2014-01-06 网页处理方法及装置 Active CN104765747B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410005882.0A CN104765747B (zh) 2014-01-06 2014-01-06 网页处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410005882.0A CN104765747B (zh) 2014-01-06 2014-01-06 网页处理方法及装置

Publications (2)

Publication Number Publication Date
CN104765747A true CN104765747A (zh) 2015-07-08
CN104765747B CN104765747B (zh) 2020-02-18

Family

ID=53647580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410005882.0A Active CN104765747B (zh) 2014-01-06 2014-01-06 网页处理方法及装置

Country Status (1)

Country Link
CN (1) CN104765747B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786713A (zh) * 2016-03-28 2016-07-20 努比亚技术有限公司 移动终端的分屏排查方法、装置及移动终端
CN109697231A (zh) * 2017-10-24 2019-04-30 北京国双科技有限公司 一种案件文书的显示方法、系统、存储介质和处理器
CN114968455A (zh) * 2022-04-29 2022-08-30 北京百度网讯科技有限公司 应用界面的报告生成方法、装置及电子设备
CN115118616A (zh) * 2022-04-29 2022-09-27 腾讯科技(深圳)有限公司 展示结果测试方法、装置、计算机设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770493A (zh) * 2009-01-04 2010-07-07 英业达股份有限公司 产生相容网页档案的系统及其方法
CN102737012A (zh) * 2011-04-06 2012-10-17 鸿富锦精密工业(深圳)有限公司 文本信息对比方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770493A (zh) * 2009-01-04 2010-07-07 英业达股份有限公司 产生相容网页档案的系统及其方法
CN102737012A (zh) * 2011-04-06 2012-10-17 鸿富锦精密工业(深圳)有限公司 文本信息对比方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘书一: "基于文本相似度的网页消重策略", 《计算机应用与软件》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786713A (zh) * 2016-03-28 2016-07-20 努比亚技术有限公司 移动终端的分屏排查方法、装置及移动终端
CN105786713B (zh) * 2016-03-28 2018-07-13 努比亚技术有限公司 移动终端的分屏排查方法、装置及移动终端
CN109697231A (zh) * 2017-10-24 2019-04-30 北京国双科技有限公司 一种案件文书的显示方法、系统、存储介质和处理器
CN114968455A (zh) * 2022-04-29 2022-08-30 北京百度网讯科技有限公司 应用界面的报告生成方法、装置及电子设备
CN115118616A (zh) * 2022-04-29 2022-09-27 腾讯科技(深圳)有限公司 展示结果测试方法、装置、计算机设备和存储介质
CN114968455B (zh) * 2022-04-29 2024-02-27 北京百度网讯科技有限公司 应用界面的报告生成方法、装置及电子设备
CN115118616B (zh) * 2022-04-29 2024-04-23 腾讯科技(深圳)有限公司 展示结果测试方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN104765747B (zh) 2020-02-18

Similar Documents

Publication Publication Date Title
CN106250513B (zh) 一种基于事件建模的事件个性化分类方法及系统
CN102236663B (zh) 一种基于垂直搜索的查询方法、系统和装置
CN106919625B (zh) 一种互联网用户属性识别方法和装置
CN110827112B (zh) 深度学习的商品推荐方法、装置、计算机设备及存储介质
CN104216881A (zh) 一种个性化标签的推荐方法及装置
CN103034680B (zh) 针对终端设备的数据交互方法及装置
US20140040228A1 (en) Displaying browse sequence with search results
CN103514181B (zh) 一种搜索方法和装置
CN103020128B (zh) 与终端设备交互数据的方法与装置
CN102035883A (zh) 一种在网络设备中用于优化网页的方法和设备
CN105677787B (zh) 信息搜索装置及信息搜索方法
CN111125566B (zh) 信息获取方法和装置、电子设备和存储介质
CN106339380A (zh) 常见问题信息的推荐方法及装置
CN101986306A (zh) 一种用于基于查询序列获取黄页信息的方法与设备
CN105930513A (zh) 一种浏览器历史记录排序方法及装置
CN107911448A (zh) 一种内容推送方法及装置
CN105718533A (zh) 信息推送方法和装置
CN103365876B (zh) 基于关系图谱生成网络操作辅助信息的方法与设备
CN104899236A (zh) 一种评论信息显示方法、装置及系统
CN104765747A (zh) 网页处理方法及装置
CN102314494A (zh) 一种用于处理网页内容的方法和设备
CN103426089B (zh) 商品导购系统及方法
CN112328805A (zh) 基于nlp的漏洞描述信息与数据库表的实体映射方法
CN111611484A (zh) 一种基于物品属性识别的股票推荐方法及系统
CN103678628A (zh) 信息推送方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant