CN103279548A - 一种对网站进行无障碍检测的方法 - Google Patents
一种对网站进行无障碍检测的方法 Download PDFInfo
- Publication number
- CN103279548A CN103279548A CN2013102241154A CN201310224115A CN103279548A CN 103279548 A CN103279548 A CN 103279548A CN 2013102241154 A CN2013102241154 A CN 2013102241154A CN 201310224115 A CN201310224115 A CN 201310224115A CN 103279548 A CN103279548 A CN 103279548A
- Authority
- CN
- China
- Prior art keywords
- detection
- barrier
- free
- website
- accessibility
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明提供了一种对网站进行无障碍检测的方法。为了使残疾人能够获取无障碍的上网体验,帮助各类残疾人无障碍的获取各类公共信息服务,各类向残疾人提供公共信息服务的网站必须满足无障碍访问的要求。当今网络环境中的许多网页,还是存在一些设计上的问题,无法达到信息无障碍的标准。对网站进行全面和充分的无障碍检测,是对网站进行有效规范的无障碍改造的前提。本发明提供了一种对网站进行无障碍检测的方法,利用机器检测和有人工干预的半自动检测方式对目标网站进行无障碍检测并将检测结果保存至数据库,同时生成网站的无障碍检测结果分析、报表。
Description
技术领域
本发明涉及信息无障碍领域,尤其涉及一种对网站进行无障碍检测的方法。
背景技术
为了使残疾人能够获取无障碍的上网体验,帮助各类残疾人无障碍的获取各类公共信息服务,各类面向残疾人提供公共信息服务的网站必须满足无障碍访问的要求。
由于开发成本的问题以及开发者对网页的无障碍开发规范和标准不够了解和重视等原因,网页开发者在开发过程中往往不会特意去遵循无障碍网页的设计标准和规范,所以当今网络环境中的许多网页,还是存在一些设计上的问题,从而无法达到信息无障碍的标准。这就导致一部分残障人士很困难甚至无法从这些网页上获取信息。通过制定网站无障碍访问的标准规范,有效地规范、检测、改造各类公共信息网站,是实现网站无障碍和信息无障碍的重要基础。
发明内容
本发明提供了一种对网站进行无障碍检测的方法。利用机器检测和人工检测相结合的方式对目标网站进行无障碍检测并将检测结果保存至数据库,同时生成网站的无障碍检测结果分析、报表。无障碍检测是无障碍改造的前提,无障碍检测的结果直接影响到接下来的无障碍改造工作,因此,一种准确高效的检测方法对整个网站无障碍建设是十分必要的。
本发明提供了一种对网站进行无障碍检测的方法,包括以下步骤:
1)利用分布式爬虫技术和网页抽样技术,获取被检测网站的信息;
2)根据网站设计无障碍技术要求,利用机器检测和人工检测相结合的方式,对目标网站进行无障碍检测;
3)根据步骤2)得出的目标网站的无障碍检测结果,生成无障碍检测、数据分析报表。
进一步,步骤1)中,利用分布式爬虫技术和网页抽样技术,获取被检测网站的信息的方法包括以下步骤:
(1.1)确定被检测的目标网站;
(1.2)利用分布式爬虫的技术,抓取步骤1)中选中的目标网站的网页,形成本地镜像,作为检测集合;
(1.3)同时,当目标网站的网页数量较大时,利用网页抽样的方法技术从数量众多的页面中分析和选取数量适宜的,有代表性的网页,作为检测集合。
(1.4)对检测集合中的所有网页进行渲染,并将渲染结果保存至数据库。
进一步,步骤2)中,根据网站设计无障碍技术要求,利用机器自动检测和有人工干预的半自动检测方式,对目标网站进行无障碍检测,其特征在于,具体步骤为:
(2.1)对于明确具体的要求,比如,图片应该有alt属性,标签元素要有有效的for属性,网页上不能出现漂浮窗,可自动化的进行检测;
(2.2)对于涉及跳转机制、视频字幕、颜色传递信息等的要求,需要人工干预,可半自动化的进行检测;
(2.3)将目标网站的无障碍检测结果保存至数据库。
进一步,步骤3)中,根据目标网站的无障碍检测结果,生成无障碍检测、数据分析报表,其特征在于,具体步骤为:
对目标网站的无障碍检测结果进行梳理和总结,采用结果化的数据格式保存对各个页面的检测结果,并根据这些数据生成无障碍检测、数据分析报表。
附图说明
图1是本发明一种对网站进行无障碍检测的方法的流程图;
具体实施方式
下面将结合本发明中的附图,对本发明的技术方案进行清晰、完整地描述。基于本发明中的实施例,本领域普通技术人员在没有做创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的目的、技术方案及优点更加清楚明白,接下来将参照附图对本发明实施例进行详细的说明。
本发明一种对网站进行无障碍检测的方法,包括以下步骤:
1)利用分布式爬虫技术和网页抽样技术,获取被检测网站的信息;
2)根据网站设计无障碍技术要求,利用机器检测和人工检测相结合的方式,对目标网站进行无障碍检测;
3)根据步骤2)得出的目标网站的无障碍检测结果,生成无障碍检测、数据分析报表。
进一步,步骤1)中,利用分布式爬虫技术和网页抽样技术,获取被检测网站的信息的方法包括以下步骤:
(1.1)确定被检测的目标网站;
(1.2)利用分布式爬虫的技术,抓取步骤1)中选中的目标网站的网页,形成本地镜像,作为检测集合;
当网站的页面数急剧上升的时候,获取网页的时间就相应的同步增加,为了提高获取网站效率,可以利用分布式爬虫技术提高抓取整个网站信息。分布式网络爬虫包含多个爬虫,每个爬虫需要完成的任务和单个爬行器类似,它们从互联网上下载网页,并把网页保存在本地的磁盘,从中抽取URL并沿着这些URL的指向继续爬行。由于并行爬行器需要分割下载任务,可能爬虫会将自己抽取的URL发送给其他爬虫。这些爬虫可能分布在同一个局域网之中,或者分散在不同的地理位置。将获取的被检测网站的信息保存至本地镜像,使得检测工作可以在本地单机进行,加快检测速度。
(1.3)同时,当目标网站的网页数量较大时,利用网页抽样的方法技术从数量众多的页面中分析和选取数量适宜的,有代表性的网页,作为检测集合。
一个大型网站会有几十万、百万数目的页面数,对每个页面都进行同样的检测是高成本、低效率、不切实际的做法。可以利用基于聚类的网页采样技术,从数量众多的页面中分析和选取数量适宜的,有代表性的网页,用以检测。
(1.4)对检测集合中的所有网页进行渲染,并将渲染结果保存至数据库。
由于网页检测工作涉及部分动态生成的结果,需要将网页加载到定制的Webkit引擎进行渲染,提取检测需要的渲染结果,并保存至数据库。
进一步,步骤2)中,根据网站设计无障碍技术要求,利用机器自动检测和有人工干预的半自动检测方式,对目标网站进行无障碍检测,其特征在于,具体步骤为:
(2.1)对于明确具体的要求,比如,图片应该有alt属性,标签元素要有有效的for属性,网页上不能出现漂浮窗,可自动化的进行检测;
(2.2)对于涉及跳转机制、视频字幕、颜色传递信息等的要求,无法通过现有的技术实现及其自动化检测,但是可以通过人工干预,半自动化的进行检测;
(2.3)将目标网站的无障碍检测结果保存至数据库;
进一步,步骤3)中,根据目标网站的无障碍检测结果,生成无障碍检测、数据分析报表;
无障碍检测分析挖掘、报表系统是对无障碍检测结果的梳理和总结,它采用结构化的数据格式保存对各个页面的检测结果,并根据这些数据生成检测报表,评估被检测的网站。生成的检测报表主要包括以下内容:首先是检测结果总览,其汇总了检测到的所有错误数目信息,用图表的方式向用户展示错误的分布的总体情况;还有错误分类统计分析,即通过对可感知性、可操作性、兼容性等方面分别汇总错误页面数、错误总数以及不符合的条目等;以及错误的详细信息,具体的指出各个页面中存在的不符合要求的地方、以及违背的标准等。
本发明的技术方案中,利用机器检测和人工检测相结合的方式对目标网站进行无障碍检测并将检测结果保存至数据库,同时生成网站的无障碍检测结果分析、报表,为网站的无障碍改造提供了重要依据。
最后,应当指出,以上实施例仅是本发明较有代表性的例子。显然,本发明的技术方案并不限于上述实施例,还可以有许多变形。本领域的普通技术人员可在不脱离本发明的发明思想情况下,对于上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的最大范围。
Claims (4)
1.一种对网站进行无障碍检测的方法,其特征在于,包括以下步骤:
1)利用分布式爬虫技术和网页抽样技术,获取被检测网站的信息;
2)根据网站设计无障碍技术要求,利用机器检测和有人工干预的半自动检测方式,对目标网站进行无障碍检测;
3)根据步骤2)得出的目标网站的无障碍检测结果,生成无障碍检测、数据分析报表。
2.根据权利要求1所述的方法,其特征在于:步骤1所述的利用分布式爬虫技术和网页抽样技术,获取被检测网站的信息,具体步骤为:
1.1)确定被检测的目标网站;
1.2)利用分布式爬虫的技术,抓取步骤1)中选中的目标网站的网页,形成本地镜像,作为检测集合;
1.3)同时,当目标网站的网页数量较大时,利用网页抽样的方法技术从数量众多的页面中分析和选取数量适宜的,有代表性的网页,作为检测集合。
1.4)对检测集合中的所有网页进行渲染,并将渲染结果保存至数据库。
3.根据权利要求1所述的方法,其特征在于:步骤2所述的根据网站设计无障碍技术要求,利用机器自动检测和有人工干预的半自动检测方式,对目标网站进行无障碍检测,具体步骤为:
2.1)对于明确具体的要求,比如,图片应该有alt属性,标签元素要有有效的for属性,网页上不能出现漂浮窗,可自动化的进行检测;
2.2)对于涉及跳转机制、视频字幕、颜色传递信息等的要求,需要人工干预,可半自动化的进行检测;
2.3)将目标网站的无障碍检测结果保存至数据库。
4.根据权利要求1所述的方法,其特征在于:步骤3所述的根据目标网站的无障碍检测结果,生成无障碍检测、数据分析报表,具体步骤为:
对目标网站的无障碍检测结果进行梳理和总结,采用结果化的数据格式保存对各个页面的检测结果,并根据这些数据生成无障碍检测、数据分析报表。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN2013102241154A CN103279548A (zh) | 2013-06-06 | 2013-06-06 | 一种对网站进行无障碍检测的方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN2013102241154A CN103279548A (zh) | 2013-06-06 | 2013-06-06 | 一种对网站进行无障碍检测的方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN103279548A true CN103279548A (zh) | 2013-09-04 |
Family
ID=49062067
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN2013102241154A Pending CN103279548A (zh) | 2013-06-06 | 2013-06-06 | 一种对网站进行无障碍检测的方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN103279548A (zh) |
Cited By (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105824941A (zh) * | 2016-03-21 | 2016-08-03 | 浙江大学 | 一种基于waqm的网站无障碍检测最佳抽样方法 |
| CN106294368A (zh) * | 2015-05-15 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 网络爬虫识别方法和装置 |
| CN106651159A (zh) * | 2016-12-08 | 2017-05-10 | 浙江大学 | 一种基于无障碍检测系统的用户评价方法 |
| CN106777015A (zh) * | 2016-12-08 | 2017-05-31 | 浙江大学 | 一种基于无障碍检测系统的数据分析方法 |
| CN106777014A (zh) * | 2016-12-08 | 2017-05-31 | 浙江大学 | 一种基于分类的自适应网站无障碍检测任务分配方法 |
| CN107329981A (zh) * | 2017-06-01 | 2017-11-07 | 北京京东尚科信息技术有限公司 | 页面检测的方法和装置 |
| US9996613B2 (en) | 2015-03-05 | 2018-06-12 | Tata Consultancy Services Limited | System and method for accessibility assessment of a web application |
| CN108960274A (zh) * | 2018-05-07 | 2018-12-07 | 浙江大学 | 一种针对网页信息无障碍检评估的主动学习方法 |
| CN110297751A (zh) * | 2018-03-22 | 2019-10-01 | 博彦科技(上海)有限公司 | 页面元素的检测方法、装置、存储介质及处理器 |
| US10678879B2 (en) | 2016-03-23 | 2020-06-09 | Tata Consultancy Services Limited | Method and system for selecting sample set for assessing the accessibility of a website |
| CN113779377A (zh) * | 2021-07-27 | 2021-12-10 | 浙江大学 | 基于无障碍检测结果去重的爬虫搜索方法 |
| CN115878481A (zh) * | 2022-12-19 | 2023-03-31 | 浙江大学 | 一种跨域协同的网站无障碍众包评测方法 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20100223550A1 (en) * | 2009-02-27 | 2010-09-02 | International Business Machines Corporation | Appratus, program and method for assisting a user in understanding content |
| CN101989303A (zh) * | 2010-11-02 | 2011-03-23 | 浙江大学 | 网站无障碍检测的自动化方法 |
| CN102662972A (zh) * | 2012-03-09 | 2012-09-12 | 浙江大学 | 一种面向视力残疾人网页内容无障碍访问的图片自动描述方法 |
-
2013
- 2013-06-06 CN CN2013102241154A patent/CN103279548A/zh active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20100223550A1 (en) * | 2009-02-27 | 2010-09-02 | International Business Machines Corporation | Appratus, program and method for assisting a user in understanding content |
| CN101989303A (zh) * | 2010-11-02 | 2011-03-23 | 浙江大学 | 网站无障碍检测的自动化方法 |
| CN102662972A (zh) * | 2012-03-09 | 2012-09-12 | 浙江大学 | 一种面向视力残疾人网页内容无障碍访问的图片自动描述方法 |
Non-Patent Citations (3)
| Title |
|---|
| 赵洋 等: "基于XSLT的Web易访问性评估工具的初步设计", 《图书情报工作》 * |
| 钱小龙 等: "无障碍网页的设计规范研究:ATAG1.0解读", 《现代远距离教育》 * |
| 陈威刚 等: "网络无障碍技术研究及成果", 《现代电信科技》 * |
Cited By (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9996613B2 (en) | 2015-03-05 | 2018-06-12 | Tata Consultancy Services Limited | System and method for accessibility assessment of a web application |
| CN106294368A (zh) * | 2015-05-15 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 网络爬虫识别方法和装置 |
| CN106294368B (zh) * | 2015-05-15 | 2019-11-05 | 阿里巴巴集团控股有限公司 | 网络爬虫识别方法和装置 |
| CN105824941A (zh) * | 2016-03-21 | 2016-08-03 | 浙江大学 | 一种基于waqm的网站无障碍检测最佳抽样方法 |
| CN105824941B (zh) * | 2016-03-21 | 2019-02-05 | 浙江大学 | 一种基于waqm的网站无障碍检测最佳抽样方法 |
| US10678879B2 (en) | 2016-03-23 | 2020-06-09 | Tata Consultancy Services Limited | Method and system for selecting sample set for assessing the accessibility of a website |
| CN106777014A (zh) * | 2016-12-08 | 2017-05-31 | 浙江大学 | 一种基于分类的自适应网站无障碍检测任务分配方法 |
| CN106777015A (zh) * | 2016-12-08 | 2017-05-31 | 浙江大学 | 一种基于无障碍检测系统的数据分析方法 |
| CN106777014B (zh) * | 2016-12-08 | 2020-03-27 | 浙江大学 | 一种基于分类的自适应网站无障碍检测任务分配方法 |
| CN106777015B (zh) * | 2016-12-08 | 2020-04-28 | 浙江大学 | 一种基于无障碍检测系统的数据分析方法 |
| CN106651159A (zh) * | 2016-12-08 | 2017-05-10 | 浙江大学 | 一种基于无障碍检测系统的用户评价方法 |
| CN107329981A (zh) * | 2017-06-01 | 2017-11-07 | 北京京东尚科信息技术有限公司 | 页面检测的方法和装置 |
| CN110297751A (zh) * | 2018-03-22 | 2019-10-01 | 博彦科技(上海)有限公司 | 页面元素的检测方法、装置、存储介质及处理器 |
| CN108960274A (zh) * | 2018-05-07 | 2018-12-07 | 浙江大学 | 一种针对网页信息无障碍检评估的主动学习方法 |
| CN113779377A (zh) * | 2021-07-27 | 2021-12-10 | 浙江大学 | 基于无障碍检测结果去重的爬虫搜索方法 |
| CN113779377B (zh) * | 2021-07-27 | 2024-03-22 | 浙江大学 | 基于无障碍检测结果去重的爬虫搜索方法 |
| CN115878481A (zh) * | 2022-12-19 | 2023-03-31 | 浙江大学 | 一种跨域协同的网站无障碍众包评测方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN103279548A (zh) | 一种对网站进行无障碍检测的方法 | |
| CN101989303B (zh) | 网站无障碍检测的自动化方法 | |
| CN103514234B (zh) | 一种页面信息提取方法和装置 | |
| JP2012519918A (ja) | ユーザーがウェブページをブラウズする挙動を視覚化するための方法、装置、およびシステム | |
| US8886660B2 (en) | Method and apparatus for tracking a change in a collection of web documents | |
| WO2010042199A1 (en) | Indexing online advertisements | |
| CN108763274B (zh) | 访问请求的识别方法、装置、电子设备及存储介质 | |
| CN103678509B (zh) | 生成网页模板的方法及装置 | |
| CN107153716B (zh) | 网页内容提取方法和装置 | |
| US20130091115A1 (en) | Automatic crawling of encoded dynamic urls | |
| CN113343312B (zh) | 基于前端埋点技术的页面防篡改方法及系统 | |
| OBrien et al. | RAMP–the Repository Analytics and Metrics Portal: A prototype web service that accurately counts item downloads from institutional repositories | |
| Arlitsch et al. | An analysis of use and performance data aggregated from 35 institutional repositories | |
| CN102664925A (zh) | 一种展现搜索结果的方法及装置 | |
| CN114513355A (zh) | 恶意域名检测方法、装置、设备及存储介质 | |
| US9465814B2 (en) | Annotating search results with images | |
| KR102124935B1 (ko) | 크라우드 소싱을 활용한 재난 모니터링 시스템, 재난 모니터링 방법 및 이를 수행하기 위한 컴퓨터 프로그램 | |
| CN116561402B (zh) | 网页中目标内容信息的获取方法、装置和服务器 | |
| CN103761257A (zh) | 基于移动浏览器的网页处理方法及系统 | |
| CN107329981B (zh) | 页面检测的方法和装置 | |
| CA2824977C (en) | Online content collection | |
| CN115410158B (zh) | 一种基于监控摄像头的地标提取方法 | |
| Dumrewal et al. | Citicafe: conversation-based intelligent platform for citizen engagement | |
| CN1768368A (zh) | 站点点击与网页上链接的关联 | |
| US20130311860A1 (en) | Identifying Referred Documents Based on a Search Result |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| WD01 | Invention patent application deemed withdrawn after publication | ||
| WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130904 |