KR20200010669A - 빅데이터 기반의 웹접근성 개선 장치 및 방법 - Google Patents

빅데이터 기반의 웹접근성 개선 장치 및 방법 Download PDF

Info

Publication number
KR20200010669A
KR20200010669A KR1020180078257A KR20180078257A KR20200010669A KR 20200010669 A KR20200010669 A KR 20200010669A KR 1020180078257 A KR1020180078257 A KR 1020180078257A KR 20180078257 A KR20180078257 A KR 20180078257A KR 20200010669 A KR20200010669 A KR 20200010669A
Authority
KR
South Korea
Prior art keywords
accessibility
web
image
vulnerability
web accessibility
Prior art date
Application number
KR1020180078257A
Other languages
English (en)
Other versions
KR102127635B1 (ko
Inventor
김현욱
Original Assignee
김현욱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김현욱 filed Critical 김현욱
Priority to KR1020180078257A priority Critical patent/KR102127635B1/ko
Publication of KR20200010669A publication Critical patent/KR20200010669A/ko
Application granted granted Critical
Publication of KR102127635B1 publication Critical patent/KR102127635B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

본 발명은 빅데이터 기반의 웹접근성 개선 장치 및 방법에 관한 것으로, 특정 웹페이지에 대한 소스코드(source code) 분석을 통해 적어도 하나의 웹접근성 엘리먼트(element)를 포함하는 웹접근성 엘리먼트 집합을 생성하는 웹접근성 엘리먼트 집합 생성부, 상기 웹접근성 엘리먼트 집합과 웹접근성 데이터베이스 간의 비교연산을 통해 상기 특정 웹페이지에 대해 이미지 접근성 및 건너뛰기 접근성 중 적어도 하나에 관한 취약성을 검출하는 취약성 검출부 및 상기 취약성이 검출되면 상기 취약성과 연관된 웹접근성 유형에 따라 상기 특정 웹페이지의 웹접근성을 자동으로 개선하는 웹접근성 개선부를 포함한다. 따라서, 본 발명은 웹페이지에 대해 자동으로 웹 접근성을 개선하여 시각장애인이 이용할 수 있도록 할 수 있다.

Description

빅데이터 기반의 웹접근성 개선 장치 및 방법{BIG DATA BASED WEB-ACCESSIBILITY IMPROVEMENT APPARATUS AND METHOD}
본 발명은 빅데이터 기반의 웹접근성 개선 기술에 관한 것으로, 보다 상세하게는 웹페이지에 대해 자동으로 웹 접근성을 개선하여 시각장애인이 이용할 수 있도록 하는 빅데이터 기반의 웹접근성 개선 장치 및 방법에 관한 것이다.
웹접근성(web accessibility)은 장애인, 고령자, 어린이 등 누구나 웹사이트에서 제공하는 정보를 비장애인과 동등하게 접근하고 이용할 수 있도록 보장하는 것을 의미한다. 웹사이트는 그림이나 사진들을 제공할 때 눈으로 볼 수 없는 경우를 대비하여 그림이나 사진을 대신할 수 있는 설명을 텍스트로 제공해야 하며, 동영상이나 오디오의 경우 청각장애인을 위한 음성정보를 문자로 제공해야 한다. 또한, 웹사이트는 마우스를 사용할 수 없는 사용자를 위하여 키보드만으로도 모든 콘텐츠에 접근하여 이용할 수 있도록 해야 하며, 움직임이 느린 사용자를 위해 시간조절기능을 제공해야 한다.
한국 공개특허공보 제10-2010-0111084(2010.10.14)호는 웹 접근성 체크 기능을 가지는 웹 컨텐츠 관리 시스템에 관한 것으로, 웹 컨텐츠를 쉽고 편리하게 관리할 수 있는 웹 컨텐츠 관리 시스템의 기능을 모두 가지고 있을 뿐만 아니라, 웹 사이트의 구축 시점 뿐만이 아니라 웹 사이트의 관리 및 운용 단계에서도 웹 접근성 문제가 있는 컨텐츠가 생산되지 않게 해 주고, 또한 웹 컨텐츠의 웹 접근성을 지속적이고 체계적으로 점검 할 수 있게 해 줄 수 있다.
한국 등록특허공보 제10-0823388(2008.02.14)호는 웹 접근성 서비스 제공방법 및 그 시스템에 관한 것으로, 웹 사이트 또는 그 웹사이트에 포함된 컨텐츠들의 웹 접근성 부합 여부를 검사하고, 웹 접근성에 부합되지 않는 경우에 관련 가이드 라인 및 해결책을 제시할 수 있는 효과가 있다.
한국 공개특허공보 제10-2010-0111084(2010.10.14)호 한국 등록특허공보 제10-0823388(2008.02.14)호
본 발명의 일 실시예는 웹페이지에 대해 자동으로 웹접근성을 개선하여 시각장애인이 이용할 수 있도록 하는 빅데이터 기반의 웹접근성 개선 장치 및 방법을 제공하고자 한다.
본 발명의 일 실시예는 이미지에 대한 대체 텍스트와 비정상 대체 텍스트 간의 유사도를 기초로 이미지 취약성을 검출하고 정상 대체 텍스트에 대한 검색 기록을 기초로 이미지 취약성을 개선할 수 있는 빅데이터 기반의 웹접근성 개선 장치 및 방법을 제공하고자 한다.
본 발명의 일 실시예는 링크 텍스트와 건너뛰기 링크 키워드 간의 동일성을 기초로 건너뛰기 취약성을 검출하여 건너뛰기 접근성을 개선할 수 있는 빅데이터 기반의 웹접근성 개선 장치 및 방법을 제공하고자 한다.
실시예들 중에서, 빅데이터 기반의 웹접근성 개선 장치는 특정 웹페이지에 대한 소스코드(source code) 분석을 통해 적어도 하나의 웹접근성 엘리먼트(element)를 포함하는 웹접근성 엘리먼트 집합을 생성하는 웹접근성 엘리먼트 집합 생성부, 상기 웹접근성 엘리먼트 집합과 웹접근성 데이터베이스 간의 비교연산을 통해 상기 특정 웹페이지에 대해 이미지 접근성 및 건너뛰기 접근성 중 적어도 하나에 관한 취약성을 검출하는 취약성 검출부 및 상기 취약성이 검출되면 상기 취약성과 연관된 웹접근성 유형에 따라 상기 특정 웹페이지의 웹접근성을 자동으로 개선하는 웹접근성 개선부를 포함한다.
상기 취약성 검출부는 상기 특정 웹페이지를 구성하는 적어도 하나의 이미지를 추출하고 상기 소스코드 분석을 통해 상기 적어도 하나의 이미지와 연관된 이미지 코드(code)로 구성된 이미지 코드 집합을 생성할 수 있다.
상기 취약성 검출부는 상기 이미지 코드에 포함된 이미지 텍스트와 상기 웹접근성 데이터베이스에 포함된 비정상 대체 텍스트 간의 유사도를 기초로 상기 특정 웹페이지의 이미지 취약성을 검출할 수 있다.
상기 취약성 검출부는 상기 특정 웹페이지에 포함된 적어도 하나의 링크(link)를 추출하고 상기 소스코드 분석을 통해 상기 적어도 하나의 링크와 연관된 링크 코드로 구성된 링크 코드 집합을 생성할 수 있다.
상기 취약성 검출부는 상기 링크 코드에 포함된 링크 텍스트와 상기 웹접근성 데이터베이스에 포함된 건너뛰기 링크 키워드 간의 동일성을 기초로 상기 특정 웹페이지의 건너뛰기 취약성을 검출할 수 있다.
상기 취약성 개선부는 상기 특정 웹페이지의 이미지 취약성이 검출된 경우 상기 적어도 하나의 이미지를 상기 웹접근성 데이터베이스에 포함된 정상 대체 텍스트와 매칭시켜 대체 이미지 코드 집합을 생성할 수 있다.
상기 취약성 개선부는 상기 적어도 하나의 이미지에 대한 상기 웹접근성 데이터베이스에서의 검색 기록이 존재하지 않는 경우 상기 적어도 하나의 이미지로부터 직접 추출된 이미지 텍스트를 기초로 상기 대체 이미지 코드 집합을 생성할 수 있다.
상기 취약성 개선부는 상기 특정 웹페이지의 건너뛰기 취약성이 검출된 경우 상기 링크 코드 집합에 대해 상기 건너뛰기 링크 키워드와 동일한 링크 텍스트에 건너뛰기 기능을 부가하여 건너뛰기 링크 코드 집합을 생성할 수 있다.
실시예들 중에서, 빅데이터 기반의 웹접근성 개선 방법은 특정 웹페이지에 대한 소스코드(source code) 분석을 통해 적어도 하나의 웹접근성 엘리먼트(element)를 포함하는 웹접근성 엘리먼트 집합을 생성하는 단계, 상기 웹접근성 엘리먼트 집합과 웹접근성 데이터베이스 간의 비교연산을 통해 상기 특정 웹페이지에 대해 이미지 접근성 및 건너뛰기 접근성 중 적어도 하나에 관한 취약성을 검출하는 단계 및 상기 취약성이 검출되면 상기 취약성과 연관된 웹접근성 유형에 따라 상기 특정 웹페이지의 웹접근성을 자동으로 개선하는 단계를 포함한다.
개시된 기술은 다음의 효과를 가질 수 있다. 다만, 특정 실시예가 다음의 효과를 전부 포함하여야 한다거나 다음의 효과만을 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
본 발명의 일 실시예에 따른 빅데이터 기반의 웹접근성 개선 장치 및 방법은 이미지에 대한 대체 텍스트와 비정상 대체 텍스트 간의 유사도를 기초로 이미지 취약성을 검출하고 정상 대체 텍스트에 대한 검색 기록을 기초로 이미지 취약성을 개선할 수 있다.
본 발명의 일 실시예에 따른 빅데이터 기반의 웹접근성 개선 장치 및 방법은 링크 텍스트와 건너뛰기 링크 키워드 간의 동일성을 기초로 건너뛰기 취약성을 검출하여 건너뛰기 접근성을 개선할 수 있다.
도 1은 본 발명의 일 실시예에 따른 빅데이터 기반의 웹접근성 개선 시스템을 설명하는 도면이다.
도 2는 도 1에 있는 웹접근성 개선 장치를 나타내는 블록도이다.
도 3은 도 1에 있는 웹접근성 개선 장치에서 수행되는 웹접근성 개선 과정을 설명하는 순서도이다.
도 4 및 5는 도 1에 있는 웹접근성 개선 장치에서 수행되는 웹접근성 데이터베이스를 구축하는 과정의 일 실시예를 설명하는 예시도이다.
도 6은 도 1에 있는 웹접근성 개선 장치에서 수행되는 이미지 접근성 개선 과정을 설명하는 예시도이다.
도 7은 도 1에 있는 웹접근성 개선 장치에서 수행되는 건너뛰기 접근성 개선 과정을 설명하는 예시도이다.
본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다. 또한, 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다"또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
본 발명은 컴퓨터가 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있고, 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다.
여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.
웹접근성(web accessibility) 지침은 웹페이지가 웹접근성을 제공하기 위한 가이드 라인을 규정하고 있다. 웹접근성은 제공하는 기능에 따라 다양한 접근성 유형으로 분류될 수 있다. 접근성 유형은 대표적으로 이미지에 대한 대체 텍스트를 제공하는 이미지 접근성과 건너뛰기 기능을 제공하는 건너뛰기 접근성을 포함할 수 있다. 즉, 웹접근성을 준수하는 웹페이지는 해당 웹페이지에 포함된 이미지 대신 대체 텍스트를 제공함으로써 이미지 접근성을 제공할 수 있고, 동일 페이지 내에서 특정 영역으로 건너뛰어 해당 영역의 컨텐츠에 접근할 수 있는 기능을 제공함으로써 건너뛰기 접근성을 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 빅데이터 기반의 웹접근성 개선 시스템을 설명하는 도면이다.
도 1을 참조하면, 빅데이터 기반의 웹접근성 개선 시스템(100)은 사용자 단말(110), 웹접근성 개선 장치(130) 및 웹접근성 데이터베이스(150)를 포함할 수 있다.
사용자 단말(110)은 웹접근성 개선 장치(130)에서 제공하는 웹접근성이 개선된 웹페이지를 확인할 수 있는 컴퓨팅 장치에 해당할 수 있다. 사용자 단말(110)은 스마트폰, 노트북 또는 컴퓨터로 구현될 수 있으며, 반드시 이에 한정되지 않고, 태블릿 PC, 점자정보 단말기 등 다양한 디바이스로도 구현될 수 있다. 사용자 단말(110)은 웹접근성 개선 장치(130)와 네트워크를 통해 연결될 수 있고, 복수의 사용자 단말(110)들은 웹접근성 개선 장치(130)와 동시에 연결될 수 있다.
일 실시예에서, 사용자 단말(110)은 특정 웹페이지에 접근하는 경우 웹접근성 개선 장치(130)에 자동으로 특정 웹페이지에 대한 웹접근성 개선요청을 제공할 수 있고, 웹접근성 개선 장치(130)로부터 웹접근성이 개선된 웹페이지를 수신하여 기존의 웹페이지 대신 개선된 웹페이지를 사용자에게 제공할 수 있다.
다른 실시예에서, 사용자 단말(110)은 웹접근성 개선 장치(130)로부터 대체 이미지 코드 집합 또는 건너뛰기 링크 코드 집합을 수신하여 특정 웹페이지에 대한 개선된 소스코드를 생성할 수 있고, 개선된 소스코드를 기초로 웹접근성이 개선된 웹페이지를 사용자에게 제공할 수 있다. 여기에서, 대체 이미지 코드 집합은 개선된 이미지 태그 리스트에 해당할 수 있고, 건너뛰기 링크 코드 집합은 개선된 건너뛰기 기능 링크 리스트에 해당할 수 있다. 사용자 단말(110)은 개선된 이미지 태그 리스트 또는 건너뛰기 기능 링크 리스트를 기초로 HTML Code를 통해 개선된 웹페이지를 사용자에게 제공할 수 있다.
웹접근성 개선 장치(130)는 사용자 단말(110)로부터 웹페이지 개선요청을 수신하거나 또는 사용자 단말(110)이 특정 웹페이지에 접근하는 경우 자동으로 특정 웹페이지에 대한 웹접근성 취약성을 분석하여 웹접근성을 개선할 수 있는 컴퓨터 또는 프로그램에 해당하는 서버로 구현될 수 있다. 웹접근성 개선 장치(130)는 사용자 단말(110)과 유선 네트워크 또는 블루투스, WiFi 등과 같은 무선 네트워크로 연결될 수 있고, 유선 또는 무선 네트워크를 통해 사용자 단말(110)과 통신을 수행할 수 있다. 일 실시예에서, 웹접근성 개선 장치(130)는 사용자 단말(110)로부터 특정 웹페이지에 대한 개선요청과 함께 해당 웹페이지에 대한 URL(Uniform Resource Locator)를 함께 수신할 수 있다.
웹접근성 개선 장치(130)는 웹접근성 데이터베이스(150)와 연동하여 웹페이지에 대한 웹접근성 취약성을 분석하고 웹접근성을 개선하여 사용자 단말(110)에 제공할 수 있다. 한편, 웹접근성 개선 장치(130)는 도 1과 달리, 웹접근성 데이터베이스(150)를 내부에 포함하여 구현될 수 있다. 일 실시예에서, 웹접근성 개선 장치(130)는 웹 크롤러(web crawler)를 사용하여 네트워크로 접근 가능한 복수의 웹사이트들을 수집할 수 있고, 각 웹사이트를 분석하여 웹접근성 취약성 판단 및 웹접근성 개선 과정에서 판단 기준이 될 수 있는 복수의 데이터베이스를 사전에 구축할 수 있다. 이에 관해서는 도 4 및 5에서 보다 자세히 설명한다.
웹접근성 데이터베이스(150)는 웹접근성 개선 장치(130)가 특정 웹사이트에 대한 웹접근성 취약성을 분석하고 웹접근성을 개선하기 위해 사용하는 다양한 정보들을 저장할 수 있다. 예를 들어, 웹접근성 데이터베이스(150)는 복수의 웹페이지들의 분석을 통해 사전에 구축한 비정상 대체 텍스트, 정상 대체 텍스트 및 건너뛰기 링크 키워드에 관한 정보를 저장할 수 있고, 특정 웹페이지에 대한 웹페이지 취약성 분석 결과를 저장할 수 있으며, 반드시 이에 한정되지 않고, 특정 웹페이지의 웹접근성을 자동으로 개선하여 사용자 단말(110)에 제공하는 과정에서 다양한 형태로 수집 또는 가공된 정보들을 저장할 수 있다.
도 2는 도 1에 있는 웹접근성 개선 장치를 나타내는 블록도이다.
도 2를 참조하면, 웹접근성 개선 장치(130)는 웹접근성 엘리먼트 집합 생성부(210), 취약성 검출부(230), 웹접근성 개선부(250) 및 제어부(270)를 포함할 수 있다.
웹접근성 엘리먼트 집합 생성부(210)는 특정 웹페이지에 대한 소스코드 분석을 통해 적어도 하나의 웹접근성 엘리먼트(element)를 포함하는 웹접근성 엘리먼트 집합을 생성할 수 있다. 여기에서, 웹접근성 엘리먼트(element)는 웹접근성 취약성을 분석하고 개선하기 위하여 웹페이지의 소스코드로부터 추출한 웹접근성 분석요소에 해당할 수 있다. 예를 들어, 웹접근성 엘리먼트는 이미지 접근성과 관련하여 소스코드에서 추출한 이미지 코드(code)에 해당할 수 있고, 건너뛰기 접근성과 관련하여 소스코드에서 추출한 링크(link) 코드에 해당할 수 있다. 웹접근성 엘리먼트 집합은 적어도 하나의 웹접근성 엘리먼트로 구성될 수 있고, 예를 들어, 이미지 코드 집합 또는 링크 코드 집합에 해당할 수 있다.
일 실시예에서, 웹접근성 엘리먼트 집합 생성부(210)는 특정 웹페이지에 대한 소스코드 분석을 통해 해당 웹페이지 구현에 사용된 프로그램 언어를 검출할 수 있고, 해당 프로그램 언어를 기초로 접근성 유형에 맞는 웹접근성 엘리먼트를 추출하여 접근성 유형 별로 웹접근성 엘리먼트 집합을 생성할 수 있다. 예를 들어, HTML로 구현된 웹페이지에 대해 접근성 유형이 이미지 접근성인 경우 소스코드로부터 이미지 코드에 해당하는 이미지 태그(tag)를 추출하여 이미지 코드 집합을 생성할 수 있고, 건너뛰기 접근성인 경우 소스코드로부터 링크 코드에 해당하는 링크 태그를 추출하여 링크 코드 집합을 생성할 수 있다.
취약성 검출부(230)는 웹접근성 엘리먼트 집합과 웹접근성 데이터베이스(150) 간의 비교연산을 통해 특정 웹페이지에 대해 이미지 접근성 및 건너뛰기 접근성 중 적어도 하나에 관한 취약성을 검출할 수 있다. 취약성 검출부(230)는 이미지 코드 집합과 비정상 대체 텍스트를 비교하여 이미지 접근성의 취약여부를 결정할 수 있고, 링크 코드 집합과 건너뛰기 링크 키워드를 비교하여 건너뛰기 접근성의 취약여부를 결정할 수 있다.
일 실시예에서, 취약성 검출부(230)는 특정 웹페이지를 구성하는 적어도 하나의 이미지를 추출하고 소스코드 분석을 통해 적어도 하나의 이미지와 연관된 이미지 코드로 구성된 이미지 코드 집합을 생성할 수 있다. 취약성 검출부(230)는 특정 웹페이지의 소스코드를 분석하여 이미지와 연관된 코드를 추출할 수 있고, 해당 코드들로 구성되는 이미지 코드 집합을 생성할 수 있다. 예를 들어, 취약성 검출부(230)는 HTML로 구현된 웹페이지의 경우 소스코드를 분석하여 이미지 코드에 해당하는 <img>, <input type=”image”> 등의 이미지 태그들을 추출할 수 있고, 해당 이미지 태그들로 구성된 이미지 코드 집합을 생성할 수 있다.
일 실시예에서, 취약성 검출부(230)는 이미지 코드에 포함된 이미지 텍스트와 웹접근성 데이터베이스(150)에 포함된 비정상 대체 텍스트 간의 유사도를 기초로 특정 웹페이지의 이미지 취약성을 검출할 수 있다. 여기에서, 이미지 텍스트는 이미지와 연관된 텍스트(또는 문장)에 해당할 수 있고, 예를 들어, 소스코드로부터 추출된 이미지에 대한 대체 텍스트에 해당할 수 있다. 비정상 대체 텍스트는 다양한 웹사이트들을 분석하여 도출된 대체 텍스트 정보로서 특정 이미지와 잘못 연관된 텍스트(또는 문장)에 해당할 수 있고, 복수의 비정상 대체 텍스트들을 포함하는 집합에 해당할 수 있다.
텍스트 간의 유사도는 서로 다른 텍스트 각각의 구성 또는 의미 간의 유사한 정도에 해당할 수 있고, 반드시 이에 한정되지 않고, 서로 다른 텍스트 간의 비교 가능한 다양한 관점에서의 유사도에 해당할 수 있다. 이미지 취약성 검출에 활용되는 텍스트 간의 유사도는 단어와 단어, 단어와 문장 및 문장과 문장 간의 유사도 중 어느 하나에 해당할 수 있다. 취약성 검출부(230)는 이미지 코드 집합에 포함된 각각의 이미지 코드에서 이미지 텍스트를 추출할 수 있고, 이미지 텍스트가 비정상 대체 텍스트와 동일한 경우 해당 웹페이지의 이미지 접근성이 취약한 것으로 결정할 수 있다.
또한, 취약성 검출부(230)는 이미지 코드에서 추출된 이미지 텍스트 중에서 비정상 대체 텍스트와 동일한 이미지 텍스트가 없는 경우에도 이미지 텍스트와 비정상 대체 텍스트 간의 유사도가 특정 기준을 초과하는 경우 해당 웹페이지의 이미지 접근성이 취약한 것으로 결정할 수 있다. 예를 들어, 취약성 검출부(230)는 Word2Vec 알고리즘을 이용하여 각각의 이미지 텍스트와 비정상 대체 텍스트 간의 유사도를 산출할 수 있고, 미리 설정된 특정 기준 유사도의 초과 여부를 기초로 이미지 접근성에 대한 취약여부를 결정할 수 있다. 여기에서, 취약성 검출부(230)는 Word2Vec 알고리즘을 이용하여 텍스트 간의 유사도를 산출하고 있으나, 반드시 이에 한정되지 않고, 텍스트 간의 유사도를 산출하기 위해 Word2Vec 이외의 유사도 산출 알고리즘을 사용할 수 있다.
일 실시예에서, 취약성 검출부(230)는 특정 웹페이지에 포함된 적어도 하나의 링크(Link)를 추출하고 소스코드 분석을 통해 적어도 하나의 링크와 연관된 링크 코드로 구성된 링크 코드 집합을 생성할 수 있다. 예를 들어, 취약성 검출부(230)는 HTML로 구현된 웹페이지의 소스코드를 분석하여 링크 코드에 해당하는 <a>와 같은 링크 태그를 추출할 수 있고, 해당 링크 태그들로 구성된 링크 코드 집합을 생성할 수 있다.
일 실시예에서, 취약성 검출부(230)는 링크 코드에 포함된 링크 텍스트와 웹접근성 데이터베이스(150)에 포함된 건너뛰기 링크 키워드 간의 동일성을 기초로 특정 웹페이지의 건너뛰기 취약성을 검출할 수 있다. 여기에서, 건너뛰기 링크 키워드는 다양한 웹사이트들을 분석하여 도출된 링크 텍스트 정보로서 건너뛰기 기능을 제공하는 건너뛰기 링크와 직접적으로 연관된 텍스트에 해당할 수 있고, 복수의 건너뛰기 링크 키워드들을 포함하는 집합에 해당할 수 있다.
텍스트와 키워드 간의 동일성은 서로 다른 텍스트와 키워드 각각의 구성 또는 의미 간의 동일성에 해당할 수 있고, 반드시 이에 한정되지 않고, 서로 다른 텍스트와 키워드 간의 비교 가능한 다양한 관점에서의 동일성에 해당할 수 있다. 건너뛰기 취약성 검출에 활용되는 텍스트와 키워드 간의 동일성은 단어와 단어, 단어와 문장 및 문장과 문장 간의 동일성 중 어느 하나에 해당할 수 있다. 취약성 검출부(230)는 링크 코드 집합에 포함된 각각의 링크 코드에서 링크 텍스트를 추출할 수 있고, 링크 텍스트와 건너뛰기 링크 키워드 간의 동일성을 기초로 건너뛰기 접근성에 대한 취약여부를 결정할 수 있다.
웹접근성 개선부(250)는 취약성이 검출되면 취약성과 연관된 웹접근성 유형에 따라 특정 웹페이지의 웹접근성을 자동으로 개선할 수 있다. 웹접근성 개선부(250)는 대체 텍스트가 없는 이미지에 대해 대체 텍스트를 설정하거나 또는 잘못 설정된 대체 텍스트를 올바른 대체 텍스트로 변경함으로써 해당 웹페이지의 이미지 접근성을 개선할 수 있다. 또한, 웹접근성 개선부(250)는 건너뛰기 링크 키워드를 포함하지 않는 웹페이지에 대해 링크 텍스트 및 해당 링크 텍스트와 연관된 건너뛰기 링크를 부여하거나 또는 건너뛰기 링크 키워드만 포함하고 건너뛰기 링크를 제공하지 않는 웹페이지에 대해 해당 건너뛰기 링크 키워드와 연관된 건너뛰기 링크를 부여함으로써 해당 웹페이지의 건너뛰기 접근성을 개선할 수 있다.
일 실시예에서, 웹접근성 개선부(250)는 특정 웹페이지의 이미지 취약성이 검출된 경우 적어도 하나의 이미지를 웹접근성 데이터베이스(150)에 포함된 정상 대체 텍스트와 매칭시켜 대체 이미지 코드 집합을 생성할 수 있다. 여기에서, 정상 대체 텍스트는 특정 이미지 및 해당 이미지와 연관된 대체 텍스트(또는 문장) 쌍에 대한 정보에 해당할 수 있고, 복수의 정상 대체 텍스트들을 포함하는 집합에 해당할 수 있다. 웹접근성 개선부(250)는 웹페이지에 포함된 각 이미지에 대하여 매칭된 대체 텍스트가 없거나 또는 비정상 대체 텍스트와 매칭되어 있는 경우 정상 대체 텍스트를 매칭시킬 수 있고, 이미지 및 해당 이미지와 매칭된 정상 대체 텍스트를 기초로 대체 이미지 코드를 생성하여 대체 이미지 코드 집합을 생성할 수 있다.
일 실시예에서, 웹접근성 개선부(250)는 적어도 하나의 이미지에 대한 웹접근성 데이터베이스(150)에서의 검색 기록이 존재하지 않는 경우 적어도 하나의 이미지로부터 직접 추출된 이미지 텍스트를 기초로 대체 이미지 코드 집합을 생성할 수 있다. 웹접근성 개선부(250)는 비정상 대체 텍스트와 연관된 이미지에 대하여 웹접근성 데이터베이스(150)에 저장된 정상 대체 텍스트로부터 해당 이미지와 연관된 정상 대체 텍스트를 검색하여 매칭시킴으로써 이미지 접근성을 개선할 수 있다. 웹접근성 개선부(250)는 정상 대체 텍스트에 대한 검색 기록을 웹접근성 데이터베이스(150)에 별도로 저장할 수 있고, 이미지 접근성 개선 과정에 활용할 수 있다.
보다 구체적으로, 웹접근성 개선부(250)는 웹접근성 데이터베이스(150)에서 정상 대체 텍스트를 검색하기 전에 비정상 대체 텍스트와 연관된 이미지에 대한 정상 대체 텍스트 검색 기록이 존재하는지를 판단할 수 있고, 해당 검색 기록이 존재하는 경우에는 웹접근성 데이터베이스(150)에서의 검색을 수행하지 않고 해당 검색 기록과 연관된 정상 대체 텍스트를 해당 이미지와 곧바로 매칭시킬 수 있다. 웹접근성 개선부(250)는 특정 이미지에 대한 정상 대체 텍스트를 매번 검색하지 않고, 이전 검색 기록을 활용하여 매칭시킴으로써 웹접근성 데이터베이스(150)에서의 검색 연산에 소요되는 불필요한 시간을 단축시키고 이미지 접근성 연산의 효율성을 향상시킬 수 있다.
만약 이전 검색 기록이 존재하지 않는 경우 웹접근성 개선부(250)는 해당 이미지를 웹페이지로부터 직접 다운로드할 수 있고, 해당 이미지에 대해 OCR(Optical Character Rcognition) 처리를 수행하여 해당 이미지로부터 직접 대체 텍스트를 추출할 수 있다. 여기에서, OCR 처리는 광학 문자 인식에 해당할 수 있고, 특정 이미지를 분석하여 해당 이미지에 포함된 문자를 인식할 수 있는 기술에 해당할 수 있다. 웹접근성 개선부(250)는 OCR 처리를 통해 추출된 대체 텍스트와 해당 이미지를 연관시켜 웹접근성 데이터베이스(150)에 저장할 수 있고, 향후 이미지 접근성 개선 과정에서 활용할 수 있다. 웹접근성 개선부(250)는 OCR 처리를 통해 추출된 대체 텍스트와 해당 이미지를 기초로 대체 이미지 코드를 생성하여 대체 이미지 코드 집합을 생성할 수 있다.
일 실시예에서, 웹접근성 개선부(250)는 특정 웹페이지의 건너뛰기 취약성이 검출된 경우 링크 텍스트 집합에 대해 건너뛰기 링크 키워드와 동일한 링크 텍스트에 건너뛰기 기능을 부가하여 건너뛰기 링크 코드 집합을 생성할 수 있다. 웹접근성 개선부(250)는 건너뛰기 링크 키워드와 동일한 링크 텍스트에 대해 건너뛰기 기능을 부가하여 건너뛰기 링크 코드를 생성함으로써 건너뛰기 접근성을 개선할 수 있다. 웹접근성 개선부(250)는 건너뛰기 링크 코드들로 구성된 건너뛰기 링크 코드 집합을 생성할 수 있다.
제어부(270)는 웹접근성 개선 장치(130)의 전체적인 동작을 제어하고, 웹접근성 엘리먼트 집합 생성부(210), 취약성 검출부(230) 및 웹접근성 개선부(250) 간의 제어 흐름 또는 데이터 흐름을 관리할 수 있다.
도 3은 도 1에 있는 웹접근성 개선 장치에서 수행되는 웹접근성 개선 과정을 설명하는 순서도이다.
도 3을 참조하면, 웹접근성 개선 장치(130)는 웹접근성 엘리먼트 집합 생성부(210)를 통해 특정 웹페이지에 대한 소스코드 분석을 통해 적어도 하나의 웹접근성 엘리먼트를 포함하는 웹접근성 엘리먼트 집합을 생성할 수 있다(단계 S310). 웹접근성 개선 장치(130)는 취약성 검출부(230)를 통해 웹접근성 엘리먼트 집합과 웹접근성 데이터베이스(150) 간의 비교연산을 통해 특정 웹페이지에 대한 이미지 접근성 및 건너뛰기 접근성 중 적어도 하나에 관한 취약성을 검출할 수 있다(단계 S330). 웹접근성 개선 장치(130)는 웹접근성 개선부(250)를 통해 취약성이 검출되면 취약성과 연관된 웹접근성 유형에 따라 특정 웹페이지의 웹접근성을 자동으로 개선할 수 있다(단계 S350).
도 4 및 5는 도 1에 있는 웹접근성 개선 장치에서 수행되는 웹접근성 데이터베이스를 구축하는 과정의 일 실시예를 설명하는 예시도이다.
도 4 및 5를 참조하면, 웹접근성 개선 장치(130)는 웹 크롤러(web crawler)를 사용하여 네트워크로 접근 가능한 복수의 웹사이트들을 수집할 수 있고, 각 웹사이트를 분석하여 웹접근성 취약성 판단 및 웹접근성 개선 과정에서 판단 기준이 될 수 있는 복수의 데이터베이스를 사전에 구축할 수 있다.
도 4에서, 웹접근성 개선 장치(130)는 웹 크롤러를 통해 수집한 웹사이트들을 분석하여 대체 텍스트 정보를 추출할 수 있고, 웹접근성 데이터베이스(150)에 저장된 비정상 대체 텍스트 데이터와 비교할 수 있다. 여기에서, 대체 텍스트 정보는 각 웹사이트를 구성하는 이미지들과 연관된 이미지 텍스트에 해당할 수 있고, 예를 들어, HTML로 구현된 소스코드에서 이미지 태그에 포함된 'alt' 속성 값으로부터 추출할 수 있다. 웹접근성 개선 장치(130)는 비정상 대체 텍스트와 동일하지 않은 대체 텍스트에 대하여 Word2Vec 알고리즘을 통해 텍스트 간의 유사도를 산출할 수 있고, 해당 유사도가 특정 기준 유사도를 초과하는 경우 해당 대체 텍스트를 비정상 대체 텍스트로 판단하여 비정상 대체 텍스트 데이터에 포함시킴으로써 비정상 대체 텍스트 데이터를 구축할 수 있다.
웹접근성 개선 장치(130)는 비정상 대체 텍스트 데이터와 유사하지 않은 것으로 판단된 대체 텍스트에 대해서는 정상 대체 텍스트 데이터에 포함시킴으로써 정상 대체 텍스트 데이터를 구축할 수 있다. 웹접근성 개선 장치(130)는 웹접근성 자동 개선을 위해 비정상 대체 텍스트 데이터와 비정상 대체 텍스트 데이터를 사전에 구축하여 웹접근성 데이터베이스(150)에 저장할 수 있다.
일 실시예에서, 웹접근성 개선 장치(130)는 데이터 구축에 사용된 웹페이지의 수, 비정상 또는 정상 대체 텍스트 데이터에 포함된 데이터의 수와 용량을 기초로 구축 완료여부를 결정할 수 있다. 예를 들어, 특정 수 이상의 웹페이지 분석을 통해 사전 데이터가 구축되면 웹접근성 개선 장치(130)는 사전 구축 과정을 종료하고 임의의 웹페이지에 대한 웹접근성 취약성을 분석하고 개선하는 과정에서 수집된 정보를 기초로 사전에 구축된 데이터들을 갱신함으로써 웹접근성 개선의 정확성을 향상시킬 수 있다.
도 5에서, 웹접근성 개선 장치(130)는 웹 크롤러를 통해 수집한 웹사이트들을 분석하여 링크 목록을 수집할 수 있고, 웹접근성 데이터베이스(150)에 저장된 건너뛰기 링크 키워드 데이터와 비교할 수 있다. 웹접근성 개선 장치(130)는 건너뛰기 링크 키워드와 동일하지 않은 링크 텍스트에 대하여 Word2Vec 알고리즘을 통해 키워드 및 텍스트 간의 유사도를 산출할 수 있고, 해당 유사도가 특정 기준 유사도를 초과하는 경우 해당 링크 텍스트를 건너뛰기 링크 키워드로 판단하여 건너뛰기 링크 키워드 데이터에 포함시킴으로써 건너뛰기 링크 키워드 데이터를 구축할 수 있다.
도 6은 도 1에 있는 웹접근성 개선 장치에서 수행되는 이미지 접근성 개선 과정을 설명하는 예시도이다.
도 6을 참조하면, 사용자 단말(610)은 웹접근성 개선 장치(630)에 특정 웹페이지에 대한 이미지 접근성 개선요청을 제공할 수 있고, 웹접근성 개선 장치(630)는 웹접근성 데이터베이스(650)와의 연동을 통해 특정 웹페이지에 대한 이미지 접근성을 개선하여 사용자 단말(610)에 제공할 수 있다. 사용자 단말(610)은 웹접근성 개선 장치(630)로부터 수신한 내용을 기초로 사용자에게 이미지 접근성이 개선된 웹페이지를 제공할 수 있다.
도 6에서, 웹접근성 개선 장치(630)는 사용자 단말(610)로부터 수신한 특정 웹페이지에 대한 소스코드 분석을 통해 이미지 코드 집합에 해당하는 이미지 태그 리스트를 생성할 수 있다. 웹접근성 개선 장치(630)는 이미지 태그 리스트에 포함된 각 이미지 태그로부터 이미지 텍스트를 추출할 수 있고, 웹접근성 데이터베이스(650)에 저장된 비정상 대체 텍스트 데이터와 비교하여 해당 이미지 텍스트가 비정상 대체 텍스트인지를 판단할 수 있다. 웹접근성 개선 장치(630)는 텍스트 간의 동일성을 기초로 대체 텍스트의 비정상 여부를 판단할 수 있고, 동일하지 않더라도 Word2Vec 알고리즘을 기초로 산출된 텍스트 간의 유사도가 특정 기준 유사도를 초과하는지를 기초로 대체 텍스트의 비정상 여부를 판단할 수 있다.
웹접근성 개선 장치(630)는 이미지 텍스트가 비정상 대체 텍스트로 결정된 경우 해당 이미지를 정상 대체 텍스트와 매칭시킴으로써 이미지 접근성을 개선할 수 있다. 만약 웹접근성 데이터베이스(650)에 해당 이미지와 연관된 정상 대체 텍스트를 검색한 기록이 존재하는 경우 웹접근성 개선 장치(630)는 추가 검색없이 해당 검색 기록과 연관되어 웹접근성 데이터베이스(650)에 저장된 정상 대체 텍스트를 해당 이미지와 매칭시킬 수 있다.
또한, 웹접근성 개선 장치(630)는 검색 기록이 존재하지 않는 경우에는 해당 이미지로부터 OCR 처리를 통해 직접 대체 텍스트를 추출하여 해당 이미지와 매칭시킬 수 있다. 웹접근성 개선 장치(630)는 이미지와 정상 대체 텍스트를 기초로 개선된 이미지 태그를 생성할 수 있고, 대체 이미지 코드 집합에 해당하는 개선된 이미지 태그 리스트를 생성하여 사용자 단말(610)에 제공할 수 있다.
도 7은 도 1에 있는 웹접근성 개선 장치에서 수행되는 건너뛰기 접근성 개선 과정을 설명하는 예시도이다.
도 7을 참조하면, 사용자 단말(710)은 웹접근성 개선 장치(730)에 특정 웹페이지에 대한 건너뛰기 접근성 개선요청을 제공할 수 있고, 웹접근성 개선 장치(730)는 웹접근성 데이터베이스(750)와의 연동을 통해 특정 웹페이지에 대한 건너뛰기 접근성을 개선하여 사용자 단말(710)에 제공할 수 있다. 사용자 단말(710)은 웹접근성 개선 장치(730)로부터 수신한 내용을 기초로 사용자에게 건너뛰기 접근성이 개선된 웹페이지를 제공할 수 있다.
도 7에서, 웹접근성 개선 장치(730)는 사용자 단말(710)로부터 수신한 특정 웹페이지에 대한 소스코드 분석을 통해 링크 코드 집합에 해당하는 링크 태그 리스트를 생성할 수 있다. 웹접근성 개선 장치(730)는 링크 태그 리스트에 포함된 각 링크 태그로부터 링크 텍스트를 추출할 수 있고, 웹접근성 데이터베이스(750)에 저장된 건너뛰기 링크 키워드 데이터와 비교하여 해당 링크 텍스트가 건너뛰기 링크에 포함되는지를 판단할 수 있다. 웹접근성 개선 장치(730)는 키워드 및 텍스트 간의 동일성을 기초로 건너뛰리 링크 포함 여부를 판단할 수 있다.
웹접근성 개선 장치(730)는 링크 텍스트가 건너뛰기 링크 키워드로 결정된 경우 해당 링크 텍스트에 건너뛰기 기능을 부가함으로써 건너뛰기 접근성을 개선할 수 있다. 웹접근성 개선 장치(730)는 건너뛰기 기능이 없는 링크 텍스트에 대하여 건너뛰기 기능을 부가하여 개선된 건너뛰기 링크 태그를 생성할 수 있고, 건너뛰기 링크 코드 집합에 해당하는 건너뛰기 기능 링크 리스트를 생성하여 사용자 단말(710)에 제공할 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 빅데이터 기반의 웹접근성 개선 시스템
110: 사용자 단말 130: 웹접근성 개선 장치
150: 웹접근성 데이터베이스
210: 웹접근성 엘리먼트 집합 생성부
230: 취약성 검출부 250: 웹접근성 개선부
270: 제어부
610, 710: 사용자 단말
630, 730: 웹접근성 개선 장치
650, 750: 웹접근성 데이터베이스

Claims (9)

  1. 특정 웹페이지에 대한 소스코드(source code) 분석을 통해 적어도 하나의 웹접근성 엘리먼트(element)를 포함하는 웹접근성 엘리먼트 집합을 생성하는 웹접근성 엘리먼트 집합 생성부;
    상기 웹접근성 엘리먼트 집합과 웹접근성 데이터베이스 간의 비교연산을 통해 상기 특정 웹페이지에 대해 이미지 접근성 및 건너뛰기 접근성 중 적어도 하나에 관한 취약성을 검출하는 취약성 검출부; 및
    상기 취약성이 검출되면 상기 취약성과 연관된 웹접근성 유형에 따라 상기 특정 웹페이지의 웹접근성을 자동으로 개선하는 웹접근성 개선부를 포함하는 빅데이터 기반의 웹접근성 개선 장치.
  2. 제1항에 있어서, 상기 취약성 검출부는
    상기 특정 웹페이지를 구성하는 적어도 하나의 이미지를 추출하고 상기 소스코드 분석을 통해 상기 적어도 하나의 이미지와 연관된 이미지 코드(code)로 구성된 이미지 코드 집합을 생성하는 것을 특징으로 하는 빅데이터 기반의 웹접근성 개선 장치.
  3. 제2항에 있어서, 상기 취약성 검출부는
    상기 이미지 코드에 포함된 이미지 텍스트와 상기 웹접근성 데이터베이스에 포함된 비정상 대체 텍스트 간의 유사도를 기초로 상기 특정 웹페이지의 이미지 취약성을 검출하는 것을 특징으로 하는 빅데이터 기반의 웹접근성 개선 장치.
  4. 제1항에 있어서, 상기 취약성 검출부는
    상기 특정 웹페이지에 포함된 적어도 하나의 링크(link)를 추출하고 상기 소스코드 분석을 통해 상기 적어도 하나의 링크와 연관된 링크 코드로 구성된 링크 코드 집합을 생성하는 것을 빅데이터 기반의 웹접근성 개선 장치.
  5. 제4항에 있어서, 상기 취약성 검출부는
    상기 링크 코드에 포함된 링크 텍스트와 상기 웹접근성 데이터베이스에 포함된 건너뛰기 링크 키워드 간의 동일성을 기초로 상기 특정 웹페이지의 건너뛰기 취약성을 검출하는 것을 특징으로 하는 빅데이터 기반의 웹접근성 개선 장치.
  6. 제3항에 있어서, 상기 취약성 개선부는
    상기 특정 웹페이지의 이미지 취약성이 검출된 경우 상기 적어도 하나의 이미지를 상기 웹접근성 데이터베이스에 포함된 정상 대체 텍스트와 매칭시켜 대체 이미지 코드 집합을 생성하는 것을 특징으로 하는 빅데이터 기반의 웹접근성 개선 장치.
  7. 제6항에 있어서, 상기 취약성 개선부는
    상기 적어도 하나의 이미지에 대한 상기 웹접근성 데이터베이스에서의 검색 기록이 존재하지 않는 경우 상기 적어도 하나의 이미지로부터 직접 추출된 이미지 텍스트를 기초로 상기 대체 이미지 코드 집합을 생성하는 것을 특징으로 하는 빅데이터 기반의 웹접근성 개선 장치.
  8. 제5항에 있어서, 상기 취약성 개선부는
    상기 특정 웹페이지의 건너뛰기 취약성이 검출된 경우 상기 링크 코드 집합에 대해 상기 건너뛰기 링크 키워드와 동일한 링크 텍스트에 건너뛰기 기능을 부가하여 건너뛰기 링크 코드 집합을 생성하는 것을 특징으로 하는 빅데이터 기반의 웹접근성 개선 장치.
  9. 빅데이터 기반의 웹접근성 개선 장치에서 수행되는 웹접근성 개선 방법에 있어서,
    특정 웹페이지에 대한 소스코드(source code) 분석을 통해 적어도 하나의 웹접근성 엘리먼트(element)를 포함하는 웹접근성 엘리먼트 집합을 생성하는 단계;
    상기 웹접근성 엘리먼트 집합과 웹접근성 데이터베이스 간의 비교연산을 통해 상기 특정 웹페이지에 대해 이미지 접근성 및 건너뛰기 접근성 중 적어도 하나에 관한 취약성을 검출하는 단계; 및
    상기 취약성이 검출되면 상기 취약성과 연관된 웹접근성 유형에 따라 상기 특정 웹페이지의 웹접근성을 자동으로 개선하는 단계를 포함하는 빅데이터 기반의 웹접근성 개선 방법.
KR1020180078257A 2018-07-05 2018-07-05 빅데이터 기반의 웹접근성 개선 장치 및 방법 KR102127635B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180078257A KR102127635B1 (ko) 2018-07-05 2018-07-05 빅데이터 기반의 웹접근성 개선 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180078257A KR102127635B1 (ko) 2018-07-05 2018-07-05 빅데이터 기반의 웹접근성 개선 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20200010669A true KR20200010669A (ko) 2020-01-31
KR102127635B1 KR102127635B1 (ko) 2020-06-29

Family

ID=69369434

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180078257A KR102127635B1 (ko) 2018-07-05 2018-07-05 빅데이터 기반의 웹접근성 개선 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102127635B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220071735A (ko) * 2020-11-24 2022-05-31 성균관대학교산학협력단 오픈소스 프로젝트의 취약점 탐색방법 및 그것이 프로그래밍되어 저장된 컴퓨터가 판독가능한 기록매체

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348211A (ja) * 2003-05-20 2004-12-09 Internatl Business Mach Corp <Ibm> データ編集装置、データ編集方法及びプログラム
KR100823388B1 (ko) 2006-08-11 2008-04-17 주식회사 케익소프트 웹 접근성 서비스 제공방법 및 그 시스템
KR20100111084A (ko) 2009-04-06 2010-10-14 (주)플랜아이 웹 접근성 체크 기능을 가지는 웹 컨텐츠 관리 시스템
JP2010262398A (ja) * 2009-04-30 2010-11-18 Nippon Telegr & Teleph Corp <Ntt> 配色診断方法、配色診断装置、配色診断プログラム
KR20150000178A (ko) * 2013-06-24 2015-01-02 박재범 웹 이미지 대체 텍스트 생성 장치 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348211A (ja) * 2003-05-20 2004-12-09 Internatl Business Mach Corp <Ibm> データ編集装置、データ編集方法及びプログラム
KR100823388B1 (ko) 2006-08-11 2008-04-17 주식회사 케익소프트 웹 접근성 서비스 제공방법 및 그 시스템
KR20100111084A (ko) 2009-04-06 2010-10-14 (주)플랜아이 웹 접근성 체크 기능을 가지는 웹 컨텐츠 관리 시스템
JP2010262398A (ja) * 2009-04-30 2010-11-18 Nippon Telegr & Teleph Corp <Ntt> 配色診断方法、配色診断装置、配色診断プログラム
KR20150000178A (ko) * 2013-06-24 2015-01-02 박재범 웹 이미지 대체 텍스트 생성 장치 및 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
webaccess(2012.01.20.)1부* *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220071735A (ko) * 2020-11-24 2022-05-31 성균관대학교산학협력단 오픈소스 프로젝트의 취약점 탐색방법 및 그것이 프로그래밍되어 저장된 컴퓨터가 판독가능한 기록매체

Also Published As

Publication number Publication date
KR102127635B1 (ko) 2020-06-29

Similar Documents

Publication Publication Date Title
US7269544B2 (en) System and method for identifying special word usage in a document
US10055402B2 (en) Generating a semantic network based on semantic connections between subject-verb-object units
KR101983975B1 (ko) 문장 분류에 기반하는 문서 자동분류 방법 및 그 장치
CN111626048A (zh) 文本纠错方法、装置、设备及存储介质
Phandi et al. SemEval-2018 task 8: Semantic extraction from CybersecUrity REports using natural language processing (SecureNLP)
KR102285142B1 (ko) 챗봇을 위한 학습 데이터 추천 장치 및 방법
CN110427612B (zh) 基于多语言的实体消歧方法、装置、设备和存储介质
CN111931935B (zh) 基于One-shot 学习的网络安全知识抽取方法和装置
US20160350278A1 (en) Claim polarity identification
US9418058B2 (en) Processing method for social media issue and server device supporting the same
CN112307164A (zh) 信息推荐方法、装置、计算机设备和存储介质
CN109634436B (zh) 输入法的联想方法、装置、设备及可读存储介质
Sabeeh et al. Enhancing the fake news detection by applying effective feature selection based on semantic sources
CN110309355B (zh) 内容标签的生成方法、装置、设备及存储介质
US11514258B2 (en) Table header detection using global machine learning features from orthogonal rows and columns
KR102127635B1 (ko) 빅데이터 기반의 웹접근성 개선 장치 및 방법
KR102483004B1 (ko) 유해 url 탐지 방법
CN116719999A (zh) 文本相似度检测方法和装置、电子设备及存储介质
KR20180055170A (ko) 기계학습을 활용한 osp 사이트 생애주기 감지 인공지능 시스템
CN115563296A (zh) 基于内容语义的融合检测方法和系统
RU2762241C2 (ru) Система и способ выявления мошеннических активностей при взаимодействии пользователя с банковскими сервисами
CN114417883A (zh) 一种数据处理方法、装置及设备
CN114329287A (zh) 一种异常链接处理方法、装置、计算机设备和存储介质
Yang et al. Automated Identification of Sensitive Data via Flexible User Requirements
CN111581950A (zh) 同义名称词的确定方法和同义名称词的知识库的建立方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant