KR20180125228A - 웹 스크래핑을 방지하는 웹 페이지 소스 코드 생성 방법 - Google Patents

웹 스크래핑을 방지하는 웹 페이지 소스 코드 생성 방법 Download PDF

Info

Publication number
KR20180125228A
KR20180125228A KR1020170059799A KR20170059799A KR20180125228A KR 20180125228 A KR20180125228 A KR 20180125228A KR 1020170059799 A KR1020170059799 A KR 1020170059799A KR 20170059799 A KR20170059799 A KR 20170059799A KR 20180125228 A KR20180125228 A KR 20180125228A
Authority
KR
South Korea
Prior art keywords
web page
code
regularity
scraping
web
Prior art date
Application number
KR1020170059799A
Other languages
English (en)
Inventor
이준형
Original Assignee
주식회사 엠와이소프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엠와이소프트 filed Critical 주식회사 엠와이소프트
Priority to KR1020170059799A priority Critical patent/KR20180125228A/ko
Publication of KR20180125228A publication Critical patent/KR20180125228A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/12Protecting executable software
    • G06F21/121Restricting unauthorised execution of programs
    • G06F21/128Restricting unauthorised execution of programs involving web programs, i.e. using technology especially used in internet, generally interacting with a web browser, e.g. hypertext markup language [HTML], applets, java
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/12Protecting executable software
    • G06F21/121Restricting unauthorised execution of programs
    • G06F21/125Restricting unauthorised execution of programs by manipulating the program code, e.g. source code, compiled code, interpreted code, machine code
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2119Authenticating web pages, e.g. with suspicious links

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 웹 스크래핑을 방지하는 웹 페이지를 컴퓨터가 생성하는 방법에 관한 것으로서, 보호 대상 데이터가 텍스트 자식 요소인 제1 요소를 포함하는, 웹 페이지 코드를 로딩하는 제1 단계와; 제1 요소를 포함하는 웹 페이지의 규칙성을 제거하는 규칙성 제거 코드를, 상기 웹 페이지 코드에 삽입하는 제2 단계를 포함한다.

Description

웹 스크래핑을 방지하는 웹 페이지 소스 코드 생성 방법{Method for Generating Source Code Which Prevents Web Scraping}
본 발명은 웹 스크래핑을 방지하는 웹 페이지를 생성하는 방법에 관한 것이다.
서비스 서버가 제공하는 웹 페이지에는 개인 정보나 고객 데이터 등과 같이 허가받지 않은 제3자가 수집해서는 안 되는 민감한 데이터가 포함될 수 있다. 그런데 개인 정보 등의 민감한 정보를 자동화된 툴을 이용해서 수집하여 제공하거나, 방문 실적에 따른 광고 수익을 노리는 자들이 실제로는 서비스 서버가 제공하는 홈페이지에 접속하지 않으면서 데이터만 수집해 가는 경우가 발생한다. 이를 웹 스크래핑(web scraping)이라고 부르기도 한다.
그렇게 되면 데이터의 원천 제공자의 수익이 저하되거나 데이터에 대한 신뢰성이 저하되는 등의 문제가 생긴다.
웹 스크래핑의 대상이 되는 홈페이지는 HTML 기반으로 코드가 작성되며 특성상 데이터가 공개되기 때문에 위와 같은 방법의 무단 수집을 방지할 수단이 원천적으로 제공되지는 않는다. 종래에는 웹 스크래핑을 방지하기 위해서 별도의 확장 플러그인 프로그램, 캡챠(CAPTCHA) 소프트웨어 내지 사용자 인증을 요구하는 방법을 사용하였는데, 이러한 종래 방법에 따르면 정상적인 사용자에게도 불편을 초래하는 문제가 동반되었다.
본 발명은, 정상적으로 서비스 서버의 홈페이지가 제공하는 서비스를 이용하는 사용자에게는 영향을 미치지 않으면서 웹 스크래핑을 방지할 수 있는 방법을 제공하는 것을 목적으로 한다.
본 발명은 웹 스크래핑을 방지하는 웹 페이지를 컴퓨터가 생성하는 방법에 관한 것으로서, 보호 대상 데이터가 텍스트 자식 요소인 제1 요소를 포함하는, 웹 페이지 코드를 로딩하는 제1 단계와; 제1 요소를 포함하는 웹 페이지의 규칙성을 제거하는 규칙성 제거 코드를, 상기 웹 페이지 코드에 삽입하는 제2 단계를 포함한다.
상기 규칙성 제거 코드는, 제1 요소 앞에 배치되며 제1 요소와 동위 요소일 수 있다.
상기 규칙성 제거 코드는, 제1 요소의 부모 요소일 수 있다.
상기 규칙성 제거 코드는, 텍스트 자식 요소와 제1 요소 사이에 배치되며, 텍스트 자식 요소의 부모 요소이며 제1 요소의 자식 요소로서 삽입되는 코드일 수 있다.
상기 규칙성 제거 코드는, 제1 요소에 자식 요소로서 추가되는 제1 요소의 동위 요소일 수 있다.
상기 규칙성 제거 코드는, 제1 요소와 텍스트 자식 요소를 포함하는 전체 요소와 동일한 속성을 가지며 임의의 데이터를 포함하며, 제1 요소의 앞에 배치되는 제1 요소의 동위 요소일 수 있다. 이 실시예에서는, 상기 임의의 데이터가 화면에 표시되지 않도록 하는 스타일시트를 생성하는 단계를 더 포함할 수 있다.
상기 규칙성 제거 코드는, 보호 대상 데이터를 인코딩한 값과, 디코딩 코드를 포함하는 코드일 수 있다. 그리고 이 실시예에서는 제1 요소와 텍스트 자식 요소는 삭제하는 단계를 더 포함할 수 있다.
상기 규칙성 제거 코드는, 보호 대상 텍스트를 이미지화하고 데이터 URI 스킴을 사용하여 표시한 코드일 수 있다. 이 실시예에서는 제1 요소와 텍스트 자식 요소는 삭제하는 단계를 더 포함할 수 있다.
본 발명에 의하면, 보호 대상 데이터를 포함하는 웹 페이지의 규칙성이 제거되기 때문에 해당 웹페이지의 소스 코드에 웹 스크래핑을 시도하더라도 보호 대상 데이터를 추출하거나 검색할 수가 없으며, 그럼에도 불구하고 사용자에게 보이는 웹 페이지는 변화가 없기 때문에 사용자의 불편함도 제거되는 효과가 있다.
도 1은 본 발명에 따른 웹 페이지 생성 방법이 적용되기 전의 웹 페이지 일례.
도 2는 본 발명의 제1 형태의 방법이 적용되어 생성된 웹 페이지의 일례.
도 3은 본 발명의 제2 형태의 방법이 적용되어 생성된 웹 페이지의 일례.
도 4는 본 발명의 제3 형태의 방법이 적용되어 생성된 웹 페이지의 일례.
도 5는 본 발명의 제4 형태의 방법이 적용되어 생성된 웹 페이지의 일례.
도 6은 본 발명의 제5 형태의 방법이 적용되어 생성된 웹 페이지의 일례.
도 7은 본 발명의 제6 형태의 방법이 적용되어 생성된 웹 페이지의 일례.
도 8은 본 발명의 제7 형태의 방법이 적용되어 생성된 웹 페이지의 일례.
도 9는 본 발명이 수행되는 환경의 일례.
이하에서는 첨부 도면을 참조하여 본 발명에 대해서 자세하게 설명한다.
본 명세서에서 수행되는 정보(데이터) 전송 과정은 필요에 따라서 암호화/복호화가 적용될 수 있으며, 본 명세서 및 특허청구범위에서 정보(데이터) 전송 과정을 설명하는 표현은 별도로 언급되지 않더라도 모두 암호화/복호화하는 경우도 포함하는 것으로 해석되어야 한다. 본 명세서에서 "A로부터 B로 전송(전달)" 또는 "A가 B로부터 수신"과 같은 형태의 표현은 중간에 다른 매개체가 포함되어 전송(전달) 또는 수신되는 것도 포함하며, A로부터 B까지 직접 전송(전달) 또는 수신되는 것만을 표현하는 것은 아니다. 본 발명의 설명에 있어서 각 단계의 순서는 선행 단계가 논리적 및 시간적으로 반드시 후행 단계에 앞서서 수행되어야 하는 경우가 아니라면 각 단계의 순서는 비제한적으로 이해되어야 한다. 즉 위와 같은 예외적인 경우를 제외하고는 후행 단계로 설명된 과정이 선행 단계로 설명된 과정보다 앞서서 수행되더라도 발명의 본질에는 영향이 없으며 권리범위 역시 단계의 순서에 관계없이 정의되어야 한다. 그리고 본 명세서에서 “A 또는 B”은 A와 B 중 어느 하나를 선택적으로 가리키는 것 뿐만 아니라 A와 B 모두를 포함하는 것도 의미하는 것으로 정의된다. 또한, 본 명세서에서 "포함"이라는 용어는 포함하는 것으로 나열된 요소 이외에 추가로 다른 구성요소를 더 포함하는 것도 포괄하는 의미를 가진다.
본 명세서에서 "엔진"이라 함은 범용적인 하드웨어와 그 기능을 수행하는 소프트웨어의 논리적 결합을 의미한다.
본 명세서에서는 본 발명의 설명에 필요한 필수적인 구성요소만을 설명하며, 본 발명의 본질과 관계가 없는 구성요소는 언급하지 아니한다. 그리고 언급되는 구성요소만을 포함하는 배타적인 의미로 해석되어서는 아니되며 다른 구성요소도 포함할 수 있는 비배타적인 의미로 해석되어야 한다.
도 1에는 본 발명에 의한 웹 페이지 생성 방법이 적용되는 대상이 되는 웹 페이지의 코드(100)의 일례가 도시되어 있다.
도 1에 도시된 웹 페이지의 코드(100)는, 보호 대상 데이터가 텍스트 자식 요소(20)인, 제1 요소(10)를 포함한다. 웹 페이지의 코드(100)에 따르면 화면에는 "Hello"가 표시된다.
도 1와 같은 통상의 웹 페이지 코드(100)는 일종의 트리 구조를 취한다. 웹 스크래핑은 웹 페이지의 데이터를 검색할 때에 웹 페이지의 트리 노드 구성의 규칙성과 데이터의 규칙성을 찾아 그 웹 페이지에 맞는 규칙을 찾고 데이터를 검색한다. 이 때, CSS 선택자, XPath 또는 정규표현식이 주로 사용된다.
화면에 표시되는 웹 페이지를 보는 사용자는 웹 페이지의 소스 코드의 규칙성은 데이터를 인식하는데에 영향이 없다. HTML 페이지를 구성하거나 화면 디자인에 사용되는 CSS 등의 요소들 중 화면 구성이나 디자인에 드러나지 않고 소스 코드상으로만 존재하는 것들이 있는데, 이러한 요소들은 화면 디자인에 영향을 주지 않지만 웹 스크래핑을 할 때에는 분석 대상이 된다.
본 발명의 기술적 사상은, 화면에 표시된 웹 페이지를 보는 사용자에게는 전혀 영향을 끼치지 않으면서 스크래핑은 방지될 수 있는 규칙성 제거 코드를 웹 페이지에 삽입하는 것에 있다.
도 2에는 본 발명의 제1 형태에 의해 생성된 웹 페이지 코드(100-1)의 일례가 도시되어 있다. 제1 요소(10)인 <div>의 앞에 제1 요소와 동위 요소(200)인 <div></div>를 규칙성 제거 코드로 도 2와 같이 배치한다. 이렇게 하면, 사용자에게 보이는 화면에는 아무 변화가 없지만 텍스트 노드의 구조에는 변화가 생겨서 웹 스크래핑을 방지할 수 있다. 도 2에서 "Hello" 텍스트 요소의 CSS 선택자는 "html > body > div:nth-of-type(2)"가 되고, XPath로는 "/html/body/div[2]"가 된다.
도 3에는 본 발명의 제2 형태에 의해 생성된 웹 페이지 코드(100-2)의 일례가 도시되어 있다. 이 실시 형태에서는 제1 요소(10)의 부모 요소(210)가 규칙성 제거 코드로서 추가된다. 도 3의 예에서는 부모 요소(210)로 <div>와 <span>을 두 번 추가한다. 이 실시 형태에서는 "Hello" 텍스트 요소(20)의 CSS 선택자가 "html > body > div > span > div"로 변경되어 웹 스크래핑을 방지할 수 있다.
도 4에는 본 발명의 제3 형태에 의해 생성된 웹 페이지 코드(100-3)의 일례가 도시되어 있다. 이 실시 형태에서는, 텍스트 자식 요소(20)와 제1 요소(10) 사이에, 텍스트 자식 요소(20)의 부모 요소이며 제1 요소(10)의 자식 요소가 규칙성 제거 코드로 삽입된다. 도 4의 예에서는, <span>과 <map>이 규칙성 제거 코드로 제1 요소(10)와 텍스트 자식 요소(20) 사이에 삽입된다. 이렇게 되면, 텍스트 요소(20)의 CSS 선택자는 "html > body > div > span > map"으로 변경되어 웹 스크래핑이 방지된다.
도 5에는 본 발명의 제4 형태에 의해 생성된 웹 페이지 코드(100-4)의 일례가 도시되어 있다. 이 실시 형태에서는, 제1 요소(10)의 자식 요소로서, 제1 요소의 동위 요소(230)가 규칙성 제거 코드로 포함된다. 도 5의 예에서는 <div></div>가 규칙성 제거 코드로 삽입된다.
도 6에는 본 발명의 제5 형태에 의해 생성된 웹 페이지 코드(100-5)의 일례가 도시되어 있다. 이 실시 형태에서는, 제1 요소(10)와 텍스트 요소(10)를 포함하는 전체 요소와 동일한 속성을 가지며 임의의 데이터(텍스트)를 포함하며, 제1 요소(10)의 앞에 배치되는 제1 요소의 동위 요소가 규칙성 제거 코드로 삽입된다. 도 6의 예에서는 <div style="display:hidden;">ABEdZ</div>가 규칙성 제거 코드로 삽입된다. 이 실시 형태에서는, Hello 를 검색하는 패턴으로 검색하면 대체된 다른 문자열 즉 "ABEdZ"가 표시될 수 있기 때문에, 사용자가 보는 화면에 영향이 없도록 하는 스타일시트를 생성할 수 있다.
도 7에는 본 발명의 제6 형태에 의해 생성된 웹 페이지 코드(100-6)의 일례가 도시되어 있다. 이 실시 형태에서는, 보호 대상 데이터를 인코딩한 값과, 그 값을 디코딩하는 코드를 규칙성 제거 코드(250)로 삽입한다. 그리고 제1 요소(10)와 텍스트 자식 요소(20)는 삭제한다. 디코딩 코드는 웹 브라우저가 HTML 소스를 화면에 표시하면서 자동을 실행되어 해당 텍스트가 표시된다. 이렇게 하면, 사용자는 "Hello" 문구를 볼 수 있지만 웹 페이지 코드(100-6)에서는 찾을 수 없기 때문에 데이터 검색이 원천적으로 차단된다. 인코딩/디코딩 방법은 공지되어 있는 프로토콜을 사용할 수 있다.
도 8에는 본 발명의 제7 형태에 의해 생성된 웹 페이지 코드(100-7)의 일례가 도시되어 있다. 이 실시 형태에서는, 보호 대상 데이터인 텍스트 "Hello"를 이미지화하고, 웹 브라우저가 지원하는 데이터 URI 스킴을 사용하여 표시한 코드(260)가 규칙성 제거 코드로 삽입된다. 그리고 제1 요소(10)와 텍스트 자식 요소(20)는 삭제된다. 도 8에 도시된 예에서는, "Hello"의 텍스트 노드가 이미지화되어 원래 있던 "Hello" 텍스트 노드에 데이터 URI 스키마로 인코딩된 <img> 요소를 사용하여 표시되었다. 사용자는 "Hello" 문구를 그대로 볼 수 있지만, 실제 데이터는 이미지 데이터이므로 검색으로는 찾을 수 없다.
도 9에는 본 발명에 의한 웹 페이지 생성 방법이 수행되는 환경의 일례가 도시되어 있다.
이 환경은 사용자 단말기(1)와, 서비스 서버(2)와, 등록스크래핑 엔진(3)과, 스크래핑 엔진(4)을 포함한다. 서비스 서버(2)는 웹 페이지를 통한 다양한 사용자 서비스를 제공하며, 서비스 서버(2)는 본 발명에 의한 웹 페이지 생성을 수행하는 안티스크래핑 엔진(5)이 연동되어 있다. 등록 스크래핑 엔진(3)은 미리 스크래핑이 허용된 엔진을 의미하며, 스크래핑 엔진(4)은 미리 허가받지 않은 일반 스크래핑 엔진을 의미한다.
사용자 단말기(1)가 서비스 서버(2)에 웹 페이지를 요청하면(단계 900), 안티스크래핑 엔진(5)은 요청된 웹 페이지에 대해서 전술한 다양한 실시 형태에 따라서 웹 스크래핑 방지가 가능한 형태로 웹 페이지를 생성하고(단계 905), 생성된 웹 페이지를 사용자 단말기(1)로 전송한다(단계 910). 안티스크래핑이 적용되더라도 사용자가 보는 화면에는 아무런 영향이 없다.
등록된 스크래핑 엔진(3)이 스크래핑을 시도하면(단계 915), 소정의 로그인 절차나 인증 절차를 거쳐서 등록 스크래핑 엔진임을 확인한 후에 응답한다(단계 920). 등록된 스크래핑 엔진인 경우라면, 응답할 때에 안티스크래핑을 수행하지 않고 원본 웹 페이지를 전송할 수도 있다.
등록되지 않은 스크래핑 엔진(4)이 스크래핑을 시도하면(단계 925), 요청된 웹 페이지에 대해서 안티스크래핑 엔진(5)이 요청된 웹 페이지에 대해서 전술한 다양한 실시 형태에 따라서 웹 스크래핑 방지가 가능한 형태로 웹 페이지를 생성하고(단계 930), 생성된 웹 페이지를 스크래핑 엔진(4)으로 전송한다(단계 935). 그러나 스크래핑 엔진(4)이 수신한 웹 페이지는 전술한 바와 같이 규칙성이 제거된 상태이므로 웹 스크래핑 수행이 불가능하다(단계 940).
본 발명에 의하면, 보호 대상 데이터를 포함하는 웹 페이지의 규칙성이 제거되기 때문에 해당 웹페이지의 소스 코드에 웹 스크래핑을 시도하더라도 보호 대상 데이터를 추출하거나 검색할 수가 없으며, 그럼에도 불구하고 사용자에게 보이는 웹 페이지는 변화가 없기 때문에 사용자의 불편함도 제거되는 효과가 있다.
이상 첨부 도면을 참고하여 본 발명에 대해서 설명하였지만 본 발명의 권리범위는 후술하는 특허청구범위에 의해 결정되며 전술한 실시예 및/또는 도면에 제한되는 것으로 해석되어서는 아니된다. 그리고 특허청구범위에 기재된 발명의, 당업자에게 자명한 개량, 변경 및 수정도 본 발명의 권리범위에 포함된다는 점이 명백하게 이해되어야 한다.
1: 사용자 단말기
2: 서비스 서버
3: 등록 스크래핑 엔진
4: 스크래핑 엔진
5: 안티스크래핑 엔진

Claims (9)

  1. 웹 스크래핑을 방지하는 웹 페이지를 컴퓨터가 생성하는 방법에 있어서,
    보호 대상 데이터가 텍스트 자식 요소인 제1 요소를 포함하는, 웹 페이지 코드를 로딩하는 제1 단계와,
    제1 요소를 포함하는 웹 페이지의 규칙성을 제거하는 규칙성 제거 코드를, 상기 웹 페이지 코드에 삽입하는 제2 단계를 포함하는,
    웹 스크래핑을 방지하는 웹 페이지 생성 방법.
  2. 청구항 1에 있어서,
    상기 규칙성 제거 코드는,
    제1 요소 앞에 배치되며 제1 요소와 동위 요소인,
    웹 스크래핑을 방지하는 웹 페이지 생성 방법.
  3. 청구항 1에 있어서,
    상기 규칙성 제거 코드는,
    제1 요소의 부모 요소인,
    웹 스크래핑을 방지하는 웹 페이지 생성 방법.
  4. 청구항 1에 있어서,
    상기 규칙성 제거 코드는,
    텍스트 자식 요소와 제1 요소 사이에 배치되며, 텍스트 자식 요소의 부모 요소이며 제1 요소의 자식 요소로서 삽입되는 코드인,
    웹 스크래핑을 방지하는 웹 페이지 생성 방법.
  5. 청구항 1에 있어서,
    상기 규칙성 제거 코드는,
    제1 요소에 자식 요소로서 추가되는 제1 요소의 동위 요소인,
    웹 스크래핑을 방지하는 웹 페이지 생성 방법.
  6. 청구항 1에 있어서,
    상기 규칙성 제거 코드는,
    제1 요소와 텍스트 자식 요소를 포함하는 전체 요소와 동일한 속성을 가지며 임의의 데이터를 포함하며, 제1 요소의 앞에 배치되는 제1 요소의 동위 요소인,
    웹 스크래핑을 방지하는 웹 페이지 생성 방법.
  7. 청구항 6에 있어서,
    상기 임의의 데이터가 화면에 표시되지 않도록 하는 스타일시트를 생성하는 단계를 더 포함하는,
    웹 스크래핑을 방지하는 웹 페이지 생성 방법.
  8. 청구항 1에 있어서,
    상기 규칙성 제거 코드는,
    보호 대상 데이터를 인코딩한 값과, 디코딩 코드를 포함하는 코드이며,
    제1 요소와 텍스트 자식 요소는 삭제하는 단계를 더 포함하는,
    웹 스크래핑을 방지하는 웹 페이지 생성 방법.
  9. 청구항 1에 있어서,
    상기 규칙성 제거 코드는,
    보호 대상 텍스트를 이미지화하고 데이터 URI 스킴을 사용하여 표시한 코드이며,
    제1 요소와 텍스트 자식 요소는 삭제하는 단계를 더 포함하는,
    웹 스크래핑을 방지하는 웹 페이지 생성 방법.
KR1020170059799A 2017-05-15 2017-05-15 웹 스크래핑을 방지하는 웹 페이지 소스 코드 생성 방법 KR20180125228A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170059799A KR20180125228A (ko) 2017-05-15 2017-05-15 웹 스크래핑을 방지하는 웹 페이지 소스 코드 생성 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170059799A KR20180125228A (ko) 2017-05-15 2017-05-15 웹 스크래핑을 방지하는 웹 페이지 소스 코드 생성 방법

Publications (1)

Publication Number Publication Date
KR20180125228A true KR20180125228A (ko) 2018-11-23

Family

ID=64565464

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170059799A KR20180125228A (ko) 2017-05-15 2017-05-15 웹 스크래핑을 방지하는 웹 페이지 소스 코드 생성 방법

Country Status (1)

Country Link
KR (1) KR20180125228A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083751A (zh) * 2019-03-18 2019-08-02 平安科技(深圳)有限公司 网页数据防爬虫抓取方法及装置、存储介质、电子设备
KR102114073B1 (ko) * 2019-02-26 2020-05-25 주식회사 디알엠인사이드 전자책 복제 방지를 지원하는 서비스 장치 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102114073B1 (ko) * 2019-02-26 2020-05-25 주식회사 디알엠인사이드 전자책 복제 방지를 지원하는 서비스 장치 및 방법
CN110083751A (zh) * 2019-03-18 2019-08-02 平安科技(深圳)有限公司 网页数据防爬虫抓取方法及装置、存储介质、电子设备

Similar Documents

Publication Publication Date Title
US10009356B2 (en) Redirection method for electronic content
JP4395178B2 (ja) コンテンツ処理システム、方法及びプログラム
US8578036B1 (en) Providing standardized transparency for cookies and other website data using a server side description file
US7779103B1 (en) Dual cookie security system
KR100878338B1 (ko) 워터마크 인코더 및 디코더를 작동시키는 소프트웨어 및장치들
US8943309B1 (en) Cookie security system with interloper detection and remedial actions to protest personal data
US20180032491A1 (en) Web page display systems and methods
US9311281B2 (en) Methods for facilitating web page image hotspots and devices thereof
JP6506762B2 (ja) サードパーティアプリケーションのアクティビティデータの収集のためのシステムおよび方法
US20120204272A1 (en) Method, apparatus and computer program product for publishing public content and private content associated with the public content
US8453215B1 (en) Suggesting access permission changes to lock a website
Bujlow et al. Web tracking: Mechanisms, implications, and defenses
KR20110009675A (ko) 웹 브라우저 상의 광고 표시를 선택적으로 보장하는 방법 및 시스템
US20100306184A1 (en) Method and device for processing webpage data
JP4935274B2 (ja) サーバ及びプログラム
US20160342689A1 (en) Method, device and system for loading recommendation information and detecting web address
US8453214B1 (en) Methods of locking a website
CN104021349A (zh) 网络证据事前保全方法及保全装置
KR20180125228A (ko) 웹 스크래핑을 방지하는 웹 페이지 소스 코드 생성 방법
CN111309578A (zh) 标识对象的方法和装置
US8453213B1 (en) Tools for locking a website
US20090248673A1 (en) Method of sorting web pages, search terminal and client terminal
CN113688339A (zh) 一种信息加载方法、装置、电子设备及计算机存储介质
US8434154B1 (en) Method and apparatus for distributing content across platforms in a regulated manner
CN112889050A (zh) 用于客户端情报安全共享的系统、方法和架构

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right