KR20060079083A - 하이퍼텍스트 링크를 평가하기 위한 방법, 시스템 및컴퓨터 판독가능 매체 - Google Patents

하이퍼텍스트 링크를 평가하기 위한 방법, 시스템 및컴퓨터 판독가능 매체 Download PDF

Info

Publication number
KR20060079083A
KR20060079083A KR1020050108994A KR20050108994A KR20060079083A KR 20060079083 A KR20060079083 A KR 20060079083A KR 1020050108994 A KR1020050108994 A KR 1020050108994A KR 20050108994 A KR20050108994 A KR 20050108994A KR 20060079083 A KR20060079083 A KR 20060079083A
Authority
KR
South Korea
Prior art keywords
token
list
link
web page
tokens
Prior art date
Application number
KR1020050108994A
Other languages
English (en)
Inventor
마이클 에이. 스타버드
Original Assignee
마이크로소프트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이크로소프트 코포레이션 filed Critical 마이크로소프트 코포레이션
Publication of KR20060079083A publication Critical patent/KR20060079083A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Investigating Strength Of Materials By Application Of Mechanical Stress (AREA)
  • Paper (AREA)
  • Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)

Abstract

웹 페이지 상의 하이퍼텍스트 링크(hypertext link)를 나타내는 링크 텍스트가 링크에 의해 참조되는 웹 페이지와 대응하는 범위를 평가하기 위한 방법 및 장치를 제공한다. 일 실시예에서, 예를 들어, 링크 텍스트와 페이지 타이틀(page title)을 개별 토큰(token)으로 구문분석하고, 토큰들을 비교함으로써, 이 링크에 의해 참조되는 웹 페이지의 타이틀과 링크 텍스트를 비교할 수 있다. 링크 텍스트 및 페이지 타이틀이 대응하는 범위는 매칭되는 토큰들의 퍼센트로서 표현될 수 있다. 최소 퍼센트의 토큰들이 매칭되지 않을 때, 시각적인 표시를 제공하는 그래픽 사용자 인터페이스(GUI)를 제공할 수 있다.
링크, 토큰, 웹 페이지, 타이틀

Description

하이퍼텍스트 링크를 평가하기 위한 방법, 시스템 및 컴퓨터 판독가능 매체{METHODS AND APPARATUS FOR THE EVALUATION OF ASPECTS OF A WEB PAGE}
도 1은 본 발명의 실시예를 구현할 수 있는 대표적인 컴퓨터 시스템의 블록도.
도 2는 본 발명의 실시예를 포함한 프로그래밍 명령어를 저장할 수 있는 대표적인 컴퓨터 메모리의 블록도.
도 3a 및 도 3b는 사용자에게 웹 페이지를 제공하기 위한 대표적인 브라우저 인터페이스를 도시하는 도면.
도 4는 본 발명의 일 실시예에 따라서, 제1 및 제2 토큰열이 대응하는 범위를 결정하기 위한 대표적인 처리를 보여주는 흐름도.
도 5는 본 발명의 일 실시예에 따라서, 제1 및 제2 토큰열내의 토큰들을 비교하기 위한 대표적인 처리를 보여주는 흐름도.
도 6은 본 발명의 일 실시예에 따라서, 특정 토큰들을 비교하기 위한 대표적인 처리를 보여주는 흐름도.
도 7은 본 발명의 일 실시예에 따라서, 제1 및 제2 토큰열이 대응하는 범위를 디스플레이할 수 있는 대표적인 그래픽 사용자 인터페이스(GUI)를 도시하는 도면.
<도면의 주요 부분에 대한 부호의 설명>
301: 브라우저 인터페이스
302, 304: 웹 페이지
303: 브라우저 인터페이스
331: 링크
350: 타이틀
본 발명은 컴퓨터 소프트웨어에 관한 것으로, 특히 웹 페이지(web page)의 양상을 평가하는 데 사용할 수 있는 소프트웨어에 관한 것이다.
많은 사람들이 월드 와이드 웹(World Wide Web; "the web")을 이용하는 데 인터넷을 사용한다. 웹 환경에서, 서버 컴퓨터는 클라이언트 컴퓨터가 요청한 정보를 웹 페이지 형태로 제공한다. 웹 페이지는 다른 정보들 중에서, HTML(Hypertext Markup Language) 또는 XML(Extensible Markup Language)과 같은 마크업 언어 포맷(markup language format)으로 제공되는 명령어 집합 또는 "태그(tags)"를 포함한다. 클라이언트 컴퓨터 상에서 실행되는 브라우저(browser) 프로그램은 사용자를 위한 디스플레이를 생성하기 위하여 페이지에 포함된 태그(들)를 수신하여 처리한다. 태그는 예를 들면, 페이지 요소의 표현을 정의할 수 있다.
또한, 태그는 (여기서 "링크"로도 참조라고도 불리는) 하이퍼텍스트 링크 (hypertext link)를 정의할 수 있다. 링크는 URL(Uniform Resource Locator)을 통하여 다른 웹 페이지와 같은 다른 웹 자원을 식별한다. 링크는 웹 페이지 상에서 영숫자 문자("링크 텍스트")에 의해 표현될 수 있다. 링크 텍스트는 전형적으로, 사용자가 링크를 쉽게 식별할 수 있도록 웹 페이지 상에 제공된다. 예를 들면, 다수의 링크는 페이지 상에 볼드체 또는 밑줄친 텍스트에 의해 표현된다. 사용자는 예를 들어, 링크 상에 "클릭(clicking)"함으로써(예를 들면, 마우스의 커서를 그 링크 위로 이동한 후에 마우스 상의 버튼을 누름으로써) 그 링크를 호출(invoke)한다. 링크를 클릭함으로써, 링크에 의해 정의된 URL에서의 웹 자원에 액세스하고자 하는 요청이 서버 컴퓨터에 발행될 수 있다.
논리적으로 관련된 웹 페이지들의 그룹은 통상 웹 사이트라고 불린다. 몇몇 웹 사이트는 유지하기에 성가실 수 있다. 예를 들면, 웹 페이지 상에서 링크에 의해 정의된 URL은 특정 웹 자원에 대한 URL이 변하거나 혹은 웹 자원이 삭제될 수 있으므로 시간이 지남에 따라 쓸모없게 될 수 있다. 웹 사이트의 유지를 지원하기 위해, 관리자 또는 다른 사용자가 웹 사이트의 페이지에 포함된 링크를 관리할 수 있게 하는 다수의 툴(tool)이 생겼다. 예를 들면, 이들 툴은 사이트의 페이지에 포함된 링크가 현재 존재하는 URL을 정의하는지의 여부를 사용자가 판정하는 것을 지원할 수 있다. 또한, 이들 툴은 사용자가 사이트 내의 링크 배치를 볼 수 있게 하는 그래픽 사용자 인터페이스(GUI)를 제공할 수 있다.
본 발명의 일 실시예에 따라서, 제1 웹 페이지에 포함되어 웹 자원을 참조하 는 하이퍼텍스트 링크를 평가하기 위한 자동화된 방법을 제공한다. 이 자동화된 방법은 링크의 특성이 웹 자원의 특성과 충분히 대응하는지의 여부를 판정하는 단계를 포함한다.
본 발명의 다른 실시예에 따라서, 실행될 때, 제1 웹 페이지에 포함되어 웹 자원을 참조하는 하이퍼텍스트 링크를 평가하기 위한 방법을 수행하는 명령어들로써 부호화된 컴퓨터 판독가능 매체를 제공한다. 본 방법은 링크의 특성이 웹 자원의 특성과 충분히 대응하는지의 여부를 판정하는 단계를 포함한다.
본 발명의 또다른 실시예에 따라서, 제1 웹 페이지에 포함되어 웹 자원을 참조하는 하이퍼텍스트 링크를 평가하기 위한 시스템을 제공한다. 이 시스템은 링크의 특성이 웹 자원의 특성과 충분히 대응하는지의 여부를 판정하는 판정 제어기를 포함한다.
첨부 도면은 치수를 고려한 것이 아니다. 도면에서, 각종 도면에 도시된 동일한 구성요소는 동일한 참조번호에 의해 표시된다. 모든 구성요소를 모든 도면에서 라벨링하지는 않는다.
웹 페이지 상의 링크가 자원이 실제 상주하는 URL을 정의하는지의 여부를 판정하는 데 사용될 수 있는 다수의 유틸리티(utility)는 있지만, 링크에 의해 정의된 URL에 상주하는 자원(예를 들면, 웹 페이지)이 페이지 상에 제공된 링크 텍스트와 충분히 대응하는지의 여부를 결정하는 유틸리티는 없다는 것을 알았다. 즉, 링크가 참조하기로 한 자원을 참조하는지의 여부를 판정하기 위해 링크 텍스트와, 이 링크에 의해 실제 참조되는 자원을 비교하는 유틸리티는 없다.
따라서 본 발명의 일 실시예는 링크 텍스트가 그 링크에 의해 참조되는 웹 페이지에 어느 범위까지 대응하는지를 평가하는 자동화된 방법을 제공한다. 일 실시예에서, 링크 텍스트를 링크가 참조하는 웹 페이지의 타이틀(title)과 비교할 수 있다. 일 실시예에서, 링크 텍스트 및 페이지 타이틀의 각각을 개별 "토큰(tokens)"으로 구문분석(parsing)할 수 있고, 토큰을 비교하여 링크 텍스트 및 페이지 타이틀이 어느 범위까지 대응하는지를 결정할 수 있다. 일 실시예에서, 제1 알고리즘에 따라 링크 텍스트에서 발견된 각 개별 토큰을 페이지 타이틀에서 발견된 각 토큰과 비교하여 매칭(matching)하는지를 결정한다. 일 실시예에서, 링크 텍스트와 페이지 타이틀간의 관련성(relevancy)은, 타이틀 페이지 또는 링크 텍스트 내에서, 다른 리스트의 토큰과 매칭하는 총 토큰의 퍼센트로서 표현될 수 있다.
예를 들어, 본 발명의 실시예는 웹 페이지에 포함된 링크의 전체 유효성(validity)을 결정하는 자동화된 유틸리티에 의해 사용될 수 있다. 예를 들면, 본 실시예는 웹 페이지에 포함된 링크가 유효하거나 존재하는 URL을 정의하는지 뿐만 아니라, 각 링크가 참조하기로 한 자원을 참조하는지를 평가하는 유틸리티에 사용될 수 있다. 이 평가의 결과는 그래픽 사용자 인터페이스(GUI)를 통하여 사용자에게 제공될 수 있다. 이와 같이, 사용자는 페이지에 포함된 링크의 전체 유효성을 보다 효과적으로 평가할 수 있다. 그러나 본 발명은 이들의 사용으로 제한되지 않으며, 본 발명의 양상은 다수의 적용을 가질 수 있다는 것을 알아야 한다. 예를 들면, 본 발명의 양상은 브라우저 프로그램에 의해 사용될 수 있고, 링크가 참조하 기로 한 페이지를 명백히 참조하지 않는 링크를 사용자에게 경고하는 역할을 할 수 있다.
본 발명의 다양한 양상은 도 1에 도시된 대표적인 컴퓨터 시스템(100)과 같은 하나 이상의 컴퓨터 시스템에 의해 구현될 수 있다. 컴퓨터 시스템(100)은 입력 장치(들)(102), 출력 장치(들)(101), 프로세서(들)(103), 메모리 시스템(104) 및 저장소(106)를 포함하며, 이들은 모두 상호연결 메카니즘(105)을 통하여 직접 또는 간접적으로 연결되고, 상호연결 메카니즘(105)은 하나 이상의 버스, 스위치 및/또는 네트워크를 구비할 수 있다. 입력 장치(들)(102)는 사용자 또는 머신(예를 들면, 사람 오퍼레이터 또는 전화 수신기)으로부터의 입력을 수신하고, 출력 장치(들)(101)는 사용자 또는 머신(예를 들면, 액정 디스플레이)로 정보를 디스플레이하거나 혹은 전송한다. 프로세서(들)(103)는 전형적으로, 다른 컴퓨터 프로그램의 실행을 제어하고, 스케줄링, 입력/출력 및 다른 장치 제어, 카운팅, 컴파일, 저장소 배정, 데이터 관리, 메모리 관리, 통신 및 데이터 흐름 제어를 제공하는 운영체제(예를 들면, 마이크로소프트 윈도우(R) 계열 운영체제 또는 다른 적당한 운영체제)로 불리는 컴퓨터 프로그램을 실행한다. 프로세서와 운영체제는 집합적으로, 다른 컴퓨터 프로그래밍 언어의 애플리케이션 프로그램을 기록하기 위한 컴퓨터 플랫폼을 정의한다.
또한 프로세서(들)(103)는 다양한 기능을 구현하기 위하여 하나 이상의 컴퓨터 프로그램을 실행할 수 있다. 이들 컴퓨터 프로그램은 절차 프로그래밍 언어, 객체지향 프로그래밍 언어, 매크로 언어 또는 이들의 결합으로 기록할 수 있다. 이들 컴퓨터 프로그램은 저장 시스템(106)에 저장될 수 있다. 저장 시스템(106)은 휘발성 또는 비휘발성 매체 상에 정보를 유지할 수 있으며, 고정 또는 착탈가능하다. 도 2는 저장 시스템(106)을 보다 상세히 도시한다.
저장 시스템(106)은 전형적으로, 컴퓨터 프로그램, 또는 이 프로그램이 사용할 정보를 정의하는 신호를 저장하는 컴퓨터 판독가능/기록가능 비휘발성 기록 매체(201)를 포함한다. 예를 들면, 매체는 디스크 또는 플래시 메모리일 수 있다. 전형적으로, 프로세서(들)(103)는 동작시에 비휘발성 기록 매체(201)로부터 휘발성 메모리(202)로 데이터를 판독하며, 휘발성 메모리(202)는 프로세서(103)에 의한 정보 액세스가 매체(201)에서보다 더욱 신속하게 만들어 준다. 메모리(202)는 도 2에 도시된 바와 같이 저장 시스템(106)에 위치하거나, 혹은 도 1에 도시된 바와 같이 메모리 시스템(104)에 위치할 수 있다. 프로세서(들)(103)는 통상 집적 회로 메모리(104, 202)내에서 데이터를 조작하며, 그 후 처리가 완료된 후에 매체(201)로 데이터를 복사한다. 매체(201)와 집적회로 메모리 소자(104, 202) 간의 데이터 이동을 관리하는 다양한 메카니즘이 알려져 있는데, 본 발명은 이로 제한되지는 않는다. 또한 본 발명은 특정 메모리 시스템(104) 또는 저장 시스템(106)으로 제한되지 않는다.
전술한 바와 같이, 본 발명의 일 실시예는 웹 페이지 상의 링크를 특징짓는 텍스트가 링크에 의해 참조되는 자원과 대응하는 범위를 평가하기 위하여, 컴퓨터 시스템(100)에 의해 수행될 수 있는 자동화된 방법을 제공한다. 본 발명의 실시예에 따라서 평가할 수 있는 링크를 포함한 대표적인 웹 페이지가 도 3a-3b에 도시되 어 있다. 특히, 도 3a는 웹 페이지(302)를 제공하는 브라우저 인터페이스(301)를 도시하고, 도 3b는 웹 페이지(304)를 제공하는 브라우저 인터페이스(303)를 도시한다.
웹 페이지(302)는 그래픽, 텍스트 및 링크를 포함한, 웹 페이지에 공통인 다양한 요소(305, 310, 315, 320)를 포함한다. 또한 웹 페이지(302)는 메뉴 부분(330)을 포함하는데, 이 메뉴 부분(330)은 "Developer Tools"라는 명칭의 링크(331)를 포함한 다수의 추가 링크를 포함한다. 사용자가 (예를 들면, 링크(331)위로 커서를 이동시켜 마우스 버튼을 누르거나 혹은 "엔터"키를 침으로써) 링크(331)를 호출할 때, 브라우저는 웹 페이지(304)를 액세스하기 위한 요청을 발생할 수 있다.
웹 페이지(304)는 도 3b에 도시되어 있다. 웹 페이지(304)는 여러 양상에서 웹 페이지(302)와 유사하다. 예를 들면, 웹 페이지(304)는 웹 페이지(302)에 의해 제공되는 링크(305, 310)를 포함한다. 또한 웹 페이지(304)는 다른 것들 중에서 링크(340, 342, 344)를 포함한다. 웹 페이지(304)는 인터페이스(303)의 상부에 디스플레이되어 있는 텍스트 "MSDN Home Page"인 타이틀(350)을 포함한다.
이제 도 4 내지 도 6을 참조하여, 웹 페이지에 포함된 링크를 평가하기 위한 대표적인 기법을 설명한다. 도 4 내지 도 6의 각각은 이 기법을 점차적으로 보다 상세한 레벨로 도시하는 흐름도를 제공한다. 도 4는 전체 기법을 도시하는 흐름도이다. 도 5는 링크 텍스트 및 페이지 타이틀에서 발견되는 개별 토큰들을 비교하는 단계를 보다 상세히 도시하는 흐름도이다. 마지막으로, 도 6은 더욱 상세하게 비교를 도시하는 흐름도이다.
먼저 도 4를 참조하면, 처리(400)가 시작하여 단계(410) 및 단계(415)를 개시한다. 단계(410)는 평가를 위해 링크 텍스트를 선택한다. 이것은 링크 텍스트를 메모리로 판독하는 것과 같은 적당한 임의 방식으로 수행될 수 있다. 일 실시예에서, 단계(410)의 결과는 링크 텍스트를 구성하는 토큰(즉, 개별 단어 또는 문자열)들의 집합 또는 "토큰 리스트"이다. 일 실시예에서, 리스트에서의 각 토큰은 "블랭크(blank)" 또는 "공백(space)" 문자에 의해 분리되거나 혹은 구분된다. 링크 텍스트 "Developer Tools"로부터 링크(331)(도 3a)의 예를 사용하면, 단계(410)의 결과는 토큰 "Developer"와 "Tools"을 포함한 토큰 리스트일 수 있다.
단계(415)에서, 처리는 링크가 참조하는 페이지의 타이틀을 결정하려 한다. 또한 이것은 참조 페이지를 액세스하도록 요청을 발생하는 것과 같은 적당한 임의 방식으로 수행될 수 있다. 단계(410)에서와 같이, 단계(415)의 결과는 토큰 리스트이다. 페이지 타이틀 "MSDN Home Page"인 페이지(304)(즉, 사용자가 링크(331)를 호출시에 서비스되는 페이지)로부터 타이틀(350)의 예를 사용하면, 단계(415)의 결과는 토큰 "MSDN", "Home" 및 "Page"를 포함한 토큰 리스트이다.
단계(410, 415)의 완료시에 처리는 단계(425)로 진행되고, 여기서 각 토큰 리스트에서 "중요 토큰(significant tokens)"을 결정한다. 일 실시예에서, 알려진 비중요 토큰(insignificant tokens)을 제거함으로써 각 리스트에서 중요 토큰을 결정한다. 예를 들면, 비중요 토큰은 토큰 리스트를 비교하기에 덜 유용한 것으로 알려진 단어일 수 있다. 즉, 비중요 토큰이 링크 텍스트 토큰 리스트와 페이지 타 이틀 토큰 리스트의 모두에서 발견될지라도, 비중요 토큰이 토큰 리스트들간의 매칭을 이끌어낸다는 사실은, 링크 텍스트 토큰 리스트가 페이지 타이틀 토큰 리스트에 대응하는지의 여부를 결정하는 데에는 유용하지 않다. 예를 들면, 비중요 토큰은 "the", "and"과 같은 단어, 그리고/또는 다른 단어, 또는 문자 집합을 포함할 수 있다.
일 실시예에서, 실행동안에 처리(400)가 액세스하는 데이터 구조에 비중요 토큰을 저장할 수 있다. 일 실시예에서, 데이터 구조를 구성할 수 있으므로, 사용자는 비중요 토큰의 집합에 추가, 삭제 또는 변경을 할 수 있다. 비중요 토큰 집합을 구성하는 능력은 예를 들어, 영어외의 언어인 토큰을 사용하기 위해 리스트를 적응시킬 시에 유용할 수 있다. 예를 들면, 사용자는 프랑스 웹 사이트에 제공된 링크에 대응하는 링크 텍스트를 평가하기 위하여 리스트로 일반 프랑스 대명사 집합을 추가할 수 있다.
일 실시예에서, 단계(425)는 각 토큰 리스트로부터 특정 문자를 제거하는 것을 포함한다. 둘 사이의 보다 효과적인 비교를 용이하게 하기 위해 각 토큰으로부터 예를 들어, 마침표, 세미콜론, 하이픈, 앰퍼샌드(ampersand)와 같은 문자 그리고/또는 그외 다른 문자를 제거할 수 있다.
처리는 단계(425)의 완료시에 단계(430)로 진행되고, 여기서, 중요 토큰 리스트를 비교한다. 도 5는 중요 토큰 리스트를 비교하기 위한 대표적인 기법을 도시한다. 도 5의 처리에서, 먼저 두 토큰 리스트 중의 보다 짧은 리스트를 선택하고, 그 후에 보다 짧은 리스트에서의 각 토큰을 보다 큰 리스트에서의 각 토큰과 순차적으로 비교한다.
단계(500)가 시작되면, 처리는 단계(510)로 진행되어 두 토큰 리스트 중에 보다 짧은 리스트를 결정한다. 임의 적당한 방식으로 이를 수행할 수 있다. 예를 들면, 일 실시예에서, 이것은 보다 적은 수의 토큰을 담은 토큰 리스트를 결정함으로써 수행할 수 있다. 이와 달리, 이것은 보다 적은 수의 문자를 담은 토큰 리스트를 결정함으로써 수행할 수 있다. 본 발명은 특정 구현으로 제한되지는 않는다.
단계(510)가 완료되면, 처리는 단계(515)로 진행되어 비교를 위해 보다 큰 리스트에서의 토큰과 (단계(510)로부터 결정된) 보다 짧은 리스트로부터 토큰을 선택한다. 적당한 임의 방식으로 이를 수행할 수 있다. 예를 들면, 토큰 리스트로부터 임의적으로 토큰을 선택할 수 있다.
단계(515)가 완료되면, 처리는 단계(520)로 진행되어 비교를 위해 보다 큰 리스트로부터 첫 토큰을 선택한다. 단계(515)에서의 선택에서와 같이, 적당한 임의 방식으로 이를 수행할 수 있다.
단계(520)가 완료되면, 처리는 단계(525)로 진행되어 보다 짧은 리스트로부터 선택한 토큰을 보다 큰 리스트로부터 선택한 토큰과 비교하여 토큰이 매칭하는지를 결정한다. 도 6은 단계(525)를 수행하기 위한 대표적인 기법을 도시한다. 도 6의 처리는 대표적인 두 토큰 "referral"과 "refer"간의 비교에 관하여 기술한다.
처리(600)가 시작될 때, 처리는 단계(610)에서 진행되어 두 토큰 중에 보다 큰 토큰과 보다 작은 토큰을 결정한다. 적당한 임의 방식으로 이를 수행할 수 있 다. 예를 들면, 보다 적은 수의 문자를 가진 토큰을 보다 작은 토큰으로 결정할 수 있고, 보다 큰 수의 문자를 가진 토큰을 보다 큰 토큰으로 결정할 수 있다. 일 실시예에서, 토큰이 동일한 수의 문자를 포함하는 경우, 임의 순서로 보다 큰 토큰과 보다 작은 토큰을 결정할 수 있다. 주어진 예에서, 처리는 보다 큰 토큰을 "referral"로, 보다 작은 토큰을 "refers"로 결정할 수 있다.
단계(610)가 완료되면, 처리는 단계(615)로 진행되어 보다 큰 토큰의 적어도 "임계 퍼센트(threshold percentage)"를 구성하는 보다 큰 토큰 내의 텍스트를 결정한다. 일 실시예에서, 임계 퍼센트는 보다 작은 토큰과 비교시에 사용되는 보다 큰 토큰 내의 텍스트 부분을 구성한다. 일 실시예에서, 이 부분은 보다 큰 토큰에서 문자의 총 수를 확인하고, 이 토큰의 첫 문자로부터 시작하여, 임계 퍼센트를 만족시키거나 혹은 초과하는 문자의 수를 확인함으로써 식별된다. 주어진 예를 사용하면, 임계 퍼센트가 60%인 경우, 보다 큰 토큰 "referral"에서 임계 퍼센트를 구성하는 텍스트는 "refer"이다(즉, "referral"에서 8문자 중의 5문자, 또는 텍스트의 62.5%).
일 실시예에서, (예를 들어, 사용자가) 임계 퍼센트를 특정 구현의 요구를 만족시키도록 구성할 수 있다. 예를 들어, 사용자가 특정 구현에 맞도록 임계 퍼센트를 변경할 수 있게 해주는 GUI를 제공한다.
단계(615)가 완료되면, 처리는 단계(620)로 진행되어 단계(615)에서 확인된 텍스트와 보다 작은 토큰을 비교한다. 일 실시예에서, 이 비교는 보다 작은 토큰이 단계(615)에서 확인된 텍스트를 포함하는지의 여부를 판정하는 것을 수반한다. 주어진 예를 사용하여, 처리는 (단계(615)에서 결정된) "refer"이 "refers"내에 포함되는지를 결정한다. 그러나 본 발명은 이 양상으로 제한되지 않으므로, 적당한 임의 방식으로 이 비교를 수행할 수 있다.
단계(620)가 완료되면 처리(600)는 완료되고, 전체 처리는 처리(500)로 복귀한다(도 5). 특히, 도 6의 처리는 단계(525)를 수행하기 위한 대표적인 기법이므로, 전체 처리는 도 5의 단계(525)로 복귀한다.
처리는 단계(525)가 완료된 후에에서 단계(530)로 진행되고, 여기서 매칭이 있는지에 대해 판정한다. 일 실시예에서, 단계(615)에서 확인된 텍스트가 보다 작은 토큰 내에 포함된다고 단계(620)(도 6)에서 결정된 경우에, 매칭을 찾는다. 매칭을 발견한 경우, 처리는 단계(535)로 진행되어 매칭 표시를 기록한다. 표시를 예를 들어, 메모리에 기록할 수 있다.
매칭을 발견하지 못한 경우, 처리는 단계(545)로 진행되어 보다 큰 토큰 리스트 내의 더 이상의 토큰이 존재하는지에 대한 판정을 행한다. 보다 큰 토큰 리스트 내의 토큰이 더 존재한다고 판정한 경우, 처리는 단계(520)로 복귀하고, 보다 큰 리스트 내의 다음 토큰을 선택할 수 있다. 이와 같이, 처리는 보다 짧은 리스트 내의 각 토큰과 보다 큰 리스트 내의 모든 토큰들간에 비교를 수행한다.
단계(545)에서 보다 큰 리스트 내의 더 이상의 토큰이 존재하지 않는다고 판정한 경우, 보다 짧은 리스트 내의 토큰과 보다 큰 리스트 내의 임의 토큰간에 매칭이 없다는 표시를 기록한다.
단계(535)와 단계(550) 중 하나가 완료되면, 처리는 단계(540)로 진행되어 보다 짧은 리스트에 더 이상의 토큰이 존재하는지에 대한 판정을 행한다. 존재하지 않는 경우, 처리는 완료된다. 보다 짧은 리스트에 토큰이 더 존재하는 경우, 처리는 단계(515)로 복귀하여 비교를 위해 보다 짧은 리스트 내의 다음 토큰을 선택할 수 있다. 따라서 처리는 보다 짧은 리스트 내의 모든 토큰에 대한 비교를 반복한다.
보다 작은 토큰 리스트와 보다 큰 토큰 리스트의 모두에서의 토큰이 고갈되면, 처리(500)는 완료되고, 전체 처리는 처리(400)(도 4)로 복귀한다. 특히 도 5의 처리는 단계(430)를 수행하기 위한 대표적인 기법이므로, 전체 처리는 도 4의 단계(430)로 복귀한다.
단계(430)가 완료된 후, 처리(400)는 단계(435)로 진행되어 링크 텍스트와 페이지 타이틀이 대응하는 범위를 정의하기 위하여 관련성 점수(relevancy score)를 계산한다. 일 실시예에서, 매칭하는 중요 토큰의 수를 (즉, 단계(510)에서 결정된) 보다 짧은 토큰 리스트 내의 중요 토큰의 총 수로 나누고, 그 결과를 100%로 승산함으로써 관련성 점수를 계산한다. 그러나 본 발명은 이 양상으로 제한되지 않으므로, 두 토큰 리스트의 대응 범위는 적당한 임의 방식으로 결정할 수 있다.
단계(435)의 완료시에, 처리(400)는 완료된다.
일 실시예에서, 최소 관련성 점수는 두 토큰 리스트들이 충분히 대응하는지를 정의할 수 있다. 예를 들면, "매칭"을 구성하도록 두 토큰 리스트가 대응해야 하는 범위를 정의하도록 70%의 최소 관련성 점수를 설정하고, 그에 의해 (토큰 리스트가 나타내는) 페이지 타이틀과 링크 텍스트가 매칭하는지를 정의할 수 있다.
일 실시예에서, 전술한 임계 퍼센트에서와 같이, (예를 들어, 사용자가) 특정 구현의 요구에 맞도록 토큰 리스트들간의 충분한 대응을 정의하는 최소 관련성 점수를 구성할 수 있다. 예를 들면, 사용자가 특정 구현에 맞도록 최소 관련성 점수를 맞춤화할 수 있도록 GUI를 제공할 수 있다.
사용자는 매칭하지 않는 토큰 리스트를 식별할 수 있다. 예를 들면, GUI는 링크 텍스트와 페이지 타이틀을 나타내는 토큰 리스트가 매칭하지 않음을 사용자에게 시각적으로 표시할 수 있다. 도 7에 도시된 바와 같이, 대표적인 GUI(700)는 웹 페이지(302)(도 3a)에 포함된 링크와 서로 참조되는 페이지의 타이틀간의 비교 결과를 제공한다.
GUI(700)는 부분(701)과 부분(702)을 포함한다. 부분(702)은 링크와 관련된 특정 정보를 각 컬럼에 나타내는 그리드 디스플레이(grid display)를 제공한다. 예를 들면, 컬럼(column)(702A)은 링크 텍스트를 포함하고, 컬럼(702B)은 링크에 의해 참조되는 페이지의 타이틀을 포함한다.
도시된 대표적인 실시예에서, 웹 페이지 상의 링크를 나타내는 텍스트와 매칭하지 않는 것으로 간주되는 페이지 타이틀에 시각 표시를 제공한다. 예를 들면, 로우(705)는 링크(331)(도 3a)를 나타내는 텍스트(710)와, 링크(331)가 참조하는 웹 페이지(304)의 타이틀(715)(즉, 도 3b에서 타이틀(350))을 포함한다. 로우(row)(705)는 링크 텍스트(710)와 매칭하지 않는 것으로 간주되는 타이틀을 시각적으로 표시하기 위해 볼드체로 타이틀(715)을 보여준다.
전술한 기법을 사용하여, 관리자 또는 다른 사용자는 웹 사이트에 의해 제공 되는 링크를 보다 효과적으로 관리할 수 있다. 예를 들면, 링크를 나타내는 텍스트가 링크에 의해 참조되는 페이지의 타이틀과 매칭하지 않는다고 (예를 들면, GUI(700)를 통해) 경고시에, 사용자는 링크가 정확한 페이지를 참조하는지를 판정하기 위해 링크를 보다 엄밀히 검사할 수 있다. 결과적으로, 사용자는 (예를 들면, GUI(700)를 통해) 쓸모없게 된 링크를 단순히 확인하는 대신에, 무효 자원(invalid resources)을 참조하는 링크를 보다 효과적으로 갱신할 수 있다.
그러나 본 발명은 이러한 구현으로 제한되지 않으며, 다수의 다른 적용이 가능하다는 것을 이해해야 한다. 예를 들면, 관리자가 웹 사이트를 관리하기 위해 본 발명을 사용할 필요는 없다. 대신에, 본 발명의 실시예는 이들 링크가 참조하기로 한 문서를 참조하는지를 판정하기 위해 웹 페이지에 포함된 링크를 검사하는 브라우저 프로그램에서 구현될 수 있다. 브라우저는 링크가 참조하기로 한 페이지의 타이틀과 매칭하지 않는 링크 텍스트의 시각적 표시를 제공할 수 있고, 그리고/또는 참조 페이지에 대한 사용자의 액세스를 막을 수 있다. 따라서 본 발명의 실시예는 사용자가 악의적이며 해롭거나 혹은 바람직하지 못한 내용을 피할 수 있도록 돕는 데 유용할 수 있다.
또다른 예에서와 같이, 도 4 내지 도 6을 참조하여 전술한 비교 기법을 링크 텍스트와 페이지 타이틀간의 매칭을 결정하는 데 사용할 필요는 없다. 예를 들면, 이 알고리즘을 페이지 타이틀 대 질의열의 관련성을 결정하는 데 이용할 수 있다. (검색 엔진이 하는 것과 같이) 질의열을 웹 페이지 내용과 매칭시킴으로써 질의열에 대한 적절한 매칭을 결정하는 대신에, 질의열을 페이지 타이틀과 매칭시킬 수 있다. 또한 전술한 관련성 점수와 같은 것을 사용하여 질의열에 대한 관련성순으로 매칭을 정렬할 수 있다.
전술한 내용으로부터, 본 발명의 실시예의 양상을 하나 이상의 컴퓨터 프로그램 및/또는 하드웨어, 펌웨어 또는 이들의 조합으로 구현할 수 있다는 것을 알아야 한다. 예를 들면, 실시예의 다양한 구성요소는 프로세서에 의한 액세스 및 실행을 위해 명령어를 저장하는 컴퓨터 판독가능 매체를 구비한 컴퓨터 프로그램 제품으로 구현될 수 있다. 명령어는 컴퓨터에 의해 실행될 시에 컴퓨터로 하여금 다양한 실시예 양상을 구현하도록 해준다.
본 발명의 적어도 하나의 실시예의 몇몇 양상을 전술한 바와 같이, 당업자라면 다양한 변경, 변형 및 개선을 쉽게 할 수 있다는 것을 알 것이다. 이러한 변경, 변형 및 개선은 본 발명의 일부이며, 본 발명의 사상 및 범주내에 있다. 따라서 전술한 설명 및 도면은 단지 예일 뿐이다.
본 발명은 링크 텍스트가 그 링크에 의해 참조되는 웹 페이지에 어느 범위까지 대응하는지를 평가하는 자동화된 방법을 제공한다.

Claims (20)

  1. 제1 웹 페이지(web page)에 포함되어 웹 자원을 참조하는 하이퍼텍스트 링크(hypertext link)를 평가하기 위한 자동화된 방법에 있어서,
    (가) 상기 링크의 특성이 상기 웹 자원의 특성과 충분히 대응하는지를 판정하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서,
    상기 웹 자원은 제2 웹 페이지를 포함하고, 상기 웹 자원의 특성은 상기 제2 웹 페이지의 타이틀(title)을 포함하고, 상기 링크의 특성은 상기 제1 웹 페이지 상의 링크를 나타내는 텍스트(text)를 포함하는 방법.
  3. 제2항에 있어서,
    상기 단계(가)는
    (가1) 상기 제1 웹 페이지 상의 링크를 나타내는 텍스트를 적어도 하나의 토큰을 포함한 제1 토큰 리스트로 구문분석(parsing)하는 단계와,
    (가2) 상기 제2 웹 페이지의 타이틀을 적어도 하나의 토큰을 포함한 제2 토큰 리스트로 구문분석하는 단계와,
    (가3) 상기 제1 토큰 리스트와 상기 제2 토큰 리스트를 비교하는 단계
    를 더 포함하는 방법.
  4. 제3항에 있어서,
    상기 단계(가3)는
    상기 제1 토큰 리스트로부터 제1 토큰을 선택하는 단계와,
    상기 제2 토큰 리스트로부터 제2 토큰을 선택하는 단계와,
    상기 제1 토큰과 상기 제2 토큰 중에 보다 큰 토큰과 보다 작은 토큰을 결정하는 단계와,
    임계 퍼센트(threshold percentage)를 구성하는 상기 보다 큰 토큰의 일부분을 식별하는 단계와,
    상기 임계 퍼센트가 상기 보다 작은 토큰 내에 포함되는지를 판정하는 단계
    를 더 포함하는 방법.
  5. 제3항에 있어서,
    상기 단계(가1)는 상기 제1 토큰 리스트 내의 각 토큰과 비중요 토큰 집합을 비교함으로서 상기 제1 토큰 리스트로부터 제1 중요 토큰 리스트(a list of significant tokens)를 결정하는 단계를 더 포함하고, 상기 단계(가2)는 상기 제2 토큰 리스트 내의 각 토큰과 비중요 토큰 집합을 비교함으로써 상기 제2 토큰 리스트로부터 제2 중요 토큰 리스트를 결정하는 단계를 더 포함하고, 상기 단계(가3)는 상기 제1 중요 토큰 리스트와 상기 제2 중요 토큰 리스트를 비교하는 단계를 더 포 함하는 방법.
  6. 제1항에 있어서,
    (나) 상기 단계(가)의 판정 결과를 그래픽 사용자 인터페이스(GUI) 상에 디스플레이하는 단계를 더 포함하는 방법.
  7. 제6항에 있어서,
    상기 단계(나)는 상기 링크의 특성이 상기 웹 자원의 특성과 충분히 대응하지 않는다고 판정한 경우에 상기 GUI 상에 시각적 표시를 제공하는 단계를 더 포함하는 방법.
  8. 실행 시에, 제1 웹 페이지에 포함되어 웹 자원을 참조하는 하이퍼텍스트 링크를 평가하기 위한 방법을 수행하는 명령어으로 부호화된 컴퓨터 판독가능 매체에 있어서, 상기 방법은,
    (가) 상기 링크의 특성이 상기 웹 자원의 특성과 충분히 대응하는지를 판정하는 단계
    를 포함하는 컴퓨터 판독가능 매체.
  9. 제8항에 있어서,
    상기 웹 자원은 제2 웹 페이지를 포함하고, 상기 웹 자원의 특성은 상기 제2 웹 페이지의 타이틀을 포함하고, 상기 링크의 특성은 상기 제1 웹 페이지 상의 링크를 나타내는 텍스트를 포함하는 컴퓨터 판독가능 매체.
  10. 제9항에 있어서,
    상기 단계(가)는
    (가1) 상기 제1 웹 페이지 상의 링크를 나타내는 텍스트를 적어도 하나의 토큰을 포함한 제1 토큰 리스트로 구문분석하는 단계와,
    (가2) 상기 제2 웹 페이지의 타이틀을 적어도 하나의 토큰을 포함한 제2 토큰 리스트로 구문분석하는 단계와,
    (가3) 상기 제1 토큰 리스트와 상기 제2 토큰 리스트를 비교하는 단계
    를 더 포함하는 컴퓨터 판독가능 매체.
  11. 제10항에 있어서,
    상기 단계(가3)는
    상기 제1 토큰 리스트로부터 제1 토큰을 선택하는 단계와,
    상기 제2 토큰 리스트로부터 제2 토큰을 선택하는 단계와,
    상기 제1 토큰과 상기 제2 토큰 중에 보다 큰 토큰과 보다 작은 토큰을 결정하는 단계와,
    임계 퍼센트를 구성하는 상기 보다 큰 토큰의 일부분을 식별하는 단계와,
    상기 임계 퍼센트가 상기 보다 작은 토큰 내에 포함되는지를 판정하는 단계
    를 더 포함하는 컴퓨터 판독가능 매체.
  12. 제10항에 있어서,
    상기 단계(가1)는 상기 제1 토큰 리스트 내의 각 토큰을 비중요 토큰 집합과 비교함으로써 상기 제1 토큰 리스트로부터 제1 중요 토큰 리스트를 결정하는 단계를 더 포함하고, 상기 단계(가2)는 상기 제2 토큰 리스트 내의 각 토큰을 비중요 토큰 집합과 비교함으로써 상기 제2 토큰 리스트로부터 제2 중요 토큰 리스트를 결정하는 단계를 더 포함하고, 상기 단계(가3)는 상기 제1 중요 토큰 리스트와 상기 제2 중요 토큰 리스트를 비교하는 단계를 더 포함하는 컴퓨터 판독가능 매체.
  13. 제8항에 있어서, 상기 방법은,
    (나) 상기 단계(가)의 판정 결과를 그래픽 사용자 인터페이스(GUI) 상에 디스플레이하는 단계를 더 포함하는 컴퓨터 판독가능 매체.
  14. 제13항에 있어서,
    상기 단계(나)는 상기 링크의 특성이 상기 웹 자원의 특성과 충분히 대응하지 않는다고 판정된 경우에 상기 GUI 상에 시각적 표시를 제공하는 단계를 더 포함하는 컴퓨터 판독가능 매체.
  15. 제1 웹 페이지에 포함되어 웹 자원을 참조하는 하이퍼텍스트 링크를 평가하 기 위한 시스템에 있어서,
    상기 링크의 특성이 상기 웹 자원의 특성과 충분히 대응하는지를 판정하기 위한 판정 제어기
    를 포함하는 시스템.
  16. 제15항에 있어서,
    상기 제1 웹 페이지 상의 링크를 나타내는 텍스트를 적어도 하나의 토큰을 포함한 제1 토큰 리스트로 구문분석하는 링크 텍스트 구문분석 제어기와,
    상기 제2 웹 페이지의 타이틀을 적어도 하나의 토큰을 포함한 제2 토큰 리스트로 구문분석하는 페이지 타이틀 구문분석 제어기와,
    상기 제1 토큰 리스트와 상기 제2 토큰 리스트를 비교하는 비교 제어기
    를 더 포함하는 시스템.
  17. 제16항에 있어서,
    상기 비교 제어기는
    상기 제1 토큰 리스트로부터 제1 토큰을 선택하고,
    상기 제2 토큰 리스트로부터 제2 토큰을 선택하고,
    상기 제1 토큰과 상기 제2 토큰 중에 보다 큰 토큰과 보다 작은 토큰을 결정하고,
    임계 퍼센트를 구성하는 상기 보다 큰 토큰의 일부분을 식별하고,
    상기 임계 퍼센트가 상기 보다 작은 토큰 내에 포함되는지를 판정하는 시스템.
  18. 제16항에 있어서,
    상기 링크 텍스트 구문분석 제어기는 상기 제1 토큰 리스트 내의 각 토큰을 비중요 토큰 집합과 비교함으로써 상기 제1 토큰 리스트로부터 제1 중요 토큰 리스트를 결정하고,
    상기 페이지 타이틀 구문분석 제어기는 상기 제2 토큰 리스트 내의 각 토큰을 비중요 토큰 집합과 비교함으로써 상기 제2 토큰 리스트로부터 제2 중요 토큰 리스트를 결정하고,
    상기 비교 제어기는 상기 제1 중요 토큰 리스트와 상기 제2 중요 토큰 리스트를 비교하는 시스템.
  19. 제15항에 있어서,
    상기 결정 제어기의 결과를 그래픽 사용자 인터페이스(GUI) 상에 디스플레이하기 위한 디스플레이 제어기를 더 포함하는 시스템.
  20. 제19항에 있어서,
    상기 디스플레이 제어기는, 상기 링크의 특성이 상기 웹 자원의 특성과 충분히 대응하지 않는다고 판정된 경우에 상기 GUI 상에 시각적 표시를 제공하는 시스 템.
KR1020050108994A 2004-12-30 2005-11-15 하이퍼텍스트 링크를 평가하기 위한 방법, 시스템 및컴퓨터 판독가능 매체 KR20060079083A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/027,661 US20060150076A1 (en) 2004-12-30 2004-12-30 Methods and apparatus for the evaluation of aspects of a web page
US11/027,661 2004-12-30

Publications (1)

Publication Number Publication Date
KR20060079083A true KR20060079083A (ko) 2006-07-05

Family

ID=35892612

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050108994A KR20060079083A (ko) 2004-12-30 2005-11-15 하이퍼텍스트 링크를 평가하기 위한 방법, 시스템 및컴퓨터 판독가능 매체

Country Status (7)

Country Link
US (1) US20060150076A1 (ko)
EP (1) EP1677215B1 (ko)
JP (1) JP2006190253A (ko)
KR (1) KR20060079083A (ko)
CN (1) CN1797403A (ko)
AT (1) ATE438149T1 (ko)
DE (1) DE602005015675D1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8549099B2 (en) * 2007-07-12 2013-10-01 Viasat, Inc. Methods and systems for javascript parsing
US20100146415A1 (en) * 2007-07-12 2010-06-10 Viasat, Inc. Dns prefetch
US8966053B2 (en) 2007-07-12 2015-02-24 Viasat, Inc. Methods and systems for performing a prefetch abort operation for network acceleration
US8171135B2 (en) * 2007-07-12 2012-05-01 Viasat, Inc. Accumulator for prefetch abort
US9654328B2 (en) 2007-10-15 2017-05-16 Viasat, Inc. Methods and systems for implementing a cache model in a prefetching system
US20100180005A1 (en) * 2009-01-12 2010-07-15 Viasat, Inc. Cache cycling
IT1395277B1 (it) 2009-08-11 2012-09-05 London Equitable Ltd In Its Capacity As Trustee Of The Think Tank Trust Sistema per rilevare anomalie nel flusso venoso a livello extracranico
CN102243633A (zh) * 2010-05-11 2011-11-16 深圳市金蝶中间件有限公司 网页布局的方法及装置
JP5417471B2 (ja) * 2012-03-14 2014-02-12 株式会社東芝 構造化文書管理装置、構造化文書検索方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5941944A (en) * 1997-03-03 1999-08-24 Microsoft Corporation Method for providing a substitute for a requested inaccessible object by identifying substantially similar objects using weights corresponding to object features
US5999929A (en) * 1997-09-29 1999-12-07 Continuum Software, Inc World wide web link referral system and method for generating and providing related links for links identified in web pages
US6446095B1 (en) * 1998-06-09 2002-09-03 Matsushita Electric Industrial Co., Ltd. Document processor for processing a document in accordance with a detected degree of importance corresponding to a data link within the document
WO2000072190A1 (fr) * 1999-05-19 2000-11-30 Fujitsu Limited Procede pour prendre en charge la mise au point de contenus internet, support d'enregistrement contenant le programme applicatif du procede, et systeme d'application du procede
US6578025B1 (en) * 1999-06-11 2003-06-10 Abuzz Technologies, Inc. Method and apparatus for distributing information to users
GB2352548B (en) * 1999-07-26 2001-06-06 Sun Microsystems Inc Method and apparatus for executing standard functions in a computer system
AU2001227909A1 (en) 2000-01-14 2001-07-24 Screamingmedia Inc. Dead hyper link detection method and system
JP4200645B2 (ja) * 2000-09-08 2008-12-24 日本電気株式会社 情報処理装置、情報処理方法および記録媒体
US20020103920A1 (en) * 2000-11-21 2002-08-01 Berkun Ken Alan Interpretive stream metadata extraction
US7120642B2 (en) * 2001-09-10 2006-10-10 Siemens Corporate Research, Inc. Automatic validation method for multimedia product manuals
US20040014013A1 (en) * 2001-11-01 2004-01-22 Telecommunications Research Associates Interface for a presentation system
US7725487B2 (en) * 2003-12-01 2010-05-25 National Institute Of Information And Communications Technology Content synchronization system and method of similar web pages
US8707251B2 (en) * 2004-06-07 2014-04-22 International Business Machines Corporation Buffered viewing of electronic documents

Also Published As

Publication number Publication date
EP1677215A1 (en) 2006-07-05
US20060150076A1 (en) 2006-07-06
EP1677215B1 (en) 2009-07-29
CN1797403A (zh) 2006-07-05
JP2006190253A (ja) 2006-07-20
DE602005015675D1 (de) 2009-09-10
ATE438149T1 (de) 2009-08-15

Similar Documents

Publication Publication Date Title
KR20060079083A (ko) 하이퍼텍스트 링크를 평가하기 위한 방법, 시스템 및컴퓨터 판독가능 매체
US6041324A (en) System and method for identifying valid portion of computer resource identifier
US9606971B2 (en) Rule-based validation of websites
Lawson Web scraping with Python
RU2501078C2 (ru) Ранжирование результатов поиска с использованием расстояния редактирования и информации о документе
US20060059133A1 (en) Hyperlink generation device, hyperlink generation method, and hyperlink generation program
US9298680B2 (en) Display of hypertext documents grouped according to their affinity
US8458207B2 (en) Using anchor text to provide context
US6950980B1 (en) System, method, and program product for saving a submitted form of a web page
JP6116247B2 (ja) 視覚的要素をブロック分割し、識別し、インデクスを付けて、ドキュメントを検索するためのシステムおよび方法
US20080235567A1 (en) Intelligent form filler
US20110087966A1 (en) Internet customization system
US5977969A (en) Universal resource locator dialog with extended top level domains
US7756860B2 (en) Advanced handling of multiple form fields based on recent behavior
JP5360842B2 (ja) ウェブ文書を表示する端末装置が実行するプログラム
KR20060079080A (ko) 웹페이지의 양상을 평가하기 위한 방법 및 장치
US20080140645A1 (en) Method and Device for Filtering Elements of a Structured Document on the Basis of an Expression
CN101118560A (zh) 关键词输出设备和关键词输出方法
JP2007528520A (ja) 検索エンジンに登録されたウェブサイトを管理するための方法およびシステム
WO2008011635A1 (en) Reuse of available source data and localizations
RU2562397C2 (ru) Способ и устройство для добавления адреса гиперссылки в закладку
JP2008197877A (ja) セキュリティ運用管理システム、方法およびプログラム
KR20020093132A (ko) 개선된 경로 검사기
JP2008158589A (ja) 更新情報通知装置及び更新情報通知プログラム
CN102193789A (zh) 一种实现可配置跳转链接的方法和设备

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid