KR20020016514A - 데이터 저장 장소에서 컨텐츠에 대한 색인가능한메타데이터를 수집하기 위한 방법, 시스템, 및 프로그램 - Google Patents

데이터 저장 장소에서 컨텐츠에 대한 색인가능한메타데이터를 수집하기 위한 방법, 시스템, 및 프로그램 Download PDF

Info

Publication number
KR20020016514A
KR20020016514A KR1020010049456A KR20010049456A KR20020016514A KR 20020016514 A KR20020016514 A KR 20020016514A KR 1020010049456 A KR1020010049456 A KR 1020010049456A KR 20010049456 A KR20010049456 A KR 20010049456A KR 20020016514 A KR20020016514 A KR 20020016514A
Authority
KR
South Korea
Prior art keywords
content
data storage
accessed
metadata
storage location
Prior art date
Application number
KR1020010049456A
Other languages
English (en)
Other versions
KR100482479B1 (ko
Inventor
데이돈러틀리지
두타레빈드라나스
쉘데이비드알렌
Original Assignee
포만 제프리 엘
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포만 제프리 엘, 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 포만 제프리 엘
Publication of KR20020016514A publication Critical patent/KR20020016514A/ko
Application granted granted Critical
Publication of KR100482479B1 publication Critical patent/KR100482479B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 데이터 저장 장소(repository)의 어드레스 위치에서 컨텐츠에 대하여 색인을 넣을 수 있는 메타데이터를 수집하기 위해서 컨텐츠 제공자에 의해서 관리되는 데이터 저장 장소(repository)를 검색하기 위한 방법, 시스템, 및 프로그램에 관한 것이다. 커스텀화된 설정들은 컨텐츠 제공자의 데이터 저장 장소를 검색하는 방법에 대한 명령들을 제공한다. 컨텐츠 제공자의 데이터 저장 장소에서의 컨텐츠 페이지들의 컨텐츠는 액세스된 커스텀화된 설정들에 포함된 명령들에 따라서 액세스된다. 액세스된 컨텐츠 페이지들로부터의 메타데이터는 생성되어 데이터 저장 장소에서의 액세스된 어드레스가능한 위치에 대한 메타데이터의 색인에 추가된다.

Description

데이터 저장 장소에서 컨텐츠에 대한 색인가능한 메타데이터를 수집하기 위한 방법, 시스템, 및 프로그램{METHOD, SYSTEM, AND PROGRAM FOR GATHERING INDEXABLE METADATA ON CONTENT AT A DATA REPOSITORY}
본 발명은 전자적 데이터 저장 장소에서의 컨텐츠에 대한 색인가능한 메타데이터를 수집하기 위한 방법, 시스템, 및 프로그램에 관한 것이다.
인터넷에서 문서들을 위치시키기 위해서, 사용자들은 통상적으로 인터넷 검색 엔진을 사용한다. 인터넷 사용자들은 검색용 불(boolean) 연산자들을 포함하는 하나 이상의 핵심 검색 용어들(terms)을 입력하고(enter), 검색 엔진을 포함하는 서버에 검색 요청을 전송한다. 검색 엔진은 인터넷의 웹 페이지들로부터 정보의 색인을 관리한다. 이 색인은 특정 웹 주소 또는 URL에 대한 검색 용어들을 제공한다. 검색 엔진 데이터베이스에서 URL에 대한 색인 용어들이 인터넷 사용자 검색 질의를 만족한다면, 그 URL은 질의에 응답하여 반환된다.
검색 엔진 제공자들은 사용자에게 반환될 수도 있는 보다 정확하고 큰 다수의 잠재적인 검색 결과들을 제공하기 위해서 URL 데이터베이스를 항상 갱신할 필요가 있다. 검색 엔진 회사들은 때때로 위치된 HTML 페이지들의 메타태그들(metatags) 및 컨텐츠에 기초하는 웹 페이지들을 검색 및 분류하는 로봇을 사용한다. 로봇은 HTML 페이지를 검색한 후, 그런 다음 검색된 페이지로부터 참조된 모든 문서들을 반복하여 검색함으로써 웹의 하이퍼텍스트 구조를 자동적으로 통과하는 프로그램이다. 웹 페이지들을 액세스하고 색인을 붙이기 위해서 검색 엔진에 의해서 릴리즈된(released) 웹 로봇들은 웹 크롤러들(crawlers) 및 웹 스파이더로 언급된다.
로봇들에 의해서 생성된 URL을 위한 색인가능한 용어들의 데이터베이스를 가지는 검색 엔진들이 매우 일반적이며 대중적이다. 그러나, 그러한 로봇이 생성된 URL 데이터베이스들의 일부 주목할만한 단점은 URL 웹 사이트의 주기적인 갱신은 로봇이 이전에 색인된 페이지를 재검사할 때까지 URL 데이터베이스를 부정확하고 예전 상태로 둔다는 것이다. 또한, 검색 엔진 로봇들은 검색 엔진 데이터베이스에서 색인 검색 용어들로 HTML 페이지들을 검색하고 HTML 컨텐츠를 분석하도록 현재 설계되어있다. 그러나, 다수의 웹 페이지들은, 예를 들면, MPEG, SHOCKWAVE, ZIP 파일, 등등의 다양한 멀티-미디어 형식들로 인코딩된 컨텐츠와 같이, HTML 페이지들을 통과하도록 설계된 종래의 검색 엔진 로봇들에 액세스 불가능하거나 또는 분석 불가능한 형식으로 컨텐츠를 제공한다. 또한, 웹 사이트 컨텐츠는 데이터베이스를 질의하여 검색 결과들을 반환하도록, 예를 들면, CGI(Common Gataway Interface:공통 게이트웨이 인터페이스), 자바 프로그램들, 마이크로소프트 액티브 서버 페이지들과 같은, 프로그램에 의해서 사용되는 검색 용어를 제공함으로써 동적이고 액세스가능할 수도 있다. 질의들을 통해서 액세스 가능한 그런 동적 데이터는 통상적으로 종래의 검색 엔진 로봇들에 의해서 식별되지 않으며 검색 엔진 URL 데이터베이스에서 색인된다.
웹 로봇들은 웹 서버들을 과부하시키고 보안상 위험한 단점이 여전히 남아있다. 이런 이유로, 많은 웹 사이트들은, 심지어 웹 사이트 제공자가 그들이 정보를 공개적으로 사용가능하도록 원할 때조차, 검색 엔진 웹 로봇이 컨텐츠에 접근하고 분류하는 것을 제한하는 방화벽(firewall)을 사용한다. 또한 웹 사이트 제공자들은 로봇이 접근 및 색인이 허용되지 않는 사이트에서의 URL을 나타내는 "robot.txt" 파일을 생성함으로써 사이트로의 웹 로봇의 액세스를 제한할 수 있다. 검색 엔진 웹 로봇들의 그러한 제한으로 웹 로봇이 검색 엔진 사용자들에게 매우 흥미있을 수 있는 관련된 웹 페이지들에 액세스하는 것을 방지한다.
일부 검색 엔진들은 수동의 분류학자(taxonomist)를 사용한다. 예를 들면, 야후(Yahoo)는 웹 페이지의 수동적인 의뢰(submission)를 수신한 다음 그것의 데이터베이스에 포함하도록 웹 페이지를 분류한다. 이런 방법은 매우 시간 소모적이다. 또한, 수동적인 분류 방법은 새로운 페이지들에 대하여, 인터넷, 즉, WWW(World Wide Web)를 연속적으로 검토하는 그리고 사용사에 의해서 제공되는 컨텐츠에 제한을 두지 않는 로봇 방법만큼 많은 페이지를 분류할 수 없다.
따라서, 웹 페이지들을 분류하기 위한 향상된 기술이 필요하다.
도 1은 본 발명의 바람직한 실시예에 따라서 데이터 저장 장소들을 위한 색인가능한 메타데이터를 수집하는 컨텐츠 제공자 및 웨어하우스(warehouse)와의 관계를 도시한 도면.
도 2는 본 발명의 바람직한 실시예에 따라서 URL에서 색인가능한 메타데이터를 수집하는데 사용되는 수집 툴(collection tool)의 프로그램 구성요소들을 도시한 도면.
도 3은 본 발명의 바람직한 실시예에 따라서 수집 툴이 URL를 검색하는 방법을 제어하는데 사용되는 파일의 구조를 도시한 도면.
도 4, 5, 및 6은 본 발명이 바람직한 실시예에 따라서 URL로부터 색인가능한 메타데이터를 수집하기 위해 수집 툴에 의해서 실행되는 로직(logic)을 도시한 도면.
도면의 주요 부분에 대한 부호의 설명
2 : 컨텐츠 제공자 4 : 웨어하우스
6 : 수집 툴 8 : 웹 저장 장소
12 : 액세스 장벽
상술된 종래 기술에서의 제한을 극복하기 위해서, 바람직한 실시예들은 데이터 저장 장소에서 어드레스들 위치들에서 컨텐츠에 대하여 색인가능한 메타데이터를 수집하도록 컨텐츠 제공자들에 의해서 관리되는 데이터 저장 장소를 검색하기 위한 방법, 시스템, 및 프로그램을 나타낸다. 컨텐츠 제공자에 의해서 커스텀화될 수 있는 설정들은 액세스된다. 커스텀화된 설정들은 컨텐츠 제공자의 데이터 저장 장소를 검색하는 방법에 대한 명령어들을 제공한다. 컨텐츠 제공자의 데이터 저장 장소에서 컨텐츠 페이지들의 컨텐츠는 액세스된 커스텀화된 설정들에 포함된 명령들에 따라서 액세스된다. 액세스된 컨텐츠 페이지들로부터의 메타데이터는 발생되어 데이터 저장 장소에서 액세스된 어드레스 가능한 위치들을 위해서 메타데이터의 색인에 추가된다.
다른 실시예들에서, 액세스된 커스텀화가능한 설정들은 컨텐츠 제공자에 의해서 제공되는 컨텐츠 제공자의 데이터 저장 장소에서 어드레스 가능한 위치들을 제공할 수도 있다. 그런 경우에, 컨텐츠 페이지들을 액세스하는 것은 제공된 어드레스 가능한 위치들에서 컨텐츠 페이지들을 액세스하는 것을 포함하고, 여기서 액세스된 컨텐츠 페이지들에 대한 메타데이터가 생성된다.
또한, 액세스된 커스텀화 가능한 설정들은 적어도 하나의 제공된 어드레스 가능한 위치를 위한 질의 용어들을 제공한다. 질의 용어들이 있는 제공된 어드레스 가능한 위치 각각에 대하여, 제공된 질의 용어들은 질의 결과들을 얻기 위해서 제공된 어드레스 가능한 위치에서 사용된다. 그리고 나서 메타데이터는 데이터 저장 장소에서 액세스된 어드레스 가능한 위치들에 대하여 메타데이터의 색인에 추가하도록 획득된 질의 결과들로부터 발생된다.
다른 실시예들에서, 액세스된 커스텀화 가능한 설정들은 또한 유효성 확인 프로그램들을 나타낸다. 액세스된 설정들에서 표시된 각각의 유효성 확인 프로그램은 각각의 액세스된 컨텐츠 페이지에 대하여 실행된다. 각각의 액세스된 컨텐츠 페이지에 대한 유효성 출력 결과는 그 컨텐츠 페이지의 특성들을 나타내는 각각의 유효성 확인 프로그램으로 발생된다. 메타데이터는 데이터 저장 장소에서 액세스된 어드레스 가능한 위치들에 대하여 메타데이터의 색인에 추가하도록 유효성 출력 결과로부터 발생된다. 또한, 컨텐츠 페이지에 참조된 삽입 파일을 분석할 수 있는 파서가 결정된다. 참조된 삽입 파일의 컨텐츠는 분석되고 메타데이터는 색인에 추가하도록 삽입된 파일의 분석된 컨텐츠를 위해서 발생된다.
바람직한 실시예들은 데이터 저장 장소의 소유자가 메타데이터가 수집되는 방법에 대하여 더욱 잘 조절할 수 있는 데이터 저장 장소에서 URL를 위한 색인 가능한 메타데이터를 수집하도록 데이타 저장 장소들을 검색하는 기술을 제공한다. 예를 들면, 바람직한 실시예들은 컨텐츠 제공자로 하여금 색인 가능한 메타데이터를 검색하도록 URL를 지정할 수 있도록 한다. 또한, 바람직한 실시예들에서, 메타데이터는 동영상(movie) 파일들, 쇽웨이브(Shockwave) 파일들, ZIP 파일들 등과 같은 멀티미디어 파일들에서의 컨텐츠와 같은, 종래의 검색 엔진에 의해서 액세스되지 않는 형식으로 인코딩된 컨텐츠용으로 수집될 수 있다. 또한, 바람직한 실시예들에서, 데이터 저장 장소 소유자는 URL에서 컨텐츠가 특정한 유효성 기준을 만족시키거나 또는 선택된 한정사들(qualifiers)을 만족하는지를 나타내는 메타데이터를 발생시키도록 유효성 확인 프로그램들을 선택함으로써 어떤 메타데이터가 제공되는지를 제어할 수도 있다.
이러한 바람직한 실시예의 기술들은, 웹 로봇들은 단지 URL에서 문자 형식인 컨텐츠를 검색하고, 멀티-미디어 파일들 또는 다른 압축 파일들과 같은, 문자가 아닌(non-textual) 인코딩으로 삽입된 파일들을 액세스하지 않는 현재 기술에 대하여 향상된 것이다. 또한, 데이터 저장 장소 소유자로 하여금 URL이 검색되고 메타데이터가 수집되는 방법을 맞출 수 있도록 함으로써, 데이터 저장 장소 소유자는 색인 가능한 메타데이터를 데이터 저장 장소용으로 사용가능하게 향상시킬 수 있고, 그럼으로써 검색 결과들의 품질을 향상시킨다.
또한, 바람직한 실시예의 수집 툴(collection tool)은 URL 사이트들에 대한 아주 적절한 메타데이터를 수집하기 위해서 URL 페이지들에서 메타데이터의 상업적인 수집에 종사하는 데이터 웨어하우스 업체에 의해서 사용될 수도 있다. 데이터 웨어하우스는 가입자(subscriber) URL에서의 메타데이터를 수집하여 관련자(interested parties)에게 메타데이터를 판매하거나 또는 허가하도록 컨텐츠 제공자들에게 예약(subscriptions)을 제공하거나 판매한다.
다음의 기술에서, 본 발명의 일부를 구성하고, 본 발명의 일부 실시예들을 도시하는 첨부한 도면을 참조한다. 다른 실시예들이 활용될 수도 있으며 본 발명의 범주에서 벗어나지 않는 한 구조 및 실행의 변경이 가능하다.
도 1은 컨텐츠 제공자(2) 및 메타데이터 웨어하우스(4) 사이에 설정된 관계를 도시하고 있다. 메타데이터 웨어하우스(4)는 다른 컨텐츠 사이트 소유자들(2)로부터 URL 상의 색인 가능한 메타데이터를 수집한다. 메타데이터 웨어하우스(4)는 그것의 URL 데이터베이스를 갱신하는데 사용하도록 검색 엔진 제공자에게 이 정보를 제공할 수도 있다. 이와 달리, 메타데이터 웨어하우스(4)는 검색 엔진 데이터베이스를 위한 색인 가능한 메타데이터를 수집하는 검색 엔진 제공자의 일부일 수도 있다. 컨텐츠 제공자(2)는 인터넷 사용자들로 하여금 검색동안 그것의 사이트에서 URL을 위치시킬 수 있도록 하기 위해서 그것의 웹 사이트 상의 정보를 메타데이터 웨어하우스(4)로 사용가능하게 한다. 컨텐츠 제공자(2)의 브라우저 가능한(browsable) 컨텐츠는 저장 장소(8)에서 관리된다. 인터넷 사용자는 URL을 제공함으로써 저장 장소(8)에서의 데이터를 액세스할 수 있다. 만약 저장 장소가 동적 데이터를 포함한다면, 인터넷 사용자는 저장 장소(8)에 있는 동적 데이터에 액세스하기 위해서 CGI 명령어와 함께 파라미터들을 제공해야할 수도 있다. 데이터 저장 장소(8)는 인터넷을 통해 액세스가능한 비-HTML(non-HTML) 컨텐츠뿐만 아니라 HTML 페이지들을 포함할 수도 있다. 데이터 저장 장소(8)에서의 비-HTML 컨텐츠는 동적 데이터를 포함할 수 있으며, 동영상(movie) 파일, 쇽웨이브(ShockWave) 파일, 또는 어떤 다른 멀티-미디어 형식과 같은, 표현하거나(render) 또는 처리하기 위해서 플러그-인(plug-in) 애플리케이션을 요구하는 파일 형식으로 관리되는 파일이다.
메타데이터 웨어하우스(4)는 저장 장소(8)에 있는 URL에서 컨텐츠 상의 정보를 위해 저장 장소(8)를 검색하고 저장 장소(8)에 있는 액세스된 URL에서 컨텐츠에 기반한 메타데이터(10)를 발생시키는, 아래에 상세히 기술된, 수집 툴(collection tool)(6)을 제공한다. 그런 다음 이 메타데이터(10)는, 바람직하게는 인터넷과 같은 네트워크 연결을 통하여, 웨어하우스(4)로 제공된다. 수집 툴(6)은 외부 위치로부터 저장 장소(8)를 검색하기 위해서 웨어하우스(4) 서버에 의해서 실행될 수도 있다. 대신에, 컨텐츠 제공자(2)는 웨어하우스(4) 서버로 역전송하기 위해서 메타데이터(10)를 실행 및 수집하도록 저장 장소(8)에 액세스할 수 있는 컨텐츠 제공자(2) 컴퓨터의 수집 툴(6)을 실행할 수도 있다.
도 1은 종래 기술의 웹 로봇들이 컨텐츠 제공자(2)의 저장 장소(8)에 있는 URL에서의 색인 가능한 메타데이터를 수집하는 것을 방지하는, 액세스 장벽(access barrier)(12)의 존재를 도시하고 있다. 이런 액세스 장벽(12)은 통상적으로 단지 HTML 웹 페이지들의 정보를 분석하고 수집할 수 있는 종래 기술의 로봇들에 액세스할 수 없는, 예를 들면, MPEG(또는 어떤 다른 멀티미디어 파일 형식), 쇽웨이브(Shockwave), ZIP 파일들, CGI, XML(Extended Markup File: 확장표시언어), 자바 프로그램 등과 같은, 인코딩 형식을 포함한다. 또한, 액세스 장벽(12)은 로봇들이 저장 장소(8) URL을 통과하는것(traversing)을 방지하는 방화벽을 포함할 수도 있다.
도 2는 수집 툴(6) 내부의 프로그램 구성요소들을 도시한다. 수집 툴(6)은 웹 페이지들을 통과(traversing)하기 위한 기술로 알려진 로봇 형태의 기능들(functions)을 포함하며 저장 장소(8)의 URL에서의 컨텐츠로부터 색인 가능한 메타데이터를 수집하도록 설계되어 있다. 수집 툴(6)은 검색 명령어 파일(20)로 언급되는 구조화된 문서에 근거하여 검색 절차를 결정한다. 검색 명령어 파일(20)은 수집 툴(6)이 액세스하도록 프로그램되어 있는 URL에서 컨텐츠 제공자의 저장 장소(8)에 저장될 수도 있다. 이와는 달리, 웨어하우스(4)가 컨텐츠 제공자(2)에게 수집 툴(6)을 제공할 때, 검색 명령어 파일(20)은 수집 툴(6) 설치 패키지에 포함되어 수집 툴(6) 파일들 내부에 설치될 수도 있다.
또한 수집 툴(6)은 HTML, XML, Shockwave, MPEG, JPEG, ZIP 파일들 또는 다른 멀티미디어 컨텐츠 형식 또는 압축 형태와 같은, 다른 컨텐츠 인코딩들로부터 데이터를 분석하고 수집할 수 있는 파서들(parsers) 22a, b, ... n 을 포함한다. 이런 파서들 22a, b,...n은 수집 툴(6)로 하여금 웹 페이지들에서 사용가능한 컨텐츠 형태들의 여러 형태로부터 색인 가능한 메타데이터를 수집할 수 있도록한다. 이런 방법으로, 바람직한 실시예들에서, 색인 가능한 메타데이터(10)는 HTML 또는 다른 문자 형태로 인코딩된 컨텐츠에 제한을 받지 않지만, 멀티미디어 파일 형태와 같은, 다른 형태로 인코딩된 컨텐츠에서의 정보를 포함할 수도 있다.
또한 수집 툴(6)은 페이지들이 특정한 사전설정된 조건들을 만족하는지를 결정하기 위해서 URL에서의 페이지를 처리하는 프로그램들인 유효성 확인기(validation checkers) 24a, b,...n을 포함한다. 이런 유효성 확인기들 24a, b,...n의 출력은 분석된 웹 페이지가 특정 기준들 및 조건에 일치하는지를 나타낸다. 이런 유효성 확인기 출력은 웹 페이지용 메타데이터에 추가될 수도 있다. 예를 들면, 유효성 확인기들 24a, b,...n은 다음의 유효성 확인기 프로그램들의 어떤 하나를 포함할 수도 있다.
W3C(World Wide Web Consortium: W3 협회) 유효성 서비스: XML 올바른 구성(well-formedness) 뿐만아니라, W3C HTML 및 XHTML 추천들 및 표준들에 일치하는지를 결정하기 위해서 HTML 페이지들을 확인한다.
XML 올바른 구성(Wellformedness) 확인기 및 유효화기(Validator): 올바른 구성(well-formedness) 및 (선택적으로) 유효성에 대하여 XML 문서를 확인한다.
BOBBY: 무자격의 사람들로의 접근에 대하여 웹 페이지들을 분석하는 웹 기반의 도구이다. BOBBY의 접근에 대한 분석은 W3C 웹 컨텐츠 접근 지침(Web Content Accessibility Guidelines)에 근거한다. 예를 들면, Bobby가 승인되기 위해서는, 웹 사이트는 모든 비-문자 성분들(즉, 이미지들, 애니메이션들, 오디오, 비디오)과 동등한 텍스트를 제공해야하며, 그래프들 및 챠트들의 개요를 제공해야하며, 색을 포함하는 모든 정보는 또한 색이 없이 사용될 수 있도록 해야하며, 문서의 문자 및 비-문자 컨텐츠의 문자 동등(예를 들면, 표제)의 자연어에서 변경을 분명하게 식별해야하며, 논리적으로 컨텐츠를 구성해야하고, 그리고 지원되지 않는 기능들을 위한 대안의 컨텐츠(예를 들면, 애플릿들(applets) 또는 플러그-인들(plug-ins))을 확실히 제공해야한다.
보안: 유효성 확인기 24a, b,...n은 어떤 보안 설정들 또는 보안 보증들을 결정하고 그런 보안 설정들에 대한 색인 가능한 정보를 반환할 수도 있다.
비밀(Privacy): 유효성 확인기 24a, b,...n은 어떤 비밀 보장 또는 브랜드화된 로고들 또는, 승인 및 TRUSTe 비밀 프로그램에의 참여를 나타내는, 승인의 TRUSTe 봉인과 같은, URL에서 비밀 조건들에 관련한 승인의 봉인들을 결정할 수도있다.
등급(Ratings) 또는 심사(Awards): 유효성 확인기 24a, b,...n은 그 사이트가 어떤 지정된 등급 또는 심사인지를 결정할 수도 있다. 바람직한 실시예에서, 컨텐츠 제공자(2)는 웨어하우스(4)에서 어떤 특정한 등급 또는 심사를 지정할 수도 있다.
"Best Viewed By"유효성 확인기 24a, b,...n은 URL에서 웹 페이지가 그 웹 페이지를 보는데 사용하기 위해서 바람직한 브라우저를 나타내는지를 결정할 수도 있다.
보증(Endorsements) 및 승인: 유효성 확인기 24a, b,...n은 사이트가 어떤 특정한 보증 또는 승인을 가지는지를 결정할 수도 있다. 바람직한 실시예들에서, 컨텐츠 제공자(2)는 웨어하우스(4)에서 확인하기 위한 어떤 특정한 보증 및 승인을 지정할 수도 있다. 예를 들면, 컨텐츠 제공자(2)는 수집 툴(6)이 특정한 승인 단계를 확신하도록 특정한 바른 구성으로부터 보증을 위한 페이지를 확인하는 것을 요청할 수도 있다.
경고(Warning): 유효성 확인기 24a, b,...n은 사이트가, "18세 이하 금지(No one under 18)", "성인용(Adult Content)" 등과 같은, 어떤 경고를 포함하는지를 결정할 수도 있다. 바람직한 실시예들에서, 컨텐츠 제공자(2)는 웨어하우스(4)에서 확인하기 위해서 어떤 특정한 경고를 지정할 수도 있다.
유효성 확인기들 24a, b,...n은 웹 페이지 또는 그 내부의 컨텐츠의 어떤 다른 특성들을 확인할 수도 있다. 또한, 유효성 확인기들 24a, b,...n은 HTML이 아닌 페이지들의 특성을 재고하기 위한 다른 컨텐츠 인코딩들을 위한 파서 프로그램들을 포함할 수도 있다. 예를 들면, 유효성 확인기 24a, b,...n은, 예를 들면, 성인용(Adult Content), Graphic Violence, "R" 등급, "XXX" 등급, 등등과 같은 어떤 컨텐츠 경고가 존재하는지를 결정하기 위해서, 예를 들면, MPEG 또는 Apple QuickTime 파일과 같은, 동영상(movie) 파일을 분석할 수도 있다.
유효성 확인기들 24a, b,...n은 컨텐츠 파일을 검사하기 위해서 파서들 22a, b,...n을 활용할 수 있거나, 이와는 달리, 유효성 확인기 24a, b,...n은 페이지 컨텐츠를 검사하기 위해서 자체의 파서를 포함할 수도 있다.
도 3은 저장 장소(8)에서 URL을 처리하는 방법에 관하여 수집 툴(6)을 나타내는 검색 명령어 파일(20) 내부의 구성요소들을 도시한다. 바람직한 실시예에서, 컨텐츠 제공자(2)는 수집 툴(6)이 저장 장소(8)를 검색하는 방법을 제어하도록 검색 명령어 파일(20)을 구성한다. 검색 URL(50) 성분들은 수집 툴(6)이 다른 성분들에 따라서 액세스하고 검색해야하는 URL를 나타낸다. 질의 용어들 성분(52)은 URL에서 웹 페이지를 통하여 동적 데이터에 액세스하기 위해서 URL에 반하여 실행하기 위한 수집 툴(6)을 위한 지정된 URL에 대한 검색 용어들의 목록을 제공한다. 저장 장소(8)는 질의 용어들에 응답하여 동적 데이터를 액세스하고 발생시키기 위해서 CGI 또는 자바 프로그램들을 포함할 수도 있다. 수집 툴(6)은 URL 페이지에서 질의들을 실행할 때 페이지에 표시하도록 검색 용어를 포함하는 URL을 구성할 수도 있다. 질의 용어 한정사들(qualifiers)(54)은 질의 결과가 한정사(qualifier) 술어(predicate)를 만족시키는지를 결정하기 위해서 하나 이상의 질의 용어들을 위하여 질의 결과들에 반하여 적용하는 술어들(predicates)을 제공한다.
패스워드 성분(56)은 수집 툴(6)이 그 URL에서의 데이터에 액세스하도록 특정 URL에서 사용할 수 있는 패스워드들을 나타낸다. 패스워드는 수집 툴(6)로 하여금 보호된 사이트에 들어가거나 도는 방화벽이 설치된 페이지들을 검색할 수 있도록 한다. 재귀적인 검색 설정 성분(58)은 수집 툴(6)이 검색 URL(50)에서 나열된 액세스된 URL에서의 URL 링크들을 검색하는 방법을 나타낸다. 예를 들면, 설정(56)은 수집 툴(6)이 URL에서의 모든 링크들을 검색하도록 지시한다. 대신에, 설정(56)은 URL을 벗어난 어떤 링크들을 검색하지 않도록 지시할 수도 있거나, 또는 재귀적인 검색의 깊이 또는 크기를 제한할 수도 있다.
금지된 URL 성분(60)은 수집 툴(6)이 액세스할 수 없는 URL을 나타낸다. 이 성분(60)은 수집 툴(6)이 검색 URL(50)에 나열된 URL에서의 링크를 통하여 재귀적으로 액세스될 수 있는 특정 URL에 액세스하는 것을 방지하는데 사용된다. 유효성 확인기들 성분(62)은 수집 툴(6)이 액세스된 페이지에 대하여 실행해야하는 하나 이상의 유효성 확인기 24a, b,...n을 나타낸다. 확인 파라미터들 성분(64)은 유효성 확인기 24a, b,...n가 검사된 웹 페이지에 대하여 확인해야하는 특유의 특성들을 나타낸다. 예를 들면, 파라미터들(64)은 유효성 확인기 24a, b,...n가 검색해야하는 승인의 봉인들, 보증(endorsements), 경고, 등급 등을 나타낼 수도 있다. 만약 유효성 확인기(60)을 위해서 어떤 확인 파라미터들도 제공되지 않는다면, 유효성 확인기(60)는 페이지가 어떤 사전 설정된 파라미터들을 포함하는지를 결정하는 BOBBY 또는 XML 올바른 구성(well formedness)의 경우와 같이, 그것을 검사하기 위해서 어떤 사용자 파라미터들도 요구하지 않는다.
유효성 확인기 한정사들(qualifiers)(66)은 URL에서 컨텐츠를 검사하는 유효성 확인기 24a, b,...n으로부터의 출력에 대하여 실행하는 한정사들(qualifiers)을 제공한다. 만약 URL에 대한 유효성 확인기 24a, b,...n의 출력이 한정사 술어를 만족하지 않는다면, 그 URL에 대하여 어떤 메타데이터도 반환되지 않으며 비한정(non-qualifying) URL은 웨어하우스(4)에 제공되는 메타데이터와 함께 포함되도록 색인이 붙여지지 않는다. 예를 들면, 한정사는 BOBBY와 부합되지 않는 페이지들의 검색 결과들을 반환하지 않는다는 것을 나타낼 수도 있다. 만약 BOBBY 유효성 확인기 24a, b,...n이 URL의 컨텐츠가 BOBBY와 부합되지 않았다고 결정했다면, BOBBY 한정사에 따라서, 그 URL을 위한 메타데이터는 반환되지 않고 그 URL은 색인이 붙지 않는다. 대신에, 검사된 URL 페이지에 대하여 불복종(non-compliance)을 나타내는, 또는 불복종을 나타내는 어떤 등급을 지시하는 메타데이터는 반환될 수도 있다. 불복종을 나타내는 그러한 메타데이터는 관심있는 인터넷 검색자들로 하여금 불복종 페이지를 위치시킬 수 있도록 한다. 검색 명령어 파일(20)에서 선택된 각각의 유효성 확인기(62)에 대한 개별적인 유효성 확인기 한정사(66)가 있다. 만약 어떤 유효성 확인기 한정사(66)도 없다면, 그 페이지에 대한 메터데이터는 유효성 확인기 24a, b,...n으로부터의 출력과 무관하게 반환된다. 만약 유효성 확인기 24a, b,...n으로부터의 출력에 대한 한정사가 충족되지 않는다면, 수집 툴(6)은 비한정(non-qualifying) URL을 위한 어떤 데이터도 제공하지 않는다. 대신에, 수집 툴(6)은 그 URL을 위한 메타데이터와 함께 비한정 출력을 포함하지 않을 수도 있지만, 그 URL을 위한 다른 한정(qualifying) 메타데이터로 하여금 웨어하우스(4)로 제공될 수 있도록 한다. 이런 방법으로, 컨텐츠 제공자(2)는 URL이 인터넷 사용자 검색 질의들에 응답하여 반환되는 방법을 맞추도록 제공되는 메타데이터의 형식을 제어할 수 있다.
페이지 속성 한정사 성분(68)은 컨텐츠의 데이터, 바이트 크기 등과 같은, 페이지를 한정하는데 사용하는 속성을 나타낸다.
웨어하우스(4)는 컨텐츠 제공자(2)로 하여금 검색 명령어 파일(20)에서 검색 설정들을 설정할 수 있도록 GUI(graphical user interface: 그래픽 사용자 인터페이스)를 개발할 수도 있다. 예를 들면, 만약 컨텐츠 제공자(2)가 인터넷을 통하여 웨어하우스(4)와 통신한다면, 컨텐츠 제공자(2)는 수집 툴(6)이 저장 장소(8)를 검색하는 방법을 제어하는 검색 명령어 파일(20)에서 검색 설정들을 선택하기 위해서 웹 브라우저 GUI를 사용할 수도 있다. 또한 GUI는 컨텐츠 제공자(2)로 하여금 유효성 확인기 24a, b,...n을 선택하여 사용할 수 있도록 하여 유효성 확인기들 24a, b,...n을 위한 한정사들(66)을 선택할 수 있다. 이것은 컨텐츠 제공자(2)로 하여금 수집 툴(6)이 그것의 저장 장소(8)를 검색할 방법을 커스텀화할 수 있도록 한다.
도 4는 컨텐츠 제공자(2)가 웨어하우스(4)에 제공하는 하나 이상의 URL 페이지에서 검색 동작을 실행하는 수집 툴(6)에서 구현된 프로그램 로직을 나타낸다. 제어는 수집 툴의 실행이 시작되는 블럭(100)에서 시작한다. 컨텐츠 제공자(2)는저장 장소(8)를 포함하는 방화벽 내부에서 내부적으로 수집 툴(6)을 실행할 수도 있다. 대신에, 웨어하우스(4)는 저장 장소(8)를 포함하는 방화벽 외부의 서버로부터 수집 툴(6)을 실행할 수도 있다. 컨텐츠 제공자(2) 및 웨어하우스(4)는 웨어하우스 URL 데이터베이스가 저장 장소(8) URL를 위한 색인 가능한 메타데이터로 정규적으로 갱신되도록 수집 툴(6)을 실행하기 위한 정규 일정에 동의할 수도 있다. 또한, 컨텐츠 제공자(2)는 저장 장소(8)의 컨텐츠에 어떤 갱신이나 수정을 한 후와 같은, 수집 툴(6)을 실행할 시기를 결정할 수도 있다. 일단 실행되면, 수집 툴(6)은 검색 명령어 파일(20)을 액세스하고, 그리고 그 검색 명령어 파일(20)은 수집 툴(6)을 실행하는 컨텐츠 제공자(2) 컴퓨터, 저장 장소(8), 또는 웨어하우스(4) 서버의 디렉토리에서 관리된다. 블럭(104) 및 블럭(160) 사이에서, 수집 툴(6)은 검색 URL 목록(50)에서의 각각의 URL 페이지에 대하여 블럭(106-148)에서의 단계들을 실행한다. 만약 (블럭(106)에서) 고려되는 URL 페이지에 대해 제공된 패스워드가 있다면, 수집 툴은 그 URL 페이지를 액세스할 때 그 페스워드를 (블럭(108)에서) 사용한다; 그렇지 않다면, 수집 툴(6)은 그 URL 페이지를 (블럭(110)에서) 액세스한다. 만약 (블럭(112)에서) 질의 용어들 목록(52)에서의 그 URL 페이지에 대하여 제공된 질의 용어들이 있다면, 수집 툴(6)은 그 검색 용어에 대한 동적 데이터를 획득하기 위해서 각각의 제공된 질의 용어를 그 URL 페이지에 (블럭(114)에서) 제공한다. 질의 결과들을 (블럭(116)에서) 수신한 후에, 수집 툴(6)은 (블럭(118)에서) 모든 질의 용어들 또는 특정 질의 용어들을 위한 질의 용어 한정사들 성분(54)에서 어떤 한정사들이 있는지를 결정한다. 따라서, 특정 한정사들은 모든 질의 용어들을 위한 질의 결과들 또는 특정 질의 용어들을 위한 질의 결과들에 적용할 수도 있다. 만약 그런 한정사들이 있다면, 수집 툴(6)은 (블럭(120)에서) 그 한정사들을 만족시키지 않는 그런 질의 결과들에 관한 비한정 동작 및 그 한정사들을 만족시키는 그런 질의 결과들에 대한 한정 동작을 실행한다. 비한정 동작의 구성은 그 URL 페이지에 대한 메타데이터에서의 비한정 질의 결과들을 포함하지 않고/않거나 질의 결과들이 한정된 정보를 포함할 수도 있다. 한정 동작의 구성은 그 URL 페이지에 대한 메타데이터에서 한정 질의 결과들을 포함하고/하거나 질의 결과들이 한정된 정보를 포함할 수도 있다. 만약 그 검색 용어들에 대한 한정사들이 없다면, 수집 툴(6)은 (블럭(122)에서) 그 URL 페이지를 위한 메타데이터에 질의 결과들에 대한 정보를 부가한다.
블럭(120 또는 122)으로부터 제어는 도 5의 블럭(124)로 진행한다. 블럭(124)에서, 수집 툴(6)은 (블럭(124)에서) 유효성 확인기 성분(62)이 유효성 확인기들 24a, b,...n이 실행하도록 선택되었는지를 나타내는지를 결정한다. 만약 그렇다면, 수집 툴(6)은 (블럭(126)에서), 유효성 확인기 24a, b,...n을 위해 제공된 임의의 확인 파라미터들(64)을 사용하여, URL 페이지에 대비하여 각각의 선택된 유효성 확인기 24a, b,...n을 실행한다. 만약 (블럭(128)에서) 특정 유효성 확인기 24a, b,...n을 위한 임의의 유효성 확인기 한정사들(66)이 있다면, 한정사들을 포함하는 그런 유효성 확인기들에 대하여, 수집 툴(6)은 (블럭(130)에서) 유효성 확인기 출력이 한정사(들)을 만족하는지를 결정한다. 만약 한정사들이 충족되거나(130의 예(yes) 분기로부터) 또는 만약 유효성 확인기 한정사들이 없다면(블럭(128)의 아니오(no) 분기), 수집 툴(6)은 (블럭(132)에서) 그 URL 페이지에 대한 메타데이터에서 유효성 확인기 출력에 대한 정보를 부가한다. 만약 유효성 확인기 출력이 그 한정사들을 충족시키지 않는다면, 수집 툴(6)은 비한정 동작을 (블럭(140)에서) 실행하며, 비한정 동작의 구성은 그 메타데이터에서 검색 URL 페이지에 대한 어떤 정보를 포함하지 않으며 블럭(160)으로 진행하여 검색 URL(50)에서 다음 URL 페이지를 고려한다. 이와는 달리, 비한정 동작은 한정사가 충족되지 않은 그 URL 페이지를 위한 메타데이터에서 특정 정보를 포함하여 블럭(134)로 진행하여 검색 명령어 파일(20)에서 지시된 바와 같이 그 URL 페이지를 위한 후속 메타데이터를 수집하도록 수집 툴(6)을 수반할 수도 있다.
유효성 확인기들 성분(62)에서 어떤 선택된 유효성 확인기들을 고려한 후에 그리고 만약 유효성 확인기 출력이 어떤 한정사들을 충족시킨다면, 제어는 블럭들(124 또는 132)에서 블럭(134)으로 이동한다. 만약 (블럭(134)에서) 어떤 페이지 속성 한정사들(68)이 있다면, (블럭(136)에서) 수집 툴(6)은 그 URL 페이지가 속성 한정사들을 충족시키는지를 결정한다. 만약 그렇다면, (블럭(138)에서) 수집 툴은 그 URL 페이지를 위한 메타데이터에서 충족된 속성에 대한 정보를 부가한다. 반면에, 만약 페이지 속성들이 충족되지 않는다면, (블럭(140)에서) 수집 툴(6)은 비한정 동작을 실행하며, 비한정 동작은 메타데이터에서 검색 URL 페이지에 대한 어떤 정보를 포함하지 않고 블럭(160)으로 이동하여 검색 URL(50)에서 다음 URL 페이지를 고려하도록 구성된다. 대신에, 비한정 동작이 한정사가 충족되지 않은 URL 페이지를 위한 메타데이터에서 특정 정보를 포함하여 블럭(142)로 이동하여 검색 명령어 파일(20)에서 지시된 바와 같이 URL 페이지를 위한 후속 메타데이터를 수집하도록 수집 툴(6)을 수반할 수도 있다.
블럭(134) 또는 블럭(138)의 아니오(no) 분기로부터, 제어는 블럭(142)으로 이동하여 수집 툴(6)은, 예를 들면, XML, DHTML과 같은, URL 페이지의 형식를 결정하고 (블럭(144)에서) URL 페이지 형식을 분석할 수 있는 파서 22a, b,...n을 선택한다. 그런 다음 수집 툴(6)은 URL 페이지를 위한 메타데이터를 발생시키기 위해서 컨텐츠를 분석하는 (블럭(146)에서), 즉 파서로 부르는, 선택된 파서 22a, b,...n을 사용한다. 파서 22a, b,...n는 종래 기술에서 알려진 방법으로 URL 페이지를 위한 색인가능한 메타데이터를 발생시킬 수도 있다. 예를 들면, 파서 24a, b,...n은 가시적인 텍스트의 전체 본문에 색인을 붙일 수도 있지만, 공통적으로 사용된 단어들, 예를 들면, "the", "and" 등은 배제할 수도 있으며, 문서에서 특히 주요단어 메타태그에 포함된 주요단어들에 색인을 붙일 수도 있고/있거나, 색인가능한 메타데이터에서, 한 단어에 대한 변형들, 예를 들면, politics, politician, political 등을 포함하도록 단어 스테밍(stemming)을 실행한다.
만약 (블럭(148)에서) URL 페이지가 삽입된 이미지들, 쇽웨이브(Shockwave) 파일들, ZIP 파일들, 또는 다른 인코딩된 파일과 같은 삽입 파일에 대한 참조를 포함한다면, 삽입 파일에 대한 각각의 참조에 대하여, (블럭(150)에서) 수집 툴(6)은 삽입 파일을 분석할 수 있는 파서 22a, b,...n을 선택한다. 삽입 파일은, HTML "HREF" 문장을 사용하여 생성된 하이퍼텍스트 링크와 같은, 하이퍼텍스트 링크를 통하여 참조되는 파일과 구별된다. 링크된 파일은 브라우저가 액세스하는 HTML 페이지이다. 삽입된 파일은 통상적으로 삽입된 파일을 열어서 나타내는데 사용하기 위해서이거나, 또는 삽입된 파일의 컨텐츠를 작성하기 위한 플러그-인 애플리케이션을 지정하는 객체 태그를 사용하거나 또는 애플릿으로 참조된다. (블럭(152)에서) 수집 툴(6)은 각각의 삽입된 파일을 분석하기 위해서 선택된 파서를 사용하고 URL 페이지용 메타데이터에 추가하도록 삽입된 파일 컨텐츠로부터 색인 가능한 메타데이터를 발생시킨다. 파서나 또는 수집 툴(6)은 삽입된 파일의 컨텐츠를 처리하거나 또는 나타내도록 삽입된 파일을 위해 객체 태그에서 지시된 플러그-인 애플리케이션을 사용한다. 블럭(148) 또는 블럭(152)의 no 분기로부터, (블럭(154)에서) 수집 툴은 그 URL 페이지가 다른 URL 페이지들과의 링크들을 포함하는지를 결정한다. 만약 링크들이 포함되어 있고 (블럭(156)에서) 재귀적 검색 설정들(58)이 재귀적 검색을 제한하지 않는다면, 수집 툴(6)은 금지된 URL(60)로 등록되지 않은 각각의 링크된 URL 페이지에 대하여 106에서 158까지의 단계들을 (블럭(158)에서) 실행한다. 블럭(154)의 아니오(no) 분기로부터, 블럭(156)의 예(yes) 분기로부터 또는 블럭(158)으로부터, 제어는 (블럭(160)에서) 검색 URL(50)에 등록된 다음 URL 페이지를 검토하도록 복귀한다.
바람직한 실시예들은 현재의 검색 로봇들 및 에이전트들(agents)에 관하여 향상된 컨텐츠 제공자의 사이트에서 URL을 검색하기 위한 URL 메타데이터 수집 툴(6)을 제공한다. 바람직한 실시예들에서, 컨텐츠 제공자(2)는 저장 장소(8)에서 URL을 위한 색인 가능한 메타데이터가 최신인지를 확신하도록 그것의 저장 장소(8)의 검색들이 발생될 때를 제어할 수 있다. 또한, 컨텐츠 제공자(2)로 하여금 검색의 스케줄링을 제어할 수 있도록 함으로서, 컨텐츠 제공자(2)는 최신 기술에서 검색 에이전트들 또는 로봇들이 컨텐츠 제공자(2)의 서버를 과부하시키는 상태를 피할 수 있다. 예를 들면, 컨텐츠 제공자(2)는 한산한 시간에 수집 툴(6)이 검색하도록 예정할 수 있다.
또한, 바람직한 실시예에서, 컨텐츠 제공자(2)는 색인가능한 메타데이터를 검색 및 수집하는 수집 툴(6)을 위한 특정 URL을 지정할 수 있다. 또한, 수집 툴(6)은 쇽웨이브(Shockwave) 파일들, ZIP 파일들, 및 다른 텍스트가 아닌(non-text) 멀티미디어 파일들과 같은, 검색 엔진에의해서 현재 색인되어있지 않은 멀티-미디어 컨텐츠 및 컨텐츠 인코딩들에 대한 색인 가능한 메타데이터를 수집할 수 있다. 또한, 바람직한 실시예에서, 컨텐츠 제공자(2)는 어떤 기준을 만족시키지 않는 페이지들로부터 메타데이터를 차단하는 유효성 확인 페이지들 및 한정사들 설정에 의해서 정보가 색인되는지를 제어할 수 있다. 이런 방법으로, 바람직한 실시예들은 컨텐츠 제공자(2) 웹 사이트에서 URL 페이지들의 색인 가능한 메타데이터를 수집하고 컨텐츠 제공자(2)로 하여금 색인 가능한 메타데이터가 수집되는 방법을 제어할 수 있도록 하기 위한 향상되고 보다 잘 제어할 수 있는 도구를 제공한다.
일단 웨어하우스(4)가 다른 컨텐츠 제공자들(2)로부터 메타데이터(10)를 수집하면, 웨어하우스(4)는 검색 엔진 업체에 그들의 검색 엔진 데이터베이스에 포함하도록 또는 다른 관심있는 업체에 색인 가능한 메타데이터를 제공할 수 있다. 또한, 데이터 웨어하우스는 URL에 대하여 메타데이터가 수집되는 방법을 제어하고싶어하는 가입자들을 등록시키는 비즈니스 모델의 일부로서 수집 툴을 사용할 수도 있다. 데이터 웨어하우스는 상업 광고용 URL을 위한 메타데이터의 데이타베이스를 구축하기 위해서 수집 툴을 사용할 수 있다. 또한, 데이타 웨어하우스는 수집 툴 프로그램이 실행될 때 표시되거나 또는 컨텐츠 제공자들이 수집 툴을 사용할 때 수익을 발생시키도록 구성된 광고를 포함할 수 있다.
이와 다른 실시예들 및 결론(Alternative Embodiments and Conclusions)
다음은 본 발명을 실현하기 위한 소정의 다른 실시예들을 기술하고 있다.
바람직한 실시예들은 소프트웨어, 펌웨어, 하드웨어, 또는 그것들의 어떤 조합을 생산하도록 표준 프로그래밍 및/또는 엔지니어링 기술들을 사용하는 방법, 장치, 또는 프로그램으로서 구현된다. 바람직한 실시예의 기능들을 정의하는 프로그램들은 자기 저장 매체, "플로피 디스크(floppy disk)", CD-ROM, 네트워크 전송 라인을 통하여 프로그램들에 액세스할 수 있는 파일 서버, 무선 전송 매체, 공간을 통하여 전파하는 신호들, 라이오파, 적외선 신호들 등과 같은 컴퓨터-판독가능한 장치들, 캐리어들, 또는 미디어를 포함하지만 제한을 두지는 않는 미디어를 포함하는 다양한 정보를 통하여 컴퓨터로 전달될 수 있다. 물론, 당업자라면 알 수 있듯이, 본 발명의 범주에서 벗어나지 않는 범위에서 여러가지 변경이 이루어질 수 있다. 본 발명의 기능들을 관리하는 컴퓨터-판독가능한 명령어들을 전송할 때, 매체를 포함하는 그런 정보는 본 발명의 다른 실시예들을 나타낸다.
바람직한 실시예들은 추가적인 메타데이터 색인 기능을 제공하는데 사용하기위해서 수집 툴에 포함된 특정 프로그램 구성요소들을 제공한다. 후속 실시예들에서, 수집 툴은 여기서 기술된 것과 다른 기준으로 페이지들을 검사할 수도 있다.
바람직한 실시예들은 컨텐츠 제공자가 검색 명령어 파일(20)에서 구성하는 특정 설정들을 기술한다. 다른 실시예에서, 컨텐츠 제공자(2)는 수집 툴(6)이 웹 페이지들을 검색하고 메타데이터가 반환되는 방법에 대한 추가적인 제어 수준들을 제공하기 위해서 여기서 기술된 것과는 다른 형태의 설정들을 구성할 수도 있다.
도 4-6의 바람직한 로직은 특정 주문에서 특정 연산의 발생을 기술한다. 다른 실시예에서, 특정 논리 연산은 다른 명령으로 실생되거나, 수정 또는 제거될 수 있으며 본 발명의 바람직한 실시예들을 구현한다. 또한, 단계들이 상기 로직에 추가되어 바람직한 실시예를 구현할 수도 있다. 또한, 여기서 기술된 연산들은 연속적으로 발생할 수도 있거나 또는 특정 연산들은 동시에 처리될 수도 있다.
요약하면, 바람직한 실시예들은 웹 사이트에서 어드레스가능한 위치에서의 컨텐츠에 대한 색인 가능한 메타데이터를 수집하기 위해서 컨텐츠 제공자에 의해서 관리되는 웹 사이트를 검색하기 위한 방법, 시스템, 및 프로그램을 제공한다. 컨텐츠 제공자에 의해서 커스텀화될 수 있는 설정들이 허용된다. 커스텀화된 설정들은 컨텐츠 제공자의 웹 사이트를 검색하는 방법에 대한 명령어들을 제공한다. 액세스된 커스텀화된 설정들은 컨텐츠 제공자의 웹 사이트에서 컨텐츠 페이지들의 처리를 제어하는데 사용된다. 액세스된 컨텐츠 페이지들로부터의 메타데이터는 발생되어 웹 사이트에서 액세스된 어드레스가능한 위치들을 위한 메타데이터의 색인에 추가된다.
본 발명의 바람직한 실시예들이 예시 및 설명의 목적으로 상술되었지만, 본 발명을 엄격한 형식으로 제한하고자 하는 것은 아니다. 전술한 기술적 사상으로부터 다양한 변경 및 변형이 가능하다. 본 발명의 범주는 상술된 명세서에 의해서 제한되지 않으며, 오히려 첨부된 청구항에 의해서 제한될 수 있다. 상기 명세서, 예제들 및 데이터는 제조시 완벽한 설명을 제공하며 본 발명의 구성을 사용한다. 본 발명의 사상 및 범주에서 벗어나지 않게 본 발명의 다양한 실시예가 구현될 수 있기 때문에, 본 발명은 첨부된 청구항에 귀속된다.
본 발명에 따르면, 웹 페이지들을 분류하기 위한 향상된 기술이 제공된다.

Claims (47)

  1. 데이터 저장 장소에서 어드레스 위치들의 컨텐츠에 대한 색인 가능한 메타데이터를 수집하기 위해서 컨텐츠 제공자에 의해서 관리되는 데이터 저장 장소를 검색하기 위한 방법으로서,
    상기 컨텐츠 제공자에 의해서 커스텀화될 수 있는 설정들(settings)을 액세스하는 단계 - 상기 커스텀화된 설정들은 상기 컨텐츠 제공자의 데이터 저장 장소를 검색하는 방법에 대한 명령어들을 제공함 - 와,
    상기 컨텐츠 제공자의 데이터 저장 장소에서의 컨텐츠 페이지들을 액세스하는 단계와,
    상기 액세스된 커스텀화된 설정들에 포함된 명령어들에 따라서 상기 컨텐츠 제공자의 데이터 저장 장소에서의 컨텐츠 페이지들의 컨텐츠를 액세스하는 단계와,
    상기 액세스된 컨텐츠 페이지들로부터 메타데이터를 생성하여 상기 데이터 저장 장소에서 액세스된 어드레스 가능한 위치들을 위한 메타데이터의 색인에 추가하는 단계
    를 포함하는 데이터 저장 장소 검색 방법.
  2. 제 1 항에 있어서,
    상기 커스텀화된 설정들은 파라미터들 및 상기 컨텐츠 제공자의 데이터 저장장소 내의 컨텐츠의 구성에 유일한 액세스 방법을 포함하는
    데이터 저장 장소 검색 방법.
  3. 제 1 항에 있어서,
    상기 액세스된 커스텀화 가능한 설정들은 상기 컨텐츠 제공자에 의해서 제공된 컨텐츠 제공자의 데이터 저장 장소에서 어드레스가능한 위치들을 제공하고,
    상기 컨텐츠 페이지들을 액세스하는 단계는 상기 제공된 어드레스가능한 위치들에서의 컨텐츠 페이지들을 액세스하는 단계를 포함하고, 상기 액세스된 컨텐츠 페이지들에 대해 메타데이터가 생성되는
    데이터 저장 장소 검색 방법.
  4. 제 3 항에 있어서,
    상기 액세스된 커스텀화 가능한 설정들은 적어도 하나의 포함된 어드레스 가능한 위치에 대한 질의 용어들을 제공하고,
    질의 용어들이 있는 각각의 제공된 어드레스가능한 위치에 대한 질의 결과들을 획득하기 위해서 상기 제공된 어드레스가능한 위치에서 상기 제공된 질의 용어들을 사용하는 단계와,
    상기 획득된 질의 결과들로부터 메타데이터를 생성하여 상기 데이터 저장 장소에서의 액세스된 어드레스가능한 위치들에 대한 메타데이터의 색인에 추가하는 단계를 더 포함하는
    데이터 저장 장소 검색 방법.
  5. 제 4 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 또한 적어도 하나의 검색 용어를 위한 한정사(qualifier)를 제공하고,
    적어도 하나의 한정사를 포함하는 각각의 질의 용어에 대하여, 상기 질의 용어에 대한 질의 결과들이 상기 질의 용어에 대한 각각의 한정사를 충족시키는지를 결정하는 단계 - 만약 상기 질의 결과가 상기 질의 결과를 발생시킨 상기 질의 용어에 대한 각각의 한정사를 충족시킨다면 상기 질의 결과에 대한 메타데이터가 생성됨 - 와,
    각각의 한정사를 충족시키지 않는 각각의 질의 결과에 대해 비한정(non-qualifying) 동작을 수행하는 단계를 더 포함하는
    데이터 저장 장소 검색 방법.
  6. 제 5 항에 있어서,
    상기 비한정 동작은 상기 색인에 상기 질의 결과에 대한 메타데이터를 포함하지 않는 단계를 포함하는
    데이터 저장 장소 검색 방법.
  7. 제 3 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 적어도 하나의 제공된 어드레스가능한 위치에 대한 패스워드를 더 제공하고,
    상기 제공된 패스워드를 이용하여 상기 패스워드가 제공되는 지시된 어드레스가능한 위치에서의 컨텐츠 페이지를 액세스하도록 하는 단계를 더 포함하는
    데이터 저장 장소 검색 방법.
  8. 제 1 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 또한 하이퍼텍스트를 검색하는 것이 상기 액세스된 컨텐츠 페이지에 포함된 링크된 어드레스가능한 위치들로 링크하는지를 나타내는 재귀적 검색 설정을 지시하고,
    재귀적 검색 설정이 링크된 어드레스가능한 위치들을 재귀적으로 검색하는 것을 나타내면, 각각의 링크된 어드레스가능한 위치에서의 컨텐츠 페이지를 액세스하는 단계 - 상기 액세스된 컨텐츠 페이지 내의 상기 링크된 어드레스가능한 위치들에서 재귀적으로 액세스된 각각의 컨텐츠 페이지에 대하여 메타데이터가 생성됨-를 더 포함하는
    데이터 저장 장소 검색 방법.
  9. 제 8 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 데이터 저장 장소에서 금지된 어드레스가능한 위치들을 더 제공하고, 하나의 지시된 금지된 어드레스 위치인 링크된 어드레스가능한 위치에서 각각의 컨텐츠 페이지에 대하여 메타데이터가 생성되지 않는
    데이터 저장 장소 검색 방법.
  10. 제 1 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 또한 유효성 확인 프로그램들을 나타내고,
    각각의 액세스된 컨텐츠 페이지에 대하여 상기 액세스된 커스텀화가능한 설정들에서 지시된 각각의 상기 유효성 확인 프로그램을 실행하는 단계와,
    컨텐츠 페이지의 특성을 기술하는 각각의 유효성 확인프로그램을 갖는 각각의 액세스된 컨텐츠 페이지에 대해 상기 유효성 확인 프로그램을 갖는 유효성 출력 결과를 생성하는 단계와,
    상기 유효성 출력 결과로부터 메타데이터를 생성하여, 상기 데이터 저장 장소에서의 액세스된 어드레스가능한 위치들을 위한 메타데이터의 색인에 추가하는 단계를 더 포함하는
    데이터 저장 장소 검색 방법.
  11. 제 10 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 또한 적어도 하나의 유효성 확인 프로그램으로 사용하기 위한 적어도 하나의 파라미터를 나타내며,
    상기 유효성 확인 프로그램을 실행할 때 상기 적어도 하나의 파라미터를 사용하는 단계를 더 포함하고,
    상기 유효성 출력 결과는 또한 상기 유효성 확인 프로그램으로 사용된 적어도 하나의 파라미터와 관련된 상기 컨텐츠 페이지의 특성들을 나타내는
    데이터 저장 장소 검색 방법.
  12. 제 10 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 또한 적어도 하나의 유효성 확인 프로그램으로 사용하기 위한 적어도 하나의 한정사를 나타내며,
    상기 유효성 출력 결과가 상기 출력 결과를 생성하는 상기 유효성 확인 프로그램을 구비한 상기 적어도 하나의 한정사를 충족시키는지를 결정하는 단계를 더 포함하고,
    상기 출력 결과에 대한 메타데이터는 만약 상기 출력 결과가 상기 한정사를 충족시키면 상기 색인에 포함되는
    데이터 저장 장소 검색 방법.
  13. 제 12 항에 있어서,
    만약 상기 유효성 출력 결과가 상기 한정사를 충족시키지 않는다면 상기 어드레스가능한 위치에서 상기 컨텐츠 페이지를 위한 메타데이터가 상기 색인에 포함되지 않는 방법.
  14. 제 1 항에 있어서,
    상기 액세스된 컨텐츠 페이지의 형식을 결정하는 단계와,
    상기 결정된 형식을 분석할 수 있는 다수의 파서들 중 하나를 선택하는 단계와,
    상기 선택된 파서를 사용하여 상기 컨텐츠 페이지를 분석하는 단계 - 상기 색인에 추가된 상기 메타데이터는 상기 분석된 컨텐츠 페이지로부터 생성됨 -를 더 포함하는
    데이터 저장 장소 검색 방법.
  15. 제 1 항에 있어서,
    상기 컨텐츠 페이지에 참조된 삽입된 파일을 분석할 수 있는 파서를 결정하는 단계와,
    상기 참조된 삽입된 파일의 상기 컨텐츠를 분석하는 단계와,
    상기 색인에 추가된 상기 삽입된 파일의 분석된 컨텐츠를 위한 메타데이터를 생성시키는 단계를 포함하는
    데이터 저장 장소 검색 방법.
  16. 제 1 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들을 사용하여 컨텐츠 제공자 데이터 저장 장소들을 위한 메타데이터를 액세스하고 생성시킬 수 있는 컨텐츠 제공자들에게 수집 툴을 분배하는 단계와,
    그들의 데이터 저장 장소들에서 메타데이터를 수집하는 수집 툴을 사용하여 다중 컨텐츠 제공자들로부터 수집된 메타데이터 데이터를 수집하는 단계를 더 포함하는
    데이터 저장 장소 검색 방법.
  17. 제 16 항에 있어서,
    상기 수집한 메터데이터를 상업화하는 단계를 더 포함하는
    데이터 저장 장소 검색 방법.
  18. 제 16 항에 있어서,
    상기 수집 툴을 사용하고 메타데이터를 제공하기 위하여 컨텐츠 제공자들로부터 전자적 승낙을 수신하는 단계를 더 포함하는
    데이터 저장 장소 검색 방법.
  19. 데이터 저장 장소에서 어드레스 위치들에서의 컨텐츠에 대한 색인 가능한 메타데이터를 수집하기 위하여 컨텐츠 제공자에 의해서 관리되는 상기 데이터 저장 장소를 검색하기 위한 시스템으로서,
    상기 컨텐츠 제공자에 의해서 커스텀화될 수 있는 설정들을 액세스하기 위한 수단 - 상기 커스텀화된 설정들은 상기 컨텐츠 제공자의 데이터 저장 장소를 검색하는 방법에 대한 명령어를 제공함 - 과,
    상기 컨텐츠 제공자의 데이터 저장 장소에서 컨텐츠 페이지들을 액세스하기 위한 수단과,
    상기 액세스된 커스텀화된 설정들에 포함된 명령어들에 따라서 상기 컨텐츠 제공자의 데이터 저장 장소에서의 컨텐츠 페이지들의 상기 컨텐츠를 액세스하기 위한 수단과,
    액세스된 컨텐츠 페이지들로부터 메타데이터를 생성하여 상기 데이터 저장 장소에서 액세스된 어드레스가능한 위치들을 위한 메타데이터의 색인에 추가하는 수단
    을 포함하는 데이터 저장 장소 검색 시스템.
  20. 제 19 항에 있어서,
    상기 커스텀화된 설정들은 파라미터들 및 상기 컨텐츠 제공자의 데이터 저장 장소 내의 컨텐츠의 구성에 유일한 액세스 방법을 포함하는 데이터 저장 장소 검색 시스템.
  21. 제 20 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 컨텐츠 제공자에 의해서 제공된 상기 컨텐츠 제공자의 데이터 저장 장소에서 어드레스가능한 위치들을 제공하고,
    상기 컨텐츠 페이지들을 액세스하기 위한 수단은 상기 제공된 어드레스가능한 위치들에서의 상기 컨텐츠 페이지들을 액세스하는 것을 포함하고, 상기 액세스된 컨텐츠 페이지들에 대하여 메타데이터가 생성되는
    데이터 저장 장소 검색 시스템.
  22. 제 21 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 적어도 하나의 포함된 어드레스가능한 위치에 대한 질의 용어들을 제공하고,
    질의 용어들이 있는 각각의 제공된 어드레스가능한 위치에 대한 질의 결과들을 획득하기 위해서 상기 제공된 어드레스가능한 위치에서 상기 제공된 질의 용어들을 사용하는 수단과,
    상기 획득된 질의 결과들로부터 메타데이터를 생성하여 상기 데이터 저장 장소에 액세스된 어드레스가능한 위치들을 위한 상기 메타데이터의 색인에 추가하는 수단을 더 포함하는
    데이터 저장 장소 검색 시스템.
  23. 제 22 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 적어도 하나의 검색 용어를 위한 한정사(qualifier)들을 제공하고,
    상기 질의 용어에 대한 상기 질의 결과들이 적어도 하나의 한정사를 갖는 각각의 질의 용어를 위한 상기 질의 용어에 대한 각각의 한정사를 충족시키는지를 결정하는 수단 - 만약 상기 질의 결과가 상기 질의 결과를 발생시킨 상기 질의 용어에 대한 각각의 한정사를 충족시킨다면 상기 질의 결과에 대한 메타데이터가 생성됨 - 과,
    각각의 한정사를 충족시키지 않는 각각의 질의 결과에 대해 비한정 동작을 수행하는 수단을 더 포함하는
    데이터 저장 장소 검색 시스템.
  24. 제 20 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 적어도 하나의 제공된 어드레스가능한 위치에 대한 패스워드를 더 제공하고,
    상기 제공된 패스워드를 사용하여 상기 패스워드가 제동되는 상기 지시된 어드레스가능한 위치에서의 컨텐츠 페이지를 액세스하는 수단을 더 포함하는
    데이터 저장 장소 검색 시스템.
  25. 제 21 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 또한 하이퍼텍스트의 검색이 상기 액세스된 컨텐츠 페이지에 포함된 링크된 어드레스가능한 위치들에 링크시키는지를나타내는 재귀적인 검색 설정을 지시하고,
    상기 재귀적 검색 설정이 링크된 어드레스가능한 위치들을 재귀적으로 검색하는 것을 나타내면, 각각의 링크된 어드레스가능한 위치에서의 컨텐츠 페이지를 액세스하는 수단을 더 포함하고,
    상기 액세스된 컨텐츠 페이지에서 상기 링크된 어드레스가능한 위치들에 재귀적으로 액세스된 각각의 컨텐츠 페이지에 대해 메타데이터가 생성되는
    데이터 저장 장소 검색 시스템.
  26. 제 25 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 상기 데이터 저장 장소에서 금지된 어드레스가능한 위치들을 더 제공하고, 하나의 금지된 어드레스 위치인 링크된 어드레스가능한 위치에서 각각의 컨텐츠 페이지에 대하여 메타 데이터가 발생되지 않는
    데이터 저장 장소 검색 시스템.
  27. 제 19 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 또한 유효성 확인 프로그램들을 나타내고,
    각각의 액세스된 컨텐츠 페이지에 대하여 상기 액세스된 커스텀화가능한 설정들에서 지시된 각각의 유효성 확인 프로그램을 실행하는 수단과,
    상기 컨텐츠 페이지의 특성들을 기술하는 각각의 유효성 확인 프로그램을 갖는 각각의 액세스된 컨텐츠 페이지에 대해 상기 유효성 확인 프로그램을 갖는 유효성 출력 결과를 생성하는 단계와,
    상기 유효성 출력 결과로부터 메타데이터를 생성하여 상기 데이터 저장 장소에서의 액세스된 어드레스가능한 위치들에 대한 상기 메타데이터의 색인에 추가하는 수단을 더 포함하는
    데이터 저장 장소 검색 시스템.
  28. 제 27 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 또한 적어도 하나의 유효성 확인 프로그램으로 사용하기 위한 적어도 하나의 파라미터를 나타내며,
    상기 유효성 확인 프로그램을 실행할 때 상기 적어도 하나의 파라미터를 사용하는 수단을 더 포함하고,
    상기 유효성 출력 결과는 또한 상기 유효성 확인 프로그램으로 사용된 적어도 하나의 파라미터와 관련된 컨텐츠 페이지의 특성들을 나타내는
    데이터 저장 장소 검색 시스템.
  29. 제 27 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 또한 적어도 하나의 유효성 확인 프로그램으로 사용하기 위하여 적어도 하나의 한정사를 나타내며,
    상기 유효성 출력 결과가 상기 출력 결과를 생성하는 상기 유효성 확인 프로그램을 구비한 상기 적어도 하나의 한정사를 충족시키는지를 결정하는 수단을 더 포함하고,
    만약 상기 출력 결과가 상기 한정사를 충족시킨다면 상기 출력 결과에 대한 메타데이터는 상기 색인에 포함되는
    데이터 저장 장소 검색 시스템.
  30. 제 19 항에 있어서,
    상기 액세스된 컨텐츠 페이지의 형식을 결정하는 수단과,
    상기 결정된 형식을 분석할 수 있는 다수의 파서들 중 하나를 선택하는 수단과,
    상기 선택된 파서를 사용하여 상기 컨텐츠 페이지를 분석하는 수단 - 상기 색인에 추가한 메타데이터는 상기 분석된 컨텐츠 페이지로부터 생성됨 -을 더 포함하는
    데이터 저장 장소 검색 시스템.
  31. 제 19 항에 있어서,
    상기 컨텐츠 페이지에 참조된 삽입된 파일을 분석할 수 있는 파서를 결정하는 수단과,
    상기 참조된 삽입된 파일의 컨텐츠를 분석하는 수단과,
    상기 색인에 추가하기 위해서 상기 삽입된 파일의 분석된 컨텐츠를 위한 메타데이터를 생성하는 수단을 더 포함하는
    데이터 저장 장소 검색 시스템.
  32. 제 20 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들을 사용하여 컨텐츠 제공자 데이터 저장 장소를 위한 메타데이터를 액세스하고 생성시킬 수 있는 컨텐츠 제공자들에게 수집 툴을 배포하는 수단과,
    데이터가 컨텐츠 제공자들의 데이터 저장 장소들에서 메타데이터를 수집하는 상기 수집 툴을 사용하여 다중 컨텐츠 제공자들로부터 수집되는 메타데이터를 수집하는 수단을 더 포함하는
    데이터 저장 장소 검색 시스템.
  33. 데이터 저장 장소에서 어드레스 위치들에서의 컨텐츠에 대한 색인 가능한 메타데이터를 수집하기 위하여 컨텐츠 제공자에 의해서 관리되는 데이터 저장 장소를 검색하기 위한 프로그램으로서, 상기 프로그램은 컴퓨터로 하여금
    상기 컨텐츠 제공자에 의해서 커스텀화될 수 있는 설정들을 액세스하는 것 - 상기 커스텀화된 설정들은 상기 컨텐츠 제공자의 데이터 저장 장소를 검색하는 방법에 대한 명령어들을 제공함 - 와,
    상기 컨텐츠 제공자의 데이터 저장 장소에서 컨텐츠 페이지들을 액세스하는 것과,
    상기 액세스된 커스텀화된 설정들에 포함된 명령어들에 따라서 상기 컨텐츠 제공자의 데이터 저장 장소에서 컨텐츠 페이지의 상기 컨텐츠를 액세스하는 것과,
    상기 액세스된 컨텐츠 페이지들로부터 메타데이터를 생성하여 상기 데이터 저장 장소에서 액세스된 어드레스가능한 위치들에 대한 메타데이터의 색인에 추가하는 것
    을 수행하도록 할 수 있는 컴퓨터 판독가능한 매체에서 구현된 코드를 포함하는 데이터 저장 장소 검색 프로그램.
  34. 제 33 항에 있어서,
    상기 커스텀화된 설정들은 파라미터들 및 상기 컨텐츠 제공자의 데이터 저장장소 내의 컨텐츠의 구성에 유일한 액세스 방법들을 포함하는
    데이터 저장 장소 검색 프로그램.
  35. 제 33 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 상기 컨텐츠 제공자에 의해서 제공된 상기 컨텐츠 제공자의 데이터 저장 장소에서 어드레스가능한 위치들을 제공하고,
    상기 컨텐츠 페이지들을 액세스하는 것은 상기 제공된 어드레스가능한 위치들에서의 컨텐츠 페이지들을 액세스하는 것을 포함하며,
    상기 액세스된 컨텐츠 페이지들에 대해 메타데이터가 생성되는
    데이터 저장 장소 검색 프로그램.
  36. 제 33 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 적어도 하나가 포함된 어드레스가능한 위치를 위한 질의 용어들을 제공하고,
    상기 프로그램은 상기 컴퓨터로 하여금
    질의 용어들이 있는 각각의 제공된 어드레스가능한 위치에 대하여, 질의 결과들을 획득하기 위하여 상기 제공된 어드레스가능한 위치에서 상기 제공된 질의용어들을 사용하는 것과,
    획득된 질의 결과들로부터 메타 데이터를 생성하여 상기 데이터 저장 장소에서 액세스된 어드레스가능한 위치들을 위한 상기 메타데이터의 색인에 추가하는 것을 더 실행하도록 하는
    데이터 저장 장소 검색 프로그램.
  37. 제 36 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 적어도 하나의 검색 용어를 위한 한정사들(qualifiers)을 제공하고,
    상기 프로그램은 상기 컴퓨터로 하여금
    적어도 하나의 한정사를 갖는 각각의 질의 용어에 대하여, 상기 질의 용어에 대한 질의 결과들이 상기 질의 용어를 위한 각각의 한정사를 충족시키는지를 결정하는 것 - 만약 상기 질의 결과가 상기 질의 결과를 발생시킨 상기 질의 용어를 위한 각각의 한정사를 충족시킨다면 상기 질의 결과에 대한 메타데이터가 생성됨 - 과,
    각각의 한정사를 충족시키지 않는 각각의 질의 결과에 대하여 비한정 동작(non-qualifying action)을 수행하는 것을 더 수행하도록 할 수 있는
    데이터 저장 장소 검색 프로그램.
  38. 제 33 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 적어도 하나의 제공된 어드레스가능한 위치를 위한 패스워드를 더 제공하고,
    상기 프로그램은 상기 컴퓨터로 하여금
    상기 제공된 패스워드를 사용하여 상기 패스워드가 제공되는 지시된 어드레스가능한 위치에서의 상기 컨텐츠 페이지를 액세스하는 것을 더 수행하도록 할 수 있는
    데이터 저장 장소 검색 프로그램.
  39. 제 33 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 또한 하이퍼텍스트의 검색이 상기 액세스된 컨텐츠 페이지에 포함된 링크된 어드레스가능한 위치들에 링크시키는지를 나타내는 재귀적인 검색 설정을 지시하고,
    상기 프로그램은 상기 컴퓨터로 하여금
    상기 재귀적 검색 설정이 링크된 어드레스가능한 위치들을 재귀적으로 검색하는 것을 나타내면, 각각의 링크된 어드레스가능한 위치에서의 컨텐츠 페이지를 액세스하는 것 - 상기 액세스된 컨텐츠 페이지 내의 상기 링크된 어드레스가능한 위치들에서 재귀적으로 액세스된 각각의 컨텐츠 페이지에 대하여 메타데이터가 생성됨 -을 더 수행하도록 할 수 있는
    데이터 저장 장소 검색 프로그램.
  40. 제 39 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 상기 데이터 저장 장소에서 금지된 어드레스가능한 위치들을 더 제공하고, 하나의 금지된 어드레스 위치인 링크된 어드레스가능한 위치에서 각각의 컨텐츠 페이지에 대하여 메타데이터가 생성되지 않는
    데이터 저장 장소 검색 프로그램.
  41. 제 33 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 또한 유효성 확인 프로그램들을 나타내고,
    상기 프로그램은 상기 컴퓨터로 하여금
    각각의 액세스된 컨텐츠 페이지에 대하여 상기 액세스된 커스텀화가능한 설정들에서 각각의 상기 유효성 확인 프로그램을 실행하는 것과,
    상기 컨텐츠 페이지의 특성들을 기술하는 각각의 유효성 확인 프로그램을 갖는 각각의 액세스된 컨텐츠 페이지에 대해 상기 유효성 확인 프로그램을 갖는 유효성 출력 결과를 생성하는 것과,
    상기 유효성 출력 결과로부터 메타데이터를 생성하여 상기 데이터 저장 장소에서의 액세스된 어드레스가능한 위치들에 대한 메타데이터의 색인에 추가하는 것을 더 수행하도록 할 수 있는
    데이터 저장 장소 검색 프로그램.
  42. 제 41 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 또한 적어도 하나의 유효성 확인 프로그램으로 사용하기 위한 적어도 하나의 파라미터를 나타내며,
    상기 프로그램은 상기 컴퓨터로 하여금
    상기 유효성 확인 프로그램을 실행할 때 상기 적어도 하나의 파라미터를 사용하는 것을 더 수행하도록 할 수 있고,
    상기 유효성 출력 결과는 또한 상기 유효성 확인 프로그램으로 사용된 적어도 하나의 파라미터와 관련된 컨텐츠 페이지의 특성들을 나타내는
    데이터 저장 장소 검색 프로그램.
  43. 제 41 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들은 또한 적어도 하나의 유효성 확인 프로그램으로 사용하기 위한 적어도 하나의 한정사를 나타내며,
    상기 프로그램은 상기 컴퓨터로 하여금
    상기 유효성 출력 결과가 상기 출력 결과를 생성하는 상기 유효성 확인 프로그램을 구비한 적어도 하나의 한정사를 충족시키는지를 결정하는 것을 더 수행하도록 할 수 있고,
    만약 상기 출력 결과가 상기 한정사를 충족시키면 상기 출력 결과에 대한 메타데이터가 상기 색인에 포함되는
    데이터 저장 장소 검색 프로그램.
  44. 제 33 항에 있어서,
    상기 프로그램은 상기 컴퓨터로 하여금
    상기 액세스된 컨텐츠 페이지의 형식을 결정하는 것과,
    상기 결정된 형식을 분석할 수 있는 다수의 파서들 중에서 하나를 선택하는 것과,
    상기 선택된 파서를 사용하여 상기 컨텐츠 페이지를 분석하는 것을 더 수행하도록 할 수 있고,
    상기 색인에 추가한 메타데이터는 상기 분석된 컨텐츠 페이지로부터 발생되는
    데이터 저장 장소 검색 프로그램.
  45. 제 33 항에 있어서,
    상기 프로그램은 상기 컴퓨터로 하여금
    상기 컨텐츠 페이지에 참조된 삽입된 파일을 분석할 수 있는 파서를 결정하는 것과,
    상기 참조된 삽입된 파일의 컨텐츠를 분석하는 것과,
    상기 색인에 추가하기 위해서 상기 삽입된 파일의 상기 분석된 컨텐츠를 위한 메타데이터를 발생시키는 것을 더 수행하도록 할 수 있는
    데이터 저장 장소 검색 프로그램.
  46. 제 33 항에 있어서,
    상기 액세스된 커스텀화가능한 설정들을 사용하여 컨텐츠 제공자 데이터 저장 장소들을 위한 메타데이터를 액세스하고 생성시킬 수 있는 컨텐츠 제공자들에게 상기 프로그램을 배포하는 것과,
    컨텐츠 제공자들의 데이터 저장 장소들의 메타데이터를 수집하기 위한 수집 툴을 사용하여 다중 컨텐츠 제공자들로부터 수집된 메타데이터 데이터를 수집하는 것을 더 포함하는
    데이터 저장 장소 검색 프로그램.
  47. 제 46 항에 있어서,
    상기 메타데이터를 수집하여 제공하기 위해 프로그램을 사용하는 컨텐츠 제공자들로부터 전자적 승낙을 수신하는 것을 포함하는 프로그램.
KR10-2001-0049456A 2000-08-24 2001-08-17 데이터 저장 장소 검색 방법, 시스템 및 기록 매체 KR100482479B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/645,386 2000-08-24
US09/645,386 US6959326B1 (en) 2000-08-24 2000-08-24 Method, system, and program for gathering indexable metadata on content at a data repository

Publications (2)

Publication Number Publication Date
KR20020016514A true KR20020016514A (ko) 2002-03-04
KR100482479B1 KR100482479B1 (ko) 2005-04-14

Family

ID=24588814

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0049456A KR100482479B1 (ko) 2000-08-24 2001-08-17 데이터 저장 장소 검색 방법, 시스템 및 기록 매체

Country Status (4)

Country Link
US (1) US6959326B1 (ko)
EP (1) EP1182590A3 (ko)
JP (1) JP3771822B2 (ko)
KR (1) KR100482479B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004109539A1 (en) * 2003-06-05 2004-12-16 Samsung Electronics Co., Ltd. Method of efficiently managing multimedia content and storage medium storing therein multimedia content using the same
KR100473163B1 (ko) * 2002-01-15 2005-03-08 주식회사 에듀미디어텍 멀티미디어 컨텐츠가 저장된 기록 매체 및 그 재생을 위한장치와 방법
KR100912984B1 (ko) * 2002-04-12 2009-08-20 미쓰비시덴키 가부시키가이샤 메타데이터 편집 장치, 메타데이터 재생 장치, 메타데이터 배신 장치, 메타데이터 검색 장치, 메타데이터 재생성 조건 설정 장치, 콘텐츠 배신 장치, 메타데이터 배신 방법, 메타데이터 재생성 장치, 메타데이터 재생성 방법
KR101088983B1 (ko) * 2003-03-14 2011-12-01 가부시키가이샤 엔티티 도코모 데이터 탐색 시스템 및 방법과, 데이터 탐색 방법을수행하는 장치

Families Citing this family (114)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711738B1 (en) * 1999-11-15 2010-05-04 West Services, Inc. Method, system and computer-readable medium for accessing and retrieving court records, items and documents
US6883135B1 (en) 2000-01-28 2005-04-19 Microsoft Corporation Proxy server using a statistical model
JP2004515864A (ja) 2000-10-24 2004-05-27 トムソン ライセンシング ソシエテ アノニム 埋め込み型メディア・プレーヤ・ページのサイズ調整方法、記録媒体、および伝送媒体
US8122236B2 (en) 2001-10-24 2012-02-21 Aol Inc. Method of disseminating advertisements using an embedded media player page
US20020103920A1 (en) 2000-11-21 2002-08-01 Berkun Ken Alan Interpretive stream metadata extraction
FR2818848B1 (fr) * 2000-12-26 2004-05-14 France Telecom Systeme de gestion d'informations en temps reel, pour un reseau comportant un ensemble heterogene de terminaux, serveur et terminal principal pour un tel systeme
US20040088333A1 (en) 2002-01-25 2004-05-06 David Sidman Apparatus method and system for tracking information access
US7440953B2 (en) * 2001-01-25 2008-10-21 Content Directions, Inc. Apparatus, method and system for directory quality assurance
US7620622B1 (en) * 2001-03-08 2009-11-17 Yahoo! Inc. Method and system for indexing information and providing results for a search including objects having predetermined attributes
WO2002084590A1 (en) 2001-04-11 2002-10-24 Applied Minds, Inc. Knowledge web
US20040172410A1 (en) * 2001-06-11 2004-09-02 Takashi Shimojima Content management system
US20020198962A1 (en) * 2001-06-21 2002-12-26 Horn Frederic A. Method, system, and computer program product for distributing a stored URL and web document set
WO2003017023A2 (en) * 2001-08-14 2003-02-27 Quigo Technologies, Inc. System and method for extracting content for submission to a search engine
WO2003077558A2 (en) * 2002-03-14 2003-09-18 Koninklijke Philips Electronics N.V. Improved finding of tv anytime web services
US8069175B2 (en) 2002-04-10 2011-11-29 Google Inc. Delegating authority to evaluate content
US7844610B2 (en) 2003-12-12 2010-11-30 Google Inc. Delegated authority evaluation system
US8090800B2 (en) * 2002-05-14 2012-01-03 Oracle International Corporation Method and system for automated web page accessibility coding standards analysis
US6983280B2 (en) * 2002-09-13 2006-01-03 Overture Services Inc. Automated processing of appropriateness determination of content for search listings in wide area network searches
US8012025B2 (en) 2002-12-13 2011-09-06 Applied Minds, Llc Video game controller hub with control input reduction and combination schemes
KR100511785B1 (ko) * 2002-12-20 2005-08-31 한국전자통신연구원 멀티미디어 컨텐츠 기술 메타데이터 저작 시스템 및 저작방법
US20060167813A1 (en) * 2003-02-25 2006-07-27 Ali Aydar Managing digital media rights through missing masters lists
US20060167807A1 (en) * 2003-02-25 2006-07-27 Ali Aydar Dispute resolution in an open copyright database
US20060167882A1 (en) * 2003-02-25 2006-07-27 Ali Aydar Digital rights management system architecture
JP2007525725A (ja) * 2003-02-25 2007-09-06 スノキャップ,インコーポレイテッド コンテンツ規制システム及び装置
US20060167804A1 (en) * 2003-02-25 2006-07-27 Ali Aydar Track listening and playing service for digital media files
US8117130B2 (en) * 2003-02-25 2012-02-14 Stragent, Llc Batch loading and self-registration of digital media files
US20040215534A1 (en) 2003-04-25 2004-10-28 Apple Computer, Inc. Method and system for network-based allowance control
EP1639440A4 (en) 2003-04-25 2009-03-11 Apple Inc GRAPHIC USER INTERFACE FOR BROWSING, BROWSING AND PRESENTING MEDIA ARTICLES
JP4454251B2 (ja) * 2003-05-19 2010-04-21 日本放送協会 コンテンツ配信システム
US9678967B2 (en) * 2003-05-22 2017-06-13 Callahan Cellular L.L.C. Information source agent systems and methods for distributed data storage and management using content signatures
US7228301B2 (en) * 2003-06-27 2007-06-05 Microsoft Corporation Method for normalizing document metadata to improve search results using an alias relationship directory service
US8954509B1 (en) * 2003-09-18 2015-02-10 Microsoft Corporation System and method for broadcasting data over a computer network
US7844548B2 (en) * 2003-10-15 2010-11-30 Apple Inc. Techniques and systems for electronic submission of media for network-based distribution
US7546531B2 (en) * 2003-11-21 2009-06-09 Microsoft Corporation Accessing alternate content
US7293012B1 (en) * 2003-12-19 2007-11-06 Microsoft Corporation Friendly URLs
US7457955B2 (en) 2004-01-14 2008-11-25 Brandmail Solutions, Inc. Method and apparatus for trusted branded email
US8073910B2 (en) * 2005-03-03 2011-12-06 Iconix, Inc. User interface for email inbox to call attention differently to different classes of email
US20070162394A1 (en) * 2004-02-12 2007-07-12 Iconix, Inc. Rapid identification of message authentication
US7584221B2 (en) 2004-03-18 2009-09-01 Microsoft Corporation Field weighting in text searching
US7680759B1 (en) * 2004-08-18 2010-03-16 Teradata Us, Inc. Automated metadata validation
US7606793B2 (en) 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
US7827181B2 (en) 2004-09-30 2010-11-02 Microsoft Corporation Click distance determination
US7761448B2 (en) 2004-09-30 2010-07-20 Microsoft Corporation System and method for ranking search results using click distance
US7739277B2 (en) 2004-09-30 2010-06-15 Microsoft Corporation System and method for incorporating anchor text into ranking search results
WO2006069161A2 (en) * 2004-12-20 2006-06-29 Snocap, Inc. Dispute resolution in an open copyright database
US7716198B2 (en) 2004-12-21 2010-05-11 Microsoft Corporation Ranking search results using feature extraction
US7599966B2 (en) * 2005-01-27 2009-10-06 Yahoo! Inc. System and method for improving online search engine results
US20060167854A1 (en) * 2005-01-27 2006-07-27 Dissett Daniel P System and method for improving online search engine results
US20060184517A1 (en) * 2005-02-15 2006-08-17 Microsoft Corporation Answers analytics: computing answers across discrete data
US7792833B2 (en) 2005-03-03 2010-09-07 Microsoft Corporation Ranking search results using language types
US7392253B2 (en) * 2005-03-03 2008-06-24 Microsoft Corporation System and method for secure full-text indexing
WO2006094557A1 (en) * 2005-03-11 2006-09-14 Kother Mikael Highlighting of search terms in a meta search engine
US7599917B2 (en) 2005-08-15 2009-10-06 Microsoft Corporation Ranking search results using biased click distance
US8930402B1 (en) 2005-10-31 2015-01-06 Verizon Patent And Licensing Inc. Systems and methods for automatic collection of data over a network
US20070203898A1 (en) * 2006-02-24 2007-08-30 Jonathan Lurie Carmona Search methods and systems
US20070203956A1 (en) * 2006-02-28 2007-08-30 Microsoft Corporation Metadata Customization Using Diffgrams
US20070276920A1 (en) * 2006-05-12 2007-11-29 Daniel Buchmann Consistency of routing rules in distributed system landscapes
US7827188B2 (en) * 2006-06-09 2010-11-02 Copyright Clearance Center, Inc. Method and apparatus for converting a document universal resource locator to a standard document identifier
US9633356B2 (en) 2006-07-20 2017-04-25 Aol Inc. Targeted advertising for playlists based upon search queries
JP4130685B2 (ja) * 2006-07-25 2008-08-06 インターナショナル・ビジネス・マシーンズ・コーポレーション デジタル・コンテンツに関する問合せに対して回答することを支援するためのシステム、プログラム、および方法
US8190661B2 (en) * 2007-01-24 2012-05-29 Microsoft Corporation Using virtual repository items for customized display
US20080201330A1 (en) * 2007-02-16 2008-08-21 Microsoft Corporation Software repositories
US8145673B2 (en) * 2007-02-16 2012-03-27 Microsoft Corporation Easily queriable software repositories
US20080208831A1 (en) * 2007-02-26 2008-08-28 Microsoft Corporation Controlling search indexing
US10387440B2 (en) * 2007-03-29 2019-08-20 Jda Software Group, Inc. Generic data staging and loading using enhanced metadata and associated method
US7958103B1 (en) * 2007-03-30 2011-06-07 Emc Corporation Incorporated web page content
US7831625B2 (en) 2007-05-16 2010-11-09 Microsoft Corporation Data model for a common language
US7725454B2 (en) * 2007-07-20 2010-05-25 Microsoft Corporation Indexing and searching of information including handler chaining
US7849065B2 (en) * 2007-07-20 2010-12-07 Microsoft Corporation Heterogeneous content indexing and searching
JP2009075904A (ja) * 2007-09-21 2009-04-09 Fujifilm Corp 検索可能化プログラム
US20090083336A1 (en) * 2007-09-26 2009-03-26 Microsoft Corporation Search based data management
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US7840569B2 (en) 2007-10-18 2010-11-23 Microsoft Corporation Enterprise relevancy ranking using a neural network
US8521079B2 (en) * 2007-12-21 2013-08-27 Ibiquity Digital Corporation Radio service registry
WO2009120004A2 (ko) * 2008-03-24 2009-10-01 Kang Min Soo 디지털 콘텐츠 관련 메타 정보 활용 키워드 광고 방법 및 그 관련 시스템
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US8095963B2 (en) 2008-04-30 2012-01-10 Microsoft Corporation Securing resource stores with claims-based security
US8449144B2 (en) * 2008-05-16 2013-05-28 Musco Corporation Apparatus, method, and system for highly controlled light distribution using multiple light sources
US20090327466A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Internal uniform resource locator formulation and testing
US8214336B2 (en) * 2009-06-16 2012-07-03 International Business Machines Corporation Preservation of digital content
US8095571B2 (en) 2009-06-22 2012-01-10 Microsoft Corporation Partitioning modeling platform data
US20110176397A1 (en) * 2010-01-18 2011-07-21 Rabih Salem Ballout Method for Providing an Interactive, Personalized Radio Network
US20110178878A1 (en) * 2010-01-18 2011-07-21 Rabih Ballout System for Providing an Interactive, Personalized Radio Network
US20110178874A1 (en) * 2010-01-18 2011-07-21 Rabih Salem Ballout Service for Providing an Interactive, Personalized Radio Network
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US9563681B1 (en) 2012-08-08 2017-02-07 Amazon Technologies, Inc. Archival data flow management
US9767098B2 (en) 2012-08-08 2017-09-19 Amazon Technologies, Inc. Archival data storage system
US8694604B2 (en) * 2011-08-25 2014-04-08 Microsoft Corporation Accurate search results while honoring content limitations
KR101210201B1 (ko) * 2011-10-04 2012-12-07 주식회사 소머스 소셜 네트워크 서비스를 이용한 인터랙티브 다국어 광고 시스템 및 그 구동 방법
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
US9070010B2 (en) 2012-08-06 2015-06-30 Bank Of America Corporation Image check content estimation and use
US9830111B1 (en) 2012-08-08 2017-11-28 Amazon Technologies, Inc. Data storage space management
US8805793B2 (en) 2012-08-08 2014-08-12 Amazon Technologies, Inc. Data storage integrity validation
US9779035B1 (en) 2012-08-08 2017-10-03 Amazon Technologies, Inc. Log-based data storage on sequentially written media
US8959067B1 (en) * 2012-08-08 2015-02-17 Amazon Technologies, Inc. Data storage inventory indexing
US9904788B2 (en) 2012-08-08 2018-02-27 Amazon Technologies, Inc. Redundant key management
US9225675B2 (en) 2012-08-08 2015-12-29 Amazon Technologies, Inc. Data storage application programming interface
US9652487B1 (en) 2012-08-08 2017-05-16 Amazon Technologies, Inc. Programmable checksum calculations on data storage devices
US10120579B1 (en) 2012-08-08 2018-11-06 Amazon Technologies, Inc. Data storage management for sequentially written media
US9721236B2 (en) 2012-08-09 2017-08-01 Bank Of America Corporation Distributed processing of a check image
US8996476B2 (en) 2012-08-20 2015-03-31 Bank Of America Corporation Correction of check processing defects
US10558581B1 (en) 2013-02-19 2020-02-11 Amazon Technologies, Inc. Systems and techniques for data recovery in a keymapless data storage system
US11016946B1 (en) * 2015-03-31 2021-05-25 EMC IP Holding Company LLC Method and apparatus for processing object metadata
US10373128B2 (en) 2015-06-25 2019-08-06 Bank Of America Corporation Dynamic resource management associated with payment instrument exceptions processing
US10049350B2 (en) 2015-06-25 2018-08-14 Bank Of America Corporation Element level presentation of elements of a payment instrument for exceptions processing
US10115081B2 (en) 2015-06-25 2018-10-30 Bank Of America Corporation Monitoring module usage in a data processing system
US10229395B2 (en) 2015-06-25 2019-03-12 Bank Of America Corporation Predictive determination and resolution of a value of indicia located in a negotiable instrument electronic image
US11386060B1 (en) 2015-09-23 2022-07-12 Amazon Technologies, Inc. Techniques for verifiably processing data in distributed computing systems
US10552303B2 (en) * 2016-07-18 2020-02-04 International Business Machines Corporation Segmented accessibility testing in web-based applications
US11064013B2 (en) * 2018-05-22 2021-07-13 Netskope, Inc. Data loss prevention using category-directed parsers
US10764253B2 (en) 2018-06-28 2020-09-01 Bank Of America Corporation System for using metadata to identify and extract specific upstream data, provisioning data batches, and providing dynamic downstream data access
US12086450B1 (en) 2018-09-26 2024-09-10 Amazon Technologies, Inc. Synchronous get copy for asynchronous storage
KR102394483B1 (ko) * 2021-09-02 2022-05-04 (주)가온아이 전자 문서에 오류가 있는지 여부를 판단하는 오류 판단 서비스를 제공하기 위한 서비스 제공 서버 및 그 동작 방법
US11503038B1 (en) 2021-10-27 2022-11-15 Netskope, Inc. Policy enforcement and visibility for IaaS and SaaS open APIs

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5493677A (en) * 1994-06-08 1996-02-20 Systems Research & Applications Corporation Generation, archiving, and retrieval of digital images with evoked suggestion-set captions and natural language interface
US5675785A (en) 1994-10-04 1997-10-07 Hewlett-Packard Company Data warehouse which is accessed by a user using a schema of virtual tables
US5873076A (en) * 1995-09-15 1999-02-16 Infonautics Corporation Architecture for processing search queries, retrieving documents identified thereby, and method for using same
US5721903A (en) 1995-10-12 1998-02-24 Ncr Corporation System and method for generating reports from a computer database
US5974455A (en) * 1995-12-13 1999-10-26 Digital Equipment Corporation System for adding new entry to web page table upon receiving web page including link to another web page not having corresponding entry in web page table
US5970482A (en) 1996-02-12 1999-10-19 Datamind Corporation System for data mining using neuroagents
US5715453A (en) * 1996-05-31 1998-02-03 International Business Machines Corporation Web server mechanism for processing function calls for dynamic data queries in a web page
US6038610A (en) * 1996-07-17 2000-03-14 Microsoft Corporation Storage of sitemaps at server sites for holding information regarding content
US5864863A (en) * 1996-08-09 1999-01-26 Digital Equipment Corporation Method for parsing, indexing and searching world-wide-web pages
US5935210A (en) * 1996-11-27 1999-08-10 Microsoft Corporation Mapping the structure of a collection of computer resources
US5999940A (en) * 1997-05-28 1999-12-07 Home Information Services, Inc. Interactive information discovery tool and methodology
US5920856A (en) * 1997-06-09 1999-07-06 Xerox Corporation System for selecting multimedia databases over networks
US5983267A (en) * 1997-09-23 1999-11-09 Information Architects Corporation System for indexing and displaying requested data having heterogeneous content and representation
KR100269258B1 (ko) * 1997-10-21 2000-10-16 정선종 프로세스 방법론을 위한 통합 case 정보저장소 메타 모델시스템 및 그 통합 지원 방법
KR19990047854A (ko) * 1997-12-05 1999-07-05 정선종 메타데이타에 의한 정보 검색의 지능형 사용자 인터페이스 방법
US6145003A (en) * 1997-12-17 2000-11-07 Microsoft Corporation Method of web crawling utilizing address mapping
US6094649A (en) * 1997-12-22 2000-07-25 Partnet, Inc. Keyword searches of structured databases
US6151624A (en) * 1998-02-03 2000-11-21 Realnames Corporation Navigating network resources based on metadata
US6167405A (en) * 1998-04-27 2000-12-26 Bull Hn Information Systems Inc. Method and apparatus for automatically populating a data warehouse system
US6192364B1 (en) * 1998-07-24 2001-02-20 Jarg Corporation Distributed computer database system and method employing intelligent agents
US6226618B1 (en) * 1998-08-13 2001-05-01 International Business Machines Corporation Electronic content delivery system
US6138157A (en) * 1998-10-12 2000-10-24 Freshwater Software, Inc. Method and apparatus for testing web sites
KR100295391B1 (ko) * 1998-12-03 2001-07-12 오길록 씨.에이.엘.에스 통합 데이터베이스를 위한 메타 데이터카탈로그 시스템
CA2256936C (en) * 1998-12-23 2002-04-02 Hamid Bacha System for electronic repository of data enforcing access control on data search and retrieval
KR20000054898A (ko) * 1999-02-01 2000-09-05 김영환 컴퓨터를 이용한 멀티미디어 정보검색 방법 및 그 장치
US6253198B1 (en) * 1999-05-11 2001-06-26 Search Mechanics, Inc. Process for maintaining ongoing registration for pages on a given search engine
US6263364B1 (en) * 1999-11-02 2001-07-17 Alta Vista Company Web crawler system using plurality of parallel priority level queues having distinct associated download priority levels for prioritizing document downloading and maintaining document freshness
US6434548B1 (en) * 1999-12-07 2002-08-13 International Business Machines Corporation Distributed metadata searching system and method
US7020679B2 (en) * 2000-05-12 2006-03-28 Taoofsearch, Inc. Two-level internet search service system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100473163B1 (ko) * 2002-01-15 2005-03-08 주식회사 에듀미디어텍 멀티미디어 컨텐츠가 저장된 기록 매체 및 그 재생을 위한장치와 방법
KR100912984B1 (ko) * 2002-04-12 2009-08-20 미쓰비시덴키 가부시키가이샤 메타데이터 편집 장치, 메타데이터 재생 장치, 메타데이터 배신 장치, 메타데이터 검색 장치, 메타데이터 재생성 조건 설정 장치, 콘텐츠 배신 장치, 메타데이터 배신 방법, 메타데이터 재생성 장치, 메타데이터 재생성 방법
KR101088983B1 (ko) * 2003-03-14 2011-12-01 가부시키가이샤 엔티티 도코모 데이터 탐색 시스템 및 방법과, 데이터 탐색 방법을수행하는 장치
WO2004109539A1 (en) * 2003-06-05 2004-12-16 Samsung Electronics Co., Ltd. Method of efficiently managing multimedia content and storage medium storing therein multimedia content using the same

Also Published As

Publication number Publication date
US6959326B1 (en) 2005-10-25
EP1182590A3 (en) 2005-11-23
JP2002123528A (ja) 2002-04-26
JP3771822B2 (ja) 2006-04-26
EP1182590A2 (en) 2002-02-27
KR100482479B1 (ko) 2005-04-14

Similar Documents

Publication Publication Date Title
KR100482479B1 (ko) 데이터 저장 장소 검색 방법, 시스템 및 기록 매체
US10362050B2 (en) System and methods for scalably identifying and characterizing structural differences between document object models
KR101477763B1 (ko) 원격 모듈용 메시지 목록
CN1104696C (zh) 自动添加信息的超级文本链接接收文件的系统和方法
US9606971B2 (en) Rule-based validation of websites
AU2010201642B2 (en) Remote module incorporation into a container document
US8756228B2 (en) Method and apparatus for creating contextualized feeds
US8185819B2 (en) Module specification for a module to be incorporated into a container document
US8024384B2 (en) Techniques for crawling dynamic web content
US20100011282A1 (en) Annotation system and method
US20070157078A1 (en) Method for combining input data with run-time parameters into xml output using xsl/xslt
US20070136443A1 (en) Proxy server collection of data for module incorporation into a container document
US20090281995A1 (en) System and method for enhanced direction of automated content identification in a distributed environment
US20090172520A1 (en) Method of managing web services using integrated document
US8484217B1 (en) Knowledge discovery appliance
US6711570B1 (en) System and method for matching terms contained in an electronic document with a set of user profiles
US20100192054A1 (en) Sematically tagged background information presentation
KR100771577B1 (ko) 웹페이지 접속 이력정보 관리방법
Bosse et al. WEB DATA MINING1
Lewandowski How Search Engines Capture and Process Content from the Web
Valerio A Methodology to Retrieve, to Manage, to Classify and to Query Open Source Information

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130327

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20140326

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20160325

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20180329

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20190327

Year of fee payment: 15