KR101312834B1 - 검색 경보 결과들 전송 방법, 검색 경보 결과들 전송 시스템, 및 컴퓨터 판독가능 저장 메모리 - Google Patents

검색 경보 결과들 전송 방법, 검색 경보 결과들 전송 시스템, 및 컴퓨터 판독가능 저장 메모리 Download PDF

Info

Publication number
KR101312834B1
KR101312834B1 KR1020087025614A KR20087025614A KR101312834B1 KR 101312834 B1 KR101312834 B1 KR 101312834B1 KR 1020087025614 A KR1020087025614 A KR 1020087025614A KR 20087025614 A KR20087025614 A KR 20087025614A KR 101312834 B1 KR101312834 B1 KR 101312834B1
Authority
KR
South Korea
Prior art keywords
search
time
document
schema
property
Prior art date
Application number
KR1020087025614A
Other languages
English (en)
Other versions
KR20090005018A (ko
Inventor
미챌 기드오니
드미트리 메이어존
멘톤 제이. 프래블
미르치아 니고비치-니고스쿠
Original Assignee
마이크로소프트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이크로소프트 코포레이션 filed Critical 마이크로소프트 코포레이션
Publication of KR20090005018A publication Critical patent/KR20090005018A/ko
Application granted granted Critical
Publication of KR101312834B1 publication Critical patent/KR101312834B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Abstract

원하는 문서들 및/또는 자원들을 검색하기 위한 크롤러와 같은 검색 엔진들과 함께 경보 검색 메커니즘이 이용된다. 검색 쿼리들을 이용하여 특정 문서들이 발견된다. 검색 메커니즘은 쿼리들 내의 관련 특성들의 세트의 값들을 추적한다. 시스템에 의해 문서가 검색될 때마다, 특성들의 세트의 값들이 이전 값과 매칭된다. 매칭이 존재하지 않는 경우, 이것은 문서가 변경되었음을 지시한다.
문서 검색, 크롤러, 검색 엔진, 경보 검색 메커니즘, 검색 쿼리

Description

검색 경보 결과들 전송 방법, 검색 경보 결과들 전송 시스템, 및 컴퓨터 판독가능 저장 메모리{SIGNIFICANT CHANGE SEARCH ALERTS}
본 발명은 중대 변경 검색 경보에 관한 것이다.
검색 경보들(search alerts)은 시스템 내에 유지되는 지속적인 쿼리들이다. 시스템이 지속적인 쿼리(persistent query)를 만족시키는 새로운 쿼리 결과(문서, 리스트-항목, 폴더 등)를 식별할 때마다, 경보 사용자는 이러한 결과에 대해 통지받는다. 통상적으로, 경보 사용자는 경보가 사용자에게 전송되는 빈도를 선택할 수 있다. 예를 들어, 경보를 전송하는 빈도는 매일일 수 있다.
그러나, 검색 경보 사용자들에 대한 검색 경보 결과들은 (너무 자주) 부적절한 결과들을 전송함으로써 사용자들을 성가시게 할 수 있다. 특히, 부적절한 결과들은 사용자들에게 흥미롭지 않은 문서들에 대한 검색의 변경들에 의해 발생한다.
예를 들어, 사용자는 "특허"라는 용어를 검색하기를 원하고, 시스템(인터넷을 통해 네트워킹된 컴퓨터들 등)에서 이러한 검색에 대한 매일의 경보(daily alert)를 생성한다. 통상적으로, 사용자는 마지막 날에 발견된 모든 결과를 갖는 매일의 통지를 받을 것이다. 시스템은 시스템에 의해 발견되었거나 최종일 동안에 변경된 "특허"라는 용어를 포함하는 모든 문서를 리스트한 결과들을 반환한다. 많은 사례에서, 소정의 변경들은 사용자가 통지받을 만큼 충분히 흥미롭지 못하며, 성가신 것으로 간주될 수 있다. 사용자는 문서가 보안 기술자의 변경 또는 사용자가 볼 수 없는 다른 특성들에 대한 변경을 가질 수 있을 때 결과들을 성가신 것으로 간주할 수 있다.
<발명의 요약>
본 요약은 아래의 상세한 설명에서 더 설명되는 개념들의 선택을 간단한 형태로 소개하기 위해 제공된다. 본 요약은 청구 발명의 중요한 특징들 또는 필수 특징들을 식별하려는 의도도 없고, 청구 발명의 범위 결정의 보조물로서도 의도하지 않는다.
본 개시는 쿼리들 내의 관련 특성들의 세트만의 값들을 추적하는 경보 검색 메커니즘들에 관한 것이다. 문서가 시스템에 의해 크롤링(crawling)될 때마다, 이러한 특성들의 세트의 값들("콘텐츠 시그니처"라 함)은 이전 값들("이전 콘텐츠 시그니처"라 함)과 매칭된다. 매칭이 존재하지 않는 경우, 이는 문서가 변경되었음을 지시한다. 관심없는 특성(보안 기술자 등)만이 변경된 경우, 이 특성의 값은 이전 콘텐츠 시그니처에 의해서도, 새로운 콘텐츠 시그니처에 의해서도 추적되지 않고, 따라서 여전히 매칭이 존재하므로, 문서는 변경된 것으로 나타나지 않는다.
또한, 문서에 대한 관련 특성들의 세트(예를 들어, 스키마)는 관리자에 의해 변경될 수 있다. 특성들의 세트가 예를 들어 "관련 세트"에 특성을 추가함으로써 변경되는 경우, 문서들은 변경된 것으로 나타날 것이다. 이전 시그니처가 새로운 콘텐츠 시그니처와 다른 특성들의 세트를 포함하며, 따라서 상이한 콘텐츠가 매칭될 수 있으므로, 문서들은 변경된 것으로 나타나게 된다. 따라서, 시스템은 문서 자체가 아니라 문서에 대한 스키마가 변경되었음을 판정할 수 있다. 일 실시예에서, 시스템은 체크섬과 같은 "스키마 버전" 디지털 시그니처를 추적함으로써 이러한 상황을 검출할 수 있다. 새로운 콘텐츠 시그니처가 이전 콘텐츠 시그니처와 매칭되지 않고, "스키마 버전"이 변경되지 않은 경우, 문서는 변경되었다. "스키마 버전"도 변경된 경우, 문서는 변경되지 않은 것으로 간주될 수 있다(실제로 변경되지 않은 문서에 대한 통지를 전송함으로써 사용자를 성가시게 할 수도 있는 경보를 전송하는 것을 피하는 것이 보다 나을 수 있기 때문이다).
이들 및 다른 특징들 및 이점들은 아래의 상세한 설명을 읽고 관련 도면들을 검토함으로써 명백할 것이다. 위의 일반적인 설명 및 아래의 상세한 설명 모두는 예시적일 뿐, 청구 발명을 제한하지 않는다는 것을 이해해야 한다.
도 1은 본 발명의 일 실시예에 따라 사용될 수 있는 컴퓨팅 장치를 나타내는 도면.
도 2는 중대 변경 검색 경보들을 위한 시스템의 블록도.
도 3은 시스템 검색 경보 쿼리 처리 메커니즘의 블록도.
도 4는 경보 통지를 트리거할지의 여부를 결정하기 위한 프로세스의 흐름도.
이하, 실시예들은 그의 일부를 형성하고 특정 실시예들을 예시적으로 도시하는 첨부 도면들을 참조하여 보다 상세히 설명된다. 특히, 여기에 설명되는 다양한 실시예는 방법들, 장치들 또는 이들의 조합으로서 구현될 수 있다. 또한, 다양한 실시예는 완전히 하드웨어적인 구현, 완전히 소프트웨어적인 구현, 또는 소프트웨어와 하드웨어 양태들을 조합한 구현의 형태를 가질 수 있다. 따라서, 아래의 상세한 설명은 제한적인 것으로 간주되지 않아야 한다.
도 1을 참조하면, 본 발명을 구현하기 위한 시스템의 일례는 컴퓨팅 장치(100)와 같은 컴퓨팅 장치를 포함한다. 컴퓨팅 장치(100)는 네트워크 기반 협동 시스템에서 데이터와 상호작용하는 클라이언트, 서버, 이동 장치 또는 임의의 다른 컴퓨팅 장치로서 구성될 수 있다. 매우 기본적인 구성에서, 컴퓨팅 장치(100)는 통상적으로 적어도 하나의 처리 유닛(102) 및 시스템 메모리(104)를 포함한다. 컴퓨팅 장치의 정확한 구성 및 타입에 따라, 시스템 메모리(104)는 휘발성(RAM 등), 비휘발성(ROM, 플래시 메모리 등) 또는 이 둘의 소정 조합일 수 있다. 시스템 메모리(104)는 통상적으로 운영 체제(105), 하나 이상의 애플리케이션(106)을 포함하며, 프로그램 데이터(107)를 포함할 수 있다. 도 2-4를 참조하여 후술되는 경보 통지 서비스들(108)은 시스템 메모리(104) 내에 구현된다.
컴퓨팅 장치(100)는 추가 특징들 또는 기능을 가질 수 있다. 예를 들어, 컴퓨팅 장치(100)는 예를 들어 자기 디스크, 광 디스크 또는 테이프와 같은 추가 데이터 저장 장치들(이동식 및/또는 비이동식)도 포함할 수 있다. 이러한 추가 저장 장치는 이동식 저장 장치(109) 및 비이동식 저장 장치(110)로서 도 1에 도시되어 있다. 컴퓨터 저장 매체는 컴퓨터 판독 가능 명령들, 데이터 구조들, 프로그램 모듈들, 또는 다른 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성, 이동식 및 비이동식 매체를 포함할 수 있다. 시스템 메모리(104), 이동식 저장 장치(109) 및 비이동식 저장 장치(110)는 모두 컴퓨터 저장 매체의 예들이다. 컴퓨터 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 다른 메모리 기술, CD-ROM, DVD 또는 다른 광학 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 다른 자기 저장 장치, 또는 원하는 정보를 저장하는 데 사용될 수 있고 컴퓨팅 장치(100)에 의해 액세스될 수 있는 임의의 다른 매체를 포함하지만, 이에 한정되지 않는다. 이러한 임의의 컴퓨터 저장 매체는 장치(100)의 일부일 수 있다. 컴퓨팅 장치(100)는 키보드, 마우스, 펜, 음성 입력 장치, 터치 입력 장치 등과 같은 입력 장치(들)(112)도 구비할 수 있다. 표시 장치, 스피커, 프린터 등과 같은 출력 장치(들)(114)도 포함될 수 있다.
컴퓨팅 장치(100)는 장치가 네트워크 등을 통해 다른 컴퓨팅 장치들(118)과 통신하는 것을 가능하게 하는 통신 접속들(116)도 포함한다. 네트워크들은 근거리 네트워크 및 원거리 네트워크는 물론, 인트라넷 및 엑스트라넷을 포함하지만 이에 한정되지 않는 다른 대규모 네트워크들을 포함한다. 통신 접속(116)은 통신 매체의 일례이다. 통신 매체는 통상적으로 반송파 또는 다른 전송 메커니즘과 같은 피변조 데이터 신호 내의 컴퓨터 판독 가능 명령들, 데이터 구조들, 프로그램 모듈들, 또는 다른 데이터에 의해 구현될 수 있으며, 임의의 정보 전달 매체를 포함한다. "피변조 데이터 신호"라는 용어는 신호 내에 정보를 인코딩하는 방식으로 신호의 특성들 중 하나 이상을 설정 또는 변경한 신호를 의미한다. 예를 들어, 그리고 제한 없이, 통신 매체는 유선 네트워크 또는 직접 유선 접속과 같은 유선 매체, 및 음향, RF, 적외선 및 다른 무선 매체와 같은 무선 매체를 포함한다. 여기서 사용될 때 컴퓨터 판독 가능 매체라는 용어는 저장 매체 및 통신 매체 양자를 포함한다.
본 개시는 쿼리들 내의 관련 특성들의 세트의 값들을 추적하는 경보 검색 메커니즘들에 관한 것이다. 질서 정연한 방식으로 월드 와이드 웹을 브라우즈하는 자동화된 프로그램인 웹 크롤러가 문서들을 검색하는 데 사용될 수 있다. 예를 들어, 문서가 시스템에 의해 "크롤링"될 때마다, 이러한 특성들의 세트의 값들("콘텐츠 시그니처"라 함)은 이전 값들("이전 콘텐츠 시그니처"라 함)과 매칭된다. (문서들은 문서 특성들의 값들 자체를 비교함으로써 매칭될 수도 있지만, 이것은 대개는 예를 들어, MD5 해시 함수를 이용하여, 이후에 비교될 수 있는 시그니처들을 생성하는 것보다 효율적이지 않다.) 매칭이 존재하지 않는 경우, 이는 문서가 변경된 흥미로운 콘텐츠를 가짐을 지시한다. 관심없는 특성(보안 기술자 등)만이 변경된 경우, 이 특성의 값은 이전 콘텐츠 시그니처에 의해서도, 새로운 콘텐츠 시그니처에 의해서도 추적되지 않으므로, 문서는 대개 변경된 것으로 플래그되지 않을 것이다.
문서에 대한 관련 특성들의 세트(예를 들어, 스키마)는 관리자에 의해 변경될 수 있다. 세트가 예를 들어 "관련 세트"에 특성을 추가함으로써 변경되는 경우, 문서들은 변경된 것으로 나타날 것이다. 이전 시그니처가 새로운 콘텐츠 시그니처와 다른 특성들의 세트를 포함하며, 따라서 상이한 콘텐츠가 매칭될 수 있으므로, 문서들은 변경된 것으로 나타나게 된다. 따라서, 시스템은 문서 자체가 아니라 문서에 대한 스키마가 변경된 것으로 결정할 수 있다.
예를 들어, 관련 특성들의 세트가 특성 A 및 특성 B인 경우, (이전) 콘텐츠 시그니처는 특성 A의 값 및 특성 B의 값을 포함한다. 관리자가 특성 C를 관련 특성들의 세트에 추가할 때, 스키마가 변경된다. 통상적으로, 새로운 콘텐츠 시그니처는 모든 특성(A, B, C)의 값들을 포함할 것이다. 새로운 콘텐츠 시그니처((A+B+C)를 포함함)가 이전 콘텐츠 시그니처 (A+B)와 비교될 때, 값들은 매칭되지 않는다. 따라서, 값들이 매칭되지 않을 때, A 및 B 특성 값들 자체가 변경되지 않았음에도 문서는 변경된 것으로 나타난다.
시스템은 체크섬과 같은 "스키마 버전" 디지털 시그니처를 추적함으로써 이러한 상황을 검출할 수 있다. 예를 들어, 특성 값들을 포함하지 않는 특성 식별자들의 체크섬이 추적될 수 있다. 통상적으로, 특성 식별자들의 체크섬을 추적하는 것은 문서 내의 관련 특성들의 존재를 포착할 것이다. 새로운 콘텐츠 시그니처가 이전 콘텐츠 시그니처와 매칭되지 않고, "스키마 버전"이 변경되지 않은 경우, 문서는 변경되었다. "스키마 버전"도 변경된 경우, 문서는 변경되지 않은 것으로 간주될 수 있다.
도 2는 본 발명의 양태들에 따른 중대 변경 검색 경보들을 위한 시스템의 블록도를 나타낸다. 수집기 애플리케이션(210)은 다수의 저장소, 다양한 포맷 및 언어들로부터 문서들과 같은 검색 항목들을 수집하기 위한 범용 메커니즘을 제공한다. 수집기 애플리케이션(210)은 문서의 콘텐츠를, 문서들에 대한 풀 텍스트 인덱스를 구축하는 데 주로 적합한 통합 포맷으로 요약한다. 수집기 파이프라인(220)은 다수의 소비자에게 수집된 문서들에 대한 액세스를 제공한다. 통상적으로, 수집기 애플리케이션(210)은 다수의 소비자가 문서들을 한 번 페치하고 동일 데이터를 처리하는 것을 허가한다.
ARPI(아카이브 플러그인)는 수집기 파이프라인의 소비자이다. 문서가 수집기 애플리케이션(210)에 의해 크롤링될 때, 크롤링된 문서의 콘텐츠에 대해 (MD5 해시 함수와 같은) 디지털 시그니처가 계산된다. ARPI는 특성들의 나머지에 더하여 MD5 해시를 특성 저장소(SQL 데이터베이스(240)에 저장된 것 등)에 기입한다. 또한, ARPI는 (예를 들어) 문서 내의 모든 관련 특성의 체크섬일 수 있는 스키마 시그니처도 기입할 수 있다.
도 3은 본 발명의 양태들에 따른 시스템 검색 경보 쿼리 처리 메커니즘의 블록도를 나타낸다. 사용자가 검색 경보를 생성할 때, 결과적인 경보 쿼리는 검색 경보 처리기(310)에 저장된다. 이어서, 경보는 예를 들어 매일 또는 매주와 같이 (예를 들어, 소정의 시간 주기일 수 있는) 양자적으로 트리거된다. 경보가 트리거될 때, 검색 경보 처리기(310)는 경보의 사용자가 통지받아야 하는 임의의 새로운 결과들이 존재하는지를 검사하기 위해 검색 쿼리를 실행한다. 객체 모델(320)은 쿼리를 수신하고, 쿼리를 쿼리 프로세서(330)에 전달한다. 쿼리 프로세서(330)는 특성 저장소(340) 및 풀 텍스트 인덱스(350)에 쿼리 커맨드들을 발행한다. 후술하는 바와 같이, 쿼리는 예를 들어 검색 쿼리를 만족시키고 최종 통지 시간 이후에 추가된 임의의 새로운 문서들이 존재하는지, 또는 최종 통지 시간 이후에 변경된 임의의 관련 문서들이 존재하는지를 결정하는 데 사용된다.
최종 통지 시간 이후에 생성/변경되었고 순서대로 배열된 상위 10개의 결과를 페치하는 쿼리의 일례는 다음과 같다.
Figure 112008072689879-pct00001
전술한 바와 같이, 사용자들은 종종 경보 사용자와 관련없는 변경들을 갖는 문서들을 포함하는 검색 결과들을 제공받는다. 하나의 주요 이유는 디지털 시그니처(MD5 해시 등)가 스키마 세트의 임의의 추적 가능 특성에 대해 계산된다는 점이다. 관리자가 세트에 특성들을 추가하거나 세트로부터 특성들을 제거한 후, 아무 것도 행하지 않은 경우, 경보가 오류로 트리거될 수 있다.
풀 텍스트 인덱스가 생성될 때, 문서들에 대한 새로운 특성들이 계산되어 (APRI에 의해) 특성 저장소에 추가된다. 새로운 특성들은 검색 문서의 "발견 시간" 및 "변경 시간"과 같은 특성들을 설정하는 데 사용된다. 발견 시간은 크롤링을 수행하는 수집기 애플리케이션에 의해 문서가 발견된 최초 시간이다. 변경 시간은 이전 크롤링 이후 문서에 대한 임의의 중요한 변경이 언제 이루어졌는지를 나타낸다.
"ModificationTime" 특성을 결정하기 위하여, "UrlSigniture" 특성, ContentSigniture 특성, SchemaSigniture 특성 및 SchemaModificationTime 특성이 추적된다. 시스템에 의해 처리된 모든 문서 및 자원에 대한 특성들을 추적하기 위해 SQL 테이블 MSSAlertDocHistory가 사용될 수 있다.
예를 들어, UrlSigniture 특성은 URL의 MD5 해시이고, ContentSigniture는 경보들에 의해 추적되는 특성들에 관한 MD5 해시이고, SchemaSigniture 특성은 경보들에 의해 추적된 특성들의 세트의 체크섬(또는 MD5 해시를 포함하는 다른 적절한 디지털 시그니처)이며, SchemaModificationTime 특성은 경보들에 의해 추적된 특성들의 세트가 변경된 최종 시간이다. "ModificationTime" 특성은 문서가 최종 변경된 때를 상술하는 데에도 사용될 수 있다.
특성들의 세트에 대한 변경들이 이루어질 때, 변경들은 경보 통지 시스템의 수집 애플리케이션에 의해 검출된다. 경보 통지 시스템은 통상적으로, 실제로 변경된 것이 "관련 특성들"의 세트인 때 문서가 변경된 것을 사용자에게 통지하기로 결정하지 않는데, 이는 사용자가 통상적으로 관련 특성들의 세트에 단지 새로운 특성이 추가될 때 또는 관련 특성들의 세트로부터 단지 특성이 제거될 때 관심을 갖지 않기 때문이다.
도 4는 본 발명의 양태들에 따라 경보 통지를 트리거할지를 결정하기 위한 프로세스의 흐름도이다. 문서(410)가 발견되거나 변경되었는지를 판정하기 위하여, 프로세스(수집기 애플리케이션(210) 등)는 동작 420에서 문서(410)와 연관된 URL의 디지털 시그니처가 변경되었는지를 판정한다. 프로세스가 디지털 시그니처에 대한 매칭이 존재하지 않는 것으로 판정하는 경우, 프로세스는 동작 430으로 진행하며, 여기서 경보 시스템은 관심 있는 새로운 문서가 최근에 생성되었음을 보고한다. 프로세스가 URL 시그니처에 대한 매칭이 존재하는 것으로 판정하는 경우, 프로세스는 동작 440으로 진행한다.
2개의 문서가 동일 UrlSigniture 특성을 지시하는 경우에는 문제가 발생할 수 있다. 2개의 문서가 동일 UrlSigniture 특성을 지시하고, 풀 크롤링이 수행되고 있는 경우, 시스템은 실제로는 아무 것도 존재하지 않을 수 있는 때에도 관련 변경들이 존재하는 것으로 보고할 수 있다. 64 비트의 MD5 해시를 수행하고 저장하면, 본문(예를 들어, 문서의 텍스트의 본문)이 매우 큰 경우에도, 이러한 문제는 극히 일어나기 어렵다. 문제가 발생하는 것을 훨씬 더 가능성 없게 하기 위하여, UrlSigniture를 저장하는 것에 더하여 전체 URL이 저장될 수 있다.
동작 440에서, 프로세스는 문서(410)와 연관된 콘텐츠의 디지털 시그니처가 변경되었는지를 판정한다. 프로세스가 콘텐츠 시그니처에 대한 매칭이 존재하지 않는 것으로 판정하는 경우, 프로세스는 동작 450으로 진행한다. 프로세스가 콘텐츠 시그니처에 대한 매칭이 존재하는 것으로 판정하는 경우, 프로세스는 동작 470으로 진행한다.
동작 450에서, 프로세스는 문서(410)와 연관된 스키마가 변경되었는지를 판정한다. 프로세스가 스키마가 변경된 것으로 판정하는 경우, 스키마 시그니처 및 스키마 변경 시간의 특성들이 갱신된다. 프로세스가 스키마가 변경되지 않은 것으로 판정하는 경우, 문서(410)와 연관된 특성들은 통상적으로 갱신될 필요가 없다.
동작 470에서, 프로세스는 스키마 시그니처가 변경되었는지를 판정한다. 프로세스가 스키마가 변경된 것으로 판정하는 경우, 프로세스는 동작 490으로 진행하며, 여기서 스키마 시그니처 및 스키마 변경 시간의 특성들이 갱신된다(문서 변경 시간 특성은 통상적으로 갱신되지 않는다). 프로세스가 스키마가 변경되지 않은 것으로 판정하는 경우, 프로세스는 동작 480으로 진행한다. 동작 480에서, 관심 있는 문서가 최근에 변경되었다는 통지가 경보 시스템에 의해 전송된다. 또한, 변경 시간 특성이 갱신된다.
테이블 1은 기존 문서에 대한 변경들이 이루어질 때 만나는 일반적인 시나리오를 나타낸다.
테이블 1
T0 T1 T2 T3 T4 T5
경보 통지 문서 변경 #1 크롤링 문서 변경 #2 크롤링 경보 통지
콘텐츠 시그니처 X 크롤링이 발생할 때까지 효과 없음



X1 크롤링이 발생할 때까지 효과 없음



X2 변경 #1 및 변경 #2에 대해 통지



스키마 시그니처 Y Y Y
발견 시간 T T T
스키마 변경시간 T T T
변경 시간 T T2 T4
시간 T0에서, 경보 통지가 이루어지며, 기존 문서 특성들, 즉 콘텐츠 시그니처, 스키마 시그니처, 발견 시간, 스키마 변경 시간 및 변경 시간의 상태가 각각 X, Y, T, T 및 T로서 기록된다.
시간 T1에서, 문서에 대한 제1 변경이 이루어진다. 크롤링이 발생하지 않았으므로, 문서에 대한 변경은 문서 특성들에 영향을 미치지 않으며, 변경들은 시스템에 의해 통지되지 않는다.
시간 T2에서, 크롤링이 발생한다. 콘텐츠 시그니처의 변경이 검출되고, 콘텐츠 시그니처의 상태가 X1로 갱신된다. 변경 시간의 상태는 T2로 갱신된다. (이 시간에는 경보 통지가 행해지지 않는데, 이는 크롤링이 통상적으로 계속적으로 발생하지만, 테이블에 보여지는 바와 같이, 시간들 T0 및 T5에서 발생하는 경보 통지들과 같이, 경보 통지들은 소정의 간격으로 수행될 수 있기 때문이다.)
시간 T3에서, 문서에 대하여 제2 변경이 이루어진다. 문서에 대한 변경은 크롤링이 발생할 때까지 문서 특성들에 영향을 미치지 않는다.
시간 T4에서, 제2 크롤링이 발생한다. 콘텐츠 시그니처의 변경이 검출되고, 콘텐츠 시그니처의 상태가 X2로 갱신되며, 변경 시간이 T4로 갱신된다.
시간 T5에서, 경보 통지가 발생한다. 경보 통지 시스템의 사용자는 기존 문서에 대한 제1 및 제2 변경들을 통지받는다.
테이블 2는 기존 문서에 대해, 그리고 기존 문서와 연관된 스키마에 대해 언제 변경들이 이루어지는지를 나타낸다.
테이블 2
T0 T1 T2 T3 T4 T5
경보 통지 크롤링 스키마 변경 문서 변경 크롤링 경보 통지
콘텐츠 시그니처 X X 크롤링이 발생할 때까지 효과 없음



크롤링이 발생할 때까지 효과 없음 X2 변경이 스키마 변경인 것으로 간주되므로, 사용자에게 통지하지 않음



스키마 시그니처 Y Y Y1
발견 시간 T T T
스키마 변경시간 T T T4
변경 시간 T T T1
시간 T0에서, 경보 통지가 이루어지며, 기존 문서 특성들, 즉 콘텐츠 시그니처, 스키마 시그니처, 발견 시간, 스키마 변경 시간 및 변경 시간의 상태가 각각 X, Y, T, T 및 T로 기록된다.
시간 T1에서, 크롤링이 행해지며, 문서 또는 스키마에 대한 어떠한 변경도 검출되지 않았다.
시간 T2에서, 스키마 변경이 발생한다. (통상적으로 크롤링은 계속적으로 발생하지만, 테이블에 보이는 바와 같이, 시간 T0 및 T5에서 발생하는 경보 통지들과 같이, 경보 통지들은 소정의 간격으로 수행될 수 있으므로, 이 시간에는 경보 통지가 행해지지 않는다.)
시간 T3에서, 문서에 대한 변경이 행해진다. 문서에 대한 변경은 크롤링이 발생할 때까지 문서 특성들에 영향을 미치지 않는다.
시간 T4에서, 제2 크롤링이 발생한다. 콘텐츠 시그니처의 변경이 검출되고, 콘텐츠 시그니처의 상태가 X2로 갱신되며, 스키마 시그니처의 상태가 Y1로 갱신되고, 스키마 변경 시간이 T4로 갱신된다. 콘텐츠 시그니처의 상태가 X1에서 X2로 변경된 경우에도, 변경 시간의 상태는 갱신되지 않는데, 이는 스키마 변경 시간의 상태도 변경되었기 때문이다. 콘텐츠 시그니처에 대한 변경이 문서의 관심 있는 특성들 중 하나의 실제 변경에 기인해야 하는지, 또는 변경이 추적되고 있는 특성들의 세트의 변경에 기인해야 하는지가 반드시 명확하지는 않다.
시간 T5에서, 경보 통지가 발생한다. 경보 통지 시스템의 사용자는 기존 문서에 대한 변경을 통지받지 않는데, 이는 스키마가 변경되었기 때문이다.
대안 실시예에서, "관련 특성들"의 세트 내의 특성들의 리스트는 버전 정보를 이용하여 추적될 수 있다. 특성들의 세트에 대한 변경이 이루어질 때마다, 버전 레벨이 증가될 수 있다. 버전 레벨은 또한 (도 3과 관련하여 전술한 바와 같은) SQL 테이블 MSSAlertDocHistory에 저장될 수 있다. 크롤링이 발생하고, 현재 버전이 저장된 버전과 다를 때, 테이블 내의 버전 값 및 스키마 시그니처 특성의 값이 갱신되는 반면, 스키마 변경 시간은 갱신되지 않고 동일하게 유지된다. 따라서, 최종 경보 통지 후에 기존 문서에 대해 발생하는(그러나 관련 특성들의 세트에 대한 변경 전에 이루어진) 임의의 변경은 정상적으로 사용자에게 전송된다. 또한, 관련 특성들의 세트에 대해 변경들이 이루어진 후에 기존 문서에 대해 발생하는 임의의 변경은 사용자에게 전송되지 않는다.
대안 실시예에서는, 실제로 발생한 소정의 변경들이 사용자에게 보고되지 않을 수도 있다. 이러한 실시예는 부적절한 통지들의 초과에 유리하게 소정의 유효한 통지들을 이용하는 정책에 따라 이용될 수 있다.
다른 실시예에서, 기본 특성 시그니처가 소정의 특성들의 세트에 대해 이루어진 변경들을 추적하는 데 사용될 수 있다. 추적 가능 특성들의 버전이 SQL 테이블 MSSAlertDocHistory 내에 유지되는 버전과 매칭되지 않을 때, 기본 특성 시그니처를 참고할 수 있다. 기본 특성 시그니처가 매칭되지 않는 경우, 사용자는 변경을 통지받을 수 있다. 따라서, 사용자는 추적 가능 특성들에 대한 변경들에만 기초하여 행해지는 통지들에 비해 보다 적은 수의 통지들을 누락할 것이다.
또 다른 실시예에서, 크롤러가 실제로 언제 동일 문서들을 여러 번 재발견하였는지를 결정하는 것을 돕기 위해 URL 시그니처들이 추적될 수 있다. 예를 들어, 관리자가 크롤링 동안 사용되는 규칙들을 변경하거나 계정 증명서를 변경할 때, 많은 문서들은 크롤러에게 액세스되지 못하게 될 수 있다. 문제의 해결은 종종 많은 문서들이 먼저 인덱스로부터 삭제된 후에 다시 추가되게 한다. 이러한 문제를 처리하기 위하여, 카탈로그로부터의 콘텐츠 제거와 관련된 크롤러 거동에 관계없이 URL 시그니처들이 유지된다(삭제되지 않는다). 따라서, 유지된 URL 시그니처들은 콘텐츠의 재추가로부터 발생하는 허위 통지들을 피하기 위해 참고될 수 있다.
도 5는 검색 경보 결과들을 전송하기 위한 프로세스를 나타내는 흐름도이다.프로세스(500)의 동작 510에서, 제1 검색 엔진으로부터 제1 쿼리 결과가 수신되는데, 이 쿼리 결과는 자원들을 찾기 위한 제1 검색 값을 포함하는 제1 쿼리에 응답하여 얻어진다. 동작 520에서, 제1 검색 쿼리 결과들에 의해 식별되는 자원의 제1 관련 부분으로부터 제1 디지털 시그니처가 형성되는데, 제1 관련 부분은 제1 검색 값에 의해 식별되는 콘텐츠를 포함한다. 동작 530에서, 제2 검색 엔진으로부터 제2 쿼리 결과가 수신되는데, 이 쿼리 결과는 제1 검색 쿼리를 포함하는 제2 쿼리에 응답하여 얻어지며, 제2 검색 엔진은 제1 검색 엔진과 동일하거나 상이하다. 동작 540에서, 제2 검색 쿼리 결과들에 의해 식별되는 자원의 제2 관련 부분으로부터 제2 디지털 시그니처가 형성되는데, 제2 관련 부분은 제1 검색 값에 의해 식별되는 콘텐츠를 포함한다. 동작 550에서, 제1 및 제2 디지털 시그니처들의 비교가 상이한 것에 응답하여 사용자에게 통지가 전송된다.
위의 명세서, 예들 및 데이터는 본 발명의 구성의 제조 및 이용의 완전한 설명을 제공한다. 본 발명의 많은 실시예가 본 발명의 사상 및 범위로부터 벗어나지 않고 이루어질 수 있으므로, 본 발명은 아래에 첨부된 청구범위에 존재한다.

Claims (20)

  1. 컴퓨터로 구현되며, 검색 경보 결과들(search alert results)을 전송하는 방법으로서,
    검색된 자원들 내에서 추적될 특성들의 세트로 이루어진 스키마(schema)를 설정(establishing)하는 단계- 상기 특성들의 세트는 자원이 변경되는 때를 결정하는데 사용되는 특성들의 서브세트이고, 상기 스키마는 상기 추적될 특성들의 세트가 변경되는 경우 변경되며, 상기 특성들은 문서에 대한 검색의 발견 시간 및 변경 시간을 설정하고, 상기 발견 시간은 크롤링(crawl)을 수행하는 수집기(gatherer) 애플리케이션에 의해 문서가 발견된 최초 시간이고, 상기 변경 시간은 적어도 콘텐츠 시그니처 특성과 URL 시그너처 특성과 스키마 시그너처 특성을 사용하여 결정됨 -;
    제1 검색 엔진으로부터 제1 쿼리 결과를 수신하는 단계- 상기 쿼리 결과는 자원들을 찾기 위한 제1 검색 값을 포함하는 제1 쿼리에 응답하여 얻어짐-;
    상기 제1 검색 쿼리 결과 및 상기 추적될 특성들의 세트에 의해 식별되는 자원의 제1 관련 부분의 제1 디지털 시그니처를 형성하는 단계- 상기 제1 관련 부분은 상기 제1 검색 값에 의해 식별되는 콘텐츠를 포함함-;
    제2 검색 엔진으로부터 제2 쿼리 결과를 수신하는 단계- 상기 제2 쿼리 결과는 상기 제1 검색 쿼리를 포함하는 제2 쿼리에 응답하여 얻어지며, 상기 제2 검색 엔진은 상기 제1 검색 엔진과 동일하거나 상이함-;
    상기 제2 검색 쿼리 결과 및 상기 추적될 특성들의 세트에 의해 식별되는 자원의 제2 관련 부분의 제2 디지털 시그니처를 형성하는 단계- 상기 제2 관련 부분은 상기 제1 검색 값에 의해 식별되는 콘텐츠를 포함함-;
    상기 제1 디지털 시그니처와 상기 제2 디지털 시그니처가 상이하다는 비교 결과 및 상기 제1 디지털 시그너처의 형성 단계와 상기 제2 디지털 시그너처의 형성 단계 간에 상기 스키마가 변경되지 않았다는 판정에 응답하여 사용자에게 통지를 전송하는 단계;
    상기 제1 검색 쿼리 결과에 의해 식별되는 자원의 제3 관련 부분의 제3 디지털 시그니처를 형성하는 단계- 상기 제3 관련 부분은 제2 검색 값에 의해 식별되는 콘텐츠를 포함함-;
    상기 제2 검색 쿼리 결과에 의해 식별되는 자원의 제4 관련 부분의 제4 디지털 시그니처를 형성하는 단계- 상기 제4 관련 부분은 상기 제1 디지털 시그너처와 상기 제2 디지털 시그너처를 비교하는 상기 제2 검색 값에 의해 식별되는 콘텐츠를 포함함-; 및
    상기 제3 디지털 시그니처와 상기 제4 디지털 시그니처가 상이하다는 비교 결과에 응답하여 사용자에게 통지를 전송하는 단계
    를 포함하는 검색 경보 결과들 전송 방법.
  2. 제1항에 있어서,
    상기 제1 검색 값은 관련 특성들의 세트를 포함하는
    검색 경보 결과들 전송 방법.
  3. 제2항에 있어서,
    상기 제1 검색 쿼리 결과에 의해 식별되는 자원의 URL의 디지털 시그니처를 형성하는 단계를 더 포함하는
    검색 경보 결과들 전송 방법.
  4. 제1항에 있어서,
    상기 제1 및 제2 검색 엔진들은 크롤러(crawler)들인
    검색 경보 결과들 전송 방법.
  5. 제1항에 있어서,
    상기 통지는 사전결정된 시간 간격으로 상기 사용자에게 전송되는
    검색 경보 결과들 전송 방법.
  6. 제1항에 있어서,
    상기 제1 검색 쿼리 결과에 의해 식별되는 자원의 URL의 디지털 시그니처를 형성하는 단계를 더 포함하는
    검색 경보 결과들 전송 방법.
  7. 제1항에 있어서,
    상기 제1 검색 쿼리 결과에 의해 식별되는 자원의 스키마의 제5 디지털 시그니처를 형성하는 단계; 및
    상기 제2 검색 쿼리 결과에 의해 식별되는 자원의 스키마의 제6 디지털 시그니처를 형성하는 단계
    를 더 포함하는 검색 경보 결과들 전송 방법.
  8. 제7항에 있어서,
    각각의 상기 통지는 상기 제5 디지털 시그니처와 상기 제6 디지털 시그니처가 상이하다는 비교 결과에 응답하여 상기 사용자에게 전송되지 않는
    검색 경보 결과들 전송 방법.
  9. 제1항에 있어서,
    상기 제1 검색 쿼리 결과에 의해 식별되는 자원의 풀 텍스트 인덱스를 형성하는 단계를 더 포함하는
    검색 경보 결과들 전송 방법.
  10. 검색 경보 결과들을 전송하는 시스템으로서,
    프로세서 및 컴퓨터 판독가능 저장 메모리;
    상기 컴퓨터 판독가능 저장 메모리에 저장되고 상기 프로세서에서 실행되는 운영 환경;
    문서들을 검색하기 위한 검색 값들을 포함하는 경보 쿼리들을 저장하고 실행하는 검색 경보 처리기;
    경보 쿼리에 의해 식별되는 문서들로부터의 검색 값의 특성들의 특성 세트들을 저장하는 특성 저장소- 상기 특성들의 세트는 문서가 변경되는 때를 결정하는 특성들의 서브세트이고, 상기 특성들의 세트는 스키마를 정의하고, 상기 스키마는 상기 특성들의 세트가 변경되는 경우 변경되며, 상기 특성들은 문서에 대한 검색의 발견 시간 및 변경 시간을 설정하고, 상기 발견 시간은 크롤링을 수행하는 수집기 애플리케이션에 의해 문서가 발견된 최초 시간이고, 상기 변경 시간은 적어도 콘텐츠 시그니처 특성과 URL 시그너처 특성과 스키마 시그너처 특성을 사용하여 결정됨 -; 및
    상기 특성들의 세트가 변경되는 때를 검출하는 수집기- 상기 수집기는 제1 시간에 검색 값에 의해 식별되는 문서 내의 검색 값의 특성들의 제1 특성 세트와, 제2 시간에 상기 검색 값에 의해 식별되는 상기 문서 내의 검색 값의 특성들의 제2 특성 세트를 비교하여 상기 변경을 검출하고, 상기 수집기는 상기 스키마가 상기 제1 시간과 상기 제2 시간 간에 변경되지 않았을 경우 상기 검출된 변경과 연관된 문서를 사용자에게 통지함 -
    를 포함하는 검색 경보 결과들 전송 시스템.
  11. 제10항에 있어서,
    상기 문서들은 매체 콘텐츠를 포함하는
    검색 경보 결과들 전송 시스템.
  12. 제10항에 있어서,
    상기 수집기는 상기 제1 시간에 상기 검색 값에 의해 식별되는 상기 문서의 풀 텍스트 인덱스를 구축하도록 더 구성되는
    검색 경보 결과들 전송 시스템.
  13. 제10항에 있어서,
    상기 URL 시그너처는 상기 문서에 대해 URL의 MD5 해시를 사용하는
    검색 경보 결과들 전송 시스템.
  14. 제13항에 있어서,
    상기 스키마 시그너처 특성은 크롤링이 수행되는 경우 업데이트되는
    검색 경보 결과들 전송 시스템.
  15. 제13항에 있어서,
    상기 특성 세트는 상기 제1 시간에 상기 검색 값에 의해 식별되는 문서에 대한 스키마의 스키마 변경 시간에 대한 특성을 포함하고, 상기 수집기는 상기 스키마 변경 시간 이후인 변경 시간을 갖는 문서 변경들을 사용자들에게 통지하도록 더 구성되는
    검색 경보 결과들 전송 시스템.
  16. 제1 및 제2 시간에 경보 쿼리에 의해 식별되는 문서에 대한 검색 값의 특성들의 특성 세트를 저장- 상기 저장된 특성 세트들은 상기 검색 값을 포함하는 상기 식별된 문서의 부분들의 디지털 시그니처들이고, 상기 특성 세트는 경보에 의해 식별된 문서가 변경되는 때를 결정하는 특성들의 서브세트이고, 상기 특성들은 문서에 대한 검색의 발견 시간 및 변경 시간을 설정하고, 상기 발견 시간은 크롤링을 수행하는 수집기 애플리케이션에 의해 문서가 발견된 최초 시간이고, 상기 변경 시간은 적어도 콘텐츠 시그니처 특성과 URL 시그너처 특성과 스키마 시그너처 특성을 사용하여 결정됨 -하고;
    상기 제1 시간으로부터의 특성 세트와 상기 제2 시간으로부터의 특성 세트를 비교하며; 및
    상기 문서와 연관된 스키마 버전이 변경되지 않았을 경우 상기 제1 시간으로부터의 특성 세트가 상기 제2 시간으로부터의 특성 세트와 상이한 것에 응답하여 사용자에게 통지를 전송- 상기 스키마 버전은 자원이 추적되는지 여부를 판정하기 위해 모니터링되는 특성들의 세트를 식별하고, 상기 스키마 버전은 상기 특성들의 세트에 제1 특성이 추가되고 상기 특성들의 세트로부터 제2 특성이 제거되는 경우 변경됨 -하기 위한
    컴퓨터 실행 가능 명령어들을 포함하는 컴퓨터 판독가능 저장 메모리.
  17. 제16항에 있어서,
    상기 URL 시그너처 특성은 상기 제1 시간에 상기 경보 쿼리에 의해 식별되는 문서와 연관된 URL의 디지털 시그니처를 포함하는
    컴퓨터 판독가능 저장 메모리.
  18. 제16항에 있어서,
    상기 스키마 시그너처 특성은 상기 제1 시간에 상기 경보 쿼리에 의해 식별되는 문서와 연관된 스키마의 디지털 시그니처를 포함하는
    컴퓨터 판독가능 저장 메모리.
  19. 제16항에 있어서,
    상기 저장된 특성 세트들의 리스트들의 버전들을 추적하기 위한 컴퓨터 실행 가능 명령어들을 더 포함하는
    컴퓨터 판독가능 저장 메모리.
  20. 삭제
KR1020087025614A 2006-04-26 2007-03-23 검색 경보 결과들 전송 방법, 검색 경보 결과들 전송 시스템, 및 컴퓨터 판독가능 저장 메모리 KR101312834B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/412,725 2006-04-26
US11/412,725 US8108388B2 (en) 2006-04-26 2006-04-26 Significant change search alerts
PCT/US2007/007230 WO2007126698A1 (en) 2006-04-26 2007-03-23 Significant change search alerts

Publications (2)

Publication Number Publication Date
KR20090005018A KR20090005018A (ko) 2009-01-12
KR101312834B1 true KR101312834B1 (ko) 2013-09-27

Family

ID=38649552

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087025614A KR101312834B1 (ko) 2006-04-26 2007-03-23 검색 경보 결과들 전송 방법, 검색 경보 결과들 전송 시스템, 및 컴퓨터 판독가능 저장 메모리

Country Status (6)

Country Link
US (1) US8108388B2 (ko)
EP (1) EP2024879B1 (ko)
JP (1) JP5265523B2 (ko)
KR (1) KR101312834B1 (ko)
RU (1) RU2436152C2 (ko)
WO (1) WO2007126698A1 (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8122360B2 (en) * 2007-06-27 2012-02-21 Kosmix Corporation Automatic selection of user-oriented web content
US20090043867A1 (en) * 2007-08-06 2009-02-12 Apple Inc. Synching data
CN101393551B (zh) * 2007-09-17 2011-03-23 鸿富锦精密工业(深圳)有限公司 专利全文检索的索引建立系统及方法
US7747784B2 (en) * 2008-03-04 2010-06-29 Apple Inc. Data synchronization protocol
US7991740B2 (en) * 2008-03-04 2011-08-02 Apple Inc. Synchronization server process
US8112537B2 (en) * 2008-09-29 2012-02-07 Apple Inc. Trickle sync protocol
US8576049B2 (en) * 2009-09-23 2013-11-05 International Business Machines Corporation Document authentication and identification
US8976003B2 (en) * 2009-09-23 2015-03-10 International Business Machines Corporation Large-scale document authentication and identification system
US8751516B1 (en) * 2009-12-22 2014-06-10 Douglas Tak-Lai Wong Landing page search results
US8949184B2 (en) * 2010-04-26 2015-02-03 Microsoft Technology Licensing, Llc Data collector
US20160147830A1 (en) * 2014-07-09 2016-05-26 Splunk Inc. Managing datasets produced by alert-triggering search queries
US10027744B2 (en) * 2016-04-26 2018-07-17 Servicenow, Inc. Deployment of a network resource based on a containment structure
US11822561B1 (en) 2020-09-08 2023-11-21 Ipcapital Group, Inc System and method for optimizing evidence of use analyses
US11941355B2 (en) * 2022-06-09 2024-03-26 Google Llc Using operational transforms to perform operations on parallel copies of a document model

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060031624A (ko) * 2003-06-13 2006-04-12 야후! 인크. 경보 전달 아키텍처를 위한 방법 및 시스템

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717924A (en) * 1995-07-07 1998-02-10 Wall Data Incorporated Method and apparatus for modifying existing relational database schemas to reflect changes made in a corresponding object model
US5721903A (en) * 1995-10-12 1998-02-24 Ncr Corporation System and method for generating reports from a computer database
JPH10198614A (ja) * 1997-01-09 1998-07-31 Nec Corp ハイパーテキスト文書更新検知方法及びクライアント
US5898836A (en) * 1997-01-14 1999-04-27 Netmind Services, Inc. Change-detection tool indicating degree and location of change of internet documents by comparison of cyclic-redundancy-check(CRC) signatures
US6067541A (en) * 1997-09-17 2000-05-23 Microsoft Corporation Monitoring document changes in a file system of documents with the document change information stored in a persistent log
US6226630B1 (en) * 1998-07-22 2001-05-01 Compaq Computer Corporation Method and apparatus for filtering incoming information using a search engine and stored queries defining user folders
JP2000222273A (ja) * 1999-02-03 2000-08-11 Nec Software Shikoku Ltd ドキュメントダウンロードシステム
US6493703B1 (en) * 1999-05-11 2002-12-10 Prophet Financial Systems System and method for implementing intelligent online community message board
US6477565B1 (en) * 1999-06-01 2002-11-05 Yodlee.Com, Inc. Method and apparatus for restructuring of personalized data for transmission from a data network to connected and portable network appliances
US6256773B1 (en) * 1999-08-31 2001-07-03 Accenture Llp System, method and article of manufacture for configuration management in a development architecture framework
US6516337B1 (en) * 1999-10-14 2003-02-04 Arcessa, Inc. Sending to a central indexing site meta data or signatures from objects on a computer network
US6842774B1 (en) * 2000-03-24 2005-01-11 Robert L. Piccioni Method and system for situation tracking and notification
JP2002197100A (ja) * 2000-12-27 2002-07-12 Nec Corp 検索サービスシステムと方法及び記録媒体並びに情報仲介方法
US20020198946A1 (en) * 2001-01-16 2002-12-26 Yi-Min Wang Personal centralized alert delivery systems and methds of use
US20040030741A1 (en) * 2001-04-02 2004-02-12 Wolton Richard Ernest Method and apparatus for search, visual navigation, analysis and retrieval of information from networks with remote notification and content delivery
US6829606B2 (en) 2002-02-14 2004-12-07 Infoglide Software Corporation Similarity search engine for use with relational databases
US7970832B2 (en) 2002-11-20 2011-06-28 Return Path, Inc. Electronic message delivery with estimation approaches and complaint, bond, and statistics panels
JP2004280539A (ja) * 2003-03-17 2004-10-07 Canon Inc 電子文書の更新通知システム
US20040243555A1 (en) * 2003-05-30 2004-12-02 Oracle International Corp. Methods and systems for optimizing queries through dynamic and autonomous database schema analysis
US20040249848A1 (en) * 2003-06-06 2004-12-09 Carlbom Ingrid Birgitta Method and apparatus for intelligent and automatic alert management using multimedia database system
JP2005031867A (ja) * 2003-07-09 2005-02-03 Fujitsu Ltd ウエブ情報収集装置及びウエブ情報収集方法
US20050033777A1 (en) * 2003-08-04 2005-02-10 Moraes Mark A. Tracking, recording and organizing changes to data in computer systems
US7187988B2 (en) * 2003-09-12 2007-03-06 Taiwan Semiconductor Manufacturing Company, Ltd. Web service and method for customers to define their own alert for real-time production status
US7774242B2 (en) * 2004-03-17 2010-08-10 Sap Ag Proximity sensing
US7627724B2 (en) * 2004-06-21 2009-12-01 Microsoft Corporation Persistent, real-time determination of the freshness of changeable data associated with a container
US7555532B2 (en) * 2004-09-23 2009-06-30 Orbital Data Corporation Advanced content and data distribution techniques
US7644107B2 (en) * 2004-09-30 2010-01-05 Microsoft Corporation System and method for batched indexing of network documents
US7933900B2 (en) * 2005-10-23 2011-04-26 Google Inc. Search over structured data
US7925649B2 (en) * 2005-12-30 2011-04-12 Google Inc. Method, system, and graphical user interface for alerting a computer user to new results for a prior search

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060031624A (ko) * 2003-06-13 2006-04-12 야후! 인크. 경보 전달 아키텍처를 위한 방법 및 시스템

Also Published As

Publication number Publication date
US20070255744A1 (en) 2007-11-01
EP2024879A4 (en) 2009-11-04
JP5265523B2 (ja) 2013-08-14
KR20090005018A (ko) 2009-01-12
EP2024879B1 (en) 2020-06-10
US8108388B2 (en) 2012-01-31
RU2008142357A (ru) 2010-04-27
WO2007126698A1 (en) 2007-11-08
RU2436152C2 (ru) 2011-12-10
EP2024879A1 (en) 2009-02-18
JP2009535691A (ja) 2009-10-01

Similar Documents

Publication Publication Date Title
KR101312834B1 (ko) 검색 경보 결과들 전송 방법, 검색 경보 결과들 전송 시스템, 및 컴퓨터 판독가능 저장 메모리
US20220197954A1 (en) System and methods for metadata management in content addressable storage
US10942982B2 (en) Employing organizational context within a collaborative tagging system
US20200356529A1 (en) Information Source Agent Systems and Methods for Distributed Data Storage and Management Using Content Signatures
CN108446407B (zh) 基于区块链的数据库审计方法和装置
CN110168523B (zh) 改变监测跨图查询
US7797335B2 (en) Creation and persistence of action metadata
AU2012238282B2 (en) Cross-ACL Multi-Master Replication
KR20200093556A (ko) 클라이언트 동기화 서비스에 대한 로컬 트리의 업데이트
US7571158B2 (en) Updating content index for content searches on networks
US20120131001A1 (en) Methods and computer program products for generating search results using file identicality
JP2006107446A (ja) ネットワーク・ドキュメントのバッチ索引付けのためのシステムおよび方法
WO2014028300A1 (en) Managing cross-correlated data
JP5542859B2 (ja) ログ管理装置、ログ蓄積方法、ログ検索方法、およびプログラム
US8671108B2 (en) Methods and systems for detecting website orphan content
US9734195B1 (en) Automated data flow tracking
US11126592B2 (en) Rapid indexing of document tags
US20070078800A1 (en) System and method of building an atomic view of a filesystem that lacks support for atomic operations
CN116881870B (zh) 一种基于科研成果分析的数据溯源方法和系统
CN117667838A (zh) 一种文件记录管理方法、装置及电子设备
CN111400556A (zh) 数据查询方法及装置、计算机设备、存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160818

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170818

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180903

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190829

Year of fee payment: 7