KR20080031928A

KR20080031928A - 태그를 분석하여 관련 문서를 찾기 위한 시스템 및 방법

Info

Publication number: KR20080031928A
Application number: KR1020087002629A
Authority: KR
Inventors: 윤샨 루; 마이클 탄네
Original assignee: 윙크 테크놀로지스 인코포레이티드
Priority date: 2005-08-03
Filing date: 2006-08-03
Publication date: 2008-04-11
Also published as: KR101361182B1; CA2617831A1; US10963522B2; JP5431727B2; WO2007019311A2; US20170357723A1; WO2007019311A3; JP2009503751A; EP1924903A2; CA2617831C; US20070185858A1; US9715542B2; US20200311155A1; EP1924903A4

Abstract

검색 질의에 대한 객체의 관련성을 결정하는 방법은, 다수의 태그를 다수의 객체에 연관시키는 단계, 상기 다수의 객체에 북마크를 기록하는 단계, 또는 위 2가지 단계 모두, 및 다수의 객체와 검색 질의 각각에 대한 관련성 점수를 결정하는 단계를 포함한다. 이 방법의 일 실시예는 풀-텍스트 관련성 알고리즘을 태그 관련성 알고리즘과 결합시킨다. 다른 실시예는 통계상 분류 또는 순위 회구 알고리즘과 같은 통계상 관련성 알고리즘을 포함한다. 유저가 검색 질의를 실행할 때, 그 객체를 포함하는 결과 리스트가, 관련성 점수에 기초하여 조직된 그 객체와 함께 반환된다. 객체는, 예컨대 먼저 가장 높은 관련성 점수를 지닌 것을 열거하고, 그것들을 그것들의 관련성을 표시한 것으로 표시함으로써 조직된다. 바람직하게, 태그-객체 쌍에 대한 관련성 점수는, 그 태그에서의 기간이 그 객체와 연관된 횟수, 그 객체와 연관된 태그의 개수, 그 태그가 다수의 객체와 연관된 횟수, 그 태그에서의 기간을 포함하는 태그-객체 쌍의 개수, 그 객체에 대한 기준을 포함하는 태그-객체 쌍의 개수, 또는 이들의 임의의 조합에 기초한다.

Description

태그를 분석하여 관련 문서를 찾기 위한 시스템 및 방법{SYSTEMS FOR AND METHODS OF FINDING RELEVANT DOCUMENTS BY ANALYZING TAGS}

본 출원은 본 명세서에 그 전문이 참조로 통합되어 있고, 2005년 8월 3일 "Techniques for Finding Relevant Documents Using Analysis of Tags"라는 제목으로 출원되고 공동 계류중인 미국 가출원 일련 번호 60/705,704호의 35 U.S.C. §119(e) 하의 우선권을 주장한다.

본 발명은 문서를 검색하는 것에 관한 것이다. 더 구체적으로는, 본 발명은 검색 결과의 품질 또는 관련성을 개선하기 위해, 사람들에 의해 생성된 태그를 분석함으로써, 인터넷에서 정보를 검색하는 시스템 및 방법에 관한 것이다.

인터넷 검색 엔진은 인터넷에 포함되어 있는 광범위한 정보 중에서 바라는 정보의 위치를 찾도록 설계된다. 유저(user)는 검색 용어를 포함하는 질물을 입력하여 찾고자 하는 정보를 서술한다. 검색 엔진은 유저가 찾는 정보에 가장 가깝게 관련되는 웹(web) 페이지를 식별한 목적을 지닌 다양한 관련성 계산을 사용하여 웹 페이지의 색인과 그 검색 용어를 매칭시킨다. 이후 검색 엔진은 이들 웹 페이지에 하이퍼링크(hyperlink)의 순위가 정해진 리스트를 반환하는데, 이 경우 리스트의 상부에 더 가까운 가장 관련성이 있는 것으로 생각된 페이지에 링크된다.

검색 엔진의 목적은 주어진 질의에 대한 가장 관련성 있는 웹 페이지를 전달하는 것이다. 검색 엔진은, 예컨대 웹 페이지 사이의 하이퍼링크에 관련된 정보를 고려하여 문서 내의 검색 용어의 존재, 밀도, 및 근접성과 같은 각 페이지 내에 포함된 정보 또는 결과나 웹 페이지를 클릭(clicking on), 브라우징(browsing) 또는 등급을 매기는 것(rating)과 같은 유저의 행동을 고려함으로써, 다양한 기술을 사용하여 웹 페이지의 관련성을 결정한다. 이들 기술은 최상의 결과를 달성하기 위해, 개별적으로 적용되거나 다양하게 결합되어 함께 적용될 수 있다.

어느 웹 페이지가 가장 관련성이 있는지를 결정하는 프로세스는 매우 어려운데, 이는 인터넷 상의 웹 페이지의 개수가 매우 크고 늘어나고 있으며, 종종 명목상 유저의 질의를 충족시키는 많은 수의 웹 페이지가 존재하기 때문이다. 또한, 대부분의 유저는 형식이 잘 갖추어진 질의를 생성하고 입력하는 프로세스에서 정교하지 못하기 때문에 유저가 찾는 정보의 타입이 무엇인지가 애매모호할 경우가 있다. 그러므로, 질의에서의 단어들과 문서에서의 단어들을 비교함으로써, 어느 문서가 그 질의에 가장 관련성이 있는지를 결정하는 것은, 정확도가 제한된 결과를 제공한다.

유저가 인터넷을 브라우즈 또는 검색할 때, 웹 페이지, 이미지, 토픽, 웹로그(Weblog){"블로그(blog)라고도 한다}과 같은 다양한 객체 또는 다른 객체를 그 객체에 대한 기준(reference)을 기록함으로써, "북마크(bookmark)"할 수 있다. 이들 북마크는 유저가 객체와 연관시키는 하나 이상의 조건으로 이루어지는 하나 이상의 태그(tag), 그 객체에 대한 하이퍼링크(hyperlink)(URL: Uniform Resource Locator), 그 관계를 기록하기 위한 메커니즘, 및 잠재적인 다른 정보를 포함할 수 있다. 이들 북마크는 유저가 그 객체와 임의의 태그를 다시 불러 그 북마크된 객체가 무엇에 대한 것인지를 상기하거나 다른 유저와 의사 교환을 하는 것을 돕는다. 예컨대, 유저가 지붕 위에 올리는 태양 전력 패널을 서술하는 웹 페이지를 방문하면, 유저는 "태양 전력(solar power)"이라는 용어를 사용하는 웹 페이지를 북마크하고 그 웹 페이지와 태그를 연관시킨다. 유저는 주(State) 태양 전력 리베이트(rebate) 프로그램에 대한 또다른 웹 페이지와, "태양 전력"이라는 용어를 사용하는 동일한 태그를 연관시킬 수도 있다. 그 결과, "태양 전력"이라는 용어를 지닌 태그는 2가지 웹 페이지 모두와 연관된다.

서버 애플리케이션, 북마크 툴바(toolbar)에서의 작은 애플릿(applet), 브라우저 플러그-인(plug-in) 또는 익스텐션(extention), 클라이언트 애플리케이션 또는 일부 다른 애플리케이션을 사용하는 것과 같이, 유저가 태그를 입력할 수 있는 여러 방식이 존재한다. 일단 태그가 입력되면, 그러한 태그와 연관된 이들 웹 페이지를 디스플레이하기 위해, 이들 태그에 대해 유저가 검색하는 것을 허용하는 것이 흔한 일이다. 지금까지로서는, 유저가 그들 자체의 태그를 검색하거나 다른 사람들의 태그를 검색하는 것을 허용하는 서비스가 생성되었다.

북마크는 유저가 웹 페이지와 같은 객체를 평가한다는 어떤 종류의 표시를 제공하고, 태그는 부가적으로 유저가 그 객체와 일정한 용어 또는 용어들을 연관시킨다는 어떤 종류의 표시를 제공한다. 이 정보는 웹 페이지가 검색 엔진으로부터의 질의의 결과로서 디스플레이되어야 하는지 여부를 결정하는 데 있어 잠재적으로 귀 중한 것인데, 이는 그것이 그 웹 페이지에 대한 실제 사람의 관심도와 특별한 주제와의 연관성의 표시이기 때문이다.

어느 웹 페이지, 이미지, 블로그 또는 다른 객체가 유저의 질의에 관련되는지를 결정하는 데 있어, 다양한 웹 페이지, 이미지, 블로그 또는 다른 객체와 연관된 태그를 고려하는 검색 엔진을 가지는 것이 바람직할 수 있다.

본 발명의 실시예는 검색 질의에 응답하여 유저에게 객체(결과 리스트)의 리스트를 제공한다. 이 결과 리스트는 그 질의에 대한 각 객체의 관련성에 기초하여 조직된다. 바람직하게, 관련성은 그 객체를 태그하는 것(tagging), 그 객체를 북마크하는 것(bookmarking), 또는 그 2가지 모두, 또는 어떤 검색에 대한 객체의 관련성 또는 값을 표시하기 위한 임의의 다른 유저의 액션(action)에 기초한다.

본 발명의 일 양상에서, 어떤 질의에 다수의 객체의 관련성을 결정하는 방법은, 객체들에 대한 "북마크" 참조를 기록하는 단계 및/또는 이들 객체와 다수의 태그를 연관시키는 단계, 및 임의의 주어진 질의에 대한 상기 다수의 객체의 각 객체에 대한 관련성 점수를 결정하는 단계를 포함한다. 이 방법은 검색 질의에 응답하여 반환된 결과 리스트 내에서 디스플레이하기 위해 나중에 객체들을 조직하기 위해 사용된다. 객체들은 웹 페이지로의 하이퍼링크 또는 하이퍼링크의 그룹, 텍스트, 이미지, 사진, 태그, 태그의 그룹, 주제 영역, 개념, 오디오 파일, 비디오 파일, 소프트웨어, 또는 이들의 임의의 조합을 포함한다.

다수의 태그로부터의 각 태그는 하나 이상의 용어를 포함한다. 이 방법은 또한 하나 이상의 용어로부터의 각 용어를 한 객체와 연관시켜 하나 이상의 대응하는 용어-객체 쌍을 한정하고, 그 용어와 그 객체 사이의 관련성의 정도를 표시하는 용어 점수를 각각의 용어-객체 쌍에 대해 결정하는 단계를 포함한다. 대안적으로, 또는 부가적으로, 이 방법은 또한 객체를 북마크하는 단계를 포함한다.

바람직하게, 태그-객체 쌍에 대한 관련성 점수는 그 태그에서의 각 태그에 대한 용어-객체 쌍에 대한 용어 점수를 결합함으로써 결정된다. 용어 점수는 그것들을 합하거나 그것들에 가중치를 부여하여 가중치가 부여된 용어 점수를 합산함으로써 결합될 수 있다.

일 실시예에서, 태그-객체 쌍에 대한 관련성 점수는 태그에서의 용어가 그 객체와 연관되는 횟수, 그 객체와 연관된 태그의 수, 태그가 다수의 객체와 연관되는 횟수, 또는 이들의 임의의 조합으로부터 결정된다. 태그-객체 쌍에 대한 관련성 점수는 태그에서의 용어를 포함하는 태그-객체 쌍의 수, 그 객체에 대한 기준을 포함하는 태그-객체 쌍의 수 또는 이들 두 가지 모두로부터 결정될 수 있다.

또다른 실시예에서, 이 방법은 또한 제 1 유저에 의해 다수의 객체로부터 하나의 객체와 태그를 연관시키는 단계, 제 2 유저에 의해 그 태그에서의 하나 이상의 용어를 포함하는 검색 질의를 수행하는 단계, 그 관련성 점수에 기초한 결과 리스트에서 다수의 객체를 조직화하는 단계, 이를 통해 조직된 결과 리스트를 한정하는 단계, 및 제 2 유저에게 조직된 결과 리스트를 반환하는 단계를 포함한다. 한 객체에 대한 관련성 점수와 검색 질의는 객체에 존재하거나 그것과 연관된 검색 질의 용어 각각에 대한 관련성 점수에 대응한다. 대안적으로, 또는 부가적으로, 다수의 태그-객체 쌍으로부터의 태그-객체 쌍에 대한 관련성 점수는 제 1 유저가 다수의 객체 중 어느 하나와 연관된 태그의 개수, 제 1 유저와 제 2 유저가 태그와 연관된 객체의 개수, 객체의 등급을 매기는 것, 객체를 북마크하는 것 또는 이들의 임의의 조합으로부터 결정된다.

또다른 실시예에서, 태그-객체 쌍에 대한 관련성 점수는 제 1 유저와 제 2 유저 중 선택된 한 사람, 또는 둘 다에 관련성 등급 매김으로부터 결정된다. 관련성 등급 매김은 선택된 유저가 객체와 연관된 태그에 대한 등급 매김, 북마킹, 태깅, 또는 제 1 유저와 제 2 유저에 대한 검색 활동성 사이의 유사성 계측값, 제 1 유저와 제 2 유저 사이의 관계 계측값, 또는 이들의 임의의 조합으로부터 결정된다.

다수의 객체는 그것들이 관련성 점수(예컨대, 가장 높은 등급이 먼저 열거된다)에 기초하도록 지시하거나 그래픽 요소로 다수의 객체 중 적어도 하나를 마킹함으로써 조직될 수 있다.

태그 또는 북마크 또는 랭킹은 태그를 유저에 제시된 필드에 입력하고, 그 태그의 등급을 매기며, 그 객체로의 링크를 차단(그로 인해 "네거티브" 연관성을 만든다)하고, 그 태그를 선택하며, 북마크를 검사하거나 그 태그를 사용하여 그 객체에 대한 검색을 수행함으로써, 객체와 연관될 수 있다. 일 실시예에서, 태그 크롤러(crawler)는 적어도 하나의 다수의 태그를 적어도 하나의 다수의 객체와 연관시킨다.

본 발명의 제 2 양상에서는, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법은, 다수의 객체와 연관된 다수의 태그를 태그 데이터베이스에 저장하는 단계와, 다수의 태그 및 다수의 객체 사이의 관련성 점수를 색인 데이터베이스에 저장하는 단계를 포함한다. 이 관련성 점수는 조직화된 결과 리스트에서 다수의 문서를 조직화하기 위해 사용된다.

다수의 태그는 그것을 형성하는 용어를 저장함으로써, 태그 데이터베이스에 저장된다. 관련성 점수는 용어와 객체 사이의 관련성을 표시한다. 이 방법은 또한 색인 데이터베이스에 다수의 색인을 저장하는 단계를 포함한다. 각 색인 엔트리는 다수의 용어로부터의 용어, 다수의 객체로부터의 대응하는 객체, 및 그 용어와 객체 사이의 대응하는 관련성 점수에 대응한다.

일 실시예에서, 각각의 관련성 점수는 용어를 그 객체와 연관시키는 유저의 신뢰도 등급 매김과 관련된다. 대안적으로, 또는 부가적으로 용어와 객체에 대한 각 관련성 점수는 객체가 북마크된 개수 또는 객체에 주어진 등급 매김의 값과 개수로부터 결정된다. 대안적으로, 또는 부가적으로 용어와 객체 사이의 각각의 관련성 점수는, 통계적 분류 또는 기호논리적 회귀(logistic regression), 지지 벡터 머신, 분류 또는 회귀 트리(tree) 또는 부스팅된(boosted) 트리 앙상블(tree ensemble)과 같은 랭크 회귀 알고리즘으로부터 결정된다.

이 방법은 또한 용어(들)를 포함하는 검색 질의에 응답하여 유저에게 결과 리스트를 제공하는 단계, 상기 유저가 결과 리스트에 포함된 객체에 상기 용어를 연관시키는 단계, 및 상기 용어와 객체 사이의 관련성 점수를 결정하는 단계를 포함한다. 다수의 객체로부터 하나의 객체 및 그 관련 태그로부터 객체 사이의 관련성 점수는, 태그가 상기 객체와 연관된 개수, 상기 객체와 연관된 총 개수의 태그, 태그가 다수의 객체들 중 어느 하나와 연관된 횟수, 모든 다수의 객체와 연관된 태그의 수, 태그가 상기 객체와 연관된 시간 또는 이들의 임의의 조합으로부터 결정된다.

본 발명의 제 3 양상에서는, 결과 리스트에서 디스플레이를 위한 다수의 객체를 조직화하는 방법이 다수의 객체와 연관된 태그와 검색 질의에서의 용어를 상관시키는 단계와, 상기 상관에 기초하여 조직화된 다수의 개체를 포함하는 결과 리스트를 반환하는 단계를 포함한다.

본 발명의 제 4 양상에서는, 검색 질의에 응답하여 검색 결과 리스트를 반환하기 위한 시스템이 객체와 연관된 태그를 저장하는 태그 데이터베이스와, 이 태그 데이터베이스에 연결된 태그 분석기를 포함한다. 객체는 웹 페이지로의 하이퍼링크, 하이퍼링크의 그룹, 텍스트, 이미지, 사진, 태그, 태그의 그룹, 주제 영역, 개념, 오디오 파일, 비디오 파일, 소프트웨어, 또는 이들의 임의의 조합을 포함한다. 바람직하게, 이 객체들은 웹 페이지로의 하이퍼링크이다.

이 태그 분석기는 태그와 객체 사이의 관련성 점수를 결정하기 위해 프로그래밍된다. 일 실시예에서, 이 시스템은 또한 태그와 객체 사이의 관련성 점수를 저장하기 위핸 객체 색인을 포함한다.

일 실시예에서, 관련성 점수는 태그 및 객체를 형성하는 용어에 대해 가중치가 부여된 관련성 점수를 합산함으로써 결정된다. 또다른 실시예에서, 용어를 포함하는 검색 질의와 객체 사이의 관련성 점수는, 그 검색 질의에서 용어를 포함하는 태그의 수, 검색 질의에 포함된 태그가 태그 데이터베이스에서 포함되는 횟수, 객체와 연관된 태그의 수, 일치하는 태그 내 및 검색 질의 내의 용어의 수, 또는 이들의 임의의 조합으로부터 결정된다. 또다른 실시예에서는, 태그와 객체에 대한 관련성 점수가 그 객체 내의 태그의 위치, 그 객체 내의 태그의 빈도수, 그 객체 내의 태그의 밀도, 또는 이들의 임의의 조합에 기초한다.

일 실시예에서, 태그와 객체 사이의 관련성 점수에 가중치를 매기는 것은, 객체와 태그를 연관시킨 유저에 할당된 기밀성(confidence) 레벨(기밀성 등급 매김)에 기초한다. 그 관련성 점수는 통계적 분류 또는 랭크 회귀 알고리즘, 클러스터링(clustering) 분석 알고리즘, 또는 형태론적(morphological) 분석 알고리즘을 사용하여 결정된다. 이 통계적 분류 알고리즘은 기호논리적 회귀, 지지 벡터 분류, 분류 트리 분류 트리 앙상블을 포함한다.

또다른 실시예에서, 이 시스템은 또한 객체 색인에 결합된 검색 엔진을 포함한다. 이 검색 엔진은 태그에 대응하는 용어를 포함하는 검색 질의를 수신하고 태그-객체 쌍에 대한 관련성 점수에 기초한 조직화된 결과 리스트를 반환하도록 프로그래밍된다. 이 시스템은 또한 검색 엔진에 연결된 데이터베이스를 포함한다. 이 유저 데이터베이스는 유저에 의해 후속된 링크, 객체와 연관된 태그, 유저에 의해 차단된 객체, 또는 이들의 임의의 조합과 같은 검색 질의에 관련된 정보를 포함한다.

도 1은 본 발명의 일 실시예에 따른, 태그를 분석함으로써 적어도 부분적으 로 이끌어 낸 검색 결과 리스트를 디스플레이하는 그래픽 유저 인터페이스(graphical user interface)의 개략도.

도 2는 본 발명의 일 실시예에 따른, 순위 매김(ranking) 문서의 프로세스에 태그를 적용할 수 있는 인터넷 검색 적용 동작을 도시하는 흐름도.

도 3은 본 발명의 일 실시예에 따른, 인터넷 검색 적용의 구성 성분을 도시하는 개략도.

도 4는 본 발명의 일 실시예에 따른, 태그 데이터를 준비하고 분석하기 위한 프로세스를 도시하는 흐름도.

도 5는 본 발명의 일 실시예에 따른, 태그 데이터를 사용하는 결과를 계산하기 위한 단계들을 도시하는 흐름도.

도 6은 본 발명의 일 실시예에 따른, 인터넷 검색 적용의 구성 성분을 도시하는 하드웨어 도면.

도 7은 본 발명의 일 실시예에 따른, 문서 색인을 도시하는 도면.

일반적인 검색 엔진과는 달리, 본 발명의 실시예는 인터넷을 검색하는 유저에게 더 많은 관련 정보를 제공하기 위해 태그 및/또는 북마크를 사용한다. 일 실시예에서, 검색 엔진은 질의를 수신하고 관련 문서들 또는 문서들의 그룹의 리스트를 결정하기 위해 확립된 방법을 구현하고, 관련 문서들 또는 문서들의 그룹들의 리스트를 결정하기 위해 문서들 또는 문서들의 그룹들과 연관된 태그들을 분석하며, 결과 리스트를 유저에게 전달하기 위해 동일한 방식으로 2개의 리스트를 결합 한다. 다음에 오는 예들이 문서의 검색 및 반환을 서술하는데 반해, 본 발명은 몇 가지 말하자면, 웹 페이지, 텍스트, 이미지, 사진, 태그, 태그의 그룹, 주제 영역, 개념, 프로파일, 대답, 오디오 파일, 비디오 파일, 소프트웨어, 또는 이들의 임의의 조합에 하이퍼링크 또는 하이퍼링크의 그룹 - 하지만 이들에 제한되지는 않는다 - 을 포함하는 임의의 객체를 검색 및 반환하기 위해 사용될 수 있다는 점을 알게 된다.

예컨대, 본 발명에 따르면, 용어 X를 지닌 질의는 리스트의 어딘가에 있는 웹 페이지 M을 포함하는 웹 페이지들의 결과 리스트를 반환하게 된다. 그 다음 제 1 유저가 그 웹 페이지 M을 용어 X를 포함하는 태그와 연관시킨다. 어떤 질의에서 그 용어 X를 사용하여 검색을 수행하는 제 2 유저에게는, 제 1 유저에 의한 태그의 생성에 앞서 디스플레이되었던 것보다 높은 위치에 웹 페이지 M을 디스플레이할 수 있는 결과 리스트가 전달된다.

본 발명의 실시예에 따르면, 웹 페이지 M이 제 2 유저에게 더 관련된다고 간주되는 정도는, 용어 X가 웹 페이지 M에 대한 태그에서 사용되는 횟수, 웹 페이지 M과 연관된 모든 태그의 총 개수, 제 1 유저가 생성한 태그의 개수, 각 유저에 의해 북마크되거나 태그된 문서의 개수, 용어 X가 전체적으로 태그로서 사용되는 빈도수, 전체적으로 태그의 총 개수, 그 용어 X를 포함하는 태그/문서 쌍들의 개수, 그 웹 페이지 M에 대한 기준, 또는 그 모두, 제 1 사람과 제 2 사람 사이의 관계, 제 1 사람과 제 2 사람에서 또는 제 1 사람이나 제 2 사람이 속하는 그룹에서 만들어진 신뢰성 레벨(예컨대, 신뢰성 평가) - 하지만 이들에 제한되지는 않는다 - 을 포함하는 인자를 분석함으로써 결정된다. 유저들과 그들이 속하는 그룹들의 관계 또는 유사성 정도와, 어떤 유저에게 부여된 신뢰성 레벨은 모두 계측값을 사용하여 정량화될 수 있다. 예컨대, 2명의 유저 사이의 관계가 계측값이 1인 관계에 속한다고 생각하는 것은, 그 2명의 유저가 계측값이 0.5인 관계를 가지는 2명의 유저보다 더 유사(예컨대, 유사한 관심도를 가지거나 공통으로 친구를 공유하는)하다는 것을 표시할 수 있다. 부가적으로, 용어 X에 있어서 2개 이상의 단어가 존재하는 경우에는, 제 2 유저에 의해 질의에 포함되는 용어 X에 있는 단어들의 개수, 그 단어들이 어구로서 사용되는지의 여부, 단어 순서, 및 모든 이전에 언급된 인자들과 같은 다른 인자들이 분석될 수 있는데, 즉 그 분석은 또한 단어들의 상이한 조합을 분석하는 것을 포함할 수 있다.

본 발명의 다른 실시예에 따르면, 검색 엔진은 상이하게 순서가 정해져야 할 결과 리스트들을 전달하지 않을 수 있고, 오히려 포함된 문서들을 표시하기 위해 일부 그래픽 요소를 둘 수 있는데, 이는 그것들이 그것들과 연관된 태그를 가지기 때문이다.

본 발명의 다른 실시예에 따르면, 태그는 유저에 의해 명백히 문서와 연관되지 않을 수 있고, 오히려 북마크를 검사하고, 검색을 행하거나 등급을 정하는 것(rating), 차단(blocking), 세이빙(saving) 또는 클리킹과 같은 다른 유저의 행동에 의해 문서들과 연관될 수 있다.

본 발명의 다른 실시예에 따르면, 태그는 웹 페이지 또는 웹 페이지의 그룹뿐만 아니라, 이미지, 사진, 다른 태그, 태그의 그룹, 주제 영역, 유저 프로파일, 개념, 지도, 오디오 또는 비디오 파일, 소프트웨어 또는 다른 객체 - 하지만 이들에 제한되지는 않는다 - 를 포함하는 공적인 또는 사적인 임의의 식별 가능한 데이터 자원과 연관될 수 있다.

다음에 이어지는 설명에서, "검색 엔진(search engine)"이라는 용어는 입력으로서 질의를 취하고, 전자 문서 또는 웹 페이지 또는 그 웹을 통해 액세스 가능한 다른 객체에 대한 하이퍼링크의 결과 리스트를 반환하는 장치(또는 범용 컴퓨터에서 실행되는 프로그램)를 가리키기 위해 사용된다. 이 검색 엔진은 문서의 언어 자료(corpus), 코드 및 각 문서의 관련성을 결정하는 알고리즘의 색인과, 결과 리스트를 유저에게 전달하는 그래픽 유저 인터페이스를 포함한다.

다음에 이어지는 설명 전체에 걸쳐, "질의(query)"라는 용어는 검색 조건의 세트를 이미 끼워넣거나 임의의 다른 인터페이스에 의해 제출된 "링크(link)"를 통해 타이핑되고, 말해지며 제출되었는지에 대해 검색 엔진에 제출된 조건의 세트를 가리킨다. 질의는 단일 단어, 다수 단어, 또는 어구를 포함할 수 있다. 이 질의는 문제{예컨대, "자연 언어(natural language)" 질의}, 치밀하지 못한 용어의 집합, 또는 구조화된 부울 표현식(structured Boolean expression)과 같이 말로 표현될 수 있다. 실제로, 질의는 검색 문자를 포함하거나 검색 문자에 관련된 전자 문서나 웹 페이지를 검색하기 위해 검색 엔진에 의해 사용된 부호(symbol)나 임의의 다른 문자를 포함할 수 있다.

다음에 이어지는 설명 전체에 걸쳐, "웹 사이트(Web site)"라는 용어는 월드 와이드 웹 상에서 이용 가능하고 함께 링크되는 웹 페이지의 집합체를 가리키기 위 해 사용된다. "웹 페이지(Web page)"라는 용어는 웹 사이트 상에서 발표되고 임의의 개수의 호스트로부터 월드 와이드 웹을 통해 액세스 가능한 문서를 가리키고, 텍스트, 비디오, 이미지, 음악, 및 그래픽 - 하지만 이들에 제한되지는 않는다 - 을 포함한다.

다음에 이어지는 설명 전체에 걸쳐, "결과 리스트(results list)"라는 용어는, 문서, 객체(이미지와 비디오 - 하지만 이들에 제한되지는 않는다 - 를 포함하는 전술한 바와 같은) 또는 웹 페이지를 액세스하기 위해 임의의 다른 프로토콜이나 하이퍼텍스트 전송 프로토콜(HTTP)을 사용하여 액세스 가능한 웹 페이지를 참조문으로 인용하는 하이퍼링크 또는 하이퍼링크의 그룹, 또는 문서의 제목, 문서의 요약, 연관된 태그의 개수나 다른 관련성 계측값, 연관된 태그의 리스트, 문서의 캐싱된(cached) 복사물에 대한 링크, 문서가 마지막으로 색인되거나 마지작으로 수정된 날짜, 그 문서와 연관되거나 그 문서 내에 위치한 이미지, 그 문서로부터 추출된 정보, 및 그것을 북마크했거나 태그했었을 유저 - 하지만 이들에 제한되지는 않는다 - 를 포함하는 각 링크에 대한 다른 연관된 정보와 함께 다른 전자 문서를 가리킨다.

다음에 이어지는 설명 전체에 걸쳐, "태그(tag)"라는 용어는 각각 하나 이상의 단어로 이루어지는 하나 이상의 요소, 주소 지정 가능한 객체를 인용하는 하이퍼링크, 태그가 생성된 시간, 및 그 태그를 생성한 유저와 같은 다른 정보 중 임의의 것을 포함하는 임의의 데이터 구조를 가리킨다. 태그는, 인터넷이나 로컬(local) 컴퓨터 저장 디바이스에 있는 컴퓨터 네트워크 상의 웹 페이지, 이미지, 지도, 또는 다른 객체와 같은 다양한 객체로의 링크를 포함할 수 있다. 태그하는 것(tagging)은 또한 주소 지정 가능한 문서 또는 객체로의 특별한 하이퍼링크를 용어와 연관시키는 프로세스를 가리킬 수 있다.

본 명세서에서 사용된 것처럼, "북마크(bookmark)"라는 용어는 하이퍼링크, 북마크를 만드는 유저의 아이디(identity), 북마크가 만들어진 시간, 및 위에서 한정된 것과 같은 태그 중 임의의 것을 기록하는 임의의 데이터 구조를 가리킨다.

본 명세서에서 사용된 것처럼, "문서(document)"라는 용어는 넓게 한정되고, 그것의 일상적인 의미 외에, 컴퓨터 파일과 웹 페이지를 포함한다. "문서"라는 용어는 텍스트를 포함하는 컴퓨터 파일에 제한되지 않고, 유저 프로파일, 개념, 대답과, 그래픽, 오디오, 비디오, 및 다른 멀티미디어 데이터를 포함하는 컴퓨터 파일을 포함한다. 유저 프로파일은, 정보의 몇 가지만 말하자면 관심, 취미, 친구 리스트, 사진, 전문적인 경험, 및 교육과 같은 어떤 사람에 대한 정보 - 하지만 이들에 제한되지는 않는다 - 를 포함하는 페이지나 기록이다.

본 명세서에서 사용된 것처럼, "스패머(spammer)"라는 용어는 검색 엔진의 관련성 방법론을 이용하도록 설계된 임의의 개수의 기술을 사용하여, 그렇지 않으면 검색 엔진이 디스플레이한 것보다 높은 랭크 또는 더 큰 빈도수를 지닌 제품(product), 웹 페이지 또는 다른 물질로의 검색 엔진 디스플레이 링크를 가지려고 시도하는 사람 또는 실체(entity)로서 한정된다.

본 명세서에서 사용된 것처럼, "프로그래밍된(programmed)"라는 용어는 저장, 처리, 전송과 같은 컴퓨터 명령어를 실행하거나 그 외에 데이터를 조작하기 위 해 사용된 다른 수단, 하드웨어, 소프트웨어, 펌웨어의 임의의 조합을 의미한다.

아래에 더 상세히 설명되는 것처럼, 검색 엔진은 유저에 의해 입력된 질의를 취하고, 유저가 찾은 정보에 가장 관련되는 것 같은 문서를 식별할 목적을 지닌 다양한 관련성 계산을 사용하여, 문서의 색인과 검색 용어를 매칭시킨다. 이후 검색 엔진은 리스트의 상부에 더 가까운 가장 관련성이 있다고 생각되는 이들 문서로의 하이퍼링크의 등급이 매겨진 리스트를 반환한다. 본 발명에 따르면, 유저는 용어를 문서와 연관시키는 태그를 생성하는 능력을 가지고, 검색 엔진은 웹 페이지와 연관된 태그의 분석에 적어도 부분적으로 기초한 결과 리스트를 반환한다.

본 발명에 따르면, 태그가 주어진 질의에 대한 어떤 문서의 관련성에 영향을 미치는 정도는, 연관시킨 유저가 부여한 확신 레벨에 관련될 수 있다. 이 확신 레벨은 유저의 태그가 과거에 어떻게 관련되는지, 유저의 관찰된 활동성이 청중에서 나머지 유저 또는 질의를 행하는 유저에 얼마나 유사한지, 유저 사이의 연결 정도와 같은 인자와 다른 인자들에 의해 결정될 수 있다.

도 1은 본 발명에 따른 질의에 응답하여 반환된 결과 페이지를 디스플레이하는 그래픽 유저 인터페이스(GUI)의 스크린 샷(shot)이다. 그 결과 리스트는 각 링크와 연관된 태그의 분석에 기초하여 재정렬(reorder)되거나 마킹(mark)될 수 있다.

결과 페이지(100)는 질의 용어를 삽입하기 위한 상자(100)와, 검색 엔진에 의해 반환된 결과 리스트를 포함하는 영역(120)을 포함한다. 영역(120)은 또한 검색 엔진에 의해 반환된 각 결과와 연관된 태그(150)의 리스트를 포함할 수 있다. 아래에 더 상세히 설명된 것처럼, 바람직한 일 실시예에서는 영역(120)에서의 결과의 일부 또는 정부가 태그(150)의 분석에 기초하여 재정렬(130)되거나, 또다른 실시예에서는 영역(120) 내의 결과가 또한 재정렬될 수 있지만, 일부는 태그 및/또는 북마크(150)의 분석이 그것들의 관련성에 영향을 미치게 된다는 것을 표시하기 위해 그래픽 요소(140)로 마킹된다. 그 결과 페이지(100)는 또한 객체의 등급을 매기기 위한 메커니즘(165)을 포함한다.

유저는 그들이 문서를 설명하는 것이라고 생각하는 용어와 문서 사이의 연관성을 확립할 수 있다. 이 프로세스는 전술한 바와 같이 "북마킹(bookmarking)" 또는 태깅(tagging)"이라고 한다. 이는 북마킹의 경우 나중에 재호출하기 위해 하이퍼링크를 기록하기 위한 메커니즘을 활성화하도록 영역(120)에서 하이퍼링크 또는 그래픽 요소(160)를 클릭하는 것에 의해, 또는 태깅의 경우에는 문서와 새로운 태그 또는 태그들을 연관시키거나 북마크 툴바에서의 익스텐션 또는 툴바 또는 애플릿을 사용하여 행해진다. 이 요소(160)는 그 문서를 "북마킹" 또는 태깅"하는 것을 제안하는 임의의 다른 표현이나 디스크와 같은 이미지, 텍스트 링크일 수 있다. 상이한 유저는 어떤 용어가 상이한 문서와 연관되는지에 대한 상이한 생각을 가질 수 있고, 풍부하고 변화된 태그의 세트가 확립될 수 있다. 그것이 본 발명에 따라 분석되는 태그의 세트이다.

유저는 그 문서가 질의에 관련된다고 생각하지 않는다면 결과 리스트로부터 문서를 차단할 수 있다. 이 프로세스를 "블로킹(blocking)"이라고 부른다. 이는 문서로의 링크를 차단하기 위한 메커니즘을 활성화하기 위해 영역(120)에서 하이퍼링 크나 그래픽 요소(170)를 클릭하여 행해진다. 이 요소(170)는 텍스트 링크, 이미지(예컨대, 도 1에서의 170) 또는 그 문서를 "차단" 또는 "제거"할 것을 제안하는 임의의 다른 표현일 수 있다. 문서를 차단(blocking)하게 되면 질의에서의 용어를 포함하는 문서에 대한 네거티브(negative) 태그를 연관시키는 결과를 가지게 된다. 상이한 유저가 어떤 용어를 상이한 문서에 연관시킬지에 대해 상이한 생각을 가지게 되므로, 때때로 어떤 문서에 대해 태그가 적절한지에 대한 불일치가 존재하게 된다. 다른 때에는, 스패머가 공공연히 잘못 인도하는(misleading) 태그를 문서와 연관시키기도 한다. 아래에 더 상세히 설명되는 것처럼, 포지티브(positive) 태그와 네거티브 태그가 의견의 차이를 상쇄하고 스팸이나 다른 잘못 인도하는 문서의 양을 줄이기 위해 사용될 수 있다.

결과 페이지(100)는 또한 질의 용어에 관련된 개념에 대한 설명을 디스플레이하기 위한 영역(180)을 포함할 수 있고, "See also"를 포함하는 영역(190)은 다른 질의 용어에 관련되는 다른 개념에 링크한다.

도 1에 도시된 예에서 보여지는 것처럼, 유저가 상자(110)에서 "U2"라는 질의 용어를 입력하고 검색을 요청할 때, 유저에게 결과 페이지(100)가 반환된다. 영역(120)은 "U2"라는 질의 용어에 관련된 객체로 링크되는 결과의 리스트를 포함한다. 바람직한 일 실시예에서, 결과(130)의 일부는 유저가 다양한 문서와 연관시킨 태그(150)의 분석에 기초하여 재정렬된다. 예컨대, www.atu2.com에 위치한 제목이 "U2 Home Page: @U2..."인 문서는, 태그(150)의 리스트에 도시된 것처럼 "U2", "U2 fan site", 및 "U2 fans"이라는 용어들로 태그되었다. 태그의 분석은 이 문서로 하 여금 그렇게 하지 않으면 가졌을 결과 리스트보다 높게 열거되게 하였다. 또다른 실시예에서는, 결과가 재정렬되거나 마킹될 수 있지만, 일부 결과는 그래픽 요소(140)로 마킹되어, 유저 태그 및/또는 북마크를 분석하는 것은 사람들이 이들 결과가 더 관련성이 있음을 알게 되었음과, 선택적으로는 그것들이 관련성이 있음을 알게 된 사람들의 인원을 표시하게 됨을 보여준다. www.u2station.com에 위치한 제목이 "U2 station"인 문서는 "U2"와 "U2 fansite"라는 용어와 태그되었고, 어떤 사람의 그래픽 요소(140)로 마킹되어 다른 유저가 그것이 관련성을 가짐을 알아냈음을 표시한다. 어떤 사람의 아이콘(icon) 외의 그래픽 요소가, 그 관련성이 다른 유저에 의해 표시되었음을 유저들에게 알리기 위해 사용될 수 있다는 것을 알게 된다.

유저가 www.u2log.com과 같은 문서에 대한 태그를 북마크 하는 것 및/또는 추가하는 것을 하기를 바란다면, 그 유저는 그래픽 아이콘(160)을 클릭할 것을 선택할 수 있고, 이는 태그를 북마킹하는 것 및/도는 추가하는 것에 대한 메커니즘을 활성화하고, 이는 그 유저에게 의미있는 일부 다른 용어나 영역(110) 내의 이미 존재하는 그 검색 용어의 태그와 동일할 수 있다. 유저가 "lyrics"와 같은 상이한 검색을 행하였다면, 그 유저는 제목이 "U2 Wanderer.org the U2 Discography and U2 Lyrics Site"인 그 문서가 질의인 "lyrics"에 대해 열거되어야 한다는 사실을 믿지 않았다면, 유저가 검색 결과로부터의 문서를 차단하기 위해 요소(170)를 클릭할 수 있으며, 이는 그 문서와 "lyrics"라는 용어를 포함하는 태그를 연관시키는 결과를 가지게 된다. 마이너스 기호("-")는 용어와 웹 페이지 사이의 연관선을 긍정하기보 다는 부정하는 것을 표시한다.

이 예를 계속하면, 영역(180)은 "U2"라는 밴드(band)를 설명하는 개념과 "U2"라는 용어에 관련된 다른 개념의 리스트를 포함한다. 영역(190)은 "Bono, U2 concerts, best selling music artists, the ONE campaign, Live 8..."과 같은 관련된 주제로의 "See also" 링크의 한 세트를 포함한다. 본 발명에 따르면, 유저가 이들 링크 중 하나, 예컨대 "Live 8"을 선택하게 되면, 검색 용어인 "Live 8"을 사용하여 질의가 이루어지고, 이는 결과 페이지(100)와 유사한 결과 페이지를 가져오며, 그 결과 페이지에서는 검색 용어(110)가 "Live 8"이고, 그 결과 리스트(120)는 그 검색 용어에 관련되는 문서로의 링크의 리스트이며, 그 리스트에서의 위치는 문서와 연관된 태그에 의해 차례로 영향을 받는다. 따라서 임의의 검색으로부터의 결과의 순서는 태깅에 의해 영향을 받는다. 주제 영역과 개념은 본 명세서에 참조로 통합되어 있고, 2006년 2월 27일에 출원된, 제목이 "Methods of and Systems for Searching by Incorporating User-Entered Information"인 미국 특허 출원 11/364,617호에 더 상세히 설명된다.

많은 수정예가 본 발명에 따라 만들어질 수 있음을 알게 된다. 예컨대, 유저 생성 태그는 단말기(terminal)로부터 직접 유저에 의한 입력보다는 또다른 서비스로부터 수입되거나 파일로부터 읽혀질 수 있다. 게다가, 결과 페이지(100)가 결과 리스트(120), 태그의 리스트(150), 개념(180), 및 개념으로의 링크(190)를 보여주고 있을지라도, 본 발명에 따르면 태그의 분석에 의해 영향을 받는 결과 페이지는 도 1에 도시된 것 외에 또는 도 1에 도시된 것을 포함하는 영역의 임의의 조합으로 또는 이들 영역 일부가 없이 디스플레이될 수 있다는 것을 알게 된다. 이 태그 정보는 검색 결과가 더 이해가 쉽게 하고, 정확하며 의미가 있도록 하기 위해 다양한 페이지 설계 요소와 결합하여 사용된다.

도 2는 본 발명에 따른 인터넷 검색 애플리케이션(200)의 동작을 도시하는 흐름도이다. 인터넷 검색 애플리케이션(200)은 검색 엔진에 질의를 제출하고 태그의 분석에 의해 적어도 부분적으로 결정된 결과를 수신하는 능력을 유저에게 제공하여, 유저에게 그렇게 하지 않으면 제공되는 것보다 더 관련성이 있는 검색 결과를 제공한다. 유저는 그 결과 리스트에 도시된 웹 페이지를 방문할 수 있고, 또한 그들이 그 페이지가 관련성이 있거나 없는지를 표시하기 위해 그러한 페이지들 중 일부를 "북마크"할 것을 선택할 수 있다. 유저는 이들 페이지를 질의 용어 또는 일부 다른 용어나 용어들로 태그할 수 있다. 검색 엔진은 제출된 임의의 태그를 기록하고 그러한 태그들을 다른 유저에 의한 나중 검색에 사용한다.

단계(210)에서는 유저는 질의를 검색 엔진에 제출한다. 이후 프로세스는 가장 관련성 있는 문서의 리스트를 모으기 위해 다양한 알고리즘을 사용하는 다양한 정보 검색 접근법을 사용하여 그 언어 자료에서의 객체에 검색 엔진이 질의를 매칭시키는 단계(220)와, 가장 관련성 있는 문서의 리스트를 모으기 위해 다양한 문서와 연관된 태그를 검색 엔진이 분석하는 단계(230) 양쪽으로 계속 진행한다. 태그의 분석은 모든 유저에게 일반적일 수 있거나 검색을 행하는 개별 유저에게 맞추어진 것이거나 유저가 회원인 그룹에 맞추어진 것일 수 있다. 단계(220, 230)은 단계(240)로 진행하여 단계(230)로부터의 결과가 단계(220)로부터의 결과와 결합되어 더 관련성 있는 결과를 제공한다. 이후 프로세스는 단계(250)로 계속되어 결과 페이지(예컨대, 도 1에서 100)가 유저에게 보내진다. 단계(250)로부터 유저는 단계(260 또는 270)로 진행할 것을 선택할 수 있다.

단계(260)에서는, 유저가 결과 리스트에서의 문서를 방문하기 위해 하나 이상의 링크를 따라간다. 대안적으로, 단계(270)에서는 유저가 북마크하고 선택적으로 태그를 입력하는데, 이들 각 태그는 결과 리스트에서의 문서 중 하나와 하나 이상의 용어를 연관시킨다. 태그를 입력하기 위해, 유저는 유저가 태그를 입력하는 유저 인터페이스를 가져오는 문서{예컨대, 도 1에서의 영역(160)}를 북마크 또는 태그하기 위한 메커니즘을 클릭할 수 있거나, 단계(260)에서는 유저가 유저의 브라우저로 로딩된 "bookmarklet"을 사용하거나 그 문서를 북마크하고 그 태그를 입력하기 위한 다른 유사한 메커니즘을 사용할 수 있다. 대안적으로, 단계(270)에서는 유저가 차단을 위한 메커니즘{예컨대, 도 1에서의 영역(170)}을 클릭함으로써, 그 질의에 관련되지 않은 문서들을 차단할 수 있다. 결과 리스트에서의 문서들을 방문하는 단계(260)로부터, 유저는 단계(270)로 진행할 수 있어 태그를 입력하고, 대안적으로 단계(270)로부터 유저는 단계(260)로 진행할 수 있다. 단계(260)와 단계(270)는 모두 단계(280)로 진행하여, 시스템이 유저에 의해 입력된 북마크, 태그, 및 랭킹을 기록한다. 단계(280)는 단계(230)로 되돌아가, 임의의 다음 검색 동안 분석되는 태그의 데이터베이스가 이제 단계(270)에서 입력된 이들 새로운 태그를 포함하게 된다. 단계(230)로 되돌아가는 것과 비교하여, 프로세스는 또한 단계(290)로 계속되어 유저는 검색을 종료한다.

도 3은 본 발명에 따른 시스템(300)의 구성 성분을 도시한다. 시스템(300)은 웹 서버(310)에 결합하는 유저 클라이언트(305)를 포함한다. 웹 서버(310)는 검색 엔진(320), 유저 데이터베이스(330), 태그 데이터베이스(340)에 결합된다. 검색 엔진(320)는 문서 색인(350)에 결합된다. 유저 데이터베이스(330)는 또한 검색 엔진(320)에 결합된다. 태그 데이터베이스(340)는 태그 분석기(360)와 태그 크롤러(crawler)(391)에 결합된다. 태그 분석기(360)는 또한 문서 색인(350)에 결합되고, 이 문서 색인(350)은 색인 작성기(indexer)(370)에 결합된다. 색인 작성기(370)는 웹 콘텐츠 데이터베이스(380)에 결합되고, 이 웹 콘텐츠 데이터베이스(380)는 웹 크롤러(390)에 결합된다. 웹 크롤러(390)와 태그 크롤러(391)는 인터넷(395)를 통해 하나 이상의 웹 사이트(399)에 결합된다.

동작시, 웹 크롤러(390)는 웹 사이트(399)를 방문하고, 액세스하는 웹 페이지의 콘텐츠를 웹 콘텐츠 데이터베이스(380)에 파퓰레이트(populate)하게 하면서, 인터넷을 항해한다. 색인 작성기(370)는 웹 콘텐츠 데이터베이스(380)를 사용하여 문서 색인(350)을 생성한다. 태그 크롤러(391)는 웹 사이트(399)를 방문하고, 찾은 태그로 태그 데이터베이스(340)를 파퓰레이트하면서 인터넷을 항해한다.

유저가 검색을 행할 때, 유저는 유저 클라이언트(305)를 사용하여 질의를 입력하고, 이는 웹 서버(310)에 제출된다. 웹 서버(310)는 그 질의를 검색 엔진(320)에 제출하여 전술한 태그 분석으로부터 이끌어 낸 인자들과 관련성 알고리즘을 사용하여 문서 색인(350)과 그 질의를 매칭시켜, 가장 관련성 있는 문서를 결정하여 웹 서버(310)에 그 결과 리스트를 반환한다. 이후 웹 서버(310)는 결과 페이지(예 컨대, 도 1에서 100)를 디스플레이를 위해 유저 클라이언트(305)에 전달한다.

또한, 그 질의에 응답하여 유저 데이터베이스(330)는 결과 리스트{예컨대, 도 1에서의 영역(120)}으로부터 이어지는 링크, 북마크되거나 등급이 매겨진{예컨대, 단계(165)} 문서, 및 태그 엔트리 메커니즘{예컨대, 도 1에서의 영역(160)}를 사용하여 입력된 태그, 네거티브 태그를 입력하는 결과를 가지는 차단 메커니즘{예컨대, 도 1에서의 영역(170)}을 사용하여 차단된 문서와 같은 유저의 검색에 대한 정보를 기록한다. 이 정보는 그 유저를 위해 다음 검색 결과를 커스터마이징하고, 그 유저의 태그를 놓을 신뢰성의 양을 결정하기 위해, 웹 서버(310)와 검색 엔진(320)에 의해 사용된다. 또한 질의에 응답하여, 태그 엔트리 메커니즘{예컨대, 도 1에서의 영역(160)}을 사용하여 입력된 태그와 차단 메커니즘{예컨대, 도 1에서의 영역(170)}을 사용하여 유저에 의해 입력된 네거티브 태그가 또한 태그 데이터베이스(340)에 기록된다. 본 발명의 실시예 내에서, 유저 데이터베이스(330)와 태그 데이터베이스(340)에 저장된 정보는 2개의 별개의 데이터베이스로서 구현될 수 있거나, 동일한 데이터베이스 내에서 구현될 수 있다.

반드시 필수적이지는 않지만 일부 알맞게 기초하여, 질의가 수행될 때, 태그 데이터베이스(340)에 포함되는 태그 정보는 태그 분석기(360)에 보내지고, 이 태그 분석기(360)에서는 그 태그 정보가 분석되어 검색 엔진(320)이 질의들에 대한 가장 관련성이 있는 웹 페이지를 결정하도록, 각 유저에 의해 각 문서와 연관된 다양한 태그에 의해 관련성에 대한 어떠한 영향이 주장되는지를 결정한다. 태그 분석기(360)는 다음 검색에서 사용하기 위해, 이러한 태그 관련성 정보를 문서 색 인(350)에 기록한다.

태그 데이터베이스(340)는 질의 용어, 유저 식별자, 문서 ID, 문서 링크, 태그 용어, 등급 매김, 및 타임 스탬프를 포함하는 특징을 태그 분석기(360)에 전송하나, 이에 한정되지는 않는다. 또한, 태그 분석기(360)는 또한 이 문서 내에 있는 용어의 밀도, 이 문서 내에 있는 용어의 위치, 이 문서의 다양한 섹션에 있는 용어의 존재, 및 이들 용어를 포함하는 문서에 대한 하이퍼링크를 포함하는 다른 특징을 주어진 문서에 대해 찾아볼 수 있지만, 이에 한정되지는 않는다. 이 태그 분석기(360)는 또한 이전 태그 이력, 북마크 이력, 기밀성의 레벨, 다른 유저와의 유사성(예를 들면, 이 유저 및 다른 유저에 의해 생성된 태그 및 사용된 용어 사이의 유사성), 및 그룹 내의 멤버쉽을 포함하는 다른 정보를 주어진 유저를 위하여 찾아 볼 수 있지만, 이에 한정되지는 않는다.

이 태그 분석기(360)는 다른 태크에 따라 다양한 문서에 대한 관련성 점수 세트를 개발하기 위해 이들 특징을 사용한다. 이들 특징을 분석하는 프로세스가 도 4에 도시되며, 이하에서 상세하게 기술된다. 임의의 소정 질의-문서 쌍에 대한 일반적인 솔루션 또는 유저 레벨에 관한 관련성을 계산하기 위해 메커니즘이 사용된다.

이전에 언급된 태그 데이터에 관한 분석이 수행된다. 일반적으로, 임의의 주어진 질의를 위하여 임의의 주어진 문서의 관련성은 질의에 있는 용어를 포함하는 태그의 개수, 임의의 주어진 태그가 태그 전부에 사용된 횟수의 개수, 이 주어진 문서를 참조하는 태그의 개수, 문서가 북마크된 횟수의 개수, 문서에 적용된 등급 매김의 값 및 번호를 포함하는 인자 함수가 될 것이지만, 이에 한정되지는 않는다. 게다가, 주어진 문서에 대한 관련성의 임의 태그에 대한 예측 능력은 만일 평가될 수 있다면, 태그를 입력한 유저에 놓이게 된 기밀성의 레벨에 비례한다. 본 발명에 따른 관련성 모델링 프로세스는 기호논리적 회귀(logicstic regression), 지지 벡터 머신, 분류 또는 회귀 트리, 또는 부스팅된 트리 앙상블(ensembles)과 같은 임의의 통계적 분류 또는 랭크 회귀 알고리즘을 포함하는 다른 방법뿐만 아니라 다른 폼의 분석을 사용하여 수행될 수 있음이 이해될 것이지만, 이에 한정되지는 않는다.

도 4는 본 발명의 일 실시예에 따라, 질의에 대한 문서의 관련성을 결정하기 위하여 준비중에 있는 태그 데이터를 준비하고 분석하는 단계들을 예시하는 흐름도(400)이다.

도 4를 참조하면, 단계(410)에서, 태그 데이터는 웹 클라이언트 및 웹 서버(예를 들면, 305, 310, 도 3) 또는 태그 크롤러(crawler)(예를 들면, 391, 도 3)를 통하여 유저에 의해 입력되고, 시스템(예를 들면, 단계 280, 도 2)에 의해 태그 데이터베이스(예를 들면, 340, 도 3)에 제출된다. 단계(410)는 연속적 토대로 처리할 수 있으며, 도 4에 의해 기술된 프로세스의 나머지 단계에 독립하여, 일 시간 기간에 걸쳐 처리할 수 있다.

단계(420)에서, 태그 데이터베이스(340, 도 3)에서의 각 태그가 분석된다. 각 태그를 분석하는 프로세스는 유저 기밀성을 계산하는 단계(430) 및 가중된 태그 카운트를 결정하는 단계(440)를 통하여 진행한다. 단계(430)에서, 입력된 각 태그 에 대하여, 태그를 입력하는 유저의 기밀성 레벨이 계산된다. 태그가 참조하는 문서의 관련성에 영향을 끼치게 될 정도는 이를 입력하는 유저에 놓이는 기밀성 레벨의 함수이다.

기밀성의 레벨은, 유저의 행동이 주어진 용어 또는 주제 영역을 위하여 유저 커뮤니티의 행동과 얼마나 근접하게 매칭되는지, 또는 이 유저의 등급을 매김으로써 다른 유저에 의해 놓이는 기밀성에 기초하여, 북마킹, 태깅, 클릭킹, 랭킹 또는 차단, 사교계에서 그 유저와 연결시키기, 또는 그 유저에 의해 입력된 태그에 태깅 또는 가입하기를 포함하는 유저 행동의 통계적 모델을 사용하거나 또는 알고리즘으로 계산될 수 있다. 예를 들면, 루크라는 유저가 용어 A로 주어진 문서 X를 태그하고 다른 유저는 용어 D 및 F로 문서 X를 태그하였다면, 문서 X와 관련한 완전한 태그 세트는 {a,d,f}이고, 여기서 소문자 레벨 "a"는 용어 "A"를 사용하여 태킹하는 실제예를 표기한다. 이 예를 계속하면, 만일 질의 용어 A를 사용하여 검색하는 2명의 다른 유저, 시몬과 피터가 각기 문서 X를 블럭한다면, 이 문서 X는 이제 {a, -a, -a, d, f}로 태그될 것이다. 결과적으로, 루크의 기밀성 레벨은 감소하게 되는데, 이는 복수의 유저가 그의 태그를 동의하지 않았기 때문이며, 시몬과 피터의 기밀성 레벨은 증가하게 되는데, 이는 그들의 태그가 복수의 유저와 일치했기 때문이다. 유저에 놓이는 기밀성이 본 발명과 얼마만큼 양립하는 지를 결정하는 다른 방법이 있을 수 있음이 이해될 것이다. 만일 유저가 알려져 있지 않거나 또는 유저의 기밀성 레벨이 결정될 수 없다면, 중립 또는 태그가 획득된 소스로부터 물려받은 기밀성의 레벨이 이 태그에 할당된다. 유저 기밀성은 일부 다른 적절한 토대로 발 생하는 일부 프로세스를 통하여 또는 태그를 분석하는 시간으로 계산될 수 있음이 이해될 것이다.

단계(440)에서, 각 용어를 위하여 각 문서 또는 문서 그룹의 가중된 태그 카운트가 결정된다. 만일 문서 X가 용어 A를 사용하여 n번 태그되었다면, 용어 A에 대한 문서 X를 위하여 가중된 태그 카운트는 음이건 양이건, 모든 태그 a₁ ~ a_n의 총합이 되며, 이는 i = 1 ~ n인 각 태그 a_i를 생성한 각 유저 U_i에 대한 기밀성 레벨에서 팩터링하여 문서 X를 참조한다. 게다가, 만일 유저가 많은 태그를 입력한다면, 이 유저는 종종 문서를 태그하는 것으로 여겨질 수 있으며, 이 유저에 의해 임의의 주어진 태그의 가중치는 뜸하게 태그하는 유저의 태그보다 덜 중요한 것으로 여겨질 수 있다. 게다가, 만일 이들이 제때에 더 일찍 생성된다면, 태그는 덜 중요한 것으로 여겨질 수 있으며, 만일 이들이 최근에 더 많이 생성되었다면 더 중요한 거승로 여겨질 수 있다. 본 발명의 부분으로 여겨질 수 있는 가중된 태그 카운트를 결정하는 경우, 고려될 수 있는 다른 인자가 있음이 이해될 것이다. 일단 가중된 태그 카운트가 각 용어를 위하여 각 문서에 대하여 결정되면, 이 프로세스는 단계(450)로 진행한다.

단계(450)에서, 전체에서 각 용어는 각 용어를 위하여 문서 그룹 또는 각 문서에 대한 태그 점수를 만들기 위해 분석된다. 각 문서를 분석하는 단계(460), 및 각 문서를 위하여 태그 점수를 계산하는 단계(470)를 통하여 진행한다.

단계(460)에서, 태그 점수가 계산되어야 하는 다음 문서가 분석된다. 이 문 서에 관해 이전에 취합되거나 또는 계산된 모든 정보가 모아지고 추가 분석이 완료된다. 예를 들면, 고려될 수 있는 인자는 문서에서의 용어 밀도 또는 발생도, 문서에서의 용어의 위치, 동일 태그에서의 다수의 용어의 존재, 문서에 대한 하이퍼링크의 앵커 텍스트에서의 용어의 존재, 태그가 생성되고 마지막으로 변경된 시간, 및 유사성을 결정하는 통계적 분석, 클러스터링 분석 또는 형태론적 분석 또는 임의의 다른 형태의 분석에 기초하여 문서에서의 다른 용어의 유사성을 포함하지만, 이에 한정되지는 않는다. 일반 이 문서가 분석되면, 프로세스는 단계(470)로 진행하여, 용어에 대한 문서를 위하여 태그 점수를 계산한다.

단계(470)에서, 태그 점수는 현재 태그에 대한 현재 문서에 관해 계산된다. 각 문서에 대한 태그 점수는 문서를 참조한 총 태그의 개수의 함수가 되며, 각 태그는 이에 인가된 가중치에 따라 계산에 기여하며, 이는 위의 단계(440)에서 결정되는 바와 같이, 가중된 태그 카운트이다. 게다가, 이 태그 점수에 각 태그의 기여는 위의 단계(430)에서 결정된 바와 같이, 태그를 입력한 유저에 평가된 기밀성 및, 단계(460)에서 완료된 문서의 분석에 비례한다. 용어A에 대한 문서X에 관한 태그 점수 S_A는 태그 데이터베이스(예를 들면, 340, 도 3)에 존재하는 총 다른 용어의 개수, 태그 데이터베이스에 존재하는 총 태그 개수, 용어A가 태그 데이터베이스에 존재하는 빈도, 문서X가 태그된 다른 용어의 개수, 및 용어A로 태그된 다른 용어의 개수에 대한 함수가 된다. 이들 인자의 조합은 값이 각 문서의 태그 점수를 위하여 할당되도록 계산된다. 본 발명의 일부로 여겨질 수 있는 계산될 수 있는 다른 인자 가 있음이 이해될 것이다. 본 발명의 바람직한 실시예에서, 이 태그 점수는 개별 유저 또는 유저의 그룹으로 맞추어 만들어지다. 본 발명의 또 다른 실시예에서, 각 문서에 대한 태그 점수는 시스템의 각 유저를 위하여 동일하다. 단계(470)는 전체에서 문서의 각각이 각 용어를 위하여 이에 할당된 태그 점수 값을 가질 때까지 단계(450)로 회귀한다. 이후, 프로세스는 단계(480)로 진행한다.

단계(480)에서, 주어진 태그에 의해 태그된 각 문서는 각 용어에 대한 각 문서에 관한 태그 점수가 태그 분석에 의해 결정되는 질의 용어에 대하여 모든 문서의 관련성을 결정하기 위해 검색 시간에서 쉽고 신속하게 검색될 수 있는 포맷으로 기록되도록 색인된다. 문서의 색인 및 이들의 태그 점수, 및 태그 가중치 및 유저 기밀성 레벨은 검색 시간에 검색 엔진(예를 들면, 320, 도 3)에 의해 빠르고 쉽게 검색되어, 다른 검색 기술과 조합하거나, 또는 태그 분석 단독으로 결정되는 질의 용어로 각 문서의 관련성을 계산할 수 있는 문서 색인(예를 들면, 도 3)으로 발행될 수 있다. 본 발명의 다른 실시예에서, 이 프로세스(400)의 일부 단계는 생략될 수 있거나 또는 다른 단계가 삽입될 수 있으며, 또는 다른 가중치가 적용되거나 또는 다른 태그 점수가 계산될 수 있는데, 여전히 본 발명의 범위 내에 있는 것으로 고려됨을 이해해야 할 것이다.

도 5는 본 발명의 일 실시예에 따른 태그 데이터를 이용한 결과를 계산하는 단계를 예시하는 흐름도(500)이다.

도 5를 참조하면, 단계(510)에서, 검색 엔진은 하나 이상의 용어를 포함할 수 있는 질의(230, 도 2)를 처리한다.

단계(520)에서, 검색 엔진은 질의에 있는 각 용어에 기초하여, 질의에 가장관련된 문서 또는 문서의 그룹에 대한 리스트를 생성한다. 각 용어에 기초하여 관련성을 결정하는 이 프로세스는 문서를 식별하는 단계(530), 태그 랭크를 결정하는 단계(540), 및 각 문서의 점수를 매기는 단계(550)를 통하여 진행한다. 단계(530)에서, 질의에서의 용어에 대하여, 기왕 관련된 것으로 고려되었던 문서의 리스트는 이들 문서가 연관된 태그에 기초하여 생성된다. 이 리스트는 길이에 있어, 매우 짧음(예를 들면, 5 또는 그 이하)에서부터 매우 김(예를 들면, 10,000,000 또는 그 이상)의 범위를 가질 수 있다. 이들 리스트는 검색 응용에서, 실제적인 목적을 위하여 트렁케이트될(truncated) 수 있으며, 특정 실시예의 요구에 따라 정렬되거나 정렬되지 않을 수 있음을 이해해야 할 것이다.

단계(540)에서, 각 문서의 태그 점수는 용어 또는 임의 용어의 그룹화에 대하여 결정된다. 각 문서의 태그 점수는 색인에서 이 문서에 할당된 태그 점수의 함수가 될 것이며, 이 태그 점수를 계산하기 위해 사용되고 있는 태그를 제출한 유저의 현재 기밀성 레벨에 의해 영향을 받을 것이며, 어떤 그룹의 멤버인 개별 유저 또는 유저를 위하여 다를 수 있다.

단계(550)에서, 각 문서는 현재 고려중인 질의 용어에 기초하여, 문서가 놓이게 되는 결과 리스트에서 위치를 결정하는 값으로 점수가 매겨진다. 단계(550)는 질의에서의 모든 용어가 고려될 때까지 단계(520)로 복귀한다.

단계(560)에서, 질의에서의 용어 각각에 기초하여 각 문서에 대한 관련성 점수는 제출된 완전한 질의에 대하여 각 문서에 대한 총 관련성 점수를 계산하기 위 해 결합된다. 다음으로, 단계(570)에서, 랭크된 결과 리스트가 생성되고, 단계(580)에서, 그 결과 리스트는 어떤 다른 관련성 형태론이 사용될지라도 결합될 검색 엔진에 전달된다(예를 들면, 단계 240, 도 2). 본 발명의 다른 실시예에서, 이러한 프로세스(500)의 일부 단계는 생략되거나 또는 다른 순서로 처리될 수 있으며, 또는 다른 단계가 삽입될 수 있으며, 또는 다른 가중치가 적용되거나 또는 다른 태그 점수가 계산될 수 있으며, 여전히 본 발명의 범위 내에 있는 것으로 여겨질 수 있음을 이해해야 할 것이다.

도 6은 본 발명에 따른 유저(610)에 의한 사용을 위해 인터넷 검색 어플리케이션 시스템(600)을 위한 하드웨어 구성성분을 예시한다. 이 시스템(600)은 인터넷(630)을 걸쳐 웹 서버(640)에 연결된 클라이언트 디바이스(620)를 포함한다. 이 클라이언트 디바이스(620)는 웹 서버(640)에 액세스하기 위한 임의의 디바이스이며, HTTP(HyperText Transfer Protocol) 및 WAP(Wireless Application Protocol)를 포함하는 인터넷 프로토콜을 사용하여 통신하기 위해 구성되지만, 이에 한정되는 것은 아니다. 바람직하게는, 클라이언트 디바이스(620)는 개인용 컴퓨터이지만, 그러나 또한 휴대폰 또는 PDA(Personal Digital Assistant)와 같은 핸드헬드 디바이스를 포함하는 또 다른 디바이스일 수 있으며, 이 클라이언트 디바이스는 HTML(HyperText Markup Language), HDML(Handheld Device Markup Language), WML(Wireless Markup Language) 등과 같은 표준을 사용하여 정보를 표현할 수 있다.

웹 서버(640)는 검색 서버(650) 및 태그 데이터 저장소(660) 둘 다에 연결된 다. 이 태그 데이터 저장소(660)는 태그 분석 서버(670)에 연결되고, 검색 서버(650)는 색인 데이터 저장소(680)에 연결된다. 게다가, 태그 분석 서버(670)는 색인 데이터 서버(680)에 연결된다.

도 7은 본 발명의 일 실시예에 따른 문서 색인(700)을 보여준다. 당업자라면 이 문서 색인(700)은 본 발명의 방법을 설명하기 위해 사용된 개념적 구조이고, 선호되는 문서 색인은 반전된 색인을 사용함을 이해할 것이다. 이 문서 색인(700)은 예시적인 제 1 및 제 2 행(740 및 750)을 각기 포함하는데, 각각은 열(705, 710, 715, 720 및 725)에서 태그-객체 쌍 및 관련한 정보를 포함한다. 행(740)을 참조하면, 이 열(705)은 태그 "U2"를 포함하고, 열(710)은 객체, 여기서는 웹 페이지("U2" 홈")를 포함하며, 열(715)은 태그-객체 쌍("U2-U2 홈")을 위한 원(raw)(예를 들면 가중치가 부과되지 않은) 관련성 점수를 포함하고, 열(720)은 이러한 태그-객체 쌍을 위한 가중치(weight)를 포함하고, 그리고 열(725)은 객체 "U2 홈"에 태그 U2를 연관시킨 유저에 대한 유저 기밀성 등급 매김을 포함한다. 열(750)은 유사하게 식별된 정보를 포함한다. 열(720)에서 엔트리(0.6)는 이 태그-객체 쌍에서 태그"U2"를 생성하기 위해 가중치를 결정한다. 이러한 가중치는 가중치(0.6)를 결정하기 위해, 가령 태그가 객체에 연관되는 시간과 같은 다른 기밀성 인자와 결합된 열(725)에서의 유저 기밀도 등급 매김(0.7)으로부터 결정된다. 이러한 태그-객체 쌍을 위한 관련성 점수는 최종 관련성 점수(57)를 결정하기 위해 가중치(0.6)에 의해 곱해진 원 관련성(0.95) 점수와 같다. 유사한 방식으로, 행(750)에서의 태그-객체 쌍을 위한 관련성 점수는 70*0.9, 즉 63이 되는 것으로 결정된다. 따라서, 만일 유저가 용어"U2"를 포함하는 검색 질의를 실행하면, 행(750)에서의 이 객체에 상응하는 객체"Rock Band Home Site"가 행(740)에서의 객체"U2"보다 반환된 (조직화된) 결과 리스트에서 보다 높게 랭크될 것이며, 이는 유저의 검색에 더 관련됨을 나타낸다.

문서 색인(700)은 단순히 예시적인 것임을 이해해야 할 것이다. 또한, 수개의 다른 구성을 명명하기 위해 관련성 점수를 결정하기 위한 다른 알고리즘, 관련성 점수에 대한 다른 범위, 엔트리의 다른 조합이 사용될 수 있다.

첨부된 청구항에 의해 한정된 바와 같이, 본 발명의 사상 및 범위로부터 벗어나지 않고서도 실시예에 다양한 변경이 이루어질 수 있음이 당업자에게는 이미 명백할 것이다.

전술한 바와 같이, 본 발명은 문서를 검색하는 것, 특히 검색 결과의 품질 또는 관련성을 개선하기 위해, 사람들에 의해 생성된 태그를 분석함으로써, 인터넷에서 정보를 검색하는 시스템 및 방법에 이용 가능하다.

Claims

검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법으로서,

상기 다수의 객체와 다수의 태그를 연관시키는 단계, 또는 상기 다수의 객체에 북마크를 기록하는 단계, 또는 연관시키고 기록하는 단계; 및

상기 다수의 객체의 각각 및 검색 질의에 대한 관련성을 결정하는 단계

를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 1 항에 있어서,

상기 다수의 태그로부터의 각 태그는 하나 이상의 용어를 포함하고, 객체와 상기 하나 이상의 용어로부터 각 용어를 연관시켜, 하나 이상의 대응 용어-객체 쌍을 한정하는 단계를 더 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 2 항에 있어서,

각 용어-객체 쌍에 대하여 상기 용어와 객체 사이의 관련성 정도를 나타내는 용어 점수를 결정하는 단계를 더 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 3 항에 있어서,

태그-객체 쌍을 위하여 관련성 점수를 결정하는 단계는, 상기 태그에서의 각 용어에 대한 용어-객체 쌍을 위하여 상기 용어 점수를 결합하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 4 항에 있어서,

상기 용어 점수를 결합하는 단계는, 용어 점수를 합산하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 4 항에 있어서,

상기 용어 점수를 결합하는 단계는, 가중치로 각 용어 점수를 가중하고 이 가중된 용어 점수를 합산하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 2 항에 있어서,

태그-객체 쌍을 위한 관련성 점수는, 태그에서의 용어가 객체와 연관되는 횟수, 객체와 연관된 태그의 수, 태그가 다수의 객체와 연관되는 횟수, 또는 이들의 임의 조합으로부터 결정되는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 2 항에 있어서,

태그-객체 쌍을 위한 관련성 점수는, 상기 태그에서의 용어를 포함하는 태그-객체 쌍의 수, 상기 객체에 대한 기준을 포함하는 태그-객체 쌍의 수, 또는 둘 다로부터 결정되는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 1 항에 있어서,

제 1 유저에 의해 다수의 객체로부터의 하나의 객체와 태그를 연관시키는 단계;

제 2 유저에 의해 태그에서의 하나 이상 용어를 포함하는 검색 질의를 수행하는 단계;

상기 관련성 점수에 기초하여 결과 리스트에서의 다수의 객체를 조직화하는 단계;

이를 통해 조직된 결과 리스트를 한정하는 단계; 및

제 2 유저에 조직화된 결과 리스트를 반환하는 단계를 더 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 9 항에 있어서,

객체 및 검색 질의에 대한 관련성 점수는 상기 객체에 존재하거나 또는 상기 객체와 연관되는, 검색 질의 용어 각각에 대한 관련성 점수로부터 결정되는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 9 항에 있어서,

상기 다수의 태그-객체 쌍으로부터의 태그-객체 쌍에 대한 관련성 점수는 제 1 유저가 다수의 객체 중 어느 하나와 관련된 태그의 수, 또는 제 1 및 제 2 유저가 태그와 연관된 객체의 수, 또는 둘 다로부터 결정되는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 9 항에 있어서,

태그-객체에 대한 관련성 점수는, 제 1 유저와, 제 2 유저 중 선택된 하나 또는 둘 다에 대한 관련성 등급 매김으로부터 결정되는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 12 항에 있어서,

상기 관련성 등급 매김은, 상기 선택된 유저가 객체와 관련시킨 태그의 등급 매김, 제 1 및 제 2 유저에 대한 검색 활동 사이의 유사성 계측값, 제 1 유저 및 제 2 유저 사이의 연결 계측값, 또는 이들의 임의의 조합으로부터 결정되는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 9 항에 있어서,

상기 다수의 객체를 조직화하는 단계는, 관련성 점수에 기초하여 다수의 객체를 순서화하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정 하는 방법.
제 9 항에 있어서,

상기 다수의 객체를 조직화하는 단계는, 그래픽 구성요소로 다수의 객체들 중 적어도 하나를 마킹하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 1 항에 있어서,

객체와 태그를 연관시키는 단계는, 유저에 제공된 영역에서 태그를 입력하는 단계, 상기 태그를 등급 매김하는 단계, 상기 객체에 대한 링크를 차단하는 단계, 상기 태그를 선택하는 단계, 또는 상기 객체를 선택하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 1 항에 있어서,

객체와 태그를 연관시키는 단계는, 북마크를 검사하는 단계 또는 상기 태그를 사용하여 객체에 대한 검색을 수행하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 1 항에 있어서,

상기 다수의 객체는, 웹 페이지에 대한 하이퍼링크 또는 웹 페이지에 대한 하이퍼링크의 그룹을 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 1 항에 있어서,

상기 다수의 객체는, 텍스트, 이미지, 사진, 태그, 태그의 그룹, 제목 영역, 개념, 유저 프로파일, 응답, 오디오 파일, 비디오 파일, 소프트웨어, 또는 이들의 임의 조합에 대한 하이퍼링크 또는 하이퍼링크의 그룹을 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
제 1 항에 있어서,

태그 크롤러(tag crawler)는 다수의 객체들 중 적어도 하나와 다수의 태그들 중 적어도 하나와 연관시키는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트(populate)하는 방법으로서,

다수의 객체와 연관된 다수의 태그를 태그 데이터베이스에 저장하는 단계; 및

상기 다수의 태그 및 다수의 객체 사이의 관련성 점수를 색인 데이터베이스에 저장하는 단계를 포함하되, 상기 관련성 점수는 조직화된 결과 리스트에서 다수 의 문서를 조직화하기 위해 사용된, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
제 21 항에 있어서,

태그 데이터베이스에 다수의 태그를 저장하는 단계는, 다수의 태그를 형성하는 용어를 저장하는 단계를 포함하되, 추가로 관련성 점수를 저장하는 단계는 용어 및 객체 사이의 관련성을 나타내는 관련성 점수를 저장하는 단계를 포함하는, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
제 22 항에 있어서,

색인 데이터베이스에, 다수의 색인을 저장하는 단계를 더 포함하되, 각 색인 엔트리는 다수의 용어로부터의 용어, 다수의 객체로부터 대응하는 객체, 및 용어 및 객체 사이의 대응하는 관련성 점수에 대응하는, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
제 23 항에 있어서,

용어 및 객체 사이의 각 대응하는 관련성 점수는 상기 객체와 용어를 연관시킨 유저의 기밀성에 관련되는, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
제 23 항에 있어서,

용어 및 객체 사이의 관련성 점수는 통계적 분류 또는 랭크 회귀 알고리즘으로부터 결정되는, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
제 25 항에 있어서,

상기 통계적 분류 또는 랭크 회귀 알고리즘은 기호논리적 회귀, 지지 벡터 머신, 분류 또는 회귀 트리 및 부스팅된 트리 앙상블 중 어느 하나인, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
제 21 항에 있어서,

용어를 포함하는 검색 질의에 응답하여 유저에게 결과 리스트를 제공하는 단계;

상기 유저에 의해 결과 리스트에 포함된 객체에 상기 용어를 연관시키는 단계; 및

상기 용어와 객체 사이의 관련성 점수를 결정하는 단계를 더 포함하는, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
제 27 항에 있어서,

다수의 객체로부터 하나의 객체 및 그 관련 태그 사이의 관련성 점수는, 태 그가 상기 객체와 연관되는 횟수, 상기 객체와 연관된 총 개수의 태그, 태그가 다수의 객체들 중 어느 하나와 연관되는 횟수, 모든 다수의 객체와 연관된 태그의 수, 태그가 상기 객체와 연관된 시간, 객체가 북마크된 횟수, 객체에 적용된 등급 매김의 값 및 수, 또는 이들의 임의 조합인, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
결과 리스트에서 디스플레이를 위해 다수의 객체를 조직화하는 방법으로서,

다수의 객체와 연관된 태그와 검색 질의에서의 용어를 상관시키는 단계; 및

상기 상관 관계에 기초하여 조직화된 다수의 개체를 포함하는 결과 리스트를 반환하는 단계

를 포함하는, 결과 리스트에서 디스플레이를 위해 다수의 객체를 조직화하는 방법.
제 29 항에 있어서,

검색 질의를 실행하여, 객체의 제 1 리스트를 생성하는 단계; 및

상관에 기초하여 다수의 객체를 조직화하는 단계를 더 포함하는, 결과 리스트에서 디스플레이를 위해 다수의 객체를 조직화하는 방법.
제 30 항에 있어서,

객체와 태그를 연관시키는 단계를 더 포함하는, 결과 리스트에서 디스플레이 를 위해 다수의 객체를 조직화하는 방법.
제 30 항에 있어서,

각 상관은 관련성 계측값에 대응하는, 결과 리스트에서 디스플레이를 위해 다수의 객체를 조직화하는 방법.
제 29 항에 있어서,

검색 질의에서 다수의 객체 및 용어 사이의 관련성 계측값을 결정하기 위해 다수의 객체에 통계적 분류 또는 랭크 회귀 알고리즘을 적용하는 단계를 더 포함하는, 결과 리스트에서 디스플레이를 위해 다수의 객체를 조직화하는 방법.
제 33 항에 있어서,

상기 통계적 분류 또는 랭크 회귀 알고리즘은 기호논리적 회귀, 지지 벡터 머신, 분류 또는 회귀 트리 및 부스팅된 트리 앙상블 중 어느 하나인, 결과 리스트에서 디스플레이를 위해 다수의 객체를 조직화하는 방법.
검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템으로서,

객체와 연관된 태그를 저장하는 태그 데이터베이스; 및

상기 태그 데이터베이스에 연결된 태그 분석기를 포함하되, 상기 분석기는 검색 질의에 대한 다수의 객체의 관련성 점수를 결정하기 위해 프로그래밍된, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
제 35 항에 있어서,

객체와 연관된 태그 및 객체 사이의 관련성 점수, 또는 객체에 대한 북마크 사이의, 관련성 점수 또는 둘 다를 저장하는 객체 색인을 더 포함하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
제 35 항에 있어서,

관련성 점수는 태그 및 객체를 형성하는 용어에 대한 가중치가 부여된 관련성 점수를 합산함으로써 결정되는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
제 35 항에 있어서,

용어를 포함하는 검색 질의와 객체 사이의 관련성 점수는, 검색 질의에서 용어를 포함하는 태그의 수, 검색 질의에 포함된 태그가 태그 데이터베이스에서 포함되는 횟수, 객체와 연관되는 태그의 수, 일치하는 태그 내 및 검색 질의 내의 용어의 수, 객체가 북마크되는 횟수, 객체각 등급이 매겨지는 횟수, 또는 이들의 임의 조합인, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
제 35 항에 있어서,

태그 및 객체에 대한 관련성 점수는 객체 내의 태그의 위치, 객체 내의 태그의 빈도, 객체 내의 태그의 밀도, 또는 이들의 조합이 기초하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
제 35 항에 있어서,

태그 및 객체 사이의 관련성 점수의 가중치를 매기는 것은, 객체와 태그를 연관시킨 유저에 할당된 기밀성(confidence)의 레벨에 기초하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
제 35 항에 있어서,

통계적 분류 또는 랭크 회귀 알고리즘, 클러스터링(clustering) 분석 알고리즘, 또는 형태론적 분석 알고리즘을 사용하여 결정되는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
제 41 항에 있어서,

상기 통계적 분류 또는 랭크 회귀 알고리즘은 기호논리적 회귀, 지지 벡터 머신, 분류 또는 회귀 트리 및 부스팅된 트리 앙상블 중 어느 하나인, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
제 36 항에 있어서,

객체 색인에 연결된 검색 엔진을 더 포함하되, 상기 검색 엔진은 태그에 대응하는 용어를 포함하는 검색 질의를 수신하고, 태그-객체 쌍에 대한 관련성 점수에 기초한 조직화된 결과를 반환하도록 프로그래밍되는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
제 43 항에 있어서,

검색 엔진에 연결된 유저 데이터베이스를 더 포함하되, 상기 유저 데이터베이스는 검색 질의에 관련된 정보를 포함하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
제 44 항에 있어서,

검색 질에 관련된 정보는 유저에 의해 후속된 링크, 객체와 연관된 태그, 유저에 의해 차단된 객체, 북마크, 또는 이들의 조합을 포함하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
제 35 항에 있어서,

상기 객체는 웹 페이지에 대한 하이퍼링크 또는 웹 페이지에 대한 하이퍼링크의 그룹을 포함하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
제 35 항에 있어서,

상기 객체는, 텍스트, 이미지, 사진, 태그, 태그의 그룹, 제목 영역, 개념, 유저 프로파일, 응답, 오디오 파일, 비디오 파일, 소프트웨어, 또는 이들의 임의 조합에 대한 하이퍼링크 또는 하이퍼링크의 그룹을 포함하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
제 35 항에 있어서,

객체와 태그를 연관시키는 수단을 더 포함하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.