KR20080031928A - 태그를 분석하여 관련 문서를 찾기 위한 시스템 및 방법 - Google Patents

태그를 분석하여 관련 문서를 찾기 위한 시스템 및 방법 Download PDF

Info

Publication number
KR20080031928A
KR20080031928A KR1020087002629A KR20087002629A KR20080031928A KR 20080031928 A KR20080031928 A KR 20080031928A KR 1020087002629 A KR1020087002629 A KR 1020087002629A KR 20087002629 A KR20087002629 A KR 20087002629A KR 20080031928 A KR20080031928 A KR 20080031928A
Authority
KR
South Korea
Prior art keywords
tag
objects
relevance
user
term
Prior art date
Application number
KR1020087002629A
Other languages
English (en)
Other versions
KR101361182B1 (ko
Inventor
윤샨 루
마이클 탄네
Original Assignee
윙크 테크놀로지스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윙크 테크놀로지스 인코포레이티드 filed Critical 윙크 테크놀로지스 인코포레이티드
Publication of KR20080031928A publication Critical patent/KR20080031928A/ko
Application granted granted Critical
Publication of KR101361182B1 publication Critical patent/KR101361182B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

검색 질의에 대한 객체의 관련성을 결정하는 방법은, 다수의 태그를 다수의 객체에 연관시키는 단계, 상기 다수의 객체에 북마크를 기록하는 단계, 또는 위 2가지 단계 모두, 및 다수의 객체와 검색 질의 각각에 대한 관련성 점수를 결정하는 단계를 포함한다. 이 방법의 일 실시예는 풀-텍스트 관련성 알고리즘을 태그 관련성 알고리즘과 결합시킨다. 다른 실시예는 통계상 분류 또는 순위 회구 알고리즘과 같은 통계상 관련성 알고리즘을 포함한다. 유저가 검색 질의를 실행할 때, 그 객체를 포함하는 결과 리스트가, 관련성 점수에 기초하여 조직된 그 객체와 함께 반환된다. 객체는, 예컨대 먼저 가장 높은 관련성 점수를 지닌 것을 열거하고, 그것들을 그것들의 관련성을 표시한 것으로 표시함으로써 조직된다. 바람직하게, 태그-객체 쌍에 대한 관련성 점수는, 그 태그에서의 기간이 그 객체와 연관된 횟수, 그 객체와 연관된 태그의 개수, 그 태그가 다수의 객체와 연관된 횟수, 그 태그에서의 기간을 포함하는 태그-객체 쌍의 개수, 그 객체에 대한 기준을 포함하는 태그-객체 쌍의 개수, 또는 이들의 임의의 조합에 기초한다.

Description

태그를 분석하여 관련 문서를 찾기 위한 시스템 및 방법{SYSTEMS FOR AND METHODS OF FINDING RELEVANT DOCUMENTS BY ANALYZING TAGS}
본 출원은 본 명세서에 그 전문이 참조로 통합되어 있고, 2005년 8월 3일 "Techniques for Finding Relevant Documents Using Analysis of Tags"라는 제목으로 출원되고 공동 계류중인 미국 가출원 일련 번호 60/705,704호의 35 U.S.C. §119(e) 하의 우선권을 주장한다.
본 발명은 문서를 검색하는 것에 관한 것이다. 더 구체적으로는, 본 발명은 검색 결과의 품질 또는 관련성을 개선하기 위해, 사람들에 의해 생성된 태그를 분석함으로써, 인터넷에서 정보를 검색하는 시스템 및 방법에 관한 것이다.
인터넷 검색 엔진은 인터넷에 포함되어 있는 광범위한 정보 중에서 바라는 정보의 위치를 찾도록 설계된다. 유저(user)는 검색 용어를 포함하는 질물을 입력하여 찾고자 하는 정보를 서술한다. 검색 엔진은 유저가 찾는 정보에 가장 가깝게 관련되는 웹(web) 페이지를 식별한 목적을 지닌 다양한 관련성 계산을 사용하여 웹 페이지의 색인과 그 검색 용어를 매칭시킨다. 이후 검색 엔진은 이들 웹 페이지에 하이퍼링크(hyperlink)의 순위가 정해진 리스트를 반환하는데, 이 경우 리스트의 상부에 더 가까운 가장 관련성이 있는 것으로 생각된 페이지에 링크된다.
검색 엔진의 목적은 주어진 질의에 대한 가장 관련성 있는 웹 페이지를 전달하는 것이다. 검색 엔진은, 예컨대 웹 페이지 사이의 하이퍼링크에 관련된 정보를 고려하여 문서 내의 검색 용어의 존재, 밀도, 및 근접성과 같은 각 페이지 내에 포함된 정보 또는 결과나 웹 페이지를 클릭(clicking on), 브라우징(browsing) 또는 등급을 매기는 것(rating)과 같은 유저의 행동을 고려함으로써, 다양한 기술을 사용하여 웹 페이지의 관련성을 결정한다. 이들 기술은 최상의 결과를 달성하기 위해, 개별적으로 적용되거나 다양하게 결합되어 함께 적용될 수 있다.
어느 웹 페이지가 가장 관련성이 있는지를 결정하는 프로세스는 매우 어려운데, 이는 인터넷 상의 웹 페이지의 개수가 매우 크고 늘어나고 있으며, 종종 명목상 유저의 질의를 충족시키는 많은 수의 웹 페이지가 존재하기 때문이다. 또한, 대부분의 유저는 형식이 잘 갖추어진 질의를 생성하고 입력하는 프로세스에서 정교하지 못하기 때문에 유저가 찾는 정보의 타입이 무엇인지가 애매모호할 경우가 있다. 그러므로, 질의에서의 단어들과 문서에서의 단어들을 비교함으로써, 어느 문서가 그 질의에 가장 관련성이 있는지를 결정하는 것은, 정확도가 제한된 결과를 제공한다.
유저가 인터넷을 브라우즈 또는 검색할 때, 웹 페이지, 이미지, 토픽, 웹로그(Weblog){"블로그(blog)라고도 한다}과 같은 다양한 객체 또는 다른 객체를 그 객체에 대한 기준(reference)을 기록함으로써, "북마크(bookmark)"할 수 있다. 이들 북마크는 유저가 객체와 연관시키는 하나 이상의 조건으로 이루어지는 하나 이상의 태그(tag), 그 객체에 대한 하이퍼링크(hyperlink)(URL: Uniform Resource Locator), 그 관계를 기록하기 위한 메커니즘, 및 잠재적인 다른 정보를 포함할 수 있다. 이들 북마크는 유저가 그 객체와 임의의 태그를 다시 불러 그 북마크된 객체가 무엇에 대한 것인지를 상기하거나 다른 유저와 의사 교환을 하는 것을 돕는다. 예컨대, 유저가 지붕 위에 올리는 태양 전력 패널을 서술하는 웹 페이지를 방문하면, 유저는 "태양 전력(solar power)"이라는 용어를 사용하는 웹 페이지를 북마크하고 그 웹 페이지와 태그를 연관시킨다. 유저는 주(State) 태양 전력 리베이트(rebate) 프로그램에 대한 또다른 웹 페이지와, "태양 전력"이라는 용어를 사용하는 동일한 태그를 연관시킬 수도 있다. 그 결과, "태양 전력"이라는 용어를 지닌 태그는 2가지 웹 페이지 모두와 연관된다.
서버 애플리케이션, 북마크 툴바(toolbar)에서의 작은 애플릿(applet), 브라우저 플러그-인(plug-in) 또는 익스텐션(extention), 클라이언트 애플리케이션 또는 일부 다른 애플리케이션을 사용하는 것과 같이, 유저가 태그를 입력할 수 있는 여러 방식이 존재한다. 일단 태그가 입력되면, 그러한 태그와 연관된 이들 웹 페이지를 디스플레이하기 위해, 이들 태그에 대해 유저가 검색하는 것을 허용하는 것이 흔한 일이다. 지금까지로서는, 유저가 그들 자체의 태그를 검색하거나 다른 사람들의 태그를 검색하는 것을 허용하는 서비스가 생성되었다.
북마크는 유저가 웹 페이지와 같은 객체를 평가한다는 어떤 종류의 표시를 제공하고, 태그는 부가적으로 유저가 그 객체와 일정한 용어 또는 용어들을 연관시킨다는 어떤 종류의 표시를 제공한다. 이 정보는 웹 페이지가 검색 엔진으로부터의 질의의 결과로서 디스플레이되어야 하는지 여부를 결정하는 데 있어 잠재적으로 귀 중한 것인데, 이는 그것이 그 웹 페이지에 대한 실제 사람의 관심도와 특별한 주제와의 연관성의 표시이기 때문이다.
어느 웹 페이지, 이미지, 블로그 또는 다른 객체가 유저의 질의에 관련되는지를 결정하는 데 있어, 다양한 웹 페이지, 이미지, 블로그 또는 다른 객체와 연관된 태그를 고려하는 검색 엔진을 가지는 것이 바람직할 수 있다.
본 발명의 실시예는 검색 질의에 응답하여 유저에게 객체(결과 리스트)의 리스트를 제공한다. 이 결과 리스트는 그 질의에 대한 각 객체의 관련성에 기초하여 조직된다. 바람직하게, 관련성은 그 객체를 태그하는 것(tagging), 그 객체를 북마크하는 것(bookmarking), 또는 그 2가지 모두, 또는 어떤 검색에 대한 객체의 관련성 또는 값을 표시하기 위한 임의의 다른 유저의 액션(action)에 기초한다.
본 발명의 일 양상에서, 어떤 질의에 다수의 객체의 관련성을 결정하는 방법은, 객체들에 대한 "북마크" 참조를 기록하는 단계 및/또는 이들 객체와 다수의 태그를 연관시키는 단계, 및 임의의 주어진 질의에 대한 상기 다수의 객체의 각 객체에 대한 관련성 점수를 결정하는 단계를 포함한다. 이 방법은 검색 질의에 응답하여 반환된 결과 리스트 내에서 디스플레이하기 위해 나중에 객체들을 조직하기 위해 사용된다. 객체들은 웹 페이지로의 하이퍼링크 또는 하이퍼링크의 그룹, 텍스트, 이미지, 사진, 태그, 태그의 그룹, 주제 영역, 개념, 오디오 파일, 비디오 파일, 소프트웨어, 또는 이들의 임의의 조합을 포함한다.
다수의 태그로부터의 각 태그는 하나 이상의 용어를 포함한다. 이 방법은 또한 하나 이상의 용어로부터의 각 용어를 한 객체와 연관시켜 하나 이상의 대응하는 용어-객체 쌍을 한정하고, 그 용어와 그 객체 사이의 관련성의 정도를 표시하는 용어 점수를 각각의 용어-객체 쌍에 대해 결정하는 단계를 포함한다. 대안적으로, 또는 부가적으로, 이 방법은 또한 객체를 북마크하는 단계를 포함한다.
바람직하게, 태그-객체 쌍에 대한 관련성 점수는 그 태그에서의 각 태그에 대한 용어-객체 쌍에 대한 용어 점수를 결합함으로써 결정된다. 용어 점수는 그것들을 합하거나 그것들에 가중치를 부여하여 가중치가 부여된 용어 점수를 합산함으로써 결합될 수 있다.
일 실시예에서, 태그-객체 쌍에 대한 관련성 점수는 태그에서의 용어가 그 객체와 연관되는 횟수, 그 객체와 연관된 태그의 수, 태그가 다수의 객체와 연관되는 횟수, 또는 이들의 임의의 조합으로부터 결정된다. 태그-객체 쌍에 대한 관련성 점수는 태그에서의 용어를 포함하는 태그-객체 쌍의 수, 그 객체에 대한 기준을 포함하는 태그-객체 쌍의 수 또는 이들 두 가지 모두로부터 결정될 수 있다.
또다른 실시예에서, 이 방법은 또한 제 1 유저에 의해 다수의 객체로부터 하나의 객체와 태그를 연관시키는 단계, 제 2 유저에 의해 그 태그에서의 하나 이상의 용어를 포함하는 검색 질의를 수행하는 단계, 그 관련성 점수에 기초한 결과 리스트에서 다수의 객체를 조직화하는 단계, 이를 통해 조직된 결과 리스트를 한정하는 단계, 및 제 2 유저에게 조직된 결과 리스트를 반환하는 단계를 포함한다. 한 객체에 대한 관련성 점수와 검색 질의는 객체에 존재하거나 그것과 연관된 검색 질의 용어 각각에 대한 관련성 점수에 대응한다. 대안적으로, 또는 부가적으로, 다수의 태그-객체 쌍으로부터의 태그-객체 쌍에 대한 관련성 점수는 제 1 유저가 다수의 객체 중 어느 하나와 연관된 태그의 개수, 제 1 유저와 제 2 유저가 태그와 연관된 객체의 개수, 객체의 등급을 매기는 것, 객체를 북마크하는 것 또는 이들의 임의의 조합으로부터 결정된다.
또다른 실시예에서, 태그-객체 쌍에 대한 관련성 점수는 제 1 유저와 제 2 유저 중 선택된 한 사람, 또는 둘 다에 관련성 등급 매김으로부터 결정된다. 관련성 등급 매김은 선택된 유저가 객체와 연관된 태그에 대한 등급 매김, 북마킹, 태깅, 또는 제 1 유저와 제 2 유저에 대한 검색 활동성 사이의 유사성 계측값, 제 1 유저와 제 2 유저 사이의 관계 계측값, 또는 이들의 임의의 조합으로부터 결정된다.
다수의 객체는 그것들이 관련성 점수(예컨대, 가장 높은 등급이 먼저 열거된다)에 기초하도록 지시하거나 그래픽 요소로 다수의 객체 중 적어도 하나를 마킹함으로써 조직될 수 있다.
태그 또는 북마크 또는 랭킹은 태그를 유저에 제시된 필드에 입력하고, 그 태그의 등급을 매기며, 그 객체로의 링크를 차단(그로 인해 "네거티브" 연관성을 만든다)하고, 그 태그를 선택하며, 북마크를 검사하거나 그 태그를 사용하여 그 객체에 대한 검색을 수행함으로써, 객체와 연관될 수 있다. 일 실시예에서, 태그 크롤러(crawler)는 적어도 하나의 다수의 태그를 적어도 하나의 다수의 객체와 연관시킨다.
본 발명의 제 2 양상에서는, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법은, 다수의 객체와 연관된 다수의 태그를 태그 데이터베이스에 저장하는 단계와, 다수의 태그 및 다수의 객체 사이의 관련성 점수를 색인 데이터베이스에 저장하는 단계를 포함한다. 이 관련성 점수는 조직화된 결과 리스트에서 다수의 문서를 조직화하기 위해 사용된다.
다수의 태그는 그것을 형성하는 용어를 저장함으로써, 태그 데이터베이스에 저장된다. 관련성 점수는 용어와 객체 사이의 관련성을 표시한다. 이 방법은 또한 색인 데이터베이스에 다수의 색인을 저장하는 단계를 포함한다. 각 색인 엔트리는 다수의 용어로부터의 용어, 다수의 객체로부터의 대응하는 객체, 및 그 용어와 객체 사이의 대응하는 관련성 점수에 대응한다.
일 실시예에서, 각각의 관련성 점수는 용어를 그 객체와 연관시키는 유저의 신뢰도 등급 매김과 관련된다. 대안적으로, 또는 부가적으로 용어와 객체에 대한 각 관련성 점수는 객체가 북마크된 개수 또는 객체에 주어진 등급 매김의 값과 개수로부터 결정된다. 대안적으로, 또는 부가적으로 용어와 객체 사이의 각각의 관련성 점수는, 통계적 분류 또는 기호논리적 회귀(logistic regression), 지지 벡터 머신, 분류 또는 회귀 트리(tree) 또는 부스팅된(boosted) 트리 앙상블(tree ensemble)과 같은 랭크 회귀 알고리즘으로부터 결정된다.
이 방법은 또한 용어(들)를 포함하는 검색 질의에 응답하여 유저에게 결과 리스트를 제공하는 단계, 상기 유저가 결과 리스트에 포함된 객체에 상기 용어를 연관시키는 단계, 및 상기 용어와 객체 사이의 관련성 점수를 결정하는 단계를 포함한다. 다수의 객체로부터 하나의 객체 및 그 관련 태그로부터 객체 사이의 관련성 점수는, 태그가 상기 객체와 연관된 개수, 상기 객체와 연관된 총 개수의 태그, 태그가 다수의 객체들 중 어느 하나와 연관된 횟수, 모든 다수의 객체와 연관된 태그의 수, 태그가 상기 객체와 연관된 시간 또는 이들의 임의의 조합으로부터 결정된다.
본 발명의 제 3 양상에서는, 결과 리스트에서 디스플레이를 위한 다수의 객체를 조직화하는 방법이 다수의 객체와 연관된 태그와 검색 질의에서의 용어를 상관시키는 단계와, 상기 상관에 기초하여 조직화된 다수의 개체를 포함하는 결과 리스트를 반환하는 단계를 포함한다.
본 발명의 제 4 양상에서는, 검색 질의에 응답하여 검색 결과 리스트를 반환하기 위한 시스템이 객체와 연관된 태그를 저장하는 태그 데이터베이스와, 이 태그 데이터베이스에 연결된 태그 분석기를 포함한다. 객체는 웹 페이지로의 하이퍼링크, 하이퍼링크의 그룹, 텍스트, 이미지, 사진, 태그, 태그의 그룹, 주제 영역, 개념, 오디오 파일, 비디오 파일, 소프트웨어, 또는 이들의 임의의 조합을 포함한다. 바람직하게, 이 객체들은 웹 페이지로의 하이퍼링크이다.
이 태그 분석기는 태그와 객체 사이의 관련성 점수를 결정하기 위해 프로그래밍된다. 일 실시예에서, 이 시스템은 또한 태그와 객체 사이의 관련성 점수를 저장하기 위핸 객체 색인을 포함한다.
일 실시예에서, 관련성 점수는 태그 및 객체를 형성하는 용어에 대해 가중치가 부여된 관련성 점수를 합산함으로써 결정된다. 또다른 실시예에서, 용어를 포함하는 검색 질의와 객체 사이의 관련성 점수는, 그 검색 질의에서 용어를 포함하는 태그의 수, 검색 질의에 포함된 태그가 태그 데이터베이스에서 포함되는 횟수, 객체와 연관된 태그의 수, 일치하는 태그 내 및 검색 질의 내의 용어의 수, 또는 이들의 임의의 조합으로부터 결정된다. 또다른 실시예에서는, 태그와 객체에 대한 관련성 점수가 그 객체 내의 태그의 위치, 그 객체 내의 태그의 빈도수, 그 객체 내의 태그의 밀도, 또는 이들의 임의의 조합에 기초한다.
일 실시예에서, 태그와 객체 사이의 관련성 점수에 가중치를 매기는 것은, 객체와 태그를 연관시킨 유저에 할당된 기밀성(confidence) 레벨(기밀성 등급 매김)에 기초한다. 그 관련성 점수는 통계적 분류 또는 랭크 회귀 알고리즘, 클러스터링(clustering) 분석 알고리즘, 또는 형태론적(morphological) 분석 알고리즘을 사용하여 결정된다. 이 통계적 분류 알고리즘은 기호논리적 회귀, 지지 벡터 분류, 분류 트리 분류 트리 앙상블을 포함한다.
또다른 실시예에서, 이 시스템은 또한 객체 색인에 결합된 검색 엔진을 포함한다. 이 검색 엔진은 태그에 대응하는 용어를 포함하는 검색 질의를 수신하고 태그-객체 쌍에 대한 관련성 점수에 기초한 조직화된 결과 리스트를 반환하도록 프로그래밍된다. 이 시스템은 또한 검색 엔진에 연결된 데이터베이스를 포함한다. 이 유저 데이터베이스는 유저에 의해 후속된 링크, 객체와 연관된 태그, 유저에 의해 차단된 객체, 또는 이들의 임의의 조합과 같은 검색 질의에 관련된 정보를 포함한다.
도 1은 본 발명의 일 실시예에 따른, 태그를 분석함으로써 적어도 부분적으 로 이끌어 낸 검색 결과 리스트를 디스플레이하는 그래픽 유저 인터페이스(graphical user interface)의 개략도.
도 2는 본 발명의 일 실시예에 따른, 순위 매김(ranking) 문서의 프로세스에 태그를 적용할 수 있는 인터넷 검색 적용 동작을 도시하는 흐름도.
도 3은 본 발명의 일 실시예에 따른, 인터넷 검색 적용의 구성 성분을 도시하는 개략도.
도 4는 본 발명의 일 실시예에 따른, 태그 데이터를 준비하고 분석하기 위한 프로세스를 도시하는 흐름도.
도 5는 본 발명의 일 실시예에 따른, 태그 데이터를 사용하는 결과를 계산하기 위한 단계들을 도시하는 흐름도.
도 6은 본 발명의 일 실시예에 따른, 인터넷 검색 적용의 구성 성분을 도시하는 하드웨어 도면.
도 7은 본 발명의 일 실시예에 따른, 문서 색인을 도시하는 도면.
일반적인 검색 엔진과는 달리, 본 발명의 실시예는 인터넷을 검색하는 유저에게 더 많은 관련 정보를 제공하기 위해 태그 및/또는 북마크를 사용한다. 일 실시예에서, 검색 엔진은 질의를 수신하고 관련 문서들 또는 문서들의 그룹의 리스트를 결정하기 위해 확립된 방법을 구현하고, 관련 문서들 또는 문서들의 그룹들의 리스트를 결정하기 위해 문서들 또는 문서들의 그룹들과 연관된 태그들을 분석하며, 결과 리스트를 유저에게 전달하기 위해 동일한 방식으로 2개의 리스트를 결합 한다. 다음에 오는 예들이 문서의 검색 및 반환을 서술하는데 반해, 본 발명은 몇 가지 말하자면, 웹 페이지, 텍스트, 이미지, 사진, 태그, 태그의 그룹, 주제 영역, 개념, 프로파일, 대답, 오디오 파일, 비디오 파일, 소프트웨어, 또는 이들의 임의의 조합에 하이퍼링크 또는 하이퍼링크의 그룹 - 하지만 이들에 제한되지는 않는다 - 을 포함하는 임의의 객체를 검색 및 반환하기 위해 사용될 수 있다는 점을 알게 된다.
예컨대, 본 발명에 따르면, 용어 X를 지닌 질의는 리스트의 어딘가에 있는 웹 페이지 M을 포함하는 웹 페이지들의 결과 리스트를 반환하게 된다. 그 다음 제 1 유저가 그 웹 페이지 M을 용어 X를 포함하는 태그와 연관시킨다. 어떤 질의에서 그 용어 X를 사용하여 검색을 수행하는 제 2 유저에게는, 제 1 유저에 의한 태그의 생성에 앞서 디스플레이되었던 것보다 높은 위치에 웹 페이지 M을 디스플레이할 수 있는 결과 리스트가 전달된다.
본 발명의 실시예에 따르면, 웹 페이지 M이 제 2 유저에게 더 관련된다고 간주되는 정도는, 용어 X가 웹 페이지 M에 대한 태그에서 사용되는 횟수, 웹 페이지 M과 연관된 모든 태그의 총 개수, 제 1 유저가 생성한 태그의 개수, 각 유저에 의해 북마크되거나 태그된 문서의 개수, 용어 X가 전체적으로 태그로서 사용되는 빈도수, 전체적으로 태그의 총 개수, 그 용어 X를 포함하는 태그/문서 쌍들의 개수, 그 웹 페이지 M에 대한 기준, 또는 그 모두, 제 1 사람과 제 2 사람 사이의 관계, 제 1 사람과 제 2 사람에서 또는 제 1 사람이나 제 2 사람이 속하는 그룹에서 만들어진 신뢰성 레벨(예컨대, 신뢰성 평가) - 하지만 이들에 제한되지는 않는다 - 을 포함하는 인자를 분석함으로써 결정된다. 유저들과 그들이 속하는 그룹들의 관계 또는 유사성 정도와, 어떤 유저에게 부여된 신뢰성 레벨은 모두 계측값을 사용하여 정량화될 수 있다. 예컨대, 2명의 유저 사이의 관계가 계측값이 1인 관계에 속한다고 생각하는 것은, 그 2명의 유저가 계측값이 0.5인 관계를 가지는 2명의 유저보다 더 유사(예컨대, 유사한 관심도를 가지거나 공통으로 친구를 공유하는)하다는 것을 표시할 수 있다. 부가적으로, 용어 X에 있어서 2개 이상의 단어가 존재하는 경우에는, 제 2 유저에 의해 질의에 포함되는 용어 X에 있는 단어들의 개수, 그 단어들이 어구로서 사용되는지의 여부, 단어 순서, 및 모든 이전에 언급된 인자들과 같은 다른 인자들이 분석될 수 있는데, 즉 그 분석은 또한 단어들의 상이한 조합을 분석하는 것을 포함할 수 있다.
본 발명의 다른 실시예에 따르면, 검색 엔진은 상이하게 순서가 정해져야 할 결과 리스트들을 전달하지 않을 수 있고, 오히려 포함된 문서들을 표시하기 위해 일부 그래픽 요소를 둘 수 있는데, 이는 그것들이 그것들과 연관된 태그를 가지기 때문이다.
본 발명의 다른 실시예에 따르면, 태그는 유저에 의해 명백히 문서와 연관되지 않을 수 있고, 오히려 북마크를 검사하고, 검색을 행하거나 등급을 정하는 것(rating), 차단(blocking), 세이빙(saving) 또는 클리킹과 같은 다른 유저의 행동에 의해 문서들과 연관될 수 있다.
본 발명의 다른 실시예에 따르면, 태그는 웹 페이지 또는 웹 페이지의 그룹뿐만 아니라, 이미지, 사진, 다른 태그, 태그의 그룹, 주제 영역, 유저 프로파일, 개념, 지도, 오디오 또는 비디오 파일, 소프트웨어 또는 다른 객체 - 하지만 이들에 제한되지는 않는다 - 를 포함하는 공적인 또는 사적인 임의의 식별 가능한 데이터 자원과 연관될 수 있다.
다음에 이어지는 설명에서, "검색 엔진(search engine)"이라는 용어는 입력으로서 질의를 취하고, 전자 문서 또는 웹 페이지 또는 그 웹을 통해 액세스 가능한 다른 객체에 대한 하이퍼링크의 결과 리스트를 반환하는 장치(또는 범용 컴퓨터에서 실행되는 프로그램)를 가리키기 위해 사용된다. 이 검색 엔진은 문서의 언어 자료(corpus), 코드 및 각 문서의 관련성을 결정하는 알고리즘의 색인과, 결과 리스트를 유저에게 전달하는 그래픽 유저 인터페이스를 포함한다.
다음에 이어지는 설명 전체에 걸쳐, "질의(query)"라는 용어는 검색 조건의 세트를 이미 끼워넣거나 임의의 다른 인터페이스에 의해 제출된 "링크(link)"를 통해 타이핑되고, 말해지며 제출되었는지에 대해 검색 엔진에 제출된 조건의 세트를 가리킨다. 질의는 단일 단어, 다수 단어, 또는 어구를 포함할 수 있다. 이 질의는 문제{예컨대, "자연 언어(natural language)" 질의}, 치밀하지 못한 용어의 집합, 또는 구조화된 부울 표현식(structured Boolean expression)과 같이 말로 표현될 수 있다. 실제로, 질의는 검색 문자를 포함하거나 검색 문자에 관련된 전자 문서나 웹 페이지를 검색하기 위해 검색 엔진에 의해 사용된 부호(symbol)나 임의의 다른 문자를 포함할 수 있다.
다음에 이어지는 설명 전체에 걸쳐, "웹 사이트(Web site)"라는 용어는 월드 와이드 웹 상에서 이용 가능하고 함께 링크되는 웹 페이지의 집합체를 가리키기 위 해 사용된다. "웹 페이지(Web page)"라는 용어는 웹 사이트 상에서 발표되고 임의의 개수의 호스트로부터 월드 와이드 웹을 통해 액세스 가능한 문서를 가리키고, 텍스트, 비디오, 이미지, 음악, 및 그래픽 - 하지만 이들에 제한되지는 않는다 - 을 포함한다.
다음에 이어지는 설명 전체에 걸쳐, "결과 리스트(results list)"라는 용어는, 문서, 객체(이미지와 비디오 - 하지만 이들에 제한되지는 않는다 - 를 포함하는 전술한 바와 같은) 또는 웹 페이지를 액세스하기 위해 임의의 다른 프로토콜이나 하이퍼텍스트 전송 프로토콜(HTTP)을 사용하여 액세스 가능한 웹 페이지를 참조문으로 인용하는 하이퍼링크 또는 하이퍼링크의 그룹, 또는 문서의 제목, 문서의 요약, 연관된 태그의 개수나 다른 관련성 계측값, 연관된 태그의 리스트, 문서의 캐싱된(cached) 복사물에 대한 링크, 문서가 마지막으로 색인되거나 마지작으로 수정된 날짜, 그 문서와 연관되거나 그 문서 내에 위치한 이미지, 그 문서로부터 추출된 정보, 및 그것을 북마크했거나 태그했었을 유저 - 하지만 이들에 제한되지는 않는다 - 를 포함하는 각 링크에 대한 다른 연관된 정보와 함께 다른 전자 문서를 가리킨다.
다음에 이어지는 설명 전체에 걸쳐, "태그(tag)"라는 용어는 각각 하나 이상의 단어로 이루어지는 하나 이상의 요소, 주소 지정 가능한 객체를 인용하는 하이퍼링크, 태그가 생성된 시간, 및 그 태그를 생성한 유저와 같은 다른 정보 중 임의의 것을 포함하는 임의의 데이터 구조를 가리킨다. 태그는, 인터넷이나 로컬(local) 컴퓨터 저장 디바이스에 있는 컴퓨터 네트워크 상의 웹 페이지, 이미지, 지도, 또는 다른 객체와 같은 다양한 객체로의 링크를 포함할 수 있다. 태그하는 것(tagging)은 또한 주소 지정 가능한 문서 또는 객체로의 특별한 하이퍼링크를 용어와 연관시키는 프로세스를 가리킬 수 있다.
본 명세서에서 사용된 것처럼, "북마크(bookmark)"라는 용어는 하이퍼링크, 북마크를 만드는 유저의 아이디(identity), 북마크가 만들어진 시간, 및 위에서 한정된 것과 같은 태그 중 임의의 것을 기록하는 임의의 데이터 구조를 가리킨다.
본 명세서에서 사용된 것처럼, "문서(document)"라는 용어는 넓게 한정되고, 그것의 일상적인 의미 외에, 컴퓨터 파일과 웹 페이지를 포함한다. "문서"라는 용어는 텍스트를 포함하는 컴퓨터 파일에 제한되지 않고, 유저 프로파일, 개념, 대답과, 그래픽, 오디오, 비디오, 및 다른 멀티미디어 데이터를 포함하는 컴퓨터 파일을 포함한다. 유저 프로파일은, 정보의 몇 가지만 말하자면 관심, 취미, 친구 리스트, 사진, 전문적인 경험, 및 교육과 같은 어떤 사람에 대한 정보 - 하지만 이들에 제한되지는 않는다 - 를 포함하는 페이지나 기록이다.
본 명세서에서 사용된 것처럼, "스패머(spammer)"라는 용어는 검색 엔진의 관련성 방법론을 이용하도록 설계된 임의의 개수의 기술을 사용하여, 그렇지 않으면 검색 엔진이 디스플레이한 것보다 높은 랭크 또는 더 큰 빈도수를 지닌 제품(product), 웹 페이지 또는 다른 물질로의 검색 엔진 디스플레이 링크를 가지려고 시도하는 사람 또는 실체(entity)로서 한정된다.
본 명세서에서 사용된 것처럼, "프로그래밍된(programmed)"라는 용어는 저장, 처리, 전송과 같은 컴퓨터 명령어를 실행하거나 그 외에 데이터를 조작하기 위 해 사용된 다른 수단, 하드웨어, 소프트웨어, 펌웨어의 임의의 조합을 의미한다.
아래에 더 상세히 설명되는 것처럼, 검색 엔진은 유저에 의해 입력된 질의를 취하고, 유저가 찾은 정보에 가장 관련되는 것 같은 문서를 식별할 목적을 지닌 다양한 관련성 계산을 사용하여, 문서의 색인과 검색 용어를 매칭시킨다. 이후 검색 엔진은 리스트의 상부에 더 가까운 가장 관련성이 있다고 생각되는 이들 문서로의 하이퍼링크의 등급이 매겨진 리스트를 반환한다. 본 발명에 따르면, 유저는 용어를 문서와 연관시키는 태그를 생성하는 능력을 가지고, 검색 엔진은 웹 페이지와 연관된 태그의 분석에 적어도 부분적으로 기초한 결과 리스트를 반환한다.
본 발명에 따르면, 태그가 주어진 질의에 대한 어떤 문서의 관련성에 영향을 미치는 정도는, 연관시킨 유저가 부여한 확신 레벨에 관련될 수 있다. 이 확신 레벨은 유저의 태그가 과거에 어떻게 관련되는지, 유저의 관찰된 활동성이 청중에서 나머지 유저 또는 질의를 행하는 유저에 얼마나 유사한지, 유저 사이의 연결 정도와 같은 인자와 다른 인자들에 의해 결정될 수 있다.
도 1은 본 발명에 따른 질의에 응답하여 반환된 결과 페이지를 디스플레이하는 그래픽 유저 인터페이스(GUI)의 스크린 샷(shot)이다. 그 결과 리스트는 각 링크와 연관된 태그의 분석에 기초하여 재정렬(reorder)되거나 마킹(mark)될 수 있다.
결과 페이지(100)는 질의 용어를 삽입하기 위한 상자(100)와, 검색 엔진에 의해 반환된 결과 리스트를 포함하는 영역(120)을 포함한다. 영역(120)은 또한 검색 엔진에 의해 반환된 각 결과와 연관된 태그(150)의 리스트를 포함할 수 있다. 아래에 더 상세히 설명된 것처럼, 바람직한 일 실시예에서는 영역(120)에서의 결과의 일부 또는 정부가 태그(150)의 분석에 기초하여 재정렬(130)되거나, 또다른 실시예에서는 영역(120) 내의 결과가 또한 재정렬될 수 있지만, 일부는 태그 및/또는 북마크(150)의 분석이 그것들의 관련성에 영향을 미치게 된다는 것을 표시하기 위해 그래픽 요소(140)로 마킹된다. 그 결과 페이지(100)는 또한 객체의 등급을 매기기 위한 메커니즘(165)을 포함한다.
유저는 그들이 문서를 설명하는 것이라고 생각하는 용어와 문서 사이의 연관성을 확립할 수 있다. 이 프로세스는 전술한 바와 같이 "북마킹(bookmarking)" 또는 태깅(tagging)"이라고 한다. 이는 북마킹의 경우 나중에 재호출하기 위해 하이퍼링크를 기록하기 위한 메커니즘을 활성화하도록 영역(120)에서 하이퍼링크 또는 그래픽 요소(160)를 클릭하는 것에 의해, 또는 태깅의 경우에는 문서와 새로운 태그 또는 태그들을 연관시키거나 북마크 툴바에서의 익스텐션 또는 툴바 또는 애플릿을 사용하여 행해진다. 이 요소(160)는 그 문서를 "북마킹" 또는 태깅"하는 것을 제안하는 임의의 다른 표현이나 디스크와 같은 이미지, 텍스트 링크일 수 있다. 상이한 유저는 어떤 용어가 상이한 문서와 연관되는지에 대한 상이한 생각을 가질 수 있고, 풍부하고 변화된 태그의 세트가 확립될 수 있다. 그것이 본 발명에 따라 분석되는 태그의 세트이다.
유저는 그 문서가 질의에 관련된다고 생각하지 않는다면 결과 리스트로부터 문서를 차단할 수 있다. 이 프로세스를 "블로킹(blocking)"이라고 부른다. 이는 문서로의 링크를 차단하기 위한 메커니즘을 활성화하기 위해 영역(120)에서 하이퍼링 크나 그래픽 요소(170)를 클릭하여 행해진다. 이 요소(170)는 텍스트 링크, 이미지(예컨대, 도 1에서의 170) 또는 그 문서를 "차단" 또는 "제거"할 것을 제안하는 임의의 다른 표현일 수 있다. 문서를 차단(blocking)하게 되면 질의에서의 용어를 포함하는 문서에 대한 네거티브(negative) 태그를 연관시키는 결과를 가지게 된다. 상이한 유저가 어떤 용어를 상이한 문서에 연관시킬지에 대해 상이한 생각을 가지게 되므로, 때때로 어떤 문서에 대해 태그가 적절한지에 대한 불일치가 존재하게 된다. 다른 때에는, 스패머가 공공연히 잘못 인도하는(misleading) 태그를 문서와 연관시키기도 한다. 아래에 더 상세히 설명되는 것처럼, 포지티브(positive) 태그와 네거티브 태그가 의견의 차이를 상쇄하고 스팸이나 다른 잘못 인도하는 문서의 양을 줄이기 위해 사용될 수 있다.
결과 페이지(100)는 또한 질의 용어에 관련된 개념에 대한 설명을 디스플레이하기 위한 영역(180)을 포함할 수 있고, "See also"를 포함하는 영역(190)은 다른 질의 용어에 관련되는 다른 개념에 링크한다.
도 1에 도시된 예에서 보여지는 것처럼, 유저가 상자(110)에서 "U2"라는 질의 용어를 입력하고 검색을 요청할 때, 유저에게 결과 페이지(100)가 반환된다. 영역(120)은 "U2"라는 질의 용어에 관련된 객체로 링크되는 결과의 리스트를 포함한다. 바람직한 일 실시예에서, 결과(130)의 일부는 유저가 다양한 문서와 연관시킨 태그(150)의 분석에 기초하여 재정렬된다. 예컨대, www.atu2.com에 위치한 제목이 "U2 Home Page: @U2..."인 문서는, 태그(150)의 리스트에 도시된 것처럼 "U2", "U2 fan site", 및 "U2 fans"이라는 용어들로 태그되었다. 태그의 분석은 이 문서로 하 여금 그렇게 하지 않으면 가졌을 결과 리스트보다 높게 열거되게 하였다. 또다른 실시예에서는, 결과가 재정렬되거나 마킹될 수 있지만, 일부 결과는 그래픽 요소(140)로 마킹되어, 유저 태그 및/또는 북마크를 분석하는 것은 사람들이 이들 결과가 더 관련성이 있음을 알게 되었음과, 선택적으로는 그것들이 관련성이 있음을 알게 된 사람들의 인원을 표시하게 됨을 보여준다. www.u2station.com에 위치한 제목이 "U2 station"인 문서는 "U2"와 "U2 fansite"라는 용어와 태그되었고, 어떤 사람의 그래픽 요소(140)로 마킹되어 다른 유저가 그것이 관련성을 가짐을 알아냈음을 표시한다. 어떤 사람의 아이콘(icon) 외의 그래픽 요소가, 그 관련성이 다른 유저에 의해 표시되었음을 유저들에게 알리기 위해 사용될 수 있다는 것을 알게 된다.
유저가 www.u2log.com과 같은 문서에 대한 태그를 북마크 하는 것 및/또는 추가하는 것을 하기를 바란다면, 그 유저는 그래픽 아이콘(160)을 클릭할 것을 선택할 수 있고, 이는 태그를 북마킹하는 것 및/도는 추가하는 것에 대한 메커니즘을 활성화하고, 이는 그 유저에게 의미있는 일부 다른 용어나 영역(110) 내의 이미 존재하는 그 검색 용어의 태그와 동일할 수 있다. 유저가 "lyrics"와 같은 상이한 검색을 행하였다면, 그 유저는 제목이 "U2 Wanderer.org the U2 Discography and U2 Lyrics Site"인 그 문서가 질의인 "lyrics"에 대해 열거되어야 한다는 사실을 믿지 않았다면, 유저가 검색 결과로부터의 문서를 차단하기 위해 요소(170)를 클릭할 수 있으며, 이는 그 문서와 "lyrics"라는 용어를 포함하는 태그를 연관시키는 결과를 가지게 된다. 마이너스 기호("-")는 용어와 웹 페이지 사이의 연관선을 긍정하기보 다는 부정하는 것을 표시한다.
이 예를 계속하면, 영역(180)은 "U2"라는 밴드(band)를 설명하는 개념과 "U2"라는 용어에 관련된 다른 개념의 리스트를 포함한다. 영역(190)은 "Bono, U2 concerts, best selling music artists, the ONE campaign, Live 8..."과 같은 관련된 주제로의 "See also" 링크의 한 세트를 포함한다. 본 발명에 따르면, 유저가 이들 링크 중 하나, 예컨대 "Live 8"을 선택하게 되면, 검색 용어인 "Live 8"을 사용하여 질의가 이루어지고, 이는 결과 페이지(100)와 유사한 결과 페이지를 가져오며, 그 결과 페이지에서는 검색 용어(110)가 "Live 8"이고, 그 결과 리스트(120)는 그 검색 용어에 관련되는 문서로의 링크의 리스트이며, 그 리스트에서의 위치는 문서와 연관된 태그에 의해 차례로 영향을 받는다. 따라서 임의의 검색으로부터의 결과의 순서는 태깅에 의해 영향을 받는다. 주제 영역과 개념은 본 명세서에 참조로 통합되어 있고, 2006년 2월 27일에 출원된, 제목이 "Methods of and Systems for Searching by Incorporating User-Entered Information"인 미국 특허 출원 11/364,617호에 더 상세히 설명된다.
많은 수정예가 본 발명에 따라 만들어질 수 있음을 알게 된다. 예컨대, 유저 생성 태그는 단말기(terminal)로부터 직접 유저에 의한 입력보다는 또다른 서비스로부터 수입되거나 파일로부터 읽혀질 수 있다. 게다가, 결과 페이지(100)가 결과 리스트(120), 태그의 리스트(150), 개념(180), 및 개념으로의 링크(190)를 보여주고 있을지라도, 본 발명에 따르면 태그의 분석에 의해 영향을 받는 결과 페이지는 도 1에 도시된 것 외에 또는 도 1에 도시된 것을 포함하는 영역의 임의의 조합으로 또는 이들 영역 일부가 없이 디스플레이될 수 있다는 것을 알게 된다. 이 태그 정보는 검색 결과가 더 이해가 쉽게 하고, 정확하며 의미가 있도록 하기 위해 다양한 페이지 설계 요소와 결합하여 사용된다.
도 2는 본 발명에 따른 인터넷 검색 애플리케이션(200)의 동작을 도시하는 흐름도이다. 인터넷 검색 애플리케이션(200)은 검색 엔진에 질의를 제출하고 태그의 분석에 의해 적어도 부분적으로 결정된 결과를 수신하는 능력을 유저에게 제공하여, 유저에게 그렇게 하지 않으면 제공되는 것보다 더 관련성이 있는 검색 결과를 제공한다. 유저는 그 결과 리스트에 도시된 웹 페이지를 방문할 수 있고, 또한 그들이 그 페이지가 관련성이 있거나 없는지를 표시하기 위해 그러한 페이지들 중 일부를 "북마크"할 것을 선택할 수 있다. 유저는 이들 페이지를 질의 용어 또는 일부 다른 용어나 용어들로 태그할 수 있다. 검색 엔진은 제출된 임의의 태그를 기록하고 그러한 태그들을 다른 유저에 의한 나중 검색에 사용한다.
단계(210)에서는 유저는 질의를 검색 엔진에 제출한다. 이후 프로세스는 가장 관련성 있는 문서의 리스트를 모으기 위해 다양한 알고리즘을 사용하는 다양한 정보 검색 접근법을 사용하여 그 언어 자료에서의 객체에 검색 엔진이 질의를 매칭시키는 단계(220)와, 가장 관련성 있는 문서의 리스트를 모으기 위해 다양한 문서와 연관된 태그를 검색 엔진이 분석하는 단계(230) 양쪽으로 계속 진행한다. 태그의 분석은 모든 유저에게 일반적일 수 있거나 검색을 행하는 개별 유저에게 맞추어진 것이거나 유저가 회원인 그룹에 맞추어진 것일 수 있다. 단계(220, 230)은 단계(240)로 진행하여 단계(230)로부터의 결과가 단계(220)로부터의 결과와 결합되어 더 관련성 있는 결과를 제공한다. 이후 프로세스는 단계(250)로 계속되어 결과 페이지(예컨대, 도 1에서 100)가 유저에게 보내진다. 단계(250)로부터 유저는 단계(260 또는 270)로 진행할 것을 선택할 수 있다.
단계(260)에서는, 유저가 결과 리스트에서의 문서를 방문하기 위해 하나 이상의 링크를 따라간다. 대안적으로, 단계(270)에서는 유저가 북마크하고 선택적으로 태그를 입력하는데, 이들 각 태그는 결과 리스트에서의 문서 중 하나와 하나 이상의 용어를 연관시킨다. 태그를 입력하기 위해, 유저는 유저가 태그를 입력하는 유저 인터페이스를 가져오는 문서{예컨대, 도 1에서의 영역(160)}를 북마크 또는 태그하기 위한 메커니즘을 클릭할 수 있거나, 단계(260)에서는 유저가 유저의 브라우저로 로딩된 "bookmarklet"을 사용하거나 그 문서를 북마크하고 그 태그를 입력하기 위한 다른 유사한 메커니즘을 사용할 수 있다. 대안적으로, 단계(270)에서는 유저가 차단을 위한 메커니즘{예컨대, 도 1에서의 영역(170)}을 클릭함으로써, 그 질의에 관련되지 않은 문서들을 차단할 수 있다. 결과 리스트에서의 문서들을 방문하는 단계(260)로부터, 유저는 단계(270)로 진행할 수 있어 태그를 입력하고, 대안적으로 단계(270)로부터 유저는 단계(260)로 진행할 수 있다. 단계(260)와 단계(270)는 모두 단계(280)로 진행하여, 시스템이 유저에 의해 입력된 북마크, 태그, 및 랭킹을 기록한다. 단계(280)는 단계(230)로 되돌아가, 임의의 다음 검색 동안 분석되는 태그의 데이터베이스가 이제 단계(270)에서 입력된 이들 새로운 태그를 포함하게 된다. 단계(230)로 되돌아가는 것과 비교하여, 프로세스는 또한 단계(290)로 계속되어 유저는 검색을 종료한다.
도 3은 본 발명에 따른 시스템(300)의 구성 성분을 도시한다. 시스템(300)은 웹 서버(310)에 결합하는 유저 클라이언트(305)를 포함한다. 웹 서버(310)는 검색 엔진(320), 유저 데이터베이스(330), 태그 데이터베이스(340)에 결합된다. 검색 엔진(320)는 문서 색인(350)에 결합된다. 유저 데이터베이스(330)는 또한 검색 엔진(320)에 결합된다. 태그 데이터베이스(340)는 태그 분석기(360)와 태그 크롤러(crawler)(391)에 결합된다. 태그 분석기(360)는 또한 문서 색인(350)에 결합되고, 이 문서 색인(350)은 색인 작성기(indexer)(370)에 결합된다. 색인 작성기(370)는 웹 콘텐츠 데이터베이스(380)에 결합되고, 이 웹 콘텐츠 데이터베이스(380)는 웹 크롤러(390)에 결합된다. 웹 크롤러(390)와 태그 크롤러(391)는 인터넷(395)를 통해 하나 이상의 웹 사이트(399)에 결합된다.
동작시, 웹 크롤러(390)는 웹 사이트(399)를 방문하고, 액세스하는 웹 페이지의 콘텐츠를 웹 콘텐츠 데이터베이스(380)에 파퓰레이트(populate)하게 하면서, 인터넷을 항해한다. 색인 작성기(370)는 웹 콘텐츠 데이터베이스(380)를 사용하여 문서 색인(350)을 생성한다. 태그 크롤러(391)는 웹 사이트(399)를 방문하고, 찾은 태그로 태그 데이터베이스(340)를 파퓰레이트하면서 인터넷을 항해한다.
유저가 검색을 행할 때, 유저는 유저 클라이언트(305)를 사용하여 질의를 입력하고, 이는 웹 서버(310)에 제출된다. 웹 서버(310)는 그 질의를 검색 엔진(320)에 제출하여 전술한 태그 분석으로부터 이끌어 낸 인자들과 관련성 알고리즘을 사용하여 문서 색인(350)과 그 질의를 매칭시켜, 가장 관련성 있는 문서를 결정하여 웹 서버(310)에 그 결과 리스트를 반환한다. 이후 웹 서버(310)는 결과 페이지(예 컨대, 도 1에서 100)를 디스플레이를 위해 유저 클라이언트(305)에 전달한다.
또한, 그 질의에 응답하여 유저 데이터베이스(330)는 결과 리스트{예컨대, 도 1에서의 영역(120)}으로부터 이어지는 링크, 북마크되거나 등급이 매겨진{예컨대, 단계(165)} 문서, 및 태그 엔트리 메커니즘{예컨대, 도 1에서의 영역(160)}를 사용하여 입력된 태그, 네거티브 태그를 입력하는 결과를 가지는 차단 메커니즘{예컨대, 도 1에서의 영역(170)}을 사용하여 차단된 문서와 같은 유저의 검색에 대한 정보를 기록한다. 이 정보는 그 유저를 위해 다음 검색 결과를 커스터마이징하고, 그 유저의 태그를 놓을 신뢰성의 양을 결정하기 위해, 웹 서버(310)와 검색 엔진(320)에 의해 사용된다. 또한 질의에 응답하여, 태그 엔트리 메커니즘{예컨대, 도 1에서의 영역(160)}을 사용하여 입력된 태그와 차단 메커니즘{예컨대, 도 1에서의 영역(170)}을 사용하여 유저에 의해 입력된 네거티브 태그가 또한 태그 데이터베이스(340)에 기록된다. 본 발명의 실시예 내에서, 유저 데이터베이스(330)와 태그 데이터베이스(340)에 저장된 정보는 2개의 별개의 데이터베이스로서 구현될 수 있거나, 동일한 데이터베이스 내에서 구현될 수 있다.
반드시 필수적이지는 않지만 일부 알맞게 기초하여, 질의가 수행될 때, 태그 데이터베이스(340)에 포함되는 태그 정보는 태그 분석기(360)에 보내지고, 이 태그 분석기(360)에서는 그 태그 정보가 분석되어 검색 엔진(320)이 질의들에 대한 가장 관련성이 있는 웹 페이지를 결정하도록, 각 유저에 의해 각 문서와 연관된 다양한 태그에 의해 관련성에 대한 어떠한 영향이 주장되는지를 결정한다. 태그 분석기(360)는 다음 검색에서 사용하기 위해, 이러한 태그 관련성 정보를 문서 색 인(350)에 기록한다.
태그 데이터베이스(340)는 질의 용어, 유저 식별자, 문서 ID, 문서 링크, 태그 용어, 등급 매김, 및 타임 스탬프를 포함하는 특징을 태그 분석기(360)에 전송하나, 이에 한정되지는 않는다. 또한, 태그 분석기(360)는 또한 이 문서 내에 있는 용어의 밀도, 이 문서 내에 있는 용어의 위치, 이 문서의 다양한 섹션에 있는 용어의 존재, 및 이들 용어를 포함하는 문서에 대한 하이퍼링크를 포함하는 다른 특징을 주어진 문서에 대해 찾아볼 수 있지만, 이에 한정되지는 않는다. 이 태그 분석기(360)는 또한 이전 태그 이력, 북마크 이력, 기밀성의 레벨, 다른 유저와의 유사성(예를 들면, 이 유저 및 다른 유저에 의해 생성된 태그 및 사용된 용어 사이의 유사성), 및 그룹 내의 멤버쉽을 포함하는 다른 정보를 주어진 유저를 위하여 찾아 볼 수 있지만, 이에 한정되지는 않는다.
이 태그 분석기(360)는 다른 태크에 따라 다양한 문서에 대한 관련성 점수 세트를 개발하기 위해 이들 특징을 사용한다. 이들 특징을 분석하는 프로세스가 도 4에 도시되며, 이하에서 상세하게 기술된다. 임의의 소정 질의-문서 쌍에 대한 일반적인 솔루션 또는 유저 레벨에 관한 관련성을 계산하기 위해 메커니즘이 사용된다.
이전에 언급된 태그 데이터에 관한 분석이 수행된다. 일반적으로, 임의의 주어진 질의를 위하여 임의의 주어진 문서의 관련성은 질의에 있는 용어를 포함하는 태그의 개수, 임의의 주어진 태그가 태그 전부에 사용된 횟수의 개수, 이 주어진 문서를 참조하는 태그의 개수, 문서가 북마크된 횟수의 개수, 문서에 적용된 등급 매김의 값 및 번호를 포함하는 인자 함수가 될 것이지만, 이에 한정되지는 않는다. 게다가, 주어진 문서에 대한 관련성의 임의 태그에 대한 예측 능력은 만일 평가될 수 있다면, 태그를 입력한 유저에 놓이게 된 기밀성의 레벨에 비례한다. 본 발명에 따른 관련성 모델링 프로세스는 기호논리적 회귀(logicstic regression), 지지 벡터 머신, 분류 또는 회귀 트리, 또는 부스팅된 트리 앙상블(ensembles)과 같은 임의의 통계적 분류 또는 랭크 회귀 알고리즘을 포함하는 다른 방법뿐만 아니라 다른 폼의 분석을 사용하여 수행될 수 있음이 이해될 것이지만, 이에 한정되지는 않는다.
도 4는 본 발명의 일 실시예에 따라, 질의에 대한 문서의 관련성을 결정하기 위하여 준비중에 있는 태그 데이터를 준비하고 분석하는 단계들을 예시하는 흐름도(400)이다.
도 4를 참조하면, 단계(410)에서, 태그 데이터는 웹 클라이언트 및 웹 서버(예를 들면, 305, 310, 도 3) 또는 태그 크롤러(crawler)(예를 들면, 391, 도 3)를 통하여 유저에 의해 입력되고, 시스템(예를 들면, 단계 280, 도 2)에 의해 태그 데이터베이스(예를 들면, 340, 도 3)에 제출된다. 단계(410)는 연속적 토대로 처리할 수 있으며, 도 4에 의해 기술된 프로세스의 나머지 단계에 독립하여, 일 시간 기간에 걸쳐 처리할 수 있다.
단계(420)에서, 태그 데이터베이스(340, 도 3)에서의 각 태그가 분석된다. 각 태그를 분석하는 프로세스는 유저 기밀성을 계산하는 단계(430) 및 가중된 태그 카운트를 결정하는 단계(440)를 통하여 진행한다. 단계(430)에서, 입력된 각 태그 에 대하여, 태그를 입력하는 유저의 기밀성 레벨이 계산된다. 태그가 참조하는 문서의 관련성에 영향을 끼치게 될 정도는 이를 입력하는 유저에 놓이는 기밀성 레벨의 함수이다.
기밀성의 레벨은, 유저의 행동이 주어진 용어 또는 주제 영역을 위하여 유저 커뮤니티의 행동과 얼마나 근접하게 매칭되는지, 또는 이 유저의 등급을 매김으로써 다른 유저에 의해 놓이는 기밀성에 기초하여, 북마킹, 태깅, 클릭킹, 랭킹 또는 차단, 사교계에서 그 유저와 연결시키기, 또는 그 유저에 의해 입력된 태그에 태깅 또는 가입하기를 포함하는 유저 행동의 통계적 모델을 사용하거나 또는 알고리즘으로 계산될 수 있다. 예를 들면, 루크라는 유저가 용어 A로 주어진 문서 X를 태그하고 다른 유저는 용어 D 및 F로 문서 X를 태그하였다면, 문서 X와 관련한 완전한 태그 세트는 {a,d,f}이고, 여기서 소문자 레벨 "a"는 용어 "A"를 사용하여 태킹하는 실제예를 표기한다. 이 예를 계속하면, 만일 질의 용어 A를 사용하여 검색하는 2명의 다른 유저, 시몬과 피터가 각기 문서 X를 블럭한다면, 이 문서 X는 이제 {a, -a, -a, d, f}로 태그될 것이다. 결과적으로, 루크의 기밀성 레벨은 감소하게 되는데, 이는 복수의 유저가 그의 태그를 동의하지 않았기 때문이며, 시몬과 피터의 기밀성 레벨은 증가하게 되는데, 이는 그들의 태그가 복수의 유저와 일치했기 때문이다. 유저에 놓이는 기밀성이 본 발명과 얼마만큼 양립하는 지를 결정하는 다른 방법이 있을 수 있음이 이해될 것이다. 만일 유저가 알려져 있지 않거나 또는 유저의 기밀성 레벨이 결정될 수 없다면, 중립 또는 태그가 획득된 소스로부터 물려받은 기밀성의 레벨이 이 태그에 할당된다. 유저 기밀성은 일부 다른 적절한 토대로 발 생하는 일부 프로세스를 통하여 또는 태그를 분석하는 시간으로 계산될 수 있음이 이해될 것이다.
단계(440)에서, 각 용어를 위하여 각 문서 또는 문서 그룹의 가중된 태그 카운트가 결정된다. 만일 문서 X가 용어 A를 사용하여 n번 태그되었다면, 용어 A에 대한 문서 X를 위하여 가중된 태그 카운트는 음이건 양이건, 모든 태그 a1 ~ an의 총합이 되며, 이는 i = 1 ~ n인 각 태그 ai를 생성한 각 유저 Ui에 대한 기밀성 레벨에서 팩터링하여 문서 X를 참조한다. 게다가, 만일 유저가 많은 태그를 입력한다면, 이 유저는 종종 문서를 태그하는 것으로 여겨질 수 있으며, 이 유저에 의해 임의의 주어진 태그의 가중치는 뜸하게 태그하는 유저의 태그보다 덜 중요한 것으로 여겨질 수 있다. 게다가, 만일 이들이 제때에 더 일찍 생성된다면, 태그는 덜 중요한 것으로 여겨질 수 있으며, 만일 이들이 최근에 더 많이 생성되었다면 더 중요한 거승로 여겨질 수 있다. 본 발명의 부분으로 여겨질 수 있는 가중된 태그 카운트를 결정하는 경우, 고려될 수 있는 다른 인자가 있음이 이해될 것이다. 일단 가중된 태그 카운트가 각 용어를 위하여 각 문서에 대하여 결정되면, 이 프로세스는 단계(450)로 진행한다.
단계(450)에서, 전체에서 각 용어는 각 용어를 위하여 문서 그룹 또는 각 문서에 대한 태그 점수를 만들기 위해 분석된다. 각 문서를 분석하는 단계(460), 및 각 문서를 위하여 태그 점수를 계산하는 단계(470)를 통하여 진행한다.
단계(460)에서, 태그 점수가 계산되어야 하는 다음 문서가 분석된다. 이 문 서에 관해 이전에 취합되거나 또는 계산된 모든 정보가 모아지고 추가 분석이 완료된다. 예를 들면, 고려될 수 있는 인자는 문서에서의 용어 밀도 또는 발생도, 문서에서의 용어의 위치, 동일 태그에서의 다수의 용어의 존재, 문서에 대한 하이퍼링크의 앵커 텍스트에서의 용어의 존재, 태그가 생성되고 마지막으로 변경된 시간, 및 유사성을 결정하는 통계적 분석, 클러스터링 분석 또는 형태론적 분석 또는 임의의 다른 형태의 분석에 기초하여 문서에서의 다른 용어의 유사성을 포함하지만, 이에 한정되지는 않는다. 일반 이 문서가 분석되면, 프로세스는 단계(470)로 진행하여, 용어에 대한 문서를 위하여 태그 점수를 계산한다.
단계(470)에서, 태그 점수는 현재 태그에 대한 현재 문서에 관해 계산된다. 각 문서에 대한 태그 점수는 문서를 참조한 총 태그의 개수의 함수가 되며, 각 태그는 이에 인가된 가중치에 따라 계산에 기여하며, 이는 위의 단계(440)에서 결정되는 바와 같이, 가중된 태그 카운트이다. 게다가, 이 태그 점수에 각 태그의 기여는 위의 단계(430)에서 결정된 바와 같이, 태그를 입력한 유저에 평가된 기밀성 및, 단계(460)에서 완료된 문서의 분석에 비례한다. 용어A에 대한 문서X에 관한 태그 점수 SA는 태그 데이터베이스(예를 들면, 340, 도 3)에 존재하는 총 다른 용어의 개수, 태그 데이터베이스에 존재하는 총 태그 개수, 용어A가 태그 데이터베이스에 존재하는 빈도, 문서X가 태그된 다른 용어의 개수, 및 용어A로 태그된 다른 용어의 개수에 대한 함수가 된다. 이들 인자의 조합은 값이 각 문서의 태그 점수를 위하여 할당되도록 계산된다. 본 발명의 일부로 여겨질 수 있는 계산될 수 있는 다른 인자 가 있음이 이해될 것이다. 본 발명의 바람직한 실시예에서, 이 태그 점수는 개별 유저 또는 유저의 그룹으로 맞추어 만들어지다. 본 발명의 또 다른 실시예에서, 각 문서에 대한 태그 점수는 시스템의 각 유저를 위하여 동일하다. 단계(470)는 전체에서 문서의 각각이 각 용어를 위하여 이에 할당된 태그 점수 값을 가질 때까지 단계(450)로 회귀한다. 이후, 프로세스는 단계(480)로 진행한다.
단계(480)에서, 주어진 태그에 의해 태그된 각 문서는 각 용어에 대한 각 문서에 관한 태그 점수가 태그 분석에 의해 결정되는 질의 용어에 대하여 모든 문서의 관련성을 결정하기 위해 검색 시간에서 쉽고 신속하게 검색될 수 있는 포맷으로 기록되도록 색인된다. 문서의 색인 및 이들의 태그 점수, 및 태그 가중치 및 유저 기밀성 레벨은 검색 시간에 검색 엔진(예를 들면, 320, 도 3)에 의해 빠르고 쉽게 검색되어, 다른 검색 기술과 조합하거나, 또는 태그 분석 단독으로 결정되는 질의 용어로 각 문서의 관련성을 계산할 수 있는 문서 색인(예를 들면, 도 3)으로 발행될 수 있다. 본 발명의 다른 실시예에서, 이 프로세스(400)의 일부 단계는 생략될 수 있거나 또는 다른 단계가 삽입될 수 있으며, 또는 다른 가중치가 적용되거나 또는 다른 태그 점수가 계산될 수 있는데, 여전히 본 발명의 범위 내에 있는 것으로 고려됨을 이해해야 할 것이다.
도 5는 본 발명의 일 실시예에 따른 태그 데이터를 이용한 결과를 계산하는 단계를 예시하는 흐름도(500)이다.
도 5를 참조하면, 단계(510)에서, 검색 엔진은 하나 이상의 용어를 포함할 수 있는 질의(230, 도 2)를 처리한다.
단계(520)에서, 검색 엔진은 질의에 있는 각 용어에 기초하여, 질의에 가장관련된 문서 또는 문서의 그룹에 대한 리스트를 생성한다. 각 용어에 기초하여 관련성을 결정하는 이 프로세스는 문서를 식별하는 단계(530), 태그 랭크를 결정하는 단계(540), 및 각 문서의 점수를 매기는 단계(550)를 통하여 진행한다. 단계(530)에서, 질의에서의 용어에 대하여, 기왕 관련된 것으로 고려되었던 문서의 리스트는 이들 문서가 연관된 태그에 기초하여 생성된다. 이 리스트는 길이에 있어, 매우 짧음(예를 들면, 5 또는 그 이하)에서부터 매우 김(예를 들면, 10,000,000 또는 그 이상)의 범위를 가질 수 있다. 이들 리스트는 검색 응용에서, 실제적인 목적을 위하여 트렁케이트될(truncated) 수 있으며, 특정 실시예의 요구에 따라 정렬되거나 정렬되지 않을 수 있음을 이해해야 할 것이다.
단계(540)에서, 각 문서의 태그 점수는 용어 또는 임의 용어의 그룹화에 대하여 결정된다. 각 문서의 태그 점수는 색인에서 이 문서에 할당된 태그 점수의 함수가 될 것이며, 이 태그 점수를 계산하기 위해 사용되고 있는 태그를 제출한 유저의 현재 기밀성 레벨에 의해 영향을 받을 것이며, 어떤 그룹의 멤버인 개별 유저 또는 유저를 위하여 다를 수 있다.
단계(550)에서, 각 문서는 현재 고려중인 질의 용어에 기초하여, 문서가 놓이게 되는 결과 리스트에서 위치를 결정하는 값으로 점수가 매겨진다. 단계(550)는 질의에서의 모든 용어가 고려될 때까지 단계(520)로 복귀한다.
단계(560)에서, 질의에서의 용어 각각에 기초하여 각 문서에 대한 관련성 점수는 제출된 완전한 질의에 대하여 각 문서에 대한 총 관련성 점수를 계산하기 위 해 결합된다. 다음으로, 단계(570)에서, 랭크된 결과 리스트가 생성되고, 단계(580)에서, 그 결과 리스트는 어떤 다른 관련성 형태론이 사용될지라도 결합될 검색 엔진에 전달된다(예를 들면, 단계 240, 도 2). 본 발명의 다른 실시예에서, 이러한 프로세스(500)의 일부 단계는 생략되거나 또는 다른 순서로 처리될 수 있으며, 또는 다른 단계가 삽입될 수 있으며, 또는 다른 가중치가 적용되거나 또는 다른 태그 점수가 계산될 수 있으며, 여전히 본 발명의 범위 내에 있는 것으로 여겨질 수 있음을 이해해야 할 것이다.
도 6은 본 발명에 따른 유저(610)에 의한 사용을 위해 인터넷 검색 어플리케이션 시스템(600)을 위한 하드웨어 구성성분을 예시한다. 이 시스템(600)은 인터넷(630)을 걸쳐 웹 서버(640)에 연결된 클라이언트 디바이스(620)를 포함한다. 이 클라이언트 디바이스(620)는 웹 서버(640)에 액세스하기 위한 임의의 디바이스이며, HTTP(HyperText Transfer Protocol) 및 WAP(Wireless Application Protocol)를 포함하는 인터넷 프로토콜을 사용하여 통신하기 위해 구성되지만, 이에 한정되는 것은 아니다. 바람직하게는, 클라이언트 디바이스(620)는 개인용 컴퓨터이지만, 그러나 또한 휴대폰 또는 PDA(Personal Digital Assistant)와 같은 핸드헬드 디바이스를 포함하는 또 다른 디바이스일 수 있으며, 이 클라이언트 디바이스는 HTML(HyperText Markup Language), HDML(Handheld Device Markup Language), WML(Wireless Markup Language) 등과 같은 표준을 사용하여 정보를 표현할 수 있다.
웹 서버(640)는 검색 서버(650) 및 태그 데이터 저장소(660) 둘 다에 연결된 다. 이 태그 데이터 저장소(660)는 태그 분석 서버(670)에 연결되고, 검색 서버(650)는 색인 데이터 저장소(680)에 연결된다. 게다가, 태그 분석 서버(670)는 색인 데이터 서버(680)에 연결된다.
도 7은 본 발명의 일 실시예에 따른 문서 색인(700)을 보여준다. 당업자라면 이 문서 색인(700)은 본 발명의 방법을 설명하기 위해 사용된 개념적 구조이고, 선호되는 문서 색인은 반전된 색인을 사용함을 이해할 것이다. 이 문서 색인(700)은 예시적인 제 1 및 제 2 행(740 및 750)을 각기 포함하는데, 각각은 열(705, 710, 715, 720 및 725)에서 태그-객체 쌍 및 관련한 정보를 포함한다. 행(740)을 참조하면, 이 열(705)은 태그 "U2"를 포함하고, 열(710)은 객체, 여기서는 웹 페이지("U2" 홈")를 포함하며, 열(715)은 태그-객체 쌍("U2-U2 홈")을 위한 원(raw)(예를 들면 가중치가 부과되지 않은) 관련성 점수를 포함하고, 열(720)은 이러한 태그-객체 쌍을 위한 가중치(weight)를 포함하고, 그리고 열(725)은 객체 "U2 홈"에 태그 U2를 연관시킨 유저에 대한 유저 기밀성 등급 매김을 포함한다. 열(750)은 유사하게 식별된 정보를 포함한다. 열(720)에서 엔트리(0.6)는 이 태그-객체 쌍에서 태그"U2"를 생성하기 위해 가중치를 결정한다. 이러한 가중치는 가중치(0.6)를 결정하기 위해, 가령 태그가 객체에 연관되는 시간과 같은 다른 기밀성 인자와 결합된 열(725)에서의 유저 기밀도 등급 매김(0.7)으로부터 결정된다. 이러한 태그-객체 쌍을 위한 관련성 점수는 최종 관련성 점수(57)를 결정하기 위해 가중치(0.6)에 의해 곱해진 원 관련성(0.95) 점수와 같다. 유사한 방식으로, 행(750)에서의 태그-객체 쌍을 위한 관련성 점수는 70*0.9, 즉 63이 되는 것으로 결정된다. 따라서, 만일 유저가 용어"U2"를 포함하는 검색 질의를 실행하면, 행(750)에서의 이 객체에 상응하는 객체"Rock Band Home Site"가 행(740)에서의 객체"U2"보다 반환된 (조직화된) 결과 리스트에서 보다 높게 랭크될 것이며, 이는 유저의 검색에 더 관련됨을 나타낸다.
문서 색인(700)은 단순히 예시적인 것임을 이해해야 할 것이다. 또한, 수개의 다른 구성을 명명하기 위해 관련성 점수를 결정하기 위한 다른 알고리즘, 관련성 점수에 대한 다른 범위, 엔트리의 다른 조합이 사용될 수 있다.
첨부된 청구항에 의해 한정된 바와 같이, 본 발명의 사상 및 범위로부터 벗어나지 않고서도 실시예에 다양한 변경이 이루어질 수 있음이 당업자에게는 이미 명백할 것이다.
전술한 바와 같이, 본 발명은 문서를 검색하는 것, 특히 검색 결과의 품질 또는 관련성을 개선하기 위해, 사람들에 의해 생성된 태그를 분석함으로써, 인터넷에서 정보를 검색하는 시스템 및 방법에 이용 가능하다.

Claims (48)

  1. 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법으로서,
    상기 다수의 객체와 다수의 태그를 연관시키는 단계, 또는 상기 다수의 객체에 북마크를 기록하는 단계, 또는 연관시키고 기록하는 단계; 및
    상기 다수의 객체의 각각 및 검색 질의에 대한 관련성을 결정하는 단계
    를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  2. 제 1 항에 있어서,
    상기 다수의 태그로부터의 각 태그는 하나 이상의 용어를 포함하고, 객체와 상기 하나 이상의 용어로부터 각 용어를 연관시켜, 하나 이상의 대응 용어-객체 쌍을 한정하는 단계를 더 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  3. 제 2 항에 있어서,
    각 용어-객체 쌍에 대하여 상기 용어와 객체 사이의 관련성 정도를 나타내는 용어 점수를 결정하는 단계를 더 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  4. 제 3 항에 있어서,
    태그-객체 쌍을 위하여 관련성 점수를 결정하는 단계는, 상기 태그에서의 각 용어에 대한 용어-객체 쌍을 위하여 상기 용어 점수를 결합하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  5. 제 4 항에 있어서,
    상기 용어 점수를 결합하는 단계는, 용어 점수를 합산하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  6. 제 4 항에 있어서,
    상기 용어 점수를 결합하는 단계는, 가중치로 각 용어 점수를 가중하고 이 가중된 용어 점수를 합산하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  7. 제 2 항에 있어서,
    태그-객체 쌍을 위한 관련성 점수는, 태그에서의 용어가 객체와 연관되는 횟수, 객체와 연관된 태그의 수, 태그가 다수의 객체와 연관되는 횟수, 또는 이들의 임의 조합으로부터 결정되는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  8. 제 2 항에 있어서,
    태그-객체 쌍을 위한 관련성 점수는, 상기 태그에서의 용어를 포함하는 태그-객체 쌍의 수, 상기 객체에 대한 기준을 포함하는 태그-객체 쌍의 수, 또는 둘 다로부터 결정되는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  9. 제 1 항에 있어서,
    제 1 유저에 의해 다수의 객체로부터의 하나의 객체와 태그를 연관시키는 단계;
    제 2 유저에 의해 태그에서의 하나 이상 용어를 포함하는 검색 질의를 수행하는 단계;
    상기 관련성 점수에 기초하여 결과 리스트에서의 다수의 객체를 조직화하는 단계;
    이를 통해 조직된 결과 리스트를 한정하는 단계; 및
    제 2 유저에 조직화된 결과 리스트를 반환하는 단계를 더 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  10. 제 9 항에 있어서,
    객체 및 검색 질의에 대한 관련성 점수는 상기 객체에 존재하거나 또는 상기 객체와 연관되는, 검색 질의 용어 각각에 대한 관련성 점수로부터 결정되는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  11. 제 9 항에 있어서,
    상기 다수의 태그-객체 쌍으로부터의 태그-객체 쌍에 대한 관련성 점수는 제 1 유저가 다수의 객체 중 어느 하나와 관련된 태그의 수, 또는 제 1 및 제 2 유저가 태그와 연관된 객체의 수, 또는 둘 다로부터 결정되는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  12. 제 9 항에 있어서,
    태그-객체에 대한 관련성 점수는, 제 1 유저와, 제 2 유저 중 선택된 하나 또는 둘 다에 대한 관련성 등급 매김으로부터 결정되는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  13. 제 12 항에 있어서,
    상기 관련성 등급 매김은, 상기 선택된 유저가 객체와 관련시킨 태그의 등급 매김, 제 1 및 제 2 유저에 대한 검색 활동 사이의 유사성 계측값, 제 1 유저 및 제 2 유저 사이의 연결 계측값, 또는 이들의 임의의 조합으로부터 결정되는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  14. 제 9 항에 있어서,
    상기 다수의 객체를 조직화하는 단계는, 관련성 점수에 기초하여 다수의 객체를 순서화하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정 하는 방법.
  15. 제 9 항에 있어서,
    상기 다수의 객체를 조직화하는 단계는, 그래픽 구성요소로 다수의 객체들 중 적어도 하나를 마킹하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  16. 제 1 항에 있어서,
    객체와 태그를 연관시키는 단계는, 유저에 제공된 영역에서 태그를 입력하는 단계, 상기 태그를 등급 매김하는 단계, 상기 객체에 대한 링크를 차단하는 단계, 상기 태그를 선택하는 단계, 또는 상기 객체를 선택하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  17. 제 1 항에 있어서,
    객체와 태그를 연관시키는 단계는, 북마크를 검사하는 단계 또는 상기 태그를 사용하여 객체에 대한 검색을 수행하는 단계를 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  18. 제 1 항에 있어서,
    상기 다수의 객체는, 웹 페이지에 대한 하이퍼링크 또는 웹 페이지에 대한 하이퍼링크의 그룹을 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  19. 제 1 항에 있어서,
    상기 다수의 객체는, 텍스트, 이미지, 사진, 태그, 태그의 그룹, 제목 영역, 개념, 유저 프로파일, 응답, 오디오 파일, 비디오 파일, 소프트웨어, 또는 이들의 임의 조합에 대한 하이퍼링크 또는 하이퍼링크의 그룹을 포함하는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  20. 제 1 항에 있어서,
    태그 크롤러(tag crawler)는 다수의 객체들 중 적어도 하나와 다수의 태그들 중 적어도 하나와 연관시키는, 검색 질의에 대한 다수의 객체의 관련성을 결정하는 방법.
  21. 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트(populate)하는 방법으로서,
    다수의 객체와 연관된 다수의 태그를 태그 데이터베이스에 저장하는 단계; 및
    상기 다수의 태그 및 다수의 객체 사이의 관련성 점수를 색인 데이터베이스에 저장하는 단계를 포함하되, 상기 관련성 점수는 조직화된 결과 리스트에서 다수 의 문서를 조직화하기 위해 사용된, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
  22. 제 21 항에 있어서,
    태그 데이터베이스에 다수의 태그를 저장하는 단계는, 다수의 태그를 형성하는 용어를 저장하는 단계를 포함하되, 추가로 관련성 점수를 저장하는 단계는 용어 및 객체 사이의 관련성을 나타내는 관련성 점수를 저장하는 단계를 포함하는, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
  23. 제 22 항에 있어서,
    색인 데이터베이스에, 다수의 색인을 저장하는 단계를 더 포함하되, 각 색인 엔트리는 다수의 용어로부터의 용어, 다수의 객체로부터 대응하는 객체, 및 용어 및 객체 사이의 대응하는 관련성 점수에 대응하는, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
  24. 제 23 항에 있어서,
    용어 및 객체 사이의 각 대응하는 관련성 점수는 상기 객체와 용어를 연관시킨 유저의 기밀성에 관련되는, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
  25. 제 23 항에 있어서,
    용어 및 객체 사이의 관련성 점수는 통계적 분류 또는 랭크 회귀 알고리즘으로부터 결정되는, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
  26. 제 25 항에 있어서,
    상기 통계적 분류 또는 랭크 회귀 알고리즘은 기호논리적 회귀, 지지 벡터 머신, 분류 또는 회귀 트리 및 부스팅된 트리 앙상블 중 어느 하나인, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
  27. 제 21 항에 있어서,
    용어를 포함하는 검색 질의에 응답하여 유저에게 결과 리스트를 제공하는 단계;
    상기 유저에 의해 결과 리스트에 포함된 객체에 상기 용어를 연관시키는 단계; 및
    상기 용어와 객체 사이의 관련성 점수를 결정하는 단계를 더 포함하는, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
  28. 제 27 항에 있어서,
    다수의 객체로부터 하나의 객체 및 그 관련 태그 사이의 관련성 점수는, 태 그가 상기 객체와 연관되는 횟수, 상기 객체와 연관된 총 개수의 태그, 태그가 다수의 객체들 중 어느 하나와 연관되는 횟수, 모든 다수의 객체와 연관된 태그의 수, 태그가 상기 객체와 연관된 시간, 객체가 북마크된 횟수, 객체에 적용된 등급 매김의 값 및 수, 또는 이들의 임의 조합인, 결과 리스트에서 조직화된 객체를 반환하기 위해 사용된 시스템을 파퓰레이트하는 방법.
  29. 결과 리스트에서 디스플레이를 위해 다수의 객체를 조직화하는 방법으로서,
    다수의 객체와 연관된 태그와 검색 질의에서의 용어를 상관시키는 단계; 및
    상기 상관 관계에 기초하여 조직화된 다수의 개체를 포함하는 결과 리스트를 반환하는 단계
    를 포함하는, 결과 리스트에서 디스플레이를 위해 다수의 객체를 조직화하는 방법.
  30. 제 29 항에 있어서,
    검색 질의를 실행하여, 객체의 제 1 리스트를 생성하는 단계; 및
    상관에 기초하여 다수의 객체를 조직화하는 단계를 더 포함하는, 결과 리스트에서 디스플레이를 위해 다수의 객체를 조직화하는 방법.
  31. 제 30 항에 있어서,
    객체와 태그를 연관시키는 단계를 더 포함하는, 결과 리스트에서 디스플레이 를 위해 다수의 객체를 조직화하는 방법.
  32. 제 30 항에 있어서,
    각 상관은 관련성 계측값에 대응하는, 결과 리스트에서 디스플레이를 위해 다수의 객체를 조직화하는 방법.
  33. 제 29 항에 있어서,
    검색 질의에서 다수의 객체 및 용어 사이의 관련성 계측값을 결정하기 위해 다수의 객체에 통계적 분류 또는 랭크 회귀 알고리즘을 적용하는 단계를 더 포함하는, 결과 리스트에서 디스플레이를 위해 다수의 객체를 조직화하는 방법.
  34. 제 33 항에 있어서,
    상기 통계적 분류 또는 랭크 회귀 알고리즘은 기호논리적 회귀, 지지 벡터 머신, 분류 또는 회귀 트리 및 부스팅된 트리 앙상블 중 어느 하나인, 결과 리스트에서 디스플레이를 위해 다수의 객체를 조직화하는 방법.
  35. 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템으로서,
    객체와 연관된 태그를 저장하는 태그 데이터베이스; 및
    상기 태그 데이터베이스에 연결된 태그 분석기를 포함하되, 상기 분석기는 검색 질의에 대한 다수의 객체의 관련성 점수를 결정하기 위해 프로그래밍된, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
  36. 제 35 항에 있어서,
    객체와 연관된 태그 및 객체 사이의 관련성 점수, 또는 객체에 대한 북마크 사이의, 관련성 점수 또는 둘 다를 저장하는 객체 색인을 더 포함하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
  37. 제 35 항에 있어서,
    관련성 점수는 태그 및 객체를 형성하는 용어에 대한 가중치가 부여된 관련성 점수를 합산함으로써 결정되는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
  38. 제 35 항에 있어서,
    용어를 포함하는 검색 질의와 객체 사이의 관련성 점수는, 검색 질의에서 용어를 포함하는 태그의 수, 검색 질의에 포함된 태그가 태그 데이터베이스에서 포함되는 횟수, 객체와 연관되는 태그의 수, 일치하는 태그 내 및 검색 질의 내의 용어의 수, 객체가 북마크되는 횟수, 객체각 등급이 매겨지는 횟수, 또는 이들의 임의 조합인, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
  39. 제 35 항에 있어서,
    태그 및 객체에 대한 관련성 점수는 객체 내의 태그의 위치, 객체 내의 태그의 빈도, 객체 내의 태그의 밀도, 또는 이들의 조합이 기초하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
  40. 제 35 항에 있어서,
    태그 및 객체 사이의 관련성 점수의 가중치를 매기는 것은, 객체와 태그를 연관시킨 유저에 할당된 기밀성(confidence)의 레벨에 기초하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
  41. 제 35 항에 있어서,
    통계적 분류 또는 랭크 회귀 알고리즘, 클러스터링(clustering) 분석 알고리즘, 또는 형태론적 분석 알고리즘을 사용하여 결정되는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
  42. 제 41 항에 있어서,
    상기 통계적 분류 또는 랭크 회귀 알고리즘은 기호논리적 회귀, 지지 벡터 머신, 분류 또는 회귀 트리 및 부스팅된 트리 앙상블 중 어느 하나인, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
  43. 제 36 항에 있어서,
    객체 색인에 연결된 검색 엔진을 더 포함하되, 상기 검색 엔진은 태그에 대응하는 용어를 포함하는 검색 질의를 수신하고, 태그-객체 쌍에 대한 관련성 점수에 기초한 조직화된 결과를 반환하도록 프로그래밍되는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
  44. 제 43 항에 있어서,
    검색 엔진에 연결된 유저 데이터베이스를 더 포함하되, 상기 유저 데이터베이스는 검색 질의에 관련된 정보를 포함하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
  45. 제 44 항에 있어서,
    검색 질에 관련된 정보는 유저에 의해 후속된 링크, 객체와 연관된 태그, 유저에 의해 차단된 객체, 북마크, 또는 이들의 조합을 포함하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
  46. 제 35 항에 있어서,
    상기 객체는 웹 페이지에 대한 하이퍼링크 또는 웹 페이지에 대한 하이퍼링크의 그룹을 포함하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
  47. 제 35 항에 있어서,
    상기 객체는, 텍스트, 이미지, 사진, 태그, 태그의 그룹, 제목 영역, 개념, 유저 프로파일, 응답, 오디오 파일, 비디오 파일, 소프트웨어, 또는 이들의 임의 조합에 대한 하이퍼링크 또는 하이퍼링크의 그룹을 포함하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
  48. 제 35 항에 있어서,
    객체와 태그를 연관시키는 수단을 더 포함하는, 검색 질의에 응답하여 검색 결과 리스트를 반환하는 시스템.
KR1020087002629A 2005-08-03 2006-08-03 태그를 분석하여 관련 문서를 찾기 위한 시스템 및 방법 KR101361182B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US70570405P 2005-08-03 2005-08-03
US60/705,704 2005-08-03
US11/498,448 US9715542B2 (en) 2005-08-03 2006-08-02 Systems for and methods of finding relevant documents by analyzing tags
US11/498,448 2006-08-02
PCT/US2006/030443 WO2007019311A2 (en) 2005-08-03 2006-08-03 Systems for and methods of finding relevant documents by analyzing tags

Publications (2)

Publication Number Publication Date
KR20080031928A true KR20080031928A (ko) 2008-04-11
KR101361182B1 KR101361182B1 (ko) 2014-02-07

Family

ID=37727923

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087002629A KR101361182B1 (ko) 2005-08-03 2006-08-03 태그를 분석하여 관련 문서를 찾기 위한 시스템 및 방법

Country Status (6)

Country Link
US (3) US9715542B2 (ko)
EP (1) EP1924903A4 (ko)
JP (1) JP5431727B2 (ko)
KR (1) KR101361182B1 (ko)
CA (1) CA2617831C (ko)
WO (1) WO2007019311A2 (ko)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010041818A2 (ko) * 2008-10-08 2010-04-15 경북대학교 산학협력단 태그 적합성 피드백 시스템 및 방법
KR101007056B1 (ko) * 2008-07-30 2011-01-12 주식회사 메디오피아테크 연관 태그에 기반한 태그 클러스터링 장치 및 그 방법
KR101067851B1 (ko) * 2009-03-05 2011-09-27 이노디지털 주식회사 웹 페이지 검색 시스템
KR101226712B1 (ko) * 2010-12-22 2013-01-25 한양대학교 에리카산학협력단 컨텐츠 태그의 순위 산정 장치 및 방법
US8429098B1 (en) 2010-04-30 2013-04-23 Global Eprocure Classification confidence estimating tool
KR101270958B1 (ko) * 2013-01-02 2013-06-11 주식회사 한글과컴퓨터 전자 문서 내 이미지 검색 장치 및 방법
KR20160111233A (ko) 2015-03-16 2016-09-26 한화테크윈 주식회사 영상 검색 방법 및 장치
KR20190134928A (ko) * 2018-05-17 2019-12-05 주식회사 머니브레인 대화 이해 ai 시스템에 의하여, 계층적으로 저장되어 있는 북마크에 대한 문맥기반 검색 서비스를 제공하는 방법 및 컴퓨터 판독가능 기록 매체
WO2022097891A1 (ko) * 2020-11-05 2022-05-12 주식회사 해시스크래퍼 동일 구조의 데이터를 추출하는 방법 및 그를 이용한 장치

Families Citing this family (118)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9092523B2 (en) 2005-02-28 2015-07-28 Search Engine Technologies, Llc Methods of and systems for searching by incorporating user-entered information
KR101374651B1 (ko) * 2005-03-18 2014-03-17 써치 엔진 테크놀로지스, 엘엘씨 서치 결과를 향상시키기 위해 사용자로부터의 피드백을 적용하는 서치 엔진
US10210159B2 (en) * 2005-04-21 2019-02-19 Oath Inc. Media object metadata association and ranking
US8732175B2 (en) * 2005-04-21 2014-05-20 Yahoo! Inc. Interestingness ranking of media objects
US20090164564A1 (en) * 2005-07-01 2009-06-25 Michael John Willis System and methods for mobilizing web content
US8095551B2 (en) * 2005-08-18 2012-01-10 Microsoft Corporation Annotating shared contacts with public descriptors
US20090154665A1 (en) * 2005-11-28 2009-06-18 Galvin Brian M Authenticated audiographs from voice mail
US7773731B2 (en) 2005-12-14 2010-08-10 At&T Intellectual Property I, L. P. Methods, systems, and products for dynamically-changing IVR architectures
US7577664B2 (en) * 2005-12-16 2009-08-18 At&T Intellectual Property I, L.P. Methods, systems, and products for searching interactive menu prompting system architectures
WO2007092781A2 (en) * 2006-02-03 2007-08-16 Kda Research Online qualitative research system
US20070204238A1 (en) * 2006-02-27 2007-08-30 Microsoft Corporation Smart Video Presentation
JP2007272390A (ja) * 2006-03-30 2007-10-18 Sony Corp リソース管理装置、タグ候補選定方法及びタグ候補選定プログラム
US7711732B2 (en) * 2006-04-21 2010-05-04 Yahoo! Inc. Determining related terms based on link annotations of documents belonging to search result sets
GB0702604D0 (en) * 2006-05-05 2007-03-21 Omnifone Ltd Handset commissi0ning
US9507778B2 (en) * 2006-05-19 2016-11-29 Yahoo! Inc. Summarization of media object collections
US7873641B2 (en) 2006-07-14 2011-01-18 Bea Systems, Inc. Using tags in an enterprise search system
US20080016053A1 (en) * 2006-07-14 2008-01-17 Bea Systems, Inc. Administration Console to Select Rank Factors
US20080016061A1 (en) * 2006-07-14 2008-01-17 Bea Systems, Inc. Using a Core Data Structure to Calculate Document Ranks
US20080016071A1 (en) * 2006-07-14 2008-01-17 Bea Systems, Inc. Using Connections Between Users, Tags and Documents to Rank Documents in an Enterprise Search System
US20080016052A1 (en) * 2006-07-14 2008-01-17 Bea Systems, Inc. Using Connections Between Users and Documents to Rank Documents in an Enterprise Search System
US20080016072A1 (en) * 2006-07-14 2008-01-17 Bea Systems, Inc. Enterprise-Based Tag System
US7693906B1 (en) * 2006-08-22 2010-04-06 Qurio Holdings, Inc. Methods, systems, and products for tagging files
US20080082486A1 (en) * 2006-09-29 2008-04-03 Yahoo! Inc. Platform for user discovery experience
US20080086496A1 (en) * 2006-10-05 2008-04-10 Amit Kumar Communal Tagging
US20080120291A1 (en) * 2006-11-20 2008-05-22 Rexee, Inc. Computer Program Implementing A Weight-Based Search
US8059915B2 (en) * 2006-11-20 2011-11-15 Videosurf, Inc. Apparatus for and method of robust motion estimation using line averages
US8379915B2 (en) * 2006-11-20 2013-02-19 Videosurf, Inc. Method of performing motion-based object extraction and tracking in video
US20080120328A1 (en) * 2006-11-20 2008-05-22 Rexee, Inc. Method of Performing a Weight-Based Search
US20080120290A1 (en) * 2006-11-20 2008-05-22 Rexee, Inc. Apparatus for Performing a Weight-Based Search
US8488839B2 (en) * 2006-11-20 2013-07-16 Videosurf, Inc. Computer program and apparatus for motion-based object extraction and tracking in video
US8230320B2 (en) * 2006-12-26 2012-07-24 International Business Machines Corporation Method and system for social bookmarking of resources exposed in web pages that don't follow the representational state transfer architectural style (REST)
US7953736B2 (en) * 2007-01-04 2011-05-31 Intersect Ptp, Inc. Relevancy rating of tags
US8010532B2 (en) * 2007-01-17 2011-08-30 Yahoo! Inc. System and method for automatically organizing bookmarks through the use of tag data
US8190602B1 (en) * 2007-01-30 2012-05-29 Adobe Systems Incorporated Searching a database of selected and associated resources
US20080195586A1 (en) * 2007-02-09 2008-08-14 Sap Ag Ranking search results based on human resources data
US7895515B1 (en) * 2007-02-28 2011-02-22 Trend Micro Inc Detecting indicators of misleading content in markup language coded documents using the formatting of the document
US7685200B2 (en) 2007-03-01 2010-03-23 Microsoft Corp Ranking and suggesting candidate objects
US20080222100A1 (en) * 2007-03-08 2008-09-11 Fu-Sheng Chiu Internet forum management method
US8346763B2 (en) * 2007-03-30 2013-01-01 Microsoft Corporation Ranking method using hyperlinks in blogs
KR101417769B1 (ko) 2007-04-16 2014-08-07 삼성전자주식회사 통신 단말기의 사용자 컨텐츠 관리 방법
US20080276177A1 (en) * 2007-05-03 2008-11-06 Microsoft Corporation Tag-sharing and tag-sharing application program interface
US7920748B2 (en) * 2007-05-23 2011-04-05 Videosurf, Inc. Apparatus and software for geometric coarsening and segmenting of still images
US7903899B2 (en) * 2007-05-23 2011-03-08 Videosurf, Inc. Method of geometric coarsening and segmenting of still images
US20090055267A1 (en) * 2007-08-23 2009-02-26 Robert Roker Internet advertising brokerage apparatus, systems, and methods
US8862690B2 (en) * 2007-09-28 2014-10-14 Ebay Inc. System and method for creating topic neighborhood visualizations in a networked system
US9081852B2 (en) 2007-10-05 2015-07-14 Fujitsu Limited Recommending terms to specify ontology space
US8280892B2 (en) * 2007-10-05 2012-10-02 Fujitsu Limited Selecting tags for a document by analyzing paragraphs of the document
US8909632B2 (en) * 2007-10-17 2014-12-09 International Business Machines Corporation System and method for maintaining persistent links to information on the Internet
US20090144240A1 (en) * 2007-12-04 2009-06-04 Yahoo!, Inc. Method and systems for using community bookmark data to supplement internet search results
US8136034B2 (en) 2007-12-18 2012-03-13 Aaron Stanton System and method for analyzing and categorizing text
US7840548B2 (en) * 2007-12-27 2010-11-23 Yahoo! Inc. System and method for adding identity to web rank
US7853583B2 (en) * 2007-12-27 2010-12-14 Yahoo! Inc. System and method for generating expertise based search results
US20090192879A1 (en) * 2008-01-21 2009-07-30 Michael Hood Lead Rating Systems
US8280886B2 (en) 2008-02-13 2012-10-02 Fujitsu Limited Determining candidate terms related to terms of a query
JP2009265754A (ja) * 2008-04-22 2009-11-12 Ntt Docomo Inc 情報提供装置、情報提供方法及び情報提供プログラム
US20090271388A1 (en) * 2008-04-23 2009-10-29 Yahoo! Inc. Annotations of third party content
US8682819B2 (en) * 2008-06-19 2014-03-25 Microsoft Corporation Machine-based learning for automatically categorizing data on per-user basis
US9251266B2 (en) * 2008-07-03 2016-02-02 International Business Machines Corporation Assisting users in searching for tagged content based on historical usage patterns
US20100010982A1 (en) * 2008-07-09 2010-01-14 Broder Andrei Z Web content characterization based on semantic folksonomies associated with user generated content
US8364660B2 (en) * 2008-07-11 2013-01-29 Videosurf, Inc. Apparatus and software system for and method of performing a visual-relevance-rank subsequent search
US8364698B2 (en) * 2008-07-11 2013-01-29 Videosurf, Inc. Apparatus and software system for and method of performing a visual-relevance-rank subsequent search
US8024342B2 (en) * 2008-07-31 2011-09-20 Yahoo! Inc. Systems and methods for determining a tag match ratio
US7730061B2 (en) * 2008-09-12 2010-06-01 International Business Machines Corporation Fast-approximate TFIDF
US8407216B2 (en) * 2008-09-25 2013-03-26 Yahoo! Inc. Automated tagging of objects in databases
US8364718B2 (en) * 2008-10-31 2013-01-29 International Business Machines Corporation Collaborative bookmarking
US8296305B2 (en) * 2008-12-09 2012-10-23 Yahoo! Inc. Rules and method for improving image search relevance through games
US8271501B2 (en) * 2008-12-17 2012-09-18 International Business Machines Corporation Web search among rich media objects
US20100161592A1 (en) * 2008-12-22 2010-06-24 Colin Shengcai Zhao Query Intent Determination Using Social Tagging
US8914359B2 (en) * 2008-12-30 2014-12-16 Microsoft Corporation Ranking documents with social tags
US8799279B2 (en) 2008-12-31 2014-08-05 At&T Intellectual Property I, L.P. Method and apparatus for using a discriminative classifier for processing a query
JP2010277543A (ja) * 2009-06-01 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> 正解データベース生成装置、正解データベース生成方法、正解データベース生成プログラムおよびそのプログラムを記録した記録媒体
US10353967B2 (en) * 2009-06-22 2019-07-16 Microsoft Technology Licensing, Llc Assigning relevance weights based on temporal dynamics
US10944868B2 (en) * 2009-07-10 2021-03-09 Avaya Inc. Contact center interfaces
WO2011022867A1 (en) * 2009-08-24 2011-03-03 Hewlett-Packard Development Company, L.P. Method and apparatus for searching electronic documents
US9223854B2 (en) * 2009-10-14 2015-12-29 Hewlett-Packard Development Company, L.P. Document relevance determining method and computer program
US9836466B1 (en) 2009-10-29 2017-12-05 Amazon Technologies, Inc. Managing objects using tags
WO2011089569A1 (en) * 2010-01-21 2011-07-28 Indegene Lifesystems Pvt. Ltd. Tool for clinical data mining and analysis
JP5234836B2 (ja) * 2010-04-19 2013-07-10 日本電信電話株式会社 コンテンツ管理装置,情報関連度算出方法および情報関連度算出プログラム
US9508011B2 (en) 2010-05-10 2016-11-29 Videosurf, Inc. Video visual and audio query
US20110295859A1 (en) * 2010-05-27 2011-12-01 Alcatel-Lucent Usa Inc. Technique For Multi-Dimensionally Determining Strength Of An Item In A Weighted List Based On Tagging
US20110296345A1 (en) * 2010-05-27 2011-12-01 Alcatel-Lucent Usa Inc. Technique For Determining And Indicating Strength Of An Item In A Weighted List Based On Tagging
CN102456057B (zh) * 2010-11-01 2016-08-17 阿里巴巴集团控股有限公司 基于网上交易平台的检索方法、装置和服务器
US9449093B2 (en) 2011-02-10 2016-09-20 Sri International System and method for improved search experience through implicit user interaction
US9569499B2 (en) 2011-03-03 2017-02-14 Nec Corporation Method and apparatus for recommending content on the internet by evaluating users having similar preference tendencies
KR101271115B1 (ko) 2011-03-23 2013-06-04 강민수 특허 리스크 헤징 예측 정보 생성 방법, 그 방법을 실시하는 시스템, 그 방법을 실시하는 프로그램, 그 프로그램이 기록된 기록 매체
CN102156747B (zh) * 2011-04-21 2013-05-29 清华大学 一种引入社会化标签的协作过滤评分预测方法及装置
US9342605B2 (en) 2011-06-13 2016-05-17 Facebook, Inc. Client-side modification of search results based on social network data
US8645366B1 (en) * 2011-12-30 2014-02-04 Google Inc. Generating recommendations of points of interest
US20130230248A1 (en) * 2012-03-02 2013-09-05 International Business Machines Corporation Ensuring validity of the bookmark reference in a collaborative bookmarking system
WO2013154550A1 (en) * 2012-04-11 2013-10-17 Intel Corporation User interface content personalization system
CN103426191B (zh) * 2012-05-26 2016-04-27 百度在线网络技术(北京)有限公司 一种图片标注方法及系统
US9514186B1 (en) * 2012-05-29 2016-12-06 Google Inc. User-list management
US9449348B2 (en) * 2012-08-28 2016-09-20 Facebook, Inc. Providing a locality viewport through a social networking system
US9740765B2 (en) 2012-10-08 2017-08-22 International Business Machines Corporation Building nomenclature in a set of documents while building associative document trees
US9251146B2 (en) * 2013-05-10 2016-02-02 International Business Machines Corporation Altering relevancy of a document and/or a search query
US10402407B2 (en) * 2013-06-17 2019-09-03 Lenovo (Singapore) Pte. Ltd. Contextual smart tags for content retrieval
US20140379706A1 (en) * 2013-06-25 2014-12-25 Sap Ag Content Management System with Chained Document Discovery
US10169686B2 (en) * 2013-08-05 2019-01-01 Facebook, Inc. Systems and methods for image classification by correlating contextual cues with images
CN104424302B (zh) * 2013-09-04 2018-09-18 阿里巴巴集团控股有限公司 一种同类数据对象的匹配方法和装置
US10241988B2 (en) * 2013-12-05 2019-03-26 Lenovo (Singapore) Pte. Ltd. Prioritizing smart tag creation
US9633083B2 (en) * 2013-12-05 2017-04-25 Lenovo (Singapore) Pte. Ltd. Organizing search results using smart tag inferences
US10482131B2 (en) * 2014-03-10 2019-11-19 Eustus Dwayne Nelson Collaborative clustering feed reader
US10482490B2 (en) 2014-04-09 2019-11-19 Sailthru, Inc. Behavioral tracking system and method in support of high-engagement communications
US10289679B2 (en) * 2014-12-10 2019-05-14 International Business Machines Corporation Data relationships in a question-answering environment
US10402410B2 (en) 2015-05-15 2019-09-03 Google Llc Contextualizing knowledge panels
US11803918B2 (en) 2015-07-07 2023-10-31 Oracle International Corporation System and method for identifying experts on arbitrary topics in an enterprise social network
US10331747B1 (en) 2015-09-30 2019-06-25 Open Text Corporation Method and system for creating and using persona in a content management system
CN106815273B (zh) * 2015-12-02 2020-07-31 北京国双科技有限公司 数据存储方法和装置
TWI573031B (zh) * 2015-12-04 2017-03-01 英業達股份有限公司 資料分類及搜尋方法
WO2017136868A1 (en) * 2016-02-10 2017-08-17 Clap Online Pty Ltd A data acquisition and communication system
CN106407386B (zh) * 2016-09-14 2020-04-17 广东小天才科技有限公司 提高题目搜索效率的方法和装置
US11158012B1 (en) * 2017-02-14 2021-10-26 Casepoint LLC Customizing a data discovery user interface based on artificial intelligence
AU2018365901C1 (en) 2017-11-07 2022-12-15 Thomson Reuters Enterprise Centre Gmbh System and methods for concept aware searching
US10747839B2 (en) * 2018-05-07 2020-08-18 International Business Machines Corporation Intelligent bookmarking with cognitive capability
JP7099925B2 (ja) * 2018-09-27 2022-07-12 富士フイルム株式会社 画像処理装置、画像処理方法、プログラムおよび記録媒体
US11640630B2 (en) 2018-11-09 2023-05-02 Honeywell International Inc. Systems and methods for verifying identity of a user on an equipment online marketplace platform
US11494832B2 (en) 2018-11-09 2022-11-08 Honeywell International Inc. Systems and methods for securely creating a listing of equipment on an equipment online marketplace platform
US20230092628A1 (en) * 2021-09-23 2023-03-23 Change Healthcare Holdings, Llc Systems and methods for building products

Family Cites Families (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6029195A (en) 1994-11-29 2000-02-22 Herz; Frederick S. M. System for customized electronic identification of desirable objects
US5680511A (en) * 1995-06-07 1997-10-21 Dragon Systems, Inc. Systems and methods for word recognition
JP3284832B2 (ja) * 1995-06-22 2002-05-20 セイコーエプソン株式会社 音声認識対話処理方法および音声認識対話装置
US6314420B1 (en) 1996-04-04 2001-11-06 Lycos, Inc. Collaborative/adaptive search engine
US5848396A (en) * 1996-04-26 1998-12-08 Freedom Of Information, Inc. Method and apparatus for determining behavioral profile of a computer user
US5835712A (en) * 1996-05-03 1998-11-10 Webmate Technologies, Inc. Client-server system using embedded hypertext tags for application and database development
US6070176A (en) 1997-01-30 2000-05-30 Intel Corporation Method and apparatus for graphically representing portions of the world wide web
JPH10254886A (ja) * 1997-03-07 1998-09-25 Fujitsu Ltd 検索システムにおける検索結果コンテンツへの付加的情報の付加及び検索システム
US6112203A (en) 1998-04-09 2000-08-29 Altavista Company Method for ranking documents in a hyperlinked environment using connectivity and selective content analysis
US6256622B1 (en) * 1998-04-21 2001-07-03 Apple Computer, Inc. Logical division of files into multiple articles for search and retrieval
US6212522B1 (en) * 1998-05-15 2001-04-03 International Business Machines Corporation Searching and conditionally serving bookmark sets based on keywords
US6006225A (en) 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
US6334131B2 (en) 1998-08-29 2001-12-25 International Business Machines Corporation Method for cataloging, filtering, and relevance ranking frame-based hierarchical information structures
US6360215B1 (en) * 1998-11-03 2002-03-19 Inktomi Corporation Method and apparatus for retrieving documents based on information other than document content
US7032030B1 (en) 1999-03-11 2006-04-18 John David Codignotto Message publishing system and method
US6327590B1 (en) 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US7110993B2 (en) 1999-05-28 2006-09-19 Overture Services, Inc. System and method for influencing a position on a search result list generated by a computer network search engine
US6711585B1 (en) * 1999-06-15 2004-03-23 Kanisa Inc. System and method for implementing a knowledge management system
US6810395B1 (en) * 1999-11-22 2004-10-26 Hewlett-Packard Development Company, L.P. Method and apparatus for query-specific bookmarking and data collection
US6785671B1 (en) 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
US7428505B1 (en) 2000-02-29 2008-09-23 Ebay, Inc. Method and system for harvesting feedback and comments regarding multiple items from users of a network-based transaction facility
US6718365B1 (en) * 2000-04-13 2004-04-06 International Business Machines Corporation Method, system, and program for ordering search results using an importance weighting
JP2001350794A (ja) 2000-06-08 2001-12-21 Gram Design:Kk データベース検索用キーワードに基づくコミュニケーション装置及び方法並びに記録媒体
US6601075B1 (en) 2000-07-27 2003-07-29 International Business Machines Corporation System and method of ranking and retrieving documents based on authority scores of schemas and documents
US6823491B1 (en) * 2000-08-31 2004-11-23 International Business Machines Corporation System and method for a dynamically integrated search engine
TW548557B (en) 2000-09-13 2003-08-21 Intumit Inc A method and system for electronic document to have fast-search category and mutual link
JP3934325B2 (ja) 2000-10-31 2007-06-20 株式会社日立製作所 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体
US6845374B1 (en) 2000-11-27 2005-01-18 Mailfrontier, Inc System and method for adaptive text recommendation
US7356530B2 (en) 2001-01-10 2008-04-08 Looksmart, Ltd. Systems and methods of retrieving relevant information
US20020152033A1 (en) * 2001-02-23 2002-10-17 Beavis Ronald C. Method for evaluating the quality of database search results by means of expectation value
US6714929B1 (en) 2001-04-13 2004-03-30 Auguri Corporation Weighted preference data search system and method
US20020165856A1 (en) 2001-05-04 2002-11-07 Gilfillan Lynne E. Collaborative research systems
SE523098C2 (sv) * 2001-06-19 2004-03-30 Jan G Faeger Anordning och förfarande för att i en reell omgivning skapa en virtuell företeelse
US6728704B2 (en) 2001-08-27 2004-04-27 Verity, Inc. Method and apparatus for merging result lists from multiple search engines
US20030046098A1 (en) 2001-09-06 2003-03-06 Seong-Gon Kim Apparatus and method that modifies the ranking of the search results by the number of votes cast by end-users and advertisers
US20020156779A1 (en) 2001-09-28 2002-10-24 Elliott Margaret E. Internet search engine
US6944609B2 (en) 2001-10-18 2005-09-13 Lycos, Inc. Search results using editor feedback
TW530224B (en) 2001-12-07 2003-05-01 Inst Information Industry Relation establishment system and method for key words in search engine
US7986672B2 (en) 2002-02-25 2011-07-26 Qualcomm Incorporated Method and apparatus for channel quality feedback in a wireless communication
US20030212663A1 (en) 2002-05-08 2003-11-13 Doug Leno Neural network feedback for enhancing text search
US7188117B2 (en) * 2002-05-17 2007-03-06 Xerox Corporation Systems and methods for authoritativeness grading, estimation and sorting of documents in large heterogeneous document collections
JP2004013323A (ja) 2002-06-04 2004-01-15 Nippon Telegraph & Telephone East Corp 情報検索方法、情報検索システム、情報検索プログラム、情報評価プログラム、情報検索プログラムおよび情報評価プログラムをそれぞれ記録した記録媒体
US20040030697A1 (en) 2002-07-31 2004-02-12 American Management Systems, Inc. System and method for online feedback
US20040024755A1 (en) 2002-08-05 2004-02-05 Rickard John Terrell System and method for indexing non-textual data
US7599911B2 (en) 2002-08-05 2009-10-06 Yahoo! Inc. Method and apparatus for search ranking using human input and automated ranking
US7386554B2 (en) * 2002-09-03 2008-06-10 Infoglide Software Corporation Remote scoring and aggregating similarity search engine for use with relational databases
US6829599B2 (en) 2002-10-02 2004-12-07 Xerox Corporation System and method for improving answer relevance in meta-search engines
US20040083127A1 (en) 2002-10-29 2004-04-29 Lunsford Joseph R. Web site and method for search engine optimization by prompting, recording and displaying feedback of a web site user
US20040117354A1 (en) 2002-12-16 2004-06-17 Azzaro Steven Hector Process for tagging and measuring quality
EP1584013A4 (en) 2002-12-20 2007-09-19 Shailen V Banker RELATED INFORMATION SYSTEM
US20040146200A1 (en) * 2003-01-29 2004-07-29 Lockheed Martin Corporation Segmenting touching characters in an optical character recognition system to provide multiple segmentations
US20040215608A1 (en) 2003-04-25 2004-10-28 Alastair Gourlay Search engine supplemented with URL's that provide access to the search results from predefined search queries
US20050033771A1 (en) * 2003-04-30 2005-02-10 Schmitter Thomas A. Contextual advertising system
US7283997B1 (en) * 2003-05-14 2007-10-16 Apple Inc. System and method for ranking the relevance of documents retrieved by a query
US8666983B2 (en) 2003-06-13 2014-03-04 Microsoft Corporation Architecture for generating responses to search engine queries
WO2005026902A2 (en) 2003-09-11 2005-03-24 Levi Ronald M A rental system, method and apparatus
US7647242B2 (en) * 2003-09-30 2010-01-12 Google, Inc. Increasing a number of relevant advertisements using a relaxed match
US20050071328A1 (en) * 2003-09-30 2005-03-31 Lawrence Stephen R. Personalization of web search
US7523096B2 (en) 2003-12-03 2009-04-21 Google Inc. Methods and systems for personalized network searching
US7523109B2 (en) 2003-12-24 2009-04-21 Microsoft Corporation Dynamic grouping of content including captive data
US20050160107A1 (en) 2003-12-29 2005-07-21 Ping Liang Advanced search, file system, and intelligent assistant agent
US20050149499A1 (en) 2003-12-30 2005-07-07 Google Inc., A Delaware Corporation Systems and methods for improving search quality
US8375048B1 (en) * 2004-01-20 2013-02-12 Microsoft Corporation Query augmentation
US8788492B2 (en) 2004-03-15 2014-07-22 Yahoo!, Inc. Search system and methods with integration of user annotations from a trust network
US7590619B2 (en) 2004-03-22 2009-09-15 Microsoft Corporation Search system using user behavior data
US7689585B2 (en) 2004-04-15 2010-03-30 Microsoft Corporation Reinforced clustering of multi-type data objects for search term suggestion
US7231405B2 (en) 2004-05-08 2007-06-12 Doug Norman, Interchange Corp. Method and apparatus of indexing web pages of a web site for geographical searchine based on user location
US7349901B2 (en) 2004-05-21 2008-03-25 Microsoft Corporation Search engine spam detection using external data
WO2007001247A2 (en) * 2004-06-02 2007-01-04 Yahoo! Inc. Content-management system for user behavior targeting
US7788260B2 (en) 2004-06-14 2010-08-31 Facebook, Inc. Ranking search results based on the frequency of clicks on the search results by members of a social network who are within a predetermined degree of separation
US7730012B2 (en) 2004-06-25 2010-06-01 Apple Inc. Methods and systems for managing data
US20060047643A1 (en) * 2004-08-31 2006-03-02 Chirag Chaman Method and system for a personalized search engine
US8109765B2 (en) 2004-09-10 2012-02-07 Scientific Learning Corporation Intelligent tutoring feedback
US20060173880A1 (en) 2005-01-28 2006-08-03 Microsoft Corporation System and method for generating contextual survey sequence for search results
US20060170705A1 (en) * 2005-02-01 2006-08-03 Lyris Technologies, Inc. Method and system to review the display of content
US9092523B2 (en) 2005-02-28 2015-07-28 Search Engine Technologies, Llc Methods of and systems for searching by incorporating user-entered information
KR101374651B1 (ko) 2005-03-18 2014-03-17 써치 엔진 테크놀로지스, 엘엘씨 서치 결과를 향상시키기 위해 사용자로부터의 피드백을 적용하는 서치 엔진
US7653302B2 (en) * 2005-03-24 2010-01-26 Syabas Technology Inc. Techniques for transmitting personal data and metadata among computing devices
WO2006110684A2 (en) * 2005-04-11 2006-10-19 Textdigger, Inc. System and method for searching for a query
US8732175B2 (en) * 2005-04-21 2014-05-20 Yahoo! Inc. Interestingness ranking of media objects
US7809192B2 (en) * 2005-05-09 2010-10-05 Like.Com System and method for recognizing objects from images and identifying relevancy amongst images and information
US7783135B2 (en) * 2005-05-09 2010-08-24 Like.Com System and method for providing objectified image renderings using recognition information from images
US8086605B2 (en) * 2005-06-28 2011-12-27 Yahoo! Inc. Search engine with augmented relevance ranking by community participation
US20070112758A1 (en) 2005-11-14 2007-05-17 Aol Llc Displaying User Feedback for Search Results From People Related to a User
US7668821B1 (en) * 2005-11-17 2010-02-23 Amazon Technologies, Inc. Recommendations based on item tagging activities of users
US7756855B2 (en) * 2006-10-11 2010-07-13 Collarity, Inc. Search phrase refinement by search term replacement
US20090089322A1 (en) * 2007-09-28 2009-04-02 Mor Naaman Loading predicted tags onto electronic devices
US9137321B2 (en) 2013-03-15 2015-09-15 Citrix Systems, Inc. Pairing users with social media communities
US20160379074A1 (en) * 2015-06-25 2016-12-29 Appropolis Inc. System and a method for tracking mobile objects using cameras and tag devices

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101007056B1 (ko) * 2008-07-30 2011-01-12 주식회사 메디오피아테크 연관 태그에 기반한 태그 클러스터링 장치 및 그 방법
WO2010041818A2 (ko) * 2008-10-08 2010-04-15 경북대학교 산학협력단 태그 적합성 피드백 시스템 및 방법
WO2010041818A3 (ko) * 2008-10-08 2010-06-24 경북대학교 산학협력단 태그 적합성 피드백 시스템 및 방법
KR101067851B1 (ko) * 2009-03-05 2011-09-27 이노디지털 주식회사 웹 페이지 검색 시스템
US8429098B1 (en) 2010-04-30 2013-04-23 Global Eprocure Classification confidence estimating tool
KR101226712B1 (ko) * 2010-12-22 2013-01-25 한양대학교 에리카산학협력단 컨텐츠 태그의 순위 산정 장치 및 방법
KR101270958B1 (ko) * 2013-01-02 2013-06-11 주식회사 한글과컴퓨터 전자 문서 내 이미지 검색 장치 및 방법
KR20160111233A (ko) 2015-03-16 2016-09-26 한화테크윈 주식회사 영상 검색 방법 및 장치
KR20190134928A (ko) * 2018-05-17 2019-12-05 주식회사 머니브레인 대화 이해 ai 시스템에 의하여, 계층적으로 저장되어 있는 북마크에 대한 문맥기반 검색 서비스를 제공하는 방법 및 컴퓨터 판독가능 기록 매체
WO2022097891A1 (ko) * 2020-11-05 2022-05-12 주식회사 해시스크래퍼 동일 구조의 데이터를 추출하는 방법 및 그를 이용한 장치

Also Published As

Publication number Publication date
KR101361182B1 (ko) 2014-02-07
CA2617831A1 (en) 2007-02-15
US10963522B2 (en) 2021-03-30
JP5431727B2 (ja) 2014-03-05
WO2007019311A2 (en) 2007-02-15
US20170357723A1 (en) 2017-12-14
WO2007019311A3 (en) 2007-08-30
JP2009503751A (ja) 2009-01-29
EP1924903A2 (en) 2008-05-28
CA2617831C (en) 2016-08-30
US20070185858A1 (en) 2007-08-09
US9715542B2 (en) 2017-07-25
US20200311155A1 (en) 2020-10-01
EP1924903A4 (en) 2011-09-28

Similar Documents

Publication Publication Date Title
US20200311155A1 (en) Systems for and methods of finding relevant documents by analyzing tags
US11036814B2 (en) Search engine that applies feedback from users to improve search results
TWI391834B (zh) 藉分析標籤尋找相關文件之系統及方法
US8838567B1 (en) Customization of search results for search queries received from third party sites
US8589391B1 (en) Method and system for generating web site ratings for a user
US9529861B2 (en) Method, system, and graphical user interface for improved search result displays via user-specified annotations
JP5268073B2 (ja) ブックマークおよびランク付け
US20060282413A1 (en) System and method for a search engine using reading grade level analysis
US20100161592A1 (en) Query Intent Determination Using Social Tagging
JP2008507041A (ja) 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
US20180032614A1 (en) System And Method For Compiling Search Results Using Information Regarding Length Of Time Users Spend Interacting With Individual Search Results
JP2002539559A (ja) インターネット検索とホットリンクを結びつける、相乗作用を生むインターネットブックマーク
Šimko et al. Semantic history map: Graphs aiding web revisitation support
JP2010282403A (ja) 文書検索方法
Liu et al. Discovering business intelligence information by comparing company Web sites
TW201411379A (zh) 搜索系統及方法
Tan et al. QueReSeek: Community-Based Web Navigation by Reverse Lookup of Search History
Lakers et al. Search Engine Technology
WO2011018453A1 (en) Method and apparatus for searching documents

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170207

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180108

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190103

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20200121

Year of fee payment: 7