KR20070007031A - 트렌드 분석을 이용한 검색 쿼리 처리 시스템 및 방법 - Google Patents
트렌드 분석을 이용한 검색 쿼리 처리 시스템 및 방법 Download PDFInfo
- Publication number
- KR20070007031A KR20070007031A KR1020067011525A KR20067011525A KR20070007031A KR 20070007031 A KR20070007031 A KR 20070007031A KR 1020067011525 A KR1020067011525 A KR 1020067011525A KR 20067011525 A KR20067011525 A KR 20067011525A KR 20070007031 A KR20070007031 A KR 20070007031A
- Authority
- KR
- South Korea
- Prior art keywords
- query
- queries
- search
- criterion
- user
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99942—Manipulating data structure, e.g. compression, compaction, compilation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
검색 요청을 처리하는 시스템 및 방법은 찾고 있는 정보의 보다 정확한 이해를 제공하기 위해 수신된 쿼리의 분석을 포함한다. 일 실시예에서, 쿼리는 쿼리의 하나 이상의 단어 또는 토큰을 포함할 수 있는 단위로 구문 분석되며, 단위는 개념 네트워크에 관련된다. 관심 기준에 따라 쿼리들을 서브셋으로 분류하고, 서로 다른 서브셋에 대한 개념 네트워크를 비교함으로써 트렌드 분석이 이루어진다. 계속해서 수신된 쿼리에 대한 자동 검색 에이전트의 응답을 향상시키기 위해 트렌드 정보가 사용될 수 있다.
Description
본 출원은 다음의 공통 양도된 계류중인 미국 특허 출원에 관련된다: "범용 검색 인터페이스 시스템 및 방법"이라는 명칭으로 2003년 4월 4일자 제출된 예비 출원 60/460,222호; 및 "단위들의 클러스터링을 이용한 검색 처리 시스템 및 방법"이라는 명칭으로 2003년 10월 9일자 제출된 예비 출원 60/510,220호. 이들 출원 각각의 개시는 모든 목적을 위해 본원에 참조로 포함된다. 본원 발명은 트렌드 분석을 이용한 검색 쿼리(query) 처리 시스템 및 방법에 관한 것이다.
인터넷의 출현 및 월드 와이드 웹(web)을 통해 사용자가 이용 가능한 다수의 웹 페이지 및 미디어 컨텐츠에 의해, 웹으로부터 원하는 정보를 필터링하고 얻기 위한 간결한 접근법을 사용자에게 제공할 필요가 생겼다. 원하는 정보를 얻고자 하는 사용자의 요구를 충족시키기 위한 검색 시스템 및 프로세스가 개발되었다. 이러한 기술의 예는 Yahoo!, Google 및 다른 사이트들을 통해 액세스될 수 있다. 통상적으로, 사용자가 쿼리를 입력하고 검색 프로세스는 쿼리에 관련된 하나 이상의 링크(웹을 검색하는 경우), 문서 및/또는 참조(다른 검색어의 경우)로 답변한 다. 답변한 링크는 사용자가 실제로 찾고 있던 것과 밀접하게 관련될 수도 있고, 완전히 관련이 없을 수도 있다. 쿼리에 대한 결과의 "관련성"은 부분적으로는 사용된 검색 시스템(밑에 있는 수집 시스템)의 강인성(robustness)뿐 아니라 입력된 실제 쿼리의 함수일 수도 있다. 관련성은 사용자에 의해 주관적으로 결정될 수도 있고, 사용자가 찾고 있는 것에 의해 객관적으로 결정될 수도 있다.
사용자가 입력한 쿼리는 통상적으로 하나 이상의 단어로 구성된다. 예를 들어, 쿼리는 "hawaii", "new york city", "new york city law enforcement"과 같다. 이와 같이, 쿼리는 전부 인간의 두뇌에서 완전하지 않다. 다시 말하면, 인간은 쿼리에 관해 자연히 생각하지 않는다. 이들은 쿼리 검색 엔진 또는 룩업 라이브러리 카탈로그의 필요성에 의해 부분적으로 부과되는 인위적인 구조이다. 인간은 단지 단일 단어들에 관해서도 자연스럽게 생각하지 않는다. 인간이 생각하는 것은 자연 개념이다. 예를 들어, "hawaii"와 "new york city"는 단어 수로 측정되는 길이에 관해서는 상당히 다른 쿼리이지만, 이들은 한 가지 중요한 특징을 공유하는데, 즉 이들은 각각 하나의 개념을 구성한다. 그러나 "new york city law enforcement"라는 쿼리는 "new york city"와 "law enforcement"라는 두 가지 별개의 개념을 구성하기 때문에 다르다.
또한, 인간은 개념들 간의 논리적 관계에 관해 생각한다. 예를 들어, 경찰은 중요한 법률 시행 기관이기 때문에 "law enforcement"와 "police"는 관련 개념이며, 이러한 개념들 중 하나를 타이핑하는 사용자는 사용자가 타이핑했던 특정 단어나 문구를 포함하지 않더라도 다른 개념과 관련된 사이트에 관심이 있을 수도 있 다. 이러한 사고 패턴의 결과, 인간은 자연히 단일 단어들의 가변적인 긴 시퀀스를 단순화하지 않고 하나 이상의 자연 개념을 입력함으로써 쿼리를 구성하며, 쿼리는 일반적으로 사용자가 알 수 있는 관련 개념을 모두 포함하지는 않는다. 또한, 사용자 의도가 쿼리의 개별 단어에 반드시 반영되는 것은 아니다. 예를 들어, "law enforcement"는 하나의 개념이지만, 개별 단어 "law"와 "enforcement"는 조합된 단어들과 같은 사용자 의도를 개별적으로 전달하지는 않는다.
주요 검색 제공자, 예를 들어 MSN, Google이나 임의의 다른 주요 검색 엔진 사이트의 현재 기술은 인간이 쿼리를 생성하는 것과 동일한 방식으로 쿼리를 이해하지 않는다. 예컨대, 기존의 검색 엔진들은 일반적으로 사용자가 실제로 의도하고 있는 관련 개념이나 근원적인 자연 개념이 아니라, 사용자가 입력한 정확한 단어나 문구를 검색한다. 이는 아마 검색 제공자들이 사용자의 의도를 인지하여 최적의 검색 결과 및 컨텐츠를 제공하는 것을 방해하는 가장 중요한 이유일 것이다.
알 수 있듯이, 사용자가 관심 있거나 사용자의 경험을 향상시키는 실제 개념에 보다 일치하는 결과를 제공하는데 도움이 되는 개선된 검색 및 인터페이스 기술이 필요하다.
본 발명의 실시예들은 찾고 있는 정보의 보다 정교한 이해를 제공하기 위해 수신된 쿼리의 분석을 포함하여, 검색 요청을 처리하는 시스템 및 방법을 제공한다. 쿼리는 예를 들어 쿼리의 하나 이상의 단어 또는 토큰을 포함할 수 있는 단위로 구문 분석될 수 있다. 쿼리의 단위 표현에 대해 추가 분석이 이루어져, 다른 쿼리에 사용되는 단위들의 비슷한 조합과 같은 패턴을 검출한다. 제 2 단위들의 비슷한 세트에 관련하여 쿼리에서 생기는 단위들은 클러스터에 그룹화되고, 각각에 관련된 제 2 단위들의 유사도를 기초로 두 클러스터 부재 간의 관계에 가중치가 할당될 수 있다.
본 발명의 한 형태에 따르면, 쿼리들의 다른 서브셋마다 클러스터링이 반복되고, 하나 이상의 기준에 따라 쿼리가 서브셋으로 분류된다. 일 실시예에서, 기준은 시간, 사용자의 개인 성격 또는 인구 통계(예를 들어, 연령, 성별, 알려진 취미 또는 사용자 프로파일), 지역 분류 기준(예를 들어, 물리적 위치 또는 IP 주소), 또는 쿼리에 선행하는 상황이나 사용자의 행동을 나타내는 종단적 기준(예를 들어, 쿼리가 입력될 때 사용자가 웹사이트 어디에 있는지)을 포함한다. 적어도 2개의 서브셋으로부터 해당 서브셋-특정 개념을 비교함으로써 단위나 클러스터에 관한 트렌드 정보가 생성된다.
첨부 도면과 함께 다음의 상세한 설명은 본 발명의 특징 및 이점의 이해를 돕는다.
도 1은 본 발명의 실시예에 따른 정보 검색 및 통신 시스템의 간략화된 고 레벨 블록도이다.
도 2는 본 발명의 실시예에 따른 미디어 컨텐츠를 전달하는 정보 검색 및 통신 네트워크의 간략화된 블록도이다.
도 3은 본 발명의 실시예에 따른 쿼리 처리 엔진의 간략화된 블록도이다.
도 4는 본 발명의 실시예에 따라 트렌드 분석을 실행하는 프로세스의 흐름도이다.
도 5는 본 발명의 실시예에 따른 단위 사전, 및 어떤 형태에서 쿼리 처리 엔진을 포함하는 관련 처리 정보를 포함하는 시스템의 간략화된 블록도이다.
도 6은 하루의 시간 함수로서 쿼리의 빈도를 나타내는 트렌드 데이터의 그래프이다.
도 1은 본 발명의 실시예에 따른 클라이언트 시스템(20)을 포함하는 정보 검색 및 통신 네트워크(10)의 일반 개요를 나타낸다. 컴퓨터 네트워크(10)에서, 클라이언트 시스템(20)은 인터넷(40) 또는 다른 통신망을 통해, 예를 들어 LAN 또는 WAN 접속을 통해 임의의 개수의 서버 시스템(501~50N)에 연결된다. 여기서 설명하는 바와 같이, 클라이언트 시스템(20)은 본 발명에 따라 임의의 서버 시스템(501~50N)과 통신하도록, 예를 들어 미디어 컨텐츠 및 웹 페이지와 같은 다른 정보를 액세스, 수신, 검색 및 디스플레이하도록 구성된다.
도 1에 나타낸 시스템의 여러 구성요소들은 여기서 상세히 설명할 필요 없는 종래의 공지된 구성요소를 포함한다. 예를 들어, 클라이언트 시스템(20)은 개인용 데스크탑 컴퓨터, 워크스테이션, 랩탑, PDA, 셀폰, 또는 임의의 WAP 가능 장치나 인터넷에 직접 또는 간접적으로 인터페이스할 수 있는 다른 연산 장치를 포함할 수 있다. 클라이언트 시스템(20)은 통상적으로 Microsoft Internet ExplorerTM 브라우 저, Netscape NavigarotTM 브라우저, MozillaTM 브라우저, OperaTM 브라우저, 셀폰이나 PDA 또는 다른 무선 장치의 경우에는 WAP 가능 브라우저 등 클라이언트 시스템(20)의 사용자가 인터넷(40)을 통해 서버 시스템(501~50N)으로부터 입수할 수 있는 정보 및 페이지를 액세스 및 처리하고 볼 수 있게 하는 브라우징 프로그램을 실행한다. 또한, 클라이언트 시스템(20)은 통상적으로 키보드, 마우스, 터치 스크린, 펜 등, 서버 시스템(501~50N)이나 다른 서버에 의해 제공되는 페이지, 폼 및 다른 정보와 관련하여 디스플레이(예를 들어, 모니터 스크린, LCD 디스플레이 등) 상의 브라우저에 의해 제공되는 그래픽 사용자 인터페이스(GUI)와 상호 작용하기 위한 하나 이상의 사용자 인터페이스 장치(22)를 포함한다. 본 발명은 네트워크의 특정 글로벌 인터 네트워크라 하는 인터넷에 사용하기 적합하다. 그러나 인터넷 대신 또는 인터넷에 추가로 인트라넷, 익스트라넷, 가상 개인 네트워크(VPN), 비-TCP/IP 기반 네트워크, 임의의 LAN 또는 WAN 등의 다른 네트워크가 사용될 수 있는 것으로 이해해야 한다.
일 실시예에 따르면, 클라이언트 장치(20) 및 그 구성요소들은 모두 Intel PentiumTM 프로세서, AMD AtholonTM 프로세서 등의 중앙 처리 유닛이나 다중 프로세서를 이용하여 실행되는 컴퓨터 코드를 포함하는 애플리케이션을 이용하여 구성될 수 있는 연산자이다. 여기에 개시된 바와 같이 데이터 및 미디어 컨텐츠를 전달, 처리 및 디스플레이하도록 클라이언트 시스템(20)을 조작 및 구성하는 컴퓨터 코드 는 바람직하게 하드디스크에 다운로드되어 저장되지만, 전체 프로그램 코드 또는 그 일부는 ROM이나 RAM으로 잘 알려진 다른 비휘발성 메모리 매체나 장치에 저장될 수도 있고, 콤팩트 디스크(CD) 매체, 디지털 다기능 디스크(DVD) 매체, 플로피 디스크 등 프로그램 코드를 저장할 수 있는 임의의 매체에 제공될 수도 있다. 추가로, 전체 프로그램 코드 또는 그 일부는 소프트웨어 소스로부터, 예를 들어 서버 시스템(501~50N) 중 하나로부터 인터넷을 통해 클라이언트 시스템(20)에 전송 및 다운로드될 수도 있고, 임의의 통신 매체 및 프로토콜(예를 들어, TCP/IP, HTTP, HTTPS, 이더넷, 또는 다른 종래의 매체 및 프로토콜)을 이용하여 임의의 다른 네트워크 접속(예를 들어, 익스트라넷, VPN, LAN, 또는 다른 종래의 네트워크)을 통해 전송될 수도 있다.
본 발명의 형태들을 구현하는 컴퓨터 코드는 C, C++, HTML, XML, 자바, 자바 스크립트 등의 코드나 임의의 다른 적당한 스크립트 언어(예를 들어, VBScript)일 수도 있고, 클라이언트 시스템(20) 상에서 실행되거나 클라이언트 시스템(20) 상에서 실행되도록 컴파일될 수 있는 다른 적당한 프로그래밍 언어일 수도 있는 것으로 인식해야 한다. 어떤 실시예에서는, 클라이언트 시스템(20)에 코드가 다운로드되지 않고, 필요한 코드가 서버에 의해 실행되거나, 클라이언트 시스템(20)에 이미 존재하는 코드가 실행된다.
도 2는 본 발명의 실시예에 따른 미디어 컨텐츠를 전달하는 다른 정보 검색 및 통신 네트워크(110)를 나타낸다. 도시한 바와 같이, 네트워크(110)는 클라이언 트 시스템(120), 하나 이상의 컨텐츠 서버 시스템(150) 및 검색 서버 시스템(160)을 포함한다. 네트워크(110)에서, 클라이언트 시스템(120)은 인터넷(140) 또는 다른 통신 네트워크를 통해 서버 시스템(150, 160)과 통신 가능하게 연결된다. 상술한 바와 같이, 클라이언트 시스템(120) 및 그 구성요소들은 인터넷(140) 또는 다른 통신 네트워크를 통해 서버 시스템(150, 160) 및 다른 서버 시스템과 통신하도록 구성된다.
일 실시예에 따르면, 클라이언트 시스템(120)에서 실행하는 (모듈(125)로 나타낸) 클라이언트 애플리케이션은 서버 시스템(150, 160)과 통신하고 이들로부터 수신된 데이터를 처리 및 디스플레이하도록 클라이언트 시스템(120) 및 그 구성요소들을 제어하는 명령들을 포함한다. 클라이언트 애플리케이션 모듈(125)은 상술한 바와 같이 플로피 디스크, CD, DVD 등 임의의 소프트웨어 저장 매체에 제공될 수 있지만, 클라이언트 애플리케이션(125)은 바람직하게 원격 서버 시스템(예를 들어, 서버 시스템(150), 서버 시스템(160) 또는 다른 원격 서버 시스템) 등의 소프트웨어 소스로부터 클라이언트 시스템(120)에 전송 및 다운로드된다. 예를 들어, 한 형태에서, 클라이언트 애플리케이션 모듈(125)은 예를 들어, 임베디드 자바 스크립트나 액티브 X 컨트롤 등 데이터를 조종하고 각종 객체, 프레임 및 윈도우로 데이터를 랜더링하는 각종 컨트롤을 포함하는 HTML 래퍼(wrapper)로 인터넷(140)을 통해 클라이언트 시스템(120)에 제공될 수 있다.
추가로, 클라이언트 애플리케이션 모듈(125)은 검색 요청 및 검색 결과 데이터를 처리하는 전문 검색 모듈(126), 데이터 및 미디어 컨텐츠를 텍스트 및 데이터 프레임과 활성 윈도우, 예를 들어 브라우저 윈도우와 대화 상자에 랜더링하는 사용자 인터페이스 모듈(127), 클라이언트(120) 상에서 실행하는 각종 애플리케이션과 인터페이스 및 통신하는 애플리케이션 인터페이스 모듈(128)과 같이 데이터 및 미디어 컨텐츠를 처리하기 위한 다양한 소프트웨어 모듈을 포함한다. 본 발명의 형태에 따라 애플리케이션 인터페이스 모듈(128)이 인터페이스 하도록 바람직하게 구성되는, 클라이언트 시스템(120)에서 실행하는 각종 애플리케이션의 예는 각종 이메일 애플리케이션, 인스턴트 메시징(IM) 애플리케이션, 브라우저 애플리케이션, 문서 관리 애플리케이션 및 그 밖의 애플리케이션들을 포함한다. 또한, 인터페이스 모듈(127)은 클라이언트 시스템(120)에 구성된 디폴트 브라우저나 다른 브라우저 등의 브라우저를 포함할 수 있다. 어떤 실시예에서, 클라이언트 애플리케이션 모듈(125)은 상기에 인용된 예비 출원 60/460,222호에 개시된 범용 검색 인터페이스의 특징을 제공한다.
일 실시예에 따르면, 검색 서버 시스템(160)은 클라이언트 시스템(120)에 검색 결과 데이터 및 미디어 컨텐츠를 제공하도록 구성되고, 컨텐츠 서버 시스템(150)은 예를 들어 검색 서버 시스템(160)에 의해 제공되는 검색 결과 페이지에서 선택된 링크에 응답하여 클라이언트 시스템(120)에 웹 페이지와 같은 데이터 및 미디어 컨텐츠를 제공하도록 구성된다. 어떤 변형예에서, 검색 서버 시스템(160)은 컨텐츠에 대한 링크 및/또는 다른 참조는 물론, 또는 그 대신 컨텐츠를 리턴한다.
일 실시예의 검색 서버 시스템(160)은 하나 이상의 페이지 인덱스를 예를 들어 페이지, 페이지로의 링크, 인덱스된 페이지의 컨텐츠를 나타내는 데이터 등으로 파퓰레이팅(populating)하는 각종 수집 기술을 참조한다. 이러한 수집 기술은 계층 구조 내의 웹 페이지들을 분류하고 정렬하기 위한 수동 또는 반자동 분류 알고리즘 및 인터페이스는 물론, 자동 웹 크롤러(web crawler), 스파이더 등을 포함한다. 어떤 형태에서, 검색 서버 시스템(160)은 웹 페이지를 처리하고 정렬하기 위한 검색 관련 알고리즘으로도 구성된다. 검색 서버 시스템(160)은 또한 사용자 쿼리 활동을 쿼리 로그 파일 형태로 기록하도록 바람직하게 구성된다.
검색 서버 시스템(160)은 클라이언트 시스템, 특히 검색 모듈(126)로부터 수신된 각종 검색 요청에 응답하는 데이터를 제공하도록 구성된다. 서버 시스템(150, 160)은 단일 구조의 일부, 예를 들어 Yahoo! 사에 의해 사용자들에게 제공되는 것과 같은 분산 서버 시스템의 일부일 수도 있고, 다른 구조의 일부일 수도 있다. 컨텐츠 서버 시스템(150) 및 검색 서버 시스템(160)은 각각 적어도 하나의 서버 및 관련 데이터베이스 시스템을 포함하며, 다수의 서버 및 관련 데이터베이스 시스템을 포함할 수도 있고, 단일 블록으로 도시되지만 지리적으로 분산될 수도 있다. 예를 들어, 검색 서버 시스템(160)의 모든 서버는 서로 근접하여 배치될 수도 있고(예를 들어, 하나의 빌딩이나 캠퍼스에 위치하는 서버팜으로), 서로 멀리 떨어진 위치에 분산될 수도 있다(A시에 위치하는 하나 이상의 서버 및 B시에 위치하는 하나 이상의 서버).
여기서 사용되는 바와 같이, "서버 시스템"은 통상적으로 하나 이상의 지리적 위치에 국부적으로 또는 전역에 하나 이상의 논리적으로 그리고/또는 물리적으로 접속된 서버를 포함한다. "서버"는 통상적으로 컴퓨터 시스템 및 관련 저장 시 스템 및 당업계에 공지된 것과 같은 데이터베이스 애플리케이션을 포함한다.
일 실시예에 따르면, 검색 서버 시스템(160)은 페이지 인덱스(들)에 액세스하고 클라이언트 시스템(120)으로부터 수신된 검색 쿼리에 응답하여 사용자들에게 검색 결과를 제공하는 하나 이상의 페이지 인덱스 및 알고리즘으로 구성된다. 어떤 형태에서, 검색 서버 시스템(160)은 추가로 클라이언트 시스템(120)으로부터의 검색 요청에 응답하여 향상된 검색 쿼리 분석 및 클러스터링 기능을 제공하도록 구성된다. 다른 변형예에서, 검색 서버 시스템(160)은 컨텐츠 서버 시스템(150)의 컨텐츠 및 기능을 모두 포함한다.
일 실시예에서, 검색 서버 시스템(160)에서 실행하는 프로세스들은 검색 쿼리 및/또는 검색 결과의 문맥 분석을 수행하여 여러 상황을 반영하도록 그룹화된 검색 결과로 응답한다. 많은 검색어는 의도한 상황에 따라 다른 의미를 가질 수 있다. 예를 들어, 사용자가 "Java"라는 용어를 사용하여 검색을 실행한다면, 의도한 상황은 명확하지 않다. 사용자는 자바 컴퓨터 언어에 관심이 있을 수도 있고, 인도네시아 자바 섬에 관심이 있을 수도 있으며, (구어체로 흔히 자바라 하는) 커피에 관심이 있을 수도 있다. 본 발명은 검색 쿼리 및/또는 결과를 유리하게 분석하고, 사용자의 컴퓨터(120)에 디스플레이할 상황으로 결과를 그룹화한다. 예를 들어, 검색어 "Java"에 응답하여, 검색 서버 시스템(160)의 어떤 실시예는 3개(또는 다른 상황이 인지된다면 그 이상)의 문맥 또는 단어 개념: 컴퓨터 언어 자바, 섬 자바, 커피 자바로 그룹화된 검색 결과를 리턴한다. 시스템은 각 상황에 관련하여 제공되는 링크들과 함께 세트로 결과를 표시하도록 구성될 수도 있고, 어떤 링크도 없이 (사용자가 상황을 구별하기에 충분한 정보와 함께) 문맥만을 디스플레이하고 사용자가 원하는 상황을 선택하여 관련 링크를 디스플레이하게 할 수도 있다. Yahoo! 네트워크 시스템에서, 예를 들어 각 문맥이 검색 인덱스로부터의 페이지에 대한 링크 세트, 스폰서 일치와 관련된 링크, 디렉터리 일치와 관련된 링크 및 Inside Yahoo!(IY) 일치와 관련된 링크를 갖는 문맥 세트가 디스플레이될 수 있다.
"Java"와 같이 모호한 의미를 갖는 단어나 문구 외에도, 본 발명의 시스템은 일 실시예에서 반드시 모호한 것은 아닌 검색어에 대한 문맥으로 결과를 그룹화하도록 구성된다. 일례는 검색어 "Hawaii"에 대해 리턴되는 결과이다. 본래 또는 자연히 "Hawaii"란 용어는 모호하지 않을 수도 있지만, 이러한 용어에 대해 리턴되는 결과의 특징은 Hawaii에 관해 논하거나 단지 언급하는 모든 사이트에 관련되어 매우 넓을 수 있다. 사용자에게 보다 유용한 결과를 제공하기 위해, 본 발명의 시스템은 바람직하게 검색 결과가 실제로 관련되는 지식을 레버리지함으로써 문맥으로 검색 결과를 구성한다. 예를 들어, Hawaii에 대해 시스템은 "Hawaii: 여행", "Hawaii: 기후", "Hawaii: 지리", "Hawaii: 문화" 등 다양한 문맥 그룹화로 결과를 리턴할 수 있다.
어떤 실시예에서, 인덱스의 페이지 링크와 관련하여 문맥 식별자가 저장되어, 검색이 실행될 때 식별자에 따라 링크가 그룹화될 수 있다. 페이지 링크는 다수의 문맥 식별자와 관련될 수 있다. 이러한 식별자는 바람직하게 사용자가 관련 검색을 실행할 때 시스템에 의해 링크와 자동으로 관련되지만, 식별자는 하나 이상 의 인덱스 편집기 팀에 의해 변경되고 수동으로 링크와 관련될 수도 있다. 이와 같이, 다수의 검색으로부터 수집된 지식은 시스템에 피드백되어, 디스플레이된 검색 결과를 요청한 사용자에게 더욱 중요하고 유용하게 하도록 문맥을 정의하고 재정의한다.
일 실시예에서, 검색 서버 시스템(160) 상의 알고리즘은 검색어의 개념 발견 또는 개념 분석을 실행하여 더욱 뜻있는 결과를 사용자에게 제공한다. 예를 들어, "New York City"라는 검색 문구에 대해, 사용자는 뉴욕주의 다른 도시에 반해 뉴욕시(도시 또는 지방)에 관련된 사이트에 관심이 있음이 상당히 명백하다. 마찬가지로, "New York City law enforcement"에 대해, 사용자는 뉴욕시의 법률 시행(예를 들어, 절도 부분)에 관련된 사이트에 관심이 있음이 명백하다. 그러나 대부분의 검색 엔진은 단지 검색 문구에 단어가 나타나는 순서와 관계없이 개별 단어 "New", "York", "City", "law", "enforcement"를 사용하여 검색하게 된다. 다른 검색 엔진은 인덱스에 나타나는 검색 문구에서 가장 긴 서브스트링을 찾는 시도를 할 수도 있다. 예를 들어, 인덱스가 "New York City law enforcement"가 아니라 "New York", "New York City" 및 "New York City law"에 포함되었다면, 검색 엔진은 반드시 사용자가 의도한 것은 아닌 "enforcement" 및 "New York City law"를 이용하여 검색하게 된다.
본 발명의 실시예들은 검색 문구의 단어들을 유리하게 분석하여 검색 쿼리를 구성하는 하나 이상의 개념(단위)을 식별한다.
도 3은 본 발명의 일 실시예에 따른 개념 발견 또는 트렌드 분석을 포함하는 개념 분석을 실행하는 시스템(300)의 블록도이다. 하나 이상의 쿼리 로그 파일(302)(또는 실제 쿼리)이 (쿼리 엔진이라고도 하는) 쿼리 처리 엔진(304)에 의해 수신되며, 쿼리 처리 엔진(304)은 후술하는 바와 같이 단위 사전(306)을 생성한다. 쿼리 로그 파일(또는 실제 쿼리)은 인터넷 또는 각종 네트워크 접속, 예를 들어 LAN, WAN, 직접 링크, 배포 매체(예를 들어, CD, DVD, 플로피 디스크) 등을 통해 다양한 소스로부터 수신될 수 있다. 소스의 예는 검색 서버 시스템(160)(도 1), 또는 검색 서버들의 분산 네트워크에 있는 다수의 검색 서버(160), 또는 하나 이상의 컨텐츠 서버(150)를 포함한다. 쿼리 로그 파일 소스는 통상적으로 동일한 조직 또는 엔티티, 예를 들어 Yahoo! 서버와 관련되지만, 반드시 그러한 것은 아니다. (쿼리 로그라고도 하는) 쿼리 로그 파일은 상호 정보 등의 정보 이론이나 개념에 사용될 수 있는 것과 같은 통계적 방법을 이용하여 쿼리 엔진(304)에 의해 처리된다. 바람직한 형태에서는, 원하는 대로 다른 주기, 예를 들어 시간, 주간 등에 대한 로그가 사용될 수도 있지만, 일간 쿼리 로그가 사용된다. 통상적으로 쿼리 로그는 사용자들에 의해 제공된 실제 쿼리를 포함하며, 질문하는 사용자들의 지리적 위치, 타임 스탬프, 클라이언트 시스템의 IP 주소, 쿠키, 클라이언트 종류(예를 들어, 브라우저 종류) 등과 같은 쿼리의 일부 또는 전부에 대한 추가 정보를 포함할 수도 있다. 쿼리 처리 엔진(304)은 각종 쿼리 로그를 처리하고, 그로부터 단위를 생성한다. 단위 및 발생 빈도와 같은 관련 통계는 여기서는 단위 사전(306)이라 하는 데이터베이스 파일 또는 메모리에 저장된다. 단위 사전(306)은 후술하는 바와 같이 검색 엔진에 의해 이어지는 쿼리에 대한 응답에 사용될 수 있다.
일 실시예에서, 쿼리 프로세서(304)는 단위 분석 모듈(310) 및 클러스터링 모듈(312)을 포함한다. 단위 분석 모듈(310)은 쿼리 로그(302)를 처리하여 단위를 생성한다. 바람직한 실시예에서, 시스템은 검색어가 제시되는 순서를 사용하여 쿼리를 구성하는 단위들을 식별한다. 단위는 단어(예를 들어, "java")일 수도 있고 서로 인접하게 자주 나타나는 단위 그룹(예를 들어, "new york city")일 수도 있다. 단위의 식별은 상기에 인용한 예비 출원 60/460,222호에 상세히 기술되어 있다. 단위 분석 모듈(310)에 의해 생성된 단위들은 단위 사전(306)에 저장되며, 어떤 실시예에서는, 통계 정보(예를 들어, 발생 빈도 또는 하나 이상의 다른 단위와 관련한 발생 빈도) 또한 포함될 수도 있다. 단위 사전(306)에 저장된 정보는 검색 엔진에 의해 이어지는 쿼리에 대한 응답에 사용될 수도 있다.
클러스터링 모듈(312)은 단위 분석 모듈(310)에 의해 식별되는 단위들을 사용하여 쿼리들의 추가 분석을 수행함으로써 서로 다른 단위들 사이의 유사성을 지시하는 클러스터 또는 개념 네트워크를 생성한다. 일반적으로 공지되 바와 같이, 개념 네트워크는 각각의 개념이 노드에 대응하는 관계를 나타내는 구조이며, 개념들 사이의 관계는 노드를 연결하는 라인(또는 에지)으로 표현된다. 에지에는 서로 다른 가중치가 할당될 수 있어, 에지의 가중치는 개념들(노드들) 사이의 유사성의 강도 또는 정확도를 반영한다. 본 발명의 실시예에 따르면, "서명" 단위들의 하나 이상의 동일 그룹과 함께 쿼리에 나타나는 경향이 있는 서로 다른 단위(클러스터의 "멤버")를 식별함으로써 단위들로부터 클러스터가 생성된다. 멤버 단위는 개념 네트워크에서 노드 역할을 할 수 있다. 서로 다른 단위나 개념 사이의 연결성 또는 관계의 다른 표현이 사용될 수도 있으며, 여기서 사용된 "개념 네트워크"는 다른 표현들을 포함하는 것으로 이해해야 한다.
예를 들어, 다수의 사용자가 자신이 좋아하는 팝 음악 그룹에 관한 정보를 검색한다고 가정한다. 통상적으로, 이들 사용자는 그룹명(예를 들어, "Avril Lavigne"이나 "Celine Dion") 그리고 "가사", "mp3", "기타 타브", "디스코그래피" 등과 같이 찾아낸 정보의 종류를 반영하는 다른 단어들을 포함하는 쿼리를 구성하게 된다. 클러스터링 모듈(312)은 이들 쿼리를 분석하여 "가사", "mp3", "기타 타브", "디스코그래피" 등이 다른 팝 음악 그룹의 이름을 포함하는 멤버의 클러스터에 대한 "서명" 단위인지를 판단한다. 클러스터링 모듈(312)에 구현될 수 있는 클러스터의 생성을 위한 특정 기술의 예는 상기에 인용한 예비 출원 60/510,220호에 개시되어 있다. 클러스터링 모듈(312)은 유리하게 멤버 단위 및 서명에 관련된 데이터를 포함하는 클러스터링 정보를 단위 사전(306)에 저장한다. 이와 같이 단위 사전(306)에서 이용 가능한 정보는 단위 및 그 "이웃"(즉, 소정 유닛을 갖는 쿼리에 나타나는 다른 유닛들)에 관한 정보는 물론, 비슷한 이웃을 가질 수 있는 다른 단위들과의 관계를 포함한다.
바람직한 실시예에서, 쿼리 처리 엔진(304)에 특정 단위나 쿼리에 관한 실세계 지식이나 언어적 정보가 제공될 필요는 없지만, 클러스터링 모듈(312)에 의해 생성된 클러스터는 개념의 실세계에서의 관계(예를 들어, 공통 카테고리에 속하는 그룹 단위)를 반영하는 경향이 있다. 예를 들어, 어떤 클러스터는 "New York City", "San Francisco", "Chicago"를 포함할 수도 있고, 그 클러스터에 대한 서명 은 "호텔", "레스토랑", "나이트 클럽"을 포함할 수도 있다. 이러한 클러스터는 뉴욕, 샌프란시스코, 시카고가 모두 여행 목적지(또는 도시)임을 반영하지만, 쿼리 엔진(304)(도 3)은 "목적지"(또는 "도시") 개념의 어떤 사전 지식도 가질 필요는 없다. 이 개념상의 지식은 쿼리의 패턴 분석으로부터 자동으로 싹틀 수 있다. 본 명세서가 인간에게 언어적 의미를 전달하는 용어를 갖는 클러스터를 라벨링하는 경우, 이는 본 개시의 이해를 용이하게 하기 위한 편의임을 이해해야 한다. 실제로, 쿼리 엔진(304) 또는 단위 사전(306)에 의해 사용되는 어떤 클러스터 라벨링 방식도 이러한 특성을 가질 필요는 없으며, 예컨대 클러스터 라벨은 단순히 숫자, 클러스터의 서명에 대한 포인터 등일 수 있다.
단위는 다수의 클러스터에 속할 수 있으며, 예를 들어 "java"와 같이 모호한 단위는 결국에 "컴퓨터 프로그래밍" 클러스터, "식음료" 클러스터, "여행" 또는 "장소" 클러스터가 될 수 있다. 어떤 실시예에서는, 어떤 클러스터에도 속하지 않는 단위들이 있을 수도 있다.
본 발명의 실시예에 따르면, 쿼리 처리 엔진(304)은 시간, 지리, 사용자 인구 통계, (여기서는 "종단적" 기준이라 하는) 사용자 이력 또는 상황 등의 다양한 기준에 따라 쿼리의 트렌드를 찾는 트렌드 분석 모듈(320) 또한 포함한다. 트렌드 분석 모듈(320)은 단위 분석 모듈(310) 및 클러스터링 모듈(312)의 기능을 유리하게 레버리지하여 쿼리의 서로 다른 서브셋에 대한 개념 분석 및/또는 개념 발견을 실행하고, 결과를 컴파일한다. 결과적인 트렌드 정보는 유리하게 단위 사전(306)에 부가된다.
단위 사전(306)은 임의의 형태로 구현될 수 있으며, 자기 디스크 또는 테이프, 콤팩트 디스크(CD)와 같은 광 저장 매체 등을 포함하는 임의의 적당한 저장 매체에 저장될 수 있다. 단위 사전(306)의 내용은 유리하게 단위는 물론 단위 분석 모듈(310)에 의해 생성된 통계적 데이터, 클러스터링 모듈(312)에 의해 결정된 클러스터링 정보, 트렌드 분석 모듈(320)에 의해 생성된 트렌드 정보와 같은 각 단위에 관한 추가 정보를 포함한다. 단위, 클러스터 및/또는 트렌드에 관한 정보는 이어지는 쿼리에 응답하기 위해 검색 엔진에 의해 사용될 수 있다.
도 4는 트렌드 분석 모듈(320)의 실시예에 의해 실행될 수 있는 프로세스(400)의 흐름도이다. 단계(402)에서는, 쿼리 로그에 포함된 쿼리가 선택된 기준에 따라 서브셋으로 분류된다. 기준은 로그 파일이 제공하는 쿼리에 관한 임의의 정보를 기초로 정해질 수 있으며, 쿼리들은 소정 기준에 따라 임의의 개수의 서브셋으로 분류될 수 있다.
일례로서, 쿼리 로그가 각종 쿼리의 제출 시간에 관련된 정보를 제공한다면 "시간" 기준이 사용될 수 있다. 시간 기준에 따라, 쿼리는 시간에 따른 사용자 관심의 트렌드를 분석하기 위해 예를 들어 주 또는 달 단위로 분류될 수 있다. 쿼리는 하루의 시간(예를 들어, 아침, 점심, 저녁, 밤), 평일 대 주말 또는 휴일, 계절 등을 기준으로 분류될 수도 있다. 다양한 변형이 가능하며, 단지 일례로서 오전 8시와 오전 10시 사이에 수신된 쿼리는 주, 달 또는 다른 원하는 기간에 걸쳐 수집될 수 있다. 어떤 실시예에서, 하루의 시간은 검색 서버의 현지 시간에 따라 결정된다. 지리적으로 서로 다른 지역에 서비스하도록 다수의 서버에 검색 서비스가 제공되는 경우에, 서버의 현지 시간은 대략 사용자의 현지 시간을 나타낸다. 다른 실시예에서, 사용자의 현지 시간이 사용될 수도 있다.
다른 예로서, 쿼리 로그가 쿼리의 지리적 근원에 관한 정보를 제공한다면 "지리" 기준이 사용될 수 있다. 지리는 물리적 지리에 관련될 수 있다. 예를 들어, 쿼리의 근원의 가능성 있는 지역을 식별하는데 어떤 IP 주소가 사용될 수 있으며, 쿼리를 제시한 사용자에 관한 사용자 프로파일이 사용자가 거주하는 곳을 판단하는데 사용될 수 있으며, 또는 쿼리가 서로 다른 위치 또는 서로 다른 위치와 관련된 지방/국가 사이트의 미러 사이트에서 수신되었는지에 따라 쿼리가 분류될 수도 있다. 대안으로, 지리 기준은 사용자의 IP 주소(또는 IP 주소로부터 결정된 도메인)가 지리적 근원으로 취급되는 "사이버 지리"를 나타낼 수도 있다. 물리적 및 사이버 지리 기준은 조합될 수도 있다.
제 3 예로서, 쿼리 로그가 연령, 성별 등과 같은 사용자의 인구 통계적 특징에 관한 정보를 제공한다면 "인구 통계" 기준이 사용될 수도 있다. 임의의 개수 및 조합의 인구 통계 데이터가 사용되어 트렌드 분석을 위한 인구 통계적 기준을 규정할 수 있다. 예를 들어, 인구 통계 기준은 한 "25세 이상 자택을 소유한 여성 사용자" 그룹, 다른 "35세 이상 세입자 남성 사용자" 그룹, "자동차를 소유한 25세 이하 사용자" 그룹 등을 포함할 수 있다.
제 4 예로서, 쿼리 로그가 쿼리 등록 이전의 사용자 행동에 관한 (여기서는 "사용자 이력" 또는 "사용자 상황"이라고 하는) 정보를 제공한다면, "종단적" 또는 "사용자 이력" 기준이 사용될 수 있다. 예를 들어, 포탈 사이트(예를 들어, www.yahoo.com의 Yahoo! 사이트)가 다양한 분야 또는 쇼핑 프로퍼티, 일반 웹 디렉터리, 음악 프로퍼티 등의 "프로퍼티"를 포함하며, 각 프로퍼티는 사용자가 퀴리를 입력할 수 있게 하는 검색 인터페이스를 포함한다고 가정한다. 쿼리가 입력되었을 때 사용자가 방문하고 있던 프로퍼티에 관한 정보가 구해져 "종단적" 기준으로 사용될 수 있다. 이와 같이, 일 실시예에서 종단적 기준은 "쇼핑" 프로퍼티에서 사용자로부터 발생한 하나의 쿼리 서브셋 및 "일반 디렉터리" 프로퍼티에서 사용자로부터 발생한 다른 쿼리 서브셋 등을 포함할 수 있다. 사용자가 언제든지 검색 쿼리를 입력하기 위한 대화 상자에 대해 실질적으로 연속적인 액세스를 갖는 등(이러한 대화 상자의 일례는 상기에 인용한 예비 출원 60/460,222호에 개시되어 있다)의 다른 실시예에서, 사용자 이력 정보는 사용자가 쿼리를 입력했을 때 디스플레이되고 있던 웹 페이지의 URL이나 다른 식별자를 포함할 수도 있다. 종단적 기준은 URL, 그 일부(예를 들어, 도메인명), 또는 페이지의 컨텐츠에 관한 정보(예를 들어 페이지 인덱스에 유지될 수 있는 정보)에 따라 쿼리를 분류할 수 있다.
당업자들은 상기 기준 및 서브셋의 예가 한정이 아니라 예시이며, 소정 기준에 따라 임의의 개수의 쿼리 기준 및 서브셋이 사용될 수 있음을 인식할 것이다. 기준에 따른 쿼리의 분류는 관련 기준의 "미지" 및/또는 "다른" 값들에 대한 서브셋을 포함할 수 있으며, 이 서브셋은 시스템 구성에 따라 분석될 수도 있고 아닐 수도 있다.
단계(404)에서 쿼리의 각 서브셋은 클러스터링 모듈(312)에 제공되어 하나 이상의 서브셋-특정 개념 네트워크를 생성한다. 어떤 실시예에서는 기존의 단위 사전(306)이 사용되며, 다른 실시예에서는 서브셋이 단위 분석 모듈(310)에 제공되어 서브셋-특정 단위 세트를 생성할 수도 있다. 단위 분석 및 클러스터링 분석은 상기에 인용한 예비 출원 60/510,220호에 상세히 개시되어 있다. 클러스터링 분석은 유리하게 각 쿼리 서브셋에 대해 개별적으로 수행되어, 서브셋마다 개념 네트워크 세트가 생성된다. 결과적인 서브셋-특정 개념 네트워크는 트렌드 분석 모듈(320)로 리턴된다.
단계(408)에서는, 트렌드 분석 모듈(320)이 서브셋-특정 개념 네트워크를 이용하여 트렌드 분석을 실행하여, 기준에 따라 달라지는 사용자 행동 패턴을 반영하는 유사성 및 차이를 검출한다. 이러한 다른 패턴들은 여기서 "트렌드"라 하며, 일반적으로 트렌드 분석은 서로 다른 서브셋으로부터 생성된 클러스터(예를 들어, 개념 네트워크) 및/또는 서명을 비교하여 이러한 차이를 발견하는 것을 포함한다. 트렌드 및 트렌드 분석은 다양한 형태를 가질 수 있다.
일례로서, 어떤 트렌드 분석은 다른 시간 기간 동안 또는 다른 사용자 인구 통계에 대한 특정 검색어 또는 단위의 상대적 빈도를 비교할 수 있다. 비교되는 단위들은 예를 들어 클러스터의 서로 다른 멤버 단위일 수도 있고 클러스터에 대한 다른 서명 단위일 수도 있다. 예컨대, "가수" 클러스터가 있다고 가정하면, 이 클러스터에 대한 어떤 트렌드 분석은 21세 이하 사용자에 대해서는 "Celine Dion"보다 "Avril Lavigne"이 더 인기있는 커리 용어인 것으로 나타나는 반면, 35세 이상의 사용자에 대해서는 그 반대인 것으로 나타날 수 있다. 또는, "도시" 클러스터가 있고, 이 클러스터의 서명은 "채용" 및 "호텔" 단위를 포함한다고 가정하면, 이 서명에 대한 어떤 트렌드 분석은 평일 동안 "채용"이 더 자주 검색되는 한편, 주말에는 "호텔"이 더 자주 검색된 것으로 나타날 수 있다. (이는 예를 들어 사용자들이 평일에는 직업 검색을 하고 주말에는 휴가 계획을 세우는 경향이 있음을 반영한다).
어떤 실시예에서, 트렌드 분석은 사용자 관심 및 행동에서 더욱 포착하기 힘든 트렌드를 검출하는데 사용될 수도 있다. 예를 들어, 어떤 분야(예를 들어, 음악)에서 잘 알려진 명사가 다른 분야(예를 들어, 정치)에 들어가기로 결정한다고 가정한다. 그 명사의 전체 관심도는 많이 변하지 않지만, 명사에 관해 찾는 정보의 종류에는 변동이 있을 수 있다. 예컨대, 명사의 이름과 "노래" 또는 "앨범"에 대한 검색 빈도는 감소하는 반면, 명사의 이름과 "정치" 또는 "세금"과 같은 용어에 대한 검색 빈도는 증가한다. 다른 시간 기간에 대한 명사 이름의 이웃들의 비교는 이러한 트렌드를 나타내게 된다.
단계(410)에서, 이어지는 쿼리에 응답하는데 사용하기 위해 트렌드 정보는 예를 들어 단위 사전(306)에 저장된다. 정보는 정보가 관계하는 특정 단위 및/또는 클러스터에 관련하여, 단위 또는 클러스터에 관련된 서명 또는 제안에 관련하여 저장될 수도 있다.
여기서 설명하는 시스템 및 프로세스는 예시이며 변형 및 개조가 가능한 것으로 인식된다. 순서대로 설명한 프로세스 단계들은 병렬로 실행될 수도 있고, 단계들의 순서는 달라질 수도 있으며, 단계들은 변형되거나 조합될 수도 있다. 트렌드 분석은 임의의 개수의 기준에 대해 동시에 이루어질 수도 있으며(예를 들어, " 쇼핑" 분야로부터 발생하는 21세 이하의 사용자), 기준에 따른 분류는 원하는 만큼 엉성할 수도 또는 세밀할 수도 있다. 한 서브셋-특정 개념 네트워크는 다른 서브셋-특정 개념 네트워크와 비교될 수도 있고, 서로 다른 서브셋-특정 개념 네트워크들이 각각 분류되지 않은 쿼리로부터 생성된 "글로벌" 개념 네트워크와 비교될 수도 있다. 트렌드 분석은 특정 개념 네트워크, 예를 들어 상당수의 쿼리에 사용되는 단위들과 관련된 것으로 제한되어 뜻있는 데이터, 또는 관련 검색을 제안하는 기초로 사용되는 단위들을 생성할 수도 있다. 트렌드 분석은 단위, 클러스터, 서명 또는 이들의 임의의 조합에 대해 수행될 수 있다.
단위 및 클러스터 데이터와 같이, 트렌드 정보는 시간에 따라 유리하게 업데이트 또는 재생성되어, 사용자 관심 변화(예를 들어, 소정 팝 음악 연주자의 인기 증가 또는 감소, 구직 대 여행의 관심 증가 또는 감소 등)를 반영할 수 있는 사용자 행동의 변화를 포착한다.
본 발명의 다른 실시예에서, 트렌드 정보는 관련 트렌드를 고려함으로써 특정 사용자 관심에 대한 검색 응답을 조건에 맞추는데 도움을 주는데 사용된다. 도 5는 쿼리에 응답하기 위해 도 2의 시스템(110)에 의해 사용될 수 있는 방법을 나타낸다. 클라이언트(120)는 검색 서버 시스템(160)에 쿼리를 전송한다. 검색 서버 시스템(160)은 쿼리 및/또는 그 구성 단위를 개념 서버(180)에 전송하고, 개념 서버(180)는 단위 사전(306)에 액세스한다. 개념 서버(180)는 각종 단위에 대한 통계 및 클러스터 정보와 함께 쿼리로부터 식별되는 하나 이상의 단위와 같이 쿼리에 관련된 개념적 데이터는 물론, 단위들에 관련된 트렌드 정보를 리턴한다. 이 정보 는 예를 들어 쿼리를 해싱하여 그 안에 포함된 단위들을 식별하고 단위 사전(306)에 액세스하여 식별된 각 단위에 대한 엔트리를 검색함으로써 유도될 수 있다. 일 실시예에서, 리턴된 정보는 쿼리, 그 하나 이상의 구성 단위, 또는 임의의 구성 단위에 관련된 하나 이상의 클러스터에 관련된 트렌드에 관한 정보, 단위, 통계, 클러스터를 포함한다.
검색 서버 시스템(160)은 유리하게 개념 서버(180)로부터 수신된 개념적 데이터를 쿼리에 응답하는데 사용한다. 검색 서버 시스템(160)에 의해 리턴된 결과는 유리하게 클러스터 및 단위 및/또는 클러스터와 관련된 트렌드를 포함하여, 단위로 포착된 사용자 요구의 이해 및 그 확장과 관련을 기초로, 사용자가 다음에 조사하고자 하는 것에 관한 힌트나 팁과 같은 다른 관련 정보와 함께 사용자의 쿼리에 대해 사용자에게 응답하는 결과를 포함한다.
예를 들어, 쿼리가 하나 이상의 문맥으로 사용될 수 있는 "Java"와 같이 모호한 용어를 포함한다고 가정한다. 이러한 용어는 다수의 클러스터, 예를 들어 "식음료" 클러스터, "컴퓨터" 클러스터 및 "위치" 클러스터에 속할 수 있다. 어떤 실시예에서, 검색 서버 시스템(160)은 예를 들어 어떤 클러스터에 가장 두드러진 배치가 주어져야 하는지를 선택함으로써 트렌드 데이터를 사용하여 응답을 구체화할 수 있다. 예를 들어, 주중에 "Java"를 검색한 사용자들이 컴퓨터 언어에 가장 관심이 있기 쉬운 반면, 주말에 "Java"를 검색한 사용자들은 커피에 가장 관심이 있을 법하다면, 검색 결과가 제시되는 순서는 요일에 따라 달라질 수 있는데, 예를 들어 주중이라면 컴퓨터 언어에 관련된 결과가 가장 두드러지게 제시될 수 있는 한 편, 주말이라면 커피에 관련된 결과가 가장 두드러지게 제시될 수 있다. (서로 다른 클러스터와의 관련성을 기초로 검색 결과를 그룹화하는 어떤 기술은 상기 인용한 예비 출원 60/510,220호에 개시되어 있다.)
제 2 예로서, 랩 그룹명이자 어떤 법인의 증권 시세 표시기 심벌인 4 문자 시퀀스("WXYZ")가 있다고 가정한다. 주식 시장이 열렸을 때 수신된 쿼리 대 시장이 닫혔을 때 수신된 쿼리를 기초로 개념 네트워크 또는 클러스터를 비교하면, 전자의 경우에 WXYZ 회사가 더 자주 검색되고 있는 반면, 후자의 경우에는 WXYZ 랩 그룹이 더 자주 검색되고 있는 것으로 나타날 수 있다. 이에 따라, 쿼리가 수신될 때 시장이 열렸는지 닫혔는지에 따라 랩 그룹과 관련된 결과 전에 또는 뒤에 회사와 관련된 검색 결과가 배치될 수 있다.
제 3 예로서, 문맥에 따라 사교적인 이벤트일 수도 있고 정당일 수도 있는 "party"라는 용어에 대해 생각한다. "party"라는 용어를 포함하는 일부 쿼리들은 모호함을 해소하는 다른 용어(예를 들어, "Republican party" 또는 "party games")를 포함할 수도 있지만 다른 쿼리들은 이러한 용어를 포함하지 않을 수도 있다. 모호한 쿼리에 대한 응답을 명확하게 하는데 트렌드 분석이 이용될 수 있다. 예를 들어, 도 6은 "party"라는 용어를 포함하는 쿼리의 빈도를(임의의 단위로) 하루의 시간 기준(4시간 증분으로)에 따라 나타내는 트렌드 데이터의 그래프이다. 이러한 트렌드 데이터는 상술한 프로세스(400)에 따라 어떤 쿼리 세트를 분석함으로써 얻을 수 있다. 트렌드 데이터 세트(602)("X" 심벌)는 "party"가 사교적인 이벤트에 명확하게 관련된 다른 용어(예를 들어, "게임", "호의", "공급"와 함께 나타나는 쿼리에 대응한다. 트렌드 데이터 세트(604)("O" 심벌)는 "party"가 정당에 명확하게 관련된 다른 용어(예를 들어, "공화당", "민주당", "후보자"와 함께 나타나는 쿼리에 대응한다. 트렌드 데이터(606)(삼각형)는 모호함이 쿼리의 다른 용어를 참조로 해소될 수 없는 "party"를 포함하는 쿼리에 대응한다.
본 발명에 따라 모호함을 해소하는 한 방법은 다른 트렌드들의 형상을 비교하고(예를 들어, 도 6에 나타낸 데이터 세트들의 1차 및/또는 2차 도함수) 모호한 쿼리 세트에 대한 트렌드가 모호하지 않은 세트들 중 하나와 다른 것보다 더 밀접하게 일치하는지를 판단하는 것이다. 도 6에 나타낸 예에서, 모호한 트렌드 데이터(606)는 "정당" 트렌드 데이터(604)보다 "사교적인 이벤트" 트렌드 데이터(602)에 더 비슷하다. 이것으로부터, "party"를 포함하는 모호한 쿼리를 입력한 사용자들이 정당보다는 사교적 이벤트에 더 관심이 있다는 것이 추론될 수 있으며, 이에 따라, 예를 들어 정당에 관련된 결과 앞에 사교적 이벤트에 관련된 결과를 제시함으로써 검색 결과가 제시될 수 있다.
추론한 의도에 대한 신뢰 레벨을 확립하는데 두 트렌드 데이터 세트 사이의 유사도가 고려되어 사용될 수 있음에 유의해야 한다. 도 6에 나타낸 예에서, 모호한 트렌드 데이터(606)는 "사교적 이벤트" 트렌드 데이터(602)와 더 가깝게 일치하므로, 추론에 대한 신뢰 레벨이 높아지게 된다. 다른 경우에, 신뢰 레벨은 사용자 행동에 따라 더 낮을 수도 더 높을 수도 있다. 이러한 신뢰 레벨은 쿼리에 대한 응답을 명확하게 하는데 다른 요인일 될 수 있다. 예컨대, 충분히 높은 신뢰 레벨이 주어지면, 처음에 사교적 이벤트에 관련된 결과만이 제시되고, 이러한 경우에 사용자가 정당에 관련된 결과를 검색할 선택권이 제공될 수 있다.
이러한 예는 예시이며, 변형 및 변경이 가능하다. 예컨대, 다수의 기준(예를 들어, 하루의 시간 및 사용자 연령)에 따른 트렌드가 유사도 결정에 함께 고려될 수 있다. 트렌드 비교는 실제 주파수 값, 도함수(변화율), 고차 도함수 또는 이들의 임의의 조합과 같이 두 곡선의 유사도의 임의의 적절한 측정을 기초로 할 수 있다.
제 4 예로서, 독극물일 수도 있고 헤비메탈 밴드일 수도 있는 "poison"이란 용어를 생각한다. 또한, 어떤 쿼리는 모호성을 해소하는 다른 용어를 포함하게 되는데, 예컨대 "rat poison" 또는 "poison control"과 같은 쿼리는 독극물에 관련되는 반면, "poison lyrics" 또는 "poison mp3"는 밴드에 관련된다. 그러나 다른 쿼리는 단지 모호할 것이다.
"party" 예시에서 설명한 것과 같은 분석이 모호성 해소에 사용될 수 있다. 다른 접근법은 "poison" 밴드가 음악 연주자 클러스터에 속하고, 이 클러스터는 이름이 비교적 모호하지 않은 다른 연주자를 포함한다는 점을 인식하는 것을 포함한다. (예를 들어, 가상으로 "Britney Spears"를 쿼리로서 입력하는 모든 사용자는 유명한 가수에 관심이 있다.) 모호하지 않은 연주자 이름을 포함하는 쿼리는 "제어" 그룹으로서 사용될 수 있으며, 이것으로부터 연주자에 관한 정보를 찾고 있는 사용자들의 행동에 관한 추론을 끌어낼 수 있다. 이 행동은 모호한 용어가 연주자를 말하는 것을 의도할 가능성을 추정하기 위해, 연주자를 말할 수도 아닐 수도 있는 모호한 용어(예를 들어, "poison")를 타이핑하는 사용자들의 행동과 비교될 수 있다.
제어 그룹과 모호한 용어를 포함하는 쿼리 사이의 수많은 비교가 가능하다. 예컨대, 모호한 용어 "poison"을 포함하며 음악과 명확하게 관련된 용어(예를 들어, "가사") 또한 포함하는 쿼리의 분수 및 모호하지 않은 이름(예를 들어, "Britney Spears")를 포함하는 쿼리의 해당 "제어" 분수가 연산될 수 있다. 제어 분수는 음악에 관심 있는 사용자들이 잠재적으로 모호한 쿼리를 입력하게 될 가능성을 짐작하는 것으로 간주될 수 있다. 이것을 "poison"을 포함하는 명확한 음악 지향 쿼리의 빈도와 비교함으로써, 쿼리 "poison"을 입력한 사용자가 밴드에 관심이 있을 가능성을 추론할 수 있다.
이러한 예를 보다 구체화하기 위해, 용어 "poison"을 포함하며 용어 "가사" 또한 포함하는 쿼리의 분수는 0.1이고, 용어 "Britney Spears"를 포함하며 용어 "가사" 또한 포함하는 쿼리의 분수는 0.2라고 가정한다. 이것으로부터, "poison"을 입력한 사용자의 1/2은 아마 밴드를 말하는 것으로 의도한 것이 아님을 추론할 수 있다. 이 경우, 밴드 관련 및 독극물 관련 결과 모두 두드러지게 디스플레이된다. 독극물을 검색한 사용자들이 모호함 해소 용어를 포함하는데 실패할 가능성을 추정하기 위해, 독극물 "poison"을 포함하는 클러스터(예를 들어, 약물 관련 클러스터)를 기초로 하는 제어 분수를 이용하여 비슷한 분석이 이루어질 수 있다. 약물 관련 클러스터의 용어에 대한 모호한 쿼리의 가능성이 작다면, 모호한 쿼리 "poison"은 밴드를 말하기 쉬운 것으로 제안된다.
또한, 음악에 관심 있는 사용자와 반대로 약물에 관심 있는 사용자로부터 잠 재적으로 모호한 쿼리를 수신할 가능성을 비교함으로써 사용자 의도가 추론될 수 있다. 예를 들어, 음악에 관심 있는 사용자들로부터의 쿼리의 29%는 연주자 이름만을 포함하는 단일 단위 쿼리인 반면, 약물에 관심 있는 사용자들로부터의 쿼리의 2%만이 단일 단위를 포함하는 것으로 가정한다. 단일 단위 쿼리 "poison"을 입력한 사용자는 밴드에 더 관심이 있을 것으로 추론될 수 있다.
이러한 분석의 보다 정교한 변형이 사용될 수도 있는 것으로 인식될 것이다. 예컨대, 하나의 연주자만을 사용하여 제어 분수를 계산하기보다는 더 많은 연주자가 사용될 수도 있다(예를 들어, "Britney Spears"뿐 아니라 "matchbox twenty", "Johnny Cash" 등). 마찬가지로, 하나의 모호함 해소 용어를 고려하기보다는 다수의 용어가 사용될 수도 있다(예를 들어, "가사"뿐 아니라 "mp3", "투어", "앨범" 등). 다른 모호한 용어 및 다른 클러스터에도 비슷한 분석이 적용될 수 있다.
제 5 예로서, 사용자가 "digital cameras"라는 쿼리를 입력한다고 가정한다. 사용자가 디지털 카메라를 판매하는 사이트를 찾고 있거나 디지털 카메라에 관한 정보(제품 리뷰 등)를 찾고 있을 수 있다. (예를 들어, 사용자 프로파일 및/또는 종단적 기준을 포함하는) 다양한 기준에 따른 이전 쿼리의 트렌드 분석이 사용되어 어떤 것이 그에 따른 결과가 더 적당하게 맞을 수 있는지를 판단할 수 있다.
제 6 예로서, 어떤 실시예에서는 검색 서버 시스템(160)이 트렌드 정보를 기초로 관련 검색을 제안할 수 있다. 예를 들어, 21세 이하로 알려진 사용자가 가수명을 포함하는 쿼리를 입력한다면, 검색 서버 시스템은 그 가수에 관련된 사이트 목록을 표시하는 것 외에도, 트렌드 분석에 의해 21세 이하의 사용자들 사이에 인 기 있는 것으로 인식되는 하나 이상의 다른 가수(예를 들어, "Avril Lavgne")에 관련된 검색을 제안할 수도 있다. 35세 사용자의 경우, 다른 가수(예를 들어, "Celine Dion")가 제안될 수도 있다. 다른 경우에, 평일에 "new york city"의 쿼리가 입력되면, "호텔" 제안보다는 "채용" 제안이 더 두드러지게 이루어질 수 있는 한편(이것이 트렌드 데이터와 일치한다면), 동일 쿼리가 주말에 입력되며 그 반대로 사용될 수 있다.
어떤 실시예에서, 검색 서버 시스템(160)에 의해 사용자의 가능성 있는 성별, 연령 또는 지리적 위치와 같이 특정 사용자에 관한 정보를 추론하는데 트렌드 데이터가 사용될 수도 있다. 이러한 추론은 트렌드 데이터에 관해 동일 사용자에 의해 입력된 다수의 쿼리를 비교하여 다른 기준에 대한 사용자의 행동을 매치시키는 것을 포함할 수 있다. 이러한 추론은 정확성이 보장되는 것은 아니며, 이들은 사용자가 어떻게 행동하는지를 반영하며, 반드시 사용자는 아닌 것으로 이해해야 한다. 특정 사용자에 관해 이루어진 어떤 추론도 가능성 있는 사용자 의도의 하나의 표시로서 트렌드 데이터를 또 사용하여 그 사용자에 의해 입력된 추가 쿼리에 대한 응답에 맞추는데 사용될 수 있다. 이와 같이 트렌드 데이터는 쿼리를 입력하는 특정 사용자에 대한 검색 서버의 응답을 개인화하는데 사용될 수 있다.
트렌드 데이터는 특정 경우에 표시되는 광고(들) 및/또는 특정 광고 배치에 부과되는 요금과 같은 광고 결정과 관련하여 검색 서버 시스템(160)의 제공자에 의해 사용될 수도 있다.
본 발명은 특정 실시예에 관해 설명되었지만, 당업자들은 수많은 변형이 가 능함을 인식할 것이다. 예컨대, 트렌드 분석에 사용되는 쿼리의 기준 및 서브셋의 개수 및 한정성은 달라질 수 있으며, 수신된 모든 쿼리가 트렌드 분석에 사용되는 것은 아니다. 클러스터, 서명 및 트렌드 정보는 동적으로 규정되며, 트렌드 분석은 시간에 따라(예를 들어, 일간 또는 주간) 수행되어 사용자 행동 변화에 응답하여 트렌드 정보를 업데이트할 수 있다. 또 다른 실시예에서, 클러스터, 서명 및 트렌드 데이터가 거의 실시간으로 업데이트될 수 있도록 쿼리는 수신되는 대로 처리될 수 있다. 여기서 설명한 자동화 시스템 및 방법은 클러스터, 서명, 및 단위, 클러스터, 서명의 일부 또는 전부에 관련된 트렌드 정보 등을 포함하는 결과적인 단위 사전의 전부 또는 일부에 관한 인간의 검토로 증대 또는 보충될 수 있다.
여기서 설명한 실시예들은 웹 사이트, 링크, 및 월드 와이드 웹(또는 그 서브셋)이 검색 자료 역할을 하는 경우에 지정된 다른 기술을 참조할 수 있다. 여기서 설명한 시스템 및 프로세스는 다른 검색 자료(전자 데이터베이스나 문서 저장소 등)에 사용하도록 개조될 수 있으며, 결과는 컨텐츠는 물론, 컨텐츠가 발견될 수 있는 위치에 대한 링크나 참조 또한 포함할 수 있는 것으로 이해해야 한다.
이와 같이 본 발명은 특정 실시예에 관해 설명되었지만, 발명은 다음 청구항의 범위 내에서 모든 변형 및 등가물을 커버하는 것으로 인식될 것이다.
Claims (20)
- 쿼리를 처리하는 방법으로서,하나 이상의 단위를 각각 포함하는 이전 쿼리들의 세트를 수신하는 단계;기준에 따라 상기 쿼리들을 서브셋으로 분류하는 단계;상기 쿼리들의 각 서브셋에 대해 하나 이상의 서브셋-특정 개념 네트워크를 생성하는 단계; 및상기 서브셋들 중 적어도 2개로부터의 해당 서브셋-특정 개념 네트워크를 비교함으로써 단위에 대한 트렌드 정보를 생성하는 단계를 포함하는, 쿼리 처리 방법.
- 제 1 항에 있어서,상기 기준은 시간 기준인 것을 특징으로 하는 쿼리 처리 방법.
- 제 1 항에 있어서,상기 기준은 사용자들의 하나 이상의 인구 통계 특징을 참조로 규정되는 것을 특징으로 하는 쿼리 처리 방법.
- 제 1 항에 있어서,상기 기준은 지리적 기준인 것을 특징으로 하는 쿼리 처리 방법.
- 제 1 항에 있어서,상기 기준은 상기 쿼리의 사용자 상황을 나타내는 종단적 기준인 것을 특징으로 하는 쿼리 처리 방법.
- 제 1 항에 있어서,다음 쿼리를 수신하는 단계;상기 다음 쿼리를 하나 이상의 구성 단위로 구문 분석(parsing)하는 단계; 및상기 다음 쿼리에 대한 응답을 명확하게 하는데 상기 트렌드 정보를 사용하는 단계를 더 포함하는 것을 특징으로 하는 쿼리 처리 방법.
- 제 6 항에 있어서,상기 트렌드 정보는 상기 쿼리의 모호한 용어를 해소하는데 사용되는 것을 특징으로 하는 쿼리 처리 방법.
- 제 6 항에 있어서,상기 트렌드 정보는 관련 검색을 제안하는데 사용되는 것을 특징으로 하는 쿼리 처리 방법.
- 제 6 항에 있어서,상기 트렌드 정보는 응답 데이터를 그룹화하는데 사용되는 것을 특징으로 하는 쿼리 처리 방법.
- 제 6 항에 있어서,상기 트렌드 정보는 디스플레이를 위한 광고를 선택하는데 사용되는 것을 특징으로 하는 쿼리 처리 방법.
- 쿼리를 처리하는 시스템으로서,기준에 따라 쿼리들의 세트를 다수의 서브셋으로 분류하도록 구성된 트렌드 분석 모듈; 및상기 다수의 서브셋 각각에 대한 각각의 개념 네트워크를 생성하도록 구성된 클러스터링 모듈을 포함하며,상기 트렌드 분석 모듈은 또한 상기 서브셋들 중 적어도 2개에 대한 각 개념 네트워크를 비교함으로써 트렌드 정보를 생성하도록 구성되는, 쿼리 처리 시스템.
- 제 11 항에 있어서,상기 기준은 시간 기준인 것을 특징으로 하는 쿼리 처리 시스템.
- 제 11 항에 있어서,상기 기준은 사용자들의 하나 이상의 인구 통계 특징을 참조로 규정되는 것을 특징으로 하는 쿼리 처리 시스템.
- 제 11 항에 있어서,상기 기준은 지리적 기준인 것을 특징으로 하는 쿼리 처리 시스템.
- 제 11 항에 있어서,상기 기준은 상기 쿼리의 사용자 상황을 나타내는 종단적 기준인 것을 특징으로 하는 쿼리 처리 시스템.
- 제 11 항에 있어서,다음 쿼리를 수신하고, 상기 다음 쿼리를 하나 이상의 구성 단위로 구문 분석하며, 상기 트렌드 정보에 적어도 일부 기초하여 응답을 명확하게 하도록 구성된 응답 모듈을 더 포함하는 것을 특징으로 하는 쿼리 처리 시스템.
- 제 16 항에 있어서,상기 응답 모듈은 상기 트렌드 정보를 사용하여 상기 쿼리의 모호한 용어를 해소하도록 구성되는 것을 특징으로 하는 쿼리 처리 시스템.
- 제 16 항에 있어서,상기 응답 모듈은 상기 트렌드 정보를 사용하여 관련 검색을 제안하도록 구성되는 것을 특징으로 하는 쿼리 처리 시스템.
- 제 16 항에 있어서,상기 응답 모듈은 상기 트렌드 정보를 사용하여 응답 데이터를 그룹화하도록 구성되는 것을 특징으로 하는 쿼리 처리 시스템.
- 제 16 항에 있어서,상기 응답 모듈은 상기 트렌드 정보를 사용하여 디스플레이를 위한 광고를 선택하도록 구성되는 것을 특징으로 하는 쿼리 처리 시스템.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/712,307 US7240049B2 (en) | 2003-11-12 | 2003-11-12 | Systems and methods for search query processing using trend analysis |
US10/712,307 | 2003-11-12 | ||
US200403751 | 2004-11-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070007031A true KR20070007031A (ko) | 2007-01-12 |
KR101031449B1 KR101031449B1 (ko) | 2011-04-26 |
Family
ID=34552670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020067011525A KR101031449B1 (ko) | 2003-11-12 | 2004-11-12 | 트렌드 분석을 이용한 검색 쿼리 처리 시스템 및 방법 |
Country Status (6)
Country | Link |
---|---|
US (2) | US7240049B2 (ko) |
EP (1) | EP1690169A4 (ko) |
JP (1) | JP4722051B2 (ko) |
KR (1) | KR101031449B1 (ko) |
CN (1) | CN100401292C (ko) |
WO (1) | WO2005050367A2 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150047941A (ko) | 2013-10-25 | 2015-05-06 | 삼성테크윈 주식회사 | 검색 시스템 및 그의 동작 방법 |
Families Citing this family (298)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8706747B2 (en) | 2000-07-06 | 2014-04-22 | Google Inc. | Systems and methods for searching using queries written in a different character-set and/or language from the target pages |
US6832220B1 (en) * | 2000-08-03 | 2004-12-14 | Microsoft Corporation | Method and apparatus for file searching, accessing file identifiers from reference page |
US7693830B2 (en) | 2005-08-10 | 2010-04-06 | Google Inc. | Programmable search engine |
US7743045B2 (en) | 2005-08-10 | 2010-06-22 | Google Inc. | Detecting spam related and biased contexts for programmable search engines |
US7716199B2 (en) | 2005-08-10 | 2010-05-11 | Google Inc. | Aggregating context data for programmable search engines |
US7831476B2 (en) * | 2002-10-21 | 2010-11-09 | Ebay Inc. | Listing recommendation in a network-based commerce system |
US8255417B2 (en) * | 2003-05-20 | 2012-08-28 | Google Inc. | System and method for providing definitions |
US7693827B2 (en) * | 2003-09-30 | 2010-04-06 | Google Inc. | Personalization of placed content ordering in search results |
US7660400B2 (en) * | 2003-12-19 | 2010-02-09 | At&T Intellectual Property Ii, L.P. | Method and apparatus for automatically building conversational systems |
US8954420B1 (en) | 2003-12-31 | 2015-02-10 | Google Inc. | Methods and systems for improving a search ranking using article information |
US7158966B2 (en) * | 2004-03-09 | 2007-01-02 | Microsoft Corporation | User intent discovery |
US8386728B1 (en) | 2004-03-31 | 2013-02-26 | Google Inc. | Methods and systems for prioritizing a crawl |
US8631076B1 (en) | 2004-03-31 | 2014-01-14 | Google Inc. | Methods and systems for associating instant messenger events |
US8346777B1 (en) | 2004-03-31 | 2013-01-01 | Google Inc. | Systems and methods for selectively storing event data |
US7941439B1 (en) | 2004-03-31 | 2011-05-10 | Google Inc. | Methods and systems for information capture |
US7409383B1 (en) | 2004-03-31 | 2008-08-05 | Google Inc. | Locating meaningful stopwords or stop-phrases in keyword-based retrieval systems |
US7333976B1 (en) | 2004-03-31 | 2008-02-19 | Google Inc. | Methods and systems for processing contact information |
US8275839B2 (en) | 2004-03-31 | 2012-09-25 | Google Inc. | Methods and systems for processing email messages |
US8099407B2 (en) | 2004-03-31 | 2012-01-17 | Google Inc. | Methods and systems for processing media files |
US8161053B1 (en) | 2004-03-31 | 2012-04-17 | Google Inc. | Methods and systems for eliminating duplicate events |
US20060010029A1 (en) * | 2004-04-29 | 2006-01-12 | Gross John N | System & method for online advertising |
US20050246358A1 (en) * | 2004-04-29 | 2005-11-03 | Gross John N | System & method of identifying and predicting innovation dissemination |
US20050246391A1 (en) * | 2004-04-29 | 2005-11-03 | Gross John N | System & method for monitoring web pages |
US8250065B1 (en) * | 2004-05-28 | 2012-08-21 | Adobe Systems Incorporated | System and method for ranking information based on clickthroughs |
US9626437B2 (en) * | 2004-06-10 | 2017-04-18 | International Business Machines Corporation | Search scheduling and delivery tool for scheduling a search using a search framework profile |
US7565630B1 (en) | 2004-06-15 | 2009-07-21 | Google Inc. | Customization of search results for search queries received from third party sites |
US8972444B2 (en) * | 2004-06-25 | 2015-03-03 | Google Inc. | Nonstandard locality-based text entry |
US8392453B2 (en) * | 2004-06-25 | 2013-03-05 | Google Inc. | Nonstandard text entry |
US9223868B2 (en) * | 2004-06-28 | 2015-12-29 | Google Inc. | Deriving and using interaction profiles |
US7562069B1 (en) * | 2004-07-01 | 2009-07-14 | Aol Llc | Query disambiguation |
US8078607B2 (en) * | 2006-03-30 | 2011-12-13 | Google Inc. | Generating website profiles based on queries from webistes and user activities on the search results |
US8620915B1 (en) | 2007-03-13 | 2013-12-31 | Google Inc. | Systems and methods for promoting personalized search results based on personal information |
US7555524B1 (en) * | 2004-09-16 | 2009-06-30 | Symantec Corporation | Bulk electronic message detection by header similarity analysis |
US8874570B1 (en) | 2004-11-30 | 2014-10-28 | Google Inc. | Search boost vector based on co-visitation information |
US7962461B2 (en) | 2004-12-14 | 2011-06-14 | Google Inc. | Method and system for finding and aggregating reviews for a product |
US9092523B2 (en) | 2005-02-28 | 2015-07-28 | Search Engine Technologies, Llc | Methods of and systems for searching by incorporating user-entered information |
US9378203B2 (en) | 2008-05-01 | 2016-06-28 | Primal Fusion Inc. | Methods and apparatus for providing information of interest to one or more users |
US20060224583A1 (en) * | 2005-03-31 | 2006-10-05 | Google, Inc. | Systems and methods for analyzing a user's web history |
US20060224608A1 (en) * | 2005-03-31 | 2006-10-05 | Google, Inc. | Systems and methods for combining sets of favorites |
US9256685B2 (en) | 2005-03-31 | 2016-02-09 | Google Inc. | Systems and methods for modifying search results based on a user's history |
US20060224579A1 (en) * | 2005-03-31 | 2006-10-05 | Microsoft Corporation | Data mining techniques for improving search engine relevance |
US7403767B2 (en) * | 2005-04-29 | 2008-07-22 | Siemens Aktiengesellschaft | Cellular telephone network with record keeping for missed calls |
US20060253423A1 (en) * | 2005-05-07 | 2006-11-09 | Mclane Mark | Information retrieval system and method |
US7647312B2 (en) * | 2005-05-12 | 2010-01-12 | Microsoft Corporation | System and method for automatic generation of suggested inline search terms |
US8103659B1 (en) * | 2005-06-06 | 2012-01-24 | A9.Com, Inc. | Perspective-based item navigation |
US8200687B2 (en) | 2005-06-20 | 2012-06-12 | Ebay Inc. | System to generate related search queries |
US10769215B2 (en) * | 2005-07-14 | 2020-09-08 | Conversant Wireless Licensing S.A R.L. | Method, apparatus and computer program product providing an application integrated mobile device search solution using context information |
US7844599B2 (en) * | 2005-08-24 | 2010-11-30 | Yahoo! Inc. | Biasing queries to determine suggested queries |
US7747639B2 (en) * | 2005-08-24 | 2010-06-29 | Yahoo! Inc. | Alternative search query prediction |
US7672932B2 (en) | 2005-08-24 | 2010-03-02 | Yahoo! Inc. | Speculative search result based on a not-yet-submitted search query |
US8989718B2 (en) | 2005-09-14 | 2015-03-24 | Millennial Media, Inc. | Idle screen advertising |
US10911894B2 (en) | 2005-09-14 | 2021-02-02 | Verizon Media Inc. | Use of dynamic content generation parameters based on previous performance of those parameters |
US9471925B2 (en) | 2005-09-14 | 2016-10-18 | Millennial Media Llc | Increasing mobile interactivity |
US8302030B2 (en) | 2005-09-14 | 2012-10-30 | Jumptap, Inc. | Management of multiple advertising inventories using a monetization platform |
US7912458B2 (en) | 2005-09-14 | 2011-03-22 | Jumptap, Inc. | Interaction analysis and prioritization of mobile content |
US10592930B2 (en) | 2005-09-14 | 2020-03-17 | Millenial Media, LLC | Syndication of a behavioral profile using a monetization platform |
US8311888B2 (en) | 2005-09-14 | 2012-11-13 | Jumptap, Inc. | Revenue models associated with syndication of a behavioral profile using a monetization platform |
US9703892B2 (en) | 2005-09-14 | 2017-07-11 | Millennial Media Llc | Predictive text completion for a mobile communication facility |
US7660581B2 (en) | 2005-09-14 | 2010-02-09 | Jumptap, Inc. | Managing sponsored content based on usage history |
US8364540B2 (en) | 2005-09-14 | 2013-01-29 | Jumptap, Inc. | Contextual targeting of content using a monetization platform |
US8156128B2 (en) | 2005-09-14 | 2012-04-10 | Jumptap, Inc. | Contextual mobile content placement on a mobile communication facility |
US8819659B2 (en) | 2005-09-14 | 2014-08-26 | Millennial Media, Inc. | Mobile search service instant activation |
US7860871B2 (en) | 2005-09-14 | 2010-12-28 | Jumptap, Inc. | User history influenced search results |
US8832100B2 (en) | 2005-09-14 | 2014-09-09 | Millennial Media, Inc. | User transaction history influenced search results |
US8805339B2 (en) | 2005-09-14 | 2014-08-12 | Millennial Media, Inc. | Categorization of a mobile user profile based on browse and viewing behavior |
US8503995B2 (en) | 2005-09-14 | 2013-08-06 | Jumptap, Inc. | Mobile dynamic advertisement creation and placement |
US8812526B2 (en) | 2005-09-14 | 2014-08-19 | Millennial Media, Inc. | Mobile content cross-inventory yield optimization |
US8364521B2 (en) | 2005-09-14 | 2013-01-29 | Jumptap, Inc. | Rendering targeted advertisement on mobile communication facilities |
US8131271B2 (en) | 2005-11-05 | 2012-03-06 | Jumptap, Inc. | Categorization of a mobile user profile based on browse behavior |
US7769764B2 (en) | 2005-09-14 | 2010-08-03 | Jumptap, Inc. | Mobile advertisement syndication |
US7752209B2 (en) | 2005-09-14 | 2010-07-06 | Jumptap, Inc. | Presenting sponsored content on a mobile communication facility |
US20110313853A1 (en) | 2005-09-14 | 2011-12-22 | Jorey Ramer | System for targeting advertising content to a plurality of mobile communication facilities |
US7577665B2 (en) | 2005-09-14 | 2009-08-18 | Jumptap, Inc. | User characteristic influenced search results |
US8615719B2 (en) | 2005-09-14 | 2013-12-24 | Jumptap, Inc. | Managing sponsored content for delivery to mobile communication facilities |
US8290810B2 (en) | 2005-09-14 | 2012-10-16 | Jumptap, Inc. | Realtime surveying within mobile sponsored content |
US7676394B2 (en) | 2005-09-14 | 2010-03-09 | Jumptap, Inc. | Dynamic bidding and expected value |
US8103545B2 (en) | 2005-09-14 | 2012-01-24 | Jumptap, Inc. | Managing payment for sponsored content presented to mobile communication facilities |
US7702318B2 (en) | 2005-09-14 | 2010-04-20 | Jumptap, Inc. | Presentation of sponsored content based on mobile transaction event |
US10038756B2 (en) | 2005-09-14 | 2018-07-31 | Millenial Media LLC | Managing sponsored content based on device characteristics |
US8666376B2 (en) | 2005-09-14 | 2014-03-04 | Millennial Media | Location based mobile shopping affinity program |
US8229914B2 (en) | 2005-09-14 | 2012-07-24 | Jumptap, Inc. | Mobile content spidering and compatibility determination |
US8209344B2 (en) | 2005-09-14 | 2012-06-26 | Jumptap, Inc. | Embedding sponsored content in mobile applications |
US8238888B2 (en) | 2006-09-13 | 2012-08-07 | Jumptap, Inc. | Methods and systems for mobile coupon placement |
US9058406B2 (en) | 2005-09-14 | 2015-06-16 | Millennial Media, Inc. | Management of multiple advertising inventories using a monetization platform |
US8027879B2 (en) | 2005-11-05 | 2011-09-27 | Jumptap, Inc. | Exclusivity bidding for mobile sponsored content |
US9201979B2 (en) | 2005-09-14 | 2015-12-01 | Millennial Media, Inc. | Syndication of a behavioral profile associated with an availability condition using a monetization platform |
US8195133B2 (en) | 2005-09-14 | 2012-06-05 | Jumptap, Inc. | Mobile dynamic advertisement creation and placement |
US8688671B2 (en) | 2005-09-14 | 2014-04-01 | Millennial Media | Managing sponsored content based on geographic region |
US8660891B2 (en) | 2005-11-01 | 2014-02-25 | Millennial Media | Interactive mobile advertisement banners |
US9076175B2 (en) | 2005-09-14 | 2015-07-07 | Millennial Media, Inc. | Mobile comparison shopping |
EP1934843A2 (en) * | 2005-10-04 | 2008-06-25 | Thomson Global Resources | Systems, methods, and software for assessing ambiguity of medical terms |
US10698939B2 (en) | 2005-10-26 | 2020-06-30 | Cortica Ltd | System and method for customizing images |
US9466068B2 (en) | 2005-10-26 | 2016-10-11 | Cortica, Ltd. | System and method for determining a pupillary response to a multimedia data element |
US9558449B2 (en) | 2005-10-26 | 2017-01-31 | Cortica, Ltd. | System and method for identifying a target area in a multimedia content element |
US10621988B2 (en) | 2005-10-26 | 2020-04-14 | Cortica Ltd | System and method for speech to text translation using cores of a natural liquid architecture system |
US10848590B2 (en) | 2005-10-26 | 2020-11-24 | Cortica Ltd | System and method for determining a contextual insight and providing recommendations based thereon |
US10691642B2 (en) | 2005-10-26 | 2020-06-23 | Cortica Ltd | System and method for enriching a concept database with homogenous concepts |
US10635640B2 (en) | 2005-10-26 | 2020-04-28 | Cortica, Ltd. | System and method for enriching a concept database |
US9477658B2 (en) | 2005-10-26 | 2016-10-25 | Cortica, Ltd. | Systems and method for speech to speech translation using cores of a natural liquid architecture system |
US9767143B2 (en) | 2005-10-26 | 2017-09-19 | Cortica, Ltd. | System and method for caching of concept structures |
US8326775B2 (en) | 2005-10-26 | 2012-12-04 | Cortica Ltd. | Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof |
US10380623B2 (en) | 2005-10-26 | 2019-08-13 | Cortica, Ltd. | System and method for generating an advertisement effectiveness performance score |
US11604847B2 (en) | 2005-10-26 | 2023-03-14 | Cortica Ltd. | System and method for overlaying content on a multimedia content element based on user interest |
US11361014B2 (en) | 2005-10-26 | 2022-06-14 | Cortica Ltd. | System and method for completing a user profile |
US9747420B2 (en) | 2005-10-26 | 2017-08-29 | Cortica, Ltd. | System and method for diagnosing a patient based on an analysis of multimedia content |
US10193990B2 (en) | 2005-10-26 | 2019-01-29 | Cortica Ltd. | System and method for creating user profiles based on multimedia content |
US8312031B2 (en) | 2005-10-26 | 2012-11-13 | Cortica Ltd. | System and method for generation of complex signatures for multimedia data content |
US9396435B2 (en) | 2005-10-26 | 2016-07-19 | Cortica, Ltd. | System and method for identification of deviations from periodic behavior patterns in multimedia content |
US9372940B2 (en) | 2005-10-26 | 2016-06-21 | Cortica, Ltd. | Apparatus and method for determining user attention using a deep-content-classification (DCC) system |
US10535192B2 (en) | 2005-10-26 | 2020-01-14 | Cortica Ltd. | System and method for generating a customized augmented reality environment to a user |
US9031999B2 (en) | 2005-10-26 | 2015-05-12 | Cortica, Ltd. | System and methods for generation of a concept based database |
US10360253B2 (en) | 2005-10-26 | 2019-07-23 | Cortica, Ltd. | Systems and methods for generation of searchable structures respective of multimedia data content |
US11003706B2 (en) | 2005-10-26 | 2021-05-11 | Cortica Ltd | System and methods for determining access permissions on personalized clusters of multimedia content elements |
US10191976B2 (en) | 2005-10-26 | 2019-01-29 | Cortica, Ltd. | System and method of detecting common patterns within unstructured data elements retrieved from big data sources |
US10380267B2 (en) | 2005-10-26 | 2019-08-13 | Cortica, Ltd. | System and method for tagging multimedia content elements |
US11620327B2 (en) | 2005-10-26 | 2023-04-04 | Cortica Ltd | System and method for determining a contextual insight and generating an interface with recommendations based thereon |
US11032017B2 (en) | 2005-10-26 | 2021-06-08 | Cortica, Ltd. | System and method for identifying the context of multimedia content elements |
US9529984B2 (en) | 2005-10-26 | 2016-12-27 | Cortica, Ltd. | System and method for verification of user identification based on multimedia content elements |
US10585934B2 (en) | 2005-10-26 | 2020-03-10 | Cortica Ltd. | Method and system for populating a concept database with respect to user identifiers |
US10614626B2 (en) | 2005-10-26 | 2020-04-07 | Cortica Ltd. | System and method for providing augmented reality challenges |
US9256668B2 (en) | 2005-10-26 | 2016-02-09 | Cortica, Ltd. | System and method of detecting common patterns within unstructured data elements retrieved from big data sources |
US8818916B2 (en) * | 2005-10-26 | 2014-08-26 | Cortica, Ltd. | System and method for linking multimedia data elements to web pages |
US10180942B2 (en) | 2005-10-26 | 2019-01-15 | Cortica Ltd. | System and method for generation of concept structures based on sub-concepts |
US8266185B2 (en) | 2005-10-26 | 2012-09-11 | Cortica Ltd. | System and methods thereof for generation of searchable structures respective of multimedia data content |
US11216498B2 (en) | 2005-10-26 | 2022-01-04 | Cortica, Ltd. | System and method for generating signatures to three-dimensional multimedia data elements |
US9953032B2 (en) | 2005-10-26 | 2018-04-24 | Cortica, Ltd. | System and method for characterization of multimedia content signals using cores of a natural liquid architecture system |
US11403336B2 (en) | 2005-10-26 | 2022-08-02 | Cortica Ltd. | System and method for removing contextually identical multimedia content elements |
US8509750B2 (en) | 2005-11-05 | 2013-08-13 | Jumptap, Inc. | System for targeting advertising content to a plurality of mobile communication facilities |
US8175585B2 (en) | 2005-11-05 | 2012-05-08 | Jumptap, Inc. | System for targeting advertising content to a plurality of mobile communication facilities |
KR100809415B1 (ko) * | 2005-12-08 | 2008-03-05 | 한국전자통신연구원 | 온톨로지를 활용한 정보질의 확장 시스템 및 그 방법 |
US7680775B2 (en) * | 2005-12-13 | 2010-03-16 | Iac Search & Media, Inc. | Methods and systems for generating query and result-based relevance indexes |
US7627559B2 (en) * | 2005-12-15 | 2009-12-01 | Microsoft Corporation | Context-based key phrase discovery and similarity measurement utilizing search engine query logs |
US9262446B1 (en) | 2005-12-29 | 2016-02-16 | Google Inc. | Dynamically ranking entries in a personal data book |
US7685144B1 (en) | 2005-12-29 | 2010-03-23 | Google Inc. | Dynamically autocompleting a data entry |
US7634463B1 (en) | 2005-12-29 | 2009-12-15 | Google Inc. | Automatically generating and maintaining an address book |
US7725417B2 (en) * | 2006-02-09 | 2010-05-25 | Ebay Inc. | Method and system to analyze rules based on popular query coverage |
US8380698B2 (en) * | 2006-02-09 | 2013-02-19 | Ebay Inc. | Methods and systems to generate rules to identify data items |
US7739226B2 (en) * | 2006-02-09 | 2010-06-15 | Ebay Inc. | Method and system to analyze aspect rules based on domain coverage of the aspect rules |
US7640234B2 (en) * | 2006-02-09 | 2009-12-29 | Ebay Inc. | Methods and systems to communicate information |
US7739225B2 (en) | 2006-02-09 | 2010-06-15 | Ebay Inc. | Method and system to analyze aspect rules based on domain coverage of an aspect-value pair |
US7849047B2 (en) * | 2006-02-09 | 2010-12-07 | Ebay Inc. | Method and system to analyze domain rules based on domain coverage of the domain rules |
US9443333B2 (en) | 2006-02-09 | 2016-09-13 | Ebay Inc. | Methods and systems to communicate information |
US7689554B2 (en) * | 2006-02-28 | 2010-03-30 | Yahoo! Inc. | System and method for identifying related queries for languages with multiple writing systems |
US7571162B2 (en) * | 2006-03-01 | 2009-08-04 | Microsoft Corporation | Comparative web search |
US9953097B2 (en) | 2006-03-16 | 2018-04-24 | Ebay Inc. | System and method for managing network traffic routing |
US7716229B1 (en) * | 2006-03-31 | 2010-05-11 | Microsoft Corporation | Generating misspells from query log context usage |
KR100754768B1 (ko) * | 2006-04-06 | 2007-09-03 | 엔에이치엔(주) | 사용자별 맞춤 추천어를 제공하는 시스템, 방법 및 상기방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독가능한 기록 매체 |
US8126874B2 (en) * | 2006-05-09 | 2012-02-28 | Google Inc. | Systems and methods for generating statistics from search engine query logs |
US7523108B2 (en) * | 2006-06-07 | 2009-04-21 | Platformation, Inc. | Methods and apparatus for searching with awareness of geography and languages |
US7814112B2 (en) * | 2006-06-09 | 2010-10-12 | Ebay Inc. | Determining relevancy and desirability of terms |
US20080016157A1 (en) * | 2006-06-29 | 2008-01-17 | Centraltouch Technology Inc. | Method and system for controlling and monitoring an apparatus from a remote computer using session initiation protocol (sip) |
US8688485B2 (en) * | 2006-07-06 | 2014-04-01 | Google Inc. | Low fare search for ticket changes using married segment indicators |
US20080010101A1 (en) * | 2006-07-06 | 2008-01-10 | Todd Williamson | Determining reissue methods for ticket changes |
US20080010102A1 (en) * | 2006-07-06 | 2008-01-10 | Todd Williamson | Database for storing historical travel information |
US20080041945A1 (en) * | 2006-07-06 | 2008-02-21 | Todd Williamson | Ticket reconstruction |
US8731980B2 (en) * | 2006-07-06 | 2014-05-20 | Google Inc. | Low fare search for ticket changes |
US7664744B2 (en) * | 2006-07-14 | 2010-02-16 | Yahoo! Inc. | Query categorizer |
WO2008030568A2 (en) * | 2006-09-07 | 2008-03-13 | Feedster, Inc. | Feed crawling system and method and spam feed filter |
US7979425B2 (en) * | 2006-10-25 | 2011-07-12 | Google Inc. | Server-side match |
US10733326B2 (en) | 2006-10-26 | 2020-08-04 | Cortica Ltd. | System and method for identification of inappropriate multimedia content |
US7937403B2 (en) * | 2006-10-30 | 2011-05-03 | Yahoo! Inc. | Time-based analysis of related keyword searching |
US9110975B1 (en) * | 2006-11-02 | 2015-08-18 | Google Inc. | Search result inputs using variant generalized queries |
US20080109752A1 (en) * | 2006-11-07 | 2008-05-08 | Yahoo! Inc. | Expanding search query input box to support livesearch interaction |
US8635203B2 (en) * | 2006-11-16 | 2014-01-21 | Yahoo! Inc. | Systems and methods using query patterns to disambiguate query intent |
US7630970B2 (en) * | 2006-11-28 | 2009-12-08 | Yahoo! Inc. | Wait timer for partially formed query |
US7941436B2 (en) * | 2006-11-30 | 2011-05-10 | Yahoo, Inc. | Keyword bidding strategy for novel concepts |
US7822734B2 (en) * | 2006-12-12 | 2010-10-26 | Yahoo! Inc. | Selecting and presenting user search results based on an environment taxonomy |
US7630972B2 (en) * | 2007-01-05 | 2009-12-08 | Yahoo! Inc. | Clustered search processing |
US20090012841A1 (en) * | 2007-01-05 | 2009-01-08 | Yahoo! Inc. | Event communication platform for mobile device users |
US7912847B2 (en) * | 2007-02-20 | 2011-03-22 | Wright State University | Comparative web search system and method |
US8738606B2 (en) * | 2007-03-30 | 2014-05-27 | Microsoft Corporation | Query generation using environment configuration |
CN101286150B (zh) * | 2007-04-10 | 2010-09-15 | 阿里巴巴集团控股有限公司 | 生成更新参数的方法和装置、展示相关关键词的方法和装置 |
US7672937B2 (en) * | 2007-04-11 | 2010-03-02 | Yahoo, Inc. | Temporal targeting of advertisements |
KR20080096005A (ko) * | 2007-04-26 | 2008-10-30 | 엔에이치엔(주) | 키워드 제공 범위에 따라 키워드 제공 방법 및 그 시스템 |
US7895227B1 (en) * | 2007-04-27 | 2011-02-22 | Intuit Inc. | System and method for detecting trends in network-based content |
CN101179472B (zh) * | 2007-05-31 | 2011-05-11 | 腾讯科技(深圳)有限公司 | 一种网络资源搜索方法及搜索系统 |
US8019742B1 (en) | 2007-05-31 | 2011-09-13 | Google Inc. | Identifying related queries |
US7644075B2 (en) * | 2007-06-01 | 2010-01-05 | Microsoft Corporation | Keyword usage score based on frequency impulse and frequency weight |
US8051040B2 (en) | 2007-06-08 | 2011-11-01 | Ebay Inc. | Electronic publication system |
US8290921B2 (en) * | 2007-06-28 | 2012-10-16 | Microsoft Corporation | Identification of similar queries based on overall and partial similarity of time series |
US20090006311A1 (en) * | 2007-06-28 | 2009-01-01 | Yahoo! Inc. | Automated system to improve search engine optimization on web pages |
US7685100B2 (en) | 2007-06-28 | 2010-03-23 | Microsoft Corporation | Forecasting search queries based on time dependencies |
US8090709B2 (en) | 2007-06-28 | 2012-01-03 | Microsoft Corporation | Representing queries and determining similarity based on an ARIMA model |
US7693908B2 (en) * | 2007-06-28 | 2010-04-06 | Microsoft Corporation | Determination of time dependency of search queries |
US7693823B2 (en) * | 2007-06-28 | 2010-04-06 | Microsoft Corporation | Forecasting time-dependent search queries |
US7689622B2 (en) * | 2007-06-28 | 2010-03-30 | Microsoft Corporation | Identification of events of search queries |
US7685099B2 (en) * | 2007-06-28 | 2010-03-23 | Microsoft Corporation | Forecasting time-independent search queries |
US20090043749A1 (en) * | 2007-08-06 | 2009-02-12 | Garg Priyank S | Extracting query intent from query logs |
US7966341B2 (en) * | 2007-08-06 | 2011-06-21 | Yahoo! Inc. | Estimating the date relevance of a query from query logs |
US7428522B1 (en) * | 2007-09-27 | 2008-09-23 | Yahoo! Inc. | Real-time search term popularity determination, by search origin geographic location |
US20090089169A1 (en) * | 2007-09-28 | 2009-04-02 | Google Inc. | Event Based Serving |
US8903756B2 (en) * | 2007-10-19 | 2014-12-02 | Ying Zhao | System and method for knowledge pattern search from networked agents |
KR100893129B1 (ko) * | 2007-10-24 | 2009-04-15 | 엔에이치엔(주) | 멀티 미디어 컨텐츠의 추천 키워드 추출 시스템 및 그 방법 |
US7853475B2 (en) * | 2007-11-09 | 2010-12-14 | Motorola Mobility, Inc. | Intelligent advertising based on mobile content |
US7415460B1 (en) * | 2007-12-10 | 2008-08-19 | International Business Machines Corporation | System and method to customize search engine results by picking documents |
US8612409B2 (en) * | 2007-12-18 | 2013-12-17 | Yahoo! Inc. | Method and apparatus for detecting and explaining bursty stream events in targeted groups |
CA2710421A1 (en) * | 2007-12-21 | 2009-07-09 | Marc Light | Entity, event, and relationship extraction |
US9501467B2 (en) | 2007-12-21 | 2016-11-22 | Thomson Reuters Global Resources | Systems, methods, software and interfaces for entity extraction and resolution and tagging |
US20090164266A1 (en) * | 2007-12-21 | 2009-06-25 | Microsoft Corporation | Category aggregated opinion data |
EP2240873A1 (en) * | 2007-12-31 | 2010-10-20 | Thomson Reuters Global Resources | Systems, methods and sofstware for evaluating user queries |
US8402031B2 (en) * | 2008-01-11 | 2013-03-19 | Microsoft Corporation | Determining entity popularity using search queries |
US10049100B2 (en) * | 2008-01-30 | 2018-08-14 | Thomson Reuters Global Resources Unlimited Company | Financial event and relationship extraction |
US9746985B1 (en) | 2008-02-25 | 2017-08-29 | Georgetown University | System and method for detecting, collecting, analyzing, and communicating event-related information |
US8881040B2 (en) | 2008-08-28 | 2014-11-04 | Georgetown University | System and method for detecting, collecting, analyzing, and communicating event-related information |
US9489495B2 (en) | 2008-02-25 | 2016-11-08 | Georgetown University | System and method for detecting, collecting, analyzing, and communicating event-related information |
US9529974B2 (en) | 2008-02-25 | 2016-12-27 | Georgetown University | System and method for detecting, collecting, analyzing, and communicating event-related information |
US20090222321A1 (en) * | 2008-02-28 | 2009-09-03 | Microsoft Corporation | Prediction of future popularity of query terms |
US20090276414A1 (en) * | 2008-04-30 | 2009-11-05 | Microsoft Corporation | Ranking model adaptation for searching |
US10198503B2 (en) | 2008-05-01 | 2019-02-05 | Primal Fusion Inc. | System and method for performing a semantic operation on a digital social network |
US9361365B2 (en) * | 2008-05-01 | 2016-06-07 | Primal Fusion Inc. | Methods and apparatus for searching of content using semantic synthesis |
US9798807B2 (en) * | 2008-05-06 | 2017-10-24 | Excalibur Ip, Llc | Algorithmically generated topic pages |
US8126930B2 (en) * | 2008-05-06 | 2012-02-28 | Yahoo! Inc. | Micro-bucket testing for page optimization |
EP2304544A4 (en) * | 2008-06-13 | 2011-08-24 | Ebay Inc | METHOD AND SYSTEM OF GROUPING |
US10922363B1 (en) * | 2010-04-21 | 2021-02-16 | Richard Paiz | Codex search patterns |
US11048765B1 (en) | 2008-06-25 | 2021-06-29 | Richard Paiz | Search engine optimizer |
US9183323B1 (en) | 2008-06-27 | 2015-11-10 | Google Inc. | Suggesting alternative query phrases in query results |
US9740986B2 (en) * | 2008-09-30 | 2017-08-22 | Excalibur Ip, Llc | System and method for deducing user interaction patterns based on limited activities |
US20100114887A1 (en) * | 2008-10-17 | 2010-05-06 | Google Inc. | Textual Disambiguation Using Social Connections |
US7949647B2 (en) | 2008-11-26 | 2011-05-24 | Yahoo! Inc. | Navigation assistance for search engines |
US8631007B1 (en) * | 2008-12-09 | 2014-01-14 | Google Inc. | Disambiguating keywords and other query terms used to select sponsored content |
US8452791B2 (en) | 2009-01-16 | 2013-05-28 | Google Inc. | Adding new instances to a structured presentation |
US8615707B2 (en) * | 2009-01-16 | 2013-12-24 | Google Inc. | Adding new attributes to a structured presentation |
US8412749B2 (en) | 2009-01-16 | 2013-04-02 | Google Inc. | Populating a structured presentation with new values |
US20100185651A1 (en) * | 2009-01-16 | 2010-07-22 | Google Inc. | Retrieving and displaying information from an unstructured electronic document collection |
US8977645B2 (en) * | 2009-01-16 | 2015-03-10 | Google Inc. | Accessing a search interface in a structured presentation |
US20100191758A1 (en) * | 2009-01-26 | 2010-07-29 | Yahoo! Inc. | System and method for improved search relevance using proximity boosting |
US8700630B2 (en) * | 2009-02-24 | 2014-04-15 | Yahoo! Inc. | Algorithmically generated topic pages with interactive advertisements |
US8190601B2 (en) * | 2009-05-22 | 2012-05-29 | Microsoft Corporation | Identifying task groups for organizing search results |
US20100306235A1 (en) * | 2009-05-28 | 2010-12-02 | Yahoo! Inc. | Real-Time Detection of Emerging Web Search Queries |
US20110106819A1 (en) * | 2009-10-29 | 2011-05-05 | Google Inc. | Identifying a group of related instances |
US8768938B2 (en) * | 2009-06-25 | 2014-07-01 | Hewlett-Packard Development Company, L.P. | Histogram processing by trend and pattern removal |
US20110010378A1 (en) * | 2009-07-07 | 2011-01-13 | John Dukes | Trend charting system and method |
US11113299B2 (en) | 2009-12-01 | 2021-09-07 | Apple Inc. | System and method for metadata transfer among search entities |
US20130304818A1 (en) * | 2009-12-01 | 2013-11-14 | Topsy Labs, Inc. | Systems and methods for discovery of related terms for social media content collection over social networks |
US8515975B1 (en) * | 2009-12-07 | 2013-08-20 | Google Inc. | Search entity transition matrix and applications of the transition matrix |
US8849785B1 (en) | 2010-01-15 | 2014-09-30 | Google Inc. | Search query reformulation using result term occurrence count |
WO2011090036A1 (ja) * | 2010-01-19 | 2011-07-28 | 日本電気株式会社 | 動向情報検索装置、動向情報検索方法および記録媒体 |
US8983989B2 (en) * | 2010-02-05 | 2015-03-17 | Microsoft Technology Licensing, Llc | Contextual queries |
US8150859B2 (en) * | 2010-02-05 | 2012-04-03 | Microsoft Corporation | Semantic table of contents for search results |
US8903794B2 (en) * | 2010-02-05 | 2014-12-02 | Microsoft Corporation | Generating and presenting lateral concepts |
US8260664B2 (en) * | 2010-02-05 | 2012-09-04 | Microsoft Corporation | Semantic advertising selection from lateral concepts and topics |
US20110231395A1 (en) * | 2010-03-19 | 2011-09-22 | Microsoft Corporation | Presenting answers |
US20110258017A1 (en) * | 2010-04-15 | 2011-10-20 | Ffwd Corporation | Interpretation of a trending term to develop a media content channel |
US8380723B2 (en) * | 2010-05-21 | 2013-02-19 | Microsoft Corporation | Query intent in information retrieval |
US8560562B2 (en) | 2010-07-22 | 2013-10-15 | Google Inc. | Predictive query suggestion caching |
US11386510B2 (en) | 2010-08-05 | 2022-07-12 | Thomson Reuters Enterprise Centre Gmbh | Method and system for integrating web-based systems with local document processing applications |
US8731939B1 (en) | 2010-08-06 | 2014-05-20 | Google Inc. | Routing queries based on carrier phrase registration |
JP5542017B2 (ja) * | 2010-09-15 | 2014-07-09 | アルパイン株式会社 | 名称検索装置 |
US20120095997A1 (en) * | 2010-10-18 | 2012-04-19 | Microsoft Corporation | Providing contextual hints associated with a user session |
US20120265784A1 (en) | 2011-04-15 | 2012-10-18 | Microsoft Corporation | Ordering semantic query formulation suggestions |
US20120271844A1 (en) * | 2011-04-20 | 2012-10-25 | Microsoft Corporation | Providng relevant information for a term in a user message |
US20120290612A1 (en) * | 2011-05-10 | 2012-11-15 | Ritoe Rajan V | N-dimensional data searching and display |
US10776431B2 (en) * | 2011-10-26 | 2020-09-15 | Oath Inc. | System and method for recommending content based on search history and trending topics |
US9069880B2 (en) * | 2012-03-16 | 2015-06-30 | Microsoft Technology Licensing, Llc | Prediction and isolation of patterns across datasets |
US9916396B2 (en) | 2012-05-11 | 2018-03-13 | Google Llc | Methods and systems for content-based search |
US8620925B1 (en) | 2012-05-17 | 2013-12-31 | Google Inc. | System and method for identifying advertising opportunities |
US8954438B1 (en) | 2012-05-31 | 2015-02-10 | Google Inc. | Structured metadata extraction |
US10275525B2 (en) * | 2012-06-14 | 2019-04-30 | Excalibur Ip, Llc | Method and system for mining trends around trending terms |
US20130339136A1 (en) * | 2012-06-18 | 2013-12-19 | Ebay Inc. | Detection of events from bursts of activity indicators |
US9471606B1 (en) | 2012-06-25 | 2016-10-18 | Google Inc. | Obtaining information to provide to users |
CN103516583B (zh) * | 2012-06-28 | 2017-09-29 | 北京奇虎科技有限公司 | 一种用于即时通讯中进行消息交互的方法及装置 |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
US9424233B2 (en) | 2012-07-20 | 2016-08-23 | Veveo, Inc. | Method of and system for inferring user intent in search input in a conversational interaction system |
US9110852B1 (en) | 2012-07-20 | 2015-08-18 | Google Inc. | Methods and systems for extracting information from text |
US9465833B2 (en) | 2012-07-31 | 2016-10-11 | Veveo, Inc. | Disambiguating user intent in conversational interaction system for large corpus information retrieval |
US9390174B2 (en) | 2012-08-08 | 2016-07-12 | Google Inc. | Search result ranking and presentation |
US9529867B1 (en) * | 2012-10-11 | 2016-12-27 | Google Inc. | System and method for providing a dynamic dashboard |
US9256682B1 (en) | 2012-12-05 | 2016-02-09 | Google Inc. | Providing search results based on sorted properties |
US11741090B1 (en) | 2013-02-26 | 2023-08-29 | Richard Paiz | Site rank codex search patterns |
US11809506B1 (en) | 2013-02-26 | 2023-11-07 | Richard Paiz | Multivariant analyzing replicating intelligent ambience evolving system |
US9218819B1 (en) | 2013-03-01 | 2015-12-22 | Google Inc. | Customizing actions based on contextual data and voice-based inputs |
US20140250116A1 (en) * | 2013-03-01 | 2014-09-04 | Yahoo! Inc. | Identifying time sensitive ambiguous queries |
US9342503B1 (en) * | 2013-03-12 | 2016-05-17 | Amazon Technologies, Inc. | Correlation across languages |
US10055462B2 (en) | 2013-03-15 | 2018-08-21 | Google Llc | Providing search results using augmented search queries |
US10108700B2 (en) | 2013-03-15 | 2018-10-23 | Google Llc | Question answering to populate knowledge base |
US9477759B2 (en) | 2013-03-15 | 2016-10-25 | Google Inc. | Question answering using entity references in unstructured data |
US8965915B2 (en) | 2013-03-17 | 2015-02-24 | Alation, Inc. | Assisted query formation, validation, and result previewing in a database having a complex schema |
US10121493B2 (en) | 2013-05-07 | 2018-11-06 | Veveo, Inc. | Method of and system for real time feedback in an incremental speech input interface |
WO2014183035A1 (en) | 2013-05-10 | 2014-11-13 | Veveo, Inc. | Method and system for capturing and exploiting user intent in a conversational interaction based information retrieval system |
US9311406B2 (en) | 2013-06-05 | 2016-04-12 | Microsoft Technology Licensing, Llc | Discovering trending content of a domain |
US9336300B2 (en) | 2014-01-17 | 2016-05-10 | Facebook, Inc. | Client-side search templates for online social networks |
US9785661B2 (en) | 2014-02-07 | 2017-10-10 | Microsoft Technology Licensing, Llc | Trend response management |
MY184201A (en) | 2014-05-19 | 2021-03-25 | Mimos Berhad | A system and method for analyzing concept evolution using network analysis |
US9465831B2 (en) * | 2014-07-18 | 2016-10-11 | Wipro Limited | System and method for optimizing storage of multi-dimensional data in data storage |
JP6162664B2 (ja) * | 2014-08-13 | 2017-07-12 | ヤフー株式会社 | 抽出装置、検索サーバ、情報処理装置、抽出システム、抽出方法及び抽出プログラム |
US10210214B2 (en) | 2014-08-27 | 2019-02-19 | International Business Machines Corporation | Scalable trend detection in a personalized search context |
US20160103861A1 (en) * | 2014-10-10 | 2016-04-14 | OnPage.org GmbH | Method and system for establishing a performance index of websites |
US9852136B2 (en) | 2014-12-23 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for determining whether a negation statement applies to a current or past query |
US9854049B2 (en) | 2015-01-30 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for resolving ambiguous terms in social chatter based on a user profile |
US9629033B2 (en) * | 2015-06-16 | 2017-04-18 | Cisco Technology, Inc. | System and method to facilitate service hand-outs using user equipment groups in a network environment |
US10528632B2 (en) | 2016-07-19 | 2020-01-07 | Microsoft Technology Licensing, Llc | Systems and methods for responding to an online user query |
US11416535B2 (en) | 2018-04-20 | 2022-08-16 | Microsoft Technology Licensing, Llc | User interface for visualizing search data |
CN110033156B (zh) * | 2018-12-14 | 2023-05-09 | 创新先进技术有限公司 | 一种业务活动效果的确定方法及装置 |
US11256992B2 (en) | 2019-06-25 | 2022-02-22 | Google Llc | Developing event-specific provisional knowledge graphs |
WO2020263226A1 (en) | 2019-06-25 | 2020-12-30 | Google Llc | Using live data streams and/or search queries to determine information about developing events |
US20210065019A1 (en) * | 2019-08-28 | 2021-03-04 | International Business Machines Corporation | Using a dialog system for learning and inferring judgment reasoning knowledge |
CN111159248B (zh) * | 2019-12-12 | 2023-04-28 | 北京字节跳动网络技术有限公司 | 信息检索方法、装置和电子设备 |
US20230230109A1 (en) * | 2022-01-19 | 2023-07-20 | Martin A. Alpert | Trend prediction |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5619709A (en) * | 1993-09-20 | 1997-04-08 | Hnc, Inc. | System and method of context vector generation and retrieval |
AU6849196A (en) * | 1995-08-16 | 1997-03-19 | Syracuse University | Multilingual document retrieval system and method using semantic vector matching |
US6076088A (en) * | 1996-02-09 | 2000-06-13 | Paik; Woojin | Information extraction system and method using concept relation concept (CRC) triples |
US6460034B1 (en) | 1997-05-21 | 2002-10-01 | Oracle Corporation | Document knowledge base research and retrieval system |
US6006321A (en) | 1997-06-13 | 1999-12-21 | Malleable Technologies, Inc. | Programmable logic datapath that may be used in a field programmable device |
AU3292699A (en) * | 1998-02-13 | 1999-08-30 | Yahoo! Inc. | Search engine using sales and revenue to weight search results |
WO2000005664A1 (en) * | 1998-07-24 | 2000-02-03 | Jarg Corporation | Search system and method based on multiple ontologies |
WO2000011576A1 (en) * | 1998-08-24 | 2000-03-02 | Virtual Research Associates, Inc. | Natural language sentence parser |
US6317722B1 (en) * | 1998-09-18 | 2001-11-13 | Amazon.Com, Inc. | Use of electronic shopping carts to generate personal recommendations |
US6363373B1 (en) * | 1998-10-01 | 2002-03-26 | Microsoft Corporation | Method and apparatus for concept searching using a Boolean or keyword search engine |
US6189002B1 (en) * | 1998-12-14 | 2001-02-13 | Dolphin Search | Process and system for retrieval of documents using context-relevant semantic profiles |
US6327590B1 (en) * | 1999-05-05 | 2001-12-04 | Xerox Corporation | System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis |
US6772150B1 (en) * | 1999-12-10 | 2004-08-03 | Amazon.Com, Inc. | Search query refinement using related search phrases |
US6675159B1 (en) * | 2000-07-27 | 2004-01-06 | Science Applic Int Corp | Concept-based search and retrieval system |
AU2001288469A1 (en) * | 2000-08-28 | 2002-03-13 | Emotion, Inc. | Method and apparatus for digital media management, retrieval, and collaboration |
US20020087346A1 (en) * | 2000-11-28 | 2002-07-04 | Harkey Scott T. | Utilization of competencies as drivers in a learning network |
US6766316B2 (en) * | 2001-01-18 | 2004-07-20 | Science Applications International Corporation | Method and system of ranking and clustering for document indexing and retrieval |
US6584470B2 (en) * | 2001-03-01 | 2003-06-24 | Intelliseek, Inc. | Multi-layered semiotic mechanism for answering natural language questions using document retrieval combined with information extraction |
US7194454B2 (en) * | 2001-03-12 | 2007-03-20 | Lucent Technologies | Method for organizing records of database search activity by topical relevance |
US7403938B2 (en) * | 2001-09-24 | 2008-07-22 | Iac Search & Media, Inc. | Natural language query processing |
US7406459B2 (en) * | 2003-05-01 | 2008-07-29 | Microsoft Corporation | Concept network |
US20040260677A1 (en) | 2003-06-17 | 2004-12-23 | Radhika Malpani | Search query categorization for business listings search |
-
2003
- 2003-11-12 US US10/712,307 patent/US7240049B2/en active Active
-
2004
- 2004-11-12 WO PCT/US2004/037571 patent/WO2005050367A2/en active Application Filing
- 2004-11-12 KR KR1020067011525A patent/KR101031449B1/ko active IP Right Grant
- 2004-11-12 CN CNB2004800367547A patent/CN100401292C/zh active Active
- 2004-11-12 JP JP2006539831A patent/JP4722051B2/ja active Active
- 2004-11-12 EP EP04819083A patent/EP1690169A4/en not_active Ceased
-
2007
- 2007-05-30 US US11/755,658 patent/US7562076B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150047941A (ko) | 2013-10-25 | 2015-05-06 | 삼성테크윈 주식회사 | 검색 시스템 및 그의 동작 방법 |
US9858297B2 (en) | 2013-10-25 | 2018-01-02 | Hanwha Techwin Co., Ltd. | System for search and method for operating thereof |
Also Published As
Publication number | Publication date |
---|---|
US20050102259A1 (en) | 2005-05-12 |
EP1690169A2 (en) | 2006-08-16 |
US20070226198A1 (en) | 2007-09-27 |
JP2007511016A (ja) | 2007-04-26 |
WO2005050367A3 (en) | 2006-08-24 |
WO2005050367A2 (en) | 2005-06-02 |
JP4722051B2 (ja) | 2011-07-13 |
KR101031449B1 (ko) | 2011-04-26 |
US7562076B2 (en) | 2009-07-14 |
CN100401292C (zh) | 2008-07-09 |
EP1690169A4 (en) | 2008-12-17 |
CN1930566A (zh) | 2007-03-14 |
US7240049B2 (en) | 2007-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101031449B1 (ko) | 트렌드 분석을 이용한 검색 쿼리 처리 시스템 및 방법 | |
CN101111837B (zh) | 查询自动分类的搜索处理 | |
JP5461360B2 (ja) | スーパーユニットを用いた検索処理のためのシステム及び方法 | |
Nasraoui et al. | A web usage mining framework for mining evolving user profiles in dynamic web sites | |
US6311194B1 (en) | System and method for creating a semantic web and its applications in browsing, searching, profiling, personalization and advertising | |
US8166013B2 (en) | Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis | |
TWI493367B (zh) | 搜尋結果之先進過濾方法 | |
US7340460B1 (en) | Vector analysis of histograms for units of a concept network in search query processing | |
US20110264683A1 (en) | System and method for managing information map | |
Li | Internet tourism resource retrieval using PageRank search ranking algorithm | |
KR20020014026A (ko) | 웹 개인화에 바탕한 뉴스 추적 및 분석 서비스 | |
Fortuna et al. | User modeling combining access logs, page content and semantics | |
Madadipouya | A location-based movie recommender system using collaborative filtering | |
WO2008032037A1 (en) | Method and system for filtering and searching data using word frequencies | |
Lee et al. | Analyzing URL queries | |
KR20240015280A (ko) | 트렌드 분석을 이용한 검색 쿼리 처리 시스템 및 방법 | |
Ambika et al. | Web mining: The demystification of multifarious aspects | |
Eirinaki et al. | Ikum: An integrated web personalization platform based on content structures and user behavior | |
David et al. | Building solutions for web personalization | |
Milani et al. | Fuzzy matching of user profiles for a banner engine | |
Saxena | Improving Web Recommendations Using Web Usage Mining and Web Semantics | |
WO2011132204A2 (en) | Fetch engine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
FPAY | Annual fee payment | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20160318 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20170322 Year of fee payment: 7 |