KR20160026907A - 개체 확장을 이용한 인물 탐색 기법 - Google Patents

개체 확장을 이용한 인물 탐색 기법 Download PDF

Info

Publication number
KR20160026907A
KR20160026907A KR1020157036770A KR20157036770A KR20160026907A KR 20160026907 A KR20160026907 A KR 20160026907A KR 1020157036770 A KR1020157036770 A KR 1020157036770A KR 20157036770 A KR20157036770 A KR 20157036770A KR 20160026907 A KR20160026907 A KR 20160026907A
Authority
KR
South Korea
Prior art keywords
search
query
search query
computer
person
Prior art date
Application number
KR1020157036770A
Other languages
English (en)
Inventor
저스틴 오몬트
마크 엘리오트 데이비스
Original Assignee
마이크로소프트 테크놀로지 라이센싱, 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/931,922 external-priority patent/US20150006520A1/en
Application filed by 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 filed Critical 마이크로소프트 테크놀로지 라이센싱, 엘엘씨
Publication of KR20160026907A publication Critical patent/KR20160026907A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • G06F17/30672
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • G06F17/30675
    • G06F17/30864

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

탐색 질의에서 식별되는 사람에 관한 콘텐츠(또는 콘텐츠에 대한 참고자료)에 대한 탐색 질의에 응답하는 시스템 및 방법뿐만 아니라 컴퓨터 판독가능 매체가 제시된다. 다수의 실시예들에 의하면, 컴퓨터 사용자로부터 탐색 질의를 수신하면, 관련 개체 데이터는 식별된 인물에 대한 적어도 하나의 관련 개체 소스로부터 획득된다. 관련 개체 데이터는 식별된 인물과 연관된 카테고리 또는 관련 개체(또는 개체들) 중 적어도 하나를 포함한다. 확장형 탐색 질의는 컴퓨터 사용자로부터의 탐색 질의 및 관련 개체 데이터에 따라 생성된다. 탐색 결과들은 확장형 탐색 질의에 따라 획득되고, 탐색 결과 프리젠테이션이 생성되어 탐색 질의의 응답으로 컴퓨터 사용자에게 되돌려 보내진다.

Description

개체 확장을 이용한 인물 탐색 기법{PERSON SEARCH UTILIZING ENTITY EXPANSION}
인터넷 상에서 특정 인물에 관한 콘텐츠를 찾아내는 것은 해결해야 할 과제일 수 있다. "사람들 탐색"을 어렵게 하는 많은 요인들(대부분의 이름들은 고유하지 않음)이 있다. 임의의 주어인 영역에서, 동일한 이름을 갖는 다수의 사람들이 있을 수 있다. 또한, 임의의 주어진 인물의 웹 프레즌스(web presence)가 낮을 수 있어, 그 인물에 대한 탐색 결과들은 동일한 이름을 갖는 보다 잘 알려진 사람을 가리키는 결과들로 점유될 것이다.
이하의 개요는 이하의 상세한 설명에서 추가로 설명되는 개념들의 선택을 단순화된 형태로 소개하도록 제공된다. 개요는 청구대상의 주요한 특징들 또는 필수적인 특징들을 확인하도록 의도되는 것도, 청구대상의 범위를 제한하기 위해 사용되도록 의도되는 것도 아니다.
개시되는 청구대상의 측면들에 의하면, 컴퓨터 사용자로부터 탐색 질의가 수신되고, 이 탐색 질의는 찾고자 하는 콘텐츠(또는 콘텐츠에 대한 참고자료)와 관련된 인물을 식별하는 것이다. 컴퓨터 사용자로부터 탐색 질의를 수신하면, 식별된 인물에 대한 적어도 하나의 관련 개체 소스로부터 관련 개체 데이터가 획득된다. 관련 개체 데이터는 식별된 인물과 연관된 카테고리 또는 관련 개체(또는 개체들) 중 적어도 하나를 포함한다. 확장형 탐색 질의는 컴퓨터 사용자로부터의 탐색 질의 및 관련 개체 데이터에 따라 생성된다. 확장형 탐색 질의에 따라 검색 결과들이 획득되고, 또한 탐색 결과 프리젠테이션(a search results presentation)이 생성되어, 탐색 질의의 응답으로 사용자 컴퓨터에게 되돌려 보내진다.
개시된 청구대상의 다른 측면들에 의하면, 컴퓨터 실행가능 인스트럭션을 포함하는 컴퓨터 판독가능 매체가 제시된다. 매체로부터 검색된 인스트럭션을 실행하는 하나의 프로세서를 적어도 포함하는 컴퓨팅 시스템에서의 실행시에, 컴퓨팅 시스템은 사용자로부터의 탐색 질의에 응답하기 위한 방법을 수행하도록 구성된다. 보다 구체적으로, 컴퓨터 사용자로부터 탐색 질의를 수신하는 것에 응답하여, 이 탐색 질의가 찾고자 하는 콘텐츠(또는 콘텐츠에 대한 참고자료)와 관련된 인물을 식별하는 경우, 관련 개체 데이터가 식별된 인물에 대한 적어도 하나의 관련 개체 소스로부터 획득된다. 확장형 탐색 질의는 컴퓨터 사용자로부터의 탐색 질의 및 관련 개체 데이터에 따라 생성된다. 탐색 결과들은 확장형 탐색 질의에 따라 획득되고, 또한 탐색 결과 프리젠테이션이 생성되어, 탐색 질의의 응답으로 컴퓨터 사용자에게 되돌려 보내진다.
개시된 청구대상의 또 다른 측면들에 의하면, 인물에 관련된 콘텐츠에 대한 탐색 질의에 응답하는 컴퓨터 시스템이 제시된다. 컴퓨터 시스템은 프로세서 및 메모리를 포함하되, 프로세서는 인물에 관련된 콘텐츠에 대한 탐색 질의에 응답하기 위해 부가적인 구성요소들과 함께 또는 그 일부로서 메모리에 저장된 인스트럭션을 실행한다. 이들 부가적인 구성요소들은 (비제한적인 예로서) 질의 주제 식별 구성요소, 관련 개체 검색 구성요소, 확장형 질의 생성기, 탐색 결과 검색 구성요소, 및 탐색 결과 프리젠테이션 생성기를 포함한다. 동작시에, 질의 주제 식별 구성요소는 콘텐츠가 구해지는 탐색 질의로부터 인물의 신원을 판정하도록 구성된다. 관련 개체 검색 구성요소는 관련 개체 소스로부터 식별된 인물에 대응하는 관련 개체 데이터를 획득한다. 관련 개체 데이터를 획득한 후에, 확장형 질의 생성기는 식별된 인물에 관련된 콘텐츠에 대한 탐색 질의로부터 또한 관련 개체 데이터로부터 확장형 질의를 생성한다. 다수의 실시예들에 의하면, 관련 개체 데이터는 탐색 질의의 식별된 인물과 연관된 카테고리 또는 관련 개체 중 적어도 하나를 포함한다. 탐색 결과 검색 구성요소는 확장형 탐색 질의에 따라 콘텐츠 스토어로부터 탐색 결과들을 획득한다. 그 이후, 탐색 결과 프리젠테이션 생성기는 식별된 인물에 대응하는 콘텐츠를 참조하는 탐색 결과들에 따라 탐색 결과 프리젠테이션을 생성하고, 그 탐색 결과 프리젠테이션을 컴퓨터 사용자에게 되돌려 보낸다.
개시된 청구대상의 수반되는 다수의 이점들 및 이전의 측면들은, 이하의 도면들과 함께 취해질 때에 이하의 설명을 참조해서 보다 잘 이해되는 바와 같이 더욱 쉽게 이해될 것이다.
도 1은 개시된 청구대상의 측면들을 구현하기에 적합한 네트워크화된 환경의 블록도이다.
도 2는 질의 확장을 통해 특정 인물에 대한 콘텐츠 관련 탐색 질의에 응답으로 개선된 결과들을 제공하기 위한 예시적인 루틴을 나타내는 흐름도이다.
도 3은 개시된 청구대상의 측면들에 따라 확장형 탐색 질의를 생성하기 위한 예시적인 루틴을 나타내는 흐름도이다.
도 4 및 5는 확장형 탐색 질의들의 요소들을 나타낸다.
도 6은 컴퓨터 사용자로부터의 탐색 질의에 응답으로 개선된 결과들을 제공하도록 구성된 탐색 엔진의 예시적인 구성요소들을 나타내는 블록도이다.
명확성을 위해, 본 명세서에서의 "예시적인"이란 용어의 사용은 실례 또는 무언가의 예로서 기능하는 것으로 해석되어야 하고, 그것의 이상적인 및/또는 주요한 실례로서 해석되지 말아야 한다. 개체는 비제한적인 예로서 사람, 장소, 그룹, 개념, 활동 등을 포함하는 추상적이거나 유형적인 것에 대응한다.
도 1로 가면, 도 1은 구체적으로 인물에 관한 탐색 질의에 대한 응답으로 개선된 탐색 결과들을 컴퓨터 사용자에게 제공하는 것과 관련해서, 개시된 청구대상의 측면들을 구현하기에 적합한 예시적인 네트워크화된 환경(100)을 나타내는 블록도이다. 예시적인 네트워크화된 환경(100)은 인터넷, 광역 네트워크 또는 WAN 등과 같은 네트워크(108)에 연결되는 하나 이상의 사용자 컴퓨터, 예를 들어 사용자 컴퓨터들(102-106)을 포함한다. 사용자 컴퓨터들은 비제한적인 예로서 (데스크탑 컴퓨터(104)와 같은) 데스크탑 컴퓨터들; (랩탑 컴퓨터(102)와 같은) 랩탑 컴퓨터들; (태블릿 컴퓨터(106)와 같은) 태블릿 컴퓨터들; 모바일 디바이스들(도시되지 않음); 게임 콘솔들(도시되지 않음); PDA(도시되지 않음) 등을 포함한다. 사용자 컴퓨터들은 유선 및/또는 무선 접속을 이용해서 네트워크(108)에 연결하도록 구성될 수 있다. 단지 예시를 위해서, 예시적인 네트워크화된 환경(100)은 네트워크(108)를 사용자 컴퓨터들(102-106)과 탐색 엔진(110) 사이에 있는 것으로, 또 다시 탐색 엔진(110)과 네트워크 사이트들(112-116) 사이에 있는 것으로 도시한다. 그러나, 이러한 도시는 이것들이 별도의 네트워크들임을 제안하는 것으로 간주되지 말아야 한다.
또한, 네트워크 사이트들(110-116)을 포함한 다수의 네트워크화된 사이트들이 네트워크(108)에 연결되어 있다. 비제한적인 예로서, 네트워크(108)에 연결된 네트워크화된 사이트들은 컴퓨터 사용자들로부터의 탐색 질의에 응답하도록 구성된 탐색 엔진(110), 다수의 뉴스 기사들 및 콘텐츠를 호스팅하는 뉴스 소스들(112, 114), 소셜 네트워킹 사이트(116) 등을 포함한다. 컴퓨터 사용자(101)와 같은 컴퓨터 사용자는 뉴스 콘텐츠를 포함한 콘텐츠에 액세스하기 위해 사용자 컴퓨터(102)와 같은 사용자 컴퓨터를 거쳐 이들 및 다른 네트워크화된 사이트들로 네비게이팅할 수 있다.
개시된 청구대상의 측면들에 의하면, 탐색 엔진(110)은 컴퓨터 사용자로부터의 탐색 질의에 응답하여 탐색 결과들을 (일반적으로 네트워크(108)에서 이용가능한 콘텐츠에 대한 참고자료의 형태로) 제공하도록 구성된다. 특히, 특정 인물에 관한 정보를 위해 컴퓨터 사용자로부터 탐색 질의를 수신하는 것에 응답하여, 탐색 엔진(110)은 그 콘텐츠 스토어에서의 정보에 따라 상기 식별된 인물에 관련된 콘텐츠를 식별하고, 식별된 콘텐츠의 적어도 일부에 기초하여 탐색 결과 프리젠테이션을 생성하며, 탐색 결과 프리젠테이션을 컴퓨터 사용자에게 제공한다.
또한, 도 1은 소셜 네트워크 사이트(116), 및 뉴스 사이트들(112-114)을 포함한 다수의 뉴스 소스들을 예시적으로 포함한다. 쉽게 이해되는 바와 같이, 소셜 네트워크 사이트(116)는, 컴퓨터 사용자가 사용자의 다수의 측면들을 기재하는 프로파일을 확립할 수 있고, 다른 컴퓨터 사용자들, 그룹들 등과 소셜 네트워크 및 관계를 구축할 수 있는 플랫폼을 제공하는 온라인 사이트/서비스이다. 소셜 네트워크 사이트(116)에서, 컴퓨터 사용자는 자신의 소셜 네트워크에서의 것들을 이용하여 다수의 관심, 활동, 및 배경을 확립하거나 표시할 수 있다. 실제로, 컴퓨터 사용자는 종종 소셜 네트워킹 사이트(116)에 의해 호스팅될 수도 있는 특정 개체에서의 선호도 또는 관심을, 그 개체가 인물, 장소, 그룹, 개념, 활동 등이든 아니든, 소셜 네트워킹 서비스에 표시할 수 있음을 당업자는 이해할 것이다. 단 하나의 소셜 네트워크 사이트(116)가 예시적인 네트워크 환경(100)에 포함되어 있지만, 이는 단지 설명을 위한 것이며 개시된 청구대상에 제한을 두는 것으로 간주되지 말아야 한다. 실제 실시예에서, 네트워크(108)에 연결된 임의의 수의 소셜 네트워크 사이트들이 존재할 수 있다.
당업계에서 공지된 바와 같이, 탐색 엔진(110)은 뉴스 사이트들(112, 114), 소셜 네트워킹 사이트(116), 및 각 네트워크 사이트에서 이용가능한 콘텐츠에 관한 정보를 획득하기 위한 블로그들 및 레지스트리들(도시되지 않음)과 같은 다른 사이트들을 포함해서 다수의 콘텐츠 소스들과 (서비스 호출들 및/또는 웹 크롤러들을 통해 직접적으로 또는 간접적으로) 통신하도록 구성된다. 이용가능 콘텐츠에 관한 정보는 또한 다수의 서비스들 및/또는 네트워킹 사이트들로부터 탐색 엔진으로 푸쉬될 수 있다. 콘텐츠 스토어에 (일반적으로 콘텐츠에 대한 참고자료로서) 상기 정보가 저장되어, 탐색 엔진은 컴퓨터 사용자(101)와 같은 컴퓨터 사용자로부터의 탐색 질의에 응답하기 위해 이 콘텐츠 스토어로부터 콘텐츠를 획득할 수 있다. 탐색 엔진(110)은 또한 탐색 질의 로그들, 네트워크 브라우징 이력들, 구매 이력들 등으로부터 임의의 주어진 사람에 관한 정보를 획득할 수 있다. 다수의 네트워크 사이트들로부터 획득된 콘텐츠 및 상기 정보는 일반적으로 키워드 및 구매에 따라 색인화될 수 있어, 정보가 신속하게 식별 및 액세스될 수 있다. 또한, 탐색 엔진의 콘텐츠 스토어에 저장되는 정보에 부가하여, 탐색 엔진(110)은 탐색 질의에 대한 응답시에 다른 네트워크 사이트들로부터 정보를 획득하도록 구성될 수도 있다. 예컨대, 개시된 청구대상의 측면들에 의하면, 탐색 질의에 대한 응답시에, 탐색 엔진(110)은, 요청하는 컴퓨터 사용자로 되돌려 보내기 위한 관련 정보 및/또는 요청하는 컴퓨터 사용자에게 되돌려 보내기 위한 관련 정보를 탐색 엔진이 식별하는 것을 도와주는 정보로서, 소셜 네트워크 사이트(116)와 같은 하나 이상의 소셜 네트워킹 사이트들로부터 데이터를 획득할 수 있다.
개시된 청구대상의 측면들을 더 설명하기 위해, 이제 도 2를 참조한다. 도 2는 질의 확장을 통해 특정 인물에 대응하는 콘텐츠 관련 탐색 질의에 대한 응답으로 개선된 결과들을 제공하기 위한 예시적인 루틴의 흐름도이다. 블록 202에서 시작하면, 탐색 엔진(110)은 컴퓨터 사용자(101)와 같은 컴퓨터 사용자로부터 탐색 질의를 수신하되, 상기 탐색 질의는 특정 사람에 대응하는 콘텐츠를 요청하는 것이다.
쉽게 이해되는 바와 같이, 탐색 질의는 일반적으로(배타적으로는 아니지만) 텍스트 스트링(a text string)이다. 예컨대, 인물 관련 콘텐츠에 대한 탐색 질의는 "Bruce Wayne"일 수 있다. 따라서, 동일한 이름을 갖는 다수의 사람들이 존재할 수 있기 때문에, 블록 204에서, 탐색 엔진은 탐색 질의의 대상인 인물을 고유하게 식별하도록 시도한다. 개시된 청구대상의 측면들에 의하면, 탐색 엔진은 적어도 요청하는 컴퓨터 사용자에 관련된 특정 정보 및 일반적인 정보에 따라 콘텐츠가 요청되는 인물을 고유하게 식별하도록 시도한다. 일반적인 정보는, 비제한적인 예로서, 탐색 질의에서 식별된 이름을 갖는 인물에 대응하는 탐색 질의들의 인기도(popularity); 탐색 질의에서 식별된 이름을 갖는 인물의 최신 유행의 인기도(trending popularity); 탐색 질의에서의 다른 단어들 및/또는 구절들(예를 들어, "Bruce Wayne Seattle" 또는 "Bruce Wayne Microsoft"); 인물을 나타내는 이미지 등을 포함한다. 요청하는 컴퓨터 사용자에 관련된 특정 정보는, 비제한적인 예로서, 현재 위치; 이전의 탐색 질의 이력; 현재 및 예전의 직장; (명시적 및 암묵적의 양쪽으로 식별된) 선호도; 요청하는 컴퓨터 사용자와 탐색 질의의 잠재적 대상들 간의 일반적인 그래프 연관성뿐만 아니라 서로아는 친구들의 수; 요청하는 사용자와 잠재적 대상들 간의 물리적 거리; 친구들의 위치; 예전의 위치들 등을 포함한다. 통상, 배타적으로는 아니지만, 탐색 엔진(110)은 전역적으로 고유한 식별자를 탐색 질의의 대상물인 인물과 적어도 내부적으로 연관시킬 수 있다. 게다가, 탐색 질의의 대상물인 인물이 식별자이면, 탐색 엔진(110)은 연관된 전역적으로 고유한 식별자를 탐색 질의에 응답하여 탐색 결과들을 획득, 또는 재순위화(reranking)할 때에 사용할 수 있다.
물론, 블록 202 및 204에서 제시된 순서는 예시로서 간주되어야 하고, 개시된 청구대상에 제한을 두지 않아야 한다. 다수의 조건 하에서, 찾고자 하는 콘텐츠와 관련된 인물의 신원은 탐색 요청을 제출/수신하기 전에 공지될 수 있다. 예컨대, 자동-제안 탐색 추천은 자동-제안들 중 하나로서 특정 인물을 표시할 수 있고, 일반적으로, 제안된 인물의 고유한 신원이 공지됨을 표시할 수 있다. 이와 달리, 다른 서비스는 인물을 고유하게 식별하는 인물에 대한 탐색 요청을 탐색 서비스에 제출할 수 있어, 인물의 신원이 판정될 필요가 없다. 따라서, 일 실시예는 도 2의 블록 202 및 블록 204와 관련해서 개시되어 있지만, 이는 일 실시예의 설명을 위한 것이며, 개시된 청구대상에 제한을 두는 것이 아니다.
찾고자 하는 콘텐츠와 관련된 인물을 식별하는 탐색 요청과 관련하여, 그 인물의 이름이 공지되어 있진 않지만 일부 정보가 제공되어 그 인물을 고유하게 식별하게 될 수 있는 때가 존재할 수도 있다. 예컨대, 컴퓨터 사용자는 Seattle Seahawks의 단장의 이름을 알 수 없을 수 있지만, "Ggeneral manager of the Seattle Seahawks"이란 텍스트의 입력시에 컴퓨터 사용자는 종종 찾고자 하는 콘텐츠와 관련된 인물을 충분히 식별하여, 블록 204에서 인물의 신원이 판정될 수 있다.
블록 206에서, 탐색 질의의 대상물인 인물을 식별한 후에, 탐색 엔진(110)은 식별된 인물에 대응하는 관련 개체 데이터를 획득한다. 개시된 청구대상의 측면들에 의하면, 관련 개체 데이터는 식별된 인물에 관한 개체들을 포함한다. 관련 개체는 식별된 인물이 몇몇의 이유로 관련되어지는 개체이다. 이유들 중 일부는 알려져 있을 수 있지만, 다른 것들은 통계적 유사도에 따라 미공지 및 암시될 수 있다. 예컨대, 식별된 인물이 회사 A의 직원이고, 워크그룹 Z의 구성원이라고 가정하자. 식별된 인물에 대한 관련 개체들은, 이러한 고용 관계에 기초하여, 일반적으로 "회사 A" 및 "워크그룹 Z"를 포함할 것이다. 이러한 동일의 고용 관계로부터 일어나는 다른 관련 개체들은 동료들을 포함할 수 있다. 또 다른 개체들은, 이러한 동일의 고용 관계에 기초하여, 다른(이전의) 워크그룹들, 과거 및 현재의 동료들 등을 포함할 수도 있다. 상기 예의 진척을 위해, 식별된 인물은 또한 특정 대학의 동창생일 수도 있다. 따라서, 식별된 인물이 공부한 대학에서의 특정 학부, 수여받은 학점, 식별된 인물의 학문적 업적들, 동료 학생들 등뿐만 아니라, 대학은 식별된 인물의 관련 개체일 수 있다. 또한, 식별된 인물이 또한 원예에 열정을 갖고 있다고 가정하면, 식별된 인물은 로컬 마스터 정원사들 모임의 구성원일 수 있고, 그 결과, 로컬 마스터 정원사들 모임은 그 모임의 동료 구성원들뿐만 아니라 식별된 인물에 대한 관련 개체일 수 있다.
개시된 청구대상의 측면들에 의하면, 탐색 엔진(110)은 하나 이상의 관련 개체 소스들로부터 관련 개체 데이터를 획득한다. 탐색 엔진(110)은 호스트를 저장하거나 또는 사용자 프로파일 스토어(예를 들어, 도 6의 사용자 프로파일 스토어(628))로부터의 식별된 인물에 관한 다수의 정보를 저장할 수 있으므로, 관련 개체 소스들 중 하나일 수 있다. 예컨대, 탐색 엔진(110)은 컴퓨터 사용자에 대응하는 사용자 프로파일 정보를 저장할 수 있다. 이 사용자 프로파일 정보는 (탐색 질의들, 브라우징 이력 등으로부터 도출된 정보와 같은) 식별된 정보에 암시적으로 기초할 뿐만 아니라 (식별된 인물로부터의) 식별된 정보에 명시적으로 기초할 수 있다. 소셜 네트워킹 사이트(116)와 같은 소셜 네트워킹 사이트들은 부가적인 관련 개체 소스들을 나타낼 수 있다. 상기한 바와 같이, 소셜 네트워킹 사이트는 탐색 질의의 식별된 인물과 같은 인물이 다른 개체들(사람들, 조직들, 활동들, 원인들 등을 포함함)과의 소셜 네트워크들 및 관계들을 확립할 수 있게 한다. 물론, 다수의 관련 개체 소스들이 존재할 수 있되, 그들 각각의 호스팅 정보는 식별된 인물과 다른 개체들 간의 관계를 표시할 수 있으며, 또한 탐색 엔진(110)은 임의의 수의 이들 관련 개체 소스들로부터 관련 개체 데이터를 획득하도록 구성될 수 있다.
관련 개체 소스들 각각에 의해 호스팅되는 관련 개체 정보가, 식별된 인물이 비밀을 유지하길 원하는 정보를 포함할 수 있음을 이해해야 한다. 이를 해결하기 위해, 개시된 청구대상의 측면들에 의하면, 탐색 질의는 요청하는 컴퓨터 사용자를 식별하고, 식별되면, 관련 개체 정보를 획득함에 있어서 요청하는 컴퓨터 사용자에게 제공되는 권한을 사용하도록 시도할 수 있다. 다수의 실시예들에서, 컴퓨터 사용자는 식별된 인물에 관한 정보에 액세스하기 위해 그 자신 또는 그녀 자신을 인증하도록 요구받는다. 다른 요구사항들은, 비제한적인 예로서, 제한될 수 있는 콘텐츠를 보기 위해 및/또는 그 콘텐츠에 액세스하기 위해 요청하는 컴퓨터 사용자가 하나 이상의 서비스에 로그인되는 것을 포함할 수 있다.
상기 예들과 관련해서 제안된 바와 같이, 관련 개체 소스는 하나 이상의 카테고리들을 (탐색 질의의 식별된 인물과 같은) 사람에 연관시킬 수 있다. 따라서, 관련 개체 소스들로부터 획득된 관련 개체 데이터는 카테고리 데이터를 포함할 수도 있다. (카테고리당 인물의 실제 관계들뿐만 아니라 카테고리에 의해 정의된 잠재적 관계들의 세트와 관련해서) 카테고리 데이터는 (이하에서 더욱 상세히 설명되는 바와 같이) 수신된 탐색 질의의 확장시에 유리하게 사용될 수 있다. 상기 예에서, 관련 개체 소스는 "직원", "동문", 및 "정원사"를 포함하는 식별된 인물과 다수의 카테고리들을 연관시켰을 수 있다. 게다가, 관련 개체 소스들의 각각은 카테고리와 연관되어야 하는 것이 무엇인지를 정의하는 카테고리 정보를 유지할 수 있다. 이 카테고리 정보는 (식별된 인물과 같은) 특정 카테고리에 속해 있는 제 1 개체와 다른 개체들 사이에 존재할 수 있는 잠재적이지만 반드시 요구되는 것은 아닌 관계들의 목록을 종종 포함한다. "직원" 카테고리는 "고용주", "워크 그룹", "현재 관리자", "직접적인 보고", "동료" 등을 포함하는 것으로 잠재적 관계들의 세트를 정의할 수 있다. 그에 따라, "직원"으로서 카테고리화되는 각 개체는 그 후에 잠재적 관계들의 세트로 정의되는 바와 같이 다른 개체들과의 관계를 가질 수 있다. 물론, 카테고리가 잠재적 관계들의 세트를 정의하지만, 그 카테고리의 개체는 잠재적 관계 각각 모두에 기초하여 다른 개체들에 관련되도록 요구되지 않는다. 또한, 소정의 개체, 예를 들어 탐색 질의의 식별된 인물에 대응하는 개체는 복수의 카테고리와 연관될 수 있다. 정의된 카테고리들에 부가하여, 카테고리들이 또한 추론될 수 있다. 예컨대, 직원은 회사에서 예전에 수행한 이전의 작업에 관심이 있을 수 있어, 추론되는 카테고리는 "동료"이다.
블록 208에서, 탐색 모델은 확장형 탐색 질의에 적용하도록 식별/결정된다. 이 탐색 모델은 탐색 결과들을 개선하기 위해 확장형 탐색 질의의 다수의 요소들(용어들 및 구절들)에 가중치를 부여하는 정보를 포함한다. 탐색 모델을 확장형 탐색 질의에 적용하는 것은, 적어도 부분적으로, 확장형 탐색 질의의 질의 용어들 전부가 동일하지 않다는 것, 즉 일부 질의 용어들이 식별된 인물에 대한 관련 탐색 콘텐츠를 식별함에 있어서 다른 것들보다 더욱 중요하다는 것을 인식한다. 통상, 배타적으로는 아니지만, 고용 관련 질의 용어들 또는 교육 관련 질의 용어들에 관심을 갖는 것/가중치를 부여하는 것은, 다수의 탐색 결과들(또는, 보다 정확하게 말해서, 탐색 결과들에 의해 참조되는 콘텐츠)의 관련성이 특정 사용자에게 제시될 때에 개선된 탐색 결과들을 제공한다. 다수의 실시예들에 의하면, 탐색 모델의 선택은 요청하는 컴퓨터 사용자에 관한 정보에 기초할 수 있다. 예컨대, 요청하는 컴퓨터 사용자가 학부 내에 있다고 알려지면, 교육 모델이 선택될 수 있다. 이와 달리, 식별된 인물에 관한 정보에 따라, 관련 개체 데이터를 포함한 탐색 엔진(110) 또는 외부 소스들에 이용가능한 정보로부터, 탐색 모델의 선택이 이루어질 수 있다. 또 부가적인 실시예들에서, 탐색 모델의 선택은 요청하는 컴퓨터 사용자뿐만 아니라 탐색 질의의 식별된 인물에 관한 정보에 따라 이루어질 수 있다.
블록 210에서, 확장형 탐색 질의는 식별된 인물에 대한 결정된 탐색 모델에 따라 생성된다. 확장형 탐색 질의를 생성하는 것은 도 3과 관련해서 보다 상세하게 설명된다. 보다 구체적으로, 도 3은 관련 개체 소스들로부터 획득된 관련 개체 데이터에 따라 확장형 탐색 질의를 생성하기 위한 예시적인 루틴(300)을 나타내는 흐름도이다. 블록 302에서, 수신된 탐색 질의의 필터 요소들 및 식별된 인물은 확장형 탐색 질의의 초반부로서 포함된다. 이는 수신된 탐색 질의를 초반부에 단순히 복사하는 것을 수반할 수 있지만, 초반의 탐색 질의는 반드시 단순히 복사되지 않을 수 있다. 종종, 요청하는 컴퓨터 사용자는 찾고자 하는 인물의 이름 또는 그 인물과 연관된 식별하는 필터 요소들 중 임의의 하나의 철자를 잘못 쓸 수 있다. 예컨대, "Microsoft"에서 일하는 "Bruce Wayne"에 대응하는 콘텐츠를 찾기 위해, 수신된 탐색 질의는 "브루스 웨인 마이크로소프트"일 수 있다. 이름(또는 하나 이상의 필터 요소들)의 철자가 잘못 쓰였다고 판정될 수 있으면, 확장형 탐색 질의에 원래의 탐색 질의를 포함시키는 것은 덜 생산적일 것이다. 따라서, 루틴(200)의 블록 204에서, 인물이 식별된다. 필요 요소들에 대한 정정 또한 (루틴들(200, 300)에서 명시적으로 호출되는 것은 아니지만) 이루어질 수 있다.
탐색 질의의 질의 용어들을 확장형 탐색 질의에 포함시키는 것에 부가하여, 질의 용어들은 획득된 관련 개체 데이터로부터 도출되고 확장형 탐색 질의에 포함/통합된다. 특히, 블록 304에서, 획득된 관련 개체 데이터로부터 (식별된 인물에 관한) 관련 개체들은 결정된 탐색 모델에 따라 확장형 탐색 질의의 관련 개체들의 부분에 포함된다. 블록 306에서, 질의 용어들은 (개체와 같은) 카테고리 및 (이하에 설명되는 바와 같은) 카테고리 개체들의 양쪽을 포함하는 카테고리 데이터로부터 도출되고, 탐색 모델에 따라 확장형 탐색 질의의 카테고리 개체들 부분에 포함된다. 이후, 블록 308에서, 확장형 탐색 질의는 복귀도고, 루틴(300)은 종료된다.
확장형 탐색 질의의 상기한 부분들을 보다 잘 설명하기 위해, 도 4를 참조한다. 도 4는 상기 예에 대응하는, 즉 인물 "Bruce Wayne"에 대한 예시적인 확장형 탐색 질의를 나타낸다. 이 예에 있어서, 상기 식별된 인물, "Bruce Wayne"이 단지 하나의 카테고리, Employee와 연관될 수 있다고 가정한다. 확장형 탐색 질의(400)에 도시된 바와 같이, 초반부(402)는 원래의 탐색 질의 텍스트(404)인 "Bruce. Wayne"뿐만 아니라 식별된 인물에 관한 다른 이름, 이 경우에는 "Batman Dark.Knight Matches. Malone Caped.Crusader"를 포함한다. 물론, 컴퓨터 사용자들 전부가 모든 정보로의 액세스 권리를 갖지 못할 것이다. 가능한 예에서, 사람들 전부가 "Bruce Wayne"을 고유하게 참조할 수 있는 다른 이름들을 알 수 있는 것은 아니다. 그러나, 요청하는 컴퓨터 사용자가 전체 권리들을 갖는 경우, 이러한 정보는 개선된 결과들을 획득하는 데 유용할 수 있다. 탐색 질의의 2개의 이름들 사이의 연산자(406) "."과 관련해서, 이는 2개의 이름들, "Bruce" 및 "Wayne"이 함께 발생하거나 또는 양쪽이 발생해야 하는 것이 의무적이진 않지만(단지 하나가 매우 선호됨), "Wayne" 바로 옆에 차례로 발생하는 "Bruce"를 선호하는 것으로 보여져야 함을 표시하기 위한 예시적인 관례를 나타낸다. 물론, 이러한 관례(뿐만 아니라 이 도면에서의 다른 연산자들)는 예시일 뿐이며, 개시되는 청구대상에 제한을 두는 것으로 간주되지 말아야 한다. 다른 구문적 관례들은 (비제한적인 예로서) 괄호들 사이의 단어들/용어들 중 어느 하나가 콘텐츠의 중심부에서 발견되면 문서와 일치해야 하는 것을 탐색 엔진(110)에 표시하는 연산자(408) "inbody:"와; 용어들의 철자가 변경되지 않아야 함을 표시하는 "noalter:" 연산자와; 용어들이 중요해서 일치하는 콘텐츠에 떨어뜨려질 수 없음을 표시하는 "norelax:" 연산자를 포함한다. 연산자(410) "+"는 연속되는 다른 탐색 연산자들 및/또는 토큰들을 탐색 엔진에 표시한다.
확장형 탐색 질의(400)는 텍스트(416) "Research"와 같은 탐색 질의의 식별된 인물에 관련된 개체들을 포함하는 관련 개체 부분(412)을 또한 포함한다. 또한, 확장형 탐색 질의에 포함되는 것은 카테고리 "Employee"의 카테고리 개체들을 포함하는 카테고리 개체들 부분(414)이다. 상기한 바와 같이, 카테고리 개체들 부분(414)은 카테고리("Employee")뿐만 아니라 텍스트(418) "Workgroup"과 같은 카테고리 개체들을 포함한다. 이들 항목들은, "Bruce Wayne"의 경우에, 컴퓨터 사용자가 식별된 인물을 어떻게 알 것 같은지에 기초하여 결과들의 생성을 선택적으로 돕는다. 알 수 있는 바와 같이, 특정 인물에 대한 확장형 탐색 질의는 "Bruce Wyane"과 같은 탐색 질의를 취하고, 식별된 인물에 대응하는 콘텐츠를 보다 잘 식별하기 위해 관련된 개체들뿐만 아니라 카테고리 개체들로 질의를 확장한다. 연산자 "rankonly:"와 관련해서, 일치하는 토큰/값이 "Research"와 같은 문서에서 발견됨에 따라, 이 연산자는 문서의 순위가 올라갈 수 있게 연산한다. 연산자는 특정된 용어들이 결과적인 문서에서 발견될 것을 요구받지 않도록 연산하고, 발견되는 경우, 보다 관련성 있는 것으로 순위화되는 문서를 초래할 것이다. 연산자 "word:"는 "Workgroup"과 같은 괄호들 내의 토큰들 중 하나 이상이 문서에서 발견될 때에 그 문서와 일치하도록 동작한다. 어떤 의미에서, 연산자 "word:"는 괄호들 사이의 각 토큰을 문서와 비교해서 토큰들 순위의 단일 최대값을 복귀시키는 최대화(또는 최대값) 연산자의 형태로 동작한다. 구체적으로, 하나 이상의 토큰이 일치하면, 최대로 일치하는 토큰의 값만이 복귀된다. "norank:" 토큰(미도시)은 특정된 토큰들이 결과 문서에서 필요로 되지만 전반적인 결과에서 문서의 관련성 또는 순서화에 영향을 미치지 못한다. 연산사 "rankonly;"와의 조합에 있어서, 토큰들 중 임의의 하나 이상이 토큰이 발견되면 문서의 순위가 상승된다.
확장형 질의들(400, 500)이 일반적으로 ("Bruce.Wayne"과 같은) 원문(textual) 토큰들을 포함하지만, 이것은 설명을 위한 것이며 개시된 청구대상에 제한을 두는 것으로 간주되지 말아야 함을 이해해야 한다. 다른 실시예들에서, 확장형 탐색 질의에서의 하나 이상의 토큰들은 인기있는 사람 및/또는 관련 개체들을 식별하는 특정 식별자들일 수 있다. 예컨대, 확장형 탐색 질의(500)는 Facebook 숫자 식별자("740049358")를 포함하는 연산자(510)뿐만 아니라 Facebook 사용자 식별자("t-drake")를 포함하는 연산자(512)를 포함한다. 물론, 식별자들의 임의의 특정 소스들이 사용될 수 있고, Facebook 식별자들은 단지 설명을 위한 것이다.
상기에서 제안된 바와 같이, 식별된 인물은 하나 이상의 카테고리와 연관될 수 있다. 따라서, 도 4의 확장형 탐색 질의(400)가 단일의 카테고리로부터의 정보를 기재하지만, 이는 예시를 위한 것이다. 마찬가지로, 도 5는 상기 예에 대응하는, 즉 식별된 인물 "Bruce Wayne"에 대한 예시적인 확장형 탐색 질의(500)를 나타내지만, 이 예에서는 2개의 카테고리 Employer 및 Education을 포함한다. 알 수 있는 바와 같이, 확장형 탐색 질의(500)는 초반부(502)뿐만 아니라 관련 개체들 부분(504) 및 카테고리 개체들 부분(506)을 포함한다. 관련 개체들 부분(504) 및 카테고리 개체들 부분(506)에서 알 수 있는 바와 같이, 식별된 인물을 위해 더욱 관련된 개체들이 발견되고 식별된 인물에 대한 다수의 카테고리에 대응하는 보다 많은 정보가 획득됨에 따라, 확장형 탐색 질의들은 보다 상세해지고, 탐색 질의의 식별된 인물에 대응하는 콘텐츠를 탐색 엔진이 식별하도록 돕는 것을 포함하게 된다.
블록 212에서, 탐색 결과들은 확장형 탐색 질의에 따라 획득된다. 탐색 질의에 따라 탐색 결과들을 획득하면, 이 경우에 관련 개체들 및 카테고리들에 따른 확장형 용어들을 갖는 탐색 질의는 해당 기술분야에서 공지되어 있다. 개시된 청구대상의 측면들에 의하면, 탐색 결과들은 수신된 탐색 질의로부터의 질의 용어들에 따라 획득되고, 선택적으로는 관련 개체 데이터로부터 도출된 질의 용어들에 따라 획득된다. 달리 말하면, 관련 개체 데이터로부터 도출되는 확장형 탐색 질의의 질의 용어들은 식별된 인물에 대응하는 콘텐츠/탐색 결과들의 범위를 확장하도록 의도되지만, 관련 개체 데이터로부터 도출되는 이들 질의 용어들은 의무적인 용어들이 아니다. 이러한 방식(즉, 관련 개체 데이터로부터 도출된 질의 용어들이 "선택적"이라는 방식)으로, 확장형 탐색 질의는, 그 질의 용어들이 선택적이지 않은 경우에 콘텐츠의 범위를 좁히는 것이 아니라, 식별된 인물에 잠재적으로 관련되는 콘텐츠의 범위를 확장한다.
블록 214에서, 획득된 탐색 결과들에 따라 탐색 결과 프리젠테이션이 적어도 부분적으로 생성된다. 통상, 하나 이상의 탐색 결과들 페이지는 획득된 탐색 결과들에 따라 생성되고, 그 결과들은 제시의 제 1 페이지에 가장 높은 점수를 기록한다. 블록 216에서, 탐색 결과 프리젠테이션을 생성한 후에, 제시의 적어도 일부는 탐색 질의에 응답하여 요청하는 컴퓨터 사용자로 되돌려 보내진다. 다수의 실시예들에 의하면, 요청하는 컴퓨터 사용자로 되돌려 보내지는 결과들은 대상의 인물에 관한 정보의 다수의 카테고리들에 따라 조직화된다. 이후에, 루틴(200)은 종료된다.
루틴(200)에서 표시되어 있지 않지만, 결과들이 컴퓨터 사용자로 되돌려 보내진 후에 추가적인 단계들이 취해질 수 있다. 예컨대 비제한적으로, 컴퓨터 사용자의 디바이스 상에서의 하나 이상의 프로세스들은 제공되는 결과들, 예를 들어 어떤 참조(하이퍼링크)가 컴퓨터 사용자 다음에 수행되는지, 어떤 것이 금지되는지, 컴퓨터 사용자가 얼마나 오래 일부 콘텐츠 대 다른 콘텐츠(some content vs. other content)를 소비했는지 등과 관련해서 컴퓨터 사용자의 활동을 감시할 수 있다. 컴퓨터 사용자의 활동을 감시하고 그것을 탐색 엔진에 제출함으로써, 특정 사람 및/또는 개체들과 관련해서 추론들이 이루어질 수 있어, 그 다음 질의들은 이들 추론들을 고려할 수 있다. 실제로, 추론들의 일부 또는 전부는, 특정 결과들 위해서 또한 특정 결과들에 반하여, 상기한 탐색 모델들을 형성하는 데 사용될 수 있다.
루틴들(200, 300)과 관련해서, 이들 루틴들이 별개의 단계들과 관련해서 표현되지만, 이들 단계들은 사실상 논리적인 것으로 간주되어야 하며, 특정 구현의 별개의 단계들 및/또는 임의의 실제 단계들에 대응하거나 대응하지 않을 수 있다. 이들 단계들이 다수의 루틴들에서 제시되는 순서는 단계들이 수행될 수 있는 순서만으로 간주되지 말아야 한다. 게다가, 이들 루틴들은 개시된 청구대상의 다수의 새로운 특징들을 포함하는 반면에, 다른 단계들(열거되지 않음)은 루틴들의 실행시에 수행되지 않을 수도 있다. 또한, 당업자는 이들 루틴들의 논리적 단계들이 함께 조합되거나 혹은 다수의 단계들로 이루어질 수 있음을 이해해야 할 것이다. 루틴들(200, 300)의 단계들은 병렬로 또는 직렬로 수행될 수 있거나 혹은 사전 컴퓨팅될 수 있다. 종종, 배타적으로는 아니지만, 다수의 루틴들의 기능은 도 6과 관련해서 이하에서 설명되는 바와 같이 컴퓨터 하드웨어 및/또는 시스템 상에서 실행되는 소프트웨어(예를 들어, 애플리케이션, 시스템 서비스, 라이브러리 등)로 구현된다. 다수의 실시예들에서, 다수의 루틴들의 전부 또는 일부는 컴퓨터 시스템 상에서 SoC를 포함한 하드웨어 모듈들로 구현될 수도 있다.
개시된 청구대상의 다수의 새로운 측면들이 애플리케이션들(컴퓨터 프로그램들로도 불림), 앱들(일반적으로 단일 또는 협소 목적의 소형 애플리케이션들), 및/또는 방법들로 구현되는 루틴들로 표현되지만, 이들 측면들은, 컴퓨터 판독가능 저장 매체로도 불리는 컴퓨터 판독가능 매체에 의해 저장된 컴퓨터 실행가능 인스트럭션으로서 구현될 수도 있다. 당업자가 인지하는 바와 같이, 컴퓨터 판독가능 매체는 추후의 검색 및 실행을 위한 컴퓨터 실행가능 인스트럭션을 호스팅할 수 있다. 컴퓨터 판독가능 저장 디바이스들에 저장된 컴퓨터 실행가능 인스트럭션이 실행되면, 디바이스들은 루틴들(200, 300)과 관련해서 상기한 그 단계들, 방법들, 및 루틴들을 포함해서, 다수의 단계들, 방법들 및/또는 기능을 수행한다. 컴퓨터 판독가능 매체의 예들로는 블루레이 디스크, DVD, CD, 광 디스크 카트리지 등과 같은 광 저장 매체와; RAM, ROM, 메모리 카드, 썸 드라이브 등과 같은 메모리 저장 디바이스와; 클라우드 스토리지(즉, 온라인 저장 서비스) 등을 포함하지만 이로 제한되지 않는다. 그러나, 본 명세서의 목적을 위해, 컴퓨터 판독가능 매체는 반송파 및 전파 신호를 명시적으로 제외한다.
이제 도 6으로 가면, 도 6은 컴퓨터 사용자로부터의 탐색 질의에 응답하여 개선된 결과들을 제공하도록 구성된 탐색 엔진의 예시적인 구성요소들을 나타내는 블록도이다. 도 6에 도시된 바와 같이, 탐색 엔진(110)은 시스템 버스(610)를 이용해서 상호 연결된 메모리(604) 및 프로세서(602)(또는 프로세싱 유닛)를 포함한다. 당업자가 이해하는 바와 같이, 메모리(604)는 (항상은 아니지만) 일반적으로 휘발성 메모리(606) 및 비휘발성 메모리(608)의 양쪽을 포함한다. 휘발성 메모리(606)는 메모리에 전력이 공급되는 한 정보를 보유 또는 저장한다. 반대로, 비휘발성 메모리(608)는 전력 공급이 이용불가능한 때에도 정보를 저장(또는 지속)할 수 있다. 일반적으로 말하면, RAM 및 CPU 캐시 메모리는 휘발성 메모리의 예들인 반면에 ROM 및 메모리 카드는 비휘발성 메모리의 예들이다.
프로세서(602)는 다수의 기능들을 수행함에 있어서, 구체적으로 질의 확장을 통해 개선된 결과들을 갖는 질의들을 탐색하는 것에 응답함에 있어서, 메모리(604)로부터 검색된 인스트럭션을 실행한다. 프로세서(602)는 단일 프로세서, 다중 프로세서, 단일 코어 유닛들, 및 다중 코어 유닛들과 같은 상업적으로 이용가능한 다수의 프로세서들 중 임의의 것으로 구성될 수 있다. 게다가, 개시된 청구대상의 새로운 측면들이 미니 컴퓨터와; 메인프레임 컴퓨터, 퍼스널 컴퓨터(예를 들어, 데스크탑 컴퓨터, 랩탑 컴퓨터, 태블릿 컴퓨터 등)와; 스마트폰, PDA 등과 같은 핸드헬드 컴퓨팅 디바이스와, 마이크로프로세서 기반 또는 프로그래밍가능한 가전 제품과; 게임 콘솔 등을 포함하지만 이로 제한되지 않는 다른 컴퓨터 시스템 구성으로 실시될 수 있다는 것을 당업자는 이해할 것이다.
시스템 버스(610)는 상호 통신을 위해 다수의 구성요소들을 인터페이스에 제공한다. 시스템 버스(610)는 다수의 구성요소들(내부 구성요소 및 외부 구성요소의 양쪽을 포함함)을 상호 연결할 수 있는 다수 형태의 버스 구조들 중 임의의 하나 일 수 있다. 탐색 엔진(110)은 다른 컴퓨터들(사용자 컴퓨터들(102-106)과 사용자 컴퓨터들, 네트워크 사이트들(112-116)을 포함하는 다른 네트워크 사이트들을 포함하지만 이로 제한되지 않음)뿐만 아니라 컴퓨터 네트워크(108) 상의 다른 디바이스들과 네트워크 사이트를 상호 연결하기 위한 네트워크 통신 구성요소(612)를 더 포함한다. 네트워크 통신 구성요소(612)는 유선 접속, 무선 접속, 또는 그 양쪽을 통해 네트워크(108)와 같은 외부 네트워크 상의 다른 디바이스들 및 서비스들과 통신하도록 구성될 수 있다.
또한, 탐색 엔진(110)은 상기한 바와 같이 탐색 질의의 대상, 예를 들어 탐색 질의에서 식별된 인물의 식별을 획득하도록 구성되는 질의 주제 식별 구성요소(614)를 포함한다. 탐색 엔진(110)에 또한 포함되는 것은 관련 개체 검색 구성요소(616)이다. 관련 개체 검색 구성요소(616)는 식별된 인물의 관련 개체들(또는, 보다 일반적으로는, 탐색 질의의 대상의 관련 개체들)에 대응하는 관련 개체 데이터를 획득한다. 앞서 언급한 바와 같이, 관련 개체 데이터는 관련 개체들, 식별된 인물과 연관된 카테고리들뿐만 아니라 연관된 카테고리들에 대응하는 카테고리 데이터를 포함한다. 관련 개체 검색 구성요소(616)는 도 2와 관련해서 상기한 바와 같이 관련 개체 소스들로부터 관련 개체 데이터를 획득한다. 확장형 질의 생성기(618)는 관련 개체 검색 구성요소(616)에 의해 획득된 관련 개체 데이터에 따라 컴퓨터 사용자로부터 수신된 탐색 질의로부터 확장형 탐색 질의를 생성한다.
탐색 결과 검색 구성요소는 확장형 질의 구성요소(618)에 의해 생성된 확장형 탐색 질의에 따라 콘텐츠 스토어(626)로부터 탐색 결과들을 획득하도록 구성된다. 탐색 모델 구성요소(624)는 (상기한 바와 같은) 탐색 모델을 선택하고, 그 탐색 모델을 획득된 탐색 결과들에 적용하도록 구성된다. 탐색 결과 프리젠테이션 생성기(620)는 탐색 질의에 응답하여 요청하는 컴퓨터 사용자로의 제시를 위해 통상 하나 이상의 탐색 결과 페이지들을 포함하는 탐색 결과 프리젠테이션을 생성한다.
상기한 도 6의 탐색 엔진(110)의 다수의 구성요소들이 컴퓨터 시스템들 내의 실행가능한 소프트웨어 모듈들, 하드웨어 모듈들(SoC를 포함함), 또는 2개의 조합으로서 구현될 수 있다는 것을 당업자는 이해할 것이다. 게다가, 다수의 구성요소들 각각은 하나 이상의 컴퓨터 시스템들과 함께 독립적이면서 협력적인 프로세스 또는 디바이스로서 구현될 수 있다. 물론, 탐색 엔진(110)과 관련해서 상기한 다수의 구성요소들이 다수의 기재된 기능들을 수행하기 위한 논리적 구성요소들로서 간주되어야 한다는 것을 또한 이해해야 한다. 당업자가 이해하는 바와 같이, 논리적 구성요소들(또는 서브시스템들)은 실제 별개의 구성요소들에 대해 일대일 방식으로 직접적으로 대응하거나 대응하지 않을 수 있다. 실제 실시예에서, 각 컴퓨터 시스템의 다수의 구성요소들은 다수의 실제 구성요소들 전체에 걸쳐 함께 조합되거나 분해될 수 있으며, 및/또는 컴퓨터 네트워크(108) 상의 협력적 프로세스들로서 구현될 수 있다.
탐색 엔진(110) 상에서의 동작에 부가하여, 개시된 청구대상의 측면들은 다른 컴퓨팅 디바이스들에서 구현될 수 있고, 및/또는 컴퓨터 사용자의 디바이스를 포함한 다수의 컴퓨팅 디바이스들에 분배될 수 있다. 예컨대, 다수의 실시예들에 의하면, 탐색 요청에 매우 관련성 있는 적어도 일부의 콘텐츠는 액세스 보호되는 사이트 상에서 호스팅될 수 있고, 즉 그/그녀가 인증되고 및/또는 사이트와의 오픈 로그인 상태(an open log-in status)를 유지할 때에 컴퓨터 사용자에게 콘텐츠가 이용가능하지만, 이와 달리 다른 사람들에 대해서는 콘텐츠가 제한된다. 컴퓨터 사용자로부터의 탐색 요청에 응답하여, 탐색 엔진(또는 다른 서비스)는 컴퓨터 사용자의 디바이스를 이용하여 상기 액세스 제한된 사이트로부터 관련 개체 데이터를 간접적으로 획득할 수 있고; (예를 들어, 컴퓨터 사용자가 사이트와의 현재 로그인된 상태를 유지하는) 상기 컴퓨터 사용자의 디바이스는 탐색 엔진을 대신하여 관련 개체 데이터에 액세스한다. 실제로, 다수의 실시예들에서, 컴퓨터 사용자의 디바이스에서의 하나 이상의 구성요소들은 탐색 요청을 예상하고 액세스 제한된 사이트들로부터 다른 것들에 대응하는 데이터를 획득한다.
개시된 청구대상의 대부분이 특정 사람에 관한 콘텐츠를 획득함에 있어서 적극적인 역할을 취하는 컴퓨터 사용자와 관련해서 이루어졌지만, 개시된 청구대상의 측면들은 사람들에 관한 콘텐트의 자동 생성에 적절하고 유리하게 적용될 수 있다. 예컨대, 하나 이상의 사람들에 관한 다수의 탐색 질의들(확장형 탐색 질의들)이 이루어질 수 있어, 그 사람(또는 사람들)에 관한 인터넷 상에서의 "최근" 콘텐츠가 요청시에 빨리 이용될 수 있다. 또 다른 예는, 사용자가 인터넷 상에 그 사용자의 새로운 이미지/비디오/보도 기사가 발생하는 때를 통지받을 수 있도록 환경을 설정하는 것이다. 물론, 개시된 청구대상의 측면들은 사람들 이외에 화제들 또는 개체들에 적용될 수 있다. 예컨대, 자동 생성 페이지는 최신의 관련 암벽 등반, 대법원 등을 표시하도록 설정될 수 있다.
개시된 청구대상의 다수의 새로운 측면들이 설명되었지만, 이들 측면들은 예시이며 제한적인 것으로 간주되지 말아야 함을 이해해야 한다. 다수의 측면들에 대한 변형 및 변경은 개시된 청구대상의 범위에서 벗어나지 않고서 이루어질 수 있다.

Claims (10)

  1. 탐색 질의에 응답하기 위한 컴퓨터-구현 방법으로서,
    탐색 질의를 수신하는 단계 - 상기 탐색 질의는 찾고자 하는 콘텐츠와 관련된 인물을 식별함 - 와,
    관련 개체 소스로부터 관련 개체 데이터를 획득하는 단계 - 상기 관련 개체 데이터는 상기 탐색 질의의 식별된 인물과 연관된 카테고리 또는 관련 개체 중 적어도 하나를 포함함 - 와,
    상기 수신된 탐색 질의 및 상기 관련 개체 데이터에 기초하여 확장형 탐색 질의(expanded search query)를 생성하는 단계와,
    상기 확장형 탐색 질의에 따라 탐색 결과들을 획득하는 단계와,
    상기 획득된 탐색 결과들에 따라 탐색 결과 프리젠테이션(a search results presentation)을 생성하는 단계와,
    상기 탐색 질의에 응답하여 상기 탐색 결과 프리젠테이션을 반환하는 단계를 포함하는
    컴퓨터-구현 방법.
  2. 제 1 항에 있어서,
    상기 확장형 탐색 질의를 생성하는 단계는, 상기 관련 개체 데이터로부터 도출된 질의 용어들을 상기 수신된 탐색 질의의 질의 용어들과 통합하는 단계를 포함하고,
    상기 확장형 탐색 질의에 따라 탐색 결과들을 획득하는 단계는, 상기 수신된 탐색 질의의 질의 용어들에 따라 또한 선택적으로는 상기 관련 개체 데이터로부터 도출된 상기 질의 용어들에 따라 탐색 결과들을 획득하는 단계를 포함하는
    컴퓨터-구현 방법.
  3. 제 2 항에 있어서,
    상기 식별된 인물과 연관된 상기 카테고리는 상기 관련 개체 데이터로부터 도출된 질의 용어로서 상기 확장형 탐색 질의에 포함되는
    컴퓨터-구현 방법.
  4. 제 3 항에 있어서,
    상기 관련 개체 데이터는 상기 식별된 인물과 연관된 복수의 카테고리를 포함하는
    컴퓨터-구현 방법.
  5. 제 4 항에 있어서,
    상기 관련 개체 데이터는 상기 관련 개체 데이터에서의 각 카테고리에 대응하는 카테고리 데이터를 포함하고, 상기 카테고리 데이터는 질의 용어들로서 상기 확장형 탐색 질의에 통합되는 하나 이상의 카테고리 개체를 포함하는
    컴퓨터-구현 방법.
  6. 제 2 항에 있어서,
    복수의 탐색 모델들로부터 하나의 탐색 모델을 선택하는 단계와, 상기 선택된 탐색 모델을 상기 확장형 탐색 질의의 생성에 적용하는 단계를 더 포함하고,
    상기 복수의 탐색 모델로부터 하나의 탐색 모델을 선택하는 단계는,
    요청하는 컴퓨터 사용자에 대응하는 정보에 따라 탐색 모델을 선택하는 단계와,
    상기 식별된 인물에 대응하는 정보에 따라 탐색 모델을 선택하는 단계 중 하나 이상의 단계를 포함하는
    컴퓨터-구현 방법.
  7. 컴퓨터 실행가능 인스트럭션을 포함하는 컴퓨터 판독가능 매체로서,
    상기 컴퓨터 실행가능 인스트럭션은, 상기 컴퓨터 판독가능 매체로로부터 검색된 상기 컴퓨터 실행가능 인스트럭션을 실행하는 프로세서를 적어도 포함하는 컴퓨팅 시스템에서의 실행시에, 청구항 1 내지 6과 관련하여 제시된 방법들 중 임의의 방법을 수행하는
    컴퓨터 판독가능 매체.
  8. 인물에 관련된 콘텐츠에 대한 탐색 질의에 응답하는 컴퓨터 시스템으로서,
    상기 시스템은 프로세서 및 메모리를 포함하고,
    상기 프로세서는 인물에 관련된 콘텐츠에 대한 탐색 질의에 응답하도록 부가적인 구성요소들과 협력하여 또는 그 일부로서 상기 메모리에 저장되는 인스트럭션을 실행하고,
    상기 부가적인 구성요소들은,
    상기 탐색 질의로부터 찾고자 하는 콘텐츠와 관련된 인물에 대한 신원을 판정하도록 구성되는 질의 주제 식별 구성요소와,
    상기 신원이 판정된 인물에 대응하는 관련 개체 데이터를 관련 개체 소스로부터 획득하는 관련 개체 검색 구성요소와,
    상기 신원이 판정된 인물에 관한 콘텐츠에 대한 상기 탐색 질의로부터 또한 상기 관련 개체 데이터로부터 확장형 질의를 생성하는 확장형 질의 생성기 - 상기 관련 개체 데이터는 상기 탐색 질의의 상기 신원이 판정된 인물과 연관된 카테고리 또는 관련 개체 중 적어도 하나를 포함함 - 와,
    콘텐츠 스토어로부터 탐색 결과들을 획득하도록 구성된 탐색 결과 검색 구성요소 - 상기 탐색 결과들은, 상기 확장형 탐색 질의에 따라, 상기 신원이 판정된 인물에 대응하는 콘텐츠를 참조함 - 와,
    상기 신원이 판정된 인물에 대응하는 콘텐츠를 참조하는 상기 탐색 결과들에 따라 탐색 결과 프리젠테이션을 생성하고, 상기 탐색 결과 프리젠테이션을 컴퓨터 사용자에게 반환하도록 구성된 탐색 결과 프리젠테이션 생성기를 포함하는
    컴퓨터 시스템.
  9. 제 8 항에 있어서,
    상기 탐색 결과 검색 구성요소는 상기 수신된 탐색 질의의 질의 용어들에 따라 또한 선택적으로는 상기 관련 개체 데이터로부터의 상기 확장형 탐색 질의에 통합되는 상기 질의 용어들에 따라 탐색 결과들을 획득함으로써 상기 확장형 탐색 질의에 따라 상기 신원이 판정된 인물에 대응하는 탐색 결과들을 획득하는
    컴퓨터 시스템.
  10. 제 8 항에 있어서,
    복수의 탐색 모델로부터 하나의 탐색 모델을 선택하고, 상기 하나의 탐색 모델에 따라 상기 관련 개체 데이터로부터의 상기 탐색 질의로부터 확장형 질의를 생성하기 위해 상기 확장형 질의 생성기에 상기 하나의 탐색 모델을 제공하도록 구성된 탐색 모델 구성요소를 더 포함하고,
    상기 확장형 질의 생성기는 상기 하나의 탐색 모델에 따라 확장형 질의를 생성하고,
    상기 탐색 결과 프리젠테이션 생성기는 상기 하나의 탐색 모델에 따라 상기 탐색 결과 프리젠테이션을 생성하는
    컴퓨터 시스템.
KR1020157036770A 2013-06-29 2014-06-24 개체 확장을 이용한 인물 탐색 기법 KR20160026907A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/931,922 2013-06-29
US13/931,922 US20150006520A1 (en) 2013-06-10 2013-06-29 Person Search Utilizing Entity Expansion
PCT/US2014/043750 WO2014209925A1 (en) 2013-06-29 2014-06-24 Person search utilizing entity expansion

Publications (1)

Publication Number Publication Date
KR20160026907A true KR20160026907A (ko) 2016-03-09

Family

ID=51210813

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157036770A KR20160026907A (ko) 2013-06-29 2014-06-24 개체 확장을 이용한 인물 탐색 기법

Country Status (4)

Country Link
EP (1) EP3014486A1 (ko)
KR (1) KR20160026907A (ko)
CN (1) CN105493082A (ko)
WO (1) WO2014209925A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180027278A (ko) * 2016-09-06 2018-03-14 주식회사 카카오 검색 방법 및 장치

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10423652B2 (en) * 2016-08-08 2019-09-24 Baidu Usa Llc Knowledge graph entity reconciler
US10467229B2 (en) * 2016-09-30 2019-11-05 Microsoft Technology Licensing, Llc. Query-time analytics on graph queries spanning subgraphs
US10482096B2 (en) * 2017-02-13 2019-11-19 Microsoft Technology Licensing, Llc Distributed index searching in computing systems
US10242223B2 (en) 2017-02-27 2019-03-26 Microsoft Technology Licensing, Llc Access controlled graph query spanning
US11132408B2 (en) * 2018-01-08 2021-09-28 International Business Machines Corporation Knowledge-graph based question correction
US11288320B2 (en) * 2019-06-05 2022-03-29 International Business Machines Corporation Methods and systems for providing suggestions to complete query sessions
CN113297452A (zh) * 2020-05-26 2021-08-24 阿里巴巴集团控股有限公司 多级检索方法、多级检索装置及电子设备
CN113111647B (zh) * 2021-04-06 2022-09-06 北京字跳网络技术有限公司 信息的处理方法、装置、终端和存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011053755A1 (en) * 2009-10-30 2011-05-05 Evri, Inc. Improving keyword-based search engine results using enhanced query strategies
CN102902806B (zh) * 2012-10-17 2016-02-10 深圳市宜搜科技发展有限公司 一种利用搜索引擎进行查询扩展的方法及系统
CN102955697B (zh) * 2012-11-08 2016-01-20 沈阳建筑大学 基于面向方面的构件库构建方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180027278A (ko) * 2016-09-06 2018-03-14 주식회사 카카오 검색 방법 및 장치
US11080323B2 (en) 2016-09-06 2021-08-03 Kakao Enterprise Corp Search method and apparatus

Also Published As

Publication number Publication date
WO2014209925A1 (en) 2014-12-31
EP3014486A1 (en) 2016-05-04
CN105493082A (zh) 2016-04-13

Similar Documents

Publication Publication Date Title
US20150006520A1 (en) Person Search Utilizing Entity Expansion
US20150095319A1 (en) Query Expansion, Filtering and Ranking for Improved Semantic Search Results Utilizing Knowledge Graphs
KR20160026907A (ko) 개체 확장을 이용한 인물 탐색 기법
JP5230751B2 (ja) 社会的行動分析及び語彙分類を用いた推奨システム
US9529910B2 (en) Systems and methods for an expert-informed information acquisition engine utilizing an adaptive torrent-based heterogeneous network solution
US10102482B2 (en) Factorized models
US9740881B2 (en) Defense against search engine tracking
US20110225139A1 (en) User role based customizable semantic search
US10606874B2 (en) Adjusting search results based on user skill and category information
US9135357B2 (en) Using scenario-related information to customize user experiences
US20190102397A1 (en) Methods and systems for client side search ranking improvements
US11687794B2 (en) User-centric artificial intelligence knowledge base
US10685073B1 (en) Selecting textual representations for entity attribute values
US20190310888A1 (en) Allocating Resources in Response to Estimated Completion Times for Requests
US10885132B2 (en) System and method for web search obfuscation using emulated user profiles
US7797311B2 (en) Organizing scenario-related information and controlling access thereto
US9465875B2 (en) Searching based on an identifier of a searcher
US8583682B2 (en) Peer-to-peer web search using tagged resources
US10740418B2 (en) System and method for monitoring user searches to obfuscate web searches by using emulated user profiles
US20210105261A1 (en) User authentication based on cognitive profiling
EP2973015A2 (en) Searching using social filters as operators
JP2005266964A (ja) 業務対応型エージェントプログラム、業務対応型情報検索支援方法、及び業務対応型情報検索支援装置
D'Ulizia et al. A similarity assessment method for discovering and adapting business services
CN112052314A (zh) 用于提供建议以完成查询的方法和系统

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid