KR101027999B1 - 사용자 로그로부터의 검색 카테고리 유의어 추론 - Google Patents
사용자 로그로부터의 검색 카테고리 유의어 추론 Download PDFInfo
- Publication number
- KR101027999B1 KR101027999B1 KR1020087015058A KR20087015058A KR101027999B1 KR 101027999 B1 KR101027999 B1 KR 101027999B1 KR 1020087015058 A KR1020087015058 A KR 1020087015058A KR 20087015058 A KR20087015058 A KR 20087015058A KR 101027999 B1 KR101027999 B1 KR 101027999B1
- Authority
- KR
- South Korea
- Prior art keywords
- query
- category
- previous
- search
- result
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/40—Data acquisition and logging
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99932—Access augmentation or optimizing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
이전의 결과 데이터로부터 카테고리 유의어를 추론하는 방법 및 시스템은, 이전의 결과 데이터와 관련된 카테고리 정보 및 질의 정보를 포함하는 이전의 질의 데이터를 식별하는 단계; 상기 질의 정보가 상기 카테고리 정보의 유의어인지를 판정하는 단계; 및 상기 질의 정보가 상기 카테고리 정보의 유의어인 것으로 판정된 경우에, 상기 질의 정보 및 상기 카테고리 정보를 다음의 검색 요청에 사용하는 단계를 포함한다.
Description
본 발명의 원리와 일치하는 실시예들은 일반적으로 질의 처리에 관한 것이며, 더욱 구체적으로는 검색 질의 정제(search query refinement)에 관한 것이다.
인터넷의 역사는 1960년대 후반으로 거슬러 올라가지만, 개인 컴퓨팅(personal computing) 및 인터네트워킹(internetworking)의 광범위한 유용성 및 수용은 정보 공유 기술의 폭발적인 성장 및 전례가 없는 진보에 기인한 것이었다. 특히, 월드와이드웹(World Wide Web, 이하 "웹(web)"이라 한다)은 전세계 사용자(world audience)에게 있어 문자 정보(written information), 구두(음성) 정보(spoken information) 및 시각(이미지 및 비디오) 정보를 포함하는, 전자적인 형태로 저장된 막대한 양의 정보에 대한 접근성(accessibility)에 대변혁을 일으켰다. 요컨대, 웹은 전세계 거의 모든 언어로 된 사실상 무제한적인 정보 라이브러리(library)에 연결된 모든 사용자에 대한 액세스를, 데스크톱 컴퓨터에 제공하였다.
검색 엔진은, 사용자가 관련 웹 컨텐츠를 효율적이고 적시에 발견 및 검색할 수 있도록 웹의 사용 증가와 같은 속도로 진화해왔다. 웹 컨텐츠의 타입 및 양이 증가함에 따라, 검색 엔진의 정교화(sophistication) 및 정확도도 마찬가지로 향상되었다. 일반적으로, 검색 엔진은 검색 질의에 대한 응답으로 최고 품질의 결과를 제공하려고 힘쓴다. 하지만, 검색된 웹 컨텐츠의 관련성(relevance)이 본래 주관적이고 사용자의 관심, 지식 및 태도에 의존적이기 때문에, 품질을 판정하는 것은 어렵다.
검색 엔진에 의해 사용되는 기존의 방법은 검색 질의 용어들과 웹 페이지로부터의 색인화된 용어들의 대조에 기초한다. 좀 더 진보된 방법은, 예를 들어 하이퍼링크 구조 기반 분석법(hyperlink structure-based analysis)을 이용하여 검색된 웹 컨텐츠의 중요도(importance)를 결정한다.
전형적인 검색 질의 시나리오는, 검색 엔진에 제출되는 흔히 키워드 형태인 자연어 질문 또는 개개의 용어 중 어느 것에서 시작한다. 검색 엔진은 잠재적으로 검색 가능한 웹 컨텐츠의 정보 특징을 기술하는 데이터 저장소에 대해 검색을 수행하고, 후보 웹 페이지를 식별한다. 검색은 흔히 수천 또는 심지어 수백만 개의 결과를 회신하므로, 대부분의 검색 엔진은 전형적으로 가장 유망한 결과의 서브세트에만 순위(rank) 또는 스코어(score)를 부여한다. 그 후, 최상위 웹 페이지가 웹 페이지로부터 취득한 스니핏(snippet)과 같이, 대개 웹 컨텐츠 타이틀, 하이퍼링크, 및 다른 설명적인 정보의 형태로 사용자에게 제공된다. 양질의 검색 결과를 제공하는 것은, 검색 질의 자체의 융통성 없고 함축적인 범위(literal and implicit scope)에 의해 복잡해질 수 있다. 구조가 취약한(poorly framed) 검색 질의는, 민감하게 반응하는(reponsive) 고품질의 검색 결과를 얻기에는 모호하거나 너무 개괄적이거나 또는 너무 구체적일 수 있다. 예를 들어, 검색 질의 내의 용어는 구문(syntactic) 또는 의미(semantic) 레벨에 있어 모호할 수 있다. 구문상의 모호성(syntactic ambiguity)은 동일한 발음 및 어쩌면 동일한 철자를 갖지만 그 단어의 실제 의미와는 상이한 의미를 갖는 부정확한 단어를 나타내는 우연한 동음 이의어(homonym)에 기인한 것일 수 있다. 예를 들어, 단어 "bear"는 동물 또는 옷을 입지 않은 상태를 의미하거나 가리킬 수 있다. 의미상의 모호성(semantic ambiguity)은 부적절한 문맥에 기인한 것일 수 있다. 예를 들어, 단어 "jaguar"는 동물, 매킨토시(Macintosh) 운영체제의 버전, 또는 자동차의 브랜드를 가리킬 수 있다. 마찬가지로, 너무 개괄적인 검색 용어는 지나치게 넓은 결과를 얻는 한편, 너무 좁은 검색 용어는 과도하게 제한적이고 민감하게 반응하지 않는(non-responsive) 응답 결과를 얻는다.
따라서, 구조가 부적절한 검색 질의로 인한 모호성 또는 과도한 보편성(generality) 또는 과도한 구체성을 해결할, 검색 질의 정제를 위한 제안을 제공하는 접근법이 필요하다. 바람직하게는, 이러한 접근법은, 적용(issue)되면, 원래의 검색 질의의 의도에 기초를 이루는 실제 주제(topic)와 밀접하게 관련된 검색 결과를 얻는 정제된 검색 질의를 제공하고, 개념적 독립성 및 분명한 의미를 반영하는 제안을 가능한 검색 용어로서 제공할 것이다.
본 발명의 원리와 일치하는 일 실시예에 따른 방법은, 이전의 결과 데이터와 관련된 카테고리 정보 및 질의 정보를 적어도 포함하는 이전의 질의 데이터를 식별하는 단계; 상기 질의 정보가 상기 카테고리 정보의 유의어인지를 판정하는 단계; 및 상기 질의 정보가 상기 카테고리 정보의 유의어인 것으로 판정된 경우에, 상기 질의 정보 및 상기 카테고리 정보를 다음의 검색 요청에 사용하는 단계를 포함할 수 있다.
본 발명의 원리와 일치하는 다른 실시예에 따른 시스템은, 이전의 검색 결과 내에 포함된 질의 데이터와 카테고리 데이터가 카테고리 유의어인지를 판정하기 위한 수단; 및 상기 질의 데이터와 상기 카테고리 데이터가 카테고리 유의어인 것으로 판정된 경우에, 상기 질의 데이터를 상기 카테고리 데이터와 연관된 다음의 검색 요청에 통합하기 위한 수단을 포함할 수 있다.
본 발명의 원리와 일치하는 또 다른 실시예에 따른 디바이스는, 이전의 검색 요청과 연관된 하나 이상의 질의, 카테고리 쌍을 포함하는 이력 로그 데이터(historical log data)를 식별하기 위한 로직(logic); 상기 질의, 카테고리 쌍 내의 상기 질의가 명칭 질의인지 카테고리 질의인지를 판정하기 위한 로직; 및 상기 질의가 카테고리 질의인 것으로 판정된 경우에, 상기 질의가 상기 카테고리의 유의어인지를 판정하기 위한 로직을 포함할 수 있다.
본 발명의 원리와 일치하는 또 다른 실시예에 따른 방법은, 클라이언트로부터 검색 질의를 수신하는 단계; 상기 수신된 검색 질의에 기초하여 결과 카테고리를 식별하는 단계; 상기 식별된 결과 카테고리에 대한 카테고리 유의어를 식별하는 단계; 및 상기 결과 카테고리 및 상기 식별된 카테고리 유의어에 기초하여 결과 검색을 수행하는 단계를 포함할 수 있다.
본 명세서의 포함되어 본 명세서의 일부를 구성하는 첨부도면은 본 발명의 실시예를 나타내며, 상세한 설명과 함께 본 발명을 설명한다.
도 1은 본 발명의 원리와 일치하는 개념을 설명하는 예시적인 도면이다.
도 2는 본 발명의 원리와 일치하는 시스템 및 방법이 구현될 수 있는 네트워크의 예시적인 도면이다.
도 3은 본 발명의 원리와 일치하는 실시예에 따른, 도 2의 클라이언트 또는 서버의 예시적인 도면이다.
도 4는, 도 2 및 도 3에서 사용될 수 있는, 예시적인 컴퓨터로 판독 가능한 매체의 일부를 나타낸 도면이다.
도 5는 본 발명의 원리와 일치하는 실시예에서 유의어를 식별하기 위한 예시적인 프로세스의 흐름도이다.
도 6은 본 발명의 원리와 일치하는 일 실시예에서, 제한 요소(containment)와 등가 요소(equivalency)의 질의, 카테고리 쌍들을 구별하기 위한 예시적인 프로세스의 흐름도이다.
도 7은 본 발명의 원리에 따른 사용자에 의해 개시된 사용자 개시 검색(user initiated search)을 수행하기 위한 예시적인 프로세스를 나타낸 흐름도이다.
이하, 첨부도면을 참조하여 본 발명의 원리와 일치하는 실시예들에 대해 상세하게 설명한다. 상이한 도면들에서의 동일한 도면부호는 동일 또는 유사한 구성 요소로 취급할 수 있다. 또한 이하의 상세한 설명은 본 발명을 한정하는 것은 아니다.
개요
검색 엔진을 통해 검색 가능하게 되는 문서의 양은 실질적으로 증가하고 있다. 따라서, 관련 문서를 발견하기 위해 제출될 수 있는 검색 질의는, 잠재적인 모호성 또는 보편성에 더욱 쉽게 영향을 받을 수 있다. 최초의 질의 결함을 제거할 수 있거나, 추가의 관련 문서를 식별하기 위해 최초의 검색 질의를 확장할 수 있는, 검색 질의 정제를 식별하여 제공하는 것이 바람직하다. 여기서 설명하는 바와 같이, 검색 질의 정제는, 사용자가 더욱 신속하고 더욱 정확하게 바람직한 검색 결과를 식별하도록 보조하기 위해 자동으로 생성될 수 있다. 더욱 구체적으로는, 검색 가능한 정보는 각종의 미리 정해진 카테고리에 할당되거나 분류될 수 있다. 예를 들어, "Joe's Bar and Grill"에 대한 리스팅(listing)은 "bars(바)"와 "taverns(술집)" 양쪽 카테고리에 할당될 수 있다. 본 발명의 원리에 따르면, 이전의 결과 데이터 내에서 카테고리 유의어를 식별할 수 있으므로, 검색 가능한 정보의 향상된 검색이 가능해진다. 식별된 카테고리 유의어는 그 후 요청된 검색을 수행할 때 미리 정해진 카테고리와 함께 사용될 수 있다.
도 1은 본 발명의 원리와 일치하는 개념을 설명하는 예시적인 도면이다. 도 1 (A)에 나타낸 바와 같이, 사용자는 웹 브라우저를 사용하여, 웹 페이지(100)와 같은 웹 문서를 액세스할 수 있다. 도 1 (A)에 나타낸 바와 같이, 웹 브라우저는 사용자로부터 최초의 검색 질의를 수신하기 위한 검색 질의 입력 상자(102)를 포함 할 수 있다. 예시적인 실시예에서, 검색 질의 입력 상자(102)는, 아마도 버지니아주, 페어팩스 소재의 변호사에 관한 정보를 요청하는, "attorney Fairfax, VA"와 같은 구(phrase)를 포함할 수 있다.
본 발명의 원리에 따르면, 입력된 질의를 제출함으로써, 도 1 (B)에 나타낸 바와 같이, 제출된 질의뿐 아니라 질의 용어들에 대해 식별된 카테고리 유의어에 기초한 웹 문서를 결과로서 얻을 수 있다. 예시적인 실시예에서, 결과는 수정된 질의: (attorney OR attorneys OR lawyer OR lawyers) AND "Fairfax, VA"에 기초하여 디스플레이될 수 있다. 이하에 더욱 상세하게 설명하는 바와 같이, 검색 질의에 적용된 식별된 카테고리에 대한 유의어는, 제공되는 검색 결과를 취득할 때 식별되어 사용될 수 있다. 더욱 구체적으로는, 수신된 질의에 대한 다음의 검색은, 질의 용어, 최초에 식별된 카테고리뿐 아니라 이전의 good(우수) 검색 결과에 기초하여 그 후에 식별된 카테고리 유의어를 사용하여 수행될 수 있다. 이와 같이, 검색 결과에 대해 향상된 정확도 및 기능성을 얻을 수 있다.
"문서(document)"라는 용어는 여기에서 사용되는 경우, 임의의 기계로 판독 가능하고(machine_readable) 기계에 저장 가능한 작업 결과물(machine-storable work product)을 포함하는 것으로 광의로 해석되어야 한다. 문서는, 예를 들면 이메일, 웹 사이트, 파일, 파일들의 조합, 다른 파일에 대한 링크가 삽입된(embedded) 하나 이상의 파일, 뉴스 그룹 포스팅, 블로그, 비지니스 리스팅(business listing), 인쇄된 텍스트의 전자적 변형물(electronic version), 웹 광고 등을 포함할 수 있다. 인터넷 환경에서, 일반적인 문서는 웹 페이지이다. 문서는 흔히 텍스트 정보를 포함하고, 삽입된 정보(메타 정보, 이미지, 하이퍼링크 등) 및/또는 삽입된 명령어(자바스크립트 등)를 포함할 수 있다. "링크(link)"라는 용어가 여기에서 사용되는 경우, 다른 문서나 동일한 문서의 다른 부분으로부터의 어떤 문서에 대한 임의의 참조 및 어떤 문서로부터의 다른 문서나 동일한 문서의 다른 부분에 대한 임의의 참조를 포함하는 것으로 광의로 해석되어야 한다.
예시적인 네트워크 구성
도 2는 본 발명의 원리와 일치하는 시스템 및 방법이 구현될 수 있는 네트워크(200)의 예시적인 도면이다. 네트워크(200)는 네트워크(250)를 통해 다수의 서버(220-240)와 연결되는 다수의 클라이언트(210)를 포함할 수 있다. 간결하게, 두 개의 클라이언트(210)와 세 개의 서버(220-240)가 네트워크(250)에 연결되어 있는 것으로 예시하였다. 실제로, 클라언트와 서버는 더 많거나 더 적을 수 있다. 또, 어떤 경우에는 클라이언트가 서버의 기능을 수행할 수 있고, 서버가 클라이언트의 기능을 수행할 수도 있다.
클라이언트(210)는 클라이언트 엔티티들을 포함할 수 있다. 엔티티는 개인용 컴퓨터, 무선 전화, 개인용 휴대 정보 단말기(personal digital assistant, PDA), 랩톱 컴퓨터, 또는 다른 타입의 계산 또는 통신 디바이스, 이들 디바이스 중 어느 하나에서 실행되는 스레드(thread)나 프로세스(process), 및/또는 이들 디바이스 중 어느 하나에 의해 실행 가능한 객체(object)로 규정될 수 있다. 클라이언트(210)는 클라이언트(210)와 서버(220-240) 사이에서 사용자 인터페이스로서 동작하도록 구성된 브라우저 소프트웨어를 더 포함할 수 있다.
서버(220-240)는 본 발명의 원리와 일치하는 방식으로 문서 또는 다른 정보를 수집(gather), 처리, 검색, 및/또는 유지하는 서버 엔티티들을 포함할 수 있다. 본 발명의 원리와 일치하는 실시예에서, 서버(220)는 클라이언트(210)에 의해 사용 가능한 검색 엔진(225)을 포함할 수 있다. 서버(220)는 문서의 코퍼스(corpus)를 크롤링(crawling)하고, 문서를 색인화하며, 저장소(repository)에 문서와 연관된 정보를 저장할 수 있다. 서버(230, 240)는 서버(220)에 의해 크롤링 또는 분석될 수 있는 문서들을 저장하거나 유지할 수 있다. 또, 서버(220-240)는 클라이언트(210)에 대한 문서 또는 정보의 전송과 관련된 하나 이상의 로그(log)를 유지할 수도 있다. 본 발명의 원리와 일치하는 일 실시예에서, 이러한 로그는 수신된 사용자의 질의 또는 요청에 응답하여 클라이언트(210)에 어떤 문서 또는 정보를 전송하였는지와 관련된 정보를 포함할 수 있다. 또한, 서버(220-240)로부터의 문서 또는 정보의 전송에 응답하여 클라이언트(210)가 취한 조치를 포함하여, 추가 정보를 로깅할 수 있다.
서버(220-240)는 별개의 엔티티로 도시되어 있지만, 서버(220-240) 중 하나 이상의 서버는 서버(220-240) 중 다른 하나 이상의 서버가 갖는 기능 중 하나 이상을 수행하는 것이 가능할 수 있다. 예를 들면, 서버(220-240) 중 둘 이상이 단일(single) 서버로서 구현될 수도 있다. 또한, 서버(220-240) 중 단 하나의 서버가 둘 이상의 별개의 (그리고 아마도 분산형) 디바이스로서 구현될 수도 있다.
네트워크(250)는 근거리 통신망(LAN, Local Area Network), 광역 통신망(WAN, Wide Area Network), 공중 전화 교환망(PSTN, Pubic Switched Telephone Network)과 같은 전화망, 인트라넷, 인터넷, 또는 네트워크들의 조합을 포함할 수 있다. 클라이언트(210) 및 서버(220-240)는 유선, 무선, 및/또는 광학적 연결을 통해 네트워크(250)에 연결될 수 있다.
예시적인 클라이언트/서버 아키텍처
도 3은 클라이언트(210) 및/또는 서버(220-240) 중 하나 이상에 대응할 수 있는, 클라이언트 또는 서버 엔티티(이하, "클라이언트/서버 엔티티"라고 한다)의 예시적인 도면이다. 이 클라이언트/서버 엔티티는 버스(310), 프로세서(320), 주 메모리(330), ROM(Read Only Memory)(340), 스토리지 디바이스(350), 입력 디바이스(360), 출력 디바이스(370), 및 통신 인터페이스(380)를 포함할 수 있다. 버스(310)는 클라이언트/서버 엔티티의 구성요소들 사이의 통신을 가능하게 하는 경로를 포함할 수 있다.
프로세서(320)는 명령어를 해석하고 실행할 수 있는, 프로세서, 마이크로프로세서 또는 처리 로직(processing logic)을 포함할 수 있다. 주 메모리(330)는 프로세서(320)에 의한 실행을 위한 정보 및 명령어를 저장하는 RAM(Random Access Memory) 또는 다른 타입의 동적 스토리지 디바이스(dynamic storage device)를 포함할 수 있다. ROM(340)은 프로세서(320)가 사용하는 정적인 정보 및 명령어를 저장하는 ROM 디바이스 또는 다른 타입의 정적 스토리지 디바이스(static storage device)를 포함할 수 있다. 스토리지 디바이스(350)는 자기 기록 매체 및/또는 광학 기록 매체와 그에 대응하는 드라이브를 포함할 수 있다.
입력 디바이스(360)는 키보드, 마우스, 펜, 음성 인식(voice recognition) 장치 및/또는 바이오메트릭(biometric) 장치 등과 같은, 조작자가 클라이언트/서버 엔티티에 정보를 입력할 수 있도록 해주는 장치를 포함할 수 있다. 출력 디바이스(370)는 디스플레이, 프린터, 스피커 등을 포함하는, 조작자에게 정보를 출력하는 장치를 포함할 수 있다. 통신 인터페이스(380)는, 클라이언트/서버 엔티티가 다른 디바이스 및/또는 시스템과 통신할 수 있도록 해주는 임의의 송수신기형(transceiver-like) 장치를 포함할 수 있다. 예를 들면, 통신 인터페이스(380)는 네트워크(250)와 같은, 네트워크를 통해 다른 디바이스나 시스템과 통신하는 장치를 포함할 수 있다.
이하에 상세하게 설명하는 바와 같이, 본 발명의 원리와 일치하는 클라이언트/서버 엔티티는 일정한 질의 처리와 관련된 작업(operation)을 수행할 수 있다. 클라이언트/서버 엔티티는 주 메모리(330)와 같은, 컴퓨터로 판독 가능한 매체 내에 저장된 소프트웨어 명령어를 실행하는 프로세서(320)에 응답하여, 이 작업들을 수행할 수 있다. 컴퓨터로 판독 가능한 매체는 물리 또는 논리 메모리 디바이스 및/또는 반송파(carrier wave, 搬送波)로서 규정될 수 있다. 소프트웨어 명령어는 데이터 스토리지 디바이스(350)와 같은, 다른 컴퓨터로 판독 가능한 매체로부터, 또는 통신 인터페이스(380)를 통해 다른 디바이스로부터 주 메모리(330) 내로 판독될 수 있다. 주 메모리(330)에 저장된 소프트웨어 명령어는 프로세서(320)로 하여금 후술하는 프로세스들을 수행하게 할 수 있다. 다르게는, 소프트웨어 명령어 대신에 또는 소프트웨어 명령어와 결합하여 하드와이어링 된 회로(hardwired circuitry)를 사용하여 본 발명의 원리와 일치하는 프로세스들을 실행할 수 있다. 따라서, 본 발명의 원리와 일치하는 실시예들은 하드웨어 회로와 소프트웨어의 어떤 특정 조합으로 한정되는 것은 아니다.
예시적인 컴퓨터로 판독한 매체
도 4는 서버(220)에 의해 사용될 수 있는 예시적인 컴퓨터로 판독 가능한 매체(400)의 일부를 나타낸 도면이다. 일 실시예에서, 컴퓨터로 판독 가능한 매체(400)는 서버(220)의 주 메모리(330)에 대응할 수 있다. 도 4에 나타낸 컴퓨터로 판독 가능한 매체(400)의 일부분은 운영 체제(410), 검색 엔진 소프트웨어/로직(420), 및 질의 정제 소프트웨어(430)를 포함할 수 있다.
운영 체제(410)는 Windows, Unix, 또는 Linux 운영 체제와 같은, 운영 체제 소프트웨어를 포함할 수 있다. 검색 엔진 소프트웨어/로직(420)은 하나 이상의 클라이언트(210)로부터 질의 정보를 수신하고 수신된 질의에 기초하여 관련 검색 결과를 식별하는 방법을 제공할 수 있다. 질의 정제 소프트웨어(430)는, 이하에 상세하게 설명하는 본 발명의 원리에 따라 수신된 질의에 기초하여 질의 정제를 식별하는 소프트웨어를 포함할 수 있다. 본 발명의 원리와 일치하는 일 실시예에서, 질의 정제 소프트웨어(430)는 검색 엔진 소프트웨어/로직(420)에 통합될 수도 있다.
유의어를 식별하기 위한 예시적인 프로세싱
도 5는 본 발명의 원리와 일치하는 실시예에서 유의어를 식별하기 위한 예시적인 프로세스의 흐름도이다. 앞서 간략하게 설명한 바와 같이, 수신된 사용자 검색 질의는 다수의 용어 또는 구를 포함할 수 있고, 그 일부는 질의의 전체 문맥에 따라 적용될 수 있는 다수의 유의어를 포함할 수 있다. 예를 들어, 본 발명의 원리와 일치하는 일 실시예에서, 수신된 검색 질의는 국부화(localized)된 비지니스 또는 상업 정보(merchant information)의 검색에 관련 있을 수 있다. 전형적으로, 이런 형태의 검색 질의는 명칭 및/또는 카테고리 정보를 포함한다. 또, 이러한 검색 질의는 사용자와 연관된 미리 정해진 위치, 디스플레이된 지도에 의해 경계가 정해진 지역, 또는 수신된 검색 질의 자체에 포함된 위치 정보와 같은, 일정한 형태의 위치 정보를 더 포함할 수 있다. 여기서는 로컬 검색(local search) 정보를 주로 설명하지만, 추가적인 실시예들에서, 다른 태깅(tagging)되거나 카테고리화된(categorized) "문서" 또는 정보를 유사한 방식으로 검색할 수 있다. 예를 들어, 제품 정보 또는 가격 검색은 미리 정해진 제품 카테고리에 기초한 제품의 식별 또는 검색으로 귀착될 수 있다.
로컬 검색의 수행으로 인식되는 한 가지 문제는, 검색 가능한 정보는 전형적으로 명칭, 위치, 및 카테고리에 기초하여 리스팅되고 저장된다는 것이다. 많은 경우에, 이러한 정보는 로컬 업종 전화부(local yellow page) 또는 비지니지 리스팅 디렉토리(business listing directory)와 같은 리스팅 소스에 의해 제공된다. 이 리스팅 정보는, 그렇지 않은 경우에는 비지니스 명칭으로부터 수집되는 정보(예컨대, 카테고리 정보)를 포함할 수 있기 때문에, 향상된 검색을 수행할 수 있다. 유감스럽게도, 할당된 카테고리 정보는 하나의 특정한 용어나 구 또는 심지어 수 개의 특정한 용어나 구로 제한될 수 있다. 예를 들어, 모든 eatery(간이 식당)은 "restaurant(레스토랑)" 카테고리 아래에 리스팅될 수 있고, 검색 질의는 용어 "diner(다이너, 식당차)"를 포함할 수 있다. 연관 검색(associated search)을 수행하기 위해 검색 질의를 구문 그대로(pure syntex) 사용하면, 어떤 경우에, "restaurant"은 "diner"의 적당한 유의어로 인식되지 않을 것이다. 따라서, 연관 검색은 검색 수행 시에 restaurant 카테고리를 포함하지 않을 것이고, 대신 "diner"만을 검색할 것이다.
본 발명의 원리에 따르면, 수신된 검색 질의는 질의 정제 소프트웨어(430)에 의해 이전의 검색 질의/결과 조합에 기초하여 강화된 카테고리 또는 추가 카테고리를 포함하도록 정제될 수 있다. 도 5로 돌아가면, 프로세스는 이력 검색의 로그 및 결과로부터 "good(우수)" 또는 관련 "triple(트리플)"을 식별함으로써 개시될 수 있다(동작 500). 여기서 사용된 바와 같이, 용어 "triple은 일반적으로 이전의 질의 결과를 대표하는 데이터를 포함하도록 규정될 수 있다. 더욱 구체적으로는, "triple"은 1) 질의 용어; 2) 결과 비지니스 명칭; 및 3) 결과 비지니스 카테고리를 포함할 수 있다. 또한, 식별된 "triple"이 "good"인지 여부에 관한 판정은 임의의 적당한 인자에 기초할 수 있다.
본 발명의 원리와 일치하는 일 실시예에서, "good" triple은 미리 정해진 행위(action)가 수신되었을 때 그러한 triple로서 식별된다. 예를 들어, 예시적인 일 실시예에서, 비지니스 리스팅을 포함하는 정보를 클라이언트(210)에 공급하는 외에, 서버(220-240)는 또한, 그 리스팅과 연관된 웹 사이트에 대한 드라이빙 디렉션(driving direction, 오시는 길), 이메일 링크, 링크 등의, 각각의 리스팅에 관한 추가적인 정보 또는 기능성을 제공할 수 있다. 이러한 실시예에서, good triple은 어떤 클라이언트(210)가 미리 정해진 사용자 행위를 서버(220-240)에 전송하였는지에 관한 리스팅과 연관된 triple로서 식별될 수 있다. 특정한 일 실시예에서, 사용자 행위는 드라이빙 디렉션에 대한 링크를 클릭하는 것일 수 있다.
유의해야 할 것은, 많은 저장된 리스팅이 그것과 연관된 다수의 비지니스 명칭 및 다수의 카테고리를 가질 수 있다는 것이다. 따라서, 드라이빙 디렉션의 클릭(또는 다른 "goodness(양호)" 표시)은 질의-명칭-카테고리 triple을 발생시킬 수 있다. 예를 들어, "bar"에 대해 수신된 질의는 두 개의 카테고리, 'bars(바)'와 'taverns(술집)'를 가지는 특정한 리스팅인 'Joe's Bar and Grill'에 부합할 수 있다. 이 예에서, 두 개의 개별 질의-명칭-카테고리 triple은 다음과 같이 관찰될 수 있다: 1.) (bar, 'Joe's Bar and Grill, bars), 및 2.) (bar, 'Joe's Bar and Grill, taverns). 리스팅에 대해 두 개의 good "triple"이 존재하면, 그 triple을 어떻게 카운트(count)할 것인지에 대한 문제가 제기된다. 본 발명의 원리와 일치하는 일 실시예에서, 각각의 상기한 triple은 0.5(1.0이 아님)의 카운트를 가지는 것으로 취급될 수 있다. 마찬가지로, 예로서, 질의가 세 개의 식별된 triple을 결과로서 얻는 경우에, 각각의 triple은 0.333의 카운트로서 취급될 수 있다. 즉, 단일(single) 리스팅 가중치(1.0)는 그것과 연관된 다수의 triple들 간에 공평하게 분배된다. 이런 방식으로, 전체 데이터세트의 합은 정확하게 관찰된 결과들의 합계가 된다.
일단 good triple이 식별되었으면, 해당 good triple과 연관된 질의를 "명칭 질의" 또는 "카테고리 질의"로 분류할 수 있다(동작 502). 여기서 규정한 바와 같 이, "명칭 질의"는 비지니스 명칭(예컨대, "China Taste Buffet")에 관련된 질의 용어를 포함하고, "카테고리 질의"는 가능한 비지니스 카테고리(예컨대, "China restaurant")에 관련된 질의 용어를 포함한다. 이 두 타입의 질의를 구별함으로써, 식별된 카테고리들이 명칭 질의에 대한 유의어로서 할당되는 것이 방지된다.
본 발명의 원리와 일치하는 일 실시예에 따르면, 명칭 질의/카테고리 질의의 판정은, 식별된 질의 각각에 연관된 "명칭 혼란도(name perplexity)" 또는 "명칭 엔트로피(name entropy)"의 정도에 기초하여 이루어질 수 있다. 이를 위해, 각각의 질의 명칭에 대해, 명칭 혼란도는 다음의 식:
eH( name | query )
으로 표현될 수 있으며, 위 식에서 H(name|query)는 비지니스 명칭의 조건부(conditional) 명칭 엔트로피이고, 동작 500에서 선택된 결과로부터 추정된 질의에 주어진다. 명칭 엔트로피는 다음의 식:
으로 규정될 수 있으며, 위 식에서 P(name|query)는, 회신이 된 주어진 질의로 시작되는 명칭의 확률이다.
다시 말해, 질의가 비지니스 명칭을 포함할 가능성은, 그 질의와 쌍을 이루는 비지니스 명칭의 수에 기초하여 결정될 수 있다. 비지니스 명칭 쌍이 거의 없는 질의는 카테고리 질의로 간주되고(예컨대, 낮은 명칭 혼란도), 질의와 쌍을 이루는 상이한 명칭이 더 많은 질의는 명칭 혼란도가 높은 것으로 간주된다. 엔트로 피라는 개념은 빈번하게 사용되는 명칭과 드물게 사용되는 명칭에 대한 가중치 부여를 설명하기 위해 도입되었다는 것을 알아야 한다.
동작 500 및 동작 502에서 식별된 질의가 good(우수) 질의 및 카테고리 질의인 것으로 각각 판정되면, 그 후 결과 카테고리와 식별된 질의가 유의어로서 취급되어야 하는지를 판정한다(동작 504). 예를 들어, 동작 500에서의 질의 결과_명칭 결과_카테고리(query-result_name-result_category) 리스팅에 대한 최초의 "goodness" 결정 및 동작 502에서 식별된 높은 명칭 혼란도(즉, 다수의 비지니스 명칭이 이 질의와 쌍을 이룰 수 있다)에 기초하여, 카테고리 "Restaurant-Chiness(레스토랑-차이니즈)"는 질의"Chiness restaurant(차이니즈 레스토랑)"에 대한 카테고리 유의어인 것으로 판정될 수 있다. 이렇게 판정되면, 식별된 카테고리는 연관된 질의 용어에 대한 카테고리 유의어로서 할당될 수 있으므로(동작 504), 그 질의와 연관된 다음의 검색에서는 그 카테고리에 관한 검색을 추가로 실시할 것을 보장한다.
유감스럽게도, 동작 500 및 동작 502를 통해 전달되는 간편하게 검사하는 질의는 질의/카테고리 하위어(hyponym)에 대한 가능성을 생각하지 않는다. 알려진 바와 같이, 하위어는 그 의미가 종속어(subordinate) 또는 하위 분류(subclass)를 나타내는 단어이다. 예를 들어, Pennsysvanian(펜실바니안)은 American(아메리칸)의 하위어이다. 바로 전의 문제로 돌아가면, Chinese restaurant(차이니즈 레스토랑)은 카테고리 "Restaurants(레스토랑)"의 하위 카테고리이기 때문에, 관찰된 질의 "Chinese restaurant"은 카테고리 "Restaurants"의 하위어일 수 있다. 후자의 질의, 카테고리 쌍은 등가 요소(equivalence)가 아니라 제한 요소(containment)를 포함하기 때문에(예컨대, Chinese restaurant은 restaurant의 한 유형이지만, "restaurant"과 동등하지는 않다), 카테고리 "Restaurant"에 대한 유의어로서 사용되어서는 안된다.
도 6은 본 발명의 원리와 일치하는 일 실시예에서, 제한 요소와 등가 요소의 질의, 카테고리 쌍들을 구별하기 위한 예시적인 프로세스의 흐름도이다. 제한 요소 타입의 질의, 카테고리 쌍의 배제(rejection)를 용이하게 하기 위하여, 식별된 질의, 카테고리 쌍에 대한 F-measure를 계산한다(동작 600). 여기서 규정하는 바와 같이, 각 쌍의 F-measure는, 질의, 카테고리 쌍이 유의어로서는 배제되어야 하는 하위어이거나 제한 요소 타입의 쌍일 가능성으로 규정될 수 있다. 이러한 계산은 다음의 식으로 표현될 수 있다:
위의 식에서, P(query, category)는 서로 유의어인 카테고리와 질의 양쪽 모두의 결합 확률(joint probability)을 나타낸다. P(query, category) 및 P(category, query)의 값은, 바람직한 사용자 행위를 수신한 인스턴스(instance) 수의 카운트값으로 나눈, 카테고리 및 질의 용어가 함께 나타나고 바람직한 사용자 행위와 연계되어 "good"으로 증명된 인스턴스 수(number of instance)의 카운트값에 의해 추정될 수 있다.
P(query)의 값은, 바람직한 사용자 행위를 수신한 인스턴스 수의 카운트값으 로 나눈, 질의 용어에 의해 바람직한 사용자 행위가 수행되는 인스턴스 수의 카운트값에 의해 추정될 수 있다. 마찬가지로, P(category)의 값은, 바람직한 사용자 행위를 수신한 인스턴스 수의 카운트값으로 나눈, 식별된 카테고리에 의해 바람직한 사용자 행위가 수행되는 인스턴스 수의 카운트값에 의해 추정될 수 있다.
또, P(query|category)는, 카테고리가 주어진 질의의 확률로서 규정될 수 있고, P(category|query)는, 질의가 주어진 카테고리의 확률이다. 이들은 P(query|category) = P(query, category)/P(category) 및 P(category|query) = P(query, category)/P(query)로서 규정되고, 성분(component)들의 이전의 추정값을 사용하여 추정된다. 일반적으로 통계에 근거한 항으로 아래와 같이 나타낸다:
하지만, 질의 확률과 카테고리 확률에 관련하여, 리콜(recall)은 P(category|query)이고, 프리시젼(precision)은 P(query|category)이며, F-measure은 P(query, category)/(a*P(category)+(1-a)*P(query))와 같으며, 이어서 상기한 정의들을 일반적인 F-measure 식에 대입하고 단순화한다. 이 문맥에서 용어 '리콜(recall)' 및 '프리시젼(precision)'은, 주어진 질의 및 카테고리에 대해, 질의에 대한 응답으로써, 카테고리와 부합하는 결과를 회신하는, 검색 실험에 관한 것이다.
상수 'a'의 값을 선택함으로써, 프리시젼과 리콜 사이의 적절한 트레이드오프(tradeoff)를 설정할 수 있다. 대략 0.7 내지 0.9 범위 내의 값이, 하위어가 식 별된 카테고리 유의어 내에 포함되는 가능성을 정확히 제거하거나 감소시키기 위해, 프리시전과 리콜 사이에 적절한 타협을 제공하는 것으로 판정되었다. 예시적인 일 실시예에서, 'a'의 값은 0.85이다.
일단 선택된 질의, 카테고리 쌍에 대한 F-measure이 결정되었으면, 계산된 F-measure이 미리 정해진 기준(criteria)을 충족시키는지를 판정한다(동작 602). 판정 결과 계산된 F-measure이 미리 정해진 기준을 충족시키면, 질의, 카테고리 쌍 내의 질의와 카테고리가 유의어인 것으로 간주한다(동작 606). 판정 결과 계산된 F-measure이 미리 정해진 기준을 충족시키지 못하면, 질의와 카테고리는 유의어로 간주되지 않고, 질의, 카테고리 쌍은 고려 대상에서 폐기된다(동작 604).
예시적인 일 실시예에서, F-measure 기준은 주어진 질의에 대해 높거나 큰 F-measure을 가지는 질의, 카테고리 쌍을 결정하는 임의의 적당한 방법을 포함할 수 있다. 예로 들어, 최고의 F-measure을 가지는 질의, 카테고리 쌍만을 주어진 질의에 대해 서로의 유의어로 간주하는 것으로 결정할 수 있다. 다르게는, 미리 정해진 질의, 카테고리 쌍의 정해진 상위 몇 개를 주어진 질의에 대한 유의어로 간주할 수 있다. 또 다른 실시예에서, 최대 F-measure 값을 결정할 수 있으며, 이 값의 미리 정해진 비율(예컨대, 50%)까지의 모든 질의, 카테고리 쌍을 주어진 질의에 대한 유의어로 간주할 수 있다. 또 다른 실시예에서, 최소의 요구되는 F-measure 값을 결정할 수 있으며, 이 값을 충족시키거나 초과하는 질의, 카테고리 쌍을 주어진 질의에 대한 유의어로서 식별할 수 있다.
다른 예시적인 실시예에서, F-measure 값은, 명칭 혼란도, 카테고리 혼란도, 및 질의 빈도와 같은 다른 인자와 결합될 수 있다. 예를 들어, 유의어로서 간주되기 위해서는, 질의, 카테고리 쌍은, 적어도 25의 명칭 혼란도, 적어도 50의 카테고리 혼란도, 적어도 1/1,000,000의 질의 빈도를 가질 것이 요구될 수 있으며, F-measure 값이 0.03과 측정된 최대 F-measure 값의 50% 둘 다보다 커야 한다.
유의어를 결정한 다음에, 처리할 추가적인 질의, 카테고리 쌍이 남아 있는지를 판정한다(동작 608). 처리할 추가적인 질의, 카테고리 쌍이 남아 있으면, 프로세스는 다음 질의, 카테고리 쌍을 위해 동작 600으로 돌아가고, 처리할 추가적인 질의, 카테고리 쌍이 남아 있지 않으면, 프로세스는 종료한다.
본 발명의 원리와 일치하는 일 실시예에서, 유의어 쌍은, 추론된 유의어에 대한 다음의 수동 재검토를 위해 하나 이상의 "라벨러(labeller)"에 전달될 수 있다.
도 7은 본 발명의 원리에 따른 사용자 개시 검색(user initiated search)을 수행하기 위한 예시적인 프로세스를 나타낸 흐름도이다. 처음에, 사용자의 지시로 클라이언트(210)로부터 검색 질의를 수신한다(동작 700). 전술한 바와 같이, 본 발명의 원리에 따르면, 검색 질의는, 예시적인 일 실시예에서, 로컬 비지니스 정보의 발견 또는 식별에 관한 다수의 용어를 포함한다. 다른 실시예에서, 검색 질의는 제품 가격 및 설명 정보, 텍스트 웹 기반 정보, 매체(예컨대, 노래, 이미지, 비디오 등) 정보와 같은, 정보의 부가적인 타입의 발견 또는 식별에 관한 것일 수 있다.
요청되는 정보의 타입과 상관없이, 서버(220) 상의 검색 엔진(225)은 다음에 요청된 정보와 연관된 하나 이상의 카테고리를 식별할 수 있다(동작 702). 최초의 카테고리를 식별하는 방법은 본 발명의 범위 밖이므로, 여기서는 상세하게 설명하지 않는다. 일단 최초의 카테고리가 식별되었으면, 도 5 및 도 6의 프로세스를 사용하여 결정된 카테고리 유의어를 식별할 수 있다(동작 704). 질의 용어, 최초로 결정된 카테고리 또는 카테고리들, 그리고 위에서 상세하게 설명한 방법으로 식별된 카테고리 유의어를 사용하여, 검색 결과를 생성(동작 706)하고, 클라이언트(210)에 전달하여 요청한 사용자에게 결과로서 디스플레이한다.
예시적인 일 실시예에서, 리스팅 정보는 수신한 검색 용어 외에 전술한 방법으로 식별된 카테고리 유의어를 사용하여 구체적으로 검색될 수 있다. 예를 들어, 'doctor(의사)'에 대한 검색은 식별된 카테고리 유의어 "Physicians(내과 의사)-General Practice(일반 진료)"를 포함하도록 수정될 수 있다. 일 실시예에서, 이러한 용어는 논리적으로 OR 연산될 수 있다. 주어진 예에서, 그 결과로서 얻은 질의에는 ""doctors OR EXACTCATEGORYMATCH(Physicians-General Practice)"를 포함할 것이며, 여기서 EXACTCATEGORYMATCH는, 규정된 카테고리 유의어 내에 포함되는 각각의 용어가 리스팅 정보에서 식별된 카테고리들에서 발견되는 것을 보장한다.
카테고리 유의어를 추론하기 위해 이력 검색 정보를 사용함으로써, 향상된 검색 결과를 제공할 수 있다. 더욱 구체적으로는, 이전의 검색으로부터 good(우수) 검색 결과를 식별함으로써, 카테고리 유의어를 정확하게 추론할 수 있다. 추론된 유의어를 사용함으로써, 장래의 검색 결과를 제공할 때, 사용자에게 바람직한 결과를 제공할 가능성이 증가한다.
결론
본 발명의 원리와 일치하는 시스템 및 방법은 검색 질의 정제를 용이하게 할 수 있다. 본 발명의 원리와 일치하는 일 실시예에서는, 이력 검색 정보로부터 카테고리 유의어를 추론할 수 있다.
본 발명의 바람직한 실시예들에 대한 이상의 설명은, 본 발명에 대한 예시와 설명을 제공하지만, 본 발명을 총망라하거나 개시된 바로 그 형태로 한정하려는 의도는 아니다. 이상의 교시에 비추어 여러 변경예 및 변형예가 가능하거나, 또는 본 발명의 실시로부터 여러 변경예 및 변형예를 얻을 수 있다. 예를 들면, 도 5 내지 도 7과 관련하여 일련의 동작(act)을 설명하였지만, 본 발명의 원리와 일치하는 다른 실시예에서는 이 동작들의 순서가 변경될 수 있다. 또, 비종속적인(non-dependent) 동작들은 병렬로 실행될 수 있다. 또, 동작들은 다른 방식으로 변경될 수 있다.
이상에서 설명한 바와 같이, 본 발명의 측면들이 도면에 예시된 실시예에서 여러 상이한 형태의 소프트웨어, 펌웨어, 및 하드웨어로 구현될 수 있다는 것은 해당 기술분야의 당업자에게 명백할 것이다. 본 발명의 원리와 일치하는 측면들을 구현하는데 이용되는 실제의 소프트웨어 코드 또는 특화된(specialized) 제어 하드웨어는 본 발명을 제한하고 있지 않다. 따라서, 본 발명의 측면들에 대한 동작(operation) 및 작용(behavior)을 특정한 소프트웨어 코드에 대한 언급 없이 설명하였으며, 해당 기술분야의 당업자라면 본 명세서의 상세한 설명에 기초하여 본 발명의 측면들을 구현하기 위한 소프트웨어 및 제어 하드웨어를 설계할 수 있다는 것을 알 것이다.
본 출원의 설명에서 사용된 요소(element), 동작(act), 명령어(instruction)는 결정적이거나 필수적인 것으로 명백히 기술되지 않는 한, 본 발명에서 그러한 것으로 해석되어서는 안 된다. 오직 하나의 아이템이 의도되는 경우, 용어 "하나(one)" 또는 유사한 표현을 사용한다. 또, 구 "...에 기초하여(based on)"는 명백히 다르게 나타내지 않는 한 "적어도 일부는 ...에 기초하여"를 의미하는 것으로 의도된다.
Claims (26)
- 서버가 이전의 질의 데이터를 식별하는 단계로서, 상기 이전의 질의 데이터는 적어도 질의 용어 정보 및 상기 질의 용어 정보에 기초하여 회신된 검색 결과와 연관된 카테고리 정보를 포함하는, 상기 이전의 질의 데이터를 식별하는 단계;상기 카테고리 정보가 상기 질의 용어 정보의 유의어(synonym)인지를 판정하는 단계;상기 질의 용어 정보 또는 상기 카테고리 정보와 관련된 다음의 검색 요청을 수신하는 단계;상기 질의 용어 정보가 상기 카테고리 정보의 유의어인 경우에, 상기 질의 용어 정보 및 상기 카테고리 정보에 기초하여 상기 다음의 검색 요청을 정제하는 단계;상기 정제된 검색 요청에 기초하여 검색을 수행하는 단계; 및상기 검색에 기초하여 검색 결과를 제공하는 단계를 포함하고,상기 이전의 질의 데이터는, 비지니스 리스팅(business listing) 정보에 대한 사용자 질의와 연관된 질의 용어, 상기 사용자 질의에 응답하여 회신되는 결과 비지니스 명칭, 및 상기 결과 비지니스 명칭과 연관된 결과 비지니스 카테고리를 포함하고,상기 카테고리 정보가 상기 질의 용어 정보의 유의어(synonym)인지를 판정하는 단계는, 상기 이전의 질의 데이터가 명칭 질의 또는 카테고리 질의와 관련이 있는지를 판정하는 단계; 상기 이전의 질의 데이터가 카테고리 질의와 관련 있는 것으로 판정된 경우에, 상기 질의 용어가 상기 결과 비지니스 카테고리의 후보 유의어인지를 판정하는 단계; 상기 이전의 질의 데이터와 연관된 질의, 카테고리 쌍이 하위어(hyponym)인지를 판정하는 단계; 상기 이전의 질의 데이터와 연관된 상기 질의, 카테고리 쌍이 하위어인 경우에, 상기 결과 비지니스 카테고리의 유의어로서는 상기 질의 용어를 배제하는 단계; 및 상기 이전의 질의 데이터와 연관된 상기 질의, 카테고리 쌍이 하위어가 아닌 경우에, 상기 결과 비지니스 카테고리의 유의어로서 상기 질의 용어를 인정하는 단계를 포함하는,서버에 의해 수행되는 방법.
- 삭제
- 제1항에 있어서,상기 이전의 질의 데이터를 식별하는 단계는, 상기 이전의 질의 데이터가 관련성에 대한 이전의 지표(previous indication)를 수신하였는지를 판정하는 단계를 더 포함하는, 방법.
- 제3항에 있어서,상기 관련성에 대한 이전의 지표(previous indication)는, 상기 이전의 질의 데이터와 연관된 미리 정해진 사용자 행위를 수신하는 것을 포함하는, 방법.
- 제4항에 있어서,상기 미리 정해진 사용자 행위는, 드라이빙 디렉션 요청(driving directions request)에 대한 사용자 선택을 수신하는 것을 포함하는, 방법.
- 삭제
- 제1항에 있어서,상기 이전의 질의 데이터가 명칭 질의 또는 카테고리 질의 중 하나와 관련이 있는지를 판정하는 단계를 더 포함하는 방법.
- 제7항에 있어서,상기 이전의 질의 데이터가 명칭 질의 또는 카테고리 질의 중 하나와 관련이 있는지를 판정하는 단계는, 상기 질의 용어 정보가 비지니스 명칭 또는 비지니스 카테고리에 대한 요청과 관련이 있는지를 판정하는 단계를 더 포함하는, 방법.
- 제8항에 있어서,상기 질의 용어 정보가 비지니스 명칭 또는 비지니스 카테고리에 대한 요청과 관련이 있는 것인지를 판정하는 단계는,상기 질의 용어 정보와 쌍을 이루는 비지니스 명칭의 개수를 결정하는 단계로서, 카테고리 질의(categorical query)에 대응하는 질의 용어 정보가, 명칭 질의(name query)에 대응하는 질의 용어 정보보다 더 많은 비지니스 명칭과 쌍을 이루는, 상기 질의 용어 정보와 쌍을 이루는 비지니스 명칭의 개수를 결정하는 단계를 더 포함하는, 방법.
- 삭제
- 삭제
- 제1항에 있어서,상기 이전의 질의 데이터와 연관된 질의, 카테고리 쌍이 하위어(hyponym)인지를 판정하는 단계는, 상기 질의, 카테고리 쌍에 대한 F-measure를 계산하는 단계를 포함하는, 방법.
- 제13항에 있어서,상기 'a'는 0.7 내지 0.9 범위 내에 있는, 방법.
- 제13항에 있어서,상기 'a'는 0.85인, 방법.
- 이전의 검색 결과와 연관된 이전의 질의 데이터와 이전의 카테고리 데이터가 카테고리 유의어를 포함하는지를 판정하기 위한 수단;상기 이전의 카테고리 데이터와 관련된 다음의 검색 요청을 수신하기 위한 수단;상기 이전의 질의 데이터와 상기 이전의 카테고리 데이터가 카테고리 유의어를 포함하는 경우에, 상기 이전의 질의 데이터에 기초하여 상기 다음의 검색 요청을 정제하기 위한 수단;상기 정제된 검색 요청에 기초하여 검색을 수행하기 위한 수단; 및상기 검색에 기초하여 검색 결과를 제공하기 위한 수단을 포함하는 시스템으로서,상기 이전의 질의 데이터는, 비지니스 리스팅(business listing) 정보에 대한 사용자 질의와 연관된 질의 용어, 상기 사용자 질의에 응답하여 회신되는 결과 비지니스 명칭, 및 상기 결과 비지니스 명칭과 연관된 결과 비지니스 카테고리를 포함하고,상기 이전의 검색 결과와 연관된 이전의 질의 데이터와 이전의 카테고리 데이터가 카테고리 유의어를 포함하는지를 판정하기 위한 수단은, 상기 이전의 질의 데이터가 명칭 질의 또는 카테고리 질의와 관련이 있는지를 판정하는 수단; 상기 이전의 질의 데이터가 카테고리 질의와 관련 있는 것으로 판정된 경우에, 상기 질의 용어가 상기 결과 비지니스 카테고리의 후보 유의어인지를 판정하는 수단; 상기 이전의 질의 데이터와 연관된 질의, 카테고리 쌍이 하위어(hyponym)인지를 판정하는 수단; 상기 이전의 질의 데이터와 연관된 상기 질의, 카테고리 쌍이 하위어인 경우에, 상기 결과 비지니스 카테고리의 유의어로서는 상기 질의 용어를 배제하는 수단; 및 상기 이전의 질의 데이터와 연관된 상기 질의, 카테고리 쌍이 하위어가 아닌 경우에, 상기 결과 비지니스 카테고리의 유의어로서 상기 질의 용어를 인정하는 수단을 포함하는, 시스템.
- 제16항에 있어서,이전의 검색 결과와 연관된 이전의 질의 데이터와 이전의 카테고리 데이터가 카테고리 유의어를 포함하는지를 판정하기 위한 상기 수단은,상기 이전의 검색 결과가 관련있는 검색 결과인지를 판정하기 위한 수단; 및상기 이전의 검색 결과가 관련있는 검색 결과로 판정된 경우에, 상기 이전의 검색 결과 내에 포함된 상기 이전의 질의 데이터와 상기 이전의 카테고리 데이터가 카테고리 유의어를 포함하는지를 판정하기 위한 수단을 더 포함하는, 시스템.
- 제17항에 있어서,상기 이전의 검색 결과가 관련있는 검색 결과인지를 판정하기 위한 상기 수단은, 상기 이전의 검색 결과와 관련하여 소정의 사용자 행위가 수신되었는지 판정하기 위한 수단을 더 포함하는, 시스템.
- 삭제
- 복수의 명령어를 저장하는 메모리; 및상기 복수의 명령어를 실행하여, 이전의 검색 요청과 연관된 하나 이상의 질의, 카테고리 쌍을 포함하는 이력 로그 데이터(historical log data)를 식별하고; 상기 질의, 카테고리 쌍 내의 질의가 명칭 질의인지 카테고리 질의인지를 판정하고; 상기 질의가 상기 카테고리 질의로 판정되면, 상기 질의가 상기 카테고리의 유의어인지를 판정하고; 상기 질의 또는 상기 카테고리에 관련된 검색 요청을 수신하고; 상기 질의가 상기 카테고리의 유의어인 경우에, 상기 질의, 카테고리 쌍에 기초하여 상기 수신된 검색 요청을 정제하고; 상기 정제된 검색 요청에 기초하여 검색을 수행하고; 그리고 상기 검색에 기초하여 검색 결과를 제공하는 프로세서를 포함하는 디바이스로서,상기 질의, 카테고리 쌍 내의 상기 질의는 비지니스 리스팅(business listing) 정보에 대한 질의이고,상기 이력 로그 데이터(historical log data)는, 상기 질의와 연관된 질의 용어, 상기 질의에 응답하여 회신되는 결과 비지니스 명칭, 및 상기 결과 비지니스 명칭과 연관된 결과 비지니스 카테고리를 포함하고,상기 프로세서가 상기 질의가 상기 카테고리의 유의어인지를 판정할 때, 상기 프로세서는 상기 질의가 카테고리 질의인 경우 상기 질의 용어가 상기 결과 비지니스 카테고리의 후보 유의어인지 판정하고; 상기 질의, 카테고리 쌍이 하위어(hyponym)인지를 판정하고; 상기 질의, 카테고리 쌍이 하위어인 경우에, 상기 결과 비지니스 카테고리의 유의어로서는 상기 질의 용어를 배재하고; 상기 질의, 카네고리 쌍이 하위어가 아닌 경우에, 상기 결과 비지니스 카테고리의 유의어로서 상기 질의 용어를 인정하는,디바이스.
- 제20항에 있어서,상기 질의가 상기 카테고리의 유의어인지를 판정할 때, 상기 프로세서는 상기 질의가 상기 카테고리의 하위어인지를 판정하는, 디바이스.
- 적어도 질의 용어 및 결과 카테고리를 포함하는 이전의 검색 결과 데이터를 식별하는 단계;상기 질의 용어가 상기 결과 카테고리의 유의어인지를 판정하는 단계;상기 결과 카테고리와 관련된 다음의 검색 요청을 수신하는 단계;상기 질의 용어가 상기 결과 카테고리의 유의어인 경우에, 상기 질의 용어에 기초하여 상기 다음의 검색 요청을 정제하는 단계;상기 정제된 검색 요청에 기초하여 검색을 수행하는 단계; 및상기 검색에 기초하여 검색 결과를 제공하는 단계를 포함하는 방법을 수행하도록, 프로세서를 제어하기 위한 명령어를 포함하는 컴퓨터로 판독 가능한 메모리 디바이스로서,상기 이전의 검색 결과 데이터는, 비지니스 리스팅(business listing) 정보에 대한 사용자 질의와 연관된 질의 용어, 상기 사용자 질의에 응답하여 회신되는 결과 비지니스 명칭, 및 상기 결과 비지니스 명칭과 연관된 결과 비지니스 카테고리를 포함하고,상기 질의 용어가 상기 결과 카테고리의 유의어인지를 판정하는 단계는, 상기 이전의 검색 결과 데이터가 명칭 질의 또는 카테고리 질의와 관련이 있는지를 판정하는 단계; 상기 이전의 검색 결과 데이터가 카테고리 질의와 관련 있는 경우, 상기 질의 용어가 상기 결과 비지니스 카테고리의 후보 유의어인지를 판정하는 단계; 상기 이전의 검색 결과 데이터와 연관된 질의, 카테고리 쌍이 하위어(hyponym)인지를 판정하는 단계; 상기 이전의 검색 결과 데이터와 연관된 상기 질의, 카테고리 쌍이 하위어인 경우에, 상기 결과 비지니스 카테고리의 유의어로서는 상기 질의 용어를 배제하는 단계; 및 상기 이전의 검색 결과 데이터와 연관된 상기 질의, 카테고리 쌍이 하위어가 아닌 경우에, 상기 결과 비지니스 카테고리의 유의어로서 상기 질의 용어를 인정하는 단계를 포함하는,프로세서를 제어하기 위한 명령어를 포함하는 컴퓨터로 판독 가능한 메모리 디바이스.
- 클라이언트로부터 검색 질의를 수신하는 단계;상기 수신된 검색 질의에 기초하여 결과 카테고리를 식별하는 단계;이전의 질의 데이터에 기초하여 상기 식별된 결과 카테고리에 대한 카테고리 유의어를 식별하는 단계;상기 수신된 검색 질의, 상기 결과 카테고리, 및 상기 식별된 카테고리 유의어에 기초하여 검색을 수행하는 단계; 및상기 검색에 기초하여 검색 결과를 제공하는 단계를 포함하는 방법으로서,상기 이전의 질의 데이터는, 비지니스 리스팅(business listing) 정보에 대한 사용자 질의와 연관된 질의 용어, 상기 사용자 질의에 응답하여 회신되는 결과 비지니스 명칭, 및 상기 결과 비지니스 명칭과 연관된 결과 비지니스 카테고리를 포함하고,상기 카테고리 유의어를 식별하는 단계는, 상기 이전의 질의 데이터가 명칭 질의 또는 카테고리 질의와 관련이 있는지를 판정하는 단계; 상기 이전의 질의 데이터가 카테고리 질의와 관련 있는 경우에, 상기 질의 용어가 상기 결과 비지니스 카테고리의 후보 유의어인지를 판정하는 단계; 상기 이전의 질의 데이터와 연관된 질의, 카테고리 쌍이 하위어(hyponym)인지를 판정하는 단계; 상기 이전의 질의 데이터와 연관된 상기 질의, 카테고리 쌍이 하위어인 경우에, 상기 결과 비지니스 카테고리의 유의어로서는 상기 질의 용어를 배제하는 단계; 및 상기 이전의 질의 데이터와 연관된 상기 질의, 카테고리 쌍이 하위어가 아닌 경우에, 상기 결과 비지니스 카테고리의 유의어로서 상기 질의 용어를 인정하는 단계를 포함하는, 방법
- 제23항에 있어서,상기 검색을 수행하는 단계는,상기 수신된 질의에 기초하여 비지니스 명칭 검색을 수행하는 단계;상기 식별된 카테고리 유의어에 기초하여 비지니스 명칭 검색을 수행하는 단계; 및상기 식별된 결과 카테고리에 기초하여 결과 카테고리 검색을 수행하는 단계를 더 포함하는, 방법.
- 제24항에 있어서,상기 식별된 결과 카테고리에 기초하여 결과 카테고리 검색을 수행하는 단계는, 식별된 결과 카테고리와 정확히 일치하는 것을 결과로서 얻는 정확한 일치 검색(exact match search) 수행을 포함하는, 방법.
- 검색 질의를 수신하는 단계;현재의 프로세스에서 상기 검색 질의를 처리하기 위한 질의 데이터를 취득하는 단계로서, 상기 질의 데이터는 상기 현재의 프로세스 이전에 실행되어 검색 결과를 회신하였던 프로세스에 의해 취득된 질의 용어 정보 및 카테고리 정보를 포함하고, 상기 검색 결과는 상기 질의 용어 정보에 기초하여 선택되었으며, 상기 카테고리 정보는 상기 검색 결과 연관되어 있는, 상기 질의 데이터를 취득하는 단계;상기 카테고리 정보가 상기 질의 용어 정보의 유의어로서 분류되기 위한 기준을 충족시키는 것을 판정하는 단계; 및상기 카테고리 정보가 상기 질의 용어 정보의 유의어로서 분류되기 위한 기준을 충족시키는 것을 판정하는 단계에 응답하여:상기 카테고리 정보 및 상기 질의 용어 정보에 기초하여 상기 검색 질의를 정제하여, 정제된 검색 질의를 생성하는 단계;상기 정제된 검색 질의에 기초하여 검색을 수행하는 단계; 및상기 검색에 기초하여 검색 결과를 출력하는 단계를 포함하는 컴퓨터로 구현되는 방법으로서,상기 카테고리 정보가 상기 질의 용어 정보의 유의어로서 분류되기 위한 기준을 충족시키는 것을 판정하는 단계는, 상기 질의 데이터가 명칭 질의 또는 카테고리 질의와 관련이 있는지를 판정하는 단계; 상기 질의 데이터가 카테고리 질의와 관련 있는 경우에, 질의 용어가 비지니스 카테고리의 후보 유의어인지를 판정하는 단계; 상기 질의 데이터와 연관된 질의, 카테고리 쌍이 하위어(hyponym)인지를 판정하는 단계; 상기 질의 데이터와 연관된 상기 질의, 카테고리 쌍이 하위어인 경우에, 상기 비지니스 카테고리의 유의어로서는 상기 질의 용어를 배제하는 단계; 및 상기 질의 데이터와 연관된 상기 질의, 카테고리 쌍이 하위어가 아닌 경우에, 상기 비지니스 카테고리의 유의어로서 상기 질의 용어를 인정하는 단계를 포함하는, 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/283,833 | 2005-11-22 | ||
US11/283,833 US7627548B2 (en) | 2005-11-22 | 2005-11-22 | Inferring search category synonyms from user logs |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080077382A KR20080077382A (ko) | 2008-08-22 |
KR101027999B1 true KR101027999B1 (ko) | 2011-04-13 |
Family
ID=38054698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087015058A KR101027999B1 (ko) | 2005-11-22 | 2006-11-22 | 사용자 로그로부터의 검색 카테고리 유의어 추론 |
Country Status (7)
Country | Link |
---|---|
US (3) | US7627548B2 (ko) |
EP (1) | EP1952287A4 (ko) |
JP (1) | JP4809441B2 (ko) |
KR (1) | KR101027999B1 (ko) |
CN (1) | CN101361068B (ko) |
CA (1) | CA2630808A1 (ko) |
WO (1) | WO2007062397A2 (ko) |
Families Citing this family (83)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4062345B2 (ja) * | 2006-08-16 | 2008-03-19 | 富士ゼロックス株式会社 | 情報処理装置、情報処理システム、及び制御プログラム |
US8661012B1 (en) * | 2006-12-29 | 2014-02-25 | Google Inc. | Ensuring that a synonym for a query phrase does not drop information present in the query phrase |
US8037086B1 (en) | 2007-07-10 | 2011-10-11 | Google Inc. | Identifying common co-occurring elements in lists |
US8312010B1 (en) | 2007-08-16 | 2012-11-13 | Google Inc. | Local business ranking using mapping information |
US20090132505A1 (en) * | 2007-11-16 | 2009-05-21 | Iac Search & Media, Inc. | Transformation in a system and method for conducting a search |
US20090132514A1 (en) * | 2007-11-16 | 2009-05-21 | Iac Search & Media, Inc. | method and system for building text descriptions in a search database |
US20090132485A1 (en) * | 2007-11-16 | 2009-05-21 | Iac Search & Media, Inc. | User interface and method in a local search system that calculates driving directions without losing search results |
US8732155B2 (en) * | 2007-11-16 | 2014-05-20 | Iac Search & Media, Inc. | Categorization in a system and method for conducting a search |
US20090132236A1 (en) * | 2007-11-16 | 2009-05-21 | Iac Search & Media, Inc. | Selection or reliable key words from unreliable sources in a system and method for conducting a search |
US7809721B2 (en) * | 2007-11-16 | 2010-10-05 | Iac Search & Media, Inc. | Ranking of objects using semantic and nonsemantic features in a system and method for conducting a search |
US8145703B2 (en) * | 2007-11-16 | 2012-03-27 | Iac Search & Media, Inc. | User interface and method in a local search system with related search results |
US20090132927A1 (en) * | 2007-11-16 | 2009-05-21 | Iac Search & Media, Inc. | User interface and method for making additions to a map |
US7921108B2 (en) | 2007-11-16 | 2011-04-05 | Iac Search & Media, Inc. | User interface and method in a local search system with automatic expansion |
US20090132572A1 (en) * | 2007-11-16 | 2009-05-21 | Iac Search & Media, Inc. | User interface and method in a local search system with profile page |
US20090132645A1 (en) * | 2007-11-16 | 2009-05-21 | Iac Search & Media, Inc. | User interface and method in a local search system with multiple-field comparison |
US20090132513A1 (en) * | 2007-11-16 | 2009-05-21 | Iac Search & Media, Inc. | Correlation of data in a system and method for conducting a search |
US20090132573A1 (en) * | 2007-11-16 | 2009-05-21 | Iac Search & Media, Inc. | User interface and method in a local search system with search results restricted by drawn figure elements |
US8090714B2 (en) * | 2007-11-16 | 2012-01-03 | Iac Search & Media, Inc. | User interface and method in a local search system with location identification in a request |
US20090132929A1 (en) * | 2007-11-16 | 2009-05-21 | Iac Search & Media, Inc. | User interface and method for a boundary display on a map |
US20090132486A1 (en) * | 2007-11-16 | 2009-05-21 | Iac Search & Media, Inc. | User interface and method in local search system with results that can be reproduced |
US20090132512A1 (en) * | 2007-11-16 | 2009-05-21 | Iac Search & Media, Inc. | Search system and method for conducting a local search |
US20090132484A1 (en) * | 2007-11-16 | 2009-05-21 | Iac Search & Media, Inc. | User interface and method in a local search system having vertical context |
KR100922691B1 (ko) | 2007-12-31 | 2009-10-20 | 엔에이치엔(주) | 테마 연관 질의어 제공 방법 및 시스템 |
US7937387B2 (en) * | 2008-02-01 | 2011-05-03 | Mandiant | System and method for data preservation and retrieval |
US7890530B2 (en) * | 2008-02-05 | 2011-02-15 | International Business Machines Corporation | Method and system for controlling access to data via a data-centric security model |
US8578408B2 (en) * | 2008-03-10 | 2013-11-05 | Hulu, LLC | Method and apparatus for providing directed advertising based on user preferences |
US8180771B2 (en) * | 2008-07-18 | 2012-05-15 | Iac Search & Media, Inc. | Search activity eraser |
US8768933B2 (en) * | 2008-08-08 | 2014-07-01 | Kabushiki Kaisha Toshiba | System and method for type-ahead address lookup employing historically weighted address placement |
US9092517B2 (en) * | 2008-09-23 | 2015-07-28 | Microsoft Technology Licensing, Llc | Generating synonyms based on query log data |
US8407202B2 (en) * | 2008-10-06 | 2013-03-26 | At&T Intellectual Property I, L.P. | Embedded business metadata |
KR101045955B1 (ko) * | 2008-11-14 | 2011-07-04 | 한국과학기술정보연구원 | 문맥의 의미적 연관관계 추출 방법 및 그 장치와 그 프로그램 소스를 저장한 기록 매체 |
US8108393B2 (en) * | 2009-01-09 | 2012-01-31 | Hulu Llc | Method and apparatus for searching media program databases |
CN101464897A (zh) * | 2009-01-12 | 2009-06-24 | 阿里巴巴集团控股有限公司 | 一种词匹配及信息查询方法及装置 |
US8949265B2 (en) | 2009-03-05 | 2015-02-03 | Ebay Inc. | System and method to provide query linguistic service |
US8185544B2 (en) * | 2009-04-08 | 2012-05-22 | Google Inc. | Generating improved document classification data using historical search results |
CN101872351B (zh) * | 2009-04-27 | 2012-10-10 | 阿里巴巴集团控股有限公司 | 识别同义词的方法、装置及利用其进行搜索的方法和装置 |
US8103667B2 (en) | 2009-05-28 | 2012-01-24 | Microsoft Corporation | Ranking results of multiple intent queries |
CN101576916B (zh) * | 2009-06-18 | 2011-01-05 | 清华大学 | 一种获取同义词的方法及装置 |
KR101042500B1 (ko) * | 2009-06-19 | 2011-06-16 | 엔에이치엔(주) | 이전 질의어를 이용한 검색 결과 제공 방법 및 장치 |
US8515731B1 (en) * | 2009-09-28 | 2013-08-20 | Google Inc. | Synonym verification |
KR101301534B1 (ko) * | 2009-12-14 | 2013-09-04 | 한국전자통신연구원 | 이형태 자동 구축 방법 및 장치 |
US8543381B2 (en) * | 2010-01-25 | 2013-09-24 | Holovisions LLC | Morphing text by splicing end-compatible segments |
JP5084859B2 (ja) * | 2010-03-17 | 2012-11-28 | ヤフー株式会社 | 情報処理装置、データ抽出方法、及びプログラム |
US8161073B2 (en) | 2010-05-05 | 2012-04-17 | Holovisions, LLC | Context-driven search |
US9600566B2 (en) | 2010-05-14 | 2017-03-21 | Microsoft Technology Licensing, Llc | Identifying entity synonyms |
US9075774B2 (en) * | 2010-05-20 | 2015-07-07 | Nec Corporation | Perplexity calculation device |
WO2011149961A2 (en) | 2010-05-24 | 2011-12-01 | Intersect Ptp, Inc. | Systems and methods for identifying intersections using content metadata |
US8566348B2 (en) | 2010-05-24 | 2013-10-22 | Intersect Ptp, Inc. | Systems and methods for collaborative storytelling in a virtual space |
US20110313756A1 (en) * | 2010-06-21 | 2011-12-22 | Connor Robert A | Text sizer (TM) |
CN102567408B (zh) | 2010-12-31 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 推荐搜索关键词的方法和装置 |
US20120179705A1 (en) * | 2011-01-11 | 2012-07-12 | Microsoft Corporation | Query reformulation in association with a search box |
CN102737021B (zh) * | 2011-03-31 | 2014-10-22 | 北京百度网讯科技有限公司 | 搜索引擎及其实现方法 |
US8667007B2 (en) | 2011-05-26 | 2014-03-04 | International Business Machines Corporation | Hybrid and iterative keyword and category search technique |
US20120310954A1 (en) * | 2011-06-03 | 2012-12-06 | Ebay Inc. | Method and system to narrow generic searches using related search terms |
CN102955798B (zh) * | 2011-08-25 | 2018-04-17 | 深圳市世纪光速信息技术有限公司 | 一种基于搜索引擎的搜索方法及搜索服务器 |
EP2568395A1 (en) | 2011-09-08 | 2013-03-13 | Axel Springer Digital TV Guide GmbH | Method and apparatus for automatic generation of recommendations |
KR20130060720A (ko) * | 2011-11-30 | 2013-06-10 | 한국전자통신연구원 | 목적 기반 시맨틱 서비스 디스커버리를 위한 서비스 목적 해석 장치 및 방법 |
KR101902568B1 (ko) * | 2011-12-09 | 2018-09-28 | 주식회사 카카오 | 정보 제공 시스템 및 정보 제공 방법 |
US8620951B1 (en) | 2012-01-28 | 2013-12-31 | Google Inc. | Search query results based upon topic |
US8745019B2 (en) | 2012-03-05 | 2014-06-03 | Microsoft Corporation | Robust discovery of entity synonyms using query logs |
KR20130102854A (ko) * | 2012-03-08 | 2013-09-23 | 삼성전자주식회사 | 검색 시스템 및 동작 방법 |
US10032131B2 (en) | 2012-06-20 | 2018-07-24 | Microsoft Technology Licensing, Llc | Data services for enterprises leveraging search system data assets |
US9594831B2 (en) | 2012-06-22 | 2017-03-14 | Microsoft Technology Licensing, Llc | Targeted disambiguation of named entities |
US8935299B2 (en) | 2012-07-19 | 2015-01-13 | Facebook, Inc. | Identifying relevant data for pages in a social networking system |
US9141707B2 (en) * | 2012-07-19 | 2015-09-22 | Facebook, Inc. | Context-based object retrieval in a social networking system |
US9229924B2 (en) | 2012-08-24 | 2016-01-05 | Microsoft Technology Licensing, Llc | Word detection and domain dictionary recommendation |
US9767484B2 (en) * | 2012-09-11 | 2017-09-19 | Google Inc. | Defining relevant content area based on category density |
US8983956B1 (en) | 2013-03-15 | 2015-03-17 | Google Inc. | Category generalization for search queries |
US9996588B2 (en) * | 2013-12-09 | 2018-06-12 | International Business Machines Corporation | Managing a search |
US9589050B2 (en) | 2014-04-07 | 2017-03-07 | International Business Machines Corporation | Semantic context based keyword search techniques |
US9959364B2 (en) * | 2014-05-22 | 2018-05-01 | Oath Inc. | Content recommendations |
CN105786810B (zh) * | 2014-12-16 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 类目映射关系的建立方法与装置 |
CN105159931B (zh) * | 2015-08-06 | 2018-06-22 | 上海智臻智能网络科技股份有限公司 | 用于生成同义词的方法和装置 |
US10832146B2 (en) | 2016-01-19 | 2020-11-10 | International Business Machines Corporation | System and method of inferring synonyms using ensemble learning techniques |
US10467291B2 (en) * | 2016-05-02 | 2019-11-05 | Oath Inc. | Method and system for providing query suggestions |
US11580115B2 (en) * | 2017-06-29 | 2023-02-14 | Ebay Inc. | Identification of intent and non-intent query portions |
CN107729347B (zh) * | 2017-08-23 | 2021-06-11 | 北京百度网讯科技有限公司 | 同义标签的获取方法、装置、设备及计算机可读存储介质 |
KR102044009B1 (ko) * | 2018-09-19 | 2019-11-12 | 주식회사 카카오 | 정보 제공 시스템 및 정보 제공 방법 |
US11182416B2 (en) * | 2018-10-24 | 2021-11-23 | International Business Machines Corporation | Augmentation of a text representation model |
KR102144775B1 (ko) * | 2018-11-26 | 2020-08-14 | 장태호 | 태깅 정보를 이용한 데이터 검색 장치 |
US10997641B1 (en) * | 2019-07-15 | 2021-05-04 | Coupa Software Incorporated | Enabling supplier catalogs based on procurement data from buyer community |
CN111666417B (zh) * | 2020-04-13 | 2023-06-23 | 百度在线网络技术(北京)有限公司 | 生成同义词的方法、装置、电子设备以及可读存储介质 |
CN114510635B (zh) * | 2022-01-17 | 2024-10-15 | 阿里巴巴(中国)网络技术有限公司 | 商品搜索方法、装置、电子设备及可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040220905A1 (en) * | 2003-05-01 | 2004-11-04 | Microsoft Corporation | Concept network |
KR100525618B1 (ko) * | 2004-04-22 | 2005-11-03 | 엔에이치엔(주) | 연관 검색 쿼리 추출 방법 및 시스템 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5502774A (en) | 1992-06-09 | 1996-03-26 | International Business Machines Corporation | Automatic recognition of a consistent message using multiple complimentary sources of information |
US6366910B1 (en) * | 1998-12-07 | 2002-04-02 | Amazon.Com, Inc. | Method and system for generation of hierarchical search results |
US6873990B2 (en) * | 2001-02-07 | 2005-03-29 | International Business Machines Corporation | Customer self service subsystem for context cluster discovery and validation |
US7162453B1 (en) * | 2001-06-29 | 2007-01-09 | I2 Technologies Us, Inc. | Protecting content from unauthorized reproduction |
JP2004534324A (ja) * | 2001-07-04 | 2004-11-11 | コギズム・インターメディア・アーゲー | 索引付きの拡張可能な対話的文書検索システム |
US7403938B2 (en) * | 2001-09-24 | 2008-07-22 | Iac Search & Media, Inc. | Natural language query processing |
US7149732B2 (en) * | 2001-10-12 | 2006-12-12 | Microsoft Corporation | Clustering web queries |
US7287025B2 (en) * | 2003-02-12 | 2007-10-23 | Microsoft Corporation | Systems and methods for query expansion |
US7185088B1 (en) * | 2003-03-31 | 2007-02-27 | Microsoft Corporation | Systems and methods for removing duplicate search engine results |
US20040260677A1 (en) * | 2003-06-17 | 2004-12-23 | Radhika Malpani | Search query categorization for business listings search |
US7593929B2 (en) * | 2003-10-22 | 2009-09-22 | International Business Machines Corporation | Context sensitive term expansion with dynamic term expansion |
US20050149499A1 (en) | 2003-12-30 | 2005-07-07 | Google Inc., A Delaware Corporation | Systems and methods for improving search quality |
-
2005
- 2005-11-22 US US11/283,833 patent/US7627548B2/en not_active Expired - Fee Related
-
2006
- 2006-11-22 EP EP06848489A patent/EP1952287A4/en not_active Withdrawn
- 2006-11-22 CN CN2006800510987A patent/CN101361068B/zh active Active
- 2006-11-22 KR KR1020087015058A patent/KR101027999B1/ko not_active IP Right Cessation
- 2006-11-22 WO PCT/US2006/061211 patent/WO2007062397A2/en active Application Filing
- 2006-11-22 CA CA002630808A patent/CA2630808A1/en not_active Abandoned
- 2006-11-22 JP JP2008542520A patent/JP4809441B2/ja not_active Expired - Fee Related
-
2009
- 2009-10-19 US US12/581,544 patent/US8156102B2/en not_active Expired - Fee Related
-
2012
- 2012-03-26 US US13/430,294 patent/US20120203778A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040220905A1 (en) * | 2003-05-01 | 2004-11-04 | Microsoft Corporation | Concept network |
KR100525618B1 (ko) * | 2004-04-22 | 2005-11-03 | 엔에이치엔(주) | 연관 검색 쿼리 추출 방법 및 시스템 |
Also Published As
Publication number | Publication date |
---|---|
CA2630808A1 (en) | 2007-05-31 |
CN101361068A (zh) | 2009-02-04 |
EP1952287A2 (en) | 2008-08-06 |
EP1952287A4 (en) | 2010-01-20 |
US7627548B2 (en) | 2009-12-01 |
US8156102B2 (en) | 2012-04-10 |
JP4809441B2 (ja) | 2011-11-09 |
CN101361068B (zh) | 2012-04-04 |
US20120203778A1 (en) | 2012-08-09 |
US20100036822A1 (en) | 2010-02-11 |
JP2009516890A (ja) | 2009-04-23 |
WO2007062397A2 (en) | 2007-05-31 |
WO2007062397A3 (en) | 2007-12-06 |
US20070118512A1 (en) | 2007-05-24 |
KR20080077382A (ko) | 2008-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101027999B1 (ko) | 사용자 로그로부터의 검색 카테고리 유의어 추론 | |
US9697249B1 (en) | Estimating confidence for query revision models | |
EP1988476B1 (en) | Hierarchical metadata generator for retrieval systems | |
US8229730B2 (en) | Indexing role hierarchies for words in a search index | |
US8468156B2 (en) | Determining a geographic location relevant to a web page | |
US8819047B2 (en) | Fact verification engine | |
US8639708B2 (en) | Fact-based indexing for natural language search | |
US8332426B2 (en) | Indentifying referring expressions for concepts | |
US8868562B2 (en) | Identification of semantic relationships within reported speech | |
US9251206B2 (en) | Generalized edit distance for queries | |
US10585927B1 (en) | Determining a set of steps responsive to a how-to query | |
US11361036B2 (en) | Using historical information to improve search across heterogeneous indices | |
US8364672B2 (en) | Concept disambiguation via search engine search results | |
US20150294007A1 (en) | Performing A Search Based On Entity-Related Criteria | |
US8538970B1 (en) | Personalizing search results | |
EP2181403B1 (en) | Indexing role hierarchies for words in a search index | |
Bitar et al. | A Proposed Query Optimization Method to Boost Students use of Search Engines | |
WO2009029922A2 (en) | Fact-based indexing for natural language search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140324 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |