KR101644817B1 - 탐색 결과들을 생성하는 방법 - Google Patents

탐색 결과들을 생성하는 방법 Download PDF

Info

Publication number
KR101644817B1
KR101644817B1 KR1020147035902A KR20147035902A KR101644817B1 KR 101644817 B1 KR101644817 B1 KR 101644817B1 KR 1020147035902 A KR1020147035902 A KR 1020147035902A KR 20147035902 A KR20147035902 A KR 20147035902A KR 101644817 B1 KR101644817 B1 KR 101644817B1
Authority
KR
South Korea
Prior art keywords
web page
page information
attribute
vendor
sets
Prior art date
Application number
KR1020147035902A
Other languages
English (en)
Other versions
KR20150016973A (ko
Inventor
시아오메이 한
차오 송
후이 웨이
Original Assignee
알리바바 그룹 홀딩 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 알리바바 그룹 홀딩 리미티드 filed Critical 알리바바 그룹 홀딩 리미티드
Publication of KR20150016973A publication Critical patent/KR20150016973A/ko
Application granted granted Critical
Publication of KR101644817B1 publication Critical patent/KR101644817B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

보다 적절한 탐색 결과들을 생성하는 시스템 및 방법이 개시된다. 바람직한 실시예들에서, 복수의 세트들의 웹 페이지 정보가 상기 웹 페이지 정보와 연관된 벤더들에 기초하여 하나 이상의 그룹들로 분류된다; 속성들은 상기 탐색 결과들을 그룹핑하기 위해 사용되고 값은 상기 벤더와 연관된 각각의 속성에 대해 결정된다; 상기 시스템 및 방법은 탐색 질의가 상기 벤더와 연관된 제 1 속성의 속성 값에 대응하는지의 여부에 적어도 부분적으로 기초하여 일 세트의 웹 페이지 정보가 사용자에게 제공된 탐색 결과들에 포함되어야 하는지의 여부를 추가로 결정한다.

Description

탐색 결과들을 생성하는 방법{GENERATING SEARCH RESULTS}
다른 출원들에 대한 상호 참조
본 출원은 모든 목적들을 위해 여기에 참조로서 통합되는, 2012년 7월 5일에 출원된, 탐색 결과들을 생성하기 위한 방법 및 디바이스라는 제목의, 중화 인민 공화국 특허 출원 번호 제201210233248.3호에 대한 우선권을 주장한다.
본 출원은 네트워크 통신 기술에 관한 것이다. 특히, 본 출원은 탐색 결과들을 생성하는 것에 관한 것이다.
통상적으로, 사용자가 탐색 웹 페이지에서 탐색 키워드들을 입력함으로써 탐색을 행할 때, 탐색 엔진은 문서 데이터베이스에 저장된 문서들에 탐색 키워드들을 매칭시킨다. 탐색 키워드들과 텍스트로 또는 의미론적으로 유사한 문서들은 예를 들면, 대응하는 이력적 클릭 레이트들에 따라 평가된다. 탐색 결과들 중에서 보다 높게 평가되는 문서들은 사용자로 다시 전송된다. 예를 들면, 문서는 웹 페이지 또는 광고를 포함할 수 있다.
이러한 종래의 탐색들이 가진 문제점은 탐색들 동안, 종종 문서들에 포함된 키워드들이 탐색 키워드들에 대하여 매칭시키기 위해 사용되고, 일부 문서들은 문서들의 노출을 증가시키도록 의도되지만 사용자들을 속일 수 있는 키워드들을 호도하는 것을 포함할 수 있다는 것이다. 예를 들면, 판매자의 주 제품들이 피아노들이지만 판매자가 피아노들을 판매하는 판매자의 웹 페이지를 보도록 보다 많은 사람들을 끌어당기기 위해, 판매자는 인기있는 모바일 전화에 관련되는 타이틀을 웹 페이지에 제공한다. 인기있는 모바일 전화를 탐색한 사용자들이 판매자에 대응하는 링크 상에서 클릭할 때, 그들은 피아노들에 관련된 웹 페이지 정보를 발견하고, 이것은 사용자들이 탐색하기를 의도한 것이 아니다. 따라서, 사용자의 시간은 낭비되고 또한 사용자들은 그들이 실제로 찾았던 제품들 또는 정보를 발견하기 위해 부가적인 탐색들을 수행할 필요가 있을 수 있다. 이들 반복된 탐색들은 서버 상에서의 부가적인 부담을 부가한다.
본 발명은 프로세서; 장치; 시스템; 물질의 구성; 컴퓨터 판독가능한 저장 매체 상에 구현된 컴퓨터 프로그램 제품; 및/또는 프로세서에 결합된 메모리 상에 저장되고/되거나 그것에 의해 제공된 지시들을 실행하도록 구성된 프로세서와 같은, 프로세서로서 포함하는, 다수의 방식들로 구현될 수 있다. 본 명세서에서, 이들 구현들, 또는 본 발명이 취할 수 있는 임의의 다른 형태는 기술들로서 불리울 수 있다. 일반적으로, 개시된 프로세스들의 단계들의 순서는 본 발명의 범위 내에서 변경될 수 있다. 달리 서술되지 않는다면, 태스크를 수행하도록 구성되는 것으로서 설명된 프로세서 또는 메모리와 같은 구성요소는 주어진 시간에 태스크를 수행하도록 임시로 구성되는 일반 구성요소 또는 태스크를 수행하기 위해 제조되는 특정 구성요소로서 구현될 수 있다. 여기에 사용된 바와 같이, 용어('프로세서')는 컴퓨터 프로그램 지시들과 같은, 데이터를 프로세싱하도록 구성된 하나 이상의 디바이스들, 회로들, 및/또는 프로세싱 코어들을 나타낸다.
본 발명의 하나 이상의 실시예들의 상세한 설명은 본 발명의 원리들을 예시하는 첨부한 도면들과 함께 이하에 제공된다. 본 발명은 이러한 실시예들에 관련하여 설명되지만, 본 발명은 임의의 실시예에 제한되지 않는다. 본 발명의 범위는 단지 청구항들에 의해서만 제한되고 본 발명은 다수의 대안들, 수정들 및 등가물들을 포함한다. 다수의 특정 세부사항들은 본 발명의 철저한 이해를 제공하기 위해 다음의 설명에 제시된다. 이들 세부사항들은 예를 위해 제공되고 본 발명은 이들 특정 세부사항들의 일부 또는 모두 없이 청구항들에 따라 실시될 수 있다. 명료함을 위해, 본 발명에 관련된 기술 분야들에 알려져 있는 기술적 자료는 본 발명이 불필요하게 모호해지지 않도록 상세히 설명되지 않는다.
탐색 결과들을 생성하는 실시예들이 여기에 설명된다. 하나 이상의 탐색 키워드들을 포함하는 탐색 질의가 사용자로부터 수신된다. 다양한 실시예들에서, 탐색 질의는 웹 페이지 정보의 세트들의 데이터베이스에 대하여 매칭된다. 다양한 실시예들에서, 웹 페이지 정보의 세트는 특정한 웹 페이지 또는 광고와 연관된 콘텐트 및/또는 메타데이터를 나타낸다. 웹 페이지 정보의 세트는 벤더 및 상기 벤더에 의해 판매된 하나 이상의 제품들과 연관된 속성들을 포함할 수 있다. 상기 웹 페이지 정보의 세트들은 연관된 벤더(예로서, 그룹에서 웹 페이지 정보의 세트의 각각을 제출한 벤더)에 의해 분류되고 특정한 벤더와 연관된 웹 페이지 정보의 각각의 그룹에 대해, 제 1 필드 값이 상기 그룹에서의 웹 페이지 정보의 세트(들)로부터 추출되고 벤더와 연관된 제 1 속성 및 또한 상기 벤더와 연관된 그룹에서의 웹 페이지 정보의 세트(들)의 각각에 대한 속성 값으로서 사용된다. 일부 실시예들에서, 제 1 속성은 주 제품 속성이며 벤더에 의해 판매된 1차 유형(들)의 제품들을 정확하게 나타내기 위해 추정된다. 일부 실시예들에서, 값은 벤더 그룹의 웹 페이지 정보의 세트들에서의 핵심 제품 단어이다. 일부 실시예들에서, 탐색 키워드들은 웹 페이지 정보의 세트들에 대응하는 제 1 속성들의 값들에 비교되고 제 1 속성의 값들이 탐색 키워드들과 매칭되는 것들이 사용자에게 리턴될 탐색 결과들에 포함된다.
본 발명의 다양한 실시예들이 다음의 상세한 설명 및 첨부한 도면들에 개시된다.
도 1은 탐색 결과들을 생성하기 위한 시스템의 일 실시예를 도시한 도면.
도 2는 탐색 결과들을 생성하기 위한 프로세스의 일 실시예를 도시한 흐름도.
도 3은 탐색 결과들을 생성하기 위한 프로세스의 일 실시예를 도시한 흐름도.
도 4는 탐색 결과들을 생성하기 위한 시스템의 일 실시예를 도시한 도면.
도 5는 탐색 결과들을 생성하기 위한 시스템의 일 실시예를 도시한 도면.
도 1은 탐색 결과들을 생성하기 위한 시스템의 일 실시예를 도시한 도면이다. 상기 예에서, 시스템(100)은 클라이언트 디바이스(102), 네트워크(104), 서버(106), 및 데이터베이스(108)를 포함한다.
클라이언트 디바이스(102)는 네트워크(104)를 통해 서버(106)와 통신하도록 구성된다. 클라이언트 디바이스(102)는 랩탑 컴퓨터인 것으로 도시되고, 클라이언트 디바이스(102)의 다른 예들은 데스크탑 컴퓨터, 이동 디바이스, 태블릿 디바이스, 스마트 폰, 및/또는 임의의 다른 컴퓨팅 디바이스를 포함한다. 클라이언트 디바이스(102)는 사용자가 문자들을 입력할 수 있는 입력 인터페이스(예로서, 물리 키보드 또는 터치스크린) 및 또한 정보가 사용자를 위해 디스플레이될 수 있는 디스플레이 인터페이스를 포함한다. 다양한 실시예들에서, 사용자는 탐색 질의를 탐색 페이지로 입력하기 위해 클라이언트 디바이스(102)에서 실행하는 웹 브라우저 애플리케이션을 사용할 수 있다. 탐색 질의는 클라이언트 디바이스(102)로부터 서버(106)로 전송된다. 서버(106)는 탐색 결과들을 클라이언트 디바이스(102)로 리턴하도록 구성된다. 일부 실시예들에서, 서버(106)로부터 리턴된 탐색 결과들의 적어도 일부는 웹 페이지 정보의 세트들이다. 웹 페이지 정보의 세트는 웹 페이지(하나 이상의 제품들을 판매하는 것과 연관된) 또는 광고와 연관될 수 있다.
웹 페이지 정보의 세트들은 데이터베이스(108)에 저장된다. 웹 페이지 정보의 각각의 세트는 하나 이상의 제품들의 벤더에 의해 제출된다. 그러므로, 웹 페이지 정보의 콘텐트들(예로서, 제품 단어들, 연관된 산업들, 제품 속성들, 카테고리, 벤더 정보 등)은 연관된 벤더에 의해 결정된다. 웹 페이지 정보의 세트들의 벤더들에 의한 제출로 인해, 때때로 웹 페이지 정보의 세트는 벤더와 연관된 1차 유형들의 제품들 또는 1차 산업이 아닌 제품 또는 산업에 관련된 정보를 포함할 수 있다. 일부 실시예들에서, 데이터베이스(108)는 또한 예를 들면, 탐색 결과들 중에서 이전 수신된 탐색 질의들 및 이전 선택된 세트들의 정보와 연관된 이력 데이터를 저장한다.
서버(106)는 벤더들에 기초하여 데이터베이스(108)에 저장된 웹 페이지 정보의 세트들을 그룹들로 분류하도록 구성된다. 달리 말하자면, 동일한 벤더와 연관된 웹 페이지 정보의 세트들은 동일한 그룹으로 분류된다. 서버(106)는 벤더와 연관된 그룹과 연관된 웹 페이지 정보의 세트들로부터 추출된 값들에 기초하여 벤더와 연관된 적어도 제 1 속성 값을 결정하도록 구성된다. 다양한 실시예들에서, 제 1 속성은 주 제품 속성을 포함하고, 이것은 벤더에 의해 제공된 하나 이상의 1차 제품들을 나타낸다. 다양한 실시예들에서, 서버(106)는 웹 페이지 정보의 세트와 연관된 벤더와 연관된 제 1 속성 값이 탐색 질의에 포함된 탐색 키워드에 대응하는지에 기초하여 상기 웹 페이지 정보의 세트가 상기 탐색 결과들에 포함되어야 하는지의 여부를 결정하도록 구성된다. 제 1 속성 값이 적어도 탐색 키워드에 대응하는 경우에, 그 후 웹 페이지 정보의 세트가 탐색 결과들에 포함된다. 예를 들면, 제 1 속성이 주 제품 속성이라면, 단지 그것의 주 제품들이 탐색 질의에 적절한 벤더들과 연관된 웹 페이지 정보의 세트들이 탐색 결과들에 포함된다.
도 2는 탐색 결과들을 생성하기 위한 프로세스의 일 실시예를 도시한 흐름도이다. 일부 실시예들에서, 프로세스(200)는 도 1의 시스템(100)에서 구현된다.
202에서, 하나 이상의 탐색 키워드들을 포함하는 탐색 질의가 사용자로부터 수신된다. 예를 들면, 탐색 질의는 웹페이지에서 탐색 엔진으로 사용자에 의해 입력될 수 있다.
204에서, 탐색 질의에 매칭되는 웹 페이지 정보의 복수의 세트들이 결정된다. 일부 실시예들에서, 탐색 질의는 웹 페이지 정보 데이터베이스에 저장된 웹 페이지 정보의 세트들에 대해 비교되고 웹 페이지 정보의 예비 매칭 세트들이 결정된다. 웹 페이지 정보의 세트는 특정한 벤더에 의해 제출되고 그러므로 상기 벤더에 의해 제공된 콘텐트 및/또는 메타데이터를 포함한다. 일부 실시예들에서, 웹 페이지 정보의 세트의 콘텐트 및/또는 메타데이터가 다양한 필드들에 저장된다. 예를 들면, 웹 페이지 정보의 매칭 세트는 적어도 탐색 질의의 키워드와 매칭되거나 그것에 유사한 적어도 키워드를 포함하는 웹 페이지 정보의 세트이다. 그러나, 웹 페이지 정보의 예비 매칭 세트들은 탐색 결과들로서 사용자에게 직접 리턴되지 않는다. 이하에 설명될 바와 같이, 적어도 웹 페이지 정보의 예비 매칭 세트들의 서브세트는 탐색 결과로서 사용자에게 리턴되도록 선택된다.
206에서, 웹 페이지 정보의 복수의 세트들이 웹 페이지 정보의 복수의 세트들 각각의 세트들과 연관된 벤더들에 기초하여 하나 이상의 그룹들로 분류된다. 웹 페이지 정보의 예비 매칭 세트들은 다양한 그룹들로 분류되고, 여기에서 동일한 그룹에서의 웹 페이지 정보의 세트들은 동일한 벤더와 연관된다. 달리 말하자면, 동일한 벤더에 의해 제출되는 웹 페이지 정보의 세트들은 동일한 그룹으로 분류된다.
일부 실시예들에서, 질의에 응답하여 웹 페이지 정보의 예비 매칭 세트들을 분류하기보다는, 데이터베이스에 저장된 웹 페이지 정보의 세트들 모두는 질의들을 프로세싱하는 것에 앞서 연관된 벤더들에 기초하여 그룹들로 분류된다.
208에서, 벤더와 연관된 웹 페이지 정보의 세트들의 그룹에 대해, 웹 페이지 정보의 세트들의 그룹에 포함된 값은 벤더와 연관된 제 1 속성의 속성 값으로서 결정된다. 일부 실시예들에서, 웹 페이지 정보의 세트들의 그룹들 각각에 대해, 특정한 필드 값이 그룹과 연관된 벤더와 연관될 제 1 속성에 할당된다. 다양한 실시예들에서, 벤더와 연관된 제 1 속성은 주 제품 속성이다. 일부 실시예들에서, 웹 페이지 정보의 세트는 다음의 필드들 중 적어도 하나 이상을 포함한다: 제품 단어들, 연관된 산업들, 카테고리, 제품 속성들, 발행인, 및 벤더 정보(예로서, 벤더 어드레스, 벤더명, 및 다른 이러한 정보).
그룹의 웹 페이지 정보의 세트들 각각의 제 1 지정 필드 값이 추출된다. 예를 들면, 제 1 지정 필드는 웹 페이지 정보의 세트의 제품 단어 필드이다. 벤더와 연관된 주 제품 속성은 웹 페이지 정보의 세트들의 그룹과 연관된 벤더가 주로 판매하는 제품들 또는 특정 제품들의 유형들을 설명하기 위해 사용된다. 일부 실시예들에서, 주 제품 속성의 값들은 벤더와 연관된 웹 페이지 정보의 세트들의 제품 단어 필드들로부터 추출된 핵심 제품 단어들을 포함한다. 예를 들면, 벤더와 연관된 웹 페이지 정보의 세트들의 제품 단어 필드들의 값들이 추출되고 고유한, 핵심 제품 단어들이 이들 값들로부터 추출될 수 있다. 다양한 실시예들에서, 핵심 제품 단어는 제품의 유형을 나타내는 단어 또는 구절(통상적으로 명사)이다. 예를 들면, 추출된 값들로부터 핵심 제품 단어들을 획득하기 위해, 일반적인 품사 태깅 툴이 각각의 추출된 제품 단어 필드 값의 품사들(명사, 동사, 형용사 등)을 획득하기 위해 사용될 수 있다. 추출된 제품 단어 필드 값들로부터 추출된 하나 이상의 (고유한) 명사들의 세트는 핵심 제품 단어들이 된다. 또한, 예를 들면, 반드시 단지 명사들인 것은 아니며 핵심 제품 단어들을 구성하는 구절들의 사전이 또한 추출된 제품 단어 필드 값들로부터 핵심 제품 단어들을 추출하기 위해 사용될 수 있다. 예를 들면, "삼성" 및 "브랜드"는 핵심 제품 단어들 사전에 포함되지 않지만 "태블릿들"이 포함된다면, 제품 단어 필드 값("삼성 브랜드 태블릿들")의 핵심 제품 단어들은 "태블릿들"이며, 이것은 주 제품 속성의 값으로서 사용된다. 일부 실시예들에서, 이하에 추가로 설명될 바와 같이, 발생률은 핵심 제품 단어들 각각의 세트에 대해 결정되며(발생률은 핵심 제품 단어들의 세트가 벤더에 대해 결정된 핵심 제품 단어들의 세트들 모두 내에 나타나는 빈도이다) 제 1 사전 설정된 임계 값을 초과하는 대응하는 발생률들을 가진 핵심 제품 단어들의 이들 세트들만이 벤더와 연관된 주 제품 속성의 속성 값들로서 사용된다. 벤더와 연관된 주 제품 속성은 또한 벤더와 연관된 웹 페이지 정보의 모든 세트와 연관된다.
일부 실시예들에서, 그룹의 웹 페이지 정보의 세트들 각각의 제 2 지정 필드 값이 추출되고 벤더와 연관된 제 2 속성을 위해 사용될 것이다. 다양한 실시예들에서, 벤더와 연관된 제 2 속성은 주 산업 속성이다. 예를 들면, 제 2 지정 필드는 웹 페이지 정보의 세트들의 연관된 산업 필드이다. 주 산업 속성은 웹 페이지 정보의 세트들과 연관된 벤더가 연관되는 1차 유형(들)의 산업들을 설명하기 위해 사용될 수 있다. "주 산업" 속성 값의 일 예는 "통신 장비"이다. 일부 실시예들에서, 이하에 추가로 설명될 바와 같이, 발생률은 각각의 추출된 연관된 산업들 값에 대해 결정되고 제 2 사전 설정된 임계 값을 초과하는 대응하는 발생률들을 가진 단지 이들 연관된 산업들 값은 벤더와 연관된 주 산업 속성의 속성 값들로서 사용된다. 벤더와 연관된 주 산업 속성은 또한 벤더와 연관된 웹 페이지 정보의 모든 세트와 연관된다.
웹 페이지 정보의 다양한 세트들이 동일한 제품과 연관될 수 있지만 웹 페이지 정보의 각각의 세트는 약간 상이한 필드 값들을 포함할 수 있다(예를 들면, 웹 페이지 정보의 세트들이 이들 필드 값들에 대해 상이한 워딩들을 특정할 수 있는 그것들 각각의 벤더들에 의해 제출되었기 때문에). 다음은 특정한 필드들 및 그것들 각각의 값들을 포함하는 웹 페이지 정보의 세트이다.
제품 단어들: 삼성 태블릿들
연관된 산업(들): 통신 장비
카테고리: 소비자 디바이스들
유형: GSM
컬러: 적색
원산지: 광저우
벤더: 사용자 1, 알리바바 네트워크 테크놀로지 주식회사(Alibaba Network Techonology Co., Ltd.)
상기 나열된 예시적인 벤더에 대해, 사용자 1, 알리바바 네트워크 테크놀로지 주식회사, 다음의 주 제품 속성 값들 및 주 산업 속성 값들은 상기 나열된 웹 페이지 정보의 세트 및 또한 상기 벤더와 연관되는 웹 페이지 정보의 다른 세트들에 기초하여 추출될 수 있다.
주 제품: 모바일 전화들, MP3들, 컴퓨터들, 전화기들
주 산업: 통신 장비, 비즈니스 서비스들.
특정한 벤더에 대한 주 제품 속성 및 주 산업 속성의 값들을 선택하는 일 예가 이하에 있다.
먼저, 벤더와 연관된 웹 페이지 정보의(예로서, 웹 페이지 정보의 예비 매칭 세트들의) 세트들이 발견된다. 그 후 제품 단어 필드들 및 웹 페이지 정보의 세트들에 대응하는 연관된 산업 필드들의 값들 모두가 추출된다. 각각의 제품 단어 필드 값(또는 그로부터 추출된 핵심 제품 단어들의 세트) 및 각각의 연관된 산업 필드 값에 대해, 웹 페이지 정보의 세트들 중에서 발생률들이 결정된다. 그 후 발생률들이 제 1 사전 설정된 임계 값을 초과하는 이들 제품 단어 필드 값들(또는 그로부터 추출된 핵심 제품 단어들의 세트)이 벤더에 대한 주 제품 속성의 값들로서 선택되고 발생률들이 제 2 사전 설정된 임계 값을 초과하는 이들 연관된 산업 값들이 벤더에 대한 주 산업 속성의 값들로서 선택된다. 일부 실시예들에서, 주 제품 속성을 위해 선택된 값들은 벤더와 연관된 웹 페이지 정보의 세트들의 제품 단어 필드들로부터 추출된 값들로부터 결정된 핵심 제품 단어들을 포함한다. 예를 들면, 제 1 사전 설정된 임계 값은 10%이다. 제품 단어(A)는 벤더와 연관된 웹 페이지 정보의 모두 중에서 50회 나타난다. 제품 단어(B) 및 제품 단어(C)는, 벤더와 연관된 웹 페이지 정보의 모두 중에서, 각각 30회 및 2회 나타난다. 제품 단어(C)의 발생률은 2/(50+30+2)=2.4%이며, 이것은 10%의 제 1 사전 설정된 임계 값보다 작다. 그러므로, 제품 단어(C)는 벤더의 주 제품 속성에 대응하는 속성 값으로서 선택되지 않는다. 그러나 제품 단어들(A(50/(50+30+2)=61.0%) 및 B(30/(50+30+2)=36.6%)의 각각의 발생률은 10%의 제 1 사전 설정된 임계 값보다 크며, 그러므로 벤더에 대응하는 핵심 제품 단어들이며 또한 벤더의 주 제품 속성 값의 값들로서 선택된다.
210에서, 벤더와 연관된 웹 페이지 정보의 세트들의 그룹의 웹 페이지 정보의 세트가 탐색 결과들에 포함되어야 하는지의 여부가, 탐색 질의가 벤더와 연관된 제 1 속성(예로서, 주 제품 속성 및/또는 주 산업 속성)의 속성 값에 대응하는지의 여부에 적어도 부분적으로 기초하여 결정된다. 일단 주 제품 속성 값(들) 및/또는 주 산업 속성 값(들)이 벤더에 대해 선택된다면; 벤더와 연관된 웹 페이지 정보의 세트가 잠재적으로 사용자에 리턴될 탐색 결과들에 포함되어야 하는지의 여부는 탐색 질의의 탐색 키워드들이 주 제품 속성 값(들) 및/또는 주 산업 속성 값(들) 중 임의의 것에 매칭하는지의 여부에 의존한다. 주 제품 속성 값(들) 및/또는 주 산업 속성 값(들)은 벤더와 연관된 제품들/산업들의 유형들을 정확하게 나타내도록 추정되기 때문에, 벤더에 의해 판매된 1차 유형들의 제품들에 덜 적절하지만 벤더에 의해 제출된 웹 페이지 정보의 세트들에 포함될 수 있는 다른 제품 단어 필드 값들 및 연관된 산업 필드 값들은 탐색 질의에 대하여 매칭시키기 위해 사용되지 않을 것이다. 그러므로, 이러한 덜 적절한 제품 필드 값들의 유의성은 주 제품 속성 및/또는 주 산업 속성의 사용과 함께 약화된다.
일부 실시예들에서, 주 제품 속성 값(들) 및/또는 주 산업 속성 값(들)이 유사성 또는 정확한 매칭에 기초하여 탐색 키워드들의 적어도 일부에 대응하는지가 결정될 수 있다. 예를 들면, 주 제품 속성 값이 "모바일 전화"이며 탐색 키워드들이 또한 "모바일 전화"이면, 두 개는 정확한 매칭이다. 일부 실시예들에서, 주 제품 속성 값(들) 및/또는 주 산업 속성 값(들)은 두 개의 단어들 사이에서의 사전 설정된 대응성에 기초하여 탐색 키워드들의 적어도 일부와 부합하도록 결정될 수 있다. 예를 들면, 주 제품 속성 값이 "모바일 전화"이며 탐색 키워드가 "노키아(Nokia)"이고 "모바일 전화" 및 "노키아" 사이에서의 사전 설정된 대응성이 사전-확립되었다면, 두 개의 단어들은 사전 설정된 대응성에 따라 매칭된다.
일부 실시예들에서, 탐색 키워드가 웹 페이지 정보의 세트와 연관된 벤더의 주 제품 속성 값(들) 또는 주 산업 속성 값(들) 중 하나와 매칭한다면, 웹 페이지 정보의 세트는 잠재적으로 사용자에게 리턴될 탐색 결과들에 포함된다. 그러나, 탐색 키워드가 웹 페이지 정보의 세트와 연관된 벤더의 주 제품 속성 값(들) 및 주 산업 속성 값(들) 중 어느 하나와도 매칭하지 않는다면, 웹 페이지 정보의 세트는 사용자에게 리턴될 탐색 결과들로부터 제외된다.
탐색 결과들을 결정하기 위해 각각의 벤더와 연관된 할당된 주 제품 속성 값(들) 및/또는 주 산업 속성 값(들)을 사용함으로써, 그것의 주 제품 속성 값(들) 및/또는 주 산업 속성 값(들)이 탐색 질의에 적절하지 않은 웹 페이지 정보의 이들 세트들이 걸러 내어지며 탐색 결과들로부터 제외된다. 벤더가 웹 페이지 정보의 세트들에서의 거짓 정보를 공개한다면, 이러한 웹 페이지 정보는 이러한 웹 페이지 정보와 연관된 주 제품들 및/또는 주 산업들이 탐색 질의와 연관된 제품들에 관련되지 않음을 결정하는 것을 통해 걸러 내어질 수 있다. 또한, 탐색 질의에 무관한 웹 페이지 정보의 주 제품들 또는 주 산업들이 탐색 결과들로부터 제거되기 때문에, 탐색 엔진 서버들이 탐색 질의를 전송한 클라이언트에 탐색 결과 데이터를 송신할 때, 송신된 데이터의 볼륨은 그에 따라 감소된다. 그 결과, 네트워크 송신 속도들은 개선될 것이며, 네트워크 혼잡은 완화될 것이다.
도 3은 탐색 결과들을 생성하기 위한 프로세스의 일 실시예를 도시한 흐름도이다. 일부 실시예들에서, 프로세스(300)는 도 1의 시스템(100)에 구현된다.
프로세스(300)는 프로세스(200)와 유사하지만 부가적으로 탐색 질의와 충분히 유사하지 않은 웹 페이지 정보의 세트들의 걸러내기 및 적어도 일 부분이 사용자에게 리턴되는 탐색 결과들의 평가를 포함한다.
302에서, 하나 이상의 탐색 키워드들을 포함하는 탐색 질의가 사용자로부터 수신된다. 예를 들면, 탐색 질의는 사용자에 의해 웹페이지에서의 탐색 엔진에 입력될 수 있다.
304에서, 탐색 질의에 매칭하는 웹 페이지 정보의 복수의 세트들이 결정된다. 일부 실시예들에서, 탐색 질의는 웹 페이지 정보 데이터베이스에 저장된 웹 페이지 정보의 세트들에 대해 비교되고 웹 페이지 정보의 예비 매칭 세트들이 결정된다.
306에서, 탐색 질의에 대하여 웹 페이지 정보의 제 1 세트와 연관된 유사성 값에 적어도 부분적으로 기초하여 웹 페이지 정보의 복수의 세트들로부터 웹 페이지 정보의 제 1 세트를 걸러낼지의 여부가 결정된다. 일부 실시예들에서, 306은 추가 프로세싱으로부터 탐색 질의와 충분히 유사하지 않은 웹 페이지 정보의 예비 매칭 세트들(또는 웹 페이지 정보의 모든 세트들의 데이터베이스)의 세트들을 걸러내기 위해(즉, 제외하기 위해) 선택적으로 수행된다. 일부 실시예들에서, 웹 페이지 정보의 세트가 탐색 질의와 충분히 유사한지의 여부를 결정하기 위해, 유사성 값이 탐색 질의에 대하여 웹 페이지 정보의 세트에 대해 결정되고 유사성 값이 사전 설정된 유사성 임계 값보다 작다면, 웹 페이지 정보의 세트는 탐색 질의와 불충분하게 유사한 것으로 고려되고 그러므로 걸러내어진다. 웹 페이지 정보의 예비 매칭 세트들(또는 웹 페이지 정보의 모든 세트들의 데이터베이스)로부터의 웹 페이지 정보의 각각의 세트 및 탐색 질의 사이에서의 유사성 값은 임의의 적절한 기술에 의해 결정될 수 있다.
다음은 웹 페이지 정보의 세트 및 탐색 질의 사이에서의 유사성 값을 결정하는 일 예시적인 기술이다.
탐색 질의의 탐색 키워드들과 연관된 하나 이상의 핵심 제품 단어들이 추출된다. 사용자들이 탐색 키워드들을 제공하는 엄격한 규칙들이 없기 때문에, 탐색 질의에서의 대다수의 탐색 키워드들은 구어이다. 때때로, 탐색 질의는 사용자들이 탐색하길 원하는 제품들의 이름들과 연관된 단어들 및 또한 제품들의 이름들과 연관된 단어들 외에 서술 구들을 포함한다. 이러한 서술 구들은 매우 다양할 수 있다. 예를 들면, 사용자가 노인에 의해 사용되기에 적절한 모바일 전화를 구매하기를 원할 때, 그 또는 그녀는 웹 페이지 상에 다음의 탐색 키워드들을 입력할 수 있다: "노인에 의해 사용될 수 있는 노키아 모바일 전화" 또는 "노인에 의해 사용될 다기능 모바일 전화, 노키아". 탐색된 웹 페이지 정보는 노인에 적합한 컴퓨터들 및 노키아 디스플레이 디바이스들을 판매할 수 있으며 사용자의 탐색 키워드들에 관련되는 다른 이러한 웹 페이지 정보는, 모든 이러한 아이템들이 반드시, 사용자가 실제로 구매하기를 원하는 것인, 노인들에 적절한 모바일 전화들인 것은 아니다. 먼저 탐색 질의에 포함된 핵심 제품 단어들만을 추출하며 웹 페이지 정보의 세트와의 유사성 값을 결정하기 위해 탐색 질의와 연관된 핵심 제품 단어들을 사용하는 것이 바람직하다. 예를 들면, 탐색 질의의 핵심 제품 단어들을 획득하기 위해, 일반적인 품사 태깅 툴은 탐색 질의에서의 각각의 탐색 키워드의 품사들(명사, 동사, 형용사 등)을 획득하기 위해 사용될 수 있다. 탐색 질의로부터 추출된 하나 이상의 명사들의 세트는 핵심 제품 단어들이 된다. 탐색 질의는 적어도 하나의 명사를 포함한다는 것이 추정된다. 탐색 질의가 단지 하나의 명사를 포함한다면, 명사는 핵심 제품 단어이다. 탐색 질의가 두 개의 명사들(A 및 B)을 포함한다면, A 및 B 사이에서의 관계가 평가된다. 명사(A)가 명사(B)를 수정하는 높은 확률이 있다면, 명사(B)는 핵심 제품 단어이다. 반대의 상황에서, 명사(A)가 핵심 제품 단어일 것이다. 확률들 사이에서의 차이가 매우 낮다면 또는 두 개의 명사들이 매우 유사하다면, 둘은 양쪽 모두 핵심 제품 단어들이다. 탐색 질의가 3개 이상의 명사들을 포함한다면, 마지막 명사(C)는 핵심 제품 단어로서 간주되고, C에 대한 이전 두 개의 명사들의 관계는 두 개의 명사들 중 하나 양쪽 모두가 핵심 제품 단어들인지 여부를 결정하기 위해 평가된다(이전에 설명된 바와 같이, 단지 두 개의 명사들만이 포함되는 상황들과 유사한).
웹 페이지 정보의 세트와 연관된 하나 이상의 핵심 제품 단어들이 웹 페이지 정보의 세트(예로서, 그것의 제품 단어 필드와 같은 특정한 필드의 값)로부터 추출된다. 웹 페이지 정보의 세트의 핵심 제품 단어들은 탐색 질의에 대해 상기 설명된 바와 같이 동일한 예시적인 기술을 사용하여 결정될 수 있다.
핵심 제품 단어들이 탐색 질의 및 웹 페이지 정보의 세트에 대해 결정된 후, 다양한 카테고리들에서의 클릭 레이트는 탐색 질의로부터 추출된 핵심 제품 단어들의 세트 및 웹 페이지 정보의 세트로부터 추출된 핵심 제품 단어들 각각의 세트에 대해 결정된다. 클릭 레이트 카테고리 분포는 웹 페이지 정보의 세트로부터 추출된 핵심 제품 단어들 각각의 세트에 대해 결정된다. 예를 들면, 웹 페이지 정보의 세트와 연관된 핵심 제품 단어들의 세트와 연관된 클릭 레이트 카테고리 분포는 동일한 세트의 제품 단어들을 포함하는 웹 페이지 정보의 이력 세트들에 포함된 카테고리들을 포함할 수 있다. 클릭 레이트 카테고리 분포는 탐색 질의와 연관된 핵심 제품 단어들 각각의 세트에 대해 결정된다. 예를 들면, 탐색 질의와 연관된 핵심 제품 단어들의 세트와 연관된 클릭 레이트 카테고리 분포는 핵심 제품 단어들의 세트를 포함하는 탐색 질의들에 대해 이력적으로 리턴된 탐색 결과들 중에서 선택된 웹 페이지 정보의 세트와 연관된 카테고리들을 포함할 수 있다. 클릭 레이트 카테고리 분포는 각각의 상이한 카테고리에 대한 통계 표현을 포함할 수 있다.
클릭 레이트 카테고리 분포가 탐색 질의와 연관된 핵심 제품 단어들의 세트 및 웹 페이지 정보의 세트와 연관된 핵심 제품 단어들의 세트의 각각에 대해 결정된다는 것을 고려해볼 때, 탐색 질의 및 웹 페이지 정보의 세트 사이에서의 유사성 값은 예시적인 수학식, 이하의 수학식 (1)을 사용하여 결정될 수 있다:
Figure 112014124178743-pct00001
(1)
수학식 1에서, D(QP, DP)는 웹 페이지 정보의 세트 및 탐색 질의 사이에서의 유사성 값을 나타내고, QP는 탐색 질의의 핵심 제품 단어들의 클릭 레이트 카테고리 분포를 나타내고, DP는 웹 페이지 정보의 세트에서의 핵심 제품 단어들의 클릭 레이트 카테고리 분포를 나타내고, w는 탐색 질의와 연관된 클릭 레이트 카테고리 분포 및 웹 페이지 정보의 세트와 연관된 클릭 레이트 카테고리 분포에서의 상이한 카테고리들의 최대 수를 나타내고, PQ(w)는 탐색 질의의 카테고리(w)에 대한 클릭 레이트를 나타내며, PD(w)는 웹 페이지 정보의 특정한 세트에서의 핵심 제품 단어들의 카테고리(w)에 대한 클릭 레이트를 나타낸다.
그 후 유사성 값(예로서, D(QP, DP))은 사전 설정된 유사성 임계 값에 대해 비교된다. 일부 실시예들에서, 유사성 값이 사전 설정된 유사성 임계 값보다 작다면, 유사성 값과 연관된 웹 페이지 정보의 세트는 걸러내어진다.(예로서, 추가 프로세싱으로부터 제외된다). 일부 실시예들에서, 유사성 값이 사전 설정된 유사성 임계 값과 같거나 그보다 크다면, 유사성 값과 연관된 웹 페이지 정보의 세트가 보유된다(예로서, 추가 프로세싱에 포함된다).
308에서, 웹 페이지 정보의 복수의 세트들은 웹 페이지 정보의 복수의 세트들 각각의 세트들과 연관된 벤더들에 기초하여 하나 이상의 그룹들로 분류된다. 306에서 걸러내어지지 않은 웹 페이지 정보의 예비 매칭 세트들은 다양한 그룹들로 분류되고, 여기에서 동일한 그룹에서의 웹 페이지 정보의 세트들은 동일한 벤더와 연관된다. 달리 말하자면, 동일한 벤더에 의해 제출되는 웹 페이지 정보의 세트들은 동일한 그룹으로 분류된다.
310에서, 벤더와 연관된 웹 페이지 정보의 세트들의 그룹에 대해, 웹 페이지 정보의 세트들의 그룹에 포함된 값은 벤더와 연관된 주 제품 속성의 속성 값으로서 결정된다. 예를 들면, 310은 도 2의 프로세스(200)의 208과 유사한 방식으로 수행될 수 있다. 도 2의 프로세스(200)의 208에 대해 상기 설명된 바와 같이, 벤더와 연관된 그룹에서의 웹 페이지 정보의 세트들의 제 2 지정 필드는 벤더와 연관된 주 산업 속성을 결정하기 위해 사용될 수 있다.
312에서, 웹 페이지 정보의 세트들의 그룹의 웹 페이지 정보의 세트는 벤더와 연관된 주 제품 속성의 속성 값에 대응하는 탐색 질의에 적어도 부분적으로 기초하여 탐색 결과들에 포함되도록 결정된다. 예를 들면, 312는 도 2의 프로세스(200)의 210과 유사한 방식으로 수행될 수 있다. 도 2의 프로세스(200)의 210에 대해 상기 설명된 바와 같이, 웹 페이지 정보의 세트는 그것의 벤더와 연관된 주 제품 속성 값 또는 그것의 벤더와 연관된 주 산업 속성 값 중 적어도 하나가 탐색 질의의 탐색 키워드에 대응한다면 탐색 결과들에 포함되도록 결정된다. 또한, 웹 페이지 정보의 세트는 그것의 벤더와 연관된 주 제품 속성 값도 그것의 벤더와 연관된 주 산업 속성 값도 탐색 질의의 탐색 키워드에 대응하지 않는다면 탐색 결과들로부터 제외되도록 결정된다.
314에서, 탐색 결과들이 평가된다. 일부 실시예들에서, 탐색 결과들에서 312에 포함되는 것으로 결정된 웹 페이지 정보의 세트들은 선택적으로 사용자에게 디스플레이되기 이전에 평가된다.
탐색 결과들은 임의의 적절한 기술에 기초하여 평가될 수 있다. 일 예시적인 평가 기술은 다음과 같이 설명된다:
탐색 질의의 하나 이상의 특성들이 결정된다. 예를 들면, 특성들은 탐색 질의가 수신된 클라이언트 디바이스와 연관된 위치 정보를 포함할 수 있다. 또한, 클릭 확률 예측 모델이 결정된다. 클릭 확률 예측 모델은 웹 페이지 정보의 세트들에 대응하는 및 탐색 질의들과 연관된 상이한 특성 정보에 대한 예측된 클릭 레이트 확률들을 포함한다. 예를 들면, 예측된 클릭 레이트 확률들은 이력 탐색들로부터의 기록된 탐색 키워드들, 이전 디스플레이된 탐색 결과들 및 탐색 결과 페이지 상에서의 그것들 각각의 위치들, 및 이력 탐색 결과들 중에서 사용자에 의해 선택된 웹 페이지 정보의 세트들과 같은 이력 정보에 기초할 수 있다. 더욱이, 사용자에 의해 선택된 웹 페이지 정보의 세트들에 대하여 탐색 키워드들과 연관된 특성 정보(예로서, 대중적인 또는 인기있는 탐색 키워드들과 연관된 위치들 및 웹 페이지 정보에 대한 탐색 키워드들의 상관들과 같은 정보)는 이들 이력 탐색들로부터 결정된다. 예를 들면, 기계 학습 방법들(예를 들면, 논리 회귀 모델과 같은)이 특성 정보를 결정하기 위해 이러한 이력 데이터 상에서 사용될 수 있으며 훈련은 어떤 종류의 클릭 레이트가 탐색 결과 페이지에 이전에 디스플레이된 웹 페이지 정보의 각각의 세트에 대하여 탐색 질의와 연관된 어떤 특성들에 대해 획득될 수 있는지를 결정하기 위해 행해진다. 예를 들면, 통계적 모델들에 대한 훈련은 탐색 결과 페이지에서 이력적으로 디스플레이된 웹 페이지 정보의 각각의 세트에 대한 탐색 질의와 연관된 특성들의 세트에 대한 예측된 클릭 레이트를 획득할 수 있을 수 있다. 그러므로, 클릭 확률 예측 모델은 일부 실시예들에서 확립되고, 이러한 모델은 상이한 특성 정보에 대응하는 예측된 클릭 레이트 확률들에 대한 통계 정보를 포함한다. 새로운 탐색 질의(즉, 어떤 특성 정보가 이전에 결정되지 않았는지에 대한 탐색 질의)가 수신될 때, 산출들이 탐색 결과들에 포함되는 웹 페이지 정보의 세트들 및 탐색 질의에 포함된 탐색 키워드들 사이에서의 관계에 대해 실시간으로 수행되고 이전 생성된 클릭 확률들은 웹 페이지 정보의 세트들에 대하여 새로운 탐색 질의를 위해 검색된다. 일부 실시예들에서, 웹 페이지 정보의 세트들은 현재 탐색 질의의 특성 정보에 대한 그것들 각각의 예측된 클릭 레이트 확률들에 기초하여 평가될 수 있다.
때때로, 웹 페이지 정보의 세트는 광고를 포함한다. 광고들이 탐색 결과 페이지 상에서 서빙될 때, 벤더는 탐색 키워드가 탐색 질의에 포함될 때, 벤더와 연관된 웹 페이지 정보의 세트(예로서, 광고)가 탐색 결과 페이지 상에 디스플레이되는 보다 큰 가능성을 갖도록 탐색 키워드를 입찰할 수 있다. 이와 같이, 다양한 탐색 키워드들과 연관된 입찰 가격들이 데이터베이스에 저장될 수 있다. 일부 실시예들에서, 평가될 웹 페이지 정보의 세트들이 광고들을 포함할 때와 같이, 평가 값은 예측된 클릭 레이트 확률들, 현재 탐색 질의의 특성 정보, 및 현재 탐색 질의의 탐색 키워드들과 연관된 입찰 가격들에 기초하여 웹 페이지 정보의 각각의 세트에 대해 결정된다. 예를 들면, 웹 페이지 정보의 각각의 세트에 대한 평가 값은 현재 탐색 질의의 특성 정보에 대한 그것의 각각의 예측된 클릭 레이트 확률 및 현재 탐색 질의와 연관된 입찰 가격 사이에서의 제품으로서 결정될 수 있다. 예를 들면, 탐색 질의가 하나의 탐색 키워드를 포함한다면, 탐색 질의와 연관된 입찰 가격은 탐색 키워드의 입찰 가격이다. 또는 탐색 질의가 다수의 탐색 키워드들을 포함한다면, 탐색 질의와 연관된 입찰 가격은 탐색 키워드들 중 임의의 것과 연관된 최고 입찰 가격이다. 그 후 탐색 결과들은 그것들 각각의 평가 값들의 내림차순으로 평가된다.
일부 실시예들에서, 일단 탐색 결과들이 평가되면, 최고 평가 탐색 결과들의 적어도 일 부분이 사용자를 위해 디스플레이되도록 리턴된다.
316에서, 웹 페이지의 세트들의 그룹의 웹 페이지 정보의 세트는 주 제품 속성을 사용하여 업데이트된다. 선택적으로, 일부 실시예들에서, 주 제품 속성이 결정된 그룹과 연관된 웹 페이지 정보의 세트들은 결정된 주 제품 속성을 갖고 업데이트될 수 있다. 예를 들면, 웹 페이지 정보의 세트에 포함된 정보의 적어도 일부은 연관된 벤더에 의해 자발적으로 제출되기 때문에, 웹 페이지 정보의 세트는 시스템에 의해 상기 벤더에 대해 결정된 주 제품 속성의 값에 핵심 제품 단어들을 포함하지 않을 수 있다. 그러므로, 웹 페이지 정보의 세트에 포함되지 않은 주 제품 속성과 연관되는 제품 단어들은 웹 페이지 정보의 세트에 부가되고 주 제품 속성과 연관되지 않지만 웹 페이지 정보의 세트에 포함되는 제품 단어들은 웹 페이지 정보의 세트로부터 삭제될 수 있다. 예를 제공하기 위해, 벤더가 웹 페이지 정보(A)의 세트에 대해 제출한 제품 단어 필드에 대한 값이 "모바일 전화들, MP3들, 컴퓨터들, 및 전화기들"이라고 가정하자. 그 후, 상기 언급된 웹 페이지 정보(A)의 세트를 포함하는, 벤더와 연관된 웹 페이지 정보의 세트들이 발견된다. 벤더에 대해 결정된(예로서, 도 2의 프로세스(200)와 같은 프로세스에 기초하여) 주 제품 속성 값은 단지 "MP3, 태블릿들"이다. 그러므로, 웹 페이저 정보의 세트(A)는, 주 제품 속성 값에 기초하여, "컴퓨터들", "전화기들", 및 "모바일 전화들"을 제외하기 위해 및 "태블릿들"을 부가하기 위해 업데이트될 수 있다. 웹 페이지 정보의 세트(A)의 업데이트된 제품 단어 필드는 "MP3들, 태블릿들"을 포함한다. 웹 페이지 정보의 세트들의 업데이트된 제품 단어 필드들은 벤더에 의해 판매되는 1차 제품들을 보다 양호하게 반영한다. 또한, 웹 페이지 정보의 세트들의 이러한 자동 업데이팅은 그것들이 이전 제출한 정보를 업데이트하는 것을 잊은 벤더들을 도울 수 있다.
선택적으로, 일부 실시예들에서, 주 산업 속성이 결정된 그룹과 연관된 웹 페이지 정보의 세트들은 결정된 주 산업 속성을 갖고 업데이트될 수 있다. 예를 들면, 웹 페이지 정보의 세트에 포함된 정보의 적어도 일부가 연관된 벤더에 의해 자발적으로 제출되기 때문에, 웹 페이지 정보의 세트는 상기 벤더에 대해 결정된 주 산업 속성의 값에 산업들을 포함하지 않을 수 있다. 그러므로, 웹 페이지 정보의 세트에 포함되지 않은 주 산업 속성과 연관되는 산업들은 웹 페이지 정보의 세트에 부가될 수 있으며 주 산업 속성과 연관되지 않지만 웹 페이지 정보의 세트에 포함되는 산업들은 웹 페이지 정보의 세트로부터 삭제될 수 있다. 웹 페이지 정보의 세트들의 업데이트된 산업 필드들은 벤더와 연관된 1차 산업들을 보다 양호하게 반영한다.
프로세스들의 설명된 실시예들에 관하여, 간소화를 위해, 모두 일련의 동작들의 조합들로서 제공되었다. 그러나, 당업자들은 본 출원이 설명된 동작들의 시퀀스에 의해 제한되지 않으며, 특정한 단계들에 대해, 본 출원의 사상 내에서 다른 단계들과 동시에 또는 다른 시퀀스들로 실행될 수 있다는 것을 인지해야 한다.
도 4는 탐색 결과들을 생성하기 위한 시스템의 일 실시예를 도시한 도면이다. 상기 예에서, 시스템(400)은: 웹 페이지 정보 모듈(401), 속성 값 통계 모듈(402), 및 탐색 결과 추출 모듈(403)을 포함한다. 일부 실시예들에서, 도 2의 프로세스(200)가 시스템(400) 상에 구현된다.
모듈들 및 서브-모듈들은 요소들에 대해 설계된 프로그래밍가능한 로직 디바이스들 및/또는 주문형 반도체들과 같은 하드웨어가 컴퓨터 디바이스(개인용 컴퓨터들, 서버들, 네트워크 장비 등과 같은)가 본 발명의 실시예들에 설명된 방법들을 수행하게 하기 위한 다수의 지시들을 포함하는, 비-휘발성 저장 매체(광 디스크, 플래시 저장 디바이스, 모바일 하드 디스크 등과 같은)에 저장될 수 있는 소프트웨어 제품들의 형태에 의해 구현될 수 있기 때문에, 하나 이상의 프로세서들 상에서 실행하는 소프트웨어 구성요소들로서 구현될 수 있다. 모듈들 및 서브-모듈들은 단일 디바이스 상에 구현되거나 다수의 디바이스들에 걸쳐 분포될 수 있다.
웹 페이지 정보 모듈(401)은 대응하는 세트들의 웹 페이지 정보를 탐색하기 위한 기초로서 탐색 키워드들을 사용하도록 구성된다.
속성 값 통계 모듈(402)은 연관된 벡터들에 기초하여 웹 페이지 정보의 복수의 세트들을 그룹들로 분류하도록 구성된다. 속성 값 통계 모듈(402)은 또한 그것의 발생률이 특정한 벤더와 연관된 웹 페이지 정보 중에서 사전 설정된 임계 값보다 큰 제 1 지정 필드 및/또는 제 2 지정 필드의 값을 추출하도록 구성된다. 예를 들면, 제 1 지정 값은 제품 단어 필드이며 제 2 지정 필드는 연관된 산업 필드이다. 추출된 제 1 지정 필드 값의 핵심 제품 단어들은 벤더에 대한 주 제품 속성 값의 속성 값으로서 사용된다. 또한, 제 2 지정 필드 값에 포함된 산업 값(들)은 벤더에 대한 주 산업 속성 값의 속성 값으로서 사용된다.
탐색 결과 추출 모듈(403)은 탐색 결과들에 포함하기 위해 탐색 질의에 대응하는 주 제품 속성들 및/또는 주 산업 속성들과 연관된 웹 페이지 정보의 세트들을 결정하도록 구성된다.
일부 실시예들에서, 속성 값 통계(402)는 다음을 포함한다:
다양한 연관된 벤더들에 기초하여 웹 페이지 정보의 세트들을 분류하도록 구성된 웹 페이지 정보 추출 서브-모듈.
제품 단어 필드들의 값들 및/또는 웹 페이지 정보의 세트들의 그룹으로부터 연관된 산업 필드들의 값을 추출하도록 구성된 백분율 산출 서브-모듈. 백분율 산출 서브-모듈은 또한 제품 단어 필드들 각각의 상이한 값에 대한 그룹 중에서 발생률을 결정하며 어떤 값들이 제 1 사전 설정된 임계 값을 초과하는 발생률들과 연관되는지를 결정하도록 구성된다. 백분율 산출 서브-모듈은 또한 연관된 산업 필드들 각각의 상이한 값에 대한 그룹 중에서 발생률을 결정하며 어떤 값들이 제 2 사전 설정된 임계 값을 초과하는 발생률들과 연관되는지를 결정하도록 구성된다.
그것의 연관된 백분율들이 제 1 사전 설정된 임계 값보다 크며 그것들을 벤더와 연관된 주 제품 속성에 대응하는 속성 값(들)으로서 사용하는 핵심 제품 단어들을 이들 제품 단어 필드 값들로부터 추출하도록 구성된 속성 값 추출 서브-모듈. 속성 값 추출 서브-모듈은 또한 그것의 백분율이 벤더와 연관된 주 산업 속성에 대응하는 속성 값(들)으로서 제 2 사전 설정된 임계 값보다 큰 연관된 산업 값들을 사용하도록 구성된다.
도 5는 탐색 결과들을 생성하기 위한 시스템의 일 실시예를 도시한 도면이다. 예에서, 시스템(500)은: 웹 페이지 정보 탐색 모듈(501), 웹 페이지 필터링 모듈(502), 속성 값 통계 모듈(503), 탐색 결과 추출 모듈(504), 탐색 결과 디스플레잉 모듈(505), 및 정보 업데이팅 모듈(506)을 포함한다. 일부 실시예들에서, 프로세스(300)는 시스템(500) 상에 구현된다.
대응하는 웹 페이지 정보를 탐색하기 위한 기초로서 사용자-입력된 탐색 키워드들을 사용하기 위한, 웹 페이지 정보 탐색 모듈(501).
웹 페이지 필터링 모듈(502)은 탐색 키워드들에 대하여 연관된 유사성 값들이 사전 설정된 유사성 임계 값보다 작은 웹 페이지 정보의 세트들을 걸러내도록 구성된다.
일부 실시예들에서, 탐색 키워드들에 대한 웹 페이지 정보의 세트의 유사성 값은 이하에 설명된 서브-모듈들을 사용하여 결정된다:
웹 페이지 정보의 세트들로부터 및 탐색 키워드들로부터 핵심 제품 단어들을 개별적으로 추출하도록 구성된 핵심 제품 단어 추출 서브-모듈.
상이한 클릭 카테고리들에서 각각의 핵심 제품 단어의 클릭 레이트를 사용하여 탐색 키워드들에 대한 웹 페이지 정보의 각각의 세트의 유사성 값을 산출하도록 구성된 유사성 산출 서브-모듈.
연관된 벤더들에 기초하여 웹 페이지 정보의 복수의 세트들을 그룹들로 분류하도록 구성된 속성 값 통계 모듈(503). 속성 값 통계 모듈(503)은 또한 발생률이특정한 벤더와 연관된 웹 페이지 정보 중에서 사전 설정된 임계 값보다 큰 제 1 지정 필드 및/또는 제 2 지정 필드의 값을 추출하도록 구성된다. 예를 들면, 제 1 지정 필드는 제품 단어 필드이며 제 2 지정 필드는 연관된 산업 필드이다. 추출된 제 1 지정 필드 값의 핵심 제품 단어들은 벤더에 대한 주 제품 속성 값의 속성 값으로서 사용된다. 또한, 제 2 지정 필드 값에 포함된 산업 값(들)은 벤더에 대한 주 산업 속성 값의 속성 값으로서 사용된다.
탐색 결과 추출 모듈(504)은 탐색 결과들에 포함하기 위해 탐색 질의에 대응하는 주 제품 속성들 및/또는 주 산업 속성들과 연관된 웹 페이지 정보의 세트들을 결정하도록 구성된다.
일부 실시예들에서, 탐색 결과들이 평가될 수 있다.
탐색 결과 디스플레잉 모듈(505)은 사용자에 대한 탐색 결과 페이지 상에 탐색 결과들을 디스플레이하도록 구성된다.
일부 실시예들에서, 벤더들의 적어도 일부는 광고사들을 포함하고, 탐색 결과 디스플레잉 모듈(505)은 다음을 포함할 수 있다:
탐색 키워드들의 및 웹 페이지 정보의 다양한 세트들과 연관된 특성 정보에 대한 통계 정보를 별개로 컴파일링하도록 구성된 특성 정보 통계 서브-모듈.
클릭 확률 예측 서브-모듈은 웹 페이지 정보의 다양한 세트들에 대한 예측된 클릭 확률들을 결정하기 위해 특성 정보 및 클릭 확률 예측 모델을 사용하도록 구성된다. 클릭 확률 예측 모델은 이력적 탐색 질의들과 연관된 상이한 특성 정보에 대응하는 웹 페이지 정보의 다양한 세트들의 예측된 클릭 확률들의 통계 정보를 포함한다.
판매하는 평가 서브-모듈은 그것들 각각의 예측된 클릭 확률들, 현재 탐색 질의의 특성 정보, 및 탐색 키워드 입찰 가격들에 기초하여 웹 페이지 정보의 다양한 세트들을 평가하도록 구성된다.
일부 실시예들에서, 다양한 벤더들과 연관된 획득된 주 제품 속성들 및 주 산업 속성들은 벤더들과 연관된 웹 페이지 정보의 세트들을 업데이트하기 위해 사용될 수 있다. 일부 실시예들에서, 시스템(500)은 다음을 더 포함한다:
정보 업데이팅 모듈(506)은 벤더와 연관된 웹 페이지 정보의 세트들을 업데이팅하기 위한 기초로서 각각의 벤더의 주 제품 속성 및 주 산업 속성을 사용하도록 구성된다.
본 출원은 많은 일반 목적 또는 특수화된 컴퓨터 시스템 환경들 또는 구성들에 사용될 수 있다. 예를 들면: 개인용 컴퓨터들, 서버들, 핸드헬드 디바이스들 또는 휴대용 장비, 태블릿형 장비, 다중프로세서 시스템들, 마이크로프로세서-기반 시스템들, 셋-탑 박스들, 프로그래밍가능한 소비자 전자 장비, 네트워킹된 PC들, 미니컴퓨터들, 메인프레임 컴퓨터들, 상기 시스템들 또는 장비 중 임의의 것을 포함하는 분산 컴퓨팅 환경들 등.
본 출원은 프로그램 모듈과 같은, 컴퓨터에 의해 실행된 컴퓨터 실행가능한 명령들의 일반적인 맥락으로 설명될 수 있다. 일반적으로, 프로그램 모듈들은 특정 태스크들을 실행하거나 특정 추상 데이터 유형들을 달성하기 위해, 루틴들, 프로그램들, 오브젝트들, 구성요소들, 데이터 구조들 등을 포함한다. 본 출원은 또한 분산 컴퓨팅 환경들에서 실행될 수 있으며; 이러한 분산 컴퓨팅 환경들에서, 태스크들은 통신 네트워크들을 통해 연결된 원격 프로세싱 장비에 의해 실행된다. 분산 컴퓨팅 환경들에서, 프로그램 모듈들은 저장 장비를 포함하는 로컬 또는 원격 컴퓨터들에서의 저장 매체 상에 위치될 수 있다.
본 출원에 의해 제공된 탐색 결과 생성 방법 및 탐색 결과 생성 디바이스는 상기에 상세히 설명되었다. 본 문서는 본 출원의 구현의 형태들 및 원리들을 자세히 설명하기 위해 특정한 실시예들을 이용하였다. 상기 실시예 설명들은 단지 본 출원의 방법들의 및 그것의 핵심 개념들의 이해를 돕도록 의도된다. 게다가, 이 분야의 일반적인 기술을 갖는 사람은 본 출원의 개념들에 기초하여, 특정 구현들에 대한 및 출원들의 범위에 대한 수정들을 할 수 있을 것이다. 상기를 요약하기 위해, 이러한 설명의 콘텐트들은 본 출원을 제한하는 것으로서 이해되어서는 안된다.
앞서 말한 실시예들은 이해의 명료함을 위해 어느 정도 상세히 설명되었지만, 본 발명은 제공된 세부사항들에 제한되지 않는다. 본 발명을 구현하는 많은 대안적인 방법들이 있다. 개시된 실시예들은 예시적이며 제한적이지 않다.
100: 시스템 102: 클라이언트 디바이스
104: 네트워크 106: 서버
108: 데이터베이스 400: 시스템
401: 웹 페이지 정보 모듈 402: 속성 값 통계 모듈
403: 탐색 결과 추출 모듈 500: 시스템
501: 웹 페이지 정보 탐색 모듈 502: 웹 페이지 필터링 모듈
503: 속성 값 통계 모듈 504: 탐색 결과 추출 모듈
505: 탐색 결과 디스플레잉 모듈 506: 정보 업데이팅 모듈

Claims (21)

  1. 하나 이상의 프로세서들로서:
    웹 페이지 정보의 복수의 세트들 각각의 세트들과 연관된 벤더들에 기초하여 웹 페이지 정보의 상기 복수의 세트들을 하나 이상의 그룹들로 분류하고;
    벤더와 연관된 웹 페이지 정보의 세트들의 그룹에 대해, 상기 벤더와 연관된 속성의 속성 값으로서 상기 웹 페이지 정보의 세트들의 그룹에 포함된 값을 결정하고, 상기 웹 페이지 정보의 세트들의 그룹에 포함된 값을 결정하는 것은:
    상기 웹 페이지 정보의 세트들의 그룹으로부터 제품 단어 필드들과 연관된 값들을 추출하고;
    상기 추출된 값들의 고유한 값에 대한 발생률을 결정하고;
    상기 고유한 값과 연관된 상기 발생률이 제 1 사전 설정된 임계 값과 동일하거나 이를 초과하는 경우에, 상기 벤더와 연관된 상기 속성의 속성 값으로서 상기 고유한 값을 결정하는 것을 포함하고;
    탐색 질의가 상기 벤더와 연관된 상기 속성의 속성 값에 대응하는지의 여부에 적어도 부분적으로 기초하여, 상기 벤더와 연관된 상기 웹 페이지 정보의 세트들의 그룹의 웹 페이지 정보의 세트가 탐색 결과들에 포함되어야 하는지의 여부를 결정하도록 구성된, 상기 하나 이상의 프로세서들; 및
    상기 하나 이상의 프로세서들에 결합되고 지시들을 상기 하나 이상의 프로세서들에 제공하도록 구성된 하나 이상의 메모리들을 포함하는, 시스템.
  2. 제 1 항에 있어서,
    상기 속성은 주 제품 속성을 포함하는, 시스템.
  3. 삭제
  4. 제 1 항에 있어서,
    상기 벤더와 연관된 상기 속성은 상기 벤더와 연관된 제 1 속성을 포함하고, 상기 하나 이상의 프로세서들은:
    상기 벤더와 연관된 상기 웹 페이지 정보의 세트들의 그룹에 대해, 상기 벤더와 연관된 제 2 속성의 속성 값으로서 상기 웹 페이지 정보의 세트들의 그룹에 포함된 또 다른 값을 결정하도록 추가로 구성되는, 시스템.
  5. 제 4 항에 있어서,
    상기 제 2 속성은 주 산업 속성을 포함하는, 시스템.
  6. 제 4 항에 있어서,
    상기 고유한 값은 제 1 고유한 값을 포함하고, 상기 웹 페이지 정보의 세트들의 그룹에 포함된 상기 또 다른 값을 결정하는 것은:
    상기 웹 페이지 정보의 세트들의 그룹으로부터 연관된 산업 필드들과 연관된 값들을 추출하고;
    상기 추출된 값들의 제 2 고유한 값에 대한 발생률을 결정하고;
    상기 제 2 고유한 값과 연관된 상기 발생률이 제 2 사전 설정된 임계 값과 동일하거나 이를 초과하는 경우에, 상기 벤더와 연관된 상기 제 2 속성의 속성 값으로서 상기 제 2 고유한 값을 결정하는 것을 포함하는, 시스템.
  7. 제 6 항에 있어서,
    상기 탐색 질의가 상기 벤더와 연관된 상기 제 1 속성의 속성 값에 대응하는지의 여부에 적어도 부분적으로 기초하여 상기 벤더와 연관된 상기 웹 페이지 정보의 세트들의 그룹의 웹 페이지 정보의 세트가 탐색 결과들에 포함되어야 하는지의 여부를 결정하는 것은 상기 탐색 질의가 상기 벤더와 연관된 상기 제 2 속성의 속성 값에 대응하는지의 여부에 추가로 기초하는, 시스템.
  8. 제 7 항에 있어서,
    상기 탐색 질의가 상기 벤더와 연관된 상기 제 1 속성의 속성 값 또는 상기 벤더와 연관된 상기 제 2 속성의 속성 값에 대응하는 경우에, 상기 탐색 결과들로 상기 웹 페이지 정보의 세트를 포함하며 상기 탐색 질의가 상기 벤더와 연관된 상기 제 1 속성의 속성 값에도 상기 벤더와 연관된 상기 제 2 속성의 속성 값에도 대응하지 않는 경우에, 상기 탐색 결과들로부터 상기 웹 페이지 정보의 세트를 제외하는, 시스템.
  9. 제 1 항에 있어서,
    상기 탐색 질의가 상기 벤더와 연관된 상기 속성의 속성 값에 대응하는 경우에, 상기 탐색 결과들로 상기 웹 페이지 정보의 세트를 포함하며 상기 탐색 질의가 상기 벤더와 연관된 상기 속성의 속성 값에 대응하지 않는 경우에, 상기 탐색 결과들로부터 상기 웹 페이지 정보의 세트를 제외하는, 시스템.
  10. 제 1 항에 있어서,
    상기 하나 이상의 프로세서들은 상기 웹 페이지 정보의 제 1 세트와 상기 탐색 질의 사이에서의 유사성에 기초하여 웹 페이지 정보의 상기 복수의 세트들로부터 상기 웹 페이지 정보의 제 1 세트를 걸러낼지의 여부를 결정하도록 추가로 구성되는, 시스템.
  11. 제 1 항에 있어서,
    상기 하나 이상의 프로세서들은 탐색 결과들을 평가하도록 추가로 구성되는, 시스템.
  12. 제 11 항에 있어서,
    상기 하나 이상의 프로세서들은 상기 평가된 탐색 결과들의 적어도 일 부분을 리턴하도록 추가로 구성되는, 시스템.
  13. 제 1 항에 있어서,
    웹 페이지 정보의 상기 복수의 세트들의 적어도 일부는 제품 정보의 세트들을 포함하는, 시스템.
  14. 제 1 항에 있어서,
    웹 페이지 정보의 상기 복수의 세트들은 상기 탐색 질의에 매칭시키기 위해 결정되는, 시스템.
  15. 하나 이상의 프로세서들을 사용하여, 웹 페이지 정보의 복수의 세트들 각각의 세트들과 연관된 벤더들에 기초하여 웹 페이지 정보의 상기 복수의 세트들을 하나 이상의 그룹들로 분류하는 단계,
    벤더와 연관된 웹 페이지 정보의 세트들의 그룹에 대해, 상기 벤더와 연관된 속성의 속성 값으로서 상기 웹 페이지 정보의 세트들의 그룹에 포함된 값을 결정하는 단계로서:
    상기 웹 페이지 정보의 세트들의 그룹으로부터 제품 단어 필드들과 연관된 값들을 추출하는 단계;
    상기 추출된 값들의 고유한 값에 대한 발생률을 결정하는 단계;
    상기 고유한 값과 연관된 상기 발생률이 제 1 사전 설정된 임계 값과 동일하거나 이를 초과하는 경우에, 상기 벤더와 연관된 상기 속성의 속성 값으로서 상기 고유한 값을 결정하는 단계를 포함하는, 상기 웹 페이지 정보의 세트들의 그룹에 포함된 상기 값을 결정하는 단계, 및
    탐색 질의가 상기 벤더와 연관된 상기 속성의 속성 값에 대응하는지의 여부에 적어도 부분적으로 기초하여 상기 벤더와 연관된 상기 웹 페이지 정보의 세트들의 그룹의 웹 페이지 정보의 세트가 탐색 결과들에 포함되어야 하는지의 여부를 결정하는 단계를 포함하는, 방법.
  16. 제 15 항에 있어서,
    상기 속성은 주 제품 속성을 포함하는, 방법.
  17. 삭제
  18. 제 15 항에 있어서,
    상기 벤더와 연관된 상기 속성은 상기 벤더와 연관된 제 1 속성을 포함하고,
    상기 벤더와 연관된 상기 웹 페이지 정보의 세트들의 그룹에 대해, 상기 벤더와 연관된 제 2 속성의 속성 값으로서 상기 웹 페이지 정보의 세트들의 그룹에 포함된 또 다른 값을 결정하는 단계를 더 포함하는, 방법.
  19. 제 18 항에 있어서,
    상기 제 2 속성은 주 산업 속성을 포함하는, 방법.
  20. 제 18 항에 있어서,
    상기 고유한 값은 제 1 고유한 값을 포함하고, 상기 웹 페이지 정보의 세트들의 그룹에 포함된 상기 또 다른 값을 결정하는 단계는:
    상기 웹 페이지 정보의 세트들의 그룹으로부터 연관된 산업 필드들과 연관된 값들을 추출하는 단계;
    상기 추출된 값들의 제 2 고유한 값에 대한 발생률을 결정하는 단계; 및
    상기 제 2 고유한 값과 연관된 상기 발생률이 제 2 사전 설정된 임계 값과 동일하거나 이를 초과한 경우에, 상기 벤더와 연관된 상기 제 2 속성의 속성 값으로서 상기 제 2 고유한 값을 결정하는 단계를 포함하는, 방법.
  21. 컴퓨터 프로그램이 기록된 컴퓨터 판독가능한 기록 매체로서, 비-일시적 컴퓨터 판독가능한 저장 매체에 구현되고 컴퓨터 지시들을 포함하는, 상기 컴퓨터 판독가능한 기록 매체에 있어서,
    상기 컴퓨터 지시들은:
    웹 페이지 정보의 복수의 세트들 각각의 세트들과 연관된 벤더들에 기초하여 웹 페이지 정보의 상기 복수의 세트들을 하나 이상의 그룹들로 분류하고;
    벤더와 연관된 웹 페이지 정보의 세트들의 그룹에 대해, 상기 벤더와 연관된 속성의 속성 값으로서 상기 웹 페이지 정보의 세트들의 그룹에 포함된 값을 결정하고, 상기 웹 페이지 정보의 세트들의 그룹에 포함된 값을 결정하는 것은:
    상기 웹 페이지 정보의 세트들의 그룹으로부터 제품 단어 필드들과 연관된 값들을 추출하고;
    상기 추출된 값들의 고유한 값에 대한 발생률을 결정하고;
    상기 고유한 값과 연관된 상기 발생률이 제 1 사전 설정된 임계 값과 동일하거나 이를 초과하는 경우에, 상기 벤더와 연관된 상기 속성의 속성 값으로서 상기 고유한 값을 결정하는 것을 포함하고;
    탐색 질의가 상기 벤더와 연관된 상기 속성의 속성 값에 대응하는지의 여부에 적어도 부분적으로 기초하여 상기 벤더와 연관된 상기 웹 페이지 정보의 세트들의 그룹의 웹 페이지 정보의 세트가 탐색 결과들에 포함되어야 하는지의 여부를 결정하기 위한 것인, 컴퓨터 판독가능한 기록 매체.
KR1020147035902A 2012-07-05 2013-06-28 탐색 결과들을 생성하는 방법 KR101644817B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201210233248.3A CN103530299B (zh) 2012-07-05 2012-07-05 一种搜索结果的生成方法及装置
CN201210233248.3 2012-07-05
US13/929,099 2013-06-27
US13/929,099 US9934293B2 (en) 2012-07-05 2013-06-27 Generating search results
PCT/US2013/048731 WO2014008139A2 (en) 2012-07-05 2013-06-28 Generating search results

Publications (2)

Publication Number Publication Date
KR20150016973A KR20150016973A (ko) 2015-02-13
KR101644817B1 true KR101644817B1 (ko) 2016-08-02

Family

ID=49879305

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147035902A KR101644817B1 (ko) 2012-07-05 2013-06-28 탐색 결과들을 생성하는 방법

Country Status (6)

Country Link
US (1) US9934293B2 (ko)
JP (1) JP6022056B2 (ko)
KR (1) KR101644817B1 (ko)
CN (1) CN103530299B (ko)
TW (1) TW201403360A (ko)
WO (1) WO2014008139A2 (ko)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104035955B (zh) * 2014-03-18 2018-07-10 北京百度网讯科技有限公司 搜索方法和装置
TW201539291A (zh) * 2014-04-03 2015-10-16 Qware Systems & Services Corp 商品關鍵字排列調整系統及其方法
EP2933734A1 (en) * 2014-04-17 2015-10-21 OnPage.org GmbH Method and system for the structural analysis of websites
US11755559B1 (en) 2014-10-09 2023-09-12 Splunk Inc. Automatic entity control in a machine data driven service monitoring system
US11200130B2 (en) * 2015-09-18 2021-12-14 Splunk Inc. Automatic entity control in a machine data driven service monitoring system
CN104933172A (zh) * 2015-06-30 2015-09-23 百度在线网络技术(北京)有限公司 一种基于用户搜索行为的信息推送方法和装置
CN105045889B (zh) * 2015-07-29 2018-04-20 百度在线网络技术(北京)有限公司 一种信息推送方法及装置
US11868354B2 (en) * 2015-09-23 2024-01-09 Motorola Solutions, Inc. Apparatus, system, and method for responding to a user-initiated query with a context-based response
CN105427490B (zh) * 2015-10-26 2017-08-25 国网天津市电力公司 一种网页信息提取声光告警方法
US10218728B2 (en) * 2016-06-21 2019-02-26 Ebay Inc. Anomaly detection for web document revision
CN106777282B (zh) * 2016-12-29 2018-07-13 百度在线网络技术(北京)有限公司 相关搜索的排序方法和装置
CN107665229B (zh) * 2017-05-26 2020-02-21 深圳市谷熊网络科技有限公司 信息搜索方法、装置及设备
US11158311B1 (en) * 2017-08-14 2021-10-26 Guangsheng Zhang System and methods for machine understanding of human intentions
TWI762764B (zh) * 2019-02-15 2022-05-01 國風傳媒有限公司 詞彙整合裝置、方法及其電腦程式產品
BR112022003279A2 (pt) * 2019-10-01 2022-05-24 Jfe Steel Corp Sistema de busca de informações
CN112446214B (zh) * 2020-12-09 2024-02-02 北京有竹居网络技术有限公司 广告关键词的生成方法、装置、设备及存储介质
CN115150297B (zh) * 2022-08-15 2023-05-19 雁展科技(深圳)有限公司 一种基于移动互联网的数据过滤及内容评价方法和系统

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7630986B1 (en) * 1999-10-27 2009-12-08 Pinpoint, Incorporated Secure data interchange
US7349868B2 (en) 2001-05-15 2008-03-25 I2 Technologies Us, Inc. Pre-qualifying sellers during the matching phase of an electronic commerce transaction
JP2003085395A (ja) 2001-09-07 2003-03-20 Nec Informatec Systems Ltd 電子商取引仲介システム、及びその方法
US7308421B2 (en) 2002-04-12 2007-12-11 Vendavo, Inc. System and method for grouping products in a catalog
US8364670B2 (en) * 2004-12-28 2013-01-29 Dt Labs, Llc System, method and apparatus for electronically searching for an item
US7870031B2 (en) * 2005-12-22 2011-01-11 Ebay Inc. Suggested item category systems and methods
WO2008005102A2 (en) * 2006-05-13 2008-01-10 Sap Ag Consistent set of interfaces derived from a business object model
US7921106B2 (en) * 2006-08-03 2011-04-05 Microsoft Corporation Group-by attribute value in search results
US8738456B2 (en) 2006-11-14 2014-05-27 Xerox Corporation Electronic shopper catalog
US9317824B2 (en) * 2007-01-17 2016-04-19 Hartford Fire Insurance Company Vendor management system and process
US7925652B2 (en) * 2007-12-31 2011-04-12 Mastercard International Incorporated Methods and systems for implementing approximate string matching within a database
US8285721B2 (en) 2008-09-29 2012-10-09 Ebay Inc. Mapping item records to product records
US9460212B2 (en) * 2008-12-03 2016-10-04 Paypal, Inc. System and method for personalized search
US20100211445A1 (en) * 2009-01-15 2010-08-19 Shaun Bodington Incentives associated with linked financial accounts
US8612472B2 (en) 2009-12-16 2013-12-17 Microsoft Corporation Determining preferences from user queries
US8255268B2 (en) * 2010-01-20 2012-08-28 American Express Travel Related Services Company, Inc. System and method for matching merchants based on consumer spend behavior
WO2011105604A1 (ja) 2010-02-26 2011-09-01 楽天株式会社 情報処理装置、情報処理方法、情報処理装置用のプログラム、および、記録媒体
US9760905B2 (en) * 2010-08-02 2017-09-12 Visa International Service Association Systems and methods to optimize media presentations using a camera
CN102446180B (zh) * 2010-10-09 2016-03-02 北京京东尚科信息技术有限公司 一种商品搜索方法及其装置
CN102542474B (zh) * 2010-12-07 2015-10-21 阿里巴巴集团控股有限公司 查询结果排序方法及装置
US9171088B2 (en) * 2011-04-06 2015-10-27 Google Inc. Mining for product classification structures for internet-based product searching
CN102968418A (zh) * 2011-09-01 2013-03-13 阿里巴巴集团控股有限公司 网站信息检索方法和系统
US8527475B1 (en) * 2011-09-21 2013-09-03 Amazon Technologies, Inc. System and method for identifying structured data items lacking requisite information for rule-based duplicate detection
AU2013214801B2 (en) * 2012-02-02 2018-06-21 Visa International Service Association Multi-source, multi-dimensional, cross-entity, multimedia database platform apparatuses, methods and systems
CN103377190B (zh) * 2012-04-11 2017-01-18 阿里巴巴集团控股有限公司 一种基于交易平台的供应商信息搜索方法和装置
WO2014036441A2 (en) * 2012-08-31 2014-03-06 The Dun & Bradstreet Corporation System and process for discovering relationships between entities based on common areas of interest
US9208460B2 (en) * 2012-10-19 2015-12-08 Lexisnexis, A Division Of Reed Elsevier Inc. System and methods to facilitate analytics with a tagged corpus
US9342846B2 (en) * 2013-04-12 2016-05-17 Ebay Inc. Reconciling detailed transaction feedback
US10719562B2 (en) * 2013-12-13 2020-07-21 BloomReach Inc. Distributed and fast data storage layer for large scale web data services
US10275812B2 (en) * 2014-07-15 2019-04-30 Xerox Corporation Method and apparatus for denying a transaction detected to be initiated outside of a required application on an endpoint device
US20170186065A1 (en) * 2015-12-29 2017-06-29 Alibaba Group Holding Limited System and Method of Product Selection for Promotional Display

Also Published As

Publication number Publication date
KR20150016973A (ko) 2015-02-13
JP2015522190A (ja) 2015-08-03
TW201403360A (zh) 2014-01-16
US20140012840A1 (en) 2014-01-09
WO2014008139A3 (en) 2014-05-30
CN103530299A (zh) 2014-01-22
US9934293B2 (en) 2018-04-03
TWI561999B (ko) 2016-12-11
WO2014008139A2 (en) 2014-01-09
JP6022056B2 (ja) 2016-11-09
CN103530299B (zh) 2017-04-12

Similar Documents

Publication Publication Date Title
KR101644817B1 (ko) 탐색 결과들을 생성하는 방법
Ding et al. Entity discovery and assignment for opinion mining applications
WO2020147720A1 (zh) 信息推荐方法和装置以及存储介质
JP5860456B2 (ja) 検索語重み付けの決定および利用
JP5736469B2 (ja) ユーザ意図の有無に基づく検索キーワードの推薦
US9910930B2 (en) Scalable user intent mining using a multimodal restricted boltzmann machine
US20150269163A1 (en) Providing search recommendation
EP2842060A1 (en) Recommending keywords
US20200142938A1 (en) Unbiasing search results
US11416907B2 (en) Unbiased search and user feedback analytics
CN109299235B (zh) 知识库搜索方法、装置及计算机可读存储介质
CN112989208B (zh) 一种信息推荐方法、装置、电子设备及存储介质
US20170228461A1 (en) Methods and systems for finding and ranking entities in a domain specific system
CN112100396A (zh) 一种数据处理方法和装置
CN111475725A (zh) 用于搜索内容的方法、装置、设备和计算机可读存储介质
CN110008396B (zh) 对象信息推送方法、装置、设备及计算机可读存储介质
CN111428100A (zh) 一种数据检索方法、装置、电子设备及计算机可读存储介质
CN111737607B (zh) 数据处理方法、装置、电子设备以及存储介质
CN109471969A (zh) 一种应用搜索方法、装置及设备
JP2016110260A (ja) コンテンツ検索結果提供システム及びコンテンツ検索結果提供方法
CN110851560B (zh) 信息检索方法、装置及设备
CN114255067A (zh) 数据定价方法和装置、电子设备、存储介质
JP2021092925A (ja) データ生成装置およびデータ生成方法
US11860917B1 (en) Catalog adoption in procurement
CN116610782B (zh) 文本检索方法、装置、电子设备及介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190712

Year of fee payment: 4