TWI525458B - Recommended methods and devices for searching for keywords - Google Patents

Recommended methods and devices for searching for keywords Download PDF

Info

Publication number
TWI525458B
TWI525458B TW100105663A TW100105663A TWI525458B TW I525458 B TWI525458 B TW I525458B TW 100105663 A TW100105663 A TW 100105663A TW 100105663 A TW100105663 A TW 100105663A TW I525458 B TWI525458 B TW I525458B
Authority
TW
Taiwan
Prior art keywords
search
recommended
search keyword
recommendation
keyword
Prior art date
Application number
TW100105663A
Other languages
English (en)
Other versions
TW201227368A (en
Inventor
Li Zhu
xiao-cong Zhu
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of TW201227368A publication Critical patent/TW201227368A/zh
Application granted granted Critical
Publication of TWI525458B publication Critical patent/TWI525458B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

推薦搜索關鍵字的方法和裝置
本發明涉及資訊搜索技術領域,尤其涉及一種推薦搜索關鍵字的方法和裝置。
現有搜索引擎通常都提供搜索關鍵字推薦的功能。例如,用戶在搜索欄中輸入搜索關鍵字,並點擊“開始搜索”的按鈕後,跳轉到的頁面中不僅包含搜索結果(對網頁搜索來說,搜索結果是匹配搜索關鍵字的網頁的鏈結位址和其他展示資訊),還包括搜索引擎推薦的與用戶輸入的搜索關鍵字相關的其他搜索關鍵字或搜索關鍵字的組合。或者,用戶在搜索欄中輸入搜索關鍵字,會在搜索欄的下拉功能表中彈出與用戶輸入的搜索關鍵字相關的推薦關鍵字,以便用戶選擇某一推薦關鍵字後進行搜索。
現有的推薦搜索關鍵字的方案通常都是基於搜索日誌的,將搜索日誌中與用戶輸入的搜索關鍵字相關度較高的搜索關鍵字作為推薦的搜索關鍵字的,基本原理如下:
首先建立搜索日誌。搜索日誌中包含的搜索關鍵字有以下來源:其一為用戶每次在搜索欄中輸入的搜索關鍵字;其二為搜索引擎推薦的搜索關鍵字。並確定搜索日誌中的搜索關鍵字對應的重要性參數的參數值,搜索日誌中的搜索關鍵字對應的重要性參數的參數值主要取決於以下因素,具體可以按照各因素加權求和的方式來確定每個搜索關鍵字重要性參數的參數值:
1、點擊因素,即該搜索關鍵字的搜索結果是否存在被用戶點擊的記錄、被點擊的次數以及點擊的位置等,具體地,若用戶只利用該搜索關鍵字進行了搜索但未點擊搜索結果中的網頁鏈結位址,則該搜索關鍵字的點擊因素的參數值較低,例如設定的該因素的參數值為0;若用戶利用該搜索關鍵字進行了搜索後且點擊了搜索結果,則該搜索關鍵字的點擊因素的參數值較高,例如設定該因素的參數值為搜索結果被點擊的次數。如果搜索關鍵字存在點擊記錄、且被點擊的次數較多,則該搜索關鍵字的點擊參數的參數值更高,從而使得加權求和後重要性參數的參數值較高。
2、該搜索關鍵字的品質因素。搜索關鍵字的品質因素包括搜索關鍵字的長度、語義項數目、以及是否包含預定搜索關鍵字集合中的搜索關鍵字等。搜索關鍵字的長度即搜索關鍵字包含的字元數目,具體地,為不同字元數目分別預先設定對應的該因素的參數值,例如設定長度為2的搜索關鍵字對應的該因素的參數值為1、設定長度為3的搜索關鍵字對應的該因素的參數值為0.8、設定長度為4的搜索關鍵字對應的該因素的參數值為0.5等等;語義項數目是指對該搜索關鍵字進行分詞處理後,將分詞處理獲得的語義項(Term)數目與設定的比較閾值進行比較,根據比較結果確定搜索關鍵字對應的語義項因素的參數值;預定的搜索關鍵字集合例如違禁詞集合、產品品牌詞集合或特殊商業意圖詞集合等,根據比較搜索關鍵字中是否包含這些預定的搜索關鍵字集合中的樣本詞,來確定搜索關鍵字對應的該因素的參數值。
在進行搜索關鍵字推薦時,搜索引擎接收到用戶在搜索欄中輸入搜索關鍵字後,針對搜索日誌中包含的每個搜索關鍵字,執行:
確定搜索日誌中包含的各搜索關鍵字與輸入的搜索關鍵字的相似度值,具體確定兩個搜索關鍵字相似度值的方法有很多,例如基於兩個搜索關鍵字最長公共子串等方法,然後對確定出的相似度值和搜索日誌中包含的該搜索關鍵字的重要性參數的參數值進行加權求和的方式來確定搜索日誌中包含的該搜索關鍵字的推薦度值。
按照對應的推薦度值由高到底的順序,對搜索日誌中包含的搜索關鍵字進行排序,選擇排序靠前的N個搜索關鍵字作為推薦給用戶的搜索關鍵字。
上述基於搜索日誌的推薦搜索關鍵字的方案的優點在於能夠逐步引導具有明確搜索意圖的用戶完成或修正搜索過程。例如,用戶輸入的搜索關鍵字為“手機”,按照上述基於搜索日誌的推薦搜索關鍵字的方案第一次推薦出的搜索關鍵字為“S品牌手機”,用戶點擊了推薦的搜索關鍵字“S品牌手機”進一步進行搜索時,相當於本次輸入的搜索關鍵字為“S品牌手機”,按照上述基於搜索日誌的推薦搜索關鍵字的方案第二次推薦出的搜索關鍵字為“S品牌智慧手機”,依此類推。
然而對於沒有明顯搜索意圖的用戶而言,例如用戶輸入的搜索關鍵字為“代理加盟”,上述不斷細化的推薦方式難以滿足需求,推薦出的搜索關鍵字往往是與輸入的搜索關鍵詞語義上基本一致或在輸入的搜索關鍵字基礎上添加其他限定詞後的詞,並且推薦出的搜索關鍵字往往局限於某個特定的領域,推薦搜索關鍵字的效果不佳,即推薦出的關鍵字很少被用戶進一步點擊。並且,由於搜索引擎伺服器進行相關關鍵字的推薦時,需要調取搜索日誌、進行相似度值的計算、排序等操作,佔用了搜索引擎伺服器的系統資源,然而推薦的相關關鍵字確無法滿足用戶的需求,因此,這造成了搜索引擎伺服器系統資源的浪費,影響了搜索引擎伺服器的處理效率。
本發明實施例提供一種推薦搜索關鍵字的方法和裝置,用以解決現有技術中向沒有明確搜索意圖的用戶推薦搜索關鍵字時推薦效果不佳,造成搜索引擎伺服器系統資源浪費的問題。
本發明實施例提供的技術方案如下:
一種推薦搜索關鍵字的方法,包括:
接收輸入的搜索關鍵字;比較接收的搜索關鍵字與設定的非意圖詞集合中的樣本詞以及設定的意圖詞集合中的樣本詞;當比較結果為接收的搜索關鍵字包含非意圖詞集合中的樣本詞而不包含意圖詞集合中的樣本詞時,以第一預定推薦方式為確定推薦搜索關鍵字的主方式,以除第一預定推薦方式外的其他推薦方式為確定搜索關鍵字的輔助方式的策略,確定推薦搜索關鍵字,其中,第一預定推薦方式為基於知識庫的推薦方式和/或基於會話相關性的推薦方式。
一種推薦搜索關鍵字的裝置,包括:接收單元,用於接收輸入的搜索關鍵字;比較單元,用於比較接收單元接收的搜索關鍵字與設定的非意圖詞集合中的樣本詞以及設定的意圖詞集合中的樣本詞;第一推薦單元,用於在比較單元得到的比較結果為接收的搜索關鍵字包含非意圖詞集合中的樣本詞而不包含意圖詞集合中的樣本詞時,以第一預定推薦方式為確定推薦搜索關鍵字的主方式,以除第一預定推薦方式外的其他推薦方式為確定搜索關鍵字的輔助方式的策略,確定推薦搜索關鍵字,其中,第一預定推薦方式為基於知識庫的推薦方式和/或基於會話相關性的推薦方式。
本發明實施例藉由首先對用戶輸入的搜索關鍵字進行搜索意圖識別,識別搜索關鍵字是否有明顯搜索意圖;對於沒有明顯搜索意圖的搜索關鍵字,以第一預定推薦方式為確定推薦搜索關鍵字的主方式,而以其他推薦方式為確定搜索關鍵字的輔助方式的策略來確定推薦的搜索關鍵字,由於第一預定推薦方式為適用於在沒有明顯搜索意圖情況下的基於知識庫的推薦方式和/或基於會話相關性的推薦方式,因此改善了搜索關鍵字的推薦效果,提高了搜索 引擎伺服器的處理效率。
針對現有搜索關鍵字推薦方案存在的為沒有明顯搜索意圖的用戶推薦搜索關鍵字時效果不佳,造成搜索引擎伺服器系統資源浪費的問題。本發明實施例提出了一種關鍵字推薦方案,該方案首先對用戶輸入的搜索關鍵字是否反映出明確搜索意圖進行判定,對於有明確搜索意圖和沒有明確搜索意圖的用戶輸入的搜索關鍵字,採用有區分的搜索關鍵字推薦方式來推薦搜索關鍵字。
此外,本發明實施例還提供了兩種適用於向沒有明確搜索意圖的用戶推薦搜索關鍵字的方法。
下面結合各個附圖對本發明實施例技術方案的主要實現原理、具體實施方式及其對應能夠達到的有益效果進行詳細的闡述。
如圖1所示,本發明實施例的主要實現原理流程如下:步驟10,接收輸入的搜索關鍵字;步驟20,比較接收的搜索關鍵字與設定的非意圖詞集合中的樣本詞以及設定的意圖詞集合中的樣本詞,當比較結果為接收的搜索關鍵字包含非意圖詞集合中的樣本詞而不包含意圖詞集合中的樣本詞時,進入步驟30,而當比較結果為接收的搜索關鍵字不包含非意圖詞集合中的樣本詞時,進入步驟40,在本步驟20中,確定輸入的搜索關鍵字是否包含設定的非意圖詞集合(或意圖詞集合)中的樣本詞的依據為輸入的搜索關鍵字是否包含與非意圖詞集合中(或意圖詞集合)的樣本詞相同的子串;步驟30,可以確定接收的搜索關鍵字對應的搜索意圖標識為非明確搜索意圖標識,進入步驟50;步驟40,可以確定接收的搜索關鍵字對應的搜索意圖標識為明確搜索意圖標識,進入步驟60;步驟50,以第一預定推薦方式為確定推薦搜索關鍵字的主方式,而以其他推薦方式為確定搜索關鍵字的輔助方式的策略,來確定推薦搜索關鍵字,其中,第一預定推薦方式可以為基於知識庫的推薦方式和/或基於會話相關性的推薦方式。其中,當以基於知識庫的推薦方式為主方式時,包含基於會話相關性的推薦方式在內的其他推薦方式可以看做是基於知識庫的推薦方式的輔助推薦方式,而當以基於會話相關性為主方式時,包含基於知識庫的推薦方式在內的其他推薦方式可以看做是基於會話相關性的推薦方式的輔助推薦方式,流程結束。
步驟60,以第二預定推薦方式來確定推薦搜索關鍵字,流程結束。其中,第二預定推薦方式可以為基於搜索日誌的推薦方式,也可以為以基於搜索日誌的推薦方式為確定推薦搜索關鍵字的主方式,而以其他推薦方式為確定搜索關鍵字的輔助方式的推薦方式。
上述步驟中,步驟30可以不用執行,從而可以在比較結果為接收的搜索關鍵字包含非意圖詞集合中的樣本詞而不包含意圖詞集合中的樣本詞時,直接轉為執行步驟50;類似地,步驟40也可以不用執行,從而可以在比較結果為接收的搜索關鍵字不包含非意圖詞集合中的樣本詞時,直接轉為執行步驟60。
在本發明實施例中,由於基於知識庫的推薦方式或基於會話相關性的推薦方式均為適合針對具備非明確搜索意圖標識的搜索關鍵字進行推薦並能得到較好推薦效果的方式(以基於知識庫的推薦方式或基於會話相關性的推薦方式為主時的搜索關鍵字推薦流程將在後文的具體實施例中進行詳細描述),因此,當確定出接收的搜索關鍵字中僅包含非意圖詞集合中的樣本詞時,藉由這兩種方式中的任意一種方式為主來進行搜索關鍵字的推薦,均能夠改善搜索關鍵字的推薦效果,解決現有搜索關鍵字推薦方案存在的為沒有明顯搜索意圖的用戶推薦搜索關鍵字時效果不佳從而造成搜索引擎伺服器系統資源浪費的問題。
在本發明實施例中,為了進一步改善搜索關鍵字的推薦效果,當步驟50中採用上述策略來確定推薦的搜索關鍵字時,根據輸入的搜索關鍵字所推薦的所有搜索關鍵字可以滿足條件:採用上述策略中所述的第一預定推薦方式所推薦的搜索關鍵字的數目在所述所有搜索關鍵字的總數中所占比例大於採用所述其他推薦方式確定推薦的搜索關鍵字的數目在該總數中所占比例。這樣可以使得用戶所面對的推薦的關鍵字中包含大量的由上述第一預定推薦方式確定的搜索關鍵字。前文已提到,第一預定推薦方式是針對非明確搜索意圖標識的搜索關鍵字進行推薦並能得到較好推薦效果的方式,從而使該第一預定推薦方式所對應的所述比例較大,能夠改善搜索關鍵字的推薦效果。
下面將依據本發明上述發明原理,詳細介紹兩個實施例來對本發明方法的主要實現原理進行詳細的闡述和說明。
實施例一
圖2為本實施例提供的推薦搜索關鍵字的裝置的原理示意圖。該裝置中包括意圖識別模組、推薦方式選擇模組和搜索關鍵字推薦模組。
其中,各模組功能的簡單介紹如下:意圖識別模組,主要用於在輸入的搜索關鍵字包含設定的非意圖詞集合中的樣本詞但不包含設定的意圖詞集合中的樣本詞時,確定輸入的搜索關鍵字對應的搜索意圖標識為非明確搜索意圖標識,而在輸入的搜索關鍵字不包含設定的非意圖詞集合中的樣本詞時,確定輸入的搜索關鍵字對應的搜索意圖標識為明確搜索意圖標識,並將輸入的搜索關鍵字的搜索意圖標識發送給推薦方式選擇模組進行處理;推薦方式選擇模組,主要用於從預先設置的不同搜索意圖標識與推薦策略的對應關係中,選擇出意圖識別模組發來的搜索意圖標識對應的推薦策略;搜索關鍵字推薦模組,主要用於根據用戶輸入的搜索關鍵字以及推薦方式選擇模組選擇出的推薦策略,確定推薦的搜索關鍵字。
圖3a為本發明實施例提供的搜索關鍵字推薦方案的具體流程圖。
步驟301,用戶在搜索引擎頁面中的搜索欄中輸入搜索關鍵字;在本實施例中,用戶輸入的搜索關鍵字為“代理加盟”;步驟302,搜索引擎中的意圖識別模組藉由比較用戶輸入的搜索關鍵字與預先儲存的非意圖詞集合和意圖詞集合,確定用戶輸入的搜索關鍵字對應的搜索意圖標識(非明確搜索意圖標識或明確搜索意圖標識);所述非意圖詞集合和意圖詞集合中均儲存著大量樣本詞。非意圖詞集合中的樣本詞是能夠表徵非搜索意圖的詞,而意圖詞集合中的樣本詞則是能夠表徵具備搜索意圖的詞。一般來說,非意圖樣本詞是指沒有明確對應實體的詞,例如商業意圖詞等,非意圖樣本詞不能為產品名稱或品牌等,例如“編程”、“風險分析”、“法律投訴”等等都是非意圖樣本詞;而意圖詞是指有明確對應實體的詞,實際物品、商品的名稱都是意圖詞,例如“手機”、“汽車”、“滅火器”等等。
意圖識別模組在輸入的搜索關鍵字包含設定的非意圖詞集合中的樣本詞而不包含設定的非意圖詞集合中的樣本詞時,確定輸入的搜索關鍵字對應的搜索意圖標識為非明確搜索意圖標識;而在輸入的搜索關鍵字不包含設定的非意圖詞集合中的樣本詞時,可以確定輸入的搜索關鍵字對應的搜索意圖標識為明確搜索意圖標識。非明確搜索意圖標識和明確搜索意圖標識可以預先設定,例如“NEG”為非明確搜索意圖標識、“POS”為明確搜索意圖標識;或者“0”為非明確搜索意圖標識、“1”為明確搜索意圖標識。
步驟303,意圖識別模組將確定出的用戶輸入的搜索關鍵字對應的搜索意圖標識發送給推薦方式選擇模組;步驟304,推薦方式選擇模組從預先設置的不同搜索意圖標識與推薦策略的對應關係中,選擇出意圖識別模組發來的搜索意圖標識對應的推薦策略;不同搜索意圖標識與推薦策略的對應關係如表1所示。其中,推薦方式A為基於知識庫(KBS,Knowledge-Based System)的推薦方式、推薦方式B為基於會話相關性(Session)的推薦方式、推薦方式C為基於搜索日誌的推薦方式。
當然,每種不同搜索意圖標識對應的推薦策略也可以是多種推薦方式的組合,非明確搜索意圖標識對應的推薦策略可以為以第一預定推薦方式為確定推薦搜索關鍵字的主方式,而以其他推薦方式為確定搜索關鍵字的輔助方式;明確搜索意圖標識對應的推薦策略則可以為以基於搜索日誌的推薦方式為推薦搜索關鍵字的主方式,而以其他推薦方式為確定搜索關鍵字的輔助方式。具體地,可以用每種推薦方式推薦出的搜索關鍵字數目在推薦的搜索關鍵字總數中所占比例來體現這種主輔關係,如表2所示。
假定推薦方式A推薦出的搜索關鍵字數目在推薦的搜索關鍵字總數中所占比例為a;推薦方式B推薦出的搜索關鍵字數目在推薦的搜索關鍵字總數中所占比例為b;推薦方式C推薦出的搜索關鍵字數目在推薦的搜索關鍵字總數中所占比例為c。對於明確搜索意圖標識對應的推薦策略而言,c>=a+b;對於非明確搜索意圖標識對應的推薦策略而言,a+b>=c。後續為了便於描述,可以將a、b、c這樣的比例稱為“推薦比例”。
步驟305,搜索關鍵字推薦模組根據推薦方式選擇模組選擇出的推薦策略、以及用戶輸入的搜索關鍵字,確定推薦的搜索關鍵字。
需要說明的是,在上述步驟304中推薦策略中各推薦方式推薦出的搜索關鍵字數目在推薦的搜索關鍵字總數中所占比例a、b、c的具體數值可以採用自適應的方法來動態調整,例如可以採用基於曝光回饋率(CTR,Click-Through-Rate)的方法來動態調整a、b、c的值。根據用戶輸入的搜索關鍵字或推薦出的搜索關鍵字進行搜索得到搜索結果,被稱為該搜索關鍵字被曝光了一次,如果用戶點擊了搜索結果,則說明該搜索關鍵字得到了一次回饋。對於推薦方式來說,如果本次搜索結果是利用推薦方式A推薦出的搜索關鍵字進行搜索而得到的,稱為推薦方式A獲得了1次曝光,如果用戶本次所點擊的搜索結果是採用推薦方式A(基於知識庫的推薦方式)推薦出的搜索關鍵字而得到的,那麼稱推薦方式A獲得了一次回饋。
推薦方式的曝光回饋率是指該推薦方式得到的曝光次數與基於該曝光次數獲得的回饋次數之間的比值。例如,推薦方式A的曝光回饋率是指在預定時間段內推薦方式A被曝光的次數與推薦方式A獲得的回饋次數之間的比值。
調整a、b、c數值的流程請參照圖3b所示:S1,搜索引擎針對預定時間段內每次用戶點擊搜索結果的行為,若搜索結果是根據推薦出的搜索關鍵字獲得的搜索結果,記錄本次搜索關鍵字所採用的推薦方式,即記錄預定時間段內每種推薦方式得到的曝光次數;假定5天之內,推薦方式A得到了1000次曝光、推薦方式B得到了500次曝光、推薦方式C得到了300次曝光。
S2,搜索引擎統計所述設定時間段內,每種推薦方式推薦出的搜索關鍵字獲得回饋的次數;假定5天之內,推薦方式A得到了500次回饋、推薦方式B得到了200次回饋、推薦方式C得到了100次回饋。
S3,搜索引擎根據S1得到的預定時間段內每種推薦方式得到的曝光次數,以及S2獲得的所述預定時間段內每種推薦方式獲得的回饋次數,計算每種推薦方式對應的曝光回饋率;推薦方式A對應的曝光回饋率為1000次曝光/500次回饋=2;推薦方式B對應的曝光回饋率為500次曝光/200次回饋=2.5;推薦方式C對應的曝光回饋率為300次曝光/100次回饋=3;S4,搜索引擎按照設定的調整步長,增大具有最小曝光回饋率數值的推薦方式(可以理解為獲得回饋的效率較高的推薦方式)確定的推薦搜索關鍵字數目在各推薦方式確定的推薦搜索關鍵字總數中所占比例,減少具有最大曝光回饋率數值的推薦方式(可以理解為獲得回饋的效率較低的推薦方式)對應的該比例;假定調整之前a=40%、b=40%、c=20%,由於推薦方式A曝光回饋率數值最小,而推薦方式C曝光回饋率數值最大,按照每次調整5%的調整步長,修改a、c的值,a’=a+5%=45%,c’=c-5%=15%。
下面分別對基於知識庫的推薦方式和基於會話相關性的推薦方式進行詳細的描述。
一、基於知識庫的推薦方式
圖4為基於知識庫的推薦方式的原理示意圖。
步驟401,資料庫中儲存有搜索日誌、資料挖掘引擎對資料庫中儲存的搜索關鍵字進行聚類處理,從而獲得至少兩個詞條集合,其中,同一詞條集合中包含的各詞條之間存在邏輯對應關係且各詞條類型相同,而不同詞條結合對應的詞條類型不同;在本實施例中,可以獲取四類不同類型的詞條集合,具體為:複合類型詞條的集合、單一類型詞條的集合、品牌類型詞條的集合和產品型號類型詞條的集合。不同類型詞條集合中的詞條之間存在邏輯對應關係。
例如,請參照圖5所示,複合類型詞條集合中的詞條“智慧3G手機”、單一類型詞條的集合中的詞條“手機”、品牌類型詞條的集合中的詞條“品牌S”、產品型號類型詞條的集合中的詞條“i9000”兩兩之間存在邏輯關係;複合類型詞條集合中的詞條“數位相框”與單一類型詞條的集合中的詞條“相框”存在邏輯關係,同時與品牌類型詞條的集合中的詞條“品牌A”、產品型號類型詞條的集合中的詞條“v630”存在邏輯關係;複合類型詞條集合中的詞條“代理加盟”與單一類型詞條的集合中的詞條“代理”存在邏輯關係,同時與品牌類型詞條的集合中的詞條“品牌A代理商”、產品型號類型詞條的集合中的詞條“T50b”存在邏輯關係等等。
步驟402、根據接收到的搜索關鍵字,從步驟401中獲得的各個詞條集合中,確定包含與該搜索關鍵字匹配一致的詞條的集合;逐一將用戶輸入的搜索關鍵字與上述四個詞條集合中的詞條進行比對,從而確定輸入的搜索關鍵字所在的集合,這裏若假定用戶輸入的搜索關鍵字為“加盟代理”,則確定用戶輸入的搜索關鍵字所在的集合為複合類型詞條集合。
步驟403,從儲存的規則集合中,選擇出以該輸入的搜索關鍵字所在的集合中包含的詞條類型為鏈首的規則,規則集合中的每個規則包含各詞條類型的先後順序鏈;例如,規則1:複合類型->品牌類型->產品型號類型;規則2:單一類型->複合類型->品牌類型->產品型號類型;規則3:產品型號類型->品牌類型;規則4:品牌類型->產品型號類型;......例如,前文所述的用戶輸入的搜索關鍵字為“加盟代理”,而與“加盟代理”對應的結合為包含複合型詞條的集合,因此,針對“加盟代理”這一搜索關鍵字,選擇出的規則為以複合類型為鏈首的規則1。
步驟404,針對每個選擇出的規則,確定該規則包含的先後順序鏈中鏈首之後的詞條類型後,進入步驟405;在規則1中,在鏈首“複合類型”之後的詞條類型為品牌類型。
步驟405,將包含所述鏈首之後的詞條類型詞條的集合中與該輸入的搜索關鍵字存在邏輯對應關係的詞條作為推薦的搜索關鍵字;參見圖5,由於在品牌類型詞條集合中與複合類型詞條集合中的“代理加盟”存在邏輯關係的詞條為“品牌A代理商”,因此將詞條“品牌A代理商”作為推薦的搜索關鍵字。
需要說明的是在步驟403中選擇出的規則的數目為至少一個,因而在步驟405中對應推薦出至少一個搜索關鍵字。當採用基於知識庫的推薦方式推薦出的搜索關鍵字的數目m超過按照搜索策略需要採用基於知識庫的推薦方式推薦出的搜索關鍵字的數目a×n(n為推薦的搜索關鍵字總數),即m>a×n時,從採用基於知識庫的推薦方式推薦出的m個搜索關鍵字中選擇出a×n個搜索關鍵字,具體的較佳方式包括根據搜索關鍵字的重要性參數值來選取等。
二、基於會話相關性Session的推薦方式
圖6為基於會話相關性的推薦方式的原理示意圖。
步驟601,預先根據搜索日誌中同一用戶使用的相鄰搜索關鍵字(相鄰搜索關鍵字是指搜索關鍵字的輸入時間間隔小於預定閾值的不同搜索關鍵字)之間的點擊關係和時間間隔,確定並儲存每次搜索過程對應的搜索關鍵字鏈,搜索關鍵字鏈中包含至少兩個搜索關鍵字;搜索日誌中通常會儲存同一用戶的搜索記錄,搜索記錄中包含根據輸入的搜索關鍵字進行網頁搜索的時間,以及是否點擊搜索結果等資訊。
兩個相鄰搜索關鍵字存在點擊關係是指同一用戶在設定的時間內,例如5分鐘內,分別根據這兩個搜索關鍵字進行了網頁搜索,且用戶分別點擊了根據兩個搜索關鍵字獲得的搜索結果中的頁面連接。其中,用戶點擊了根據搜索關鍵字獲得的搜索結果中的頁面連接反映出用戶藉由該搜索關鍵字進行了較為滿意的搜索過程。其中,相鄰搜索關鍵字中輸入時間靠後的一搜索關鍵字可以是用戶從根據輸入時間靠前的一搜索關鍵字推薦出的搜索關鍵字中選取的搜索關鍵字,也可以是用戶再次輸入的搜索關鍵字。
藉由上述方法,可以獲得搜索過程對應的包含至少兩個搜索關鍵字的搜索關鍵字鏈。
假定在本實施例中獲得了如下搜索關鍵字鏈:搜索關鍵字鏈1:“代理-代理加盟-A品牌加盟商-A品牌型號為T50b的產品”搜索關鍵字鏈2:“代理加盟-服裝專賣店加盟-加盟熱線”;搜索關鍵字鏈3:“K品牌速食店-代理加盟-加盟熱線”......。
步驟602,接收輸入的搜索關鍵字;這裏假定用戶在搜索欄輸入的搜索關鍵字為“代理加盟”;步驟603,確定儲存的包含有輸入的搜索關鍵字的各搜索關鍵字鏈中在輸入的搜索關鍵字後面位置的搜索關鍵字;搜索關鍵字鏈1中在“代理加盟”後面位置的搜索關鍵字為“A品牌加盟商”、“A品牌型號為T50b的產品”;搜索關鍵字鏈2中在“代理加盟”後面位置的搜索關鍵字為“服裝專賣店加盟”、“加盟熱線”;搜索關鍵字鏈3中在“代理加盟”後面位置的搜索關鍵字為“加盟熱線”;步驟604,根據所述後面位置的搜索關鍵字確定推薦的搜索關鍵字;步驟604的具體方式實現方式包括但不限於以下兩種:
1、根據預先儲存有各種行業類別詞條的集合(例如商業類型詞條集合、電子產品類型詞條集合等),從各搜索關鍵字鏈的位於輸入的搜索關鍵字後面位置的搜索關鍵字中,選擇出與輸入的搜索關鍵字處於同一行業類別詞條集合的搜索關鍵字作為推薦的搜索關鍵字;
2、分別統計後面位置的搜索關鍵字中各不同搜索關鍵字在所有後面位置的搜索關鍵字中的出現概率,並對應出現概率由高到低的順序,依次選擇預定數量的出現概率對應的搜索關鍵字作為推薦的搜索關鍵字。
例如共有100個搜索關鍵字鏈中出現了“代理加盟”,在其中50個搜索關鍵字鏈中“代理加盟”後面位置的搜索關鍵字為“加盟熱線”、在其中15個搜索關鍵字鏈中“代理加盟”後面位置的搜索關鍵字為“服裝專賣店”、在其中15個搜索關鍵字鏈中“代理加盟”後面位置的搜索關鍵字為“加盟商培訓”、在其中20個搜索關鍵字鏈中“代理加盟”後面位置的搜索關鍵字為“加盟返利”,則“加盟熱線”出現的概率為0.5、“加盟返利”出現的概率為0.2、“服裝專賣店”出現的概率為0.15、“加盟商培訓”出現的概率為0.15,那麼按照概率由高到低的順序排列後,推薦的順序為“加盟熱線”-“加盟返利”-“服裝專賣店”-“加盟商培訓”,若需要推薦出1個搜索關鍵字,則將“加盟熱線”作為推薦的搜索關鍵字。
當然,上述兩種後一位置的搜索關鍵字確定推薦的搜索關鍵字的方式也可以結合使用,例如先篩選出後一位置的搜索關鍵字中選擇出與輸入的搜索關鍵字處於同一行業類別詞條集合中的後一位置的搜索關鍵字,再從篩除出的搜索關鍵字中進一步選擇出出現概率最高的搜索關鍵字作為推薦的搜索關鍵字。
上述基於知識庫的推薦方式或基於會話相關性的推薦方式能夠擴大推薦關鍵字時的行業領域,採用行業領域發散的思路來推薦關鍵字,而不是僅根據重要性參數值來推薦搜索關鍵字。
本發明實施例提供的搜索關鍵字的推薦方案中,首先對用戶輸入的搜索關鍵字進行搜索意圖識別,識別用戶輸入的搜索關鍵字是否有明顯搜索意圖;對於沒有明顯搜索意圖的用戶輸入的搜索關鍵字,根據第一預定推薦方式為確定推薦搜索關鍵字的主方式,而以其他推薦方式為確定搜索關鍵字的輔助方式的策略來確定推薦搜索關鍵字,由於第一預定推薦方式可以為基於知識庫或基於會話相關性的推薦方式,因此可以針對沒有明顯搜索意圖的用戶輸入的搜索關鍵字完成較優的搜索關鍵字推薦,從而擴大了推薦搜索關鍵字時的行業領域,避免現有的基於日誌的關鍵字推薦方式存在的逐級細化的問題,能夠改善搜索關鍵字的推薦效果。對於有明顯搜索意圖的用戶輸入的搜索關鍵字,可以將基於知識庫的推薦方式或基於會話相關性的推薦方式作為現有的基於日誌的推薦方式的合理補充。
實施例二
實施例一中提供的基於意圖識別的搜索關鍵字推薦方案還可以與搜索關鍵字的行業類別識別相結合,從而獲得更佳的推薦效果。行業類別識別是指預先將搜索日誌中的搜索關鍵字按照行業類別進行分類,例如分為電子產品類別、商業活動類別、農業產品類別、服裝產品類別等等,並儲存每個行業類別對應的搜索關鍵字集合。當至少兩個行業類別對應的搜索關鍵字集合中都包含用戶輸入的搜索關鍵字時,根據每個行業類別分別對應的搜索關鍵字集合中用戶輸入的搜索關鍵字的點擊因素的參數值,確定輸入的搜索關鍵字屬於每個行業類別的概率,並進而根據確定出的概率以及推薦搜索關鍵字的總數,確定每個行業類別對應的需要推薦出的搜索關鍵字數目;針對每個行業類別,可以採用實施例一中提供的方案中步驟304確定出的推薦策略來確定推薦的搜索關鍵字。具體過程請參照圖7所示:步驟701,根據預先儲存的各行業類別分別對應的搜索關鍵字集合,確定包含有用戶輸入的搜索關鍵字的搜索關鍵字集合對應的行業類別,從而獲得輸入的搜索關鍵字對應的行業類別集合;假定,輸入的搜索關鍵字為“蘋果”,服裝行業類別對應的搜索關鍵字集合和農產品類別對應的搜索關鍵字集合中均包括輸入的搜索關鍵字“蘋果”,則蘋果對應的行業類別集合S為{服裝行業類別、農產品類別}。
步驟702,針對步驟701確定出的行業類別集合中的每個行業類別,確定輸入的搜索關鍵字在該行業類別對應的搜索關鍵字集合中的點擊因素的屬性值;例如,在最簡單的一種情況下,每個行業類別對應的搜索關鍵字集合中搜索關鍵字點擊因素的屬性值為根據該搜索關鍵字獲得的搜索結果被點擊的次數,假定服裝行業類別對應的搜索關鍵字集合中搜索關鍵字“蘋果”的搜索結果被點擊的次數為20次,點擊因素的屬性值為20;農產品類別對應的搜索關鍵字集合中搜索關鍵字“蘋果”的搜索結果被點擊的次數為80次,點擊因素的屬性值為80。
步驟703,根據步驟702確定出的點擊因素的屬性值,確定輸入的搜索關鍵字屬於步驟701中獲得的行業類別集合中各行業類別的概率;對步驟701中獲得的行業類別集合中每個行業類別中輸入的搜索關鍵字的點擊因素的屬性值進行歸一化處理,將歸一化處理結果作為輸入的搜索關鍵字屬於各行業類別的概率,即搜索關鍵字“蘋果”屬於農產品類別的概率為80%,屬於服裝類行業類別的概率為20%。
步驟704,根據步驟703確定出的概率、以及所需推薦的關鍵字的數目,確定所述行業類別集合中每個行業類別對應需要推薦的關鍵字的數目;若所需推薦的搜索關鍵字的總數為10個,則農產品類別對應的需要推薦的關鍵字的數目為10×80%=8個,服裝類行業類別對應的需要推薦的關鍵字的數目為10×20%=2個。
步驟705,針對每個行業類別,根據該行業類別對應的搜索關鍵字集合,可以採用實施例一中步驟304確定出 的推薦策略來確定該行業類別推薦的搜索關鍵字;步驟706,將每個行業類別推薦的搜索關鍵片語成的集合,作為推薦的搜索關鍵字集合。
較佳地,還可以根據步驟703確定出的概率,對步驟706獲得的推薦的搜索關鍵字進行排序,例如將對應的概率值較高的行業類別推薦的搜索關鍵字排在靠前的位置,將對應的概率值較低的行業類別推薦的搜索關鍵字排在靠後的位置。
需要說明的是,圖3中的步驟301~步驟303和步驟701~步驟703可以並行地執行。
相應地,本發明實施例還提供了一種推薦搜索關鍵字的裝置,該裝置的具體結構示意圖如圖8所示,包括以下功能單元:接收單元81,用於接收輸入的搜索關鍵字;比較單元82,用於比較接收單元81接收的搜索關鍵字與設定的非意圖詞集合中的樣本詞以及設定的意圖詞集合中的樣本詞;第一推薦單元83,用於在比較單元82得到的比較結果為接收的搜索關鍵字包含非意圖詞集合中的樣本詞而不包含意圖詞集合中的樣本詞時,以第一預定推薦方式為確定推薦搜索關鍵字的主方式,以除第一預定推薦方式外的其他推薦方式為確定搜索關鍵字的輔助方式的策略,確定推薦搜索關鍵字,其中,第一預定推薦方式為基於知識庫的推薦方式和/或基於會話相關性的推薦方式。
此外,該裝置還可以包括第二推薦單元,用於在比較單元82得到的比較結果為接收的搜索關鍵字不包含非意圖詞集合中的樣本詞時,以第二預定推薦方式為確定推薦搜索關鍵字的主方式,以除第二預定推薦方式外的其他推薦方式為確定搜索關鍵字的輔助方式的策略,確定推薦搜索關鍵字。
在本發明實施例中,當第一預定推薦方式為基於知識庫的推薦方式時,上述第一推薦單元83具體可以劃分為以下功能模組:
集合確定模組,用於在比較單元82得到的比較結果為接收的搜索關鍵字包含非意圖詞集合中的樣本詞而不包含意圖詞集合中的樣本詞時,從基於資料挖掘演算法預先獲得的至少兩個詞條集合中,確定接收單元81接收的搜索關鍵字包含的詞條所在的集合,其中,同一詞條集合包含的各詞條之間存在邏輯對應關係且各詞條類型相同,不同詞條集合對應的詞條類型不同;規則選擇模組,用於從儲存的包含各詞條類型的先後順序鏈的多個規則中,選擇包含以集合確定模組確定的集合所包含詞條的詞條類型為鏈首的先後順序鏈的規則;選取模組,用於針對規則選擇模組選擇出的每個規則,執行:確定該規則包含的先後順序鏈的鏈首之後的詞條類型,並根據所述邏輯對應關係,從確定的詞條類型對應的集合中,選取與接收的搜索關鍵字包含的詞條存在邏輯對應關係的詞條作為確定的推薦搜索關鍵字。
而當第一預定推薦方式為基於會話相關性的推薦方式時,第一推薦單元83具體可以劃分為以下功能模組:
第一確定模組,用於從預先儲存的每次搜索過程對應的搜索關鍵字鏈中,確定位於接收單元接收的搜索關鍵字後面位置的搜索關鍵字,其中,搜索關鍵字鏈是根據搜索日誌中同一用戶使用的相鄰搜索關鍵字之間的點擊關係和時間間隔確定的,且任意搜索關鍵字鏈均包含至少兩個搜索關鍵字;第二確定模組,用於根據第一確定模組確定的搜索關鍵字確定推薦搜索關鍵字。
本領域普通技術人員可以理解實現上述實施例方法中的全部或部分步驟是可以藉由程式來指令相關的硬體來完成,該程式可以儲存於一電腦可讀取儲存媒體中,如:ROM/RAM、磁碟、光碟等。
顯然,本領域的技術人員可以對本發明進行各種修改和變型而不脫離本發明的精神和範圍。這樣,倘若本發明的這些修改和變型屬於本發明申請專利範圍及其等同技術的範圍之內,則本發明也意圖包含這些修改和變型在內。
81...接收單元
82...比較單元
83...第一推薦單元
圖1為本發明實施例的主要實現原理流程圖;
圖2為本發明實施例一中推薦搜索關鍵字的裝置的原理示意圖;
圖3a為本發明實施例一提供搜索關鍵字推薦方案的流程圖;
圖3b為本發明實施例一中動態調整a、b、c值的流程圖;
圖4為本發明實施例一中基於知識庫的推薦方式的原理示意圖;
圖5為本發明實施例一中四個包含不同詞條類型詞條的集合的示意圖;
圖6為本發明實施例一中基於會話相關性的推薦方式的原理示意圖;
圖7為本發明實施例二提供搜索關鍵字推薦方案的流程圖;
圖8為本發明實施例提供的一種推薦搜索關鍵字的裝置的具體結構示意圖。

Claims (15)

  1. 一種推薦搜索關鍵字的方法,其特徵在於,包括:接收輸入的搜索關鍵字;比較接收的搜索關鍵字與設定的非意圖詞集合中的樣本詞以及設定的意圖詞集合中的樣本詞;當比較結果為接收的搜索關鍵字包含非意圖詞集合中的樣本詞而不包含意圖詞集合中的樣本詞時,以第一預定推薦方式為確定推薦搜索關鍵字的主方式,以除第一預定推薦方式外的其他推薦方式為確定搜索關鍵字的輔助方式的策略,確定推薦搜索關鍵字,其中,第一預定推薦方式為基於知識庫的推薦方式和/或基於會話相關性的推薦方式。
  2. 如申請專利範圍第1項之方法,其中,以第一預定推薦方式為確定推薦搜索關鍵字的主方式,而以其他推薦方式為確定搜索關鍵字的輔助方式的策略,確定推薦搜索關鍵字,具體包括:依據採用第一預定推薦方式所確定的推薦搜索關鍵字的數目在採用第一預定推薦方式及該其他推薦方式確定的所有推薦搜索關鍵字的總數中所占比例大於採用該其他推薦方式確定的推薦搜索關鍵字的數目在該總數中所占比例的原則,確定推薦搜索關鍵字。
  3. 如申請專利範圍第1或2項之方法,其中,還包括: 當比較結果為接收的搜索關鍵字不包含非意圖詞集合中的樣本詞時,以第二預定推薦方式為確定推薦搜索關鍵字的主方式,以除第二預定推薦方式外的其他推薦方式為確定搜索關鍵字的輔助方式的策略,確定推薦搜索關鍵字。
  4. 如申請專利範圍第3項之方法,其中,以第二預定推薦方式為確定推薦搜索關鍵字的主方式,以除第二預定推薦方式外的其他推薦方式為確定搜索關鍵字的輔助方式的策略,確定推薦搜索關鍵字,具體包括:依據由第二預定推薦方式所確定的推薦搜索關鍵字的數目在採用第二預定推薦方式及除第二預定推薦方式外的其他推薦方式所確定的所有推薦搜索關鍵字的總數中所占比例大於採用該除第二預定推薦方式外的其他推薦方式確定的推薦搜索關鍵字的數目在該總數中所占比例的原則,確定推薦搜索關鍵字。
  5. 如申請專利範圍第2項之方法,其中,還包括:在確定推薦搜索關鍵字之前,基於曝光回饋率,自適應動態調整各推薦方式分別確定的推薦搜索關鍵字數目在推薦搜索關鍵字總數目中所占比例,其具體包括:分別記錄用於確定推薦搜索關鍵字的各推薦方式在預定時間段內的曝光次數與獲得回饋的次數;根據記錄的曝光次數與獲得回饋的次數,分別確定各推薦方式對應的曝光回饋率;按照設定的調整步長,增大具有最小曝光回饋率數值 的推薦方式確定的推薦搜索關鍵字數目在該各推薦方式確定的推薦搜索關鍵字總數中所占比例,減小具有最大曝光回饋率數值的推薦方式確定的推薦搜索關鍵字數目在該各推薦方式確定的推薦搜索關鍵字總數中所占比例。
  6. 如申請專利範圍第1項之方法,其中,接收到輸入的搜索關鍵字之後,還包括:根據預先儲存的各行業類別分別對應的搜索關鍵字集合,確定包含有接收的搜索關鍵字的搜索關鍵字集合;並從預先儲存的各搜索關鍵字集合包含的搜索關鍵字的點擊因素的屬性值中,分別確定接收的搜索關鍵字的點擊因素的屬性值,並根據該點擊因素的屬性值,分別確定接收的搜索關鍵字屬於確定的搜索關鍵字集合對應的各行業類別的概率;根據確定出的概率以及所需推薦的搜索關鍵字的數目,分別確定各行業類別所對應的需推薦的搜索關鍵字的數目;以及以第一預定推薦方式為確定推薦搜索關鍵字的主方式,以除第一預定推薦方式外的其他推薦方式為確定搜索關鍵字的輔助方式的策略,確定推薦搜索關鍵字,具體包括:針對確定的搜索關鍵字集合對應的各行業類別中的任一行業類別,執行下述步驟,直至確定出各行業類別分別對應的推薦搜索關鍵字:按照採用第一預定推薦方式確定的推薦搜索關鍵字的 數目在採用包含第一預定推薦方式以及該其他推薦方式確定的搜索關鍵字總數中所占的比例大於採用該其他推薦方式確定的推薦搜索關鍵字的數目在該總數中所占比例的原則,確定針對該行業類別所確定的推薦搜索關鍵字。
  7. 如申請專利範圍第1項之方法,其中,該基於知識庫的推薦方式,包括:接收輸入的搜索關鍵字;以及從基於資料挖掘演算法預先獲得的至少兩個詞條集合中,確定接收的搜索關鍵字所在的集合,其中,同一詞條集合包含的各詞條之間存在邏輯對應關係且各詞條類型相同,不同詞條集合對應的詞條類型不同;並從儲存的包含各詞條類型的先後順序鏈的多個規則中,選擇包含以確定的該集合所包含詞條的詞條類型為鏈首的先後順序鏈的規則;針對選擇出的每個規則,執行:確定該規則包含的先後順序鏈的鏈首之後的詞條類型,並根據該邏輯對應關係,從確定的詞條類型對應的集合中,選取與接收的搜索關鍵字存在邏輯對應關係的詞條作為確定的推薦搜索關鍵字。
  8. 如申請專利範圍第1項之方法,其中,該基於會話相關性的推薦方式,包括:接收輸入的搜索關鍵字;從預先儲存的每次搜索過程對應的搜索關鍵字鏈中,確定位於接收的搜索關鍵字後面位置的搜索關鍵字,其 中,該搜索關鍵字鏈是根據搜索日誌中同一用戶使用的相鄰搜索關鍵字之間的點擊關係和時間間隔確定的,且任意搜索關鍵字鏈均包含至少兩個搜索關鍵字;並根據確定的搜索關鍵字確定推薦搜索關鍵字。
  9. 如申請專利範圍第8項之方法,其中,根據確定的搜索關鍵字確定推薦搜索關鍵字,具體包括:從確定的搜索關鍵字中,選擇與接收的搜索關鍵字屬於同一行業類別的搜索關鍵字;並將選擇的搜索關鍵字作為確定的推薦搜索關鍵字。
  10. 如申請專利範圍第8項之方法,其中,根據確定的搜索關鍵字確定推薦搜索關鍵字,具體包括:分別確定該確定的搜索關鍵字中各搜索關鍵字在所有的該確定的搜索關鍵字中的出現概率;對應於出現概率的由高至低順序,依次選擇預定數量的出現概率對應的搜索關鍵字作為推薦搜索關鍵字。
  11. 一種推薦搜索關鍵字的裝置,其特徵在於,包括:接收單元,用於接收輸入的搜索關鍵字;比較單元,用於比較接收單元接收的搜索關鍵字與設定的非意圖詞集合中的樣本詞以及設定的意圖詞集合中的樣本詞;第一推薦單元,用於在比較單元得到的比較結果為接收的搜索關鍵字包含非意圖詞集合中的樣本詞而不包含意圖詞集合中的樣本詞時,以第一預定推薦方式為確定推薦 搜索關鍵字的主方式,以除第一預定推薦方式外的其他推薦方式為確定搜索關鍵字的輔助方式的策略,確定推薦搜索關鍵字,其中,第一預定推薦方式為基於知識庫的推薦方式和/或基於會話相關性的推薦方式。
  12. 如申請專利範圍第11項之裝置,其中,該第一推薦單元以第一預定推薦方式為確定推薦搜索關鍵字的主方式,而以其他推薦方式為確定搜索關鍵字的輔助方式的策略,確定推薦搜索關鍵字,具體為:該第一推薦單元依據採用第一預定推薦方式所確定的推薦搜索關鍵字的數目在採用第一預定推薦方式及該其他推薦方式確定的所有推薦搜索關鍵字的總數中所占比例大於採用該其他推薦方式確定的推薦搜索關鍵字的數目在該總數中所占比例的原則,確定推薦搜索關鍵字。
  13. 如申請專利範圍第11項之裝置,其中,還包括:第二推薦單元,用於在比較單元得到的比較結果為接收的搜索關鍵字不包含非意圖詞集合中的樣本詞時,以第二預定推薦方式為確定推薦搜索關鍵字的主方式,以除第二預定推薦方式外的其他推薦方式為確定搜索關鍵字的輔助方式的策略,確定推薦搜索關鍵字。
  14. 如申請專利範圍第11項之裝置,其中,該第一預定推薦方式為基於知識庫的推薦方式時,該第一推薦單元具體包括:集合確定模組,用於在比較單元得到的比較結果為接收的搜索關鍵字包含非意圖詞集合中的樣本詞而不包含意 圖詞集合中的樣本詞時,從基於資料挖掘演算法預先獲得的至少兩個詞條集合中,確定接收單元接收的搜索關鍵字包含的詞條所在的集合,其中,同一詞條集合包含的各詞條之間存在邏輯對應關係且各詞條類型相同,不同詞條集合對應的詞條類型不同;規則選擇模組,用於從儲存的包含各詞條類型的先後順序鏈的多個規則中,選擇包含以集合確定模組確定的集合所包含詞條的詞條類型為鏈首的先後順序鏈的規則;選取模組,用於針對規則選擇模組選擇出的每個規則,執行:確定該規則包含的先後順序鏈的鏈首之後的詞條類型,並根據該邏輯對應關係,從確定的詞條類型對應的集合中,選取與接收的搜索關鍵字包含的詞條存在邏輯對應關係的詞條作為確定的推薦搜索關鍵字。
  15. 如申請專利範圍第11項之裝置,其中,該第一預定推薦方式為基於會話相關性的推薦方式時,該第一推薦單元具體包括:第一確定模組,用於從預先儲存的每次搜索過程對應的搜索關鍵字鏈中,確定位於接收單元接收的搜索關鍵字後面位置的搜索關鍵字,其中,該搜索關鍵字鏈是根據搜索日誌中同一用戶使用的相鄰搜索關鍵字之間的點擊關係和時間間隔確定的,且任意搜索關鍵字鏈均包含至少兩個搜索關鍵字;第二確定模組,用於根據第一確定模組確定的搜索關鍵字確定推薦搜索關鍵字。
TW100105663A 2010-12-31 2011-02-21 Recommended methods and devices for searching for keywords TWI525458B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010618555.4A CN102567408B (zh) 2010-12-31 2010-12-31 推荐搜索关键词的方法和装置

Publications (2)

Publication Number Publication Date
TW201227368A TW201227368A (en) 2012-07-01
TWI525458B true TWI525458B (zh) 2016-03-11

Family

ID=46381715

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100105663A TWI525458B (zh) 2010-12-31 2011-02-21 Recommended methods and devices for searching for keywords

Country Status (7)

Country Link
US (2) US8799306B2 (zh)
EP (1) EP2659398A4 (zh)
JP (1) JP5736469B2 (zh)
CN (1) CN102567408B (zh)
HK (1) HK1168920A1 (zh)
TW (1) TWI525458B (zh)
WO (1) WO2012092196A1 (zh)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8977642B2 (en) 2010-03-19 2015-03-10 Intuit Inc. Recommending relevant and personalized content accessing keywords for users of a text messaging service based global textsite platform
US9405832B2 (en) * 2012-05-31 2016-08-02 Apple Inc. Application search query classifier
CN103577416B (zh) 2012-07-20 2017-09-22 阿里巴巴集团控股有限公司 扩展查询方法及系统
CN103577426B (zh) * 2012-07-24 2019-04-12 百度在线网络技术(北京)有限公司 用于提供搜索建议的附加应用信息的方法、装置与系统
CN103593371B (zh) * 2012-08-16 2016-04-13 腾讯科技(深圳)有限公司 推荐搜索关键词的方法和装置
KR101387914B1 (ko) * 2012-10-16 2014-04-23 주식회사 와이즈넛 검색어 자동 완성 기능과 연동되는 추천 결과 제공 방법
CN103853771B (zh) * 2012-12-03 2018-12-14 百度在线网络技术(北京)有限公司 一种搜索结果的推送方法及系统
WO2014143076A1 (en) * 2013-03-13 2014-09-18 Intuit Inc. Recommending relevant and personalized content accessing keywords for users of a text messaging service based global textsite platform
US20140280294A1 (en) * 2013-03-13 2014-09-18 Google, Inc. Connecting users in search services based on received queries
US9372929B2 (en) * 2013-03-20 2016-06-21 Securboration, Inc. Methods and systems for node and link identification
CN104111941B (zh) * 2013-04-18 2018-11-16 阿里巴巴集团控股有限公司 信息展示的方法及设备
US9241242B2 (en) * 2013-04-19 2016-01-19 Tencent Technology (Shenzhen) Company Limited Information recommendation method and apparatus
CN103235812B (zh) * 2013-04-24 2015-04-01 中国科学院计算技术研究所 查询多意图识别方法和系统
US9524520B2 (en) 2013-04-30 2016-12-20 Wal-Mart Stores, Inc. Training a classification model to predict categories
US9524319B2 (en) 2013-04-30 2016-12-20 Wal-Mart Stores, Inc. Search relevance
CN103294814A (zh) * 2013-06-07 2013-09-11 百度在线网络技术(北京)有限公司 搜索结果推荐方法、系统和搜索引擎
US9477728B2 (en) * 2013-08-09 2016-10-25 Oracle International Corporation Handling of errors in data transferred from a source application to a target application of an enterprise resource planning (ERP) system
CN104657397B (zh) * 2013-11-25 2020-03-03 腾讯科技(深圳)有限公司 一种信息处理方法及终端
CN103631939B (zh) * 2013-12-06 2017-04-05 无锡艾德思奇软件有限公司 用于搜索引擎的数据处理方法和装置
CN104063418A (zh) * 2014-03-17 2014-09-24 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN104933081B (zh) * 2014-03-21 2018-06-29 阿里巴巴集团控股有限公司 一种搜索建议提供方法及装置
US9639601B2 (en) * 2014-06-06 2017-05-02 Xerox Corporation Question answering system adapted to style of user requests
US10846773B2 (en) * 2014-12-25 2020-11-24 Rakuten, Inc. Information processing device, information processing method, program, and storage medium
WO2016151690A1 (ja) 2015-03-20 2016-09-29 株式会社 東芝 文書検索装置、方法及びプログラム
KR101638821B1 (ko) * 2015-04-16 2016-07-12 네이버 주식회사 도메인 속성을 이용한 질의어 추천 방법과 시스템 및 기록매체
JP2018533774A (ja) * 2015-10-27 2018-11-15 ベイジン ディディ インフィニティ テクノロジー アンド ディベロップメント カンパニー リミティッド メッセージを配信するためのシステム及び方法
CN106774969B (zh) * 2015-11-20 2021-12-14 北京搜狗科技发展有限公司 一种输入方法和装置
CN105404680A (zh) * 2015-11-25 2016-03-16 百度在线网络技术(北京)有限公司 一种搜索推荐方法及装置
CN105512180B (zh) * 2015-11-25 2019-07-23 百度在线网络技术(北京)有限公司 一种搜索推荐方法及装置
JP6687737B2 (ja) * 2016-08-12 2020-04-28 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体
CN107784029B (zh) * 2016-08-31 2022-02-08 阿里巴巴集团控股有限公司 生成提示关键词、建立索引关系的方法、服务器和客户端
CN106528531B (zh) * 2016-10-31 2019-09-03 北京百度网讯科技有限公司 基于人工智能的意图分析方法及装置
CN106503233A (zh) * 2016-11-03 2017-03-15 北京挖玖电子商务有限公司 热门搜索词推荐系统
TWI647638B (zh) * 2016-11-15 2019-01-11 財團法人工業技術研究院 互動式推薦系統與方法
CN106777217B (zh) * 2016-12-23 2020-10-30 北京奇虎科技有限公司 一种搜索词推荐方法及装置
CN106844609A (zh) * 2017-01-17 2017-06-13 百度在线网络技术(北京)有限公司 一种搜索方法及装置
CN108664513B (zh) * 2017-03-31 2022-04-12 北京京东尚科信息技术有限公司 用于推送关键词的方法、装置以及设备
CN107577667B (zh) * 2017-09-14 2020-10-27 北京奇艺世纪科技有限公司 一种实体词处理方法和装置
CN110020045B (zh) * 2017-09-25 2021-07-27 北京国双科技有限公司 关键词路径分析方法及装置
CN108776901B (zh) * 2018-04-27 2021-01-15 微梦创科网络科技(中国)有限公司 基于搜索词的广告推荐方法及系统
CN108920531B (zh) * 2018-06-08 2021-10-15 Oppo(重庆)智能科技有限公司 搜索内容推荐方法、装置、终端设备及存储介质
CN109213848B (zh) * 2018-11-23 2022-03-11 北京字节跳动网络技术有限公司 相关搜索词的确定方法、装置、存储介质及电子设备
SG11202108736WA (en) * 2019-02-25 2021-09-29 Liveperson Inc Intent-driven contact center
CN111831848A (zh) * 2019-04-23 2020-10-27 广东小天才科技有限公司 作文好词句的推荐方法及装置、终端设备
CN111339239B (zh) * 2019-06-13 2021-01-05 海通证券股份有限公司 知识检索方法及装置、存储介质、服务器
CN110322139B (zh) * 2019-06-28 2023-11-28 创新先进技术有限公司 策略推荐方法及装置
CN110765354B (zh) * 2019-10-22 2022-11-22 北京字节跳动网络技术有限公司 信息的推送方法、装置、电子设备及存储介质
JP6960483B2 (ja) * 2020-02-04 2021-11-05 株式会社カカクコム 情報処理装置、サーバ、情報処理方法及び情報処理プログラム
CN111782935A (zh) * 2020-05-12 2020-10-16 北京三快在线科技有限公司 一种信息推荐方法、装置、电子设备及存储介质
CN111581481B (zh) * 2020-05-13 2024-03-08 北京达佳互联信息技术有限公司 搜索词推荐方法、装置、电子设备以及存储介质
WO2021246248A1 (ja) * 2020-06-03 2021-12-09 ソニーグループ株式会社 情報処理装置及び情報処理方法
CN113570404B (zh) * 2021-06-30 2023-12-05 深圳市东信时代信息技术有限公司 一种目标用户定位的方法、装置及相关设备
CN113486253B (zh) * 2021-07-30 2024-03-19 抖音视界有限公司 搜索结果展示方法、装置、设备和介质
CN113536777A (zh) * 2021-07-30 2021-10-22 深圳豹耳科技有限公司 新闻关键词的抽取方法、装置、设备及存储介质
CN113626715A (zh) * 2021-08-26 2021-11-09 北京字跳网络技术有限公司 查询结果显示方法、装置、介质和电子设备
CN115238049B (zh) * 2022-06-17 2023-08-04 北京优酷科技有限公司 剧本标注方法及电子设备

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219957A (ja) 1994-01-28 1995-08-18 Matsushita Electric Ind Co Ltd 情報分類装置、情報検索装置及び情報収集装置
US6460029B1 (en) * 1998-12-23 2002-10-01 Microsoft Corporation System for improving search text
US6567797B1 (en) 1999-01-26 2003-05-20 Xerox Corporation System and method for providing recommendations based on multi-modal user clusters
US6502091B1 (en) 2000-02-23 2002-12-31 Hewlett-Packard Company Apparatus and method for discovering context groups and document categories by mining usage logs
JP2002092033A (ja) 2000-09-12 2002-03-29 Sanyo Electric Co Ltd 情報検索装置
US6845374B1 (en) 2000-11-27 2005-01-18 Mailfrontier, Inc System and method for adaptive text recommendation
US7149804B2 (en) 2001-04-30 2006-12-12 Sony Computer Entertainment America Inc. Method and system for providing evaluation of text-based products
US7028024B1 (en) 2001-07-20 2006-04-11 Vignette Corporation Information retrieval from a collection of information objects tagged with hierarchical keywords
US7092936B1 (en) 2001-08-22 2006-08-15 Oracle International Corporation System and method for search and recommendation based on usage mining
JP4003468B2 (ja) 2002-02-05 2007-11-07 株式会社日立製作所 適合性フィードバックによる類似データ検索方法および装置
EP1395056A1 (en) 2002-08-30 2004-03-03 Sony International (Europe) GmbH Methods to create a user profile and to specify a suggestion for a next selection of the user
JP2005031949A (ja) 2003-07-11 2005-02-03 Canon Inc 情報検索方法、情報検索装置およびプログラム
US8086619B2 (en) 2003-09-05 2011-12-27 Google Inc. System and method for providing search query refinements
US7451131B2 (en) 2003-12-08 2008-11-11 Iac Search & Media, Inc. Methods and systems for providing a response to a query
US7428529B2 (en) 2004-04-15 2008-09-23 Microsoft Corporation Term suggestion for multi-sense query
US7707220B2 (en) 2004-07-06 2010-04-27 Icosystem Corporation Methods and apparatus for interactive searching techniques
US20060129531A1 (en) * 2004-12-09 2006-06-15 International Business Machines Corporation Method and system for suggesting search engine keywords
JP4461233B2 (ja) * 2005-03-30 2010-05-12 独立行政法人情報通信研究機構 メディアデータ選択装置、メディアデータ選択方法、メディアデータ選択プログラムおよびそのプログラムを記録した記録媒体
US8438142B2 (en) 2005-05-04 2013-05-07 Google Inc. Suggesting and refining user input based on original user input
US8200687B2 (en) * 2005-06-20 2012-06-12 Ebay Inc. System to generate related search queries
US7577665B2 (en) 2005-09-14 2009-08-18 Jumptap, Inc. User characteristic influenced search results
US7627548B2 (en) 2005-11-22 2009-12-01 Google Inc. Inferring search category synonyms from user logs
US7756855B2 (en) 2006-10-11 2010-07-13 Collarity, Inc. Search phrase refinement by search term replacement
US7689554B2 (en) 2006-02-28 2010-03-30 Yahoo! Inc. System and method for identifying related queries for languages with multiple writing systems
CN100495398C (zh) 2006-03-30 2009-06-03 国际商业机器公司 文件系统中搜索排序的方法及相关搜索引擎
US8073860B2 (en) * 2006-03-30 2011-12-06 Veveo, Inc. Method and system for incrementally selecting and providing relevant search engines in response to a user query
JP4958476B2 (ja) 2006-05-24 2012-06-20 株式会社日立製作所 検索装置
US7840538B2 (en) * 2006-12-20 2010-11-23 Yahoo! Inc. Discovering query intent from search queries and concept networks
US7725453B1 (en) 2006-12-29 2010-05-25 Google Inc. Custom search index
JP4909748B2 (ja) 2007-01-22 2012-04-04 ヤフー株式会社 ページ移動操作の履歴情報に基づいてWebページへの参照元のWebページに関する情報を推薦する方法及びサーバ
US20080222119A1 (en) 2007-03-08 2008-09-11 Microsoft Corporation Detecting a user's location, local intent and travel intent from search queries
JP2008293211A (ja) 2007-05-23 2008-12-04 Hitachi Ltd アイテム推薦システム
US7734641B2 (en) 2007-05-25 2010-06-08 Peerset, Inc. Recommendation systems and methods using interest correlation
US7818320B2 (en) 2007-05-31 2010-10-19 Yahoo! Inc. Enhanced search results based on user feedback relating to search result abstracts
CN101436186B (zh) * 2007-11-12 2012-09-05 北京搜狗科技发展有限公司 一种提供相关搜索的方法及系统
US20090171929A1 (en) * 2007-12-26 2009-07-02 Microsoft Corporation Toward optimized query suggeston: user interfaces and algorithms
JP4962967B2 (ja) * 2008-01-11 2012-06-27 ヤフー株式会社 Webページ検索サーバ及びクエリ推薦方法
CN101241512B (zh) 2008-03-10 2012-01-11 北京搜狗科技发展有限公司 一种重新定义查询词的搜索方法及装置
US20090259646A1 (en) 2008-04-09 2009-10-15 Yahoo!, Inc. Method for Calculating Score for Search Query
US7890516B2 (en) 2008-05-30 2011-02-15 Microsoft Corporation Recommending queries when searching against keywords
JP4869292B2 (ja) * 2008-06-20 2012-02-08 ヤフー株式会社 検索キーワードを推薦するサーバ、方法、およびプログラム
CN101751422A (zh) * 2008-12-08 2010-06-23 北京摩软科技有限公司 一种移动终端智能搜索的方法、移动终端和服务器
CN101751437A (zh) * 2008-12-17 2010-06-23 中国科学院自动化研究所 基于强化学习的网页页面主动式检索系统
JP2010146366A (ja) * 2008-12-19 2010-07-01 Toshiba Corp 情報提供サーバ
US8515966B2 (en) 2009-01-09 2013-08-20 Ebay Inc. Analyzing queries to generate product intention rules
CN101464897A (zh) * 2009-01-12 2009-06-24 阿里巴巴集团控股有限公司 一种词匹配及信息查询方法及装置
US8719249B2 (en) 2009-05-12 2014-05-06 Microsoft Corporation Query classification
US8423568B2 (en) * 2009-09-16 2013-04-16 Microsoft Corporation Query classification using implicit labels
CN102033877A (zh) * 2009-09-27 2011-04-27 阿里巴巴集团控股有限公司 检索方法和装置
US20110208730A1 (en) * 2010-02-23 2011-08-25 Microsoft Corporation Context-aware searching
US9177045B2 (en) * 2010-06-02 2015-11-03 Microsoft Technology Licensing, Llc Topical search engines and query context models
US8612432B2 (en) * 2010-06-16 2013-12-17 Microsoft Corporation Determining query intent
WO2012040872A1 (en) * 2010-09-29 2012-04-05 Yahoo! Inc. Training search query intent classifier using wiki article titles and search click log

Also Published As

Publication number Publication date
CN102567408A (zh) 2012-07-11
TW201227368A (en) 2012-07-01
US9092549B2 (en) 2015-07-28
US20140379745A1 (en) 2014-12-25
JP2014501422A (ja) 2014-01-20
JP5736469B2 (ja) 2015-06-17
WO2012092196A1 (en) 2012-07-05
CN102567408B (zh) 2014-06-04
US20120173562A1 (en) 2012-07-05
EP2659398A4 (en) 2017-01-25
US8799306B2 (en) 2014-08-05
EP2659398A1 (en) 2013-11-06
HK1168920A1 (zh) 2013-01-11

Similar Documents

Publication Publication Date Title
TWI525458B (zh) Recommended methods and devices for searching for keywords
US11782970B2 (en) Query categorization based on image results
US8843470B2 (en) Meta classifier for query intent classification
US9805022B2 (en) Generation of topic-based language models for an app search engine
Das Sarma et al. Dynamic relationship and event discovery
US9317550B2 (en) Query expansion
CA2528887C (en) Search query categorization for business listings search
US9324112B2 (en) Ranking authors in social media systems
TWI512506B (zh) Sorting method and device for search results
US8468153B2 (en) Information service for facts extracted from differing sources on a wide area network
US20090171938A1 (en) Context-based document search
US8515986B2 (en) Query pattern generation for answers coverage expansion
JP2017508214A (ja) 検索推奨の提供
WO2014107488A1 (en) Determining product categories by mining chat transcripts
CN110222203B (zh) 元数据搜索方法、装置、设备及计算机可读存储介质
Nuray-Turan et al. Attribute and object selection queries on objects with probabilistic attributes
CN111160699A (zh) 一种专家推荐方法及系统
de Amo et al. Mining contextual preference rules for building user profiles
Das et al. Leveraging collaborative tagging for web item design
US20190266291A1 (en) Document processing based on proxy logs
US20130091131A1 (en) Meta-model distributed query classification
Cheng et al. Data services for E-tailers leveraging web search engine assets
US8161065B2 (en) Facilitating advertisement selection using advertisable units
Pei et al. WEB RESOURCE CATEGORIZATION FOR SEMANTIC WEB SEARCH