TWI582619B - Method and apparatus for providing referral words - Google Patents

Method and apparatus for providing referral words Download PDF

Info

Publication number
TWI582619B
TWI582619B TW100128685A TW100128685A TWI582619B TW I582619 B TWI582619 B TW I582619B TW 100128685 A TW100128685 A TW 100128685A TW 100128685 A TW100128685 A TW 100128685A TW I582619 B TWI582619 B TW I582619B
Authority
TW
Taiwan
Prior art keywords
category
recommended
recommended query
query keyword
keyword
Prior art date
Application number
TW100128685A
Other languages
English (en)
Other versions
TW201248435A (en
Inventor
Peng Huang
Feng Lin
Shou-Song Zhang
Wei Zheng
Jiong Feng
Qin Zhang
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of TW201248435A publication Critical patent/TW201248435A/zh
Application granted granted Critical
Publication of TWI582619B publication Critical patent/TWI582619B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Description

提供推薦詞的方法及裝置
本發明涉及搜索技術,特別涉及一種提供推薦詞的方法及裝置。
隨著網際網路的迅速發展,電子商務已經廣泛的融入到人們的日常生活中。
在這些電子商務的應用中,輸入搜索關鍵字進行查詢是用戶查找和定位其感興趣商品的主要方法和途徑,也是用戶使用的最為頻繁的一個基本功能。為了能夠快速查找和定位所需要的商品,用戶需要選擇恰當的搜索關鍵字來描述自身的搜索需求。
通常情況下,用戶的搜索習慣是由抽象到特殊,即首先輸入較寬泛的搜索關鍵字,然後再通過特殊化搜索關鍵字,逐步縮小搜索範圍,最終定位到具體商品。
實際應用中,許多特殊商品的拼寫比較複雜生僻,用戶有可能只記憶住搜索關鍵字的開頭部分,而遺忘後續的內容,從而導致用戶需要通過多次查詢才能定位到其所需要的商品,而重複或多次輸入搜索關鍵字是一個繁瑣的過程,降低了搜索效率,並且容易發生輸入錯誤。
為了有效提高用戶的搜索效率,參閱圖1所示,現有技術下,電子商務網站通常會對用戶輸入的搜索關鍵字進行自動補齊,即提供一系列的推薦詞。一個高效的提供推薦詞的方法,可以節省用戶的輸入成本,緩解用戶構造完整搜索關鍵字的需求負擔,同時,高品質的推薦詞可以幫助用戶更好的查找和定位其感興趣的商品。
隨著電子商務網站中各類商品的數目日益增多,用戶從輸入搜索關鍵字到搜索到所需商品的過程也越來越長,因此,需要重新設計一種提供推薦詞的方法,在現有技術的基礎上進一步提高電子商務網站的搜索效率,提升系統的服務性能。
本發明實施例提供一種提供推薦詞的方法及裝置,用以解決現有技術中存在的推薦詞概念模糊,從而降低搜索裝置的搜索效率的問題。
本發明實施例提供的具體技術方案如下:一種提供推薦詞的方法,包括:接收用戶輸入的初始查詢關鍵字,並基於該初始查詢關鍵字獲得相應的推薦查詢關鍵字;決定獲得的推薦查詢關鍵字對應的至少兩種類別,以及用於查詢推薦查詢關鍵字的至少兩種點選區域;分別決定獲得的每一種類別針對所述推薦查詢關鍵字在每一種點選區域下的類別權重,以及每一種點選區域的點選特徵權重;分別根據獲得的每一種類別對應的類別權重,以及每一種點選區域對應的點選特徵權重,計算獲得每一種類別針對所述推薦查詢關鍵字的信賴水準;分別根據每一種類別針對所述推薦查詢關鍵字的信賴水準,決定所述推薦查詢關鍵字的目標類別,並對所述推薦查詢關鍵字及相應的目標類別進行呈現。
一種提供推薦詞的裝置,包括:獲取單元,用於接收用戶輸入的初始查詢關鍵字查詢關鍵字,並基於該初始查詢關鍵字獲得相應的推薦查詢關鍵字;第一決定單元,用於決定所述推薦查詢關鍵字對應的至少兩種類別,以及用於查詢推薦查詢關鍵字的至少兩種點選區域;第二決定單元,用於分別決定獲得的每一種類別針對所述推薦查詢關鍵字在每一種點選區域下的類別權重,以及每一種點選區域的點選特徵權重;計算單元,用於分別根據獲得的每一種類別對應的類別權重,以及每一種點選區域對應的點選特徵權重,計算獲得每一種類別針對所述推薦查詢關鍵字的信賴水準;呈現單元,用於分別根據每一種類別針對所述推薦查詢關鍵字的信賴水準,決定所述推薦查詢關鍵字的目標類別,並對所述推薦查詢關鍵字及相應的目標類別進行呈現。
本發明實施例中,使用用戶查詢日誌建立推薦詞典,並根據用戶點選日誌建立類別推薦方式,這樣,系統根據用戶輸入的初始query(查詢關鍵字)得到相應的推薦query時,可以根據用戶已有的點選行為決定各推薦query對應的目標類別,並在呈現各推薦query的同時也呈現相應的目標類別,這樣,通過目標類別向用戶提示各推薦query的引導意圖,令用戶可以根據各推薦query對應的目標類別,迅速決定自身的搜索意圖,避免無關的推薦query所造成的干擾,從而有效地提高了資訊搜索速度;同時,系統利用用戶選取的推薦query進行搜索時只在相應目標類別下進行搜索,而不是在所有的類別下搜索,從而大量減少了搜索資訊的數量,進一步提高資訊搜索速度,降低了伺服器的處理壓力。本發明可用於電腦、無線通訊設備等電子產品。
下面結合附圖對本發明較佳的實施方式進行詳細說明。
字典在查詢輸入補齊中起著重要的作用,所有的推薦詞都是基於字典產生的。例如,用戶輸入“pho”,通過字典查詢可以得到“phone”、“photo”、“photo frame”、“photo album”等具有“pho”首碼的推薦詞。
建立字典的詳細流程如下:
1、輸入用戶的查詢日誌;
2、對用戶的查詢日誌進行預處理操作,包括消除亂碼、規範標點符號書寫、拼寫糾錯(用戶可能由於手誤輸入錯誤的搜索關鍵字)、複數轉換成單數表示等,這些經過預處理之後的搜索關鍵字成為候選詞集合;
3、從步驟2生成的候選詞集合中選取一個候選詞;
4、從候選詞中提取並移除最左邊的字母元素,例如,候選詞“phone”,提取字母元素“p”,移除首字母後候選詞為“hone”;
5、將候選詞“phone”加入首字母“p”對應的推薦詞集合中;
6、重複步驟0,直到候選詞中所有的字母元素被提取;
7、將候選詞“phone”加入“phone”對應的推薦詞集合;
8、重複步驟0,直到候選詞集合為空;
9、完成推薦詞字典的建立
電子商務網站上,用於展示推薦詞的空間都存在限制,僅僅能展示有限的推薦詞,但是與用戶輸入的搜索關鍵字匹配的推薦詞的數量通常情況下遠遠大於這個限制,因此,需要從推薦詞中選取“品質”最好的若干個推薦詞進行呈現。
本發明實施例中,採用優先順序來衡量推薦詞的品質,優先順序越高,品質越好,具體為:首先使用推薦詞與搜索關鍵字之間的匹配度進行排序,如果推薦詞與搜索關鍵字的匹配屬於推薦詞的第一個單詞,則其匹配位置為“0”,如果屬於第二個單詞,則匹配位置為“1”,以此類推;匹配位置越靠前,則優先順序越高,例如輸入“phone”,推薦詞“phone case”比“mobile phone”要好,因為第一個匹配位置為0,第二個匹配位置為1;在電子商務領域中,每個電子商品都會被歸入某個類別(或同時歸於多個類別),所謂類別即是指在電子商務領域中,一個商品對應的產品類別,例如,手機對應的類別為通訊器材,而相機對應的類別為數位產品等等。用戶的查詢行為通常是和某一個類別相關聯,因此,本發明實施例中,將推薦詞和類別關聯在一起推薦給用戶,令用戶可以通過類別篩選過濾掉部分干擾因素,所謂的干擾因素即是與用戶搜索目的無關的推薦詞,從而提高系統的搜索效率。具體為:通常情況下,用戶在電子商務網站上輸入搜索關鍵字後,會點選和瀏覽網頁中非導航區內的某些商品,或者點選網頁中導航區內的類別,因此,可以從用戶的查詢日誌中學習搜索關鍵字(即推薦詞)與類別之間的關聯性。本發明實施例中,使用Offer點選行為(即網頁中非導航區展示的商品資訊的點選行為)、電子商務導航區點選行為作為特徵,使用線性模型進行融合,它們分別對應:Offer點選模型、導航區點選模型,其融合框架如圖2所示:首先,定義兩個函數:分別為:click 1(offer,query)=cat',其中,query表示用戶輸入的某個搜索關鍵字,Offer表示用戶點選了某個產品的網頁,cat'表示上述Offer的類別;click 1(offer,query)=cat'的含義即表示當用戶輸入query後,在offer網頁中是否點選了類別cat',取值為1表示點選,取值為0表示未點選。
click 2(query)=cat",其中,query表示用戶輸入的某個搜索關鍵字,表示用戶點選了導航區的某個類別,click 2(query)=cat"的含義即表示當用戶輸入query後,在導航區是否點選了類別cat",取值為1表示點選,取值為0表示未點選。
基於上述定義的函數,Offer網頁的點選特徵模型可以採用公式一表示為:
公式“f”表示一個針對Offer抽取特徵的特徵函數,針對一個offer,給定query(查詢詞,函數中用x表示)和cat'(類別)的條件下,這個函數取值有兩個:1或者0(這就是一個特徵的取值),其中,特徵函數中y定義為click1函數;給定一個query,並且這個query的click1(offer,query)=cat'的時候,取值為1;否則,數取值為0。通過這個函數,可以把一個Offer轉換成一個特徵空間,該特徵空間表示用戶輸入query(可以是多個)後,在offer網頁中分別點選了哪些類別下的商品資訊。
基於上述定義的函數,導航區點選特徵模型可以採用公式二表示為:
公式“f”表示一個針對導航區抽取特徵的特徵函數,給定一個query(查詢詞,函數中用x表示)和類別的條件下,這個函數取值有兩個:1或者0(這就是一個特徵值的取值範圍);其中,特徵函數中的y定義為click2函數。給定一個query,可以計算導航區類的類別的特徵值,如果click2(query)=cat",取值為1;否則,取值為0。通過這個函數,可以基於query和導航區的類別生成一個特徵空間,該特徵空間表示用戶輸入query(可以是多個)後,在導航區中分別點選了哪些類別。
以Offer點選資料和導航區點選資料為訓練資料進行訓練,分別得出Offer點選特徵和導航區點選特徵下每一種類別的類別權重,也可以稱為Offer點選區域和導航區點選區域下每一種類別的類別權重,可以理解為針對某個特定的query,用戶在Offer點選區域內點選每一個類別的概率,以及用戶在導航區點選區域內點選每一個類別的概率;權重的具體定義方式為:
1)Offer點選區域下的類別權重如公式三所示:
其中,Offer_cnt表示在offer點選資料中,特定query下,其關聯的類別是cat'的所有Offer的點選數累加;cat j表示某一個預設的類別,實際應用中,電子商務網站有很多產品被歸類於某一類,如,水果,“j”用來標識不同的類別。
例如,假設給定query“蘋果”,在“水果”類別下用戶點選了75個offer,“電子”類別下用戶點選了25個offer,則g1(“蘋果”,“水果”)=0.75,g1(“蘋果”,”電子”)=0.25;
2)導航區點選區域下的權重如公式四所示:
其中,sn_cnt表示在導航區點選資料中,特定query下,類別cat"的點選數累加,“j”用來標識不同的類別。假設有類別1,類別2,類別3,......,類別n,使j=1,2,...,n,可以統計所有類別下某一個query的點選數累計。
例如,假設給定query“蘋果”,並且導航區展示了2個類別,分別是“類別1:水果”和“類別2:電子”,在“蘋果”這一query下,導航區類別1的點選數累加是75,類別2的點選數累加是25,則g2(“蘋果”,“水果”)=0.75,g2(“蘋果”,“電子”)=0.25。
較佳的,參閱圖3所示,本實施例中,對於單個點選特徵f i ,需要進一步乘以其對應的權重g i ,這樣,可以使各個單個點選特徵之間有較好的區分度,因為g i 是一種最大使然比,反映了結果在訓練資料中的經驗分佈,即是指,f i 表示提取的一個點選特徵,通過這個點選特徵f i 與其對應的g i 的乘積,可以看出在這個點選特徵f i 下query偏向於哪一個類別,例如,仍採用上述實施例,其中,g 1g 2都偏向於“水果”類別(都是0.75),那麼,此時,這個點選特徵f i 傾向於類別1“水果”。
基於上述實施例,最後的判別操作綜合了所有點選區域對應的點選特徵,即各個點選區域對應的各點選特徵之間也需要點選特徵權重w來進行區分;因此,引入選通流程來評估特徵的重要程度,即計算w,具體如圖4所示,各種點選特徵對應的w由管理人員根據試驗結果進行預先設置。
從上述函數設置方式可以看出,g表示某一點選特徵相對於輸出類別的重要程度;w表示各點選特徵之間的相對重要程度。
實際應用中,在訓練資料進行了標注的情況下,w可以使用最大使然估計(MLE)訓練得到,事實上,這種情況下可以不需要g參數(但g參數可以作為點選特徵值,而不再是0,1值,直接訓練特徵參數即可;而在訓練資料未進行標注的情況下,可以採用點選區域對應的點選特徵的信賴水準(也可以稱為該點選區域的信賴水準)來設置w,例如,Offer點選區域內,Offer點選特徵對應的W1設置為:ω1=1-p error ,其中,p error 表示使用Offer點選特徵進行判斷的錯誤率;中心NP的ω值可以設定為它與原始query的相似度分值。
基於上述定義的各種函數,參閱圖5所示,本發明實施例中,基於用戶輸入的初始query,搜索裝置向用戶提供相關推薦詞的詳細流程如下:
步驟500:接收用戶輸入的初始query,並基於該初始query獲得相應的推薦query。
本實施例中,搜索裝置接收用戶輸入的初始query後,由於初始query可能是不完整的,因此搜索裝置需要根據預設的字典對初始query進行補充,以獲得相應的推薦query,即根據初始query獲得相應的推薦詞。
例如,假設用戶輸入“pho”,則搜索裝置通過字典查詢可以得到“phone”、“photo”、“photo frame”、“photo album”等具有“pho”首碼的推薦詞,即推薦query。
又例如,假設用戶輸入“蘋”,則搜索裝置通過字典查詢可以得到“蘋果”這一推薦query。
又例如,假設用戶輸入“蘋果”,則搜索裝置通過字典查詢可以得到“蘋果手機”、“蘋果MP3”……推薦query。
後續實施例中,以用戶輸入的初始query為“蘋”,而搜索裝置根據字典對其進行補充,獲得推薦query“蘋果”為例進行介紹。
步驟510:決定獲得的推薦query對應的至少兩種類別,以及用於查詢推薦query的至少兩種點選區域。
本實施例中,假設“蘋果”對應兩種類別,分別為“水果”和“電子”,而用於查詢推薦query的點選區域也有兩種,一種為Offer網頁,一種為導航區。
步驟520:分別決定獲得的每一種類別在每一種點選區域下的類別權重g,以及每一種點選區域的點選特徵權重w。
本實施例中,在決定任意一個類別(稱為類別x)在任意一個點選區域(稱為區域x)下的類別權重g時,採用以下方式進行計算:根據推薦query在區域x內類別x下對應的點選總數目,以及推薦query在區域x內所有類別下對應的點選數總數目的比值,決定相應的類別權重g,即類別x在區域x內的類別權重g,具體計算公式參考公式三和公式四,在此不再贅述。
同時,任意一點選區域的點選特徵權重w的決定方式如下:在訓練資料進行了標注的情況下,w使用極大似然估計方式獲得;在訓練資料未進行標注的情況下,採用上述任意一點選區域對應的信賴水準來設置w。具體設置方式在之前實施例中已介紹,在此亦不再贅述。
上述參數g和參數w的取值可以預先由管理人員配置好進行保存,並根據用戶資料的變更而進行即時更新,也可以在獲取推薦query後,根據當前的用戶資料進行即時計算。
例如,假設針對推薦query“蘋果”,系統統計用戶點選行為,在offer網頁的區域內,在“水果”類別下,用戶點選次數總共為75次,在“電子”類別下用戶點選次數總共為75次,則g1(“蘋果“,“水果”)=0.75,g1(“蘋果”,“電子”)=0.25;而在導航區域內,在“水果”類別下,用戶點選次數總共為80次,在“電子”類別下,用戶點選次數總共為20次,則g2(“蘋果”,“水果”)=0.8,g2(“蘋果”,“電子”)=0.2;同時,假設使用offer點選模型預測query類別的精確度為80%,則設置Offer網頁的點選特徵權重為w1=0.8;使用導航區點選模型預測query類別的精確度為60%,則設置導航區的點選特徵權重為w2=0.6。
步驟530:分別根據每一種類別在每一種點選區域下針對上述推薦query的類別權重g,以及每一種點選區域的點選特徵權重w,計算獲得每一種類別針對上述推薦query的信賴水準h。
本實施例中,計算任意一種類別針對上述推薦query的信賴水準h時,採用公式五進行計算:
其中,使用h(x,y)作為x對y的信賴水準;X表示推薦query;Y表示類別對應的特徵函數,如,click 1(offer,query)或,click 2(query),針對某一類別,若存在推薦query,則Y取值為1,若不存在推薦query,則Y取值為0,而由於本實施例中是針對存在的類別計算h(x,y)的,因此,Y就可以看作是作為計算物件的任意一種類別;Wi表示點選區域i的點選特徵權重;K表示點選區域的數目;gi表示類別Y在點選區域i內針對推薦query的類別權重;f i (x,y)表示點選區域i對應的點選特徵,參考公式一和公式二可以獲知,若類別y下確實存在推薦query,則f i (x,y)取值為1,而公式五是針對推薦query與Y之間的對應關係存在的情況而計算的,因此,f i (x,y)取值為1,顯然,可以將f i (x,y)的計算融入g i (x,y)的計算中;Z表示歸一化因數,Z=ω i g i (x,y)f i (x,y)
本實施例中,K=2,則i取值範圍是1和2。
例如,結合步驟520中的舉例,可以計算獲得,Z=(0.8×0.75+0.6×0.8)+(0.8×0.25+0.6×0.2)=1.4;那麼,h(“蘋果”,“水果”)/Z=(0.8×0.75+0.6×0.8)/1.4=77.14%;h(“蘋果”,“電子”)/Z=(0.8×0.25+0.6×0.2)/1.4=22.86%。
步驟540:分別根據每一種類別針對上述推薦query的信賴水準h,決定該推薦query的目標類別,並對所述推薦查詢關鍵字及相應的目標類別進行呈現。
本實施例中,步驟540的執行方式包含但不限於以下幾種:
1、將信賴水準超過設定閾值的類別決定為推薦query的目標類別,並按照目標類別的信賴水準從高到低的順序對推薦query進行呈現;例如,推薦query“蘋果”對應兩種目標類別,分別為信賴水準77.14%的“水果”,和信賴水準22.86%的“電子”類別,均超過設定門限值20%,因此,在呈現“蘋果”這一推薦詞,先呈現“水果”類別,再呈現“電子”類別;具體為:
初始query:蘋
推薦query:蘋果 水果類
推薦query:蘋果 電子類
2、將信賴水準超過設定閾值的類別決定為推薦query的目標類別,並按照目標類別的種類對推薦query進行分組呈現。
例如,基於初始query“蘋果”,其相應的推薦queryE“蘋果手機”、“蘋果MP3”和“蘋果耳機”,分別對應信賴水準56%的“手機”類別,和信賴水準44%的”數位影音”類別,均超過設定門限值20%,因此,在呈現上述各推薦query時,按照不同的目標類別進行分組呈現,具體為:
初始query:蘋果
 手機類 數位影音類
推薦query:蘋果手機 蘋果MP3
 蘋果耳機
......
實際應用中還會隨著業務的增加而出現多種靈活的呈現方法,上述兩種方式僅為舉例。
進一步地,當系統根據用戶選擇的推薦query作進一步搜索時,可以只在相應的目標類別下進行搜索,而不是在所有類別下進行搜索,從而有效減少了搜索資訊量,進一步提高了搜索效率。
基於上述實施例,參閱圖6所示,本實施例中,搜索裝置包括獲取單元60、第一決定單元61、第二決定單元62、獲取單元60,用於接收用戶輸入的推薦query,並基於該初始query獲得相應的推薦query;第一決定單元61,用於決定推薦query對應的至少兩種類別,以及用於查詢推薦query的至少兩種點選區域;第二決定單元62,用於分別決定獲得的每一種類別針對推薦query在每一種點選區域下的類別權重,以及每一種點選區域的點選特徵權重;計算單元63,用於分別根據獲得的每一種類別對應的類別權重,以及每一種點選區域對應的點選特徵權重,計算獲得每一種類別針對推薦query的信賴水準;呈現單元64,用於分別根據每一種類別針對推薦query的信賴水準,決定該推薦query的目標類別,並對所述推薦查詢關鍵字及相應的目標類別進行呈現。
綜上所述,本發明實施例中,使用用戶查詢日誌建立推薦詞典,並根據用戶點選日誌建立類別推薦方式,這樣,系統根據用戶輸入的初始query得到相應的推薦query時,可以根據用戶已有的點選行為決定各推薦query對應的目標類別,並在呈現各推薦query的同時也呈現相應的目標類別,這樣,通過目標類別向用戶提示各推薦query的引導意圖,令用戶可以根據各推薦query對應的目標類別,迅速決定自身的搜索意圖,避免無關的推薦query所造成的干擾,從而有效地提高了資訊搜索速度;同時,系統利用用戶選取的推薦query進行搜索時只在相應目標類別下進行搜索,而不是在所有的類別下搜索,從而大量減少了搜索資訊的數量,進一步提高資訊檢索速度,降低了伺服器的處理壓力。本發明可用於電腦、無線通訊設備等電子產品。
顯然,本領域的技術人員可以對本發明進行各種修改和變型而不脫離本發明的精神和範圍。這樣,倘若本發明的這些修改和變型屬於本發明申請專利範圍及其等同技術的範圍之內,則本發明也意圖包含這些修改和變型在內。
60...獲取單元
61...第一決定單元
62...第二決定單元
63...計算單元
64...呈現單元
圖1為現有技術下提供推薦詞示意圖;
圖2為本發明實施例中提供推薦詞裝置原理示意圖;
圖3為本發明實施例中第一種權重設置示意圖;
圖4為本發明實施例中第二種權重設置示意圖;
圖5為本發明實施例中提供推薦詞流程圖;
圖6為本發明實施例中搜索裝置功能結構示意圖。

Claims (10)

  1. 一種提供推薦詞的方法,其特徵在於,包括:接收用戶輸入的初始查詢關鍵字;在用戶輸入該初始查詢關鍵字之後以及點擊搜索查詢指令之前,基於該初始查詢關鍵字獲得相應的推薦查詢關鍵字;決定獲得的推薦查詢關鍵字對應的至少兩種類別,以及用於查詢推薦查詢關鍵字的至少兩種點選區域;分別決定獲得的每一種類別針對該推薦查詢關鍵字在每一種點選區域下的類別權重,以及每一種點選區域的點選特徵權重;分別根據獲得的每一種類別對應的類別權重,以及每一種點選區域對應的點選特徵權重,計算獲得每一種類別針對該推薦查詢關鍵字的信賴水準;分別根據每一種類別針對該推薦查詢關鍵字的信賴水準,決定該推薦查詢關鍵字的目標類別,並對該推薦查詢關鍵字及相應的目標類別進行呈現。
  2. 如申請專利範圍第1項之方法,其中,決定獲得的任意一種類別針對該推薦查詢關鍵字在任意一點選區域下的類別權重,包括:根據該推薦查詢關鍵字在該任意一點選區域內該任意一種類別下對應的點選總數目,以及該推薦查詢關鍵字在該任意一點選區域內的所有類別下對應的點選總數目的比值,決定該類別權重。
  3. 如申請專利範圍第1項之方法,其中,決定任意一點選區域的點選特徵權重時,包括:採用最大似然估計方式設置該點選特徵權重;或者,採用該任意一點選區域對應的信賴水準設置該點選特徵權重。
  4. 如申請專利範圍第1、2或3項之方法,其中,根據獲得的每一種類別對應的類別權重,以及每一種點選區域對應的點選特徵權重,計算獲得任意一種類別針對該推薦查詢關鍵字的信賴水準,包括:採用公式計算該信賴水準;其中,h(x,y)表示x對y的信賴水準;X表示推薦查詢關鍵字;Y表示該任意一種類別;Wi表示點選區域i的點選特徵權重;K表示點選區域的數目;gi表示類別Y在點選區域i內針對推薦查詢關鍵字的類別權重;f i (x,y)表示點選區域i對應的點選特徵,取值為1;Z表示歸一化因數,
  5. 如申請專利範圍第4項之方法,其中,分別根據每一種類別針對該推薦查詢關鍵字的信賴水準,決定該推薦 查詢關鍵字的目標類別,並對該推薦查詢關鍵字及相應的目標類別進行呈現,包括:將信賴水準超過設定閾值的類別決定為該推薦查詢關鍵字的目標類別,並按照目標類別的信賴水準從高到低的順序對該推薦查詢關鍵字進行呈現;或者,將信賴水準超過設定閾值的類別決定為該推薦查詢關鍵字的目標類別,並按照目標類別的種類對該推薦查詢關鍵字進行分組呈現。
  6. 一種提供推薦詞的裝置,其特徵在於,包括:獲取單元,用於接收用戶輸入的初始查詢關鍵字,在用戶輸入該初始查詢關鍵字之後以及點擊搜索查詢指令之前,基於該初始查詢關鍵字獲得相應的推薦查詢關鍵字;第一決定單元,用於決定該推薦查詢關鍵字對應的至少兩種類別,以及用於查詢推薦查詢關鍵字的至少兩種點選區域;第二決定單元,用於分別決定獲得的每一種類別針對該推薦查詢關鍵字在每一種點選區域下的類別權重,以及每一種點選區域的點選特徵權重;計算單元,用於分別根據獲得的每一種類別對應的類別權重,以及每一種點選區域對應的點選特徵權重,計算獲得每一種類別針對該推薦查詢關鍵字的信賴水準;呈現單元,用於分別根據每一種類別針對該推薦查詢關鍵字的信賴水準,決定該推薦查詢關鍵字的目標類別, 並對該推薦查詢關鍵字及相應的目標類別進行呈現。
  7. 如申請專利範圍第6項之裝置,其中,該第一決定單元決定獲得的任意一種類別針對該推薦查詢關鍵字在任意一點選區域下的類別權重時,根據該推薦查詢關鍵字在該任意一點選區域內該任意一種類別下對應的點選總數目,以及該推薦查詢關鍵字在該任意一點選區域內的所有類別下對應的點選總數目的比值,決定該類別權重。
  8. 如申請專利範圍第6項之裝置,其中,該第一決定單元決定任意一點選區域的點選特徵權重時,採用最大似然估計方式設置該點選特徵權重;或者,採用該任意一點選區域對應的信賴水準設置該點選特徵權重。
  9. 如申請專利範圍第6、7或8項之裝置,其中,該第二決定單元根據獲得的每一種類別對應的類別權重,以及每一種點選區域對應的點選特徵權重,計算獲得任意一種類別針對該推薦查詢關鍵字的信賴水準時,採用公式計算該信賴水準;其中,h(x,y)表示x對y的信賴水準;X表示推薦查詢關鍵字;Y表示該任意一種類別;Wi表示點選區域i的點選特徵權重;K表示點選區域的數目;gi表示類別Y在點選區域i內針對推薦查詢關鍵字的類別權重;f i (x,y)表示點選區域i對應的點選特徵,取值為1; Z表示歸一化因數,
  10. 如申請專利範圍第9項之裝置,其中,該呈現單元分別根據每一種類別針對該推薦查詢關鍵字的信賴水準,決定該推薦查詢關鍵字的目標類別,並對該推薦查詢關鍵字及相應的目標類別進行呈現時,將信賴水準超過設定閾值的類別決定為該推薦查詢關鍵字的目標類別,並按照目標類別的信賴水準從高到低的順序對該推薦查詢關鍵字進行呈現;或者,將信賴水準超過設定閾值的類別決定為該推薦查詢關鍵字的目標類別,並按照目標類別的種類對該推薦查詢關鍵字進行分組呈現。
TW100128685A 2011-05-26 2011-08-11 Method and apparatus for providing referral words TWI582619B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110138955.XA CN102799591B (zh) 2011-05-26 2011-05-26 一种提供推荐词的方法及装置

Publications (2)

Publication Number Publication Date
TW201248435A TW201248435A (en) 2012-12-01
TWI582619B true TWI582619B (zh) 2017-05-11

Family

ID=47198703

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100128685A TWI582619B (zh) 2011-05-26 2011-08-11 Method and apparatus for providing referral words

Country Status (7)

Country Link
US (1) US20120330962A1 (zh)
EP (1) EP2715574A4 (zh)
JP (1) JP5984917B2 (zh)
CN (1) CN102799591B (zh)
HK (1) HK1173244A1 (zh)
TW (1) TWI582619B (zh)
WO (1) WO2012162541A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902535B (zh) * 2012-12-24 2019-02-22 腾讯科技(深圳)有限公司 获取联想词的方法、装置及系统
CN103914492B (zh) * 2013-01-09 2018-02-27 阿里巴巴集团控股有限公司 查询词融合方法、商品信息发布方法和搜索方法及系统
CN103942198B (zh) * 2013-01-18 2017-07-28 佳能株式会社 用于挖掘意图的方法和设备
CN104281896A (zh) * 2013-07-01 2015-01-14 富士通株式会社 信息整合系统和信息整合方法
US10255363B2 (en) 2013-08-12 2019-04-09 Td Ameritrade Ip Company, Inc. Refining search query results
US9881010B1 (en) * 2014-05-12 2018-01-30 Google Inc. Suggestions based on document topics
US11061893B2 (en) * 2014-05-30 2021-07-13 Apple Inc. Multi-domain query completion
CN105183733A (zh) * 2014-06-05 2015-12-23 阿里巴巴集团控股有限公司 一种文本信息的匹配、业务对象的推送方法和装置
US9811559B2 (en) * 2014-09-01 2017-11-07 Mapquest, Inc. Computerized systems and methods for identifying points-of-interest using customized query prediction
US20160371340A1 (en) * 2015-06-19 2016-12-22 Lenovo (Singapore) Pte. Ltd. Modifying search results based on context characteristics
RU2632140C2 (ru) * 2015-09-29 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для кластеризации предложений для поисковых запросов
CN105426535A (zh) * 2015-12-18 2016-03-23 北京奇虎科技有限公司 基于搜索提示的搜索方法及装置
US10515402B2 (en) * 2016-01-30 2019-12-24 Walmart Apollo, Llc Systems and methods for search result display
CN108319585B (zh) * 2018-01-29 2021-03-02 北京三快在线科技有限公司 数据处理方法及装置、电子设备、计算机可读介质
CN110515929B (zh) * 2019-08-29 2023-03-31 掌阅科技股份有限公司 书籍展示方法、计算设备及存储介质
CN111552867B (zh) * 2020-03-31 2021-09-28 北京城市网邻信息技术有限公司 一种业务信息的推荐方法和装置
CN112256960B (zh) * 2020-10-10 2024-04-16 成都一课量子科技有限公司 一种商场、社区、写字楼用户推荐服务的算法方法
CN113326420B (zh) * 2021-06-15 2023-10-27 北京百度网讯科技有限公司 问题检索方法、装置、电子设备和介质
CN115618100B (zh) * 2022-09-15 2024-02-06 中航信移动科技有限公司 用于关联事件推荐的数据处理方法、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI227417B (en) * 2003-12-02 2005-02-01 Inst Information Industry Digital resource recommendation system, method and machine-readable medium using semantic comparison of query sentence
US20060122979A1 (en) * 2004-12-06 2006-06-08 Shyam Kapur Search processing with automatic categorization of queries
US20070100890A1 (en) * 2005-10-26 2007-05-03 Kim Tae-Il System and method of providing autocomplete recommended word which interoperate with plurality of languages
US20100114908A1 (en) * 2008-11-04 2010-05-06 Microsoft Corporation Relevant navigation with deep links into query
US7836391B2 (en) * 2003-06-10 2010-11-16 Google Inc. Document search engine including highlighting of confident results

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6772150B1 (en) * 1999-12-10 2004-08-03 Amazon.Com, Inc. Search query refinement using related search phrases
WO2004090754A1 (en) * 2003-04-04 2004-10-21 Yahoo! Inc. A system for generating search results including searching by subdomain hints and providing sponsored results by subdomain
US20050222987A1 (en) * 2004-04-02 2005-10-06 Vadon Eric R Automated detection of associations between search criteria and item categories based on collective analysis of user activity data
US7519581B2 (en) * 2004-04-30 2009-04-14 Yahoo! Inc. Method and apparatus for performing a search
US7747639B2 (en) * 2005-08-24 2010-06-29 Yahoo! Inc. Alternative search query prediction
US20080294624A1 (en) * 2007-05-25 2008-11-27 Ontogenix, Inc. Recommendation systems and methods using interest correlation
US20090171929A1 (en) 2007-12-26 2009-07-02 Microsoft Corporation Toward optimized query suggeston: user interfaces and algorithms
US20090241058A1 (en) * 2008-03-18 2009-09-24 Cuill, Inc. Apparatus and method for displaying search results with an associated anchor area
CN101887437B (zh) * 2009-05-12 2016-03-30 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN102033877A (zh) * 2009-09-27 2011-04-27 阿里巴巴集团控股有限公司 检索方法和装置
US9405841B2 (en) * 2009-10-15 2016-08-02 A9.Com, Inc. Dynamic search suggestion and category specific completion
US8954422B2 (en) * 2010-07-30 2015-02-10 Ebay Inc. Query suggestion for E-commerce sites
US20120072281A1 (en) * 2010-09-21 2012-03-22 Yahool Inc. Method and system to monetize domain queries in sponsored search
US8972895B2 (en) * 2010-12-20 2015-03-03 Target Brands Inc. Actively and passively customizable navigation bars
US8756121B2 (en) * 2011-01-21 2014-06-17 Target Brands, Inc. Retail website user interface
US8983995B2 (en) * 2011-04-15 2015-03-17 Microsoft Corporation Interactive semantic query suggestion for content search

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7836391B2 (en) * 2003-06-10 2010-11-16 Google Inc. Document search engine including highlighting of confident results
TWI227417B (en) * 2003-12-02 2005-02-01 Inst Information Industry Digital resource recommendation system, method and machine-readable medium using semantic comparison of query sentence
US20060122979A1 (en) * 2004-12-06 2006-06-08 Shyam Kapur Search processing with automatic categorization of queries
US20070100890A1 (en) * 2005-10-26 2007-05-03 Kim Tae-Il System and method of providing autocomplete recommended word which interoperate with plurality of languages
US20100114908A1 (en) * 2008-11-04 2010-05-06 Microsoft Corporation Relevant navigation with deep links into query

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
楊秉桓,應用查詢關鍵字於網頁推薦系統之研究,國立屏東科技大學資訊管理系碩士論文,2007/07/03 *

Also Published As

Publication number Publication date
TW201248435A (en) 2012-12-01
JP5984917B2 (ja) 2016-09-06
US20120330962A1 (en) 2012-12-27
CN102799591A (zh) 2012-11-28
CN102799591B (zh) 2015-03-04
WO2012162541A1 (en) 2012-11-29
EP2715574A1 (en) 2014-04-09
HK1173244A1 (zh) 2013-05-10
EP2715574A4 (en) 2015-04-01
JP2014515514A (ja) 2014-06-30

Similar Documents

Publication Publication Date Title
TWI582619B (zh) Method and apparatus for providing referral words
US11710054B2 (en) Information recommendation method, apparatus, and server based on user data in an online forum
US20240029464A1 (en) Method, apparatus, and computer program product for classification of documents
WO2020037930A1 (zh) 信息推荐方法、装置、计算机设备及存储介质
US8612435B2 (en) Activity based users' interests modeling for determining content relevance
CN103870505B (zh) 一种查询词推荐方法和查询词推荐系统
CN107463591B (zh) 响应于搜索查询对待与内容匹配的图像动态排序的方法和系统
WO2015188699A1 (zh) 推荐项目的方法和装置
US20140279751A1 (en) Aggregation and analysis of media content information
CN109933721B (zh) 一种融合用户隐式物品偏好与隐式信任的可解释推荐方法
US8849846B1 (en) Modifying search criteria using gestures
US20180285331A1 (en) Method, server, browser, and system for recommending text information
CN105531701A (zh) 个性化趋势图像搜索建议
CN109753601A (zh) 推荐信息点击率确定方法、装置及电子设备
WO2019222083A1 (en) Action indicators for search operation output elements
US20160299951A1 (en) Processing a search query and retrieving targeted records from a networked database system
TWI461942B (zh) An ad management apparatus, an advertisement selecting apparatus, an advertisement management method, an advertisement management program, and a recording medium on which an advertisement management program is recorded
US20120254158A1 (en) Aggregating product review information for electronic product catalogs
JP5813052B2 (ja) 情報処理装置、方法及びプログラム
JP4839295B2 (ja) クエリ抽出方法、クエリ抽出装置およびクエリ抽出プログラム
CN110347922B (zh) 基于相似度的推荐方法、装置、设备和存储介质
US11256703B1 (en) Systems and methods for determining long term relevance with query chains
CN107622125B (zh) 一种信息爬取方法和装置、电子设备
JP2015088089A (ja) レコメンドサーバ及びレコメンド方法
CN113392329A (zh) 内容推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees