TWI591495B - E-commerce search engine search method and e-commerce search engine - Google Patents

E-commerce search engine search method and e-commerce search engine Download PDF

Info

Publication number
TWI591495B
TWI591495B TW101121754A TW101121754A TWI591495B TW I591495 B TWI591495 B TW I591495B TW 101121754 A TW101121754 A TW 101121754A TW 101121754 A TW101121754 A TW 101121754A TW I591495 B TWI591495 B TW I591495B
Authority
TW
Taiwan
Prior art keywords
product information
user
seller
trust
result
Prior art date
Application number
TW101121754A
Other languages
English (en)
Other versions
TW201335780A (zh
Inventor
jia-sen Li
Original Assignee
Alibaba Group Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Services Ltd filed Critical Alibaba Group Services Ltd
Publication of TW201335780A publication Critical patent/TW201335780A/zh
Application granted granted Critical
Publication of TWI591495B publication Critical patent/TWI591495B/zh

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

電子商務搜尋引擎的搜尋方法和電子商務搜尋引擎
本申請係關於搜尋引擎技術領域,特別係關於一種電子商務搜尋引擎的搜尋方法和電子商務搜尋引擎。
隨著電腦技術的不斷發展,人們越來越依靠於透過電腦系統來儲存大量的資訊。當今所廣泛應用的搜尋引擎旨在協助用戶在大量資訊中進行檢索,以方便、快捷地獲得有用資訊。在資訊檢索領域,搜尋引擎獲得了很大的成功,開發並採用了大量有益的技術。其中,各種搜尋引擎的技術改進和最佳化,都直接反應到搜尋結果的最佳化上。
目前,一種通常的電子商務搜尋引擎的搜尋方法為,對用戶輸入的關鍵字進行匹配查詢,得到與該關鍵字匹配的商品資訊,並對作為搜尋結果的商品資訊進行排序,最後輸出排序後的搜尋結果。
為提高搜尋的準確性,通常電子商務搜尋引擎會採用一些搜尋排序策略,以方便用戶快速找到需要的商品資訊。例如,結合索引的權重以及商品資訊和賣家的綜合得分,對商品資訊進行排序,這裡索引為一般意義上的搜尋引擎的索引,一般是以詞,詞語,人名,概念,字母,單詞,數位等值進行排序的一種結構。又如,現有另一種搜尋排序策略結合索引的權重以及商品資訊單一維度的價格或銷量,對商品資訊進行排序。
現有電子商務搜尋引擎所採用的具體的搜尋排序策略主要包括:根據商品資訊的標題關鍵字、價格、交易量、賣家得分等各項指標的綜合排序,但由於其從總體層面對商品資訊進行排序,而未考慮用戶的個體差異,故在用戶A和用戶B輸入同樣的關鍵字時,會得到同樣的搜尋結果。然而,作為消費者,不同用戶的消費觀念是不同的,這勢必決定不同用戶很有可能具有不同的消費行為,從而決定不同用戶期待看到不同的搜尋結果,因此現有的搜尋結果有待最佳化,以滿足用戶的個體差異,提高搜尋的準確性。
總之,需要本領域技術人員迫切解決的一個技術問題就是:如何能夠最佳化搜尋結果,以滿足用戶的個體差異,並提高搜尋的準確性。
本申請所要解決的技術問題是提供一種電子商務搜尋引擎的搜尋方法和電子商務搜尋引擎,能夠最佳化搜尋結果,以滿足用戶的個體差異,並提高搜尋的準確性。
為了解決上述問題,本申請公開了一種電子商務搜尋引擎的搜尋方法,包括:接收用戶輸入的關鍵字,對該關鍵字進行匹配查詢,得到與該關鍵字匹配的商品資訊,並對作為搜尋結果的商品資訊進行初步排序,得到相應的中間排序結果; 依據該用戶針對商品資訊所屬賣家的評價記錄,獲取該用戶與商品資訊所屬賣家之間的信任度;依據該用戶與商品資訊所屬賣家之間的信任度,對該中間排序結果中商品資訊進行二次排序,得到相應的最終排序結果,其中,該最終排序結果中該用戶與商品資訊所屬賣家之間的信任度高的商品資訊排在該用戶與商品資訊所屬賣家之間的信任度低的商品資訊的前面;輸出該最終排序結果中排序靠前的至少一個商品資訊。
較佳的,該依據該用戶與商品資訊所屬賣家之間的信任度,對該中間排序結果中商品資訊進行二次排序的步驟,包括:將該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度與預設的信任度閾值進行比較,如果大於信任度閾值,則將相應的賣家儲存至白名單,如果小於等於信任度閾值,則將相應的賣家儲存至黑名單;按照該用戶與商品資訊所屬賣家之間的信任度從高到低,依次將該中間排序結果中白名單中賣家的商品資訊排在該最終排序結果的開頭,以及,按照該用戶與商品資訊所屬賣家之間的信任度的從低到高,依次將該中間排序結果中黑名單中賣家的商品資訊排在該最終排序結果的末尾。
較佳的,該依據該用戶與商品資訊所屬賣家之間的信任度,對該中間排序結果中商品資訊進行二次排序的步驟 ,包括:針對該中間排序結果中商品資訊,如果該用戶與其所屬賣家之間的信任度獲取失敗,則將該用戶與其所屬賣家之間的信任度賦值為預設的信任度閾值;按照該用戶與商品資訊所屬賣家之間的信任度從高到低,依次將該中間排序結果中商品資訊排在該最終排序結果中。
較佳的,該依據該用戶針對商品資訊所屬賣家的評價記錄,獲取該用戶與商品資訊所屬賣家之間的信任度的步驟,包括:對該用戶針對商品資訊所屬賣家的多條評價記錄進行平均處理,得到該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度;該平均處理包括算數平均、加權平均或加權移動平均。
較佳的,透過如下步驟獲取該用戶針對商品資訊所屬賣家的評價記錄:識別該用戶的身份,並根據識別結果在用戶評價資料庫中查找得到該用戶針對賣家的評價記錄,其中,該用戶評價資料庫中儲存有用戶身份、商品資訊、商品資訊所屬賣家身份和相應的用戶評價記錄。
較佳的,該預設的信任度閾值為對全網用戶針對商品資訊所屬賣家的評價記錄處理得到。
較佳的,透過如下步驟識別該用戶的身份:當該用戶註冊登錄時,以該用戶的ID作為該用戶的 身份;當該用戶以未登錄狀態瀏覽時,根據該用戶的cookie識別該用戶的身份。
較佳的,該評價記錄的記錄形式包括評分形式、評分的量化形式,或者文檔形式。
另一方面,本申請還公開了一種電子商務搜尋引擎,包括:介面模組,用於接收用戶輸入的關鍵字;匹配查詢模組,用於對該關鍵字進行匹配查詢,得到與該關鍵字匹配的商品資訊;中間排序模組,用於對作為搜尋結果的商品資訊進行初步排序,得到相應的中間排序結果;信任度獲取模組,用於依據該用戶針對商品資訊所屬賣家的評價記錄,獲取該用戶與商品資訊所屬賣家之間的信任度;二次排序模組,用於依據該用戶與商品資訊所屬賣家之間的信任度,對該中間排序結果中商品資訊進行二次排序,得到相應的最終排序結果,其中,該最終排序結果中該用戶與商品資訊所屬賣家之間的信任度高的商品資訊排在該用戶與商品資訊所屬賣家之間的信任度低的商品資訊的前面;及輸出模組,用於輸出該最終排序結果中排序靠前的至少一個商品資訊。
較佳的,該二次排序模組,包括: 比較子模組,用於將該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度與預設的信任度閾值進行比較,如果大於信任度閾值,則將相應的賣家儲存至白名單,如果小於等於信任度閾值,則將相應的賣家儲存至黑名單;及第一排序子模組,用於按照該用戶與商品資訊所屬賣家之間的信任度從高到低,依次將該中間排序結果中白名單中賣家的商品資訊排在該最終排序結果的開頭,以及,按照該用戶與商品資訊所屬賣家之間的信任度的從低到高,依次將該中間排序結果中黑名單中賣家的商品資訊排在該最終排序結果的末尾。
與現有技術相比,本申請具有以下優點:
本申請根據用戶輸入的關鍵字對商品資訊進行搜尋,首先按照已有搜尋排序策略對作為搜尋結果的商品資訊進行初步排序,得到相應的中間排序結果,然後,依據該用戶與商品資訊所屬賣家之間的信任度,對中間排序結果中的商品資訊順序進行調整,最終輸出調整後的中間排序結果。消費觀念中用戶與賣家之間的信任度也是一個重要的因素,因為用戶更傾向去購買自己所信任的賣家的商品資訊,而由於本申請輸出的搜尋結果中,將更容易讓用戶信任賣家的商品資訊排在前面,故能夠最佳化搜尋結果,以滿足用戶的個體差異,並提高搜尋的準確性;另一方面,用戶瀏覽排在前面的商品資訊就能完成消費行為,故本申請還能夠減少用戶針對搜尋結果的瀏覽量和瀏覽時間,達 到快速成交轉換的目的。
為使本申請的上述目的、特徵和優點能夠更加明顯易懂,下面結合附圖和具體實施方式對本申請作進一步詳細的說明。
作為消費者,用戶A和用戶B其實是不同的,二者具有不同的消費觀念,在不考慮他們的個體差異的情況下,可能會造成用戶A不喜歡的商品資訊排在搜尋結果的前面,例如將經常被賣家投訴的賣家的商品資訊排在搜尋結果的前面,影響用戶體驗,浪費用戶的時間。
欲最佳化搜尋結果,就應在搜尋排序時考慮用戶的個體差異,這就不能類似現有電子商務搜尋引擎僅僅考慮宏觀的資料,還應考慮反映用戶的個體差異的資料,例如,用戶自身的一些特徵,如購買能力、價格敏感度、地域特徵、歷史購買記錄、商品資訊的評價記錄、對商品資訊的偏好程度等。
上述購買能力、價格敏感度、地域特徵等特徵並無客觀的評價指標,因此不能更客觀地反映用戶的個體差異。而用戶交易的歷史資料中會記錄歷史購買記錄、商品資訊的評價、對商品資訊的偏好程度等特徵,故這些特徵的客觀性是無異議的;但是,考慮到搜尋排序的可執行性,上述用戶自身的一些特徵作為搜尋排序指標也應是可執行的,然而歷史購買記錄和對商品資訊的偏好程度特徵很難被 量化為具體的數值,故本申請較佳方案中未考慮歷史購買記錄和對商品資訊的偏好程度特徵,僅保留商品資訊的評價記錄特徵來排序以進行搜尋結果的最佳化。
在實際中,歷史資料中記錄的商品資訊的評價特徵通常針對某個特定的商品資訊ID,而在電子商務網站中,即使對於同一商品資訊,一旦賣家進行編輯,相應的商品資訊ID就會隨之發生變化;而搜尋排序針對的是最新的商品資訊ID,這樣,如果直接將商品資訊的評價記錄特徵作為排序特徵,則搜尋結果中商品資訊對應的商品資訊ID與歷史資料中記錄的商品資訊的評價記錄特徵對應的商品資訊ID往往是不同的,這導致商品資訊的評價記錄特徵失去了應有的意義。
本申請發明人在研究中發現,歷史資料中記錄的商品資訊的評價記錄特徵還會針對某個特定的商品資訊ID所屬的賣家ID,而對於電子商務網站而言,一經註冊賣家ID是不會變化的;雖然搜尋排序針對的是商品資訊ID,但商品資訊ID與賣家ID之間存在隸屬關係,這樣,將商品資訊的評價特徵視作用戶對商品資訊所屬賣家的評價特徵,並應用於搜尋排序,則能夠發揮商品資訊的評價記錄特徵應有的意義。具體而言,本申請將用戶與商品資訊所屬賣家之間的信任度作為排序指標。
另外,如果電子商務搜尋引擎僅採用一次排序,亦即直接將用戶與商品資訊所屬賣家之間的信任度作為已有搜尋排序策略的參數,計算成本會很高,對於海量千萬級別 用戶和數億的商品資訊,其計算複雜度過高。以每天差不多是百萬數量的評論記錄為例,將其換算到百萬賣家和千萬級的用戶身上的,還是要換算到幾十萬賣家和千萬級的用戶身上。假設對於每個用戶,只計算那些評論過的商品資訊,假設每個消費者半年內,對商品資訊有10個評論,那也是有數億條記錄,計算到幾億的商品資訊基礎表資訊上,而不是對部分商品資訊進行計算,這導致每天將產生上百G的儲存,這樣的一次排序就會消耗大量的計算資源。
本申請發明人注意到,已有搜尋排序策略本身就有一個淘汰的機制,會淘汰掉一定範圍之外(如數千名之外)的商品資訊,然後將排在此範圍內的商品資訊作為排序結果。一個是對一定範圍內的商品資訊的二次排序,一個是對可能達到數億的商品資訊的排序,成本的節省顯而易見。
綜上,本申請根據用戶輸入的關鍵字對商品資訊進行搜尋,首先按照已有搜尋排序策略對作為搜尋結果的商品資訊進行初步排序,得到相應的中間排序結果,然後,依據該用戶與商品資訊所屬賣家之間的信任度,對中間排序結果中的商品資訊順序進行調整,最終輸出調整後的中間排序結果。消費觀念中用戶與賣家之間的信任度也是一個重要的因素,因為用戶更傾向去購買自己所信任的賣家的商品資訊,而由於本申請輸出的搜尋結果中,將更容易讓用戶信任賣家的商品資訊排在前面,故能夠最佳化搜尋結 果,以滿足用戶的個體差異;另一方面,還能夠減少用戶針對搜尋結果的瀏覽量和瀏覽時間,達到快速成交轉換的目的。
參照圖1,其示出了本申請一種電子商務搜尋引擎的搜尋方法實施例1的流程圖,具體可以包括:步驟101、接收用戶輸入的關鍵字;步驟102、對該關鍵字進行匹配查詢,得到與該關鍵字匹配的商品資訊,並對作為搜尋結果的商品資訊進行初步排序,得到相應的中間排序結果;這裡的初步排序採用按照已有搜尋排序策略,已有搜尋排序策略主要根據商品資訊的標題關鍵字、價格、交易量、賣家得分等各項指標進行綜合排序。例如,其可以結合索引的權重以及商品資訊和賣家的綜合得分,對商品資訊進行排序;又如,其可以結合索引的權重以及商品資訊單一維度的價格或銷量,對商品資訊進行排序,等等。
在此,提供一種結合索引的權重以及商品資訊和賣家的綜合得分,對商品資訊進行排序的示例。
該示例關於,用戶輸入的關鍵字為“三葉草經典板鞋”,假設匹配查詢查找到與該關鍵字相應的3個索引:“三葉草”、“經典”和“板鞋”;一般情況下,每個索引的權重是一樣的,但也可以設置為不同,例如,品牌詞的權重為0.2,名詞的權重是0.1,形容詞的權重是0.05等;進一步假設搜尋結果中有2個商品資訊,其中,商品 資訊A的標題為“Adidas三葉草中性板鞋”,商品資訊A本身的優質分為0.8分,商品資訊A所屬賣家的優質分是0.6分,商品資訊B的標題為“top阿迪達斯ADIDAS 2011新款三葉草經典款式”,商品資訊B本身的優質分為0.9分,商品資訊B所屬賣家的優質分是0.5分;對於商品資訊A,由於其標題覆蓋了“三葉草”和“板鞋”2個索引,則其文本相關性是0.2+0.1=0.3,對於商品資訊B,由於其覆蓋了“三葉草”和“經典”2個索引,則其文本相關性是0.2+0.05=0.25;最後,結合商品資訊的優質分和賣家的優質分,商品資訊A的總得分是0.3+0.8+0.6=1.7分,商品資訊B的總得分是0.25+0.9+0.5=1.65分,該總得分為商品資訊的最後的排序分,也即中間排序結果中商品資訊A排在商品資訊B之前。
步驟103、依據該用戶針對商品資訊所屬賣家的評價記錄,獲取該用戶與商品資訊所屬賣家之間的信任度;在本申請的一種較佳實施例中,該依據該用戶針對商品資訊所屬賣家的評價記錄,獲取該用戶與商品資訊所屬賣家之間的信任度的步驟,可以進一步包括:對該用戶針對商品資訊所屬賣家的多條評價記錄進行平均處理,得到該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度;該平均處理具體可以包括算數平均、加權平均或加權移動平均等。
在本申請的一種較佳實施例中,可以透過如下步驟獲取該用戶針對商品資訊所屬賣家的評價記錄:識別該用戶的身份,並根據識別結果在用戶評價資料庫中查找得到該用戶針對賣家的評價記錄,其中,該用戶評價資料庫中儲存有用戶身份、商品資訊、商品資訊所屬賣家身份和相應的用戶評價記錄。
更為較佳的是,可以透過如下步驟識別該用戶的身份:當該用戶註冊登錄時,以該用戶的ID作為該用戶的身份;當該用戶以未登錄狀態瀏覽時,根據該用戶的cookie(用於儲存用戶私有資訊的小文字檔案)識別該用戶的身份。
在實際應用中,對於一個需要用戶ID註冊登錄的網站來說,用戶唯一識別字的選擇可以遵從以下順序:當用戶註冊登錄時以用戶ID為準,當用戶在未登錄狀態瀏覽時以用戶的cookie為準。
其中,基於cookie的用戶識別是現有一種典型的用戶識別方法。當透過自定義Apache日誌格式或者JavaScript的方法獲得用戶cookie時,其實已經找到了一個非常有效的用戶識別的手段。cookie在未被清除的前提下可以認為是跟某個訪問用戶端電腦綁定的,所以基於cookie的用戶識別的準確度比較高。例如,如在淘寶註冊過的用戶,便會有cookies資訊儲存在用戶的電腦的c磁碟裡面,當該 用戶再次訪問淘寶時,淘寶的系統會去指定的路徑去取cookies資訊,如果取到了,則即使該用戶不登錄,也能取到登錄名,如果取不到,則會新建一個cookies資訊到用戶的電腦裡面。目前大多數用戶都不清除自己的cookies資訊。所以,可以利用該技術,得到用戶的身份標識。
在實際中,電子商務網站會透過成交日誌記錄用戶身份、用戶完成的交易資訊及相應的用戶評價等資訊,而用戶完成的交易資訊中會包括商品資訊和商品資訊所屬賣家身份等資訊;故本申請可以依據電子商務網站的成交日誌建立該用戶評價資料庫。
目前在電子商務領域內,商品資訊的評價的主要方式包括動態評分體系,如:好、中、差等三種評分方式(量化形式),還有評論內容共三種途徑。故在本申請的一種較佳實施例中,該評價記錄的記錄形式具體可以包括評分形式、評分的量化形式,或者文檔形式。由於評分形式的評價記錄為數值,可以直接參與運算,對於評分的量化形式或者文檔形式,可以透過評價的量化分值或者評價記錄的語氣詞,轉化得到相應的數值以參與運算,本申請對具體的轉化方法不加以限制。
通常,一個用戶針對商品資訊所屬賣家的多條評價記錄為多條,故可透過平均處理得到該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度;該平均處理具體可以包括算數平均、加權平均或加權移動平均等。
例如,用戶A在商家A處購買商品資訊,買過10次東西,10條評價記錄中,6次都是5分(非常滿意),2個4分(較滿意),2個3分(滿意);若採用算數平均,該用戶對該賣家的信任度為(65+24+23)/10=4.4;若採用加權平均,可以分別給每次的評價記錄賦予一定的權重,然後進行平均;若採用移動加權評價,則需要考慮評價記錄的生成時間,每次的評價記錄的權重隨時間而線性或指數式遞減,其中,最近的加權大於次近的加權。
步驟104、依據該用戶與商品資訊所屬賣家之間的信任度,對該中間排序結果中商品資訊進行二次排序,得到相應的最終排序結果,其中,該最終排序結果中該用戶與商品資訊所屬賣家之間的信任度高的商品資訊排在該用戶與商品資訊所屬賣家之間的信任度低的商品資訊的前面; 這裡的二次排序主要依據該用戶與商品資訊所屬賣家之間的信任度,對中間排序結果中的商品資訊順序進行調整,最終輸出調整後的中間排序結果;這樣,本申請輸出的最終排序結果中,將更容易讓用戶信任賣家的商品資訊排在前面,故最佳化搜尋結果,以滿足用戶的個體差異。例如,中間排序結果中商品資訊A排在商品資訊B之前,但該用戶之前投訴過商品資訊A所屬的賣家A或者該用戶之前給過商品資訊A所屬的賣家A差評,導致該用戶與商品資訊A所屬賣家A之間的信任度低於該用戶與商 品資訊B所屬賣家B之間的信任度,故二次排序將商品資訊B排在商品資訊A之前。
步驟105、輸出該最終排序結果中排序靠前的至少一個商品資訊。
本申請可以提供如下二次排序的技術方案:
方案一、
該依據該用戶與商品資訊所屬賣家之間的信任度,對該中間排序結果中商品資訊進行二次排序的步驟,具體可以包括:子步驟A1、將該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度與預設的信任度閾值進行比較,如果大於信任度閾值,則將相應的賣家儲存至白名單,如果小於等於信任度閾值,則將相應的賣家儲存至黑名單;子步驟A2、按照該用戶與商品資訊所屬賣家之間的信任度從高到低,依次將該中間排序結果中白名單中賣家的商品資訊排在該最終排序結果的開頭,以及,按照該用戶與商品資訊所屬賣家之間的信任度的從低到高,依次將該中間排序結果中黑名單中賣家的商品資訊排在該最終排序結果的末尾。
方案一透過比較該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度與預設的信任度閾值,來判斷該用戶是否信任該中間排序結果中商品資訊所屬賣家,若高於閾值則信任,否則不予信任,並用白名單來儲存信任賣家,用黑名單儲存不信任的賣家。
在實際中,已有搜尋排序策略本身就有一個淘汰的機制,會淘汰掉4000名之外的商品資訊,然後對排在前4000名的商品資訊進行初步排序和二次排序。另外,只有該用戶評價過的賣家才能獲得該用戶與其所屬賣家之間的信任度的,通常用戶只對4000個商品資訊所屬賣家的小部分進行過評價,因此,二次排序時,白名單、黑名單儲存的賣家數量之和與4000不是一個數量級。方案一的子步驟A2僅調整白名單、黑名單儲存的賣家的商品資訊,而其他商品資訊在搜尋結果中的順序不變,能夠大大節省二次排序的計算量。
在具體實現中,可以根據消費者消費心理或者用戶-信任度的分佈情況,設置信任度閾值。
對於用戶-信任度的分佈情況的應用,在本申請的一種較佳實施例中,該預設的信任度閾值可透過對全網用戶針對商品資訊所屬賣家的評價記錄處理得到。
假設電子商務網站具有200萬賣家和3千萬用戶身上,該處理可以對3千萬用戶的評價記錄取平均值,或者,根據黃金分割理論,對3千萬用戶的評價記錄從低到高排序,取出第61.8%那個排序名次對應的數值即為預設的信任度閾值。當然,本領域技術人員還可以根據實際需求,採用其他方法設置信任度閾值,本申請對此不加以限制。
在本申請的另一種較佳實施例中,還可以將該預設的信任度閾值作為預設值顯示,由用戶進行調整。
方案二、
該依據該用戶與商品資訊所屬賣家之間的信任度,對該中間排序結果中商品資訊進行二次排序的步驟,具體可以包括:子步驟B1、如果該用戶與其所屬賣家之間的信任度獲取失敗,則將該用戶與其所屬賣家之間的信任度賦值為預設的信任度閾值;子步驟B2、按照該用戶與商品資訊所屬賣家之間的信任度從高到低,依次將該中間排序結果中商品資訊排在該最終排序結果中。上述獲取失敗的原因是該用戶未對商品資訊所屬賣家進行過評價。
相對於方案一的白名單和黑名單,方案二對該用戶未評價過的賣家進行賦值,由於該中間排序結果中商品資訊都具有對應的該用戶與商品資訊所屬賣家之間的信任度,故可以統一進行二次排序。方案二省去了白名單和黑名單儲存的麻煩,但與方案一相比,耗費更多的計算量。
參照圖2,其示出了本申請一種電子商務搜尋引擎的搜尋方法實施例2的流程圖,具體可以包括:步驟201、接收用戶輸入的關鍵字;步驟202、對該關鍵字進行匹配查詢,得到與該關鍵字匹配的商品資訊,並對作為搜尋結果的商品資訊進行初步排序,得到相應的中間排序結果;步驟203、識別該用戶的身份,並根據識別結果在用戶評價資料庫中查找得到該用戶針對賣家的評價記錄,其中,該用戶評價資料庫中儲存有用戶身份、商品資訊、商 品資訊所屬賣家身份和相應的用戶評價記錄;步驟204、依據該用戶針對商品資訊所屬賣家的評價記錄,獲取該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度,該獲取過程具體可以包括:對該用戶針對商品資訊所屬賣家的多條評價記錄進行平均處理,得到該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度;在實際中,該平均處理具體可以包括算數平均、加權平均或加權移動平均等。
步驟205、將該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度與預設的信任度閾值進行比較,如果大於信任度閾值,則將相應的賣家儲存至白名單,如果小於等於信任度閾值,則將相應的賣家儲存至黑名單;步驟206、按照該用戶與商品資訊所屬賣家之間的信任度從高到低,依次將該中間排序結果中白名單中賣家的商品資訊排在該最終排序結果的開頭,以及,按照該用戶與商品資訊所屬賣家之間的信任度從低到高,依次將該中間排序結果中黑名單中賣家的商品資訊排在該最終排序結果的末尾;步驟207、輸出該最終排序結果中排序靠前的至少一個商品資訊。
與前述搜尋方法實施例相應,本申請還公開了一種電子商務搜尋引擎,參照圖3,具體可以包括:介面模組301,用於接收用戶輸入的關鍵字; 匹配查詢模組302,用於對該關鍵字進行匹配查詢,得到與該關鍵字匹配的商品資訊;中間排序模組303,用於對作為搜尋結果的商品資訊進行初步排序,得到相應的中間排序結果;信任度獲取模組304,用於依據該用戶針對商品資訊所屬賣家的評價記錄,獲取該用戶與商品資訊所屬賣家之間的信任度;二次排序模組305,用於依據該用戶與商品資訊所屬賣家之間的信任度,對該中間排序結果中商品資訊進行二次排序,得到相應的最終排序結果,其中,該最終排序結果中該用戶與商品資訊所屬賣家之間的信任度高的商品資訊排在該用戶與商品資訊所屬賣家之間的信任度低的商品資訊的前面;及輸出模組306,用於輸出該最終排序結果中排序靠前的至少一個商品資訊。
在本申請的一種較佳實施例中,該二次排序模組305,可以進一步包括:比較子模組,用於將該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度與預設的信任度閾值進行比較,如果大於信任度閾值,則將相應的賣家儲存至白名單,如果小於等於信任度閾值,則將相應的賣家儲存至黑名單;及第一排序子模組,用於按照該用戶與商品資訊所屬賣家之間的信任度從高到低,依次將該中間排序結果中白名 單中賣家的商品資訊排在該最終排序結果的開頭,以及,按照該用戶與商品資訊所屬賣家之間的信任度的從低到高,依次將該中間排序結果中黑名單中賣家的商品資訊排在該最終排序結果的末尾。
在本申請的另一種較佳實施例中,該二次排序模組305,可以進一步包括:信任度賦值子模組,用於在該用戶與其所屬賣家之間的信任度獲取失敗時,將該用戶與其所屬賣家之間的信任度賦值為預設的信任度閾值;及第二排序子模組,用於按照該用戶與商品資訊所屬賣家之間的信任度從高到低,依次將該中間排序結果中商品資訊排在該最終排序結果中。
在本申請的另一種較佳實施例中,該信任度獲取模組,可具體用於對該用戶針對商品資訊所屬賣家的多條評價記錄進行平均處理,得到該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度;該平均處理包括算數平均、加權平均或加權移動平均。
在本申請的一種較佳實施例中,該電子商務搜尋引擎還可以包括:評價記錄獲取模組,用於獲取該用戶針對商品資訊所屬賣家的評價記錄,具體可以包括:識別子模組,用於識別該用戶的身份;及記錄查找子模組,用於根據識別結果在用戶評價資料庫中查找得到該用戶針對賣家的評價記錄,其中,該用戶 評價資料庫中儲存有用戶身份、商品資訊、商品資訊所屬賣家身份和相應的用戶評價記錄。
在本申請實施例中,較佳的是,該預設的信任度閾值為對全網用戶針對商品資訊所屬賣家的評價記錄處理得到。
在本申請的一種較佳實施例中,該識別子模組,可以進一步包括:第一識別單元,用於當該用戶註冊登錄時,以該用戶的ID作為該用戶的身份;及第二識別單元,用於當該用戶以未登錄狀態瀏覽時,根據該用戶的cookie識別該用戶的身份。
在本申請實施例中,較佳的是,該評價記錄的記錄形式包括評分形式、評分的量化形式,或者文檔形式。
對於電子商務搜尋引擎實施例而言,由於其與搜尋方法實施例基本相似,所以描述的比較簡單,相關之處參見搜尋方法實施例的部分說明即可。
本說明書中的各個實施例均採用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。
本領域內的技術人員應明白,本申請的實施例可提供為方法、系統、或電腦程式產品。因此,本申請可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本申請可採用在一個或多個其中包含有電腦可用程式碼的電腦可用儲存媒體(包括但不限 於磁碟記憶體、CD-ROM、光學記憶體等)上實施的電腦程式產品的形式。
本申請是參照根據本申請實施例的方法、設備(系統)、和電腦程式產品的流程圖和/或方框圖來描述的。應理解可由電腦程式指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些電腦程式指令到通用電腦、專用電腦、嵌入式處理機或其他可編程資料處理設備的處理器以產生一個機器,使得透過電腦或其他可編程資料處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些電腦程式指令也可儲存在能引導電腦或其他可編程資料處理設備以特定方式工作的電腦可讀記憶體中,使得儲存在該電腦可讀記憶體中的指令產生包括指令裝置的製造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些電腦程式指令也可裝載到電腦或其他可編程資料處理設備上,使得在電腦或其他可編程設備上執行一系列操作步驟以產生電腦實現的處理,從而在電腦或其他可編程設備上執行的指令提供用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
以上對本申請所提供的一種電子商務搜尋引擎的搜尋 方法和電子商務搜尋引擎,進行了詳細介紹,本文中應用了具體個例對本申請的原理及實施方式進行了闡述,以上實施例的說明只是用於幫助理解本申請的方法及其核心思想;同時,對於本領域的一般技術人員,依據本申請的思想,在具體實施方式及應用範圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本申請的限制。
301‧‧‧介面模組
302‧‧‧匹配查詢模組
303‧‧‧中間排序模組
304‧‧‧信任度獲取模組
305‧‧‧二次排序模組
306‧‧‧輸出模組
圖1是本申請一種電子商務搜尋引擎的搜尋方法實施例1的流程圖;圖2是本申請一種電子商務搜尋引擎的搜尋方法實施例2的流程圖;圖3是本申請一種電子商務搜尋引擎實施例的結構圖。

Claims (10)

  1. 一種電子商務搜尋引擎的搜尋方法,其特徵在於,包括:接收用戶輸入的關鍵字;對該關鍵字進行匹配查詢,得到與該關鍵字匹配的商品資訊,並對作為搜尋結果的商品資訊進行初步排序,得到相應的中間排序結果;依據該用戶針對商品資訊所屬賣家的評價記錄,獲取該用戶與商品資訊所屬賣家之間的信任度;依據該用戶與商品資訊所屬賣家之間的信任度,對該中間排序結果中商品資訊進行二次排序,得到相應的最終排序結果,其中,該最終排序結果中該用戶與商品資訊所屬賣家之間的信任度高的商品資訊排在該用戶與商品資訊所屬賣家之間的信任度低的商品資訊的前面;輸出該最終排序結果中排序靠前的至少一個商品資訊。
  2. 如申請專利範圍第1項所述的方法,其中,該依據該用戶與商品資訊所屬賣家之間的信任度,對該中間排序結果中商品資訊進行二次排序的步驟,包括:將該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度與預設的信任度閾值進行比較,如果大於信任度閾值,則將相應的賣家儲存至白名單,如果小於等於信任度閾值,則將相應的賣家儲存至黑名單;按照該用戶與商品資訊所屬賣家之間的信任度從高到 低,依次將該中間排序結果中白名單中賣家的商品資訊排在該最終排序結果的開頭,以及,按照該用戶與商品資訊所屬賣家之間的信任度的從低到高,依次將該中間排序結果中黑名單中賣家的商品資訊排在該最終排序結果的末尾。
  3. 如申請專利範圍第1項所述的方法,其中,該依據該用戶與商品資訊所屬賣家之間的信任度,對該中間排序結果中商品資訊進行二次排序的步驟,包括:針對該中間排序結果中商品資訊,如果該用戶與其所屬賣家之間的信任度獲取失敗,則將該用戶與其所屬賣家之間的信任度賦值為預設的信任度閾值;按照該用戶與商品資訊所屬賣家之間的信任度從高到低,依次將該中間排序結果中商品資訊排在該最終排序結果中。
  4. 如申請專利範圍第1至3項中任一項所述的方法,其中,該依據該用戶針對商品資訊所屬賣家的評價記錄,獲取該用戶與商品資訊所屬賣家之間的信任度的步驟,包括:對該用戶針對商品資訊所屬賣家的多條評價記錄進行平均處理,得到該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度;該平均處理包括算數平均、加權平均或加權移動平均。
  5. 如申請專利範圍第1至3項中任一項所述的方法,其中,透過如下步驟獲取該用戶針對商品資訊所屬賣家的 評價記錄:識別該用戶的身份,並根據識別結果在用戶評價資料庫中查找得到該用戶針對賣家的評價記錄,其中,該用戶評價資料庫中儲存有用戶身份、商品資訊、商品資訊所屬賣家身份和相應的用戶評價記錄。
  6. 如申請專利範圍第2或3項所述的方法,其中,該預設的信任度閾值為對全網用戶針對商品資訊所屬賣家的評價記錄處理得到。
  7. 如申請專利範圍第5項所述的方法,其中,透過如下步驟識別該用戶的身份:當該用戶註冊登錄時,以該用戶的ID作為該用戶的身份;當該用戶以未登錄狀態瀏覽時,根據該用戶的cookie識別該用戶的身份。
  8. 如申請專利範圍第1至3項中任一項所述的方法,該評價記錄的記錄形式包括評分形式、評分的量化形式,或者文檔形式。
  9. 一種電子商務搜尋引擎,其特徵在於,包括:介面模組,用於接收用戶輸入的關鍵字;匹配查詢模組,用於對該關鍵字進行匹配查詢,得到與該關鍵字匹配的商品資訊;中間排序模組,用於對作為搜尋結果的商品資訊進行初步排序,得到相應的中間排序結果;信任度獲取模組,用於依據該用戶針對商品資訊所屬 賣家的評價記錄,獲取該用戶與商品資訊所屬賣家之間的信任度;二次排序模組,用於依據該用戶與商品資訊所屬賣家之間的信任度,對該中間排序結果中商品資訊進行二次排序,得到相應的最終排序結果,其中,該最終排序結果中該用戶與商品資訊所屬賣家之間的信任度高的商品資訊排在該用戶與商品資訊所屬賣家之間的信任度低的商品資訊的前面;及輸出模組,用於輸出該最終排序結果中排序靠前的至少一個商品資訊。
  10. 如申請專利範圍第9項所述的電子商務搜尋引擎,其中,該二次排序模組,包括:比較子模組,用於將該用戶與該中間排序結果中商品資訊所屬賣家之間的信任度與預設的信任度閾值進行比較,如果大於信任度閾值,則將相應的賣家儲存至白名單,如果小於等於信任度閾值,則將相應的賣家儲存至黑名單;及第一排序子模組,用於按照該用戶與商品資訊所屬賣家之間的信任度從高到低,依次將該中間排序結果中白名單中賣家的商品資訊排在該最終排序結果的開頭,以及,按照該用戶與商品資訊所屬賣家之間的信任度的從低到高,依次將該中間排序結果中黑名單中賣家的商品資訊排在該最終排序結果的末尾。
TW101121754A 2012-02-22 2012-06-18 E-commerce search engine search method and e-commerce search engine TWI591495B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100428373A CN103294677A (zh) 2012-02-22 2012-02-22 电子商务搜索引擎的搜索方法和电子商务搜索引擎

Publications (2)

Publication Number Publication Date
TW201335780A TW201335780A (zh) 2013-09-01
TWI591495B true TWI591495B (zh) 2017-07-11

Family

ID=49095571

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101121754A TWI591495B (zh) 2012-02-22 2012-06-18 E-commerce search engine search method and e-commerce search engine

Country Status (2)

Country Link
CN (1) CN103294677A (zh)
TW (1) TWI591495B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI820489B (zh) * 2021-10-04 2023-11-01 禾多移動多媒體股份有限公司 關鍵字管理系統

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104252514A (zh) * 2013-12-04 2014-12-31 深圳市华傲数据技术有限公司 一种页面回显方法和系统
CN104462333B (zh) * 2014-12-03 2017-08-25 上海同刚网络科技有限公司 购物搜索推荐与告警方法和系统
CN105719145B (zh) * 2014-12-04 2020-11-03 菜鸟智能物流控股有限公司 获取商品到货时间的方法和装置
CN104796478B (zh) * 2015-04-24 2019-03-15 中国联合网络通信集团有限公司 一种资源推荐方法及装置
JP6835680B2 (ja) * 2017-07-14 2021-02-24 株式会社Nttドコモ 情報処理装置および信用度算出方法
CN107977405B (zh) * 2017-11-16 2021-01-22 北京三快在线科技有限公司 数据排序方法、数据排序装置、电子设备及可读存储介质
TWI671695B (zh) * 2017-12-26 2019-09-11 人因設計所股份有限公司 控管頁面資訊系統之方法
CN108595668A (zh) * 2018-04-28 2018-09-28 深圳春沐源控股有限公司 一种商品的自动排序方法、装置及计算机可读存储介质
CN109766491A (zh) * 2018-12-18 2019-05-17 深圳壹账通智能科技有限公司 商品搜索方法、装置、计算机设备和存储介质
CN110866698A (zh) * 2019-11-14 2020-03-06 北京京东尚科信息技术有限公司 用于评定服务提供方的服务分值的装置
CN115982423A (zh) * 2023-03-18 2023-04-18 北京新发地农产品网络配送中心有限责任公司 商品搜索匹配方法、装置、设备及计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1818908A (zh) * 2006-03-16 2006-08-16 董崇军 一种在搜索引擎中应用搜索者反馈信息的方法
CN102214183A (zh) * 2010-04-12 2011-10-12 北京银万特科技有限公司 按页面反馈内容与固定排名相结合的搜索引擎查询方法
CN102236646A (zh) * 2010-04-20 2011-11-09 得利在线信息技术(北京)有限公司 对象级垂直搜索引擎个性化排序算法iRank
CN102207962B (zh) * 2011-05-25 2013-03-13 盛乐信息技术(上海)有限公司 一种动态搜索引擎及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI820489B (zh) * 2021-10-04 2023-11-01 禾多移動多媒體股份有限公司 關鍵字管理系統

Also Published As

Publication number Publication date
TW201335780A (zh) 2013-09-01
CN103294677A (zh) 2013-09-11

Similar Documents

Publication Publication Date Title
TWI591495B (zh) E-commerce search engine search method and e-commerce search engine
US10452662B2 (en) Determining search result rankings based on trust level values associated with sellers
JP5913736B2 (ja) キーワードの推薦
US9563705B2 (en) Re-ranking results in a search
TWI609278B (zh) Method and system for recommending search words
US8880548B2 (en) Dynamic search interaction
US9251292B2 (en) Search result ranking using query clustering
US20140025532A1 (en) Correlated Content Recommendation Techniques
TWI645350B (zh) 決策因素分析裝置與決策因素分析方法
US9330071B1 (en) Tag merging
KR101955244B1 (ko) 논문 평가 방법 및 전문가 추천 방법
JP2014209376A (ja) オンライン商取引プラットフォームにおける広告ソースおよびキーワードセットの適合
CN107679186B (zh) 基于实体库进行实体搜索的方法及装置
JP2015500525A (ja) 情報検索のための方法および装置
JP6832606B2 (ja) コンテンツマッチングシステム
US9959559B2 (en) Ranking and recommendation algorithms for search listings
Zhang et al. Predicting temporary deal success with social media timing signals
Bajpai et al. Survey paper on dynamic recommendation system for e-commerce
Zhang et al. Discovering Social Media Timing Signals for Predicting Temporary Deal Success.
JP2017076376A (ja) 算出装置、算出方法および算出プログラム
US20160260151A1 (en) Search engine optimization for category web pages
JP6007300B1 (ja) 算出装置、算出方法および算出プログラム
Najib et al. A Systematic Literature Review on the Product Ranking Methods
TWI232390B (en) Business search engine
US9600529B2 (en) Attribute-based document searching

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees