TWI517065B - Method and related device for determining the list of candidate products - Google Patents

Method and related device for determining the list of candidate products Download PDF

Info

Publication number
TWI517065B
TWI517065B TW100104748A TW100104748A TWI517065B TW I517065 B TWI517065 B TW I517065B TW 100104748 A TW100104748 A TW 100104748A TW 100104748 A TW100104748 A TW 100104748A TW I517065 B TWI517065 B TW I517065B
Authority
TW
Taiwan
Prior art keywords
product
value
attribute
class attribute
nominal class
Prior art date
Application number
TW100104748A
Other languages
English (en)
Other versions
TW201218105A (en
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of TW201218105A publication Critical patent/TW201218105A/zh
Application granted granted Critical
Publication of TWI517065B publication Critical patent/TWI517065B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

確定候選產品鏈結表的方法及相關裝置
本申請涉及電腦網路技術領域,尤其涉及一種確定候選產品鏈結表的方法、一種確定兩個產品之間標稱類屬性上值的相似度值的方法、一種確定候選產品鏈結表的裝置及一種提供候選產品鏈結表的系統。
網上購物作為一種新興的購物方式,與傳統的實體購物方式相比具有種類齊全、方便快捷、省時省力以及價格低廉的優勢,已經成為一種普遍的購物方式。
網路商店經營者預先在電子商務網站上上傳自身銷售的每種產品的資訊,產品資訊包括產品標識、圖片以及該產品各屬性的屬性值。根據屬性值的取值特點,產品屬性可以被分為以下兩大類:標稱類屬性和非標稱類屬性。其中非標稱類屬性包括數值型屬性、序數型屬性以及集合類屬性等。
標稱類屬性的特點是其屬性值為無值序字串,例如產品品牌屬於標稱類屬性,其屬性值的取值為無值序字串,以化妝品為例,產品品牌屬性的取值範圍為雅芳、玉蘭油、雅詩蘭黛、碧兒泉、蘭蔻、……等。而非標稱類屬性的屬性值為自然數或者可以對應為自然數的有值序字串。例如,產品價格屬性屬於數值型屬性,其屬性值的取值範圍為大於零的實數,以產品為某一款式的鞋子為例,該鞋子的價格為59.99元。又如產品銷量屬性屬於序數型屬性,其屬性值的取值範圍為自然數,或者可以被映射為自然數的其他形式,例如“高”、“中”、“低”等有值序字串,仍以某一款式的鞋子為例,鞋子的銷量為100雙。產品顏色屬於集合類屬性,其屬性值的取值範圍為預定枚舉集合中的一個或多個元素形成的集合,如鞋子的顏色值為{紫色,紅色,黃色}。
用戶在進行網上購物時,常見的一種流程為:透過瀏覽器用戶端登錄電子商務網站,透過電子商務網站提供的搜尋功能、推薦產品列表或者該用戶此前收藏的網店經營者的銷售產品列表等途徑,獲得各種產品的資訊,基於獲得的資訊選擇一個產品,在確認購買之後,發出產品訂單。
在上述過程中,用戶根據各種產品資訊,選擇產品及確認購買是一個關鍵步驟。為了向用戶提供更多相關產品的資訊,便於用戶貨比三家,電子商務網站在用戶選擇一個產品之後,通常都會向用戶提供與選擇出的產品相近或相似的一些其他候選產品的資訊。
現有技術中,向用戶提供與指定產品相近或相似的候選產品鏈結表的基本原理如附圖1所示,假定用戶選定的產品為產品t,具體步驟如下:
步驟101,從產品屬性資訊資料庫中獲取每個產品各屬性的屬性值,包括產品t和其他產品的各屬性的屬性值;
步驟102,根據獲取到的產品的屬性值,逐個計算產品t與每個其他產品的相似度值;
以產品c為例,根據獲取到的產品c的各屬性的值與產品t的各對應屬性的值,計算產品c與產品t的相似度值Similarity(t,c),
其中,i為屬性的標識,假定每個產品均有n個屬性,那麼i的取值為1至n;t i 為產品ti個屬性的值、c i 為產品ci個屬性的值;w i 為第i個屬性的權重值;Sim i 為產品t和產品c在第i個屬性上值的相似度值。
步驟103,基於步驟102計算出的每個產品與用戶選擇的產品t的相似度值Similarity(t,c),選擇相似度值超過預定閾值d s 的產品組成產品t的相似產品集合C A
步驟104,將相似產品集合C A 中各產品按照與產品t的相似度值由高到底的順序排列,選取其中排名較前的預定N個產品的鏈結表作為產品t的相似產品鏈結表;
步驟105,將步驟104確定出的相似產品鏈結表中每個產品的相關資訊,例如產品標識、圖片、簡介、評價等資訊提供給用戶。
另外,還可以在用戶選擇產品之前,預先儲存每個產品的標識以及該產品對應的相似產品鏈結表,以備在用戶選擇產品後,根據選擇出產品的標識查詢該產品的相似產品鏈結表提供給用戶。
在上述步驟102中,對於產品的不同類型的屬性,現有技術採用以下方案來計算屬性的相似度值Sim i
1、如果屬性i為數值型屬性,產品t和產品c在屬性i上值的相似度值為:
其中,D(,)為距離測度,D(t i ,c i )=|t i -c i |;minD是所有產品在屬性i上兩兩之間距離測度值中的最小值;
2、如果屬性i為序數型屬性,產品t和產品c在屬性i上值的相似度值為:
,其中n為序數的取值上限;
3、如果屬性i為集合型屬性,產品t和產品c在屬性i上值的相似度值為:
4、如果屬性i為標稱型屬性,產品t和產品c在屬性i上值的相似度值為:
其中:,N為產品總數;
,其中f(t i )與f(c i )分別表示t i c i 在同類產品集合的產品該屬性的屬性值中出現的次數。
s(‧)與屬性值t i 和屬性值c i 分別在所有產品該標稱屬性的值中出現的次數有關,如果二者出現的次數接近,例如二者的出現次數都較多,或者二者出現的次數都較少,則二者的相似度值較高;否則,二者的相似度值較低。
上述log(N/f(‧))函數用於度量一個屬性值的特殊性,或者說與眾不同特點,當屬性值t i 在各產品該標稱類屬性的屬性值中出現的頻率較低時,該函數值較大;反之出現的頻率較高時,該函數值較小。
t i c i 之間的相似度值Sim i (t i ,c i )與s(‧)的含意相似,只是為了便於計算兩個產品之間的相似度值將s(‧)的取值範圍進行了歸一化處理,即使取值範圍調整為[0,1]。
目前,產品的標稱類屬性在產品的所有屬性中所占的比例較大,例如產品品牌屬性、產品名稱屬性等等,並且許多標稱類屬性、例如產品品牌屬性是用戶選擇產品時重要的考慮因素,因此在計算兩個產品之間的相似度值Similarity(t,c)時,標稱類屬性的權重值,即標稱類屬性的重要性往往非常高,而現有技術在計算兩個產品之間標稱類屬性的值的相似度值時,實質上是基於字串匹配技術來實現的,即當兩個產品該標稱類屬性的屬性值字串相同時,則相似度值為1;否則按照字串的統計分佈來計算相似度值;現有技術的處理方案無法深入發現屬性值內在的語義含意,不能很好地計算出標稱類屬性這一重要屬性的相似度值,導致無法準確地為用戶提供用戶選定的產品的候選產品。
本申請實施例提供一種確定候選產品鏈結表的方法,用以解決現有技術無法準確地確定產品之間的相似度值,導致無法準確地提供候選產品鏈結表的問題。
對應地,本申請實施例還提供了一種提供候選產品鏈結表的系統和一種確定產品標稱類屬性上的相似度值的裝置。
本申請實施例提供的技術方案如下:
一種確定候選產品鏈結表的方法,包括:提供包括第一產品和多個第二產品的同類產品集合,針對同類產品集合中的每個第二產品執行:計算該第一產品和該第二產品在每個非標稱類屬性上值的相似度值;計算該第一產品和該第二產品在每個標稱類屬性上值的相似度值時,執行:當第一產品該標稱類屬性的值和第二產品該標稱類屬性的值不同時,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品的傾向性,確定該第一產品該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值;根據第一產品和第二產品的非標稱類屬性的值的相似度值和標稱類屬性的值的相似度值,計算第一產品和第二產品的產品相似度值;將與第一產品相似度值排名較前的至少一個第二產品作為該第一產品的候選產品鏈結表。
一種確定兩個產品之間標稱類屬性上值的相似度值的方法,包括:計算第一產品和第二產品在標稱類屬性上值的相似度值時,執行:在第一產品該標稱類屬性的值和第二產品該標稱類屬性的值不同時,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品的傾向性,確定該第一產品的該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值。
一種確定候選產品鏈結表的裝置,包括:提供單元,用於提供包括第一產品和多個第二產品的同類產品集合;第一相似度確定單元,用於針對同類產品集合中的每個第二產品,計算該第一產品和該第二產品在每個非標稱類屬性上值的相似度值;第二相似度確定單元,用於針對同類產品集合中的每個第二產品,計算該第一產品和該第二產品在每個標稱類屬性上值的相似度值時,執行:當第一產品該標稱類屬性的值和第二產品該標稱類屬性的值不同時,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品的傾向性,確定該第一產品該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值;產品相似度確定單元,用於根據第一相似度確定單元確定出的第一產品和第二產品的非標稱類屬性的值的相似度值和第二相似度確定單元確定出的第一產品和第二產品標稱類屬性的值的相似度值,計算第一產品和第二產品的產品相似度值;鏈結表確定單元,用於根據第三相似度確定單元確定出的第一產品和每個第二產品的產品相似度值,將與第一產品相似度值排名較前的至少一個第二產品作為該第一產品的候選產品鏈結表。
一種提供候選產品鏈結表的系統,包括:網頁伺服器,用於向確定候選產品鏈結表的裝置發送候選產品查詢請求,該請求中包含指定產品的標識;交易記錄資料庫,用於儲存用戶購買記錄集合;產品屬性資料庫,用於儲存每個產品各屬性的值;確定候選產品鏈結表的裝置,用於根據交易記錄資料庫中儲存的用戶購買記錄集合和產品屬性資料庫中儲存的每個產品各屬性的值,確定每個產品對應的候選產品鏈結表,並儲存每個產品的標識以及該產品的候選產品鏈結表的對應關係;接收到網頁伺服器發來的候選產品查詢請求後,從儲存的產品的標識以及候選產品鏈結表的對應關係中選擇出該產品查詢請求中包含的該指定產品的標識對應的候選產品鏈結表,並將選擇出的候選產品鏈結表提供給網頁伺服器。
本申請實施例透過對確定兩個產品相似度值過程中確定該兩個產品在標稱類屬性上值的相似度值的步驟進行改進,根據每個產品該標稱類屬性的值和整體用戶購買產品的記錄,確定整體用戶群在購買該標稱類屬性值與第一產品的屬性值一致的產品和該標稱類屬性值與第二產品的屬性值一致的產品上表現出的傾向性特徵是否相似,若相似,則確定第一產品該標稱類屬性的屬性值與第二產品該標稱類屬性的屬性值的相似度值較高;否則,相似度值較低,從而能夠根據屬性值內在的語義含意來確定相似度值,提高了計算標稱類屬性值相似度值的準確性。
申請人發現現有技術無法將與用戶選擇出的產品較為相關的候選產品優先地提供給用戶的原因在於:計算兩個產品之間同一標稱類屬性的值的相似度值時,是基於硬計算範式的,即是基於這兩個產品該標稱類屬性的值分別在所有產品該標稱類屬性值中出現頻率來確定相似度值的;而無法深入發現屬性值內在的語義含意。例如對於化妝品類別的產品來說,每個產品具有的品牌屬性為標稱類屬性,該屬性值的取值為無值序字串,例如假設存在品牌“品牌一、品牌二、品牌三、品牌四、品牌五、品牌六”,並假設“品牌一、品牌二、品牌三”這三個品牌屬於高檔品牌,而“品牌四、品牌五、品牌六”屬於低檔品牌。此時,不能因為“品牌二”和“品牌五”在所有產品的品牌名稱這一標稱類屬性的屬性值中出現頻率接近,就認為這兩個品牌的相似度高。在計算品牌屬性的相似度時,同為高檔品牌的產品之間應具有較高的相似度值,而高檔品牌的產品和低檔品牌的產品之間應具有較低的相似度值。
本申請的基本思想是:在計算兩個產品A(第一產品)和B(第二產品)之間的相似度值的過程中,對計算標稱類屬性值的相似度值的步驟進行改進,具體為:
對於每個標稱類屬性來說,根據該標稱類屬性的值與產品A該標稱類屬性的值一致的產品、該標稱類屬性的值與產品B該標稱類屬性的值一致的產品分別被各用戶購買的記錄,來確定整體用戶群購買的產品分別在產品A該標稱類屬性值上體現出的傾向性特點(即哪些用戶傾向於購買該標稱類屬性的值與產品A該標稱類屬性的值一致的產品,例如哪些用戶傾向於購買“品牌二”品牌的產品)、以及在產品B該標稱類屬性值上體現出的傾向性特點(即哪些用戶傾向於購買該標稱類屬性的值與產品B該標稱類屬性的值一致的產品,例如哪些用戶傾向於購買“品牌五”品牌的產品),如果整體用戶群購買的產品在產品A該標稱類屬性的值上體現出的傾向性特點與在產品B該標稱類屬性的值上體現出的傾向性特點相同,即購買“品牌二”品牌的產品的用戶通常也購買“品牌五”品牌的產品,那麼認為在產品品牌標稱類屬性上,“品牌二”和“品牌五”相似度高,否則認為“品牌二”和“品牌五”相似度低。
在此基礎上,結合其他類別屬性上屬性值的相關度值計算方法,確定用戶當前選定的產品與其他產品的相似度值;再根據計算出的相似度值確定優先提供給用戶的候選產品鏈結表。
如圖2所示,本申請實施例的主要實現原理流程如下:
步驟10,提供包括第一產品和多個第二產品的同類產品集合,針對該同類產品集合中的每個第二產品執行步驟20~步驟50:
步驟20,計算該第一產品和該第二產品在每個非標稱類屬性上值的相似度值;
步驟30,計算該第一產品和該第二產品在每個標稱類屬性上值的相似度值時,執行:當第一產品該標稱類屬性的值和第二產品該標稱類屬性的值不同時,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品的傾向性,確定該第一產品該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值;
步驟40,根據步驟20計算出的第一產品和第二產品的非標稱類屬性的值的相似度值和步驟30計算出的標稱類屬性的值的相似度值,計算第一產品和第二產品的產品相似度值;
步驟50,將與第一產品相似度值排名較前的至少一個第二產品作為該第一產品的候選產品鏈結表。
在步驟30計算中兩個產品的標稱類屬性的值的相似度值過程中,確定這兩個產品在每個標稱類屬性上的相似度值時,在第一產品和第二產品該標稱類屬性的值相同時,可將第一產品和第二產品該標稱類屬性的值的相似度設定的最高值,例如1。
下面將依據本申請上述發明原理,詳細介紹兩個實施例來對本申請方法的主要實現原理進行詳細的闡述和說明。
實施例一
請參照附圖3a,為本申請實施例中提供候選產品鏈結表的系統的原理結構圖。該系統包括瀏覽器用戶端、網頁Web伺服器、交易記錄資料庫、產品屬性資料庫和確定候選產品鏈結表的裝置。
其中,用戶透過瀏覽器用戶端登錄網頁伺服器查看各種產品資訊,選擇感興趣的產品、以及確認購買產品等;
網頁伺服器,用於向確定候選產品鏈結表的裝置發送候選產品查詢請求,該請求中包含指定產品的標識;
交易記錄資料庫,用於儲存用戶購買產品的訂單記錄資料,每條訂單記錄包括訂單生成時間、用戶標識、用戶所購買的產品的標識、購買產品的數量等;
產品屬性資料庫,用於儲存每個產品各屬性的屬性值;
確定候選產品鏈結表的裝置,用於針對同類產品集合中的每個產品,根據該產品和該同類產品集合中每個其他產品各屬性值的相似度值和設定的各屬性權重值,確定該產品與該其他產品的相似度值,根據交易記錄資料庫中儲存的用戶購買記錄集合和產品屬性資料庫中儲存的每個產品各屬性的值,確定每個產品對應的候選產品鏈結表,並儲存每個產品的標識以及該產品的候選產品鏈結表的對應關係;接收到網頁伺服器發來的候選產品查詢請求後,從儲存的產品的標識以及候選產品鏈結表的對應關係中選擇出該產品查詢請求中包含的該指定產品的標識對應的候選產品鏈結表,並將選擇出的候選產品鏈結表提供給網頁伺服器;
其中,在確定同類產品集合中第一產品和第二產品的相似度值時,針對同類產品集合中的每個第二產品執行:計算該第一產品和該第二產品在每個非標稱類屬性上值的相似度值;計算該第一產品和該第二產品在每個標稱類屬性上值的相似度值時,執行:當第一產品該標稱類屬性的值和第二產品該標稱類屬性的值不同時,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品的傾向性,確定該第一產品該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值;根據第一產品和第二產品的非標稱類屬性的值的相似度值和標稱類屬性的值的相似度值,計算第一產品和第二產品的產品相似度值;將與第一產品相似度值排名較前的至少一個第二產品作為該第一產品的候選產品鏈結表。
本申請實施例中為用戶提供候選產品鏈結表的過程流程圖如附圖3b所示。
步驟301,用戶透過瀏覽器用戶端與網頁伺服器進行互動,發送瀏覽產品請求,瀏覽產品請求可以為多種訊息,例如查看推薦產品列表的請求,或者根據關鍵字查詢產品資訊的請求,或者在透過用戶名和密碼登錄後發送查看收藏網店的銷售產品列表的請求;
步驟302,網頁伺服器接收到瀏覽產品請求後,對應向用戶提供產品列表,產品列表中不僅可以包含產品標識,還可以附加提供產品的縮略圖、簡要介紹等等;
步驟303,用戶基於網頁伺服器提供的產品列表,選中其中的一個產品A,例如將滑鼠停留在該產品的縮略圖上、或者點擊該產品的標識等等;
步驟304,網頁伺服器向確定候選產品鏈結表的裝置發送候選產品查詢請求,該請求中包含用戶選中的產品A的標識;
步驟305,確定候選產品鏈結表的裝置接收到候選產品查詢請求後,從預先儲存的各產品的標識與候選產品鏈結表的對應關係(如表1所示)中,查找候選產品查詢請求中包含的產品A的標識對應的候選產品鏈結表為ListA:H-I-J,表1中的H、I、J、K、L、M、R、S、T、U分別為其他產品的標識;表1給出了儲存的產品標識與候選產品鏈結表的對應關係的示例。
表1中的候選產品鏈結表是確定候選產品鏈結表的裝置預先根據交易記錄資料庫和產品屬性資料庫中儲存的資料,計算產品A與其他產品的相似度值,將與產品A的相似度值超過預定閾值的產品加入候選產品集合C A 中,並將C A 中的產品按照相似度值由高到低的順序排序,並從中選取排名較前的預定數目的產品而生成的候選產品鏈結表,在本實施例中產品A的候選產品鏈結表為ListA:H-I-J;
為了提高計算兩個產品相似度值時的效率,可以預先對產品類別進行分類,僅計算產品A所屬的同類產品集合中的其他產品與產品A的相似度值,例如假定用戶選中的產品A為“品牌五”潤膚霜,那麼這時只需要計算化妝品產品集合中的其他產品與產品A“品牌五”潤膚霜之間的相似度值即可。
步驟306,確定候選產品鏈結表的裝置將查找到的候選產品鏈結表ListA:H-I-J發送給網頁伺服器;
步驟307,網頁伺服器將確定候選產品鏈結表的裝置發來的候選產品鏈結表透過瀏覽器用戶端顯示給用戶;
步驟308,用戶根據顯示的候選產品鏈結表,確定想要購買的產品,確認購買後,向網頁伺服器發送確認購買通知,該確認購買通知中包含確認購買的產品的標識;
步驟309,網頁伺服器接收到確認購買通知後生成訂單,並在交易記錄資料庫中儲存用戶購買記錄。
上述步驟306中,也可以直接發送至瀏覽器用戶端顯示給用戶;即不透過網頁伺服器中轉,省略步驟307。
在上述步驟305中,確定候選產品鏈結表的裝置的結構示意圖如附圖4所示,在確定候選產品鏈結表時,該裝置首先逐一計算同類產品集合中的每個產品(以產品A為例)與同類產品集合中的每個其他產品(以產品B為例)每個屬性的屬性值之間的相似度值,並根據產品A與產品B各屬性值的相關度值,計算產品A與產品B的相似度值,由於本申請主要是透過附圖5中的各步驟詳細地說明計算兩個產品的標稱類屬性值的相關度值時的改進,計算非標稱類屬性的屬性值的相關度值時,例如數值型屬性、序數型屬性和集合類屬性的值的相關度值的方法與現有技術類似,此處不再贅述。
這裏以計算產品A和產品B的標識為Attribute_I的標稱類屬性上值的相關度值為例進行說明。
步驟501,根據產品屬性資料庫中儲存的各產品的標稱類屬性Attribute_I的值,確定標稱類屬性Attribute_I的值集合ITEM
產品屬性資料庫中的資料表Table_P中儲存有每個產品各屬性的值,資料表Table_P的儲存結構如表2所示,每行包含同一個產品各屬性的值,每列包含各產品同一屬性的值,也可以理解為一個產品的不同屬性的值分別儲存於同一行的不同欄位中。
透過資料庫查詢SQL語句“Select distinct Attribute_I from Table_P”可以從表Table_P中獲取屬性Attribute_I對應的欄位中不同的屬性值,從而獲得屬性Attribute_I的包含有N個元素的屬性值集合ValueSet_Attribute_I={ITEM i },i=0,...N,在本實施例中屬性值集合ValueSet_Attribute_I具體包括3個不同的值:ITEM 1ITEM 2ITEM 3
步驟502,從交易記錄資料庫中獲取購買過產品的用戶集合Set_U;
假定在交易記錄資料庫中訂單資料表Table_T的儲存結構如表2所示,每行的不同欄位分別儲存一個訂單記錄的各種相關資料,包括訂單生成時間、用戶標識、用戶所購買的產品的標識、購買產品的數量等。以表3其中第3行為例,序列號為55的訂單記錄表明標識為u 100的用戶,在2007年1月4日18點00時00分購買了1件產品標識為A的產品。
上述表Table_T中儲存用戶標識的欄位為user,透過資料庫查詢SQL語句“Select distinct user from Table_T”可以從表Table_T中獲取欄位user中不同的用戶標識u 100u 101,從而獲得用戶標識集合Set_U={u 100,u 101};
較佳地,考慮到用戶的購買行為具有連續性,即習慣進行網上購物的用戶往往每週、或每個月都要進行網上購物,這種用戶的行為具有一定的習慣性或傾向性特點;而有的用戶只是2、3年中偶爾進行了一次網上購物,這類用戶的行為具有很大的偶然性,很難從中發現傾向性,因此相比較而言,前一類用戶的訂單記錄更有用,出於減少資料量,提高處理效率方面的考慮,可以從用戶標識集合Set_U中進一步篩選出預定時間段內進行網上交易的用戶,例如一個月、一個季度、半年、一年內等進行網上交易的用戶。
步驟503,根據步驟501獲得的屬性Attribute_I的屬性值集合ValueSet_Attribute_I,以及步驟502獲得的用戶標識集合Set_U,確定每個用戶標識u i 與屬性Attribute_I的屬性值之間的三元組<u i ,item j ,1/0>,如果用戶標識為u i 的用戶購買過屬性Attribute_I的屬性值為item j 的產品,則第三個向量值為1(或其他第一預定值),即<u i ,item j ,1>;否則,特徵三元組中第三個向量值為0(或其他第二預定值),即<u i ,item j ,0>;
依次取出用戶標識集合Set_U中的每個用戶標識,構建該用戶標識與屬性Attribute_I的屬性值之間的三元組,下面給出了兩種三元組的構建方法,執行以下步驟:
方案一:從訂單資料表Table_T中取出用戶標識為u i 的所有記錄,根據取出的記錄中的產品標識欄位,即可獲得用戶標識為u i 的用戶已購買的產品標識的集合;從產品屬性資料庫中獲取集合中各產品屬性Attribute_I的值,將第一向量為u i 、第二向量為中各產品屬性Attribute_I的值的三元組的第三個向量值設置為1;將第一向量為u i 、第二向量為屬性值集合Set_Attribute_I中除用戶標識為u i 的用戶已購買的產品屬性Attribute_I的值之外的屬性值的三元組中第三個向量值設置為0;以此獲取每個用戶標識u i 與屬性值集合Set_Attribute_I中包含的屬性值數量對應的N個三元組。
方案二:依次獲取屬性值集合Set_Attribute_I中的各屬性值item k ,k的取值範圍為0至N(屬性值集合Set_Attribute_I中包含的元素數目),執行以下SQL語句:
Select*
From Table_T and Table_P
Where T.user=”u i ”and T.product=P.product and P.Attribute_I=”item k
若執行上述語句後的返回值不為空,則說明用戶u i 購買過標稱類屬性Attribute_I的值為item k 的產品,將第一向量為u i 、且第二向量為item k 的三元組中第三個向量設置為1,即<u i ,item k ,1>;否則將第一向量為u i 、且第二向量為item k 的三元組中的第三個向量設置為0,即<u i ,item k ,0>。
步驟504,根據步驟503確定出的各用戶對應的標稱類屬性Attribute_I的N個三元組,確定標稱類屬性Attribute_I的用戶屬性值矩陣,用戶屬性值矩陣中的每行包含同一用戶購買的產品是否具有屬性值集合ValueSet_Attribute_I中的各屬性值的資訊,該矩陣中的每列包含各用戶購買的產品是否具有屬性值集合ValueSet_Attribute_I中同一屬性值的資訊;
如附圖6a所示,按照設定的屬性值集合Set_Attribute_I中各屬性值的排列順序,依次將同一用戶對應的N個三元組中的第三個向量填入特徵矩陣的同一行的不同位置中。
步驟505,從步驟504獲得的屬性值矩陣中提取產品A標稱類屬性Attribute_I的屬性值item i 對應的列向量,以及產品B標稱類屬性Attribute_I的屬性值item j 對應的列向量,如附圖6b中的黑色粗線框所示,在本實施例中=<1,0,...,1>,=<0,0,...,1>;
其中列向量表明整體用戶群購買的產品標稱類屬性Attribute_I的屬性值為item i 的傾向性特徵,即哪些用戶傾向於購買標稱類屬性Attribute_I的屬性值為item i 的產品;列向量表明整體用戶群購買的產品標稱類屬性Attribute_I的屬性值為item j 的傾向性特徵,即哪些用戶傾向於購買標稱類屬性Attribute_I的屬性值為item j 的產品。
步驟506,計算步驟505提取出的的互相關度值,將計算出的互相關度值作為產品A和產品B的標稱類屬性Attribute_I的值的相似度值sim i (item i ,item j );
需要說明的是,也可以採用條件機率的方式替代步驟506中計算互相關度的方式確定產品A和產品B的標稱類屬性Attribute_I的屬性值的相似度值sim i (item i ,item j ),具體過程請參照附圖7所示:
步驟701,根據該標稱類屬性的值與第一產品該標稱類屬性的值一致的產品和該標稱類屬性的值與第二產品該標稱類屬性的值一致的產品被各用戶購買的記錄,確定購買該標稱類屬性的值與第一產品該標稱類屬性的值一致的產品的第一用戶集合、購買該標稱類屬性的值與第二產品該標稱類屬性的值一致的產品的第二用戶集合、同時購買該標稱類屬性的值與第一產品該標稱類屬性的值一致的產品和該標稱類屬性的值與第二產品該標稱類屬性的值一致的產品的第三用戶集合;
在本實施例中根據附圖6b中的第i列和第j列,可以獲得購買標稱類屬性Attribute_I的屬性值為item i 的產品的用戶集合U A (即中元素值為1的元素對應的用戶組成的集合)、購買標稱類屬性Attribute_I的屬性值為item j 的產品的用戶集合U B (即中元素值為1的元素對應的用戶組成的集合)、以及同時購買屬性值為item i 的產品和屬性值為item j 的產品的用戶集合U AB
步驟702,根據第一用戶集合、第二用戶集合和第三用戶集合,確定用戶在購買屬性值與第一產品該標稱類屬性屬性值一致的產品的情況下購買屬性值與第二產品該標稱類屬性屬性值一致的產品的第一條件機率、以及用戶在購買屬性值與第二產品該標稱類屬性屬性值一致的產品的情況下購買屬性值與第一產品該標稱類屬性屬性值一致的產品的第二條件機率;
根據用戶集合U A 、用戶集合U AB 確定用戶在購買屬性值為item i 的產品的情況下購買屬性值為item j 的產品的條件機率為:
P(B|A)=|U AB |/|U A |,其中|U|為集合U中包含的元素數量;
同理可以獲得購買屬性值item j 為的產品的情況下購買屬性值為item i 的產品的條件機率為:
P(A|B)=|U AB |/|U B |;
步驟703,將第一條件機率和第二條件機率的算術平均值作為確定第一產品和第二產品該標稱類屬性值的相似度值。
確定產品A的標稱類屬性Attribute_I的屬性值item i 和產品B的標稱類屬性Attribute_I的屬性值item j 的相似度值sim i (item i ,item j )為:
sim i (item i ,item j )=(P(B|A)+P(A|B))/2
即,如果購買標稱類屬性Attribute_I的屬性值為item i 的產品的用戶群中的而用戶同時也有較大可能傾向於購買標稱類屬性Attribute_I的屬性值為item j 的產品,則說明在屬性值item i 和屬性值item j 具有較高的相似性。
當然,附圖7只是給出了一種準確性更高的計算兩個產品標稱類屬性上值的相似度值的方案,直接將第一條件機率和第二條件機率作為相似度值也可以解決無法發現屬性值內在的語義含意的問題。
如附圖4所示,確定候選產品鏈結表的裝置具體包括提供單元401、第一相似度確定單元402、第二相似度確定單元403、產品相似度確定單元404、鏈結表確定單元405;較佳地還可以包括儲存單元406、接收單元407、選擇單元408和發送單元409,其中:
提供單元401,用於提供包括第一產品和多個第二產品的同類產品集合;
第一相似度確定單元402,用於針對同類產品集合中的每個第二產品,計算該第一產品和該第二產品在每個非標稱類屬性上值的相似度值;
第二相似度確定單元403,用於針對同類產品集合中的每個第二產品,計算該第一產品和該第二產品在每個標稱類屬性上值的相似度值時,執行:當第一產品該標稱類屬性的值和第二產品該標稱類屬性的值不同時,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品的傾向性,確定該第一產品該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值;
產品相似度確定單元404,用於根據第一相似度確定單元402確定出的第一產品和第二產品的非標稱類屬性的值的相似度值和第二相似度確定單元403確定出的第一產品和第二產品標稱類屬性的值的相似度值,計算第一產品和第二產品的產品相似度值;
鏈結表確定單元405,用於根據產品相似度確定單元404確定出的第一產品和每個第二產品的產品相似度值,將與第一產品相似度值排名較前的至少一個第二產品作為該第一產品的候選產品鏈結表;
儲存單元406,用於儲存第一產品的標識以及鏈結表確定單元405確定出的候選產品鏈結表的對應關係;
接收單元407,用於接收候選產品查詢請求;
選擇單元408,用於在接收單元407接收到候選產品查詢請求後,從儲存單元406儲存的產品的標識以及候選產品鏈結表的對應關係中,選擇出候選產品查詢請求中包含的產品的標識對應的候選產品鏈結表;
發送單元409,用於將選擇單元408獲得的候選產品鏈結表發送給網頁伺服器。
第二相似度確定單元403計算產品A與其他產品B標稱類屬性值的相似度值的具體過程請參照附圖5至附圖7所示,在這裏不再贅述。
本申請實施例在確定產品A和產品B某個標稱類屬性的屬性值的相關度值時,根據每個產品該標稱類屬性的屬性值和每個用戶購買產品的記錄,確定整體用戶群所購買的產品的該標稱類屬性值在產品A的屬性值和產品B的屬性值上的傾向性特徵是否相似,若相似,則說明產品A與產品B該標稱類屬性的屬性值的相似度較高,否則確定產品A與產品B該標稱類屬性的屬性值的相似度較低,從而能夠發現產品A該標稱類屬性的屬性值與產品B該標稱類屬性的屬性值的相似度內在語意上的相似性,克服了現有技術存在的問題,提高計算標稱類屬性值相似度值的準確性,從而進一步提高了計算候選產品鏈結表的準確性。
實施例二
實施例一提供了一種採用離線方式提供選中的產品A的後續產品鏈結表的方案:計算產品A與其他產品的相似度值,並基於計算出的選中產品A與其他產品的相似度值提供候選產品鏈結表,儲存每個產品的標識與該產品的候選產品鏈結表之間的對應關係,在接收到候選產品查詢請求時,根據候選產品查詢請求中包含的產品標識,從儲存的產品標識與該產品的候選產品鏈結表的對應關係中選擇出該候選產品查詢請求中包含的產品標識對應的候選產品鏈結表,將選擇出候選產品鏈結表發送給網頁伺服器。由於這種方案預先儲存的產品標識與該產品的候選產品鏈結表的對應關係會佔用一定儲存資源,而其中有可能有部分產品標識與該產品的候選產品鏈結表的對應關係被檢索到的機率較低。因此,本申請還提供了一種線上確定備選產品鏈結表的方式,即在步驟305中確定候選產品鏈結表的裝置不是從儲存的每個產品的標識與該產品的候選產品鏈結表之間的對應關係中選擇候選產品查詢請求中包含的產品標識對應的候選產品鏈結表,而是根據交易記錄資料庫、產品屬性資料庫中的資料即時地計算出候選產品查詢請求中包含的產品標識對應的候選產品鏈結表。
較佳地,考慮這種即時計算候選產品鏈結表的方案在同類產品集合中的其他產品數量較多時,計算相似度值會耗費較多時間,如果步驟305中確定候選產品鏈結表的裝置在較短時間內接收到網頁伺服器發來數量較多的候選產品查詢請求的話,處理壓力將會增大,因此可以預先根據除標稱類屬性之外的其他屬性值進行篩選,如果候選產品查詢請求中的產品標識對應的指定產品A和其他產品B之間除標稱類屬性之外的其他類型屬性(例如數值型等)的屬性值的相似度值低於設定的閾值,則無需再計算產品A和產品B標稱類屬性上屬性值的相似度值,直接將產品B排除在候選產品集合C A 之外。
請參照附圖8,為本申請實施例提供的確定候選產品鏈結表的裝置的原理結構圖。確定候選產品鏈結表的裝置具體包括:接收單元801、產品相似度值確定單元802、鏈結表確定單元803和發送單元804,其中:
接收單元801,用於接收網頁伺服器發來的候選產品查詢請求;
產品相似度值確定單元802,用於針對查詢請求中包含的產品標識對應的指定產品,根據該指定產品和所屬同類產品集合中每個其他產品各屬性值的相似度值和設定的各屬性權重值,確定該指定產品與該其他產品的相似度值,其中在確定該指定產品和每個其他產品每個標稱類屬性上屬性值的相似度值時,執行:在該指定產品和每個其他產品該標稱類屬性的屬性值不同時,根據購買記錄集合中購買該指定產品該標稱類屬性的值對應的產品的用戶購買該其他產品該標稱類屬性的值對應的產品的傾向性,確定該指定產品該標稱類屬性的值和該其他產品該標稱類屬性的值的相似度值;
鏈結表確定單元803,用於將與指定產品相似度值排名較前的至少一個其他產品作為該指定產品的候選產品鏈結表;
發送單元804,用於將鏈結表確定單元803獲得的候選產品鏈結表發送給網頁伺服器。
本領域普通技術人員可以理解實現上述實施例方法中的全部或部分步驟是可以透過程式來指令相關的硬體來完成,該程式可以儲存於一電腦可讀取儲存媒體中,如:ROM/RAM、磁碟、光碟等。
顯然,本領域的技術人員可以對本申請進行各種改動和變型而不脫離本申請的精神和範圍。這樣,倘若本申請的這些修改和變型屬於本申請申請專利範圍及其等同技術的範圍之內,則本申請也意圖包含這些改動和變型在內。
401...提供單元
402...第一相似度確定單元
403...第二相似度確定單元
404...產品相似度確定單元
405...鏈結表確定單元
406...儲存單元
407...接收單元
408...選擇單元
409...發送單元
801...接收單元
802...產品相似度值確定單元
803...鏈結表確定單元
804...發送單元
圖1為現有技術中提供與指定產品相關的候選產品鏈結表的流程圖;
圖2為本申請實施例的主要實現原理流程圖;
圖3a為本申請實施例中提供候選產品鏈結表的系統的原理結構圖;
圖3b為本申請實施例一中向用戶提供候選產品鏈結表的過程流程圖;
圖4為本申請實施例一中確定候選產品鏈結表的裝置的結構示意圖;
圖5為本申請實施例一中計算產品A和產品B標稱類屬性I的屬性值的相關度值的流程圖;
圖6a為本申請實施例一中用戶屬性值矩陣的示意圖;
圖6b為本申請實施例一中用戶屬性值矩陣中產品A標稱類屬性I的屬性值對應的列向量和產品B標稱類屬性I的屬性值對應的列向量的示意圖;
圖7為本申請實施例一中提出的採用條件機率方式確定標稱類屬性值的相似度值的流程圖;
圖8為本申請實施例二中確定候選產品鏈結表的裝置的結構示意圖。

Claims (13)

  1. 一種確定候選產品鏈結表的方法,其特徵在於,包括:提供包括第一產品和多個第二產品的同類產品集合,針對同類產品集合中的每個第二產品執行:計算該第一產品和該第二產品在每個非標稱類屬性上值的相似度值;計算該第一產品和該第二產品在每個標稱類屬性上值的相似度值時,執行:當第一產品該標稱類屬性的值和第二產品該標稱類屬性的值不同時,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品的傾向性,確定該第一產品該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值;根據第一產品和第二產品的非標稱類屬性的值的相似度值和標稱類屬性的值的相似度值,計算第一產品和第二產品的產品相似度值;將與第一產品相似度值排名較前的至少一個第二產品作為該第一產品的候選產品。
  2. 如申請專利範圍第1項所述的方法,其中,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品的傾向性,確定該第一產品該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值,具體包括: 根據購買記錄集合,確定第一用戶集合、第二用戶集合、第三用戶集合;其中,第一用戶集合為該購買記錄集合中購買該標稱類屬性的值與該第一產品該標稱類屬性的值一致的產品的集合;第二用戶集合為該購買記錄集合中購買該標稱類屬性的值與該第二產品該標稱類屬性的值一致的產品的集合;第三用戶集合為該購買記錄集合中購買該標稱類屬性的值與該第一產品該標稱類屬性的值一致的產品並且購買該標稱類屬性值與該第二產品該標稱類屬性的值一致的產品的集合;根據第一用戶集合、第二用戶集合和第三用戶集合,確定用戶在購買該標稱類屬性的值與該第一產品該標稱類屬性的值一致的產品的情況下購買該標稱類屬性的值與該第二產品該標稱類屬性的值一致的產品的第一條件機率,並確定用戶在購買該標稱類屬性的值與該第二產品該標稱類屬性的值一致的產品的情況下購買該標稱類屬性的值與該第一產品該標稱類屬性的值一致的產品的第二條件機率;將該第一條件機率和第二條件機率的算術平均值作為第一產品和第二產品在該標稱類屬性上值的相似度值。
  3. 如申請專利範圍第1項所述的方法,其中,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品 的傾向性,確定該第一產品該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值,具體包括:根據購買記錄集合,確定該標稱類屬性的用戶屬性值關係矩陣,該用戶關係矩陣中的每列表明具有該標稱類屬性的同一個值的產品是否被各用戶購買的記錄;從該用戶屬性值關係矩陣中選擇出第一產品該標稱類屬性的值對應的列作為該標稱類屬性的值與第一產品該標稱類屬性的值一致的產品被各用戶購買的記錄,將第二產品該標稱類屬性的值對應的列作為該標稱類屬性的值與第二產品該標稱類屬性的值一致的產品被各用戶購買的記錄;該產品和該其他產品該標稱類屬性值的相似度值sim(i,j)為
  4. 如申請專利範圍第3項所述的方法,其中,根據購買記錄集合,確定該標稱類屬性的用戶屬性值關係矩陣,具體包括:針對用戶購買記錄集合中的每個用戶購買記錄,執行:根據該用戶購買記錄以及每個產品該標稱類屬性的值,確定該用戶購買的產品的該標稱類屬性的值;並且,根據確定出的該用戶購買的產品的該標稱類屬性的值,確定該用戶的該標稱類屬性向量,其中m為該用戶的標識,對於該中的每個元素R m,i ,其中i為該值集合中 的值的標識,若用戶購買過標識為i的值的產品,則將元素R m,i 的值設置為第一值;否則元素R m,i 的值設置為第二值;將每個用戶的該標稱類屬性向量作為矩陣中的行,確定該標稱類屬性的用戶屬性值關係矩陣。
  5. 如申請專利範圍第1項所述的方法,其中,計算該第一產品和該第二產品在每個標稱類屬性上值的相似度值時,還包括:當第一產品該標稱類屬性的值和第二產品該標稱類屬性的值相同時,確定該第一產品該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值為設定的最高值。
  6. 如申請專利範圍第1至5項中任一項所述的方法,其中,選取排名較前的至少一個第二產品作為該第一產品的候選產品鏈結表之後,還包括:儲存第一產品的標識以及確定出的候選產品鏈結表的對應關係;在接收到候選產品查詢請求後,從儲存的產品的標識以及候選產品鏈結表的對應關係中,選擇出候選產品查詢請求中包含的產品的標識對應的候選產品鏈結表。
  7. 一種確定兩個產品之間標稱類屬性上值的相似度值的方法,其特徵在於,包括:計算第一產品和第二產品在標稱類屬性上值的相似度值時,執行:當第一產品該標稱類屬性的值和第二產品該標稱類屬 性的值不同時,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品的傾向性,確定該第一產品的該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值。
  8. 如申請專利範圍第7項所述的方法,其中,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品的傾向性,確定該第一產品的該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值,具體包括:根據購買記錄集合,確定該標稱類屬性的用戶屬性值關係矩陣,該用戶關係矩陣中的每列表明具有該標稱類屬性的同一個值的產品是否被各用戶購買的記錄;從該用戶屬性值關係矩陣中選擇出第一產品該標稱類屬性的值對應的列作為該標稱類屬性的值與第一產品該標稱類屬性的值一致的產品被各用戶購買的記錄,將第二產品該標稱類屬性的值對應的列作為該標稱類屬性的值與第二產品該標稱類屬性的值一致的產品被各用戶購買的記錄;該產品和該其他產品該標稱類屬性值的相似度值sim(i,j)為
  9. 如申請專利範圍第7項所述的方法,其中,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品 的傾向性,確定該第一產品的該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值,具體包括:根據購買記錄集合,確定第一用戶集合、第二用戶集合、第三用戶集合;其中,第一用戶集合為該購買記錄集合中購買該標稱類屬性的值與該第一產品該標稱類屬性的值一致的產品的集合;第二用戶集合為該購買記錄集合中購買該標稱類屬性的值與該第二產品該標稱類屬性的值一致的產品的集合;第三用戶集合為該購買記錄集合中購買該標稱類屬性的值與該第一產品該標稱類屬性的值一致的產品並且購買該標稱類屬性值與該第二產品該標稱類屬性的值一致的產品的集合;根據第一用戶集合、第二用戶集合和第三用戶集合,確定用戶在購買該標稱類屬性的值與該第一產品該標稱類屬性的值一致的產品的情況下購買該標稱類屬性的值與該第二產品該標稱類屬性的值一致的產品的第一條件機率,並確定用戶在購買該標稱類屬性的值與該第二產品該標稱類屬性的值一致的產品的情況下購買該標稱類屬性的值與該第一產品該標稱類屬性的值一致的產品的第二條件機率;將該第一條件機率和第二條件機率的算術平均值作為第一產品和第二產品在該標稱類屬性上值的相似度值。
  10. 一種確定候選產品鏈結表的裝置,其特徵在於, 包括:提供單元,用於提供包括第一產品和多個第二產品的同類產品集合;第一相似度確定單元,用於針對同類產品集合中的每個第二產品,計算該第一產品和該第二產品在每個非標稱類屬性上值的相似度值;第二相似度確定單元,用於針對同類產品集合中的每個第二產品,計算該第一產品和該第二產品在每個標稱類屬性上值的相似度值時,執行:當第一產品該標稱類屬性的值和第二產品該標稱類屬性的值不同時,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品的傾向性,確定該第一產品該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值;產品相似度確定單元,用於根據第一相似度確定單元確定出的第一產品和第二產品的非標稱類屬性的值的相似度值和第二相似度確定單元確定出的第一產品和第二產品標稱類屬性的值的相似度值,計算第一產品和第二產品的產品相似度值;鏈結表確定單元,用於根據第三相似度確定單元確定出的第一產品和每個第二產品的產品相似度值,將與第一產品相似度值排名較前的至少一個第二產品作為該第一產品的候選產品鏈結表。
  11. 如申請專利範圍第10項所述的裝置,其中,還 包括:儲存單元,用於儲存第一產品的標識以及鏈結表確定單元確定出的候選產品鏈結表的對應關係;接收單元,用於接收候選產品查詢請求;選擇單元,用於在接收單元接收到候選產品查詢請求後,從儲存單元儲存的產品的標識以及候選產品鏈結表的對應關係中,選擇出候選產品查詢請求中包含的產品的標識對應的候選產品鏈結表。
  12. 如申請專利範圍第10項所述的裝置,其中,該第二相似度確定單元還用於當第一產品該標稱類屬性的值和第二產品該標稱類屬性的值相同時,確定該第一產品該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值為設定的最高值。
  13. 一種提供候選產品鏈結表的系統,其特徵在於,包括:網頁伺服器,用於向確定候選產品鏈結表的裝置發送候選產品查詢請求,該請求中包含指定產品的標識;交易記錄資料庫,用於儲存用戶購買記錄集合;產品屬性資料庫,用於儲存每個產品各屬性的值;確定候選產品鏈結表的裝置,用於根據交易記錄資料庫中儲存的用戶購買記錄集合和產品屬性資料庫中儲存的每個產品各屬性的值,確定每個產品對應的候選產品鏈結表,計算第一產品和第二產品在每個標稱類屬性上值的相似度值時,執行:當第一產品該標稱類屬性的值和第二產 品該標稱類屬性的值不同時,根據購買記錄集合中購買該第一產品該標稱類屬性的值對應的產品的用戶購買該第二產品該標稱類屬性的值對應的產品的傾向性,確定該第一產品該標稱類屬性的值和第二產品該標稱類屬性的值的相似度值;並儲存每個產品的標識以及該產品的候選產品鏈結表的對應關係;接收到網頁伺服器發來的候選產品查詢請求後,從儲存的產品的標識以及候選產品鏈結表的對應關係中選擇出該產品查詢請求中包含的該指定產品的標識對應的候選產品鏈結表,並將選擇出的候選產品鏈結表提供給網頁伺服器。
TW100104748A 2010-10-22 2011-02-14 Method and related device for determining the list of candidate products TWI517065B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010527002.8A CN102456203B (zh) 2010-10-22 2010-10-22 确定候选产品链表的方法及相关装置

Publications (2)

Publication Number Publication Date
TW201218105A TW201218105A (en) 2012-05-01
TWI517065B true TWI517065B (zh) 2016-01-11

Family

ID=45975589

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100104748A TWI517065B (zh) 2010-10-22 2011-02-14 Method and related device for determining the list of candidate products

Country Status (7)

Country Link
US (1) US20130198022A1 (zh)
EP (1) EP2630625A4 (zh)
JP (1) JP5897019B2 (zh)
CN (1) CN102456203B (zh)
HK (1) HK1166412A1 (zh)
TW (1) TWI517065B (zh)
WO (1) WO2012054488A1 (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103679489A (zh) * 2012-09-10 2014-03-26 腾讯科技(深圳)有限公司 一种物品关联推荐的方法及系统
CN103106600A (zh) * 2012-11-15 2013-05-15 深圳中兴网信科技有限公司 商品信息推送系统和商品信息推送方法
US9117239B2 (en) 2013-03-13 2015-08-25 Reno Acquisitions, Llc Method and system for generating a data grid interface to monitor and recommend relevant products
US20140279189A1 (en) * 2013-03-13 2014-09-18 Dynamite Data, Llc Method and system for monitoring and recommending relevant products
US20140358730A1 (en) * 2013-05-30 2014-12-04 Wal-Mart Stores, Inc. Systems And Methods For Optimally Ordering Recommendations
JP6060833B2 (ja) * 2013-06-28 2017-01-18 株式会社Jvcケンウッド 情報処理装置、情報処理方法、及び情報処理プログラム
KR102215436B1 (ko) * 2014-02-26 2021-02-16 십일번가 주식회사 쇼핑몰의 동일 상품 판별 장치 및 방법
JP6112077B2 (ja) * 2014-07-03 2017-04-12 トヨタ自動車株式会社 半導体装置
CN105808611B (zh) * 2014-12-31 2019-12-06 华为技术有限公司 数据挖掘方法和装置
CN104715285B (zh) * 2015-03-31 2018-06-22 北京嘀嘀无限科技发展有限公司 处理订单的方法和设备
MY181464A (en) 2015-02-02 2020-12-22 Beijing Didi Infinity Technology & Dev Co Ltd Methods and systems for order processing
EP3278536B1 (en) 2015-03-31 2023-11-15 British Telecommunications public limited company Network control with central analysis of network-data
EP3109771A1 (en) * 2015-06-22 2016-12-28 Deutsche Telekom AG Method, distributed system and device for efficiently quantifying a similarity of large data sets
GB2541034A (en) 2015-07-31 2017-02-08 British Telecomm Network operation
CN105205107A (zh) * 2015-08-27 2015-12-30 湖南人文科技学院 一种物联网数据相似度处理方法
US10832304B2 (en) 2016-01-15 2020-11-10 Target Brands, Inc. Resorting product suggestions for a user interface
CN107016473B (zh) * 2016-01-27 2022-11-22 创新先进技术有限公司 一种风险控制方法和设备
CN107515880B (zh) * 2016-06-17 2020-12-22 宏碁股份有限公司 数据分散处理系统与方法
CN108121737B (zh) * 2016-11-29 2022-04-26 阿里巴巴集团控股有限公司 一种业务对象属性标识的生成方法、装置和系统
CN107391531B (zh) * 2017-04-11 2020-09-22 阿里巴巴集团控股有限公司 一种菜品推荐方法和装置
US11416877B2 (en) 2017-09-26 2022-08-16 International Business Machines Corporation Extracting product drag effect from transaction records
JP6508316B2 (ja) * 2017-12-22 2019-05-08 カシオ計算機株式会社 情報表示装置及びプログラム
CN110348921B (zh) * 2018-04-02 2023-06-02 北京京东尚科信息技术有限公司 门店物品选取的方法和装置
EP3598373A1 (en) * 2018-07-18 2020-01-22 Seulo Palvelut Oy Determining product relevancy
CN110033351B (zh) * 2019-04-15 2021-09-10 秒针信息技术有限公司 一种相似度的确定方法及装置
CN112632145A (zh) * 2019-09-24 2021-04-09 北京国双科技有限公司 新油气藏的评估方法、装置、存储介质及设备
CN111198988B (zh) * 2019-12-25 2023-05-02 中国平安财产保险股份有限公司 业务推荐方法、训练方法、装置、计算机设备和存储介质
CN112634009B (zh) * 2020-12-14 2024-05-14 中国建设银行股份有限公司 一种产品的推送方法、装置、存储介质及电子设备
CN114881723A (zh) * 2022-04-19 2022-08-09 上海浦东发展银行股份有限公司 金融产品推荐方法、装置及计算机设备

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6317722B1 (en) * 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
US6266649B1 (en) * 1998-09-18 2001-07-24 Amazon.Com, Inc. Collaborative recommendations using item-to-item similarity mappings
US6356879B2 (en) * 1998-10-09 2002-03-12 International Business Machines Corporation Content based method for product-peer filtering
US7366721B1 (en) * 2000-08-29 2008-04-29 Intel Corporation Method and apparatus for displaying a plurality of related products to a user based upon the selection of a main product by the user
US6728706B2 (en) * 2001-03-23 2004-04-27 International Business Machines Corporation Searching products catalogs
JP2002312397A (ja) * 2001-04-09 2002-10-25 Nippon Telegr & Teleph Corp <Ntt> 相関アイテム検出方法および装置、お薦めアイテム紹介方法および装置、相関アイテム検出プログラム、お薦めアイテム紹介プログラム、同プログラムを記録した記録媒体
US7707221B1 (en) * 2002-04-03 2010-04-27 Yahoo! Inc. Associating and linking compact disc metadata
US8019656B2 (en) * 2003-05-07 2011-09-13 Cbs Interactive Inc. System and method for generating an alternative product recommendation
US20060036510A1 (en) * 2003-06-02 2006-02-16 W.W. Grainger, Inc. System and method for directing a customer to additional purchasing opportunities
US7286939B2 (en) * 2003-10-28 2007-10-23 Westerngeco, L.L.C. Method for estimating porosity and saturation in a subsurface reservoir
JP4543930B2 (ja) * 2005-01-07 2010-09-15 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4770445B2 (ja) * 2005-12-20 2011-09-14 大日本印刷株式会社 情報推薦装置
US20080120167A1 (en) * 2006-11-17 2008-05-22 Ac Technologies S.A. Personal Inventory and Marketing Electronic System and Method
WO2008121737A1 (en) * 2007-03-30 2008-10-09 Amazon Technologies, Inc. Service for providing item recommendations
US8073854B2 (en) * 2007-04-10 2011-12-06 The Echo Nest Corporation Determining the similarity of music using cultural and acoustic information
US7974933B2 (en) * 2007-09-11 2011-07-05 Bae Systems Plc Estimating the efficacy of a mathematical model of system behaviour
US20090070325A1 (en) * 2007-09-12 2009-03-12 Raefer Christopher Gabriel Identifying Information Related to a Particular Entity from Electronic Sources
US20090077081A1 (en) * 2007-09-19 2009-03-19 Joydeep Sen Sarma Attribute-Based Item Similarity Using Collaborative Filtering Techniques
US8001003B1 (en) * 2007-09-28 2011-08-16 Amazon Technologies, Inc. Methods and systems for searching for and identifying data repository deficits
US7921071B2 (en) * 2007-11-16 2011-04-05 Amazon Technologies, Inc. Processes for improving the utility of personalized recommendations generated by a recommendation engine
CN101206674A (zh) * 2007-12-25 2008-06-25 北京科文书业信息技术有限公司 以商品为媒介的增强型相关搜索系统及其方法
JP5079578B2 (ja) * 2008-04-10 2012-11-21 日本電信電話株式会社 履歴処理装置、履歴処理方法および履歴処理プログラム
US8306872B2 (en) * 2008-08-08 2012-11-06 Nikon Corporation Search supporting system, search supporting method and search supporting program
US8615516B2 (en) * 2008-12-22 2013-12-24 International Business Machines Corporation Grouping similar values for a specific attribute type of an entity to determine relevance and best values
US8694514B2 (en) * 2009-10-12 2014-04-08 Oracle International Corporation Collaborative filtering engine
WO2012016052A1 (en) * 2010-07-28 2012-02-02 True Fit Corporation Fit recommendation via collaborative inference

Also Published As

Publication number Publication date
JP2013544000A (ja) 2013-12-09
TW201218105A (en) 2012-05-01
HK1166412A1 (zh) 2012-10-26
WO2012054488A1 (en) 2012-04-26
US20130198022A1 (en) 2013-08-01
CN102456203B (zh) 2015-10-14
EP2630625A4 (en) 2016-05-04
JP5897019B2 (ja) 2016-03-30
EP2630625A1 (en) 2013-08-28
CN102456203A (zh) 2012-05-16

Similar Documents

Publication Publication Date Title
TWI517065B (zh) Method and related device for determining the list of candidate products
CN107424043B (zh) 一种产品推荐方法及装置,电子设备
WO2019233258A1 (zh) 信息发送方法、装置、系统和计算机可读存储介质
JP6356744B2 (ja) ウェブサイト横断情報を表示する方法およびシステム
WO2020147720A1 (zh) 信息推荐方法和装置以及存储介质
US8019650B2 (en) Method and system for producing item comparisons
US8380694B2 (en) Method and system for aggregating reviews and searching within reviews for a product
WO2020048084A1 (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
US9400831B2 (en) Providing information recommendations based on determined user groups
JP5442799B2 (ja) タグ管理装置、タグ管理方法、タグ管理プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
US20130006713A1 (en) Method for aggregating pricing information and assigning a fair market value to goods sold in a peer-to-peer e-commerce transaction
US20130249934A1 (en) Color-based identification, searching and matching enhancement of supply chain and inventory management systems
US11537601B2 (en) Accessing datasets
KR102142126B1 (ko) 계층적 카테고리 군집 기반 장바구니 상품 추천 방법
CN113032668A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN111310032A (zh) 资源推荐方法、装置、计算机设备及可读存储介质
US20200250455A1 (en) Physical item optimization using velocity factors
CN105389714B (zh) 一种从行为数据识别用户特性的方法
US20150142782A1 (en) Method for associating metadata with images
JP6664580B2 (ja) 算出装置、算出方法および算出プログラム
CN112784064A (zh) 一种面向社交网络的层次化超维知识图谱构建方法
JP6007300B1 (ja) 算出装置、算出方法および算出プログラム
Wan et al. A Recommendation Approach Based on Heterogeneous Network and Dynamic Knowledge Graph
TW201207646A (en) Inquiry method, system and device based on vertical search
TWI486799B (zh) A method and a device for determining a weight value of a search word, a search result generating method, and a device

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees