TW201626310A - 用戶興趣資料分析和收集系統及其方法 - Google Patents

用戶興趣資料分析和收集系統及其方法 Download PDF

Info

Publication number
TW201626310A
TW201626310A TW104140938A TW104140938A TW201626310A TW 201626310 A TW201626310 A TW 201626310A TW 104140938 A TW104140938 A TW 104140938A TW 104140938 A TW104140938 A TW 104140938A TW 201626310 A TW201626310 A TW 201626310A
Authority
TW
Taiwan
Prior art keywords
sequence
log
user
weight
session
Prior art date
Application number
TW104140938A
Other languages
English (en)
Inventor
Liang Feng
ya-wei Yin
Original Assignee
China Unionpay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Co Ltd filed Critical China Unionpay Co Ltd
Publication of TW201626310A publication Critical patent/TW201626310A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申請公開了一種用戶興趣資料分析和收集系統,所述系統包括:會話識別模組,用於從web伺服器抽取日誌資料以及與所述日誌資料對應的商品購買歷史記錄,並對所述日誌資料進行處理,從而生成頁面流覽序列參照集合;推薦服務控制器,用於即時收集用戶的流覽記錄;日誌資料預處理模組,用於在滿足預定條件下,從所述推薦服務控制器接收所述用戶在本次會話中的流覽日誌資料,並對該日誌資料進行預處理;以及匹配分析模組,用於將經過預處理的日誌資料與所生成的頁面流覽序列參照集合進行匹配,並根據匹配結果來確定所述用戶潛在感興趣的商品集合。本申請還公開了一種用戶興趣資料分析和收集方法。

Description

用戶興趣資料分析和收集系統及其方法 發明領域
本發明涉及電子資訊技術領域,具體來說,涉及一種用戶興趣資料分析和收集系統以及其方法。
發明背景
隨著互聯網的迅猛發展,中國網路購物的用戶規模不斷上升。2010年中國網路購物市場交易規模接近5000億,達4980.0億元,占到社會消費品零售總額的3.2%;同時,網路購物用戶規模達到1.48億,在線民中的滲透率達30.8%。對於一些傳統企業而言,通過一些傳統的行銷手段已經很難對現今的市場形成什麼重大的改變了。如果想將企業的銷售管道完全打開,企業就必需引進新的思維和新的方法。而網路購物正好為現今的傳統企業提供了一個很好的機會與平臺,傳統企業通過借助第三方平臺和建立自有平臺紛紛試水網路購物,構建合理的網路購物平臺、整合管道、完善產業佈局成為傳統企業未來發展重心和出路。
隨著網路購物平臺的蜂擁崛起,如何基於大資料來分析和收集用戶興趣資料,以便更好地向該用戶提供推薦從而提升用戶體驗成為了研究重點。
在申請號為201310717507.4的中國專利(發明名稱為“一種基於Web日誌資料的資訊個性化推薦方法”)中介紹了一種通過分析日誌的Web推薦技術。在該專利中,通過對伺服器中Web日誌檔的資料進行分析和預處理,提取出乾淨、規則、準確的資料源;使用協同過濾技術建立用戶興趣矩陣,計算各用戶間的相似度,選較大相似度的用戶作為相似用戶;對相似用戶的興趣愛好建立推薦資源池;伺服器選推薦資源池中推薦值大於閾值的頁面推薦給用戶。
但是,在該專利中,度量用戶興趣方法為用戶流覽某一資源類別的時間。而分析獲得的興趣粒度很大程度上取決於資源分類的粗細粒度。如果粒度較粗,較難精確判斷興趣細微傾向。另外,用戶流覽過的頁面通常會涵蓋多個類別主題。多個主題的頁面資料源會導致最後分析結果的不精確。
發明概要
為了解決上述問題,本申請提供了一種基於用戶頁面流覽序列的商品推薦方法。當新的用戶訪問電商網站時,通過將用戶當前會話中的流覽記錄序列拆分為多個流覽子序列,分析和匹配子序列和Web日誌中其他用戶的流覽記錄,找到類似頁面流覽記錄的歷史會話,最後根據類似會話的最終實際購買商品,實施相關的商品推薦。
根據本申請的一個方面,提供了一種用戶興趣資料分 析和收集系統。該系統包括會話識別模組、推薦服務控制器、日誌資料預處理模組以及匹配分析模組。其中,會話識別模組用於線上下從web伺服器抽取日誌資料以及與所述日誌資料對應的商品購買歷史記錄,並對所述日誌資料進行處理,從而生成頁面流覽序列參照集合。推薦服務控制器用於即時收集用戶的流覽記錄。日誌資料預處理模組用於在滿足預定條件下,從所述推薦服務控制器接收所述用戶在本次會話中的流覽日誌資料,並對該日誌資料進行預處理。匹配分析模組用於將經過預處理的日誌資料與所生成的頁面流覽序列參照集合進行匹配,並根據匹配結果來確定所述用戶潛在感興趣的商品集合。
上述系統還可包括:候選結果過濾排序模組,用於從所述匹配分析模組接收所確定的商品集合,並根據預設定的推薦規則,對所述商品集合中的商品進行排序,並將排序的結果發送給所述推薦服務控制器。
在上述系統中,所述推薦服務控制器還配置成根據所述候選結果過濾排序模組所發送的排序結果,選擇出最終的推薦商品併發送給所述用戶。
在上述系統中,所述會話識別模組配置成執行如下步驟:通過核對請求資源URI的尾碼名,剔除請求資源為非頁面的日誌條目;剔除狀態回應碼為錯誤的日誌條目;匯總同一個會話識別字的所有日誌記錄,形成屬於該會話識別字的會話日誌記錄集合;以及判斷會話中是否包含購買頁面和支付頁面,以便篩選出最終完成購物的會話。
在上述系統中,當用戶訪問的頁面數量超過預先設定的數目N時,所述推薦服務控制器從所述web伺服器的日誌中抽取該用戶的當前會話中所有的日誌條目序列,從而啟動推薦服務。
在上述系統中,所述日誌資料預處理模組配置成執行如下步驟:從所述日誌條目序列中剔除非頁面的以及回應碼為錯誤的日誌條目,以便形成精化日誌條目序列Lp;根據所述精化日誌條目序列Lp,產生多個預定長度的連續日誌條目子序列;以及通過如下公式將所述連續日誌條目子序列中的每條子序列轉換為m維的權重向量:
其中,wl,i表示某一子序列l的第i維權重,f(l,i)表示第i維日誌條目的URL出現在子序列l的次數,Count(i)表示第i維URL在所述頁面流覽序列參照集合中出現的次數,t(l,i)表示本次用戶端流覽該頁面的時間長度,λ是Count函數的權重因數。
在上述系統中,所述匹配分析模組通過如下公式計算匹配度:
其中l1和l2表示兩個給定序列,w1i是序列l1中的第i維的權重,w2i是序列l2中的第i維的權重,函數min返回兩個數值 中的較小值。
在上述系統中,所述匹配分析模組進一步配置成:根據經過預處理的日誌資料與所生成的頁面流覽序列參照集合的匹配結果,對於所述頁面流覽序列參照集合中的每個參照流覽序列,選取其與經過預處理的日誌資料中每個子序列的匹配度最大值來作為該參照流覽序列的權重;挑選權重最大的前n個參照流覽序列,從而生成參照序列集合SeC;以及對於所述參照序列集合SeC中每條候選參照流覽序列,找出與序列相關的購買商品集合來作為所述用戶潛在感興趣的商品集合。
在上述系統中,所述候選結果過濾排序模組配置成:根據所述匹配分析模組所確定的商品集合,累加所述商品集合中每個商品對應的候選參照序列的權重來作為該商品的權重,根據所述商品的權重來對所述商品集合中的商品排序,以及將權重較大的一定數量的商品作為最終推薦商品告知所述推薦服務控制器。
根據本申請的另一個方面,提供了一種用戶興趣資料分析和收集方法。該方法包括步驟A:從web伺服器抽取日誌資料以及與所述日誌資料對應的商品購買歷史記錄,並對所述日誌資料進行處理,從而生成頁面流覽序列參照集合;步驟B:即時收集用戶的日誌資料;步驟C:在滿足預定條件下,對該用戶的日誌資料進行預處理;以及步驟D:將經過預處理的日誌資料與所生成的頁面流覽序列參照集合進行匹配,並根據匹配結果來確定所述用戶潛在感興趣 的商品集合。
本申請技術方案的分析資料源為當前會話的頁面流覽記錄,資料依賴性低、方便採集,操作流程直接明瞭。同時,會話頁面流覽記錄隱含用戶潛在的興趣傾向和購物習慣,有助於提升推薦服務的準確性和個性化。
在參照附圖閱讀了本發明的具體實施方式以後,本領域技術人員將會更清楚地瞭解本發明的各個方面。本領域技術人員應當理解的是:這些附圖僅僅用於配合具體實施方式說明本發明的技術方案,而並非意在對本發明的保護範圍構成限制。
圖1是根據本申請的一個實施例、基於頁面流覽序列來對用戶興趣資料進行分析、收集以及商品推薦的流程圖。
較佳實施例之詳細說明
下面介紹的是本發明的多個可能實施例中的一些,旨在提供對本發明的基本瞭解,並不旨在確認本發明的關鍵或決定性的要素或限定所要保護的範圍。容易理解,根據本發明的技術方案,在不變更本發明的實質精神下,本領域的一般技術人員可以提出可相互替換的其他實現方式。因此,以下具體實施方式以及附圖僅是對本發明的技術方案的示例性說明,而不應當視為本發明的全部或者視為對本發明技術方案的限定或限制。
在日誌檔中,每條記錄被稱為日誌項或是條目,表示 用戶端對伺服器的一次資源請求。目前,許多主流的日誌格式(例如公共日誌格式(CLF)和擴展公共日誌格式(ECLF))一般都會包括用戶端請求的IP位址、請求時間、請求資源的路徑名稱、狀態回應碼、用戶作業系統、流覽器類型這幾個重要欄位,以標示用戶端對Web伺服器請求的情況。用戶流覽網站會話是指用戶在連續一段時間內訪問網站歷史記錄集合。通常來說,在一個用戶會話,代表了一次用戶的完整流覽記錄。
整個回饋互動式的用戶興趣資料分析收集方案總體流程由“用戶頁面流覽序列參照資料集生成”和“商品推薦服務實施”兩部分組成,如圖1所示,整個過程如下:1)系統從web伺服器中,抽取部分日誌,以及對應的商品購買歷史記錄(見方框a1);2)對日誌資料做預處理,識別會話,篩選出用戶最後形成購買的會話記錄,生成頁面流覽序列參照集合(見方框a2);3)當用戶登錄網站,推薦服務控制器即時收集用戶的流覽記錄(見方框b1),並在符合特定條件情況下,啟動推薦服務,並將用戶本會話中的流覽日誌資料發送至日誌資料預處理模組(見方框b2);4)對用戶的流覽資料做預處理,發送至匹配分析模組(見方框b3);5)匹配分析模組分析和匹配子序列和Web日誌中其他用戶的歷史流覽記錄,找到類似頁面流覽記錄的歷史會 話,生成候選推薦商品集合,發送至“候選結果過濾排序”模組(見方框b4);6)根據預設定的推薦規則,結合相似度,對推薦商品進行排序,並發送至推薦服務控制器(見方框b5),隨後發送給用戶(見方框b6)。
其中第1、2步負責生成用戶頁面流覽序列參照資料集,後續步驟負責實施推薦服務。以下內容將詳細介紹本方案工作步驟:
1、生成用戶頁面流覽序列的參照資料集
在進行Web伺服器日誌分析前,需要抽取出對分析有價值的日誌條目,並匯總形成會話。為了識別用戶會話,網站的伺服器使用並保存會話ID(Session ID),伺服器日誌中日誌條目保留Session ID欄位,以保存該次請求的Session ID值。一般來說,Session ID是一種唯一標識當前訪問伺服器的客戶的唯讀值。
具體的步驟如下:1)通過核對請求資源URI的尾碼名,剔除請求資源為圖片、視頻、腳本等非頁面的日誌條目;2)剔除狀態回應碼為錯誤(例如400、404、505)的日誌條目;3)通過核實日誌條目中Session ID方式,判斷為同一個會話的請求操作。Session ID相同並且服務請求時間差小於伺服器設置值的日誌條目,判斷屬於同一個會話;4)匯總同一個SessionID的所有日誌記錄,形成屬於該 SessionID的會話日誌記錄集合;5)如果用戶端的流覽器不支援cookie存儲,會採用URL複寫的方式保存SessionID。這時,需要在日誌條目中URL項中,刪除URL中SessionID參數;6)判斷會話中是否包含購買頁面和支付頁面,篩選出最終完成購物的會話,作為協同過濾的參照記錄。
在一個實施例中,一條參照的用戶會話日誌記錄包括:用戶在會話中流覽頁面序列L,以及最終購買的商品列表P。
2、商品推薦服務實施
線上下完成參照用戶頁面流覽序列資料集生成後,線上上,推薦系統即時跟蹤用戶在電商網站的訪問記錄,根據這些記錄實施推薦服務。具體的步驟如下:
1)推薦系統通過訪問電商網站的web伺服器日誌(或是其他方法),跟蹤用戶在當前會話中訪問頁面記錄。當訪問的頁面數量超過固定數目N時(N為預先設定的),推薦服務控制器從web伺服器日誌中抽取該用戶的當前會話中所有的日誌條目序列Lr,啟動推薦服務。
2)採用於第一章相類似的方法,從用戶當前會話日誌條目序列Lr中,剔除非頁面的、以及回應碼為錯誤的日誌條目。如果URL中包含SessionID項,並修剪URL中SessionID項。最後,形成屬於本次會話的精化日誌條目序列Lp。
3)根據精化日誌條目序列Lp,產生多個長度為w的連續日誌條目子序列l1,l2…ln。n為子序列的個數,子序列的集 合表示為Sub(Lp)。例如,日誌條目序列Lp={a1,a2,a3,a4,a5},生成的長度為3的連續日誌條目子序列有l1={a1,a2,a3}、l2={a2,a3,a4}和l3={a3,a4,a5}。w的數值為預先設定。如果Lp的長度小於等於w,則Sub(Lp)={Lp}。
4)將每條子序列l={a1,a2,…,an}表示為m維的權重向量w(l)={w1,w2,…,wm}。其中wi為對應日誌條目在第i維的權重,m是參照集中所有日誌條目中出現的URL的總數。wi的計算方式如下:
其中,f(l,i)表示第i維日誌條目的URL出現在子序列l的次數。如果l中不存在第i維URL,f(l,i)等於0。Count(i)表示第i維URL在參照集中出現的次數。t(l,i)表示本次用戶端流覽該頁面的時間長度,通過該日誌條目與下一條日誌條目的時間差計算而得,單位為秒。參數λ是Count函數權重因數,λ數值越大,Count函數的影響越小,反之亦然。
5)逐一計算Sub(Lp)中子序列與參照集中各個會話流覽頁面序列的相似度,給定序列l1和l2,兩者之間相似度計算公式Sim(l1,l2)計算方式如下:
其中,w1i是序列l1中的第i維的權重。函數min返回兩個數值中的較小值。
6)根據Sub(Lp)中子序列與參照資料中各個流覽序列的相似度的結果。對於每個參照流覽序列來說,選取參照序列與Sub(Lp)中子序列的相似度最大的值,作為該參照序列的權重w_l。挑選出權重最大的前n個參照序列,生成參照序列集合SeC={l1,l2…ln}。
7)對於集合SeC中每條候選參照流覽頁面序列,找出與序列相關的購買商品集合作為候選推薦商品。對於每個候選推薦商品,累加商品對應的候選參照序列的權重w_l,作為候選推薦商品的權重w_p。
8)挑選出權重w_p最大的前m個候選推薦商品作為最終推薦商品,推薦控制伺服器將推薦商品傳送給用戶。
綜上,本申請的技術方案具有以下優點:首先,本方案過比較會話頁面流覽記錄,找到相關購買商品。方法流程直接明瞭,避免了內容分析不完全或不精確問題。其次,相比其他通過商品購買,商品打分等資料分析的推薦方法,本方案分析的資料源為用戶當前會話的頁面流覽記錄,資料依賴性低、方便採集、服務物件門檻低。最後,會話頁面流覽記錄隱含用戶潛在的興趣傾向和購物習慣,有助於提升推薦服務的準確性和個性化。
上文中,參照附圖描述了本發明的具體實施方式。但是,本領域中的普通技術人員能夠理解,在不偏離本發明的精神和範圍的情況下,還可以對本發明的具體實施方式作各種變更和替換。這些變更和替換都落在本發明申請專利範圍所限定的範圍內。

Claims (18)

  1. 一種用戶興趣資料分析和收集系統,其特徵在於,所述系統包括:會話識別模組,用於從web伺服器抽取日誌資料以及與所述日誌資料對應的商品購買歷史記錄,並對所述日誌資料進行處理,從而生成頁面流覽序列參照集合;推薦服務控制器,用於即時收集用戶的流覽記錄;日誌資料預處理模組,用於在滿足預定條件下,從所述推薦服務控制器接收所述用戶在本次會話中的流覽日誌資料,並對該日誌資料進行預處理;以及匹配分析模組,用於將經過預處理的日誌資料與所生成的頁面流覽序列參照集合進行匹配,並根據匹配結果來確定所述用戶潛在感興趣的商品集合。
  2. 如請求項1所述的系統,還包括:候選結果過濾排序模組,用於從所述匹配分析模組接收所確定的商品集合,並根據預設定的推薦規則,對所述商品集合中的商品進行排序,並將排序的結果發送給所述推薦服務控制器。
  3. 如請求項2所述的系統,其中,所述推薦服務控制器還配置成根據所述候選結果過濾排序模組所發送的排序結果,選擇出最終的推薦商品併發送給所述用戶。
  4. 如請求項1所述的系統,其中,所述會話識別模組配置成執行如下步驟: 通過核對請求資源URI的尾碼名,剔除請求資源為非頁面的日誌條目;剔除狀態回應碼為錯誤的日誌條目;匯總同一個會話識別字的所有日誌記錄,形成屬於該會話識別字的會話日誌記錄集合;以及判斷會話中是否包含購買頁面和支付頁面,以便篩選出最終完成購物的會話。
  5. 如請求項1所述的系統,其中,當用戶訪問的頁面數量超過預先設定的數目N時,所述推薦服務控制器從所述web伺服器的日誌中抽取該用戶的當前會話中所有的日誌條目序列,從而啟動推薦服務。
  6. 如請求項5所述的系統,其中,所述日誌資料預處理模組配置成執行如下步驟:從所述日誌條目序列中剔除非頁面的以及回應碼為錯誤的日誌條目,以便形成精化日誌條目序列Lp;根據所述精化日誌條目序列Lp,產生多個預定長度的連續日誌條目子序列;以及通過如下公式將所述連續日誌條目子序列中的每條子序列轉換為m維的權重向量: 其中,wl,i表示某一子序列l的第i維權重,f(l,i)表示第i維日誌條目的URL出現在子序列l的次數,Count(i)表示第i維URL在所述頁面流覽序列參照集合中出現的次 數,t(l,i)表示本次用戶端流覽該頁面的時間長度,λ是Count函數的權重因數。
  7. 如請求項1或6所述的系統,其中,所述匹配分析模組通過如下公式計算匹配度: 其中l1和l2表示兩個給定序列,w1i是序列l1中的第i維的權重,w2i是序列l2中的第i維的權重,函數min返回兩個數值中的較小值。
  8. 如請求項1所述的系統,其中,所述匹配分析模組進一步配置成:根據經過預處理的日誌資料與所生成的頁面流覽序列參照集合的匹配結果,對於所述頁面流覽序列參照集合中的每個參照流覽序列,選取其與經過預處理的日誌資料中每個子序列的匹配度最大值來作為該參照流覽序列的權重;挑選權重最大的前n個參照流覽序列,從而生成參照序列集合SeC;以及對於所述參照序列集合SeC中每條候選參照流覽序列,找出與序列相關的購買商品集合來作為所述用戶潛在感興趣的商品集合。
  9. 如請求項2所述的系統,其中,所述候選結果過濾排序模組配置成: 根據所述匹配分析模組所確定的商品集合,累加所述商品集合中每個商品對應的候選參照序列的權重來作為該商品的權重,根據所述商品的權重來對所述商品集合中的商品排序,以及將權重較大的一定數量的商品作為最終推薦商品告知所述推薦服務控制器。
  10. 一種用戶興趣資料分析和收集方法,其特徵在於,所述方法包括:步驟A:從web伺服器抽取日誌資料以及與所述日誌資料對應的商品購買歷史記錄,並對所述日誌資料進行處理,從而生成頁面流覽序列參照集合;步驟B:即時收集用戶的日誌資料;步驟C:在滿足預定條件下,對該用戶的日誌資料進行預處理;以及步驟D:將經過預處理的日誌資料與所生成的頁面流覽序列參照集合進行匹配,並根據匹配結果來確定所述用戶潛在感興趣的商品集合。
  11. 如請求項10所述的方法,還包括:步驟E:根據預設定的推薦規則,對所述商品集合中的商品進行排序。
  12. 如請求項11所述的方法,還包括:步驟F:根據所述排序結果,選擇出最終的推薦商品併發送給所述用戶。
  13. 如請求項10所述的方法,其中,步驟A進一步包括:通過核對請求資源URI的尾碼名,剔除請求資源為非頁面的日誌條目;剔除狀態回應碼為錯誤的日誌條目;匯總同一個會話識別字的所有日誌記錄,形成屬於該會話識別字的會話日誌記錄集合;以及判斷會話中是否包含購買頁面和支付頁面,以便篩選出最終完成購物的會話。
  14. 如請求項10所述的方法,其中,步驟C進一步包括:當用戶訪問的頁面數量超過預先設定的數目N時,從所述web伺服器的日誌中抽取該用戶的當前會話中所有的日誌條目序列,從而啟動推薦服務。
  15. 如請求項14所述的方法,其中,步驟C進一步包括:從所述日誌條目序列中剔除非頁面的以及回應碼為錯誤的日誌條目,以便形成精化日誌條目序列Lp;根據所述精化日誌條目序列Lp,產生多個預定長度的連續日誌條目子序列;以及通過如下公式將所述連續日誌條目子序列中的每條子序列轉換為m維的權重向量: 其中,wl,i表示某一子序列l的第i維權重,f(l,i)表示第i維日誌條目的URL出現在子序列1的次數,Count(i)表示第i維URL在所述頁面流覽序列參照集合中出現的 次數,t(l,i)表示本次用戶端流覽該頁面的時間長度,λ是Count函數的權重因數。
  16. 如請求項10或15所述的方法,其中,步驟D通過如下公式計算匹配度: 其中l1和l2表示兩個給定序列,w1i是序列l1中的第i維的權重,w2i是序列l2中的第i維的權重,函數min返回兩個數值中的較小值。
  17. 如請求項10所述的方法,其中,步驟D進一步包括:根據經過預處理的日誌資料與所生成的頁面流覽序列參照集合的匹配結果,對於所述頁面流覽序列參照集合中的每個參照流覽序列,選取其與經過預處理的日誌資料中每個子序列的匹配度最大值來作為該參照流覽序列的權重;挑選權重最大的前n個參照流覽序列,從而生成參照序列集合SeC;以及對於所述參照序列集合SeC中每條候選參照流覽序列,找出與序列相關的購買商品集合來作為所述用戶潛在感興趣的商品集合。
  18. 如請求項11所述的方法,其中,步驟E進一步包括:根據所述匹配分析模組所確定的商品集合,累加所述商品集合中每個商品對應的候選參照序列的權重來 作為該商品的權重,根據所述商品的權重來對所述商品集合中的商品排序,以及將權重較大的一定數量的商品作為最終推薦商品告知所述推薦服務控制器。
TW104140938A 2014-12-26 2015-12-07 用戶興趣資料分析和收集系統及其方法 TW201626310A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410823475.0A CN105589905B (zh) 2014-12-26 2014-12-26 用户兴趣数据分析和收集系统及其方法

Publications (1)

Publication Number Publication Date
TW201626310A true TW201626310A (zh) 2016-07-16

Family

ID=55929487

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104140938A TW201626310A (zh) 2014-12-26 2015-12-07 用戶興趣資料分析和收集系統及其方法

Country Status (5)

Country Link
US (1) US10762549B2 (zh)
EP (1) EP3239855A4 (zh)
CN (1) CN105589905B (zh)
TW (1) TW201626310A (zh)
WO (1) WO2016101777A1 (zh)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545450A (zh) * 2016-06-27 2018-01-05 百度在线网络技术(北京)有限公司 一种交易信息推送方法和装置
CN106447464A (zh) * 2016-10-22 2017-02-22 肇庆市联高电子商务有限公司 电子商务数据处理系统
CN108665333B (zh) * 2017-03-31 2021-04-30 北京京东尚科信息技术有限公司 商品推荐方法、装置、电子设备和存储介质
CN108874813B (zh) * 2017-05-10 2022-07-29 腾讯科技(北京)有限公司 一种信息处理方法、装置及存储介质
CN107682385A (zh) * 2017-05-10 2018-02-09 平安科技(深圳)有限公司 基于线上线下一体化服务的方法及设备、存储介质
CN108932640B (zh) * 2017-05-18 2022-03-04 北京京东尚科信息技术有限公司 用于处理订单的方法和装置
TWI635451B (zh) * 2017-07-06 2018-09-11 雲義科技股份有限公司 運用虛擬商品於推薦系統影響相似度分析方法及其系統
CN107317873B (zh) * 2017-07-21 2020-08-11 曙光信息产业(北京)有限公司 一种会话处理方法和装置
CN109767278B (zh) * 2017-11-09 2021-03-30 北京京东尚科信息技术有限公司 用于输出信息的方法和装置
CN108647284B (zh) * 2018-05-03 2021-07-23 网易宝有限公司 记录用户行为的方法及装置、介质和计算设备
CN110544140B (zh) * 2018-05-29 2024-08-20 北京京东尚科信息技术有限公司 一种处理浏览数据的方法和装置
CN108763502B (zh) * 2018-05-30 2022-03-25 腾讯科技(深圳)有限公司 信息推荐方法和系统
CN108876526B (zh) * 2018-06-06 2021-11-02 北京京东尚科信息技术有限公司 商品推荐方法、装置和计算机可读存储介质
CN110827044A (zh) * 2018-08-07 2020-02-21 北京京东尚科信息技术有限公司 提取用户兴趣模式的方法和装置
CN109271588A (zh) * 2018-09-06 2019-01-25 北京摩迅筑路机械有限公司 数据处理方法和装置
CN109102342A (zh) * 2018-09-17 2018-12-28 广东成高成数据集成有限公司 基于区块链及人工智能的数据集成即应用系统、服务方法
CN109359263B (zh) * 2018-10-16 2020-09-29 杭州安恒信息技术股份有限公司 一种用户行为特征提取方法及系统
CN109685128A (zh) * 2018-12-18 2019-04-26 电子科技大学 一种MB-kmeans++聚类方法及基于其的用户会话聚类方法
CN109859004A (zh) * 2019-01-10 2019-06-07 珠海金山网络游戏科技有限公司 一种基于历史数据的商品推荐方法及系统
CN109886772A (zh) * 2019-01-16 2019-06-14 深圳壹账通智能科技有限公司 产品推荐方法、装置、计算机设备和存储介质
CN110032546A (zh) * 2019-04-18 2019-07-19 厦门大学嘉庚学院 一种快速满足临时性日志分析系统及其方法
CN110516184B (zh) * 2019-05-27 2023-03-24 广州起妙科技有限公司 一种统计uv数量的模拟运算方法
CN110414824B (zh) * 2019-07-23 2023-04-07 复旦大学 一种基于社群系统的服务管理系统
CN111767457B (zh) * 2019-08-29 2024-04-09 北京沃东天骏信息技术有限公司 推荐方法及装置
CN112486935B (zh) * 2019-09-12 2024-01-30 阿里巴巴集团控股有限公司 日志记录处理方法、装置、设备及机器可读存储介质
CN111078994B (zh) * 2019-11-06 2023-04-18 珠海健康云科技有限公司 基于画像的医学科普文章推荐方法及系统
CN110852852A (zh) * 2019-11-15 2020-02-28 成都航天科工大数据研究院有限公司 一种工业互联网产品推荐系统及方法
CN111080448B (zh) * 2019-12-02 2024-03-26 深圳索信达数据技术有限公司 一种基于会话的意图分析方法
CN110929160B (zh) * 2019-12-02 2024-05-10 上海麦克风文化传媒有限公司 一种系统排序结果的优化方法
CN112232915B (zh) * 2019-12-23 2024-07-23 北京来也网络科技有限公司 结合rpa与ai的商品推荐方法和装置
CN111080325A (zh) * 2019-12-31 2020-04-28 科技谷(厦门)信息技术有限公司 一种民航客户关系关系分析系统及方法
CN111221953B (zh) * 2020-01-08 2024-03-08 南京新贝金服科技有限公司 一种在线售前客服效果评价方法
CN111639989B (zh) * 2020-04-28 2024-02-02 上海秒针网络科技有限公司 商品推荐方法和可读存储介质
CN111582985A (zh) * 2020-05-09 2020-08-25 北京首汽智行科技有限公司 一种基于用户推荐的共享出行服务网点确定方法和装置
CN111597451B (zh) * 2020-05-21 2024-03-08 北京明略昭辉科技有限公司 一种目标用户的确定方法、确定装置及可读存储介质
CN113724026B (zh) * 2020-05-25 2024-06-18 北京沃东天骏信息技术有限公司 一种订单来源的分析方法和装置
CN111815351B (zh) * 2020-05-29 2024-06-21 杭州览众数据科技有限公司 一种基于协同过滤与关联规则的服装推荐方法
CN111767201B (zh) * 2020-06-29 2023-08-29 百度在线网络技术(北京)有限公司 用户行为分析方法、终端设备、服务器及存储介质
WO2022021395A1 (zh) * 2020-07-31 2022-02-03 深圳齐心集团股份有限公司 一种电子商务商品推荐系统
CN112115169B (zh) * 2020-09-17 2023-09-08 北京奇艺世纪科技有限公司 用户画像生成、对象分发、内容推荐方法、装置及介质
CN112036988B (zh) * 2020-09-24 2023-04-07 上海风秩科技有限公司 标签生成方法和装置、存储介质及电子设备
CN112256958A (zh) * 2020-09-27 2021-01-22 中智关爱通(上海)科技股份有限公司 一种商品推荐方法
CN112435134A (zh) * 2020-11-23 2021-03-02 泰康保险集团股份有限公司 信息列表生成方法及装置、可读存储介质以及电子设备
CN112818217B (zh) * 2021-01-13 2022-03-01 安徽省信盾科技有限公司 一种基于区块链分片的Web服务推荐方法及系统
CN113761308A (zh) * 2021-01-28 2021-12-07 北京沃东天骏信息技术有限公司 物品标识的特征提取方法、装置、设备及存储介质
CN113761002A (zh) * 2021-03-25 2021-12-07 北京沃东天骏信息技术有限公司 信息推送方法、装置、设备和计算机可读存储介质
CN113382309A (zh) * 2021-06-02 2021-09-10 南拳互娱(武汉)文化传媒有限公司 游戏达人直播的导流算法与推荐采购平台
CN113538110B (zh) * 2021-08-13 2023-08-11 苏州工业职业技术学院 一种基于浏览序列的相似物品推荐方法
CN113643033B (zh) * 2021-09-02 2022-04-19 厦门蝉羽网络科技有限公司 一种用于大数据风控分析的信息处理方法及服务器
CN113590974B (zh) * 2021-09-29 2022-01-28 北京每日优鲜电子商务有限公司 推荐页面配置方法、装置、电子设备和计算机可读介质
CN114374595B (zh) * 2022-01-13 2024-03-15 平安普惠企业管理有限公司 事件节点归因分析方法、装置、电子设备及存储介质
TWI827029B (zh) * 2022-04-29 2023-12-21 台灣伽瑪移動數位股份有限公司 用於推薦商品之方法及其相關電子裝置
CN114971805A (zh) * 2022-06-07 2022-08-30 武汉洋洪电子商务有限公司 一种基于深度学习的电子商务平台商品智能分析推荐系统
CN115022098B (zh) * 2022-08-09 2022-11-18 北京瑞莱智慧科技有限公司 人工智能安全靶场内容推荐方法、装置及存储介质
CN115345656A (zh) * 2022-08-10 2022-11-15 江西省众灿互动科技股份有限公司 一种用于精细化营销的行为数据分析方法
CN115935068B (zh) * 2022-12-12 2023-09-05 杭州洋驼网络科技有限公司 互联网平台的商品推荐方法以及装置
CN116089733B (zh) * 2023-04-12 2023-06-16 悦享星光(北京)科技有限公司 一种基于大数据的数据分析方法
CN116644945B (zh) * 2023-07-27 2023-10-13 济南六度网络技术有限公司 一种基于数据匹配分析的装修派单管理系统
CN116894713A (zh) * 2023-09-07 2023-10-17 酒仙网络科技股份有限公司 一种基于电商平台的酒类销售管理系统
CN117194804B (zh) * 2023-11-08 2024-01-26 上海银行股份有限公司 一种适用于经营管理系统的引导性推荐方法及系统
CN117235396B (zh) * 2023-11-13 2024-03-22 广州品唯软件有限公司 一种精选楼层入参的校验方法、装置、设备及存储介质
CN117708863B (zh) * 2024-02-05 2024-04-19 四川集鲜数智供应链科技有限公司 一种基于物联网的设备数据加密处理方法
CN118096312B (zh) * 2024-03-05 2024-07-23 太一云境技术有限公司 一种基于序列帧的产品展示方法及系统
CN118485501B (zh) * 2024-07-16 2024-10-01 成都市思博睿科技有限公司 应用于数字化零售平台的数据分析方法及系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040070606A1 (en) 2002-09-27 2004-04-15 Dan Yang Method, system and computer product for performing e-channel analytics
US8370203B2 (en) * 2002-10-07 2013-02-05 Amazon Technologies, Inc. User interface and methods for recommending items to users
WO2006061797A2 (en) 2004-12-10 2006-06-15 Koninklijke Philips Electronics N.V. Dynamic internet shopping method and system
CN101071424B (zh) * 2006-06-23 2010-08-25 腾讯科技(深圳)有限公司 一种个性化信息推送系统和方法
US20080103907A1 (en) * 2006-10-25 2008-05-01 Pudding Ltd. Apparatus and computer code for providing social-network dependent information retrieval services
CN101324948B (zh) * 2008-07-24 2015-11-25 阿里巴巴集团控股有限公司 一种信息推荐的方法及装置
US20110173098A1 (en) 2010-01-12 2011-07-14 Lee Chun-Yi System, method, computer readable medium and computer program product for managing electronic commerce
TWI490710B (zh) 2010-02-10 2015-07-01 Alibaba Group Holding Ltd 向用戶推薦網路目標資訊的方法及向用戶推薦網路目標資訊的伺服器
TWI433042B (zh) 2010-10-06 2014-04-01 Chunghwa Telecom Co Ltd Multi - product recommendation method and system
US8600968B2 (en) * 2011-04-19 2013-12-03 Microsoft Corporation Predictively suggesting websites
CN103812683B (zh) 2012-11-15 2015-07-15 腾讯科技(深圳)有限公司 一种用户行为数据的处理方法、装置和系统
CN103839169A (zh) * 2012-11-21 2014-06-04 大连灵动科技发展有限公司 一种基于频率矩阵和文本相似度的个性化商品推荐方法
CN103885968B (zh) 2012-12-20 2019-04-12 北京百度网讯科技有限公司 一种用于提供推荐信息的方法和装置
CN103294800B (zh) 2013-05-27 2016-12-28 华为技术有限公司 一种信息推送方法及装置
US11061973B2 (en) * 2013-06-14 2021-07-13 Microsoft Technology Licensing, Llc Incorporating user usage of consumable content into recommendations
CN103577544B (zh) * 2013-10-11 2017-07-07 北京百度网讯科技有限公司 一种用于提供待发送信息的方法及装置
US20150169744A1 (en) * 2013-12-12 2015-06-18 Flipboard, Inc. Selecting Diverse, Relevant Content From Multiple Content Feeds
CN103678652B (zh) * 2013-12-23 2017-02-01 山东大学 一种基于Web日志数据的信息个性化推荐方法

Also Published As

Publication number Publication date
US20180005297A1 (en) 2018-01-04
EP3239855A1 (en) 2017-11-01
EP3239855A4 (en) 2018-07-04
US10762549B2 (en) 2020-09-01
CN105589905B (zh) 2019-06-18
WO2016101777A1 (zh) 2016-06-30
CN105589905A (zh) 2016-05-18

Similar Documents

Publication Publication Date Title
WO2016101777A1 (zh) 用户兴趣数据分析和收集系统及其方法
TWI539305B (zh) Personalized information push method and device
Zhao et al. Connecting social media to e-commerce: Cold-start product recommendation using microblogging information
KR102472572B1 (ko) 사용자 의도 프로파일링 방법 및 이를 위한 장치
KR102174717B1 (ko) 사용자 구매 기준 및 상품 리뷰 기반 상품 추천 시스템 및 방법
TWI615724B (zh) 基於電子資訊的關鍵字提取的資訊推送、搜尋方法及裝置
CN103914478B (zh) 网页训练方法及系统、网页预测方法及系统
CN107153656B (zh) 一种信息搜索方法和装置
CN105183727A (zh) 一种图书推荐方法及其系统
KR102252188B1 (ko) 사용자 구매 기준을 반영한 상품 추천 시스템 및 방법
CN108153792B (zh) 一种数据处理方法和相关装置
KR102142126B1 (ko) 계층적 카테고리 군집 기반 장바구니 상품 추천 방법
CN112200601A (zh) 物品推荐方法、装置及可读存储介质
CN111949887A (zh) 物品推荐方法、装置及计算机可读存储介质
CN106372956B (zh) 一种基于用户搜索日志进行意图实体识别的方法和系统
CN107133811A (zh) 一种目标用户的识别方法和装置
CN111523315B (zh) 数据处理方法、文本识别方法、装置及计算机设备
Thorleuchter et al. Companies website optimising concerning consumer's searching for new products
KR101645554B1 (ko) 소비자 프로파일링을 통한 맞춤형 쇼핑정보 제공 시스템 및 방법
CN113220974A (zh) 点击率预测模型训练、搜索召回方法、装置、设备及介质
KR20220102054A (ko) 사용자 분석 데이터를 활용하는 커머스 플랫폼 서버 및 이를 이용한 서비스 제공 방법
Sumathi et al. Fake review detection of e-commerce electronic products using machine learning techniques
Verma et al. Opinion mining considering roman words using Jaccard similarity algorithm based on clustering
US20140324523A1 (en) Missing String Compensation In Capped Customer Linkage Model
CN109242690A (zh) 理财产品推荐方法、装置、计算机设备及可读存储介质