TW202312060A - 以用戶短期特徵預測用戶是否屬於價值用戶群的預測裝置、方法與儲存該方法的儲存媒介 - Google Patents
以用戶短期特徵預測用戶是否屬於價值用戶群的預測裝置、方法與儲存該方法的儲存媒介 Download PDFInfo
- Publication number
- TW202312060A TW202312060A TW110133239A TW110133239A TW202312060A TW 202312060 A TW202312060 A TW 202312060A TW 110133239 A TW110133239 A TW 110133239A TW 110133239 A TW110133239 A TW 110133239A TW 202312060 A TW202312060 A TW 202312060A
- Authority
- TW
- Taiwan
- Prior art keywords
- user
- term
- short
- value
- grouping
- Prior art date
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一種以用戶短期特徵預測用戶是否屬於價值用戶群的預測方法,包括:獲取分群結果,其中所述分群結果表示至少一用戶屬於價值用戶群;獲取所述價值用戶群的多個用戶特徵,以透過所述多個用戶特徵建立所述價值用戶群的第一分群模型,其中所述多個用戶特徵至少一者為用戶長期特徵徵;自第一分群模型中萃取出多個用戶短期特徵,並以所述多個用戶短期特徵建立所述價值用戶群的一第二分群模型;以及使用所述第二分群模型根據另一用戶的多個用戶短期特徵預測所述另一用戶是否屬於所述價值用戶群。
Description
本發明涉及一種用於預測用戶是否屬於某一個價值用戶群的預測裝置、方法與儲存該方法的儲存媒介,且特別是一種以用戶短期特徵預測用戶是否屬於價值用戶群的預測裝置、方法與儲存該方法的儲存媒介。
在傳統的用戶管理系統中,往往要等待到每月/季/半年/年的用戶帳單,才得以了解各個用戶對商品或服務提供者(亦即,提供服務或商品的企業)的價值貢獻程度。然而,現在用戶的行為變化迅速,以往等待到每月/季/半年/年的用戶帳單才判斷用戶屬於哪種價值用戶族群的做法,會讓商品或服務提供者迷失於統計數據,而導致無法即時針對當前用戶環境進行用戶服務優化,並促成用戶增加消費的機會。
舉例來說,依據每季的帳單,用戶可能是屬於購買金額較高的價值用戶群,但如果等到下一季帳單才查看用戶是否仍屬於購買金額較高的價值用戶群,則有可能已經流失該用戶。簡單地說,若能即時地了解用戶的行為,則比較有機會維持高價值用戶,甚至可能將準高價值用戶趁早變成高價值用戶。
為了解決先前技術的問題,本發明提供一種以用戶短期特徵預測用戶是否屬於價值用戶群的預測方法,係執行於一預測裝置,包括:獲取一分群結果,其中所述分群結果表示至少一用戶屬於一價值用戶群;基於一機器學習算法實現一特徵工程,以獲取所述價值用戶群的多個用戶特徵,並透過所述多個用戶特徵建立所述價值用戶群的一第一分群模型,其中所述多個用戶特徵至少一者為一用戶長期特徵,所述用戶長期特徵為在一目標時間到達才能獲得的一特徵;自第一分群模型中萃取出多個用戶短期特徵,並以所述多個用戶短期特徵建立所述價值用戶群的一第二分群模型,其中所述用戶短期特徵為在所述目標時間到達前便能獲得的一特徵;以及使用所述第二分群模型根據另一用戶的多個用戶短期特徵預測所述另一用戶是否屬於所述價值用戶群。
於本發明實施例中,根據多個用戶在所述目標時間到達時得到的多個用戶資料對所述多個用戶分群,以獲取所述分群結果。
於本發明實施例中,所述分群結果是由一RFM模型、或一機器學習算法進行分群。
於本發明實施例中,所述預測方法更包括:根據所述另一用戶被預測是否屬於所述價值用戶群來決定對所述另一用戶的一行銷策略。
於本發明實施例中,挑選所述價值用戶群中多個重要性為前幾名或超過一門限值的多個用戶特徵來做為所述價值用戶群的所述多個用戶特徵。
於本發明實施例中,挑選所述第一分群模型中多個重要性為前幾名或超過一門限值的多個用戶短期特徵來做為所述第二分群模型的所述多個用戶短期特徵。
於本發明實施例中,挑選所述第一分群模型中多個重要性為前幾名或超過一門限值的多個用戶短期特徵,以及自挑選出的所述多個用戶短期特徵延伸出多個用戶短期特徵,將挑選出的所述多個用戶短期特徵以及延伸出的所述多個用戶短期特徵做為所述第二分群模型的所述多個用戶短期特徵。
於本發明實施例中,所述預測方法更包括:監控預測的所述價值用戶群的多個用戶與所述分群結果的所述價值用戶群的所述多個用戶之間的一交集於時間上的變化,以判斷所述多個用戶的一行銷策略是否正確。
於本發明實施例中,所述預測方法更包括:將預測的所述價值用戶群的多個用戶與所述分群結果的所述價值用戶群的所述多個用戶整合做為所述價值用戶群的所述多個用戶。
於本發明實施例中,使用所述第二分群模型根據所述另一用戶的所述多個用戶短期特徵預測所述另一用戶是否屬於所述價值用戶群是透過一特徵比對,且所述特徵比對是透過一類神經網路分類或計算一餘弦相似性來實現。
根據本發明的目的,本發明提供一種非揮發性的儲存媒介,儲存有多個程式碼,所述多個程式碼係被一計算機裝置讀取,以執行上述預測方法的其中一者。
根據本發明的目的,本發明提供一種以用戶短期特徵預測用戶是否屬於價值用戶群的預測裝置,係以一純硬體電路或一計算機裝置搭配一軟體實現,其係組態成多個模組,且多個模組運作以執行上述預測方法的其中一者。
相較於先前技術,本發明可以透過用戶短期特徵,如每日或單次消費行為,對用戶進行用戶價值評分預測(即,預測用戶是否屬於某一個價值用戶群),故可針對到用戶個人,讓用戶對現行服務的反應更加即時全面,無須等到最終消費結果產生才反應。
下面結合附圖對本發明的較佳實施例進行詳細闡述,以使本發明的優點和特徵能更易於被本領域技術人員理解,藉以對本發明的保護範圍做出更為清楚明確的界定。
本發明透過機器學習方法,透過蒐集並分析用戶資料(包括用戶短期資料、用戶長期資料與用戶非時間相關資料),以解析用戶行為(對應於包括用戶長期特徵、用戶短期特徵或與用戶非時間相關特徵的用戶特徵)來建立第一分群模型,並透過建立的第一分群模型基於用戶的用戶資料對用戶分群。接著,透過第一分群模型獲取用戶價值評分與用戶之用戶短期特徵之相關性,此相關性可理解為驗證用戶之用戶短期特徵是否對於用戶價值評分有顯著貢獻,若有顯著貢獻,顯示透過用戶短期特徵重新建立的第二分群模型具有解釋力,並可用於根據用戶的用戶短期特徵(代表著短期的用戶行為)來預測用戶價值(即,預測用戶是否屬於某一個價值用戶群,例如高價值用戶群)。例如,用戶每週會登入網頁次數是否跟用戶終身價值有關,或者,用戶每次登入頁面都會在首頁停留5秒以上是否就會比較願意多花錢購買。透過特徵工程由用戶資料(包含用戶短期資料與用戶長期資料)進行用戶行為解析,以萃取出重要且有意義的用戶特徵(包含用戶短期特徵、用戶長期特徵與用戶非時間相關特徵)。例如,以每日/週/月/季/半年/年來切分用戶資料為用戶短期資料與用戶長期資料,不同的商業情境所在意的時間長短不同,如對電商零售來說,每週可能算長期,每小時才算短期,而對金融業來說,每三年可能算長期,每週才算短期。簡單地說,用戶短期資料與用戶長期資料之有關短期與長期的定義會因為不同商業情境而有不同。另外,用戶非時間相關資料則是指與時間無關的資料,例如用戶的戶籍地地址,以及用戶非時間相關特徵則是指與時間無關的特徵。
於本發明中,先運用用戶資料對用戶進行價值用戶的分群,將每一個用戶分派到多個價值用戶群的其中一個。以一分群或分類模型(例如,RFM模型(Recency Frequency Monetary Model,即以近一次消費、消費頻率、消費金額等數值分群的分類模型)來說,用戶可能被分群到例如高價值(VIP)用戶群、高消費用戶群、常購用戶群、近期高活躍用戶群或其他價值用戶群。接著,建立某一個價值用戶群(例如,有興趣的是高價值用戶群)的第一分群模型。之後,進行特徵工程,使用第一分群模型找出對此價值用戶群來說是重要且有意義的用戶短期特徵,並以這些重要且有意義的用戶短期特徵建模僅關聯於用戶短期行為的第二分群模型。接著,基於第二分群模型,根據當前用戶之用戶短期特徵預測出用戶中長期顧客價值評分,即使用第二分群模型根據當前用戶之用戶短期特徵預測用戶是否屬於第二分群模型的價值用戶群。
上述使用第二分群模型根據當前用戶短期特徵預測用戶是否屬於第二分群模型的價值用戶群是透過特徵比對進行,第二分群模型可以是透過分類算法或迴歸算法所得到之分群模型或其他機器學習算法訓練好的類神經網路。另外,特徵比對也可以是透過計算用戶之多個用戶短期特徵的數值與第二分群模型之用戶短期特徵的數值之間的相關性,如可計算餘弦相似性(cosine similarity),便可以預測用戶是否屬於第二分群模型的價值用戶群。
簡單地說,不論是使用已定義的RFM模型、第一分群模型或是第二分群模型,都是可以用於對用戶的用戶價值進行評分, RFM模型與第一分群模型可利用用戶長期資料與用戶長期特徵進行分群,在商業競爭激烈的現況下, RFM模型與第一分群模型可能要等到有用戶長期資料才能對用戶做有效且精準行銷,故可能會讓有價值的用戶流失。因此,本發明可使用第二分群模型依據用戶短期資料(即依據用戶短期特徵)提早對用戶的價值評分,以對用戶做有效且精準行銷,增加用戶的消費金額並有效地避免有價值的用戶流失。
對價值用戶群來說是重要有意義的用戶特徵的意思可指重要性為前幾名或重要性超過一定門限值的用戶特徵,例如,購買金額對高價值用戶群為重要且有意義的用戶特徵,但是使用現金或信用卡進行消費的用戶特徵可能對高價值用戶群來說不重要且無意義。在建立分群模型時,可定義出各種用戶特徵,以在進行分群模型評估時,可以了解分群模型是否具有解釋力(即分群的精確度是否足夠)。如果解釋力不夠,則可進一步地增加用戶特徵。然而,通常一個分群模型中,有些用戶特徵對分群模型的價值用戶群來說是不重要且無意義的。
使用分群模型對用戶進行預測的意思可指對用戶的用戶價值評分,即進行特徵比對,以預測用戶是否屬於分群模型的價值用戶群。特徵比對可指計算用戶之用戶特徵的數值與分群模型的價值用戶群的用戶特徵的數值之間的相似性,也可指所計算出相似性的機率結果。當然,特徵比對的作法有非常多種,且本發明不以類神經網路計算出的機率結果或以計算餘弦相似性的作法為限制,其他以支持向量機或決策樹實現的特徵比對作法也在本發明的範圍之內。
於本發明中,短期的定義可指比想知道的答案短就叫短期,例如想知道哪些用戶在月底貢獻度較大,若使用一週、兩週或三週的用戶特徵進行預測,那麼一週、兩週或三週相較一個月來說就是短期,也就是比目標期間短的期間都可叫短期,目標期間則叫長期。需要說明的是,有些特徵是與時間無關者,通常不會是用戶長期特徵或用戶短期特徵,而是用戶非時間相關特徵,例如若將用戶的戶籍地地址作為用戶特徵之一,則用戶的戶籍地地址不是用戶短期特徵也不是用戶長期特徵。用戶短期特徵專指有相對時間概念的特徵。
於本發明中,用戶資料通常是原始資料,而不會是用戶特徵,除非一開始設計資料庫儲存用戶特徵作為用戶資料,例如資料庫一開始就設計成會計算用戶來店次數與每週消費平均,並儲存用戶來店次數與每週消費平均作為用戶資料使用。特徵是具有代表性的資料,可理解為輸入參數或變數,有意義的輸入參數或變數會影響到最終的用戶價值評分,例如用戶的瀏覽行為特徵,可能是進到網頁後常常點擊廣告內容、或者喜歡觀看影片、或者停留在網頁的時間不超過10秒等等,都可能是有意義的特徵。
常見的特徵,從類型上可分為數值類型、類別類型與時間類型。此三類型的特徵可以彼此轉換,例如,數值類型的特徵可以進行處理,而轉換成時間類型的特徵。數值類型的特徵是利用統計描述方法,將整體資料範圍切分成數分。類別類型的特徵是指屬於何種類別,例如,裝置資訊可能是筆電、手機或平板,而裝置為筆電、手機與平板的哪一者即是類別類型的特徵。另外,數值類型的特徵也能轉換成類別類型的特徵,或者類別類型的特徵也可以依照各類別比重作特徵加權,以轉換成數值類型的特徵。時間類型的特徵可以是將數值特徵依照每週/每月/每季等方法計算頻率、次數或大小等,其計算方法非常多種,且不以本發明所述的作法為限制。簡單地說,三種類型之特徵的任一者都可以經過處理,以生成其中另一者的特徵。
本發明使用用戶短期特徵的目的是希望利用短期間特徵參數來預測長時間的結果,用戶短期特徵雖與時間相關,但因為特徵類型可以互相轉換,故廣義上來說用戶短期特徵可包含前述數值類型、類別類型與時間類型之特徵,但可以是以相較於目標時間(長期)的較短時間(短期)切分出來的特徵。用戶短期特徵是相對的概念,例如一般可能要等到月底才知道用戶當月的最終花費, 但從用戶每週的消費紀錄、頻率、週期、來店次數、瀏覽頻率、點擊次數與頻率、是否有加入購物車或願望清單,以及用戶過去的歷史紀錄等等,都有很大的機會預測出用戶月底的購買紀錄。找出重要的用戶短期特徵後,便可據此建立自動化流程,實際使用時則是自動化從用戶資料轉換與萃取出用戶短期特徵。
於本發明中,延伸出來的特徵可指原本不存在的特徵,延伸特徵可指用既有特徵或既有資料進行計算、轉換或擷取出來的特徵。過於細膩的資料可能難以直接作為特徵使用,因此,可對資料進行轉換產生例如,一般地址資料可能會包含許多資訊,例如總統府地址為:「 106台北市大安區新生南路二段 1號 」,若直接以這項資料來進行建模,將會因為資料太過細緻而無法運用,這時會做一些特徵轉換處理,可能將原始的「地址: 106台北市大安區新生南路二段 1號 」轉變成「郵遞區號: 106、城市:台北市、 鄉鎮市區 大安區 、其他地址: 新生南路二段 1號 」或可能透過經緯度查詢獲得較粗略定位資訊的「經緯度: 25N / 121E」。延伸的特徵,以用於模型的訓練與處理。又舉一例:一既有特徵為「每28日登入頻率=10」,則可以延伸出「每週平均登入頻率=2」或者「每雙週平均登入頻率=4」的延伸特徵。又如一既有或原始資料為「ID:0001;2020-9-1 10:00:05;登入首頁;使用裝置device=iphone12」,可延伸出與「使用者識別碼」、「登入時間」、「登入次數」、「使用裝置」相關之多個延伸特徵,其中例如「登入時間」之特徵可包含多個以不同時段、週期等計算之延伸特徵,以及「使用裝置」之特徵可包含與「裝置品牌」及「裝置型號」相關之延伸特徵等。
另舉一例說明延伸特徵的例子,假設在數值迴歸應用中,評估一個晶片效能的模型的既有特徵有電阻R與電流I,若有相關領域的技術人員提出功率P也是一個重要且有意義的特徵,此時可以延伸出一個功率P=I
2R的特徵作為評估一個晶片效能的模型的特徵。又舉一例:網路行銷的情境中,總曝光次數I及總點擊次數TC為既有特徵,可延伸出點閱率CTR=TC/I的延伸特徵作為評估廣告、關鍵字等的效能。再舉一例:一用戶資料包括「ID:0001;2020-9-1 10:00:05;登入首頁」、「ID:0001;2020-9-1 10:00:15;離開首頁」、「ID:0001;2020-9-5 14:08:30;登入首頁」、「ID:0001;2020-9-5 14:08:30;消費;消費金額=1,000」與「ID:0001;2020-9-5 14:08:50;離開首頁」,依據此原始數據中所記錄之造訪狀況,即對登入/離開首頁之時間進行分析,延伸特徵可包含「七天內登入首頁次數」、「日均登入首頁次數」、「九月登入首頁次數」、「九月第一週登入首頁次數」、「日間時段造訪頻率」、「每次登入停留時間」、「工作階段(session)長度」等。簡單地說,在本發明中,也會類似上述進行特徵延伸的作法,在既有的用戶資料或已預先定義的用戶特徵,再延伸出有對分群模型來說重要且有意義的特徵。
請參閱圖1,圖1是本發明實施例的價值用戶分群系統的方塊圖。價值用戶分群系統1係搭配用戶服務系統(圖未繪示)使用,用戶服務系統用於提供服務給用戶,而價值用戶分群系統1則用於根據服務的用戶之用戶資料來對用戶進行分群,以預測用戶是否屬於某一個價值用戶群,從而決定行銷策略,增加交易與用戶的滿意度。上述提供的服務例如是線上或實體購物、線上或實體交易、線上或實體投資、線上或實體訂閱或線上或實體諮詢等,亦即,用戶服務系統可以包括線上的服務主機或實體店面的銷售點終端(POS),且本發明不以此為限制。換言之,價值用戶分群系統1可以對使用線上服務或實體服務的用戶進行價值用戶的分群。
價值用戶分群系統1包括平台裝置11、用戶管理系統12、公開資料來源裝置13、資料庫14與以用戶短期特徵預測用戶是否屬於價值用戶群的預測裝置15,其中資料庫14信號連接平台裝置11、用戶管理系統12、公開資料來源裝置13與預測裝置15。另外,本發明中的「信號連接」是指透過軟體或硬體方式的無線或有線連接,使得信號或資訊可以彼此在信號連接的多個元件中互相傳遞。
平台裝置11是企業平台或其他類型的平台,其用以獲取用戶的瀏覽行為111、興趣喜好112、裝置資訊113、網際網路位址(IP)或裝置識別(device identification)114之用戶資料。用戶管理系統12用於獲取用戶的人口統計資料121、消費紀錄122、帳務紀錄123與互動紀錄124之用戶資料。公開資料來源裝置13用於獲取用戶的氣候地理131、金融經濟132、人文人口133與醫療生物134之用戶資料。平台裝置11、用戶管理系統12與公開資料來源裝置13獲取的用戶的多個用戶資料可以被資料庫14所儲存,資料庫14可以是非結構化資料庫,但本發明不以此為限制,亦可能是結構化資料庫。
預測裝置15通常是透過軟體配合計算機裝置的方式來實現。例如,計算機裝置包括運算單元、儲存單元與通訊單元,其中運算單元電性連接儲存單元與通訊單元。運算單元會讀取非揮發性儲存媒介所儲存的多個程式碼,多個程式碼被執行後,能夠運行以用戶的用戶短期特徵來預測用戶的價值評分的方法(即,以用戶的用戶短期特徵來預測用戶是否屬於某一個價值用戶群)。另外,預測裝置15也可以透過硬體電路來實現,例如,透過設計Verilog或VHDL碼對場可程式化陣列(FPGA)晶片燒錄,以實現純硬體電路的預測裝置15,又例如,透過製作特定應用晶片(ASIC)來實現純硬體電路的預測裝置15。總而言之,預測裝置15是使用軟體還是硬體來實現,其皆非用於限制本發明。
不管預測裝置15使用軟體或硬體方式來實現,其可以劃分出多個模組如圖1。於圖1中,預測裝置15包括數據管理模組151、機器學習模組152、模型部署模組153與行銷模組154,數據管理模組151、機器學習模組152、模型部署模組153與行銷模組154除了彼此信號連接之外,還信號連接於資料庫14。當然,圖1之預測裝置15的模組劃分僅是實現本發明的其中一種方式,且圖1的做法並非用於限制本發明。另外,數據管理模組151、機器學習模組152、模型部署模組153與行銷模組154將與本發明圖3之以用戶短期特徵對用戶進行價值用戶分群的預測方法一併做說明,此處先不贅述。
在說明本發明之預測裝置15與圖3之預測方法的細節之前,請先參照本發明圖2,圖2是本發明實施例之以用戶短期特徵對用戶進行價值用戶分群的概念示意圖。在圖2中,多個用戶資料中的人口統計資料121、消費紀錄122、帳戶紀錄123與互動紀錄124的用戶資料集12S被用來對多個用戶進行價值用戶的分群,每一個用戶會被分群到多個價值用戶群231、232、…、23N的其中一者,其中N為大於等於2的正整數。價值用戶的分群方式例如可以是採用RFM模型,也可是使用其他模型之分群方式,例如以靜態特徵(年齡、性別、職業、註冊時間點)分群,或以動態特徵(RFM參數、會員等級或晉升狀況、帳號餘額、所採用之商品之取貨/交付方式)分群,且本發明不以此為限制。
換句話說,於圖2中的右邊,可使用RFM模型先對多個用戶進行價值用戶的分群,其中RFM模型必須基於用戶資料中的用戶資料集12S所產生的用戶資料才能夠進行價值用戶的分群。用戶資料集12S的用戶資料多數為用戶長期資料,因此,RFM模型至少要有用戶長期資料才能夠進行價值用戶的分群。另外,用戶資料集12S的用戶資料也可能有用戶短期資料與用戶非時間相關資料。
如前面所述,本發明的目的是希望能夠使用相較於用戶長期特徵之統計時間來得短的用戶短期特徵來提前知悉用戶群22的各用戶是否可能屬於多個價值用戶群231~23N的某一個群。因此,透過用戶資料集11S中的瀏覽行為111、興趣洗好112、裝置資訊113、網際網路位址或裝置識別114的用戶資料與用戶資料集13S中的氣候地理131、金融經濟132、人文人口133、醫療生物134的用戶資料可以產生出包括多個用戶短期特徵211~21M的用戶短期特徵集21。
為了使得可以使用用戶短期特徵集21中的至少一部分用戶短期特徵211~21M來預測用戶是否屬於多個價值用戶群231~23N的某一個群,本發明是將價值用戶群231~23N中有興趣的群(也可能全部都有興趣)建立對應的第一分群模型,並對第一分群模型進行特徵工程,找出用戶短期特徵建立第二分群模型,以使用第二分群模型根據用戶的用戶短期特徵預測用戶是否屬於價值用戶群231~23N的某一個群。例如,針對價值用戶群231,找出對價值用戶群231來說是重要且有意義的用戶特徵(包括用戶長期特徵、用戶短期特徵與用戶非時間相關特徵),然後進行特徵工程,找出第一分群模型中的用戶短期特徵,並使用這些用戶短期特徵建立價值用戶群231的第二分群模型,之後,透過使用價值用戶群231的第二分群模型根據用戶的用戶短期特徵預測用戶是否屬於價值用戶群231。
請接著參照本發明的圖1與圖3,圖3是本發明實施例之以用戶短期特徵對用戶進行價值用戶分群的預測方法的流程圖。首先,在步驟S31中,數據處理模組151用於獲取分群結果,其中分群結果表示至少一個價值用戶群所包括的用戶。進一步地說,數據處理模組151可以收集用戶資料(至少包括用戶長期資料),並根據用戶資料來將用戶分類至對應的價值用戶群。例如,透過RFM模型,即可以根據用戶資料將用戶分類為高價值(VIP)用戶群、高消費用戶群、常購用戶群、近期高活躍用戶群或其他價值用戶群。另外,步驟S31也可以是由數據處理模組151對用戶資料處理,以獲取用戶特徵(至少包括用戶長期特徵),且基於用戶特徵使用預設的分群模型來獲取分群結果。簡單地說,數據處理模組151取得分群結果的做法並非用於限制本發明。甚至,在本發明其他實施例中,分群可以不是由數據處理模組151進行,而是數據處理模組151僅接收分群結果。
以一般電商常用的會員系統的情況,每位用戶在註冊後都會獲得一個使用者帳號,未來用戶在用戶服務系統中的所有行為活動都會記錄在資料庫14中,例如用戶何時消費、消費多少錢、消費的時間、地點與品項、消費前點擊了哪些頁面、放了多少品項進購物車與實際購買了多少品項等。數據處理模組151取得這些資料後,並於月底進行統計後,便能透過各種分群方式(例如,前述RFM模型,但也可以是以商品愛好分群或活動參與分群的作法),獲得分群結果。以RFM模型為例,RFM模型是根據消費總額、消費頻率與最近一次消費來將用戶分類為屬於高價值(VIP)用戶群、高消費用戶群、常購用戶群、近期高活躍用戶群或其他價值用戶群。
在步驟S32中,透過數據處理模組151與機器學習模組152建立價值用戶群的第一分群模型。根據分群結果,可以知道某一個價值用戶群的用戶有哪些,數據處理模組151可以處理此價值用戶群之用戶的用戶資料,根據系統預設或人為設定的規則,從用戶資料中獲取或辨識出多個用戶特徵(至少包括用戶長期特徵,但也有可能更包括用戶短期特徵與用戶非時間相關特徵)。接著,機器學習模組152根據數據處理模組151所獲取的用戶特徵建立價值用戶群的第一分群模型。
選擇性地,由於用戶特徵有些可能對於價值用戶群來說不是重要且有意義的,因此,數據處理模組151產生的用戶特徵若不是預先知悉一定會與價值用戶群有關的,則在步驟S32中,機器學習模組152可經過學習僅挑選出對於價值用戶群來說是重要且有意義的用戶特徵。可使用機器學習算法來進行特徵工程,萃取與確認對價值用戶群(例如高價值用戶群)來說是重要且有意義的用戶特徵有哪些。通常可進行特徵選取,依重要性分數選擇前面數名(或重要性超過門限值)的用戶特徵作為價值用戶群的重要用戶特徵,且價值用戶群的這些重要用戶特徵就是對價值用戶群來說是有意義且重要的用戶特徵。接著,利用這些重要用戶特徵即可以完成第一分群模型的建立。
舉例來說,在知悉哪些用戶是屬於高價值用戶群,哪些用戶不是屬於高價值用戶群後,便可以透過萃取出對高價值用戶群來說是有意義且重要的用戶特徵,而對其他價值用戶群亦可用類似方式進行用戶特徵之萃取。萃取出之用戶特徵可如,高價值用戶群的用戶可能每天至少為瀏覽網頁超過10秒,或高價值用戶群的用戶每週至少會進到網頁首頁停留5秒以上,或高價值用戶群的用戶習慣透過手機登入而非個人電腦登入等。在知悉上面這些用戶特徵是重要的情況下,數據處理模組151會對用戶資料進行處理,以萃取出上述這些用戶特徵,並且機器學習模組152會依據這些用戶特徵建立出高價值用戶群的第一分群模型。
用戶的用戶資料通常為原始資料,需要數據處理模組151進行處理與轉換。在此例子中,高價值用戶群的其中一個用戶的用戶資料包括「ID:0001;2020-9-1 10:00:05;登入首頁;使用裝置device=iphone12」、「ID:0001;2020-9-1 10:00:15;離開首頁;使用裝置device=iphone12」、「ID:0001;2020-9-5 14:08:30;登入首頁;使用裝置device=iphone12」、「ID:0001;2020-9-5 14:08:30;消費;消費金額=1,000;使用裝置device=iphone12」與「ID:0001;2020-9-5 14:08:50;離開首頁;使用裝置device=iphone12」。
數據處理模組151可以因此自動地萃取出「ID:0001」的用戶之特徵為「每週登入頻率=2」、「平均停留時間=15」、「每週首頁停留次數=2」與「每週消費金額=1,000」與「使用裝置device=iphone12」。於此例中,「使用裝置device=iphone12」可以視為用戶非時間相關特徵,若以月底才做統計,則「每週登入頻率=2」、「平均停留時間=15」、「每週首頁停留次數=2」與「每週消費金額=1,000」都屬於用戶短期特徵,要注意是,此處雖然沒有列出用戶長期特徵,但實際上,數據處理模組151也可取得用戶長期特徵,例如「每月登入頻率=9」、「平均停留時間=12」、「每月首頁停留次數=9」與「每月消費金額=3,000」。
在步驟S33中,基於第一分群模型,機器學習模組152進行特徵工程以萃取用戶短期特徵,並根據萃取的用戶短期特徵建立第二分群模型。在此請注意,第二分群模型也可以將用戶非時間相關特徵作為輸入參數,即機器學習模組152更可以萃取用戶非時間相關特徵,並使用萃取的用戶短期特徵與用戶非時間相關特徵建立第二分群模型。第一分群模型的用戶特徵若有用戶長期特徵、用戶短期特徵與用戶非時間相關特徵,則可以依據重要性挑選出第一分群模型中的用戶短期特徵(可選地,還可以挑選出重要且有意義的用戶非時間相關特徵),然後利用萃取出來的用戶特徵,即可以建立第二分群模型。特徵工程可以是透過機器學習算法來實現,且本發明不以此為限制。
在一些情況下,第二分群模型有可能不具有完整的解釋力,因為第一分群模型中可能沒有足夠的用戶短期特徵,甚至完全沒有用戶短期特徵。因此,步驟S33中,數據處理模組151更可以進行用戶資料的處理,根據第一分群模型的用戶特徵延伸出多個用戶短期特徵,以使得建立的第二分群模型更具備解釋力。舉例來說,第一分群模型中其中一個的用戶長期特徵為「每月登入頻率>9」,則可以延伸出「每週登入頻率>2」或者「每雙週登入頻率>4」的用戶短期特徵。另外,進行特徵延伸的部分,其中一種做法是繪製出雷達圖,針對第一分群模型中之用戶特徵的弱項類型去延伸用戶短期特徵,以使得第二分群模型具備足夠的解釋力。
舉例來說,若發現對高價值用戶群的第一分群模型來說,重要且有意義的用戶短期特徵為「每週登入頻率>2」、「平均停留時間>10」與「每週消費金額>1,000」,則使用這些短期用戶特徵來建立與訓練出第二分群模型。另外,若高價值用戶群的第一分群模型中有不重要且無意義的用戶特徵為「每週首頁停留次數=2」與「使用裝置device=iphone12」,則這些用戶特徵將不被用來訓練與建立第二分群模型,以避免過擬合。
數據處理模組151可根據一短期期間規則決定短期特徵的短期期間,短期期間可作為短期特徵值之觀察期間。數據處理模組151可根據一短期期間規則調整短期特徵的短期期間,例如數據處理模組151可針對特徵值之於時間軸上之分佈進行分析,以作為調整短期期間之依據。例如,數據處理模組151可對長期特徵資料集進行時間序列分析,如找出季節性等特徵,以採用相應之短期期間規則。短期期間可包含日曆期間,如小時、日、週、月、季等。短期時間亦可包含日曆期間之變化,如雙日、雙週等。用戶短期特徵不必然以固定週期來切分,若如瀏覽、造訪、消費等用戶行為非線性時,可利用非固定週期來設定短期期間。舉例而言,當用戶於每月初於平台裝置11之行為較為活躍,惟活躍度隨時間至月底而遞減,若採固定週期切分特徵,接近月底之特徵值可能會使預測失準,例如一用戶習慣於每月第一週消費一金額V
1>10,000元,惟至當月月底前消費金額遞減,例如第二至第四週消費金額分別為V
2=2,000、V
3=0、V
4=0,若每月消費金額為長期特徵,則若將短期特徵設為固定週期之情況下,最後一或二週之消費金額可能會將此用戶資料預測為負例。為解決此問題,短期的期間可採遞增、遞減或其他變化等方式設定,例如,週期不必然連續,如可以特定時間點為錨點觀察自該錨點開始之一窗口內的期間,例如,以每月第一日為錨點觀察往後一週內之數值,即設定一窗口為七日,將該第一週設為第一週期,並將第一週至第四週設為第二週期,或甚至忽略第一週至第四週而僅將每月第一週設為短期特徵之週期;或者,將窗口設為每週一至每週三而忽略每週四至每週日,以將每週一至三設為短期特徵之週期等。或者,週期可為以每上一個週期增加一日的期間遞增,如週期P的序列中,P
1=1日、P
2=2日、P
3=3日,P
4=4日…P
n=n日等。或者,短期特徵之週期可採梯度方式增加,如註冊會員後一個月內,短期期間為每週,註冊會員後二至六個月內,短期期間為每雙週等。週期亦可重疊,如進行窗口滑動以判定短期期間,如窗口設為3日時,9月1日至9月3日為一短期期間,9月2日至9月4日為一短期期間,9月3日至9月5日為一短期其間等。從上開敘述可得知,短期特徵係相對於長期特徵而言,因此長期特徵亦可能為非固定或與短期特徵有相應變化,以該梯度方式遞增週期為例,註冊會員後一個月內,長期特徵可為具有一個月之期間,而註冊會員後二至六個月內,長期特徵可為具有六個月之期間。
接著,在第二分群模型建立完畢後,於步驟S34中,模型部署模組153部署第二分群模型,並且使用第二分群模型根據用戶的用戶短期用戶特徵預測用戶是否屬於第二分群模型的價值用戶群。簡單地說,在部署完第二分群模型後,每當用戶登入後,預測裝置15便能夠不用等到目標時間(如以長期特徵的長期期間)到達,便可以知悉用戶是否屬於第二分群模型的價值用戶群。附帶一提的是,使用第二分群模型根據用戶的用戶短期用戶特徵預測用戶是否屬於第二分群模型的價值用戶群的做法可以是透過特徵比對,例如類神經網路的分類或計算餘弦相似性。
之後,在對用戶依據其用戶短期特徵預測其是否屬於價值用戶群之後,在步驟S35中,行銷模組154根據用戶是否屬於第二分群模型的價值用戶群的預測結果,決定對用戶的行銷策略。例如,若根據用戶一週的用戶資料擷取出短期特徵,並根據用戶的用戶短期特徵預測用戶為高價值用戶群,則可以直接發送準高價值用戶或高價值用戶的折價卷或促銷活動給用戶,以藉此增加交易或訂閱的成功率。附帶一提的是,預測用戶為價值用戶群的預測結果可以是以機率的方式呈現,例如,50%、70%或90%,因此,行銷模組154可以根據預測結果的機率值給予不同優惠資訊給用戶。
舉例來說,多個用戶的多個用戶短期徵分別為「ID:0001;每週登入頻率=2;平均停留時間=15;每週消費金額=800」、「ID:0002;每週登入頻率=0.01;平均停留時間=7;每週消費金額=600」、「ID:0003;每週登入頻率=1;平均停留時間=50;每週消費金額=50,000」、「ID:0004;每週登入頻率=3;平均停留時間=25;每週消費金額=1,300」與、「ID:0005;每週登入頻率=10;平均停留時間=50;每週消費金額=15,300」,以及第二分群模型的用戶短期特徵為「每週登入頻率>2」、「平均停留時間>10」與「每週消費金額>1,000」,則可以預測「ID:0004」與「ID:0005」的用戶屬於第二分群模型的價值用戶群。
在此請注意,上述第二分群模型可以是依短期特徵之週期更新,如依最短週期更新、依第二分群模型之所有特徵中具最短週期之特徵的週期更新,或者隨時、即時、或近乎即時地更新,如更新頻率可以是一個小時或兩個小時一次。例如,即使是因為舉辦一活動才使得用戶的消費金額變多,該活動可為節日性、單次性、臨時性、突發性、短期性活動等,則舉辦活動促使用戶增加消費的用戶短期特徵也可被當作第二分群模型的用戶短期特徵,即使用與活動相關的用戶短期特徵來增補原來的多個用戶短期特徵。在活動舉辦結束後,因為第二分群模型是隨時地更新,所以活動舉辦結束後的一段時間後,第二分群模型不會將舉辦活動促使用戶增加消費的用戶短期特徵作為其用戶短期特徵,即移除自多個短期用戶特徵中與活動相關的用戶短期特徵。另外一種做法是準備兩個第二分群模型,其中一個第二分群模型是不考慮舉辦活動相關的用戶短期特徵以做為常態使用的第二分群模型,另一個第二分群模型則是考慮舉辦活動相關的用戶短期特徵以做為活動舉辦使用的第二分群模型。例如,舉辦活動是促銷某類商品,則活動舉辦使用的第二分群模型可以將用戶之興趣與在每週(假設活動時間為一個月)舉辦活動期間所購買之金額的用戶短期特徵作為第二分群模型的用戶短期特徵。
另外,前述用戶資料的來源與類型不以前述內容為限制。用戶資料的原始資料更可以包括透過物聯網或其他裝置感測到並傳送到預測裝置。例如,用戶到賣場停車,停車繳費機會記錄用戶的停車時間與次數等,第二分群模型可以將用戶每週的停車次數與來店消費次數的比率作為其用戶短期特徵。除此之外,同一個用戶的用戶資料的資料來源可是一個以上。例如,透過不同分店之實體連鎖店的POS獲取的用戶資料以獲得用戶短期特徵。又例如,用戶因為調職,故不在原先工作地點的連鎖咖啡店消費,而改成在工作地點的連鎖咖啡店消費,故將兩個資料來源的用戶資料做統整後,才能正確地獲得用戶的用戶短期特徵,此亦示意了非時間特徵與短期特徵的整合應用。
請接著參照圖4,圖4是本發明實施例之以用戶短期特徵對用戶進行價值用戶分群的預測方法或裝置建立的RFM預測分群與當前RFM分群的示意圖。RFM預測分群可指針對RFM模型分群結果之各價值客戶群以前述短期特徵方式預測符合各價值客戶群之客戶。依據目標時間的用戶資料進行RFM分群後的當前RFM分群結果41中的高價值用戶群411與依據本發明實施例預測方法或裝置預測的RFM分群結果42的高價值用戶群421可能會有不同的用戶,可以將預測的RFM分群結果42的高價值用戶群421的用戶視為高價值或準高價值的用戶,直接進行行銷。也就是說,可以直接將高價值用戶群421用戶加入到高價值用戶群411,以優化當前RFM分群結果41,盡可能找出高價值的潛在用戶。簡單地說,本發明實施例的預測方法更包括將預測的價值用戶群與當前的價值用戶群進行合併的步驟。另外,高價值用戶群411、421之間的用戶變動也可以用於預測目前的行銷策略是否正確,並說明如下。
請同時參照圖5A與圖5B,圖5A是本發明實施例之以用戶短期特徵對用戶進行價值用戶分群的預測方法或裝置於第一時間獲得之價值用戶群及當前的價值用戶群的示意圖,以及圖5B是本發明實施例之以用戶短期特徵對用戶進行價值用戶分群的預測方法或裝置於第二時間獲得之價值用戶群及當前的價值用戶群的示意圖。於第一時間,預測的價值用戶群52及當前的價值用戶群51之間的交集531,但在第二時間,預測的價值用戶群52及當前的價值用戶群51之間的交集532相較於交集531卻變小,亦即交集之用戶數量變少,而對交集之用戶及交集之變化可對其中之用戶作統計分析,以了解原客戶(位於交集531中之價值用戶群51)可能不再符合價值用戶群51或流失之情況,因此,可以進一步了解針對價值客戶群51的行銷策略是否可能出錯或需要調整,才導致價值用戶群的用戶流失,故可判定是否需調整行銷策略。
請同時參照圖5A與圖5C,圖5C是本發明實施例之以用戶短期特徵對用戶進行價值用戶分群的預測方法或裝置於第二時間獲得之價值用戶群及當前的價值用戶群的另一示意圖。於第一時間,預測的價值用戶群52及當前的價值用戶群51之間的交集531,但在第二時間,預測的價值用戶群52及當前的價值用戶群51之間的交集533卻變大,因此,可以知悉行銷策略可能有產生效果,故可以維持原行銷策略。某些實施例中,預測裝置15亦可包含或電性連接一顯示模組(未繪示),該顯示模組可根據用戶群51及52之資料將類似於圖5A-5C之用戶群圖形化方式呈現於螢幕上,以供監控預測的價值用戶群52之間的變化或當前的價值用戶群51與預測的價值用戶群52之間的變化。簡單地說,本發明的預測裝置以用戶短期特徵對用戶進行價值用戶分群的預測的價值用戶群與當前的價值用戶群在不同時間點的交集變化可以拿來被監控,以判斷行銷策策略是否得當,亦即本發明實施例的預測方法更包括此處所講的監控交集變化以判斷行銷策策略是否正確的步驟。
在某些實施例中,本發明可藉由一電腦軟體程式執行本揭露之模組或方法,其中所述電腦軟體程式可儲存於非揮發性的儲存媒介,例如快閃記憶體裝置、磁性儲存裝置、光碟或其他類型的儲存媒介。例如,本發明可藉由一電腦軟體程式利用一機器學習演算法對第一用戶資料集進行擬合,以選定一用戶短期特徵集。該用戶短期特徵集可包含至少一短期特徵。該第一用戶資料集可包含具第一週期性之用戶長期特徵集。該用戶長期特徵集可包含長期特徵資料。該電腦軟體程式可對用戶資料集進行特徵工程,以選定該用戶短期特徵集。該特徵工程可包含特徵重要性分析,以作為選定該用戶短期特徵集之依據。該特徵工程可包含短期特徵萃取,以自該用戶長期特徵集中萃取出該用戶短期特徵集。該用戶短期特徵集可包含具第二週期性之用戶短期特徵資料。該第一週期性可包含第一週期,該第二週期性可包含第二週期;對於同一特徵而言,該第二週期可短於該第一週期。該電腦軟體程式可依據該用戶短期特徵集對該第一用戶資料集進行處理,以產生第二用戶資料集。對該第一用戶資料集進行處理可包含對該第一用戶資料集刪除該用戶短期特徵集之外之特徵。該電腦軟體程式可利用該機器學習演算法對該第二用戶資料集進行擬合,以產生一用戶分群預測模型。該電腦軟體程式可利用該用戶分群預測模型對第三用戶資料集進行預測,以產生第一預測結果。該第三用戶資料集可包含至少某一特定用戶之用戶資料。該第三用戶資料集可包含該用戶短期特徵集。該第一預測結果除了包括某一特定用戶是否屬於特定族群的預測結果外,更可包含第四用戶資料集。該第四用戶資料集可包含以該用戶分群預測模型預測為正例之用戶資料。該電腦軟體程式可對該第一用戶資料集與該第四用戶資料集進行聯集分析,以取得第一聯集分析結果。該電腦軟體程式可對該第一用戶資料集與該第四用戶資料集進行資料合併,以取得第五用戶資料集。於產生該第一預測結果之後,該電腦軟體程式可利用該用戶分群預測模型對第六用戶資料集進行預測,以產生第二預測結果。該第六用戶資料集可包含至少某一特定用戶之用戶資料。該第六用戶資料集可包含該用戶短期特徵集。該第二預測結果除了包括某一特定用戶是否屬於特定族群的預測結果外,更可包含第七用戶資料集。該第七用戶資料集可包含以該用戶分群預測模型預測為正例之用戶資料。該電腦軟體程式可對該第一用戶資料集與該第七用戶資料集進行資料合併,以取得第八用戶資料集。該電腦軟體程式可對該第一用戶資料集與該第七用戶資料集進行聯集分析,以取得第二聯集分析結果。該電腦軟體程式可對該第一聯集分析結果與該第二聯集分析結果進行交集比對,以產生一交集比對結果,其中該交集比對結果可以更真實地反映某一個特定族群的用戶短期特徵,該電腦軟體程式可以根據該交集比對結果以建立出用於判斷或預測用戶是否屬於該特定族群的分類模型。
某些實施例中,本發明係包含一可用於用戶資料處理之電腦程式產品,其中所述電腦軟體程式可儲存於非揮發性的儲存媒介,例如快閃記憶體裝置、磁性儲存裝置、光碟或其他類型的儲存媒介,且所述電腦軟體程式經由電腦載入後用以預測並擴充用戶資料集,係執行包含以下之步驟:對第一用戶資料集進行特徵工程,使該第一用戶資料集包含具有一用戶長期特徵集之用戶資料,該用戶長期特徵集包含具第一週期性之特徵,該第一用戶資料集包含第一用戶數量之用戶資料;利用一機器模型演算法對該第一用戶資料集進行擬合,以產生一用戶短期特徵集,該用戶短期特徵集包含具第二週期性之特徵,其中該用戶長期特徵集之第一週期性具有第一週期,該用戶短期特徵集之第二週期性具有第二週期,該第一週期長於該第二週期;依據該用戶短期特徵集對該第一用戶資料集進行特徵選定,以產生第二用戶資料集,使該第二用戶資料集包含具有該用戶短期特徵之用戶資料,利用該機器學習演算法對該第二用戶資料集進行擬合,以產生一用戶群集預測模型;利用該用戶群集預測模型對第三用戶資料集進行預測,以產生第一用戶群集預測結果,該第一用戶群集預測結果除了包括某一特定用戶是否屬於特定族群的預測結果外,更包含第四用戶資料集;及對該第一用戶資料集與該第四用戶資料集進行資料合併,以產生第五用戶資料集,該第五用戶資料集包含第二用戶數量之用戶資料,該第五用戶資料集之第二用戶數量高於該第一用戶資料集之第一用戶數量。
在某些實施例中,上述用戶資料集可包含複數個不同用戶之資料,上述特徵資料集可包含複數個不同資料屬性之特徵欄位,各該特徵欄位包含複數個特徵值,各該特徵欄位之複數個特徵值可構成一特徵值範圍。該電腦軟體程式可依據各該特徵欄位之特徵值範圍計算或選取一特徵門檻值。前述特徵資料集之資料可包含特徵門檻值。各該特徵門檻值可為各該特徵欄位之特徵值範圍中之最大值、最小值、平均值、中位數、眾數、百分位數、四分位數、標準差等。依據不同特徵值的屬性,該電腦軟體程式可利用不同的特徵門檻值判斷規則來決定特徵門檻值。例如,該電腦軟體程式可判斷特徵值與該機器學習演算法所擬合之目標變數或標籤的關聯性,若判斷該關聯性為正相關,可計算或選取特徵值範圍中之最小值作為特徵門檻值,而若判斷該關聯性為負相關,可計算或選取特徵值範圍中之最大值作為特徵門檻值。例如,若該機器學習演算法之目標變數為消費金額,特徵為每週登入頻率,特徵值範圍之最小值為2,該電腦軟體程式可判斷消費金額與每週登入頻率具有正相關之關聯性,可選取該最小值作為特徵門檻值。在某些例子中,若目標變數與特徵之間具有弱關聯性,該電腦軟體程式可計算或選取特徵值範圍之算術平均數作為特徵門檻值。在某些例子中,若特徵為計數屬性,該電腦軟體程式可計算或選取特徵值範圍中之眾數作為特徵門檻值。在某些例子中,該電腦軟體程式可設定一門檻值系數h=0, 0.5, 1, 1.8, 2, …並計算特徵值範圍之統計數據與該門檻值系數之乘積作為特徵門檻值;例如,若設定h=0.5,前述每週登入頻率之特徵門檻值便為1。在某些例子中,該電腦軟體程式可接收一特徵門檻值之設定指令,以依據該設定指令設定特徵門檻值。
本發明之功效在於可以透過用戶的用戶短期特徵,如每日或單次消費行為,對用戶進行用戶價值評分預測(即,預測用戶是否屬於某一個價值用戶群),故可針對到用戶個人,讓用戶對現行服務的反應更加即時全面,無須等到最終消費結果產生才反應。進一步地,透過本發明可以有效地維持高價值用戶,以及將準高價值用戶趁早變成高價值用戶,甚至可以彌補既有客戶分群如現有RFM分群的不足,將準高價值用戶視為高價值用戶(即,合併預測高價值用戶群與當前分群的高價值用戶群),以提升交易與訂閱的金額跟成功率。
上述對「本發明」之描述、各實施例、變形例中的記載以及圖式中揭露的內容僅為用於說明請求項中記載的發明的一例,依據本發明精神亦可有包含不同特徵或實施態樣之各種實施組合,因此請求項中記載的發明不受上述對「本發明」之描述、實施例或圖式中揭露的內容所限定。本申請最初的請求項中的記載僅僅是一個示例,可以根據說明書、圖式等的記載對請求項中的記載進行適宜的變更。
1:價值用戶分群系統
11:平台裝置
11S:用戶資料集
111:瀏覽行為
112:興趣喜好
113:裝置資訊
114:網際網路位址(IP)或裝置識別
12:用戶管理系統
12S:用戶資料集
121:人口統計資料
122:消費紀錄
123:帳務紀錄
124:互動紀錄
13:公開資料來源裝置
13S:用戶資料集
131:氣候地理
132:金融經濟
133:文人口
134:醫療生物
14:資料庫
15:預測裝置
151:數據管理模組
152:機器學習模組
153:模型部署模組
154:行銷模組
21:用戶短期特徵集
211~21M:用戶短期特徵
22:用戶群
231~23N:價值用戶群
S31~S35:步驟
41:當前RFM分群結果
411:高價值用戶群
42:預測的RFM分群結果
421:高價值用戶群
51:當前的價值用戶群
52:預測的價值用戶群
531~533:交集
圖1是本發明實施例的價值用戶分群系統的方塊圖。
圖2是本發明實施例之以用戶短期特徵對用戶進行價值用戶分群的概念示意圖。
圖3是本發明實施例之以用戶短期特徵對用戶進行價值用戶分群的預測方法的流程圖。
圖4是本發明實施例之以用戶短期特徵對用戶進行價值用戶分群的預測方法或裝置建立的RFM預測分群與當前RFM分群的示意圖。
圖5A是本發明實施例之以用戶短期特徵對用戶進行價值用戶分群的預測方法或裝置於第一時間獲得之價值用戶群及當前的價值用戶群的示意圖。
圖5B是本發明實施例之以用戶短期特徵對用戶進行價值用戶分群的預測方法或裝置於第二時間獲得之價值用戶群及當前的價值用戶群的示意圖。
圖5C是本發明實施例之以用戶短期特徵對用戶進行價值用戶分群的預測方法或裝置於第二時間獲得之價值用戶群及當前的價值用戶群的另一示意圖。
S31~S35:步驟
Claims (15)
- 一種以用戶短期特徵預測用戶是否屬於價值用戶群的預測方法,係執行於一預測裝置,包括: 獲取一分群結果,其中所述分群結果表示至少一用戶屬於一價值用戶群; 基於一機器學習算法實現一特徵工程,以獲取所述價值用戶群的多個用戶特徵,並透過所述多個用戶特徵建立所述價值用戶群的一第一分群模型,其中所述多個用戶特徵至少一者為一用戶長期特徵,所述用戶長期特徵為在一目標時間到達才能獲得的一特徵; 自第一分群模型中萃取出多個用戶短期特徵,並以所述多個用戶短期特徵建立所述價值用戶群的一第二分群模型,其中所述用戶短期特徵為在所述目標時間到達前便能獲得的一特徵;以及 使用所述第二分群模型根據另一用戶的多個用戶短期特徵預測所述另一用戶是否屬於所述價值用戶群。
- 如請求項1的預測方法,更包含根據多個用戶在所述目標時間到達時得到的多個用戶資料對所述多個用戶分群,以獲取所述分群結果。
- 如請求項2的預測方法,其中所述分群結果是由一RFM模型進行分群。
- 如請求項1的預測方法,更包括: 根據所述另一用戶被預測是否屬於所述價值用戶群來決定對所述另一用戶的一行銷策略。
- 如請求項1的預測方法,更包含挑選所述價值用戶群中多個重要性為前幾名或超過一門限值的多個用戶特徵來做為所述價值用戶群的所述多個用戶特徵。
- 如請求項1的預測方法,更包含挑選所述第一分群模型中多個重要性為前幾名或超過一門限值的多個用戶短期特徵來做為所述第二分群模型的所述多個用戶短期特徵。
- 如請求項1的預測方法,更包含挑選所述第一分群模型中多個重要性為前幾名或超過一門限值的多個用戶短期特徵,以及自挑選出的所述多個用戶短期特徵延伸出多個用戶短期特徵,將挑選出的所述多個用戶短期特徵以及延伸出的所述多個用戶短期特徵做為所述第二分群模型的所述多個用戶短期特徵。
- 如請求項1的預測方法,更包括: 使用所述第二分群模型將多個用戶預測為屬於所述價值用戶群;以及 監控所預測的所述價值用戶群的多個用戶與所述分群結果的所述價值用戶群的所述多個用戶之間的一交集於時間上的變化,以判斷所述多個用戶的一行銷策略是否正確。
- 如請求項1的預測方法,更包括: 使用所述第二分群模型將多個用戶預測為屬於所述價值用戶群;以及 將所預測的所述價值用戶群的多個用戶與所述分群結果的所述價值用戶群的所述多個用戶整合做為所述價值用戶群的所述多個用戶。
- 如請求項1的預測方法,其中使用所述第二分群模型根據所述另一用戶的所述多個用戶短期特徵預測所述另一用戶是否屬於所述價值用戶群是透過一特徵比對,且所述特徵比對是透過一類神經網路分類或計算一餘弦相似性來實現。
- 如請求項1的預測方法,其中於一活動舉辦期間,更新所述第二分群模型,以使用與一活動有關的至少一短期用戶特徵來增補所述多個短期用戶特徵,以及於所述活動舉辦期間結束後,更新所述第二分群模型,以自所述多個短期用戶特徵中移除與所述活動相關的所述用戶短期特徵。
- 如請求項1的預測方法,更包括: 準備另一第二分群模型; 於一活動舉辦期間,更新所述另一第二分群模型,並使用所述另一第二分群模型預測所述另一用戶是否屬於所述價值用戶群;以及 於所述活動舉辦期間,不更新所述第二分群模型。
- 一種非揮發性的儲存媒介,儲存有多個程式碼,所述多個程式碼係被一計算機裝置讀取,以執行如請求項1-12其中一項所述之預測方法。
- 一種以用戶短期特徵預測用戶是否屬於價值用戶群的預測裝置,係以一純硬體電路或一計算機裝置搭配一軟體實現,其係組態成多個模組,且多個模組運作以執行如請求項1-12其中一項所述之預測方法。
- 一種用於用戶資料處理之電腦程式產品,經由電腦載入後用以預測並擴充用戶資料集,係執行包含以下之步驟: 對第一用戶資料集進行特徵工程,使該第一用戶資料集包含具有一用戶長期特徵集之用戶資料,該用戶長期特徵集包含具第一週期性之特徵,該第一用戶資料集包含第一用戶數量之用戶資料; 利用一機器模型演算法對該第一用戶資料集進行擬合,以產生一用戶短期特徵集,該用戶短期特徵集包含具第二週期性之特徵,其中該用戶長期特徵集之第一週期性具有第一週期,該用戶短期特徵集之第二週期性具有第二週期,該第一週期長於該第二週期; 依據該用戶短期特徵集對該第一用戶資料集進行特徵選定,以產生第二用戶資料集,使該第二用戶資料集包含具有該用戶短期特徵之用戶資料,利用該機器學習演算法對該第二用戶資料集進行擬合,以產生一用戶群集預測模型; 利用該用戶群集預測模型對第三用戶資料集進行預測,以產生第一用戶群集預測結果,該第一用戶群集預測結果包含第四用戶資料集;以及 對該第一用戶資料集與該第四用戶資料集進行資料合併,以產生第五用戶資料集,該第五用戶資料集包含第二用戶數量之用戶資料,該第五用戶資料集之第二用戶數量高於該第一用戶資料集之第一用戶數量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW110133239A TW202312060A (zh) | 2021-09-07 | 2021-09-07 | 以用戶短期特徵預測用戶是否屬於價值用戶群的預測裝置、方法與儲存該方法的儲存媒介 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW110133239A TW202312060A (zh) | 2021-09-07 | 2021-09-07 | 以用戶短期特徵預測用戶是否屬於價值用戶群的預測裝置、方法與儲存該方法的儲存媒介 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202312060A true TW202312060A (zh) | 2023-03-16 |
Family
ID=86690583
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW110133239A TW202312060A (zh) | 2021-09-07 | 2021-09-07 | 以用戶短期特徵預測用戶是否屬於價值用戶群的預測裝置、方法與儲存該方法的儲存媒介 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TW202312060A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117688343A (zh) * | 2024-02-04 | 2024-03-12 | 成都帆点创想科技有限公司 | 一种多任务学习LSTM-Attention框架的LTV预测方法及系统 |
-
2021
- 2021-09-07 TW TW110133239A patent/TW202312060A/zh unknown
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117688343A (zh) * | 2024-02-04 | 2024-03-12 | 成都帆点创想科技有限公司 | 一种多任务学习LSTM-Attention框架的LTV预测方法及系统 |
CN117688343B (zh) * | 2024-02-04 | 2024-05-03 | 成都帆点创想科技有限公司 | 一种多任务学习LSTM-Attention框架的LTV预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210035152A1 (en) | Predicting the effectiveness of a marketing campaign prior to deployment | |
Rossi et al. | The value of purchase history data in target marketing | |
Ahlemeyer-Stubbe et al. | A practical guide to data mining for business and industry | |
Linoff et al. | Data mining techniques: for marketing, sales, and customer relationship management | |
US8688595B2 (en) | Analyzing transactional data | |
US8255268B2 (en) | System and method for matching merchants based on consumer spend behavior | |
US20150006286A1 (en) | Targeting users based on categorical content interactions | |
US20110178844A1 (en) | System and method for using spend behavior to identify a population of merchants | |
US11734711B2 (en) | Systems and methods for intelligent promotion design with promotion scoring | |
TWM624658U (zh) | 以用戶短期特徵預測用戶是否屬於價值用戶群的預測裝置 | |
US20130046619A1 (en) | System and method for targeted advertising | |
US20130204823A1 (en) | Tools and methods for determining relationship values | |
US20160063546A1 (en) | Method and system for making timely and targeted offers | |
Wong et al. | Identifying valuable travelers and their next foreign destination by the application of data mining techniques | |
US20110178843A1 (en) | System and method for using spend behavior to identify a population of consumers that meet a specified criteria | |
WO2018213019A1 (en) | Systems and methods for intelligent promotion design with promotion selection | |
JP2011134356A (ja) | キャンペーン動的適正化システム及びその方法又はその方法を記録した記録媒体及びその方法を伝送する伝送媒体 | |
Leeflang et al. | Identifying the direct mail-prone consumer | |
KR20230142975A (ko) | 온오프라인 통합 고객행동기반 개인화 마케팅 시스템 | |
US20210312494A1 (en) | Systems and methods for intelligent promotion design with promotion selection | |
TW202312060A (zh) | 以用戶短期特徵預測用戶是否屬於價值用戶群的預測裝置、方法與儲存該方法的儲存媒介 | |
US9940640B2 (en) | Automated event correlation to improve promotional testing | |
Leventhal | Predictive Analytics for Marketers: Using Data Mining for Business Advantage | |
Colot et al. | Alternatives for Telco Data Network: the value of spatial and referral networks for churn detection | |
Patil et al. | A Web Application for Customer Segment based Black Friday Sales Forecast |