TW202022751A - 基於資料與文字探勘技術產生優惠組合推薦之方法 - Google Patents
基於資料與文字探勘技術產生優惠組合推薦之方法 Download PDFInfo
- Publication number
- TW202022751A TW202022751A TW107144985A TW107144985A TW202022751A TW 202022751 A TW202022751 A TW 202022751A TW 107144985 A TW107144985 A TW 107144985A TW 107144985 A TW107144985 A TW 107144985A TW 202022751 A TW202022751 A TW 202022751A
- Authority
- TW
- Taiwan
- Prior art keywords
- group
- preferential
- target
- discount
- customer group
- Prior art date
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本發明結合分類與分群之資料探勘技術及文字探勘技術,根據客戶顯著屬性從目標客群中區分出具顯著差異的行銷群組,並標記出各行銷群組的核心優惠關鍵字,有助於行銷人員了解目標客群的特性,設計出兼具精準行銷與差異行銷之優惠組合。
Description
本發明是有關於一種基於資料與文字探勘技術的方法,且特別是有關於一種基於資料與文字探勘技術產生優惠組合推薦之方法。
因電信業競爭日益激烈且開發全新用戶不易,故各家業者推出各種優惠促銷吸引客戶攜碼轉換。然而,根據實務觀察,有些用戶攜碼轉換至其他業者後仍會回流至原業者。因此,如何有效預測出這些族群,並即時推出吸引其回流的優惠產品,以期達到精準且具差異性的行銷作業,實為本領域具通常知識者亟欲解決之議題。
有鑑於此,本發明提供一種基於資料與文字探勘技術產生差異化的優惠組合推薦之方法,其可用以解決上述技術問題。
本發明提供一種基於資料與文字探勘技術產生差異化的優惠組合推薦之方法,包括:取得目標客群與相對應目標客群的歷史銷售資料及優惠歷史資料;基於目標客群與相對應目標客群的歷史銷售資料建立一分類模型以及一分群模型,其中分類模型用以找出欲行銷客群中的行銷客群,而分群模型用以將目標客群區分為多個目標群組以及將行銷客群區分為多個行銷群組;基於目標客群與相對應目標客群的優惠歷史資料找出優惠關鍵字分類表;基於各目標群組對應的客戶屬性及優惠關鍵字對各目標群組進行差異性分析,以取得客戶群組屬性差異表及優惠關鍵字群組差異表,以及對應於各目標群組的核心優惠;依據客戶群組屬性差異表產生對應於各行銷群組的行銷群組策略,再依據優惠關鍵字分類表及客戶群組屬性差異表與現行優惠進行比對,取得對於各行銷群組的合適推薦優惠,並加入對應各目標群組的核心優惠,以產生對應各行銷群組的優惠推薦組合;以及依據對各行銷群組採用對應的優惠推薦組合的銷售結果更新對應各行銷群組的優惠推薦組合。
基於上述,本發明係揭露一種基於資料與文字探勘技術,輔以銷售後資訊回饋調適,以對於行銷群組快速產生差異化的優惠組合推薦之方法。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
請參考圖1,其是依據本發明之一實施例繪示的基於資料與文字探勘技術產生差異化的優惠組合推薦之方法流程圖。概略而言,本發明結合分類與分群之資料探勘技術及文字探勘技術,根據客戶顯著屬性從目標客群中區分出具顯著差異的行銷群組,並標記出各行銷群組的核心優惠關鍵字,有助於行銷人員了解目標客群的特性,設計出兼具精準行銷與差異行銷之優惠組合。並且,本發明可更進一步結合關聯分析技術,快速產生此客群行銷群組的差異化優惠組合設計推薦,讓行銷人員能更方便且快速地設計優惠組合,更專注於客群開發,活動設計等行銷作業。此外,本發明可更進一步根據市場銷售數據更新關鍵參數,以產生更符合市場需求的推薦優惠組合,以期即時因應市場銷售變化。以下將作進一步說明。
在步驟100中,其主要包括取得目標客群與相對應目標客群的歷史銷售資料及優惠歷史資料,並定義目標客群與相對應目標客群之客戶顯著屬性。在一實施例中,可透過銷售之歷史資料,進行兩客群之客戶屬性顯著性檢定,以得到重要顯著的客戶屬性資訊,提供後續的分類與分群模型建立之依據。另外,可採四分位數統計量當初始值以建立優惠重組推薦參數(包含影響程度基準值參數、正負向比例差距基準值參數與核心優惠關連維度下限基準值參數)評鑑表。
在步驟200中,可基於目標客群與相對應目標客群的歷史銷售資料建立一分類模型以及一分群模型,其中分類模型用以找出欲行銷客群中的行銷客群,而分群模型用以將行銷客群區分為多個行銷群組。概略而言,步驟200係基於步驟100的結構進行資料之標註、類別化與標準化等作業後,採用資料探勘技術對目標客群與相對應目標客群建立分類模型與分群模型,其中,分類模型用以區分出欲行銷客群中的行銷客群,分群模型用以將上述得到的行銷客群拆分成不同特徵的行銷群組,以及將目標客群區分為不同的目標群組,以利後續行銷作業,其中前述行銷群組一對一對應於前述目標群組。
在步驟300中,可基於目標客群與相對應目標客群的優惠歷史資料找出優惠關鍵字分類表。概略而言,步驟300可透過目標客群與相對應目標客群之優惠歷史資料,採用文字探勘技術擷取優惠關鍵字,依照其影響程度參數與正負向比例差距參數,判斷各優惠關鍵字影響程度與正負傾向,以取得優惠關鍵字分類表。
在步驟400中,可基於各目標群組對應的客戶屬性及優惠關鍵字對各目標群組進行差異性分析,以取得客戶群組屬性差異表及優惠關鍵字群組差異表,以及對應於各目標群組的核心優惠。概略而言,步驟400可根據步驟200與300所得之結果,進行各目標群組的差異性分析,其中客戶屬性與優惠關鍵字可採用ANOVA與卡方檢定,以取得客戶群組屬性差異表與優惠關鍵字群組差異表。此外,優惠關連可採用關連分析技術,依照核心優惠關連維度下限參數,以取得各群組之核心優惠。
在步驟500中,可依據客戶群組屬性差異表產生對應於各行銷群組的行銷群組策略,再依據優惠關鍵字分類表及客戶群組屬性差異表與現行優惠進行比對,取得對於各行銷群組的合適推薦優惠,並加入對應各目標群組的核心優惠,以產生對應各行銷群組的優惠推薦組合。概略而言,在步驟500,可根據步驟300與400所得之結果,依群組屬性差異表擬定行銷群組策略,再依優惠關鍵字分類表及群組屬性差異表與現行優惠進行比對,取得的行銷群組合適推薦優惠,最後加入群組之核心優惠,以產生行銷群組優惠推薦組合。
在步驟600中,可依據對各行銷群組採用對應的優惠推薦組合的銷售結果更新對應各行銷群組的優惠推薦組合。概略而言,在步驟600中可依銷售歷史紀錄,更新客戶屬性資料與優惠資料,並以前次基準值與當前四分位差統計量,更新優惠重組推薦參數評鑑表,進行資料回饋重新運算,以調適行銷群組優惠推薦組合。
藉此,當行銷人員有目標客群之行銷需求時,係利用目標客群之客戶屬性與優惠歷史資料,透過上述步驟,即可快速取得不同行銷客群的差異化優惠組合設計推薦。以下將對上述各步驟的技術細節作進一步說明。
請參照圖2,其是依據本發明圖1實施例繪示的步驟100的詳細流程。首先,在步驟101中,可定義目標客群與相對應目標客群。在本實施例中,可依行銷需求定義三個客群,即為目標客群、相對應目標客群與欲行銷客群,並設定可取得的客戶相關屬性。在不同的實施例中,目標客群包括曾經離網且回流之用戶,相對應目標客群包括曾經離網且未回流用戶,欲行銷客群包括曾經離網且未知是否回流的用戶,行銷客群包括曾經離網且預測會回流的用戶,但可不限於此。
在一實施例中,若為第一次實施,「優惠重組推薦參數評鑑表」基準項(即,前次基準值)可預設為0。
在步驟103中,可依照步驟101的結果,擷取目標客群與相對應目標客群的客戶屬性資料與優惠歷史資料。
在步驟104中,可依照步驟101與103的結果,進行目標客群與相對應目標客群的差異性分析,以從客戶屬性資料中找出目標客群與相對應目標客群的顯著差異屬性。在不同的實施例中,可針對目標客群與相對應目標客群之客戶屬性資料逐一進行兩客群的差異性檢定,若客戶屬性資料為數值連續型資料,可採用T檢定(T-test)或是單因子獨立變異數分析(ONEWAY-ANOVA)進行檢定;若客戶屬性資料為類別型資料,可採用卡方適合度檢定(Chi-square Goodness of Fit)進行檢定。
在步驟105中,可依照步驟104的結果,保留目標客群與相對應目標客群之間有顯著差異的客戶屬性資料,以供後續使用。
請參照圖3,其是依據本發明圖1實施例繪示的步驟200的詳細流程。在步驟201中,可取得目標客群與相對應目標客群之間有顯著差異的客戶屬性資料。
在步驟202中,可將目標客群的顯著差異屬性對應的分類屬性標註為第一狀態以及將相對應目標客群的顯著差異屬性對應的分類屬性標註為第二狀態。在一實施例中,可將目標客群與相對應目標客群各新增一個分類屬性,其中目標客群的分類屬性值設定為Y或1,相對應目標客群的分類屬性值設定為N或0,供分類模型建立之使用。
在步驟203中,可將目標客群與相對應目標客群之間有顯著差異的客戶屬性資料進行類別化及標準化。舉例而言,可逐一檢視每個客戶屬性,若此屬性值的值域太過分散,或有行銷特殊需求,便可將此客戶屬性值進行類別化,供分類模型建立之使用,例如:客戶年齡屬性,即可分類為15歲以下、15歲~30歲、30歲~50歲、50歲以上四個類別。若此客戶屬性值為數值連續型,則將此屬性進行標準化作業,供分群模型建立之使用,標準化方式可採用Min-Max標準化或Z-score 標準化,本方法可預設為使用Z-score進行標準化,但可不限於此。
在步驟204中,可基於類別化及標準化後的目標客群與相對應目標客群的顯著差異屬性,以及目標客群與相對應目標客群的顯著差異屬性對應的分類屬性建立分類模型。在一實施例中,可依據步驟203的結果而採用多種分類模型建立演算法,以為目標客群與相對應目標客群建立分類模型,例如:決策樹、SVM、C4.5等演算法,以供後續使用。並且,可擷取各分類模型之準確率最高且非過度擬合(Overfitting)的模型作為上述分類模型,以供後續使用。
在步驟206中,可基於標準化後的目標客群的顯著差異屬性建立分群模型。在不同的實施例中,可依照步驟203的結果,採用多種分群模型演算法,將目標客群建立分群模型,例如:K-means、K-medoids、EM等演算法,以供後續使用。並且,可擷取各分類模型之群組數適中,且各群組的客戶數差距適當的分群模型,以供後續使用。
在步驟208中,可依照步驟204的結果,將欲行銷客群代入分類模型以取得行銷客群,以供後續使用。
在步驟209中,可依照步驟204、206的結果,將行銷客群帶入分群模型進行群組歸屬作業,以取得行銷群組,以供後續使用;其中群組歸屬可採用多種距離公式,如歐幾里得距離、馬式距離、Lance距離等,本方法可預設採用歐幾里得距離,但可不限於此。
請參照圖4A,其是依據本發明圖1實施例繪示的步驟300的詳細流程。在步驟301中,可取得定義目標客群與相對應目標客群之優惠歷史資料。在本實施例中,可依照步驟105的結果,擷取目標客群與相對應目標客群之優惠歷史資料,供後續步驟使用。
在步驟302中,可採用資料探勘工具對目標客群與相對應目標客群的優惠歷史資料進行文字探勘,以找出對應於目標客群與相對應目標客群的多個優惠關鍵字。在一實施例中,可採用資料探勘工具(如:R)進行文字探勘,解構優惠產品描述,以產生兩客群之優惠關鍵字文字雲,供後續步驟使用。
在步驟303中,可計算各優惠關鍵字被目標客群與相對應目標客群採用的次數,以取得優惠關鍵字選取次數表。在一實施例中,可根據步驟302的結果,計算每個優惠關鍵字被目標客群與相對應目標客群採用的次數,以取得優惠關鍵字選取次數表,供後續使用。
在步驟304中,可基於優惠關鍵字選取次數表計算各優惠關鍵字的影響程度及正負向比例差距。在一實施例中,可根據步驟303的結果,分別計算每個優惠關鍵字的影響程度與正負向比例差距,供後續使用。具體而言,假設:(1)目標客群的人數為TN;(2)相對應目標客群人數為CN;(3)優惠文字經探勘後共有m組優惠關鍵字:, i = 1,2,3…m;(4)全部客群選取的客戶人數:, i = 1,2,3…m;(5)目標客群選取的客戶人數:;(6)相對應目標客群選取客戶人數:。在上述假設之下,相關的計算公式如下:(1)影響程度:, i = 1,2,3…m,其中 x 100% , i = 1,2,3…m;(2)正向性比例;(3)負向性比例;(4)的正負向比例差距:。若,稱之具正向傾性,反之稱為具負向傾性。
在步驟305中,可依照優惠關鍵字的影響程度與正負向比例差距參數判斷優惠關鍵字的重要性。在一實施例中,可根據步驟304的結果,取得優惠關鍵字的影響程度及正負向差距之四分位數統計量,並與「優惠重組推薦參數評鑑表」中的影響程度參數基準值與正負向差距參數基準值做比較,取得此次優惠關鍵字重要性與正負向差距基準值判斷依據,其比較方式如下。定義(1)影響程度基準值參數(Influence level Parameter)為 IP;(2);(3)的所有關鍵字影響程度集合之第三四分位數()。基此,相關的計算公式為: ,其中若影響程度大於的優惠關鍵字為空集合,則。
另外,定義(1)正向比例差距基準值參數(Positive Parameter) 為 POP;(2);(3)的具正向傾性關鍵字之正負向比例差距集合的第三四分位數(Q3)。基此,相關的計算公式為: ,其中若正向比例差距大於的優惠關鍵字為空集合,則
再者,定義:(1)負向比例差距基準值參數(Negative Parameter) 為 NEP;(2)(3)具負向性質關鍵字的正負向比例差距集合之第一四分位數()。基此,相關的計算公式為: ,其中若負向比例小於的優惠關鍵字為空集合,則。
在不同的實施例中,若優惠關鍵字的影響程度大於影響程度基準值參數,則將之標示為主要優惠關鍵字,反之則標示為次要優惠關鍵字。若優惠關鍵字的正負向比例差距大於正向比例差距基準值參數則將之標示為正向性。若優惠關鍵字正負向比例差距小於負向比例差距基準值參數則將之標示為負向性。另外,若優惠關鍵字的正負向比例差距介於正向比例差距參數基準值及負向比例差距參數基準值之間,則將優惠關鍵字標示為無關連。
之後,在步驟306中,可基於各優惠關鍵字的標示結果產生優惠關鍵字分類表。在一實施例中,可根據步驟305的結果,將優惠關鍵字之標示分成六個種類,以得到優惠關鍵字分類表,以供後續使用,如圖4B所示。
請參照圖5A,其是依據圖1實施例繪示的步驟400的詳細流程。在本實施例中,目標客群可基於分群模型而被區為多個目標群組。
在步驟401中,可取得各目標群組的客戶屬性資料、優惠關鍵字與優惠歷史資料。在一實施例中,可根據步驟100、200、300所得之結果,分別擷取各目標群組之客戶屬性資料、優惠關鍵字與優惠歷史資料,以供後續使用。
在步驟402中,可執行各目標群組的優惠關鍵字的差異性檢定,以得到各目標群組的顯著差異的優惠關鍵字。在一實施例中,可根據步驟401所得之結果,採用卡方適合度檢定(Chi-square Goodness of Fit)進行目標群組之優惠關鍵字差異性檢定,以得到各目標群組具有顯著差異的優惠關鍵字。
在步驟404中,可執行各目標群組的客戶屬性資料的差異性檢定,以得到各目標群組的顯著差異的客戶屬性資料。在一實施例中,可根據步驟401所得之結果,依據客戶屬性資料的類型,可分別採用T檢定(T-test)、單因子獨立變異數分析(ONEWAY-ANOVA)進行檢定或卡方適合度檢定(Chi-square Goodness of Fit)進行目標群組的客戶屬性資料的差異性檢定,以得到各目標群組中具有顯著差異的客戶屬性資料。
在步驟406中,可基於各目標群組的優惠歷史資料進行優惠關連分析,以產生各目標群組的優惠關連圖,其中優惠歷史資料包括各目標群組的優惠產品,而優惠關連圖中的各優惠產品具有對應的優惠維度。在一實施例中,可根據步驟401所得之結果,進行目標群組進行優惠關連分析以得到各目標群組的優惠關連圖,其步驟如下:(步驟1):選擇一客戶受理的優惠產品的紀錄,如:A、B、C三個優惠產品,其中主優惠產品為A,附屬優惠產品為B、C;(步驟2):依主、附優惠產品關連順序將受理的優惠產品連接,如:A-B-C,並連接前先檢查關聯網路中是否存在對應的點及邊,若無則新增,若已存在不須重覆建立;(步驟3):對所有目標客群中的客戶重複上述步驟直至完成。完成後的優惠關連圖可參照圖5B所示,但本發明可不限於此。
在步驟407中,可計算優惠關連維度。在一實施例中,可根據步驟406所得之結果,計算各目標群組的優惠關連維度,其計算機制如下:若優惠關連維度(Related Degree)為RD,則RD即為此優惠產品所連接的線之數量。
在步驟408中,可依照核心優惠關連維度的下限基準參數判斷核心優惠。在一實施例中,可根據步驟406所得之結果,分別計算目標群組之此次核心優惠關連維度下限基準參數,相關計算機制包括:(1)定義核心優惠關連維度下限基準參數(Related Degree Lower limit)為RDL;(2):第 t 次的核心優惠關連維度下限基準參數;(3):第t次的所有集合之第三四分位數()。相關計算公式包括: ,其中若大於的優惠關鍵字為空集合,則,而若優惠產品的關連維度大於核心優惠關連維度下限基準參數,則標示此優惠產品為核心優惠。
請參照圖6,其是依據圖1實施例繪示的步驟500的詳細流程。在步驟501中,可依客戶群組屬性差異表擬定行銷群組策略。在本實施例中,可根據步驟200與405結果,以客戶群組屬性差異表與行銷需求為依據,設定行銷群組策略,如下表6的「行銷群組優惠推薦組合表」所示。
表6
在步驟502中,可依優惠關鍵字分類表與現有優惠進行關鍵字比對。在一實施例中,可根據步驟200與405結果,以優惠關鍵字分類表,取得圖4B所示「優惠關鍵字分類表」中之A、D、E項中優惠關鍵字與現行優惠的關鍵字進行比對,以得到欲行銷的優惠產品,其中A、D項對應之優惠產品稱為主要、次要優惠產品,E項對應之優惠產品稱為基本優惠產品。
在步驟503中,可取得行銷客群合適推薦優惠。在一實施例中,可根據步驟502結果,擷取主要、次要優惠產品與基本優惠產品即為行銷客群合適推薦優惠,如上表6的「行銷群組優惠推薦組合表」所示。
在步驟504中,可依群組優惠關鍵字差異表與推薦優惠進行比對。在一實施例中,可根據步驟200與405結果,以優惠關鍵字群組差異表,取各群組優惠關鍵字與現行優惠的關鍵字進行比對,以得到欲行銷的優惠產品。
在步驟505中,可取得行銷群組合適推薦優惠。在一實施例中,可根據步驟503的結果,將欲行銷優惠產品分別對應至各行銷群組中,以得到合適行銷群組推薦優惠,如上表6所示。
在步驟506中,可加入核心優惠。在一實施例中,可根據步驟409得到的結果,將群組核心優惠加入合適行銷群組推薦優惠中。
在步驟507中,可產生行銷群組優惠推薦組合。在一實施例中,可根據步驟501、506所得到的結果,產生行銷群組優惠推薦組合,以供銷售單位行銷使用,如上表6所示。
請參照圖7,其是依據圖1實施例繪示的步驟600的詳細流程。
在步驟601中,可取得銷售後之客群資料與優惠資料。在一實施例中,當行銷單位依照步驟507所得之行銷群組優惠推薦組合進行銷售一段時間後,可擷取銷售後的客群資料與優惠資料。
在步驟602中,可更新客戶屬性資料與優惠歷史資料。在一實施例中,可根據步驟501的結果,更新客戶屬性資料與優惠歷史資料。
在步驟603中,可更新優惠關鍵字分類表參數。在一實施例中,可根據步驟305計算出的影響程度基準值參數、正負向比例差距基準值參數,更新至優惠重組推薦參數評鑑表中。
在步驟604中,可更新優惠關鍵字關連表參數。在一實施例中,可根據步驟408計算出的核心優惠關連維度下限基準參數,更新至優惠重組推薦參數評鑑表中,若有多個群組則取群組中最大者當作前次基準值。
由上可知,本發明所提出的方法係一種基於資料探勘技術之自我調適優惠重組推薦方法,不侷限於任何產業,皆可根據本方法之步驟據以實施。
舉例而言,針對先前技術中所提及的電信業行銷需求,亦可依本發明提出的方法步驟而解決相關的技術問題,從而達到精準且具差異性的行銷作業,具體說明如下。
首先,由於在上述情境中的需求為吸引攜碼轉換至其他業者之用戶(簡稱離網用戶)回流至原業者,故在步驟100中所定義相關客群可包括:(1)目標客群(簡稱TG):曾經離網且回流之用戶;(2)相對應目標客群(簡稱CTG):曾經離網且未回流用戶;(3)欲行銷客群(簡稱WPG):曾經離網且未知是否回流的用戶;(4)行銷客群(簡稱PG):曾經離網且預測會回流用戶。
此外,需擷取TG、CTG、WPG之離網前之歷史資料,包含客戶屬性資料與優惠歷史資料。在一實施例中,所採用的資料擷取時間點為:(1)TG為2016/10/01 ~2016/12/31離網且於2017/04前回流;(2)CTG為2016/10/01 ~2016/12/31離網且於2017/04未回流;(3)WPG為2017/01~2017/03離網至2017/06月仍未回流。經資料清洗之後,可用的筆數為:TG共有1,635用戶數、CTG共有7,369用戶數,WPG共有19,067用戶數,並且共得到200多個可用的客戶屬性資料。
首先進行兩族群(TG與CTG)重要客戶屬性的差異性檢定,若客戶屬性資料為連續型資料,可採用單因子獨立變異數分析(ONEWAY-ANOVA)進行檢定;若客戶屬性資料為類別型資料,則可採用卡方適合度檢定(Chi-square Goodness of Fit)進行檢定,但可不限於此。檢定結果顯示,具顯著差異的客戶屬性資料共23個,如下表7的顯著客戶屬性列表所示,而此23個客戶屬性資料便可提供後續分群與分類模型使用。
表7
假設此次為第一次實施,故無前次基準值,因而可將表8中的基準項預設為0。
接著,在步驟200中,可根據步驟100所得的結果,將TG與CTG進行資料標註。並且,可新增一是否回流(NP)欄位,並將TG的所有筆數的NP欄位填入Y,CTG則填入N。在不同的實施例中,由於部分的客戶屬性資料的值域可能過大,不利於分類模型的建立,故可依照業務知識與資料分佈情況進行類別化作業以利分類模型的建立。標註與類別化部分結果如下表10的客戶屬性類別化與標註結果表所示。
表10
在表10中,可看出在TG及CTG中之間具有顯著差異的客戶屬性資料例如包括年資、年齡、購機次數、購機金額、數據流量等,但可不限於此。
在本實施例中,可採用多種分類演算法來針對TG與CTG建立分類模型,結果如圖8。在圖8中,排除過度擬合(Overfitting)的模型,其餘模型其準確率皆達80%以上,而以下實例將採用Bagging演算法作為所使用的分類模型,以提供欲行銷客群中每個用戶回流的預測機率。
接著針對TG進行分群作業,以得到分群模型,因分群演算法的屬性值域需數值型變數,故刪除2個類別型的客戶屬性資料(例如表10中的「門號資費類型」及「持機廠牌」)。此外,由於各客戶屬性資料的單位不同,故以Z-Score標準化剩下的21個客戶屬性資料。
在本實施例中,可採用K-means、K-medoids、EM等演算法作為分群模型。經分析結果,用K-Means演算法作為分群模型所得到的群組數與各群組中的人數分佈較為適當,而相關的分群結果如下,目標群組共3群(TG1、TG2、TG3),其中TG1共569用戶數、TG2共306用戶數、TG3共760用戶數,如下表11所示。
表11
之後,將WPG帶入上述得到分類模型與分群模型進行分類預測與群組歸屬作業以得到行銷客群(PG),其中群組歸屬可採用多種距離公式,如歐幾里得距離、馬式距離、Lance距離等。在本實施例中採用歐幾里得距離,其結果如下:PG共有2,868用戶數,歸屬為三個行銷群組(PG1、PG2、PG3),其中PG1共1,291用戶數、PG2共850用戶數、PG3共727用戶數,如表12所示。
表12
在步驟300中,可針對TG與CTG之優惠歷史資料進行文字探勘,得到優惠關鍵字分類表。在不同的實施例中,可依需求採用不同的文字探勘工具。在本實施例中,係採用R語言進行文字探勘以解構優惠產品描述,過程中依照業務需求合併關鍵字或取消無效關鍵字。相關的文字探勘後的關鍵字部分結果如下表13、14及15所示,其中表13為優惠關鍵字的影響程度列表,表14為優惠關鍵字的正向比例差距列表,表15為優惠關鍵字的負向比例差距列表。
表13
表14
表15
根據IP、POP與NEP以得到優惠關鍵字分類表,如圖9所示。
接著,在步驟400中,可針對TG三個群組中之客戶屬性資料進行差異性檢定分析,以得到客戶群組屬性差異表與優惠關鍵字群組差異表。熟知技藝人士很容易明白,欲瞭解不同群組間的某個性質是否有顯著差異,可使用多種統計檢定技術。在本實施例中,可對數值型資料採用ANOVA,並對類別型資料採用卡方檢定,來判別其是否有顯著差異,得到的結果如下表17的客戶群組屬性差異表及表18的優惠關鍵字群組差異表所示。
表17
表18
在表17及表18中,針對客戶屬性部分,TG1有高比例行動用戶設備數高達3門以上,TG2有高比例最常發話行動業者分鐘數超過60分鐘,TG3行動數據流量2GB以下佔比超過40%。
另外,亦針對TG的三個群組進行優惠關連分析,依照步驟406說明,畫出三群組之優惠關連圖,並依序找出三個群組之核心優惠關連維度下限基準參數(Related Degree Lower limit ,RDL)。上述結果分別如下表19的TG1優惠關連維度列表、下表20的TG2優惠關連維度列表、下表21的TG3優惠關連維度列表以及下表22的核心優惠關連維度下限基準參數表所示。
表19
表20
表21
表22
在步驟500中,可參考先前實施例中的說明而分別擬定行銷群組策略、行銷客群合適推薦優惠、行銷群組合適推薦優惠,並加入核心優惠以得到行銷群組優惠推薦組合,其原則為:以核心優惠主約必擇一,搭配適當的合適推薦優惠與群組推薦優惠,結果如下表24所示。
表24
在步驟600中,在行銷單位採納上述之優惠推薦組合進行銷售過後,依銷售歷史紀錄,包含:TG、CTG之客戶屬性資料與優惠資料進行回饋作業,同時更新優惠重組推薦參數評鑑表,以調適行銷群組優惠推薦組合以符合市場脈動。
在表24中,核心優惠關連維度下限基準值參數(RDL)為各群基準值取最大者,即MAX(7,6,10) = 10。
綜上所述,本發明的基於資料與文字探勘技術產生差異化的優惠組合推薦之方法可基於資料與文字探勘技術,輔以銷售後資訊回饋調適,以對於行銷客群快速產生差異化的優惠組合推薦之方法。並且,當行銷人員有目標客群之行銷需求時,係利用目標客群與相對應之目標客群的客戶屬性與優惠歷史資料,透過本發明揭露之方法,結合資料(分類、分群)、文字(關鍵字解析)探勘技術及關連分析技術,快速產生此客群行銷群組的差異化優惠組合設計推薦。此外,當行銷人員採納推薦推出此優惠組合後,亦可根據銷售數據更新關鍵參數,並重新執行本方法,以產生更符合市場需求的推薦優惠組合,以期即時因應市場銷售變化。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
100、200、300、400、500、600、101~105、201~209、301~306、401~409、501~507、601~604:步驟
圖1是依據本發明之一實施例繪示的基於資料與文字探勘技術產生差異化的優惠組合推薦之方法流程圖。 圖2是依據本發明圖1實施例繪示的步驟100的詳細流程。 圖3是依據本發明圖1實施例繪示的步驟200的詳細流程。 圖4A是依據本發明圖1實施例繪示的步驟300的詳細流程。 圖4B是依據本發明之一實施例繪示的優惠關鍵字分類表。 圖5A是依據圖1實施例繪示的步驟400的詳細流程。 圖5B是依據本發明之一實施例繪示的優惠關連圖。 圖6是依據圖1實施例繪示的步驟500的詳細流程。 圖7是依據圖1實施例繪示的步驟600的詳細流程。 圖8是依據本發明之一實施例繪示的多種分類演算法示意圖。 圖9是依據本發明之一實施例繪示的優惠關鍵字分類表。
100、200、300、400、500、600:步驟
Claims (8)
- 一種基於資料與文字探勘技術產生差異化的優惠組合推薦之方法,包括: 取得目標客群與相對應目標客群的歷史銷售資料及優惠歷史資料; 基於該目標客群與該相對應目標客群的該歷史銷售資料建立一分類模型以及一分群模型,其中該分類模型用以找出欲行銷客群中的行銷客群,而該分群模型用以將該目標客群區分為多個目標群組以及將該行銷客群區分為多個行銷群組; 基於該目標客群與該相對應目標客群的該優惠歷史資料找出優惠關鍵字分類表; 基於各該目標群組對應的客戶屬性及優惠關鍵字對各該目標群組進行差異性分析,以取得客戶群組屬性差異表及優惠關鍵字群組差異表,以及對應於各該目標群組的核心優惠; 依據該客戶群組屬性差異表產生對應於各該行銷群組的行銷群組策略,再依據該優惠關鍵字分類表及該客戶群組屬性差異表與現行優惠進行比對,取得對於各該行銷群組的合適推薦優惠,並加入對應各該目標群組的該核心優惠,以產生對應各該行銷群組的優惠推薦組合;以及 依據對各該行銷群組採用對應的該優惠推薦組合的銷售結果更新對應各該行銷群組的該優惠推薦組合。
- 如申請專利範圍第1項所述的方法,其中該目標客群包括曾經離網且回流之用戶,該相對應目標客群包括曾經離網且未回流用戶,該欲行銷客群包括曾經離網且未知是否回流的用戶,該行銷客群包括曾經離網且預測會回流的用戶。
- 如申請專利範圍第1項所述的方法,其中取得該目標客群與該相對應目標客群的該歷史銷售資料及優惠歷史資料的步驟包括: 擷取該目標客群與該相對應目標客群的客戶屬性資料,並據以進行該目標客群與該相對應目標客群的差異性分析,以從該客戶屬性資料中找出該目標客群與該相對應目標客群的顯著差異屬性。
- 如申請專利範圍第3項所述的方法,其中基於該目標客群與該相對應目標客群的該歷史銷售資料建立該分類模型以及該分群模型的步驟包括: 取得該目標客群與該相對應目標客群的該顯著差異屬性; 將該目標客群的該顯著差異屬性對應的分類屬性標註為第一狀態; 將該相對應目標客群的該顯著差異屬性對應的分類屬性標註為第二狀態; 將該目標客群與該相對應目標客群的該顯著差異屬性進行類別化及標準化; 基於類別化及標準化後的該目標客群與該相對應目標客群的該顯著差異屬性,以及該目標客群與該相對應目標客群的該顯著差異屬性對應的分類屬性建立該分類模型;以及 基於標準化後的該目標客群的該顯著差異屬性建立該分群模型。
- 如申請專利範圍第1項所述的方法,其中基於該目標客群與該相對應目標客群的該優惠歷史資料找出該優惠關鍵字分類表的步驟包括: 取得一優惠重組推薦參數評鑑表,其包括影響程度參數基準值、正向比例差距參數基準值及負向比例差距參數基準值; 採用資料探勘工具對該目標客群與該相對應目標客群的該優惠歷史資料進行文字探勘,以找出對應於該目標客群與該相對應目標客群的多個優惠關鍵字; 計算各該優惠關鍵字被該目標客群與該相對應目標客群採用的次數,以取得優惠關鍵字選取次數表; 基於該優惠關鍵字選取次數表計算各該優惠關鍵字的影響程度及正負向比例差距; 若該些優惠關鍵字的第一優惠關鍵字的該影響程度大於該影響程度參數基準值,定義該第一優惠關鍵字為主要優惠關鍵字,反之行定義該第一優惠關鍵字為次要優惠關鍵字; 若該第一優惠關鍵字的該正負向比例差距大於該正向比例差距參數基準值,則將該第一優惠關鍵字標示為正向性; 若該第一優惠關鍵字的該正負向比例差距小於該負向比例差距參數基準值,則將該第一優惠關鍵字標示為負向性; 若該第一優惠關鍵字的該正負向比例差距介於該正向比例差距參數基準值及該負向比例差距參數基準值之間,則將該第一優惠關鍵字標示為無關連;以及 基於各該優惠關鍵字的標示結果產生該優惠關鍵字分類表。
- 如申請專利範圍第5項所述的方法,其中基於該優惠關鍵字選取次數表計算各該優惠關鍵字的該影響程度及該正負向比例差距的步驟包括: 定義該目標客群的人數為TN; 定義該相對應目標客群人數為CN; 定義該些優惠關鍵字中的第i個優惠關鍵字為,其中i = 1,2,3…m,m為該些優惠關鍵字的組數; 定義該目標客群及該相對應目標客群中選取的客戶人數為,其中i = 1,2,3…m; 定義該目標客群中選取的客戶人數為,其中; 定義該相對應目標客群中選取客戶人數為,其中; 計算的該影響程度為, i = 1,2,3…m,其中 x 100% , i = 1,2,3…m; 計算的正向性比例為; 計算的負向性比例為; 計算的的該正負向比例差距為。
- 如申請專利範圍第1項所述的方法,其中基於各該目標群組對應的該客戶屬性及該優惠關鍵字對各該目標群組進行差異性分析,以取得該客戶群組屬性差異表及該優惠關鍵字群組差異表,以及對應於各該目標群組的該核心優惠的步驟包括: 取得各該目標群組的客戶屬性、優惠關鍵字與優惠產品; 執行各該目標群組的該優惠關鍵字的差異性檢定,以得到各該目標群組的顯著差異的優惠關鍵字; 基於各該目標群組的顯著差異的該優惠關鍵字產生優惠關鍵字群組差異表; 執行各目標群組的該客戶屬性的差異性檢定,以得到各該目標群組的顯著差異的客戶屬性; 基於各該目標群組的顯著差異的客戶屬性產生客戶群組屬性差異表; 基於各該目標群組的該優惠產品進行優惠關連分析,以產生各該目標群組的優惠關連圖,其中該優惠關連圖中的各該優惠產品具有對應的優惠維度;以及 找出各該目標群組的優惠維度大於核心優惠關連維度下限基準參數表的該優惠產品,以得到各該目標群組的核心優惠表,其中該核心優惠表包括對應於各該行銷群組的該核心優惠。
- 如申請專利範圍第1項所述的方法,其中依據對各該行銷群組採用對應的該優惠推薦組合的銷售結果更新對應各該行銷群組的該優惠推薦組合的步驟包括: 取得該銷售結果,其中該銷售結果包括銷售後之客群資料與優惠資料; 基於該銷售結果更新該客戶屬性資料與該優惠歷史資料; 基於更新的該客戶屬性資料與該優惠歷史資料更新該優惠重組推薦參數評鑑表中的該影響程度參數基準值、該正向比例差距參數基準值及該負向比例差距參數基準值; 基於更新後的該優惠重組推薦參數評鑑表更新該優惠關鍵字分類表; 基於各該目標群組對應的該客戶屬性及該優惠關鍵字對各該目標行銷群組進行差異性分析,以更新該客戶群組屬性差異表及該優惠關鍵字群組差異表,以及對應於各該目標群組的該核心優惠;以及 依據該客戶群組屬性差異表更新對應於各該行銷群組的該行銷群組策略,再依據該優惠關鍵字分類表及該客戶群組屬性差異表與現行優惠進行比對,取得對於各該行銷群組的合適推薦優惠,並加入對應各該目標群組的該核心優惠,以產生對應各該行銷群組的優惠推薦組合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107144985A TWI676143B (zh) | 2018-12-13 | 2018-12-13 | 基於資料與文字探勘技術產生優惠組合推薦之方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107144985A TWI676143B (zh) | 2018-12-13 | 2018-12-13 | 基於資料與文字探勘技術產生優惠組合推薦之方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI676143B TWI676143B (zh) | 2019-11-01 |
TW202022751A true TW202022751A (zh) | 2020-06-16 |
Family
ID=69189090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107144985A TWI676143B (zh) | 2018-12-13 | 2018-12-13 | 基於資料與文字探勘技術產生優惠組合推薦之方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI676143B (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7734641B2 (en) * | 2007-05-25 | 2010-06-08 | Peerset, Inc. | Recommendation systems and methods using interest correlation |
US8630902B2 (en) * | 2011-03-02 | 2014-01-14 | Adobe Systems Incorporated | Automatic classification of consumers into micro-segments |
TW201437961A (zh) * | 2013-03-18 | 2014-10-01 | Chunghwa Telecom Co Ltd | 電信產品組合分析與評量之方法與系統 |
TW201513011A (zh) * | 2013-09-25 | 2015-04-01 | Chunghwa Telecom Co Ltd | 一種智慧型最佳電信資費推薦方法 |
CN108171553A (zh) * | 2018-01-17 | 2018-06-15 | 焦点科技股份有限公司 | 一种周期性服务或产品的潜在客户挖掘系统与方法 |
-
2018
- 2018-12-13 TW TW107144985A patent/TWI676143B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
TWI676143B (zh) | 2019-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10078853B2 (en) | Offer matching for a user segment | |
CN102708131B (zh) | 将消费者自动分类到微细分中 | |
US8700468B2 (en) | Micro-segment definition system | |
US20180300748A1 (en) | Technologies for granular attribution of value to conversion events in multistage conversion processes | |
US10311469B2 (en) | Statistical marketing attribution correlation | |
US20160285672A1 (en) | Method and system for processing network media information | |
US20120046992A1 (en) | Enterprise-to-market network analysis for sales enablement and relationship building | |
US20220076299A1 (en) | Intelligent electronic advertisement generation and distribution | |
WO2019072128A1 (zh) | 对象识别方法及其系统 | |
US20160210656A1 (en) | System for marketing touchpoint attribution bias correction | |
CN104951468A (zh) | 数据搜索处理方法和系统 | |
US10983786B2 (en) | Automatically evaluating software project requirements | |
US9875484B1 (en) | Evaluating attribution models | |
US11295154B2 (en) | Physical item optimization using velocity factors | |
US20220253874A1 (en) | Product evaluation system and method of use | |
US10733240B1 (en) | Predicting contract details using an unstructured data source | |
CN115564531A (zh) | 商品组合推荐方法及其装置、设备、介质、产品 | |
CN111861679A (zh) | 一种基于人工智能的商品推荐方法 | |
US20200090110A1 (en) | System and method for cognitive and preemptive fashion inventory management & order fulfilment | |
CN108537599A (zh) | 基于关键词聚合的查询反馈方法、装置以及存储介质 | |
TW202022751A (zh) | 基於資料與文字探勘技術產生優惠組合推薦之方法 | |
JP7117440B1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
CN111353793A (zh) | Crm业务推荐方法及装置 | |
Maddodi et al. | Generating workload for erp applications through end-user organization categorization using high level business operation data | |
WO2017219317A1 (zh) | 一种基于搜索内容的信息推送方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |