TW202022751A - 基於資料與文字探勘技術產生優惠組合推薦之方法 - Google Patents

基於資料與文字探勘技術產生優惠組合推薦之方法 Download PDF

Info

Publication number
TW202022751A
TW202022751A TW107144985A TW107144985A TW202022751A TW 202022751 A TW202022751 A TW 202022751A TW 107144985 A TW107144985 A TW 107144985A TW 107144985 A TW107144985 A TW 107144985A TW 202022751 A TW202022751 A TW 202022751A
Authority
TW
Taiwan
Prior art keywords
group
preferential
target
discount
customer group
Prior art date
Application number
TW107144985A
Other languages
English (en)
Other versions
TWI676143B (zh
Inventor
楊智堯
李家珍
陳啟文
薛家豪
葉慧文
施嘉峻
陳奎伯
Original Assignee
中華電信股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中華電信股份有限公司 filed Critical 中華電信股份有限公司
Priority to TW107144985A priority Critical patent/TWI676143B/zh
Application granted granted Critical
Publication of TWI676143B publication Critical patent/TWI676143B/zh
Publication of TW202022751A publication Critical patent/TW202022751A/zh

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本發明結合分類與分群之資料探勘技術及文字探勘技術,根據客戶顯著屬性從目標客群中區分出具顯著差異的行銷群組,並標記出各行銷群組的核心優惠關鍵字,有助於行銷人員了解目標客群的特性,設計出兼具精準行銷與差異行銷之優惠組合。

Description

基於資料與文字探勘技術產生優惠組合推薦之方法
本發明是有關於一種基於資料與文字探勘技術的方法,且特別是有關於一種基於資料與文字探勘技術產生優惠組合推薦之方法。
因電信業競爭日益激烈且開發全新用戶不易,故各家業者推出各種優惠促銷吸引客戶攜碼轉換。然而,根據實務觀察,有些用戶攜碼轉換至其他業者後仍會回流至原業者。因此,如何有效預測出這些族群,並即時推出吸引其回流的優惠產品,以期達到精準且具差異性的行銷作業,實為本領域具通常知識者亟欲解決之議題。
有鑑於此,本發明提供一種基於資料與文字探勘技術產生差異化的優惠組合推薦之方法,其可用以解決上述技術問題。
本發明提供一種基於資料與文字探勘技術產生差異化的優惠組合推薦之方法,包括:取得目標客群與相對應目標客群的歷史銷售資料及優惠歷史資料;基於目標客群與相對應目標客群的歷史銷售資料建立一分類模型以及一分群模型,其中分類模型用以找出欲行銷客群中的行銷客群,而分群模型用以將目標客群區分為多個目標群組以及將行銷客群區分為多個行銷群組;基於目標客群與相對應目標客群的優惠歷史資料找出優惠關鍵字分類表;基於各目標群組對應的客戶屬性及優惠關鍵字對各目標群組進行差異性分析,以取得客戶群組屬性差異表及優惠關鍵字群組差異表,以及對應於各目標群組的核心優惠;依據客戶群組屬性差異表產生對應於各行銷群組的行銷群組策略,再依據優惠關鍵字分類表及客戶群組屬性差異表與現行優惠進行比對,取得對於各行銷群組的合適推薦優惠,並加入對應各目標群組的核心優惠,以產生對應各行銷群組的優惠推薦組合;以及依據對各行銷群組採用對應的優惠推薦組合的銷售結果更新對應各行銷群組的優惠推薦組合。
基於上述,本發明係揭露一種基於資料與文字探勘技術,輔以銷售後資訊回饋調適,以對於行銷群組快速產生差異化的優惠組合推薦之方法。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
請參考圖1,其是依據本發明之一實施例繪示的基於資料與文字探勘技術產生差異化的優惠組合推薦之方法流程圖。概略而言,本發明結合分類與分群之資料探勘技術及文字探勘技術,根據客戶顯著屬性從目標客群中區分出具顯著差異的行銷群組,並標記出各行銷群組的核心優惠關鍵字,有助於行銷人員了解目標客群的特性,設計出兼具精準行銷與差異行銷之優惠組合。並且,本發明可更進一步結合關聯分析技術,快速產生此客群行銷群組的差異化優惠組合設計推薦,讓行銷人員能更方便且快速地設計優惠組合,更專注於客群開發,活動設計等行銷作業。此外,本發明可更進一步根據市場銷售數據更新關鍵參數,以產生更符合市場需求的推薦優惠組合,以期即時因應市場銷售變化。以下將作進一步說明。
在步驟100中,其主要包括取得目標客群與相對應目標客群的歷史銷售資料及優惠歷史資料,並定義目標客群與相對應目標客群之客戶顯著屬性。在一實施例中,可透過銷售之歷史資料,進行兩客群之客戶屬性顯著性檢定,以得到重要顯著的客戶屬性資訊,提供後續的分類與分群模型建立之依據。另外,可採四分位數統計量當初始值以建立優惠重組推薦參數(包含影響程度基準值參數、正負向比例差距基準值參數與核心優惠關連維度下限基準值參數)評鑑表。
在步驟200中,可基於目標客群與相對應目標客群的歷史銷售資料建立一分類模型以及一分群模型,其中分類模型用以找出欲行銷客群中的行銷客群,而分群模型用以將行銷客群區分為多個行銷群組。概略而言,步驟200係基於步驟100的結構進行資料之標註、類別化與標準化等作業後,採用資料探勘技術對目標客群與相對應目標客群建立分類模型與分群模型,其中,分類模型用以區分出欲行銷客群中的行銷客群,分群模型用以將上述得到的行銷客群拆分成不同特徵的行銷群組,以及將目標客群區分為不同的目標群組,以利後續行銷作業,其中前述行銷群組一對一對應於前述目標群組。
在步驟300中,可基於目標客群與相對應目標客群的優惠歷史資料找出優惠關鍵字分類表。概略而言,步驟300可透過目標客群與相對應目標客群之優惠歷史資料,採用文字探勘技術擷取優惠關鍵字,依照其影響程度參數與正負向比例差距參數,判斷各優惠關鍵字影響程度與正負傾向,以取得優惠關鍵字分類表。
在步驟400中,可基於各目標群組對應的客戶屬性及優惠關鍵字對各目標群組進行差異性分析,以取得客戶群組屬性差異表及優惠關鍵字群組差異表,以及對應於各目標群組的核心優惠。概略而言,步驟400可根據步驟200與300所得之結果,進行各目標群組的差異性分析,其中客戶屬性與優惠關鍵字可採用ANOVA與卡方檢定,以取得客戶群組屬性差異表與優惠關鍵字群組差異表。此外,優惠關連可採用關連分析技術,依照核心優惠關連維度下限參數,以取得各群組之核心優惠。
在步驟500中,可依據客戶群組屬性差異表產生對應於各行銷群組的行銷群組策略,再依據優惠關鍵字分類表及客戶群組屬性差異表與現行優惠進行比對,取得對於各行銷群組的合適推薦優惠,並加入對應各目標群組的核心優惠,以產生對應各行銷群組的優惠推薦組合。概略而言,在步驟500,可根據步驟300與400所得之結果,依群組屬性差異表擬定行銷群組策略,再依優惠關鍵字分類表及群組屬性差異表與現行優惠進行比對,取得的行銷群組合適推薦優惠,最後加入群組之核心優惠,以產生行銷群組優惠推薦組合。
在步驟600中,可依據對各行銷群組採用對應的優惠推薦組合的銷售結果更新對應各行銷群組的優惠推薦組合。概略而言,在步驟600中可依銷售歷史紀錄,更新客戶屬性資料與優惠資料,並以前次基準值與當前四分位差統計量,更新優惠重組推薦參數評鑑表,進行資料回饋重新運算,以調適行銷群組優惠推薦組合。
藉此,當行銷人員有目標客群之行銷需求時,係利用目標客群之客戶屬性與優惠歷史資料,透過上述步驟,即可快速取得不同行銷客群的差異化優惠組合設計推薦。以下將對上述各步驟的技術細節作進一步說明。
請參照圖2,其是依據本發明圖1實施例繪示的步驟100的詳細流程。首先,在步驟101中,可定義目標客群與相對應目標客群。在本實施例中,可依行銷需求定義三個客群,即為目標客群、相對應目標客群與欲行銷客群,並設定可取得的客戶相關屬性。在不同的實施例中,目標客群包括曾經離網且回流之用戶,相對應目標客群包括曾經離網且未回流用戶,欲行銷客群包括曾經離網且未知是否回流的用戶,行銷客群包括曾經離網且預測會回流的用戶,但可不限於此。
在步驟102,可設定「優惠重組推薦參數評鑑表」中的各個評鑑參數,例如影響程度參數、正負向比例差距參數與核心優惠關連維度下限參數之評鑑項初始值。在一實施例中,可採用下表1所示的預設評鑑項統計量。
Figure 107144985-A0304-0001
表1
在一實施例中,若為第一次實施,「優惠重組推薦參數評鑑表」基準項(即,前次基準值)可預設為0。
在步驟103中,可依照步驟101的結果,擷取目標客群與相對應目標客群的客戶屬性資料與優惠歷史資料。
在步驟104中,可依照步驟101與103的結果,進行目標客群與相對應目標客群的差異性分析,以從客戶屬性資料中找出目標客群與相對應目標客群的顯著差異屬性。在不同的實施例中,可針對目標客群與相對應目標客群之客戶屬性資料逐一進行兩客群的差異性檢定,若客戶屬性資料為數值連續型資料,可採用T檢定(T-test)或是單因子獨立變異數分析(ONEWAY-ANOVA)進行檢定;若客戶屬性資料為類別型資料,可採用卡方適合度檢定(Chi-square Goodness of Fit)進行檢定。
在步驟105中,可依照步驟104的結果,保留目標客群與相對應目標客群之間有顯著差異的客戶屬性資料,以供後續使用。
請參照圖3,其是依據本發明圖1實施例繪示的步驟200的詳細流程。在步驟201中,可取得目標客群與相對應目標客群之間有顯著差異的客戶屬性資料。
在步驟202中,可將目標客群的顯著差異屬性對應的分類屬性標註為第一狀態以及將相對應目標客群的顯著差異屬性對應的分類屬性標註為第二狀態。在一實施例中,可將目標客群與相對應目標客群各新增一個分類屬性,其中目標客群的分類屬性值設定為Y或1,相對應目標客群的分類屬性值設定為N或0,供分類模型建立之使用。
在步驟203中,可將目標客群與相對應目標客群之間有顯著差異的客戶屬性資料進行類別化及標準化。舉例而言,可逐一檢視每個客戶屬性,若此屬性值的值域太過分散,或有行銷特殊需求,便可將此客戶屬性值進行類別化,供分類模型建立之使用,例如:客戶年齡屬性,即可分類為15歲以下、15歲~30歲、30歲~50歲、50歲以上四個類別。若此客戶屬性值為數值連續型,則將此屬性進行標準化作業,供分群模型建立之使用,標準化方式可採用Min-Max標準化或Z-score 標準化,本方法可預設為使用Z-score進行標準化,但可不限於此。
在步驟204中,可基於類別化及標準化後的目標客群與相對應目標客群的顯著差異屬性,以及目標客群與相對應目標客群的顯著差異屬性對應的分類屬性建立分類模型。在一實施例中,可依據步驟203的結果而採用多種分類模型建立演算法,以為目標客群與相對應目標客群建立分類模型,例如:決策樹、SVM、C4.5等演算法,以供後續使用。並且,可擷取各分類模型之準確率最高且非過度擬合(Overfitting)的模型作為上述分類模型,以供後續使用。
在步驟206中,可基於標準化後的目標客群的顯著差異屬性建立分群模型。在不同的實施例中,可依照步驟203的結果,採用多種分群模型演算法,將目標客群建立分群模型,例如:K-means、K-medoids、EM等演算法,以供後續使用。並且,可擷取各分類模型之群組數適中,且各群組的客戶數差距適當的分群模型,以供後續使用。
在步驟208中,可依照步驟204的結果,將欲行銷客群代入分類模型以取得行銷客群,以供後續使用。
在步驟209中,可依照步驟204、206的結果,將行銷客群帶入分群模型進行群組歸屬作業,以取得行銷群組,以供後續使用;其中群組歸屬可採用多種距離公式,如歐幾里得距離、馬式距離、Lance距離等,本方法可預設採用歐幾里得距離,但可不限於此。
請參照圖4A,其是依據本發明圖1實施例繪示的步驟300的詳細流程。在步驟301中,可取得定義目標客群與相對應目標客群之優惠歷史資料。在本實施例中,可依照步驟105的結果,擷取目標客群與相對應目標客群之優惠歷史資料,供後續步驟使用。
在步驟302中,可採用資料探勘工具對目標客群與相對應目標客群的優惠歷史資料進行文字探勘,以找出對應於目標客群與相對應目標客群的多個優惠關鍵字。在一實施例中,可採用資料探勘工具(如:R)進行文字探勘,解構優惠產品描述,以產生兩客群之優惠關鍵字文字雲,供後續步驟使用。
在步驟303中,可計算各優惠關鍵字被目標客群與相對應目標客群採用的次數,以取得優惠關鍵字選取次數表。在一實施例中,可根據步驟302的結果,計算每個優惠關鍵字被目標客群與相對應目標客群採用的次數,以取得優惠關鍵字選取次數表,供後續使用。
在步驟304中,可基於優惠關鍵字選取次數表計算各優惠關鍵字的影響程度及正負向比例差距。在一實施例中,可根據步驟303的結果,分別計算每個優惠關鍵字的影響程度與正負向比例差距,供後續使用。具體而言,假設:(1)目標客群的人數為TN;(2)相對應目標客群人數為CN;(3)優惠文字經探勘後共有m組優惠關鍵字:
Figure 02_image001
, i = 1,2,3…m;(4)全部客群選取
Figure 02_image003
的客戶人數:
Figure 02_image005
, i = 1,2,3…m;(5)目標客群選取
Figure 02_image007
的客戶人數:
Figure 02_image009
;(6)相對應目標客群選取
Figure 02_image011
客戶人數:
Figure 02_image013
。在上述假設之下,相關的計算公式如下:(1)
Figure 02_image001
影響程度:
Figure 02_image015
, i = 1,2,3…m,其中
Figure 02_image017
Figure 02_image019
x 100% , i = 1,2,3…m;(2)
Figure 02_image021
正向性比例
Figure 02_image023
;(3)
Figure 02_image021
負向性比例
Figure 02_image025
;(4)
Figure 02_image021
的正負向比例差距:
Figure 02_image027
。若
Figure 02_image029
,稱之
Figure 02_image001
具正向傾性,反之稱為具負向傾性。
在步驟305中,可依照優惠關鍵字的影響程度與正負向比例差距參數判斷優惠關鍵字的重要性。在一實施例中,可根據步驟304的結果,取得優惠關鍵字的影響程度及正負向差距之四分位數統計量,並與「優惠重組推薦參數評鑑表」中的影響程度參數基準值與正負向差距參數基準值做比較,取得此次優惠關鍵字重要性與正負向差距基準值判斷依據,其比較方式如下。定義(1)影響程度基準值參數(Influence level Parameter)為 IP;(2)
Figure 02_image031
;(3)
Figure 02_image033
的所有關鍵字影響程度集合之第三四分位數(
Figure 02_image035
)。基此,相關的計算公式為:
Figure 02_image037
Figure 02_image039
,其中若影響程度大於
Figure 02_image041
的優惠關鍵字為空集合,則
Figure 02_image043
另外,定義(1)正向比例差距基準值參數(Positive Parameter) 為 POP;(2)
Figure 02_image045
;(3)
Figure 02_image047
的具正向傾性關鍵字之正負向比例差距集合的第三四分位數(Q3)。基此,相關的計算公式為:
Figure 02_image049
Figure 02_image051
,其中若正向比例差距大於
Figure 02_image053
的優惠關鍵字為空集合,則
Figure 02_image055
再者,定義:(1)負向比例差距基準值參數(Negative Parameter) 為 NEP;(2)
Figure 02_image057
(3)
Figure 02_image059
具負向性質關鍵字的正負向比例差距集合之第一四分位數(
Figure 02_image061
)。基此,相關的計算公式為:
Figure 02_image063
Figure 02_image065
,其中若負向比例小於
Figure 02_image067
的優惠關鍵字為空集合,則
Figure 02_image069
在不同的實施例中,若優惠關鍵字的影響程度大於影響程度基準值參數,則將之標示為主要優惠關鍵字,反之則標示為次要優惠關鍵字。若優惠關鍵字的正負向比例差距大於正向比例差距基準值參數則將之標示為正向性。若優惠關鍵字正負向比例差距小於負向比例差距基準值參數則將之標示為負向性。另外,若優惠關鍵字的正負向比例差距介於正向比例差距參數基準值及負向比例差距參數基準值之間,則將優惠關鍵字標示為無關連。
之後,在步驟306中,可基於各優惠關鍵字的標示結果產生優惠關鍵字分類表。在一實施例中,可根據步驟305的結果,將優惠關鍵字之標示分成六個種類,以得到優惠關鍵字分類表,以供後續使用,如圖4B所示。
請參照圖5A,其是依據圖1實施例繪示的步驟400的詳細流程。在本實施例中,目標客群可基於分群模型而被區為多個目標群組。
在步驟401中,可取得各目標群組的客戶屬性資料、優惠關鍵字與優惠歷史資料。在一實施例中,可根據步驟100、200、300所得之結果,分別擷取各目標群組之客戶屬性資料、優惠關鍵字與優惠歷史資料,以供後續使用。
在步驟402中,可執行各目標群組的優惠關鍵字的差異性檢定,以得到各目標群組的顯著差異的優惠關鍵字。在一實施例中,可根據步驟401所得之結果,採用卡方適合度檢定(Chi-square Goodness of Fit)進行目標群組之優惠關鍵字差異性檢定,以得到各目標群組具有顯著差異的優惠關鍵字。
在步驟403中,可基於各目標群組的顯著差異的優惠關鍵字產生優惠關鍵字群組差異表。在一實施例中,可根據步驟402所得之結果,取得優惠關鍵字群組差異表,如下表2所示。
Figure 107144985-A0304-0002
表2
在表2中,群組i的第j顯著優惠關鍵字可定義為:
Figure 02_image089
,i=1,2…n , j = 1,2,…m(m依群組而異)。
在步驟404中,可執行各目標群組的客戶屬性資料的差異性檢定,以得到各目標群組的顯著差異的客戶屬性資料。在一實施例中,可根據步驟401所得之結果,依據客戶屬性資料的類型,可分別採用T檢定(T-test)、單因子獨立變異數分析(ONEWAY-ANOVA)進行檢定或卡方適合度檢定(Chi-square Goodness of Fit)進行目標群組的客戶屬性資料的差異性檢定,以得到各目標群組中具有顯著差異的客戶屬性資料。
在步驟405中,可基於各目標群組的顯著差異的客戶屬性資料產生客戶群組屬性差異表。在一實施例中,可根據步驟404所得之結果,取得客戶群組屬性差異表,如下表3所示。
Figure 107144985-A0304-0003
表3
在表3中,群組i的第j顯著客戶屬性資料可定義為:
Figure 02_image109
,i=1,2…n , j = 1,2,…m(m依群組而異)。
在步驟406中,可基於各目標群組的優惠歷史資料進行優惠關連分析,以產生各目標群組的優惠關連圖,其中優惠歷史資料包括各目標群組的優惠產品,而優惠關連圖中的各優惠產品具有對應的優惠維度。在一實施例中,可根據步驟401所得之結果,進行目標群組進行優惠關連分析以得到各目標群組的優惠關連圖,其步驟如下:(步驟1):選擇一客戶受理的優惠產品的紀錄,如:A、B、C三個優惠產品,其中主優惠產品為A,附屬優惠產品為B、C;(步驟2):依主、附優惠產品關連順序將受理的優惠產品連接,如:A-B-C,並連接前先檢查關聯網路中是否存在對應的點及邊,若無則新增,若已存在不須重覆建立;(步驟3):對所有目標客群中的客戶重複上述步驟直至完成。完成後的優惠關連圖可參照圖5B所示,但本發明可不限於此。
在步驟407中,可計算優惠關連維度。在一實施例中,可根據步驟406所得之結果,計算各目標群組的優惠關連維度,其計算機制如下:若優惠關連維度(Related Degree)為RD,則RD即為此優惠產品所連接的線之數量。
在步驟408中,可依照核心優惠關連維度的下限基準參數判斷核心優惠。在一實施例中,可根據步驟406所得之結果,分別計算目標群組之此次核心優惠關連維度下限基準參數,相關計算機制包括:(1)定義核心優惠關連維度下限基準參數(Related Degree Lower limit)為RDL;(2)
Figure 02_image111
:第 t 次的核心優惠關連維度下限基準參數;(3)
Figure 02_image113
:第t次的所有
Figure 02_image115
集合之第三四分位數(
Figure 02_image035
)。相關計算公式包括:
Figure 02_image117
Figure 02_image119
,其中若
Figure 02_image115
大於
Figure 02_image111
的優惠關鍵字為空集合,則
Figure 02_image121
,而若優惠產品的關連維度大於核心優惠關連維度下限基準參數,則標示此優惠產品為核心優惠。
在步驟409中,可取得各目標群組之核心優惠表。首先,可根據步驟406所得之結果取得各目標群組之核心優惠,如下表4所示。
Figure 107144985-A0304-0004
表4
在表4中,群組i的核心優惠關連維度下限基準參數可定義為:
Figure 02_image129
,i=1,2…n。
接著,可依照核心優惠關連維度下限基準參數表,找出各目標群組的優惠維度大於核心優惠關連維度下限基準參數表的優惠產品,以得到各目標群組的核心優惠表,如下表5所例示。
Figure 107144985-A0304-0005
表5
在表5中,群組i的第j顯著核心優惠(Core Discount)可定義為:
Figure 02_image149
,i=1,2…n , j = 1,2,…m(m依群組而異)。
請參照圖6,其是依據圖1實施例繪示的步驟500的詳細流程。在步驟501中,可依客戶群組屬性差異表擬定行銷群組策略。在本實施例中,可根據步驟200與405結果,以客戶群組屬性差異表與行銷需求為依據,設定行銷群組策略,如下表6的「行銷群組優惠推薦組合表」所示。
Figure 107144985-A0304-0006
表6
在步驟502中,可依優惠關鍵字分類表與現有優惠進行關鍵字比對。在一實施例中,可根據步驟200與405結果,以優惠關鍵字分類表,取得圖4B所示「優惠關鍵字分類表」中之A、D、E項中優惠關鍵字與現行優惠的關鍵字進行比對,以得到欲行銷的優惠產品,其中A、D項對應之優惠產品稱為主要、次要優惠產品,E項對應之優惠產品稱為基本優惠產品。
在步驟503中,可取得行銷客群合適推薦優惠。在一實施例中,可根據步驟502結果,擷取主要、次要優惠產品與基本優惠產品即為行銷客群合適推薦優惠,如上表6的「行銷群組優惠推薦組合表」所示。
在步驟504中,可依群組優惠關鍵字差異表與推薦優惠進行比對。在一實施例中,可根據步驟200與405結果,以優惠關鍵字群組差異表,取各群組優惠關鍵字與現行優惠的關鍵字進行比對,以得到欲行銷的優惠產品。
在步驟505中,可取得行銷群組合適推薦優惠。在一實施例中,可根據步驟503的結果,將欲行銷優惠產品分別對應至各行銷群組中,以得到合適行銷群組推薦優惠,如上表6所示。
在步驟506中,可加入核心優惠。在一實施例中,可根據步驟409得到的結果,將群組核心優惠加入合適行銷群組推薦優惠中。
在步驟507中,可產生行銷群組優惠推薦組合。在一實施例中,可根據步驟501、506所得到的結果,產生行銷群組優惠推薦組合,以供銷售單位行銷使用,如上表6所示。
請參照圖7,其是依據圖1實施例繪示的步驟600的詳細流程。
在步驟601中,可取得銷售後之客群資料與優惠資料。在一實施例中,當行銷單位依照步驟507所得之行銷群組優惠推薦組合進行銷售一段時間後,可擷取銷售後的客群資料與優惠資料。
在步驟602中,可更新客戶屬性資料與優惠歷史資料。在一實施例中,可根據步驟501的結果,更新客戶屬性資料與優惠歷史資料。
在步驟603中,可更新優惠關鍵字分類表參數。在一實施例中,可根據步驟305計算出的影響程度基準值參數、正負向比例差距基準值參數,更新至優惠重組推薦參數評鑑表中。
在步驟604中,可更新優惠關鍵字關連表參數。在一實施例中,可根據步驟408計算出的核心優惠關連維度下限基準參數,更新至優惠重組推薦參數評鑑表中,若有多個群組則取群組中最大者當作前次基準值。
由上可知,本發明所提出的方法係一種基於資料探勘技術之自我調適優惠重組推薦方法,不侷限於任何產業,皆可根據本方法之步驟據以實施。
舉例而言,針對先前技術中所提及的電信業行銷需求,亦可依本發明提出的方法步驟而解決相關的技術問題,從而達到精準且具差異性的行銷作業,具體說明如下。
首先,由於在上述情境中的需求為吸引攜碼轉換至其他業者之用戶(簡稱離網用戶)回流至原業者,故在步驟100中所定義相關客群可包括:(1)目標客群(簡稱TG):曾經離網且回流之用戶;(2)相對應目標客群(簡稱CTG):曾經離網且未回流用戶;(3)欲行銷客群(簡稱WPG):曾經離網且未知是否回流的用戶;(4)行銷客群(簡稱PG):曾經離網且預測會回流用戶。
此外,需擷取TG、CTG、WPG之離網前之歷史資料,包含客戶屬性資料與優惠歷史資料。在一實施例中,所採用的資料擷取時間點為:(1)TG為2016/10/01 ~2016/12/31離網且於2017/04前回流;(2)CTG為2016/10/01 ~2016/12/31離網且於2017/04未回流;(3)WPG為2017/01~2017/03離網至2017/06月仍未回流。經資料清洗之後,可用的筆數為:TG共有1,635用戶數、CTG共有7,369用戶數,WPG共有19,067用戶數,並且共得到200多個可用的客戶屬性資料。
首先進行兩族群(TG與CTG)重要客戶屬性的差異性檢定,若客戶屬性資料為連續型資料,可採用單因子獨立變異數分析(ONEWAY-ANOVA)進行檢定;若客戶屬性資料為類別型資料,則可採用卡方適合度檢定(Chi-square Goodness of Fit)進行檢定,但可不限於此。檢定結果顯示,具顯著差異的客戶屬性資料共23個,如下表7的顯著客戶屬性列表所示,而此23個客戶屬性資料便可提供後續分群與分類模型使用。
Figure 107144985-A0304-0007
表7
另外,在此步驟需設定「優惠重組推薦參數評鑑表」,其如下表8所例示。
Figure 107144985-A0304-0008
表8
假設此次為第一次實施,故無前次基準值,因而可將表8中的基準項預設為0。
接著,在步驟200中,可根據步驟100所得的結果,將TG與CTG進行資料標註。並且,可新增一是否回流(NP)欄位,並將TG的所有筆數的NP欄位填入Y,CTG則填入N。在不同的實施例中,由於部分的客戶屬性資料的值域可能過大,不利於分類模型的建立,故可依照業務知識與資料分佈情況進行類別化作業以利分類模型的建立。標註與類別化部分結果如下表10的客戶屬性類別化與標註結果表所示。
Figure 107144985-A0304-0009
表10
在表10中,可看出在TG及CTG中之間具有顯著差異的客戶屬性資料例如包括年資、年齡、購機次數、購機金額、數據流量等,但可不限於此。
在本實施例中,可採用多種分類演算法來針對TG與CTG建立分類模型,結果如圖8。在圖8中,排除過度擬合(Overfitting)的模型,其餘模型其準確率皆達80%以上,而以下實例將採用Bagging演算法作為所使用的分類模型,以提供欲行銷客群中每個用戶回流的預測機率。
接著針對TG進行分群作業,以得到分群模型,因分群演算法的屬性值域需數值型變數,故刪除2個類別型的客戶屬性資料(例如表10中的「門號資費類型」及「持機廠牌」)。此外,由於各客戶屬性資料的單位不同,故以Z-Score標準化剩下的21個客戶屬性資料。
在本實施例中,可採用K-means、K-medoids、EM等演算法作為分群模型。經分析結果,用K-Means演算法作為分群模型所得到的群組數與各群組中的人數分佈較為適當,而相關的分群結果如下,目標群組共3群(TG1、TG2、TG3),其中TG1共569用戶數、TG2共306用戶數、TG3共760用戶數,如下表11所示。
Figure 107144985-A0304-0010
表11
之後,將WPG帶入上述得到分類模型與分群模型進行分類預測與群組歸屬作業以得到行銷客群(PG),其中群組歸屬可採用多種距離公式,如歐幾里得距離、馬式距離、Lance距離等。在本實施例中採用歐幾里得距離,其結果如下:PG共有2,868用戶數,歸屬為三個行銷群組(PG1、PG2、PG3),其中PG1共1,291用戶數、PG2共850用戶數、PG3共727用戶數,如表12所示。
Figure 107144985-A0304-0011
表12
在步驟300中,可針對TG與CTG之優惠歷史資料進行文字探勘,得到優惠關鍵字分類表。在不同的實施例中,可依需求採用不同的文字探勘工具。在本實施例中,係採用R語言進行文字探勘以解構優惠產品描述,過程中依照業務需求合併關鍵字或取消無效關鍵字。相關的文字探勘後的關鍵字部分結果如下表13、14及15所示,其中表13為優惠關鍵字的影響程度列表,表14為優惠關鍵字的正向比例差距列表,表15為優惠關鍵字的負向比例差距列表。
Figure 107144985-A0304-0012
表13
Figure 107144985-A0304-0013
表14
Figure 107144985-A0304-0014
表15
接著,可依照步驟305說明,分別求出影響程度基準值參數(IP)、正向比例差距基準值參數(POP)、負向比例差距基準值參數(NEP),結果如下表16的IP/POP/NEP基準參數表所示。
Figure 107144985-A0304-0015
表16
根據IP、POP與NEP以得到優惠關鍵字分類表,如圖9所示。
接著,在步驟400中,可針對TG三個群組中之客戶屬性資料進行差異性檢定分析,以得到客戶群組屬性差異表與優惠關鍵字群組差異表。熟知技藝人士很容易明白,欲瞭解不同群組間的某個性質是否有顯著差異,可使用多種統計檢定技術。在本實施例中,可對數值型資料採用ANOVA,並對類別型資料採用卡方檢定,來判別其是否有顯著差異,得到的結果如下表17的客戶群組屬性差異表及表18的優惠關鍵字群組差異表所示。
Figure 107144985-A0304-0016
表17
Figure 107144985-A0304-0017
表18
在表17及表18中,針對客戶屬性部分,TG1有高比例行動用戶設備數高達3門以上,TG2有高比例最常發話行動業者分鐘數超過60分鐘,TG3行動數據流量2GB以下佔比超過40%。
另外,亦針對TG的三個群組進行優惠關連分析,依照步驟406說明,畫出三群組之優惠關連圖,並依序找出三個群組之核心優惠關連維度下限基準參數(Related Degree Lower limit ,RDL)。上述結果分別如下表19的TG1優惠關連維度列表、下表20的TG2優惠關連維度列表、下表21的TG3優惠關連維度列表以及下表22的核心優惠關連維度下限基準參數表所示。
Figure 107144985-A0304-0018
表19
Figure 107144985-A0304-0019
表20
Figure 107144985-A0304-0020
表21
Figure 107144985-A0304-0021
表22
之後,可找出各群組之優惠關連維度大於核心優惠關連維度下限基準參數表的優惠產品,即可得到各群組之核心優惠表,得到結果如下表23的核心優惠表所示。
Figure 107144985-A0304-0022
表23
在步驟500中,可參考先前實施例中的說明而分別擬定行銷群組策略、行銷客群合適推薦優惠、行銷群組合適推薦優惠,並加入核心優惠以得到行銷群組優惠推薦組合,其原則為:以核心優惠主約必擇一,搭配適當的合適推薦優惠與群組推薦優惠,結果如下表24所示。
Figure 107144985-A0304-0023
表24
在步驟600中,在行銷單位採納上述之優惠推薦組合進行銷售過後,依銷售歷史紀錄,包含:TG、CTG之客戶屬性資料與優惠資料進行回饋作業,同時更新優惠重組推薦參數評鑑表,以調適行銷群組優惠推薦組合以符合市場脈動。
在一實施例中,優惠重組推薦參數評鑑表部分則將依照前述「IP/POP/NEP基準參數表」與「核心優惠關連維度下限基準參數表」之結果,更新評鑑表之基準項內容,詳見下表24,以供下次作業評鑑之用。
Figure 107144985-A0304-0024
表24
在表24中,核心優惠關連維度下限基準值參數(RDL)為各群基準值取最大者,即MAX(7,6,10) = 10。
綜上所述,本發明的基於資料與文字探勘技術產生差異化的優惠組合推薦之方法可基於資料與文字探勘技術,輔以銷售後資訊回饋調適,以對於行銷客群快速產生差異化的優惠組合推薦之方法。並且,當行銷人員有目標客群之行銷需求時,係利用目標客群與相對應之目標客群的客戶屬性與優惠歷史資料,透過本發明揭露之方法,結合資料(分類、分群)、文字(關鍵字解析)探勘技術及關連分析技術,快速產生此客群行銷群組的差異化優惠組合設計推薦。此外,當行銷人員採納推薦推出此優惠組合後,亦可根據銷售數據更新關鍵參數,並重新執行本方法,以產生更符合市場需求的推薦優惠組合,以期即時因應市場銷售變化。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
100、200、300、400、500、600、101~105、201~209、301~306、401~409、501~507、601~604:步驟
圖1是依據本發明之一實施例繪示的基於資料與文字探勘技術產生差異化的優惠組合推薦之方法流程圖。 圖2是依據本發明圖1實施例繪示的步驟100的詳細流程。 圖3是依據本發明圖1實施例繪示的步驟200的詳細流程。 圖4A是依據本發明圖1實施例繪示的步驟300的詳細流程。 圖4B是依據本發明之一實施例繪示的優惠關鍵字分類表。 圖5A是依據圖1實施例繪示的步驟400的詳細流程。 圖5B是依據本發明之一實施例繪示的優惠關連圖。 圖6是依據圖1實施例繪示的步驟500的詳細流程。 圖7是依據圖1實施例繪示的步驟600的詳細流程。 圖8是依據本發明之一實施例繪示的多種分類演算法示意圖。 圖9是依據本發明之一實施例繪示的優惠關鍵字分類表。
100、200、300、400、500、600:步驟

Claims (8)

  1. 一種基於資料與文字探勘技術產生差異化的優惠組合推薦之方法,包括: 取得目標客群與相對應目標客群的歷史銷售資料及優惠歷史資料; 基於該目標客群與該相對應目標客群的該歷史銷售資料建立一分類模型以及一分群模型,其中該分類模型用以找出欲行銷客群中的行銷客群,而該分群模型用以將該目標客群區分為多個目標群組以及將該行銷客群區分為多個行銷群組; 基於該目標客群與該相對應目標客群的該優惠歷史資料找出優惠關鍵字分類表; 基於各該目標群組對應的客戶屬性及優惠關鍵字對各該目標群組進行差異性分析,以取得客戶群組屬性差異表及優惠關鍵字群組差異表,以及對應於各該目標群組的核心優惠; 依據該客戶群組屬性差異表產生對應於各該行銷群組的行銷群組策略,再依據該優惠關鍵字分類表及該客戶群組屬性差異表與現行優惠進行比對,取得對於各該行銷群組的合適推薦優惠,並加入對應各該目標群組的該核心優惠,以產生對應各該行銷群組的優惠推薦組合;以及 依據對各該行銷群組採用對應的該優惠推薦組合的銷售結果更新對應各該行銷群組的該優惠推薦組合。
  2. 如申請專利範圍第1項所述的方法,其中該目標客群包括曾經離網且回流之用戶,該相對應目標客群包括曾經離網且未回流用戶,該欲行銷客群包括曾經離網且未知是否回流的用戶,該行銷客群包括曾經離網且預測會回流的用戶。
  3. 如申請專利範圍第1項所述的方法,其中取得該目標客群與該相對應目標客群的該歷史銷售資料及優惠歷史資料的步驟包括: 擷取該目標客群與該相對應目標客群的客戶屬性資料,並據以進行該目標客群與該相對應目標客群的差異性分析,以從該客戶屬性資料中找出該目標客群與該相對應目標客群的顯著差異屬性。
  4. 如申請專利範圍第3項所述的方法,其中基於該目標客群與該相對應目標客群的該歷史銷售資料建立該分類模型以及該分群模型的步驟包括: 取得該目標客群與該相對應目標客群的該顯著差異屬性; 將該目標客群的該顯著差異屬性對應的分類屬性標註為第一狀態; 將該相對應目標客群的該顯著差異屬性對應的分類屬性標註為第二狀態; 將該目標客群與該相對應目標客群的該顯著差異屬性進行類別化及標準化; 基於類別化及標準化後的該目標客群與該相對應目標客群的該顯著差異屬性,以及該目標客群與該相對應目標客群的該顯著差異屬性對應的分類屬性建立該分類模型;以及 基於標準化後的該目標客群的該顯著差異屬性建立該分群模型。
  5. 如申請專利範圍第1項所述的方法,其中基於該目標客群與該相對應目標客群的該優惠歷史資料找出該優惠關鍵字分類表的步驟包括: 取得一優惠重組推薦參數評鑑表,其包括影響程度參數基準值、正向比例差距參數基準值及負向比例差距參數基準值; 採用資料探勘工具對該目標客群與該相對應目標客群的該優惠歷史資料進行文字探勘,以找出對應於該目標客群與該相對應目標客群的多個優惠關鍵字; 計算各該優惠關鍵字被該目標客群與該相對應目標客群採用的次數,以取得優惠關鍵字選取次數表; 基於該優惠關鍵字選取次數表計算各該優惠關鍵字的影響程度及正負向比例差距; 若該些優惠關鍵字的第一優惠關鍵字的該影響程度大於該影響程度參數基準值,定義該第一優惠關鍵字為主要優惠關鍵字,反之行定義該第一優惠關鍵字為次要優惠關鍵字; 若該第一優惠關鍵字的該正負向比例差距大於該正向比例差距參數基準值,則將該第一優惠關鍵字標示為正向性; 若該第一優惠關鍵字的該正負向比例差距小於該負向比例差距參數基準值,則將該第一優惠關鍵字標示為負向性; 若該第一優惠關鍵字的該正負向比例差距介於該正向比例差距參數基準值及該負向比例差距參數基準值之間,則將該第一優惠關鍵字標示為無關連;以及 基於各該優惠關鍵字的標示結果產生該優惠關鍵字分類表。
  6. 如申請專利範圍第5項所述的方法,其中基於該優惠關鍵字選取次數表計算各該優惠關鍵字的該影響程度及該正負向比例差距的步驟包括: 定義該目標客群的人數為TN; 定義該相對應目標客群人數為CN; 定義該些優惠關鍵字中的第i個優惠關鍵字為
    Figure 03_image151
    ,其中i = 1,2,3…m,m為該些優惠關鍵字的組數; 定義該目標客群及該相對應目標客群中選取
    Figure 03_image153
    的客戶人數為
    Figure 03_image155
    ,其中i = 1,2,3…m; 定義該目標客群中選取
    Figure 03_image157
    的客戶人數為
    Figure 03_image159
    ,其中
    Figure 03_image161
    ; 定義該相對應目標客群中選取
    Figure 03_image163
    客戶人數為
    Figure 03_image165
    ,其中
    Figure 03_image167
    ; 計算
    Figure 03_image151
    的該影響程度為
    Figure 03_image169
    , i = 1,2,3…m,其中
    Figure 03_image171
    Figure 03_image173
    x 100% , i = 1,2,3…m; 計算
    Figure 03_image175
    的正向性比例為
    Figure 03_image177
    ; 計算
    Figure 03_image175
    的負向性比例為
    Figure 03_image179
    ; 計算
    Figure 03_image175
    的的該正負向比例差距為
    Figure 03_image181
  7. 如申請專利範圍第1項所述的方法,其中基於各該目標群組對應的該客戶屬性及該優惠關鍵字對各該目標群組進行差異性分析,以取得該客戶群組屬性差異表及該優惠關鍵字群組差異表,以及對應於各該目標群組的該核心優惠的步驟包括: 取得各該目標群組的客戶屬性、優惠關鍵字與優惠產品; 執行各該目標群組的該優惠關鍵字的差異性檢定,以得到各該目標群組的顯著差異的優惠關鍵字; 基於各該目標群組的顯著差異的該優惠關鍵字產生優惠關鍵字群組差異表; 執行各目標群組的該客戶屬性的差異性檢定,以得到各該目標群組的顯著差異的客戶屬性; 基於各該目標群組的顯著差異的客戶屬性產生客戶群組屬性差異表; 基於各該目標群組的該優惠產品進行優惠關連分析,以產生各該目標群組的優惠關連圖,其中該優惠關連圖中的各該優惠產品具有對應的優惠維度;以及 找出各該目標群組的優惠維度大於核心優惠關連維度下限基準參數表的該優惠產品,以得到各該目標群組的核心優惠表,其中該核心優惠表包括對應於各該行銷群組的該核心優惠。
  8. 如申請專利範圍第1項所述的方法,其中依據對各該行銷群組採用對應的該優惠推薦組合的銷售結果更新對應各該行銷群組的該優惠推薦組合的步驟包括: 取得該銷售結果,其中該銷售結果包括銷售後之客群資料與優惠資料; 基於該銷售結果更新該客戶屬性資料與該優惠歷史資料; 基於更新的該客戶屬性資料與該優惠歷史資料更新該優惠重組推薦參數評鑑表中的該影響程度參數基準值、該正向比例差距參數基準值及該負向比例差距參數基準值; 基於更新後的該優惠重組推薦參數評鑑表更新該優惠關鍵字分類表; 基於各該目標群組對應的該客戶屬性及該優惠關鍵字對各該目標行銷群組進行差異性分析,以更新該客戶群組屬性差異表及該優惠關鍵字群組差異表,以及對應於各該目標群組的該核心優惠;以及 依據該客戶群組屬性差異表更新對應於各該行銷群組的該行銷群組策略,再依據該優惠關鍵字分類表及該客戶群組屬性差異表與現行優惠進行比對,取得對於各該行銷群組的合適推薦優惠,並加入對應各該目標群組的該核心優惠,以產生對應各該行銷群組的優惠推薦組合。
TW107144985A 2018-12-13 2018-12-13 基於資料與文字探勘技術產生優惠組合推薦之方法 TWI676143B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW107144985A TWI676143B (zh) 2018-12-13 2018-12-13 基於資料與文字探勘技術產生優惠組合推薦之方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW107144985A TWI676143B (zh) 2018-12-13 2018-12-13 基於資料與文字探勘技術產生優惠組合推薦之方法

Publications (2)

Publication Number Publication Date
TWI676143B TWI676143B (zh) 2019-11-01
TW202022751A true TW202022751A (zh) 2020-06-16

Family

ID=69189090

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107144985A TWI676143B (zh) 2018-12-13 2018-12-13 基於資料與文字探勘技術產生優惠組合推薦之方法

Country Status (1)

Country Link
TW (1) TWI676143B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7734641B2 (en) * 2007-05-25 2010-06-08 Peerset, Inc. Recommendation systems and methods using interest correlation
US8630902B2 (en) * 2011-03-02 2014-01-14 Adobe Systems Incorporated Automatic classification of consumers into micro-segments
TW201437961A (zh) * 2013-03-18 2014-10-01 Chunghwa Telecom Co Ltd 電信產品組合分析與評量之方法與系統
TW201513011A (zh) * 2013-09-25 2015-04-01 Chunghwa Telecom Co Ltd 一種智慧型最佳電信資費推薦方法
CN108171553A (zh) * 2018-01-17 2018-06-15 焦点科技股份有限公司 一种周期性服务或产品的潜在客户挖掘系统与方法

Also Published As

Publication number Publication date
TWI676143B (zh) 2019-11-01

Similar Documents

Publication Publication Date Title
US10078853B2 (en) Offer matching for a user segment
CN102708131B (zh) 将消费者自动分类到微细分中
US8700468B2 (en) Micro-segment definition system
US20180300748A1 (en) Technologies for granular attribution of value to conversion events in multistage conversion processes
US10311469B2 (en) Statistical marketing attribution correlation
US20160285672A1 (en) Method and system for processing network media information
US20120046992A1 (en) Enterprise-to-market network analysis for sales enablement and relationship building
US20220076299A1 (en) Intelligent electronic advertisement generation and distribution
WO2019072128A1 (zh) 对象识别方法及其系统
US20160210656A1 (en) System for marketing touchpoint attribution bias correction
CN104951468A (zh) 数据搜索处理方法和系统
US10983786B2 (en) Automatically evaluating software project requirements
US9875484B1 (en) Evaluating attribution models
US11295154B2 (en) Physical item optimization using velocity factors
US20220253874A1 (en) Product evaluation system and method of use
US10733240B1 (en) Predicting contract details using an unstructured data source
CN115564531A (zh) 商品组合推荐方法及其装置、设备、介质、产品
CN111861679A (zh) 一种基于人工智能的商品推荐方法
US20200090110A1 (en) System and method for cognitive and preemptive fashion inventory management & order fulfilment
CN108537599A (zh) 基于关键词聚合的查询反馈方法、装置以及存储介质
TW202022751A (zh) 基於資料與文字探勘技術產生優惠組合推薦之方法
JP7117440B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
CN111353793A (zh) Crm业务推荐方法及装置
Maddodi et al. Generating workload for erp applications through end-user organization categorization using high level business operation data
WO2017219317A1 (zh) 一种基于搜索内容的信息推送方法及装置

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees