JP2003242165A - 潜在ターゲット導出装置、潜在ターゲット導出方法、そのプログラム及び記録媒体 - Google Patents
潜在ターゲット導出装置、潜在ターゲット導出方法、そのプログラム及び記録媒体Info
- Publication number
- JP2003242165A JP2003242165A JP2002039904A JP2002039904A JP2003242165A JP 2003242165 A JP2003242165 A JP 2003242165A JP 2002039904 A JP2002039904 A JP 2002039904A JP 2002039904 A JP2002039904 A JP 2002039904A JP 2003242165 A JP2003242165 A JP 2003242165A
- Authority
- JP
- Japan
- Prior art keywords
- clustering
- data
- time
- specific service
- subscriber
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
ット分析において、顧客データの時系列的な推移を考慮
し、顧客特性の有効な時系列パターンを導出すること
で、潜在ターゲットの導出を実現する。 【解決手段】 顧客のデータを入力し、それをクラスタ
リングする手段210、クラスタリング結果を時系列デ
ータに並べる手段220、クラスタリング時系列データ
を特定サービスへの加入者データと非加入者データに分
類する手段230、特定サービス加入者の時系列的クラ
スタの特徴推移を抽出する手段240、この抽出結果を
非加入者データに当てはめ、特定サービス加入者特有の
ルールを選別する手段250、該ルールを特定サービス
非加入者データに適用して同様の傾向を持つ非加入者を
潜在ターゲットとして出力する手段260を設ける。
Description
などにおいて、データマイニング技術におけるクラスタ
リングとアソシエーション分析を組み合わせた、時系列
データからの潜在ターゲット導出技術に関するものであ
る。
定量的データの時系列データを用いた潜在ターゲット予
測を実施する場合、GRIや決定木等のアルゴリズムを
用いる方法が一般的であるが、そのまま顧客データの属
性値を用いる場合、ある顧客の時系列的なデータの推移
の値を分析結果として導出することはできず、例えば、
図7のように、特定時点の特定属性値そのものがルール
として導出されてしまう。図7は従来の決定木による時
系列データ分析を説明したものである。また、因果関係
や発生順序など時系列的な推移を導出するアソシエーシ
ョン分析では、定性的データしか扱うことはできない。
においては、定量的データの時系列データを用いた分析
のため、特定時点における特定属性の個々の値によりル
ールが導出され、顧客データの時系列的な推移を用いた
分析を実施することはできない。また、時系列的な推移
を導出するアソシエーション分析には定量的データを用
いることはできない。一方、定量的データを範囲毎に分
割するなどして定性的データとして扱う方法も考えられ
るが、範囲の決定や分割数の決定は人為的な判断を必要
とする。
べく、通信サービス等における潜在ターゲット導出にあ
たり、まずクラスタリングを用いて定量的データをデー
タの分散値が最大になるように定性的データ化し、その
結果をアソシエーション分析にかけることにより、特定
サービス加入者特有の時系列的な推移をルールとして導
出し、潜在ターゲットを導出することにある。また、ク
ラスタリングを用いることで、人為的な判断を必要とせ
ずに数学的に意味を持つ範囲や分割数を決定できるよう
にすることにある。
特定のタイミング毎に取得しておいた顧客のスナップシ
ョットデータをクラスタリング手段へ入力し、各々の時
点の顧客データに対してそれぞれクラスタリングを実行
する。次に、ソート手段によって、クラスタリング結果
を時系列順に並べ変え、フィルタ手段によって、特定サ
ービスへの加入者のみのクラスタリング時系列データと
特定サービスへの非加入者のみのクラスタリング時系列
データとに分類する。そして、特定サービス加入者のク
ラスタリング時系列データをアソシエーション分析手段
へ入力し、特定サービス加入者の時系列的なクラスタの
推移の特徴抽出を行う。次に、ルール選別手段に、アソ
シエーション分析手段で抽出された結果と、特定サービ
ス非加入者のクラスタリング時系列データを入力するこ
とによって、特定サービス加入者特有のルールを選別す
る。最後に、ターゲット出力手段に、特定サービス加入
者特有のクラスタの推移と、特定サービス非加入者のク
ラスタリング時系列データを入力することで、特定サー
ビス加入者特有のクラスタリング結果の推移と同一のク
ラスタリング結果の推移を示す特定サービスへの非加入
者を潜在ターゲットとして出力する。
列データを用いて分析を実施する場合、特定時点におけ
る特定属性のポイントポイントの値によりルールが導出
されるが、本発明では、クラスタリング手法とアソシエ
ーション分析を組み合わせることで、顧客データの時系
列的な推移を考慮した潜在ターゲットの導出を実施でき
る点が異なる。
実施例を説明する。図1は、本発明の実施例におけるシ
ステム構成図であり、図中、100は入力データ(スナ
ップショットデータ)、200は潜在ターゲット導出装
置、300は出力データ(潜在ターゲット)である。こ
こで、潜在ターゲット導出装置200は、クラスタリン
グ手段210、ソート手段220、フィルタ手段23
0、アソシエーンョン分析手段240、ルール選別手段
250、ターゲット出力手段260で構成される。
であり、図3はクラスタリング手段210の出力例であ
り、図4はソート手段220によるクラスタリング手段
210の出力のソーテイング結果例であり、図5は顧客
IDが「xxxx」である特定顧客のクラスタリング結
果の時系列推移イメージを表した図である。
トである。以下、図6のフローチャートに従って本実施
例の動作を説明する。
図2で示されるような特定のタイミング毎(図2では1
ケ月毎)に取得しておいた顧客データのスナップショッ
トデータを入力データ100として順次インプットする
(ステップS1,S2)。例えば、通信分野における特
定サービスを想定した場合、スナップショットデータ
は、特定サービスへの加入者のデータと非加入者のデー
タからなり、加入者データと非加入者データはフラグ等
で区別されている。また、加入者データにはサービス加
入日付なども記録されている。
図2のような定量的データの入力データ100を定性的
データにクラスタリングし、図3のようなクラスタリン
グ結果出力を得る(ステップS3)。但し、図3におい
て、a、b、c、・・・はクラスタNo.である。また、
図3中の1月の顧客データのクラスタリング結果におい
て、顧客IDが「zzzz」のクラスタリングAのクラ
スタNo.gと、顧客IDが「xxxx」のクラスタリン
グBのクラスタNo.gは独立しており、同一クラスタリ
ングにおける同一のクラスタNo.同士のみが同一のクラ
スタに属する。
の際に用いる属性は、単一属性の場合もあれば、複数の
属性を一括してクラスタリングする場合もあり、これは
事前に潜在ターゲット導出装置操作者が決定しておく。
図2では、1月、・・・、5月、6月の顧客データを示
し、これに対応して、図3では、1月、・・・、5月、
6月での特定時点でのクラスタリング結果を示している
が、特定時点の単位としては日、週、月、年など、使用
するデータにより任意の周期に設定することが可能であ
る。
リング結果の時系列順の加工とソーティング処理を実施
する(ステップS4)。例えば、図4のように、「時
間」カラムには、時系列順を出力し、「クラスタNo.−
時間」カラムには、「−」より左項にクラスタリング手
段210で出力されたクラスタNo.を出力し、右項に時
間カラムの値と同値に加工/ソーティングする。この加
工によって、特定顧客の時系列的推移は、図5で示され
るような形で表すことができる。この例では、顧客ID
が「xxxx」である特定顧客が、クラスタリングAに
ついて、時系列a−1→b−2→b−3・・・の順に推
移していることを示している。
手段220で時系列順の加工とソーティング処理された
クラスタリング時系列データについて、特定サービス加
入者のクラスタリング時系列データ231と特定サービ
ス非加入者のクラスタリング時系列データ232に分類
してそれぞれ出力する(ステップS5)。
より、特定サービス加入者のクラスタリング時系列デー
タ231を入力として、特定サービス加入者の時系列的
なクラスタの推移の特徴を抽出する(ステップS6)。
ここでは、例えばクラスタリングAにおいて、a−1→
b−2→b−3とb−4→c−5→c−6がアソシエー
ション分析手段240の出力結果として得られたとす
る。
ーション分析手段240で抽出された特定サービス加入
者の時系列的なクラスタの推移データと、フィルタ手段
230の出力の非加入者のクラスタリング時系列データ
232を入力することにより、特定サービス加入者のみ
に特有な時系列的クラスタの推移を抽出する(ステップ
S7)。例えばクラスタリングAにおいて、a−1→b
−2→b−3は特定サービス加入者と非加入者データの
双方でそれぞれのデータ中で20%の確率で出現した推
移だとし、b−4→c−5→c−6は特定サービス加入
者では20%の確率で出現し、非加入者データでは5%
の確率で出現したとすると、a−1→b−2→b−3で
推移したアソシエーション結果は特定サービス加入者特
有のルールではなく、非加入者にも当てはまる当たり前
のルールと判別できるため、ルール選別手段250によ
り排除される。しかしながらb−4→c−5→c−6で
推移したアソシエーション結果は、特定サービス加入者
の方が非加入者データに比べ4倍の確率で出現している
ため、ルール選別手段260で採用され出力される。
ール選択手段250で抽出された特定サービス加入者特
有の時系列的クラスタの推移データと、フィルタ手段2
30の出力の特定サービス非加入者のクラスタリング時
系列データ232を入力して、特定サービス非加入者の
中から、サービス加入者特有の時系列的クラスタの推移
と同一の時系列的クラスタの推移を持つ顧客を潜在ター
ゲットとし、該顧客を出力データ300として出力す
る。例えばクラスタリングAにおいて、非加入者のクラ
スタリング時系列データの中でb−4→c−5→c−6
と推移した5%の顧客を潜在ターゲットとして出力す
る。
の時系列的な推移をルールとして導出し、潜在ターゲッ
トの導出を実現することができる。
ビスの種類によっては、加入後に顧客の特性が大きく変
化することがあり、そのサービスの潜在顧客をターゲッ
ト導出する場合には、その特定サービス加入者のデータ
をそのまま使う場合、有効なルールが導出できない可能
性がある。
ソート手段220では、クラスタリング手段210の出
力のうち、特定サービス加入者のクラスタリング結果に
ついては、そのサービスに加入する直前のデータまでを
時系列データとして出力する。この処理により、サービ
スに加入する直前までの顧客特性の変化を時系列的なク
ラスタの推移として扱うことができる。それ以外の動作
は、これまでの説明と同じである。
特性が大きく変化するようなサービスに関しても、サー
ビスに加入する直前までの特定サービス加入者特有の時
系列的な推移をルールとして導出し、潜在ターゲットの
導出を実現することができる。
部もしくは全部の処理機能をコンピュータのプログラム
で構成し、そのプログラムをコンピュータを用いて実行
して本発明を実現することができること、あるいは、図
6で示した処理手順をコンピュータのプログラムで構成
し、そのプログラムをコンピュータに実行させることが
できることは言うまでもない。また、コンピュータでそ
の処理機能を実現するためのプログラム、あるいは、コ
ンピュータにその処理手順を実行させるためのプログラ
ムを、そのコンピュータが読み取り可能な記録媒体、例
えば、FDや、MO、ROM、メモリカード、CD、D
VD、リムーバブルディスクなどに記録して、保存した
り、提供したりすることができるとともに、インターネ
ット等のネットワークを通してそのプログラムを配布し
たりすることが可能である。
通信サービス分野等における潜在顧客ターゲット分析に
おいて、履歴データを各々の時点でクラスタリングする
ことで定量的データの分散値を最大にするように定性的
データに変換し、その結果をアソシエーンョン分析に適
用することで、顧客データの時系列的な推移を考慮し、
顧客特性の有効な時系列パターンを導出することで、潜
在ターゲットの導出を行うことができる。また、サービ
スの加入によって顧客特性が大きく変化する場合にも対
応して潜在ターゲットを導出することができる。
スタリング手法によって分類することで、特徴的な特性
にセグメント化し、複数の時点でのクラスタリング結果
を時系列的な流れとして扱うことで、マクロな通信利用
特性の変化と、特定顧客のミクロな利用特性の変化を追
従できるメリットがある。
る。
加工及びソーテイング結果例である。
表した図である。
である。
る図である。
Claims (6)
- 【請求項1】 データマイニングにより将来特定サービ
スへ加入する可能性のある顧客(以下、潜在ターゲッ
ト)を導出する潜在ターゲット導出装置であって、 特定のタイミング毎に取得した顧客のスナップショット
データを入力とし、該データをクラスタリングするクラ
スタリング手段と、 前記クラスタリング手段によるクラスタリング結果を時
系列的に並べるソート手段と、 前記ソート手段により時系列的に並べられたクラスタリ
ング結果(以下、クラスタリング時系列データ)を特定
サービスへの加入者データと非加入者データに分類する
フィルタ手段と、 前記フイルタ手段により分類された特定サービス加入者
のクラスタリング時系列データをもとに、特定サービス
加入者の時系列的な特徴を抽出するアソシエーション分
析手段と、 前記フイルタ手段により分類された特定サービス非加入
者のクラスタリング時系列データに対して、前記アソシ
エーション分析手段で抽出された特定サービス加入者の
時系列的な特徴を当てはめ、特定サービス加入者特有の
時系列的な特徴のみを選別するルール選別手段と、 前記フイルタ手段により分類された特定サービス非加入
者のクラスタリング時系列データを入力とし、前記ルー
ル選別手段で選別された特定サービス加入者特有の時系
列的な特徴と同様の特徴を持つ特定サービス非加入者を
潜在ターゲットとして出力するターゲット出力手段と、 を有することを特徴とする潜在ターゲット導出装置。 - 【請求項2】 請求項1記載の潜在ターゲット導出装置
において、前記ソート手段は、特定サービス加入者につ
いては、該特定サービスに加入する直前までのクラスタ
リング結果を時系列的に並べて出力することを特徴とす
る潜在ターゲット導出装置。 - 【請求項3】 データマイニングにより将来特定サービ
スへ加入する可能性のある顧客(潜在ターゲット)を導
出する潜在ターゲット導出方法であって、 特定のタイミング毎に取得した顧客のスナップショット
データを入力とし、該データをクラスタリングするクラ
スタリング過程と、 前記クラスタリング過程によるクラスタリング結果を時
系列的に並べるソート過程と、 前記ソート過程により時系列的に並べられたクラスタリ
ング結果(クラスタリング時系列データ)を特定サービ
スへの加入者データと非加入者データに分類するフィル
タ過程と、 前記フイルタ過程により分類された特定サービス加入者
のクラスタリング時系列データをもとに、特定サービス
加入者の時系列的な特徴を抽出するアソシエーション分
析過程と、 前記フイルタ過程により分類された特定サービス非加入
者のクラスタリング時系列データに対して、前記アソシ
エーション分析過程で抽出された特定サービス加入者の
時系列的な特徴を当てはめ、特定サービス加入者特有の
時系列的な特徴のみを選別するルール選別過程と、 前記フイルタ過程により分類された特定サービス非加入
者のクラスタリング時系列データを入力とし、前記ルー
ル選別過程で選別された特定サービス加入者特有の時系
列的な特徴と同様の特徴を持つ特定サービス非加入者を
潜在ターゲットとして出力するターゲット出力過程と、 を有することを特徴とする潜在ターゲット導出方法。 - 【請求項4】 請求項3記載の潜在ターゲット導出方法
において、前記ソート過程は、特定サービス加入者につ
ては、該特定サービスに加入する直前までのクラスタリ
ング結果を時系列的に並べて出力することを特徴とする
潜在ターゲット導出方法。 - 【請求項5】 請求項1もしくは2記載の潜在ターゲッ
ト導出装置の各手段あるいは請求項3もしくは4記載の
潜在ターゲット導出方法の各過程をコンピュータに実行
させるためのプログラム。 - 【請求項6】 請求項1もしくは2記載の潜在ターゲッ
ト導出装置の各手段あるいは請求項3もしくは4記載の
潜在ターゲット導出方法の各過程をコンピュータに実行
させるためのプログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002039904A JP2003242165A (ja) | 2002-02-18 | 2002-02-18 | 潜在ターゲット導出装置、潜在ターゲット導出方法、そのプログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002039904A JP2003242165A (ja) | 2002-02-18 | 2002-02-18 | 潜在ターゲット導出装置、潜在ターゲット導出方法、そのプログラム及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003242165A true JP2003242165A (ja) | 2003-08-29 |
Family
ID=27780791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002039904A Pending JP2003242165A (ja) | 2002-02-18 | 2002-02-18 | 潜在ターゲット導出装置、潜在ターゲット導出方法、そのプログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003242165A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7526462B2 (en) | 2005-05-26 | 2009-04-28 | Kabushiki Kaisha Toshiba | Method and apparatus for generating time-series data from web pages |
JP2011257917A (ja) * | 2010-06-08 | 2011-12-22 | Sony Corp | コンテンツ推薦装置およびコンテンツ推薦方法 |
JP2019032807A (ja) * | 2017-08-04 | 2019-02-28 | 富士電機株式会社 | 要因分析システム、要因分析方法およびプログラム |
-
2002
- 2002-02-18 JP JP2002039904A patent/JP2003242165A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7526462B2 (en) | 2005-05-26 | 2009-04-28 | Kabushiki Kaisha Toshiba | Method and apparatus for generating time-series data from web pages |
JP2011257917A (ja) * | 2010-06-08 | 2011-12-22 | Sony Corp | コンテンツ推薦装置およびコンテンツ推薦方法 |
JP2019032807A (ja) * | 2017-08-04 | 2019-02-28 | 富士電機株式会社 | 要因分析システム、要因分析方法およびプログラム |
JP7139625B2 (ja) | 2017-08-04 | 2022-09-21 | 富士電機株式会社 | 要因分析システム、要因分析方法およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104090888B (zh) | 一种用户行为数据的分析方法和装置 | |
CN103034508A (zh) | 软件推荐方法和系统 | |
CN106846082B (zh) | 基于硬件信息的旅游冷启动用户产品推荐系统及方法 | |
KR20080089545A (ko) | 정보 처리 장치 및 방법, 및 프로그램 | |
CN104915403B (zh) | 一种信息处理方法及服务器 | |
CN110347724A (zh) | 异常行为识别方法、装置、电子设备及介质 | |
CN111459922A (zh) | 用户识别方法、装置、设备及存储介质 | |
CN108447064A (zh) | 一种图片处理方法及装置 | |
CN110569237A (zh) | 实现实时数据清洗处理的系统及其方法 | |
JP2003242165A (ja) | 潜在ターゲット導出装置、潜在ターゲット導出方法、そのプログラム及び記録媒体 | |
CN115828180A (zh) | 一种基于解析优化和时序卷积网络的日志异常检测方法 | |
WO2023273074A1 (zh) | 一种业务产品确定方法、装置、电子设备、介质及程序 | |
CN111737371B (zh) | 可动态预测的数据流量检测分类方法及装置 | |
CN113988190A (zh) | 客户意向分析方法、装置、设备及存储介质 | |
JP5020513B2 (ja) | パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 | |
CN107463564A (zh) | 服务器中数据的特征分析方法和装置 | |
CN112162978A (zh) | 一种数据血缘检测方法、装置、电子设备及可读存储介质 | |
Varun et al. | An efficient technique for feature selection to predict customer churn in telecom industry | |
CN116431459B (zh) | 分布式日志链路跟踪数据处理方法及装置 | |
JP3767432B2 (ja) | 絞込条件抽出方法及び装置及び絞込条件抽出プログラム及び絞込条件抽出プログラムを格納した記憶媒体 | |
CN110990349A (zh) | 一种智能系统安全体系中的不平衡日志过采样方法 | |
CN112437058B (zh) | 基于会话流量日志的防火墙安全策略自动生成方法 | |
CN113313417B (zh) | 一种基于决策树模型的涉诉风险信号分级方法及装置 | |
CN118035093A (en) | Big data test case analysis and extraction algorithm based on log | |
CN105930444A (zh) | 一种互联网用户分群方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070704 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071003 |