JP2003242165A - 潜在ターゲット導出装置、潜在ターゲット導出方法、そのプログラム及び記録媒体 - Google Patents

潜在ターゲット導出装置、潜在ターゲット導出方法、そのプログラム及び記録媒体

Info

Publication number
JP2003242165A
JP2003242165A JP2002039904A JP2002039904A JP2003242165A JP 2003242165 A JP2003242165 A JP 2003242165A JP 2002039904 A JP2002039904 A JP 2002039904A JP 2002039904 A JP2002039904 A JP 2002039904A JP 2003242165 A JP2003242165 A JP 2003242165A
Authority
JP
Japan
Prior art keywords
clustering
data
time
specific service
subscriber
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002039904A
Other languages
English (en)
Inventor
Kentaro Hotta
健太郎 堀田
Tomoko Shibata
朋子 柴田
Toshinao Kokubu
利直 国分
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002039904A priority Critical patent/JP2003242165A/ja
Publication of JP2003242165A publication Critical patent/JP2003242165A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 通信サービス分野等における潜在顧客ターゲ
ット分析において、顧客データの時系列的な推移を考慮
し、顧客特性の有効な時系列パターンを導出すること
で、潜在ターゲットの導出を実現する。 【解決手段】 顧客のデータを入力し、それをクラスタ
リングする手段210、クラスタリング結果を時系列デ
ータに並べる手段220、クラスタリング時系列データ
を特定サービスへの加入者データと非加入者データに分
類する手段230、特定サービス加入者の時系列的クラ
スタの特徴推移を抽出する手段240、この抽出結果を
非加入者データに当てはめ、特定サービス加入者特有の
ルールを選別する手段250、該ルールを特定サービス
非加入者データに適用して同様の傾向を持つ非加入者を
潜在ターゲットとして出力する手段260を設ける。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、通信サービス分野
などにおいて、データマイニング技術におけるクラスタ
リングとアソシエーション分析を組み合わせた、時系列
データからの潜在ターゲット導出技術に関するものであ
る。
【0002】
【従来の技術】従来、データマイニング技術において、
定量的データの時系列データを用いた潜在ターゲット予
測を実施する場合、GRIや決定木等のアルゴリズムを
用いる方法が一般的であるが、そのまま顧客データの属
性値を用いる場合、ある顧客の時系列的なデータの推移
の値を分析結果として導出することはできず、例えば、
図7のように、特定時点の特定属性値そのものがルール
として導出されてしまう。図7は従来の決定木による時
系列データ分析を説明したものである。また、因果関係
や発生順序など時系列的な推移を導出するアソシエーシ
ョン分析では、定性的データしか扱うことはできない。
【0003】
【発明が解決しようとする課題】このように、従来技術
においては、定量的データの時系列データを用いた分析
のため、特定時点における特定属性の個々の値によりル
ールが導出され、顧客データの時系列的な推移を用いた
分析を実施することはできない。また、時系列的な推移
を導出するアソシエーション分析には定量的データを用
いることはできない。一方、定量的データを範囲毎に分
割するなどして定性的データとして扱う方法も考えられ
るが、範囲の決定や分割数の決定は人為的な判断を必要
とする。
【0004】本発明の目的は、上記従来の問題を解決す
べく、通信サービス等における潜在ターゲット導出にあ
たり、まずクラスタリングを用いて定量的データをデー
タの分散値が最大になるように定性的データ化し、その
結果をアソシエーション分析にかけることにより、特定
サービス加入者特有の時系列的な推移をルールとして導
出し、潜在ターゲットを導出することにある。また、ク
ラスタリングを用いることで、人為的な判断を必要とせ
ずに数学的に意味を持つ範囲や分割数を決定できるよう
にすることにある。
【0005】
【課題を解決するための手段】本発明では、まず、予め
特定のタイミング毎に取得しておいた顧客のスナップシ
ョットデータをクラスタリング手段へ入力し、各々の時
点の顧客データに対してそれぞれクラスタリングを実行
する。次に、ソート手段によって、クラスタリング結果
を時系列順に並べ変え、フィルタ手段によって、特定サ
ービスへの加入者のみのクラスタリング時系列データと
特定サービスへの非加入者のみのクラスタリング時系列
データとに分類する。そして、特定サービス加入者のク
ラスタリング時系列データをアソシエーション分析手段
へ入力し、特定サービス加入者の時系列的なクラスタの
推移の特徴抽出を行う。次に、ルール選別手段に、アソ
シエーション分析手段で抽出された結果と、特定サービ
ス非加入者のクラスタリング時系列データを入力するこ
とによって、特定サービス加入者特有のルールを選別す
る。最後に、ターゲット出力手段に、特定サービス加入
者特有のクラスタの推移と、特定サービス非加入者のク
ラスタリング時系列データを入力することで、特定サー
ビス加入者特有のクラスタリング結果の推移と同一のク
ラスタリング結果の推移を示す特定サービスへの非加入
者を潜在ターゲットとして出力する。
【0006】従来の技術と異なる点は、従来技術は時系
列データを用いて分析を実施する場合、特定時点におけ
る特定属性のポイントポイントの値によりルールが導出
されるが、本発明では、クラスタリング手法とアソシエ
ーション分析を組み合わせることで、顧客データの時系
列的な推移を考慮した潜在ターゲットの導出を実施でき
る点が異なる。
【0007】
【発明の実施の形態】以下、図面に基づいて本発明の一
実施例を説明する。図1は、本発明の実施例におけるシ
ステム構成図であり、図中、100は入力データ(スナ
ップショットデータ)、200は潜在ターゲット導出装
置、300は出力データ(潜在ターゲット)である。こ
こで、潜在ターゲット導出装置200は、クラスタリン
グ手段210、ソート手段220、フィルタ手段23
0、アソシエーンョン分析手段240、ルール選別手段
250、ターゲット出力手段260で構成される。
【0008】図2は顧客スナップショットデータの一例
であり、図3はクラスタリング手段210の出力例であ
り、図4はソート手段220によるクラスタリング手段
210の出力のソーテイング結果例であり、図5は顧客
IDが「xxxx」である特定顧客のクラスタリング結
果の時系列推移イメージを表した図である。
【0009】図6は本実施例における処理フローチャー
トである。以下、図6のフローチャートに従って本実施
例の動作を説明する。
【0010】まず、潜在ターゲット導出装置200へ、
図2で示されるような特定のタイミング毎(図2では1
ケ月毎)に取得しておいた顧客データのスナップショッ
トデータを入力データ100として順次インプットする
(ステップS1,S2)。例えば、通信分野における特
定サービスを想定した場合、スナップショットデータ
は、特定サービスへの加入者のデータと非加入者のデー
タからなり、加入者データと非加入者データはフラグ等
で区別されている。また、加入者データにはサービス加
入日付なども記録されている。
【0011】次に、クラスタリング手段210により、
図2のような定量的データの入力データ100を定性的
データにクラスタリングし、図3のようなクラスタリン
グ結果出力を得る(ステップS3)。但し、図3におい
て、a、b、c、・・・はクラスタNo.である。また、
図3中の1月の顧客データのクラスタリング結果におい
て、顧客IDが「zzzz」のクラスタリングAのクラ
スタNo.gと、顧客IDが「xxxx」のクラスタリン
グBのクラスタNo.gは独立しており、同一クラスタリ
ングにおける同一のクラスタNo.同士のみが同一のクラ
スタに属する。
【0012】なお、図2に示すように、クラスタリング
の際に用いる属性は、単一属性の場合もあれば、複数の
属性を一括してクラスタリングする場合もあり、これは
事前に潜在ターゲット導出装置操作者が決定しておく。
図2では、1月、・・・、5月、6月の顧客データを示
し、これに対応して、図3では、1月、・・・、5月、
6月での特定時点でのクラスタリング結果を示している
が、特定時点の単位としては日、週、月、年など、使用
するデータにより任意の周期に設定することが可能であ
る。
【0013】次に、ソート手段220により、クラスタ
リング結果の時系列順の加工とソーティング処理を実施
する(ステップS4)。例えば、図4のように、「時
間」カラムには、時系列順を出力し、「クラスタNo.−
時間」カラムには、「−」より左項にクラスタリング手
段210で出力されたクラスタNo.を出力し、右項に時
間カラムの値と同値に加工/ソーティングする。この加
工によって、特定顧客の時系列的推移は、図5で示され
るような形で表すことができる。この例では、顧客ID
が「xxxx」である特定顧客が、クラスタリングAに
ついて、時系列a−1→b−2→b−3・・・の順に推
移していることを示している。
【0014】次に、フィルタ手段230により、ソート
手段220で時系列順の加工とソーティング処理された
クラスタリング時系列データについて、特定サービス加
入者のクラスタリング時系列データ231と特定サービ
ス非加入者のクラスタリング時系列データ232に分類
してそれぞれ出力する(ステップS5)。
【0015】次に、アソシエーション分析手段240に
より、特定サービス加入者のクラスタリング時系列デー
タ231を入力として、特定サービス加入者の時系列的
なクラスタの推移の特徴を抽出する(ステップS6)。
ここでは、例えばクラスタリングAにおいて、a−1→
b−2→b−3とb−4→c−5→c−6がアソシエー
ション分析手段240の出力結果として得られたとす
る。
【0016】次に、ルール選別手段250に、アソシエ
ーション分析手段240で抽出された特定サービス加入
者の時系列的なクラスタの推移データと、フィルタ手段
230の出力の非加入者のクラスタリング時系列データ
232を入力することにより、特定サービス加入者のみ
に特有な時系列的クラスタの推移を抽出する(ステップ
S7)。例えばクラスタリングAにおいて、a−1→b
−2→b−3は特定サービス加入者と非加入者データの
双方でそれぞれのデータ中で20%の確率で出現した推
移だとし、b−4→c−5→c−6は特定サービス加入
者では20%の確率で出現し、非加入者データでは5%
の確率で出現したとすると、a−1→b−2→b−3で
推移したアソシエーション結果は特定サービス加入者特
有のルールではなく、非加入者にも当てはまる当たり前
のルールと判別できるため、ルール選別手段250によ
り排除される。しかしながらb−4→c−5→c−6で
推移したアソシエーション結果は、特定サービス加入者
の方が非加入者データに比べ4倍の確率で出現している
ため、ルール選別手段260で採用され出力される。
【0017】最後に、ターゲット出力手段260に、ル
ール選択手段250で抽出された特定サービス加入者特
有の時系列的クラスタの推移データと、フィルタ手段2
30の出力の特定サービス非加入者のクラスタリング時
系列データ232を入力して、特定サービス非加入者の
中から、サービス加入者特有の時系列的クラスタの推移
と同一の時系列的クラスタの推移を持つ顧客を潜在ター
ゲットとし、該顧客を出力データ300として出力す
る。例えばクラスタリングAにおいて、非加入者のクラ
スタリング時系列データの中でb−4→c−5→c−6
と推移した5%の顧客を潜在ターゲットとして出力す
る。
【0018】このようにして、特定サービス加入者特有
の時系列的な推移をルールとして導出し、潜在ターゲッ
トの導出を実現することができる。
【0019】以上本発明の一実施例を説明したが、サー
ビスの種類によっては、加入後に顧客の特性が大きく変
化することがあり、そのサービスの潜在顧客をターゲッ
ト導出する場合には、その特定サービス加入者のデータ
をそのまま使う場合、有効なルールが導出できない可能
性がある。
【0020】このような場合は、図1の構成において、
ソート手段220では、クラスタリング手段210の出
力のうち、特定サービス加入者のクラスタリング結果に
ついては、そのサービスに加入する直前のデータまでを
時系列データとして出力する。この処理により、サービ
スに加入する直前までの顧客特性の変化を時系列的なク
ラスタの推移として扱うことができる。それ以外の動作
は、これまでの説明と同じである。
【0021】このようにして、加入することにより顧客
特性が大きく変化するようなサービスに関しても、サー
ビスに加入する直前までの特定サービス加入者特有の時
系列的な推移をルールとして導出し、潜在ターゲットの
導出を実現することができる。
【0022】なお、図1で示した装置における各部の一
部もしくは全部の処理機能をコンピュータのプログラム
で構成し、そのプログラムをコンピュータを用いて実行
して本発明を実現することができること、あるいは、図
6で示した処理手順をコンピュータのプログラムで構成
し、そのプログラムをコンピュータに実行させることが
できることは言うまでもない。また、コンピュータでそ
の処理機能を実現するためのプログラム、あるいは、コ
ンピュータにその処理手順を実行させるためのプログラ
ムを、そのコンピュータが読み取り可能な記録媒体、例
えば、FDや、MO、ROM、メモリカード、CD、D
VD、リムーバブルディスクなどに記録して、保存した
り、提供したりすることができるとともに、インターネ
ット等のネットワークを通してそのプログラムを配布し
たりすることが可能である。
【0023】
【発明の効果】以上説明したように、本発明によれば、
通信サービス分野等における潜在顧客ターゲット分析に
おいて、履歴データを各々の時点でクラスタリングする
ことで定量的データの分散値を最大にするように定性的
データに変換し、その結果をアソシエーンョン分析に適
用することで、顧客データの時系列的な推移を考慮し、
顧客特性の有効な時系列パターンを導出することで、潜
在ターゲットの導出を行うことができる。また、サービ
スの加入によって顧客特性が大きく変化する場合にも対
応して潜在ターゲットを導出することができる。
【0024】本発明では、特定時点での顧客属性をクラ
スタリング手法によって分類することで、特徴的な特性
にセグメント化し、複数の時点でのクラスタリング結果
を時系列的な流れとして扱うことで、マクロな通信利用
特性の変化と、特定顧客のミクロな利用特性の変化を追
従できるメリットがある。
【図面の簡単な説明】
【図1】本発明の一実施例におけるシステム構成図であ
る。
【図2】顧客データの一例である。
【図3】クラスタリング手段の出力例である。
【図4】フィルタ手段によるクラスタリング出力結果の
加工及びソーテイング結果例である。
【図5】特定顧客のクラスタリング結果の時系列推移を
表した図である。
【図6】本発明の一実施例における処理フローチャート
である。
【図7】従来の決定木による時系列データ分析を説明す
る図である。
【符号の説明】
100 入力データ 200 潜在ターゲット導出装置 210 クラスタリング手段 220 ソート手段 230 フイルタ手段 240 アソシエーション分析手段 250 ルール選別手段 260 ターゲット出力手段 300 出力データ(潜在ターゲット)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 国分 利直 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B075 ND20 NR02 NR12 NS10 UU40

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 データマイニングにより将来特定サービ
    スへ加入する可能性のある顧客(以下、潜在ターゲッ
    ト)を導出する潜在ターゲット導出装置であって、 特定のタイミング毎に取得した顧客のスナップショット
    データを入力とし、該データをクラスタリングするクラ
    スタリング手段と、 前記クラスタリング手段によるクラスタリング結果を時
    系列的に並べるソート手段と、 前記ソート手段により時系列的に並べられたクラスタリ
    ング結果(以下、クラスタリング時系列データ)を特定
    サービスへの加入者データと非加入者データに分類する
    フィルタ手段と、 前記フイルタ手段により分類された特定サービス加入者
    のクラスタリング時系列データをもとに、特定サービス
    加入者の時系列的な特徴を抽出するアソシエーション分
    析手段と、 前記フイルタ手段により分類された特定サービス非加入
    者のクラスタリング時系列データに対して、前記アソシ
    エーション分析手段で抽出された特定サービス加入者の
    時系列的な特徴を当てはめ、特定サービス加入者特有の
    時系列的な特徴のみを選別するルール選別手段と、 前記フイルタ手段により分類された特定サービス非加入
    者のクラスタリング時系列データを入力とし、前記ルー
    ル選別手段で選別された特定サービス加入者特有の時系
    列的な特徴と同様の特徴を持つ特定サービス非加入者を
    潜在ターゲットとして出力するターゲット出力手段と、 を有することを特徴とする潜在ターゲット導出装置。
  2. 【請求項2】 請求項1記載の潜在ターゲット導出装置
    において、前記ソート手段は、特定サービス加入者につ
    いては、該特定サービスに加入する直前までのクラスタ
    リング結果を時系列的に並べて出力することを特徴とす
    る潜在ターゲット導出装置。
  3. 【請求項3】 データマイニングにより将来特定サービ
    スへ加入する可能性のある顧客(潜在ターゲット)を導
    出する潜在ターゲット導出方法であって、 特定のタイミング毎に取得した顧客のスナップショット
    データを入力とし、該データをクラスタリングするクラ
    スタリング過程と、 前記クラスタリング過程によるクラスタリング結果を時
    系列的に並べるソート過程と、 前記ソート過程により時系列的に並べられたクラスタリ
    ング結果(クラスタリング時系列データ)を特定サービ
    スへの加入者データと非加入者データに分類するフィル
    タ過程と、 前記フイルタ過程により分類された特定サービス加入者
    のクラスタリング時系列データをもとに、特定サービス
    加入者の時系列的な特徴を抽出するアソシエーション分
    析過程と、 前記フイルタ過程により分類された特定サービス非加入
    者のクラスタリング時系列データに対して、前記アソシ
    エーション分析過程で抽出された特定サービス加入者の
    時系列的な特徴を当てはめ、特定サービス加入者特有の
    時系列的な特徴のみを選別するルール選別過程と、 前記フイルタ過程により分類された特定サービス非加入
    者のクラスタリング時系列データを入力とし、前記ルー
    ル選別過程で選別された特定サービス加入者特有の時系
    列的な特徴と同様の特徴を持つ特定サービス非加入者を
    潜在ターゲットとして出力するターゲット出力過程と、 を有することを特徴とする潜在ターゲット導出方法。
  4. 【請求項4】 請求項3記載の潜在ターゲット導出方法
    において、前記ソート過程は、特定サービス加入者につ
    ては、該特定サービスに加入する直前までのクラスタリ
    ング結果を時系列的に並べて出力することを特徴とする
    潜在ターゲット導出方法。
  5. 【請求項5】 請求項1もしくは2記載の潜在ターゲッ
    ト導出装置の各手段あるいは請求項3もしくは4記載の
    潜在ターゲット導出方法の各過程をコンピュータに実行
    させるためのプログラム。
  6. 【請求項6】 請求項1もしくは2記載の潜在ターゲッ
    ト導出装置の各手段あるいは請求項3もしくは4記載の
    潜在ターゲット導出方法の各過程をコンピュータに実行
    させるためのプログラムを記録した記録媒体。
JP2002039904A 2002-02-18 2002-02-18 潜在ターゲット導出装置、潜在ターゲット導出方法、そのプログラム及び記録媒体 Pending JP2003242165A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002039904A JP2003242165A (ja) 2002-02-18 2002-02-18 潜在ターゲット導出装置、潜在ターゲット導出方法、そのプログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002039904A JP2003242165A (ja) 2002-02-18 2002-02-18 潜在ターゲット導出装置、潜在ターゲット導出方法、そのプログラム及び記録媒体

Publications (1)

Publication Number Publication Date
JP2003242165A true JP2003242165A (ja) 2003-08-29

Family

ID=27780791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002039904A Pending JP2003242165A (ja) 2002-02-18 2002-02-18 潜在ターゲット導出装置、潜在ターゲット導出方法、そのプログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP2003242165A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7526462B2 (en) 2005-05-26 2009-04-28 Kabushiki Kaisha Toshiba Method and apparatus for generating time-series data from web pages
JP2011257917A (ja) * 2010-06-08 2011-12-22 Sony Corp コンテンツ推薦装置およびコンテンツ推薦方法
JP2019032807A (ja) * 2017-08-04 2019-02-28 富士電機株式会社 要因分析システム、要因分析方法およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7526462B2 (en) 2005-05-26 2009-04-28 Kabushiki Kaisha Toshiba Method and apparatus for generating time-series data from web pages
JP2011257917A (ja) * 2010-06-08 2011-12-22 Sony Corp コンテンツ推薦装置およびコンテンツ推薦方法
JP2019032807A (ja) * 2017-08-04 2019-02-28 富士電機株式会社 要因分析システム、要因分析方法およびプログラム
JP7139625B2 (ja) 2017-08-04 2022-09-21 富士電機株式会社 要因分析システム、要因分析方法およびプログラム

Similar Documents

Publication Publication Date Title
CN104090888B (zh) 一种用户行为数据的分析方法和装置
CN103034508A (zh) 软件推荐方法和系统
CN106846082B (zh) 基于硬件信息的旅游冷启动用户产品推荐系统及方法
KR20080089545A (ko) 정보 처리 장치 및 방법, 및 프로그램
CN104915403B (zh) 一种信息处理方法及服务器
CN110347724A (zh) 异常行为识别方法、装置、电子设备及介质
CN111459922A (zh) 用户识别方法、装置、设备及存储介质
CN108447064A (zh) 一种图片处理方法及装置
CN110569237A (zh) 实现实时数据清洗处理的系统及其方法
JP2003242165A (ja) 潜在ターゲット導出装置、潜在ターゲット導出方法、そのプログラム及び記録媒体
CN115828180A (zh) 一种基于解析优化和时序卷积网络的日志异常检测方法
WO2023273074A1 (zh) 一种业务产品确定方法、装置、电子设备、介质及程序
CN111737371B (zh) 可动态预测的数据流量检测分类方法及装置
CN113988190A (zh) 客户意向分析方法、装置、设备及存储介质
JP5020513B2 (ja) パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体
CN107463564A (zh) 服务器中数据的特征分析方法和装置
CN112162978A (zh) 一种数据血缘检测方法、装置、电子设备及可读存储介质
Varun et al. An efficient technique for feature selection to predict customer churn in telecom industry
CN116431459B (zh) 分布式日志链路跟踪数据处理方法及装置
JP3767432B2 (ja) 絞込条件抽出方法及び装置及び絞込条件抽出プログラム及び絞込条件抽出プログラムを格納した記憶媒体
CN110990349A (zh) 一种智能系统安全体系中的不平衡日志过采样方法
CN112437058B (zh) 基于会话流量日志的防火墙安全策略自动生成方法
CN113313417B (zh) 一种基于决策树模型的涉诉风险信号分级方法及装置
CN118035093A (en) Big data test case analysis and extraction algorithm based on log
CN105930444A (zh) 一种互联网用户分群方法及系统

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070704

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071003