JP2021108216A - エネルギー顧客の予測的セグメント化 - Google Patents
エネルギー顧客の予測的セグメント化 Download PDFInfo
- Publication number
- JP2021108216A JP2021108216A JP2021073240A JP2021073240A JP2021108216A JP 2021108216 A JP2021108216 A JP 2021108216A JP 2021073240 A JP2021073240 A JP 2021073240A JP 2021073240 A JP2021073240 A JP 2021073240A JP 2021108216 A JP2021108216 A JP 2021108216A
- Authority
- JP
- Japan
- Prior art keywords
- segment
- customer
- patterns
- pattern
- segments
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011218 segmentation Effects 0.000 title description 39
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 43
- 238000000034 method Methods 0.000 claims description 72
- 230000007613 environmental effect Effects 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 13
- 238000010845 search algorithm Methods 0.000 claims description 7
- 230000006872 improvement Effects 0.000 claims description 5
- 238000007637 random forest analysis Methods 0.000 claims description 2
- 238000005265 energy consumption Methods 0.000 claims 1
- 238000003066 decision tree Methods 0.000 abstract description 13
- 238000009826 distribution Methods 0.000 abstract description 11
- 238000013459 approach Methods 0.000 abstract description 9
- 238000005457 optimization Methods 0.000 abstract description 9
- 239000011159 matrix material Substances 0.000 description 18
- 238000003860 storage Methods 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 230000003542 behavioural effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000003339 best practice Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 235000020021 gose Nutrition 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000010206 sensitivity analysis Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0204—Market segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
- G06Q10/06375—Prediction of business process outcome or impact based on a proposed change
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Computing Systems (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Algebra (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
Abstract
【課題】エネルギー消費者を分析するためのコンピュータアルゴリズムを提供する。【解決手段】コンピュータシステムは、顧客属性と、顧客が特定のエネルギー効率プログラムに登録しているかどうか等の顧客の採択ステータスとを一覧化した顧客記録を受信する。パターンの初期セットを、決定ツリー等に従って、顧客記録の中から識別する。初期セットを、最小サポートおよび有効度および最大重複要件を満たすパターンのセットを得るように取捨選択する。パターンは、各セグメントの最小有効度を最大限にすることを求める最適化アルゴリズムに従って、セグメントに割り当てられる。有効度は、正の採択ステータスを有する、各セグメントのパターンに合致する顧客の数を示す。最適化アルゴリズムは、線形分数整数計画(LFIP−F)を評価し、パターンの最適分布に反復的に近づいていく2分探索アルゴリズムである。【選択図】図3
Description
(発明の分野)
本願は、2015年12月18日に出願され、“Predictive Segmentation of Energy Consumers”と題された米国仮出願第62/269,793号の利益を主張するものであり、該米国仮出願の全体の内容は、参照により本明細書中に援用される。
本願は、2015年12月18日に出願され、“Predictive Segmentation of Energy Consumers”と題された米国仮出願第62/269,793号の利益を主張するものであり、該米国仮出願の全体の内容は、参照により本明細書中に援用される。
本発明は、エネルギー消費者を分析するためのコンピュータアルゴリズムに関する。
近年、エネルギー公益事業企業は、従来はその電気供給業者と関わりがなかった顧客基盤とのその関係を改善することにますます注力している。これまで、エネルギー企業およびその消費者は双方とも、公益事業者の役割を「光を灯し続けること」として理解していた。しかしながら、現在の技術傾向および顧客の考え方の偏移(特に、その顧客の選好の理解および予測に秀でた消費者に対面するインターネット企業の増加によって拍車がかけられている)は、公益事業におけるその顧客に関わることの関心の増加につながっている。
これらの傾向は、複合して、データ可用性(スマートメータ等の感知インフラストラクチャを通して収集される高粒度消費データおよび消費者自体に関する他の「メタデータ」の両方)および本データを処理するための算出方法(例えば、Li and Yang(2015年)、Liu and Nielsen(2015年))の増加となっている。したがって、エネルギー公益事業者は、その顧客満足度および関与およびその顧客基盤内の環境に優しいプログラムへの参加を増加させる方法を提供し得る、分析技法にますます依拠している。顧客セグメント化は、顧客を理解し、その理解に応じて、作用する方法を識別するための技法として、大小様々な組織のマーケティングツールボックスの土台である。これは、いくつかの用途を挙げると、主に、マーケティング(包括的論評は、Association(2014年)に見られる)、オンライン広告(例えば、Yan et
al.(2009年))、または電子小売(例えば、Bhatnagar and Ghose(2004年))において使用されている。
al.(2009年))、または電子小売(例えば、Bhatnagar and Ghose(2004年))において使用されている。
公益事業者が、その顧客とのより個人的かつ現代的関係を発展することを目指すにつれて、参加および関与を増加させるように、効率対策および他のプログラムについてのその通信を見直すための手段として、セグメント化を積極的に受け入れている。採用されている大部分の市場セグメント化技法は、実際は、固定規則セットの適用に焦点を当てている。例えば、大型住居に暮らし、子供を持つ消費者は、「高消費者」カテゴリに割り当てられる一方、環境保護雑誌を購読している者は、「環境保護提唱者」グループに帰属する。典型的には、これらの規則は、反事実または逸話経験、挙動研究、または小規模心理学実験から派生しており、実際は、「公然の事実」と見なされる。抽出した専門知識の結果なので、そのようなセグメント化方略は、確かに有用であり、理論および実践が知らしめられるべきである。
本明細書に説明されるアプローチは、エネルギー消費者をセグメント化するための改良されたアプローチを提供する。
本願は、顧客属性における特定のパターンに関して同質的であること、および所望の結果に対して予測的であることの両方である、大規模母集団内のサブグループを識別するための予測セグメント化技法を導入する。動機付けとなる設定は、エネルギー公益事業企業の顧客に対する非常に分かりやすくかつ直感的な、ある意味では最適でもある、セグメント化および標的化プロセスを作成することである。本設定では、エネルギー公益事業者は、少数のメッセージタイプが、異なるタイプの通信に応答する可能性が最も高い適切に選定された顧客に送信されるように設計することを所望する。提案される方法は、消費、人口統計、およびプログラム登録データを使用し、標準的機械学習技法を使用して、基本予測パターンを抽出する。本方法は、次に、専門家ガイドラインと、以前の挙動研究から利用可能な消費者特性についての仮説によって記述される、少数のセグメントへのパターンの実行可能な潜在的割当を定義する。アルゴリズムは、次いで、実行可能であること、および予測力を最大限にすることの両方である、両方のセグメントへのパターンの最適配分を識別する。本方法は、主要な米国エネルギー公益事業者からの大規模データセット上で実装され、その登録の可能性が平均母集団のものの2倍であって、少数の単純な直感的規則によって記述される、顧客のセグメントを得る。
本発明は、例えば、以下を提供する。
(項目1)
方法であって、
コンピュータシステムによって、それぞれが属性および顧客の採択ステータスを含む複数の顧客記録を受信するステップと、
前記コンピュータシステムによって、複数のパターンを識別するステップであって、各パターンは、前記複数の顧客記録の属性に従って、前記複数の顧客記録のうちの顧客記録のグループ化を定義する、ステップと、
前記コンピュータシステムによって、前記複数のパターンのうちの各パターンが前記複数のセグメントのうちの1つのセグメントに割り当てられるように、前記複数のパターンを複数のセグメント間に割り当てるステップであって、前記複数のパターンを前記複数のセグメント間に割り当てるステップは、前記複数のセグメントに関する最小有効度を反復的に増加させるアルゴリズムに従って行われ、各セグメントの有効度は、前記各セグメントに分散される前記複数のパターンのうちのパターンに合致する、前記複数の顧客記録のうちの顧客記録の採択ステータスの関数である、ステップと、
を含む、方法。
(項目2)
前記アルゴリズムは、方程式LFIP−Fを解くステップを含む、項目1に記載の方法。
(項目3)
前記アルゴリズムは、2分探索アルゴリズム1に従って、線形整数計画実行可能性問題を解くステップを含む、項目2に記載の方法。
(項目4)
前記複数のパターンのうちの各パターンは、前記各パターンの属性のうちの各属性に対し、前記各属性に関する閾値を備える、項目1に記載の方法。
(項目5)
前記複数のパターンを識別するステップは、決定ツリーに従って、前記複数の顧客記録を処理するステップを含む、項目1に記載の方法。
(項目6)
前記複数のパターンを識別するステップは、
決定ツリーに従って、前記複数の顧客記録を処理し、初期パターンセットを得るステップと、
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップと、
を含む、項目1に記載の方法。
(項目7)
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップは、
最小サポートを下回るサポートを有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンのサポートは、前記各パターンに合致する顧客記録の数を示す、ステップ
を含む、項目6に記載の方法。
(項目8)
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップは、
最小有効度を下回る有効度を有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンの有効度は、正の採択ステータスを有する前記各パターンに合致する顧客記録の割合を示す、ステップ
を含む、項目7に記載の方法。
(項目9)
前記最小有効度は、正の採択ステータスを有する前記複数の顧客記録のうちの全ての顧客記録の割合の1を上回る倍数である、項目8に記載の方法。
(項目10)
前記倍数は、少なくとも2である、項目9に記載の方法。
(項目11)
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップは、前記顧客記録のセットの最大パーセンテージを上回るものが、前記初期パターンセットの別のパターンにも合致するように、前記各パターンに合致する前記複数の顧客記録のうちの顧客記録のセットを有する、前記初期パターンセットの各パターンを除去するステップを含む、項目6に記載の方法。
(項目12)
前記最大パーセンテージは、60〜75パーセントである、項目11に記載の方法。
(項目13)
各セグメントの有効度はさらに、前記各セグメントに割り当てられる各パターンの網羅行列の関数であり、各パターンの網羅行列は、前記各パターンに合致する前記複数の顧客記録のうちの各顧客記録に対して1/nの値を有し、nは、前記各顧客記録によって合致される前記複数のパターンのうちのパターンの数である、項目1に記載の方法。
(項目14)
1つまたはそれを上回る処理デバイスと、前記1つまたはそれを上回る処理デバイスに動作可能に結合される1つまたはそれを上回るメモリデバイスとを備えるシステムであって、前記1つまたはそれを上回るメモリデバイスは、実行可能コードを記憶し、前記実行可能コードは、1つまたはそれを上回るプロセッサに、
それぞれが属性および前記顧客の採択ステータスを含む複数の顧客記録を受信するステップと、
複数のパターンを識別するステップであって、各パターンは、前記複数の顧客記録の属性に従って、前記複数の顧客記録のうちの顧客記録のグループ化を定義するステップと、
前記複数のパターンのうちの各パターンが、前記複数のセグメントのうちの1つのセグメントに割り当てられ、前記複数のパターンが、前記複数のセグメントの最小有効度を最大限にすることを追求するアルゴリズムに従って前記複数のセグメント間に分散されるように、前記複数のパターンを複数のセグメント間に割り当てるステップであって、各セグメントの有効度は、前記各セグメントに分散される前記複数のパターンのうちのパターンに合致する前記複数の顧客記録のうちの顧客記録の採択ステータスの関数である、ステップと
を行わせるために有効である、システム。
(項目15)
前記アルゴリズムは、2分探索アルゴリズム1を使用して、方程式LFIP−Fに従って、線形整数計画実行可能性問題を解くステップを含む、項目14に記載のシステム。
(項目16)
前記複数のパターンのうちの各パターンは、前記各パターンの属性のうちの各属性に対し、前記各属性に関する閾値を備える、項目14に記載のシステム。
(項目17)
前記実行可能コードはさらに、前記1つまたはそれを上回るプロセッサに、
決定ツリーに従って、前記複数の顧客記録を処理し、初期パターンセットを得るステップと、
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップと、
によって、前記複数のパターンを識別させる、項目14に記載のシステム。
(項目18)
前記実行可能コードはさらに、前記1つまたはそれを上回るプロセッサに、
最小サポートを下回るサポートを有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンのサポートは、前記各パターンに合致する顧客記録の数を示す、ステップと、
最小有効度を下回る有効度を有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンの有効度は、正の採択ステータスを有する前記各パターンに合致する顧客記録の割合を示す、ステップと、
前記顧客記録のセットの最大パーセンテージを上回るものが、前記初期パターンセットの別のパターンにも合致するように、前記各パターンに合致する前記複数の顧客記録のうちの顧客記録のセットを有する前記初期パターンセットの各パターンを除去するステップと、
によって、前記初期パターンセットを取捨選択し、前記複数のパターンを得ることを行わせるために有効である、項目17に記載のシステム。
(項目19)
前記倍数は、少なくとも2である、項目18に記載のシステム。
(項目20)
前記実行可能コードはさらに、前記1つまたはそれを上回るプロセッサに、各セグメントの有効度を前記各セグメントに割り当てられる各パターンの網羅行列の関数として算出させるために有効であり、各パターンの網羅行列は、前記各パターンに合致する前記複数の顧客記録のうちの各顧客記録に対し、1/nの値を有し、nは、前記各顧客記録によって合致される前記複数のパターンのうちのパターンの数である、項目14に記載のシステム。
本発明は、例えば、以下を提供する。
(項目1)
方法であって、
コンピュータシステムによって、それぞれが属性および顧客の採択ステータスを含む複数の顧客記録を受信するステップと、
前記コンピュータシステムによって、複数のパターンを識別するステップであって、各パターンは、前記複数の顧客記録の属性に従って、前記複数の顧客記録のうちの顧客記録のグループ化を定義する、ステップと、
前記コンピュータシステムによって、前記複数のパターンのうちの各パターンが前記複数のセグメントのうちの1つのセグメントに割り当てられるように、前記複数のパターンを複数のセグメント間に割り当てるステップであって、前記複数のパターンを前記複数のセグメント間に割り当てるステップは、前記複数のセグメントに関する最小有効度を反復的に増加させるアルゴリズムに従って行われ、各セグメントの有効度は、前記各セグメントに分散される前記複数のパターンのうちのパターンに合致する、前記複数の顧客記録のうちの顧客記録の採択ステータスの関数である、ステップと、
を含む、方法。
(項目2)
前記アルゴリズムは、方程式LFIP−Fを解くステップを含む、項目1に記載の方法。
(項目3)
前記アルゴリズムは、2分探索アルゴリズム1に従って、線形整数計画実行可能性問題を解くステップを含む、項目2に記載の方法。
(項目4)
前記複数のパターンのうちの各パターンは、前記各パターンの属性のうちの各属性に対し、前記各属性に関する閾値を備える、項目1に記載の方法。
(項目5)
前記複数のパターンを識別するステップは、決定ツリーに従って、前記複数の顧客記録を処理するステップを含む、項目1に記載の方法。
(項目6)
前記複数のパターンを識別するステップは、
決定ツリーに従って、前記複数の顧客記録を処理し、初期パターンセットを得るステップと、
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップと、
を含む、項目1に記載の方法。
(項目7)
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップは、
最小サポートを下回るサポートを有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンのサポートは、前記各パターンに合致する顧客記録の数を示す、ステップ
を含む、項目6に記載の方法。
(項目8)
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップは、
最小有効度を下回る有効度を有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンの有効度は、正の採択ステータスを有する前記各パターンに合致する顧客記録の割合を示す、ステップ
を含む、項目7に記載の方法。
(項目9)
前記最小有効度は、正の採択ステータスを有する前記複数の顧客記録のうちの全ての顧客記録の割合の1を上回る倍数である、項目8に記載の方法。
(項目10)
前記倍数は、少なくとも2である、項目9に記載の方法。
(項目11)
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップは、前記顧客記録のセットの最大パーセンテージを上回るものが、前記初期パターンセットの別のパターンにも合致するように、前記各パターンに合致する前記複数の顧客記録のうちの顧客記録のセットを有する、前記初期パターンセットの各パターンを除去するステップを含む、項目6に記載の方法。
(項目12)
前記最大パーセンテージは、60〜75パーセントである、項目11に記載の方法。
(項目13)
各セグメントの有効度はさらに、前記各セグメントに割り当てられる各パターンの網羅行列の関数であり、各パターンの網羅行列は、前記各パターンに合致する前記複数の顧客記録のうちの各顧客記録に対して1/nの値を有し、nは、前記各顧客記録によって合致される前記複数のパターンのうちのパターンの数である、項目1に記載の方法。
(項目14)
1つまたはそれを上回る処理デバイスと、前記1つまたはそれを上回る処理デバイスに動作可能に結合される1つまたはそれを上回るメモリデバイスとを備えるシステムであって、前記1つまたはそれを上回るメモリデバイスは、実行可能コードを記憶し、前記実行可能コードは、1つまたはそれを上回るプロセッサに、
それぞれが属性および前記顧客の採択ステータスを含む複数の顧客記録を受信するステップと、
複数のパターンを識別するステップであって、各パターンは、前記複数の顧客記録の属性に従って、前記複数の顧客記録のうちの顧客記録のグループ化を定義するステップと、
前記複数のパターンのうちの各パターンが、前記複数のセグメントのうちの1つのセグメントに割り当てられ、前記複数のパターンが、前記複数のセグメントの最小有効度を最大限にすることを追求するアルゴリズムに従って前記複数のセグメント間に分散されるように、前記複数のパターンを複数のセグメント間に割り当てるステップであって、各セグメントの有効度は、前記各セグメントに分散される前記複数のパターンのうちのパターンに合致する前記複数の顧客記録のうちの顧客記録の採択ステータスの関数である、ステップと
を行わせるために有効である、システム。
(項目15)
前記アルゴリズムは、2分探索アルゴリズム1を使用して、方程式LFIP−Fに従って、線形整数計画実行可能性問題を解くステップを含む、項目14に記載のシステム。
(項目16)
前記複数のパターンのうちの各パターンは、前記各パターンの属性のうちの各属性に対し、前記各属性に関する閾値を備える、項目14に記載のシステム。
(項目17)
前記実行可能コードはさらに、前記1つまたはそれを上回るプロセッサに、
決定ツリーに従って、前記複数の顧客記録を処理し、初期パターンセットを得るステップと、
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップと、
によって、前記複数のパターンを識別させる、項目14に記載のシステム。
(項目18)
前記実行可能コードはさらに、前記1つまたはそれを上回るプロセッサに、
最小サポートを下回るサポートを有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンのサポートは、前記各パターンに合致する顧客記録の数を示す、ステップと、
最小有効度を下回る有効度を有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンの有効度は、正の採択ステータスを有する前記各パターンに合致する顧客記録の割合を示す、ステップと、
前記顧客記録のセットの最大パーセンテージを上回るものが、前記初期パターンセットの別のパターンにも合致するように、前記各パターンに合致する前記複数の顧客記録のうちの顧客記録のセットを有する前記初期パターンセットの各パターンを除去するステップと、
によって、前記初期パターンセットを取捨選択し、前記複数のパターンを得ることを行わせるために有効である、項目17に記載のシステム。
(項目19)
前記倍数は、少なくとも2である、項目18に記載のシステム。
(項目20)
前記実行可能コードはさらに、前記1つまたはそれを上回るプロセッサに、各セグメントの有効度を前記各セグメントに割り当てられる各パターンの網羅行列の関数として算出させるために有効であり、各パターンの網羅行列は、前記各パターンに合致する前記複数の顧客記録のうちの各顧客記録に対し、1/nの値を有し、nは、前記各顧客記録によって合致される前記複数のパターンのうちのパターンの数である、項目14に記載のシステム。
本発明の利点が容易に理解され得るように、上記に簡単に説明される本発明のより具体的な説明が、添付の図面に図示される具体的実施形態を参照することによってもたらされるであろう。これらの図面は、本発明の典型的実施形態のみを描写するものであって、したがって、その範囲を限定するものと見なされないという理解の下、本発明は、付随の図面の使用を通して付加的具体性および詳細を伴って記載および説明されるであろう。
1.動作環境および概要
図1を参照すると、本明細書に開示される方法は、図示される動作環境100によって実装されてもよい。サーバシステム102または他のタイプのコンピュータシステムは、データベース104をホストするかまたはそれにアクセスしてもよい。サーバシステム102はまた、デスクトップまたはラップトップコンピュータと置換され得るか、または、十分な計算力を伴うモバイルデバイスとさえ置換され得る。データベース104は、複数の顧客に関する顧客記録106を含んでもよい。本明細書に開示される方法は、エネルギー顧客に関して説明される。故に、各顧客記録106は、単一世帯または顧客アカウントに関するデータを含んでもよく、これは、したがって、ともに生活している複数の個人に関するデータを含んでもよい。
図1を参照すると、本明細書に開示される方法は、図示される動作環境100によって実装されてもよい。サーバシステム102または他のタイプのコンピュータシステムは、データベース104をホストするかまたはそれにアクセスしてもよい。サーバシステム102はまた、デスクトップまたはラップトップコンピュータと置換され得るか、または、十分な計算力を伴うモバイルデバイスとさえ置換され得る。データベース104は、複数の顧客に関する顧客記録106を含んでもよい。本明細書に開示される方法は、エネルギー顧客に関して説明される。故に、各顧客記録106は、単一世帯または顧客アカウントに関するデータを含んでもよく、これは、したがって、ともに生活している複数の個人に関するデータを含んでもよい。
顧客記録106は、氏名、アカウント番号、または他の一意の識別子の形態で1人またはそれを上回る顧客の識別子108aとして、そのような情報を含んでもよい。顧客記録106は、顧客の住所108bと、年齢、所得、性別、職業、教育レベル、および顧客を特徴付けし得る任意の他の情報等の顧客記録106と関連付けられた1人またはそれを上回る個人に関する人口統計情報108cとを含んでもよい。
本明細書に開示される方法がエネルギー顧客に適用される場合、顧客記録106はさらに、使用量データ108d、例えば、1年、1ヶ月、または1日あたりに使用される毎時キロワット数を含んでもよい。使用量データ108dは、電力消費データの分析から得られた毎日、毎月、または季節的使用量パターンを含んでもよい。他の用途では、使用量データ108dは、別のサービスまたは特定のアイテムまたは生活必需品の購入の使用量を含み得る。
顧客記録106は、顧客および顧客挙動のタイプを記述するパターンを識別する際に有用であり得る、顧客に関して入手可能な任意の他のデータ108eを含んでもよい。
本明細書に開示される方法は、データを分析し、特定の措置を講じている顧客を予測する顧客データ(人口統計、使用量、およびその他)のパターンを判定するために使用される。エネルギー顧客の場合、これは、消費を低減させる、または別様に、顧客の環境影響を低減させるために、エネルギー効率プログラムに登録していること、または他の措置を講じていることを含んでもよい。故に、顧客記録106はさらに、顧客が特定のプログラムに参加することを選択しているかどうかを示す、1つまたはそれを上回る採択ステータスインジケータ108fを含んでもよい。例えば、ステータス108fは、顧客が参加を選択している場合、1であり得、そうでなければ、0であり得る。他の実施形態では、採択ステータスは、プログラムガイドラインへの準拠の程度または特定の目的に関して費やされた金銭の額を示す、値の範囲のうちの1つであってもよい。
データベース104はさらに、そこに割り当てられる複数のパターン112を有するセグメント110を記憶してもよい。各セグメント110は、有効度114を有し、これは、正の採択ステータス108fを有し、セグメント110に割り当てられたパターン112のうちの1つに合致する、顧客記録の数の尺度である。
セグメント110は、本明細書に以下で開示される方法を実装する、分析モジュール116によって定義されてもよい。特に、分析モジュール116は、パターン生成モジュール118aを含んでもよい。パターン生成モジュール118aは、顧客記録において同時に発生する一連の属性を識別する。以下に説明されるように、パターンは、各顧客記録内の種々の属性の値に関する閾値に関して記述されてもよい。また、以下に説明されるように、パターンは、決定ツリーまたは他のパターン識別アルゴリズムを使用して生成されてもよい。
分析モジュール116はさらに、パターン取捨選択モジュール(pattern pruning module)118bを含んでもよい。以下に説明されるように、パターン取捨選択モジュール118bは、最小のサポート、有効度、または非重複基準を満たさない、パターンを取捨選択(prune)してもよい。分析モジュールは、セグメント化モジュール118cを含んでもよい。セグメント化モジュール118cは、セグメントの最小有効度114がパターンをセグメント間に分散させるアルゴリズムを通して増加させられたセグメント110のセットが得られるように、取捨選択118bで生き残ったパターン112をセグメント110に割り当てる。
図2は、例示的コンピューティングデバイス200を図示する、ブロック図である。コンピューティングデバイス200は、本明細書で議論されるもの等の種々のプロシージャを行うために使用されてもよい。サーバシステム102は、コンピューティングデバイス200の属性の一部または全部を有してもよい。
コンピューティングデバイス200は、1つまたはそれを上回るプロセッサ202と、1つまたはそれを上回るメモリデバイス204と、1つまたはそれを上回るインターフェース206と、1つまたはそれを上回る大容量記憶デバイス208と、1つまたはそれを上回る入力/出力(I/O)デバイス210と、ディスプレイデバイス230とを含み、これらの全ては、バス212に結合される。プロセッサ202は、メモリデバイス204および/または大容量記憶デバイス208内に記憶される命令を実行する、1つまたはそれを上回るプロセッサまたはコントローラを含む。プロセッサ202はまた、キャッシュメモリ等の種々のタイプのコンピュータ可読媒体を含んでもよい。
メモリデバイス204は、揮発性メモリ(例えば、ランダムアクセスメモリ(RAM)214)および/または不揮発性メモリ(例えば、読取専用メモリ(ROM)216)等の種々のコンピュータ可読媒体を含む。メモリデバイス204はまた、フラッシュメモリ等の書込可能ROMを含んでもよい。
大容量記憶デバイス208は、磁気テープ、磁気ディスク、光ディスク、ソリッドステートメモリ(例えば、フラッシュメモリ)等、種々のコンピュータ可読媒体を含む。図2に示されるように、特定の大容量記憶デバイスは、ハードディスクドライブ224である。種々のドライブはまた、大容量記憶デバイス208内に含まれ、種々のコンピュータ可読媒体からの読取および/またはそこへの書込を可能にしてもよい。大容量記憶デバイス208は、可撤性媒体226および/または非可撤性媒体を含む。
I/Oデバイス210は、データおよび/または他の情報が、コンピューティングデバイス200に入力されるかまたはそこから読み出されることを可能にする、種々のデバイスを含む。例示的I/Oデバイス210は、カーソル制御デバイス、キーボード、キーパッド、マイクロホン、モニタまたは他のディスプレイデバイス、スピーカ、ネットワークインターフェースカード、モデム、レンズ、CCDまたは他の画像捕捉デバイス、および同等物を含む。
ディスプレイデバイス230は、情報をコンピューティングデバイス200の1人またはそれを上回るユーザに表示可能な任意のタイプのデバイスを含む。ディスプレイデバイス230の実施例は、モニタ、ディスプレイ端末、ビデオ投影デバイス、および同等物を含む。
インターフェース206は、コンピューティングデバイス200が、他のシステム、デバイス、またはコンピューティング環境と相互作用することを可能にする、種々のインターフェースを含む。例示的インターフェース206は、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、無線ネットワーク、およびインターネットへのインターフェース等、任意の数の異なるネットワークインターフェース220を含む。他のインターフェースは、ユーザインターフェース218と、周辺デバイスインターフェース222とを含む。インターフェース206はまた、ポインティングデバイス(マウス、トラックパッド等)、キーボード、および同等物のためのインターフェース等、1つまたはそれを上回る周辺インターフェースを含んでもよい。
バス212は、プロセッサ202、メモリデバイス204、インターフェース206、大容量記憶デバイス208、I/Oデバイス210、およびディスプレイデバイス230が、相互に通信すること、およびバス212に結合される他のデバイスまたはコンポーネントと通信することを可能にする。バス212は、システムバス、PCIバス、IEEE1394バス、USBバス等のいくつかのタイプのバス構造のうちの1つまたはそれを上回るものを表す。
例証目的のために、プログラムおよび他の実行可能プログラムコンポーネントは、本明細書では、離散ブロックとして示されるが、そのようなプログラムおよびコンポーネントは、場合によって、コンピューティングデバイス200の異なる記憶コンポーネント内に常駐してもよく、プロセッサ202によって実行されることを理解されたい。代替として、本明細書に説明されるシステムおよびプロシージャは、ハードウェアにおいて、または、ハードウェア、ソフトウェア、および/またはファームウェアの組み合わせにおいて実装されることができる。例えば、1つまたはそれを上回る特定用途向け集積回路(ASIC)が、本明細書に説明されるシステムおよびプロシージャのうちの1つまたはそれを上回るものを実施するようにプログラムされることができる。
図3を参照すると、サーバシステム102は、図示される方法300を実行してもよい。方法300は、顧客データを受信するステップ302を含んでもよい。これは、顧客に関してデータが集められる際、ある期間にわたって、データを受信するステップを含んでもよい。受信されたデータは、顧客記録106内に含まれるように上記に説明されたデータの一部または全部を含んでもよい。
方法300はさらに、顧客採択ステータスを判定するステップ304を含んでもよい。採択ステータス108fは、受信される際に、または、顧客に対するオファーを延長する後続プログラムの一部として受信され、応答を受信する際に、顧客記録内に含まれてもよい。いずれの場合も、データは、手動でまたは自動的に、各顧客に対する採択ステータスを示すサーバシステム102に提供される。いくつかの実施形態では、方法300は、オファーを受信した顧客に対してのみ実行されてもよい。
方法300はさらに、初期パターンセットを生成するステップ306を含んでもよい。例えば、初期パターンセットを生成するステップ306は、当技術分野において公知のような決定ツリーをトラバースするステップを含んでもよく、決定ツリーの各ノードは、顧客記録106の属性108b−108eに対応する、属性値または属性値の範囲である。例示的決定ツリーは、図5に示され、初期パターンセットの生成は、以下の第3.2節「データからの予測パターンの抽出」および第5.2節「データから抽出される予測パターン」により詳細に説明される。
方法300はさらに、初期パターンセットを取捨選択するステップ308を含んでもよい。これは、十分なサポートを有していないパターン(すなわち、パターンに合致する不十分な数の顧客記録106)、十分な有効度を有していないパターン(すなわち、パターンに合致し、正の採択ステータスを有する、不十分な数の顧客記録106)、および別のパターンにもまた合致する、合致する顧客記録の閾値を上回るパーセンテージを有するパターンを除去するステップを含んでもよい。取捨選択プロセスのより詳細な説明は、以下の第3.2節「データからの予測パターンの抽出」および第5.2節「データから抽出される予測パターン」に説明される。
方法300はさらに、セグメントの最小有効度に関して最大値に反復的に近づいていくアルゴリズムに従ってパターンをセグメントに割り当てるステップ310を含んでもよく、有効度は、各セグメントに割り当てられるパターンに合致する顧客記録のどれだけ多くが正の採択ステータスを有するかについての尺度である。これは、以下の第3.1節「最小有効度の増加」に説明されるように、最適化アルゴリズムを実行するステップを含んでもよい。
セグメントは、次いで、さらに処理されてもよい312。特に、セグメントは、標的化されたマーケティングのために使用されてもよい。すなわち、広告は、その有効度を増加させるために、1個のセグメントのパターンに合致する顧客のみに編成され、伝送されてもよい。セグメントはまた、顧客挙動を可視化するために、または任意の他の事業目標のために、使用されてもよい。
方法300によって実装されるアルゴリズムは、以下の第2節から第3節により詳細に説明される。第4節は、以前のアプローチの概要を含み、第5節は、実際の顧客データを使用した実験結果を図示する。
以下の説明は、セグメントの最小有効度を最大限にすることを追求する最適化アルゴリズムについてであることに留意されたい。故に、「最大」、「最適」、「最適化」、「最小限」、および「最小」という言及は、絶対または実際の最大、最適、または最小値を指すわけではなく、開示されるアルゴリズムの限界を被り、かつ開示されるアルゴリズムの有限数の反復の実施を受けて判定された最大、最適、または最小値であると理解されるものとする。
具体的には、値「を最大限にする」、値の「最大限化」、および値の「最大」は、開示されるアルゴリズムの前の反復または開示されるアルゴリズムを行わない場合と比較して、値の増加を指すと理解されるものとするが、値の閉集合が検討され、閉集合内の最大値が、確実性を持って判定され得る場合を除く。
値「を最小限にする」、値の「最小限化」、および値の「最小」は、開示されるアルゴリズムの前の反復または開示されるアルゴリズムを行わない場合と比較して、値の減少を指すと理解されるものとするが、値の閉集合が検討され、閉集合内の最小値が、確実性を持って判定され得る場合を除く。
「最適化する」とは、開示されるアルゴリズムを行わない場合よりも絶対最適値に近い値を見出すことを意味すると理解されるものとし、絶対最適値を実際に見出すと理解されないものとする。同様に、「最適」値は、ほぼ最適値であると理解されるものとし、「ほぼ」は、数字を表し、それに関する数学的演算を行う正確度を表す際の限界、開示されるアルゴリズムが理論的に達成し得るものの限界、および実践的に行われ得る反復の数の限界を指す。
2.予測セグメント化
透過的かつ有用なセグメント化方略は、以下を達成すべきである。1.実践者がそれに容易に関連させ、採択し得るように、既存の有用な専門知識および最良実践を取り込む。2.エネルギー公益事業者における非技術的プログラム管理者にとって分かりやすくかつ直感的であって、かつマーケティング通信を生成するために有用であること。3.有効度の観点から、ある最適性保証をもたらす、すなわち、母集団全体から無作為に得られた消費者より措置を講じる可能性がより高いメンバのサブグループを識別するその目的に関して、非常に弁別的である。
透過的かつ有用なセグメント化方略は、以下を達成すべきである。1.実践者がそれに容易に関連させ、採択し得るように、既存の有用な専門知識および最良実践を取り込む。2.エネルギー公益事業者における非技術的プログラム管理者にとって分かりやすくかつ直感的であって、かつマーケティング通信を生成するために有用であること。3.有効度の観点から、ある最適性保証をもたらす、すなわち、母集団全体から無作為に得られた消費者より措置を講じる可能性がより高いメンバのサブグループを識別するその目的に関して、非常に弁別的である。
第1に、多くの専門知識および実践的経験が、エネルギー公益事業者には存在し、その基盤の中から識別することを所望するある高レベルタイプの顧客についての仮説を立てることを可能にする。例えば、最も経験豊富なプログラム管理者は、「環境保護提唱者」消費者が、より「コスト優先的」な消費者(金銭節約についての議論に応答し得る)とは他のタイプの通信(環境への影響を強調する)に応答することに同意するであろう。
第2に、本方法は、ある変数と各所与のセグメントを関連付ける既存の専門知識(例えば、「環境保護提唱者」は、その所得、世帯タイプ、および教育のレベルによって定義され得る)から開始し、最も有効なセグメント化方略につながるそれらの変数を伴う、単純論理規則を識別し得る。そのような直感的セグメントは、適切なメッセージ伝達方略を生成することを可能にするはずである。例えば、「環境保護提唱者」グループ内の消費者は、エネルギー節約の環境側面を強調する、メッセージを受信するであろう一方、「高消費者」カテゴリ内のそれらの消費者は、その多額の請求を削減し得る方法について通知されるであろう。
課題は、次いで、(上記の第3の点に提示されるように)結果として生じるセグメントの有用な性質を確実にし、かつ課された構造を満たす最良可能セグメント化が達成されることを保証しながら、ポイント1および2の要求を取り込む、アルゴリズムセグメント化方法を開発することである。所望の結果は、エネルギー効率プログラム登録に関するマーケティング通信の影響を最大限にする、すなわち、登録する可能性がより高いそれらの顧客を標的化することである。通信の調整およびキャンペーンの管理は両方とも、コストがかかるため、少数のセグメントに対してメッセージを作成し、それらのセグメントに措置を講じる可能性がある消費者を含ませることが主眼である。
2.1.問題設定
N人の消費者から成る母集団Xは、オペレータ(エネルギー公益事業企業)によってサービス提供される。各消費者に対し、公益事業者は、消費および顧客特性(社会人口統計および物理的構築属性等)の両方から成る、M個の数の特徴
を観察する。したがって、全ての消費者を横断した特徴データが、行列
内に記憶される。公益事業者はまた、各消費者iに対し、過去1年以内に任意のプログラムに登録したかどうかを観察し、これは、顧客iが登録したときに限り、バイナリ変数
としてエンコードされる。
N人の消費者から成る母集団Xは、オペレータ(エネルギー公益事業企業)によってサービス提供される。各消費者に対し、公益事業者は、消費および顧客特性(社会人口統計および物理的構築属性等)の両方から成る、M個の数の特徴
を観察する。したがって、全ての消費者を横断した特徴データが、行列
内に記憶される。公益事業者はまた、各消費者iに対し、過去1年以内に任意のプログラムに登録したかどうかを観察し、これは、顧客iが登録したときに限り、バイナリ変数
としてエンコードされる。
公益事業者は、需要側効率プログラム登録のための標的化された通信の有効度を通知、簡略化、および増加させることを目的として、データ(X,y)を使用して、属性Xに対して「同質」である母集団内のK個のセグメントを識別することを所望する。以前のマーケティング研究に基づいて、公益事業者は、サービス提供している顧客の「タイプ」に関してある仮説を有し得る。本以前の知識は、以下の形態であると仮定される。「環境保護提唱者」は、比較的に高所得または少なくとも大学の学位を有する。「住宅改良希望者」は、住宅所有者またはその家の大黒柱である。
次いで、データ(X,y)は、セット
のパターン、
を抽出することによって、これらの仮説を具体的にするために使用されることができ、これらは、これらのパターンを呈する消費者の特性を指すという点において記述的であり、かつ、あるパターンに入る消費者が母集団全体から無作為に選択された消費者より登録する可能性がより高いという点において予測的である。パターンは、したがって、以下の形態の論理表現であると定義され得る。
式中、
は、ベースルール(論理文)である。故に、パターンが、一連の論理積として定義される。互換的に、パターンは、パターンの論理定義に従う、消費者のセットと称され得る。ベースルールは、以下の形態であるとする。
のパターン、
を抽出することによって、これらの仮説を具体的にするために使用されることができ、これらは、これらのパターンを呈する消費者の特性を指すという点において記述的であり、かつ、あるパターンに入る消費者が母集団全体から無作為に選択された消費者より登録する可能性がより高いという点において予測的である。パターンは、したがって、以下の形態の論理表現であると定義され得る。
式中、
は、ベースルール(論理文)である。故に、パターンが、一連の論理積として定義される。互換的に、パターンは、パターンの論理定義に従う、消費者のセットと称され得る。ベースルールは、以下の形態であるとする。
したがって、ベースルールは、方向(「≧」または「≦」のいずれか)を指す、変数xj(x内のj番目の変数)と、データから学習された閾値tjとによって定義される。規則Pj(・)は、その規則を定義する変数および方向の両方が仮説に合致する場合、仮説に一致するとする。同様に、パターンPは、仮説と一致する、少なくともδ≧1の規則を含有する場合、仮説とδ一致であると定義する。
上記の設定を用いて、各セグメント内の全てのパターンがそのセグメントを定義する仮説とδ一致であるように、K個のセグメントをパターンの集合として
として定義する。
は、セグメントとパターンとの間の許容関係を記述する、(公知の)整合性行列を定義するとする。
として定義する。
は、セグメントとパターンとの間の許容関係を記述する、(公知の)整合性行列を定義するとする。
2.2.有効なセグメント化
ここで、登録の率に関して消費者セグメント間で区別可能である場合に有効となる、セグメント化方略を検討する。すなわち、優れた方略(K個のセグメントに関して)は、母集団全体において観察される全体的率qと非常に異なる(より小さいか、またはそれを上回るかのいずれかである)確率qk、k=1,・・・,Kを伴って登録する、母集団内のそれらのセグメントを識別するであろう。例えば、セグメント化が、K=2のグループAおよびBから成る場合、A内の全ての消費者が登録しているが、B内の消費者が登録していなければ(したがって、qA=1かつqB=0)、完全に有効である。完全に非有効なセグメント化は、A内の消費者がB内の消費者と同一率で登録している(したがって、qA=qB)。当然ながら、常時、効率プログラムに登録した全ての者をセグメントのうちの1つに入れることによって、消費者を2個のセグメントにグループ化し得る。しかしながら、課題は、登録を予測もする、セグメントの分かりやすい直感的定義につながる、消費者特性X内のパターンを識別することである。
ここで、登録の率に関して消費者セグメント間で区別可能である場合に有効となる、セグメント化方略を検討する。すなわち、優れた方略(K個のセグメントに関して)は、母集団全体において観察される全体的率qと非常に異なる(より小さいか、またはそれを上回るかのいずれかである)確率qk、k=1,・・・,Kを伴って登録する、母集団内のそれらのセグメントを識別するであろう。例えば、セグメント化が、K=2のグループAおよびBから成る場合、A内の全ての消費者が登録しているが、B内の消費者が登録していなければ(したがって、qA=1かつqB=0)、完全に有効である。完全に非有効なセグメント化は、A内の消費者がB内の消費者と同一率で登録している(したがって、qA=qB)。当然ながら、常時、効率プログラムに登録した全ての者をセグメントのうちの1つに入れることによって、消費者を2個のセグメントにグループ化し得る。しかしながら、課題は、登録を予測もする、セグメントの分かりやすい直感的定義につながる、消費者特性X内のパターンを識別することである。
セグメントは、したがって、
である場合、登録に関する優れた価値尺度の数字である。式中、
は、全体的母集団内の登録の率である。解決したい問題は、結果として生じるセグメントが、例えば、以下の望ましい有効度性質を有するように、少なくとも
であって、最大で
のパターンを各セグメントに配分することである。・最小有効度を最大限にする
・セグメントを横断して有効度の適切な平衡を確実にする
式中、所与の加重ベクトルである、θを用いる。
である場合、登録に関する優れた価値尺度の数字である。式中、
は、全体的母集団内の登録の率である。解決したい問題は、結果として生じるセグメントが、例えば、以下の望ましい有効度性質を有するように、少なくとも
であって、最大で
のパターンを各セグメントに配分することである。・最小有効度を最大限にする
・セグメントを横断して有効度の適切な平衡を確実にする
式中、所与の加重ベクトルである、θを用いる。
所与のセグメントに関して実行可能な多くのパターン、すなわち、
が存在し得る。さらに、パターンは、重複し得る(すなわち、定義する消費者のセットは、互いに素ではない
)。次いで、S内のセグメントも同様に、記述する顧客内で重複するパターンを含有することが起こる場合、重複し得る。これは、制約(F0)に対処(8−9)し、かつ満たす、最適化問題の適切な定式化に付加的複雑化を課す。
が存在し得る。さらに、パターンは、重複し得る(すなわち、定義する消費者のセットは、互いに素ではない
)。次いで、S内のセグメントも同様に、記述する顧客内で重複するパターンを含有することが起こる場合、重複し得る。これは、制約(F0)に対処(8−9)し、かつ満たす、最適化問題の適切な定式化に付加的複雑化を課す。
しかしながら、パターン重複は、実質的であり得るため、上記の式は、パターン
の複数のパターンに入る消費者をオーバカウントする。本問題に対処するために採択する1個の簡略化は、n個の異なるパターンによって網羅される消費者が各パターン上に1/nの分数網羅率を有すると見なされ得るということに留意して、網羅行列Cの定義を緩和することである。これは、修正網羅行列
、すなわち、以下に変換される。
の複数のパターンに入る消費者をオーバカウントする。本問題に対処するために採択する1個の簡略化は、n個の異なるパターンによって網羅される消費者が各パターン上に1/nの分数網羅率を有すると見なされ得るということに留意して、網羅行列Cの定義を緩和することである。これは、修正網羅行列
、すなわち、以下に変換される。
したがって、修正網羅行列は、単一パターンの分数網羅率を示す各消費者iに加重を割り当てる(等しい重要性を各パターンに与える)。便宜上、本修正行列を依然としてCと称する。
3.予測セグメントの算出
予測セグメント化を算出するためのアルゴリズムの設計は、目的関数がとる具体的形態によって判定されるであろう(全ての制約は、単純線形形態である)。ここで、目的が、K個のセグメントを横断して最小有効度を最大限にするように、許容可能パターンをセグメントに配分することである状況に焦点を当てる(方程式(8)参照)。これは、その標的化された通信方略の最小有効度についての保証を有することを所望するプログラム管理者のための自然な要件である。
予測セグメント化を算出するためのアルゴリズムの設計は、目的関数がとる具体的形態によって判定されるであろう(全ての制約は、単純線形形態である)。ここで、目的が、K個のセグメントを横断して最小有効度を最大限にするように、許容可能パターンをセグメントに配分することである状況に焦点を当てる(方程式(8)参照)。これは、その標的化された通信方略の最小有効度についての保証を有することを所望するプログラム管理者のための自然な要件である。
3.1.最小有効度の増加
方程式(12)における上記の式は、各セグメントに対して決定変数をエンコードする、K個のベクトルzkを利用する。単一決定変数ベクトルを使用して、目的および制約をより使いやすいアフィン形態で表すために、以下の表記を採用することができる。
式中、
を用いる。次いで、有効度は、以下として表されることができる。
方程式(12)における上記の式は、各セグメントに対して決定変数をエンコードする、K個のベクトルzkを利用する。単一決定変数ベクトルを使用して、目的および制約をより使いやすいアフィン形態で表すために、以下の表記を採用することができる。
式中、
を用いる。次いで、有効度は、以下として表されることができる。
最大−最小目的の場合(8)では、最適化は、可能な限り、セグメントを横断して有効度の下限を増加させようとする。これは、qksの比較的に同質な分布をもたらす。本状況は、例えば、セグメントのそれぞれに措置が講じられるであろうとき、望ましくあり得る。この場合、最適化問題は、以下として表されてもよい。
問題(LFIP)は、線形制約を伴う、一般化(最大−最小)線形分数整数計画(generalized(max−min) linear−fractional integer program)である。本問題のクラスは、文献において広範に研究されている(例えば、論評に関して、Horst and Pardalos(1995年)、Feng et al.(2011)、Schaible and Shi(2004年)参照)。Boyd and Vandenberghe(2004年)に従って、以下の(LFIP)の等価な式を線形整数計画実行可能性問題(LFIP−F)として提案する。
式中、k=1,…,Kに関して、Aは、行
を伴う行列であって、Dは、行
を伴う行列である。λの所与の値に関して、上記の実行可能性問題(LFIP−F)は、標準的混合整数計画パッケージを使用して解かれることができる。初期顧客特性データは、非常に大きくあり得るが(ここでは、
の顧客)、パターンの数は、はるかに小さくなると予期され(M〜1,000)、セグメントの数も同様である(ここでは、K=5)。次いで、標準的パッケージは、優れた独創的な能力を発揮することができる。次いで、対応する最適zを伴う最大値
が、各ステップにおいて実行可能性問題(LFIP−F)を解く、反復2分探索アルゴリズム1(以下の表1参照)を使用して、効率的に見出されることができる。最適λ*が入るように保証される、大間隔[l0,u0](ここでは、[0,1])から開始して、アルゴリズムは、全ステップにおいて間隔[l,u]を連続的に狭め、λ*∈[u,b]を確実にする。これは、Patel et al.(2013)において構築された以下の補題1に概略される。
式中、k=1,…,Kに関して、Aは、行
を伴う行列であって、Dは、行
を伴う行列である。λの所与の値に関して、上記の実行可能性問題(LFIP−F)は、標準的混合整数計画パッケージを使用して解かれることができる。初期顧客特性データは、非常に大きくあり得るが(ここでは、
の顧客)、パターンの数は、はるかに小さくなると予期され(M〜1,000)、セグメントの数も同様である(ここでは、K=5)。次いで、標準的パッケージは、優れた独創的な能力を発揮することができる。次いで、対応する最適zを伴う最大値
が、各ステップにおいて実行可能性問題(LFIP−F)を解く、反復2分探索アルゴリズム1(以下の表1参照)を使用して、効率的に見出されることができる。最適λ*が入るように保証される、大間隔[l0,u0](ここでは、[0,1])から開始して、アルゴリズムは、全ステップにおいて間隔[l,u]を連続的に狭め、λ*∈[u,b]を確実にする。これは、Patel et al.(2013)において構築された以下の補題1に概略される。
補題1.アルゴリズム1の出力は、公差ε内およびlog2(ε0/ε)反復内のλの最大値であるλ*に対応する最適z*である。
本表記を用いて、以下を有する。
セグメントz*への最適パターン配分は、λ*に対応する。定義上、最適λ*は、以下の実行可能セットΛと非実行可能セット
との間の(上)遷移点である。したがって、以下が、公差パラメータε>0(小)に関して当てはまらなければならない。
セグメントz*への最適パターン配分は、λ*に対応する。定義上、最適λ*は、以下の実行可能セットΛと非実行可能セット
との間の(上)遷移点である。したがって、以下が、公差パラメータε>0(小)に関して当てはまらなければならない。
アルゴリズム1が最適λ*を見出すであろうことを証明するために、上記の条件を満たすことを示す必要がある。分析においてλを含有する項のみに、焦点を当てる。
上記の第2の項は、ε>0であって、Dおよびzλの両方が、非ゼロ入力のみを有するため、正である。
第2の条件を証明するために、値
を固定し、次いで、
またはε>0を示すことが所望される。
という事実は、
を含意し、したがって、λの所与の値に関して
を有していなければならない。zλは、
の最大値をもたらし、実行可能性セットΛを定義する全ての他の条件を満たすλに対応する決定変数ベクトルであるとする。次いで、以下となる。
を固定し、次いで、
またはε>0を示すことが所望される。
という事実は、
を含意し、したがって、λの所与の値に関して
を有していなければならない。zλは、
の最大値をもたらし、実行可能性セットΛを定義する全ての他の条件を満たすλに対応する決定変数ベクトルであるとする。次いで、以下となる。
次いで、
であるため、
と結論付けられる。したがって、アルゴリズム1は、常時、最適配分ベクトルz*に対応する、最大限に実行可能なλ*を見出すであろう。さらに、各ステップを用いて、アルゴリズムは、検索間隔[l,u]を半分にするため、
の完了条件に到達するために、最大で以下のステップをとる。
容易に明白となるように、最適化アルゴリズムは、最適解が、上記に説明されるように、各反復を用いてより小さくなる、検索窓[l,u]<ε内にあるように、最適解に近似する。
であるため、
と結論付けられる。したがって、アルゴリズム1は、常時、最適配分ベクトルz*に対応する、最大限に実行可能なλ*を見出すであろう。さらに、各ステップを用いて、アルゴリズムは、検索間隔[l,u]を半分にするため、
の完了条件に到達するために、最大で以下のステップをとる。
容易に明白となるように、最適化アルゴリズムは、最適解が、上記に説明されるように、各反復を用いてより小さくなる、検索窓[l,u]<ε内にあるように、最適解に近似する。
3.2.データからの予測パターンの抽出
特徴行列Xおよびバイナリ応答(登録)ベクトルyとしてエンコードされた観察のセットを前提として、非常に有効な(q>>q0)パターンPを抽出することが所望される。これに関して、以下のアプローチを採択する。1.可変深度の多くの決定ツリーを生成するために(ここでは、最大5個のレベルのツリーを生成した)、基本学習器として分類ツリーを有する、ランダムフォレストまたはAdaBoost Hastie et al.(2009年)等のアンサンブル方法を使用する。本ステップは、決定ツリーを各リーフまでトラバースすることによって得られる初期パターンのリストP0を構築することを可能にする。強化アンサンブル法における基本分類子として使用されるツリーのレベルに応じて、これらの規則は、単一文(深度1のツリーまたは決定株)から複数のベースルールの論理積まで、可変形態の複雑性をとることができる。2.パターンリストP0を取捨選択し、「品質」のあるセット基準に対応しない規則を排除する。本目的のために、以下の基準の両方を満たす場合、パターン
を「有効」と見なすものとする。・最小サポート:|P|>η、すなわち、パターンに合致する顧客の数は、η+1が各パターンに合致する最小母集団であるように、ηを上回らなければならない。ここでは、η=500が使用される。・最小有効度:q(P)>ζq0。ここでは、ζ=2が使用される。3.さらに、他のパターンとv%(ここでは、v=70%であるが、しかしながら、60〜75%のvの値もまた、使用されてもよい)を上回って重複し、より低い有効度qを有する、パターンを除去する。例えば、合致する顧客C1および有効度q1を有するパターンP1と、合致する顧客C2およびq1未満の有効度q2を有するパターンP2とに関して、v%を上回る顧客C2が、C1内に含まれる場合、パターンP2は、より低い有効度を有するため、取捨選択されるであろう。
特徴行列Xおよびバイナリ応答(登録)ベクトルyとしてエンコードされた観察のセットを前提として、非常に有効な(q>>q0)パターンPを抽出することが所望される。これに関して、以下のアプローチを採択する。1.可変深度の多くの決定ツリーを生成するために(ここでは、最大5個のレベルのツリーを生成した)、基本学習器として分類ツリーを有する、ランダムフォレストまたはAdaBoost Hastie et al.(2009年)等のアンサンブル方法を使用する。本ステップは、決定ツリーを各リーフまでトラバースすることによって得られる初期パターンのリストP0を構築することを可能にする。強化アンサンブル法における基本分類子として使用されるツリーのレベルに応じて、これらの規則は、単一文(深度1のツリーまたは決定株)から複数のベースルールの論理積まで、可変形態の複雑性をとることができる。2.パターンリストP0を取捨選択し、「品質」のあるセット基準に対応しない規則を排除する。本目的のために、以下の基準の両方を満たす場合、パターン
を「有効」と見なすものとする。・最小サポート:|P|>η、すなわち、パターンに合致する顧客の数は、η+1が各パターンに合致する最小母集団であるように、ηを上回らなければならない。ここでは、η=500が使用される。・最小有効度:q(P)>ζq0。ここでは、ζ=2が使用される。3.さらに、他のパターンとv%(ここでは、v=70%であるが、しかしながら、60〜75%のvの値もまた、使用されてもよい)を上回って重複し、より低い有効度qを有する、パターンを除去する。例えば、合致する顧客C1および有効度q1を有するパターンP1と、合致する顧客C2およびq1未満の有効度q2を有するパターンP2とに関して、v%を上回る顧客C2が、C1内に含まれる場合、パターンP2は、より低い有効度を有するため、取捨選択されるであろう。
4.文献のレビュー
エネルギープログラムのための顧客標的化は、最近、エンジニアリングおよびコンピュータサイエンス、運営管理、およびマーケティングにおける見掛け上異なる文献から注目を集めている。本研究は、エネルギー公益事業者における運営およびマーケティング部署内の既存の専門知識の上に分かりやすいセグメント構築をもたらす、単純かつ透過的方法論を提供することによって、それらの分野におけるより大きい議論に寄与する。需要側管理に関するエンジニアリング研究が、最近、細部に及ぶ消費読取および社会人口統計情報を含む、詳細な顧客データの可用性によって動機付けられている。典型的には、以下のいくつかの主なエリアに焦点が当てられている。i)必要性に応じた時間帯価格またはスマートサーモスタット制御等のプログラムを通知することを目標として、家庭全体のデータ(スマートメータまたはカスタム器具のいずれかから)を使用して、ユーザの母集団の消費パターンを記述すること(Kwac et al.(2013年)、Albert and Rajagopal(2015年))、ii)総合信号から、家庭全体および個々のアプライアンス実験データの両方を収集し、別個の最終用途を再構築すること(Carrie Armel et al.(2013年)、Kolter and Jaakkola(2012年)、およびiii)エネルギー使用に及ぼす異なる外部要因(特に、天候)の平均影響を研究すること(Houde et al.(2012年)、Kavousian et al.(2013年)、Kavousian et al.(2015年)。
エネルギープログラムのための顧客標的化は、最近、エンジニアリングおよびコンピュータサイエンス、運営管理、およびマーケティングにおける見掛け上異なる文献から注目を集めている。本研究は、エネルギー公益事業者における運営およびマーケティング部署内の既存の専門知識の上に分かりやすいセグメント構築をもたらす、単純かつ透過的方法論を提供することによって、それらの分野におけるより大きい議論に寄与する。需要側管理に関するエンジニアリング研究が、最近、細部に及ぶ消費読取および社会人口統計情報を含む、詳細な顧客データの可用性によって動機付けられている。典型的には、以下のいくつかの主なエリアに焦点が当てられている。i)必要性に応じた時間帯価格またはスマートサーモスタット制御等のプログラムを通知することを目標として、家庭全体のデータ(スマートメータまたはカスタム器具のいずれかから)を使用して、ユーザの母集団の消費パターンを記述すること(Kwac et al.(2013年)、Albert and Rajagopal(2015年))、ii)総合信号から、家庭全体および個々のアプライアンス実験データの両方を収集し、別個の最終用途を再構築すること(Carrie Armel et al.(2013年)、Kolter and Jaakkola(2012年)、およびiii)エネルギー使用に及ぼす異なる外部要因(特に、天候)の平均影響を研究すること(Houde et al.(2012年)、Kavousian et al.(2013年)、Kavousian et al.(2015年)。
エネルギー分析に関するより最近の文献は、総合需要プロファイルを使用して、プログラムを通知する、公益事業者における従来の需要管理実践の延長における消費パターンの特徴付け(負荷プロファイリング)に関する。その消費挙動がグリッドにもたらすコストによる消費者のセグメント化方略が、需要における変動率に最も寄与する消費者のグループを標的化するための方法として、Albert and Rajagopal(2014年)において提案されている。研究のポピュラーなトピックは、差別価格設定またはエネルギー削減の奨励等の介入のために後に使用され得る、典型的毎日の負荷プロファイル(典型的には、K−平均法等のオフザシェルフの教師なしアルゴリズムを使用した毎日のユーザ消費負荷形状のクラスタ化を伴う)における異質性である。本アプローチは、例えば、Flath et al.(2012年)、Rasanen and Kolehmainen(2009年)、Figueiredo et al.(2005年)、Smith et al.(2012年)、Tsekouras et al.(2007年)、Espinoza et al.(2005年)においてとられている。消費の第1の学習生成モデルに基づいて、負荷プロファイルをセグメント化し、次いで、得られたモデルをクラスタ化する他の変形例は、例えば、Albert and Rajagopal(2013)、Alzate et al.(2009年)において議論されている。しかしながら、本研究の方針は、大部分は、性質上記述的であって、典型的には、識別された負荷パターンに関する明確な使用例は、提供されておらず、そのような情報を組み込み得る公益事業者におけるプログラムは、現在殆ど存在しない。
一方、運営管理およびマーケティング文献は、過去数年にわたって、エネルギーへの適用に関心を集めている。これは、多くの公益事業企業において、効率プログラムを用いて消費者を配分、登録、および標的化することに関わる部署が、従来、運営またはマーケティングのいずれかであったという事実によって影響されたと考えられ得る。
5.実験設定
5.1.顧客特性データ
本願で使用したデータは、米国の北東部における大規模エネルギー企業から得られ、約100個の社会人口統計および建物特性およびN=957,150人の消費者に関する2年にわたる毎月のエネルギー消費読取値から構成された。標準的データクリーニングプロシージャ後、母集団全体を横断して少なくとも80%の有効エントリを有していた43個の着目変数が、選択された。それらのうち、19個の変数が、カテゴリ変数であって、24個は、数値変数であった。カテゴリ変数をバイナリダミー変数に変換することによって、P=304個の変数の最終データセットが得られた。q0=4.9%の割合に対応する、合計48,310人の消費者が、データ収集に先立って、2年以内に任意のエネルギー効率プログラムに登録した。
5.1.顧客特性データ
本願で使用したデータは、米国の北東部における大規模エネルギー企業から得られ、約100個の社会人口統計および建物特性およびN=957,150人の消費者に関する2年にわたる毎月のエネルギー消費読取値から構成された。標準的データクリーニングプロシージャ後、母集団全体を横断して少なくとも80%の有効エントリを有していた43個の着目変数が、選択された。それらのうち、19個の変数が、カテゴリ変数であって、24個は、数値変数であった。カテゴリ変数をバイナリダミー変数に変換することによって、P=304個の変数の最終データセットが得られた。q0=4.9%の割合に対応する、合計48,310人の消費者が、データ収集に先立って、2年以内に任意のエネルギー効率プログラムに登録した。
表1は、いくつかの着目カテゴリ変数を説明する。消費者の大部分(約80%)は、持ち家を所有しており、わずか約16%が賃貸である。教育レベルは、全体として、社会一般を反映し、消費者の4分の1は、それぞれ、学士号および修士号を有し、消費者の半分は、高校卒業資格またはそれ未満を有する。「環境保護意識」変数は雑誌購読、コミュニティとの関わり、政治の学習、異なる組織への加入等の要因を考慮する、第三者分析の結果を要約し、環境問題への推定される着目レベルをもたらす。
表2は、いくつかのより数値的な着目変数を要約する。平均生年は、1957年であって、これは、ベビーブーム世代の人口統計を示唆する。サンプル内の平均家族は、12年を上回る居住年数を伴って、大型住居(6部屋)で生活している。
5.2.データから抽出される予測パターン
予測規則が、上記の第3節に説明されるデータから抽出された。取捨選択後、予測パターンのリスト(その有効度は、少なくとも
であって、少なくともη=500のサポートを有していた)は、それぞれ、最大5個のベースルールのM0=2,965個のパターンを含有した(5個のベースルールを伴う1,852個のパターン、4個のベースルールを伴う963個のパターン、3個のベースルールを伴う143個のパターン、および2個のベースルールを伴う7個のパターン)。図4は、データから抽出された高さ3の例示的決定ツリーを図示する。強調されるパターンは、有効度(正のサンプルの割合)が8%であるルートから開始する、決定ツリー内の経路である。図5は、データから抽出されるM0=2,965個のパターンに関する異なる複雑性(2〜5個のベースルール)のパターンのためのパターン有効度q(R)の分布を図示する。予期されるように、分布は、指数関数的挙動を呈し、より低い有効度のパターンが多く、高有効度のパターンが少ない。
予測規則が、上記の第3節に説明されるデータから抽出された。取捨選択後、予測パターンのリスト(その有効度は、少なくとも
であって、少なくともη=500のサポートを有していた)は、それぞれ、最大5個のベースルールのM0=2,965個のパターンを含有した(5個のベースルールを伴う1,852個のパターン、4個のベースルールを伴う963個のパターン、3個のベースルールを伴う143個のパターン、および2個のベースルールを伴う7個のパターン)。図4は、データから抽出された高さ3の例示的決定ツリーを図示する。強調されるパターンは、有効度(正のサンプルの割合)が8%であるルートから開始する、決定ツリー内の経路である。図5は、データから抽出されるM0=2,965個のパターンに関する異なる複雑性(2〜5個のベースルール)のパターンのためのパターン有効度q(R)の分布を図示する。予期されるように、分布は、指数関数的挙動を呈し、より低い有効度のパターンが多く、高有効度のパターンが少ない。
登録を予測するための上位20個の最も重要な変数が、図6に列挙される。これらは、とりわけ、住宅の所有量(融資比率、利用可能な所有権)、住宅およびそこで生活している家族のサイズ、および家族の所得額を含む。これは、登録が財政的責任の認知および住宅への改良に関する能力に依存することを示唆する。本分析は、任意のエネルギー効率プログラムへの登録のみを考慮した。より具体的なタイプの消費者に向けられた具体的プログラムの分析は、(効率的アプライアンスとは対照的な断熱に対する割引等の)重要な変数におけるより精緻化された区別をもたらすであろう可能性が高い。
5.3.パターンとセグメントの関連付け
セグメントは、以前の挙動研究の結果およびデータを提供したエネルギー公益事業者との広範な相互作用を使用して定義された。公益事業者は、その独自の内部専門知識および研究およびFrankel et al.(2013年)等の独立の第三者挙動およびマーケティングの研究に基づいてすでに定義された少数のセグメントに入る消費者を識別することを所望した。上記の第2節に説明されるように、セグメントの目的は、i)各セグメントに対する適切な情報および立案を伴う標準化された電子メール等、少数のマーケティング通信を生成することと、ii)エネルギー効率プログラムに登録する可能性がある、各セグメントに対応する消費者を識別することとの2つであった。
セグメントは、以前の挙動研究の結果およびデータを提供したエネルギー公益事業者との広範な相互作用を使用して定義された。公益事業者は、その独自の内部専門知識および研究およびFrankel et al.(2013年)等の独立の第三者挙動およびマーケティングの研究に基づいてすでに定義された少数のセグメントに入る消費者を識別することを所望した。上記の第2節に説明されるように、セグメントの目的は、i)各セグメントに対する適切な情報および立案を伴う標準化された電子メール等、少数のマーケティング通信を生成することと、ii)エネルギー効率プログラムに登録する可能性がある、各セグメントに対応する消費者を識別することとの2つであった。
この先行技術に基づいて、公益事業者は、消費者が、K=5個のセグメント、すなわち、「環境保護提唱者」、「高消費者」、「住宅改良希望者」、「コスト優先者」、および「文化的誘因」に入ると考えていた。本仮説をエンコードするセグメント意味は、表3に要約される。これらのセグメント定義を前提として、P0からの潜在的パターンPが、各パターンPが個別のセグメントの意味についての仮説とδ一致(第2節参照)することを確実にすることによって、異なるセグメントに関連付けられた。すなわち、所与のセグメントSに関して、それらの規則
は、変数jおよび方向(データから学習された閾値を上回るか、または下回るかのいずれか)の両方に合致した少なくともδ個のベースルール
を含有することが見出された。結果として生じるパターンのセットPは、M=219個のパターンを含有した。全ての消費者が、
614,830(オリジナルサンプルの64%)を伴う低減されたパターン
のセットによって網羅されるわけではなかったが、登録した消費者の89%は、低減されたセット内に含まれた。
は、変数jおよび方向(データから学習された閾値を上回るか、または下回るかのいずれか)の両方に合致した少なくともδ個のベースルール
を含有することが見出された。結果として生じるパターンのセットPは、M=219個のパターンを含有した。全ての消費者が、
614,830(オリジナルサンプルの64%)を伴う低減されたパターン
のセットによって網羅されるわけではなかったが、登録した消費者の89%は、低減されたセット内に含まれた。
各セグメントに対して得られたパターンの数およびその網羅率(パターン内の消費者の数)もまた、表3に列挙される。パターンの数は、初期の約3,000より小さいが、最大有効度に近づけるために十分に少ない数を選択することは、依然として、非自明なタスクである。パターン/セグメント割当実行可能性をエンコードする関連付け行列Bが、図7に図示される。いくつかのパターンは、図8に図示されるように、複数のセグメントに属し得る。そこでは、ユーザを網羅するパターンの数の分布が、プロットされる。大部分のユーザは、少数のパターンによって網羅される。しかしながら、同時に、50個を上回るパターンに入る少数のユーザも存在する。
データから抽出され、セグメント「高消費者」および「コスト優先者」に割り当てられる、規則の2個の実施例が、図9に表示される。「高消費者」に割り当てられるパターンは、消費が所与の閾値を上回る条件を伴う、少なくともδ=1のベースルールを含有する。
6.結果
アルゴリズム1が、
の場合における、セグメントZへのパターンのほぼ最適な実行可能配分を得るために使用された。アルゴリズムは、[0,1](ε0の幅)から
であるときの14回の反復における収束まで検索領域を狭める。故に、セグメントZへのパターンの配分は、ε=10−14以内で最適解に近似する。2分探索プロセスは、図10に図示され、これは、
を用いて、実行可能性問題(LFIP−F)を反復的に解くことによって、セグメント有効度に関する最大下限λを見出すことを示す。
に関する結果として生じる最適配分行列Zは、図11に表示される。そこでは、水平軸は、許容可能割当行列Bを表すために図10において使用されたものと同一フォーマットにおける恣意的ID番号によってパターンを順序付ける。アルゴリズムは、最良有効度性質を伴い、(F0)における制約を満たす、少数のパターンを選択した。
アルゴリズム1が、
の場合における、セグメントZへのパターンのほぼ最適な実行可能配分を得るために使用された。アルゴリズムは、[0,1](ε0の幅)から
であるときの14回の反復における収束まで検索領域を狭める。故に、セグメントZへのパターンの配分は、ε=10−14以内で最適解に近似する。2分探索プロセスは、図10に図示され、これは、
を用いて、実行可能性問題(LFIP−F)を反復的に解くことによって、セグメント有効度に関する最大下限λを見出すことを示す。
に関する結果として生じる最適配分行列Zは、図11に表示される。そこでは、水平軸は、許容可能割当行列Bを表すために図10において使用されたものと同一フォーマットにおける恣意的ID番号によってパターンを順序付ける。アルゴリズムは、最良有効度性質を伴い、(F0)における制約を満たす、少数のパターンを選択した。
最適解は、5個のセグメントを横断して拡散される10個のパターンを含有する。表4は、結果として生じるセグメントの有効度およびサイズを要約する。最終有効度数は全て、2×q0を上回り、1個のセグメント(「文化的誘因」)に割り当てられた消費者は、全体の母集団内でほぼ3倍の率で登録していた。
図12は、セグメント間の重複の実施例を示す。本重複は、セグメントを構成するパターン自体が、それらが網羅する顧客内で重複し得、実際に重複するため、誘発される。しかしながら、セグメント重複は、消費者が、彼らを1個のセグメント(「コスト優先者」等)に属するものと見なし得る、ある特徴を有し得る一方、他の特徴が、異なるセグメント(「住宅改良希望者」等)内の消費者と共有されるため、現実では、自然な概念である。セグメント化技法は、本状況を透過的に考慮する。セグメント重複のより包括的見解は、ネットワークプロットとして図13に提示される。そこでは、各セグメントは、そのセグメント内の顧客の数に比例するサイズのノードとして表される。セグメント間のリンクの加重は、セグメントのペアワイズの重複を表す。制約が、
から
に変更されるにつれて、より多くのパターンがセグメントのいくつかを構築するために使用されるため、セグメント化の構造は、変化する。
から
に変更されるにつれて、より多くのパターンがセグメントのいくつかを構築するために使用されるため、セグメント化の構造は、変化する。
「セグメント」は、運営コストおよび複雑性を低く保ちながら、消費者間である程度まで区別する、通信の作成および管理を補助するように、プログラム管理者によって定義された構成概念であることに留意されたい。それらは、ある程度の異質性を露見させるが、同時に、介入を個人の必要性に完全に合わせることを可能にするものでもない。全ての消費者が1個のセグメントのみに属することを課すことは、非現実的仮定を課すことになり、本アプローチは、これを回避する。
図14は、
に関する最適パターン配分に対応するセグメントを定義する、パターンのリストを含む。各セグメントの意味についての表3における仮説は、閾値tj(「高」および「低」が意味する内容を精密に定義する)および付加的ベースルール等の具体的情報で拡充される。例えば、高率でエネルギー効率プログラムに登録する「住宅改良希望者」の1つのタイプは、年収$75,000を上回り、$306,870を上回るその住宅の所有権を所有する、南アジア人である。同様に、「環境保護提唱者」の1つのタイプは、年収$75,000を上回り、その州の平均所得レベルの少なくとも2.5倍を稼いでおり、子供を有し、集合住宅で生活していない家族である。各セグメント内のパターンは、次いで、そのセグメント内の消費者が応答することが認められている要素を含むように、そのセグメントに対して特有のマーケティング通信を設計するために使用されてもよい。さらに、パターンの特異性(データから学習された閾値の観点から)は、登録する可能性が最も高いそれらの消費者を標的化することを可能にする。
に関する最適パターン配分に対応するセグメントを定義する、パターンのリストを含む。各セグメントの意味についての表3における仮説は、閾値tj(「高」および「低」が意味する内容を精密に定義する)および付加的ベースルール等の具体的情報で拡充される。例えば、高率でエネルギー効率プログラムに登録する「住宅改良希望者」の1つのタイプは、年収$75,000を上回り、$306,870を上回るその住宅の所有権を所有する、南アジア人である。同様に、「環境保護提唱者」の1つのタイプは、年収$75,000を上回り、その州の平均所得レベルの少なくとも2.5倍を稼いでおり、子供を有し、集合住宅で生活していない家族である。各セグメント内のパターンは、次いで、そのセグメント内の消費者が応答することが認められている要素を含むように、そのセグメントに対して特有のマーケティング通信を設計するために使用されてもよい。さらに、パターンの特異性(データから学習された閾値の観点から)は、登録する可能性が最も高いそれらの消費者を標的化することを可能にする。
上記の議論から、得られたセグメント化の構造は、制約の性質に、特に、
の値に強く依存することが顕著に明白となる。本依存性を研究するために、アルゴリズム1が、グリッド
に関して実行された。ここで、
である。目的
の最適値およびセグメント化のために選択されたパターンの数は、図15に図示される。最良結果が、
であるときに得られた(したがって、アルゴリズムは、必要以上に多くのパターンをセグメントに引き出すわけではない)。良好な結果
が、中値から大値の
および低値の
に関して得られることが示される。これらのマップは、したがって、モデル複雑性およびセグメント化有効度をトレードオフする方法のガイドラインをもたらす。
の値に強く依存することが顕著に明白となる。本依存性を研究するために、アルゴリズム1が、グリッド
に関して実行された。ここで、
である。目的
の最適値およびセグメント化のために選択されたパターンの数は、図15に図示される。最良結果が、
であるときに得られた(したがって、アルゴリズムは、必要以上に多くのパターンをセグメントに引き出すわけではない)。良好な結果
が、中値から大値の
および低値の
に関して得られることが示される。これらのマップは、したがって、モデル複雑性およびセグメント化有効度をトレードオフする方法のガイドラインをもたらす。
の所与の値に関して、
を用いて、目的λ*および個々のセグメント有効度値qk、k=1,・・・,Kの変形例が、観察された。次いで、これは、個々の着目セグメントの所望の有効度値に適応するように設計され得る、結果として生じるセグメント化の複雑性のための調整パラメータとしての役割を果たすことができる。これは、
の値に関して図16に図示される。例えば、「文化的誘因」に強調が置かれる場合、
を伴うセグメント化が、好ましい。kの全ての値に関して、qkは、明確にλ*を上回ることに留意されたい。
最後に、セグメント化複雑性(セグメントを横断して選択されたパターンの総数)への個々のセグメント有効度の依存性が、図17に図示される。これは、セグメント化複雑性の固定された所与の値に関して達成され得る、最良可能有効度値を強調する。例えば、効率プログラム管理者が、20〜25のパターンの総数を選択することを所望する場合、「文化的誘因」セグメントの最適有効度は、常時、「コスト優先者」セグメントのものを上回ることが期待され得る。
のその範囲に関して、「住宅改良希望者」、「環境保護提唱者」、および「文化的誘因」は全て、約11%の有効度値を有する。
のその範囲に関して、「住宅改良希望者」、「環境保護提唱者」、および「文化的誘因」は全て、約11%の有効度値を有する。
7.結論
本願は、エネルギー消費者の分かりやすい予測セグメント化をプログラム的に構築するための方法を導入した。予測セグメント化問題は、データからの第1の抽出予測パターン(論理積)に基づいて公式化され、次いで、パターンをセグメントに最適に配分する。セグメントは、以前の挙動およびエネルギー公益事業者におけるマーケティング研究を使用して定義された。最適配分は、線形制約を伴う一般化(最大−最小)線形分数整数計画を解くように公式化される。本計画を解くために、効率的2分探索アルゴリズムが、使用された。本方法は、大規模な米国のエネルギー公益事業者の約百万人の電気消費者の母集団内で最適予測セグメントを識別するために使用された。消費者の最適サブセット(その特性が、サービス提供する消費者のタイプについての公益事業者の一般的仮説と整合し、全体的母集団内の約5%の登録率の少なくとも2倍登録した)が、識別された。これらのセグメントは、公益事業者が、適切なメッセージを生成し得、かつ標的化することがより有効かつ経済的である、消費者を表す。
本願は、エネルギー消費者の分かりやすい予測セグメント化をプログラム的に構築するための方法を導入した。予測セグメント化問題は、データからの第1の抽出予測パターン(論理積)に基づいて公式化され、次いで、パターンをセグメントに最適に配分する。セグメントは、以前の挙動およびエネルギー公益事業者におけるマーケティング研究を使用して定義された。最適配分は、線形制約を伴う一般化(最大−最小)線形分数整数計画を解くように公式化される。本計画を解くために、効率的2分探索アルゴリズムが、使用された。本方法は、大規模な米国のエネルギー公益事業者の約百万人の電気消費者の母集団内で最適予測セグメントを識別するために使用された。消費者の最適サブセット(その特性が、サービス提供する消費者のタイプについての公益事業者の一般的仮説と整合し、全体的母集団内の約5%の登録率の少なくとも2倍登録した)が、識別された。これらのセグメントは、公益事業者が、適切なメッセージを生成し得、かつ標的化することがより有効かつ経済的である、消費者を表す。
上記の開示では、本明細書の一部を形成し、本開示が実践され得る具体的実装が例証として示される付随の図面を参照した。本開示の範囲から逸脱することなく、他の実装が、利用されてもよく、構造変更が、行われてもよいことを理解されたい。明細書における「一実施形態」、「ある実施形態」、「ある例示的実施形態」等の言及は、説明される実施形態が、特定の特徴、構造、または特性を含み得るが、全ての実施形態が、必ずしも、特定の特徴、構造、または特性を含まない場合もあることを示す。さらに、そのような語句は、必ずしも、同一実施形態を参照するわけではない。さらに、特定の特徴、構造、または特性が、ある実施形態に関連して説明されるとき、明示的に説明されるかどうかにかかわらず、他の実施形態に関連してそのような特徴、構造、または特性に影響を及ぼすことは、当業者の知識内であることが思量される。
本明細書に開示されるシステム、デバイス、および方法の実装は、例えば、本明細書に議論されるように、1つまたはそれを上回るプロセッサおよびシステムメモリ等、コンピュータハードウェアを含む、特殊目的または汎用コンピュータを備える、または利用してもよい。本開示の範囲内の実装はまた、コンピュータ実行可能命令および/またはデータ構造を搬送または記憶するための物理的および他のコンピュータ可読媒体を含んでもよい。そのようなコンピュータ可読媒体は、汎用または特殊目的コンピュータシステムによってアクセスされ得る、任意の利用可能な媒体であることができる。コンピュータ実行可能命令を記憶するコンピュータ可読媒体は、コンピュータ記憶媒体(デバイス)である。コンピュータ実行可能命令を搬送するコンピュータ可読媒体は、伝送媒体である。したがって、一例として、限定ではなく、本開示の実装は、少なくとも2つの別々に異なる種類のコンピュータ可読媒体、すなわち、コンピュータ記憶媒体(デバイス)および伝送媒体を備えることができる。
コンピュータ記憶媒体(デバイス)は、RAM、ROM、EEPROM、CD−ROM、ソリッドステートドライブ(「SSD」)(例えば、RAMに基づく)、フラッシュメモリ、相変化メモリ(「PCM」)、他のタイプのメモリ、他の光ディスク記憶装置、磁気ディスク記憶装置または他の磁気記憶デバイス、またはコンピュータ実行可能命令またはデータ構造の形態で所望のプログラムコード手段を記憶するために使用され得、汎用または特殊目的コンピュータによってアクセスされ得る、任意の他の媒体を含む。
本明細書に開示されるデバイス、システム、および方法の実装は、コンピュータネットワークを経由して通信してもよい。「ネットワーク」は、コンピュータシステムおよび/またはモジュールおよび/または他の電子デバイス間で電子データをトランスポート可能な1つまたはそれを上回るデータリンクとして定義される。情報が、ネットワークまたは別の通信接続(有線、無線、または有線または無線の組み合わせのいずれか)を経由して、コンピュータに転送または提供されるとき、コンピュータは、接続を適切に伝送媒体と見なす。伝送媒体は、コンピュータ実行可能命令またはデータ構造の形態で所望のプログラムコード手段を搬送するために使用され得、汎用または特殊目的コンピュータによってアクセスされ得る、ネットワークおよび/またはデータリンクを含むことができる。上記の組み合わせもまた、コンピュータ可読媒体の範囲内に含まれるべきである。
コンピュータ実行可能命令は、例えば、プロセッサにおいて実行されると、汎用コンピュータ、特殊目的コンピュータ、または特殊目的処理デバイスに、ある機能または機能群を行わせる、命令およびデータを備える。コンピュータ実行可能命令は、例えば、バイナリ、アセンブリ言語等の中間フォーマット命令、またはさらにソースコードであってもよい。本主題は、構造特徴および/または方法論的作用に特有の言語で説明されているが、添付の請求項に定義される主題は、必ずしも、上述の説明された特徴または作用に限定されないことを理解されたい。むしろ、説明された特徴および作用は、請求項を実装するための例示的形態として開示される。
当業者は、本開示が、ダッシュボード内車両コンピュータ、パーソナルコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、メッセージプロセッサ、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースまたはプログラマブル消費者電子機器、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、携帯電話、PDA、タブレット、ポケベル、ルータ、スイッチ、種々の記憶デバイス、および同等物を含む、多くのタイプのコンピュータシステム構成を伴う、ネットワークコンピューティング環境内で実践されてもよいことを理解されるであろう。本開示はまた、分散型システム環境内で実践されてもよく、ネットワークを通してリンクされた(有線データリンク、無線データリンク、または有線および無線データリンクの組み合わせのいずれかによって)ローカルおよび遠隔コンピュータシステムの両方が、タスクを行う。分散型システム環境では、プログラムモジュールは、ローカルメモリ記憶デバイスおよび遠隔メモリ記憶デバイスの両方内に位置してもよい。
さらに、必要に応じて、本明細書に説明される機能は、ハードウェア、ソフトウェア、ファームウェア、デジタルコンポーネント、またはアナログコンポーネントのうちの1つまたはそれを上回るものにおいて行われることができる。例えば、1つまたはそれを上回る特定用途向け集積回路(ASIC)が、本明細書に説明されるシステムおよびプロシージャのうちの1つまたはそれを上回るものを実施するようにプログラムされることができる。ある用語が、特定のシステムコンポーネントを指すために説明および請求項全体を通して使用される。当業者が理解するように、コンポーネントは、異なる名称によって称されてもよい。本書は、名称が異なるが機能は異ならないコンポーネントの間で区別することを意図するものではない。
上記で議論されるセンサ実施形態は、その機能の少なくとも一部を行うために、コンピュータハードウェア、ソフトウェア、ファームウェア、または任意のそれらの組み合わせを備えてもよいことに留意されたい。例えば、センサは、1つまたはそれを上回るプロセッサ内で実行されるように構成される、コンピュータコードを含んでもよく、コンピュータコードによって制御されるハードウェア論理/電気回路を含んでもよい。これらの例示的デバイスは、例証目的で本明細書に提供され、限定することを意図するものではない。本開示の実施形態は、当業者に公知となるであろう、さらなるタイプのデバイス内に実装されてもよい。
本開示の少なくともいくつかの実施形態は、任意のコンピュータ使用可能媒体上に記憶されるそのような論理を備える(例えば、ソフトウェアの形態で)、コンピュータプログラム製品を対象とする。そのようなソフトウェアは、1つまたはそれを上回るデータ処理デバイス内で実行されると、デバイスを本明細書に説明されるように動作させる。
本開示の種々の実施形態が、上記に説明されたが、一例としてのみ提示され、限定ではないことを理解されたい。形態および詳細における種々の変更が、本開示の精神および範囲から逸脱することなく、その中で行われることができることは、当業者に明白となるであろう。したがって、本開示の範疇および範囲は、上記の例示的実施形態のいずれかによって限定されるべきではなく、以下の請求項およびその均等物に従ってのみ定義されるべきである。上記の説明は、例証および説明目的のために提示されている。これは、包括的であること、または本開示を開示される通りの形態に限定することを意図するものではない。多くの修正および変形例は、上記の教示に照らして、可能性として考えられる。さらに、上記の代替実装のいずれかまたは全ては、本開示の付加的ハイブリッド実装を形成するために所望される、任意の組み合わせで使用されてもよいことに留意されたい。
本発明は、その精神または不可欠な特性から逸脱することなく、他の具体的形態で具現化さてもよい。説明される実施形態は、全ての観点において、例証のみと見なされ、制限するものではない。本発明の範囲は、したがって、上記の説明によってではなく、添付の請求項によって示される。請求項の均等物の意味および範囲内の全ての変更は、その範囲内に包含されるものとする。
Claims (16)
- 複数のエネルギー顧客をセグメント化するための方法であって、
(a)複数の顧客パターンを判定することであって、各顧客パターンは、前記顧客パターンと関連付けられた複数の顧客属性を満たす前記複数のエネルギー顧客のサブセットを含み、前記サブセットは、(i)少なくとも閾値量の前記複数のエネルギーの顧客を含み、(ii)前記複数の顧客パターンのうちの他の顧客パターンとの最大で閾値レベルの重複を有する、ことと、
(b)2分探索アルゴリズムに従って、前記複数の顧客パターンを複数のセグメントに割り当てることであって、前記2分探索アルゴリズムは、前記複数のセグメントの最小有効度を最大限にし、前記セグメントの有効度は、前記セグメントと関連付けられたエネルギー効率プログラムの正の採択ステータスを有する前記セグメントに割り当てられた前記パターン内の前記複数のエネルギー顧客の量の尺度であり、前記複数のセグメントの前記最小有効度は、前記エネルギー効率プログラムに対する前記複数のエネルギー顧客全体としての有効度よりも大きい、ことと
を含む方法。 - 前記複数のセグメントは、高消費者セグメント、コスト優先的セグメント、住宅改良希望者セグメント、環境保護提唱者セグメント、および文化的誘因セグメントを含む、請求項1に記載の方法。
- 前記複数のセグメントは、専門知識に基づいて判定される、請求項1に記載の方法。
- 前記複数の顧客属性は、1つまたは複数の住宅価値メトリックを含む、請求項1に記載の方法。
- 前記1つまたは複数の住宅価値メトリックは、住宅価値、利用可能な所有権、または、融資比率を含む、請求項1に記載の方法。
- 前記複数の顧客属性は、1つまたは複数のエネルギー消費メトリックを含む、請求項1に記載の方法。
- (b)は、前記2分探索アルゴリズムを使用して実行可能性問題を反復的に解くことを含む、請求項1に記載の方法。
- 前記実行可能性問題は、線形分数整数計画である、請求項7に記載の方法。
- (b)は、各セグメントの有効度がほぼ等しいように、前記複数のセグメント間で前記パターンを最適に分布させることを含む、請求項1に記載の方法。
- 前記最小有効度は、前記エネルギー効率プログラムに対する前記複数のエネルギー顧客全体としての有効度の少なくとも3倍である、請求項1に記載の方法。
- 各セグメントに関連付けられた前記エネルギー効率プログラムは、同一である、請求項1に記載の方法。
- カスタマイズされた通信を各セグメントに伝送することをさらに含む、請求項1に記載の方法。
- 前記複数のセグメントの各セグメントは、最小有効度を有する、請求項1に記載の方法。
- (a)は、前記複数の顧客パターンを判定するためにランダムフォレストアルゴリズムを使用することを含む、請求項1に記載の方法。
- 前記複数の顧客属性は、1つまたは複数の社会人口統計メトリックを含む、請求項1に記載の方法。
- 前記1つまたは複数の社会人口統計メトリックは、世帯所得メトリックまたは教育メトリックを含む、請求項1に記載の方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022071562A JP2022101662A (ja) | 2015-12-18 | 2022-04-25 | エネルギー顧客の予測的セグメント化 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562269793P | 2015-12-18 | 2015-12-18 | |
US62/269,793 | 2015-12-18 | ||
JP2018531227A JP6876048B2 (ja) | 2015-12-18 | 2016-12-15 | エネルギー顧客の予測的セグメント化 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018531227A Division JP6876048B2 (ja) | 2015-12-18 | 2016-12-15 | エネルギー顧客の予測的セグメント化 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022071562A Division JP2022101662A (ja) | 2015-12-18 | 2022-04-25 | エネルギー顧客の予測的セグメント化 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021108216A true JP2021108216A (ja) | 2021-07-29 |
JP7065231B2 JP7065231B2 (ja) | 2022-05-11 |
Family
ID=59057661
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018531227A Active JP6876048B2 (ja) | 2015-12-18 | 2016-12-15 | エネルギー顧客の予測的セグメント化 |
JP2021073240A Active JP7065231B2 (ja) | 2015-12-18 | 2021-04-23 | エネルギー顧客の予測的セグメント化 |
JP2022071562A Pending JP2022101662A (ja) | 2015-12-18 | 2022-04-25 | エネルギー顧客の予測的セグメント化 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018531227A Active JP6876048B2 (ja) | 2015-12-18 | 2016-12-15 | エネルギー顧客の予測的セグメント化 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022071562A Pending JP2022101662A (ja) | 2015-12-18 | 2022-04-25 | エネルギー顧客の予測的セグメント化 |
Country Status (6)
Country | Link |
---|---|
US (3) | US10872386B2 (ja) |
EP (2) | EP4123559A1 (ja) |
JP (3) | JP6876048B2 (ja) |
CN (2) | CN115082102A (ja) |
CA (1) | CA3005942A1 (ja) |
WO (1) | WO2017106544A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4123559A1 (en) | 2015-12-18 | 2023-01-25 | C3.ai, Inc. | Predictive segmentation of energy customers |
EP3324255B1 (en) | 2016-11-18 | 2020-01-29 | Eurotherm Limited | Process controller having adjustable parameters |
US10445742B2 (en) * | 2017-01-31 | 2019-10-15 | Walmart Apollo, Llc | Performing customer segmentation and item categorization |
US10657575B2 (en) | 2017-01-31 | 2020-05-19 | Walmart Apollo, Llc | Providing recommendations based on user-generated post-purchase content and navigation patterns |
US11651382B2 (en) * | 2017-05-31 | 2023-05-16 | Adobe Inc. | User data overlap determination in a digital medium environment |
US11308563B2 (en) * | 2018-02-01 | 2022-04-19 | Oracle International Corporation | Energy program communication control system and method based on load shape analysis |
US20210241392A1 (en) * | 2020-02-05 | 2021-08-05 | International Business Machines Corporation | Metrics for energy saving and response behavior |
US11315200B2 (en) * | 2020-07-29 | 2022-04-26 | Arcadia Power, Inc. | Methods of allocating energy generated by a community solar energy system |
US11423444B2 (en) | 2020-08-14 | 2022-08-23 | International Business Machines Corporation | Propensity model |
CN113792099B (zh) * | 2021-08-12 | 2023-08-25 | 上海熙业信息科技有限公司 | 一种基于历史效用表剪枝的数据流高效用项集挖掘系统 |
CN114726599B (zh) * | 2022-03-28 | 2023-01-10 | 慧之安信息技术股份有限公司 | 基于人工智能算法的软件定义网络中入侵检测方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150081384A1 (en) * | 2013-09-16 | 2015-03-19 | Fraunhofer Usa, Inc. | Determining likelihood of an individual consumer enrolling in a behavior-based energy efficiency program |
US20150161233A1 (en) * | 2013-12-11 | 2015-06-11 | The Board Of Trustees Of The Leland Stanford Junior University | Customer energy consumption segmentation using time-series data |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001006432A1 (en) * | 1999-07-15 | 2001-01-25 | Ebidenergy.Com | User interface to facilitate, analyze and manage resource consumption |
US7451065B2 (en) * | 2002-03-11 | 2008-11-11 | International Business Machines Corporation | Method for constructing segmentation-based predictive models |
US7698163B2 (en) | 2002-11-22 | 2010-04-13 | Accenture Global Services Gmbh | Multi-dimensional segmentation for use in a customer interaction |
US7542960B2 (en) * | 2002-12-17 | 2009-06-02 | International Business Machines Corporation | Interpretable unsupervised decision trees |
US7689455B2 (en) * | 2005-04-07 | 2010-03-30 | Olista Ltd. | Analyzing and detecting anomalies in data records using artificial intelligence |
US7672865B2 (en) | 2005-10-21 | 2010-03-02 | Fair Isaac Corporation | Method and apparatus for retail data mining using pair-wise co-occurrence consistency |
US8082166B2 (en) | 2006-10-30 | 2011-12-20 | Mary S. Moore | Method to facilitate obtaining, storing, and subsequently conveying an organization's information for the benefit of successor organization-based agents |
CA2749770C (en) * | 2009-01-14 | 2021-07-20 | Integral Analytics, Inc. | Optimization of microgrid energy use and distribution |
WO2010091450A1 (en) * | 2009-02-10 | 2010-08-19 | Greenbox Group Pty Limited | Resource supply management system and method |
US20100332373A1 (en) * | 2009-02-26 | 2010-12-30 | Jason Crabtree | System and method for participation in energy-related markets |
US9190844B2 (en) * | 2012-11-04 | 2015-11-17 | Bao Tran | Systems and methods for reducing energy usage |
US9805321B2 (en) * | 2010-10-15 | 2017-10-31 | Accenture Global Services Limited | Eco score analytics system |
CN104254851A (zh) * | 2012-03-17 | 2014-12-31 | 海智网聚网络技术(北京)有限公司 | 用于向用户推荐内容的方法和系统 |
US10475138B2 (en) * | 2015-09-23 | 2019-11-12 | Causam Energy, Inc. | Systems and methods for advanced energy network |
US10719797B2 (en) * | 2013-05-10 | 2020-07-21 | Opower, Inc. | Method of tracking and reporting energy performance for businesses |
CN103398843B (zh) * | 2013-07-01 | 2016-03-02 | 西安交通大学 | 基于多分类相关向量机的行星齿轮箱太阳轮故障分类方法 |
US9542510B2 (en) * | 2013-08-07 | 2017-01-10 | International Business Machines Corporation | Detecting appliances in a building from coarse grained meter data with partial label |
CN103530341A (zh) * | 2013-10-08 | 2014-01-22 | 广州品唯软件有限公司 | 物品信息生成推送方法和系统 |
CN115271513A (zh) * | 2014-05-28 | 2022-11-01 | 西门子瑞士有限公司 | 用于针对一个或多个建筑物提供优化或改进措施的系统和方法 |
US11488086B2 (en) * | 2014-10-13 | 2022-11-01 | ServiceSource International, Inc. | User interface and underlying data analytics for customer success management |
US20160132913A1 (en) * | 2014-11-11 | 2016-05-12 | IGATE Global Solutions Ltd. | Multivariate Canonical Data Model for Tagging Customer Base of Energy Utility Enterprise |
US9716664B2 (en) * | 2014-12-03 | 2017-07-25 | Cisco Technology, Inc. | Tracking queuing delay and performing related congestion control in information centric networking |
US10769734B2 (en) * | 2015-01-13 | 2020-09-08 | Causam Energy, Inc. | Systems and methods for advanced energy settlements, network-based messaging, and software applications for electric power grids, microgrids, grid elements, and/or electric power networks |
US10147108B2 (en) * | 2015-04-02 | 2018-12-04 | The Nielsen Company (Us), Llc | Methods and apparatus to identify affinity between segment attributes and product characteristics |
JP6408451B2 (ja) * | 2015-05-21 | 2018-10-17 | 株式会社日立製作所 | エネルギー需要予測システム及びエネルギー需要予測方法 |
US9960637B2 (en) * | 2015-07-04 | 2018-05-01 | Sunverge Energy, Inc. | Renewable energy integrated storage and generation systems, apparatus, and methods with cloud distributed energy management services |
CN113473187B (zh) * | 2015-07-24 | 2023-10-10 | 安普视频有限公司 | 广告投放的跨屏优化 |
US10116796B2 (en) * | 2015-10-09 | 2018-10-30 | Ooma, Inc. | Real-time communications-based internet advertising |
US10387787B1 (en) * | 2015-10-28 | 2019-08-20 | Intuit Inc. | Method and system for providing personalized user experiences to software system users |
US10559044B2 (en) * | 2015-11-20 | 2020-02-11 | Opower, Inc. | Identification of peak days |
EP4123559A1 (en) | 2015-12-18 | 2023-01-25 | C3.ai, Inc. | Predictive segmentation of energy customers |
-
2016
- 2016-12-15 EP EP22195308.6A patent/EP4123559A1/en active Pending
- 2016-12-15 JP JP2018531227A patent/JP6876048B2/ja active Active
- 2016-12-15 CN CN202210473492.0A patent/CN115082102A/zh active Pending
- 2016-12-15 CA CA3005942A patent/CA3005942A1/en active Pending
- 2016-12-15 US US15/380,768 patent/US10872386B2/en active Active
- 2016-12-15 EP EP16876709.3A patent/EP3391323A4/en active Pending
- 2016-12-15 WO PCT/US2016/067002 patent/WO2017106544A1/en active Application Filing
- 2016-12-15 CN CN201680074515.3A patent/CN108401459B/zh active Active
-
2020
- 2020-11-17 US US16/950,564 patent/US11823291B2/en active Active
-
2021
- 2021-04-23 JP JP2021073240A patent/JP7065231B2/ja active Active
-
2022
- 2022-04-25 JP JP2022071562A patent/JP2022101662A/ja active Pending
-
2023
- 2023-10-23 US US18/492,765 patent/US20240078618A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150081384A1 (en) * | 2013-09-16 | 2015-03-19 | Fraunhofer Usa, Inc. | Determining likelihood of an individual consumer enrolling in a behavior-based energy efficiency program |
US20150161233A1 (en) * | 2013-12-11 | 2015-06-11 | The Board Of Trustees Of The Leland Stanford Junior University | Customer energy consumption segmentation using time-series data |
Also Published As
Publication number | Publication date |
---|---|
CN108401459B (zh) | 2022-05-17 |
CA3005942A1 (en) | 2017-06-22 |
JP2018537790A (ja) | 2018-12-20 |
JP2022101662A (ja) | 2022-07-06 |
US20220108407A1 (en) | 2022-04-07 |
JP6876048B2 (ja) | 2021-05-26 |
US10872386B2 (en) | 2020-12-22 |
EP4123559A1 (en) | 2023-01-25 |
US20170178256A1 (en) | 2017-06-22 |
EP3391323A1 (en) | 2018-10-24 |
US20240078618A1 (en) | 2024-03-07 |
JP7065231B2 (ja) | 2022-05-11 |
CN108401459A (zh) | 2018-08-14 |
CN115082102A (zh) | 2022-09-20 |
US11823291B2 (en) | 2023-11-21 |
EP3391323A4 (en) | 2019-06-05 |
WO2017106544A1 (en) | 2017-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7065231B2 (ja) | エネルギー顧客の予測的セグメント化 | |
Moon et al. | A comparative analysis of artificial neural network architectures for building energy consumption forecasting | |
US10636097B2 (en) | Systems and models for data analytics | |
Albert et al. | Predictive segmentation of energy consumers | |
Melzi et al. | A dedicated mixture model for clustering smart meter data: identification and analysis of electricity consumption behaviors | |
Wang et al. | Smart Meter Data Analytics | |
Neokosmidis et al. | Assessment of the gap and (non-) Internet users evolution based on population biology dynamics | |
CN111512326A (zh) | 基于负载形状分析的能量计划通信控制系统及方法 | |
Jeong | Identifying consumer preferences from user-generated content on Amazon. com by leveraging machine learning | |
Bouktif et al. | Towards a rigorous consideration of occupant behaviours of residential households for effective electrical energy savings: An overview | |
Sodenkamp et al. | Supervised classification with interdependent variables to support targeted energy efficiency measures in the residential sector | |
Liang et al. | Dynamic selection and order allocation of resilient suppliers based on improved fuzzy multi-criteria decision method | |
Wang et al. | Overview of smart meter data analytics | |
Dailisan et al. | Amenity counts significantly improve water consumption predictions | |
Hensher et al. | Choice Modelling: Foundational Contributions | |
Nguyen | Real-time Energy Performance Tracking | |
Ramnath et al. | Household electricity consumption prediction using database combinations, ensemble and hybrid modeling techniques | |
Thorve et al. | Assessing Fairness of Residential Dynamic Pricing for Electricity using Active Learning with Agent-based Simulation | |
Guo | Advanced Learning and Optimization Methods for Retail Market Social Benefit Maximization | |
Dai et al. | Forecasting Method of Power Consumption Information for Power Users Based on Cloud Computing | |
Simaiya et al. | A transfer learning-based hybrid model with LightGBM for smart grid short-term energy load prediction | |
Moussa et al. | Elicitation of electricity consumption habit formation among new subscribers | |
Cheng et al. | Brand equity and financial performance: an institutional view | |
Cetinkaya et al. | Electricity Consumption Behaviors and Clustering of Distribution Grids in Terms of Demand Response | |
Ganesan | Residential Consumer Behavioural Analysis on the Participation in Demand Response Strategies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220325 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220425 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7065231 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |