JP2021108216A

JP2021108216A - エネルギー顧客の予測的セグメント化

Info

Publication number: JP2021108216A
Application number: JP2021073240A
Authority: JP
Inventors: アルバートエイドリアン; Albert Adrian; マーソウミーメヘディ; Maasoumy Mehdi
Original assignee: C3 AI Inc
Current assignee: C3 AI Inc
Priority date: 2015-12-18
Filing date: 2021-04-23
Publication date: 2021-07-29
Anticipated expiration: 2036-12-15
Also published as: CN108401459B; CA3005942A1; JP2018537790A; JP2022101662A; US20220108407A1; JP6876048B2; US10872386B2; EP4123559A1; US20170178256A1; EP3391323A1; US20240078618A1; JP7065231B2; CN108401459A; CN115082102A; US11823291B2; EP3391323A4; WO2017106544A1

Abstract

【課題】エネルギー消費者を分析するためのコンピュータアルゴリズムを提供する。【解決手段】コンピュータシステムは、顧客属性と、顧客が特定のエネルギー効率プログラムに登録しているかどうか等の顧客の採択ステータスとを一覧化した顧客記録を受信する。パターンの初期セットを、決定ツリー等に従って、顧客記録の中から識別する。初期セットを、最小サポートおよび有効度および最大重複要件を満たすパターンのセットを得るように取捨選択する。パターンは、各セグメントの最小有効度を最大限にすることを求める最適化アルゴリズムに従って、セグメントに割り当てられる。有効度は、正の採択ステータスを有する、各セグメントのパターンに合致する顧客の数を示す。最適化アルゴリズムは、線形分数整数計画（ＬＦＩＰ−Ｆ）を評価し、パターンの最適分布に反復的に近づいていく２分探索アルゴリズムである。【選択図】図３

Description

（発明の分野）
本願は、２０１５年１２月１８日に出願され、“ＰｒｅｄｉｃｔｉｖｅＳｅｇｍｅｎｔａｔｉｏｎｏｆＥｎｅｒｇｙＣｏｎｓｕｍｅｒｓ”と題された米国仮出願第６２／２６９，７９３号の利益を主張するものであり、該米国仮出願の全体の内容は、参照により本明細書中に援用される。

本発明は、エネルギー消費者を分析するためのコンピュータアルゴリズムに関する。

近年、エネルギー公益事業企業は、従来はその電気供給業者と関わりがなかった顧客基盤とのその関係を改善することにますます注力している。これまで、エネルギー企業およびその消費者は双方とも、公益事業者の役割を「光を灯し続けること」として理解していた。しかしながら、現在の技術傾向および顧客の考え方の偏移（特に、その顧客の選好の理解および予測に秀でた消費者に対面するインターネット企業の増加によって拍車がかけられている）は、公益事業におけるその顧客に関わることの関心の増加につながっている。

これらの傾向は、複合して、データ可用性（スマートメータ等の感知インフラストラクチャを通して収集される高粒度消費データおよび消費者自体に関する他の「メタデータ」の両方）および本データを処理するための算出方法（例えば、ＬｉａｎｄＹａｎｇ（２０１５年）、ＬｉｕａｎｄＮｉｅｌｓｅｎ（２０１５年））の増加となっている。したがって、エネルギー公益事業者は、その顧客満足度および関与およびその顧客基盤内の環境に優しいプログラムへの参加を増加させる方法を提供し得る、分析技法にますます依拠している。顧客セグメント化は、顧客を理解し、その理解に応じて、作用する方法を識別するための技法として、大小様々な組織のマーケティングツールボックスの土台である。これは、いくつかの用途を挙げると、主に、マーケティング（包括的論評は、Ａｓｓｏｃｉａｔｉｏｎ（２０１４年）に見られる）、オンライン広告（例えば、Ｙａｎｅｔ
ａｌ．（２００９年））、または電子小売（例えば、ＢｈａｔｎａｇａｒａｎｄＧｈｏｓｅ（２００４年））において使用されている。

公益事業者が、その顧客とのより個人的かつ現代的関係を発展することを目指すにつれて、参加および関与を増加させるように、効率対策および他のプログラムについてのその通信を見直すための手段として、セグメント化を積極的に受け入れている。採用されている大部分の市場セグメント化技法は、実際は、固定規則セットの適用に焦点を当てている。例えば、大型住居に暮らし、子供を持つ消費者は、「高消費者」カテゴリに割り当てられる一方、環境保護雑誌を購読している者は、「環境保護提唱者」グループに帰属する。典型的には、これらの規則は、反事実または逸話経験、挙動研究、または小規模心理学実験から派生しており、実際は、「公然の事実」と見なされる。抽出した専門知識の結果なので、そのようなセグメント化方略は、確かに有用であり、理論および実践が知らしめられるべきである。

本明細書に説明されるアプローチは、エネルギー消費者をセグメント化するための改良されたアプローチを提供する。

本願は、顧客属性における特定のパターンに関して同質的であること、および所望の結果に対して予測的であることの両方である、大規模母集団内のサブグループを識別するための予測セグメント化技法を導入する。動機付けとなる設定は、エネルギー公益事業企業の顧客に対する非常に分かりやすくかつ直感的な、ある意味では最適でもある、セグメント化および標的化プロセスを作成することである。本設定では、エネルギー公益事業者は、少数のメッセージタイプが、異なるタイプの通信に応答する可能性が最も高い適切に選定された顧客に送信されるように設計することを所望する。提案される方法は、消費、人口統計、およびプログラム登録データを使用し、標準的機械学習技法を使用して、基本予測パターンを抽出する。本方法は、次に、専門家ガイドラインと、以前の挙動研究から利用可能な消費者特性についての仮説によって記述される、少数のセグメントへのパターンの実行可能な潜在的割当を定義する。アルゴリズムは、次いで、実行可能であること、および予測力を最大限にすることの両方である、両方のセグメントへのパターンの最適配分を識別する。本方法は、主要な米国エネルギー公益事業者からの大規模データセット上で実装され、その登録の可能性が平均母集団のものの２倍であって、少数の単純な直感的規則によって記述される、顧客のセグメントを得る。
本発明は、例えば、以下を提供する。
（項目１）
方法であって、
コンピュータシステムによって、それぞれが属性および顧客の採択ステータスを含む複数の顧客記録を受信するステップと、
前記コンピュータシステムによって、複数のパターンを識別するステップであって、各パターンは、前記複数の顧客記録の属性に従って、前記複数の顧客記録のうちの顧客記録のグループ化を定義する、ステップと、
前記コンピュータシステムによって、前記複数のパターンのうちの各パターンが前記複数のセグメントのうちの１つのセグメントに割り当てられるように、前記複数のパターンを複数のセグメント間に割り当てるステップであって、前記複数のパターンを前記複数のセグメント間に割り当てるステップは、前記複数のセグメントに関する最小有効度を反復的に増加させるアルゴリズムに従って行われ、各セグメントの有効度は、前記各セグメントに分散される前記複数のパターンのうちのパターンに合致する、前記複数の顧客記録のうちの顧客記録の採択ステータスの関数である、ステップと、
を含む、方法。
（項目２）
前記アルゴリズムは、方程式ＬＦＩＰ−Ｆを解くステップを含む、項目１に記載の方法。
（項目３）
前記アルゴリズムは、２分探索アルゴリズム１に従って、線形整数計画実行可能性問題を解くステップを含む、項目２に記載の方法。
（項目４）
前記複数のパターンのうちの各パターンは、前記各パターンの属性のうちの各属性に対し、前記各属性に関する閾値を備える、項目１に記載の方法。
（項目５）
前記複数のパターンを識別するステップは、決定ツリーに従って、前記複数の顧客記録を処理するステップを含む、項目１に記載の方法。
（項目６）
前記複数のパターンを識別するステップは、
決定ツリーに従って、前記複数の顧客記録を処理し、初期パターンセットを得るステップと、
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップと、
を含む、項目１に記載の方法。
（項目７）
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップは、
最小サポートを下回るサポートを有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンのサポートは、前記各パターンに合致する顧客記録の数を示す、ステップ
を含む、項目６に記載の方法。
（項目８）
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップは、
最小有効度を下回る有効度を有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンの有効度は、正の採択ステータスを有する前記各パターンに合致する顧客記録の割合を示す、ステップ
を含む、項目７に記載の方法。
（項目９）
前記最小有効度は、正の採択ステータスを有する前記複数の顧客記録のうちの全ての顧客記録の割合の１を上回る倍数である、項目８に記載の方法。
（項目１０）
前記倍数は、少なくとも２である、項目９に記載の方法。
（項目１１）
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップは、前記顧客記録のセットの最大パーセンテージを上回るものが、前記初期パターンセットの別のパターンにも合致するように、前記各パターンに合致する前記複数の顧客記録のうちの顧客記録のセットを有する、前記初期パターンセットの各パターンを除去するステップを含む、項目６に記載の方法。
（項目１２）
前記最大パーセンテージは、６０〜７５パーセントである、項目１１に記載の方法。
（項目１３）
各セグメントの有効度はさらに、前記各セグメントに割り当てられる各パターンの網羅行列の関数であり、各パターンの網羅行列は、前記各パターンに合致する前記複数の顧客記録のうちの各顧客記録に対して１／ｎの値を有し、ｎは、前記各顧客記録によって合致される前記複数のパターンのうちのパターンの数である、項目１に記載の方法。
（項目１４）
１つまたはそれを上回る処理デバイスと、前記１つまたはそれを上回る処理デバイスに動作可能に結合される１つまたはそれを上回るメモリデバイスとを備えるシステムであって、前記１つまたはそれを上回るメモリデバイスは、実行可能コードを記憶し、前記実行可能コードは、１つまたはそれを上回るプロセッサに、
それぞれが属性および前記顧客の採択ステータスを含む複数の顧客記録を受信するステップと、
複数のパターンを識別するステップであって、各パターンは、前記複数の顧客記録の属性に従って、前記複数の顧客記録のうちの顧客記録のグループ化を定義するステップと、
前記複数のパターンのうちの各パターンが、前記複数のセグメントのうちの１つのセグメントに割り当てられ、前記複数のパターンが、前記複数のセグメントの最小有効度を最大限にすることを追求するアルゴリズムに従って前記複数のセグメント間に分散されるように、前記複数のパターンを複数のセグメント間に割り当てるステップであって、各セグメントの有効度は、前記各セグメントに分散される前記複数のパターンのうちのパターンに合致する前記複数の顧客記録のうちの顧客記録の採択ステータスの関数である、ステップと
を行わせるために有効である、システム。
（項目１５）
前記アルゴリズムは、２分探索アルゴリズム１を使用して、方程式ＬＦＩＰ−Ｆに従って、線形整数計画実行可能性問題を解くステップを含む、項目１４に記載のシステム。
（項目１６）
前記複数のパターンのうちの各パターンは、前記各パターンの属性のうちの各属性に対し、前記各属性に関する閾値を備える、項目１４に記載のシステム。
（項目１７）
前記実行可能コードはさらに、前記１つまたはそれを上回るプロセッサに、
決定ツリーに従って、前記複数の顧客記録を処理し、初期パターンセットを得るステップと、
前記初期パターンセットを取捨選択し、前記複数のパターンを得るステップと、
によって、前記複数のパターンを識別させる、項目１４に記載のシステム。
（項目１８）
前記実行可能コードはさらに、前記１つまたはそれを上回るプロセッサに、
最小サポートを下回るサポートを有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンのサポートは、前記各パターンに合致する顧客記録の数を示す、ステップと、
最小有効度を下回る有効度を有するパターンを除去するステップであって、前記パターンのセットのうちの各パターンの有効度は、正の採択ステータスを有する前記各パターンに合致する顧客記録の割合を示す、ステップと、
前記顧客記録のセットの最大パーセンテージを上回るものが、前記初期パターンセットの別のパターンにも合致するように、前記各パターンに合致する前記複数の顧客記録のうちの顧客記録のセットを有する前記初期パターンセットの各パターンを除去するステップと、
によって、前記初期パターンセットを取捨選択し、前記複数のパターンを得ることを行わせるために有効である、項目１７に記載のシステム。
（項目１９）
前記倍数は、少なくとも２である、項目１８に記載のシステム。
（項目２０）
前記実行可能コードはさらに、前記１つまたはそれを上回るプロセッサに、各セグメントの有効度を前記各セグメントに割り当てられる各パターンの網羅行列の関数として算出させるために有効であり、各パターンの網羅行列は、前記各パターンに合致する前記複数の顧客記録のうちの各顧客記録に対し、１／ｎの値を有し、ｎは、前記各顧客記録によって合致される前記複数のパターンのうちのパターンの数である、項目１４に記載のシステム。

本発明の利点が容易に理解され得るように、上記に簡単に説明される本発明のより具体的な説明が、添付の図面に図示される具体的実施形態を参照することによってもたらされるであろう。これらの図面は、本発明の典型的実施形態のみを描写するものであって、したがって、その範囲を限定するものと見なされないという理解の下、本発明は、付随の図面の使用を通して付加的具体性および詳細を伴って記載および説明されるであろう。

図１は、本発明のある実施形態による、顧客の予測セグメント化を実装するためのコンポーネントの概略ブロック図である。

図２は、コンピューティングデバイスの概略ブロック図である。

図３は、本発明のある実施形態による、予測セグメント化を行うための方法のプロセスフロー図である。

図４は、顧客データから抽出される決定ツリーを図示する、略図である。

図５は、パターン有効度対規則の数の分布のプロットである。

図６は、エネルギー顧客の登録を記述するための予測変数を示す、グラフである。

図７は、顧客のセグメントに割り当てられるパターンのための実行可能性行列である。

図８は、パターン間の重複の分布を示す、プロットである。

図９は、２個のセグメントと関連付けられたパターンの実施例である。

図１０は、セグメント有効度対反復の数の下限および上限のプロットである。

図１１は、パターン／セグメント配分行列を図示する。

図１２は、セグメントの重複を図示する。

図１３は、セグメント重複を図示する、別の略図である。

図１４は、セグメントの一覧と、セグメント化アルゴリズムに従う対応するパターンである。

図１５は、

に関するセグメント化アルゴリズムの感度分析を示す、プロットである。

図１６は、

に関するセグメント有効度のプロットである。

図１７は、セグメント化複雑性の関数としてのセグメント有効度の散布図である。

１．動作環境および概要
図１を参照すると、本明細書に開示される方法は、図示される動作環境１００によって実装されてもよい。サーバシステム１０２または他のタイプのコンピュータシステムは、データベース１０４をホストするかまたはそれにアクセスしてもよい。サーバシステム１０２はまた、デスクトップまたはラップトップコンピュータと置換され得るか、または、十分な計算力を伴うモバイルデバイスとさえ置換され得る。データベース１０４は、複数の顧客に関する顧客記録１０６を含んでもよい。本明細書に開示される方法は、エネルギー顧客に関して説明される。故に、各顧客記録１０６は、単一世帯または顧客アカウントに関するデータを含んでもよく、これは、したがって、ともに生活している複数の個人に関するデータを含んでもよい。

顧客記録１０６は、氏名、アカウント番号、または他の一意の識別子の形態で１人またはそれを上回る顧客の識別子１０８ａとして、そのような情報を含んでもよい。顧客記録１０６は、顧客の住所１０８ｂと、年齢、所得、性別、職業、教育レベル、および顧客を特徴付けし得る任意の他の情報等の顧客記録１０６と関連付けられた１人またはそれを上回る個人に関する人口統計情報１０８ｃとを含んでもよい。

本明細書に開示される方法がエネルギー顧客に適用される場合、顧客記録１０６はさらに、使用量データ１０８ｄ、例えば、１年、１ヶ月、または１日あたりに使用される毎時キロワット数を含んでもよい。使用量データ１０８ｄは、電力消費データの分析から得られた毎日、毎月、または季節的使用量パターンを含んでもよい。他の用途では、使用量データ１０８ｄは、別のサービスまたは特定のアイテムまたは生活必需品の購入の使用量を含み得る。

顧客記録１０６は、顧客および顧客挙動のタイプを記述するパターンを識別する際に有用であり得る、顧客に関して入手可能な任意の他のデータ１０８ｅを含んでもよい。

本明細書に開示される方法は、データを分析し、特定の措置を講じている顧客を予測する顧客データ（人口統計、使用量、およびその他）のパターンを判定するために使用される。エネルギー顧客の場合、これは、消費を低減させる、または別様に、顧客の環境影響を低減させるために、エネルギー効率プログラムに登録していること、または他の措置を講じていることを含んでもよい。故に、顧客記録１０６はさらに、顧客が特定のプログラムに参加することを選択しているかどうかを示す、１つまたはそれを上回る採択ステータスインジケータ１０８ｆを含んでもよい。例えば、ステータス１０８ｆは、顧客が参加を選択している場合、１であり得、そうでなければ、０であり得る。他の実施形態では、採択ステータスは、プログラムガイドラインへの準拠の程度または特定の目的に関して費やされた金銭の額を示す、値の範囲のうちの１つであってもよい。

データベース１０４はさらに、そこに割り当てられる複数のパターン１１２を有するセグメント１１０を記憶してもよい。各セグメント１１０は、有効度１１４を有し、これは、正の採択ステータス１０８ｆを有し、セグメント１１０に割り当てられたパターン１１２のうちの１つに合致する、顧客記録の数の尺度である。

セグメント１１０は、本明細書に以下で開示される方法を実装する、分析モジュール１１６によって定義されてもよい。特に、分析モジュール１１６は、パターン生成モジュール１１８ａを含んでもよい。パターン生成モジュール１１８ａは、顧客記録において同時に発生する一連の属性を識別する。以下に説明されるように、パターンは、各顧客記録内の種々の属性の値に関する閾値に関して記述されてもよい。また、以下に説明されるように、パターンは、決定ツリーまたは他のパターン識別アルゴリズムを使用して生成されてもよい。

分析モジュール１１６はさらに、パターン取捨選択モジュール（ｐａｔｔｅｒｎｐｒｕｎｉｎｇｍｏｄｕｌｅ）１１８ｂを含んでもよい。以下に説明されるように、パターン取捨選択モジュール１１８ｂは、最小のサポート、有効度、または非重複基準を満たさない、パターンを取捨選択（ｐｒｕｎｅ）してもよい。分析モジュールは、セグメント化モジュール１１８ｃを含んでもよい。セグメント化モジュール１１８ｃは、セグメントの最小有効度１１４がパターンをセグメント間に分散させるアルゴリズムを通して増加させられたセグメント１１０のセットが得られるように、取捨選択１１８ｂで生き残ったパターン１１２をセグメント１１０に割り当てる。

図２は、例示的コンピューティングデバイス２００を図示する、ブロック図である。コンピューティングデバイス２００は、本明細書で議論されるもの等の種々のプロシージャを行うために使用されてもよい。サーバシステム１０２は、コンピューティングデバイス２００の属性の一部または全部を有してもよい。

コンピューティングデバイス２００は、１つまたはそれを上回るプロセッサ２０２と、１つまたはそれを上回るメモリデバイス２０４と、１つまたはそれを上回るインターフェース２０６と、１つまたはそれを上回る大容量記憶デバイス２０８と、１つまたはそれを上回る入力／出力（Ｉ／Ｏ）デバイス２１０と、ディスプレイデバイス２３０とを含み、これらの全ては、バス２１２に結合される。プロセッサ２０２は、メモリデバイス２０４および／または大容量記憶デバイス２０８内に記憶される命令を実行する、１つまたはそれを上回るプロセッサまたはコントローラを含む。プロセッサ２０２はまた、キャッシュメモリ等の種々のタイプのコンピュータ可読媒体を含んでもよい。

メモリデバイス２０４は、揮発性メモリ（例えば、ランダムアクセスメモリ（ＲＡＭ）２１４）および／または不揮発性メモリ（例えば、読取専用メモリ（ＲＯＭ）２１６）等の種々のコンピュータ可読媒体を含む。メモリデバイス２０４はまた、フラッシュメモリ等の書込可能ＲＯＭを含んでもよい。

大容量記憶デバイス２０８は、磁気テープ、磁気ディスク、光ディスク、ソリッドステートメモリ（例えば、フラッシュメモリ）等、種々のコンピュータ可読媒体を含む。図２に示されるように、特定の大容量記憶デバイスは、ハードディスクドライブ２２４である。種々のドライブはまた、大容量記憶デバイス２０８内に含まれ、種々のコンピュータ可読媒体からの読取および／またはそこへの書込を可能にしてもよい。大容量記憶デバイス２０８は、可撤性媒体２２６および／または非可撤性媒体を含む。

Ｉ／Ｏデバイス２１０は、データおよび／または他の情報が、コンピューティングデバイス２００に入力されるかまたはそこから読み出されることを可能にする、種々のデバイスを含む。例示的Ｉ／Ｏデバイス２１０は、カーソル制御デバイス、キーボード、キーパッド、マイクロホン、モニタまたは他のディスプレイデバイス、スピーカ、ネットワークインターフェースカード、モデム、レンズ、ＣＣＤまたは他の画像捕捉デバイス、および同等物を含む。

ディスプレイデバイス２３０は、情報をコンピューティングデバイス２００の１人またはそれを上回るユーザに表示可能な任意のタイプのデバイスを含む。ディスプレイデバイス２３０の実施例は、モニタ、ディスプレイ端末、ビデオ投影デバイス、および同等物を含む。

インターフェース２０６は、コンピューティングデバイス２００が、他のシステム、デバイス、またはコンピューティング環境と相互作用することを可能にする、種々のインターフェースを含む。例示的インターフェース２０６は、ローカルエリアネットワーク（ＬＡＮ）、広域ネットワーク（ＷＡＮ）、無線ネットワーク、およびインターネットへのインターフェース等、任意の数の異なるネットワークインターフェース２２０を含む。他のインターフェースは、ユーザインターフェース２１８と、周辺デバイスインターフェース２２２とを含む。インターフェース２０６はまた、ポインティングデバイス（マウス、トラックパッド等）、キーボード、および同等物のためのインターフェース等、１つまたはそれを上回る周辺インターフェースを含んでもよい。

バス２１２は、プロセッサ２０２、メモリデバイス２０４、インターフェース２０６、大容量記憶デバイス２０８、Ｉ／Ｏデバイス２１０、およびディスプレイデバイス２３０が、相互に通信すること、およびバス２１２に結合される他のデバイスまたはコンポーネントと通信することを可能にする。バス２１２は、システムバス、ＰＣＩバス、ＩＥＥＥ１３９４バス、ＵＳＢバス等のいくつかのタイプのバス構造のうちの１つまたはそれを上回るものを表す。

例証目的のために、プログラムおよび他の実行可能プログラムコンポーネントは、本明細書では、離散ブロックとして示されるが、そのようなプログラムおよびコンポーネントは、場合によって、コンピューティングデバイス２００の異なる記憶コンポーネント内に常駐してもよく、プロセッサ２０２によって実行されることを理解されたい。代替として、本明細書に説明されるシステムおよびプロシージャは、ハードウェアにおいて、または、ハードウェア、ソフトウェア、および／またはファームウェアの組み合わせにおいて実装されることができる。例えば、１つまたはそれを上回る特定用途向け集積回路（ＡＳＩＣ）が、本明細書に説明されるシステムおよびプロシージャのうちの１つまたはそれを上回るものを実施するようにプログラムされることができる。

図３を参照すると、サーバシステム１０２は、図示される方法３００を実行してもよい。方法３００は、顧客データを受信するステップ３０２を含んでもよい。これは、顧客に関してデータが集められる際、ある期間にわたって、データを受信するステップを含んでもよい。受信されたデータは、顧客記録１０６内に含まれるように上記に説明されたデータの一部または全部を含んでもよい。

方法３００はさらに、顧客採択ステータスを判定するステップ３０４を含んでもよい。採択ステータス１０８ｆは、受信される際に、または、顧客に対するオファーを延長する後続プログラムの一部として受信され、応答を受信する際に、顧客記録内に含まれてもよい。いずれの場合も、データは、手動でまたは自動的に、各顧客に対する採択ステータスを示すサーバシステム１０２に提供される。いくつかの実施形態では、方法３００は、オファーを受信した顧客に対してのみ実行されてもよい。

方法３００はさらに、初期パターンセットを生成するステップ３０６を含んでもよい。例えば、初期パターンセットを生成するステップ３０６は、当技術分野において公知のような決定ツリーをトラバースするステップを含んでもよく、決定ツリーの各ノードは、顧客記録１０６の属性１０８ｂ−１０８ｅに対応する、属性値または属性値の範囲である。例示的決定ツリーは、図５に示され、初期パターンセットの生成は、以下の第３．２節「データからの予測パターンの抽出」および第５．２節「データから抽出される予測パターン」により詳細に説明される。

方法３００はさらに、初期パターンセットを取捨選択するステップ３０８を含んでもよい。これは、十分なサポートを有していないパターン（すなわち、パターンに合致する不十分な数の顧客記録１０６）、十分な有効度を有していないパターン（すなわち、パターンに合致し、正の採択ステータスを有する、不十分な数の顧客記録１０６）、および別のパターンにもまた合致する、合致する顧客記録の閾値を上回るパーセンテージを有するパターンを除去するステップを含んでもよい。取捨選択プロセスのより詳細な説明は、以下の第３．２節「データからの予測パターンの抽出」および第５．２節「データから抽出される予測パターン」に説明される。

方法３００はさらに、セグメントの最小有効度に関して最大値に反復的に近づいていくアルゴリズムに従ってパターンをセグメントに割り当てるステップ３１０を含んでもよく、有効度は、各セグメントに割り当てられるパターンに合致する顧客記録のどれだけ多くが正の採択ステータスを有するかについての尺度である。これは、以下の第３．１節「最小有効度の増加」に説明されるように、最適化アルゴリズムを実行するステップを含んでもよい。

セグメントは、次いで、さらに処理されてもよい３１２。特に、セグメントは、標的化されたマーケティングのために使用されてもよい。すなわち、広告は、その有効度を増加させるために、１個のセグメントのパターンに合致する顧客のみに編成され、伝送されてもよい。セグメントはまた、顧客挙動を可視化するために、または任意の他の事業目標のために、使用されてもよい。

方法３００によって実装されるアルゴリズムは、以下の第２節から第３節により詳細に説明される。第４節は、以前のアプローチの概要を含み、第５節は、実際の顧客データを使用した実験結果を図示する。

以下の説明は、セグメントの最小有効度を最大限にすることを追求する最適化アルゴリズムについてであることに留意されたい。故に、「最大」、「最適」、「最適化」、「最小限」、および「最小」という言及は、絶対または実際の最大、最適、または最小値を指すわけではなく、開示されるアルゴリズムの限界を被り、かつ開示されるアルゴリズムの有限数の反復の実施を受けて判定された最大、最適、または最小値であると理解されるものとする。

具体的には、値「を最大限にする」、値の「最大限化」、および値の「最大」は、開示されるアルゴリズムの前の反復または開示されるアルゴリズムを行わない場合と比較して、値の増加を指すと理解されるものとするが、値の閉集合が検討され、閉集合内の最大値が、確実性を持って判定され得る場合を除く。

値「を最小限にする」、値の「最小限化」、および値の「最小」は、開示されるアルゴリズムの前の反復または開示されるアルゴリズムを行わない場合と比較して、値の減少を指すと理解されるものとするが、値の閉集合が検討され、閉集合内の最小値が、確実性を持って判定され得る場合を除く。

「最適化する」とは、開示されるアルゴリズムを行わない場合よりも絶対最適値に近い値を見出すことを意味すると理解されるものとし、絶対最適値を実際に見出すと理解されないものとする。同様に、「最適」値は、ほぼ最適値であると理解されるものとし、「ほぼ」は、数字を表し、それに関する数学的演算を行う正確度を表す際の限界、開示されるアルゴリズムが理論的に達成し得るものの限界、および実践的に行われ得る反復の数の限界を指す。

２．予測セグメント化
透過的かつ有用なセグメント化方略は、以下を達成すべきである。１．実践者がそれに容易に関連させ、採択し得るように、既存の有用な専門知識および最良実践を取り込む。２．エネルギー公益事業者における非技術的プログラム管理者にとって分かりやすくかつ直感的であって、かつマーケティング通信を生成するために有用であること。３．有効度の観点から、ある最適性保証をもたらす、すなわち、母集団全体から無作為に得られた消費者より措置を講じる可能性がより高いメンバのサブグループを識別するその目的に関して、非常に弁別的である。

第１に、多くの専門知識および実践的経験が、エネルギー公益事業者には存在し、その基盤の中から識別することを所望するある高レベルタイプの顧客についての仮説を立てることを可能にする。例えば、最も経験豊富なプログラム管理者は、「環境保護提唱者」消費者が、より「コスト優先的」な消費者（金銭節約についての議論に応答し得る）とは他のタイプの通信（環境への影響を強調する）に応答することに同意するであろう。

第２に、本方法は、ある変数と各所与のセグメントを関連付ける既存の専門知識（例えば、「環境保護提唱者」は、その所得、世帯タイプ、および教育のレベルによって定義され得る）から開始し、最も有効なセグメント化方略につながるそれらの変数を伴う、単純論理規則を識別し得る。そのような直感的セグメントは、適切なメッセージ伝達方略を生成することを可能にするはずである。例えば、「環境保護提唱者」グループ内の消費者は、エネルギー節約の環境側面を強調する、メッセージを受信するであろう一方、「高消費者」カテゴリ内のそれらの消費者は、その多額の請求を削減し得る方法について通知されるであろう。

課題は、次いで、（上記の第３の点に提示されるように）結果として生じるセグメントの有用な性質を確実にし、かつ課された構造を満たす最良可能セグメント化が達成されることを保証しながら、ポイント１および２の要求を取り込む、アルゴリズムセグメント化方法を開発することである。所望の結果は、エネルギー効率プログラム登録に関するマーケティング通信の影響を最大限にする、すなわち、登録する可能性がより高いそれらの顧客を標的化することである。通信の調整およびキャンペーンの管理は両方とも、コストがかかるため、少数のセグメントに対してメッセージを作成し、それらのセグメントに措置を講じる可能性がある消費者を含ませることが主眼である。

２．１．問題設定
Ｎ人の消費者から成る母集団Ｘは、オペレータ（エネルギー公益事業企業）によってサービス提供される。各消費者に対し、公益事業者は、消費および顧客特性（社会人口統計および物理的構築属性等）の両方から成る、Ｍ個の数の特徴

を観察する。したがって、全ての消費者を横断した特徴データが、行列

内に記憶される。公益事業者はまた、各消費者ｉに対し、過去１年以内に任意のプログラムに登録したかどうかを観察し、これは、顧客ｉが登録したときに限り、バイナリ変数

としてエンコードされる。

公益事業者は、需要側効率プログラム登録のための標的化された通信の有効度を通知、簡略化、および増加させることを目的として、データ（Ｘ，ｙ）を使用して、属性Ｘに対して「同質」である母集団内のＫ個のセグメントを識別することを所望する。以前のマーケティング研究に基づいて、公益事業者は、サービス提供している顧客の「タイプ」に関してある仮説を有し得る。本以前の知識は、以下の形態であると仮定される。「環境保護提唱者」は、比較的に高所得または少なくとも大学の学位を有する。「住宅改良希望者」は、住宅所有者またはその家の大黒柱である。

次いで、データ（Ｘ，ｙ）は、セット

のパターン、

を抽出することによって、これらの仮説を具体的にするために使用されることができ、これらは、これらのパターンを呈する消費者の特性を指すという点において記述的であり、かつ、あるパターンに入る消費者が母集団全体から無作為に選択された消費者より登録する可能性がより高いという点において予測的である。パターンは、したがって、以下の形態の論理表現であると定義され得る。

式中、

は、ベースルール（論理文）である。故に、パターンが、一連の論理積として定義される。互換的に、パターンは、パターンの論理定義に従う、消費者のセットと称され得る。ベースルールは、以下の形態であるとする。

したがって、ベースルールは、方向（「≧」または「≦」のいずれか）を指す、変数ｘ_ｊ（ｘ内のｊ番目の変数）と、データから学習された閾値ｔ_ｊとによって定義される。規則Ｐ_ｊ（・）は、その規則を定義する変数および方向の両方が仮説に合致する場合、仮説に一致するとする。同様に、パターンＰは、仮説と一致する、少なくともδ≧１の規則を含有する場合、仮説とδ一致であると定義する。

アイテムｉがパターンｍによって網羅される範囲を要約する、網羅行列（ｃｏｖｅｒａｇｅｍａｔｒｉｘ）Ｃを定義することは、有用である。

パターンＰの有効度は、そのパターンによって網羅される消費者の（経験的）登録確率として算出されてもよい。

上記の設定を用いて、各セグメント内の全てのパターンがそのセグメントを定義する仮説とδ一致であるように、Ｋ個のセグメントをパターンの集合として

として定義する。

は、セグメントとパターンとの間の許容関係を記述する、（公知の）整合性行列を定義するとする。

最後に、セグメント化は、以下の個々のセグメントのセットのようになる。

２．２．有効なセグメント化
ここで、登録の率に関して消費者セグメント間で区別可能である場合に有効となる、セグメント化方略を検討する。すなわち、優れた方略（Ｋ個のセグメントに関して）は、母集団全体において観察される全体的率ｑと非常に異なる（より小さいか、またはそれを上回るかのいずれかである）確率ｑ_ｋ、ｋ＝１，・・・，Ｋを伴って登録する、母集団内のそれらのセグメントを識別するであろう。例えば、セグメント化が、Ｋ＝２のグループＡおよびＢから成る場合、Ａ内の全ての消費者が登録しているが、Ｂ内の消費者が登録していなければ（したがって、ｑ_Ａ＝１かつｑ_Ｂ＝０）、完全に有効である。完全に非有効なセグメント化は、Ａ内の消費者がＢ内の消費者と同一率で登録している（したがって、ｑ_Ａ＝ｑ_Ｂ）。当然ながら、常時、効率プログラムに登録した全ての者をセグメントのうちの１つに入れることによって、消費者を２個のセグメントにグループ化し得る。しかしながら、課題は、登録を予測もする、セグメントの分かりやすい直感的定義につながる、消費者特性Ｘ内のパターンを識別することである。

各セグメントの有効度は、そのセグメント内の消費者の（経験的）登録確率としてパターンの有効度と類似方法で算出されてもよい。

セグメントは、したがって、

である場合、登録に関する優れた価値尺度の数字である。式中、

は、全体的母集団内の登録の率である。解決したい問題は、結果として生じるセグメントが、例えば、以下の望ましい有効度性質を有するように、少なくとも

であって、最大で

のパターンを各セグメントに配分することである。・最小有効度を最大限にする

・セグメントを横断して有効度の適切な平衡を確実にする

式中、所与の加重ベクトルである、θを用いる。

これに関して、以下のように、決定変数

を定義する。

したがって、セグメントｋは、以下のように定義される。

次いで、問題は、目的（８−９）のうちの１つが最大限にされ、以下の実行可能性制約（Ｆ_０）が満たされるように、ｚ_ｍｋの値を見出すこととなる。

所与のセグメントに関して実行可能な多くのパターン、すなわち、

が存在し得る。さらに、パターンは、重複し得る（すなわち、定義する消費者のセットは、互いに素ではない

）。次いで、Ｓ内のセグメントも同様に、記述する顧客内で重複するパターンを含有することが起こる場合、重複し得る。これは、制約（Ｆ０）に対処（８−９）し、かつ満たす、最適化問題の適切な定式化に付加的複雑化を課す。

パターンが重複しない場合、セグメント有効度は、以下のように記載され得る。

しかしながら、パターン重複は、実質的であり得るため、上記の式は、パターン

の複数のパターンに入る消費者をオーバカウントする。本問題に対処するために採択する１個の簡略化は、ｎ個の異なるパターンによって網羅される消費者が各パターン上に１／ｎの分数網羅率を有すると見なされ得るということに留意して、網羅行列Ｃの定義を緩和することである。これは、修正網羅行列

、すなわち、以下に変換される。

したがって、修正網羅行列は、単一パターンの分数網羅率を示す各消費者ｉに加重を割り当てる（等しい重要性を各パターンに与える）。便宜上、本修正行列を依然としてＣと称する。

３．予測セグメントの算出
予測セグメント化を算出するためのアルゴリズムの設計は、目的関数がとる具体的形態によって判定されるであろう（全ての制約は、単純線形形態である）。ここで、目的が、Ｋ個のセグメントを横断して最小有効度を最大限にするように、許容可能パターンをセグメントに配分することである状況に焦点を当てる（方程式（８）参照）。これは、その標的化された通信方略の最小有効度についての保証を有することを所望するプログラム管理者のための自然な要件である。

３．１．最小有効度の増加
方程式（１２）における上記の式は、各セグメントに対して決定変数をエンコードする、Ｋ個のベクトルｚ_ｋを利用する。単一決定変数ベクトルを使用して、目的および制約をより使いやすいアフィン形態で表すために、以下の表記を採用することができる。

式中、

を用いる。次いで、有効度は、以下として表されることができる。

Ｆ_０における実行可能性条件は、以下となる。

最大−最小目的の場合（８）では、最適化は、可能な限り、セグメントを横断して有効度の下限を増加させようとする。これは、ｑ_ｋｓの比較的に同質な分布をもたらす。本状況は、例えば、セグメントのそれぞれに措置が講じられるであろうとき、望ましくあり得る。この場合、最適化問題は、以下として表されてもよい。

問題（ＬＦＩＰ）は、線形制約を伴う、一般化（最大−最小）線形分数整数計画（ｇｅｎｅｒａｌｉｚｅｄ（ｍａｘ−ｍｉｎ）ｌｉｎｅａｒ−ｆｒａｃｔｉｏｎａｌｉｎｔｅｇｅｒｐｒｏｇｒａｍ）である。本問題のクラスは、文献において広範に研究されている（例えば、論評に関して、ＨｏｒｓｔａｎｄＰａｒｄａｌｏｓ（１９９５年）、Ｆｅｎｇｅｔａｌ．（２０１１）、ＳｃｈａｉｂｌｅａｎｄＳｈｉ（２００４年）参照）。ＢｏｙｄａｎｄＶａｎｄｅｎｂｅｒｇｈｅ（２００４年）に従って、以下の（ＬＦＩＰ）の等価な式を線形整数計画実行可能性問題（ＬＦＩＰ−Ｆ）として提案する。

式中、ｋ＝１，…，Ｋに関して、Ａは、行

を伴う行列であって、Ｄは、行

を伴う行列である。λの所与の値に関して、上記の実行可能性問題（ＬＦＩＰ−Ｆ）は、標準的混合整数計画パッケージを使用して解かれることができる。初期顧客特性データは、非常に大きくあり得るが（ここでは、

の顧客）、パターンの数は、はるかに小さくなると予期され（Ｍ〜１，０００）、セグメントの数も同様である（ここでは、Ｋ＝５）。次いで、標準的パッケージは、優れた独創的な能力を発揮することができる。次いで、対応する最適ｚを伴う最大値

が、各ステップにおいて実行可能性問題（ＬＦＩＰ−Ｆ）を解く、反復２分探索アルゴリズム１（以下の表１参照）を使用して、効率的に見出されることができる。最適λ^＊が入るように保証される、大間隔［ｌ_０，ｕ_０］（ここでは、［０，１］）から開始して、アルゴリズムは、全ステップにおいて間隔［ｌ，ｕ］を連続的に狭め、λ^＊∈［ｕ，ｂ］を確実にする。これは、Ｐａｔｅｌｅｔａｌ．（２０１３）において構築された以下の補題１に概略される。

補題１．アルゴリズム１の出力は、公差ε内およびｌｏｇ_２（ε_０／ε）反復内のλの最大値であるλ^＊に対応する最適ｚ^＊である。

補題１を証明するために、アルゴリズム１が、λがとり得る最大実行可能値である、一意の値λ^＊を見出すであろうことを示さなければならない。これに関して、以下の実行可能セットを定義する。

本表記を用いて、以下を有する。

セグメントｚ^＊への最適パターン配分は、λ^＊に対応する。定義上、最適λ^＊は、以下の実行可能セットΛと非実行可能セット

との間の（上）遷移点である。したがって、以下が、公差パラメータε＞０（小）に関して当てはまらなければならない。

アルゴリズム１が最適λ^＊を見出すであろうことを証明するために、上記の条件を満たすことを示す必要がある。分析においてλを含有する項のみに、焦点を当てる。

第１の条件を証明するために、以下をとる。λ∈Λそして以下が、証明されなければならない。

λ∈Λという事実は、以下を含意する。

次いで、λ＋εおよび同一ｚ_λに関して、以下を有する。

上記の第２の項は、ε＞０であって、Ｄおよびｚ_λの両方が、非ゼロ入力のみを有するため、正である。

第２の条件を証明するために、値

を固定し、次いで、

またはε＞０を示すことが所望される。

という事実は、

を含意し、したがって、λの所与の値に関して

を有していなければならない。ｚ_λは、

の最大値をもたらし、実行可能性セットΛを定義する全ての他の条件を満たすλに対応する決定変数ベクトルであるとする。次いで、以下となる。

λの非実行可能性から、さらに、

を有し、次いで、λ＋εに関して、

の最大値をもたらす、決定ベクトルｚ_λ＋εをとるが、前述から、ｚ_λ＋εを含む、

を有する。次いで、ｚ_λ＋εに関して、以下を有する。

次いで、

であるため、

と結論付けられる。したがって、アルゴリズム１は、常時、最適配分ベクトルｚ^＊に対応する、最大限に実行可能なλ^＊を見出すであろう。さらに、各ステップを用いて、アルゴリズムは、検索間隔［ｌ，ｕ］を半分にするため、

の完了条件に到達するために、最大で以下のステップをとる。

容易に明白となるように、最適化アルゴリズムは、最適解が、上記に説明されるように、各反復を用いてより小さくなる、検索窓［ｌ，ｕ］＜ε内にあるように、最適解に近似する。

３．２．データからの予測パターンの抽出
特徴行列Ｘおよびバイナリ応答（登録）ベクトルｙとしてエンコードされた観察のセットを前提として、非常に有効な（ｑ＞＞ｑ_０）パターンＰを抽出することが所望される。これに関して、以下のアプローチを採択する。１．可変深度の多くの決定ツリーを生成するために（ここでは、最大５個のレベルのツリーを生成した）、基本学習器として分類ツリーを有する、ランダムフォレストまたはＡｄａＢｏｏｓｔＨａｓｔｉｅｅｔａｌ．（２００９年）等のアンサンブル方法を使用する。本ステップは、決定ツリーを各リーフまでトラバースすることによって得られる初期パターンのリストＰ_０を構築することを可能にする。強化アンサンブル法における基本分類子として使用されるツリーのレベルに応じて、これらの規則は、単一文（深度１のツリーまたは決定株）から複数のベースルールの論理積まで、可変形態の複雑性をとることができる。２．パターンリストＰ_０を取捨選択し、「品質」のあるセット基準に対応しない規則を排除する。本目的のために、以下の基準の両方を満たす場合、パターン

を「有効」と見なすものとする。・最小サポート：｜Ｐ｜＞η、すなわち、パターンに合致する顧客の数は、η＋１が各パターンに合致する最小母集団であるように、ηを上回らなければならない。ここでは、η＝５００が使用される。・最小有効度：ｑ（Ｐ）＞ζｑ_０。ここでは、ζ＝２が使用される。３．さらに、他のパターンとｖ％（ここでは、ｖ＝７０％であるが、しかしながら、６０〜７５％のｖの値もまた、使用されてもよい）を上回って重複し、より低い有効度ｑを有する、パターンを除去する。例えば、合致する顧客Ｃ_１および有効度ｑ_１を有するパターンＰ_１と、合致する顧客Ｃ_２およびｑ_１未満の有効度ｑ_２を有するパターンＰ_２とに関して、ｖ％を上回る顧客Ｃ_２が、Ｃ_１内に含まれる場合、パターンＰ_２は、より低い有効度を有するため、取捨選択されるであろう。

本プロシージャは、取捨選択されたパターン

のセットをもたらす。

４．文献のレビュー
エネルギープログラムのための顧客標的化は、最近、エンジニアリングおよびコンピュータサイエンス、運営管理、およびマーケティングにおける見掛け上異なる文献から注目を集めている。本研究は、エネルギー公益事業者における運営およびマーケティング部署内の既存の専門知識の上に分かりやすいセグメント構築をもたらす、単純かつ透過的方法論を提供することによって、それらの分野におけるより大きい議論に寄与する。需要側管理に関するエンジニアリング研究が、最近、細部に及ぶ消費読取および社会人口統計情報を含む、詳細な顧客データの可用性によって動機付けられている。典型的には、以下のいくつかの主なエリアに焦点が当てられている。ｉ）必要性に応じた時間帯価格またはスマートサーモスタット制御等のプログラムを通知することを目標として、家庭全体のデータ（スマートメータまたはカスタム器具のいずれかから）を使用して、ユーザの母集団の消費パターンを記述すること（Ｋｗａｃｅｔａｌ．（２０１３年）、ＡｌｂｅｒｔａｎｄＲａｊａｇｏｐａｌ（２０１５年））、ｉｉ）総合信号から、家庭全体および個々のアプライアンス実験データの両方を収集し、別個の最終用途を再構築すること（ＣａｒｒｉｅＡｒｍｅｌｅｔａｌ．（２０１３年）、ＫｏｌｔｅｒａｎｄＪａａｋｋｏｌａ（２０１２年）、およびｉｉｉ）エネルギー使用に及ぼす異なる外部要因（特に、天候）の平均影響を研究すること（Ｈｏｕｄｅｅｔａｌ．（２０１２年）、Ｋａｖｏｕｓｉａｎｅｔａｌ．（２０１３年）、Ｋａｖｏｕｓｉａｎｅｔａｌ．（２０１５年）。

エネルギー分析に関するより最近の文献は、総合需要プロファイルを使用して、プログラムを通知する、公益事業者における従来の需要管理実践の延長における消費パターンの特徴付け（負荷プロファイリング）に関する。その消費挙動がグリッドにもたらすコストによる消費者のセグメント化方略が、需要における変動率に最も寄与する消費者のグループを標的化するための方法として、ＡｌｂｅｒｔａｎｄＲａｊａｇｏｐａｌ（２０１４年）において提案されている。研究のポピュラーなトピックは、差別価格設定またはエネルギー削減の奨励等の介入のために後に使用され得る、典型的毎日の負荷プロファイル（典型的には、Ｋ−平均法等のオフザシェルフの教師なしアルゴリズムを使用した毎日のユーザ消費負荷形状のクラスタ化を伴う）における異質性である。本アプローチは、例えば、Ｆｌａｔｈｅｔａｌ．（２０１２年）、ＲａｓａｎｅｎａｎｄＫｏｌｅｈｍａｉｎｅｎ（２００９年）、Ｆｉｇｕｅｉｒｅｄｏｅｔａｌ．（２００５年）、Ｓｍｉｔｈｅｔａｌ．（２０１２年）、Ｔｓｅｋｏｕｒａｓｅｔａｌ．（２００７年）、Ｅｓｐｉｎｏｚａｅｔａｌ．（２００５年）においてとられている。消費の第１の学習生成モデルに基づいて、負荷プロファイルをセグメント化し、次いで、得られたモデルをクラスタ化する他の変形例は、例えば、ＡｌｂｅｒｔａｎｄＲａｊａｇｏｐａｌ（２０１３）、Ａｌｚａｔｅｅｔａｌ．（２００９年）において議論されている。しかしながら、本研究の方針は、大部分は、性質上記述的であって、典型的には、識別された負荷パターンに関する明確な使用例は、提供されておらず、そのような情報を組み込み得る公益事業者におけるプログラムは、現在殆ど存在しない。

一方、運営管理およびマーケティング文献は、過去数年にわたって、エネルギーへの適用に関心を集めている。これは、多くの公益事業企業において、効率プログラムを用いて消費者を配分、登録、および標的化することに関わる部署が、従来、運営またはマーケティングのいずれかであったという事実によって影響されたと考えられ得る。

５．実験設定
５．１．顧客特性データ
本願で使用したデータは、米国の北東部における大規模エネルギー企業から得られ、約１００個の社会人口統計および建物特性およびＮ＝９５７，１５０人の消費者に関する２年にわたる毎月のエネルギー消費読取値から構成された。標準的データクリーニングプロシージャ後、母集団全体を横断して少なくとも８０％の有効エントリを有していた４３個の着目変数が、選択された。それらのうち、１９個の変数が、カテゴリ変数であって、２４個は、数値変数であった。カテゴリ変数をバイナリダミー変数に変換することによって、Ｐ＝３０４個の変数の最終データセットが得られた。ｑ_０＝４．９％の割合に対応する、合計４８，３１０人の消費者が、データ収集に先立って、２年以内に任意のエネルギー効率プログラムに登録した。

表１は、いくつかの着目カテゴリ変数を説明する。消費者の大部分（約８０％）は、持ち家を所有しており、わずか約１６％が賃貸である。教育レベルは、全体として、社会一般を反映し、消費者の４分の１は、それぞれ、学士号および修士号を有し、消費者の半分は、高校卒業資格またはそれ未満を有する。「環境保護意識」変数は雑誌購読、コミュニティとの関わり、政治の学習、異なる組織への加入等の要因を考慮する、第三者分析の結果を要約し、環境問題への推定される着目レベルをもたらす。

表２は、いくつかのより数値的な着目変数を要約する。平均生年は、１９５７年であって、これは、ベビーブーム世代の人口統計を示唆する。サンプル内の平均家族は、１２年を上回る居住年数を伴って、大型住居（６部屋）で生活している。

５．２．データから抽出される予測パターン
予測規則が、上記の第３節に説明されるデータから抽出された。取捨選択後、予測パターンのリスト（その有効度は、少なくとも

であって、少なくともη＝５００のサポートを有していた）は、それぞれ、最大５個のベースルールのＭ_０＝２，９６５個のパターンを含有した（５個のベースルールを伴う１，８５２個のパターン、４個のベースルールを伴う９６３個のパターン、３個のベースルールを伴う１４３個のパターン、および２個のベースルールを伴う７個のパターン）。図４は、データから抽出された高さ３の例示的決定ツリーを図示する。強調されるパターンは、有効度（正のサンプルの割合）が８％であるルートから開始する、決定ツリー内の経路である。図５は、データから抽出されるＭ_０＝２，９６５個のパターンに関する異なる複雑性（２〜５個のベースルール）のパターンのためのパターン有効度ｑ（Ｒ）の分布を図示する。予期されるように、分布は、指数関数的挙動を呈し、より低い有効度のパターンが多く、高有効度のパターンが少ない。

登録を予測するための上位２０個の最も重要な変数が、図６に列挙される。これらは、とりわけ、住宅の所有量（融資比率、利用可能な所有権）、住宅およびそこで生活している家族のサイズ、および家族の所得額を含む。これは、登録が財政的責任の認知および住宅への改良に関する能力に依存することを示唆する。本分析は、任意のエネルギー効率プログラムへの登録のみを考慮した。より具体的なタイプの消費者に向けられた具体的プログラムの分析は、（効率的アプライアンスとは対照的な断熱に対する割引等の）重要な変数におけるより精緻化された区別をもたらすであろう可能性が高い。

５．３．パターンとセグメントの関連付け
セグメントは、以前の挙動研究の結果およびデータを提供したエネルギー公益事業者との広範な相互作用を使用して定義された。公益事業者は、その独自の内部専門知識および研究およびＦｒａｎｋｅｌｅｔａｌ．（２０１３年）等の独立の第三者挙動およびマーケティングの研究に基づいてすでに定義された少数のセグメントに入る消費者を識別することを所望した。上記の第２節に説明されるように、セグメントの目的は、ｉ）各セグメントに対する適切な情報および立案を伴う標準化された電子メール等、少数のマーケティング通信を生成することと、ｉｉ）エネルギー効率プログラムに登録する可能性がある、各セグメントに対応する消費者を識別することとの２つであった。

この先行技術に基づいて、公益事業者は、消費者が、Ｋ＝５個のセグメント、すなわち、「環境保護提唱者」、「高消費者」、「住宅改良希望者」、「コスト優先者」、および「文化的誘因」に入ると考えていた。本仮説をエンコードするセグメント意味は、表３に要約される。これらのセグメント定義を前提として、Ｐ_０からの潜在的パターンＰが、各パターンＰが個別のセグメントの意味についての仮説とδ一致（第２節参照）することを確実にすることによって、異なるセグメントに関連付けられた。すなわち、所与のセグメントＳに関して、それらの規則

は、変数ｊおよび方向（データから学習された閾値を上回るか、または下回るかのいずれか）の両方に合致した少なくともδ個のベースルール

を含有することが見出された。結果として生じるパターンのセットＰは、Ｍ＝２１９個のパターンを含有した。全ての消費者が、

６１４，８３０（オリジナルサンプルの６４％）を伴う低減されたパターン

のセットによって網羅されるわけではなかったが、登録した消費者の８９％は、低減されたセット内に含まれた。

各セグメントに対して得られたパターンの数およびその網羅率（パターン内の消費者の数）もまた、表３に列挙される。パターンの数は、初期の約３，０００より小さいが、最大有効度に近づけるために十分に少ない数を選択することは、依然として、非自明なタスクである。パターン／セグメント割当実行可能性をエンコードする関連付け行列Ｂが、図７に図示される。いくつかのパターンは、図８に図示されるように、複数のセグメントに属し得る。そこでは、ユーザを網羅するパターンの数の分布が、プロットされる。大部分のユーザは、少数のパターンによって網羅される。しかしながら、同時に、５０個を上回るパターンに入る少数のユーザも存在する。

データから抽出され、セグメント「高消費者」および「コスト優先者」に割り当てられる、規則の２個の実施例が、図９に表示される。「高消費者」に割り当てられるパターンは、消費が所与の閾値を上回る条件を伴う、少なくともδ＝１のベースルールを含有する。

６．結果
アルゴリズム１が、

の場合における、セグメントＺへのパターンのほぼ最適な実行可能配分を得るために使用された。アルゴリズムは、［０，１］（ε_０の幅）から

であるときの１４回の反復における収束まで検索領域を狭める。故に、セグメントＺへのパターンの配分は、ε＝１０^−１４以内で最適解に近似する。２分探索プロセスは、図１０に図示され、これは、

を用いて、実行可能性問題（ＬＦＩＰ−Ｆ）を反復的に解くことによって、セグメント有効度に関する最大下限λを見出すことを示す。

に関する結果として生じる最適配分行列Ｚは、図１１に表示される。そこでは、水平軸は、許容可能割当行列Ｂを表すために図１０において使用されたものと同一フォーマットにおける恣意的ＩＤ番号によってパターンを順序付ける。アルゴリズムは、最良有効度性質を伴い、（Ｆ_０）における制約を満たす、少数のパターンを選択した。

最適解は、５個のセグメントを横断して拡散される１０個のパターンを含有する。表４は、結果として生じるセグメントの有効度およびサイズを要約する。最終有効度数は全て、２×ｑ_０を上回り、１個のセグメント（「文化的誘因」）に割り当てられた消費者は、全体の母集団内でほぼ３倍の率で登録していた。

図１２は、セグメント間の重複の実施例を示す。本重複は、セグメントを構成するパターン自体が、それらが網羅する顧客内で重複し得、実際に重複するため、誘発される。しかしながら、セグメント重複は、消費者が、彼らを１個のセグメント（「コスト優先者」等）に属するものと見なし得る、ある特徴を有し得る一方、他の特徴が、異なるセグメント（「住宅改良希望者」等）内の消費者と共有されるため、現実では、自然な概念である。セグメント化技法は、本状況を透過的に考慮する。セグメント重複のより包括的見解は、ネットワークプロットとして図１３に提示される。そこでは、各セグメントは、そのセグメント内の顧客の数に比例するサイズのノードとして表される。セグメント間のリンクの加重は、セグメントのペアワイズの重複を表す。制約が、

から

に変更されるにつれて、より多くのパターンがセグメントのいくつかを構築するために使用されるため、セグメント化の構造は、変化する。

「セグメント」は、運営コストおよび複雑性を低く保ちながら、消費者間である程度まで区別する、通信の作成および管理を補助するように、プログラム管理者によって定義された構成概念であることに留意されたい。それらは、ある程度の異質性を露見させるが、同時に、介入を個人の必要性に完全に合わせることを可能にするものでもない。全ての消費者が１個のセグメントのみに属することを課すことは、非現実的仮定を課すことになり、本アプローチは、これを回避する。

図１４は、

に関する最適パターン配分に対応するセグメントを定義する、パターンのリストを含む。各セグメントの意味についての表３における仮説は、閾値ｔ_ｊ（「高」および「低」が意味する内容を精密に定義する）および付加的ベースルール等の具体的情報で拡充される。例えば、高率でエネルギー効率プログラムに登録する「住宅改良希望者」の１つのタイプは、年収＄７５，０００を上回り、＄３０６，８７０を上回るその住宅の所有権を所有する、南アジア人である。同様に、「環境保護提唱者」の１つのタイプは、年収＄７５，０００を上回り、その州の平均所得レベルの少なくとも２．５倍を稼いでおり、子供を有し、集合住宅で生活していない家族である。各セグメント内のパターンは、次いで、そのセグメント内の消費者が応答することが認められている要素を含むように、そのセグメントに対して特有のマーケティング通信を設計するために使用されてもよい。さらに、パターンの特異性（データから学習された閾値の観点から）は、登録する可能性が最も高いそれらの消費者を標的化することを可能にする。

上記の議論から、得られたセグメント化の構造は、制約の性質に、特に、

の値に強く依存することが顕著に明白となる。本依存性を研究するために、アルゴリズム１が、グリッド

に関して実行された。ここで、

である。目的

の最適値およびセグメント化のために選択されたパターンの数は、図１５に図示される。最良結果が、

であるときに得られた（したがって、アルゴリズムは、必要以上に多くのパターンをセグメントに引き出すわけではない）。良好な結果

が、中値から大値の

および低値の

に関して得られることが示される。これらのマップは、したがって、モデル複雑性およびセグメント化有効度をトレードオフする方法のガイドラインをもたらす。

の所与の値に関して、

を用いて、目的λ^＊および個々のセグメント有効度値ｑ_ｋ、ｋ＝１，・・・，Ｋの変形例が、観察された。次いで、これは、個々の着目セグメントの所望の有効度値に適応するように設計され得る、結果として生じるセグメント化の複雑性のための調整パラメータとしての役割を果たすことができる。これは、

の値に関して図１６に図示される。例えば、「文化的誘因」に強調が置かれる場合、

を伴うセグメント化が、好ましい。ｋの全ての値に関して、ｑ_ｋは、明確にλ^＊を上回ることに留意されたい。

最後に、セグメント化複雑性（セグメントを横断して選択されたパターンの総数）への個々のセグメント有効度の依存性が、図１７に図示される。これは、セグメント化複雑性の固定された所与の値に関して達成され得る、最良可能有効度値を強調する。例えば、効率プログラム管理者が、２０〜２５のパターンの総数を選択することを所望する場合、「文化的誘因」セグメントの最適有効度は、常時、「コスト優先者」セグメントのものを上回ることが期待され得る。

のその範囲に関して、「住宅改良希望者」、「環境保護提唱者」、および「文化的誘因」は全て、約１１％の有効度値を有する。

７．結論
本願は、エネルギー消費者の分かりやすい予測セグメント化をプログラム的に構築するための方法を導入した。予測セグメント化問題は、データからの第１の抽出予測パターン（論理積）に基づいて公式化され、次いで、パターンをセグメントに最適に配分する。セグメントは、以前の挙動およびエネルギー公益事業者におけるマーケティング研究を使用して定義された。最適配分は、線形制約を伴う一般化（最大−最小）線形分数整数計画を解くように公式化される。本計画を解くために、効率的２分探索アルゴリズムが、使用された。本方法は、大規模な米国のエネルギー公益事業者の約百万人の電気消費者の母集団内で最適予測セグメントを識別するために使用された。消費者の最適サブセット（その特性が、サービス提供する消費者のタイプについての公益事業者の一般的仮説と整合し、全体的母集団内の約５％の登録率の少なくとも２倍登録した）が、識別された。これらのセグメントは、公益事業者が、適切なメッセージを生成し得、かつ標的化することがより有効かつ経済的である、消費者を表す。

上記の開示では、本明細書の一部を形成し、本開示が実践され得る具体的実装が例証として示される付随の図面を参照した。本開示の範囲から逸脱することなく、他の実装が、利用されてもよく、構造変更が、行われてもよいことを理解されたい。明細書における「一実施形態」、「ある実施形態」、「ある例示的実施形態」等の言及は、説明される実施形態が、特定の特徴、構造、または特性を含み得るが、全ての実施形態が、必ずしも、特定の特徴、構造、または特性を含まない場合もあることを示す。さらに、そのような語句は、必ずしも、同一実施形態を参照するわけではない。さらに、特定の特徴、構造、または特性が、ある実施形態に関連して説明されるとき、明示的に説明されるかどうかにかかわらず、他の実施形態に関連してそのような特徴、構造、または特性に影響を及ぼすことは、当業者の知識内であることが思量される。

本明細書に開示されるシステム、デバイス、および方法の実装は、例えば、本明細書に議論されるように、１つまたはそれを上回るプロセッサおよびシステムメモリ等、コンピュータハードウェアを含む、特殊目的または汎用コンピュータを備える、または利用してもよい。本開示の範囲内の実装はまた、コンピュータ実行可能命令および／またはデータ構造を搬送または記憶するための物理的および他のコンピュータ可読媒体を含んでもよい。そのようなコンピュータ可読媒体は、汎用または特殊目的コンピュータシステムによってアクセスされ得る、任意の利用可能な媒体であることができる。コンピュータ実行可能命令を記憶するコンピュータ可読媒体は、コンピュータ記憶媒体（デバイス）である。コンピュータ実行可能命令を搬送するコンピュータ可読媒体は、伝送媒体である。したがって、一例として、限定ではなく、本開示の実装は、少なくとも２つの別々に異なる種類のコンピュータ可読媒体、すなわち、コンピュータ記憶媒体（デバイス）および伝送媒体を備えることができる。

コンピュータ記憶媒体（デバイス）は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭ、ソリッドステートドライブ（「ＳＳＤ」）（例えば、ＲＡＭに基づく）、フラッシュメモリ、相変化メモリ（「ＰＣＭ」）、他のタイプのメモリ、他の光ディスク記憶装置、磁気ディスク記憶装置または他の磁気記憶デバイス、またはコンピュータ実行可能命令またはデータ構造の形態で所望のプログラムコード手段を記憶するために使用され得、汎用または特殊目的コンピュータによってアクセスされ得る、任意の他の媒体を含む。

本明細書に開示されるデバイス、システム、および方法の実装は、コンピュータネットワークを経由して通信してもよい。「ネットワーク」は、コンピュータシステムおよび／またはモジュールおよび／または他の電子デバイス間で電子データをトランスポート可能な１つまたはそれを上回るデータリンクとして定義される。情報が、ネットワークまたは別の通信接続（有線、無線、または有線または無線の組み合わせのいずれか）を経由して、コンピュータに転送または提供されるとき、コンピュータは、接続を適切に伝送媒体と見なす。伝送媒体は、コンピュータ実行可能命令またはデータ構造の形態で所望のプログラムコード手段を搬送するために使用され得、汎用または特殊目的コンピュータによってアクセスされ得る、ネットワークおよび／またはデータリンクを含むことができる。上記の組み合わせもまた、コンピュータ可読媒体の範囲内に含まれるべきである。

コンピュータ実行可能命令は、例えば、プロセッサにおいて実行されると、汎用コンピュータ、特殊目的コンピュータ、または特殊目的処理デバイスに、ある機能または機能群を行わせる、命令およびデータを備える。コンピュータ実行可能命令は、例えば、バイナリ、アセンブリ言語等の中間フォーマット命令、またはさらにソースコードであってもよい。本主題は、構造特徴および／または方法論的作用に特有の言語で説明されているが、添付の請求項に定義される主題は、必ずしも、上述の説明された特徴または作用に限定されないことを理解されたい。むしろ、説明された特徴および作用は、請求項を実装するための例示的形態として開示される。

当業者は、本開示が、ダッシュボード内車両コンピュータ、パーソナルコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、メッセージプロセッサ、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースまたはプログラマブル消費者電子機器、ネットワークＰＣ、ミニコンピュータ、メインフレームコンピュータ、携帯電話、ＰＤＡ、タブレット、ポケベル、ルータ、スイッチ、種々の記憶デバイス、および同等物を含む、多くのタイプのコンピュータシステム構成を伴う、ネットワークコンピューティング環境内で実践されてもよいことを理解されるであろう。本開示はまた、分散型システム環境内で実践されてもよく、ネットワークを通してリンクされた（有線データリンク、無線データリンク、または有線および無線データリンクの組み合わせのいずれかによって）ローカルおよび遠隔コンピュータシステムの両方が、タスクを行う。分散型システム環境では、プログラムモジュールは、ローカルメモリ記憶デバイスおよび遠隔メモリ記憶デバイスの両方内に位置してもよい。

さらに、必要に応じて、本明細書に説明される機能は、ハードウェア、ソフトウェア、ファームウェア、デジタルコンポーネント、またはアナログコンポーネントのうちの１つまたはそれを上回るものにおいて行われることができる。例えば、１つまたはそれを上回る特定用途向け集積回路（ＡＳＩＣ）が、本明細書に説明されるシステムおよびプロシージャのうちの１つまたはそれを上回るものを実施するようにプログラムされることができる。ある用語が、特定のシステムコンポーネントを指すために説明および請求項全体を通して使用される。当業者が理解するように、コンポーネントは、異なる名称によって称されてもよい。本書は、名称が異なるが機能は異ならないコンポーネントの間で区別することを意図するものではない。

上記で議論されるセンサ実施形態は、その機能の少なくとも一部を行うために、コンピュータハードウェア、ソフトウェア、ファームウェア、または任意のそれらの組み合わせを備えてもよいことに留意されたい。例えば、センサは、１つまたはそれを上回るプロセッサ内で実行されるように構成される、コンピュータコードを含んでもよく、コンピュータコードによって制御されるハードウェア論理／電気回路を含んでもよい。これらの例示的デバイスは、例証目的で本明細書に提供され、限定することを意図するものではない。本開示の実施形態は、当業者に公知となるであろう、さらなるタイプのデバイス内に実装されてもよい。

本開示の少なくともいくつかの実施形態は、任意のコンピュータ使用可能媒体上に記憶されるそのような論理を備える（例えば、ソフトウェアの形態で）、コンピュータプログラム製品を対象とする。そのようなソフトウェアは、１つまたはそれを上回るデータ処理デバイス内で実行されると、デバイスを本明細書に説明されるように動作させる。

本開示の種々の実施形態が、上記に説明されたが、一例としてのみ提示され、限定ではないことを理解されたい。形態および詳細における種々の変更が、本開示の精神および範囲から逸脱することなく、その中で行われることができることは、当業者に明白となるであろう。したがって、本開示の範疇および範囲は、上記の例示的実施形態のいずれかによって限定されるべきではなく、以下の請求項およびその均等物に従ってのみ定義されるべきである。上記の説明は、例証および説明目的のために提示されている。これは、包括的であること、または本開示を開示される通りの形態に限定することを意図するものではない。多くの修正および変形例は、上記の教示に照らして、可能性として考えられる。さらに、上記の代替実装のいずれかまたは全ては、本開示の付加的ハイブリッド実装を形成するために所望される、任意の組み合わせで使用されてもよいことに留意されたい。

本発明は、その精神または不可欠な特性から逸脱することなく、他の具体的形態で具現化さてもよい。説明される実施形態は、全ての観点において、例証のみと見なされ、制限するものではない。本発明の範囲は、したがって、上記の説明によってではなく、添付の請求項によって示される。請求項の均等物の意味および範囲内の全ての変更は、その範囲内に包含されるものとする。

以下の参考文献は、参照することによってその全体として本明細書に組み込まれる。

Claims

複数のエネルギー顧客をセグメント化するための方法であって、
（ａ）複数の顧客パターンを判定することであって、各顧客パターンは、前記顧客パターンと関連付けられた複数の顧客属性を満たす前記複数のエネルギー顧客のサブセットを含み、前記サブセットは、（ｉ）少なくとも閾値量の前記複数のエネルギーの顧客を含み、（ｉｉ）前記複数の顧客パターンのうちの他の顧客パターンとの最大で閾値レベルの重複を有する、ことと、
（ｂ）２分探索アルゴリズムに従って、前記複数の顧客パターンを複数のセグメントに割り当てることであって、前記２分探索アルゴリズムは、前記複数のセグメントの最小有効度を最大限にし、前記セグメントの有効度は、前記セグメントと関連付けられたエネルギー効率プログラムの正の採択ステータスを有する前記セグメントに割り当てられた前記パターン内の前記複数のエネルギー顧客の量の尺度であり、前記複数のセグメントの前記最小有効度は、前記エネルギー効率プログラムに対する前記複数のエネルギー顧客全体としての有効度よりも大きい、ことと
を含む方法。
前記複数のセグメントは、高消費者セグメント、コスト優先的セグメント、住宅改良希望者セグメント、環境保護提唱者セグメント、および文化的誘因セグメントを含む、請求項１に記載の方法。
前記複数のセグメントは、専門知識に基づいて判定される、請求項１に記載の方法。
前記複数の顧客属性は、１つまたは複数の住宅価値メトリックを含む、請求項１に記載の方法。
前記１つまたは複数の住宅価値メトリックは、住宅価値、利用可能な所有権、または、融資比率を含む、請求項１に記載の方法。
前記複数の顧客属性は、１つまたは複数のエネルギー消費メトリックを含む、請求項１に記載の方法。
（ｂ）は、前記２分探索アルゴリズムを使用して実行可能性問題を反復的に解くことを含む、請求項１に記載の方法。
前記実行可能性問題は、線形分数整数計画である、請求項７に記載の方法。
（ｂ）は、各セグメントの有効度がほぼ等しいように、前記複数のセグメント間で前記パターンを最適に分布させることを含む、請求項１に記載の方法。
前記最小有効度は、前記エネルギー効率プログラムに対する前記複数のエネルギー顧客全体としての有効度の少なくとも３倍である、請求項１に記載の方法。
各セグメントに関連付けられた前記エネルギー効率プログラムは、同一である、請求項１に記載の方法。
カスタマイズされた通信を各セグメントに伝送することをさらに含む、請求項１に記載の方法。
前記複数のセグメントの各セグメントは、最小有効度を有する、請求項１に記載の方法。
（ａ）は、前記複数の顧客パターンを判定するためにランダムフォレストアルゴリズムを使用することを含む、請求項１に記載の方法。
前記複数の顧客属性は、１つまたは複数の社会人口統計メトリックを含む、請求項１に記載の方法。
前記１つまたは複数の社会人口統計メトリックは、世帯所得メトリックまたは教育メトリックを含む、請求項１に記載の方法。