JP2016110289A - Abnormality extraction device, abnormality extraction method, and program - Google Patents
Abnormality extraction device, abnormality extraction method, and program Download PDFInfo
- Publication number
- JP2016110289A JP2016110289A JP2014245174A JP2014245174A JP2016110289A JP 2016110289 A JP2016110289 A JP 2016110289A JP 2014245174 A JP2014245174 A JP 2014245174A JP 2014245174 A JP2014245174 A JP 2014245174A JP 2016110289 A JP2016110289 A JP 2016110289A
- Authority
- JP
- Japan
- Prior art keywords
- contract
- period
- churn
- unit
- estimated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、異常抽出装置、方法、プログラムに係り、特に、契約の解約の実績を把握する異常抽出装置、方法、プログラムに関する。 The present invention relates to an abnormality extraction device, method, and program, and more particularly, to an abnormality extraction device, method, and program for grasping a contract cancellation record.
従来技術として、ARIMAモデルやカルマンフィルター等の、時系列分析技術による異常抽出が存在する。 As a conventional technique, there is anomaly extraction by a time series analysis technique such as an ARIMA model or a Kalman filter.
また、混合ワイブルモデルや、カプラン・マイヤー法等の、生存時間分析技術による異常抽出が存在する。 In addition, there are abnormal extractions using survival time analysis techniques such as the mixed Weibull model and the Kaplan-Meier method.
従来技術においては、時系列における季節性、生存時間における周期性等による解約リスク増と、特定属性群における局所的な解約リスク増を分離できないという問題がある。 In the prior art, there is a problem that an increase in churn risk due to seasonality in time series, periodicity in survival time, and local churn risk increase in a specific attribute group cannot be separated.
また、生存時間解析技術を応用して、上記課題を解決する場合、抽出されたものが局所異常なのか、前提とした分布が間違っているのかを区別が困難であるため、パラメトリックな分布前提を置く手法は利用できないという問題がある。 In addition, when applying the survival analysis technique to solve the above problem, it is difficult to distinguish whether the extracted one is a local anomaly or the assumed distribution is wrong. There is a problem that the placing method cannot be used.
本発明では、上記問題点を解決するために成されたものであり、生存時間の周期性と時系列の周期性を考慮した異常抽出をする異常抽出装置、方法、プログラムを提供することを目的とする。 In the present invention, an object of the present invention is to provide an anomaly extraction apparatus, method, and program for extracting an anomaly in consideration of the periodicity of the survival time and the periodicity of the time series. And
上記目的を達成するために、第1の発明の異常抽出装置は、入力された、複数のユーザの各々についての前記ユーザの契約及び解約に関する情報と、前記複数のユーザの各々についての前記ユーザの属性に関する情報とを含む契約履歴情報に基づいて、前記契約の契約期間、及び前記契約を解約した、所定期間を単位とする時系列の周期の単位の組み合わせの各々についての、前記周期の単位に前記契約期間の契約が解約された周期・期間解約率と、前記契約の契約時期の各々についての、前記契約時期の契約が解約された時期解約率と、を推定する生存関数推定部と、前記契約履歴情報から取得される、指定された属性のユーザが、前記契約の契約時期の各々に契約した契約数と、前記生存関数推定部により推定された周期・期間解約率及び時期解約率と、に基づいて、前記指定された属性のユーザが時期の各々に解約する解約数を推定する解約数推定部と、前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記解約数推定部により推定された、前記時期の各々の前記解約数と、に基づいて、解約数が異常となる時期を抽出する異常抽出部と、を含んで構成されている。 In order to achieve the above object, the abnormality extraction device according to the first aspect of the present invention is the input information on the contract and cancellation of the user for each of the plurality of users, and the user's information for each of the plurality of users. Based on the contract history information including attribute information, the contract period of the contract and the unit of the period for each combination of the units of the time-series period with the predetermined period as a unit, which has been canceled. A survival function estimation unit for estimating a period / period churn rate at which the contract of the contract period is terminated and a period churn rate at which the contract at the contract period is terminated for each of the contract periods of the contract; and The number of contracts that the user with the specified attribute acquired from the contract history information contracts with each of the contract periods of the contract, and the period / period churn rate estimated by the survival function estimation unit and A churn number estimation unit that estimates the number of churns that the user of the designated attribute churns at each of the times based on the period churn rate, and the user of the designated attribute that is acquired from the contract history information An abnormal extraction unit that extracts a period when the churn number becomes abnormal based on the churn number canceled at each of the periods and the churn number of each of the periods estimated by the churn number estimation unit; , Including.
第2の発明の異常抽出方法は、生存関数推定部と、解約数推定部と、異常抽出部と、を含む異常抽出装置における、異常抽出方法であって、前記生存関数推定部は、入力された、複数のユーザの各々についての前記ユーザの契約及び解約に関する情報と、前記複数のユーザの各々についての前記ユーザの属性に関する情報とを含む契約履歴情報に基づいて、前記契約の契約期間、及び前記契約を解約した、所定期間を単位とする時系列の周期の単位の組み合わせの各々についての、前記周期の単位に前記契約期間の契約が解約された周期・期間解約率と、前記契約の契約時期の各々についての、前記契約時期の契約が解約された時期解約率と、を推定し、前記解約数推定部は、前記契約履歴情報から取得される、指定された属性のユーザが、前記契約の契約時期の各々に契約した契約数と、前記生存関数推定部により推定された周期・期間解約率及び時期解約率と、に基づいて、前記指定された属性のユーザが時期の各々に解約する解約数を推定し、前記異常抽出部は、前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記解約数推定部により推定された、前記時期の各々の前記解約数と、に基づいて、解約数が異常となる時期を抽出する。 The abnormality extraction method of the second invention is an abnormality extraction method in an abnormality extraction device including a survival function estimation unit, a churn number estimation unit, and an abnormality extraction unit, wherein the survival function estimation unit is input A contract period of the contract based on contract history information including information on the contract and cancellation of the user for each of a plurality of users, and information on the attributes of the user for each of the plurality of users; and The period / period cancellation rate at which the contract of the contract period is canceled in the period unit, and the contract of the contract, for each combination of time-series period units with a predetermined period as a unit after the contract is canceled For each of the periods, the contract cancellation rate of the contract period is estimated, and the cancellation number estimation unit is obtained from the contract history information. Based on the number of contracts contracted for each contract period of the contract and the period / period churn rate and period churn rate estimated by the survival function estimation unit, the user of the specified attribute is assigned to each period. The number of cancellations to be canceled is estimated, and the abnormality extraction unit is acquired from the contract history information, and is estimated by the number of cancellations that the user with the specified attribute has canceled at each of the times, and the cancellation number estimation unit. In addition, the time when the number of cancellations becomes abnormal is extracted based on the number of cancellations at each time period.
第1及び第2の発明によれば、生存関数推定部により、入力された、複数のユーザの各々についての契約履歴情報に基づいて、契約の契約期間、及び契約を解約した、時系列の周期の単位の組み合わせの各々についての、周期・期間解約率と、時期解約率と、を推定し、解約数推定部により、契約履歴情報から取得される、指定された属性のユーザが、契約の契約時期の各々に契約した契約数と、推定された周期・期間解約率及び時期解約率と、に基づいて、指定された属性のユーザが時期の各々に解約する解約数を推定し、異常抽出部により、契約履歴情報から取得される、指定された属性のユーザが時期の各々に解約した解約数と、推定された、時期の各々の解約数と、に基づいて、解約数が異常となる時期を抽出する。 According to the first and second inventions, the contract period of the contract and the time-series cycle in which the contract is canceled based on the contract history information for each of the plurality of users input by the survival function estimation unit For each combination of units, the period / period churn rate and the period churn rate are estimated, and the churn number estimation unit obtains the contract with the specified attribute acquired from the contract history information. Based on the number of contracts contracted for each period, the estimated period / period churn rate and the period churn rate, the number of churns that the user with the specified attribute cancels for each period is estimated, and an anomaly extraction unit When the number of churns becomes abnormal on the basis of the number of churns that the user with the specified attribute cancels at each time and the estimated number of churns for each time obtained from the contract history information To extract.
このように、入力された、複数のユーザの各々についての契約履歴情報に基づいて、契約の契約期間、及び契約を解約した、時系列の周期の単位の組み合わせの各々についての、周期・期間解約率と、時期解約率と、を推定し、契約履歴情報から取得される、指定された属性のユーザが、契約の契約時期の各々に契約した契約数と、推定された周期・期間解約率及び時期解約率と、に基づいて、指定された属性のユーザが時期の各々に解約する解約数を推定し、契約履歴情報から取得される、指定された属性のユーザが時期の各々に解約した解約数と、推定された、時期の各々の解約数と、に基づいて、解約数が異常となる時期を抽出することにより、生存時間の周期性と時系列の周期性を考慮した異常抽出をすることができる。 As described above, based on the entered contract history information for each of the plurality of users, the contract period of the contract, and the period / period cancellation for each of the combinations of the units of the time-series period that canceled the contract. Estimate the rate and the period churn rate, and the number of contracts that the user with the specified attribute that is acquired from the contract history information contracts at each of the contract timings of the contract, the estimated period / period churn rate and Based on the churn rate, the number of churns that users with the specified attribute churn at each time period is estimated, and the churns that the user with the specified attribute churn at each time period are obtained from the contract history information. By extracting the period when the churn number becomes abnormal based on the number and the estimated churn number of each period, abnormal extraction considering the periodicity of the survival time and the periodicity of the time series is performed. be able to.
また、第1及び第2の発明においては、前記異常抽出部は、前記推定された前記時期の各々の解約数に基づいて、解約数の推定値の信頼区間を推定し、前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記推定された解約数の推定値の信頼区間と、に基づいて、解約数が、前記信頼区間に属さない時期を、解約数が異常となる時期として抽出してもよい。 In the first and second aspects of the invention, the abnormality extraction unit estimates a confidence interval of the estimated value of the churn number based on the estimated churn number at each of the estimated times, and determines from the contract history information Based on the obtained churn number that the user of the specified attribute churns at each of the times and the confidence interval of the estimated value of the estimated churn number, the churn number belongs to the confidence interval. The period when there is no cancellation may be extracted as the period when the number of cancellations becomes abnormal.
また、第1及び第2の発明においては、前記生存関数推定部は、前記契約の契約期間、及び前記契約を解約した前記周期の単位の組み合わせの各々について推定した、前記周期の単位に前記契約期間の契約が解約された周期・期間解約率に対して、前記契約期間の方向に平滑化する平滑化処理をおこなうことにより、前記周期・期間解約率を推定してもよい。 In the first and second aspects of the invention, the survival function estimation unit estimates the contract in the unit of the period estimated for each of the contract period of the contract and the combination of the units of the period in which the contract is canceled. The period / period churn rate may be estimated by performing a smoothing process for smoothing in the direction of the contract period with respect to the period / period churn rate at which the contract of the period is canceled.
また、本発明のプログラムは、コンピュータを、上記の異常抽出装置を構成する各部として機能させるためのプログラムである。 Moreover, the program of this invention is a program for functioning a computer as each part which comprises said abnormality extraction apparatus.
以上説明したように、本発明の異常抽出装置、方法、及びプログラムによれば、入力された、複数のユーザの各々についての契約履歴情報に基づいて、契約の契約期間、及び契約を解約した、時系列の周期の単位の組み合わせの各々についての、周期・期間解約率と、時期解約率と、を推定し、契約履歴情報から取得される、指定された属性のユーザが、契約の契約時期の各々に契約した契約数と、推定された周期・期間解約率及び時期解約率と、に基づいて、指定された属性のユーザが時期の各々に解約する解約数を推定し、契約履歴情報から取得される、指定された属性のユーザが時期の各々に解約した解約数と、推定された、時期の各々の解約数と、に基づいて、解約数が異常となる時期を抽出することにより、生存時間の周期性と時系列の周期性を考慮した異常抽出をすることができる。 As described above, according to the abnormality extraction device, method, and program of the present invention, the contract period of the contract and the contract are canceled based on the input contract history information for each of the plurality of users. Estimate the period / period churn rate and period churn rate for each combination of time-series cycle units, and the user with the specified attribute obtained from the contract history information Based on the number of contracts contracted with each, the estimated period / period churn rate and period churn rate, the number of churns that the user with the specified attribute cancels at each period is estimated and obtained from the contract history information By extracting the period when the churn number becomes abnormal based on the number of churns that the user with the specified attribute quits at each period and the estimated number of churns at each period Time periodicity and time It can be an abnormality extracted in consideration of the periodicity of the column.
以下、図面を参照して本発明の実施の形態を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
<本実施の形態の原理> <Principle of this embodiment>
本実施の形態の原理について説明する。図1に示すように、まず、全国の契約/解約情報から、マクロの生存関数を時系列の周期の単位ごとに求める。次に、属性である地域毎の契約数推移とマクロの生存関数を元に解約者推定値を求める。そして、地域aの解約者推移と解約者推定値とを比較して、乖離が生じている時期を抽出する。 The principle of this embodiment will be described. As shown in FIG. 1, first, a macro survival function is obtained for each unit of a time-series period from nationwide contract / cancellation information. Next, the churn person estimated value is obtained based on the transition of the number of contracts for each region and the macro survival function. Then, the churn person transition of the region a and the churn person estimated value are compared, and the time when the divergence occurs is extracted.
<本発明の実施の形態に係る異常抽出装置の構成>
次に、本発明の実施の形態に係る異常抽出装置の構成について説明する。図2に示すように、本発明の実施の形態に係る異常抽出装置100は、CPUと、RAMと、後述する異常抽出処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この異常抽出装置は、機能的には図2に示すように入力部10と、演算部20と、出力部90とを含んで構成されている。
<Configuration of Abnormality Extraction Device According to Embodiment of the Present Invention>
Next, the configuration of the abnormality extraction device according to the embodiment of the present invention will be described. As shown in FIG. 2, the abnormality extraction device 100 according to the embodiment of the present invention includes a CPU, a RAM, and a ROM that stores a program and various data for executing an abnormality extraction processing routine described later. It can consist of computers. As shown in FIG. 2, this abnormality extraction device is functionally configured to include an input unit 10, a calculation unit 20, and an output unit 90.
入力部10は、契約履歴情報を受け付け契約履歴記憶部22に記憶する。ここで、契約履歴情報とは、例えば、図3に示す契約履歴情報を取得し始めた観測開始日の情報と、例えば、図4に示す契約履歴情報の取得を終了した観測終了日の情報と、図5に示す契約毎の、契約者の顧客ID、契約者の住所コード、契約日、解約日、及び契約状態の組み合わせからなる契約情報と、年月日と周期の単位との対応関係(図示省略)と、を含むものとする。なお、時系列の周期の単位は、所定期間であり、本実施の形態においては、周期の単位を、暦の月とし、取り得る値は、1月〜12月とする。また、観測開始日に対応する時期をtstrとし、観測終了日に対応する時期をtendとする。 The input unit 10 receives the contract history information and stores it in the contract history storage unit 22. Here, the contract history information is, for example, information on the observation start date when the contract history information shown in FIG. 3 is acquired, and information on the observation end date when the acquisition of the contract history information shown in FIG. 5, for each contract shown in FIG. 5, the contract information consisting of a combination of the contractor's customer ID, the contractor's address code, the contract date, the cancellation date, and the contract status, and the correspondence relationship between the date and the cycle unit ( (Not shown). The unit of the time-series period is a predetermined period. In this embodiment, the unit of the period is a calendar month, and the possible values are January to December. Also, the time corresponding to the observation start date is set to t str and the time corresponding to the observation end date is set to t end .
演算部20は、契約履歴記憶部22と、生存関数推定部24と、解約数推定部26と、異常抽出部28と、を含んで構成されている。 The calculation unit 20 includes a contract history storage unit 22, a survival function estimation unit 24, a churn number estimation unit 26, and an abnormality extraction unit 28.
契約履歴記憶部22には、入力部10において受け付けた契約履歴情報が記憶されている。 The contract history storage unit 22 stores the contract history information received by the input unit 10.
生存関数推定部24は、契約履歴記憶部22に記憶されている契約履歴情報に基づいて、周期s毎のマクロの生存関数である周期・期間解約率、及び契約時期t毎の観測終了時点での契約の解約率である時期解約率H(t)を取得する。周期・期間解約率の例を図6に示し、時期解約率H(t)の例を図7に示す。なお、時期の単位は1ヵ月とする。 Based on the contract history information stored in the contract history storage unit 22, the survival function estimation unit 24 performs the period / period churn rate, which is a macro survival function for each cycle s, and the observation end time for each contract time t. The term churn rate H (t), which is the churn rate of the contract, is acquired. An example of the period / period churn rate is shown in FIG. 6, and an example of the timing churn rate H (t) is shown in FIG. The unit of time is one month.
まず、周期・期間解約率の取得について説明する。具体的には、始めに、契約履歴情報に含まれる契約状態の情報に基づいて、観測終了日における全解約数Nを取得する。 First, the acquisition of the period / period churn rate will be described. Specifically, first, based on the contract state information included in the contract history information, the total number of cancellations N on the observation end date is acquired.
次に、契約履歴情報に含まれる契約情報に対応する契約の各々について、当該契約の契約情報に含まれる、契約状態の情報から、当該契約が観測終了日において解約されているか否かを判定する。ここで、当該契約が観測終了日において解約されていると判定された場合には、当該契約の契約情報に含まれる、契約日と解約日との情報から、当該契約の契約期間x、及び当該解約日に対応する周期sを取得する。なお、契約が観測終了日において解約されているか否かを判定する際に、解約されている契約の数をカウントし、全解約数Nとする。 Next, for each of the contracts corresponding to the contract information included in the contract history information, it is determined from the contract status information included in the contract information of the contract whether or not the contract has been canceled on the observation end date. . Here, when it is determined that the contract has been canceled on the observation end date, the contract period x of the contract and the contract period x and the contract date are included in the contract information of the contract. The period s corresponding to the cancellation date is acquired. Note that when determining whether or not the contract has been canceled on the observation end date, the number of contracts that have been canceled is counted, and the total number of cancellations N.
次に、観測終了日において解約されている契約の各々について取得された、当該契約の契約期間xと、当該契約が解約された周期sとに基づいて、全ての契約期間xと周期sとの組み合わせ毎に、契約期間xで周期sに解約した数nxsを取得する。ここで、xは、1〜Xの値の各々をとり、sは、1〜12の値の各々をとる。 Next, based on the contract period x of the contract and the period s at which the contract is canceled, acquired for each contract canceled on the observation end date, all contract periods x and periods s For each combination, the number nxs canceled in the period s in the contract period x is acquired. Here, x takes each of the values 1 to X, and s takes each of the values 1 to 12.
次に、取得された全解約数Nと、全ての契約期間xと周期sとの組み合わせについて取得された契約期間xで周期sに解約した数nxsの各々とに基づいて、下記(1)式に従って、周期・期間解約率P(x,s)を取得する。そして、全ての契約期間xと周期sとの組み合わせの各々について、取得された周期・期間解約率P(x,s)を契約期間であるx軸方向に平滑化する平滑化処理(移動平均の他、手法は問わない)を行い、ノイズを除去したものを、最終的な周期・期間解約率P(x,s)として取得する。このようにすることにより、マクロの生存関数を周期別にノンパラメトリック推定で作成することができる。 Next, based on the acquired total number N of cancellations and each of the numbers nxs canceled in the period s in the contract period x acquired for all combinations of the contract period x and the period s, the following (1) The period / period churn rate P (x, s) is acquired according to the equation. Then, for each of the combinations of all contract periods x and periods s, a smoothing process (moving average of the average period / period churn rate P (x, s)) is smoothed in the x-axis direction as the contract period. Any other method may be used to obtain the final period / period churn rate P (x, s) from which noise has been removed. In this way, a macro survival function can be created by non-parametric estimation for each period.
次に、時期解約率H(t)の取得について説明する。まず、契約履歴情報に含まれる契約情報に基づいて、時期t(t=tstr〜tend)毎に、当該時期tに、契約日が該当する、時期tに契約した契約数mtを取得する。次に、観測終了日において解約されていると判定された契約の各々の契約情報に基づいて、時期t(t=tstr〜tend)毎に、当該時期tに、契約日が該当し、既に解約している数ntを取得する。次に、取得した時期tに契約した契約数mtと、時期tに契約し、既に解約している数ntとに基づいて、下記(2)式に従って、時期解約率H(t)を取得する。 Next, acquisition of the time lapse rate H (t) will be described. First, based on the contract information included in the contract history information, for each time t (t = t str ~t end ), get to the time t, contract date corresponds, subscriptions m t contracted at a time t To do. Next, based on the contract information of each contract determined to be canceled on the observation end date, the contract date corresponds to the time t for each time t (t = t str to t end ), The number n t that has already been canceled is acquired. Next, the number of contracts m t contracted in t time acquired, contract the time t, already on the basis of the number n t are canceled, according to the following equation (2), timing churn H a (t) get.
解約数推定部26は、契約履歴記憶部22に記憶されている契約履歴情報と、生存関数推定部において取得した、周期・期間解約率P(x,s)及び、時期解約率H(t)と、に基づいて、推定対象として指定された地域aの各々についての時期t毎の解約数推定値^Na(t)を算出する。なお、記号の前に「^」が付与されている記号は、当該記号の値が推定値であることを表す。 The churn number estimation unit 26, the contract history information stored in the contract history storage unit 22, the period / period churn rate P (x, s) and the timing churn rate H (t) acquired by the survival function estimation unit. Based on the above, the churn number estimated value ^ N a (t) at each time t for each of the areas a designated as the estimation target is calculated. A symbol with “^” in front of the symbol indicates that the value of the symbol is an estimated value.
具体的には、まず、契約履歴記憶部22に記憶されている契約履歴情報に含まれる契約の契約情報の各々に基づいて、属性である地域a毎に属する契約の各々を分類する。本実施の形態においては、住所コードが同一である契約の各々を同一の地域に属する契約とする。次に、指定された地域の中から、処理対象となる地域aを決定する。次に、処理対象となる地域aに属する契約の各々の当該契約の契約情報に含まれる契約日の情報の各々に基づいて、地域aにおける時期t毎の契約数matを取得する。次に、取得した地域aにおける時期t毎の契約数matと、生存関数推定部において取得した、周期・期間解約率P(x,s)、及び時期解約率H(t)とに基づいて、下記(3)式に従って、地域aの時期t毎の解約数推定値^Na(t)を算出する。なお、tは、tstr〜tendの値をとる。ここで、地域aの時期t毎の解約数推定値^Na(t)について説明すると、例えば、2012年12月の契約者のうち2013年1月に解約する解約者数は、(契約期間1ヵ月の契約者が1月に解約する周期・期間解約率P(1ヵ月,1月))×(2012年12月の契約者の解約率H(2012年12月))×(2012年12月の契約数mt)の積算により求まる。これを、観測開始月から、2012年12月(2013年1月の1時期前)までの総和をとったものが、2013年1月の解約数推定値となる。このように、マクロの生存関数を地域の契約数推移に当てはめることにより、解約数推定を求めることができる。また、図8に解約数推定値の算出する例を示す。 Specifically, first, each of the contracts belonging to each region a which is an attribute is classified based on the contract information of the contracts included in the contract history information stored in the contract history storage unit 22. In the present embodiment, it is assumed that each contract having the same address code belongs to the same area. Next, the area a to be processed is determined from the designated areas. Next, based on each information of the contract date included in the contract information of the contract of each contract belonging to the region a to be processed, and acquires the contract number m at every time t in the region a. Next, based on the number of contracts mat at each time t in the acquired area a, the period / period churn rate P (x, s), and the time churn rate H (t) acquired by the survival function estimation unit. Then, according to the following equation (3), the churn number estimated value ^ N a (t) for each time t in the region a is calculated. Note that t takes a value of t str to t end . Here, the estimated churn number estimated value ^ N a (t) for each period t in the region a will be described. For example, among the contractors in December 2012, the number of churners to be canceled in January 2013 is (contract period). Cycle / period churn rate P (1 month, January) for 1 month contractor cancels in January x (contractor churn rate H in December 2012 (December 2012)) x (2012 12 It is obtained by integrating the number of monthly contracts m t ). The sum of the period from the observation start month to December 2012 (one period before January 2013) is the estimated churn number estimate for January 2013. Thus, the churn number estimation can be obtained by applying the macro survival function to the number of contracts in the region. FIG. 8 shows an example of calculating the churn number estimated value.
解約数推定部26は、上記処理を、指定された全ての地域aについて行う事により、地域aの各々について、時期t毎の解約数推定値^Na(t)を算出する。 The churn number estimation unit 26 calculates the churn number estimated value ^ N a (t) for each time period t for each of the areas a by performing the above processing for all the specified areas a.
異常抽出部28は、解約数推定部26において取得した地域aの各々についての時期t毎の解約数推定値^Na(t)に基づいて、当該地域aの時期t毎の解約数推定値の信頼区間(^Na,min(t)〜^Na,max(t))を算出する。具体的には、取得した地域aの時期t毎の解約数推定値^Na(t)の信頼区間(上限を^Na,max(t)、下限を^Na,min(t)とする。)を、取得した地域aの時期t毎の解約数推定値^Na(t)に基づいて、下記(4)式、及び下記(5)式に従って算出する。 Based on the churn number estimation value ^ N a (t) for each time period t for each region a acquired by the churn number estimation unit 26, the abnormality extraction unit 28 calculates the churn number estimation value for each time period t of the region a. Confidence intervals (^ N a, min (t) to ^ N a, max (t)) are calculated. Specifically, the obtained confidence interval (the upper limit ^ N a cancellation by the estimated value for each time t of the region a ^ N a (t), max (t), the lower limit ^ N a, and min (t) Is calculated according to the following formula (4) and the following formula (5) based on the estimated churn number estimated value ^ N a (t) for each time t in the area a.
なお、異常抽出部28は、上記処理を、指定された全ての地域aについて行う事により、地域aの各々について、時期t毎に、解約数推定値^Na(t)の信頼区間(^Na,min(t)〜^Na,max(t))を算出する。 Incidentally, abnormality extraction unit 28, the above process, by performing the all regions a specified, for each of the areas a, for each time t, churn estimate ^ N a (t) of the confidence interval (^ N a, min (t) to ^ N a, max (t)) are calculated.
また、異常抽出部28は、契約履歴記憶部22に記憶されている契約履歴情報と、解約数推定部26により地域aの各々について取得した時期t毎の解約数推定値^Na(t)と、地域aの各々について取得した時期t毎の解約数推定値^Na(t)の信頼区間と、に基づいて、指定された地域aの各々について、実績値と推定値とに乖離が生じていることを表す時期t毎のAnoa(t)を算出する。また、異常抽出部28は、地域aの各々について取得した、時期t毎のAnoa(t)の値に基づいて、実績値と推定値との乖離を表すグラフ、及び表を作成し、出力部90に出力する。 In addition, the abnormality extraction unit 28 includes the contract history information stored in the contract history storage unit 22 and the churn number estimated value ^ N a (t) for each time t acquired for each area a by the churn number estimation unit 26. And the confidence interval of the estimated churn number estimated value ^ N a (t) for each period t acquired for each region a, there is a discrepancy between the actual value and the estimated value for each designated region a. Ano a (t) is calculated for each time t indicating the occurrence. Moreover, the abnormality extraction part 28 produces the graph and table showing the deviation of an actual value and an estimated value based on the value of Ano a (t) for every time t acquired about each area a, and outputs it. Output to the unit 90.
なお、異常値Anoa(t)の値が0である場合には、当該値は異常値として扱わない。また、出力例を図9及び図10に示す。なお、図9は、異常値Anoa(t)を表出力し、異常度合いに応じてマスの色を変更して出力した例を示す。また、図10は、実際の解約数(actual)と解約数推定値の信頼区間の上限値(max_line)と解約数推定値の信頼区間の下限値(min_line)とをグラフ出力した例を示す。また、tの取り得る値は、tstr〜tendとする。 When the value of the abnormal value Ano a (t) is 0, the value is not treated as an abnormal value. Also, output examples are shown in FIGS. FIG. 9 shows an example in which the abnormal value Ano a (t) is output in a table, and the square color is changed according to the degree of abnormality. FIG. 10 shows an example in which the actual churn number (actual), the upper limit value (max_line) of the confidence interval of the churn number estimated value, and the lower limit value (min_line) of the confidence interval of the churn number estimated value are output as a graph. Further, the possible values of t are t str to t end .
具体的には、まず、指定された地域の中から、処理対象となる地域aを決定する。次に、処理対象となる地域aに属する契約の各々の当該契約の契約情報に含まれる解約日の情報の各々に基づいて、地域aにおける時期t毎の解約数Na(t)を取得する。次に、取得した地域aにおける時期t毎の解約数Na(t)と、解約数推定部26により取得した地域aの時期t毎の解約数推定値^Na(t)と、取得した時期t毎の解約数推定値^Na(t)の信頼区間とに基づいて、下記(6)式に従って、tの取り得る値(tstr〜tend)の全てについて異常値Anoa(t)を算出する。このように実際の解約数と推定値との乖離を地域局所的な異常として抽出する。 Specifically, first, a region a to be processed is determined from the designated regions. Next, the number of cancellations N a (t) for each period t in the region a is acquired based on each of the cancellation date information included in the contract information of each contract belonging to the region a to be processed. . Next, the churn number N a (t) for each time t in the acquired region a, the churn number estimated value ^ N a (t) for each time t of the region a acquired by the churn number estimation unit 26, and the acquired Based on the confidence interval of the estimated churn value ^ N a (t) for each time t, according to the following equation (6), all the possible values of t (t str to t end ) are abnormal values Ano a (t ) Is calculated. In this way, the deviation between the actual number of cancellations and the estimated value is extracted as a regional local abnormality.
<本発明の実施の形態に係る異常抽出装置の作用>
次に、本実施の形態に係る異常抽出装置100の作用について説明する。まず、入力部10において契約履歴情報を受け付け契約履歴記憶部22に記憶する。次に、異常抽出装置100において、契約履歴記憶部22に記憶されている契約履歴情報を読み込むと、異常抽出装置100によって、図11に示す異常抽出処理ルーチンを実行する。
<Operation of Abnormality Extraction Device According to Embodiment of the Present Invention>
Next, the operation of the abnormality extraction device 100 according to the present embodiment will be described. First, the contract history information is received by the input unit 10 and stored in the contract history storage unit 22. Next, in the abnormality extraction device 100, when the contract history information stored in the contract history storage unit 22 is read, the abnormality extraction processing routine shown in FIG.
まず、ステップS104では、読み込んだ契約履歴情報に含まれる契約の各々のうち、処理対象となる契約を決定する。 First, in step S104, a contract to be processed is determined from each contract included in the read contract history information.
次に、ステップS106では、処理対象となる契約について、読み込んだ契約履歴情報のうち、当該契約に対応する契約情報の契約状態の情報に基づいて、当該契約が解約されているか否かを判定する。当該契約が解約されていると判定された場合には、ステップS108へ移行する。一方、当該契約が契約中と判定された場合には、ステップS114へ移行する。なお、ステップS106の処理において、解約されていると判定した回数をカウントしておき、当該カウントした値を全解約数Nとする。 Next, in step S106, it is determined whether or not the contract is canceled based on the contract status information of the contract information corresponding to the contract among the read contract history information for the contract to be processed. . If it is determined that the contract has been canceled, the process proceeds to step S108. On the other hand, if it is determined that the contract is in contract, the process proceeds to step S114. In addition, in the process of step S106, the number of times determined to have been canceled is counted, and the counted value is set as the total number of cancellations N.
次に、ステップS108では、処理対象となる契約について、読み込んだ契約履歴情報のうち、当該契約に対応する契約情報の契約日及び解約日の情報に基づいて、当該契約の契約期間xを算出する。 Next, in step S108, for the contract to be processed, the contract period x of the contract is calculated based on the contract date and cancellation date information of the contract information corresponding to the contract in the read contract history information. .
次に、ステップS110では、処理対象となる契約について、読み込んだ契約履歴情報のうち、年月日と周期の単位との対応関係の情報と、当該契約に対応する契約情報の解約日の情報とに基づいて、当該契約の解約周期sを取得する。 Next, in step S110, for the contract to be processed, information on the correspondence between the date and the cycle unit of the read contract history information, information on the date of cancellation of the contract information corresponding to the contract, Based on the above, the contract cancellation period s of the contract is acquired.
次に、ステップS112では、処理対象となる契約について、読み込んだ契約履歴情報のうち、当該契約に対応する契約情報の契約日の情報に基づいて、当該契約の契約時期tを取得する。 Next, in step S112, for the contract to be processed, the contract time t of the contract is acquired based on the contract date information of the contract information corresponding to the contract in the read contract history information.
次に、ステップS114では、読み込んだ契約履歴情報に含まれる全ての契約についてステップS106の処理を終了したか否かを判定する。全ての契約についてステップS106の処理を終了していない場合には、ステップS104へ移行し、処理対象となる契約を変更し、ステップS106以降の処理を繰り返す。一方、全ての契約についてステップS106の処理を終了している場合には、ステップS116へ移行する。 Next, in step S114, it is determined whether or not the processing in step S106 has been completed for all contracts included in the read contract history information. If the process of step S106 has not been completed for all contracts, the process proceeds to step S104, the contract to be processed is changed, and the processes after step S106 are repeated. On the other hand, when the process of step S106 has been completed for all contracts, the process proceeds to step S116.
次に、ステップS116では、ステップS108において取得した解約済みの契約の各々の契約期間xと、ステップS110において取得した解約済みの契約の各々の解約周期sと、に基づいて、xが取り得る全ての値(1〜X)と、sの取り得る全ての値(1〜12)との全ての組み合わせについて、契約期間xで周期sに解約した数nxsを取得する。 Next, in step S116, all possible values x can be taken based on the contract period x of each contract that has been canceled acquired in step S108 and the contract period s of each contract that has been canceled acquired in step S110. and the value (1 to x), for all combinations of all possible values of s (1 to 12), and acquires the number n xs you cancel the cycle s contract period x.
次に、ステップS117では、xが取り得る全ての値(1〜X)と、sの取り得る全ての値(1〜12)との全ての組み合わせについて、ステップS106において取得した全解約数Nと、ステップS116において取得した契約期間xで周期sに解約した数nxsとに基づいて、上記(1)式に従って、周期・期間解約率P(x,s)を算出する。 Next, in step S117, for all combinations of all values (1 to X) that x can take and all values (1 to 12) that s can take, the total churn number N acquired in step S106 is Based on the number nxs canceled in the period s in the contract period x acquired in step S116, the period / period churn rate P (x, s) is calculated according to the above equation (1).
次に、ステップS118では、xが取り得る全ての値(1〜X)と、sの取り得る全ての値(1〜12)との全ての組み合わせについて、ステップS117において取得した周期・期間解約率P(x,s)を、契約期間であるx軸方向に平滑化する平滑化処理を行い、最終的な周期・期間解約率P(x,s)として取得する。 Next, in step S118, the period / period churn rate acquired in step S117 for all combinations of all possible values of x (1 to X) and all possible values of s (1 to 12). A smoothing process for smoothing P (x, s) in the x-axis direction, which is the contract period, is performed and acquired as a final period / period churn rate P (x, s).
次に、ステップS120では、読み込んだ契約履歴情報に含まれる契約の各々の契約情報の契約日の情報及び観測開始日の情報と、に基づいて、各時期t(t=tstr〜tend)における契約数mtを算出する。 Next, in step S120, based on the contract date information and the observation start date information of each contract information included in the read contract history information, each time t (t = t str to t end ). to calculate the number of contracts m t in.
次に、ステップS122では、ステップS112において取得した解約済みの契約の各々の契約時期tに基づいて、各時期t(t=tstr〜tend)に契約し既に解約している数ntを算出する。 Next, in step S122, the number n t contracted at each time t (t = t str to t end ) and already canceled based on each contract time t of the contracts canceled in step S112. calculate.
次に、ステップS124では、ステップS120において取得した各時期tにおける契約数mtと、ステップS122において取得した各時期tに契約し既に解約している数ntとに基づいて、上記(2)式に従って、各時期t(t=tstr〜tend)の時期解約率H(t)を算出する。 Next, in step S124, the based and subscriptions m t at each time t obtained in step S120, on the number n t under contract already cancel each time t obtained in step S122, the (2) According to the equation, the time lapse rate H (t) at each time t (t = t str to t end ) is calculated.
次に、ステップS125では、読み込んだ契約履歴情報に含まれる契約の各々の契約情報の住所コードの情報に基づいて、地域a(住所コード)毎に契約の各々を分類する。 Next, in step S125, each of the contracts is classified for each region a (address code) based on the address code information of the contract information of each contract included in the read contract history information.
次に、ステップS126では、指定された地域の中から、処理対象となる地域aを決定する。 Next, in step S126, the area a to be processed is determined from the designated areas.
次に、ステップS128では、ステップS125において取得した、処理対象となる地域aに属する契約の各々の、読み込んだ契約履歴情報に含まれる契約情報の契約日の情報と、に基づいて、地域aにおける時期t(tstr〜tend)毎の契約数matを取得する。 Next, in step S128, based on the contract date information of the contract information included in the read contract history information of each contract belonging to the area a to be processed acquired in step S125, in the area a. The contract number mat at each time t (t str to t end ) is acquired.
次に、ステップS130では、ステップS118において取得した周期・期間解約率P(x,s)と、ステップS124において取得した、時期解約率H(t)と、ステップS128において取得した地域aにおける時期t毎の契約数matとに基づいて、上記(3)式に従って、地域aにおける各時期t(tstr〜tend)の解約数推定値^Na(t)を算出する。 Next, in step S130, the period / period churn rate P (x, s) acquired in step S118, the time lapse rate H (t) acquired in step S124, and the time t in the region a acquired in step S128. based on the contract number m at every, according to the above (3) to calculate the churn estimate ^ N a (t) for each time t (t str ~t end) in the region a.
次に、ステップS132では、ステップS130において取得した地域aにおける各時期tの解約数推定値^Na(t)に基づいて、上記(4)式に従って、地域aにおける各時期tの解約数推定値^Na(t)の信頼区間の上限値^Na,max(t)を算出する。 Next, in step S132, based on the churn number estimated value ^ N a (t) for each time t in the region a acquired in step S130, the churn number estimation for each time t in the region a is performed according to the above equation (4). the upper limit of the confidence interval of values ^ N a (t) ^ N a, and calculates the max (t).
次に、ステップS134では、ステップS130において取得した地域aにおける各時期tの解約数推定値^Na(t)に基づいて、上記(5)式に従って、地域aにおける各時期tの解約数推定値^Na(t)の信頼区間の下限値^Na,min(t)を算出する。 Next, in step S134, based on the churn number estimated value ^ N a (t) for each time t in the region a acquired in step S130, the churn number estimation for each time t in the region a is performed according to the above equation (5). the lower limit of the confidence interval for the value ^ N a (t) ^ N a, and calculates the min (t).
次に、ステップS136では、指定された全ての地域aについてステップS128〜ステップS134の処理を終了したか否かを判定する。指定された全ての地域aについてステップS128〜ステップS134の処理を終了した場合には、ステップS138へ移行する。一方、指定された全ての地域aについてステップS128〜ステップS134の処理を終了していない場合には、ステップS126へ移行し、処理対象となる地域aを変更し、ステップS128〜ステップS136の処理を繰り返す。 Next, in step S136, it is determined whether or not the processing in steps S128 to S134 has been completed for all designated areas a. When the processing of step S128 to step S134 is completed for all designated areas a, the process proceeds to step S138. On the other hand, if the processing of step S128 to step S134 has not been completed for all designated areas a, the process proceeds to step S126, the area a to be processed is changed, and the processes of steps S128 to S136 are performed. repeat.
次に、ステップS138では、指定された、処理対象となる地域aを決定する。 Next, in step S138, the designated area a to be processed is determined.
次に、ステップS140では、読み込んだ契約履歴情報に含まれる、ステップS125において取得した処理対象となる地域aに属する契約の各々の、契約情報の解約日の情報と、に基づいて、地域aにおける時期t毎の解約数Na(t)を算出する。 Next, in step S140, in the region a based on the contract date cancellation date information of each contract belonging to the region a to be processed acquired in step S125 included in the read contract history information. The number of cancellations N a (t) at each time t is calculated.
次に、ステップS142では、ステップS132において取得した地域aにおける各時期tの解約数推定値^Na(t)の信頼区間の上限値^Na,max(t)と、ステップS134において取得した地域aにおける各時期tの解約数推定値^Na(t)の信頼区間の下限値^Na,min(t)と、ステップS140において取得した地域aにおける時期t毎の解約数Na(t)と、に基づいて、上記(6)式に従って、地域aの各時期t(t=tstr〜tend)の異常値Atоa(t)を取得する。 Next, in step S142, the upper limit value ^ N a, max (t) of the confidence interval of the churn number estimated value ^ N a (t) at each time t in the region a obtained in step S132, and obtained in step S134. The lower limit value ^ N a, min (t) of the confidence interval of the estimated number of cancellations ^ N a (t) at each time t in the region a, and the number of cancellations N a (for each time t in the region a acquired in step S140. Based on t), the abnormal value At a a (t) at each time t (t = t str to t end ) of the region a is acquired according to the above equation (6).
次に、ステップS144では、指定された全ての地域aについてステップS140〜ステップS142の処理を終了したか否かを判定する。指定された全ての地域aについてステップS140〜ステップS142の処理を終了している場合には、ステップS146へ移行する。一方、指定された全ての地域aについてステップS140〜ステップS142の処理を終了していない場合には、ステップS138へ移行し、処理対象となる地域aを変更し、ステップS140〜ステップS142の処理を繰り返す。 Next, in step S144, it is determined whether or not the processing in steps S140 to S142 has been completed for all designated areas a. If the processing of step S140 to step S142 has been completed for all designated areas a, the process proceeds to step S146. On the other hand, if the processing of step S140 to step S142 has not been completed for all designated areas a, the process proceeds to step S138, the area a to be processed is changed, and the processes of steps S140 to S142 are performed. repeat.
次に、ステップS146では、ステップS142において取得した地域a毎の各時期tの異常値Atоa(t)に基づいて、図9、及び図10に示すような表又はグラフを作成する。 Next, in step S146, a table or a graph as shown in FIG. 9 and FIG. 10 is created based on the abnormal value At a (t) at each time t for each region a acquired in step S142.
次に、ステップS148では、ステップS146において取得した表又はグラフを出力部90に出力して、異常抽出処理ルーチンを終了する。 Next, in step S148, the table or graph acquired in step S146 is output to the output unit 90, and the abnormality extraction processing routine is terminated.
以上説明したように、本発明の本実施の形態に係る異常抽出装置によれば、入力された、複数のユーザの各々についての契約履歴情報に基づいて、契約の契約期間、及び契約を解約した、周期の単位の組み合わせの各々についての、周期・期間解約率と、時期解約率と、を推定し、契約履歴情報から取得される、指定された属性のユーザが、契約の契約時期の各々に契約した契約数と、推定された周期・期間解約率及び時期解約率と、に基づいて、指定された属性のユーザが時期の各々に解約する解約数を推定し、契約履歴情報から取得される、指定された属性のユーザが時期の各々に解約した解約数と、推定された、時期の各々の解約数と、に基づいて、解約数が異常となる時期を抽出することにより、生存時間の周期性と時系列の周期性を考慮した異常抽出をすることができる。 As described above, according to the abnormality extraction device according to the present embodiment of the present invention, the contract period of the contract and the contract are canceled based on the input contract history information for each of the plurality of users. Estimate the period / period churn rate and period churn rate for each combination of cycle units, and users with specified attributes obtained from the contract history information Based on the number of contracts contracted and the estimated period / period churn rate and period churn rate, the number of churns that the user with the specified attribute churns at each period is estimated and obtained from the contract history information. Based on the number of surrenders that the user with the specified attribute cancels at each time period and the estimated number of surrenders at each time period, the period of survivability is extracted by extracting the time when the surrender number is abnormal Periodicity and periodicity of time series It can be a consideration anomaly extracted.
また、生存関数を周期別に求めて重畳することで、生存時間の周期性だけでなく、時系列の周期性を考慮した異常抽出を実現することができる。 Further, by obtaining and superimposing the survival function for each period, it is possible to realize abnormality extraction considering not only the periodicity of the survival time but also the periodicity of the time series.
また、ノンパラメトリックな数え上げ手法を利用して求めた生存関数を用いるため、分布前提の当てはまりの正当性の確認を必要としない。 In addition, since the survival function obtained using a nonparametric counting method is used, it is not necessary to confirm the validity of the distribution assumption.
また、全体データと局所データとを分けて、信頼できる全体データから分布関数を求め、局所データに適用することで異常抽出を実現することができる。 Further, it is possible to realize abnormality extraction by dividing the whole data and the local data, obtaining a distribution function from the reliable whole data, and applying it to the local data.
また、従来の時系列分析技術と比較した場合、解約の情報だけでなく、契約の情報も考慮した分析となるため、より高精度に異常抽出が可能となる。 Further, when compared with the conventional time series analysis technique, the analysis is performed in consideration of not only the information on cancellation but also the information on the contract, so that the abnormality can be extracted with higher accuracy.
また、サービスの契約/解約、生存/死亡、機器故障等の開始/終了時期が存在する履歴データの分析により、時系列上におけるあるイベントによって生じた、ある特定の集団にのみ局所的に発生した解約リスク増を抽出することができる。それにより、マーケティングにおけるリテンション分析、及び機器故障予測等へ利用することができる。 In addition, by analyzing historical data with the start / end time of service contract / cancellation, survival / death, equipment failure, etc., it occurred locally only in a certain group caused by a certain event in time series An increase in churn risk can be extracted. Thereby, it can utilize for the retention analysis in marketing, equipment failure prediction, etc.
また、図12に示すように、時系列上における何らかのイベントにより生じる解約増の内、図12の実線、又は一点鎖線の円で囲われている周期性や契約期間の節目等で説明がつく解約増と、図12の点線の円で囲われているそれ以外の想定外の解約増を区別して、発見、及び抽出を可能とすることができる。 Also, as shown in FIG. 12, among the surrender increases caused by some event on the time series, the surrender can be explained by the periodicity or the milestones of the contract period enclosed by the solid line or the dashed-dotted circle in FIG. The increase and the other unexpected increase in surrender surrounded by a dotted circle in FIG. 12 can be distinguished to enable discovery and extraction.
2つの異なる時間軸(時系列、及び生存時間)を扱うことにより、時系列上のイベントにより生じる解約リスク増と、時系列上の周期(周期性等)、生存時間上の周期性(契約の節目での解約増等)とを区別して抽出することができる。 By dealing with two different time axes (time series and survival time), the churn risk increase caused by events on the time series, the period on the time series (periodicity, etc.), the periodicity on the survival time (contracts) It is possible to distinguish and extract from the increase in the number of cancellations at milestones).
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。 Note that the present invention is not limited to the above-described embodiment, and various modifications and applications are possible without departing from the gist of the present invention.
例えば、本実施の形態においては、営業データへの適用について異常抽出装置を用いる場合について説明したが、これに限定されるものではなく、製品寿命分析、企業の経営分析、災害の影響分析等、開始と終了の時期が取得可能な分野であれば異常抽出装置を応用してもよい。 For example, in the present embodiment, the case where the abnormality extraction device is used for application to sales data has been described, but the present invention is not limited to this, such as product life analysis, company management analysis, disaster impact analysis, etc. As long as the start and end times can be acquired, the abnormality extraction device may be applied.
また、本実施の形態においては、局所(属性)を全国に対応する特定地域(居住地域)とする場合について説明しているが、これに限定されるものではない。例えば、特定の顧客セグメント(顧客属性)、サービス・カテゴリ別等、分類としては何を用いてもよい。 In the present embodiment, the case where the local (attribute) is a specific area (residence area) corresponding to the whole country is described, but the present invention is not limited to this. For example, any classification may be used, such as a specific customer segment (customer attribute) or service category.
また、本実施の形態においては、時系列の扱いを一か月単位の例について説明したがこれに限定されるものではない。例えば、年単位、日単位、時間単位等、任意に設定した単位を用いてもよい。 In the present embodiment, an example of handling time series in units of one month has been described, but the present invention is not limited to this. For example, an arbitrarily set unit such as a year unit, a day unit, or a time unit may be used.
また、本実施の形態においては、周期の単位を暦の月にする場合について説明したがこれに限定されるものではない。例えば、周期の単位として、四半期単位、週単位、日単位、時間単位等、任意に設定した単位を用いてもよい。 In the present embodiment, the case where the unit of the period is a calendar month has been described. However, the present invention is not limited to this. For example, a unit set arbitrarily such as a quarter unit, a week unit, a day unit, or a time unit may be used as a cycle unit.
また、本実施の形態においては、取得された周期・期間解約率P(x,s)を契約期間であるx軸方向に平滑化する平滑化処理を行ったものを周期・期間解約率P(x,s)として取得する場合について説明したが、これに限定されるものではない。例えば、取得された周期・期間解約率P(x,s)をそのまま周期・期間解約率P(x,s)として用いてもよい。 Further, in the present embodiment, a cycle / period churn rate P (() obtained by performing a smoothing process for smoothing the acquired cycle / period churn rate P (x, s) in the x-axis direction which is a contract period. Although the case of acquiring as x, s) has been described, the present invention is not limited to this. For example, the acquired cycle / period churn rate P (x, s) may be used as it is as the cycle / period churn rate P (x, s).
また、本実施の形態においては、平均と分散が等しく、十分に大きいポアソン分布を仮定した正規分布近似による95%信頼区間の算出をする場合について説明したが、これに限定されるものではない。例えば、他の既存手法を用いてもよい。例えば、地域aの契約の各時期tの解約数推定値の分散をとり、当該分散値を用いて、異常値となる時期を抽出してもよい。 In the present embodiment, the description has been given of the case where the 95% confidence interval is calculated by normal distribution approximation assuming a Poisson distribution having a sufficiently large average and variance. However, the present invention is not limited to this. For example, other existing methods may be used. For example, the variance of the estimated churn number at each time t of the contract in the region a may be taken, and the time when the abnormal value may be extracted using the variance value.
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。 Further, in the present specification, the embodiment has been described in which the program is installed in advance. However, the program can be provided by being stored in a computer-readable recording medium or provided via a network. It is also possible to do.
、
10 入力部
20 演算部
22 契約履歴記憶部
24 生存関数推定部
26 解約数推定部
28 異常抽出部
90 出力部
100 異常抽出装置
,
DESCRIPTION OF SYMBOLS 10 Input part 20 Calculation part 22 Contract history memory | storage part 24 Survival function estimation part 26 Cancellation number estimation part 28 Abnormality extraction part 90 Output part 100 Abnormality extraction apparatus
Claims (7)
前記契約履歴情報から取得される、指定された属性のユーザが、前記契約の契約時期の各々に契約した契約数と、前記生存関数推定部により推定された周期・期間解約率及び時期解約率と、に基づいて、前記指定された属性のユーザが時期の各々に解約する解約数を推定する解約数推定部と、
前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記解約数推定部により推定された、前記時期の各々の前記解約数と、に基づいて、解約数が異常となる時期を抽出する異常抽出部と、
を含む、異常抽出装置。 The contract period of the contract based on the contract history information including the input information regarding the contract and cancellation of the user for each of the plurality of users and the information regarding the attribute of the user for each of the plurality of users. And the period / period cancellation rate at which the contract of the contract period is canceled in the unit of the period for each combination of the units of the time-series period with the predetermined period as the unit, and the contract A survival function estimator for estimating a contract cancellation rate at which the contract at the contract period is canceled for each of the contract periods;
Obtained from the contract history information, the number of contracts that the user of the specified attribute has contracted with each of the contract periods of the contract, the period / period churn rate and the period churn rate estimated by the survival function estimation unit, , A churn number estimation unit for estimating the number of churns that the user of the specified attribute churns at each time period,
Obtained from the contract history information, based on the number of churns canceled by the user of the designated attribute at each of the times and the number of churns at each of the times estimated by the churn number estimating unit. An anomaly extraction unit that extracts the time when the number of cancellations becomes abnormal,
An abnormal extraction device including
前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記推定された解約数の推定値の信頼区間と、に基づいて、解約数が、前記信頼区間に属さない時期を、解約数が異常となる時期として抽出する請求項1記載の異常抽出装置。 The abnormality extraction unit estimates a confidence interval of an estimated value of the churn number based on the churn number of each of the estimated times,
Based on the number of churns that the user of the specified attribute churns at each of the times acquired from the contract history information, and the confidence interval of the estimated value of the churn number, the number of churns is: The abnormality extraction device according to claim 1, wherein a period that does not belong to the confidence interval is extracted as a period when the churn number becomes abnormal.
前記生存関数推定部は、入力された、複数のユーザの各々についての前記ユーザの契約及び解約に関する情報と、前記複数のユーザの各々についての前記ユーザの属性に関する情報とを含む契約履歴情報に基づいて、前記契約の契約期間、及び前記契約を解約した、所定期間を単位とする時系列の周期の単位の組み合わせの各々についての、前記周期の単位に前記契約期間の契約が解約された周期・期間解約率と、前記契約の契約時期の各々についての、前記契約時期の契約が解約された時期解約率と、を推定し、
前記解約数推定部は、前記契約履歴情報から取得される、指定された属性のユーザが、前記契約の契約時期の各々に契約した契約数と、前記生存関数推定部により推定された周期・期間解約率及び時期解約率と、に基づいて、前記指定された属性のユーザが時期の各々に解約する解約数を推定し、
前記異常抽出部は、前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記解約数推定部により推定された、前記時期の各々の前記解約数と、に基づいて、解約数が異常となる時期を抽出する、
異常抽出方法。 An abnormality extraction method in an abnormality extraction device including a survival function estimation unit, a churn number estimation unit, and an abnormality extraction unit,
The survival function estimation unit is input based on contract history information including information on the contract and cancellation of the user for each of the plurality of users and information on the attribute of the user for each of the plurality of users. For each of the combinations of the contract period of the contract and the unit of the unit of the time-series period with the predetermined period as the unit, the period in which the contract of the contract period is canceled in the unit of the period Estimating the period churn rate and the churn rate at which the contract at the contract date was canceled for each of the contract dates of the contract,
The churn number estimation unit is obtained from the contract history information, and the number of contracts that the user with the specified attribute has contracted with each contract period of the contract, and the period / period estimated by the survival function estimation unit. Based on the churn rate and the churn rate, the number of churns that the user of the specified attribute churns at each of the times is estimated,
The abnormality extraction unit is obtained from the contract history information, and the number of churns canceled by the user of the designated attribute at each of the times, and the churn number estimation unit estimated by the churn number estimation unit Based on the number of surrenders, extract the time when the surrender number is abnormal,
Abnormal extraction method.
前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記推定された解約数の推定値の信頼区間と、に基づいて、解約数が、前記信頼区間に属さない時期を、解約数が異常となる時期として抽出する請求項4記載の異常抽出方法。 The extraction by the abnormality extraction unit estimates a confidence interval of the estimated value of the churn number based on the churn number of each of the estimated times,
Based on the number of churns that the user of the specified attribute churns at each of the times acquired from the contract history information, and the confidence interval of the estimated value of the churn number, the number of churns is: The abnormality extraction method according to claim 4, wherein a period that does not belong to the confidence interval is extracted as a period when the number of cancellations becomes abnormal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014245174A JP6302828B2 (en) | 2014-12-03 | 2014-12-03 | Abnormality extraction apparatus, method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014245174A JP6302828B2 (en) | 2014-12-03 | 2014-12-03 | Abnormality extraction apparatus, method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016110289A true JP2016110289A (en) | 2016-06-20 |
JP6302828B2 JP6302828B2 (en) | 2018-03-28 |
Family
ID=56124078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014245174A Active JP6302828B2 (en) | 2014-12-03 | 2014-12-03 | Abnormality extraction apparatus, method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6302828B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190012756A (en) * | 2017-07-28 | 2019-02-11 | 고려대학교 산학협력단 | Method and device for similar equipment clustering using feature extraction method based on survival function |
CN111124421A (en) * | 2019-12-23 | 2020-05-08 | 卓尔智联(武汉)研究院有限公司 | Abnormal contract data detection method and device for intelligent contracts of block chains |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0764965A (en) * | 1993-08-30 | 1995-03-10 | Hitachi Ltd | Method for predicting sales quantity |
JP2002366732A (en) * | 2001-06-11 | 2002-12-20 | Sas Institute Japan Ltd | Customer maintenance supporting system with respect to member customer |
JP2007179441A (en) * | 2005-12-28 | 2007-07-12 | Fujitsu Ltd | Cancellation analyzing device and its program |
JP2013073534A (en) * | 2011-09-29 | 2013-04-22 | Nippon Telegr & Teleph Corp <Ntt> | Customer survival rate estimation system, customer survival rate estimation method, customer survival rate estimation processing server and program for customer survival rate estimation processing server |
JP2013239065A (en) * | 2012-05-16 | 2013-11-28 | Nippon Telegr & Teleph Corp <Ntt> | Initial purchase estimation device, initial purchase estimation method and initial purchase estimation program |
JP2014093042A (en) * | 2012-11-06 | 2014-05-19 | Nippon Telegr & Teleph Corp <Ntt> | Survival rate estimation apparatus, method and program |
-
2014
- 2014-12-03 JP JP2014245174A patent/JP6302828B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0764965A (en) * | 1993-08-30 | 1995-03-10 | Hitachi Ltd | Method for predicting sales quantity |
JP2002366732A (en) * | 2001-06-11 | 2002-12-20 | Sas Institute Japan Ltd | Customer maintenance supporting system with respect to member customer |
JP2007179441A (en) * | 2005-12-28 | 2007-07-12 | Fujitsu Ltd | Cancellation analyzing device and its program |
JP2013073534A (en) * | 2011-09-29 | 2013-04-22 | Nippon Telegr & Teleph Corp <Ntt> | Customer survival rate estimation system, customer survival rate estimation method, customer survival rate estimation processing server and program for customer survival rate estimation processing server |
JP2013239065A (en) * | 2012-05-16 | 2013-11-28 | Nippon Telegr & Teleph Corp <Ntt> | Initial purchase estimation device, initial purchase estimation method and initial purchase estimation program |
JP2014093042A (en) * | 2012-11-06 | 2014-05-19 | Nippon Telegr & Teleph Corp <Ntt> | Survival rate estimation apparatus, method and program |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190012756A (en) * | 2017-07-28 | 2019-02-11 | 고려대학교 산학협력단 | Method and device for similar equipment clustering using feature extraction method based on survival function |
KR101982235B1 (en) | 2017-07-28 | 2019-05-24 | 고려대학교 산학협력단 | Method and device for similar equipment clustering using feature extraction method based on survival function |
CN111124421A (en) * | 2019-12-23 | 2020-05-08 | 卓尔智联(武汉)研究院有限公司 | Abnormal contract data detection method and device for intelligent contracts of block chains |
CN111124421B (en) * | 2019-12-23 | 2023-04-21 | 卓尔智联(武汉)研究院有限公司 | Abnormal contract data detection method and device for blockchain intelligent contract |
Also Published As
Publication number | Publication date |
---|---|
JP6302828B2 (en) | 2018-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9727533B2 (en) | Detecting anomalies in a time series | |
JP6141235B2 (en) | How to detect anomalies in time series data | |
CN106104496A (en) | The abnormality detection not being subjected to supervision for arbitrary sequence | |
CN106033424B (en) | Data mining method and device | |
US20180039766A1 (en) | Method and system for identifying a unique mobile device based on mobile device attribute changes over time | |
US9600391B2 (en) | Operations management apparatus, operations management method and program | |
CN102508774A (en) | Modeling method for software reliability growth model based on novel environmental factor function | |
EP2963553A1 (en) | System analysis device and system analysis method | |
CN108154252A (en) | Method and apparatus for estimating the flow deadline | |
JP6302828B2 (en) | Abnormality extraction apparatus, method, and program | |
WO2016106100A1 (en) | Retention risk mitigation system | |
CN111259922A (en) | Order data processing method and device based on customer order-returning early warning | |
KR101361208B1 (en) | Method for recommending papers using belief propagation | |
Lödding et al. | Modelling schedule reliability | |
Wang | An unreliable Geo/G/1 queue with startup and closedown times under randomized finite vacations | |
JP6340777B2 (en) | Store visitor attribute distribution information estimation device and program | |
Moiseev et al. | Interval forecast for model averaging methods | |
US20150024358A1 (en) | Stress assessment device, stress assessment method and recording medium | |
Creemers et al. | G-RAND: A phase-type approximation for the nonstationary G (t)/G (t)/s (t)+ G (t) queue | |
Nadaf et al. | Data mining in telecommunication | |
Halkos et al. | Evaluating alternative frequentist inferential approaches for optimal order quantities in the newsvendor model under exponential demand | |
JP5650290B1 (en) | Operational risk measurement method and apparatus | |
Li | The probabilistic life table and its applications to Canada | |
CN106067086A (en) | Human reliability based on 4M1E framework analyzes method | |
JP5564544B2 (en) | Method and system for counting work amount by customer attribute |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180305 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6302828 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |