JP2016110289A - Abnormality extraction device, abnormality extraction method, and program - Google Patents

Abnormality extraction device, abnormality extraction method, and program Download PDF

Info

Publication number
JP2016110289A
JP2016110289A JP2014245174A JP2014245174A JP2016110289A JP 2016110289 A JP2016110289 A JP 2016110289A JP 2014245174 A JP2014245174 A JP 2014245174A JP 2014245174 A JP2014245174 A JP 2014245174A JP 2016110289 A JP2016110289 A JP 2016110289A
Authority
JP
Japan
Prior art keywords
contract
period
churn
unit
estimated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014245174A
Other languages
Japanese (ja)
Other versions
JP6302828B2 (en
Inventor
裕介 市川
Yusuke Ichikawa
裕介 市川
典子 高屋
Noriko Takaya
典子 高屋
宏 澤田
Hiroshi Sawada
宏 澤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014245174A priority Critical patent/JP6302828B2/en
Publication of JP2016110289A publication Critical patent/JP2016110289A/en
Application granted granted Critical
Publication of JP6302828B2 publication Critical patent/JP6302828B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an abnormality extraction device, an abnormality extraction method, and a program that extract abnormality by taking into account periodicity of survival time and periodicity of a time series.SOLUTION: A survival function estimating part 24 estimates a cycle/term cancellation rate and a period cancellation rate of cancelled contract terms and contracts, for each combination of cycle units of a time series, on the basis of contract history information inputted for each of a plurality of users. A cancellation number estimating part 26 estimates a cancellation number reached by users of a specified attribute in each period, on the basis of a contract number reached by users of the specified attribute in each contract period, that is acquired from the contract history information, and on the basis of the estimated cycle/term cancellation rate and the period cancellation rate. An abnormality extracting part 28 extracts a period in which a cancellation number is abnormal, on the basis of the cancellation number reached by users of the specified attribute in each period, that is acquired from the contract history information, and on the basis of the estimated cancellation number for each period.SELECTED DRAWING: Figure 2

Description

本発明は、異常抽出装置、方法、プログラムに係り、特に、契約の解約の実績を把握する異常抽出装置、方法、プログラムに関する。   The present invention relates to an abnormality extraction device, method, and program, and more particularly, to an abnormality extraction device, method, and program for grasping a contract cancellation record.

従来技術として、ARIMAモデルやカルマンフィルター等の、時系列分析技術による異常抽出が存在する。   As a conventional technique, there is anomaly extraction by a time series analysis technique such as an ARIMA model or a Kalman filter.

また、混合ワイブルモデルや、カプラン・マイヤー法等の、生存時間分析技術による異常抽出が存在する。   In addition, there are abnormal extractions using survival time analysis techniques such as the mixed Weibull model and the Kaplan-Meier method.

特開2014−093042号公報JP 2014-093042 A

従来技術においては、時系列における季節性、生存時間における周期性等による解約リスク増と、特定属性群における局所的な解約リスク増を分離できないという問題がある。   In the prior art, there is a problem that an increase in churn risk due to seasonality in time series, periodicity in survival time, and local churn risk increase in a specific attribute group cannot be separated.

また、生存時間解析技術を応用して、上記課題を解決する場合、抽出されたものが局所異常なのか、前提とした分布が間違っているのかを区別が困難であるため、パラメトリックな分布前提を置く手法は利用できないという問題がある。   In addition, when applying the survival analysis technique to solve the above problem, it is difficult to distinguish whether the extracted one is a local anomaly or the assumed distribution is wrong. There is a problem that the placing method cannot be used.

本発明では、上記問題点を解決するために成されたものであり、生存時間の周期性と時系列の周期性を考慮した異常抽出をする異常抽出装置、方法、プログラムを提供することを目的とする。   In the present invention, an object of the present invention is to provide an anomaly extraction apparatus, method, and program for extracting an anomaly in consideration of the periodicity of the survival time and the periodicity of the time series. And

上記目的を達成するために、第1の発明の異常抽出装置は、入力された、複数のユーザの各々についての前記ユーザの契約及び解約に関する情報と、前記複数のユーザの各々についての前記ユーザの属性に関する情報とを含む契約履歴情報に基づいて、前記契約の契約期間、及び前記契約を解約した、所定期間を単位とする時系列の周期の単位の組み合わせの各々についての、前記周期の単位に前記契約期間の契約が解約された周期・期間解約率と、前記契約の契約時期の各々についての、前記契約時期の契約が解約された時期解約率と、を推定する生存関数推定部と、前記契約履歴情報から取得される、指定された属性のユーザが、前記契約の契約時期の各々に契約した契約数と、前記生存関数推定部により推定された周期・期間解約率及び時期解約率と、に基づいて、前記指定された属性のユーザが時期の各々に解約する解約数を推定する解約数推定部と、前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記解約数推定部により推定された、前記時期の各々の前記解約数と、に基づいて、解約数が異常となる時期を抽出する異常抽出部と、を含んで構成されている。   In order to achieve the above object, the abnormality extraction device according to the first aspect of the present invention is the input information on the contract and cancellation of the user for each of the plurality of users, and the user's information for each of the plurality of users. Based on the contract history information including attribute information, the contract period of the contract and the unit of the period for each combination of the units of the time-series period with the predetermined period as a unit, which has been canceled. A survival function estimation unit for estimating a period / period churn rate at which the contract of the contract period is terminated and a period churn rate at which the contract at the contract period is terminated for each of the contract periods of the contract; and The number of contracts that the user with the specified attribute acquired from the contract history information contracts with each of the contract periods of the contract, and the period / period churn rate estimated by the survival function estimation unit and A churn number estimation unit that estimates the number of churns that the user of the designated attribute churns at each of the times based on the period churn rate, and the user of the designated attribute that is acquired from the contract history information An abnormal extraction unit that extracts a period when the churn number becomes abnormal based on the churn number canceled at each of the periods and the churn number of each of the periods estimated by the churn number estimation unit; , Including.

第2の発明の異常抽出方法は、生存関数推定部と、解約数推定部と、異常抽出部と、を含む異常抽出装置における、異常抽出方法であって、前記生存関数推定部は、入力された、複数のユーザの各々についての前記ユーザの契約及び解約に関する情報と、前記複数のユーザの各々についての前記ユーザの属性に関する情報とを含む契約履歴情報に基づいて、前記契約の契約期間、及び前記契約を解約した、所定期間を単位とする時系列の周期の単位の組み合わせの各々についての、前記周期の単位に前記契約期間の契約が解約された周期・期間解約率と、前記契約の契約時期の各々についての、前記契約時期の契約が解約された時期解約率と、を推定し、前記解約数推定部は、前記契約履歴情報から取得される、指定された属性のユーザが、前記契約の契約時期の各々に契約した契約数と、前記生存関数推定部により推定された周期・期間解約率及び時期解約率と、に基づいて、前記指定された属性のユーザが時期の各々に解約する解約数を推定し、前記異常抽出部は、前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記解約数推定部により推定された、前記時期の各々の前記解約数と、に基づいて、解約数が異常となる時期を抽出する。   The abnormality extraction method of the second invention is an abnormality extraction method in an abnormality extraction device including a survival function estimation unit, a churn number estimation unit, and an abnormality extraction unit, wherein the survival function estimation unit is input A contract period of the contract based on contract history information including information on the contract and cancellation of the user for each of a plurality of users, and information on the attributes of the user for each of the plurality of users; and The period / period cancellation rate at which the contract of the contract period is canceled in the period unit, and the contract of the contract, for each combination of time-series period units with a predetermined period as a unit after the contract is canceled For each of the periods, the contract cancellation rate of the contract period is estimated, and the cancellation number estimation unit is obtained from the contract history information. Based on the number of contracts contracted for each contract period of the contract and the period / period churn rate and period churn rate estimated by the survival function estimation unit, the user of the specified attribute is assigned to each period. The number of cancellations to be canceled is estimated, and the abnormality extraction unit is acquired from the contract history information, and is estimated by the number of cancellations that the user with the specified attribute has canceled at each of the times, and the cancellation number estimation unit. In addition, the time when the number of cancellations becomes abnormal is extracted based on the number of cancellations at each time period.

第1及び第2の発明によれば、生存関数推定部により、入力された、複数のユーザの各々についての契約履歴情報に基づいて、契約の契約期間、及び契約を解約した、時系列の周期の単位の組み合わせの各々についての、周期・期間解約率と、時期解約率と、を推定し、解約数推定部により、契約履歴情報から取得される、指定された属性のユーザが、契約の契約時期の各々に契約した契約数と、推定された周期・期間解約率及び時期解約率と、に基づいて、指定された属性のユーザが時期の各々に解約する解約数を推定し、異常抽出部により、契約履歴情報から取得される、指定された属性のユーザが時期の各々に解約した解約数と、推定された、時期の各々の解約数と、に基づいて、解約数が異常となる時期を抽出する。   According to the first and second inventions, the contract period of the contract and the time-series cycle in which the contract is canceled based on the contract history information for each of the plurality of users input by the survival function estimation unit For each combination of units, the period / period churn rate and the period churn rate are estimated, and the churn number estimation unit obtains the contract with the specified attribute acquired from the contract history information. Based on the number of contracts contracted for each period, the estimated period / period churn rate and the period churn rate, the number of churns that the user with the specified attribute cancels for each period is estimated, and an anomaly extraction unit When the number of churns becomes abnormal on the basis of the number of churns that the user with the specified attribute cancels at each time and the estimated number of churns for each time obtained from the contract history information To extract.

このように、入力された、複数のユーザの各々についての契約履歴情報に基づいて、契約の契約期間、及び契約を解約した、時系列の周期の単位の組み合わせの各々についての、周期・期間解約率と、時期解約率と、を推定し、契約履歴情報から取得される、指定された属性のユーザが、契約の契約時期の各々に契約した契約数と、推定された周期・期間解約率及び時期解約率と、に基づいて、指定された属性のユーザが時期の各々に解約する解約数を推定し、契約履歴情報から取得される、指定された属性のユーザが時期の各々に解約した解約数と、推定された、時期の各々の解約数と、に基づいて、解約数が異常となる時期を抽出することにより、生存時間の周期性と時系列の周期性を考慮した異常抽出をすることができる。   As described above, based on the entered contract history information for each of the plurality of users, the contract period of the contract, and the period / period cancellation for each of the combinations of the units of the time-series period that canceled the contract. Estimate the rate and the period churn rate, and the number of contracts that the user with the specified attribute that is acquired from the contract history information contracts at each of the contract timings of the contract, the estimated period / period churn rate and Based on the churn rate, the number of churns that users with the specified attribute churn at each time period is estimated, and the churns that the user with the specified attribute churn at each time period are obtained from the contract history information. By extracting the period when the churn number becomes abnormal based on the number and the estimated churn number of each period, abnormal extraction considering the periodicity of the survival time and the periodicity of the time series is performed. be able to.

また、第1及び第2の発明においては、前記異常抽出部は、前記推定された前記時期の各々の解約数に基づいて、解約数の推定値の信頼区間を推定し、前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記推定された解約数の推定値の信頼区間と、に基づいて、解約数が、前記信頼区間に属さない時期を、解約数が異常となる時期として抽出してもよい。   In the first and second aspects of the invention, the abnormality extraction unit estimates a confidence interval of the estimated value of the churn number based on the estimated churn number at each of the estimated times, and determines from the contract history information Based on the obtained churn number that the user of the specified attribute churns at each of the times and the confidence interval of the estimated value of the estimated churn number, the churn number belongs to the confidence interval. The period when there is no cancellation may be extracted as the period when the number of cancellations becomes abnormal.

また、第1及び第2の発明においては、前記生存関数推定部は、前記契約の契約期間、及び前記契約を解約した前記周期の単位の組み合わせの各々について推定した、前記周期の単位に前記契約期間の契約が解約された周期・期間解約率に対して、前記契約期間の方向に平滑化する平滑化処理をおこなうことにより、前記周期・期間解約率を推定してもよい。   In the first and second aspects of the invention, the survival function estimation unit estimates the contract in the unit of the period estimated for each of the contract period of the contract and the combination of the units of the period in which the contract is canceled. The period / period churn rate may be estimated by performing a smoothing process for smoothing in the direction of the contract period with respect to the period / period churn rate at which the contract of the period is canceled.

また、本発明のプログラムは、コンピュータを、上記の異常抽出装置を構成する各部として機能させるためのプログラムである。   Moreover, the program of this invention is a program for functioning a computer as each part which comprises said abnormality extraction apparatus.

以上説明したように、本発明の異常抽出装置、方法、及びプログラムによれば、入力された、複数のユーザの各々についての契約履歴情報に基づいて、契約の契約期間、及び契約を解約した、時系列の周期の単位の組み合わせの各々についての、周期・期間解約率と、時期解約率と、を推定し、契約履歴情報から取得される、指定された属性のユーザが、契約の契約時期の各々に契約した契約数と、推定された周期・期間解約率及び時期解約率と、に基づいて、指定された属性のユーザが時期の各々に解約する解約数を推定し、契約履歴情報から取得される、指定された属性のユーザが時期の各々に解約した解約数と、推定された、時期の各々の解約数と、に基づいて、解約数が異常となる時期を抽出することにより、生存時間の周期性と時系列の周期性を考慮した異常抽出をすることができる。   As described above, according to the abnormality extraction device, method, and program of the present invention, the contract period of the contract and the contract are canceled based on the input contract history information for each of the plurality of users. Estimate the period / period churn rate and period churn rate for each combination of time-series cycle units, and the user with the specified attribute obtained from the contract history information Based on the number of contracts contracted with each, the estimated period / period churn rate and period churn rate, the number of churns that the user with the specified attribute cancels at each period is estimated and obtained from the contract history information By extracting the period when the churn number becomes abnormal based on the number of churns that the user with the specified attribute quits at each period and the estimated number of churns at each period Time periodicity and time It can be an abnormality extracted in consideration of the periodicity of the column.

本実施の形態に係る異常抽出装置の処理のフローを簡単に説明した図の例である。It is an example of the figure which demonstrated simply the flow of the process of the abnormality extraction apparatus which concerns on this Embodiment. 本実施の形態に係る異常抽出装置の機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of the abnormality extraction apparatus which concerns on this Embodiment. 契約履歴情報に含まれる観測開始日の情報の例を示す図である。It is a figure which shows the example of the information of the observation start date contained in contract history information. 契約履歴情報に含まれる観測終了日の情報の例を示す図である。It is a figure which shows the example of the information of the observation end date contained in contract history information. 契約履歴情報に含まれる契約情報の例を示す図である。It is a figure which shows the example of the contract information contained in contract history information. 周期毎のマクロの生存関数の例を示す図である。It is a figure which shows the example of the survival function of the macro for every period. 契約時期毎の観測終了時点での解約率の例を示す図である。It is a figure which shows the example of the churn rate at the time of the end of observation for every contract time. 解約数推定値の算出例を示す図である。It is a figure which shows the example of calculation of the churn number estimated value. 出力される表の例を示す図である。It is a figure which shows the example of the table output. 出力されるグラフの例を示す図である。It is a figure which shows the example of the graph output. 本実施の形態に係る異常抽出装置における異常抽出処理ルーチンのフローチャート図である。It is a flowchart figure of the abnormality extraction process routine in the abnormality extraction device which concerns on this Embodiment. 想定外の解約増の例を示す図である。It is a figure which shows the example of the surrender increase which is not assumed.

以下、図面を参照して本発明の実施の形態を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

<本実施の形態の原理> <Principle of this embodiment>

本実施の形態の原理について説明する。図1に示すように、まず、全国の契約/解約情報から、マクロの生存関数を時系列の周期の単位ごとに求める。次に、属性である地域毎の契約数推移とマクロの生存関数を元に解約者推定値を求める。そして、地域aの解約者推移と解約者推定値とを比較して、乖離が生じている時期を抽出する。   The principle of this embodiment will be described. As shown in FIG. 1, first, a macro survival function is obtained for each unit of a time-series period from nationwide contract / cancellation information. Next, the churn person estimated value is obtained based on the transition of the number of contracts for each region and the macro survival function. Then, the churn person transition of the region a and the churn person estimated value are compared, and the time when the divergence occurs is extracted.

<本発明の実施の形態に係る異常抽出装置の構成>
次に、本発明の実施の形態に係る異常抽出装置の構成について説明する。図2に示すように、本発明の実施の形態に係る異常抽出装置100は、CPUと、RAMと、後述する異常抽出処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この異常抽出装置は、機能的には図2に示すように入力部10と、演算部20と、出力部90とを含んで構成されている。
<Configuration of Abnormality Extraction Device According to Embodiment of the Present Invention>
Next, the configuration of the abnormality extraction device according to the embodiment of the present invention will be described. As shown in FIG. 2, the abnormality extraction device 100 according to the embodiment of the present invention includes a CPU, a RAM, and a ROM that stores a program and various data for executing an abnormality extraction processing routine described later. It can consist of computers. As shown in FIG. 2, this abnormality extraction device is functionally configured to include an input unit 10, a calculation unit 20, and an output unit 90.

入力部10は、契約履歴情報を受け付け契約履歴記憶部22に記憶する。ここで、契約履歴情報とは、例えば、図3に示す契約履歴情報を取得し始めた観測開始日の情報と、例えば、図4に示す契約履歴情報の取得を終了した観測終了日の情報と、図5に示す契約毎の、契約者の顧客ID、契約者の住所コード、契約日、解約日、及び契約状態の組み合わせからなる契約情報と、年月日と周期の単位との対応関係(図示省略)と、を含むものとする。なお、時系列の周期の単位は、所定期間であり、本実施の形態においては、周期の単位を、暦の月とし、取り得る値は、1月〜12月とする。また、観測開始日に対応する時期をtstrとし、観測終了日に対応する時期をtendとする。 The input unit 10 receives the contract history information and stores it in the contract history storage unit 22. Here, the contract history information is, for example, information on the observation start date when the contract history information shown in FIG. 3 is acquired, and information on the observation end date when the acquisition of the contract history information shown in FIG. 5, for each contract shown in FIG. 5, the contract information consisting of a combination of the contractor's customer ID, the contractor's address code, the contract date, the cancellation date, and the contract status, and the correspondence relationship between the date and the cycle unit ( (Not shown). The unit of the time-series period is a predetermined period. In this embodiment, the unit of the period is a calendar month, and the possible values are January to December. Also, the time corresponding to the observation start date is set to t str and the time corresponding to the observation end date is set to t end .

演算部20は、契約履歴記憶部22と、生存関数推定部24と、解約数推定部26と、異常抽出部28と、を含んで構成されている。   The calculation unit 20 includes a contract history storage unit 22, a survival function estimation unit 24, a churn number estimation unit 26, and an abnormality extraction unit 28.

契約履歴記憶部22には、入力部10において受け付けた契約履歴情報が記憶されている。   The contract history storage unit 22 stores the contract history information received by the input unit 10.

生存関数推定部24は、契約履歴記憶部22に記憶されている契約履歴情報に基づいて、周期s毎のマクロの生存関数である周期・期間解約率、及び契約時期t毎の観測終了時点での契約の解約率である時期解約率H(t)を取得する。周期・期間解約率の例を図6に示し、時期解約率H(t)の例を図7に示す。なお、時期の単位は1ヵ月とする。   Based on the contract history information stored in the contract history storage unit 22, the survival function estimation unit 24 performs the period / period churn rate, which is a macro survival function for each cycle s, and the observation end time for each contract time t. The term churn rate H (t), which is the churn rate of the contract, is acquired. An example of the period / period churn rate is shown in FIG. 6, and an example of the timing churn rate H (t) is shown in FIG. The unit of time is one month.

まず、周期・期間解約率の取得について説明する。具体的には、始めに、契約履歴情報に含まれる契約状態の情報に基づいて、観測終了日における全解約数Nを取得する。   First, the acquisition of the period / period churn rate will be described. Specifically, first, based on the contract state information included in the contract history information, the total number of cancellations N on the observation end date is acquired.

次に、契約履歴情報に含まれる契約情報に対応する契約の各々について、当該契約の契約情報に含まれる、契約状態の情報から、当該契約が観測終了日において解約されているか否かを判定する。ここで、当該契約が観測終了日において解約されていると判定された場合には、当該契約の契約情報に含まれる、契約日と解約日との情報から、当該契約の契約期間x、及び当該解約日に対応する周期sを取得する。なお、契約が観測終了日において解約されているか否かを判定する際に、解約されている契約の数をカウントし、全解約数Nとする。   Next, for each of the contracts corresponding to the contract information included in the contract history information, it is determined from the contract status information included in the contract information of the contract whether or not the contract has been canceled on the observation end date. . Here, when it is determined that the contract has been canceled on the observation end date, the contract period x of the contract and the contract period x and the contract date are included in the contract information of the contract. The period s corresponding to the cancellation date is acquired. Note that when determining whether or not the contract has been canceled on the observation end date, the number of contracts that have been canceled is counted, and the total number of cancellations N.

次に、観測終了日において解約されている契約の各々について取得された、当該契約の契約期間xと、当該契約が解約された周期sとに基づいて、全ての契約期間xと周期sとの組み合わせ毎に、契約期間xで周期sに解約した数nxsを取得する。ここで、xは、1〜Xの値の各々をとり、sは、1〜12の値の各々をとる。 Next, based on the contract period x of the contract and the period s at which the contract is canceled, acquired for each contract canceled on the observation end date, all contract periods x and periods s For each combination, the number nxs canceled in the period s in the contract period x is acquired. Here, x takes each of the values 1 to X, and s takes each of the values 1 to 12.

次に、取得された全解約数Nと、全ての契約期間xと周期sとの組み合わせについて取得された契約期間xで周期sに解約した数nxsの各々とに基づいて、下記(1)式に従って、周期・期間解約率P(x,s)を取得する。そして、全ての契約期間xと周期sとの組み合わせの各々について、取得された周期・期間解約率P(x,s)を契約期間であるx軸方向に平滑化する平滑化処理(移動平均の他、手法は問わない)を行い、ノイズを除去したものを、最終的な周期・期間解約率P(x,s)として取得する。このようにすることにより、マクロの生存関数を周期別にノンパラメトリック推定で作成することができる。 Next, based on the acquired total number N of cancellations and each of the numbers nxs canceled in the period s in the contract period x acquired for all combinations of the contract period x and the period s, the following (1) The period / period churn rate P (x, s) is acquired according to the equation. Then, for each of the combinations of all contract periods x and periods s, a smoothing process (moving average of the average period / period churn rate P (x, s)) is smoothed in the x-axis direction as the contract period. Any other method may be used to obtain the final period / period churn rate P (x, s) from which noise has been removed. In this way, a macro survival function can be created by non-parametric estimation for each period.

次に、時期解約率H(t)の取得について説明する。まず、契約履歴情報に含まれる契約情報に基づいて、時期t(t=tstr〜tend)毎に、当該時期tに、契約日が該当する、時期tに契約した契約数mを取得する。次に、観測終了日において解約されていると判定された契約の各々の契約情報に基づいて、時期t(t=tstr〜tend)毎に、当該時期tに、契約日が該当し、既に解約している数nを取得する。次に、取得した時期tに契約した契約数mと、時期tに契約し、既に解約している数nとに基づいて、下記(2)式に従って、時期解約率H(t)を取得する。 Next, acquisition of the time lapse rate H (t) will be described. First, based on the contract information included in the contract history information, for each time t (t = t str ~t end ), get to the time t, contract date corresponds, subscriptions m t contracted at a time t To do. Next, based on the contract information of each contract determined to be canceled on the observation end date, the contract date corresponds to the time t for each time t (t = t str to t end ), The number n t that has already been canceled is acquired. Next, the number of contracts m t contracted in t time acquired, contract the time t, already on the basis of the number n t are canceled, according to the following equation (2), timing churn H a (t) get.

解約数推定部26は、契約履歴記憶部22に記憶されている契約履歴情報と、生存関数推定部において取得した、周期・期間解約率P(x,s)及び、時期解約率H(t)と、に基づいて、推定対象として指定された地域aの各々についての時期t毎の解約数推定値^N(t)を算出する。なお、記号の前に「^」が付与されている記号は、当該記号の値が推定値であることを表す。 The churn number estimation unit 26, the contract history information stored in the contract history storage unit 22, the period / period churn rate P (x, s) and the timing churn rate H (t) acquired by the survival function estimation unit. Based on the above, the churn number estimated value ^ N a (t) at each time t for each of the areas a designated as the estimation target is calculated. A symbol with “^” in front of the symbol indicates that the value of the symbol is an estimated value.

具体的には、まず、契約履歴記憶部22に記憶されている契約履歴情報に含まれる契約の契約情報の各々に基づいて、属性である地域a毎に属する契約の各々を分類する。本実施の形態においては、住所コードが同一である契約の各々を同一の地域に属する契約とする。次に、指定された地域の中から、処理対象となる地域aを決定する。次に、処理対象となる地域aに属する契約の各々の当該契約の契約情報に含まれる契約日の情報の各々に基づいて、地域aにおける時期t毎の契約数matを取得する。次に、取得した地域aにおける時期t毎の契約数matと、生存関数推定部において取得した、周期・期間解約率P(x,s)、及び時期解約率H(t)とに基づいて、下記(3)式に従って、地域aの時期t毎の解約数推定値^N(t)を算出する。なお、tは、tstr〜tendの値をとる。ここで、地域aの時期t毎の解約数推定値^N(t)について説明すると、例えば、2012年12月の契約者のうち2013年1月に解約する解約者数は、(契約期間1ヵ月の契約者が1月に解約する周期・期間解約率P(1ヵ月,1月))×(2012年12月の契約者の解約率H(2012年12月))×(2012年12月の契約数m)の積算により求まる。これを、観測開始月から、2012年12月(2013年1月の1時期前)までの総和をとったものが、2013年1月の解約数推定値となる。このように、マクロの生存関数を地域の契約数推移に当てはめることにより、解約数推定を求めることができる。また、図8に解約数推定値の算出する例を示す。 Specifically, first, each of the contracts belonging to each region a which is an attribute is classified based on the contract information of the contracts included in the contract history information stored in the contract history storage unit 22. In the present embodiment, it is assumed that each contract having the same address code belongs to the same area. Next, the area a to be processed is determined from the designated areas. Next, based on each information of the contract date included in the contract information of the contract of each contract belonging to the region a to be processed, and acquires the contract number m at every time t in the region a. Next, based on the number of contracts mat at each time t in the acquired area a, the period / period churn rate P (x, s), and the time churn rate H (t) acquired by the survival function estimation unit. Then, according to the following equation (3), the churn number estimated value ^ N a (t) for each time t in the region a is calculated. Note that t takes a value of t str to t end . Here, the estimated churn number estimated value ^ N a (t) for each period t in the region a will be described. For example, among the contractors in December 2012, the number of churners to be canceled in January 2013 is (contract period). Cycle / period churn rate P (1 month, January) for 1 month contractor cancels in January x (contractor churn rate H in December 2012 (December 2012)) x (2012 12 It is obtained by integrating the number of monthly contracts m t ). The sum of the period from the observation start month to December 2012 (one period before January 2013) is the estimated churn number estimate for January 2013. Thus, the churn number estimation can be obtained by applying the macro survival function to the number of contracts in the region. FIG. 8 shows an example of calculating the churn number estimated value.

解約数推定部26は、上記処理を、指定された全ての地域aについて行う事により、地域aの各々について、時期t毎の解約数推定値^N(t)を算出する。 The churn number estimation unit 26 calculates the churn number estimated value ^ N a (t) for each time period t for each of the areas a by performing the above processing for all the specified areas a.

異常抽出部28は、解約数推定部26において取得した地域aの各々についての時期t毎の解約数推定値^N(t)に基づいて、当該地域aの時期t毎の解約数推定値の信頼区間(^Na,min(t)〜^Na,max(t))を算出する。具体的には、取得した地域aの時期t毎の解約数推定値^N(t)の信頼区間(上限を^Na,max(t)、下限を^Na,min(t)とする。)を、取得した地域aの時期t毎の解約数推定値^N(t)に基づいて、下記(4)式、及び下記(5)式に従って算出する。 Based on the churn number estimation value ^ N a (t) for each time period t for each region a acquired by the churn number estimation unit 26, the abnormality extraction unit 28 calculates the churn number estimation value for each time period t of the region a. Confidence intervals (^ N a, min (t) to ^ N a, max (t)) are calculated. Specifically, the obtained confidence interval (the upper limit ^ N a cancellation by the estimated value for each time t of the region a ^ N a (t), max (t), the lower limit ^ N a, and min (t) Is calculated according to the following formula (4) and the following formula (5) based on the estimated churn number estimated value ^ N a (t) for each time t in the area a.

なお、異常抽出部28は、上記処理を、指定された全ての地域aについて行う事により、地域aの各々について、時期t毎に、解約数推定値^N(t)の信頼区間(^Na,min(t)〜^Na,max(t))を算出する。 Incidentally, abnormality extraction unit 28, the above process, by performing the all regions a specified, for each of the areas a, for each time t, churn estimate ^ N a (t) of the confidence interval (^ N a, min (t) to ^ N a, max (t)) are calculated.

また、異常抽出部28は、契約履歴記憶部22に記憶されている契約履歴情報と、解約数推定部26により地域aの各々について取得した時期t毎の解約数推定値^N(t)と、地域aの各々について取得した時期t毎の解約数推定値^N(t)の信頼区間と、に基づいて、指定された地域aの各々について、実績値と推定値とに乖離が生じていることを表す時期t毎のAno(t)を算出する。また、異常抽出部28は、地域aの各々について取得した、時期t毎のAno(t)の値に基づいて、実績値と推定値との乖離を表すグラフ、及び表を作成し、出力部90に出力する。 In addition, the abnormality extraction unit 28 includes the contract history information stored in the contract history storage unit 22 and the churn number estimated value ^ N a (t) for each time t acquired for each area a by the churn number estimation unit 26. And the confidence interval of the estimated churn number estimated value ^ N a (t) for each period t acquired for each region a, there is a discrepancy between the actual value and the estimated value for each designated region a. Ano a (t) is calculated for each time t indicating the occurrence. Moreover, the abnormality extraction part 28 produces the graph and table showing the deviation of an actual value and an estimated value based on the value of Ano a (t) for every time t acquired about each area a, and outputs it. Output to the unit 90.

なお、異常値Ano(t)の値が0である場合には、当該値は異常値として扱わない。また、出力例を図9及び図10に示す。なお、図9は、異常値Ano(t)を表出力し、異常度合いに応じてマスの色を変更して出力した例を示す。また、図10は、実際の解約数(actual)と解約数推定値の信頼区間の上限値(max_line)と解約数推定値の信頼区間の下限値(min_line)とをグラフ出力した例を示す。また、tの取り得る値は、tstr〜tendとする。 When the value of the abnormal value Ano a (t) is 0, the value is not treated as an abnormal value. Also, output examples are shown in FIGS. FIG. 9 shows an example in which the abnormal value Ano a (t) is output in a table, and the square color is changed according to the degree of abnormality. FIG. 10 shows an example in which the actual churn number (actual), the upper limit value (max_line) of the confidence interval of the churn number estimated value, and the lower limit value (min_line) of the confidence interval of the churn number estimated value are output as a graph. Further, the possible values of t are t str to t end .

具体的には、まず、指定された地域の中から、処理対象となる地域aを決定する。次に、処理対象となる地域aに属する契約の各々の当該契約の契約情報に含まれる解約日の情報の各々に基づいて、地域aにおける時期t毎の解約数N(t)を取得する。次に、取得した地域aにおける時期t毎の解約数N(t)と、解約数推定部26により取得した地域aの時期t毎の解約数推定値^N(t)と、取得した時期t毎の解約数推定値^N(t)の信頼区間とに基づいて、下記(6)式に従って、tの取り得る値(tstr〜tend)の全てについて異常値Ano(t)を算出する。このように実際の解約数と推定値との乖離を地域局所的な異常として抽出する。 Specifically, first, a region a to be processed is determined from the designated regions. Next, the number of cancellations N a (t) for each period t in the region a is acquired based on each of the cancellation date information included in the contract information of each contract belonging to the region a to be processed. . Next, the churn number N a (t) for each time t in the acquired region a, the churn number estimated value ^ N a (t) for each time t of the region a acquired by the churn number estimation unit 26, and the acquired Based on the confidence interval of the estimated churn value ^ N a (t) for each time t, according to the following equation (6), all the possible values of t (t str to t end ) are abnormal values Ano a (t ) Is calculated. In this way, the deviation between the actual number of cancellations and the estimated value is extracted as a regional local abnormality.

<本発明の実施の形態に係る異常抽出装置の作用>
次に、本実施の形態に係る異常抽出装置100の作用について説明する。まず、入力部10において契約履歴情報を受け付け契約履歴記憶部22に記憶する。次に、異常抽出装置100において、契約履歴記憶部22に記憶されている契約履歴情報を読み込むと、異常抽出装置100によって、図11に示す異常抽出処理ルーチンを実行する。
<Operation of Abnormality Extraction Device According to Embodiment of the Present Invention>
Next, the operation of the abnormality extraction device 100 according to the present embodiment will be described. First, the contract history information is received by the input unit 10 and stored in the contract history storage unit 22. Next, in the abnormality extraction device 100, when the contract history information stored in the contract history storage unit 22 is read, the abnormality extraction processing routine shown in FIG.

まず、ステップS104では、読み込んだ契約履歴情報に含まれる契約の各々のうち、処理対象となる契約を決定する。   First, in step S104, a contract to be processed is determined from each contract included in the read contract history information.

次に、ステップS106では、処理対象となる契約について、読み込んだ契約履歴情報のうち、当該契約に対応する契約情報の契約状態の情報に基づいて、当該契約が解約されているか否かを判定する。当該契約が解約されていると判定された場合には、ステップS108へ移行する。一方、当該契約が契約中と判定された場合には、ステップS114へ移行する。なお、ステップS106の処理において、解約されていると判定した回数をカウントしておき、当該カウントした値を全解約数Nとする。   Next, in step S106, it is determined whether or not the contract is canceled based on the contract status information of the contract information corresponding to the contract among the read contract history information for the contract to be processed. . If it is determined that the contract has been canceled, the process proceeds to step S108. On the other hand, if it is determined that the contract is in contract, the process proceeds to step S114. In addition, in the process of step S106, the number of times determined to have been canceled is counted, and the counted value is set as the total number of cancellations N.

次に、ステップS108では、処理対象となる契約について、読み込んだ契約履歴情報のうち、当該契約に対応する契約情報の契約日及び解約日の情報に基づいて、当該契約の契約期間xを算出する。   Next, in step S108, for the contract to be processed, the contract period x of the contract is calculated based on the contract date and cancellation date information of the contract information corresponding to the contract in the read contract history information. .

次に、ステップS110では、処理対象となる契約について、読み込んだ契約履歴情報のうち、年月日と周期の単位との対応関係の情報と、当該契約に対応する契約情報の解約日の情報とに基づいて、当該契約の解約周期sを取得する。   Next, in step S110, for the contract to be processed, information on the correspondence between the date and the cycle unit of the read contract history information, information on the date of cancellation of the contract information corresponding to the contract, Based on the above, the contract cancellation period s of the contract is acquired.

次に、ステップS112では、処理対象となる契約について、読み込んだ契約履歴情報のうち、当該契約に対応する契約情報の契約日の情報に基づいて、当該契約の契約時期tを取得する。   Next, in step S112, for the contract to be processed, the contract time t of the contract is acquired based on the contract date information of the contract information corresponding to the contract in the read contract history information.

次に、ステップS114では、読み込んだ契約履歴情報に含まれる全ての契約についてステップS106の処理を終了したか否かを判定する。全ての契約についてステップS106の処理を終了していない場合には、ステップS104へ移行し、処理対象となる契約を変更し、ステップS106以降の処理を繰り返す。一方、全ての契約についてステップS106の処理を終了している場合には、ステップS116へ移行する。   Next, in step S114, it is determined whether or not the processing in step S106 has been completed for all contracts included in the read contract history information. If the process of step S106 has not been completed for all contracts, the process proceeds to step S104, the contract to be processed is changed, and the processes after step S106 are repeated. On the other hand, when the process of step S106 has been completed for all contracts, the process proceeds to step S116.

次に、ステップS116では、ステップS108において取得した解約済みの契約の各々の契約期間xと、ステップS110において取得した解約済みの契約の各々の解約周期sと、に基づいて、xが取り得る全ての値(1〜X)と、sの取り得る全ての値(1〜12)との全ての組み合わせについて、契約期間xで周期sに解約した数nxsを取得する。 Next, in step S116, all possible values x can be taken based on the contract period x of each contract that has been canceled acquired in step S108 and the contract period s of each contract that has been canceled acquired in step S110. and the value (1 to x), for all combinations of all possible values of s (1 to 12), and acquires the number n xs you cancel the cycle s contract period x.

次に、ステップS117では、xが取り得る全ての値(1〜X)と、sの取り得る全ての値(1〜12)との全ての組み合わせについて、ステップS106において取得した全解約数Nと、ステップS116において取得した契約期間xで周期sに解約した数nxsとに基づいて、上記(1)式に従って、周期・期間解約率P(x,s)を算出する。 Next, in step S117, for all combinations of all values (1 to X) that x can take and all values (1 to 12) that s can take, the total churn number N acquired in step S106 is Based on the number nxs canceled in the period s in the contract period x acquired in step S116, the period / period churn rate P (x, s) is calculated according to the above equation (1).

次に、ステップS118では、xが取り得る全ての値(1〜X)と、sの取り得る全ての値(1〜12)との全ての組み合わせについて、ステップS117において取得した周期・期間解約率P(x,s)を、契約期間であるx軸方向に平滑化する平滑化処理を行い、最終的な周期・期間解約率P(x,s)として取得する。   Next, in step S118, the period / period churn rate acquired in step S117 for all combinations of all possible values of x (1 to X) and all possible values of s (1 to 12). A smoothing process for smoothing P (x, s) in the x-axis direction, which is the contract period, is performed and acquired as a final period / period churn rate P (x, s).

次に、ステップS120では、読み込んだ契約履歴情報に含まれる契約の各々の契約情報の契約日の情報及び観測開始日の情報と、に基づいて、各時期t(t=tstr〜tend)における契約数mを算出する。 Next, in step S120, based on the contract date information and the observation start date information of each contract information included in the read contract history information, each time t (t = t str to t end ). to calculate the number of contracts m t in.

次に、ステップS122では、ステップS112において取得した解約済みの契約の各々の契約時期tに基づいて、各時期t(t=tstr〜tend)に契約し既に解約している数nを算出する。 Next, in step S122, the number n t contracted at each time t (t = t str to t end ) and already canceled based on each contract time t of the contracts canceled in step S112. calculate.

次に、ステップS124では、ステップS120において取得した各時期tにおける契約数mと、ステップS122において取得した各時期tに契約し既に解約している数nとに基づいて、上記(2)式に従って、各時期t(t=tstr〜tend)の時期解約率H(t)を算出する。 Next, in step S124, the based and subscriptions m t at each time t obtained in step S120, on the number n t under contract already cancel each time t obtained in step S122, the (2) According to the equation, the time lapse rate H (t) at each time t (t = t str to t end ) is calculated.

次に、ステップS125では、読み込んだ契約履歴情報に含まれる契約の各々の契約情報の住所コードの情報に基づいて、地域a(住所コード)毎に契約の各々を分類する。   Next, in step S125, each of the contracts is classified for each region a (address code) based on the address code information of the contract information of each contract included in the read contract history information.

次に、ステップS126では、指定された地域の中から、処理対象となる地域aを決定する。   Next, in step S126, the area a to be processed is determined from the designated areas.

次に、ステップS128では、ステップS125において取得した、処理対象となる地域aに属する契約の各々の、読み込んだ契約履歴情報に含まれる契約情報の契約日の情報と、に基づいて、地域aにおける時期t(tstr〜tend)毎の契約数matを取得する。 Next, in step S128, based on the contract date information of the contract information included in the read contract history information of each contract belonging to the area a to be processed acquired in step S125, in the area a. The contract number mat at each time t (t str to t end ) is acquired.

次に、ステップS130では、ステップS118において取得した周期・期間解約率P(x,s)と、ステップS124において取得した、時期解約率H(t)と、ステップS128において取得した地域aにおける時期t毎の契約数matとに基づいて、上記(3)式に従って、地域aにおける各時期t(tstr〜tend)の解約数推定値^N(t)を算出する。 Next, in step S130, the period / period churn rate P (x, s) acquired in step S118, the time lapse rate H (t) acquired in step S124, and the time t in the region a acquired in step S128. based on the contract number m at every, according to the above (3) to calculate the churn estimate ^ N a (t) for each time t (t str ~t end) in the region a.

次に、ステップS132では、ステップS130において取得した地域aにおける各時期tの解約数推定値^N(t)に基づいて、上記(4)式に従って、地域aにおける各時期tの解約数推定値^N(t)の信頼区間の上限値^Na,max(t)を算出する。 Next, in step S132, based on the churn number estimated value ^ N a (t) for each time t in the region a acquired in step S130, the churn number estimation for each time t in the region a is performed according to the above equation (4). the upper limit of the confidence interval of values ^ N a (t) ^ N a, and calculates the max (t).

次に、ステップS134では、ステップS130において取得した地域aにおける各時期tの解約数推定値^N(t)に基づいて、上記(5)式に従って、地域aにおける各時期tの解約数推定値^N(t)の信頼区間の下限値^Na,min(t)を算出する。 Next, in step S134, based on the churn number estimated value ^ N a (t) for each time t in the region a acquired in step S130, the churn number estimation for each time t in the region a is performed according to the above equation (5). the lower limit of the confidence interval for the value ^ N a (t) ^ N a, and calculates the min (t).

次に、ステップS136では、指定された全ての地域aについてステップS128〜ステップS134の処理を終了したか否かを判定する。指定された全ての地域aについてステップS128〜ステップS134の処理を終了した場合には、ステップS138へ移行する。一方、指定された全ての地域aについてステップS128〜ステップS134の処理を終了していない場合には、ステップS126へ移行し、処理対象となる地域aを変更し、ステップS128〜ステップS136の処理を繰り返す。   Next, in step S136, it is determined whether or not the processing in steps S128 to S134 has been completed for all designated areas a. When the processing of step S128 to step S134 is completed for all designated areas a, the process proceeds to step S138. On the other hand, if the processing of step S128 to step S134 has not been completed for all designated areas a, the process proceeds to step S126, the area a to be processed is changed, and the processes of steps S128 to S136 are performed. repeat.

次に、ステップS138では、指定された、処理対象となる地域aを決定する。   Next, in step S138, the designated area a to be processed is determined.

次に、ステップS140では、読み込んだ契約履歴情報に含まれる、ステップS125において取得した処理対象となる地域aに属する契約の各々の、契約情報の解約日の情報と、に基づいて、地域aにおける時期t毎の解約数N(t)を算出する。 Next, in step S140, in the region a based on the contract date cancellation date information of each contract belonging to the region a to be processed acquired in step S125 included in the read contract history information. The number of cancellations N a (t) at each time t is calculated.

次に、ステップS142では、ステップS132において取得した地域aにおける各時期tの解約数推定値^N(t)の信頼区間の上限値^Na,max(t)と、ステップS134において取得した地域aにおける各時期tの解約数推定値^N(t)の信頼区間の下限値^Na,min(t)と、ステップS140において取得した地域aにおける時期t毎の解約数N(t)と、に基づいて、上記(6)式に従って、地域aの各時期t(t=tstr〜tend)の異常値Atо(t)を取得する。 Next, in step S142, the upper limit value ^ N a, max (t) of the confidence interval of the churn number estimated value ^ N a (t) at each time t in the region a obtained in step S132, and obtained in step S134. The lower limit value ^ N a, min (t) of the confidence interval of the estimated number of cancellations ^ N a (t) at each time t in the region a, and the number of cancellations N a (for each time t in the region a acquired in step S140. Based on t), the abnormal value At a a (t) at each time t (t = t str to t end ) of the region a is acquired according to the above equation (6).

次に、ステップS144では、指定された全ての地域aについてステップS140〜ステップS142の処理を終了したか否かを判定する。指定された全ての地域aについてステップS140〜ステップS142の処理を終了している場合には、ステップS146へ移行する。一方、指定された全ての地域aについてステップS140〜ステップS142の処理を終了していない場合には、ステップS138へ移行し、処理対象となる地域aを変更し、ステップS140〜ステップS142の処理を繰り返す。   Next, in step S144, it is determined whether or not the processing in steps S140 to S142 has been completed for all designated areas a. If the processing of step S140 to step S142 has been completed for all designated areas a, the process proceeds to step S146. On the other hand, if the processing of step S140 to step S142 has not been completed for all designated areas a, the process proceeds to step S138, the area a to be processed is changed, and the processes of steps S140 to S142 are performed. repeat.

次に、ステップS146では、ステップS142において取得した地域a毎の各時期tの異常値Atо(t)に基づいて、図9、及び図10に示すような表又はグラフを作成する。 Next, in step S146, a table or a graph as shown in FIG. 9 and FIG. 10 is created based on the abnormal value At a (t) at each time t for each region a acquired in step S142.

次に、ステップS148では、ステップS146において取得した表又はグラフを出力部90に出力して、異常抽出処理ルーチンを終了する。   Next, in step S148, the table or graph acquired in step S146 is output to the output unit 90, and the abnormality extraction processing routine is terminated.

以上説明したように、本発明の本実施の形態に係る異常抽出装置によれば、入力された、複数のユーザの各々についての契約履歴情報に基づいて、契約の契約期間、及び契約を解約した、周期の単位の組み合わせの各々についての、周期・期間解約率と、時期解約率と、を推定し、契約履歴情報から取得される、指定された属性のユーザが、契約の契約時期の各々に契約した契約数と、推定された周期・期間解約率及び時期解約率と、に基づいて、指定された属性のユーザが時期の各々に解約する解約数を推定し、契約履歴情報から取得される、指定された属性のユーザが時期の各々に解約した解約数と、推定された、時期の各々の解約数と、に基づいて、解約数が異常となる時期を抽出することにより、生存時間の周期性と時系列の周期性を考慮した異常抽出をすることができる。   As described above, according to the abnormality extraction device according to the present embodiment of the present invention, the contract period of the contract and the contract are canceled based on the input contract history information for each of the plurality of users. Estimate the period / period churn rate and period churn rate for each combination of cycle units, and users with specified attributes obtained from the contract history information Based on the number of contracts contracted and the estimated period / period churn rate and period churn rate, the number of churns that the user with the specified attribute churns at each period is estimated and obtained from the contract history information. Based on the number of surrenders that the user with the specified attribute cancels at each time period and the estimated number of surrenders at each time period, the period of survivability is extracted by extracting the time when the surrender number is abnormal Periodicity and periodicity of time series It can be a consideration anomaly extracted.

また、生存関数を周期別に求めて重畳することで、生存時間の周期性だけでなく、時系列の周期性を考慮した異常抽出を実現することができる。   Further, by obtaining and superimposing the survival function for each period, it is possible to realize abnormality extraction considering not only the periodicity of the survival time but also the periodicity of the time series.

また、ノンパラメトリックな数え上げ手法を利用して求めた生存関数を用いるため、分布前提の当てはまりの正当性の確認を必要としない。   In addition, since the survival function obtained using a nonparametric counting method is used, it is not necessary to confirm the validity of the distribution assumption.

また、全体データと局所データとを分けて、信頼できる全体データから分布関数を求め、局所データに適用することで異常抽出を実現することができる。   Further, it is possible to realize abnormality extraction by dividing the whole data and the local data, obtaining a distribution function from the reliable whole data, and applying it to the local data.

また、従来の時系列分析技術と比較した場合、解約の情報だけでなく、契約の情報も考慮した分析となるため、より高精度に異常抽出が可能となる。   Further, when compared with the conventional time series analysis technique, the analysis is performed in consideration of not only the information on cancellation but also the information on the contract, so that the abnormality can be extracted with higher accuracy.

また、サービスの契約/解約、生存/死亡、機器故障等の開始/終了時期が存在する履歴データの分析により、時系列上におけるあるイベントによって生じた、ある特定の集団にのみ局所的に発生した解約リスク増を抽出することができる。それにより、マーケティングにおけるリテンション分析、及び機器故障予測等へ利用することができる。   In addition, by analyzing historical data with the start / end time of service contract / cancellation, survival / death, equipment failure, etc., it occurred locally only in a certain group caused by a certain event in time series An increase in churn risk can be extracted. Thereby, it can utilize for the retention analysis in marketing, equipment failure prediction, etc.

また、図12に示すように、時系列上における何らかのイベントにより生じる解約増の内、図12の実線、又は一点鎖線の円で囲われている周期性や契約期間の節目等で説明がつく解約増と、図12の点線の円で囲われているそれ以外の想定外の解約増を区別して、発見、及び抽出を可能とすることができる。   Also, as shown in FIG. 12, among the surrender increases caused by some event on the time series, the surrender can be explained by the periodicity or the milestones of the contract period enclosed by the solid line or the dashed-dotted circle in FIG. The increase and the other unexpected increase in surrender surrounded by a dotted circle in FIG. 12 can be distinguished to enable discovery and extraction.

2つの異なる時間軸(時系列、及び生存時間)を扱うことにより、時系列上のイベントにより生じる解約リスク増と、時系列上の周期(周期性等)、生存時間上の周期性(契約の節目での解約増等)とを区別して抽出することができる。   By dealing with two different time axes (time series and survival time), the churn risk increase caused by events on the time series, the period on the time series (periodicity, etc.), the periodicity on the survival time (contracts) It is possible to distinguish and extract from the increase in the number of cancellations at milestones).

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   Note that the present invention is not limited to the above-described embodiment, and various modifications and applications are possible without departing from the gist of the present invention.

例えば、本実施の形態においては、営業データへの適用について異常抽出装置を用いる場合について説明したが、これに限定されるものではなく、製品寿命分析、企業の経営分析、災害の影響分析等、開始と終了の時期が取得可能な分野であれば異常抽出装置を応用してもよい。   For example, in the present embodiment, the case where the abnormality extraction device is used for application to sales data has been described, but the present invention is not limited to this, such as product life analysis, company management analysis, disaster impact analysis, etc. As long as the start and end times can be acquired, the abnormality extraction device may be applied.

また、本実施の形態においては、局所(属性)を全国に対応する特定地域(居住地域)とする場合について説明しているが、これに限定されるものではない。例えば、特定の顧客セグメント(顧客属性)、サービス・カテゴリ別等、分類としては何を用いてもよい。   In the present embodiment, the case where the local (attribute) is a specific area (residence area) corresponding to the whole country is described, but the present invention is not limited to this. For example, any classification may be used, such as a specific customer segment (customer attribute) or service category.

また、本実施の形態においては、時系列の扱いを一か月単位の例について説明したがこれに限定されるものではない。例えば、年単位、日単位、時間単位等、任意に設定した単位を用いてもよい。   In the present embodiment, an example of handling time series in units of one month has been described, but the present invention is not limited to this. For example, an arbitrarily set unit such as a year unit, a day unit, or a time unit may be used.

また、本実施の形態においては、周期の単位を暦の月にする場合について説明したがこれに限定されるものではない。例えば、周期の単位として、四半期単位、週単位、日単位、時間単位等、任意に設定した単位を用いてもよい。   In the present embodiment, the case where the unit of the period is a calendar month has been described. However, the present invention is not limited to this. For example, a unit set arbitrarily such as a quarter unit, a week unit, a day unit, or a time unit may be used as a cycle unit.

また、本実施の形態においては、取得された周期・期間解約率P(x,s)を契約期間であるx軸方向に平滑化する平滑化処理を行ったものを周期・期間解約率P(x,s)として取得する場合について説明したが、これに限定されるものではない。例えば、取得された周期・期間解約率P(x,s)をそのまま周期・期間解約率P(x,s)として用いてもよい。   Further, in the present embodiment, a cycle / period churn rate P (() obtained by performing a smoothing process for smoothing the acquired cycle / period churn rate P (x, s) in the x-axis direction which is a contract period. Although the case of acquiring as x, s) has been described, the present invention is not limited to this. For example, the acquired cycle / period churn rate P (x, s) may be used as it is as the cycle / period churn rate P (x, s).

また、本実施の形態においては、平均と分散が等しく、十分に大きいポアソン分布を仮定した正規分布近似による95%信頼区間の算出をする場合について説明したが、これに限定されるものではない。例えば、他の既存手法を用いてもよい。例えば、地域aの契約の各時期tの解約数推定値の分散をとり、当該分散値を用いて、異常値となる時期を抽出してもよい。   In the present embodiment, the description has been given of the case where the 95% confidence interval is calculated by normal distribution approximation assuming a Poisson distribution having a sufficiently large average and variance. However, the present invention is not limited to this. For example, other existing methods may be used. For example, the variance of the estimated churn number at each time t of the contract in the region a may be taken, and the time when the abnormal value may be extracted using the variance value.

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。   Further, in the present specification, the embodiment has been described in which the program is installed in advance. However, the program can be provided by being stored in a computer-readable recording medium or provided via a network. It is also possible to do.


10 入力部
20 演算部
22 契約履歴記憶部
24 生存関数推定部
26 解約数推定部
28 異常抽出部
90 出力部
100 異常抽出装置
,
DESCRIPTION OF SYMBOLS 10 Input part 20 Calculation part 22 Contract history memory | storage part 24 Survival function estimation part 26 Cancellation number estimation part 28 Abnormality extraction part 90 Output part 100 Abnormality extraction apparatus

Claims (7)

入力された、複数のユーザの各々についての前記ユーザの契約及び解約に関する情報と、前記複数のユーザの各々についての前記ユーザの属性に関する情報とを含む契約履歴情報に基づいて、前記契約の契約期間、及び前記契約を解約した、所定期間を単位とする時系列の周期の単位の組み合わせの各々についての、前記周期の単位に前記契約期間の契約が解約された周期・期間解約率と、前記契約の契約時期の各々についての、前記契約時期の契約が解約された時期解約率と、を推定する生存関数推定部と、
前記契約履歴情報から取得される、指定された属性のユーザが、前記契約の契約時期の各々に契約した契約数と、前記生存関数推定部により推定された周期・期間解約率及び時期解約率と、に基づいて、前記指定された属性のユーザが時期の各々に解約する解約数を推定する解約数推定部と、
前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記解約数推定部により推定された、前記時期の各々の前記解約数と、に基づいて、解約数が異常となる時期を抽出する異常抽出部と、
を含む、異常抽出装置。
The contract period of the contract based on the contract history information including the input information regarding the contract and cancellation of the user for each of the plurality of users and the information regarding the attribute of the user for each of the plurality of users. And the period / period cancellation rate at which the contract of the contract period is canceled in the unit of the period for each combination of the units of the time-series period with the predetermined period as the unit, and the contract A survival function estimator for estimating a contract cancellation rate at which the contract at the contract period is canceled for each of the contract periods;
Obtained from the contract history information, the number of contracts that the user of the specified attribute has contracted with each of the contract periods of the contract, the period / period churn rate and the period churn rate estimated by the survival function estimation unit, , A churn number estimation unit for estimating the number of churns that the user of the specified attribute churns at each time period,
Obtained from the contract history information, based on the number of churns canceled by the user of the designated attribute at each of the times and the number of churns at each of the times estimated by the churn number estimating unit. An anomaly extraction unit that extracts the time when the number of cancellations becomes abnormal,
An abnormal extraction device including
前記異常抽出部は、前記推定された前記時期の各々の解約数に基づいて、解約数の推定値の信頼区間を推定し、
前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記推定された解約数の推定値の信頼区間と、に基づいて、解約数が、前記信頼区間に属さない時期を、解約数が異常となる時期として抽出する請求項1記載の異常抽出装置。
The abnormality extraction unit estimates a confidence interval of an estimated value of the churn number based on the churn number of each of the estimated times,
Based on the number of churns that the user of the specified attribute churns at each of the times acquired from the contract history information, and the confidence interval of the estimated value of the churn number, the number of churns is: The abnormality extraction device according to claim 1, wherein a period that does not belong to the confidence interval is extracted as a period when the churn number becomes abnormal.
前記生存関数推定部は、前記契約の契約期間、及び前記契約を解約した前記周期の単位の組み合わせの各々について推定した、前記周期の単位に前記契約期間の契約が解約された周期・期間解約率に対して、前記契約期間の方向に平滑化する平滑化処理をおこなうことにより、前記周期・期間解約率を推定する請求項1又は2記載の異常抽出装置。   The survival function estimation unit estimates each of the contract period of the contract and the combination of the units of the cycle that has canceled the contract, and the period / period churn rate at which the contract of the contract period is canceled in the unit of the period The abnormality extraction device according to claim 1 or 2, wherein the period / period churn rate is estimated by performing a smoothing process for smoothing in the direction of the contract period. 生存関数推定部と、解約数推定部と、異常抽出部と、を含む異常抽出装置における、異常抽出方法であって、
前記生存関数推定部は、入力された、複数のユーザの各々についての前記ユーザの契約及び解約に関する情報と、前記複数のユーザの各々についての前記ユーザの属性に関する情報とを含む契約履歴情報に基づいて、前記契約の契約期間、及び前記契約を解約した、所定期間を単位とする時系列の周期の単位の組み合わせの各々についての、前記周期の単位に前記契約期間の契約が解約された周期・期間解約率と、前記契約の契約時期の各々についての、前記契約時期の契約が解約された時期解約率と、を推定し、
前記解約数推定部は、前記契約履歴情報から取得される、指定された属性のユーザが、前記契約の契約時期の各々に契約した契約数と、前記生存関数推定部により推定された周期・期間解約率及び時期解約率と、に基づいて、前記指定された属性のユーザが時期の各々に解約する解約数を推定し、
前記異常抽出部は、前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記解約数推定部により推定された、前記時期の各々の前記解約数と、に基づいて、解約数が異常となる時期を抽出する、
異常抽出方法。
An abnormality extraction method in an abnormality extraction device including a survival function estimation unit, a churn number estimation unit, and an abnormality extraction unit,
The survival function estimation unit is input based on contract history information including information on the contract and cancellation of the user for each of the plurality of users and information on the attribute of the user for each of the plurality of users. For each of the combinations of the contract period of the contract and the unit of the unit of the time-series period with the predetermined period as the unit, the period in which the contract of the contract period is canceled in the unit of the period Estimating the period churn rate and the churn rate at which the contract at the contract date was canceled for each of the contract dates of the contract,
The churn number estimation unit is obtained from the contract history information, and the number of contracts that the user with the specified attribute has contracted with each contract period of the contract, and the period / period estimated by the survival function estimation unit. Based on the churn rate and the churn rate, the number of churns that the user of the specified attribute churns at each of the times is estimated,
The abnormality extraction unit is obtained from the contract history information, and the number of churns canceled by the user of the designated attribute at each of the times, and the churn number estimation unit estimated by the churn number estimation unit Based on the number of surrenders, extract the time when the surrender number is abnormal,
Abnormal extraction method.
前記異常抽出部により抽出することは、前記推定された前記時期の各々の解約数に基づいて、解約数の推定値の信頼区間を推定し、
前記契約履歴情報から取得される、前記指定された属性のユーザが前記時期の各々に解約した解約数と、前記推定された解約数の推定値の信頼区間と、に基づいて、解約数が、前記信頼区間に属さない時期を、解約数が異常となる時期として抽出する請求項4記載の異常抽出方法。
The extraction by the abnormality extraction unit estimates a confidence interval of the estimated value of the churn number based on the churn number of each of the estimated times,
Based on the number of churns that the user of the specified attribute churns at each of the times acquired from the contract history information, and the confidence interval of the estimated value of the churn number, the number of churns is: The abnormality extraction method according to claim 4, wherein a period that does not belong to the confidence interval is extracted as a period when the number of cancellations becomes abnormal.
前記生存関数推定部により推定することは、前記契約の契約期間、及び前記契約を解約した前記周期の単位の組み合わせの各々について推定した、前記周期の単位に前記契約期間の契約が解約された周期・期間解約率に対して、前記契約期間の方向に平滑化する平滑化処理をおこなうことにより、前記周期・期間解約率を推定する請求項4又は5記載の異常抽出方法。   Estimating by the survival function estimating unit estimates the contract period of the contract and the combination of the units of the period when the contract is canceled, and the period when the contract of the contract period is canceled in the unit of the period 6. The abnormality extraction method according to claim 4 or 5, wherein the period / period churn rate is estimated by performing a smoothing process to smooth the period churn rate in the direction of the contract period. コンピュータを、請求項1〜3の何れか1項記載の異常抽出装置を構成する各部として機能させるためのプログラム。   The program for functioning a computer as each part which comprises the abnormality extraction device of any one of Claims 1-3.
JP2014245174A 2014-12-03 2014-12-03 Abnormality extraction apparatus, method, and program Active JP6302828B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014245174A JP6302828B2 (en) 2014-12-03 2014-12-03 Abnormality extraction apparatus, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014245174A JP6302828B2 (en) 2014-12-03 2014-12-03 Abnormality extraction apparatus, method, and program

Publications (2)

Publication Number Publication Date
JP2016110289A true JP2016110289A (en) 2016-06-20
JP6302828B2 JP6302828B2 (en) 2018-03-28

Family

ID=56124078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014245174A Active JP6302828B2 (en) 2014-12-03 2014-12-03 Abnormality extraction apparatus, method, and program

Country Status (1)

Country Link
JP (1) JP6302828B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190012756A (en) * 2017-07-28 2019-02-11 고려대학교 산학협력단 Method and device for similar equipment clustering using feature extraction method based on survival function
CN111124421A (en) * 2019-12-23 2020-05-08 卓尔智联(武汉)研究院有限公司 Abnormal contract data detection method and device for intelligent contracts of block chains

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0764965A (en) * 1993-08-30 1995-03-10 Hitachi Ltd Method for predicting sales quantity
JP2002366732A (en) * 2001-06-11 2002-12-20 Sas Institute Japan Ltd Customer maintenance supporting system with respect to member customer
JP2007179441A (en) * 2005-12-28 2007-07-12 Fujitsu Ltd Cancellation analyzing device and its program
JP2013073534A (en) * 2011-09-29 2013-04-22 Nippon Telegr & Teleph Corp <Ntt> Customer survival rate estimation system, customer survival rate estimation method, customer survival rate estimation processing server and program for customer survival rate estimation processing server
JP2013239065A (en) * 2012-05-16 2013-11-28 Nippon Telegr & Teleph Corp <Ntt> Initial purchase estimation device, initial purchase estimation method and initial purchase estimation program
JP2014093042A (en) * 2012-11-06 2014-05-19 Nippon Telegr & Teleph Corp <Ntt> Survival rate estimation apparatus, method and program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0764965A (en) * 1993-08-30 1995-03-10 Hitachi Ltd Method for predicting sales quantity
JP2002366732A (en) * 2001-06-11 2002-12-20 Sas Institute Japan Ltd Customer maintenance supporting system with respect to member customer
JP2007179441A (en) * 2005-12-28 2007-07-12 Fujitsu Ltd Cancellation analyzing device and its program
JP2013073534A (en) * 2011-09-29 2013-04-22 Nippon Telegr & Teleph Corp <Ntt> Customer survival rate estimation system, customer survival rate estimation method, customer survival rate estimation processing server and program for customer survival rate estimation processing server
JP2013239065A (en) * 2012-05-16 2013-11-28 Nippon Telegr & Teleph Corp <Ntt> Initial purchase estimation device, initial purchase estimation method and initial purchase estimation program
JP2014093042A (en) * 2012-11-06 2014-05-19 Nippon Telegr & Teleph Corp <Ntt> Survival rate estimation apparatus, method and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190012756A (en) * 2017-07-28 2019-02-11 고려대학교 산학협력단 Method and device for similar equipment clustering using feature extraction method based on survival function
KR101982235B1 (en) 2017-07-28 2019-05-24 고려대학교 산학협력단 Method and device for similar equipment clustering using feature extraction method based on survival function
CN111124421A (en) * 2019-12-23 2020-05-08 卓尔智联(武汉)研究院有限公司 Abnormal contract data detection method and device for intelligent contracts of block chains
CN111124421B (en) * 2019-12-23 2023-04-21 卓尔智联(武汉)研究院有限公司 Abnormal contract data detection method and device for blockchain intelligent contract

Also Published As

Publication number Publication date
JP6302828B2 (en) 2018-03-28

Similar Documents

Publication Publication Date Title
US9727533B2 (en) Detecting anomalies in a time series
JP6141235B2 (en) How to detect anomalies in time series data
CN106104496A (en) The abnormality detection not being subjected to supervision for arbitrary sequence
CN106033424B (en) Data mining method and device
US20180039766A1 (en) Method and system for identifying a unique mobile device based on mobile device attribute changes over time
US9600391B2 (en) Operations management apparatus, operations management method and program
CN102508774A (en) Modeling method for software reliability growth model based on novel environmental factor function
EP2963553A1 (en) System analysis device and system analysis method
CN108154252A (en) Method and apparatus for estimating the flow deadline
JP6302828B2 (en) Abnormality extraction apparatus, method, and program
WO2016106100A1 (en) Retention risk mitigation system
CN111259922A (en) Order data processing method and device based on customer order-returning early warning
KR101361208B1 (en) Method for recommending papers using belief propagation
Lödding et al. Modelling schedule reliability
Wang An unreliable Geo/G/1 queue with startup and closedown times under randomized finite vacations
JP6340777B2 (en) Store visitor attribute distribution information estimation device and program
Moiseev et al. Interval forecast for model averaging methods
US20150024358A1 (en) Stress assessment device, stress assessment method and recording medium
Creemers et al. G-RAND: A phase-type approximation for the nonstationary G (t)/G (t)/s (t)+ G (t) queue
Nadaf et al. Data mining in telecommunication
Halkos et al. Evaluating alternative frequentist inferential approaches for optimal order quantities in the newsvendor model under exponential demand
JP5650290B1 (en) Operational risk measurement method and apparatus
Li The probabilistic life table and its applications to Canada
CN106067086A (en) Human reliability based on 4M1E framework analyzes method
JP5564544B2 (en) Method and system for counting work amount by customer attribute

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180305

R150 Certificate of patent or registration of utility model

Ref document number: 6302828

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150