WO2018142753A1 - ディープラーニングを用いる情報処理装置、情報処理方法及び情報処理プログラム - Google Patents

ディープラーニングを用いる情報処理装置、情報処理方法及び情報処理プログラム Download PDF

Info

Publication number
WO2018142753A1
WO2018142753A1 PCT/JP2017/043565 JP2017043565W WO2018142753A1 WO 2018142753 A1 WO2018142753 A1 WO 2018142753A1 JP 2017043565 W JP2017043565 W JP 2017043565W WO 2018142753 A1 WO2018142753 A1 WO 2018142753A1
Authority
WO
WIPO (PCT)
Prior art keywords
prediction
deep learning
variable
data
information processing
Prior art date
Application number
PCT/JP2017/043565
Other languages
English (en)
French (fr)
Inventor
雄介 大井
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to US16/481,891 priority Critical patent/US20190392295A1/en
Priority to JP2018565965A priority patent/JP7017149B2/ja
Publication of WO2018142753A1 publication Critical patent/WO2018142753A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Definitions

  • the present invention relates to an information processing apparatus that extracts a variable that well explains a predicted value by deep learning.
  • MCIF Marketing Customer Information Information File: customer attribute information, customer product holding information, customer contract information, customer transaction information, customer usage channel information, customer contact information, customer promotion result information, customer survey information,
  • customer attribute data A wide variety of customer information such as customer revenue information and some external information is stored as customer attribute data.
  • customer attributes are gender and age.
  • the customer product possession information includes information on ordinary deposits (including amount information), information on changes in total assets, and information on the ratio of ordinary deposits to total assets.
  • customer use channel information there are information on the annual use frequency of ATM (Automated Teller Machine), information on the annual use frequency of ATM accompanied by a fee, information on the annual use frequency of the counter, and the like.
  • customer promotion result information there is information indicating whether or not a response to direct mail has been made.
  • MCIF Customer Insight
  • Customer Insight is the heart and heart of customer behavior and attitude. For example, for customers using card loans, the number of deposits and withdrawals tends to increase by 50% in the month before the bonus month.
  • Customer Insight may be expressed as consumer Insight.
  • customers are often expressed as consumers.
  • ⁇ ⁇ Logistic regression analysis is mainly used for MCIF data analysis. For example, a stepwise method is used to select explanatory variables for logistic regression analysis.
  • the stepwise method often used for logistic regression model generation is a method of repeating model evaluation while adding explanatory variables one by one.
  • the analyst adds the objective variables in order from the explanatory variables that are considered to be the best explanation, and the analyst terminates the addition of the explanatory variables when it is determined that the model that achieves the required prediction accuracy has been constructed. Therefore, the completed model may strongly reflect the subjectivity of the analyst. Note that “well explained the objective variable” corresponds to a high degree of influence on the objective variable (large standard partial regression coefficient).
  • Deep learning Deep learning
  • Deep learning includes a function that automatically extracts feature quantities that have a high degree of influence on objective variables from explanatory variables.
  • Non-Patent Document 1 describes the analysis of MCIF data using deep learning.
  • Non-Patent Document 1 describes that deep learning can improve prediction accuracy by 10 points or more compared to conventional machine learning.
  • Non-Patent Document 1 describes that a new card loan holder for the next three months is predicted based on MCIF's data for the past 12 months.
  • a logistic regression model and a deep learning model as conventional machine learning were constructed using learning data composed of data for the past 12 months and correct data for 3 months. Both models were then evaluated using additional validation data over a 15 month period. Specifically, data for 12 months of the verification data was input to each model, and evaluation was made by comparing the prediction result of each model with the correct data for 3 months.
  • the analysis can be performed without narrowing down the explanatory variables, so the above-mentioned problem that the explanatory variables may be missed when the explanatory variables are narrowed down is solved.
  • deep learning is a black-box analysis technique that cannot explain the rules found.
  • the contents of a model generated from data cannot be known.
  • the analyst cannot know which explanatory variables affect the prediction results.
  • Deep learning is a black box technology, which is a hurdle when using deep learning in fields that require descriptiveness. For example, there is a marketing business as a field where descriptiveness is required. In marketing operations, it is desirable to extract Customer Insights to explain consumer behavior (new ownership of card loans, etc.). As Customer Insight, for example, there is a temporary shortage of money held by consumers.
  • the object of the present invention is to enable extraction of main explanatory variables in a deep learning model.
  • An information processing apparatus using deep learning uses a deep learning prediction unit that executes a prediction process using a deep learning model based on data stored in a database, and a prediction result by the deep learning prediction unit as an objective variable.
  • variable extraction means for performing multiple regression analysis using the data stored in the database as explanatory variables and determining variables for explaining the prediction results of the deep learning model based on the results of the multiple regression analysis It is characterized by.
  • An information processing method using deep learning executes a prediction process using a deep learning model based on data stored in a database, and uses a prediction result of the prediction process as a target variable, which is stored in the database. Multiple regression analysis is performed using the data as explanatory variables, and variables for explaining the prediction results of the deep learning model are determined based on the results of the multiple regression analysis.
  • An information processing program using deep learning uses a computer to execute a prediction process using a deep learning model based on data stored in a database, and a prediction result of the prediction process as a target variable.
  • the multiple regression analysis is performed using the data stored in the data as explanatory variables, and based on the results of the multiple regression analysis, a process for determining variables for explaining the prediction results of the deep learning model is executed. .
  • FIG. 1 is a block diagram showing a configuration of a Customer Insight automatic extraction device 100 as an embodiment of the present invention.
  • the Customer Insight automatic extraction device 100 includes an MCIF storage unit 1, a first attribute data extraction unit 2, a deep learning learning unit 3, a deep learning model storage unit 4, a second attribute data extraction unit 5, A learning prediction unit 6, a prediction result storage unit 7, and an explanatory variable extraction unit 8 are included.
  • each block surrounded by a broken line is a block related to deep learning.
  • the Customer Insight automatic extraction device 100 is realized by an information processing device such as a personal computer or a server. That is, the first attribute data extraction unit 2, the deep learning learning unit 3, the second attribute data extraction unit 5, the deep learning prediction unit 6, and the explanatory variable extraction unit 8 are a storage device such as a ROM (Read Only Memory) or a hard disk. It is realized by an information processing apparatus having a CPU (Central Processing Unit) that executes processing according to a program stored in. In the present embodiment, an example in which the Customer Insight automatic extraction apparatus 100 is realized by a server is assumed.
  • a CPU Central Processing Unit
  • the first attribute data extraction unit 2, the deep learning learning unit 3, the second attribute data extraction unit 5, the deep learning prediction unit 6, and the explanatory variable extraction unit 8 can be realized by individual hardware.
  • the MCIF storage unit 1 is a database that stores MCIF.
  • the MCIF storage unit 1 may be installed outside the Customer-Insight automatic extraction device 100, or may be installed so as to be accessible via a communication network.
  • the first attribute data extraction unit 2 extracts attribute data and correct answer data (hard target) used by the deep learning learning unit 3 from the MCIF.
  • the deep learning learning unit 3 performs learning using the learning attribute data and the correct answer data extracted by the first attribute data extraction unit 2, and creates a deep learning model.
  • the deep learning model storage unit 4 holds the learning result (deep learning model) of the deep learning learning unit 3.
  • the second attribute data extraction unit 5 extracts attribute data used by the deep learning prediction unit 6 and the explanatory variable extraction unit 8 from the MCIF.
  • the deep learning prediction unit 6 inputs a deep learning model from the deep learning model storage unit 4, performs prediction on the attribute data extracted by the second attribute data extraction unit 5, and performs scoring.
  • the prediction result storage unit 7 pairs the attribute data extracted by the second attribute data extraction unit 5 and the soft target (score attached to the corresponding attribute data by the deep learning prediction unit 6) for each record (pair ) And hold.
  • the explanatory variable extraction unit 8 performs a multiple regression analysis using the attribute data read from the prediction result storage unit 7 and the soft target, and is a main explanatory variable that well explains the objective variable (soft target) corresponding to the attribute data. (K items having a large weight value or standard partial regression coefficient in the multiple regression equation) are extracted.
  • the value of k is a natural number that can be arbitrarily set, but is, for example, a value corresponding to 5% of the whole.
  • the Customer Insight automatic extraction apparatus 100 executes pre-training processing (pre-training: deep learning learning processing), deep learning prediction processing, and explanatory variable extraction processing.
  • FIG. 2 is a flowchart showing the pre-learning process.
  • the first attribute data extraction unit 2 reads member (customer) attribute data and correct data (hard target) from the MCIF storage unit 1 and uses them as learning data (step S101).
  • the first attribute data extraction unit 2 extracts, for example, all attribute data (referred to as attribute data # 1) in a predetermined period (learning period) as explanatory variables in the process of step S101.
  • the deep learning learning unit 3 performs learning using the read learning data (step S102).
  • the deep learning learning unit 3 stores the deep learning model created by learning in the deep learning model storage unit 4 (step S103).
  • FIG. 3 is a flowchart showing the deep learning prediction process.
  • the second attribute data extraction unit 5 reads member (customer) attribute data from the MCIF storage unit 1 (step S201).
  • the deep learning prediction unit 6 reads the deep learning model from the deep learning model storage unit 4 (step S202).
  • the deep learning prediction unit 6 extracts, as an explanatory variable, attribute data (referred to as attribute data # 2) in a period (unlearned period) different from the period to which the attribute data # 1 belongs in the process of step S201. .
  • the deep learning prediction unit 6 uses the attribute data # 2 as input data, performs prediction using the deep learning model read out in the process of step S202, and calculates a prediction score (predicted value) (step S203). As shown in FIG. 4, the prediction result (predicted value) is associated with the record ID (customer ID).
  • the deep learning prediction unit 6 stores the prediction result (prediction value) and attribute data # 2 obtained in step S203 as a pair with the record ID in the prediction result storage unit 7 (step S204).
  • FIG. 5 is an explanatory diagram illustrating an example of a prediction result (prediction value) and attribute data # 2 stored in the prediction result storage unit 7.
  • the attribute data # 2 includes data related to M types of attributes from the attribute value # 1 to the attribute value #M.
  • the predicted value obtained in the process of step S203 is positioned as the predicted value (soft target) of the objective variable.
  • the predicted value is an objective variable in the multiple regression analysis.
  • FIG. 6 is a flowchart showing the explanatory variable extraction process.
  • the explanatory variable extraction unit 8 reads the attribute data # 2 and the predicted value calculated from the soft target, that is, the deep learning model, from the prediction result storage unit 7 (step S301).
  • the explanatory variable extraction unit 8 performs multiple regression analysis using the read attribute data # 2 and the soft target (step S302).
  • the explanatory variable extraction unit 8 sets attribute data # 2 as an explanatory variable for multiple regression analysis in the process of step S302, and sets the predicted value obtained in the process of step S203 as an objective variable for multiple regression analysis.
  • the explanatory variable extraction unit 8 extracts k cases having a large weight value (partial regression coefficient) as main explanatory variables in the multiple regression equation derived by the multiple regression analysis in step S302 (step S303).
  • the extracted explanatory variables are the main explanatory variables of the deep learning model.
  • the explanatory variable is a variable obtained by a white box type machine learning technique. Therefore, in the present embodiment, it is possible to reduce the possibility that the explanatory variable will be overlooked, and to grasp the variable affecting the prediction result. In other words, the analyst can explain the variables that affect the prediction results even using deep learning.
  • the data of the unlearned period is predicted using the deep learning model created from the attribute data # 1 of the learning period, and the score (predicted value) of the prediction result is calculated.
  • the main explanatory variables of the deep learning model can be extracted by performing multiple regression analysis using the attribute data # 2 of the unlearned period and the soft target as the soft target.
  • the Customer Insight automatic extraction apparatus 100 of the present embodiment can specify an explainable variable that affects the prediction result, the Customer Insight is estimated from the degree of influence (partial regression coefficient of multiple regression analysis). It becomes possible.
  • Embodiment 2 In the first embodiment, multiple regression analysis using all prediction results by deep learning is executed. In the second embodiment, objective variables in multiple regression analysis are narrowed down.
  • FIG. 7 is a block diagram illustrating a configuration of the Customer Insight automatic extraction apparatus 101 according to the second embodiment.
  • the Customer ⁇ ⁇ ⁇ ⁇ Insight automatic extraction device 101 includes a logistic regression model storage unit 9, a logistic regression prediction unit 10, and a prediction in addition to the blocks included in the Customer Insight automatic extraction device 100 shown in FIG. 1.
  • a result totaling unit 11 is provided.
  • the logistic regression prediction unit 10 and the prediction result totaling unit 11 are realized by a CPU that executes processing according to a program stored in a storage device such as a ROM or a hard disk in a server, for example.
  • a storage device such as a ROM or a hard disk in a server
  • the logistic regression prediction unit 10 and the prediction result totaling unit 11 may be realized by individual hardware.
  • the logistic regression model storage unit 9 holds a model using logistic regression (logistic regression model).
  • the logistic regression model is created in advance and stored in the logistic regression model storage unit 9.
  • the objective variable of the logistic regression model is, for example, a new card loan holder
  • the explanatory variable of the logistic regression model is attribute data of a customer that is considered to have a high influence on the new card loan holder.
  • the logistic regression prediction unit 10 reads a logistic regression model (hereinafter referred to as an existing model) from the logistic regression model storage unit 9, and performs attribute data # 2 extracted from the MCIF storage unit 1 by the second attribute data extraction unit 5. Run predictions and score.
  • a logistic regression model hereinafter referred to as an existing model
  • the prediction result totaling unit 11 has a high score (high prediction value) N% for data scored by the deep learning prediction unit 6 and the logistic regression prediction unit 10, and a low score for other data.
  • the data is divided into two. Note that the value of N can be set arbitrarily, but is “5” as an example.
  • the prediction result totaling unit 11 creates a table as shown in FIG. 8 so that comparison of data becomes easy. An unknown persona is set in the table.
  • “Persona” means Customer Insight.
  • FIG. 9 is an explanatory diagram showing a comparison between the evaluation result using the logistic regression model described in Non-Patent Document 1 and the evaluation result using the deep learning model.
  • the evaluation described in Non-Patent Document 1 is a prediction of a new card loan holder (extraction of a customer with a high prospect (score) to be newly held).
  • FIG. 9A shows the ratio of overlapping customers when a customer having a higher score is extracted from the evaluation result based on the logistic regression model and the evaluation result based on the deep learning model.
  • FIG. 9B is an explanatory diagram in which customers are plotted in correspondence with% when the correct customer's deep learning score and the correct customer's logistic regression analysis score are displayed in%.
  • the analysis is performed for a customer with a high likelihood that was not extracted by the logistic regression analysis.
  • a customer corresponds to “(2) unknown persona” in FIG.
  • the Customer Insight automatic extraction device 101 executes a pre-learning process, a prediction result aggregation process, and an explanatory variable extraction process.
  • the pre-learning process and the explanatory variable extraction process in the second embodiment are executed in the same manner as the pre-learning process and the explanatory variable extraction process in the first embodiment.
  • FIG. 10 is a flowchart showing the prediction result totaling process.
  • the second attribute data extraction unit 5 reads member (customer) attribute data # 2 from the MCIF storage unit 1 (step S401).
  • the deep learning prediction unit 6 reads the deep learning model from the deep learning model storage unit 4 (step S402).
  • the deep learning prediction unit 6 uses the attribute data # 2 as input data, performs prediction with the deep learning model read out in the process of step S402, and calculates a prediction score (predicted value) (step S403).
  • the logistic regression prediction unit 10 reads the logistic regression model from the logistic regression model storage unit 9 (step S404).
  • the logistic regression prediction unit 10 performs prediction using the attribute data # 2 and the logistic regression model, and calculates a prediction score (prediction value) (step S405).
  • the prediction result totaling unit 11 totals the prediction score based on the deep learning model and the prediction score based on the logistic regression, and creates a table as illustrated in FIG. 8 (step S406).
  • the prediction result totaling unit 11 classifies all prediction scores into binary values. For example, the top N% of the prediction score is “high prediction score”, and the other is “low prediction score”. Further, they are grouped as follows (see FIG. 8).
  • the prediction result totaling unit 11 arranges a prediction score by logistic regression analysis for a customer and a prediction score by deep learning. And the prediction result total part 11 classifies each prediction score into a high score or a low score, and creates a table as shown in FIG. Furthermore, the prediction result totaling unit 11 obtains the table shown in FIG. 8 by totaling the prediction scores.
  • the prediction result totaling unit 11 determines the attribute of the data (sample) belonging to the group (sample group) “the prediction score by deep learning is high and the prediction score by logistic regression analysis is low” among the aggregation results by the process of step S406. Data and a prediction score are preserve
  • the saved attribute data and the predicted score are used in the explanatory variable extraction process as a soft target.
  • the attribute value corresponds to a data group (attribute data # 3) extracted from the attribute data # 2.
  • attribute data # 3 a data group extracted from the attribute data # 2.
  • Customers with high deep learning prediction scores and low logistic regression prediction scores are considered to be customers who are likely to act according to unknown Customer Insights that were not considered in existing models, and their attribute values are , Segmented from attribute data # 2 to be attribute data # 3.
  • the explanatory variable extraction unit 8 reads out the attribute data # 3 and the predicted value calculated from the soft target, that is, the deep learning model, from the prediction result storage unit 7, and executes the multiple regression analysis based on them (see FIG. 6).
  • the following effects can be obtained.
  • the target that can be approached by the existing model the target that can be approached by both models, and the existing It is possible to extract objects that could not be approached with this model.
  • the existing model was not approached because the prediction score was low, but the deep learning model efficiently performed explanatory variables that can be explained by performing multiple regression analysis only on customer data that has a high prediction score. Can be extracted.
  • a logistic regression model is used as an existing model. That is, logistic regression analysis is used as existing machine learning (of course, deep learning is not included). Other white box type machine learning models may be used.
  • MCIF data is analyzed to infer Customer Insight behind the behavior of consumers purchasing financial products (eg, card loans).
  • financial products eg, card loans
  • the method of comparing the score predicted by the existing model and the score predicted by the deep learning model after comparing them and approaching the unknown persona is another way of using the MCIF storage unit 1 It can be applied to other than finance by replacing it with a storage unit for storing person information.
  • an EC (electronic commerce) site buyer prediction for example, an EC (electronic commerce) site buyer prediction, a store customer purchase prediction, an insurance subscriber prediction, and the like can be considered.
  • the EC site purchaser prediction the above-described embodiments can be applied to the EC site user purchaser prediction by replacing the MCIF storage unit 1 with an EC site user information storage unit.
  • FIG. 14 is a block diagram showing a main part of an information processing apparatus using deep learning according to the present invention.
  • the information processing apparatus 20 corresponds to the database 30 (corresponding to the MCIF storage unit 1 in the embodiment).
  • a deep learning prediction unit 21 (implemented by the deep learning prediction unit 6 in the embodiment) that executes a prediction process using a deep learning model based on the data stored in A variable that performs a multiple regression analysis using the prediction result as an objective variable and the data stored in the database 30 as an explanatory variable, and determines a variable for explaining the prediction result of the deep learning model based on the result of the multiple regression analysis
  • an extraction unit 22 (implemented by the explanatory variable extraction unit 8 in the embodiment).
  • FIG. 15 is a block diagram showing a main part of another information processing apparatus using deep learning according to the present invention.
  • the information processing apparatus 20 (corresponding to the Customer Insight automatic extraction apparatus 101 in the embodiment, except for the MCIF storage unit 1) further uses data stored in the database 30.
  • a machine learning unit 23 that performs machine learning (in the embodiment, realized by the logistic regression prediction unit 10) and a predetermined first ratio (for example, 5) selected in descending order of prediction score by the deep learning model.
  • Sample group for example, “customer with high prediction score by deep learning model” in the embodiment) and a predetermined second ratio (for example, selected in descending order of prediction score by machine learning) 95%) sample group (for example, in the embodiment, “the prediction score by logistic regression analysis is low )), Which extracts a plurality of samples (for example, customers) included in the prediction result totaling unit 24 (implemented in the embodiment by the prediction result totaling unit 11).
  • multiple regression analysis may be performed using the data of the plurality of samples as explanatory variables.
  • the database 30 is separated from the information processing apparatus 20, but the information processing apparatus 20 may incorporate the database 30.

Abstract

情報処理装置20は、ディープラーニングのモデルにおける主要な説明変数を抽出できるようにするために、データベース30に格納されているデータに基づいてディープラーニングモデルを用いて予測処理を実行するディープラーニング予測部21と、ディープラーニング予測部21による予測結果を目的変数とし、データを説明変数として重回帰分析を行い、重回帰分析の結果に基づいて、ディープラーニングモデルの予測結果を説明するための変数を決定する変数抽出部22とを備えている。

Description

ディープラーニングを用いる情報処理装置、情報処理方法及び情報処理プログラム
 本発明は、ディープラーニングによる予測値を良く説明する変数を抽出する情報処理装置に関する。
 金融機関などの企業は、MCIF(Marketing Customer Information File :顧客属性情報、顧客商品保有情報、顧客各種契約情報、顧客トランザクション情報、顧客利用チャネル情報、顧客コンタクト情報、顧客プロモーション結果情報、顧客アンケート情報、顧客収益情報、一部の外部情報などの多岐に渡る顧客情報が、顧客番号によって一元管理された膨大なシングルソースデータ)を、顧客の属性データとして保有している。一例として、顧客属性は、性別や年齢である。顧客商品保有情報として、普通預金の情報(金額情報を含む。)、総資産額の変動の情報、総資産に占める普通預金の割合の情報などがある。顧客利用チャネル情報として、ATM(Automated Teller Machine)の年間利用回数の情報、手数料を伴うATMの年間利用回数の情報、窓口の年間利用回数の情報などがある。顧客プロモーション結果情報として、ダイレクトメールに応答したか否かを示す情報などがある。
 金融機関などの企業は、MCIFのデータを分析して、消費者が商品(一例として、金融機関が提供するカードローン)を購入する行動の背後にあるCustomer Insight(顧客深層心理)を抽出することがある。Customer Insightは、顧客の行動や態度の根底にある本音や核心である。例えば、カードローンを利用する顧客に関して、ボーナス月の前月に入出金回数が50%増大する傾向がある。なお、顧客は消費者に含まれることがあるので、以下、Customer Insightを消費者深層心理(Consumer Insight)と表現することがある。また、顧客を、消費者と広く表現することがある。
 MCIFのデータの分析には、主として、ロジスティック回帰分析が使用されている。ロジスティック回帰分析の説明変数の選択には、例えば、ステップワイズ法が使用される。
 ロジスティック回帰分析を使用する場合、妥当な分析結果を得るための説明変数の数は100未満程度である。ところが、一般に、分析対象のデータ(MCIFのデータなど)には、説明変数になり得る10,000程度のデータが含まれている。よって、分析者は、回帰分析に使用する説明変数を、暗黙知などに基づいて100程度に絞り込む必要がある。
 また、ロジスティック回帰のモデル生成によく使用されるステップワイズ法は、説明変数を1個ずつ追加しながらモデル評価を繰り返す手法である。分析者は、目的変数を最も良く説明すると考える説明変数から順番に追加して、分析者は、所要の予測精度を達成するモデルを構築できたと判断したタイミングで説明変数の追加を打ち切る。従って、でき上がったモデルには、分析者の主観が強く反映されている可能性がある。なお、「良く目的変数を説明する」は、目的変数に対する影響度が高い(標準偏回帰係数が大きい)ことに対応する。
 すなわち、ロジスティック回帰分析をはじめとする、発見したルールを説明できるホワイトボックス型の機械学習技術(重回帰分析や決定木学習など)では、分析者の主観によって選択された限られた説明変数から予測が行われる。その結果、予測の際に説明変数の見逃しが発生する可能性が生ずる。
 ディープラーニング(深層学習)は、説明変数選択を自動化する分析フレームワークとして注目されている。ディープラーニングは、目的変数への影響度が高い特徴量を説明変数から自動抽出する機能を内包している。
 非特許文献1に、ディープラーニングを用いたMCIFのデータの分析が記載されている。非特許文献1には、従前の機械学習と比較して、ディープラーニングは、予測精度を10ポイント以上改善できると記載されている。
 なお、非特許文献1には、MCIFから顧客の過去の12ヶ月間のデータを入力とし、将来の3ヶ月間のカードローン新規保有者が予測されたことが記載されている。まず、過去の12ヶ月間のデータと3ヶ月間の正解データとからなる学習データを用いて、従前の機械学習としてのロジスティック回帰モデルとディープラーニングモデルとが構築された。その後、15ヶ月間に亘る別の検証データを用いて、双方のモデルが評価された。具体的には、各々のモデルに、検証データのうちの12ヶ月間のデータが入力され、各々のモデルの予測結果と3ヶ月間の正解データとが比較されることによって、評価がなされた。
 ディープラーニングのモデルを使用すると、説明変数の絞込みを行わずに分析ができるので、説明変数を絞込むときに説明変数を見逃すことがあるという上述した課題が解決される。
「金融行動に対する人工知能の実証研究」,影井 智宏(Tomohiro KAGEI) 友永 康之(Yasuyuki TOMONAGA ) 松下 伴理(Banri MATSUSHITA),日本マーケティング学会(Japan Marketing Academy ),Conference Proceedings vol.5 2016 197-208ページ,2016年10月12日発行
 しかし、ディープラーニングは、発見したルールを説明できないブラックボックス型の分析技術である。換言すれば、ディープラーニングでは、データから生成されたモデルの中身を知ることができない。よって、分析者は、どの説明変数が予測結果に影響を与えているか知ることができない。
 ディープラーニングがブラックボックス型の技術であることが、説明性が求められる分野でディープラーニングを使用する際のハードルになっている。説明性が求められる分野として、例えば、マーケティング業務がある。マーケティング業務では、消費者行動(カードローンの新規保有等)を説明するためのCustomer Insightを抽出することが望ましい。Customer Insightとして、例えば、消費者の一時的な所持金不足がある。
 本発明は、ディープラーニングのモデルにおける主要な説明変数を抽出できるようにすることを目的とする。
 本発明によるディープラーニングを用いる情報処理装置は、データベースに格納されているデータに基づいてディープラーニングモデルを用いて予測処理を実行するディープラーニング予測手段と、ディープラーニング予測手段による予測結果を目的変数とし、データベースに格納されているデータを説明変数として重回帰分析を行い、重回帰分析の結果に基づいて、ディープラーニングモデルの予測結果を説明するための変数を決定する変数抽出手段とを備えたことを特徴とする。
 本発明によるディープラーニングを用いる情報処理方法は、データベースに格納されているデータに基づいてディープラーニングモデルを用いて予測処理を実行し、予測処理の予測結果を目的変数とし、データベースに格納されているデータを説明変数として重回帰分析を行い、重回帰分析の結果に基づいて、ディープラーニングモデルの予測結果を説明するための変数を決定することを特徴とする。
 本発明によるディープラーニングを用いる情報処理プログラムは、コンピュータに、データベースに格納されているデータに基づいてディープラーニングモデルを用いて予測処理を実行する処理と、予測処理の予測結果を目的変数とし、データベースに格納されているデータを説明変数として重回帰分析を行い、重回帰分析の結果に基づいて、ディープラーニングモデルの予測結果を説明するための変数を決定する処理とを実行させることを特徴とする。
 本発明によれば、ディープラーニングのモデルにおける主要な説明変数(予測結果を良く説明する変数)を抽出できるようになる。
実施形態としてのCustomer Insight自動抽出装置の構成を示すブロック図である。 事前学習処理を示すフローチャートである。 ディープラーニング予測処理を示すフローチャートである。 レコードのID(顧客ID)に対応付けられる予測結果(予測値)の例を示す説明図である。 予測結果(予測値)及び属性データ#2の一例を示す説明図である。 説明変数抽出処理を示すフローチャートである。 他の実施形態のCustomer Insight自動抽出装置の構成を示すブロック図である。 予測結果集計部が作成する表の一例を示す説明図である。 ロジスティック回帰モデルを用いた評価結果とディープラーニングモデルを用いた評価結果との比較の様子を示す説明図である。 予測結果集計処理を示すフローチャートである。 顧客に対するロジスティック回帰による予測スコアとディープラーニングによる予測スコアとの一例を示す説明図である。 顧客IDに対応して、ロジスティック回帰による予測スコアとディープラーニングによる予測スコアとが設定された表の一例を示す説明図である。 顧客IDに対応して、属性値及びディープラーニングによる予測スコアとが設定された表の一例を示す説明図である。 ディープラーニングを用いる情報処理装置の主要部を示すブロック図である。 ディープラーニングを用いる他の情報処理装置の主要部を示すブロック図である。
実施形態1.
 以下、本発明の実施形態を図面を参照して説明する。図1は、本発明の実施形態としてのCustomer Insight自動抽出装置100の構成を示すブロック図である。図1に示すように、Customer Insight自動抽出装置100は、MCIF記憶部1、第1属性データ抽出部2、ディープラーニング学習部3、ディープラーニングモデル記憶部4、第2属性データ抽出部5、ディープラーニング予測部6、予測結果記憶部7、及び説明変数抽出部8を含む。なお、図1において、破線で囲まれた各ブロックは、ディープラーニングに関連するブロックである。
 Customer Insight自動抽出装置100は、パーソナルコンピュータやサーバなどの情報処理装置で実現される。すなわち、第1属性データ抽出部2、ディープラーニング学習部3、第2属性データ抽出部5、ディープラーニング予測部6、及び説明変数抽出部8は、ROM(Read Only Memory)やハードディスクなどの記憶装置に格納されたプログラムに従って処理を実行するCPU(Central Processing Unit )を有する情報処理装置で実現される。本実施形態では、Customer Insight自動抽出装置100がサーバで実現される例を想定する。
 ただし、第1属性データ抽出部2、ディープラーニング学習部3、第2属性データ抽出部5、ディープラーニング予測部6、及び説明変数抽出部8は、個別のハードウェアでも実現可能である。
 MCIF記憶部1は、MCIFを記憶するデータベースである。MCIF記憶部1は、Customer Insight自動抽出装置100の外に設置されていてもよく、通信ネットワークを介してアクセス可能であるように設置されていてもよい。第1属性データ抽出部2は、MCIFから、ディープラーニング学習部3が使用する属性データ及び正解データ(ハードターゲット)を抽出する。ディープラーニング学習部3は、第1属性データ抽出部2が抽出した学習用の属性データ及び正解データを用いて学習を実施し、ディープラーニングモデルを作成する。ディープラーニングモデル記憶部4は、ディープラーニング学習部3の学習結果(ディープラーニングモデル)を保持する。
 第2属性データ抽出部5は、MCIFから、ディープラーニング予測部6及び説明変数抽出部8が使用する属性データを抽出する。ディープラーニング予測部6は、ディープラーニングモデル記憶部4からディープラーニングモデルを入力し、第2属性データ抽出部5によって抽出された属性データに対して予測を実行し、スコア付けを行う。予測結果記憶部7は、第2属性データ抽出部5によって抽出された属性データとソフトターゲット(ディープラーニング予測部6によって、対応する属性データに付けされたスコア)とを、レコードごとに対(pair)にして保持する。
 説明変数抽出部8は、予測結果記憶部7から読み出した属性データとソフトターゲットとを用いて重回帰分析を実施し、属性データに対応する目的変数(ソフトターゲット)を良く説明する主要な説明変数(重回帰式において重み値又は標準偏回帰係数が大きいk件)を抽出する。
 なお、kの値は任意に設定可能な自然数であるが、例えば、全体の5%に相当する値である。
 次に、Customer Insight自動抽出装置100の動作を説明する。Customer Insight自動抽出装置100は、事前学習処理(pre-training:ディープラーニング学習処理)、ディープラーニング予測処理及び説明変数抽出処理を実行する。
 図2は、事前学習処理を示すフローチャートである。事前学習処理において、第1属性データ抽出部2は、MCIF記憶部1から、会員(顧客)の属性データ及び正解データ(ハードターゲット)を読み出し、それらを学習データとする(ステップS101)。
 第1属性データ抽出部2は、ステップS101の処理で、例えば、所定期間(学習用の期間)における全ての属性データ(属性データ#1とする。)を説明変数として抽出する。ディープラーニング学習部3は、読み出された学習データを用いて学習を行う(ステップS102)。
 ディープラーニング学習部3は、学習によって作成したディープラーニングモデルをディープラーニングモデル記憶部4に保存する(ステップS103)。
 図3は、ディープラーニング予測処理を示すフローチャートである。ディープラーニング予測処理において、第2属性データ抽出部5は、MCIF記憶部1から、会員(顧客)の属性データを読み出す(ステップS201)。ディープラーニング予測部6は、ディープラーニングモデル記憶部4からディープラーニングモデルを読み出す(ステップS202)。
 ディープラーニング予測部6は、ステップS201の処理で、上記の属性データ#1が属する期間とは異なる期間(未学習の期間)における属性データ(属性データ#2とする。)を説明変数として抽出する。
 ディープラーニング予測部6は、属性データ#2を入力データとして、ステップS202の処理で読み出したディープラーニングモデルで予測を実行し、予測スコア(予測値)を計算する(ステップS203)。図4に示すように、予測結果(予測値)は、レコードのID(顧客ID)に対応付けられる。
 ディープラーニング予測部6は、ステップS203の処理で得られた予測結果(予測値)及び属性データ#2をレコードのIDと対(pair)にして、予測結果記憶部7に格納する(ステップS204)。図5は、予測結果記憶部7に格納された予測結果(予測値)及び属性データ#2の一例を示す説明図である。図5に示す例では、属性データ#2は、属性値#1から属性値#MのM種類の属性に関するデータを含む。
 なお、ステップS203の処理で得られた予測値は、目的変数の予測値(ソフトターゲット)に位置づけられる。予測値は、重回帰分析における目的変数とされる。
 図6は、説明変数抽出処理を示すフローチャートである。説明変数抽出処理において、説明変数抽出部8は、予測結果記憶部7から、属性データ#2と、ソフトターゲットすなわちディープラーニングモデルから算出された予測値とを読み出す(ステップS301)。説明変数抽出部8は、読み出した属性データ#2とソフトターゲットとを用いて重回帰分析を実行する(ステップS302)。説明変数抽出部8は、ステップS302の処理で、属性データ#2を重回帰分析の説明変数とし、ステップS203の処理で得られた予測値を重回帰分析の目的変数とする。
 説明変数抽出部8は、ステップS302の重回帰分析で導かれる重回帰式において重み値(偏回帰係数)が大きいk件を主要な説明変数として抽出する(ステップS303)。
 抽出された説明変数は、ディープラーニングのモデルの主要な説明変数とされる。説明変数は、ホワイトボックス型の機械学習技術で得られた変数である。よって、本実施形態では、説明変数の見逃しが発生する可能性を低減できる上に、予測結果に影響を与えている変数を把握することが可能になる。換言すれば、分析者は、ディープラーニングを使用しても、予測結果に影響を与える変数を説明できる。
 以上のように、本実施形態では、学習用の期間の属性データ#1から作成されたディープラーニングのモデルを用いて、未学習の期間のデータが予測され、予測結果のスコア(予測値)をソフトターゲットとして、未学習の期間の属性データ#2とソフトターゲットとを使用して重回帰分析することによって、ディープラーニングモデルの主要な説明変数を抽出できる。
 また、本実施形態のCustomer Insight自動抽出装置100は、予測結果に影響を与える説明可能な変数を特定することができるので、影響度(重回帰分析の偏回帰係数)から、Customer Insightを推測することも可能になる。
実施形態2.
 第1の実施形態では、ディープラーニングによる予測結果の全てが使用される重回帰分析が実行されることになるが、第2の実施形態では、重回帰分析における目的変数が絞り込まれる。
 図7は、第2の実施形態のCustomer Insight自動抽出装置101の構成を示すブロック図である。図7に示すように、Customer Insight自動抽出装置101は、図1に示されたCustomer Insight自動抽出装置100が備える各ブロックに加えて、ロジスティック回帰モデル記憶部9、ロジスティック回帰予測部10、及び予測結果集計部11を備えている。
 なお、ロジスティック回帰予測部10及び予測結果集計部11は、例えば、サーバにおいて、ROMやハードディスクなどの記憶装置に格納されたプログラムに従って処理を実行するCPUで実現される。しかし、ロジスティック回帰予測部10及び予測結果集計部11は、個別のハードウェアで実現されてもよい。
 ロジスティック回帰モデル記憶部9は、ロジスティック回帰を用いたモデル(ロジスティック回帰モデル)を保持する。ロジスティック回帰モデルは、あらかじめ作成され、ロジスティック回帰モデル記憶部9に格納される。ロジスティック回帰モデルの目的変数が例えばカードローン新規保有者である場合、ロジスティック回帰モデルの説明変数は、カードローン新規保有者に対する影響度が高いと考えられる顧客の属性データである。
 ロジスティック回帰予測部10は、ロジスティック回帰モデル記憶部9からロジスティック回帰モデル(以下、既存モデルという。)を読み出し、MCIF記憶部1から第2属性データ抽出部5によって抽出された属性データ#2に対して予測を実行し、スコア付けを行う。
 予測結果集計部11は、ディープラーニング予測部6及びロジスティック回帰予測部10によってスコア付けされたデータを、上位(すなわち、予測値が大きい。)N%を高いスコアのデータ、それ以外を低いスコアのデータとして2つに分ける。なお、Nの値は任意に設定可能であるが、一例として「5」である。予測結果集計部11は、データの比較が容易になるように、図8に示すような表を作成する。表には、未知のペルソナが設定される。ここでは、「ペルソナ」は、Customer Insightを意味する。
 図9は、非特許文献1に記載されたロジスティック回帰モデルを用いた評価結果とディープラーニングモデルを用いた評価結果との比較の様子を示す説明図である。非特許文献1に記載された評価は、具体的には、カードローン新規保有者の予測(新規に保有する見込度(スコア)が高い顧客の抽出)である。図9(A)には、ロジスティック回帰モデルによる評価結果とディープラーニングモデルによる評価結果とにおいて、上位のスコアを有する顧客を抽出した場合に重複する顧客の割合が示されている。図9(B)には、正解顧客のディープラーニングでのスコア及び正解顧客のロジスティック回帰分析でのスコアを%表示した場合、%に対応させて顧客がプロットされている説明図である。
 図9(A)に示すように、ディープラーニングモデルを用いた評価結果に基づくスコアが高い順に5%の顧客が抽出され、ロジスティック回帰モデルに基づくスコアが高い順に5%の顧客が抽出されたときに、重複顧客の割合は、40.8%である。また、図9(B)に示すように、正解顧客のうち高いスコアを有する者は、ロジスティック回帰モデルで評価された場合でもディープラーニングモデルで評価された場合でも集中して分布するが(図9(B)における丸囲み参照)、分布の集中エリアから離れて分布する正解顧客(ディープラーニングモデルで評価された場合の高いスコアを有する正解顧客)も存在する。このことから、ディープラーニングによって、ロジスティック回帰分析では抽出されなかった見込み度が高い顧客(この例では、カードローンを新規に保有する者)も抽出されたといえる。
 第2の実施形態では、ロジスティック回帰分析では抽出されなかった見込み度が高い顧客を対象として分析が行われる。なお、そのような顧客は、図8における「(2)未知のペルソナ」に対応する。
 第2の実施形態では、Customer Insight自動抽出装置101は、事前学習処理、予測結果集計処理及び説明変数抽出処理を実行する。第2の実施形態における事前学習処理及び説明変数抽出処理は、第1の実施形態における事前学習処理及び説明変数抽出処理と同様に実行される。
 図10は、予測結果集計処理を示すフローチャートである。予測結果集計処理において、第2属性データ抽出部5は、MCIF記憶部1から、会員(顧客)の属性データ#2を読み出す(ステップS401)。ディープラーニング予測部6は、ディープラーニングモデル記憶部4からディープラーニングモデルを読み出す(ステップS402)。
 ディープラーニング予測部6は、属性データ#2を入力データとして、ステップS402の処理で読み出されたディープラーニングモデルで予測を実行し、予測スコア(予測値)を計算する(ステップS403)。
 ロジスティック回帰予測部10は、ロジスティック回帰モデル記憶部9からロジスティック回帰モデルを読み出す(ステップS404)。ロジスティック回帰予測部10は、属性データ#2とロジスティック回帰モデルとを用いて予測を実行し、予測スコア(予測値)を計算する(ステップS405)。
 予測結果集計部11は、ディープラーニングモデルによる予測スコアとロジスティック回帰による予測スコアとを集計し、図8に例示されたような表を作成する(ステップS406)。
 具体的には、予測結果集計部11は、全ての予測スコアを2値に分類する。例えば、予測スコアの上位N%を「予測スコアが高い」とし、それ以外を「予測スコアが低い」とする。さらに、以下のようにグループ化する(図8参照)。
(1)ディープラーニングによる予測スコアが低く(例えば、下位の(100-N)%に入っている。)、ロジスティック回帰による予測スコアが低い
(2)ディープラーニングによる予測スコアが高く(例えば、上位のN%に入っている。)、ロジスティック回帰による予測スコアが低い
(3)ディープラーニングによる予測スコアが低く、ロジスティック回帰による予測スコアが高い
(4)ディープラーニングによる予測スコアが高く、ロジスティック回帰による予測スコアが高い
 具体的には、予測結果集計部11は、図11に示すように、顧客に対するロジスティック回帰分析による予測スコアとディープラーニングによる予測スコアとを並べる。そして、予測結果集計部11は、各予測スコアを、高いスコア又は低いスコアに分類し、図12に示すような表を作成する。さらに、予測結果集計部11は、予測スコアを集計することによって、図8に示された表を得る。
 その後、予測結果集計部11は、ステップS406の処理による集計結果のうち、「ディープラーニングによる予測スコアが高く、ロジスティック回帰分析による予測スコアが低い」グループ(サンプル群)に属するデータ(サンプル)の属性データと予測スコアとを予測結果記憶部7に保存する(ステップS407)。具体的には、予測結果集計部11は、図12に例示された表において「ディープラーニングによる予測スコアが高く、ロジスティック回帰分析による予測スコアが低い」データに対応する顧客IDの属性データと予測スコアとを抽出し、図13に示すように、顧客IDに対応させて、属性値及びディープラーニングによる予測スコア(予測値)を予測結果記憶部7に保存する。
 なお、保存された属性データと予測スコアとは、ソフトターゲットとして、説明変数抽出処理で使用される。また、属性値は、属性データ#2から抽出されたデータ群(属性データ#3)に相当する。ディープラーニングによる予測スコアが高く、ロジスティック回帰による予測スコアが低い顧客は、既存モデルでは考慮されなかった未知のCustomer Insightに従って行動する顧客である可能性が高い顧客であると判断され、その属性値が、属性データ#2からセグメンテーションされて属性データ#3とされる。
 そして、説明変数抽出部8は、予測結果記憶部7から、属性データ#3と、ソフトターゲットすなわちディープラーニングモデルから算出された予測値とを読み出し、それらに基づいて重回帰分析を実行する(図6参照)。
 本実施形態では、第1の実施形態における効果に加えて、以下のような効果を得ることができる。すなわち、MCIFのデータから、既存のモデルとディープラーニングで作成したモデルとを用いて予測を行い、予測結果を比較することによって、既存のモデルでアプローチできる対象、両モデルでアプローチできる対象、及び既存のモデルではアプローチできていなかった対象を抽出できる。さらに、既存モデルでは予測スコアが低いためにアプローチしていなかったが、ディープラーニングモデルでは高い予測スコアになる顧客データのみを対象に重回帰分析を行うことによって、説明可能な説明変数を効率的に抽出できる。なお、本実施形態では、既存のモデルとしてロジスティック回帰モデルが用いられたが、すなわち既存の機械学習(当然、ディープラーニングは含まれない。)としてロジスティック回帰分析が用いられたが、ロジスティック回帰に代えて他のホワイトボックス型の機械学習のモデルが用いられてもよい。
 第2の実施形態では、第1の実施形態の場合と同様に、MCIFのデータを分析して、消費者が金融商品(例えば、カードローン)を購入する行動の背後にあるCustomer Insightを推測する場合を例にしたが、既存のモデルで予測されたスコアとディープラーニングモデルで予測されたスコアとを集計した後に比較し、未知のペルソナにアプローチするという手法は、MCIF記憶部1を別の利用者情報を記憶する記憶部に置き換えることによって、金融以外にも適用することができる。
 特に、ロジスティック回帰の分析モデルを用いている手法に幅広く適用できる。そのような手法として、一例としてば、EC(electronic commerce )サイトの購入者予測、店舗での顧客の購買予測、保険の加入者予測などが考えられる。ECサイトの購入者予測については、MCIF記憶部1をECサイト利用者情報記憶部に置き換えることによって、上記の各実施形態を、ECサイト利用者の購入者予測に適用することができる。
 図14は、本発明によるディープラーニングを用いる情報処理装置の主要部を示すブロック図である。図14に示すように、情報処理装置20(実施形態におけるCustomer Insight自動抽出装置100に対応、ただし、MCIF記憶部1は除外される。)は、データベース30(実施形態におけるMCIF記憶部1に対応)に格納されているデータに基づいてディープラーニングモデルを用いて予測処理を実行するディープラーニング予測部21(実施形態では、ディープラーニング予測部6で実現される。)と、ディープラーニング予測部21による予測結果を目的変数とし、データベース30に格納されているデータを説明変数として重回帰分析を行い、重回帰分析の結果に基づいて、ディープラーニングモデルの予測結果を説明するための変数を決定する変数抽出部22(実施形態では、説明変数抽出部8で実現される。)とを備えている。
 図15は、本発明によるディープラーニングを用いる他の情報処理装置の主要部を示すブロック図である。図15に示すように、情報処理装置20(実施形態におけるCustomer Insight自動抽出装置101に対応、ただし、MCIF記憶部1は除外される。)は、さらに、データベース30に格納されているデータを用いて機械学習を行う機械学習部23(実施形態では、ロジスティック回帰予測部10で実現される。)と、ディープラーニングモデルによる予測スコアが高い順に選定されたあらかじめ定められた第1割合(例えば、5%)のサンプル群(例えば、実施形態における「ディープラーニングモデルによる予測スコアが高い顧客」)に含まれ、かつ、機械学習による予測スコアが低い順に選定されたあらかじめ定められた第2割合(例えば、95%)のサンプル群(例えば、実施形態における「ロジスティック回帰分析による予測スコアが低い顧客」)に含まれる複数のサンプル(例えば、顧客)を抽出する予測結果集計部24(実施形態では、予測結果集計部11で実現される。)とを備え、変数抽出部22は、データベース30に格納されているデータのうち上記の複数のサンプルのデータを説明変数として重回帰分析を行うように構成されていてもよい。
 なお、データベース30は、情報処理装置20から分離されているが、情報処理装置20がデータベース30を内蔵してもよい。
 以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 この出願は、2017年2月2日に出願された日本出願特願2017-017440を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 1   MCIF記憶部
 2   第1属性データ抽出部
 3   ディープラーニング学習部
 4   ディープラーニングモデル記憶部
 5   第2属性データ抽出部
 6   ディープラーニング予測部
 7   予測結果記憶部
 8   説明変数抽出部
 9   ロジスティック回帰モデル記憶部
 10  ロジスティック回帰予測部
 11  予測結果集計部
 20  情報処理装置
 21  ディープラーニング予測部
 22  変数抽出部
 23  機械学習部
 24  予測結果集計部
 30  データベース
 100,101 Customer Insight自動抽出装置

Claims (10)

  1.  データベースに格納されているデータに基づいてディープラーニングモデルを用いて予測処理を実行するディープラーニング予測手段と、
     前記ディープラーニング予測手段による予測結果を目的変数とし、前記データを説明変数として重回帰分析を行い、当該重回帰分析の結果に基づいて、前記ディープラーニングモデルの予測結果を説明するための変数を決定する変数抽出手段と
     を備えたことを特徴とするディープラーニングを用いる情報処理装置。
  2.  変数抽出手段は、重回帰式における説明変数から、目的変数を良く説明する所定数の説明変数を、ディープラーニングモデルによる予測結果を説明するための変数として抽出する
     請求項1記載の情報処理装置。
  3.  前記データベースに格納されているデータを用いて機械学習を行う機械学習手段と、
     ディープラーニングモデルによる予測スコアが高い順に選定されたあらかじめ定められた第1割合のサンプル群に含まれ、かつ、前記機械学習による予測スコアが低い順に選定されたあらかじめ定められた第2割合のサンプル群に含まれる複数のサンプルを抽出する予測結果集計手段とを備え、
     変数抽出手段は、データベースに格納されているデータのうち前記複数のサンプルのデータを説明変数として重回帰分析を行う
     請求項1または請求項2記載の情報処理装置。
  4.  前記データベースは、金融機関の顧客の属性データを格納し、
     予測結果集計手段は、前記複数のサンプルを、機械学習では考慮されなかったCustomer Insightに従って行動する顧客に位置づける
     請求項3記載の情報処理装置。
  5.  データベースに格納されているデータに基づいてディープラーニングモデルを用いて予測処理を実行し、
     前記予測処理の予測結果を目的変数とし、前記データを説明変数として重回帰分析を行い、当該重回帰分析の結果に基づいて、前記ディープラーニングモデルの予測結果を説明するための変数を決定する
     ことを特徴とするディープラーニングを用いる情報処理方法。
  6.  重回帰式における説明変数から、目的変数を良く説明する所定数の説明変数を、ディープラーニングモデルによる予測結果を説明するための変数として抽出する
     請求項5記載の情報処理方法。
  7.  前記データベースに格納されているデータを用いて機械学習を行い、
     ディープラーニングモデルによる予測スコアが高い順に選定されたあらかじめ定められた第1割合のサンプル群に含まれ、かつ、前記機械学習による予測スコアが低い順に選定されたあらかじめ定められた第2割合のサンプル群に含まれる複数のサンプルを抽出し、
     データベースに格納されているデータのうち前記複数のサンプルのデータを説明変数として重回帰分析を行う
     請求項5または請求項6記載の情報処理方法。
  8.  コンピュータに、
     データベースに格納されているデータに基づいてディープラーニングモデルを用いて予測処理を実行する処理と、
     前記予測処理の予測結果を目的変数とし、前記データを説明変数として重回帰分析を行い、当該重回帰分析の結果に基づいて、前記ディープラーニングモデルの予測結果を説明するための変数を決定する処理と
     を実行させるためのディープラーニングを用いる情報処理プログラム。
  9.  コンピュータに、
     重回帰式における説明変数から、目的変数を良く説明する所定数の説明変数を、ディープラーニングモデルによる予測結果を説明するための変数として抽出する処理を実行させるための請求項8記載の情報処理プログラム。
  10.  コンピュータに、
     前記データベースに格納されているデータを用いて機械学習を行う処理と、
     ディープラーニングモデルによる予測スコアが高い順に選定されたあらかじめ定められた第1割合のサンプル群に含まれ、かつ、前記機械学習による予測スコアが低い順に選定されたあらかじめ定められた第2割合のサンプル群に含まれる複数のサンプルを抽出する処理と、
     データベースに格納されているデータのうち前記複数のサンプルのデータを説明変数として重回帰分析を行う処理と
     を実行させるための請求項8または請求項9記載の情報処理プログラム。
PCT/JP2017/043565 2017-02-02 2017-12-05 ディープラーニングを用いる情報処理装置、情報処理方法及び情報処理プログラム WO2018142753A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US16/481,891 US20190392295A1 (en) 2017-02-02 2017-12-05 Information processing device, method, and program that use deep learning
JP2018565965A JP7017149B2 (ja) 2017-02-02 2017-12-05 ディープラーニングを用いる情報処理装置、情報処理方法及び情報処理プログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-017440 2017-02-02
JP2017017440 2017-02-02

Publications (1)

Publication Number Publication Date
WO2018142753A1 true WO2018142753A1 (ja) 2018-08-09

Family

ID=63039594

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/043565 WO2018142753A1 (ja) 2017-02-02 2017-12-05 ディープラーニングを用いる情報処理装置、情報処理方法及び情報処理プログラム

Country Status (3)

Country Link
US (1) US20190392295A1 (ja)
JP (1) JP7017149B2 (ja)
WO (1) WO2018142753A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018147280A (ja) * 2017-03-07 2018-09-20 株式会社日立ソリューションズ データ分析装置及びデータ分析方法
WO2020040253A1 (ja) * 2018-08-24 2020-02-27 株式会社Nttドコモ 予測解釈装置、及び予測解釈方法
JP2020112847A (ja) * 2019-01-08 2020-07-27 株式会社日立製作所 水需要予測方法およびシステム
JP6899475B1 (ja) * 2020-09-10 2021-07-07 株式会社 日立産業制御ソリューションズ 機械学習モデル精度分析システム、機械学習モデル精度分析方法及びプログラム
JP7354844B2 (ja) 2020-01-08 2023-10-03 富士通株式会社 影響判定プログラム、装置、及び方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11720228B2 (en) 2021-08-05 2023-08-08 Evernorth Strategic Development, Inc. Systems and methods for transforming an interactive graphical user interface according to machine learning models

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07253343A (ja) * 1994-03-14 1995-10-03 Mitsubishi Electric Corp 判別方法及び判別装置及び判別システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005222445A (ja) * 2004-02-09 2005-08-18 Nifty Corp データマイニングにおける情報処理方法及び解析装置
IL232444A0 (en) * 2014-05-04 2014-08-31 Gsoft Solutions Automatic tool for statistical processing
JP2016004525A (ja) * 2014-06-19 2016-01-12 株式会社日立製作所 データ分析システム及びデータ分析方法
JP5984153B2 (ja) * 2014-09-22 2016-09-06 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、プログラム、及び情報処理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07253343A (ja) * 1994-03-14 1995-10-03 Mitsubishi Electric Corp 判別方法及び判別装置及び判別システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KI KUTA, YOHEI ET AL: "Exploiting the Hidden Layer Information Toward theUnderstanding and Utilization of FeatureRepresentations Obtained from Deep Learning", 29TH PROCEEDINGS OF THE NATIONAL CONVENTION OF THE JAPANESESOCIETY FOR ARTIFICIAL INTELLIGENCE, 2015, pages 1 - 4 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018147280A (ja) * 2017-03-07 2018-09-20 株式会社日立ソリューションズ データ分析装置及びデータ分析方法
WO2020040253A1 (ja) * 2018-08-24 2020-02-27 株式会社Nttドコモ 予測解釈装置、及び予測解釈方法
JP7328974B2 (ja) 2018-08-24 2023-08-17 株式会社Nttドコモ 予測解釈装置、及び予測解釈方法
JP2020112847A (ja) * 2019-01-08 2020-07-27 株式会社日立製作所 水需要予測方法およびシステム
JP7304698B2 (ja) 2019-01-08 2023-07-07 株式会社日立製作所 水需要予測方法およびシステム
JP7354844B2 (ja) 2020-01-08 2023-10-03 富士通株式会社 影響判定プログラム、装置、及び方法
JP6899475B1 (ja) * 2020-09-10 2021-07-07 株式会社 日立産業制御ソリューションズ 機械学習モデル精度分析システム、機械学習モデル精度分析方法及びプログラム
JP2022046145A (ja) * 2020-09-10 2022-03-23 株式会社 日立産業制御ソリューションズ 機械学習モデル精度分析システム、機械学習モデル精度分析方法及びプログラム

Also Published As

Publication number Publication date
JPWO2018142753A1 (ja) 2019-12-12
US20190392295A1 (en) 2019-12-26
JP7017149B2 (ja) 2022-02-08

Similar Documents

Publication Publication Date Title
JP7017149B2 (ja) ディープラーニングを用いる情報処理装置、情報処理方法及び情報処理プログラム
US11501205B2 (en) System and method for synthesizing data
US20210173711A1 (en) Integrated value chain risk-based profiling and optimization
Ng Boosting recessions
Tsiptsis et al. Data mining techniques in CRM: inside customer segmentation
Chorianopoulos Effective CRM using predictive analytics
JP6262909B1 (ja) 算出装置、算出方法及び算出プログラム
WO2011112981A2 (en) Methods, computer-accessible medium and systems for construction of and inference with networked data, for example, in a financial setting
JP6209691B2 (ja) マーケティング装置、マーケティング方法およびプログラム
Kulkarni et al. Advanced credit score calculation using social media and machine learning
Branzoli et al. Fintech credit: A critical review of empirical research literature
Singh et al. E-commerce system for sale prediction using machine learning technique
JP2018081651A (ja) 算出装置、算出方法及び算出プログラム
He et al. Impact of big data analytics on banking: a case study
Khder et al. The impact of implementing data mining in business intelligence
Verma et al. Data mining: next generation challenges and futureDirections
Anderies et al. Telekom-net: The embedded bi-lstm and expert knowledge model for stock forecasting and suggestion
JP2021012420A (ja) 顧客管理システム、及び顧客管理方法
Elrefai et al. Using artificial intelligence in enhancing banking services
Alshamsi Customer Churn prediction in ECommerce Sector
CN114529399A (zh) 用户数据处理方法、装置、计算机设备和存储介质
McPhail et al. Machine learning implications for banking regulation
Granov Customer loyalty, return and churn prediction through machine learning methods: for a Swedish fashion and e-commerce company
Zand Towards intelligent risk-based customer segmentation in banking
Wang et al. Product competitiveness analysis from the perspective of customer perceived helpfulness: a novel method of information fusion research

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17894685

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2018565965

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17894685

Country of ref document: EP

Kind code of ref document: A1