WO2021098265A1 - 缺失信息预测方法、装置、计算机设备及存储介质 - Google Patents

缺失信息预测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
WO2021098265A1
WO2021098265A1 PCT/CN2020/103950 CN2020103950W WO2021098265A1 WO 2021098265 A1 WO2021098265 A1 WO 2021098265A1 CN 2020103950 W CN2020103950 W CN 2020103950W WO 2021098265 A1 WO2021098265 A1 WO 2021098265A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
category
prediction model
predicted
customer
Prior art date
Application number
PCT/CN2020/103950
Other languages
English (en)
French (fr)
Inventor
董雨婷
Original Assignee
深圳壹账通智能科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳壹账通智能科技有限公司 filed Critical 深圳壹账通智能科技有限公司
Publication of WO2021098265A1 publication Critical patent/WO2021098265A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services

Definitions

  • This application relates to the field of artificial intelligence technology, and in particular to a method, device, computer equipment and storage medium for predicting missing information.
  • the embodiments of the present application provide a method, device, computer equipment, and storage medium for predicting missing information, aiming to solve the problem of not being able to obtain the missing information of customers in a timely manner in the prior art methods.
  • an embodiment of the present application provides a method for predicting missing information, which includes:
  • model configuration information includes input item information used to configure the input node, and information used to configure the output node.
  • the category of the associated customer corresponding to the information to be predicted in the preset customer information table is obtained;
  • the category quantitative information is input into the trained information prediction model to obtain category information corresponding to the category to be predicted of the client to be predicted.
  • an embodiment of the present application provides a missing information prediction device, which includes:
  • the information prediction model construction unit is used to construct an information prediction model including input nodes, feature units, and output nodes according to the input model configuration information, wherein the model configuration information includes input item information for configuring the input node, The output item information used to configure the output node and the feature unit configuration formula used to configure the feature unit;
  • An information prediction model training unit configured to train the information prediction model according to a preset data set and preset parameter adjustment rules to obtain the information prediction model after training;
  • the associated customer category obtaining unit is configured to, if the input information to be predicted including the customer to be predicted and the predicted category is received, obtain the category of the associated customer corresponding to the information to be predicted in the preset customer information table;
  • the category quantitative information acquisition unit is configured to quantify the category of each associated customer according to a preset category information quantification formula to obtain category quantitative information;
  • the category information obtaining unit is configured to input the category quantitative information into the trained information prediction model to obtain category information corresponding to the category to be predicted of the client to be predicted.
  • an embodiment of the present application provides a computer device, which includes a memory, a processor, and a computer program stored on the memory and running on the processor, and the processor executes the computer
  • the program implements the missing information prediction method described in the first aspect.
  • the embodiments of the present application also provide a computer-readable storage medium, wherein the computer-readable storage medium stores a computer program, and when the computer program is executed by a processor, the processor executes the above-mentioned first On the one hand, the missing information prediction method.
  • FIG. 1 is a schematic flowchart of a missing information prediction method provided by an embodiment of the application
  • FIG. 2 is a schematic diagram of a sub-process of the missing information prediction method provided by an embodiment of the application
  • FIG. 3 is a schematic diagram of another sub-process of the missing information prediction method provided by an embodiment of the application.
  • FIG. 4 is a schematic diagram of another process of the missing information prediction method provided by an embodiment of the application.
  • FIG. 5 is a schematic diagram of another sub-process of the missing information prediction method provided by an embodiment of the application.
  • FIG. 6 is a schematic block diagram of a missing information prediction device provided by an embodiment of the application.
  • FIG. 7 is a schematic block diagram of a computer device provided by an embodiment of the application.
  • FIG. 1 is a schematic flowchart of a missing information prediction method provided by an embodiment of the present application.
  • the missing information prediction method is applied to a user terminal.
  • the method is executed by application software installed in the user terminal.
  • the user terminal is a terminal device used to perform the missing information prediction method to predict the missing information of the customer, such as a desktop Computer, laptop, tablet or mobile phone, etc.
  • the method includes steps S110 to S150.
  • S110 Construct an information prediction model including input nodes, characteristic units, and output nodes according to the input model configuration information.
  • Model configuration information is the information used to configure the input nodes, fully connected hidden layers, and output nodes in the information prediction model.
  • the model configuration information includes input item information, output item information, and feature unit configuration formulas.
  • the input item information is In order to configure the information of the input node, the output item information is the information used to configure the output node.
  • the feature unit configuration formula is used to calculate the configuration number of feature units in the fully connected hidden layer.
  • the information prediction model can be based on the information related to a certain customer.
  • the associated customer information of the association predicts part of the missing information corresponding to the customer
  • the input item information may be a type corresponding to the associated customer information
  • the output item information may be a classification item included in the prediction result.
  • the information prediction model includes multiple input nodes, multiple output nodes, and multiple characteristic units.
  • the input item information includes multiple input items
  • the output item information includes multiple output items. Each input item corresponds to an input node. One output item corresponds to one output node, and the feature unit can be used to reflect the relationship between the input information and the target prediction information corresponding to the input information.
  • step S110 includes sub-steps S111, S112, S113, S114, and S115.
  • the input node of the information prediction model is constructed according to the input item information in the model configuration information. Specifically, each input item included in the input item information corresponds to an input node, and the input node can be constructed according to the input item information. The input node corresponding to the input item.
  • the input information is the type of relationship between the associated customer and the customer to be predicted, including four types of parents, spouses, siblings, and colleagues. Four input nodes corresponding to the four input items of parent, spouse, sibling, and colleague.
  • the output node of the information prediction model is constructed according to the output item information in the model configuration information. Specifically, each output item contained in the output item information corresponds to an output node, and the output node can be constructed according to the output item information. The output node corresponding to the output item.
  • the output item information is the classification item of the academic information, including junior high school and below, high school and technical secondary school, junior college, undergraduate, graduate and above five classification items, respectively, and the junior high school and below, high school and technical secondary school, junior college and undergraduate. , graduate students and five output nodes corresponding to the five categories above.
  • the number of input nodes and the number of output nodes are input into the feature unit configuration formula to construct a fully connected hidden layer including a corresponding number of feature units according to the calculation result.
  • the fully connected hidden layer is an intermediate layer used to connect the input nodes and output nodes.
  • the fully connected hidden layer contains several feature units, and each feature unit is associated with all input nodes and all output nodes.
  • the configuration number of feature units contained in the fully connected hidden layer can be calculated according to the feature unit configuration formula.
  • the configuration number of feature units is related to the number of input nodes and the number of output nodes.
  • the input item information includes four categories: parents, spouse, sibling, and colleague, corresponding to four input nodes
  • the output item information includes junior high school and below, high school and technical secondary school, junior college, undergraduate, graduate student and above.
  • For classification items there are five corresponding output nodes.
  • N 0 N 1 ⁇ N 2 /2, the number of feature units is 10, and then a fully connected hidden layer containing ten feature units can be constructed correspondingly.
  • S114 Construct a first formula group from the input node to the characteristic unit using the input node value as the input value and the characteristic unit value as the output value according to the characteristic unit in the fully connected hidden layer and the input node.
  • the parameter value of the training round with the highest accuracy is used as the parameter value of the information prediction model to obtain the information prediction model after training.
  • the accuracy of each round of training is obtained, and the parameter value of the training round with the highest accuracy is used as the optimal parameter value of the information prediction model to obtain the trained information prediction model.
  • the category of the associated customer corresponding to the information to be predicted in the preset customer information table is obtained.
  • the preset customer information table contains the complete information of multiple customers.
  • the information to be predicted includes a customer to be predicted and a predicted category.
  • the information to be predicted also contains the name, gender, age, family information, and job title of the customer to be predicted.
  • Company and other information the category of the customer to be predicted is missing, and the category of the customer to be predicted is the missing information that needs to be predicted.
  • the corresponding associated customer category in the preset customer information table can be obtained, and the category quantification can be further obtained information.
  • the preset customer information table contains the customer's account number, name, gender, age, family information, company, category, and other information.
  • the category is the information obtained by classifying the customer according to the information corresponding to the customer.
  • the category can include multiple categories. If the preset customer information table contains multiple categories, the first category, the second category,... Way to express.
  • Table 1 For example, a certain preset customer information table is shown in Table 1.
  • step S130 includes sub-steps S131 and S132.
  • the category corresponding to each associated customer in the associated customer information is obtained according to the predicted category in the information to be predicted.
  • the information to be predicted also includes a prediction category, which is the same as a category in the preset customer information table, and the category corresponding to each associated customer in the associated customer information can be obtained according to the predicted category.
  • the category information quantification formula is a formula used to quantify the category corresponding to each associated customer. Specifically, the category corresponding to each associated customer is sorted according to the type of relationship between the associated customer and the customer to be predicted, and then the Statistics are performed on the number distribution of each type of customer in each category item to obtain the statistical result, and the category of each type of associated customer in the statistical result is quantified according to the category information quantitative formula to obtain the category quantitative information.
  • the information to be predicted and the category information are added to the preset customer information table. Since the information to be predicted only contains part of the information of the customer to be predicted, and does not contain the category information of the customer to be predicted, the information of the customer to be predicted in the information to be predicted and the obtained category information can be added to the preset customer information table , That is, the information in the preset customer information table is expanded based on the obtained category information, and the expanded information can subsequently be used as the basis for predicting the missing information of other customers to be predicted.
  • an information prediction model including input nodes, feature units, and output nodes is constructed according to the model configuration information; the information prediction model is trained according to the data set and parameter adjustment rules to obtain the trained information Information prediction model; obtain the category of the associated customer corresponding to the information to be predicted in the preset customer information table; quantify the category of the associated customer according to the category information quantification formula to obtain category quantification information; input the category quantification information into the trained information prediction model Obtain the category information corresponding to the information to be predicted.
  • the missing information prediction device 100 includes an information prediction model construction unit 110, an information prediction model training unit 120, an associated customer category acquisition unit 130, a category quantitative information acquisition unit 140 and a category information acquisition unit 150.
  • the information prediction model construction unit 110 is configured to construct an information prediction model including input nodes, feature units, and output nodes according to the input model configuration information, wherein the model configuration information includes input item information used to configure the input node , The output item information used to configure the output node and the feature unit configuration formula used to configure the feature unit.
  • the input node construction unit is used to construct the input node of the information prediction model according to the input item information in the model configuration information; the output node construction unit is used to construct the information according to the output item information in the model configuration information The output node of the prediction model; a fully connected hidden layer construction unit for inputting the number of input nodes and the number of output nodes into the feature unit configuration formula, so as to construct a full set of feature units including a corresponding number of feature units according to the calculation result Connection hidden layer; a first formula group construction unit for constructing input node to feature unit based on the feature unit in the fully connected hidden layer and the input node, using the input node value as the input value and the feature unit value as the output value The first formula group; the second formula group construction unit is used to construct the characteristic unit to the characteristic unit according to the characteristic unit in the fully connected hidden layer and the output node, with the characteristic unit value as the input value and the output node value as the output value The second formula group of the output node to obtain the information prediction model.
  • the information prediction model training unit 120 is configured to train the information prediction model according to a preset data set and preset parameter adjustment rules to obtain the information prediction model after training.
  • the information prediction model training unit 120 includes sub-units: a data set splitting unit, an accuracy rate obtaining unit, and a parameter value determining unit.
  • the associated customer category obtaining unit 130 is configured to, if the input information to be predicted including the customer to be predicted and the predicted category is received, obtain the category of the associated customer corresponding to the information to be predicted in the preset customer information table.
  • the associated customer category obtaining unit 130 includes sub-units: an associated customer information obtaining unit and a category obtaining unit.
  • the associated customer information obtaining unit is configured to obtain the associated customer information corresponding to the customer to be predicted in the preset customer information table according to the customer to be predicted in the information to be predicted; the category obtaining unit is used to obtain the related customer information corresponding to the customer to be predicted according to the information to be predicted.
  • the prediction category in the prediction information acquires the category corresponding to each associated customer in the associated customer information.
  • the category quantitative information obtaining unit 140 is configured to quantify the category of each associated customer according to a preset category information quantification formula to obtain category quantitative information.
  • the category information obtaining unit 150 is configured to input the category quantitative information into the trained information prediction model to obtain category information corresponding to the category to be predicted of the client to be predicted.
  • the missing information prediction device 100 further includes a subunit: a category information adding unit.
  • the category information adding unit is configured to add the information to be predicted and the category information to the preset customer information table.
  • the computer device 500 includes a processor 502, a memory, and a network interface 505 connected through a system bus 501, where the memory may include a non-volatile storage medium 503 and an internal memory 504.
  • the non-volatile storage medium 503 can store an operating system 5031 and a computer program 5032.
  • the processor 502 can execute the missing information prediction method.
  • the processor 502 is used to provide computing and control capabilities, and support the operation of the entire computer device 500.
  • the network interface 505 is used for network communication, such as providing data information transmission.
  • the structure shown in FIG. 7 is only a block diagram of part of the structure related to the solution of the present application, and does not constitute a limitation on the computer device 500 to which the solution of the present application is applied.
  • the specific computer device 500 may include more or fewer components than shown in the figure, or combine certain components, or have a different component arrangement.
  • the processor 502 is configured to run a computer program 5032 stored in a memory, so as to implement the corresponding function in the foregoing missing information prediction method.
  • the embodiment of the computer device shown in FIG. 7 does not constitute a limitation on the specific configuration of the computer device.
  • the computer device may include more or less components than those shown in the figure. Or some parts are combined, or different parts are arranged.
  • the computer device may only include a memory and a processor. In such an embodiment, the structures and functions of the memory and the processor are consistent with the embodiment shown in FIG. 7 and will not be repeated here.
  • the processor 502 may be a central processing unit (Central Processing Unit, CPU), and the processor 502 may also be other general-purpose processors, digital signal processors (Digital Signal Processors, DSPs), Application Specific Integrated Circuit (ASIC), Field-Programmable Gate Array (FPGA) or other programmable logic devices, discrete gates or transistor logic devices, discrete hardware components, etc.
  • the general-purpose processor may be a microprocessor or the processor may also be any conventional processor.
  • a computer-readable storage medium may be a non-volatile computer-readable storage medium, or may be a volatile computer-readable storage medium.
  • the computer-readable storage medium stores a computer program, where the computer program implements the steps included in the foregoing missing information prediction method when the computer program is executed by a processor.
  • the units described as separate components may or may not be physically separated, and the components displayed as units may or may not be physical units, that is, they may be located in one place, or they may be distributed on multiple network units. Some or all of the units may be selected according to actual needs to achieve the objectives of the solutions of the embodiments of the present application.
  • the functional units in the various embodiments of the present application may be integrated into one processing unit, or each unit may exist alone physically, or two or more units may be integrated into one unit.
  • the above-mentioned integrated unit can be implemented in the form of hardware or software functional unit.
  • the integrated unit is implemented in the form of a software functional unit and sold or used as an independent product, it can be stored in a computer-readable storage medium.
  • the technical solution of this application is essentially or the part that contributes to the existing technology, or all or part of the technical solution can be embodied in the form of a software product, and the computer software product can be stored in a computer.
  • the read storage medium includes several instructions to enable a computer device (which may be a personal computer, a server, or a network device, etc.) to execute all or part of the steps of the methods described in the various embodiments of the present application.
  • the aforementioned storage medium is a physical, non-transitory storage medium, such as a U disk, a mobile hard disk, a read-only memory (Read-Only Memory, ROM), a magnetic disk, or an optical disk that can store program codes. Storage medium.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Human Resources & Organizations (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种缺失信息预测方法、装置、计算机设备及存储介质。方法包括:根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型(S110),根据预置的数据集及预置的参数调整规则对信息预测模型进行训练,以得到训练后的信息预测模型(S120),若接收到所输入的待预测信息,获取预置的客户信息表中与待预测信息对应的关联客户的类别(S130),根据预置的类别信息量化公式对与每一关联客户的类别进行量化以得到类别量化信息(S140),将类别量化信息输入训练后的信息预测模型以获取对应的类别信息(S150)。该方法基于预测模型技术,属于人工智能技术领域,可基于与客户相关联的其他客户的信息,对客户所缺失的信息进行准确预测,大幅提升了获取客户缺失信息的效率。

Description

缺失信息预测方法、装置、计算机设备及存储介质
本申请要求于2019年11月22日提交中国专利局、申请号为201911156335.1,发明名称为“缺失信息预测方法、装置、计算机设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种缺失信息预测方法、装置、计算机设备及存储介质。
背景技术
企业在为客户办理业务的过程中,经常需客户提供与其本人相关的个人信息。在用户个人信息部分缺失时,企业难以及时获取客户缺失的个人信息,导致无法进行后续业务办理流程。可通过与客户取得联系以获取客户所缺失的个人信息,然而发明人发现在部分情况下难以与客户取得联系,导致无法及时获取客户所缺失的个人信息,因此信息获取的效率较低,且这一获取方式易对客户造成打扰。因此,现有的技术方法在获取客户缺失信息时存在获取效率较低的问题。
发明内容
本申请实施例提供了一种缺失信息预测方法、装置、计算机设备及存储介质,旨在解决现有技术方法中所存在的无法及时获取客户的缺失信息的问题。
第一方面,本申请实施例提供了一种缺失信息预测方法,其包括:
根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型,其中,所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式;
根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练,以得到训练后的所述信息预测模型;
若接收到所输入的待预测信息,获取预置的客户信息表中与所述待预测信息对应的关联客户的类别;
根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息;
将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的待预测类别对应的类别信息。
第二方面,本申请实施例提供了一种缺失信息预测装置,其包括:
信息预测模型构建单元,用于根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型,其中,所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式;
信息预测模型训练单元,用于根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练,以得到训练后的所述信息预测模型;
关联客户类别获取单元,用于若接收到所输入的包含待预测客户及预测类别的待预测信息,获取预置的客户信息表中与所述待预测信息对应的关联客户的类别;
类别量化信息获取单元,用于根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息;
类别信息获取单元,用于将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的待预测类别对应的类别信息。
第三方面,本申请实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的缺失信息预测方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的缺失信息预测方法。
本申请实施例提供了一种缺失信息预测方法、装置、计算机设备及存储介质。根据模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型;根据数据集及参数调整规则对信息预测模型进行训练得到训练后的信息预测模型;获取预置客户信息表中与待预测信息对应的关联客户的类别;根据类别信息量化公式对关联客户的类别进行量化得到类别量化信息;将类别量化信息输入训练后的信息预测模型得到待预测信息对应的类别信息。通过上述方法,可基于与客户相关联的其他客户的信息,对客户所缺失的信息进行准确预测,大幅提升了获取客户缺失信息的效率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的缺失信息预测方法的流程示意图;
图2为本申请实施例提供的缺失信息预测方法的子流程示意图;
图3为本申请实施例提供的缺失信息预测方法的另一子流程示意图;
图4为本申请实施例提供的缺失信息预测方法的另一流程示意图;
图5为本申请实施例提供的缺失信息预测方法的另一子流程示意图;
图6为本申请实施例提供的缺失信息预测装置的示意性框图;
图7为本申请实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述 特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本申请实施例提供的缺失信息预测方法的流程示意图。该缺失信息预测方法应用于用户终端中,该方法通过安装于用户终端中的应用软件进行执行,用户终端即是用于执行缺失信息预测方法以对客户缺失的信息进行预测的终端设备,例如台式电脑、笔记本电脑、平板电脑或手机等。
如图1所示,该方法包括步骤S110~S150。
S110、根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型。
根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型。模型配置信息即是用于对信息预测模型中的输入节点、全连接隐层及输出节点进行配置的信息,模型配置信息中包括输入项信息、输出项信息及特征单元配置公式,输入项信息即为用于配置输入节点的信息,输出项信息即为用于配置输出节点的信息,特征单元配置公式用于计算全连接隐层中特征单元的配置数量,信息预测模型可基于与某一客户相关联的关联客户信息对该客户对应的部分缺失信息进行预测,输入项信息可以是与关联客户信息对应的类型,输出项信息可以是预测结果所包含的分类项。信息预测模型中包含多个输入节点、多个输出节点及多个特征单元,输入项信息中包含多个输入项,输出项信息中包含多个输出项,每一输入项对应一个输入节点,每一输出项对应一个输出节点,特征单元可用于反映输入信息与该输入信息对应的目标预测信息之间的关系。
在一实施例中,如图2所示,步骤S110包括子步骤S111、S112、S113、S114和S115。
S111、根据所述模型配置信息中的输入项信息构建所述信息预测模型的输入节点。
根据所述模型配置信息中的输入项信息构建所述信息预测模型的输入节点,具体的,输入项信息中所包含的每一输入项对应一个输入节点,则可根据输入项信息构建与每一输入项对应的输入节点。
例如,某一信息预测模型需对客户所缺失的学历信息进行预测,输入项信息为关联客户与待预测客户之间关系的类型,包括父母、配偶、兄妹、同事四种类型,则生成分别与父母、配偶、兄妹、同事四个输入项对应的四个输入节点。
S112、根据所述模型配置信息中的输出项信息构建所述信息预测模型的输出节点。
根据所述模型配置信息中的输出项信息构建所述信息预测模型的输出节点,具体的,输出项信息中所包含的每一输出项对应一个输出节点,则可根据输出项信息构建与每一输出项对应的输出节点。
例如,输出项信息为学历信息的分类项,包括初中及以下、高中及中专、专科、本科、研究生及以上五个分类项,则分别生成与初中及以下、高中及中专、专科、本科、研究生及以上五个分类项对应的五个输出节点。
S113、将所述输入节点的数量及所述输出节点的数量输入所述特征单元配置公式,以根据计算结果构建包含相应数量的特征单元的全连接隐层。
将所述输入节点的数量及所述输出节点的数量输入所述特征单元配置公式,以根据计算结果构建包含相应数量的特征单元的全连接隐层。全连接隐层即是用于对输入节点与输出节点进行联系的中间层,全连接隐层中包含若干个特征单元,每一个特征单元均与所有输入节点和所有输出节点进行关联。全连接隐层中所包含特征单元的配置数量可根据特征单元配置公式计算得到,特征单元的配置数量与输入节点的数量及输出节点的数量存在关联关系,具体的,特征单元配置公式可以是N 0=N 1×N 2/2或N 0=2×(N 1×N 2) 1/2,其中,N 0为全连接隐层中特征单元的配置数量,N 1为输入节点的数量,N 2为输出节点的数量。
例如,输入项信息中包含父母、配偶、兄妹、同事四个类别,对应得到的输入节点为四个,输出项信息中包含初中及以下、高中及中专、专科、本科、研究生及以上五个分类项,对应得到的输出节点为五个,根据上式N 0=N 1×N 2/2计算得到特征单元的数量为10,则可对应构建包含十个特征单元的全连接隐层。
S114、根据所述全连接隐层中的特征单元及所述输入节点,以输入节点值作为输入值、特征单元值作为输出值构建输入节点至特征单元的第一公式组。
根据所述全连接隐层中的特征单元及所述输入节点,以输入节点值作为输入值、特征单元值作为输出值构建输入节点至特征单元的第一公式组,其中,第一公式组包含所有输入节点至所有特征单元的公式。输入节点即是信息预测模型中用于对某一类型关联客户的类别信息进行输入的节点,输入节点的具体数值即为输入节点值,也即是对某一类型关联客户的类别信息进行量化后所得的数值,由于每一输入节点对应一个类型的关联客户的类别信息,所有输入节点即对应与一个待预测客户相关联的所有关联客户的类别信息,特征单元值即是全连接隐层中的特征单元的计算值。
例如,某一输入节点的输入节点值为x1,某一特征单元的特征单元值为y1,则该输入节点至该特征单元的公式为y1=a×x1+b;其中,a和b为该公式中的参数,公式中的参数值为随机生成的数字。
S115、根据所述全连接隐层中的特征单元及所述输出节点,以特征单元值作为输入值、输出节点值作为输出值构建特征单元至输出节点的第二公式组,以得到信息预测模型。
根据所述全连接隐层中的特征单元及所述输出节点,以特征单元值作为输入值、输出节点值作为输出值构建特征单元至输出节点的第二公式组,其中,第二公式组包含所有特征单元至所有输出节点的公式。输出节点即是信息预测模型中用于对待预测客户与每一分类项对应的匹配度进行输出的节点,输出节点的具体数值即是输出节点值,输出节点值即表示待预测客户与该输出节点对应分类项之间的匹配度,特征单元值即是全连接隐层中的特征单元的计算值。
例如,某一特征单元的特征单元值为y1,某一输出节点的输出节点值为z1,则该特征单元至该输出节点的公式为z1=c×y1+d;其中,c和d为该公式中的参数,公式中的参数值为随机生成的数字。
S120、根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练,以得到训练后的所述信息预测模型。
根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练,以得到训练后的所述信息预测模型。所生成的信息预测模型为初始预测模型,需对该预测模型进行训练,也即是对信息预测模型中公式的参数值进行调整优化,以得到预测精确度满足使用要求的信息预测模型。具体的,数据集中包含客户的目标类别信息,以及每一客户的类别量化信息,类别量化信息即用于对与该客户相关联的关联客户的类别进行量化的信息,类别量化信息中包含对某一类型关联客户的类别信息进行量化后所得的数值。所述参数调整规则即为对信息预测模型中参数值进行调整的规则。
在一实施例中,如图3所示,步骤S120包括子步骤S121、S122和S123。
S121、将所述数据集拆分为预设数量的子数据集。
将所述数据集拆分为预设数量的子数据集。预设数量即是用于对数据集进行拆分的数量信息,根据预设数量即可将数据集中的客户信息平均拆分为对应的多个子数据集,每一子数据集中均包含多份客户对应的信息。
例如,预置的数据集中包含3000份客户对应的信息,预设数量为12,则将3000份客户对应的信息平均拆分为12个子数据集,每一子数据集中包含250份客户对应的信息。
S122、根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练,并根据所述子数据集计算每一轮训练后所述信息预测模型的准确率。
这一训练过程也即是网格搜索法,依次选择一个子数据集作为训练数据集、其余子数据集作为测试数据集并结合参数调整规则对信息预测模型进行多轮训练,并根据子数据集计算每一轮训练后所述信息预测模型的准确率。具体的,子数据集总数为k,则对信息预测模型进行k轮交叉训练,对信息预测模型进行第一轮训练时,将第一个子数据集作为测试数据集,其余的k-1个子数据集作为训练数据集,将第一个训练数据集中每一客户对应的信息输入信息预测模型得到每一客户与多个分类项之间的匹配度,若某一客户匹配度最高的分类项与该客户的目标类别信息相同,则将该客户作为正样本客户,统计该训练数据集中正样本客户的占比得到即可得到该训练数据集的训练准确率Z=S/V,其中,S为该训练数据集中正样本客户的数量,V为该训练数据集中所包含客户的数量。参数调整规则中包括准确率阈值、参数调整方向及参数调整幅度,参数调整方向包括正向调整及负向调整,参数调整幅度即是进行调整的具体幅度值,判断当前训练数据集在对信息预测模型进行训练时的训练准确率是否小于准确率阈值,若判断结果为不小于,则根据参数调整方向中的正向调整及参数调整幅度中的幅度值对信息预测模型中的参数值进行调整;若判断结果为小于,则根据参数调整方向中的反向调整及参数调整幅度中的幅度值对信息预测模型中的参数值进行调整。
例如,参数调整幅度中的幅度值为0.05,判断结果为当前训练数据集对信息预测模型进 行训练时的训练准确率不小于准确率阈值,则本次调整需进行正向调整,本次调整在该信息预测模型中参数值原数值基础上乘以1.05得到新的参数值。
一个训练数据集即可对信息预测模型中的参数值进行一次调整,通过k-1个训练数据集对信息预测模型进行训练后得到第一轮训练过后的信息预测模型,将剩余的一个测试数据集输入第一轮训练过后的信息预测模型即可计算得到对应的准确率,也即是完成对该信息预测模型的一轮训练,通过测试数据集计算信息预测模型的准确率的方法与计算训练准确率的方法相同。
S123、将准确率最高的一轮训练的参数值作为所述信息预测模型的参数值以得到训练后的所述信息预测模型。
将准确率最高的一轮训练的参数值作为所述信息预测模型的参数值以得到训练后的所述信息预测模型。信息预测模型进行多轮交叉训练后,得到每一轮训练的准确率,将准确率最高的一轮训练的参数值作为信息预测模型最优的参数值,即可得到训练后的信息预测模型。
S130、若接收到所输入的包含待预测客户及预测类别的待预测信息,获取预置的客户信息表中与所述待预测信息对应的关联客户的类别。
若接收到用户所输入的待预测信息,获取预置的客户信息表中与所述待预测信息对应的关联客户的类别。其中,预置客户信息表中包含多个客户的完整信息,待预测信息中包含一个待预测客户及一个预测类别,待预测信息中还包含待预测客户的姓名、性别、年龄、家庭信息、任职公司等信息,待预测客户的类别缺失,待预测客户的类别也即是需进行预测的缺失信息,可根据待预测信息获取预置客户信息表中对应的关联客户的类别,并进一步得到类别量化信息。具体的,预置客户信息表中包含客户的账号、姓名、性别、年龄、家庭信息、任职公司、类别等信息。类别即是按照与客户相应的信息对该客户进行分类所得分类结果的信息,类别可包含多个,若预置客户信息表中包含多个类别,可采用第一类别、第二类别、……的方式进行表示。
例如,某一预置客户信息表如表1所示。
Figure PCTCN2020103950-appb-000001
表1
在一实施例中,如图4所示,步骤S130包括子步骤S131和S132。
S131、根据所述待预测信息中的待预测客户获取所述预置客户信息表中与所述待预测客户对应的关联客户信息。
根据所述待预测信息中的待预测客户获取预置客户信息表中与所述待预测客户对应的关联客户信息。具体的,根据待预测客户的姓名或家庭信息对预置客户信息表中每一客户的家庭信息进行筛选,以得到与待预测客户之间关系的类别为父母、配偶或兄妹的客户;根据待预测客户的任职公司对预置客户信息表中每一客户的任职公司进行筛选,以得到与待预测客户之间关系的类别为同事的客户。获取预置客户信息表中所有与待预测客户存在关系的客户作为关联客户,并获取每一关联客户对应的信息即可得到待预测客户的关联客户信息。
S132、根据所述待预测信息中的预测类别获取与所述关联客户信息中每一关联客户对应的类别。
根据所述待预测信息中的预测类别获取与所述关联客户信息中每一关联客户对应的类别。待预测信息中还包括预测类别,预测类别与预置客户信息表的一个类别相同,根据预测类别即可获取关联客户信息中每一关联客户对应的类别。
S140、根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息。
根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息。类别信息量化公式即是用于对每一关联客户对应的类别进行量化的公式,具体的,先根据关联客户与待预测客户之间关系的类型对每一关联客户对应的类别进行整理,之后对每一种类型的客户在每一分类项中的数量分布进行统计得到统计结果,根据类别信息量化公式对统计结果中每一种类型关联客户的类别进行量化,以得到类别量化信息。
例如,某一统计结果如表2所示。
任务ID 类型 初中及以下 高中及中专 专科 本科 研究生及以上
A0001 父母 0 1 1 0 0
A0001 配偶 0 0 0 1 0
A0001 兄妹 0 0 1 0 0
A0001 同事 0 1 1 3 0
表2
与学历这一预测类别对应的类别信息量化公式为T=0.2×S 1+0.4×S 2+0.6×S 3+0.8×S 4+1×S 5,其中,T为父母、配偶、兄妹或同事中任一类型对应的类别量化值,S 1、S 2、S 3、S 4、S 5为相应类别的客户在每一分类项中的数量分布,根据上述公式计算得到类型为同事的类别量化值T=0.2×0+0.4×1+0.6×1+0.8×3+1×0=3.4。
S150、将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的预测类别对应的类别信息。
将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的预测类别对应的类别信息。将所得到的类别量化信息输入训练后的信息预测模型,即可得到与待预测 信息对应的类别信息,具体的,将类别量化信息中每一类型对应的类别量化值分别输入信息预测模型中对应的输入节点,则每一输入节点的输入节点值即为与该输入节点对应的一个类别量化值,通过第一公式组及第二公式组的计算,即可得到每一输出节点的输出节点值,输出节点值即为待预测客户与该输出节点对应分类项的匹配度,获取匹配度最高的分类项作为待预测信息的类别信息。
例如,将类型为分别为父母、配偶、兄妹及同事的类别量化值输入信息预测模型中对应的四个输入节点,得到五个输出节点对应的输出节点值分别为:初中及以下13.5%,高中及中专38.7%,专科43.5%,本科68.1%,研究生及以上2.2%,则获取本科作为与待预测信息对应的类别信息,也即是将本科确定为待预测客户在预测类别中所缺失的类别信息。
在一实施例中,如图5所示,步骤S150之后还包括步骤S160。
S160、将所述待预测信息及所述类别信息添加至所述预置客户信息表中。
将所述待预测信息及所述类别信息添加至所述预置客户信息表中。由于待预测信息中仅包含待预测客户的部分信息,而不包含待预测客户的类别信息,因此可将待预测信息中待预测客户的信息及所得到的类别信息添加至预置客户信息表中,也即是基于所得到的类别信息对预置客户信息表中的信息进行扩充,后续可基于所扩充的信息作为对其他待预测客户的缺失信息进行预测的基础。
在本申请实施例所提供的缺失信息预测方法中,根据模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型;根据数据集及参数调整规则对信息预测模型进行训练得到训练后的信息预测模型;获取预置客户信息表中与待预测信息对应的关联客户的类别;根据类别信息量化公式对关联客户的类别进行量化得到类别量化信息;将类别量化信息输入训练后的信息预测模型得到待预测信息对应的类别信息。通过上述方法,可基于与客户相关联的其他客户的信息,对客户所缺失的信息进行准确预测,大幅提升了获取客户缺失信息的效率。
本申请实施例还提供一种缺失信息预测装置,该缺失信息预测装置用于执行前述缺失信息预测方法的任一实施例。具体地,请参阅图6,图6是本申请实施例提供的缺失信息预测装置的示意性框图。该缺失信息预测装置可以配置于用户终端中。
如图6所示,缺失信息预测装置100包括信息预测模型构建单元110、信息预测模型训练单元120、关联客户类别获取单元130、类别量化信息获取单元140和类别信息获取单元150。
信息预测模型构建单元110,用于根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型,其中,所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式。
其他发明实施例中,所述信息预测模型构建单元110包括子单元:输入节点构建单元、输出节点构建单元、全连接隐层构建单元、第一公式组构建单元和第二公式组构建单元。
输入节点构建单元,用于根据所述模型配置信息中的输入项信息构建所述信息预测模型 的输入节点;输出节点构建单元,用于根据所述模型配置信息中的输出项信息构建所述信息预测模型的输出节点;全连接隐层构建单元,用于将所述输入节点的数量及所述输出节点的数量输入所述特征单元配置公式,以根据计算结果构建包含相应数量的特征单元的全连接隐层;第一公式组构建单元,用于根据所述全连接隐层中的特征单元及所述输入节点,以输入节点值作为输入值、特征单元值作为输出值构建输入节点至特征单元的第一公式组;第二公式组构建单元,用于根据所述全连接隐层中的特征单元及所述输出节点,以特征单元值作为输入值、输出节点值作为输出值构建特征单元至输出节点的第二公式组,以得到信息预测模型。
信息预测模型训练单元120,用于根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练,以得到训练后的所述信息预测模型。
其他发明实施例中,所述信息预测模型训练单元120包括子单元:数据集拆分单元、准确率获取单元和参数值确定单元。
数据集拆分单元,用于将所述数据集拆分为预设数量的子数据集;准确率获取单元,用于根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练,并根据所述子数据集计算每一轮训练后所述信息预测模型的准确率;参数值确定单元,用于将准确率最高的一轮训练的参数值作为所述信息预测模型的参数值以得到训练后的所述信息预测模型。
关联客户类别获取单元130,用于若接收到所输入的包含待预测客户及预测类别的待预测信息,获取预置的客户信息表中与所述待预测信息对应的关联客户的类别。
其他发明实施例中,所述关联客户类别获取单元130包括子单元:关联客户信息获取单元和类别获取单元。
关联客户信息获取单元,用于根据所述待预测信息中的待预测客户获取所述预置客户信息表中与所述待预测客户对应的关联客户信息;类别获取单元,用于根据所述待预测信息中的预测类别获取与所述关联客户信息中每一关联客户对应的类别。
类别量化信息获取单元140,用于根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息。
类别信息获取单元150,用于将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的待预测类别对应的类别信息。
其他发明实施例中,所述缺失信息预测装置100还包括子单元:类别信息添加单元。
类别信息添加单元,用于将所述待预测信息及所述类别信息添加至所述预置客户信息表中。
在本申请实施例所提供的缺失信息预测装置用于执行上述缺失信息预测方法,根据模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型;根据数据集及参数调整规则对信息预测模型进行训练得到训练后的信息预测模型;获取预置客户信息表中与待预测信息对应的关联客户的类别;根据类别信息量化公式对关联客户的类别进行量化得到类别量化信息;将类别量化信息输入训练后的信息预测模型得到待预测信息对应的类别信息。通过 上述方法,可基于与客户相关联的其他客户的信息,对客户所缺失的信息进行准确预测,大幅提升了获取客户缺失信息的效率。
上述缺失信息预测装置可以实现为计算机程序的形式,该计算机程序可以在如图7所示的计算机设备上运行。
请参阅图7,图7是本申请实施例提供的计算机设备的示意性框图。
参阅图7,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行缺失信息预测方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行缺失信息预测方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现上述的缺失信息预测方法中对应的功能。
本领域技术人员可以理解,图7中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图7所示实施例一致,在此不再赘述。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(Central Processing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本申请的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质,也可以是易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现上述的缺失信息预测方法中所包含的步骤。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能 够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
而前述的存储介质为实体的、非瞬时性的存储介质,例如可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的实体存储介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (20)

  1. 一种缺失信息预测方法,应用于用户终端,其中,所述缺失信息预测方法包括:
    根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型,其中,所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式;
    根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练,以得到训练后的所述信息预测模型;
    若接收到所输入的包含待预测客户及预测类别的待预测信息,获取预置的客户信息表中与所述待预测信息对应的关联客户的类别;
    根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息;
    将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的预测类别对应的类别信息。
  2. 根据权利要求1所述的缺失信息预测方法,其中,所述根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型,包括:
    根据所述模型配置信息中的输入项信息构建所述信息预测模型的输入节点;
    根据所述模型配置信息中的输出项信息构建所述信息预测模型的输出节点;
    将所述输入节点的数量及所述输出节点的数量输入所述特征单元配置公式,以根据计算结果构建包含相应数量的特征单元的全连接隐层;
    根据所述全连接隐层中的特征单元及所述输入节点,以输入节点值作为输入值、特征单元值作为输出值构建输入节点至特征单元的第一公式组;
    根据所述全连接隐层中的特征单元及所述输出节点,以特征单元值作为输入值、输出节点值作为输出值构建特征单元至输出节点的第二公式组,以得到信息预测模型。
  3. 根据权利要求1所述的缺失信息预测方法,其中,所述根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练,以得到训练后的所述信息预测模型,包括:
    将所述数据集拆分为预设数量的子数据集;
    根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练,并根据所述子数据集计算每一轮训练后所述信息预测模型的准确率;
    将准确率最高的一轮训练的参数值作为所述信息预测模型的参数值以得到训练后的所述信息预测模型。
  4. 根据权利要求1所述的缺失信息预测方法,其中,所述获取预置的客户信息表中与所述待预测信息对应的关联客户的类别,包括:
    根据所述待预测信息中的待预测客户获取所述预置客户信息表中与所述待预测客户对应的关联客户信息;
    根据所述待预测信息中的预测类别获取与所述关联客户信息中每一关联客户对应的类别。
  5. 根据权利要求1所述的缺失信息预测方法,其中,所述缺失信息预测方法还包括:
    将所述待预测信息及所述类别信息添加至所述预置客户信息表中。
  6. 根据权利要求2所述的缺失信息预测方法,其中,所述特征单元配置公式为N 0=N 1×N 2/2或N 0=2×(N 1×N 2) 1/2,其中,N 0为所述全连接隐层中特征单元的配置数量,N 1为所述输入节点的数量,N 2为所述输出节点的数量。
  7. 根据权利要求3所述的缺失信息预测方法,其中,所述参数调整规则包括准确率阈值、参数调整方向及参数调整幅度,所述子数据集作为训练数据集,所述根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练包括:
    将一个所述训练数据集中每一客户对应的信息输入所述信息预测模型得到每一所述客户与多个分类项之间的匹配度;
    根据每一所述客户与多个分类项之间的匹配度及每一客户的目标类别信息计算得到所述训练数据集的训练准确率;
    判断所述训练数据集的训练准确率是否小于所述准确率阈值得到判断结果;
    若所述判断结果为所述训练数据集的训练准确率不小于所述准确率阈值,根据所述参数调整方向中的正向调整及所述参数调整幅度中的幅度值对所述信息预测模型中的参数值进行调整;
    若所述判断结果为所述训练数据集的训练准确率小于所述准确率阈值,根据所述参数调整方向中的反向调整及所述参数调整幅度中的幅度值对所述信息预测模型中的参数值进行调整。
  8. 一种缺失信息预测装置,其中,包括:
    信息预测模型构建单元,用于根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型,其中,所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式;
    信息预测模型训练单元,用于根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练,以得到训练后的所述信息预测模型;
    关联客户类别获取单元,用于若接收到所输入的包含待预测客户及预测类别的待预测信息,获取预置的客户信息表中与所述待预测信息对应的关联客户的类别;
    类别量化信息获取单元,用于根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息;
    类别信息获取单元,用于将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的待预测类别对应的类别信息。
  9. 一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
    根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型,其中,所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式;
    根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练,以得到训练后的所述信息预测模型;
    若接收到所输入的包含待预测客户及预测类别的待预测信息,获取预置的客户信息表中与所述待预测信息对应的关联客户的类别;
    根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息;
    将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的预测类别对应的类别信息。
  10. 根据权利要求9所述的计算机设备,其中,所述根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型,包括:
    根据所述模型配置信息中的输入项信息构建所述信息预测模型的输入节点;
    根据所述模型配置信息中的输出项信息构建所述信息预测模型的输出节点;
    将所述输入节点的数量及所述输出节点的数量输入所述特征单元配置公式,以根据计算结果构建包含相应数量的特征单元的全连接隐层;
    根据所述全连接隐层中的特征单元及所述输入节点,以输入节点值作为输入值、特征单元值作为输出值构建输入节点至特征单元的第一公式组;
    根据所述全连接隐层中的特征单元及所述输出节点,以特征单元值作为输入值、输出节点值作为输出值构建特征单元至输出节点的第二公式组,以得到信息预测模型。
  11. 根据权利要求9所述的计算机设备,其中,所述根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练,以得到训练后的所述信息预测模型,包括:
    将所述数据集拆分为预设数量的子数据集;
    根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练,并根据所述子数据集计算每一轮训练后所述信息预测模型的准确率;
    将准确率最高的一轮训练的参数值作为所述信息预测模型的参数值以得到训练后的所述信息预测模型。
  12. 根据权利要求9所述的计算机设备,其中,所述获取预置的客户信息表中与所述待预测信息对应的关联客户的类别,包括:
    根据所述待预测信息中的待预测客户获取所述预置客户信息表中与所述待预测客户对应的关联客户信息;
    根据所述待预测信息中的预测类别获取与所述关联客户信息中每一关联客户对应的类别。
  13. 根据权利要求9所述的计算机设备,其中,还包括:
    将所述待预测信息及所述类别信息添加至所述预置客户信息表中。
  14. 根据权利要求10所述的计算机设备,其中,所述特征单元配置公式为N 0=N 1×N 2/2或N 0=2×(N 1×N 2) 1/2,其中,N 0为所述全连接隐层中特征单元的配置数量,N 1为所述输入节点的数量,N 2为所述输出节点的数量。
  15. 根据权利要求11所述的计算机设备,其中,所述参数调整规则包括准确率阈值、参 数调整方向及参数调整幅度,所述子数据集作为训练数据集,所述根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练包括:
    将一个所述训练数据集中每一客户对应的信息输入所述信息预测模型得到每一所述客户与多个分类项之间的匹配度;
    根据每一所述客户与多个分类项之间的匹配度及每一客户的目标类别信息计算得到所述训练数据集的训练准确率;
    判断所述训练数据集的训练准确率是否小于所述准确率阈值得到判断结果;
    若所述判断结果为不小于,根据所述参数调整方向中的正向调整及所述参数调整幅度中的幅度值对所述信息预测模型中的参数值进行调整;
    若所述判断结果为小于,根据所述参数调整方向中的反向调整及所述参数调整幅度中的幅度值对所述信息预测模型中的参数值进行调整。
  16. 一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行以下操作:
    根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型,其中,所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式;
    根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练,以得到训练后的所述信息预测模型;
    若接收到所输入的包含待预测客户及预测类别的待预测信息,获取预置的客户信息表中与所述待预测信息对应的关联客户的类别;
    根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息;
    将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的预测类别对应的类别信息。
  17. 根据权利要求16所述的计算机可读存储介质,其中,所述根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型,包括:
    根据所述模型配置信息中的输入项信息构建所述信息预测模型的输入节点;
    根据所述模型配置信息中的输出项信息构建所述信息预测模型的输出节点;
    将所述输入节点的数量及所述输出节点的数量输入所述特征单元配置公式,以根据计算结果构建包含相应数量的特征单元的全连接隐层;
    根据所述全连接隐层中的特征单元及所述输入节点,以输入节点值作为输入值、特征单元值作为输出值构建输入节点至特征单元的第一公式组;
    根据所述全连接隐层中的特征单元及所述输出节点,以特征单元值作为输入值、输出节点值作为输出值构建特征单元至输出节点的第二公式组,以得到信息预测模型。
  18. 根据权利要求16所述的计算机可读存储介质,其中,所述根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练,以得到训练后的所述信息预测模型,包括:
    将所述数据集拆分为预设数量的子数据集;
    根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练,并根据所述子数据集计算每一轮训练后所述信息预测模型的准确率;
    将准确率最高的一轮训练的参数值作为所述信息预测模型的参数值以得到训练后的所述信息预测模型。
  19. 根据权利要求16所述的计算机可读存储介质,其中,所述获取预置的客户信息表中与所述待预测信息对应的关联客户的类别,包括:
    根据所述待预测信息中的待预测客户获取所述预置客户信息表中与所述待预测客户对应的关联客户信息;
    根据所述待预测信息中的预测类别获取与所述关联客户信息中每一关联客户对应的类别。
  20. 根据权利要求16所述的计算机可读存储介质,其中,还包括:
    将所述待预测信息及所述类别信息添加至所述预置客户信息表中。
PCT/CN2020/103950 2019-11-22 2020-07-24 缺失信息预测方法、装置、计算机设备及存储介质 WO2021098265A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201911156335.1 2019-11-22
CN201911156335.1A CN111160604A (zh) 2019-11-22 2019-11-22 缺失信息预测方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
WO2021098265A1 true WO2021098265A1 (zh) 2021-05-27

Family

ID=70556081

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2020/103950 WO2021098265A1 (zh) 2019-11-22 2020-07-24 缺失信息预测方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN111160604A (zh)
WO (1) WO2021098265A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160604A (zh) * 2019-11-22 2020-05-15 深圳壹账通智能科技有限公司 缺失信息预测方法、装置、计算机设备及存储介质
CN115841224A (zh) * 2022-11-11 2023-03-24 南京群咖信息科技有限公司 一种均衡量化企业客户关系的管理调控系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108053251A (zh) * 2017-12-18 2018-05-18 北京小度信息科技有限公司 信息处理方法、装置、电子设备及计算机可读存储介质
CN108154401A (zh) * 2018-01-15 2018-06-12 网易无尾熊(杭州)科技有限公司 用户画像刻画方法、装置、介质和计算设备
CN108520444A (zh) * 2018-04-12 2018-09-11 中国平安人寿保险股份有限公司 保险产品推荐方法、设备、装置及计算机可读存储介质
US20190114689A1 (en) * 2017-10-13 2019-04-18 Midea Group Co., Ltd. Method and system for providing personalized on-location information exchange
CN110110094A (zh) * 2019-04-22 2019-08-09 华侨大学 基于社交网络知识图谱的跨网络人物关联方法
CN111160604A (zh) * 2019-11-22 2020-05-15 深圳壹账通智能科技有限公司 缺失信息预测方法、装置、计算机设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126597A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 用户属性预测方法及装置
CN107437111B (zh) * 2017-07-31 2020-07-14 杭州朗和科技有限公司 基于神经网络的数据处理方法、介质、装置和计算设备
CN109614544B (zh) * 2018-10-30 2023-11-03 北京奇虎科技有限公司 一种用户的个人信息的预测方法及装置
CN109935338A (zh) * 2019-03-07 2019-06-25 平安科技(深圳)有限公司 基于机器学习的数据预测处理方法、装置和计算机设备
CN110009042A (zh) * 2019-04-08 2019-07-12 中诚信征信有限公司 一种数据预测方法、装置、电子设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190114689A1 (en) * 2017-10-13 2019-04-18 Midea Group Co., Ltd. Method and system for providing personalized on-location information exchange
CN108053251A (zh) * 2017-12-18 2018-05-18 北京小度信息科技有限公司 信息处理方法、装置、电子设备及计算机可读存储介质
CN108154401A (zh) * 2018-01-15 2018-06-12 网易无尾熊(杭州)科技有限公司 用户画像刻画方法、装置、介质和计算设备
CN108520444A (zh) * 2018-04-12 2018-09-11 中国平安人寿保险股份有限公司 保险产品推荐方法、设备、装置及计算机可读存储介质
CN110110094A (zh) * 2019-04-22 2019-08-09 华侨大学 基于社交网络知识图谱的跨网络人物关联方法
CN111160604A (zh) * 2019-11-22 2020-05-15 深圳壹账通智能科技有限公司 缺失信息预测方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN111160604A (zh) 2020-05-15

Similar Documents

Publication Publication Date Title
WO2021142916A1 (zh) 基于代理辅助进化算法的翼型优化方法及装置
CN109697522B (zh) 一种数据预测的方法和装置
US20170255790A1 (en) Systems and methods for processing requests for genetic data based on client permission data
US10346782B2 (en) Adaptive augmented decision engine
Huang et al. Feature screening for ultrahigh dimensional categorical data with applications
US10789149B2 (en) Duplicate bug report detection using machine learning algorithms and automated feedback incorporation
WO2018090545A1 (zh) 融合时间因素的协同过滤方法、装置、服务器和存储介质
CN111461180A (zh) 样本分类方法、装置、计算机设备及存储介质
WO2021068513A1 (zh) 异常对象识别方法、装置、介质及电子设备
WO2021098265A1 (zh) 缺失信息预测方法、装置、计算机设备及存储介质
WO2022095379A1 (zh) 数据降维处理方法、装置、计算机设备及存储介质
WO2022179384A1 (zh) 一种社交群体的划分方法、划分系统及相关装置
WO2020143186A1 (zh) 推荐系统训练方法、装置、计算机设备及存储介质
CN107392259B (zh) 构建不均衡样本分类模型的方法和装置
WO2022126975A1 (zh) 客户信息校验方法、装置、计算机设备及存储介质
US20120072456A1 (en) Adaptive resource allocation for multiple correlated sub-queries in streaming systems
WO2022095382A1 (zh) 基于知识图谱的电子卡片生成推送方法、装置
JP2022000752A (ja) 情報処理に用いられる方法、装置、電子機器及びプログラム
WO2021068798A1 (zh) 基于文本的指标提取方法、装置、计算机设备及存储介质
US11263224B2 (en) Identifying and scoring data values
CN111179055B (zh) 授信额度调整方法、装置和电子设备
US10885593B2 (en) Hybrid classification system
CN110738508A (zh) 一种数据分析方法和装置
WO2021111456A1 (en) Moderator for identifying deficient nodes in federated learning
CN114065864A (zh) 联邦学习方法、联邦学习装置、电子设备以及存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20890046

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 05/10/2022)

122 Ep: pct application non-entry in european phase

Ref document number: 20890046

Country of ref document: EP

Kind code of ref document: A1