WO2021098265A1

WO2021098265A1 - 缺失信息预测方法、装置、计算机设备及存储介质

Info

Publication number: WO2021098265A1
Application number: PCT/CN2020/103950
Authority: WO
Inventors: 董雨婷
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2019-11-22
Filing date: 2020-07-24
Publication date: 2021-05-27
Also published as: CN111160604A

Abstract

一种缺失信息预测方法、装置、计算机设备及存储介质。方法包括：根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型（S110），根据预置的数据集及预置的参数调整规则对信息预测模型进行训练，以得到训练后的信息预测模型（S120），若接收到所输入的待预测信息，获取预置的客户信息表中与待预测信息对应的关联客户的类别（S130），根据预置的类别信息量化公式对与每一关联客户的类别进行量化以得到类别量化信息（S140），将类别量化信息输入训练后的信息预测模型以获取对应的类别信息（S150）。该方法基于预测模型技术，属于人工智能技术领域，可基于与客户相关联的其他客户的信息，对客户所缺失的信息进行准确预测，大幅提升了获取客户缺失信息的效率。

Description

缺失信息预测方法、装置、计算机设备及存储介质

本申请要求于2019年11月22日提交中国专利局、申请号为201911156335.1，发明名称为“缺失信息预测方法、装置、计算机设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种缺失信息预测方法、装置、计算机设备及存储介质。

背景技术

企业在为客户办理业务的过程中，经常需客户提供与其本人相关的个人信息。在用户个人信息部分缺失时，企业难以及时获取客户缺失的个人信息，导致无法进行后续业务办理流程。可通过与客户取得联系以获取客户所缺失的个人信息，然而发明人发现在部分情况下难以与客户取得联系，导致无法及时获取客户所缺失的个人信息，因此信息获取的效率较低，且这一获取方式易对客户造成打扰。因此，现有的技术方法在获取客户缺失信息时存在获取效率较低的问题。

发明内容

本申请实施例提供了一种缺失信息预测方法、装置、计算机设备及存储介质，旨在解决现有技术方法中所存在的无法及时获取客户的缺失信息的问题。

第一方面，本申请实施例提供了一种缺失信息预测方法，其包括：

根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型，其中，所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式；

根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练，以得到训练后的所述信息预测模型；

若接收到所输入的待预测信息，获取预置的客户信息表中与所述待预测信息对应的关联客户的类别；

根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息；

将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的待预测类别对应的类别信息。

第二方面，本申请实施例提供了一种缺失信息预测装置，其包括：

信息预测模型构建单元，用于根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型，其中，所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式；

信息预测模型训练单元，用于根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练，以得到训练后的所述信息预测模型；

关联客户类别获取单元，用于若接收到所输入的包含待预测客户及预测类别的待预测信息，获取预置的客户信息表中与所述待预测信息对应的关联客户的类别；

类别量化信息获取单元，用于根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息；

类别信息获取单元，用于将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的待预测类别对应的类别信息。

第三方面，本申请实施例又提供了一种计算机设备，其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述的缺失信息预测方法。

第四方面，本申请实施例还提供了一种计算机可读存储介质，其中所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的缺失信息预测方法。

本申请实施例提供了一种缺失信息预测方法、装置、计算机设备及存储介质。根据模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型；根据数据集及参数调整规则对信息预测模型进行训练得到训练后的信息预测模型；获取预置客户信息表中与待预测信息对应的关联客户的类别；根据类别信息量化公式对关联客户的类别进行量化得到类别量化信息；将类别量化信息输入训练后的信息预测模型得到待预测信息对应的类别信息。通过上述方法，可基于与客户相关联的其他客户的信息，对客户所缺失的信息进行准确预测，大幅提升了获取客户缺失信息的效率。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的缺失信息预测方法的流程示意图；

图2为本申请实施例提供的缺失信息预测方法的子流程示意图；

图3为本申请实施例提供的缺失信息预测方法的另一子流程示意图；

图4为本申请实施例提供的缺失信息预测方法的另一流程示意图；

图5为本申请实施例提供的缺失信息预测方法的另一子流程示意图；

图6为本申请实施例提供的缺失信息预测装置的示意性框图；

图7为本申请实施例提供的计算机设备的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

请参阅图1，图1是本申请实施例提供的缺失信息预测方法的流程示意图。该缺失信息预测方法应用于用户终端中，该方法通过安装于用户终端中的应用软件进行执行，用户终端即是用于执行缺失信息预测方法以对客户缺失的信息进行预测的终端设备，例如台式电脑、笔记本电脑、平板电脑或手机等。

如图1所示，该方法包括步骤S110～S150。

S110、根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型。

根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型。模型配置信息即是用于对信息预测模型中的输入节点、全连接隐层及输出节点进行配置的信息，模型配置信息中包括输入项信息、输出项信息及特征单元配置公式，输入项信息即为用于配置输入节点的信息，输出项信息即为用于配置输出节点的信息，特征单元配置公式用于计算全连接隐层中特征单元的配置数量，信息预测模型可基于与某一客户相关联的关联客户信息对该客户对应的部分缺失信息进行预测，输入项信息可以是与关联客户信息对应的类型，输出项信息可以是预测结果所包含的分类项。信息预测模型中包含多个输入节点、多个输出节点及多个特征单元，输入项信息中包含多个输入项，输出项信息中包含多个输出项，每一输入项对应一个输入节点，每一输出项对应一个输出节点，特征单元可用于反映输入信息与该输入信息对应的目标预测信息之间的关系。

在一实施例中，如图2所示，步骤S110包括子步骤S111、S112、S113、S114和S115。

S111、根据所述模型配置信息中的输入项信息构建所述信息预测模型的输入节点。

根据所述模型配置信息中的输入项信息构建所述信息预测模型的输入节点，具体的，输入项信息中所包含的每一输入项对应一个输入节点，则可根据输入项信息构建与每一输入项对应的输入节点。

例如，某一信息预测模型需对客户所缺失的学历信息进行预测，输入项信息为关联客户与待预测客户之间关系的类型，包括父母、配偶、兄妹、同事四种类型，则生成分别与父母、配偶、兄妹、同事四个输入项对应的四个输入节点。

S112、根据所述模型配置信息中的输出项信息构建所述信息预测模型的输出节点。

根据所述模型配置信息中的输出项信息构建所述信息预测模型的输出节点，具体的，输出项信息中所包含的每一输出项对应一个输出节点，则可根据输出项信息构建与每一输出项对应的输出节点。

例如，输出项信息为学历信息的分类项，包括初中及以下、高中及中专、专科、本科、研究生及以上五个分类项，则分别生成与初中及以下、高中及中专、专科、本科、研究生及以上五个分类项对应的五个输出节点。

S113、将所述输入节点的数量及所述输出节点的数量输入所述特征单元配置公式，以根据计算结果构建包含相应数量的特征单元的全连接隐层。

将所述输入节点的数量及所述输出节点的数量输入所述特征单元配置公式，以根据计算结果构建包含相应数量的特征单元的全连接隐层。全连接隐层即是用于对输入节点与输出节点进行联系的中间层，全连接隐层中包含若干个特征单元，每一个特征单元均与所有输入节点和所有输出节点进行关联。全连接隐层中所包含特征单元的配置数量可根据特征单元配置公式计算得到，特征单元的配置数量与输入节点的数量及输出节点的数量存在关联关系，具体的，特征单元配置公式可以是N ₀＝N ₁×N ₂/2或N ₀＝2×(N ₁×N ₂) ^1/2，其中，N ₀为全连接隐层中特征单元的配置数量，N ₁为输入节点的数量，N ₂为输出节点的数量。

例如，输入项信息中包含父母、配偶、兄妹、同事四个类别，对应得到的输入节点为四个，输出项信息中包含初中及以下、高中及中专、专科、本科、研究生及以上五个分类项，对应得到的输出节点为五个，根据上式N ₀＝N ₁×N ₂/2计算得到特征单元的数量为10，则可对应构建包含十个特征单元的全连接隐层。

S114、根据所述全连接隐层中的特征单元及所述输入节点，以输入节点值作为输入值、特征单元值作为输出值构建输入节点至特征单元的第一公式组。

根据所述全连接隐层中的特征单元及所述输入节点，以输入节点值作为输入值、特征单元值作为输出值构建输入节点至特征单元的第一公式组，其中，第一公式组包含所有输入节点至所有特征单元的公式。输入节点即是信息预测模型中用于对某一类型关联客户的类别信息进行输入的节点，输入节点的具体数值即为输入节点值，也即是对某一类型关联客户的类别信息进行量化后所得的数值，由于每一输入节点对应一个类型的关联客户的类别信息，所有输入节点即对应与一个待预测客户相关联的所有关联客户的类别信息，特征单元值即是全连接隐层中的特征单元的计算值。

例如，某一输入节点的输入节点值为x1，某一特征单元的特征单元值为y1，则该输入节点至该特征单元的公式为y1＝a×x1+b；其中，a和b为该公式中的参数，公式中的参数值为随机生成的数字。

S115、根据所述全连接隐层中的特征单元及所述输出节点，以特征单元值作为输入值、输出节点值作为输出值构建特征单元至输出节点的第二公式组，以得到信息预测模型。

根据所述全连接隐层中的特征单元及所述输出节点，以特征单元值作为输入值、输出节点值作为输出值构建特征单元至输出节点的第二公式组，其中，第二公式组包含所有特征单元至所有输出节点的公式。输出节点即是信息预测模型中用于对待预测客户与每一分类项对应的匹配度进行输出的节点，输出节点的具体数值即是输出节点值，输出节点值即表示待预测客户与该输出节点对应分类项之间的匹配度，特征单元值即是全连接隐层中的特征单元的计算值。

例如，某一特征单元的特征单元值为y1，某一输出节点的输出节点值为z1，则该特征单元至该输出节点的公式为z1＝c×y1+d；其中，c和d为该公式中的参数，公式中的参数值为随机生成的数字。

S120、根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练，以得到训练后的所述信息预测模型。

根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练，以得到训练后的所述信息预测模型。所生成的信息预测模型为初始预测模型，需对该预测模型进行训练，也即是对信息预测模型中公式的参数值进行调整优化，以得到预测精确度满足使用要求的信息预测模型。具体的，数据集中包含客户的目标类别信息，以及每一客户的类别量化信息，类别量化信息即用于对与该客户相关联的关联客户的类别进行量化的信息，类别量化信息中包含对某一类型关联客户的类别信息进行量化后所得的数值。所述参数调整规则即为对信息预测模型中参数值进行调整的规则。

在一实施例中，如图3所示，步骤S120包括子步骤S121、S122和S123。

S121、将所述数据集拆分为预设数量的子数据集。

将所述数据集拆分为预设数量的子数据集。预设数量即是用于对数据集进行拆分的数量信息，根据预设数量即可将数据集中的客户信息平均拆分为对应的多个子数据集，每一子数据集中均包含多份客户对应的信息。

例如，预置的数据集中包含3000份客户对应的信息，预设数量为12，则将3000份客户对应的信息平均拆分为12个子数据集，每一子数据集中包含250份客户对应的信息。

S122、根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练，并根据所述子数据集计算每一轮训练后所述信息预测模型的准确率。

这一训练过程也即是网格搜索法，依次选择一个子数据集作为训练数据集、其余子数据集作为测试数据集并结合参数调整规则对信息预测模型进行多轮训练，并根据子数据集计算每一轮训练后所述信息预测模型的准确率。具体的，子数据集总数为k，则对信息预测模型进行k轮交叉训练，对信息预测模型进行第一轮训练时，将第一个子数据集作为测试数据集，其余的k-1个子数据集作为训练数据集，将第一个训练数据集中每一客户对应的信息输入信息预测模型得到每一客户与多个分类项之间的匹配度，若某一客户匹配度最高的分类项与该客户的目标类别信息相同，则将该客户作为正样本客户，统计该训练数据集中正样本客户的占比得到即可得到该训练数据集的训练准确率Z＝S/V，其中，S为该训练数据集中正样本客户的数量，V为该训练数据集中所包含客户的数量。参数调整规则中包括准确率阈值、参数调整方向及参数调整幅度，参数调整方向包括正向调整及负向调整，参数调整幅度即是进行调整的具体幅度值，判断当前训练数据集在对信息预测模型进行训练时的训练准确率是否小于准确率阈值，若判断结果为不小于，则根据参数调整方向中的正向调整及参数调整幅度中的幅度值对信息预测模型中的参数值进行调整；若判断结果为小于，则根据参数调整方向中的反向调整及参数调整幅度中的幅度值对信息预测模型中的参数值进行调整。

例如，参数调整幅度中的幅度值为0.05，判断结果为当前训练数据集对信息预测模型进行训练时的训练准确率不小于准确率阈值，则本次调整需进行正向调整，本次调整在该信息预测模型中参数值原数值基础上乘以1.05得到新的参数值。

一个训练数据集即可对信息预测模型中的参数值进行一次调整，通过k-1个训练数据集对信息预测模型进行训练后得到第一轮训练过后的信息预测模型，将剩余的一个测试数据集输入第一轮训练过后的信息预测模型即可计算得到对应的准确率，也即是完成对该信息预测模型的一轮训练，通过测试数据集计算信息预测模型的准确率的方法与计算训练准确率的方法相同。

S123、将准确率最高的一轮训练的参数值作为所述信息预测模型的参数值以得到训练后的所述信息预测模型。

将准确率最高的一轮训练的参数值作为所述信息预测模型的参数值以得到训练后的所述信息预测模型。信息预测模型进行多轮交叉训练后，得到每一轮训练的准确率，将准确率最高的一轮训练的参数值作为信息预测模型最优的参数值，即可得到训练后的信息预测模型。

S130、若接收到所输入的包含待预测客户及预测类别的待预测信息，获取预置的客户信息表中与所述待预测信息对应的关联客户的类别。

若接收到用户所输入的待预测信息，获取预置的客户信息表中与所述待预测信息对应的关联客户的类别。其中，预置客户信息表中包含多个客户的完整信息，待预测信息中包含一个待预测客户及一个预测类别，待预测信息中还包含待预测客户的姓名、性别、年龄、家庭信息、任职公司等信息，待预测客户的类别缺失，待预测客户的类别也即是需进行预测的缺失信息，可根据待预测信息获取预置客户信息表中对应的关联客户的类别，并进一步得到类别量化信息。具体的，预置客户信息表中包含客户的账号、姓名、性别、年龄、家庭信息、任职公司、类别等信息。类别即是按照与客户相应的信息对该客户进行分类所得分类结果的信息，类别可包含多个，若预置客户信息表中包含多个类别，可采用第一类别、第二类别、……的方式进行表示。

例如，某一预置客户信息表如表1所示。

表1

在一实施例中，如图4所示，步骤S130包括子步骤S131和S132。

S131、根据所述待预测信息中的待预测客户获取所述预置客户信息表中与所述待预测客户对应的关联客户信息。

根据所述待预测信息中的待预测客户获取预置客户信息表中与所述待预测客户对应的关联客户信息。具体的，根据待预测客户的姓名或家庭信息对预置客户信息表中每一客户的家庭信息进行筛选，以得到与待预测客户之间关系的类别为父母、配偶或兄妹的客户；根据待预测客户的任职公司对预置客户信息表中每一客户的任职公司进行筛选，以得到与待预测客户之间关系的类别为同事的客户。获取预置客户信息表中所有与待预测客户存在关系的客户作为关联客户，并获取每一关联客户对应的信息即可得到待预测客户的关联客户信息。

S132、根据所述待预测信息中的预测类别获取与所述关联客户信息中每一关联客户对应的类别。

根据所述待预测信息中的预测类别获取与所述关联客户信息中每一关联客户对应的类别。待预测信息中还包括预测类别，预测类别与预置客户信息表的一个类别相同，根据预测类别即可获取关联客户信息中每一关联客户对应的类别。

S140、根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息。

根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息。类别信息量化公式即是用于对每一关联客户对应的类别进行量化的公式，具体的，先根据关联客户与待预测客户之间关系的类型对每一关联客户对应的类别进行整理，之后对每一种类型的客户在每一分类项中的数量分布进行统计得到统计结果，根据类别信息量化公式对统计结果中每一种类型关联客户的类别进行量化，以得到类别量化信息。

例如，某一统计结果如表2所示。

任务ID	类型	初中及以下	高中及中专	专科	本科	研究生及以上
A0001	父母	0	1	1	0	0
A0001	配偶	0	0	0	1	0
A0001	兄妹	0	0	1	0	0
A0001	同事	0	1	1	3	0

表2

与学历这一预测类别对应的类别信息量化公式为T＝0.2×S ₁+0.4×S ₂+0.6×S ₃+0.8×S ₄+1×S ₅，其中，T为父母、配偶、兄妹或同事中任一类型对应的类别量化值，S ₁、S ₂、S ₃、S ₄、S ₅为相应类别的客户在每一分类项中的数量分布，根据上述公式计算得到类型为同事的类别量化值T＝0.2×0+0.4×1+0.6×1+0.8×3+1×0＝3.4。

S150、将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的预测类别对应的类别信息。

将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的预测类别对应的类别信息。将所得到的类别量化信息输入训练后的信息预测模型，即可得到与待预测信息对应的类别信息，具体的，将类别量化信息中每一类型对应的类别量化值分别输入信息预测模型中对应的输入节点，则每一输入节点的输入节点值即为与该输入节点对应的一个类别量化值，通过第一公式组及第二公式组的计算，即可得到每一输出节点的输出节点值，输出节点值即为待预测客户与该输出节点对应分类项的匹配度，获取匹配度最高的分类项作为待预测信息的类别信息。

例如，将类型为分别为父母、配偶、兄妹及同事的类别量化值输入信息预测模型中对应的四个输入节点，得到五个输出节点对应的输出节点值分别为：初中及以下13.5％，高中及中专38.7％，专科43.5％，本科68.1％，研究生及以上2.2％，则获取本科作为与待预测信息对应的类别信息，也即是将本科确定为待预测客户在预测类别中所缺失的类别信息。

在一实施例中，如图5所示，步骤S150之后还包括步骤S160。

S160、将所述待预测信息及所述类别信息添加至所述预置客户信息表中。

将所述待预测信息及所述类别信息添加至所述预置客户信息表中。由于待预测信息中仅包含待预测客户的部分信息，而不包含待预测客户的类别信息，因此可将待预测信息中待预测客户的信息及所得到的类别信息添加至预置客户信息表中，也即是基于所得到的类别信息对预置客户信息表中的信息进行扩充，后续可基于所扩充的信息作为对其他待预测客户的缺失信息进行预测的基础。

在本申请实施例所提供的缺失信息预测方法中，根据模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型；根据数据集及参数调整规则对信息预测模型进行训练得到训练后的信息预测模型；获取预置客户信息表中与待预测信息对应的关联客户的类别；根据类别信息量化公式对关联客户的类别进行量化得到类别量化信息；将类别量化信息输入训练后的信息预测模型得到待预测信息对应的类别信息。通过上述方法，可基于与客户相关联的其他客户的信息，对客户所缺失的信息进行准确预测，大幅提升了获取客户缺失信息的效率。

本申请实施例还提供一种缺失信息预测装置，该缺失信息预测装置用于执行前述缺失信息预测方法的任一实施例。具体地，请参阅图6，图6是本申请实施例提供的缺失信息预测装置的示意性框图。该缺失信息预测装置可以配置于用户终端中。

如图6所示，缺失信息预测装置100包括信息预测模型构建单元110、信息预测模型训练单元120、关联客户类别获取单元130、类别量化信息获取单元140和类别信息获取单元150。

信息预测模型构建单元110，用于根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型，其中，所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式。

其他发明实施例中，所述信息预测模型构建单元110包括子单元：输入节点构建单元、输出节点构建单元、全连接隐层构建单元、第一公式组构建单元和第二公式组构建单元。

输入节点构建单元，用于根据所述模型配置信息中的输入项信息构建所述信息预测模型的输入节点；输出节点构建单元，用于根据所述模型配置信息中的输出项信息构建所述信息预测模型的输出节点；全连接隐层构建单元，用于将所述输入节点的数量及所述输出节点的数量输入所述特征单元配置公式，以根据计算结果构建包含相应数量的特征单元的全连接隐层；第一公式组构建单元，用于根据所述全连接隐层中的特征单元及所述输入节点，以输入节点值作为输入值、特征单元值作为输出值构建输入节点至特征单元的第一公式组；第二公式组构建单元，用于根据所述全连接隐层中的特征单元及所述输出节点，以特征单元值作为输入值、输出节点值作为输出值构建特征单元至输出节点的第二公式组，以得到信息预测模型。

信息预测模型训练单元120，用于根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练，以得到训练后的所述信息预测模型。

其他发明实施例中，所述信息预测模型训练单元120包括子单元：数据集拆分单元、准确率获取单元和参数值确定单元。

数据集拆分单元，用于将所述数据集拆分为预设数量的子数据集；准确率获取单元，用于根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练，并根据所述子数据集计算每一轮训练后所述信息预测模型的准确率；参数值确定单元，用于将准确率最高的一轮训练的参数值作为所述信息预测模型的参数值以得到训练后的所述信息预测模型。

关联客户类别获取单元130，用于若接收到所输入的包含待预测客户及预测类别的待预测信息，获取预置的客户信息表中与所述待预测信息对应的关联客户的类别。

其他发明实施例中，所述关联客户类别获取单元130包括子单元：关联客户信息获取单元和类别获取单元。

关联客户信息获取单元，用于根据所述待预测信息中的待预测客户获取所述预置客户信息表中与所述待预测客户对应的关联客户信息；类别获取单元，用于根据所述待预测信息中的预测类别获取与所述关联客户信息中每一关联客户对应的类别。

类别量化信息获取单元140，用于根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息。

类别信息获取单元150，用于将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的待预测类别对应的类别信息。

其他发明实施例中，所述缺失信息预测装置100还包括子单元：类别信息添加单元。

类别信息添加单元，用于将所述待预测信息及所述类别信息添加至所述预置客户信息表中。

在本申请实施例所提供的缺失信息预测装置用于执行上述缺失信息预测方法，根据模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型；根据数据集及参数调整规则对信息预测模型进行训练得到训练后的信息预测模型；获取预置客户信息表中与待预测信息对应的关联客户的类别；根据类别信息量化公式对关联客户的类别进行量化得到类别量化信息；将类别量化信息输入训练后的信息预测模型得到待预测信息对应的类别信息。通过上述方法，可基于与客户相关联的其他客户的信息，对客户所缺失的信息进行准确预测，大幅提升了获取客户缺失信息的效率。

上述缺失信息预测装置可以实现为计算机程序的形式，该计算机程序可以在如图7所示的计算机设备上运行。

请参阅图7，图7是本申请实施例提供的计算机设备的示意性框图。

参阅图7，该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时，可使得处理器502执行缺失信息预测方法。

该处理器502用于提供计算和控制能力，支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行缺失信息预测方法。

该网络接口505用于进行网络通信，如提供数据信息的传输等。本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现上述的缺失信息预测方法中对应的功能。

本领域技术人员可以理解，图7中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定，在其他实施例中，计算机设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。例如，在一些实施例中，计算机设备可以仅包括存储器及处理器，在这样的实施例中，存储器及处理器的结构及功能与图7所示实施例一致，在此不再赘述。

应当理解，在本申请实施例中，处理器502可以是中央处理单元(Central Processing Unit，CPU)，该处理器502还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

在本申请的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质，也可以是易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序，其中计算机程序被处理器执行时实现上述的缺失信息预测方法中所包含的步骤。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的设备、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为逻辑功能划分，实际实现时可以有另外的划分方式，也可以将具有相同功能的单元集合成一个单元，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个计算机可读存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

而前述的存储介质为实体的、非瞬时性的存储介质，例如可以是U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的实体存储介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种缺失信息预测方法，应用于用户终端，其中，所述缺失信息预测方法包括：

根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型，其中，所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式；

根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练，以得到训练后的所述信息预测模型；

若接收到所输入的包含待预测客户及预测类别的待预测信息，获取预置的客户信息表中与所述待预测信息对应的关联客户的类别；

根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息；

将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的预测类别对应的类别信息。
根据权利要求1所述的缺失信息预测方法，其中，所述根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型，包括：

根据所述模型配置信息中的输入项信息构建所述信息预测模型的输入节点；

根据所述模型配置信息中的输出项信息构建所述信息预测模型的输出节点；

将所述输入节点的数量及所述输出节点的数量输入所述特征单元配置公式，以根据计算结果构建包含相应数量的特征单元的全连接隐层；

根据所述全连接隐层中的特征单元及所述输入节点，以输入节点值作为输入值、特征单元值作为输出值构建输入节点至特征单元的第一公式组；

根据所述全连接隐层中的特征单元及所述输出节点，以特征单元值作为输入值、输出节点值作为输出值构建特征单元至输出节点的第二公式组，以得到信息预测模型。
根据权利要求1所述的缺失信息预测方法，其中，所述根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练，以得到训练后的所述信息预测模型，包括：

将所述数据集拆分为预设数量的子数据集；

根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练，并根据所述子数据集计算每一轮训练后所述信息预测模型的准确率；

将准确率最高的一轮训练的参数值作为所述信息预测模型的参数值以得到训练后的所述信息预测模型。
根据权利要求1所述的缺失信息预测方法，其中，所述获取预置的客户信息表中与所述待预测信息对应的关联客户的类别，包括：

根据所述待预测信息中的待预测客户获取所述预置客户信息表中与所述待预测客户对应的关联客户信息；

根据所述待预测信息中的预测类别获取与所述关联客户信息中每一关联客户对应的类别。
根据权利要求1所述的缺失信息预测方法，其中，所述缺失信息预测方法还包括：

将所述待预测信息及所述类别信息添加至所述预置客户信息表中。
根据权利要求2所述的缺失信息预测方法，其中，所述特征单元配置公式为N ₀＝N ₁×N ₂/2或N ₀＝2×(N ₁×N ₂) ^1/2，其中，N ₀为所述全连接隐层中特征单元的配置数量，N ₁为所述输入节点的数量，N ₂为所述输出节点的数量。
根据权利要求3所述的缺失信息预测方法，其中，所述参数调整规则包括准确率阈值、参数调整方向及参数调整幅度，所述子数据集作为训练数据集，所述根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练包括：

将一个所述训练数据集中每一客户对应的信息输入所述信息预测模型得到每一所述客户与多个分类项之间的匹配度；

根据每一所述客户与多个分类项之间的匹配度及每一客户的目标类别信息计算得到所述训练数据集的训练准确率；

判断所述训练数据集的训练准确率是否小于所述准确率阈值得到判断结果；

若所述判断结果为所述训练数据集的训练准确率不小于所述准确率阈值，根据所述参数调整方向中的正向调整及所述参数调整幅度中的幅度值对所述信息预测模型中的参数值进行调整；

若所述判断结果为所述训练数据集的训练准确率小于所述准确率阈值，根据所述参数调整方向中的反向调整及所述参数调整幅度中的幅度值对所述信息预测模型中的参数值进行调整。
一种缺失信息预测装置，其中，包括：

信息预测模型构建单元，用于根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型，其中，所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式；

信息预测模型训练单元，用于根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练，以得到训练后的所述信息预测模型；

关联客户类别获取单元，用于若接收到所输入的包含待预测客户及预测类别的待预测信息，获取预置的客户信息表中与所述待预测信息对应的关联客户的类别；

类别量化信息获取单元，用于根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息；

类别信息获取单元，用于将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的待预测类别对应的类别信息。
一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现以下步骤：

根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型，其中，所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式；

根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练，以得到训练后的所述信息预测模型；

若接收到所输入的包含待预测客户及预测类别的待预测信息，获取预置的客户信息表中与所述待预测信息对应的关联客户的类别；

根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息；

将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的预测类别对应的类别信息。
根据权利要求9所述的计算机设备，其中，所述根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型，包括：

根据所述模型配置信息中的输入项信息构建所述信息预测模型的输入节点；

根据所述模型配置信息中的输出项信息构建所述信息预测模型的输出节点；

将所述输入节点的数量及所述输出节点的数量输入所述特征单元配置公式，以根据计算结果构建包含相应数量的特征单元的全连接隐层；

根据所述全连接隐层中的特征单元及所述输入节点，以输入节点值作为输入值、特征单元值作为输出值构建输入节点至特征单元的第一公式组；

根据所述全连接隐层中的特征单元及所述输出节点，以特征单元值作为输入值、输出节点值作为输出值构建特征单元至输出节点的第二公式组，以得到信息预测模型。
根据权利要求9所述的计算机设备，其中，所述根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练，以得到训练后的所述信息预测模型，包括：

将所述数据集拆分为预设数量的子数据集；

根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练，并根据所述子数据集计算每一轮训练后所述信息预测模型的准确率；

将准确率最高的一轮训练的参数值作为所述信息预测模型的参数值以得到训练后的所述信息预测模型。
根据权利要求9所述的计算机设备，其中，所述获取预置的客户信息表中与所述待预测信息对应的关联客户的类别，包括：

根据所述待预测信息中的待预测客户获取所述预置客户信息表中与所述待预测客户对应的关联客户信息；

根据所述待预测信息中的预测类别获取与所述关联客户信息中每一关联客户对应的类别。
根据权利要求9所述的计算机设备，其中，还包括：

将所述待预测信息及所述类别信息添加至所述预置客户信息表中。
根据权利要求10所述的计算机设备，其中，所述特征单元配置公式为N ₀＝N ₁×N ₂/2或N ₀＝2×(N ₁×N ₂) ^1/2，其中，N ₀为所述全连接隐层中特征单元的配置数量，N ₁为所述输入节点的数量，N ₂为所述输出节点的数量。
根据权利要求11所述的计算机设备，其中，所述参数调整规则包括准确率阈值、参数调整方向及参数调整幅度，所述子数据集作为训练数据集，所述根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练包括：

将一个所述训练数据集中每一客户对应的信息输入所述信息预测模型得到每一所述客户与多个分类项之间的匹配度；

根据每一所述客户与多个分类项之间的匹配度及每一客户的目标类别信息计算得到所述训练数据集的训练准确率；

判断所述训练数据集的训练准确率是否小于所述准确率阈值得到判断结果；

若所述判断结果为不小于，根据所述参数调整方向中的正向调整及所述参数调整幅度中的幅度值对所述信息预测模型中的参数值进行调整；

若所述判断结果为小于，根据所述参数调整方向中的反向调整及所述参数调整幅度中的幅度值对所述信息预测模型中的参数值进行调整。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行以下操作：

根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型，其中，所述模型配置信息包括用于配置所述输入节点的输入项信息、用于配置所述输出节点的输出项信息和用于配置所述特征单元的特征单元配置公式；

根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练，以得到训练后的所述信息预测模型；

若接收到所输入的包含待预测客户及预测类别的待预测信息，获取预置的客户信息表中与所述待预测信息对应的关联客户的类别；

根据预置的类别信息量化公式对与每一所述关联客户的类别进行量化以得到类别量化信息；

将所述类别量化信息输入训练后的所述信息预测模型以获取所述待预测客户的预测类别对应的类别信息。
根据权利要求16所述的计算机可读存储介质，其中，所述根据所输入的模型配置信息构建包含输入节点、特征单元和输出节点的信息预测模型，包括：

根据所述模型配置信息中的输入项信息构建所述信息预测模型的输入节点；

根据所述模型配置信息中的输出项信息构建所述信息预测模型的输出节点；

将所述输入节点的数量及所述输出节点的数量输入所述特征单元配置公式，以根据计算结果构建包含相应数量的特征单元的全连接隐层；

根据所述全连接隐层中的特征单元及所述输入节点，以输入节点值作为输入值、特征单元值作为输出值构建输入节点至特征单元的第一公式组；

根据所述全连接隐层中的特征单元及所述输出节点，以特征单元值作为输入值、输出节点值作为输出值构建特征单元至输出节点的第二公式组，以得到信息预测模型。
根据权利要求16所述的计算机可读存储介质，其中，所述根据预置的数据集及预置的参数调整规则对所述信息预测模型进行训练，以得到训练后的所述信息预测模型，包括：

将所述数据集拆分为预设数量的子数据集；

根据所述参数值调整规则及多个所述子数据集对所述信息预测模型进行多轮训练，并根据所述子数据集计算每一轮训练后所述信息预测模型的准确率；

将准确率最高的一轮训练的参数值作为所述信息预测模型的参数值以得到训练后的所述信息预测模型。
根据权利要求16所述的计算机可读存储介质，其中，所述获取预置的客户信息表中与所述待预测信息对应的关联客户的类别，包括：

根据所述待预测信息中的待预测客户获取所述预置客户信息表中与所述待预测客户对应的关联客户信息；

根据所述待预测信息中的预测类别获取与所述关联客户信息中每一关联客户对应的类别。
根据权利要求16所述的计算机可读存储介质，其中，还包括：

将所述待预测信息及所述类别信息添加至所述预置客户信息表中。