CN114841267A

CN114841267A - 实时预测方法、装置、电子设备及计算机程序产品

Info

Publication number: CN114841267A
Application number: CN202210482906.6A
Authority: CN
Inventors: 尉乃升; 王艺; 岳洪达
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-05-05
Filing date: 2022-05-05
Publication date: 2022-08-02
Anticipated expiration: 2042-05-05
Also published as: US20230359976A1; CN114841267B

Abstract

本公开提供了一种实时预测方法、装置、电子设备及计算机程序产品，涉及数据处理领域，尤其涉及人工智能领域。具体实现方案为：获取基于业务场景的用户请求；从预先存储的多个原始特征中获取与用户标识相对应的至少一个目标原始特征；从预先训练的多个模型中确定与场景标识相对应的目标模型，并从多个特征工程服务中确定与目标模型相对应的目标特征工程服务；通过目标特征工程服务对至少一个目标原始特征进行实时的特征加工处理，得到目标入模特征；输入目标入模特征至目标模型中，以得到目标模型针对用户请求作出的预测结果。

Description

实时预测方法、装置、电子设备及计算机程序产品

技术领域

本公开涉及数据处理领域，尤其涉及人工智能领域，具体而言，涉及一种实时预测方法、装置、电子设备及计算机程序产品。

背景技术

在传统的在线预测过程中，在调用在线预测服务之前，通常需要提前对原始特征进行离线的特征加工处理，从而生成入模特征，然后将全量的原始特征以及生成的所有入模特征全部存储在服务器中。其中，为了保证满足全部用户的需求，因此，即便是小部分用户才会使用到的入模特征，也需要提前生成并且存储在服务器的数据库中。

但是，将所有的原始特征以及入模特征都进行存储，会占用巨大的存储资源，同时还会对存储引擎的查询时效性带来巨大的考验。

发明内容

本公开提供了一种实时预测方法、装置、电子设备及计算机程序产品，以至少解决现有技术中在进行在线预测时需要预先存储大量的入模特征从而导致的存储压力过大的问题。

根据本公开的一个方面，提供了一种实时预测方法，包括：获取基于业务场景的用户请求，其中，用户请求中至少包括用户标识以及业务场景的场景标识；从预先存储的多个原始特征中获取与用户标识相对应的至少一个目标原始特征；从预先训练的多个模型中确定与场景标识相对应的目标模型，并从多个特征工程服务中确定与目标模型相对应的目标特征工程服务；通过目标特征工程服务对至少一个目标原始特征进行实时的特征加工处理，得到目标入模特征；输入目标入模特征至目标模型中，以得到目标模型针对用户请求作出的预测结果，其中，预测结果用于表征用户请求是否满足业务场景下的预设业务条件。

进一步地，实时预测方法还包括：在从预先训练的多个模型中确定与场景标识相对应的目标模型，并从多个特征工程服务中确定与目标模型相对应的目标特征工程服务之前，获取多个历史特征集合，其中，一个历史特征集合对应一个业务场景，每个历史特征集合由多个历史原始特征组成；根据每个历史特征集合训练得到每个业务场景下所对应的模型，并将模型存储在第一文件中；对入模特征的生成过程进行代码化处理，得到每个模型所对应的特征工程服务，并将特征工程服务存储在第二文件中，其中，入模特征为根据每个历史特征集合生成得到的特征，第一文件与第二文件之间存在对应关系；基于第一文件与第二文件，将每个模型所对应的特征工程服务以及每个模型部署在服务器中，生成在线预测服务。

进一步地，实时预测方法还包括：从预设的镜像存储区域中获取第一镜像信息，其中，第一镜像信息至少包括用于生成在线预测服务的多个执行指令；根据第一镜像信息生成在线预测服务的部署任务；根据部署任务、第一文件以及第二文件，将每个模型以及每个模型对应的特征工程服务一一对应地部署在服务器中，生成在线预测服务。

进一步地，实时预测方法还包括：获取第一文件、第二文件以及第一文件与第二文件之间的对应关系；根据部署任务从预设的镜像存储区域中获取第二镜像信息以及第三镜像信息，其中，第二镜像信息表征特征工程服务部署镜像，第三镜像信息表征模型部署镜像；根据第二镜像信息解析第一文件，得到每个模型对应的特征工程服务；根据第三镜像信息解析第二文件，得到每个模型；根据对应关系，将每个模型与每个模型所对应的特征工程服务一一对应地部署在服务器中，生成在线预测服务。

进一步地，实时预测方法还包括：检测部署任务的执行时长；在部署任务的执行时长大于预设时长时，确定在线预测服务生成失败。

进一步地，实时预测方法还包括：通过目标特征工程服务对目标原始特征进行特征编码，得到第一特征；对第一特征进行特征转换，得到第二特征；基于第二特征进行缺失值填充，得到第三特征；对第三特征进行特征归一化处理，得到第四特征；对第四特征进行特征分箱，得到第五特征；对第五特征进行嵌入式特征选择，得到目标入模特征。

进一步地，实时预测方法还包括：在输入所述目标入模特征至所述目标模型中，以得到所述目标模型针对所述用户请求作出的预测结果之后，在用户请求满足业务场景下的预设业务条件时，确定执行用户请求；在用户请求不满足业务场景下的预设业务条件时，确定拒绝执行用户请求。

进一步地，实时预测方法还包括：在输入所述目标入模特征至所述目标模型中，以得到所述目标模型针对所述用户请求作出的预测结果之后，在用户请求满足业务场景下的预设业务条件时，向终端设备推送目标产品的信息；在用户请求不满足业务场景下的预设业务条件时，禁止向终端设备推送目标产品的信息。

根据本公开的一个方面，提供了一种实时预测装置，包括：第一获取模块，用于获取基于业务场景的用户请求，其中，用户请求中至少包括用户标识以及业务场景的场景标识；第二获取模块，用于从预先存储的多个原始特征中获取与用户标识相对应的至少一个目标原始特征；确定模块，用于从预先训练的多个模型中确定与场景标识相对应的目标模型，并从多个特征工程服务中确定与目标模型相对应的目标特征工程服务；加工处理模块，用于通过目标特征工程服务对至少一个目标原始特征进行实时的特征加工处理，得到目标入模特征；预测模块，用于输入目标入模特征至目标模型中，以得到目标模型针对用户请求作出的预测结果，其中，预测结果用于表征用户请求是否满足业务场景下的预设业务条件。

根据本公开的一个方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述的实时预测方法。

根据本公开的一个方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行上述的实时预测方法。

根据本公开的一个方面，提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现上述的实时预测方法。

在本公开的技术方案中，本公开采用将生成目标入模特征的处理过程放置在在线预测阶段的方式，通过获取基于业务场景的用户请求，并从预先存储的多个原始特征中获取与用户标识相对应的至少一个目标原始特征，然后从预先训练的多个模型中确定与场景标识相对应的目标模型，并从多个特征工程服务中确定与目标模型相对应的目标特征工程服务，最后通过目标特征工程服务对至少一个目标原始特征进行实时的特征加工处理，得到目标入模特征，并输入目标入模特征至目标模型中，以得到目标模型针对用户请求作出的预测结果。其中，用户请求中至少包括用户标识以及业务场景的场景标识；预测结果用于表征用户请求是否满足业务场景下的预设业务条件。

由上述内容可知，由于本公开在接收到用户请求之后，不会直接调用入模特征，而是根据用户请求先获取得到用户标识所对应的目标原始特征，然后再根据目标原始特征，通过目标特征工程服务实时地对目标原始特征进行加工处理，得到目标入模特征，因此，在本公开中，只需要预先存储原始特征即可，而无需再存储大量的入模特征，从而降低了服务器的存储压力。而且，对于较小用户群体所对应的入模特征，通过本公开的方案也可以不需要提前进行存储，而是在接收到这些用户的用户请求之后，再实时生成对应的目标入模特征即可，从而既保证了这部分用户群体的需求，还避免了存储资源的浪费。另外，与现有技术相比，由于本公开不需要提前存储全量的入模特征，因此，在降低了存储引擎的压力的同时，存储引擎的查询时效性也可以得到提升。

由此可见，通过本公开的技术方案，达到了在在线预测阶段自动化生成入模特征的目的，从而实现了降低服务器存储压力与存储成本的效果，进而解决了现有技术中在进行在线预测时需要预先存储大量的入模特征从而导致的存储压力过大的问题。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开实施例1的一种实时预测方法流程图；

图2是根据本公开实施例1的一种特征加工处理过程的示意图；

图3是根据本公开实施例1的一种实时预测方法流程图；

图4是根据现有技术的一种非实时预测方法流程图；

图5是根据本公开实施例2的一种创建在线预测服务的流程图；

图6是根据本公开实施例3的一种特征加工处理过程的流程图；

图7是根据本公开实施例4的一种处理用户请求的流程图；

图8根据本公开实施例5的一种实时预测装置示意图；

图9是用来实现本公开实施例的实时预测方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。

实施例1

根据本公开实施例，提供了一种实时预测方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本公开实施例的实时预测方法的流程图，如图1所示，该方法包括如下步骤：

步骤S101，获取基于业务场景的用户请求。

在步骤S101中，用户请求中至少包括用户标识以及业务场景的场景标识。其中，用户请求可以由终端设备发送，终端设备可以是用户所使用的智能手机、智能平板、笔记本电脑、台式电脑等设备，业务场景至少包括营销场景、金融贷款场景、信用卡申请等场景，用户请求可以是用户在终端设备上通过完成点击网页链接、浏览广告页面以及填写申请信息等操作所生成的请求。另外，用户标识可以是用户的名称、年龄、职业以及收入等用户信息标识，还可以是用户的违约记录、犯罪记录等用户行为标识。

步骤S102，从预先存储的多个原始特征中获取与用户标识相对应的至少一个目标原始特征。

在步骤S102中，服务器中预先存储有多个原始特征，其中，多个原始特征可以理解为是全量的原始特征，这些原始特征可用于表征各类用户的用户画像等信息。例如，对于用户A发起的用户请求，通过用户A的用户标识，服务器可根据该用户标识找到最接近用户A的目标原始特征，其中，目标原始特征可以是多个。

步骤S103，从预先训练的多个模型中确定与场景标识相对应的目标模型，并从多个特征工程服务中确定与目标模型相对应的目标特征工程服务。

在步骤S103中，服务器中存储有多个预先训练的模型，其中，这些模型是基于不同的业务场景训练得到的，例如，模型A对应的是金融贷款场景，模型B对应的是信用卡申请的场景，模型C对应的是营销场景。通过用户请求中的场景标识，服务器可确定场景标识对应的模型标识，该模型标识即可表征该业务场景对应的目标模型。另外，在服务器中，基于每一个模型还对应部署有一个特征工程服务，其中，特征工程服务可理解为是对入模特征的生成过程进行代码化处理之后所得到的程序，通过特征工程服务可对原始特征进行自动化的特征加工处理，从而得到对应的入模特征。

步骤S104，通过目标特征工程服务对至少一个目标原始特征进行实时的特征加工处理，得到目标入模特征。

在步骤S104中，如图2所示，特征加工处理的过程至少包括：特征编码、特征转换、缺失值填充、特征归一化、特征分箱、嵌入式特征选择以及特征onehot(一位有效编码)编码等处理过程。如图2所示，原始特征簇A(表征用户A对应的多个原始特征)在依次通过上述特征加工处理之后，最终生成了目标入模特征B。另外，在服务器中，一个模型对应一个特征工程服务，并且每种特征工程服务用于生成一种入模特征。举例而言，对于用户A，服务器根据用户A的用户标识1获取原始特征簇A(表征用户A对应的多个原始特征)，然后根据场景标识A确定目标模型B，并调用目标模型B对应的目标特征工程服务B处理原始特征簇A，从而生成目标入模特征B；对于用户C，服务器根据用户C的用户标识2获取原始特征簇C(表征用户C对应的多个原始特征)，然后根据场景标识C确定目标模型D，并调用目标模型D所对应的目标特征工程服务D处理原始特征簇C，从而生成入模特征D。

步骤S105，输入目标入模特征至目标模型中，以得到目标模型针对用户请求作出的预测结果。

在步骤S105中，预测结果用于表征用户请求是否满足业务场景下的预设业务条件。例如，在信用卡申请的业务场景中，预设业务条件为最低信用度评分，在将目标入模特征输入至目标模型之后，预测结果可以是该用户的信用度评分低于预设的最低信用度评分，或者该用户的信用度评分大于预设的最低信用度评分。

此外，图3是根据本公开实施例1的一种实时预测方法流程图，如图3所示，用户通过终端设备向服务器发送用户请求，用户请求通过网关进入服务器，其中，用户请求中包括场景标识与用户标识，场景标识与模型标识相关联。在接收到用户请求之后，服务器调用模型查询服务，然后根据用户标识从预先存储的多个原始特征中查询得到至少一个目标原始特征，其中，原始特征可存储在服务器的离线数据库中。服务器在查询得到至少一个目标原始特征之后，通过模型标识确定目标模型以及目标模型对应的目标特征工程服务，然后通过流量代理的方式将目标原始特征传输给目标特征工程服务，由目标特征工程服务对目标原始特征进行实时特征工程处理，从而生成对应的目标入模特征，然后将入模特征输入到对应的目标模型中，形成目标模型预测服务。最后，目标模型预测服务可对用户请求进行预测，生成预测结果。其中，在图3中，示出了两种特征工程服务，分别为用于生成入模特征A的模型A特征工程服务以及用于生成入模特征B的模型B特征工程服务，与之对应的，图3还示出了两种模型预测服务，分别为模型A预测服务以及模型B预测服务，特征加工处理过程至少包括：特征编码、特征转换、缺失值填充、特征归一化处理、特征分箱以及嵌入式特征选择等步骤。需要注意到的是，特征工程服务与模型都是预先一对一部署在服务器中的，即在服务器中，通过部署多个特征工程服务与模型，生成了一种支持实时特征工程处理的在线预测服务。

另外，图4示出了根据现有技术的一种非实时预测方法流程图，如图4所示，与本公开的技术方案相比，在现有技术中，生成入模特征的过程是需要提前进行离线处理的，例如，根据原始特征分别预先生成入模特征A以及入模特征B，然后现有技术需要将生成的入模特征与原始特征全部存储在数据库中。在此基础上，现有技术是根据用户标识以及模型标识相结合的方式，直接从预先存储的所有的入模特征中获取目标入模特征，最后根据目标入模特征生成目标模型预测服务，例如，直接获取入模特征A作为目标入模特征，生成模型A预测服务，直接获取入模特征B作为目标入模特征，生成模型B预测服务。

需要注意到的是，根据现有技术的方案，通常需要在训练阶段提前对原始特征进行特征工程处理后再建模，而且在线预测服务只能进行模型预测，而不能支持特征工程处理。在这种情况下，将全量的原始特征提前处理成入模特征并进行存储会导致如下问题。一是无法及时对刚发布的模型进行使用，通常还需要花费很多时间来处理原始特征，将其变成入模特征，然后才能输入给模型进行预测。二是入模特征与原始特征全部存储在服务器中，对于存储引擎的查询实效性是巨大的考验。三是会浪费过多的存储资源，通常实时的k-v(key-value，键值对存储)存储一般基于Redis(remote dictionary server，远程字典服务数据库)，而Redis是内存型数据库，非常昂贵，一个模型就要对应存储一套入模特征，无疑是巨大的存储成本支出。四是提前加工完的入模特征通常使用率不高，一些用户群体较少，所以会调用此模型的用户也比较少，但是为了满足这一部分用户的调用需求，现有技术还必须要提前存储这部分用户群体所对应的入模特征。

而通过本公开的方案，优化了传统模型预测的生命周期架构，将根据原始特征生成入模特征的处理过程，放置在了在线服务预测阶段，而不是现有技术中的离线训练阶段。在此基础上，由于本公开只需要实时存储全量的原始特征，而不再需要实时存储所有的入模特征，因此降低了服务器的存储压力以及存储成本，而且还提高了存储引擎的查询时效性。另一方面，由于本公开可直接通过目标原始特征实时生成目标入模特征，因此本公开可将建模过程与预测过程无逢链接，在发布了新的模型之后，可直接调用对应的特征工程服务生成目标入模特征，无需在花费很多时间来处理原始特征，将其变成入模特征。此外，对于较小用户群体所对应的入模特征，通过本公开的方案也可以不需要提前进行存储，而是在接收到这些用户的用户请求之后，再实时生成对应的目标入模特征即可，从而既保证了这部分用户群体的需求，还避免了存储资源的浪费。

基于上述步骤S101至步骤S105的内容可知，在本公开的技术方案中，本公开采用将生成目标入模特征的处理过程放置在在线预测阶段的方式，通过获取基于业务场景的用户请求，并从预先存储的多个原始特征中获取与用户标识相对应的至少一个目标原始特征，然后从预先训练的多个模型中确定与场景标识相对应的目标模型，并从多个特征工程服务中确定与目标模型相对应的目标特征工程服务，最后通过目标特征工程服务对至少一个目标原始特征进行实时的特征加工处理，得到目标入模特征，并输入目标入模特征至目标模型中，以得到目标模型针对用户请求作出的预测结果。其中，用户请求中至少包括用户标识以及业务场景的场景标识；预测结果用于表征用户请求是否满足业务场景下的预设业务条件。

由此可见，通过本公开的技术方案，达到了在预测阶段自动化生成入模特征的目的，从而实现了降低服务器存储压力与存储成本的效果，进而解决了现有技术中在进行在线预测时需要预先存储大量的入模特征从而导致的存储压力过大的问题。

实施例2

在本公开的实时预测方法中，提前创建每个业务场景下的模型以及该模型所对应的特征工程服务是非常重要的，其中，基于多个业务场景所创建的多个模型以及每个模型所对应的特征工程服务可以共同组成一套在线预测服务。

在一种可选的实施例中，在从预先训练的多个模型中确定与场景标识相对应的目标模型，并从多个特征工程服务中确定与目标模型相对应的目标特征工程服务之前，服务器获取多个历史特征集合，然后根据每个历史特征集合训练得到每个业务场景下所对应的模型，并将模型存储在第一文件中，随后对入模特征的生成过程进行代码化处理，得到每个模型所对应的特征工程服务，并将特征工程服务存储在第二文件中，最后基于第一文件与第二文件，将每个模型所对应的特征工程服务以及每个模型部署在服务器中，生成在线预测服务。其中，一个历史特征集合对应一个业务场景，每个历史特征集合由多个历史原始特征组成；入模特征为根据每个历史特征集合生成得到的特征，第一文件与第二文件之间存在对应关系。

可选的，图5是根据本公开实施例2的一种创建在线预测服务的流程图，如图5所示，基于历史特征集合训练得到的模型可以以模型文件(即第一文件)的形式存储在服务器中，每个模型所对应的特征工程服务可以以特征工程文件(即第二文件)的形式存储在服务器中。其中，特征工程文件与模型文件之间存在对应关系。特征工程服务是对入模特征的生成过程进行代码化处理后生成的程序，通过特征工程服务可以自动化地基于原始特征生成入模特征。

需要注意到的是，在训练得到多个模型的同时，同时生成每个模型对应的特征工程服务，由于特征工程服务可实时的对原始特征进行自动化特征加工处理，因此本公开可将建模过程与预测过程无逢链接，从而在发布了新的模型之后，服务器可直接调用对应的特征工程服务对目标原始特征进行处理，并生成目标入模特征，无需技术人员再花费很多时间来处理原始特征，将其变成入模特征，提高了入模特征的处理效率。

在一种可选的实施例中，从预设的镜像存储区域中获取第一镜像信息，然后根据第一镜像信息生成在线预测服务的部署任务，最后根据部署任务、第一文件以及第二文件，将每个模型以及所述每个模型对应的特征工程服务一一对应地部署在所述服务器中，生成所述在线预测服务，其中，第一镜像信息至少包括用于生成在线预测服务的多个执行指令。

可选的，如图5所示，平台用户在建模平台上提交创建在线预测服务的任务请求，首先建模平台会校验平台用户是否有创建在线预测服务的权限，如果有，则校验平台用户所提交的在线预测服务的参数是否合规，如果合规，则建模平台会将任务请求插入至数据库中，并向任务控制器提交创建任务。其中，任何一步校验失败，都将导致创建任务提交失败。任务控制器在接收到创建任务之后，从预设的镜像存储区域中获取第一镜像信息，基于第一镜像信息生成在线预测服务的部署任务，其中，部署任务中包括生成在线预测服务的多个执行指令，例如，通过部署任务中的执行指令在模型服务模块中生成模型部署服务。

需要注意到的是，通过根据第一镜像信息生成在线预测服务的部署任务，可灵活地自动化部署在线预测服务，无需技术人员再人工进行部署，从而提高了部署效率以及部署成功率。

在一种可选的实施例中，服务器获取第一文件、第二文件以及第一文件与第二文件之间的对应关系，然后根据部署任务从预设的镜像存储区域中获取第二镜像信息以及第三镜像信息，其中，第二镜像信息表征特征工程服务部署镜像，第三镜像信息表征模型部署镜像。服务器根据第二镜像信息解析第一文件，得到每个模型对应的特征工程服务，根据第三镜像信息解析第二文件，得到每个模型，最后根据对应关系，将每个模型与每个模型所对应的特征工程服务部署在服务器中，生成在线预测服务。

可选的，如图5所示，在生成模型部署服务之后，服务器根据模型部署服务从镜像存储区域中获取第二镜像信息与第三镜像信息，随后基于第二镜像信息生成特征工程服务，基于第三镜像信息生成模型部署服务。服务器可通过特征工程服务解析第一文件，通过模型部署服务解析第二文件，最终分别得到每个模型与每个模型对应的特征工程服务。由于第一文件与第二文件之间存在对应关系，因此，服务器可将每个模型与每个特征工程服务一一对应的部署在服务器中。

需要注意到的是，通过第二镜像信息与第三镜像信息，实现了自动化部署模型与特征工程服务的效果。另外，通过对应关系将每个模型与对应的特征工程服务进行对应部署，实现了基于每个特征工程服务自动化生成每个模型对应的入模特征的效果，从而保证了入模特征的生成准确率。

在一种可选的实施例中，服务器通过任务控制器检测部署任务的执行时长，并在部署任务的执行时长大于预设时长时，确定在线预测服务生成失败。

可选的，如图5所示，任务控制器将循环监听部署任务的执行时长，如果发现执行时长大于预设时长，则确定在线预测服务生成失败。如果在预设时长之内，部署任务全部执行完成，则确定在线预测服务上线成功，在线预测服务将存储在数据库中的预测服务表中。需要注意到的是，建模平台还将判断创建任务是否提交成功。

在上述过程中，通过循环监听部署任务的执行时长，可及时发现部署异常的情况，从而提高了部署异常时的解决效率，同时也尽可能地避免了由于部署异常发现不及时导致的在线预测服务上线延期的问题。

实施例3

在将每个模型与每个特征工程服务一一对应的部署在服务器中之后，服务器可以通过特征工程服务对原始特征进行自动化的特征加工处理。

在一种可选的实施例中，图6是根据本公开实施例3的一种特征加工处理过程的流程图，如图6所示，服务器通过目标特征工程服务对目标原始特征进行特征编码，得到第一特征；对第一特征进行特征转换，得到第二特征；基于第二特征进行缺失值填充，得到第三特征；对第三特征进行特征归一化处理，得到第四特征；对第四特征进行特征分箱，得到第五特征；对第五特征进行嵌入式特征选择，得到目标入模特征。

可选的，特征加工处理过程至少包括：特征编码、特征转换、缺失值填充、特征归一化处理、特征分箱以及嵌入式特征选择等步骤。根据具体的实际应用场景，特征加工处理过程还可以包括特征onehot(一位有效编码)编码的步骤。

由上述内容可知，通过在在线预测阶段对目标原始特征进行自动化的特征加工处理，实现了提高入模特征生成效率的效果。另外，在此基础上，由于本公开只需要实时存储全量的原始特征，而不再需要实时存储所有的入模特征，因此降低了服务器的存储压力以及存储成本，而且还提高了存储引擎的查询时效性。

实施例4

在一种可选的实施例中，图7是根据本公开实施例4的一种处理用户请求的流程图。如图7所示，在输入所述目标入模特征至所述目标模型中，以得到所述目标模型针对所述用户请求作出的预测结果之后，服务器在用户请求满足业务场景下的预设业务条件时，确定执行用户请求；在用户请求不满足业务场景下的预设业务条件时，确定拒绝执行用户请求。

可选的，假设业务场景为信用卡申请的业务场景，预设业务条件为最低信用度评分，在将目标入模特征输入至目标模型之后，如果预测结果表征该用户的信用度评分低于预设的最低信用度评分，则服务器将确定拒绝该用户的信用卡申请请求；如果预测结果表征该用户的信用度评分大于或等于预设的最低信用度评分，则服务器将确定执行该用户的信用卡申请请求。

通过上述过程，可针对贷款以及信用卡等金融场景进行实时的反欺诈预测，从而实现了及时识别潜在金融风险的效果。

在一种可选的实施例中，在输入所述目标入模特征至所述目标模型中，以得到所述目标模型针对所述用户请求作出的预测结果之后，服务器在用户请求满足业务场景下的预设业务条件时，向终端设备推送目标产品的信息；在用户请求不满足业务场景下的预设业务条件时，禁止向终端设备推送目标产品的信息。

可选的，假设业务场景为目标产品的营销场景，预设业务条件为用户在目标产品介绍界面的最低浏览时长，在将目标入模特征输入至目标模型之后，如果预测结果表征该用户在目标产品介绍界面的浏览时长低于预设的最低浏览时长，则服务器将禁止向用户的终端设备推送目标产品的信息；如果预测结果表征该用户在目标产品介绍界面的浏览时长大于或等于预设的最低浏览时长，则服务器将向用户的终端设备推送目标产品的信息。

通过上述过程，可针对营销场景进行实时预测，从而实现了及时识别潜在消费者的效果。

实施例5

根据本公开实施例，还提供了一种实时预测装置实施例，其中，图8根据本公开实施例5的一种实时预测装置示意图，该装置包括：第一获取模块801，用于获取基于业务场景的用户请求，其中，用户请求中至少包括用户标识以及业务场景的场景标识；第二获取模块802，用于从预先存储的多个原始特征中获取与用户标识相对应的至少一个目标原始特征；确定模块803，用于从预先训练的多个模型中确定与场景标识相对应的目标模型，并从多个特征工程服务中确定与目标模型相对应的目标特征工程服务；加工处理模块804，用于通过目标特征工程服务对至少一个目标原始特征进行实时的特征加工处理，得到目标入模特征；预测模块805，用于输入目标入模特征至目标模型中，以得到目标模型针对用户请求作出的预测结果，其中，预测结果用于表征用户请求是否满足业务场景下的预设业务条件。

需要说明的是，上述第一获取模块801、第二获取模块802、确定模块803、加工处理模块804以及预测模块805对应于上述实施例中的步骤S101至步骤S105，五个模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例1所公开的内容。

可选的，实时预测装置还包括：第三获取模块、存储模块、代码化处理模块以及部署模块。其中，第三获取模块，用于获取多个历史特征集合。其中，一个历史特征集合对应一个业务场景，每个历史特征集合由多个历史原始特征组成；存储模块，用于根据每个历史特征集合训练得到每个业务场景下所对应的模型，并将模型存储在第一文件中；代码化处理模块，用于对入模特征的生成过程进行代码化处理，得到每个模型所对应的特征工程服务，并将特征工程服务存储在第二文件中，其中，入模特征为根据每个历史特征集合生成得到的特征，第一文件与第二文件之间存在对应关系；部署模块，用于基于第一文件与第二文件，将每个模型所对应的特征工程服务以及每个模型部署在服务器中，生成在线预测服务。

可选的，上述部署模块还包括：第四获取模块、生成模块以及第一部署模块。其中，第四获取模块，用于从预设的镜像存储区域中获取第一镜像信息，其中，第一镜像信息至少包括用于生成在线预测服务的多个执行指令；生成模块，用于根据第一镜像信息生成在线预测服务的部署任务；第一部署模块，用于根据部署任务、第一文件以及第二文件，将每个模型以及每个模型对应的特征工程服务一一对应地部署在所述服务器中，生成所述在线预测服务。

可选的，上述第一部署模块还包括：第五获取模块、第六获取模块、第一解析模块、第二解析模块以及第二部署模块。其中，第五获取模块，用于获取第一文件、第二文件以及第一文件与第二文件之间的对应关系；第六获取模块，用于根据部署任务从预设的镜像存储区域中获取第二镜像信息以及第三镜像信息，其中，第二镜像信息表征特征工程服务部署镜像，第三镜像信息表征模型部署镜像；第一解析模块，用于根据第二镜像信息解析第一文件，得到每个模型对应的特征工程服务；第二解析模块，用于根据第三镜像信息解析第二文件，得到每个模型；第二部署模块，用于根据对应关系，将每个模型与每个模型所对应的特征工程服务一一对应地部署在服务器中，生成在线预测服务。

可选的，请求预测装置还包括：检测模块以及第一确定模块。其中，检测模块，用于检测部署任务的执行时长；第一确定模块，用于在部署任务的执行时长大于预设时长时，确定在线预测服务生成失败。

可选的，上述加工处理模块还包括：特征编码模块、特征转换模块、缺失值填充模块、特征归一化处理模块、特征分箱模块以及嵌入式特征选择模块。其中，特征编码模块，用于通过目标特征工程服务对目标原始特征进行特征编码，得到第一特征；特征转换模块，用于对第一特征进行特征转换，得到第二特征；缺失值填充模块，用于基于第二特征进行缺失值填充，得到第三特征；特征归一化处理模块，用于对第三特征进行特征归一化处理，得到第四特征；特征分箱模块，用于对第四特征进行特征分箱，得到第五特征；嵌入式特征选择模块，用于对第五特征进行嵌入式特征选择，得到目标入模特征。

可选的，请求预测装置还包括：第二确定模块以及第三确定模块。其中，第二确定模块，用于在用户请求满足业务场景下的预设业务条件时，确定执行用户请求；第三确定模块，用于在用户请求不满足业务场景下的预设业务条件时，确定拒绝执行用户请求。

可选的，请求预测装置还包括：推送模块以及禁止推送模块。其中，推送模块，用于在用户请求满足业务场景下的预设业务条件时，向终端设备推送目标产品的信息；禁止推送模块，用于在用户请求不满足业务场景下的预设业务条件时，禁止向终端设备推送目标产品的信息。

实施例6

根据本公开实施例的另一方面，还提供一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行上述实施例1中的实时预测方法。

实施例7

根据本公开实施例的另一方面，还提供一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现上述实施例1中的实时预测方法。

实施例8

根据本公开实施例的另一方面，还提供一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述实施例1中的实时预测方法。

图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图9所示，设备900包括计算单元901，其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序，来执行各种适当的动作和处理。在RAM 903中，还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。

设备900中的多个部件连接至I/O接口905，包括：输入单元906，例如键盘、鼠标等；输出单元907，例如各种类型的显示器、扬声器等；存储单元908，例如磁盘、光盘等；以及通信单元909，例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理，例如实时预测方法。例如，在一些实施例中，实时预测方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元908。在一些实施例中，计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时，可以执行上文描述的实时预测方法的一个或多个步骤。备选地，在其他实施例中，计算单元901可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行实时预测方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种实时预测方法，包括：

获取基于业务场景的用户请求，其中，所述用户请求中至少包括用户标识以及所述业务场景的场景标识；

从预先存储的多个原始特征中获取与所述用户标识相对应的至少一个目标原始特征；

从预先训练的多个模型中确定与所述场景标识相对应的目标模型，并从多个特征工程服务中确定与所述目标模型相对应的目标特征工程服务；

通过所述目标特征工程服务对所述至少一个目标原始特征进行实时的特征加工处理，得到目标入模特征；

输入所述目标入模特征至所述目标模型中，以得到所述目标模型针对所述用户请求作出的预测结果，其中，所述预测结果用于表征所述用户请求是否满足所述业务场景下的预设业务条件。

2.根据权利要求1所述的方法，其中，在从预先训练的多个模型中确定与所述场景标识相对应的目标模型，并从多个特征工程服务中确定与所述目标模型相对应的目标特征工程服务之前，所述方法还包括：

获取多个历史特征集合，其中，一个历史特征集合对应一个业务场景，每个历史特征集合由多个历史原始特征组成；

根据所述每个历史特征集合训练得到每个业务场景下所对应的模型，并将所述模型存储在第一文件中；

对入模特征的生成过程进行代码化处理，得到每个模型所对应的特征工程服务，并将所述特征工程服务存储在第二文件中，其中，所述入模特征为根据所述每个历史特征集合生成得到的特征，所述第一文件与所述第二文件之间存在对应关系；

基于所述第一文件与所述第二文件，将所述每个模型所对应的特征工程服务以及所述每个模型部署在服务器中，生成在线预测服务。

3.根据权利要求2所述的方法，其中，基于所述第一文件与所述第二文件，将所述每个模型所对应的特征工程服务以及所述每个模型部署在服务器中，生成在线预测服务，包括：

从预设的镜像存储区域中获取第一镜像信息，其中，所述第一镜像信息至少包括用于生成所述在线预测服务的多个执行指令；

根据所述第一镜像信息生成所述在线预测服务的部署任务；

根据所述部署任务、所述第一文件以及所述第二文件，将所述每个模型以及所述每个模型对应的特征工程服务一一对应地部署在所述服务器中，生成所述在线预测服务。

4.根据权利要求3所述的方法，其中，根据所述部署任务、所述第一文件以及所述第二文件，将所述每个模型以及所述每个模型对应的特征工程服务一一对应地部署在所述服务器中，生成所述在线预测服务，包括：

获取所述第一文件、所述第二文件以及所述第一文件与所述第二文件之间的对应关系；

根据所述部署任务从所述预设的镜像存储区域中获取第二镜像信息以及第三镜像信息，其中，所述第二镜像信息表征特征工程服务部署镜像，所述第三镜像信息表征模型部署镜像；

根据所述第二镜像信息解析所述第一文件，得到所述每个模型对应的特征工程服务；

根据所述第三镜像信息解析所述第二文件，得到所述每个模型；

根据所述对应关系，将所述每个模型与所述每个模型所对应的特征工程服务一一对应地部署在所述服务器中，生成所述在线预测服务。

5.根据权利要求3所述的方法，其中，所述方法还包括：

检测所述部署任务的执行时长；

在所述部署任务的执行时长大于预设时长时，确定所述在线预测服务生成失败。

6.根据权利要求1所述的方法，其中，通过所述目标特征工程服务对所述至少一个目标原始特征进行实时的特征加工处理，得到目标入模特征，包括：

通过所述目标特征工程服务对所述目标原始特征进行特征编码，得到第一特征；

对所述第一特征进行特征转换，得到第二特征；

基于所述第二特征进行缺失值填充，得到第三特征；

对所述第三特征进行特征归一化处理，得到第四特征；

对所述第四特征进行特征分箱，得到第五特征；

对第五特征进行嵌入式特征选择，得到所述目标入模特征。

7.根据权利要求1所述的方法，其中，在输入所述目标入模特征至所述目标模型中，以得到所述目标模型针对所述用户请求作出的预测结果之后，所述方法还包括：

在所述用户请求满足所述业务场景下的预设业务条件时，确定执行所述用户请求；

在所述用户请求不满足所述业务场景下的预设业务条件时，确定拒绝执行所述用户请求。

8.根据权利要求1所述的方法，其中，在输入所述目标入模特征至所述目标模型中，以得到所述目标模型针对所述用户请求作出的预测结果之后，所述方法还包括：

在所述用户请求满足所述业务场景下的预设业务条件时，向终端设备推送目标产品的信息；

在所述用户请求不满足所述业务场景下的预设业务条件时，禁止向所述终端设备推送所述目标产品的信息。

9.一种实时预测装置，包括：

第一获取模块，用于获取基于业务场景的用户请求，其中，所述用户请求中至少包括用户标识以及所述业务场景的场景标识；

第二获取模块，用于从预先存储的多个原始特征中获取与所述用户标识相对应的至少一个目标原始特征；

确定模块，用于从预先训练的多个模型中确定与所述场景标识相对应的目标模型，并从多个特征工程服务中确定与所述目标模型相对应的目标特征工程服务；

加工处理模块，用于通过所述目标特征工程服务对所述至少一个目标原始特征进行实时的特征加工处理，得到目标入模特征；

预测模块，用于输入所述目标入模特征至所述目标模型中，以得到所述目标模型针对所述用户请求作出的预测结果，其中，所述预测结果用于表征所述用户请求是否满足所述业务场景下的预设业务条件。

10.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至8中任一项所述的实时预测方法。

11.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使计算机执行根据权利要求1至8中任一项所述的实时预测方法。

12.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1至8中任一项所述的实时预测方法。