CN116758576B

CN116758576B - 基于机器学习的营销信息识别方法、装置、设备和介质

Info

Publication number: CN116758576B
Application number: CN202311050755.8A
Authority: CN
Inventors: 潘春霞; 姜凤龙; 朱亚辉
Original assignee: Suzhou Jiyi Technology Co ltd
Current assignee: Suzhou Jiyi Technology Co ltd
Priority date: 2023-08-21
Filing date: 2023-08-21
Publication date: 2023-11-21
Anticipated expiration: 2043-08-21
Also published as: CN116758576A

Abstract

本申请涉及机器学习的技术领域，尤其是涉及基于机器学习的营销信息识别方法、装置、设备和介质，方法包括：基于期望商品参数和参数逻辑关系进行预处理，得到期望参数逻辑规则，并基于期望参数逻辑规则进行竞品搜索，得到竞品主图。进而，针对竞品主图进行划区归类处理，得到竞品主图对应的标记竞品主图，以使得将产品外观图的背景感染与营销信息分离，降低干扰因素对信息提取的影响。然后，基于标记信息中区块内容类别，利用信息提取模型对标记竞品主图进行信息提取，得到竞品主图对应的竞品信息和营销信息，利用标记竞品主图进行信息提取能够避免竞品信息和营销信息混杂在一起，提高了营销信息的精确度。

Description

基于机器学习的营销信息识别方法、装置、设备和介质

技术领域

本申请涉及机器学习的技术领域，尤其是涉及基于机器学习的营销信息识别方法、装置、设备和介质。

背景技术

随着互联网购物方式的快速普及，商品之间的竞争也越来越大，商家为了能够更好地销售商品，也推出了各种各样的营销机制，例如，限时降价、满减活动和买赠活动等各种营销机制。商家为了能够更好地适应市场的发展，需要及时准确地了解竞品的营销机制，以便于明确自家产品的优势、劣势、机遇和威胁，进而，为运营活动、战略规划等提供市场参考和行动建议，提升自家产品的市场占有率。

相关技术中，利用OCR（Optical Character Recognition，光学字符识别）技术从竞品主图中提取竞品的营销信息，然而，由于竞品主图的布局复杂性和产品外观图中的文字干扰，使得利用OCR技术提取的营销信息中包括无效信息，造成提取的营销信息的准确度低，其中，无效信息为并非营销机制的内容，例如，产品介绍、产品条码等。

因而，如何提高营销信息的准确度是本领域技术人员亟待解决的问题。

发明内容

本申请的目的是提供基于机器学习的营销信息识别方法、装置、设备和介质，用于解决以上至少一项技术问题。

本申请的上述发明目的是通过以下技术方案得以实现的：

第一方面，本申请提供一种基于机器学习的营销信息识别方法，采用如下的技术方案：

一种基于机器学习的营销信息识别方法，包括：

获取期望商品参数和参数逻辑关系，并基于所述期望商品参数和所述参数逻辑关系进行预处理，得到期望参数逻辑规则；

基于所述期望参数逻辑规则进行竞品搜索，得到竞品主图，其中，所述竞品主图包括：竞品介绍和营销机制；

针对所述竞品主图进行划区归类处理，得到所述竞品主图对应的标记竞品主图，其中，所述标记竞品主图包括：多个区块和每一所述区块对应的标记信息，所述标记信息包括：区块内容类别；

基于所述标记信息中所述区块内容类别，利用信息提取模型对所述标记竞品主图进行信息提取，得到所述竞品主图对应的竞品信息和营销信息。

通过采用上述技术方案，基于期望商品参数和参数逻辑关系进行预处理，得到期望参数逻辑规则，并基于期望参数逻辑规则进行竞品搜索，得到竞品主图，期望参数逻辑规则综合考虑了多个期望商品参数之间的相互关系和影响，以形成更复杂的条件和限制，便于排除不符合要求或不合理的期望商品参数组合，以提高竞品搜索结果的准确性。进而，针对竞品主图进行划区归类处理，得到竞品主图对应的标记竞品主图，以使得将产品外观图的背景感染与营销信息分离，降低干扰因素对信息提取的影响。然后，基于标记信息中区块内容类别，利用信息提取模型对标记竞品主图进行信息提取，得到竞品主图对应的竞品信息和营销信息，利用标记竞品主图进行信息提取能够避免竞品信息和营销信息混杂在一起，提高了营销信息的精确度。

本申请在一较佳示例中可以进一步配置为：所述针对所述竞品主图进行划区归类处理，得到所述竞品主图对应的标记竞品主图，包括：

对所述竞品主图进行初始划区，得到初始标记竞品主图；

基于所述初始标记竞品主图进行精准划区和归类处理，得到所述竞品主图对应的标记竞品主图。

本申请在一较佳示例中可以进一步配置为：所述基于所述标记信息中所述区块内容类别，利用信息提取模型对所述标记竞品主图进行信息提取，得到所述竞品主图对应的竞品信息和营销信息，包括：

基于所述标记竞品主图中的所述标记信息中所述区块内容类别进行模板构建，得到产品介绍模板和营销机制模板，其中，所述区块内容类别包括：产品介绍和营销机制；

利用所述信息提取模型，对所述标记竞品主图对应的所述产品介绍模板和所述营销机制模板进行信息提取，得到所述竞品主图对应的竞品信息和营销信息。

本申请在一较佳示例中可以进一步配置为：所述得到所述竞品主图对应的竞品信息和营销信息之后，还包括：

基于所述营销信息进行竞品价格计算，得到销售单价；

基于所述营销信息进行竞品福利计算，得到实物信息；

获取参照产品信息，并基于所述销售单价、所述实物信息和所述参照产品信息，确定营销差异信息，其中，所述参照产品信息包括：参照销售单价和参照实物信息。

当检测到携带有预设参数逻辑规则的巡图指令时，则基于所述预设参数逻辑规则进行竞品巡图信息提取，得到竞品巡图对应的竞品信息和所述竞品巡图对应的营销信息，其中，每隔预设巡图周期会检测到一次巡图指令；

将所述竞品巡图对应的竞品信息存储至竞品资料数据库中，并将所述竞品巡图对应的营销信息存储至竞品营销机制数据库中。

本申请在一较佳示例中可以进一步配置为：所述营销信息包括：营销特征，

所述得到所述竞品主图对应的竞品信息和营销信息之后，还包括：

获取每一竞品主图的销量信息，并基于每一所述竞品主图的所述销量信息，确定目标竞品主图；

基于所述目标竞品主图进行主图框架提取，得到目标主图框架；

获取本品主图介绍和本品营销机制，并基于所述目标竞品主图对应的所述营销特征、所述目标主图框架、所述本品主图介绍和所述本品营销机制，得到本品营销主图。

第二方面，本申请提供一种基于机器学习的营销信息识别装置，采用如下的技术方案：

一种基于机器学习的营销信息识别装置，包括：

逻辑规则确定模块，用于获取期望商品参数和参数逻辑关系，并基于所述期望商品参数和所述参数逻辑关系进行预处理，得到期望参数逻辑规则；

竞品搜索模块，用于基于所述期望参数逻辑规则进行竞品搜索，得到竞品主图，其中，所述竞品主图包括：竞品介绍和营销机制；

竞品标记模块，用于针对所述竞品主图进行划区归类处理，得到所述竞品主图对应的标记竞品主图，其中，所述标记竞品主图包括：多个区块和每一所述区块对应的标记信息，所述标记信息包括：区块内容类别；

信息提取模块，用于基于所述标记信息中所述区块内容类别，利用信息提取模型对所述标记竞品主图进行信息提取，得到所述竞品主图对应的竞品信息和营销信息。

第三方面，本申请提供一种电子设备，采用如下的技术方案：

至少一个处理器；

存储器；

至少一个应用程序，其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行，所述至少一个应用程序配置用于：执行上述的基于机器学习的营销信息识别方法。

第四方面，本申请提供一种计算机可读存储介质，采用如下的技术方案：

一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令所述计算机执行上所述的基于机器学习的营销信息识别方法。

综上所述，本申请包括以下至少一种有益技术效果：

基于期望商品参数和参数逻辑关系进行预处理，得到期望参数逻辑规则，并基于期望参数逻辑规则进行竞品搜索，得到竞品主图，期望参数逻辑规则综合考虑了多个期望商品参数之间的相互关系和影响，以形成更复杂的条件和限制，便于排除不符合要求或不合理的期望商品参数组合，以提高竞品搜索结果的准确性。进而，针对竞品主图进行划区归类处理，得到竞品主图对应的标记竞品主图，以使得将产品外观图的背景感染与营销信息分离，降低干扰因素对信息提取的影响。然后，基于标记信息中区块内容类别，利用信息提取模型对标记竞品主图进行信息提取，得到竞品主图对应的竞品信息和营销信息，利用标记竞品主图进行信息提取能够避免竞品信息和营销信息混杂在一起，提高了营销信息的精确度；

基于标记竞品主图中的标记信息中区块内容类别进行模板构建，得到产品介绍模板和营销机制模板，进而，利用信息提取模型，对标记竞品主图对应的产品介绍模板和营销机制模板进行信息提取，得到竞品主图对应的竞品信息和营销信息。通过这种方式，可以避免对整张标记竞品主图进行全局性信息提取，节省了计算资源，且，利用信息提取模型分别对产品介绍模板和营销机制模板进行信息提取，提高了竞品信息和营销信息的提取精准度。

附图说明

图1是本申请其中一实施例的一种基于机器学习的营销信息识别方法的流程示意图；

图2a是本申请其中一实施例的竞品主图初始划区的示意图；

图2b是本申请其中一实施例的竞品主图精准划区的示意图；

图3是本申请其中一实施例的一种基于机器学习的营销信息识别装置的结构示意图；

图4是本申请其中一实施例的一种电子设备的结构示意图。

具体实施方式

以下结合图1至图4对本申请作进一步详细说明。

本具体实施例仅仅是对本申请的解释，其并不是对本申请的限制，本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改，但只要在本申请的范围内都受到专利法的保护。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，如无特殊说明，一般表示前后关联对象是一种“或”的关系。

下面结合说明书附图对本申请实施例作进一步详细描述。

商家为了能够及时准确地了解竞品的营销机制，相关技术中，利用OCR技术从竞品主图中提取竞品的营销信息，然而，由于竞品主图的布局复杂性（即，竞品主图包括：产品介绍和营销机制）和产品外观图中的文字干扰（即，在产品介绍的产品外观图中包括：品牌、产品条码等文字信息），使得利用OCR技术直接从竞品主图中提取的营销信息中包括部分无效信息，造成提取的营销信息的准确度低，其中，无效信息为并非营销机制的内容，例如，产品介绍、产品品牌、产品条码等。

因而，为了解决上述营销信息的准确度低的问题，本申请实施例提供了一种基于机器学习的营销信息识别方法，基于期望参数逻辑规则进行竞品搜索，得到至少一个竞品主图，进而，针对竞品主图进行划区归类处理，得到竞品主图对应的标记竞品主图，其中，标记竞品主图将产品介绍和营销机制划分至不同的区块内，并标记了区块内容类别。最终，基于标记信息中区块内容类别，利用信息提取模型对标记竞品主图进行信息提取，得到竞品主图对应的竞品信息和营销信息，其中，从区块内容类别为竞品介绍的区块内提取的信息确定为竞品信息，从区块内容类别为营销机制的区块内提取的信息确定为营销信息。利用信息提取模型对划分了区块的标记竞品主图进行信息提取，即，对竞品主图进行针对性地信息提取，降低了对整个竞品主图进行识别的复杂性，提高了营销信息的精确度。

本申请实施例提供了一种基于机器学习的营销信息识别方法，由电子设备执行，该电子设备可以为服务器也可以为终端设备，其中，该服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器。终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机等，但并不局限于此，该终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请实施例在此不做限制，如图1所示，该方法包括步骤S101、步骤S102、步骤S103以及步骤S104，其中：

步骤S101：获取期望商品参数和参数逻辑关系，并基于期望商品参数和参数逻辑关系进行预处理，得到期望参数逻辑规则；

步骤S102：基于期望参数逻辑规则进行竞品搜索，得到竞品主图，其中，竞品主图包括：竞品介绍和营销机制。

对于本申请实施例，及时准确地了解竞品的营销机制，能够便于明确自家产品的优势、劣势、机遇和威胁，进而，为运营活动、战略规划等提供市场参考和行动建议，提升自家产品的市场占有率，故，在电商平台中，准确地搜索到竞品主图对营销信息的提取起到至关重要的作用。因而，本申请实施例基于期望商品参数和参数逻辑关系进行预处理，得到期望参数逻辑规则，其中，期望参数逻辑规则相较于单一的期望商品参数而言，期望参数逻辑规则综合考虑了多个期望商品参数之间的相互关系和影响，以形成更复杂的条件和限制，便于排除不符合要求或不合理的期望商品参数组合，以提高竞品搜索结果的准确性。

期望商品参数为商品的一些固有属性，期望商品参数包括但不限于：品牌名称、产品类别、产品价格区间、上架时间范围等，参数逻辑关系包括但不限于：与（AND）、或（OR）、非（NOT），其中，参数逻辑关系为至少两个期望商品参数之间的逻辑关系，且，期望商品参数和参数逻辑关系是用户基于需求自行进行设定的，本申请实施例不再进行限定。进而，基于期望商品参数和参数逻辑关系进行预处理，得到期望参数逻辑规则，并基于期望参数逻辑规则进行竞品搜索，搜索得到多个竞品图，并从多个竞品图中确定至少一个竞品主图，其中，竞品主图相较于常规的竞品图而言，包括更多的信息，即，竞品主图中包括：产品介绍（包括：产品外观图和产品文字介绍）和营销机制，且，竞品主图可以为一个、两个和多个。例如，期望商品参数为：A竞品名称、B品牌，参数逻辑关系为：非（NOT），故得到的期望参数逻辑规则为：A竞品名称NOT B品牌，该期望参数逻辑规则表征期望搜索的竞品为：排除 B品牌的A竞品名称的所有商品，故利用期望参数逻辑规则能够搜索到满足期望要求的至少一个竞品主图。

步骤S103：针对竞品主图进行划区归类处理，得到竞品主图对应的标记竞品主图，其中，标记竞品主图包括：多个区块和每一区块对应的标记信息，标记信息包括：区块内容类别。

对于本申请实施例，竞品主图中产品介绍中常常会布置由产品外观图，然而，产品外观图通常会包括大量的细节和复杂的背景，这些不相关的信息会影响信息提取的准确度。因而，本申请实施例针对竞品主图进行划区归类处理，以使得将产品外观图的背景感染与营销信息分离，降低干扰因素对信息提取的影响。

划区归类处理用于将竞品主图中分列在不同位置的内容划分至不同的区块，并针对每一区块的内容进行归类处理，基于归类结果确定每一区块对应的标记信息，得到竞品主图对应的标记竞品主图，以完成将竞品主图中产品介绍部分和营销机制部分划分至不同的区块中。区块是竞品主图中被划分出来的部分区域，每一区块为竞品主图中一个独立区域，即，不同区块之间不存在交叉重叠的情况，其中，区块的形状可以为矩形、圆形，当然，还可以为不规则的封闭图形，针对区块的形状不进行限定。标记信息用于对每一区块的情况进行详细说明，标记每一区块的区块内容类别，其中，区块内容类别包括：产品介绍和营销机制，当然，标记信息还可以包括：区块位置信息、区块大小信息等。通过区块和标记信息的组合，使得标记竞品主图提供了一种结构化的视觉表示，清晰地指示了不同区块的区块内容类别，以使得利用标记竞品主图能够更加精准地、分类别地提取出竞品信息和营销信息。

步骤S104：基于标记信息中区块内容类别，利用信息提取模型对标记竞品主图进行信息提取，得到竞品主图对应的竞品信息和营销信息。

对于本申请实施例，竞品信息包括但不限于：品牌名称、产品条码、生产厂商、产品功效等，营销信息用于表征该竞品在售卖中的售卖机制，包括但不限于：限时降价信息、满减信息和买赠信息。信息提取模型是利用大量的训练样本对神经网络进行训练得到的，其中，训练神经网络得到信息提取模型的过程包括：数据收集标注、数据预处理、模型构建、模型训练、模型评估调优五个步骤。具体的，针对数据收集标注步骤，收集包括分区块的竞品主图和标记信息的多个训练样本，训练样本中的标记信息可以是人工标注还可以是自动标注，本申请实施例不再进行限定，以使得训练样本中区块和标记信息进行配对标准。针对数据预处理步骤，在模型训练之前，通常需要对训练样本进行预处理，其中，预处理包括但不限于：调整图像尺寸、图像增强、消除噪声等，并针对标记信息进行编码处理，以将类别标签转化为适合模型处理的形式。针对模型构建步骤，选择适合执行信息提取任务的模型架构，例如，卷积神经网络（CNN）或循环神经网络（RNN）。针对模型训练步骤，利用预处理后的训练样本，对选取的神经网络模型进行训练，并在训练过程中，通过优化算法（例如，梯度下降）调整神经网络模型的参数，使其能够准确地从训练样本中提取信息，确定训练后的神经网络模型为第一信息提取模型。针对模型评估调优步骤，利用测试样本集对第一信息提取模型进行测试评估，计算第一信息提取模型在信息提取任务上的性能指标，例如，信息准确率，当测试结果中信息准确率不满足预设结果阈值时，则利用训练样本对第一信息提取模型进行再训练，以得到第二信息提取模型，并利用测试样本集对第二信息提取模型进行测试，直至得到最终的符合预设结果阈值的信息提取模型。

为了提高营销信息的准确度，本申请实施例对划分了区块的标记竞品主图进行信息提取，且，标记竞品主图的标记信息精准地标记出了区块内容类别，相当于为每一区块设置标签，以便于针对提取出的信息能够精准地归类至竞品信息，或，营销信息，避免了竞品信息和营销信息混杂在一起，提高了营销信息的精确度。与此同时，相较于整张竞品主图直接进行信息提取的方式，划分区域并标记类别的方式提供了更明确的上下文信息，有助于更准确地识别和理解营销机制的含义，进而提高营销信息的准确性。

可见，在本申请实施例中，基于期望商品参数和参数逻辑关系进行预处理，得到期望参数逻辑规则，并基于期望参数逻辑规则进行竞品搜索，得到竞品主图，期望参数逻辑规则综合考虑了多个期望商品参数之间的相互关系和影响，以形成更复杂的条件和限制，便于排除不符合要求或不合理的期望商品参数组合，以提高竞品搜索结果的准确性。进而，针对竞品主图进行划区归类处理，得到竞品主图对应的标记竞品主图，以使得将产品外观图的背景感染与营销信息分离，降低干扰因素对信息提取的影响。然后，基于标记信息中区块内容类别，利用信息提取模型对标记竞品主图进行信息提取，得到竞品主图对应的竞品信息和营销信息，利用标记竞品主图进行信息提取能够避免竞品信息和营销信息混杂在一起，提高了营销信息的精确度。

进一步的，为了提升标记竞品主图与竞品主图中图像分布情况的匹配度，在本申请实施例中，针对竞品主图进行划区归类处理，得到竞品主图对应的标记竞品主图，包括：

对竞品主图进行初始划区，得到初始标记竞品主图；

基于初始标记竞品主图进行精准划区和归类处理，得到竞品主图对应的标记竞品主图。

对于本申请实施例，竞品主图是按照一定的图文排列方式将产品介绍和营销机制进行展示，且，一般而言，竞品主图的布局分为首部、主体部和尾部，其中，竞品主图的首部一般放置文字版产品介绍、品牌logo，竞品主图的主体部一般放置产品外观图、产品介绍、营销机制等，竞品主图的尾部一般放置文字版产品介绍、营销机制。不同的竞品主图会存在不同的布局特点，故针对不同的竞品主图而言，首部、主体部和尾部各自呈现的信息不尽相同，当然，竞品主图也不一定包括首部、主体部和尾部三者全部，多种布局情况均为正常的，例如，竞品主图仅包括：主体部和尾部。

通过初始划区，可以快速了解竞品主图的整体结构和内容布局，为后续的精准划区提供了布局参照，因而，对竞品主图进行初始划区，得到初始标记竞品主图。即，针对竞品主图进行元素识别定位，以确定每一元素的分布情况，元素包括：图片元素和文字元素。进而，针对竞品主图中每一元素的分布情况，确定竞品主图的整体结构和内容布局，并选取目标划分框架，其中，目标划分框架为首部、主体部和尾部中至少两项的任意组合。然后，基于每一元素的分布情况，按照目标划分框架对竞品主图进行初始划区，得到初始标记竞品主图，其中，初始标记竞品主图由多个初始区块构成，初始区块可以为矩形、多边形或其他形状的边界框，对此本申请实施例不再进行限定。

进而，针对初始标记竞品中每一初始区块，利用计算机视觉技术提取初始标记竞品主图的颜色和纹理特征，并基于颜色和纹理特征进行特征分布分析，得到颜色分布特征和纹理分布特征，其中，颜色分布特征包括：平均值、方差、偏度、峰度等，纹理分布特征包括：纹理变化趋势和局部峰值。然后，基于颜色分布特征和纹理分布特征，对初始标记竞品主图中初始区块进行调整，使得调整后的区块分布与竞品主图中图像分布情况更加匹配，以完成对初始标记竞品主图的精准划区，其中，对初始标记竞品主图中初始区块进行调整的方式有多种，本申请实施例不再进行限定。在一种可能实现的方式中，根据颜色分布特征和纹理分布特征，使用自适应阈值方法进行图像分割，并根据分割结果，调整初始区块的边界，或将初始区块划分成多个小区块，以使得调整后的区块能够更准确地匹配竞品主图的布局。在另一种可实现的方式中，利用聚类算法进行区域分割，即，将颜色分布特征、纹理分布特征输入至聚类算法进行区域分割，并根据聚类结果，将初始标记竞品主图中相似颜色特征和纹理特征的区域合并或细分，以调整初始区块的大小和位置，使得区块划分地更加精准。

为了便于理解竞品主图的初始划区和精准划区的过程，本申请实施例提供了竞品主图初始划区对应的示意图，如图2a所示，根据竞品主图的图文排列方式，划分称为首部、主体部和尾部。竞品主图精准划区对应的示意图，如图2b所示，针对首部和尾部而言，仅有完整的一块元素排列，因而，在进行精准划区时，缩小初始区块的大小，以使得区块划分更为精准；针对主体部进行精准划区时，将原本一块的初始区块进行细分，得到左右两块精细区块。

可见，在本申请实施例中，对竞品主图进行初始划区，得到初始标记竞品主图，通过初始划区，可以快速了解竞品主图的整体结构和内容布局，为后续的精准划区提供了布局参照。进而，基于初始标记竞品主图进行精准划区和归类处理，得到竞品主图对应的标记竞品主图，对初始标记竞品主图中初始区块进行调整，使得调整后的区块分布与竞品主图中图像分布情况更加匹配。

进一步的，为了节省计算资源，并提高竞品信息和营销信息的提取精准度，在本申请实施例中，基于标记信息中区块内容类别，利用信息提取模型对标记竞品主图进行信息提取，得到竞品主图对应的竞品信息和营销信息，包括：

基于标记竞品主图中的标记信息中区块内容类别进行模板构建，得到产品介绍模板和营销机制模板，其中，区块内容类别包括：产品介绍和营销机制；

利用信息提取模型，对标记竞品主图对应的产品介绍模板和营销机制模板进行信息提取，得到竞品主图对应的竞品信息和营销信息。

对于本申请实施例，在标记竞品主图中信息量大的情况下，针对整个标记竞品主图进行信息提取，需要消耗较多的计算资源，且，提取出来的竞品信息和营销信息准确性偏低。因而，本申请实施例基于标记竞品主图中的标记信息中区块内容类别进行模板构建，得到产品介绍模板和营销机制模板，其中，模板构建的方式有多种，本申请实施例不再进行限定。例如，在标记竞品主图中选取相同区块内容类别的区块进行保留，另一区块内容类别的区块进行掩盖处理，分别得到产品介绍模板和营销机制模板，即，当进行产品介绍模板的构建时，则将标记竞品主图中区块内容类别为产品介绍的区块保留，将区块内容类别为产品介绍的区块进行掩盖处理，以得到产品介绍模板。营销机制模板与产品介绍模板的构建过程相同，对此本申请实施例不再进行重复论述。

进而，利用信息提取模块对标记竞品主图对应的产品介绍模板进行信息提取，得到竞品主图对应的竞品信息，并利用信息提取模块对营销机制模板进行信息提取，得到竞品主图对应的营销信息。通过这种方式，可以避免对整张标记竞品主图进行全局性信息提取，节省了计算资源，且，由于产品信息和营销信息存在着各自对应的语义特征，故，利用信息提取模型分别对产品介绍模板和营销机制模板进行信息提取，以使得面对多语义特征的信息时也能够正确的提取信息，提高了竞品信息和营销信息的提取精准度。

可见，在本申请实施例中，基于标记竞品主图中的标记信息中区块内容类别进行模板构建，得到产品介绍模板和营销机制模板，进而，利用信息提取模型，对标记竞品主图对应的产品介绍模板和营销机制模板进行信息提取，得到竞品主图对应的竞品信息和营销信息。通过这种方式，可以避免对整张标记竞品主图进行全局性信息提取，节省了计算资源，且，利用信息提取模型分别对产品介绍模板和营销机制模板进行信息提取，提高了竞品信息和营销信息的提取精准度。

进一步的，为了能够及时准确地了解竞品的营销机制，在本申请实施例中，得到竞品主图对应的竞品信息和营销信息之后，还包括：

当检测到携带有预设参数逻辑规则的巡图指令时，则基于预设参数逻辑规则进行竞品巡图信息提取，得到竞品巡图对应的竞品信息和竞品巡图对应的营销信息，其中，每隔预设巡图周期会检测到一次巡图指令；

将竞品巡图对应的竞品信息存储至竞品资料数据库中，并将竞品巡图对应的营销信息存储至竞品营销机制数据库中。

对于本申请实施例，商品之间的竞争越来越大，商家为了能够更好地销售商品，推出了各种各样的营销机制，且，每间隔一段时间就会更新商品的营销机制，为了能够及时准确地了解竞品的营销机制，本申请实施例设定了一个定时巡图任务，即，每隔预设巡图周期均会执行一次巡图任务，并将巡图搜索到的竞品巡图进行信息提取，实现对竞品信息和营销机制的实时监测和持续采集，以便于能够及时准确地了解竞品的营销机制。

具体的，每隔预设巡图周期后，电子设备会触发一次定时巡图任务，故能够检测到携带有预设参数逻辑规则的巡图指令，其中，预设参数逻辑规则为用户预先设定完成并存储在电子设备内的，预设参数逻辑规则用于搜索满足预期要求的竞品巡图，与期望参数逻辑规则的结构相同。进而，基于预设参数逻辑规则进行竞品巡图搜索，得到竞品巡图，然后，基于竞品巡图进行划区归类处理，得到竞品巡图对应的标记竞品巡图，并基于标记信息中区块内容类别，利用信息提取模型对标记竞品巡图进行信息提取，得到标记竞品巡图对应的竞品信息和营销信息。其中，针对竞品巡图而言，竞品巡图搜索、划区归类处理和信息提取操作原理均与竞品主图相同，为了论述简洁，本申请实施例不再进行重复的阐述。最终，将竞品巡图对应的竞品信息存储至竞品资料数据库，将竞品巡图对应的营销信息存储至竞品营销机制数据库，竞品资料数据库和营销机制数据库中存储的大量信息，便于用户更好地跟踪和比较竞品的营销机制，为业务决策和战略制定提供支持。

可见，在本申请实施例中，当检测到携带有预设参数逻辑规则的巡图指令时，则基于预设参数逻辑规则进行竞品巡图信息提取，得到竞品巡图对应的竞品信息和竞品巡图对应的营销信息。进而，将竞品巡图对应的竞品信息存储至竞品资料数据库中，并将竞品巡图对应的营销信息存储至竞品营销机制数据库中。通过这种方式，实现对竞品信息和营销机制的实时监测和持续采集，以便于能够及时准确地了解竞品的营销机制。

进一步的，在本申请实施例中，得到竞品主图对应的竞品信息和营销信息之后，还包括：

基于营销信息进行竞品价格计算，得到销售单价；

基于营销信息进行竞品福利计算，得到实物信息；

获取参照产品信息，并基于销售单价、实物信息和参照产品信息，确定营销差异信息，其中，参照产品信息包括：参照销售单价和参照实物信息。

对于本申请实施例，影响商品销售的两大因素为价格因素和实物因素，因而，获取到竞品主图对应的竞品信息和营销信息后，计算竞品的销售单价和实物信息，能够综合了解到竞品在市场的价格水平进而售卖策略，有助于调整自身产品的定价策略和售卖策略。

具体的，由于商品的营销类别有多种，故，竞品主图的营销信息也对应有多种营销类别，其中，营销类别包括但不限于：商品打折、商品满减、商品买赠和商品积分。进而，获取竞品主图对应的竞品原价和营销信息进行竞品价格计算，确定销售单价，其中，销售单价为竞品原价减去营销信息给到的优惠后，购买者到手单件商品的实际价格。例如，竞品原价为310元，营销信息为：满300减50，且，满减后一件打九折，故，基于竞品原价为310元减去50元，得到满减后价格为260元，并在满减后价格260元的基础上打九折，确定销售单价为234元。针对不同的竞品原价和营销信息进行对应的计算即可，本申请实施例不再逐一举例说明。与此同时，当营销类别为商品买赠时，则购买者实际到手商品并非只有一件单品，在销售单价相同的情况下，到手实物更多的竞品在市场竞争中的优势更大，因而，基于营销信息进行竞品福利计算，得到实物信息，其中，实物信息为基于营销信息进行语义分析，确定实际到手物品的数量、种类和规格等，实际到手物品包括：正装商品和赠品。

进一步的，针对竞品主图进行营销机制识别和营销机制分析，均是为了能够比较自身产品的营销机制和竞品的营销机制的差异，以确定自身产品在营销机制上的特点、优势和弱点，从而，能够优化自身的经营策略和产品差异，提高自身产品的竞争力。因而，获取自身产品对应的参照产品信息，即，参照销售单价和参照实物信息，基于竞品的销售单价和自身产品的参照销售单价进行售价差异标记，确定营销差异信息中售价差异信息，并基于竞品的实物信息和自身产品的参照实物信息进行实物差异标记，确定营销差异信息中实物差异信息，其中，营销差异信息包括：售价差异信息和实物差异信息，且，营销差异信息用于清楚、直观地表征自身产品和竞品对比的优势方面和劣势方面。

可见，在本申请实施例中，基于营销信息进行竞品价格计算，得到销售单价，并基于营销信息进行竞品福利计算，得到实物信息，进而，基于销售单价、实物信息和参照产品信息，确定营销差异信息，营销差异信息用于清楚、直观地表征自身产品和竞品对比的优势方面和劣势方面。

进一步的，为了缩短本品营销主图的设计时长，且，使得本品营销主图能够更好地满足购买者的消费需求，在本申请实施例中，营销信息包括：营销特征，

得到竞品主图对应的竞品信息和营销信息之后，还包括：

获取每一竞品主图的销量信息，并基于每一竞品主图的销量信息，确定目标竞品主图；

基于目标竞品主图进行主图框架提取，得到目标主图框架；

获取本品主图介绍和本品营销机制，并基于目标竞品主图对应的营销特征、目标主图框架、本品主图介绍和本品营销机制，得到本品营销主图。

对于本申请实施例，在商品销售过程中，商品的营销主图在一定程度上会影响商品的售卖，其中，营销主图中合理的框架布局能够增加商品吸引购买者的能力，并提高销售潜力，故，利用合理的框架布局能够更好地满足购买者的消费需求。

具体的，基于每一竞品主图的销量信息，从多个竞品主图中选取销量数据最高的竞品主图作为目标竞品主图。然后，基于目标主图进行主图框架提取，得到目标主图框架，即，利用计算机视觉技术，对目标主图进行图像处理和特征提取，以提取到多个视觉元素和每一视觉元素对应的位置信息，进而，基于多个视觉元素和每一视觉元素对应的位置信息进行初步框架构建，得到初始主图框架，为了提高初始主图框架和目标竞品主图匹配的准确度，基于初始主图框架和目标竞品主图进行人工校对和优化操作，得到高匹配度的目标主图框架，其中，目标主图框架为一个包括各元素和结构的可视化框架图，元素包括：产品介绍元素和营销机制元素。进而，将本品主图介绍和本品营销机制，按照目标主图框架的结构布局进行信息展示，并且按照目标竞品主图对应的营销特征调整本品营销机制的文字显示，其中，营销特征包括但不限于：文字字体、文字颜色、文字大小。在设备自身产品对应的本品营销主图时，综合了销量最高的目标竞品主图对应的营销特征和目标主图框架，缩短了本品营销主图的设计时长，并确保了本品营销主图的可行性，使得本品营销主图能够更好地满足购买者的消费需求。

可见，在本申请实施例中，基于每一竞品主图的销量信息，确定目标竞品主图，并基于目标竞品主图进行主图框架提取，得到目标主图框架，进而，基于目标竞品主图对应的营销特征、目标主图框架、本品主图介绍和本品营销机制，得到本品营销主图。综合销量最高的目标竞品主图对应的营销特征和目标主图框架，缩短了本品营销主图的设计时长，并确保了本品营销主图的可行性，使得本品营销主图能够更好地满足购买者的消费需求。

上述实施例从方法流程的角度介绍一种基于机器学习的营销信息识别方法，下述实施例从虚拟模块或者虚拟单元的角度介绍了一种基于机器学习的营销信息识别装置，具体详见下述实施例。

本申请实施例提供一种基于机器学习的营销信息识别装置，如图3所示，该基于机器学习的营销信息识别装置具体可以包括：

逻辑规则确定模块210，用于获取期望商品参数和参数逻辑关系，并基于期望商品参数和参数逻辑关系进行预处理，得到期望参数逻辑规则；

竞品搜索模块220，用于基于期望参数逻辑规则进行竞品搜索，得到竞品主图，其中，竞品主图包括：竞品介绍和营销机制；

竞品标记模块230，用于针对竞品主图进行划区归类处理，得到竞品主图对应的标记竞品主图，其中，标记竞品主图包括：多个区块和每一区块对应的标记信息，标记信息包括：区块内容类别；

信息提取模块240，用于基于标记信息中区块内容类别，利用信息提取模型对标记竞品主图进行信息提取，得到竞品主图对应的竞品信息和营销信息。

对于本申请实施例，逻辑规则确定模块210基于期望商品参数和参数逻辑关系进行预处理，得到期望参数逻辑规则，竞品搜索模块220基于期望参数逻辑规则进行竞品搜索，得到竞品主图，期望参数逻辑规则综合考虑了多个期望商品参数之间的相互关系和影响，以形成更复杂的条件和限制，便于排除不符合要求或不合理的期望商品参数组合，以提高竞品搜索结果的准确性。进而，竞品标记模块230针对竞品主图进行划区归类处理，得到竞品主图对应的标记竞品主图，以使得将产品外观图的背景感染与营销信息分离，降低干扰因素对信息提取的影响。然后，信息提取模块240基于标记信息中区块内容类别，利用信息提取模型对标记竞品主图进行信息提取，得到竞品主图对应的竞品信息和营销信息，利用标记竞品主图进行信息提取能够避免竞品信息和营销信息混杂在一起，提高了营销信息的精确度。

本申请实施例的一种可能的实现方式，竞品标记模块230在执行针对竞品主图进行划区归类处理，得到竞品主图对应的标记竞品主图时，用于：

对竞品主图进行初始划区，得到初始标记竞品主图；

本申请实施例的一种可能的实现方式，信息提取模块240在执行基于标记信息中区块内容类别，利用信息提取模型对标记竞品主图进行信息提取，得到竞品主图对应的竞品信息和营销信息时，用于：

本申请实施例的一种可能的实现方式，基于机器学习的营销信息识别装置，还包括：

营销差异确定模块，用于基于营销信息进行竞品价格计算，得到销售单价；

基于营销信息进行竞品福利计算，得到实物信息；

定时巡图模块，用于当检测到携带有预设参数逻辑规则的巡图指令时，则基于预设参数逻辑规则进行竞品巡图信息提取，得到竞品巡图对应的竞品信息和竞品巡图对应的营销信息，其中，每隔预设巡图周期会检测到一次巡图指令；

本申请实施例的一种可能的实现方式，营销信息包括：营销特征，

本品营销主图确定模块，用于基于机器学习的营销信息识别装置，还包括：

基于目标竞品主图进行主图框架提取，得到目标主图框架；

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的一种装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本申请实施例中提供了一种电子设备，如图4所示，图4所示的电子设备300包括：处理器301和存储器303。其中，处理器301和存储器303相连，如通过总线302相连。可选地，电子设备300还可以包括收发器304。需要说明的是，实际应用中收发器304不限于一个，该电子设备300的结构并不构成对本申请实施例的限定。

处理器301可以是CPU（Central Processing Unit，中央处理器），通用处理器，DSP（Digital Signal Processor，数据信号处理器），ASIC（Application SpecificIntegrated Circuit，专用集成电路），FPGA（Field Programmable Gate Array，现场可编程门阵列）或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器301也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等。

总线302可包括一通路，在上述组件之间传送信息。总线302可以是PCI（Peripheral Component Interconnect，外设部件互连标准）总线或EISA（ExtendedIndustry Standard Architecture，扩展工业标准结构）总线等。总线302可以分为地址总线、数据总线、控制总线等。为便于表示，图4中仅用一条粗线表示，但并不表示仅有一根总线或一型的总线。

存储器303可以是ROM（Read Only Memory，只读存储器）或可存储静态信息和指令的其他类型的静态存储设备，RAM（Random Access Memory，随机存取存储器）或者可存储信息和指令的其他类型的动态存储设备，也可以是EEPROM（Electrically ErasableProgrammable Read Only Memory，电可擦可编程只读存储器）、CD-ROM（Compact DiscRead Only Memory，只读光盘）或其他光盘存储、光碟存储（包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等）、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。

存储器303用于存储执行本申请方案的应用程序代码，并由处理器301来控制执行。处理器301用于执行存储器303中存储的应用程序代码，以实现前述方法实施例所示的内容。

其中，电子设备包括但不限于：移动电话、笔记本电脑、数字广播接收器、PDA（个人数字助理）、PAD（平板电脑）、PMP（便携式多媒体播放器）、车载终端（例如车载导航终端）等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。还可以为服务器等。图4示出的电子设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

本申请实施例提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，当其在计算机上运行时，使得计算机可以执行前述方法实施例中相应内容。与相关技术相比，本申请实施例，基于期望商品参数和参数逻辑关系进行预处理，得到期望参数逻辑规则，并基于期望参数逻辑规则进行竞品搜索，得到竞品主图，期望参数逻辑规则综合考虑了多个期望商品参数之间的相互关系和影响，以形成更复杂的条件和限制，便于排除不符合要求或不合理的期望商品参数组合，以提高竞品搜索结果的准确性。进而，针对竞品主图进行划区归类处理，得到竞品主图对应的标记竞品主图，以使得将产品外观图的背景感染与营销信息分离，降低干扰因素对信息提取的影响。然后，基于标记信息中区块内容类别，利用信息提取模型对标记竞品主图进行信息提取，得到竞品主图对应的竞品信息和营销信息，利用标记竞品主图进行信息提取能够避免竞品信息和营销信息混杂在一起，提高了营销信息的精确度。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上仅是本申请的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种基于机器学习的营销信息识别方法，其特征在于，包括：

针对所述竞品主图进行划区归类处理，得到所述竞品主图对应的标记竞品主图，其中，所述标记竞品主图包括：多个区块和每一所述区块对应的标记信息，所述标记信息包括：区块内容类别、区块位置信息、区块大小信息；

基于所述标记信息中所述区块内容类别，利用信息提取模型对所述标记竞品主图进行信息提取，得到所述竞品主图对应的竞品信息和营销信息，营销信息包括：营销特征，其中，营销特征包括：文字字体、文字颜色；

所述针对所述竞品主图进行划区归类处理，得到所述竞品主图对应的标记竞品主图，包括：

针对所述竞品主图进行元素识别定位，确定每一元素的分布情况，其中，所述元素包括：图片元素和文字元素；

基于每一所述元素的所述分布情况，确定目标划分框架，并按照所述目标划分框架对所述竞品主图进行初始划分，得到初始竞品主图，其中，初始标记竞品主图由多个初始区块构成；

利用计算机视觉技术提取所述初始标记竞品主图中每一所述初始区块的颜色和纹理特征，并基于每一所述初始区块对应的颜色和纹理特征进行特征分布分析，得到颜色分布特征和纹理分布特征；

基于所述颜色分布特征和所述纹理分布特征，对所述初始标记竞品主图中的多个所述初始区块进行调整，得到竞品主图对应的标记竞品主图；

2.根据权利要求1所述的基于机器学习的营销信息识别方法，其特征在于，所述基于所述标记信息中所述区块内容类别，利用信息提取模型对所述标记竞品主图进行信息提取，得到所述竞品主图对应的竞品信息和营销信息，包括：

3.根据权利要求1所述的基于机器学习的营销信息识别方法，其特征在于，所述得到所述竞品主图对应的竞品信息和营销信息之后，还包括：

基于所述营销信息进行竞品价格计算，得到销售单价；

基于所述营销信息进行竞品福利计算，得到实物信息；

4.根据权利要求1至3任意一项所述的基于机器学习的营销信息识别方法，其特征在于，所述营销信息包括：营销特征，

5.一种基于机器学习的营销信息识别装置，其特征在于，包括：

竞品标记模块，用于针对所述竞品主图进行划区归类处理，得到所述竞品主图对应的标记竞品主图，其中，所述标记竞品主图包括：多个区块和每一所述区块对应的标记信息，所述标记信息包括：区块内容类别、区块位置信息、区块大小信息；

信息提取模块，用于基于所述标记信息中所述区块内容类别，利用信息提取模型对所述标记竞品主图进行信息提取，得到所述竞品主图对应的竞品信息和营销信息，营销信息包括：营销特征，其中，营销特征包括：文字字体、文字颜色；

竞品标记模块在执行所述针对所述竞品主图进行划区归类处理，得到所述竞品主图对应的标记竞品主图时，用于：

定时巡图模块，用于当检测到携带有预设参数逻辑规则的巡图指令时，则基于所述预设参数逻辑规则进行竞品巡图信息提取，得到竞品巡图对应的竞品信息和所述竞品巡图对应的营销信息，其中，每隔预设巡图周期会检测到一次巡图指令；

6.一种电子设备，其特征在于，包括：

至少一个处理器；

存储器；

至少一个应用程序，其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行，所述至少一个应用程序配置用于：执行权利要求1～4任一项所述的基于机器学习的营销信息识别方法。

7.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令所述计算机执行权利要求1～4任一项所述的基于机器学习的营销信息识别方法。