CN116843388B

CN116843388B - 一种广告投放分析方法及系统

Info

Publication number: CN116843388B
Application number: CN202311092925.9A
Authority: CN
Inventors: 滕云开
Original assignee: Xinyi Internet Beijing Technology Co ltd
Current assignee: Xinyi Internet Beijing Technology Co ltd
Priority date: 2023-08-29
Filing date: 2023-08-29
Publication date: 2023-11-17
Anticipated expiration: 2043-08-29
Also published as: CN116843388A

Abstract

本发明公开了一种广告投放分析方法及系统，涉及广告投放技术领域，包括：收集用户及平台记录反馈，进行预处理；对收集到的数据使用机器学习算法处理和分析；根据用户的数据和偏好数据匹配广告；收集用户对广告的反馈，评估广告投放的效果。本发明能够对用户的偏好数据进行深入分析和理解，从而更精确地预测用户的行为和需求。这不仅可以提高广告的点击率和转化率，还可以提升用户的满意度和粘合度。本发明还可以通过实时收集和处理用户对广告的反馈，可以及时评估和优化广告投放的效果。这不仅可以提高广告的效果，还可以节省广告投放的成本。

Description

一种广告投放分析方法及系统

技术领域

本发明涉及广告投放技术领域，具体为一种广告投放分析方法及系统。

背景技术

在现代广告投放系统中，如何根据用户的偏好数据精准地投放广告是一个重要的问题。传统的广告投放分析方法主要存在数据预处理不全面、模型选择和参数调整不够灵活、广告匹配策略过于简单以及广告效果评估和优化不够及时等问题。这些问题可能导致广告投放的效果不佳，无法满足广告主和用户的需求。因此，如何改进广告投放分析方法，提高广告投放的精准度和效果，是广告技术领域亟待解决的问题。

本发明提出了一种广告投放分析方法，通过改进数据预处理、模型选择和参数调整、广告匹配策略以及广告效果评估和优化等环节，有效地提高了广告投放的精准度和效果，满足了广告主和用户的需求。

发明内容

鉴于上述存在的问题，提出了本发明。

因此，本发明解决的技术问题是：如何根据个人偏好进行广告投放，提升用户的满意度。

为解决上述技术问题，本发明提供如下技术方案：一种广告投放分析方法，其包括如下步骤，收集用户及平台记录反馈，进行预处理；

对收集到的数据使用机器学习算法处理和分析；

根据用户的数据和偏好数据匹配广告；

收集用户对广告的反馈，评估广告投放的效果；

所述机器学习算法处理和分析是通过线性回归模型预测用户浏览的时间，再将结果作为输入特征，输入至逻辑回归模型当中预测用户是否会点击推送广告；

所述线性回归模型表达式为：

A = β0_{用户及平台记录反馈}+ β1_{用户及平台记录反馈}* 用户及平台记录反馈 + ε_{用户及平台记录反馈}

其中， β0_{用户及平台记录反馈}是线性回归模型的截距项， β1_{用户及平台记录反馈}线性回归模型的斜率项，ε_{用户及平台记录反馈}是误差项；

在用户的数据信息中的偏好数据设置5个等级 1、2、3、4、5；所述逻辑回归模型的表达式为：

；

=γ1*k_{用户及平台记录反馈}*d_{用户及平台记录反馈}

其中，p(click=1X) 是给定输入特征X时的逻辑回归模型预测的概率，α1，α2，α3 ，α4 ，α5分别是用户年龄、偏好数据、设备数据、预测用户浏览时间以及环境数据逻辑回归模型的参数，对应每个输入特征的权重，β 是多项式项的参数，对应输入特征的权重，是用户及平台记录反馈的交互项参数，用户及平台记录反馈的用户年龄与浏览时间的组合，γ1对应组合乘积的权重，λ 是正则化参数；/>是模型参数的L2范数，k，d分别是用户及平台记录反馈所包含数据所对应的独有权重数值，k、dϵ（α1，α2，α3 ， α4 ，α5）；

用户及平台记录反馈包括用户年龄age、偏好数据preference、设备数据device、环境数据day以及浏览时间time；

将整个采集到的用户及平台记录反馈的用户年龄随机分割成N个子集，且每个子集保证相同的大小，进行K次训练和验证，选择一个子集作为验证集，剩余的K-1个子集合并成新的训练集，在新的训练集上继续迭代线性回归模型与逻辑回归模型，并在验证集上验证模型，在每次训练和验证过程中，计算逻辑回归模型预测正确样本数占总样本数的比例，其表达式为：

准确率=（真正例数+真负例数）/总样本数

其中，真正例数是模型正确预测的用户点击广告的数量，真负例数是模型正确预测用户未点击广告的数量，总样本数是验证集的大小；

设置准确率的阈值，准确率高于阈值时将信息记录至云端，认定用户对当前广告感兴趣，通过区块链技术将广告投放至用户，并默认自动投放当前类目广告；

准确率低于阈值时，将对模型的参数进行调整，添加新的特征优化模型；

用户可以选择接受或拒绝广告，若用户接受广告，记录信息并更新逻辑回归模型，若用户拒绝推送广告时，记录这个行为的时间戳，当用户拒绝广告的次数达到一定的上限时，重新针对用户及平台记录反馈进行训练，记录新的数据集，重新匹配相应的广告；

所述添加新的特征优化是当准确率低于阈值时，将对模型的参数进行第一次调整，

；

其中，是以用户及平台记录反馈的用户年龄为基础与其它四个数据依次组合，判断当前用户是否会点击推送广告，并求出四种组合的均值再判断是否满足准确率阈值；

若满足准确率阈值则记录更新数据集，继续推送广告，若不满足准确率阈值则进行有且仅有第二次调整；

针对逻辑回归模型当中的用户及平台记录反馈的交互项进行调整，以用户及平台记录反馈的偏好数据为基础与其它四个数据依次组合更新逻辑回归模型，重新记录当前用户是否点击推送广告，并求出四种组合的均值再判断是否满足准确率阈值；

若满足准确率阈值则记录更新数据集，继续推送广告，若不满足准确率阈值则重新记录用户及平台记录反馈，调整线性回归模型和逻辑回归模型的参数。

作为本发明所述的一种广告投放分析方法的一种优选方案，其中：所述收集用户及平台记录反馈包括用户的用户年龄、偏好数据、设备数据、浏览时间以及环境数据；

所述预处理是收集到的状态数据去掉缺失值，异常值，以及错误格式的无效数据，将原始格式数据转换为符合数学模型需求分析的格式，数据归一化完成数据预处理并标记为标准数据集。

作为本发明所述的一种广告投放分析方法的一种优选方案，其中：当验证线性回归模型与逻辑回归模型的准确率达到准确率阈值时，实时收集用户对广告的反馈，包括用户看到广告后的行为、用户对广告的点击率、以及用户是否购买了广告中的产品，当推送广告可以满足用户时，继续推送当前类目广告且实时监测用户使用行为数据，当推送广告不能满足用户时添加用户新的使用特征并重新匹配相应广告。

本发明的另外一个目的是提供一种广告投放分析系统，其能对用户的偏好数据进行深入分析和理解，从而更精确地预测用户的行为和需求。同时，该系统还能通过实时收集和处理用户对广告的反馈，及时评估和优化广告投放的效果，提高广告的点击率和转化率。

为解决上述技术问题，本发明提供如下技术方案：一种广告投放分析系统，包括：包括数据收集模块、数据预处理模块、广告匹配投放模块、以及反馈收集和评估模块；所述数据收集模块是收集用户的信息和反馈，包括用户的年龄、偏好数据、设备数据、浏览时间以及环境数据；所述数据预处理模块是将收集到的状态数据去掉缺失值，异常值，以及错误格式的无效数据，将原始格式数据转换为符合数学模型需求分析的格式，数据归一化完成数据预处理并标记为标准数据集；所述广告匹配投放模块是负责根据用户的数据和偏好数据匹配广告，并通过区块链技术投放匹配的广告；所述反馈收集和评估模块是负责收集用户对广告的反馈，评估广告投放的效果，以及根据反馈进行模型的调整和优化。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如上所述一种广告投放分析方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如上所述一种广告投放分析方法的步骤。

本发明的有益效果：本发明能够对用户的偏好数据进行深入分析和理解，从而更精确地预测用户的行为和需求。这不仅可以提高广告的点击率和转化率，还可以提升用户的满意度和粘合度。本发明还可以通过实时收集和处理用户对广告的反馈，可以及时评估和优化广告投放的效果。这不仅可以提高广告的效果，还可以节省广告投放的成本。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。其中：

图1为本发明第一个实施例提供的一种广告投放分析方法的整体流程图；

图2为本发明第二个实施例提供的一种广告投放分析系统的结构图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合说明书附图对本发明的具体实施方式做详细的说明，显然所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明的保护的范围。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。

其次，此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例，也不是单独的或选择性的与其他实施例互相排斥的实施例。

本发明结合示意图进行详细描述，在详述本发明实施例时，为便于说明，表示器件结构的剖面图会不依一般比例作局部放大，而且所述示意图只是示例，其在此不应限制本发明保护的范围。此外，在实际制作中应包含长度、宽度及深度的三维空间尺寸。

同时在本发明的描述中，需要说明的是，术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一、第二或第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

本发明中除非另有明确的规定和限定，术语“安装、相连、连接”应做广义理解，例如：可以是固定连接、可拆卸连接或一体式连接；同样可以是机械连接、电连接或直接连接，也可以通过中间媒介间接相连，也可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

实施例1

参照图1为本发明的一个实施例，提供了一种重力储能系统稳定运行控制方法，其特征在于：

收集用户及平台记录反馈，进行预处理；对收集到的数据使用机器学习算法处理和分析；根据用户的数据和偏好数据匹配广告；收集用户对广告的反馈，评估广告投放的效果。

首先，我们需要对收集到的数据进行预处理，包括清洗、转换和规范化。数据清洗是去除无效、错误或不完整的数据。数据转换是将数据转换为机器学习算法可以处理的格式。数据规范化是将数据调整到一个标准的范围，以减少不同特征之间的尺度差异。

收集用户及平台记录反馈包括用户的用户年龄、偏好数据、设备数据、浏览时间以及环境数据。

用户年龄：用户的年龄、性别、地理位置、教育背景等；这些数据可以帮助我们理解用户的基本特征和生活状态，以便更精准地定位用户群体，推送更符合用户实际需求和生活状态的广告。

偏好数据：用户的喜好和兴趣，如喜欢的产品、关注的品牌、订阅的内容等；这些数据可以帮助我们理解用户的个人偏好。

设备数据：用户使用的设备信息，如设备类型、操作系统、浏览器等；这些数据可以帮助我们理解用户的技术环境和使用习惯，以便优化广告的展示形式和加载速度，提供更好的用户体验。

浏览时间：用户在平台上的活动时间，如每日活跃时间、单次浏览时长、页面停留时间等；这些数据可以帮助我们理解用户的活跃程度和参与度，以及用户对特定内容的兴趣深度。

时间信息可以帮助我们理解用户的活动规律，如何在合适的时间向用户推送广告；天气信息可以帮助我们理解用户的情绪和可能的需求，如在寒冷的天气推送暖和的衣物广告；地理位置信息可以帮助我们理解用户的地理位置和可能的文化背景，以推送更符合用户地域特色的广告。

环境数据：用户的环境信息，如时间、天气、地理位置等；这些数据可以帮助我们理解用户的个人偏好和消费习惯，以便推送更符合用户个人喜好的广告，提高广告的点击率和转化率。

通过线性回归模型预测用户浏览的时间，再将结果作为输入特征，输入至逻辑回归模型当中预测用户是否会点击推送广告；

线性回归模型表达式为：

用户及平台记录反馈的五个数据都使用此线性回归模型预测用户的浏览时间。

用户及平台记录反馈中的偏好数据设置5个等级 1、2、3、4、5。

逻辑回归模型的表达式为：

；

=γ1*k_{用户及平台记录反馈}*d_{用户及平台记录反馈}

其中，p(click=1X) 是给定输入特征X时的逻辑回归模型预测的概率，α1，α2，α3 ，α4 ，α5分别是用户年龄、偏好数据、设备数据、浏览时间以及环境数据逻辑回归模型的参数，对应每个输入特征的权重，β是多项式项的参数，是用户及平台记录反馈的交互项，用户及平台记录反馈的用户年龄与浏览时间的组合，λ 是正则化参数；/>是模型参数的L2范数，k，d分别是用户及平台记录反馈所包含数据所对应的独有权重数值，k、dϵ（α1，α2，α3 ， α4 ，α5）。

用户及平台记录反馈包括用户年龄age、偏好数据preference、设备数据device、环境数据day以及浏览时间time。

用户年龄age将年龄分成几个不同的区间，为每个区间创建一个单独的模型。

比如收集用户及平台记录反馈的用户年龄，其线性回归模型的表达式为：

A = β0_age+ β1_age* age + ε_age

其中，β0_age为线性回归模型的截距项，它表示当年龄为0时，预测的浏览时间，β1_age是线性回归模型的斜率项，它表示年龄每增加1，预测的浏览时间会增加多少，ε_age是线性回归模型的误差项，它表示模型预测的浏览时间和实际浏览时间之间的差异。

其逻辑回归模型的表达式为：

；

其中，是多项式项的参数，用户及平台记录反馈中的用户年龄，/>是用户及平台记录反馈的交互项，用户及平台记录反馈的用户年龄与浏览时间的组合，/>=γ1*k_age*d_time，k，d分别是用户及平台记录反馈所中用户年龄与浏览时间所对应的独有权重系数，此时k=α1，d=α4。

其次类推，其它数据之间两两组合的逻辑回归模型也可推出

是一个正则化项，其中λ是正则化参数，/>是模型参数的L2范数（即模型参数的平方和）。/>是模型参数的平方和，用于计算L2正则化惩罚项。L2正则化可以防止模型过拟合，通过对模型参数的大小施加惩罚，使得模型更倾向于选择小的参数值。多项式项和交互项的参数也是通过最大似然估计法来确定的。多项式项可以帮助模型捕捉特征的非线性关系，交互项可以帮助模型捕捉特征之间的相互作用。

这个项可以防止模型过拟合，通过对模型参数的大小施加惩罚，使得模型更倾向于选择小的参数值。

准确率=（真正例数+真负例数）/总样本数

其中，真正例数是模型正确预测的用户点击广告的数量，真负例数是模型正确预测用户未点击广告的数量，总样本数是验证集的大小。

比较不同模型或不同参数设置下的交叉验证结果，选择性能最好的模型或参数设置，k折交叉验证可以更准确地评估模型的性能。

用户可以选择接受或拒绝广告，若用户接受广告，记录信息并更新逻辑回归模型，若用户拒绝推送广告时，记录这个行为的时间戳，当用户拒绝广告的次数达到一定的上限时，重新针对用户及平台记录反馈进行训练，记录新的数据集，重新匹配相应的广告。

当准确率低于阈值时，可能存在逻辑回归模型存在没考虑到的因素，从而进行改进，添加新的特征优化，对模型的参数进行第一次调整，

；

其中，是以用户及平台记录反馈的用户年龄为基础与其它四个数据依次组合。

判断当前用户是否会点击推送广告，并依次求出四种组合的结果，再判断其均值是否满足准确率阈值；若满足准确率阈值则记录更新数据集，继续推送广告，若不满足准确率阈值则进行有且仅有第二次调整；针对逻辑回归模型当中的用户及平台记录反馈的交互项进行调整，以用户及平台记录反馈的偏好数据为基础与其它四个数据依次组合更新逻辑回归模型，重新记录当前用户是否点击推送广告，并依次求出四种组合的结果，再判断其均值是否满足准确率阈值；若满足准确率阈值则记录更新数据集，继续推送广告，若不满足准确率阈值则重新记录用户及平台记录反馈，调整线性回归模型和逻辑回归模型的参数。

当验证线性回归模型与逻辑回归模型的准确率达到准确率阈值时，实时收集用户对广告的反馈，包括用户看到广告后的行为、用户对广告的点击率、以及用户是否购买了广告中的产品，当推送广告可以满足用户时，继续推送当前类目广告且实时监测用户使用行为数据，当推送广告不能满足用户时，则说明现模型的性能不佳，可能没有充分利用可用数据，尝试添加用户新的使用特征，比如用户的历史行为、社交网络信息，用户的购物历史、搜索历史等等，重新匹配相应广告，从而达到基于偏好数据的广告投放。

实施例2

参照图2，为本发明的一个实施例，提供了一种广告投放分析方法的系统，其特征在于：包括数据收集模块、数据预处理模块、广告匹配投放模块、以及反馈收集和评估模块。

数据收集模块是收集用户的信息和反馈，包括用户的年龄、偏好数据、设备数据、浏览时间以及环境数据。

数据预处理模块是将收集到的状态数据去掉缺失值，异常值，以及错误格式的无效数据，将原始格式数据转换为符合数学模型需求分析的格式，数据归一化完成数据预处理并标记为标准数据集。

广告匹配投放模块是负责根据用户的数据和偏好数据匹配广告，并通过区块链技术投放匹配的广告。

反馈收集和评估模块是负责收集用户对广告的反馈，评估广告投放的效果，以及根据反馈进行模型的调整和优化。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-OnlyMemory）、随机存取存储器（RAM，RandomAccessMemory）、磁碟或者光盘等各种可以存储程序代码的介质。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备（如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统）使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例（非穷尽性列表）包括以下：具有一个或多个布线的电连接部（电子装置）、便携式计算机盘盒（磁装置）、随机存取存储器（RAM）、只读存储器（ROM）、可擦除可编辑只读存储器（EPROM或闪速存储器）、光纤装置以及便携式光盘只读存储器（CDROM）。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。

实施例3

本实施例中，为了验证本发明的有益效果，通过经济效益计算和仿真实验进行科学论证。本实施例分别对现有传统的方法、本实施例的方法进行了实验。

一个在线广告平台，通过用户的偏好数据来优化广告的投放效果。目标是提高用户点击广告的概率，同时也希望提高广告的投放效率。

首先收集用户的信息和平台的反馈数据，这些数据包括用户的年龄、偏好数据、设备数据、浏览时间以及环境数据。

用户A，年龄25，偏好数据为3（在1-5的等级中，5表示最喜欢），使用的设备是iPhone，浏览时间为晚上8点，环境数据为晴天。

用户B，年龄35，偏好数据为4，使用的设备是Android手机，浏览时间为早上9点，环境数据为阴天。

对收集到的数据进行预处理，包括去掉缺失值、异常值，以及错误格式的无效数据，将原始格式数据转换为符合数学模型需求分析的格式，数据归一化完成数据预处理并标记为标准数据集。

用户A的浏览时间预测：25分钟，点击广告的概率：0.65。

用户B浏览时间预测：30分钟，点击广告的概率：0.70。

根据用户的数据和偏好数据，我们匹配最适合的广告，并通过区块链技术将广告投放给用户，用户A点击了广告，那么我们的模型预测是正确的；如果用户B没有点击广告，那么我们的模型预测是错误的。

将整个采集到的用户及平台记录反馈的用户年龄随机分割成N个子集，且每个子集保证相同的大小，进行K次训练和验证。选择一个子集作为验证集，剩余的K-1个子集合并成新的训练集，在新的训练集上继续迭代线性回归模型与逻辑回归模型，并在验证集上验证模型。通过训练我们可能会得到以下的准确率：训练集的准确率为0.75，验证集的准确率为0.70。

我们设定的阈值是0.75，但是我们的模型在验证集上的准确率只有0.70，这意味着我们需要对模型进行优化。

调整逻辑回归模型的正则化参数λ。正则化是一种防止模型过拟合的技术，通过增加一个正则化项，我们可以限制模型参数的大小，从而提高模型的泛化能力。我们可以通过交叉验证的方法来选择最优的λ值。

其次，我们还可以尝试新的数据组合。

；

其中，是以用户及平台记录反馈的用户年龄为基础与其它四个数据依次组合，判断当前用户是否会点击推送广告，并依次求出四种组合的结果，再判断其均值是否满足准确率阈值；若满足准确率阈值则记录更新数据集，继续推送广告，若不满足准确率阈值则进行有且仅有第二次调整；针对逻辑回归模型当中的用户及平台记录反馈的交互项进行调整，以用户及平台记录反馈的偏好数据为基础与其它四个数据依次组合更新逻辑回归模型，重新记录当前用户是否点击推送广告，并依次求出四种组合的结果，再判断其均值是否满足准确率阈值；若满足准确率阈值则记录更新数据集，继续推送广告，若不满足准确率阈值则重新记录用户及平台记录反馈，调整线性回归模型和逻辑回归模型的参数。

当验证线性回归模型与逻辑回归模型的准确率达到准确率阈值时，实时收集用户对广告的反馈，包括用户看到广告后的行为、用户对广告的点击率、以及用户是否购买了广告中的产品，当推送广告可以满足用户时，继续推送当前类目广告且实时监测用户使用行为数据，当推送广告不能满足用户时，则说明现模型的性能不加，可能没有充分理由可用数据，尝试添加用户新的使用特征，比如用户的历史行为、社交网络信息，用户的购物历史、搜索历史等等，重新匹配相应广告，从而达到基于偏好数据的广告投放。

表1模型预测和实际结果对比表

用户	年龄	偏好数据	浏览时间	环境数据
					1	25	3	30 min	Sunny
2	35	4	45 min	Rainy
					3	22	2	20 min	Sunny
4	40	5	60 min	Cloudy
					5	30	3	35 min	Sunny
6	28	4	40 min	Rainy
					7	32	2	25 min	Sunny
8	38	5	55 min	Cloudy
					9	27	3	33 min	Sunny
10	36	4	42 min	Rainy

表2预测结果表

我方发明的模型在10个用户中有8个预测正确，准确率为80%。而传统方式只有6个预测正确，准确率为60%。这表明我们的模型在预测用户是否会点击广告方面比传统方式更准确。

此外，对于预测错误的用户5和用户10，我方发明的模型可以根据这些错误的预测进行调整和优化。调整模型的参数，或者添加新的特征，以提高模型的准确率。而传统方式则无法做到这一点。

表3广告投入以及回报数据

可以计算出每个用户的投入回报比（ROI）：

ROI = (销售额 - 广告制作成本 - 广告投放成本) / (广告制作成本 + 广告投放成本)

通过计算我方发明的投入回报比为0.76，比传统方式的0.51要高出49%，所以我方发明不仅可以提高广告投放的准确率还可以提高广告的投入汇报比，进一步的提高广告的效果以及用户满意度。

应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种广告投放分析方法，其特征在于，包括：

收集用户及平台记录反馈，进行预处理；

所述用户及平台记录反馈包括用户年龄age、偏好数据preference、设备数据device、环境数据day以及浏览时间time；

对收集到的数据使用机器学习算法处理和分析；

根据用户的数据和偏好数据匹配广告；

收集用户对广告的反馈，评估广告投放的效果；

所述线性回归模型表达式为：

其中， β0_{用户及平台记录反馈}是线性回归模型的截距项，β1_{用户及平台记录反馈}线性回归模型的斜率项，ε_{用户及平台记录反馈}是误差项；

；

其中，是给定输入特征X时的逻辑回归模型预测的概率，α1，α2，α3 ，α4 ，α5分别是用户年龄、偏好数据、设备数据、预测的用户浏览时间以及环境数据逻辑回归模型的参数，对应每个输入特征的权重，β 是多项式项的参数，对应输入特征的权重，/>是用户及平台记录反馈的交互项参数，用户及平台记录反馈的用户年龄与预测的用户浏览时间的组合，γ1对应组合乘积的权重，λ 是正则化参数，/>是模型参数的L2范数，k，d分别是用户及平台记录反馈所包含数据所对应的独有权重数值，k、dϵ（α1，α2，α3 ，α4 ，α5）；

准确率=（真正例数+真负例数）/总样本数

；

2.如权利要求1所述的一种广告投放分析方法，其特征在于：所述预处理是收集到的状态数据去掉缺失值，异常值，以及错误格式的无效数据，将原始格式数据转换为符合数学模型需求分析的格式，数据归一化完成数据预处理并标记为标准数据集。

3.如权利要求2所述的一种广告投放分析方法，其特征在于：当验证线性回归模型与逻辑回归模型的准确率达到准确率阈值时，实时收集用户对广告的反馈，包括用户看到广告后的行为、用户对广告的点击率、以及用户是否购买了广告中的产品，当推送广告可以满足用户时，继续推送当前类目广告且实时监测用户使用行为数据，当推送广告不能满足用户时添加用户新的使用特征并重新匹配相应广告。

4.一种采用如权利要求1~3任一所述的一种广告投放分析方法的系统，其特征在于：包括数据收集模块、数据预处理模块、广告匹配投放模块、以及反馈收集和评估模块；

所述数据收集模块是收集用户的信息和反馈，包括用户的年龄、偏好数据、设备数据、浏览时间以及环境数据；

所述数据预处理模块是将收集到的状态数据去掉缺失值，异常值，以及错误格式的无效数据，将原始格式数据转换为符合数学模型需求分析的格式，数据归一化完成数据预处理并标记为标准数据集；

所述广告匹配投放模块是负责根据用户的数据和偏好数据匹配广告，并通过区块链技术投放匹配的广告；

所述反馈收集和评估模块是负责收集用户对广告的反馈，评估广告投放的效果，以及根据反馈进行模型的调整和优化。