CN117217365A - 意图预测方法、装置、存储介质与电子设备 - Google Patents

意图预测方法、装置、存储介质与电子设备 Download PDF

Info

Publication number
CN117217365A
CN117217365A CN202311094066.7A CN202311094066A CN117217365A CN 117217365 A CN117217365 A CN 117217365A CN 202311094066 A CN202311094066 A CN 202311094066A CN 117217365 A CN117217365 A CN 117217365A
Authority
CN
China
Prior art keywords
data
feature
user
network
network performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311094066.7A
Other languages
English (en)
Inventor
程新娜
吕田田
张乐
段含婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Technology Innovation Center
China Telecom Corp Ltd
Original Assignee
China Telecom Technology Innovation Center
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Technology Innovation Center, China Telecom Corp Ltd filed Critical China Telecom Technology Innovation Center
Priority to CN202311094066.7A priority Critical patent/CN117217365A/zh
Publication of CN117217365A publication Critical patent/CN117217365A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供一种意图预测方法、装置、存储介质与电子设备,涉及大数据技术领域。该意图预测方法包括:获取用户的唯一标识信息、网络行为数据与网络性能数据;将所述网络行为数据与网络性能数据划分为多个维度,并对不同所述维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据;对所述初始特征数据进行特征融合,以得到中间特征数据;利用预设深度模型对所述中间特征数据进行处理,得到用户等级信息与目标特征数据;利用意图预测模型对所述用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果。本公开提升了意图预测准确率,进一步提高了意图预测效率。

Description

意图预测方法、装置、存储介质与电子设备
技术领域
本公开涉及大数据技术领域,尤其涉及一种意图预测方法、意图预测装置、计算机可读存储介质与电子设备。
背景技术
随着移动互联网的飞速发展和大数据的时代的来临,数据分析变得越来越重要。尤其在通信行业,通信运营商不仅作为用户通信数据信息的传输管道提供者,更是数据信息的存储者。科学有效地利用数据信息进行数据分析,挖掘用户数据的意图和潜在价值,合理应用到用户营销服务,对运营商进行运营数字化转型具有重要意义。
相关技术中的意图预测方法无法满足当前用户数据量庞大的应用场景,使得用户意图预测过程速度慢,且准确度低下,造成用户的意图预测效率低下。
发明内容
本公开提供了一种意图预测方法、意图预测装置、计算机可读存储介质与电子设备,进而至少在一定程度上改善意图预测效率低下的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供一种意图预测方法,包括:获取用户的唯一标识信息、网络行为数据与网络性能数据;将所述网络行为数据与网络性能数据划分为多个维度,并对不同所述维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据;对所述初始特征数据进行特征融合,以得到中间特征数据;利用预设深度模型对所述中间特征数据进行处理,得到用户等级信息与目标特征数据;利用意图预测模型对所述用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果。
可选的,所述将所述网络行为数据与网络性能数据划分为多个维度,并对不同所述维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据,包括:在所述网络行为数据与网络性能数据中确定M个数据样本,并将每个所述数据样本划分为N个维度,在同一所述数据样本中,将所述N个维度的网络行为数据与网络性能数据进行合并,以得到M个中间维度数据,M与N是正整数;根据所述M个中间维度数据确定特征值和特征向量,将所述特征值对应的特征向量进行累加,以得到所述初始特征数据。
可选的,所述对所述初始特征数据进行特征融合,以得到中间特征数据,包括:对所述初始特征数据进行特征组合,以得到组合特征数据;根据所述组合特征数据之间的相似度对所述组合特征数据进行分类,以得到特征分类数据;对所述特征分类数据进行特征融合,以得到所述中间特征数据。
可选的,所述对所述特征分类数据进行特征融合,以得到所述中间特征数据,包括:将所述特征分类数据划分为T份,在所述T份特征分类数据中,选取任一份所述特征分类数据作为测试集,并将剩余的T-1份所述特征分类数据作为训练集,以对预设特征融合模型进行训练,T是正整数;根据所述预设特征融合模型的T次输出结果,确定所述中间特征数据。
可选的,所述利用预设深度模型对所述中间特征数据进行处理,得到用户等级信息与目标特征数据,包括:在所述中间特征数据中提取所述目标特征数据;利用所述预设深度模型对所述目标特征数据进行处理,以确定所述目标特征数据对应的用户等级信息。
可选的,所述利用意图预测模型对所述用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果,包括:将同一所述用户的唯一标识信息、所述用户等级信息,以及所述目标特征数据进行一一对应,以得到意图识别数据;将所述意图识别数据输入所述意图预测模型,以得到所述用户的意图预测结果。
可选的,在所述获取用户的唯一标识信息、网络行为数据与网络性能数据后,所述方法还包括:对所述网络行为数据与网络性能数据进行数据预处理。
根据本公开的第二方面,提供一种意图预测装置,包括:数据获取模块,被配置为获取用户的唯一标识信息、网络行为数据与网络性能数据;降维处理模块,被配置为将所述网络行为数据与网络性能数据划分为多个维度,并对不同所述维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据;特征融合模块,被配置为对所述初始特征数据进行特征融合,以得到中间特征数据;用户等级信息获取模块,被配置为利用预设深度模型对所述中间特征数据进行处理,得到用户等级信息与目标特征数据;意图预测结果获取模块,被配置为利用意图预测模型对所述用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果。
根据本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面的意图预测方法及其可能的实现方式。
根据本公开的第四方面,提供一种电子设备,包括:处理器;存储器,用于存储所述处理器的可执行指令。其中,所述处理器配置为经由执行所述可执行指令,来执行上述第一方面的意图预测方法及其可能的实现方式。
本公开的技术方案具有以下有益效果:
一方面,通过对用户数据进行降维处理以及特征融合,在一定程度上避免了相关技术中的意图预测方法在处理海量用户数据时,出现的模型训练过程复杂,且数据过拟合等问题,加速了模型训练过程,以及意图预测过程,同时基于特征处理后的中间特征数据获取用户等级信息,根据用户等级信息与对应的目标特征数据共同预测用户意图,在降低了冗余数据特征对意图预测结果的影响的同时,提高了用户意图预测准确率,从而大大提高了意图预测效率。另一方面,通过获取用户的唯一标识信息、网络行为数据与网络性能数据等多个维度的用户数据,提升了用户数据的丰富度,进一步确保了意图预测结果的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本示例性实施方式的一种系统运行架构;
图2示出本示例性实施方式中一种意图预测方法的流程图;
图3示出本示例性实施方式中一种获取初始特征数据的流程图;
图4示出本示例性实施方式中一种获取中间特征数据的流程图;
图5示出本示例性实施方式中一种特征融合的过程的流程图;
图6示出本示例性实施方式中一种获取用户等级信息的流程图;
图7示出本示例性实施方式中一种获取意图预测结果的流程图;
图8示出本示例性实施方式中一种意图预测单元的架构图;
图9示出本示例性实施方式中另一种意图预测方法的流程图;
图10示出本示例性实施方式中一种意图预测装置的结构示意图;
图11示出本示例性实施方式中一种电子设备的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
相关技术中,通过获取用户历史通话记录,提取特征,对智能对话模型进行训练,使智能对话模型能够适应不同应用场景下的用户意图识别;或者通过采集分析用户行为数据;根据行业知识图谱对用户行为数据进行知识解读,获取用户行业知识清单;应用多种用户特征识别模型识别并输出用户的个性化特征与需求,使得意图识别场景与特征处理方法较为单一、且未考虑海量特征数据的处理方式,造成意图预测方法无法满足当前用户数据量庞大的应用场景,且用户意图预测过程速度慢,准确度低下,导致用户的意图预测效率低下。
鉴于上述一个或多个问题,本公开示例性实施方式首先提供一种意图预测方法。下面结合图1对本示例性实施方式运行环境的系统架构进行说明。
参考图1所示,系统架构100可以包括终端设备110和服务器120。终端设备110可以是平板电脑、笔记本电脑、台式电脑等电子设备,终端设备110可以用于用户的唯一标识信息、网络行为数据与网络性能数据。服务器120泛指提供本示例性实施方式中意图预测相关服务的后台系统,如可以是实现意图预测方法的服务器。服务器120可以是一台服务器或多台服务器形成的集群,本公开对此不做限定。终端设备110与服务器120之间可以通过有线或无线的通信链路形成连接,以进行数据交互。
可以由终端设备110执行本示例性实施方式中的意图预测方法。例如,在通信服务场景中,终端设备110可以是用户使用的电子设备,终端设备110通过执行意图预测方法,可以收集用户的唯一标识信息、网络行为数据与网络性能数据,确定用户等级信息,从而对用户意图进行预测,获知用户的通信业务需求,对用户进行针对性推荐,以改善用户体验。
在一种实施方式中,可以由终端设备110获取用户的唯一标识信息、网络行为数据与网络性能数据,并将用户的唯一标识信息、网络行为数据与网络性能数据发送至服务器120,服务器120在接收到用户的唯一标识信息、网络行为数据与网络性能数据后,将网络行为数据与网络性能数据划分为多个维度,并对不同维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据,再对初始特征数据进行特征融合,以得到中间特征数据,并利用预设深度模型对中间特征数据进行处理,得到用户等级信息与目标特征数据,最后利用意图预测模型对用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果。
由上可知,本示例性实施方式中的意图预测方法可以由上述终端设备110或服务器120执行。
下面结合图2对意图预测方法进行说明。图2示出了意图预测方法的示例性流程,包括以下步骤S210至S250:
步骤S210,获取用户的唯一标识信息、网络行为数据与网络性能数据;
步骤S220,将网络行为数据与网络性能数据划分为多个维度,并对不同维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据;
步骤S230,对初始特征数据进行特征融合,以得到中间特征数据;
步骤S240,利用预设深度模型对中间特征数据进行处理,得到用户等级信息与目标特征数据;
步骤S250,利用意图预测模型对用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果。
基于上述方法,一方面,通过对用户数据进行降维处理以及特征融合,在一定程度上避免了相关技术中的意图预测方法在处理海量用户数据时,出现的模型训练过程复杂,且数据过拟合等问题,加速了模型训练过程,以及意图预测过程,同时基于特征处理后的中间特征数据获取用户等级信息,根据用户等级信息与对应的目标特征数据共同预测用户意图,在降低了冗余数据特征对意图预测结果的影响的同时,提高了用户意图预测准确率,从而大大提高了意图预测效率。另一方面,通过获取用户的唯一标识信息、网络行为数据与网络性能数据等多个维度的用户数据,提升了用户数据的丰富度,进一步确保了意图预测结果的准确率。
下面对图2中的每个步骤进行具体说明。
参考图2,在步骤S210中,获取用户的唯一标识信息、网络行为数据与网络性能数据。
其中,唯一标识信息用于表征用户的身份信息,本公开对唯一标识信息的具体内容不作特殊限定,例如,唯一标识信息可以包括用户的账号,或者用户使用的终端设备的IP(Internet Protocol,网际互连协议)地址等。网络行为数据可以包括用户的网络操作数据,本公开对网络行为数据的具体内容不作特殊限定,示例性的,网络行为数据可以包括用户的搜索数据,通信业务消费数据等。网络性能数据可以表征用户所使用的无线网络或移动网络的网络状态信息,例如,网络性能数据可以包括用户当前所使用的网络的带宽、时延、带宽时延积等数据。
举例而言,可以设定数据采集周期,以按照数据采集周期定期采集用户的唯一标识信息、网络行为数据与网络性能数据,以得到表1所示的用户特征数据库信息表。
表1用户特征数据库信息表
为了使获取的网络行为数据与网络性能数据更易于在深度模型中进行训练,在一种实施方式中,在获取用户的唯一标识信息、网络行为数据与网络性能数据后,上述方法还可以包括:
对网络行为数据与网络性能数据进行数据预处理。
举例而言,对网络行为数据与网络性能数据进行数据预处理主要可以包括数据清洗、数据转换、数据筛选等。在对用户的通信业务意图预测场景中,由于运营商的用户群体范围广,相应的网络行为数据与网络性能数据的数据量也十分庞大,因此为了更有效地提取用户数据的业务特征,预测用户的意图,需要根据下述步骤对获取的网络行为数据与网络性能数据进行数据预处理:
(1)数据导入:可以通过Oracle数据库提供的数据迁移工具SQL Developer直接将获取的用户的唯一标识信息、网络行为数据与网络性能数据导入到数据库,并导出数据存储文件中的用户日志数据进行数据分析;
(2)数据清洗:由于获取的用户的唯一标识信息、网络行为数据与网络性能数据因数据特点不一致,会存在数据缺失、冗余、格式不正确数据或者脏数据等问题,因此需要针对缺失数据、错误数据、逻辑错误、冗余数据、重复数据进行数据清洗,提升数据质量,也便于在后续用户业务数据特征提取步骤中提升模型精准度,对于没有价值或并不需要的数据进行删除。
(3)数据转换:可以使用极差标准化法,对数据进行标准化处理,消除变量量纲和变异范围对数据的影响。示例性的,可以取网络行为数据与网络性能数据的最大值(Xmax)和最小值(Xmin),并计算极差R=Xmin-Xmax,并根据公式(1)计算网络行为数据或网络性能数据标准化后的值:
X是网络行为数据或网络性能数据的样本值,X’是网络行为数据或网络性能数据标准化后的值。
(4)数据过滤:根据公式(2)可以通过方差选择法,进行数据特征筛选:
其中,σ表示数据的总体方差,X为是网络行为数据或网络性能数据的样本值,α是数据的总体均值,N为是网络行为数据或网络性能数据的样本个数。
通过对网络行为数据与网络性能数据进行数据预处理,降低了处理后的网络行为数据与网络性能数据的数据冗余度,进一步加快模型收敛速率,加速意图预测过程。
继续参考图2,在步骤S220中,将网络行为数据与网络性能数据划分为多个维度,并对不同维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据。
其中,初始特征数据包括网络行为数据与网络性能数据对应的低维数据,例如,网络行为数据可以包括用户搜索的问题,如“家中路由器总是断网是怎么回事?”,而该网络行为数据对应的初始特征数据可以是一组二进制数字,如“00110101”,该二进制数字“00110101”可以被设备识别为“家中路由器总是断网是怎么回事?”,从而实现了获取网络行为数据与网络性能数据对应的低维数据。
在一种实施方式中,上述将网络行为数据与网络性能数据划分为多个维度,并对不同维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据,参考图3所示,可以包括步骤S310~S320:
步骤S310,在网络行为数据与网络性能数据中确定M个数据样本,并将每个数据样本划分为N个维度,在同一数据样本中,将N个维度的网络行为数据与网络性能数据进行合并,以得到M个中间维度数据,M与N是正整数;
步骤S320,根据M个中间维度数据确定特征值和特征向量,将特征值对应的特征向量进行累加,以得到初始特征数据。
其中,数据样本可以代表数据的组,M个数据样本可以包括将网络行为数据与网络性能数据分为M组数据,中间维度数据可以是每个数据样本中N个维度数据的合并结果。
举例而言,可以使用主成分分析(Principal Component Analysis,PCA)方法对网络行为数据与网络性能数据进行降维处理,以得到初始特征数据,例如,X为网络行为数据或网络性能数据,X中包含M个数据样本,每个数据样本包括N个维度的数据,如下述公式(3)所示,对X中每个数据样本中不同维度的数据进行合并,以得到公式(4)。
其中,XNM可以表示第M个数据样本中的第N维度的网络行为数据或网络性能数据。
X=[X1,X2,...XM] (4)
其中,XM可以表示第M个中间维度数据。
再根据中间维度数据计算对应的特征值和特征向量,将特征值按照由大到小进行排序,并根据下述公式(5)累计贡献率来确定降维数:
其中,Pk是累计贡献率,λk表示第k个特征值对应的贡献率。
在Pk满足预设贡献率阈值的情况下,可以停止累加,以表示降维结束,并根据当前维度的数据得到初始特征数据,其中,预设贡献率阈值可以是0.85。
通过对网络行为数据与网络性能数据进行数据划分和数据合并,以得到低维的初始特征数据,可以有效缓解维度灾难问题,降低数据结构复杂度,有利于提升意图预测效率。
继续参考图2,在步骤S230中,对初始特征数据进行特征融合,以得到中间特征数据。
其中,中间特征数据是初始特征数据的特征融合结果。在一种实施方式中,上述对初始特征数据进行特征融合,以得到中间特征数据,参考图4所示,可以包括步骤S410~S430:
步骤S410,对初始特征数据进行特征组合,以得到组合特征数据;
其中,组合特征数据可以包括基于初始特征数据的进行特征提取、特征交叉形成的新的特征群。示例性的,如,初始特征数据包括网络操作数据A,搜索行为数据B以及网络性能数据C,可以通过对初始特征数据进行特征提取与特征组合,以得到中间特征数据D,该中间特征数据D=A+C,从而将具有联系的初始特征数据通过特征组合的方式进行关联,形成新的特征数据。
步骤S420,根据组合特征数据之间的相似度对组合特征数据进行分类,以得到特征分类数据。
其中,相似性距离可以表示特征数据之间的相似度,本公开对相似性距离的具体内容不作特殊限定,例如,相似性距离可以包括汉明距离、欧氏距离等。特征分类数据可以是对组合特征数据的重新分类的结果,特征分类数据中每个类别中的数据之间相似度较高。
举例而言,可以将用户的唯一标识信息user_id作为主键,通过K最邻近(K-Nearest Neighbor,KNN)算法或k均值聚类算法(K-means clustering algorithm),按照组合特征数据之间的相似度对组合特征数据进行分类,以得到特征分类数据:
(1)KNN算法
根据下述公式(6)计算xk与yk之间的欧氏距离d(x,y),以获取样本点xk的最接近的k个临近点yk
其中,n是样本点的总个数。
在确定xk的最接近的k个临近点yk后,可以将yk中出现频率最高的类别确定为样本点xk的类别。
(2)K-means算法
若样本集L,其中L={X1,X2,...Xn},包括n个样本数据Xi(0<i≤n),选择n个聚类中心点K1,K2,K3,...Kn,根据公式(7)计算各个聚类中心点与样本数据Xi之间的欧式距离:
将每个样本点Xi划分到距离它最近的聚类中心点Ki所代表的簇中,用各个簇中所有样本点的中心点Kit代表簇的中心点;重复以上步骤,直到簇的中心点不变或达到设定的迭代次数或达到预设容错范围。
基于组合特征数据之间的相似度对组合特征数据进行分类,可以挖掘组合特征数据之间的内在联系,使得获取的每个类别中的特征分类数据具有强关联性。
步骤S430,对特征分类数据进行特征融合,以得到中间特征数据。
在一种实施方式中,上述对特征分类数据进行特征融合,以得到中间特征数据,参考图5所示,可以包括步骤S510~S520:
步骤S510,将特征分类数据划分为T份,在T份特征分类数据中,选取任一份特征分类数据作为测试集,并将剩余的T-1份特征分类数据作为训练集,以对预设特征融合模型进行训练,T是正整数;
步骤S520,根据预设特征融合模型的T次输出结果,确定中间特征数据。
其中,训练集可以是用于训练预设特征融合模型的数据,测试集可以是验证预设特征融合模型处理结果的数据。预设特征融合模型可以是用于对特征分类数据进行特征融合的深度模型,本公开对预设特征融合模型的具体内容不作特殊限定,示例性的,预设特征融合模型可以包括基于Stacking算法的深度模型。
举例而言,预设特征融合模型可以是基于改进的Stacking算法的深度模型,可以将特征分类数据划分为5等份,以得到Train1、Train2、Train3、Train4、Train5共五组特征分类数据,依次选择其中一组特征分类数据作为测试集,其余四组作为训练集,对预设特征融合模型进行训练,以得到五组预测结果Pre1、Pre2、Pre3、Pre4、Pre5(即预设特征融合模型的第一层网络输出结果);再计算五组预测结果Pre1、Pre2、Pre3、Pre4、Pre5的加权平均值,将该加权平均值输入预设特征融合模型的第二层网络,根据第二层网络的输出结果获取中间特征数据。
基于图5所示的方法,对特征分类数据进行特征融合,以得到中间特征数据,可以进一步提升模型分类的准确率与鲁棒性,从而有利于提升意图预测准确度。
基于图4的方法,通过多种模型对初始特征数据进行处理,以得到中间特征数据,相比于使用单一模型进行特征构造的方法,有效提升了中间特征数据的分类准确率,进一步降低了中间特征数据的冗余数据量,有利于提升意图预测整体效率。
继续参考图2,在步骤S240中,利用预设深度模型对中间特征数据进行处理,得到用户等级信息与目标特征数据。
其中,预设深度模型是基于注意力机制的神经网络模型,例如,预设深度模型可以包括Transformer模型。用户等级信息可以用于表示用户的等级,例如,用户的等级可以包括优质用户、高级用户和普通用户3个等级。目标特征数据可以是用于确定用户等级信息的数据,本公开对目标特征数据不作特殊限定,示例性的,目标特征数据可以是在中间特征数据中提取到的用户访问量、用户访问时长、用户访问频次、用户上网流量、用户通话总时长等数据。
在一种实施方式中,上述利用预设深度模型对中间特征数据进行处理,得到用户等级信息与目标特征数据,参考图6所示,可以包括步骤S610~S620:
步骤S610,在中间特征数据中提取目标特征数据;
步骤S620,利用预设深度模型对目标特征数据进行处理,以确定目标特征数据对应的用户等级信息。
举例而言,预设深度模型可以包括改进的Transformer模型,可以首先在中间特征数据中提取用户访问量、用户访问时长、用户访问频次、用户上网流量、用户通话总时长等数据,以获取目标特征数据,目标特征数据的内容说明可以如表2所示。将目标特征数据中的80%作为训练集,以训练预设深度模型,将目标特征数据剩余的20%作为测试集,以验证预设深度模型的预测准确率,可以通过公式(8)计算模型的查全率和查准率,以对模型的预测效果进行评估,如:根据模型的查全率和查准率计算得到的模型预测准确率为74.37%:
F1=(2*precision*recall)/(precision+recall) (8)
其中,F1是模型的预测准确率,precision是查准率,recall是查全率。
在预设深度模型训练完成后,可以在目标特征数据中提取词向量,将该词向量作为初始化值输入到预设深度模型中学习全局信息,最后基于预设深度模型的全连接层和逻辑回归方法确定每个用户的user_id对应的用户等级信息。
表2目标特征数据内容说明表
目标特征数据 目标特征数据内容说明
用户访问量 用户访问量
用户访问时长 用户访问时长(min)
用户访问频次 用户访问频次(次/天)
用户上网流量 用户上网流量(GB)
用户通话总时长 用户的通话总时长(min)
基于图6的方法,可以获取目标特征数据对应的用户等级信息,实现了对用户等级的分类,提高了获取的用户等级信息的准确率,进一步提升了意图预测的准确率。
继续参考图2,在步骤S250中,利用意图预测模型对用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果。
其中,意图预测模型是用于对用户意图进行识别的深度模型,本公开对意图预测模型的具体种类不作特殊限定,示例性的,意图预测模型可以包括Text-CNN(TextConvolutional Neural Networks,文本卷积神经网络)模型。
在一种实施方式中,上述利用意图预测模型对用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果,参考图7所示,可以步骤S710~S720:
步骤S710,将同一用户的唯一标识信息、用户等级信息,以及目标特征数据进行一一对应,以得到意图识别数据;
步骤S720,将意图识别数据输入意图预测模型,以得到用户的意图预测结果。
其中,意图识别数据可以用于对用户意图进行识别。意图预测结果可以包括意图预测模型的输出结果,本公开对意图预测结果的具体内容不作特殊限定,示例性的,意图预测结果可以包括用户的通信业务需求以及用户的基本信息。
举例而言,利用Text-CNN模型对目标特征数据进行编码,并与特征词向量进行拼接,形成带有上下文特征信息的词向量,再根据该词向量获取意图类别标签的概率分布结果,最后根据概率分布结果确定用户的意图预测结果。
在一种实施方式中,可以将本示例性实施方式的意图预测方法进行集成,以得到意图预测单元,并将该意图预测单元嵌入到通信系统中,对用户的通信业务需求进行预测。
举例而言,意图预测单元的架构可以如图8所示,意图预测单元可以包括数据管理子单元,数据采集子单元,特征工程子单元,模型训练子单元以及意图预测子单元。在数据存储子单元中可以存储所有用户的网络数据,在数据采集子单元中,可以在网络数据中筛选包括用户的唯一标识信息的用户基础数据,网络操作数据,搜索数据以及网络性能数据,在获取这些数据后,可以在特征工程子单元中,对这些数据进行数据清洗、数据预处理、特征选择(数据降维、数据分类)以及特征组合,以得到初始特征数据,将初始特征数据输入模型训练子单元,以对构建的预设特征融合模型以及预设深度模型进行模型训练,基于训练好的预设特征融合模型对初始特征数据进行特征融合,以得到中间特征数据,将中间特征数据输入训练好的预设深度模型中,以得到用户等级信息;在意图预测子单元中将用户等级信息,用户的唯一标识信息以及目标特征数据输入意图预测模型,以得到用户的意图预测结果,基于用户的意图预测结果确定用户的业务需求信息,根据业务需求信息进行服务策略制定,将制定好的服务策略下发至业务处理子单元,以使得业务处理子单元根据服务策略进行营销服务、运营调度、用户管理以及故障告警,并更新用户的网络数据,同时将更新后的数据重新存储在数据管理子单元中。
通过将意图预测方法的集成在意图预测单元中,并将意图预测单元嵌入通信服务系统,可以使得通信服务系统基于用户的网络数据预测用户意图,从而为通信服务系统进行业务智能处理提供可能性。
在一种实施方式中,参考图9所示,本示例性实施方式的意图预测方法的一种示例性流程可以包括步骤S901~S909:
步骤S901,获取用户的网络数据;
步骤S902,根据用户的网络数据获取用户的唯一标识信息、网络行为数据以及网络性能数据;
步骤S903,对网络行为数据以及网络性能数据进行预处理;
步骤S904,基于PCA方法对预处理后的网络行为数据以及网络性能数据进行数据降维,以得到初始特征数据;
步骤S905,对初始特征数据进行特征组合,以得到组合特征数据;
步骤S906,利用KNN算法和K-means算法对组合特征数据进行分类,以得到特征分类数据;
步骤S907,基于Stacking算法模型对特征分类数据进行特征融合,以得到中间特征数据;
步骤S908,基于Transformer模型对中间特征数据进行处理,以得到用户等级信息以及目标特征数据;
步骤S909,利用意图预测模型对用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果。
基于图9的方法,有效提升了意图预测准确率,进一步提升了意图预测效率。
基于上述方法,在一定程度上避免了相关技术中的意图预测方法在处理海量用户数据时,出现的模型训练过程复杂,且数据过拟合等问题,加速了模型训练过程,以及意图预测过程,提高了用户意图预测准确率,从而大大提高了意图预测效率。
本公开的示例性实施方式还提供一种意图预测装置。如图10所示,该意图预测装置1000可以包括:
数据获取模块1010,被配置为获取用户的唯一标识信息、网络行为数据与网络性能数据;
降维处理模块1020,被配置为将网络行为数据与网络性能数据划分为多个维度,并对不同维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据;
特征融合模块1030,被配置为对初始特征数据进行特征融合,以得到中间特征数据;
用户等级信息获取模块1040,被配置为利用预设深度模型对中间特征数据进行处理,得到用户等级信息与目标特征数据;
意图预测结果获取模块1050,被配置为利用意图预测模型对用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果。
在一种实施方式中,上述将网络行为数据与网络性能数据划分为多个维度,并对不同维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据,可以包括:
在网络行为数据与网络性能数据中确定M个数据样本,并将每个数据样本划分为N个维度,在同一数据样本中,将N个维度的网络行为数据与网络性能数据进行合并,以得到M个中间维度数据,M与N是正整数;
根据M个中间维度数据确定特征值和特征向量,将特征值对应的特征向量进行累加,以得到初始特征数据。
在一种实施方式中,上述对初始特征数据进行特征融合,以得到中间特征数据,可以包括:
对初始特征数据进行特征组合,以得到组合特征数据;
根据组合特征数据之间的相似度对组合特征数据进行分类,以得到特征分类数据;
对特征分类数据进行特征融合,以得到中间特征数据。
在一种实施方式中,上述对特征分类数据进行特征融合,以得到中间特征数据,可以包括:
将特征分类数据划分为T份,在T份特征分类数据中,选取任一份特征分类数据作为测试集,并将剩余的T-1份特征分类数据作为训练集,以对预设特征融合模型进行训练,T是正整数;
根据预设特征融合模型的T次输出结果,确定中间特征数据。
在一种实施方式中,上述利用预设深度模型对中间特征数据进行处理,得到用户等级信息与目标特征数据,可以包括:
在中间特征数据中提取目标特征数据;
利用预设深度模型对目标特征数据进行处理,以确定目标特征数据对应的用户等级信息。
在一种实施方式中,上述利用意图预测模型对用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果,可以包括:
将同一用户的唯一标识信息、用户等级信息,以及目标特征数据进行一一对应,以得到意图识别数据;
将意图识别数据输入意图预测模型,以得到用户的意图预测结果。
在一种实施方式中,在获取用户的唯一标识信息、网络行为数据与网络性能数据后,上述装置还可以包括:
对网络行为数据与网络性能数据进行数据预处理。
上述装置中各部分的具体细节在方法部分实施方式中已经详细说明,因而不再赘述。
本公开的示例性实施方式还提供了一种计算机可读存储介质,可以实现为一种程序产品的形式,其包括程序代码,当程序产品在电子设备上运行时,程序代码用于使电子设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。在一种可选的实施方式中,该程序产品可以实现为便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在电子设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本公开的示例性实施方式还提供一种电子设备。该电子设备可以包括处理器与存储器。存储器存储有处理器的可执行指令,如可以是程序代码。处理器通过执行该可执行指令来执行本示例性实施方式中的方法。
下面参考图11,以通用计算设备的形式对电子设备进行示例性说明。应当理解,图11显示的电子设备1100仅仅是一个示例,不应对本公开实施方式的功能和使用范围带来限制。
如图11所示,电子设备1100可以包括:处理器1110、存储器1120、总线1130、I/O(输入/输出)接口1140、网络适配器1150。
处理器1110可以包括一个或多个处理单元,例如:处理器1110可以包括中央处理器(Central Processing Unit,CPU)、AP(Application Processor,应用处理器)、调制解调处理器、显示处理器(Display Process Unit,DPU)、GPU(Graphics Processing Unit,图形处理器)、ISP(Image Signal Processor,图像信号处理器)、控制器、编码器、解码器、DSP(Digital Signal Processor,数字信号处理器)、基带处理器、人工智能处理器等。在一种实施方式中,可以由GPU获取用户的唯一标识信息、网络行为数据与网络性能数据;并将网络行为数据与网络性能数据划分为多个维度,对不同维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据;再对初始特征数据进行特征融合,以得到中间特征数据;利用预设深度模型对中间特征数据进行处理,得到用户等级信息与目标特征数据;最后利用意图预测模型对用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果。
存储器1120可以包括易失性存储器,例如RAM 1121、缓存单元1122,还可以包括非易失性存储器,例如ROM 1123。存储器1120还可以包括一个或多个程序模块1124,这样的程序模块1124包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。例如,程序模块1124可以包括上述装置1000中的各模块。
总线1130用于实现电子设备1100的不同组件之间的连接,可以包括数据总线、地址总线和控制总线。
电子设备1100可以通过I/O接口1140与一个或多个外部设备1200(例如键盘、鼠标、外置控制器等)进行通信。
电子设备1100可以通过网络适配器1150与一个或者多个网络通信,例如网络适配器1150可以提供如3G/4G/5G等移动通信解决方案,或者提供如无线局域网、蓝牙、近场通信等无线通信解决方案。网络适配器1150可以通过总线1130与电子设备1100的其它模块通信。
尽管图11中未示出,还可以在电子设备1100中设置其它硬件和/或软件模块,包括但不限于:显示器、微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的示例性实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施方式。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施方式仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限定。

Claims (10)

1.一种意图预测方法,其特征在于,包括:
获取用户的唯一标识信息、网络行为数据与网络性能数据;
将所述网络行为数据与网络性能数据划分为多个维度,并对不同所述维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据;
对所述初始特征数据进行特征融合,以得到中间特征数据;
利用预设深度模型对所述中间特征数据进行处理,得到用户等级信息与目标特征数据;
利用意图预测模型对所述用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述网络行为数据与网络性能数据划分为多个维度,并对不同所述维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据,包括:
在所述网络行为数据与网络性能数据中确定M个数据样本,并将每个所述数据样本划分为N个维度,在同一所述数据样本中,将所述N个维度的网络行为数据与网络性能数据进行合并,以得到M个中间维度数据,M与N是正整数;
根据所述M个中间维度数据确定特征值和特征向量,将所述特征值对应的特征向量进行累加,以得到所述初始特征数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述初始特征数据进行特征融合,以得到中间特征数据,包括:
对所述初始特征数据进行特征组合,以得到组合特征数据;
根据所述组合特征数据之间的相似度对所述组合特征数据进行分类,以得到特征分类数据;
对所述特征分类数据进行特征融合,以得到所述中间特征数据。
4.根据权利要求3所述的方法,其特征在于,所述对所述特征分类数据进行特征融合,以得到所述中间特征数据,包括:
将所述特征分类数据划分为T份,在所述T份特征分类数据中,选取任一份所述特征分类数据作为测试集,并将剩余的T-1份所述特征分类数据作为训练集,以对预设特征融合模型进行训练,T是正整数;
根据所述预设特征融合模型的T次输出结果,确定所述中间特征数据。
5.根据权利要求1所述的方法,其特征在于,所述利用预设深度模型对所述中间特征数据进行处理,得到用户等级信息与目标特征数据,包括:
在所述中间特征数据中提取所述目标特征数据;
利用所述预设深度模型对所述目标特征数据进行处理,以确定所述目标特征数据对应的用户等级信息。
6.根据权利要求1所述的方法,其特征在于,所述利用意图预测模型对所述用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果,包括:
将同一所述用户的唯一标识信息、所述用户等级信息,以及所述目标特征数据进行一一对应,以得到意图识别数据;
将所述意图识别数据输入所述意图预测模型,以得到所述用户的意图预测结果。
7.根据权利要求1所述的方法,其特征在于,在所述获取用户的唯一标识信息、网络行为数据与网络性能数据后,所述方法还包括:
对所述网络行为数据与网络性能数据进行数据预处理。
8.一种意图预测装置,其特征在于,包括:
数据获取模块,被配置为获取用户的唯一标识信息、网络行为数据与网络性能数据;
降维处理模块,被配置为将所述网络行为数据与网络性能数据划分为多个维度,并对不同所述维度的网络行为数据与网络性能数据进行合并,以得到初始特征数据;
特征融合模块,被配置为对所述初始特征数据进行特征融合,以得到中间特征数据;
用户等级信息获取模块,被配置为利用预设深度模型对所述中间特征数据进行处理,得到用户等级信息与目标特征数据;
意图预测结果获取模块,被配置为利用意图预测模型对所述用户的唯一标识信息、用户等级信息与目标特征数据进行处理,以得到意图预测结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。
10.一种电子设备,其特征在于,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任一项所述的方法。
CN202311094066.7A 2023-08-28 2023-08-28 意图预测方法、装置、存储介质与电子设备 Pending CN117217365A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311094066.7A CN117217365A (zh) 2023-08-28 2023-08-28 意图预测方法、装置、存储介质与电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311094066.7A CN117217365A (zh) 2023-08-28 2023-08-28 意图预测方法、装置、存储介质与电子设备

Publications (1)

Publication Number Publication Date
CN117217365A true CN117217365A (zh) 2023-12-12

Family

ID=89050331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311094066.7A Pending CN117217365A (zh) 2023-08-28 2023-08-28 意图预测方法、装置、存储介质与电子设备

Country Status (1)

Country Link
CN (1) CN117217365A (zh)

Similar Documents

Publication Publication Date Title
CN112084383B (zh) 基于知识图谱的信息推荐方法、装置、设备及存储介质
Zhu et al. Open benchmarking for click-through rate prediction
WO2022088672A1 (zh) 基于bert的机器阅读理解方法、装置、设备及存储介质
CN108287858A (zh) 自然语言的语义提取方法及装置
CN113705299A (zh) 一种视频识别的方法、装置及存储介质
CN116049412B (zh) 文本分类方法、模型训练方法、装置及电子设备
WO2020140624A1 (zh) 从日志中提取数据的方法和相关设备
CN110674100B (zh) 一种基于全渠道运营数据的用户需求预测方法及架构
CN112883990A (zh) 数据分类方法及装置、计算机存储介质、电子设备
CN111125658A (zh) 识别欺诈用户的方法、装置、服务器和存储介质
CN116431919A (zh) 基于用户意图特征的智能新闻推荐方法和系统
CN116431813A (zh) 智能客服问题分类方法、装置、电子设备及存储介质
CN113051385B (zh) 意图识别的方法、介质、装置和计算设备
CN113593606B (zh) 音频识别方法和装置、计算机设备、计算机可读存储介质
CN115129922A (zh) 搜索词生成方法、模型训练方法、介质、装置和设备
CN114676346A (zh) 新闻事件处理方法、装置、计算机设备和存储介质
CN110826616A (zh) 信息处理方法及装置、电子设备、存储介质
CN117217365A (zh) 意图预测方法、装置、存储介质与电子设备
CN117131935A (zh) 一种面向期货领域的知识图谱构建方法
CN116340641A (zh) 基于显式和隐式兴趣特征的智能新闻推荐方法和系统
CN116663536A (zh) 一种临床诊断标准词的匹配方法及装置
CN115345600A (zh) 一种rpa流程的生成方法和装置
CN112463964B (zh) 文本分类及模型训练方法、装置、设备及存储介质
CN113627514A (zh) 知识图谱的数据处理方法、装置、电子设备和存储介质
CN114418111A (zh) 标签预测模型训练及样本筛选方法、装置、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination