CN117932539A

CN117932539A - 类别识别方法、装置、电子设备及计算机存储介质

Info

Publication number: CN117932539A
Application number: CN202410103190.3A
Authority: CN
Inventors: 陈晓
Original assignee: Shenzhen TCL New Technology Co Ltd
Current assignee: Shenzhen TCL New Technology Co Ltd
Priority date: 2024-01-24
Filing date: 2024-01-24
Publication date: 2024-04-26

Abstract

本申请实施例公开了一种类别识别方法、装置、电子设备及计算机存储介质；在本申请实施例中，从客户端的本地文件中提取所述客户端的第一属性文本信息，以及从所述客户端的下载平台中获取所述客户端的第二属性文本信息；对所述第一属性文本信息进行特征提取，得到所述第一属性文本信息对应的第一文本模态特征，以及对所述第二属性文本信息进行特征提取，得到所述第二属性文本信息对应的第二文本模态特征；对所述第一文本模态特征和所述第二文本模态特征进行融合处理，得到所述客户端对应的文本模态特征；根据所述文本模态特征对所述客户端的类别进行识别，得到所述客户端的类别识别结果。本申请实施例可以提高客户端的类别的识别的准确率。

Description

类别识别方法、装置、电子设备及计算机存储介质

技术领域

本申请涉及计算机技术领域，具体涉及一种类别识别方法、装置、电子设备及计算机存储介质。

背景技术

随着科学技术的发展，电子设备上运行的应用程序越来越多，当应用程序占用的内存较多时，会导致出现卡顿现象，此时，需要对应用程序占用的内存进行回收。

在对应用程序占用的内存进行回收的过程中，需要对应用程序的类别进行识别，以便确定是否结束该应用程序，然而，目前对应用程序进行类别识别的方法的准确度较低。

发明内容

本申请实施例提供一种类别识别方法、装置、电子设备及计算机存储介质，可以解决对应用程序进行类别识别的方法的准确度较低的技术问题。

本申请实施例提供一种类别识别方法，包括：

从客户端的本地文件中提取上述客户端的第一属性文本信息，以及从上述客户端的下载平台中获取上述客户端的第二属性文本信息；

对上述第一属性文本信息进行特征提取，得到上述第一属性文本信息对应的第一文本模态特征，以及对上述第二属性文本信息进行特征提取，得到上述第二属性文本信息对应的第二文本模态特征；

对上述第一文本模态特征和上述第二文本模态特征进行融合处理，得到上述客户端对应的文本模态特征；

根据上述文本模态特征对上述客户端的类别进行识别，得到上述客户端的类别识别结果。

相应地，本申请实施例提供一种类别识别装置，包括：

获取模块，用于从客户端的本地文件中提取上述客户端的第一属性文本信息，以及从上述客户端的下载平台中获取上述客户端的第二属性文本信息；

提取模块，用于对上述第一属性文本信息进行特征提取，得到上述第一属性文本信息对应的第一文本模态特征，以及对上述第二属性文本信息进行特征提取，得到上述第二属性文本信息对应的第二文本模态特征；

融合模块，用于对上述第一文本模态特征和上述第二文本模态特征进行融合处理，得到上述客户端对应的文本模态特征；

识别模块，用于根据上述文本模态特征对上述客户端的类别进行识别，得到上述客户端的类别识别结果。

此外，本申请实施例还提供一种电子设备，包括处理器和存储器，上述存储器存储有计算机程序，上述处理器用于运行上述存储器内的计算机程序实现本申请实施例提供的类别识别方法。

此外，本申请实施例还提供一种计算机可读存储介质，上述计算机可读存储介质存储有计算机程序，上述计算机程序适于处理器进行加载，以执行本申请实施例所提供的任一种类别识别方法。

此外，本申请实施例还提供一种计算机程序产品，包括计算机程序，上述计算机程序被处理器执行时实现本申请实施例所提供的任一种类别识别方法。

在本申请实施例中，从客户端的本地文件中提取客户端的第一属性文本信息，以及从客户端的下载平台中获取客户端的第二属性文本信息；对第一属性文本信息进行特征提取，得到第一属性文本信息对应的第一文本模态特征，以及对第二属性文本信息进行特征提取，得到第二属性文本信息对应的第二文本模态特征；对第一文本模态特征和第二文本模态特征进行融合处理，得到客户端对应的文本模态特征；根据文本模态特征对客户端的类别进行识别，得到客户端的类别识别结果，实现根据第一属性文本信息和第二属性文本信息对客户端的类别进行识别，提高客户端的类别识别结果的准确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的类别识别方法的流程示意图；

图2是本申请实施例提供的类别识别装置的结构示意图；

图3是本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供一种类别识别方法、装置、电子设备及计算机存储介质。该类别识别装置可以集成在电子设备中，该电子设备可以是服务器，也可以是终端等设备。

其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

另外，本申请实施例中的“多个”指两个或两个以上。本申请实施例中的“第一”和“第二”等用于区分描述，而不能理解为暗示相对重要性。

以下分别进行详细说明。需要说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。

在本实施例中，将从类别识别装置的角度进行描述，为了方便对本申请的类别识别方法进行说明，以下将以类别识别装置集成在终端中进行详细说明，即以终端作为执行主体进行详细说明。

请参阅图1，图1是本申请一实施例提供的类别识别方法的流程示意图。该类别识别方法可以包括：

S101、从客户端的本地文件中提取客户端的第一属性文本信息，以及从客户端的下载平台中获取客户端的第二属性文本信息。

其中，客户端的形式可以根据实际情况进行设置，比如，客户端可以为应用程序、小程序或者网页，本申请实施例在此不做限定。

客户端的本地文件指终端中运行客户端需要用到的文件。第一属性文本信息指本地文件中描述客户端的属性的信息，第一属性文本信息可以根据实际情况进行设置，比如，第一属性文本信息可以包括客户端的权限信息和客户端的热点函数中的至少一种，本申请实施例在此不做限定。

热点函数指客户端中执行时间大于预设时间的函数。可选地，热点函数可以指客户端中的本地热点函数，或者，由于不同客户端中的热点函数可能不相同，因此，在一些实施例中，从客户端的本地文件中提取客户端的第一属性文本信息，包括：

从客户端的本地文件中提取客户端的本地热点函数；

从下载平台中获取其他设备中客户端的热点函数；

根据本地热点函数和其他设备中客户端的热点函数，确定客户端的第一属性文本信息。

其中，可以从Profile文件中获取热点函数。在本申请实施例中，不但从客户端的本地文件中提取客户端的本地热点函数，而且从下载平台中获取其他设备中客户端的热点函数，然后再将本地热点函数和其他设备中客户端的热点函数，确定为客户端的第一属性文本信息，实现同时参照本地热点函数和其他设备中客户端的热点函数判断客户端的类别，进一步提高判断客户端的类别的准确度。

下载平台也可以称为应用商店、应用市场或应用宝，其指下载客户端的平台。第二属性文本信息指下载平台中与客户端关联的信息，比如，第二属性文本信息可以指下载平台中对客户端的描述信息(描述信息也可以称为介绍信息)和下载平台中对客户端的评价信息中的至少一种。

可选地，终端可以在接收到获取指令后，根据获取指令从客户端的本地文件中提取客户端的第一属性文本信息，以及从客户端的下载平台中获取客户端的第二属性文本信息，或者，终端也可以在检测到需要进行内存回收时，从客户端的本地文件中提取客户端的第一属性文本信息，以及从客户端的下载平台中获取客户端的第二属性文本信息。

对于终端获取第一属性文本信息和第二属性文本信息的方式，可以根据实际情况进行选择，本申请实施例在此不做限定。

S102、对第一属性文本信息进行特征提取，得到第一属性文本信息对应的第一文本模态特征，以及对第二属性文本信息进行特征提取，得到第二属性文本信息对应的第二文本模态特征。

其中，第一文本模态特征也可以称为第一文本模态数值向量，第二文本模态特征也可以称为第二文本模态数值向量，数值向量指包括0和1的向量。

可选地，可以根据第一属性文本信息中的信息类型，从而判断是提取为0还是提取为1。比如，当第一属性文本信息包括客户端的权限信息时，如果权限信息包括访问网络权限、访问麦克风权限、访问摄像头权限、访问联系人权限以及访问短信权限，则访问网络权限、访问麦克风权限、访问摄像头权限、访问联系人权限以及访问短信权限对应的向量元素为1，其余权限信息对应的向量元素为0。

又比如，当第一属性文本信息包括热点函数时，如果热点函数包括发送消息函数、拨打电话函数、发起视频会议函数、添加好友函数、创建群组函数以及静音函数等，则发送消息函数、拨打电话函数、发起视频会议函数、添加好友函数、创建群组函数以及静音函数对应的向量元素为1，其余函数对应的向量元素为0。

又比如，当第二属性文本信息包括通讯、聊天、社交、视频、音频、电话等关键词时，通讯、聊天、社交、视频、音频以及电话对应的向量元素为1，其他关键词对应的向量元素为0。

可选地，对第一属性文本信息进行特征提取，得到第一属性文本信息对应的第一文本模态特征的方式可以和对第二属性文本信息进行特征提取，得到第二属性文本信息对应的第二文本模态特征的方式可以相同，也可以不相同，本申请实施例在此不做限定。

对第一属性文本信息进行特征提取，得到第一属性文本信息对应的第一文本模态特征以及对第二属性文本信息进行特征提取，得到第二属性文本信息对应的第二文本模态特征的方式可以根据实际情况进行设置，本申请实施例在此不做限定。

比如，可以通过卷积层或分词转换方式，对第一属性文本信息进行特征提取以及对第二属性文本信息进行特征提取，本申请实施例在此不做限定。

当通过分词转换方式，对第一属性文本信息进行特征提取以及对第二属性文本信息进行特征提取时，对第一属性文本信息进行特征提取，得到第一属性文本信息对应的第一文本模态特征以及对第二属性文本信息进行特征提取，得到第二属性文本信息对应的第二文本模态特征的过程可以为：

对第一属性文本信息进行分词处理，得到第一属性文本信息对应的第一目标词语；

对第一目标词语进行转换处理，得到第一属性文本信息对应的第一文本模态特征；

对第二属性文本信息进行分词处理，得到第二属性文本信息对应的第二目标词语；

对第二目标词语进行转换处理，得到第二属性文本信息对应的第二文本模态特征。

其中，第一目标词语可以包括至少一个，第二目标词语可以包括至少一个。对第一属性文本信息进行分词处理的方法和对第二属性文本信息进行分词处理的方法可以相同，也可以不相同，本申请实施例在此不做限定。

对第一属性文本信息进行分词处理的方法和对第二属性文本信息进行分词处理的方法可以根据实际情况进行选择，比如，可以通过基于字典的分词方法或jieba组件对第一属性文本信息进行分词处理和对第二属性文本信息分词处理，本申请实施例在此不做限定。

可选地，为了提高将第一目标词语转换为第一文本模态特征的速度，提高将第二目标词语转换为第二文本模态特征的速度，对第一属性文本信息进行分词处理，得到第一属性文本信息对应的第一目标词语，对第二属性文本信息进行分词处理，得到第二属性文本信息对应的第二目标词语的过程可以为：

对第一属性文本信息进行分词处理，得到第一属性文本信息对应的第一候选词语；

对第一候选词语进行去除停用词处理，得到第一属性文本信息对应的第一目标词语；

对第二属性文本信息进行分词处理，得到第二属性文本信息对应的第二候选词语；

对第二候选词语进行去除停用词处理，得到第二属性文本信息对应的第二目标词语。

可选地，在对第一候选词语进行去除停用词处理和第二候选词语进行去除停用词处理之后，还可以进行词干还原处理，再得到第一目标词语和第二目标词语。

终端在得到第一目标词语和第二目标词语之后，再将第一目标词语进行转换处理，得到第一属性文本信息对应的第一文本模态特征；对第二目标词语进行转换处理，得到第二属性文本信息对应的第二文本模态特征。

其中，将第一目标词语进行转换处理的方法和将第二目标词语进行转换处理的方法可以相同，也可以不相同，本申请实施例在此不做限定。

将第一目标词语进行转换处理的方法和将第二目标词语进行转换处理的方法可以根据实际情况进行选择，比如，当第一属性文本信息包括客户端的权限信息和客户端的热点函数时，可以通过词袋模型，将客户端的权限信息对应的第一目标词语进行转换处理，通过词嵌入方法，将热点函数对应的第一目标词语进行转换处理，通过TF-IDF方法，将第二目标词语进行转换处理，本申请实施例在此不做限定。

S103、对第一文本模态特征和第二文本模态特征进行融合处理，得到客户端对应的文本模态特征。

其中，对第一文本模态特征和第二文本模态特征进行融合处理，可以指对第一文本模态特征和第二文本模态特征进行拼接，拼接可以是并行拼接，也可以是串行拼接。

可选地，为了便于后续根据文本模态特征对客户端的类别进行识别，可以根据文本模态特征生成数据框对象，将数据库对象存储为data.csv格式的文件，以便将文本模态特征存储为data.csv格式的文件。

S104、根据文本模态特征对客户端的类别进行识别，得到客户端的类别识别结果。

比如，客户端的类别识别结果可以为通讯类、游戏类或者运动类等。终端在得到客户端的类别识别结果之后，可以根据类别识别结果，确定是否结束客户端的运行。

终端根据文本模态特征对客户端的类别进行识别，得到客户端的类别识别结果的方法可以根据实际情况进行设置，比如，可以通过已训练识别模型或预设函数，根据文本模态特征对客户端的类别进行识别，本申请实施例在此不做限定。

已训练识别模型的类型可以根据实际情况进行设置，比如，已训练识别模型可以包括随机森林模型、逻辑回归模型以及支持向量机中的至少一种。

当通过已训练识别模型，根据文本模态特征对客户端的类别进行识别时，根据文本模态特征对客户端的类别进行识别，得到客户端的类别识别结果的过程可以为：

将文本模态特征输入到至少一个已训练识别模型中进行识别，得到至少一个已训练识别模型针对客户端的候选类别识别结果；

根据候选类别识别结果，确定客户端的类别识别结果。

其中，当至少一个已训练识别模型包括一个已训练识别模型时，可以直接将候选类别识别结果，确定为客户端的类别识别结果。当至少一个已训练识别模型包括多个时，根据候选类别识别结果，确定客户端的类别识别结果的过程可以为：

确定候选类别识别结果中属于第一类别的候选类别识别结果的第一数量以及属于第二类别的候选类别识别结果的第二数量；

若第一数量大于第二数量，则将第一类别确定为客户端的类别识别结果；

若所述第一数量小于第二数量，则将第二类别确定为客户端的类别识别结果。

其中，第一类别可以为某一类别，第二类别可以指除了第一类别之外的类别，也即是，第二类别可以包括多个类别。比如，第一类别为通讯类，第二类别为除了通讯类之外的类别。

可选地，第一类别可以采用第一数值表示，第二类别可以采用第二数值表示，候选类别识别结果可以包括第一数值和第二数值，比如，第一数值可以为1，第二数值为0，或者，第一数值为1，第二数值为2。当候选类别识别结果为第一数值时，表示候选类别识别结果属于第一类别，当候选类别识别结果为第二数值时，表示候选类别识别结果属于第二类别。

属于第一类别的候选类别识别结果的第一数量，也即是指候选类别识别结果中第一数值的数量，属于第二类别的候选类别识别结果的第二数量，也即是指候选类别识别结果中第二数值的数量。

比如，至少一个已训练识别模型包括三个，第一类别为通讯类，第一数值为1，第二数值为0，候选类别识别结果为1、0和1，则第一数量为2，第二数量为1，此时，将客户端的类别识别结果确定为通讯类。

或者，当至少一个已训练识别模型包括多个时，根据候选类别识别结果，确定客户端的类别识别结果的过程也可以为：

确定候选类别识别结果中属于不同类别的候选类别识别结果的数量；

将数量最高对应的类别确定为客户端的类别识别结果。

比如，不同类别包括第一类别、第二类别以及第三类别，属于第一类别的候选类别识别结果的数量为1，属于第二类别的候选类别识别结果的数量为3，属于第三类别的候选类别识别结果的数量为2，则将第二类别确定为客户端的类别识别结果。

又或者，候选类别识别结果包括第一类别和第二类别，当至少一个已训练识别模型包括多个时，将文本模态特征输入到至少一个已训练识别模型中进行识别，得到至少一个已训练识别模型针对客户端的候选类别识别结果，根据候选类别识别结果，确定客户端的类别识别结果的过程也可以为：

将文本模态特征输入到至少一个已训练识别模型中进行识别，得到至少一个已训练识别模型针对客户端属于第一类别的概率和属于第二类别的概率；

根据通过每种已训练模型得到的属于第一类别的概率，确定客户端属于第一类别的第一目标概率；

根据通过每种已训练模型得到的属于第二类别的概率，确定客户端属于第二类别的第二目标概率；

若第一目标概率大于第二目标概率，则将第一类别确定为客户端的类别识别结果；

若第一目标概率小于第二目标概率，则将第二类别确定为客户端的类别识别结果。

第一目标概率可以为通过每种已训练模型得到的属于第一类别的概率的平均概率或总概率，第二目标概率可以为通过每种已训练模型得到的属于第二类别的概率的平均概率或总概率。

比如，第一目标概率和第二目标概率均为平均概率，至少一个已训练识别模型包括已训练识别模型1、已训练识别模型2和已训练识别模型3，已训练识别模型1针对客户端属于第一类别的概率为0.4，针对客户端属于第二类别的概率为0.6，已训练识别模型2针对客户端属于第一类别的概率为0.3，针对客户端属于第二类别的概率为0.7，已训练识别模型3针对客户端属于第一类别的概率为0.2，针对客户端属于第二类别的概率为0.8，则第一目标概率为0.3，第二目标概率为0.7，第二目标概率大于第一目标概率，则将第二类别确定为客户端的类别识别结果。

又或者，当至少一个已训练识别模型包括多个时，根据候选类别识别结果，确定客户端的类别识别结果的过程也可以为：

获取每个已训练识别模型对应的权重；

将已训练识别模型对应的候选类别识别结果和已训练识别模型对应的权重进行相乘后相加，得到客户端的类别识别结果。

比如，至少一个已训练识别模型包括已训练识别模型1、已训练识别模型2和已训练识别模型3，已训练识别模型1对应的权重为a1，已训练识别模型2对应的权重为a2以及已训练识别模型3对应的权重为a3，a1+a2+a3＝1，已训练识别模型1对应的候选类别识别结果为0.6，已训练识别模型2对应的候选类别识别结果为0.2，已训练识别模型3对应的候选类别识别结果为0.7，则客户端的类别识别结果为(0.6a1+0.2a2+0.7a3)。

在一些实施例中，终端将文本模态特征输入到至少一个已训练识别模型中进行识别，可以得到至少一个已训练识别模型针对客户端属于第一类别的概率和属于第二类别的概率。

比如，至少一个已训练识别模型包括已训练识别模型1、已训练识别模型2和已训练识别模型3，已训练识别模型1针对客户端属于第一类别的概率为0.4，针对客户端属于第二类别的概率为0.6，已训练识别模型2针对客户端属于第一类别的概率为0.3，针对客户端属于第二类别的概率为0.7，已训练识别模型3针对客户端属于第一类别的概率为0.2，针对客户端属于第二类别的概率为0.8。

此时，终端可以确定每个已训练识别模型针对客户端属于第一类别的概率之间的第一差异，和/或确定每个已训练识别模型针对客户端属于第二类别的概率之间的第二差异。

如果第一差异和/或第二差异满足预设差异阈值，则根据每个已训练识别模型针对客户端属于第一类别的概率和第二类别的概率，确定每个已训练识别模型针对客户端的候选类别识别结果，然后确定候选类别识别结果中属于第一类别的候选类别识别结果的第一数量以及属于第二类别的候选类别识别结果的第二数量；若第一数量大于第二数量，则将第一类别确定为客户端的类别识别结果；若所述第一数量小于第二数量，则将第二类别确定为客户端的类别识别结果。

如果第一差异和/或第二差异不满足预设差异阈值，则根据通过每种已训练模型得到的属于第一类别的概率，确定客户端属于第一类别的第一目标概率；根据通过每种已训练模型得到的属于第二类别的概率，确定客户端属于第二类别的第二目标概率；若第一目标概率大于第二目标概率，则将第一类别确定为客户端的类别识别结果；若第一目标概率小于第二目标概率，则将第二类别确定为客户端的类别识别结果。

比如，至少一个已训练识别模型包括已训练识别模型1、已训练识别模型2和已训练识别模型3，已训练识别模型1针对客户端属于第一类别的概率为0.4，针对客户端属于第二类别的概率为0.6，已训练识别模型2针对客户端属于第一类别的概率为0.3，针对客户端属于第二类别的概率为0.7，已训练识别模型3针对客户端属于第一类别的概率为0.2，针对客户端属于第二类别的概率为0.8。0.4、0.3以及0.2之间的第一差异满足预设差异阈值且0.6、0.7以及0.8之间的第二差异满足预设差异阈值，由于0.4小于0.6，因此，已训练识别模型1对客户端的候选类别识别结果为客户端属于第二类别，由于0.3小于0.7，因此，已训练识别模型2对客户端的候选类别识别结果为客户端属于第二类别，由于0.2小于0.8，因此，已训练识别模型3对客户端的候选类别识别结果为客户端属于第二类别，此时，第一数量为0，第二数量为3，因此，客户端的类别识别结果为第二类别。

又比如，至少一个已训练识别模型包括已训练识别模型1、已训练识别模型2和已训练识别模型3，已训练识别模型1针对客户端属于第一类别的概率为0.8，针对客户端属于第二类别的概率为0.2，已训练识别模型2针对客户端属于第一类别的概率为0.3，针对客户端属于第二类别的概率为0.7，已训练识别模型3针对客户端属于第一类别的概率为0.2，针对客户端属于第二类别的概率为0.8。0.8、0.3以及0.2之间的第一差异不满足预设差异阈值且0.2、0.7以及0.8之间的第二差异不满足预设差异阈值，则确定客户端属于第一类别的第一目标概率为0.43，确定客户端属于第二类别的第二目标概率为0.56，第一目标概率小于第二目标概率，则将第二类别确定为客户端的类别识别结果。

在一些实施例中，在将文本模态特征输入到至少一个已训练识别模型中进行识别，得到至少一个已训练识别模型针对所述客户端的候选类别识别结果之前，还包括：

获取训练样本集，训练样本集包括第一样本属性文本信息和第二样本属性文本信息；

对第一样本属性文本信息进行特征提取，得到第一样本属性文本信息对应的第一样本文本模态特征，以及对第二样本属性文本信息进行特征提取，得到第二样本属性文本信息对应的第二样本文本模态特征；

对第一样本文本模态特征和第二样本文本模态特征进行融合处理，得到客户端对应的样本文本模态特征；

根据样本文本模态特征对至少一个识别模型进行训练，得到至少一个已训练识别模型。

其中，根据样本文本模态特征对至少一个识别模型进行训练，得到至少一个已训练识别模型的过程可以为：

将样本文本模态特征输入到至少一个识别模型中进行识别，得到损失函数值；

根据损失函数值判断至少一个识别模型是否收敛；

如果至少一个识别模型收敛，则将至少一个识别模型确定为至少一个已训练识别模型；

如果至少一个识别模型不收敛，则根据损失函数值更新至少一个识别模型的模型参数，并返回执行对第一样本属性文本信息进行特征提取，得到第一样本属性文本信息对应的第一样本文本模态特征的步骤。

或者，根据样本文本模态特征对至少一个识别模型进行训练，得到至少一个已训练识别模型的过程也可以为：

获取至少一个识别模型中的不同超参数组合；

将样本文本模态特征输入到至少一个识别模型中进行识别，得到针对不同超参数组合的样本类别识别结果；

根据超参数组合的样本类别识别结果，确定超参数组合对应的准确率；

将满足预设准确条件的准确率对应的超参数组合作为至少一个识别模型的超参数，得到至少一个已训练识别模型。

在本申请实施例中，先将识别模型中的不同超参数进行组合，然后按照超参数组合，设置识别模型的超参数，并将样本文本模态特征输入到至少一个识别模型中进行识别，以便得到针对不同超参数组合的样本类别识别结果。

比如识别模型为随机森林模型，随机森林模型的超参数包括树的个数和树的深度，树的个数的取值可能为b1和b2，树的深度取值可能为c1和c2，则超参数组合可以为(b1，c1)、(b1，c2)、(b2，c1)以及(b2，c2)。将识别模型中的超参数设置为(b1，c1)，此时，将样本文本模态特征输入到至少一个识别模型中进行识别，得到针对(b1，c1)的样本类别识别结果，根据针对(b1，c1)的样本类别识别结果，确定(b1，c1)对应的准确率，接着，将识别模型中的超参数设置为(b1，c2)，此时，将样本文本模态特征输入到至少一个识别模型中进行识别，得到针对(b1，c2)的样本类别识别结果，根据针对(b1，c2)的样本类别识别结果，确定(b1，c2)对应的准确率，确定(b2，c1)对应的准确率以及(b2，c2)对应的准确率可以参照上述，在此不再赘述。

可选地，针对一个超参数组合，可以将第一预设数量的样本文本模态特征输入到至少一个识别模型中进行识别，得到样本类别识别结果，并根据样本类别识别结果确定损失函数值；根据损失函数值判断至少一个识别模型是否收敛；如果至少一个识别模型收敛，则将至少一个识别模型确定为至少一个已训练识别模型；如果至少一个识别模型不收敛，则根据损失函数值更新至少一个识别模型的模型参数，并返回执行对第一样本属性文本信息进行特征提取，得到第一样本属性文本信息对应的第一样本文本模态特征的步骤。

或者，针对一个超参数组合，可以将第一预设数量的样本文本模态特征输入到至少一个识别模型中进行识别，得到样本类别识别结果，根据超参数组合的样本类别识别结果，确定超参数组合对应的候选准确率，判断准确率的个数或识别的次数是否满足预设条件，如果准确率的个数或识别的次数不满足预设条件，则根据样本类别识别结果确定损失函数值，根据损失函数值更新至少一个识别模型的模型参数，返回执行对第一样本属性文本信息进行特征提取，得到第一样本属性文本信息对应的第一样本文本模态特征的步骤，如果准确率的个数或识别的次数满足预设条件，则根据超参数组合对应的候选准确率，确定超参数组合对应的准确率。

比如，将k1份的样本文本模态特征输入到至少一个识别模型中进行识别，得到样本类别识别结果，根据超参数组合的样本类别识别结果，确定k1份对应的候选准确率，如果候选准确率的个数小于k2，则根据样本类别识别结果确定损失函数值，根据损失函数值更新至少一个识别模型的模型参数，返回执行对第一样本属性文本信息进行特征提取，得到第一样本属性文本信息对应的第一样本文本模态特征的步骤，如果候选准确率的个数等于k2，则将k2个候选准确率的平均值作为超参数组合对应的准确率。

可选地，预设准确条件可以根据实际情况进行设置，比如，可以将最高的准确率确定为满足预设准确条件的准确率。或者，也可以将大于预设准确度的准确率确定为满足预设准确条件的准确率，然后将大于预设准确度的准确率中任意一个准确率对应的超参数组合作为至少一个识别模型的超参数，得到至少一个已训练识别模型。

可选地，当至少一个识别模型包括多个识别模型时，不同超参数组合可以是不同识别模型中的超参数组合。比如，至少一个识别模型包括随机森林模型和支持向量机，随机森林模型的超参数包括树的数量和树的深度，支持向量机的超参数可以包括惩罚系数和核函数的类型，则超参数组合可以为(树的数量，树的深度，惩罚系数，核函数的类型)，此时，根据候选类别识别结果，确定客户端的类别识别结果的过程也可以为：

获取每个已训练识别模型对应的权重；

在一些实施例中，根据文本模态特征对客户端的类别进行识别，得到客户端的类别识别结果，包括：

获取客户端的图标；

对图标进行特征提取，得到客户端对应的视觉模态特征；

对文本模态特征和视觉模态特征进行融合处理，得到融合后特征；

根据融合后特征对客户端的类别进行识别，得到客户端的类别识别结果。

在本申请实施例中，获取客户端的图标；对图标进行特征提取，得到客户端对应的视觉模态特征；对文本模态特征和视觉模态特征进行融合处理，得到融合后特征；根据融合后特征对客户端的类别进行识别，得到客户端的类别识别结果，实现通过多模态特征对客户端的类别进行识别，进一步提高客户端的类别识别结果的准确度。

其中，根据融合后特征对客户端的类别进行识别，得到客户端的类别识别结果的过程，具体可以参照根据文本模态特征对客户端的类别进行识别，得到客户端的类别识别结果的过程，比如，可以通过至少一个已训练识别模型，根据融合后特征对客户端的类别进行识别，得到客户端的类别识别结果，本申请实施例在此不再赘述。

由以上可知，在本申请实施例中，从客户端的本地文件中提取客户端的第一属性文本信息，以及从客户端的下载平台中获取客户端的第二属性文本信息；对第一属性文本信息进行特征提取，得到第一属性文本信息对应的第一文本模态特征，以及对第二属性文本信息进行特征提取，得到第二属性文本信息对应的第二文本模态特征；对第一文本模态特征和第二文本模态特征进行融合处理，得到客户端对应的文本模态特征；根据文本模态特征对客户端的类别进行识别，得到客户端的类别识别结果，实现根据第一属性文本信息和第二属性文本信息对客户端的类别进行识别，提高客户端的类别识别结果的准确度。

为便于更好的实施本申请实施例提供的类别识别方法，本申请实施例还提供一种基于上述类别识别方法的装置。其中名词的含义与上述类别识别方法中相同，具体实现细节可以参考方法实施例中的说明。

例如，如图2所示，该类别识别装置可以包括：

获取模块201，用于从客户端的本地文件中提取客户端的第一属性文本信息，以及从客户端的下载平台中获取客户端的第二属性文本信息。

提取模块202，用于对第一属性文本信息进行特征提取，得到第一属性文本信息对应的第一文本模态特征，以及对第二属性文本信息进行特征提取，得到第二属性文本信息对应的第二文本模态特征。

融合模块203，用于对第一文本模态特征和第二文本模态特征进行融合处理，得到客户端对应的文本模态特征。

识别模块204，用于根据文本模态特征对客户端的类别进行识别，得到客户端的类别识别结果。

可选地，提取模块202具体用于执行：

可选地，识别模块204具体用于执行：

根据候选类别识别结果，确定客户端的类别识别结果。

可选地，识别模块204具体用于执行：

若第一数量小于第二数量，则将第二类别确定为客户端的类别识别结果。

可选地，候选类别识别结果包括第一类别和第二类别，识别模块204具体用于执行：

可选地，该类别识别装置还包括：

训练模块，用于执行：

可选地，训练模块具体用于执行：

获取至少一个识别模型中的不同超参数组合；

可选地，识别模块204具体用于执行：

获取客户端的图标；

对图标进行特征提取，得到客户端对应的视觉模态特征；

可选地，获取模块201具体用于执行：

从客户端的本地文件中提取客户端的本地热点函数；

从下载平台中获取其他设备中客户端的热点函数；

具体实施时，以上各个模块可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个模块的具体实施方式以及对应的有益效果可参见前面的方法实施例，在此不再赘述。

本申请实施例还提供一种电子设备，该电子设备可以是服务器或终端等，如图3所示，其示出了本申请实施例所涉及的电子设备的结构示意图，具体来讲：

该电子设备可以包括一个或者一个以上处理核心的处理器301、一个或一个以上计算机可读存储介质的存储器302、电源303和输入单元304等部件。本领域技术人员可以理解，图3中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器301是该电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器302内的计算机程序和/或模块，以及调用存储在存储器302内的数据，执行电子设备的各种功能和处理数据。可选的，处理器301可包括一个或多个处理核心；优选的，处理器301可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器301中。

存储器302可用于存储计算机程序以及模块，处理器301通过运行存储在存储器302的计算机程序以及模块，从而执行各种功能应用以及数据处理。存储器302可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器302可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器302还可以包括存储器控制器，以提供处理器301对存储器302的访问。

电子设备还包括给各个部件供电的电源303，优选的，电源303可以通过电源管理系统与处理器301逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源303还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该电子设备还可包括输入单元304，该输入单元304可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，电子设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，电子设备中的处理器301会按照如下的指令，将一个或一个以上的计算机程序的进程对应的可执行文件加载到存储器302中，并由处理器301来运行存储在存储器302中的计算机程序，从而实现各种功能，比如：

从客户端的本地文件中提取客户端的第一属性文本信息，以及从客户端的下载平台中获取客户端的第二属性文本信息；

对第一属性文本信息进行特征提取，得到第一属性文本信息对应的第一文本模态特征，以及对第二属性文本信息进行特征提取，得到第二属性文本信息对应的第二文本模态特征；

对第一文本模态特征和第二文本模态特征进行融合处理，得到客户端对应的文本模态特征；

根据文本模态特征对客户端的类别进行识别，得到客户端的类别识别结果。

以上各个操作的具体实施方式以及对应的有益效果可参见上文对类别识别方法的详细描述，在此不作赘述。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过计算机程序来完成，或通过计算机程序控制相关的硬件来完成，该计算机程序可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种计算机可读存储介质，其中存储有计算机程序，该计算机程序能够被处理器进行加载，以执行本申请实施例所提供的任一种类别识别方法中的步骤。例如，该计算机程序可以执行如下步骤：

以上各个操作的具体实施方式以及对应的有益效果可参见前面的实施例，在此不再赘述。

其中，该计算机可读存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该计算机可读存储介质中所存储的计算机程序，可以执行本申请实施例所提供的任一种类别识别方法中的步骤，因此，可以实现本申请实施例所提供的任一种类别识别方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

其中，根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述类别识别方法。

以上对本申请实施例所提供的一种类别识别方法、装置、电子设备及计算机存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种类别识别方法，其特征在于，包括：

从客户端的本地文件中提取所述客户端的第一属性文本信息，以及从所述客户端的下载平台中获取所述客户端的第二属性文本信息；

对所述第一属性文本信息进行特征提取，得到所述第一属性文本信息对应的第一文本模态特征，以及对所述第二属性文本信息进行特征提取，得到所述第二属性文本信息对应的第二文本模态特征；

对所述第一文本模态特征和所述第二文本模态特征进行融合处理，得到所述客户端对应的文本模态特征；

根据所述文本模态特征对所述客户端的类别进行识别，得到所述客户端的类别识别结果。

2.根据权利要求1所述的类别识别方法，其特征在于，所述对所述第一属性文本信息进行特征提取，得到所述第一属性文本信息对应的第一文本模态特征，以及对所述第二属性文本信息进行特征提取，得到所述第二属性文本信息对应的第二文本模态特征，包括：

对所述第一属性文本信息进行分词处理，得到所述第一属性文本信息对应的第一目标词语；

对所述第一目标词语进行转换处理，得到所述第一属性文本信息对应的第一文本模态特征；

对所述第二属性文本信息进行分词处理，得到所述第二属性文本信息对应的第二目标词语；

对所述第二目标词语进行转换处理，得到所述第二属性文本信息对应的第二文本模态特征。

3.根据权利要求1所述的类别识别方法，其特征在于，所述根据所述文本模态特征对所述客户端的类别进行识别，得到所述客户端的类别识别结果，包括：

将所述文本模态特征输入到至少一个已训练识别模型中进行识别，得到所述至少一个已训练识别模型针对所述客户端的候选类别识别结果；

根据所述候选类别识别结果，确定所述客户端的类别识别结果。

4.根据权利要求3所述的类别识别方法，其特征在于，所述根据所述候选类别识别结果，确定所述客户端的类别识别结果，包括：

确定所述候选类别识别结果中属于第一类别的候选类别识别结果的第一数量以及属于第二类别的候选类别识别结果的第二数量；

若所述第一数量大于所述第二数量，则将所述第一类别确定为客户端的类别识别结果；

若所述第一数量小于所述第二数量，则将所述第二类别确定为客户端的类别识别结果。

5.根据权利要求3所述的类别识别方法，其特征在于，所述候选类别识别结果包括第一类别和第二类别，所述将所述文本模态特征输入到至少一个已训练识别模型中进行识别，得到所述至少一个已训练识别模型针对所述客户端的候选类别识别结果，根据所述候选类别识别结果，确定所述客户端的类别识别结果，包括：

将所述文本模态特征输入到至少一个已训练识别模型中进行识别，得到所述至少一个已训练识别模型针对所述客户端属于所述第一类别的概率和属于所述第二类别的概率；

根据通过每种已训练模型得到的属于所述第一类别的概率，确定所述客户端属于所述第一类别的第一目标概率；

根据通过每种所述已训练模型得到的属于所述第二类别的概率，确定所述客户端属于所述第二类别的第二目标概率；

若所述第一目标概率大于所述第二目标概率，则将所述第一类别确定为所述客户端的类别识别结果；

若所述第一目标概率小于所述第二目标概率，则将所述第二类别确定为所述客户端的类别识别结果。

6.根据权利要求3所述的类别识别方法，其特征在于，在所述将所述文本模态特征输入到至少一个已训练识别模型中进行识别，得到所述至少一个已训练识别模型针对所述客户端的候选类别识别结果之前，还包括：

获取训练样本集，所述训练样本集包括第一样本属性文本信息和第二样本属性文本信息；

对所述第一样本属性文本信息进行特征提取，得到所述第一样本属性文本信息对应的第一样本文本模态特征，以及对所述第二样本属性文本信息进行特征提取，得到所述第二样本属性文本信息对应的第二样本文本模态特征；

对所述第一样本文本模态特征和所述第二样本文本模态特征进行融合处理，得到所述客户端对应的样本文本模态特征；

根据所述样本文本模态特征对至少一个识别模型进行训练，得到所述至少一个已训练识别模型。

7.根据权利要求6所述的类别识别方法，其特征在于，所述根据所述样本文本模态特征对至少一个识别模型进行训练，得到所述至少一个已训练识别模型，包括：

获取至少一个识别模型中的不同超参数组合；

将所述样本文本模态特征输入到至少一个识别模型中进行识别，得到针对不同所述超参数组合的样本类别识别结果；

根据所述超参数组合的样本类别识别结果，确定所述超参数组合对应的准确率；

将满足预设准确条件的准确率对应的超参数组合作为所述至少一个识别模型的超参数，得到所述至少一个已训练识别模型。

8.根据权利要求1所述的类别识别方法，其特征在于，所述根据所述文本模态特征对所述客户端的类别进行识别，得到所述客户端的类别识别结果，包括：

获取所述客户端的图标；

对所述图标进行特征提取，得到所述客户端对应的视觉模态特征；

对所述文本模态特征和所述视觉模态特征进行融合处理，得到融合后特征；

根据所述融合后特征对所述客户端的类别进行识别，得到所述客户端的类别识别结果。

9.根据权利要求1-8任一项所述的类别识别方法，其特征在于，所述从客户端的本地文件中提取所述客户端的第一属性文本信息，包括：

从客户端的本地文件中提取所述客户端的本地热点函数；

从所述下载平台中获取其他设备中客户端的热点函数；

根据所述本地热点函数和所述其他设备中客户端的热点函数，确定所述客户端的第一属性文本信息。

10.一种类别识别装置，其特征在于，包括：

获取模块，用于从客户端的本地文件中提取所述客户端的第一属性文本信息，以及从所述客户端的下载平台中获取所述客户端的第二属性文本信息；

提取模块，用于对所述第一属性文本信息进行特征提取，得到所述第一属性文本信息对应的第一文本模态特征，以及对所述第二属性文本信息进行特征提取，得到所述第二属性文本信息对应的第二文本模态特征；

融合模块，用于对所述第一文本模态特征和所述第二文本模态特征进行融合处理，得到所述客户端对应的文本模态特征；

识别模块，用于根据所述文本模态特征对所述客户端的类别进行识别，得到所述客户端的类别识别结果。

11.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有计算机程序，所述处理器用于运行所述存储器内的计算机程序，以执行权利要求1至9任一项所述的类别识别方法。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序适于处理器进行加载，以执行权利要求1至9任一项所述的类别识别方法。