CN113553434A - 一种应用的分类方法、装置及设备 - Google Patents
一种应用的分类方法、装置及设备 Download PDFInfo
- Publication number
- CN113553434A CN113553434A CN202111094272.9A CN202111094272A CN113553434A CN 113553434 A CN113553434 A CN 113553434A CN 202111094272 A CN202111094272 A CN 202111094272A CN 113553434 A CN113553434 A CN 113553434A
- Authority
- CN
- China
- Prior art keywords
- information
- application program
- attribute
- application
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供了一种应用的分类方法、装置及设备,包括:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息;对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息;将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
Description
技术领域
本文件涉及计算机技术领域,尤其涉及一种应用的分类方法、装置及设备。
背景技术
随着移动互联网的发展,以及智能手机应用带来的商机,各服务商均会开发各自的应用程序供用户使用,相应的,用户根据各自的实际需求可以通过各类应用市场获取到所需的应用程序。
目前,为了方便用户下载,应用市场需要对入驻该应用市场的商家所提供的应用程序相关资料(如应用程序的类别)进行分类。然而,由于商家提供的应用程序的类别与该应用市场内部使用的类别体系的定义、理解可能存在差别,这样,某一个类别体系中的类别在另一个类别体系中并不一定能够找到唯一与其相对应的类别,也可能对应多个不同的类别,从而可能导致应用市场在对商家所提供应用程序进行分类时存在误差。为此,需要提供一种有效提高应用程序分类准确率的技术方案。
发明内容
本说明书实施例的目的是提供一种应用的分类方法、装置及设备,以提供一种能够有效提高应用程序分类准确率的技术方案。
为了解决上述技术问题,本说明书实施例是这样实现的:
第一方面,本说明书实施例提供了一种应用的分类方法,包括:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息。基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息。将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
第二方面,本说明书实施例提供了一种应用的分类方法,应用于区块链系统,包括:接收第一设备发送的应用程序的分类规则信息,基于应用程序的分类规则信息生成第一智能合约,并将第一智能合约部署于区块链系统中。在获取到第一设备发送的目标应用程序的分类请求时,基于第一智能合约执行以下处理:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息。基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息。将分类特征信息输入至基于第一智能合约获取的预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
第三方面,本说明书实施例提供了一种应用的分类装置,包括:第一获取模块,获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息。第一确定模块,基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。第一合并模块,对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息。第一处理模块,将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
第四方面,本说明书实施例提供了一种应用的分类装置,上述装置为区块链系统中的装置,包括:第一接收模块,接收第一设备发送的应用程序的分类规则信息,基于应用程序的分类规则信息生成第一智能合约,并将第一智能合约部署于区块链系统中。第二处理模块,在获取到第一设备发送的目标应用程序的分类请求时,基于第一智能合约执行以下处理:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息。基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息。将分类特征信息输入至基于第一智能合约获取的预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
第五方面,本说明书实施例提供了一种应用的分类设备,包括:处理器。以及被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息。基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息。将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
第六方面,本说明书实施例提供了一种应用的分类设备,设备为区块链系统中的设备,包括:处理器。以及被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器:接收第一设备发送的应用程序的分类规则信息,基于应用程序的分类规则信息生成第一智能合约,并将第一智能合约部署于区块链系统中。在获取到第一设备发送的目标应用程序的分类请求时,基于第一智能合约执行以下处理:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息。基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息。将分类特征信息输入至基于第一智能合约获取的预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
第七方面,本说明书实施例提供了一种存储介质,存储介质用于存储计算机可执行指令,可执行指令在被执行时实现以下流程:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息。基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息。将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
第八方面,本说明书实施例提供了一种存储介质,存储介质用于存储计算机可执行指令,可执行指令在被执行时实现以下流程:接收第一设备发送的应用程序的分类规则信息,基于应用程序的分类规则信息生成第一智能合约,并将第一智能合约部署于区块链系统中。在获取到第一设备发送的目标应用程序的分类请求时,基于第一智能合约执行以下处理:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息。基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息。将分类特征信息输入至基于第一智能合约获取的预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图;
图1A为本说明书实施例提供的应用的分类方法的第一种流程示意图;
图1B为本说明书实施例提供的应用的分类过程的第一种示意图;
图2为本说明书实施例提供的应用的分类过程的第二种示意图;
图3为本说明书实施例提供的应用的分类过程的第三种示意图;
图4A为本说明书实施例提供的应用的分类方法的第二种流程示意图;
图4B为本说明书实施例提供的应用的分类过程的第四种示意图;
图5为本说明书实施例提供的应用的分类装置的第一种模块组成示意图;
图6为本说明书实施例提供的应用的分类装置的第二种模块组成示意图;
图7为本说明书实施例提供的应用的分类设备的结构示意图。
具体实施方式
本说明书实施例提供了一种应用的分类方法、装置及设备。
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
如图1A和1B所示,本说明书实施例提供了一种应用的分类方法,该方法的执行主体可以为服务器,其中,该服务器可以是独立的一个服务器,也可以是由多个服务器组成的服务器集群,而且,该服务器可以采用预先训练的预设分类模型对待分类的目标应用程序进行分类,得到目标应用程序对应的应用类别。该方法具体可以包括下述步骤:
在步骤S102中,获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息。
作为示例,上述属性信息可以是目标应用程序开发商提供的关于该目标应用程序的描述信息、目标应用程序的标识信息(如名称等)、目标应用程序的类别信息等。上述应用类别的信息可以包括:例如,“商业生活服务”、“出行物流运输”、“医疗卫生”等。上述目标应用程序的类别信息包含于上述应用类别的信息中。
需要说明的是,上述应用类别的信息可以包括通过第一种分类方式确定的第一应用类别,和/或,通过第二种分类方式确定的第二应用类别。上述第一种分类方式可以对应于第一种分类体系,上述第二种分类方式可以对应于第二种分类体系,上述第一种分类体系和上述第二种分类体系可以对应于不同的应用市场或应用平台。本说明书实施例对上述分类方式不作具体限定。上述为了说明方便,仅是提到了两种分类体系,而在实际应用中,并不仅仅包含两种分类体系,可以包含两种以上的不同分类体系,不同分类体系的分类方式也可以不同,相应的得到的应用类别也可以不同。
在一些可选的实现方式中,上述执行主体当需要对待分类的目标应用程序进行分类的情况下,可以通过预设接口从第一设备获取上述待分类的目标应用程序的属性信息,并获取对应用进行分类的多个应用类别的信息。
在步骤S104中,基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。
作为示例,上述属性表征信息可以是对该目标应用程序的标识、描述信息中的一个或多个进行合并后,用于表征该合并后的数据的信息(可以通过如向量或矩阵等进行表征)。或者,上述属性表征信息还可以是基于该目标应用程序的类别信息确定的,用于表征该目标应用程序的类型的信息。
在一种可选的实现方式中,以上述属性信息为至少包括该目标应用程序的标识、描述信息中的一个或多个,上述多个应用类别的信息为通过第一种分类方式确定的第一应用类别为例,可以通过将上述描述信息以及标识合并成文本信息,基于上述文本信息来确定该目标应用程序对应的属性表征信息。以及,基于第一应用类别的信息确定该第一应用类别对应的类别表征信息。然后,基于上述类别表征信息、以及上述属性表征信息,通过注意力算法(如Attention算法),确定该目标应用程序对应的关系表征信息。
在步骤S106中,对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息。
在一些可选的实现方式中,上述执行主体通过上述步骤S104的处理得到属性表征信息和关系表征信息后,可以对上述属性表征信息和关系表征信息进行concat操作,从而得到该目标应用程序对应得分类特征信息。
在步骤S108中,将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
在一些可选的实现方式中,假设预设分类模型中包含有目标应用市场或目标应用平台所对应的多个预设应用类别,则上述执行主体在将上述分类特征信息输入至上述预设分类模型后,可以得到该分类特征信息与上述多个预设应用类别的多个匹配概率,这样,可以将与上述匹配概率值最大的所对应的预设应用类别确定为该待分类的预设应用程序所对应的应用类别。
具体的,例如,某预设应用市场所分类的预设应用类别为10个类别,分别为预设应用类别1、预设应用类别2、预设应用类别3、预设应用类别4、预设应用类别5、预设应用类别6、预设应用类别7、预设应用类别8、预设应用类别9、预设应用类别10。这样,在将上述待分类的预设应用程序的分类特征信息输入至该预设分类模型中,可以得到待分类特征信息与上述10个预设应用类别的概率值,例如,某待分类的预设应用程序与上述预设应用类别1所对应的匹配概率为98%,与上述预设应用类别2所对应的匹配概率为90%,与上述预设应用类别3所对应的匹配概率为88%,与上述预设应用类别4所对应的匹配概率为78%,与上述预设应用类别5所对应的匹配概率为69%,与上述预设应用类别6所对应的匹配概率为55%,与上述预设应用类别7所对应的匹配概率为50%,与上述预设应用类别8所对应的匹配概率为40%,与上述预设应用类别9所对应的匹配概率为35%,与上述预设应用类别10所对应的匹配概率为18%,由于上述待分类的目标应用程序与上述预设应用类别1所对应的匹配概率最大,则可以将预设应用类别1确定为该待分类的目标应用程序所对应的应用类别。
由以上本说明书实施例提供的技术方案可见,本说明书实施例通过获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息,基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息,然后,对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息,之后,将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。这样,通过采用预先训练的预设分类模型对待分类的目标应用程序进行分类的方法,有效提高了对待分类的目标应用程序进行分类的准确率。
进一步的,上述应用类别可以获取于第一应用类别群组,和/或,第二应用类别群组,上述第一应用类别群组中包括通过第一种分类方式对应用程序进行分类的应用类别,上述第二应用类别群组中可以包括通过第二种分类方式对应用程序进行分类的应用类别,例如,第一应用类别群组可以是基于第一应用市场分类体系得到的应用类别的组合,第二应用类别群组可以是基于第二应用市场分类体系得到的应用类别的组合。上述属性信息可以包括:目标应用程序对应的目标应用类别,和/或,至少包括与上述目标应用程序对应的标识、描述信息中的一个或多个,上述目标应用类别属于所述第一应用类别群组。
在一种可选的实现方式中,以上述属性信息为至少包括该目标应用程序的标识、描述信息中的一个或多个,上述多个应用类别的信息为通过第一种分类方式确定的第一应用类别为例,上述步骤S104-步骤S106的处理过程可以包括:上述执行主体可以通过将上述描述信息、标识中的一个或多个合并成文本信息,基于上述文本信息来确定该目标应用程序对应的属性表征信息,其中,上述属性表征信息可以包括第一表征信息,该第一表征信息可以是用于指示对上述目标应用程序的描述信息进行合并后,用于表征该合并后的数据信息;或者,该第一表征信息可以是用于指示对上述目标应用程序的标识进行合并后,用于表征该合并后的数据信息;或者,该第一表征信息还可以是用以指示上述目标应用程序的描述信息以及标识进行和合并后,用于表征该合并后的数据信息。该第一表征信息可以为B*E1矩阵,其中,B可以为待分类的目标应用程序的数量,E1可以为与上述文本信息对应的第一向量维度。以及,基于第一应用类别的信息确定该第一应用类别对应的第二表征信息,该第二表征信息可以为L1*E2矩阵,其中,L1可以为与该第一应用类别的信息对应的主题词的个数,上述主题词可以是对上述应用类别的信息进行分词后得到的,E2可以为与上述第一应用类别对应的第二向量维度。然后,基于上述第二表征信息、以及上述第一表征信息,通过注意力算法(如Attention算法),确定该目标应用程序对应的关系表征信息B*E2矩阵,其中,E2可以为与上述第一应用类别对应的第二向量维度。上述执行主体通过上述步骤S104的处理得到属性表征信息和关系表征信息后,可以对上述属性表征信息和关系表征信息进行concat操作,从而得到该目标应用程序对应得分类特征信息B*E3矩阵,其中,上述E3可以为E1与E2的向量维度之和。
在一种可选的实现方式中,以上述属性信息为至少包括该目标应用程序的标识、描述信息中的一个或多个,上述应用类别获取于第二应用群组为例,上述步骤S104-步骤S106的处理过程可以包括:上述执行主体可以通过将上述描述信息以及标识信息合并成文本信息,基于上述文本信息来确定该目标应用程序对应的属性表征信息,其中,上述属性表征信息可以包括第一表征信息,该第一表征信息可以为B*E1矩阵。以及,基于第二应用类别的信息确定该第二应用类别对应的第三表征信息,该第三表征信息可以为L2*E3矩阵,其中,L2可以为与该第二应用类别的信息对应的主题词的个数,E3可以为与上述第二应用类别对应的第三向量维度,上述主题词可以是对上述应用类别的信息进行分词后得到的。然后,基于上述第三表征信息、以及上述第一表征信息,通过注意力算法(如Attention算法),确定该目标应用程序对应的关系表征信息B*E3矩阵。上述执行主体通过上述步骤S104的处理得到属性表征信息和关系表征信息后,可以对上述属性表征信息和关系表征信息进行concat操作,从而得到该目标应用程序对应得分类特征信息B*E4,其中,上述E4为E1与E3的向量维度之和。
在一种可选的实现方式中,以上述属性信息为至少包括该目标应用程序的标识、描述信息中的一个或多个,上述应用类别获取于第一应用类别群组和第二应用群组为例,上述执行主体通过上述步骤S104的处理得到属性表征信息和关系表征信息后,可以对上述属性表征信息和关系表征信息进行concat操作,从而得到该目标应用程序对应得分类特征信息B*E5矩阵,其中,上述E5为E1、E2、E3的向量维度之和,上述E2、E3的向量维度可以相等。
在一些可选的实现方式中,以上述属性信息为目标应用程序对应的目标应用类别,上述应用类别的信息为通过第一种分类方式确定的第一应用类别为例,上述步骤S104-步骤S106的处理过程可以包括:上述执行主体可以通过对获取到的目标应用类别对应的表征信息进行平均词向量处理,得到目标应用程序对应的属性表征信息,其中,该属性表征信息可以包括第四表征信息,该第四表征信息可以为B*E6矩阵,E6为与上述目标应用类别对应的第六向量维度。以及,基于第一应用类别的信息确定该第一应用类别对应的第二表征信息,该第二表征信息可以为L1*E2矩阵。然后,基于上述第一类别对应的第二表征信息、以及上述第四表征信息,通过注意力算法(如Attention算法),确定该目标应用程序对应的关系表征信息B*E7矩阵。之后,上述执行主体通过上述步骤S104的处理得到属性表征信息和关系表征信息后,可以对上述属性表征信息和关系表征信息进行concat操作,从而得到该目标应用程序对应得分类特征信息B*E8矩阵,其中,上述E8为E6与E7的向量维度之和,上述E2、E6、E7的向量维度可以相等。
在一些可选的实现方式中,以上述属性信息为目标应用程序对应的目标应用类别,上述应用类别的信息为通过第二种分类方式确定的第二应用类别为例,上述步骤S104-步骤S106的处理过程可以包括:上述执行主体可以通过对获取到的目标应用类别对应的表征信息进行平均词向量处理,得到目标应用程序对应的属性表征信息,其中,该属性表征信息可以包括第四表征信息,该第四表征信息可以为B*E6矩阵,E6为与上述目标应用类别对应的第六向量维度。以及,基于第二应用类别的主题信息确定该第二应用类别对应的第三表征信息,该第三表征信息可以为L2*E3矩阵。然后,基于上述第二类别对应的第三表征信息、以及上述第四表征信息,通过注意力算法(如Attention算法),确定该目标应用程序对应的关系表征信息B*E9矩阵。之后,上述执行主体通过上述步骤S104的处理得到属性表征信息和关系表征信息后,可以对上述属性表征信息和关系表征信息进行concat操作,从而得到该目标应用程序对应得分类特征信息B*E10矩阵,其中,上述E10为E6与E9的向量维度之和,上述E3、E6、E9的向量维度可以相等。
在一些可选的实现方式中,以上述属性信息为目标应用程序对应的目标应用类别,上述应用类别获取于第一应用类别群组和第二应用群组为例,上述执行主体通过上述步骤S104的处理得到属性表征信息和关系表征信息后,可以对上述属性表征信息和关系表征信息进行concat操作,从而得到该目标应用程序对应得分类特征信息B*E11矩阵,其中,上述E11为E6、E7、E9的向量维度之和,上述E6、E7、E9的向量维度可以相等。
在一些可选的实现方式中,以上述属性信息为至少包括:上述目标应用程序的描述信息、标识中的一个或多个,以及目标应用程序对应的目标应用类别,上述应用类别获取于第一应用类别群组和第二应用群组为例,上述执行主体通过上述步骤S104的处理得到属性表征信息和关系表征信息后,可以对上述属性表征信息和关系表征信息进行concat操作,从而得到该目标应用程序对应得分类特征信息B*E12矩阵,其中,上述E12可以为E1、E2、E3、E6、E7、E9的向量维度之和。
如图2所示,上述属性信息为至少包括:目标应用程序的标识、描述信息中的一个或多个,上述步骤S104的处理方法可以多种多样,以下再提供一种可选的处理方法,具体可以参见下述步骤S1042-步骤S1048的具体处理过程。
在步骤S1042中,对属性信息中包含的不同种类的信息进行合并处理,得到属性文本信息。
在一些可选的实现方式中,以上述属性信息为至少包括:目标应用程序的标识、描述信息中的一个或多个为例,可以对上述属性信息中包含的不同种类的信息进行合并处理,得到属性文本信息。
在步骤S1044中,对属性文本信息进行分词处理,得到属性文本信息对应的一个或多个第一分词。
在一些可选的实现方式中,可以采用预设分词算法,对上述属性文本信息进行分词处理,得到属性文本信息对应的一个或多个第一分词。在步骤S1046中,基于第一分词对应的词向量、第一分词的数量以及目标应用程序的数量信息,确定属性信息对应的初始表征信息。
在一些可选的实现方式中,上述执行主体通过上述步骤S1046的处理得到属性文本信息对应的一个或多个第一分词之后,可以通过查询词向量表的方式,获取与上述第一分词对应的词向量。然后,基于上述词向量、第一分词的数量以及上述目标应用程序的数量信息,确定属性信息对应的初始表征信息B*S1*E0矩阵,其中,B为待分类的目标应用程序的数量,S1为第一分词的数量、E0为词向量的维度。
在步骤S1048中,将初始表征信息输入到CNN模型中,以对初始表征信息进行特征提取,得到属性表征信息。
在一些可选的实现方式中,上述执行主体通过上述步骤S1046的处理,确定属性信息对应的初始表征信息后,可以将上述初始表征信息输入至CNN模型中,以对初始表征信息进行特征提取,得到属性表征信息B*E1,其中,E1的值可以等于num_filters*filter_size,num_filters和filter_size可以均为上述CNN的参数。
在步骤S1050中,基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。
进一步的,如图3所示,上述属性信息可以包括目标应用程序对应的目标应用类别,上述步骤S104的处理方法可以多种多样,以下再提供一种可选的处理方法,具体可以参见下述步骤S1052-步骤S1056的具体处理方式。
在步骤S1052中,获取目标应用类别对应的表征信息。
在步骤S1054中,对多个表征信息进行平均词向量处理,得到目标应用程序对应的属性表征信息。
在步骤S1056中,基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。
进一步的,上述步骤S104的处理方法可以多种多样,以下再提供一种可选的处理方法,具体可以参见下述步骤A2-步骤A8的具体处理过程:
在步骤A2中,对多个应用类别的信息进行预设分词处理,确定与应用类别的信息对应的多个应用类别分词。
作为示例,上述应用类别的信息可以为“商业生活服务”、“出行物流运输”、“医疗卫生”等。
在一些可选的实现方式中,以上述应用类别的信息为“商业生活服务”、“出行物流运输”、“医疗卫生”为例,对上述应用类别的信息进行预设分词处理,确定的与上述应用类别的信息对应的多个应用类别分词可以为“商业”、“生活”、“服务”、“出行”、“物流”、“运输”、“医疗”、“卫生”。
在步骤A4中,获取与应用类别分词对应的词向量维度信息。
在一些可选的实现方式中,上述执行主体通过上述步骤A2的处理,确定与应用类别的信息对应的多个应用类别分词后,可以通过查找词向量表的方式,获取与上述应用类别分词对应的词向量维度信息。
在步骤A6中,基于应用类别分词的数量信息以及词向量维度信息,生成与多个应用类别的信息对应的多个主题词信息。
在步骤A8中,基于多个主题词信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。
进一步的,上述步骤A2的处理过程可以多种多样,以下再提供一种可选的处理方法,具体可以参加下述步骤A22-步骤A22的具体处理过程。
在步骤A22中,对多个应用类别的信息进行分词处理,得到多个初始应用类别分词。
在步骤A24中,对多个初始应用类别分词进行去重处理,得到多个应用类别分词。
进一步的,上述方法还可以包括下述步骤K2-步骤K12的具体处理过程。在步骤K2中,获取用于训练预设分类模型的待分类的目标样本应用程序的样本属性信息,并获取对样本应用程序进行分类的多个样本应用类别的信息。
在步骤K4中,基于样本属性信息,确定目标样本应用程序对应的样本属性表征信息,并基于多个样本应用类别的信息和样本属性表征信息,通过注意力算法,确定目标样本应用程序对应的样本关系表征信息。
在步骤K6中,对样本属性表征信息和样本关系表征信息进行合并处理,得到目标样本应用程序对应的样本分类特征信息;将样本分类特征信息输入至预先构建的预设分类模型的初始架构,得到与目标样本应用程序对应的应用类别预测信息。
其中,上述初始架构可以包括多个网络层,各网络层可以包括多个原始参数。上述初始架构可以是基于预设的某种算法构建的,该初始架构的原始参数可以为基于包含有预设样本分类特征信息与所对应的预设类别构建的预设分类模型的参数信息。
在步骤K8中,基于应用类别预测信息与目标样本应用程序对应的样本应用类别信息之间的损失值,对初始架构的模型参数进行调整,直至损失值小于预设损失值。
其中,上述损失值可以是通过预设损失函数确定的损失值。上述预设损失函数可以是欧式空间类损失函数,或者,也可以是角度空间类损失函数等,上述欧式空间类损失函数可以包括:中心损失函数、对比损失函数和三元组损失函数等,上述这些欧式空间类损失函数可以通过限制特征点之间的距离,实现“类内聚合、类间分散”的特征分布,在训练时,可以产生一种“点对点”的约束力。上述角度空间类损失函数可以包括:ArcFace损失函数、SphereFace损失函数、CosFace损失函数等,上述角度空间类损失函数的损失目的在于从角度的方面限制特征点分布,即最小化类内特征点之间的夹角、最大化类间特征点之间的夹角,在训练时,可以产生的是一种沿圆弧的切向的约束力。
在步骤K10中,将与损失值小于预设损失值时所对应的模型参数确定为目标模型参数。
在步骤K12中,将与目标模型参数所对应的分类模型确定为预设分类模型。
由以上本说明书实施例提供的技术方案可见,本说明书实施例通过获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息,基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息,然后,对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息,之后,将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。这样,通过采用预先训练的预设分类模型对待分类的目标应用程序进行分类的方法,有效提高了对待分类的目标应用程序进行分类的准确率。
对应上述实施例提供的应用的分类方法,基于相同的技术构思,本说明书实施例又提供了一种应用的分类方法,图4A为本说明书实施例提供的应用的分类方法的第二种流程示意图,图4B为本说明书实施例提供的应用的分类过程的第六种示意图,该应用的分类方法的执行主体可以为服务器,其中,该服务器可以是独立的一个服务器,也可以是由多个服务器组成的服务器集群,而且,该服务器可以基于预先部署于区块链系统中的第一智能合约从终端设备获取待验证信息,并基于第一智能合约获取预先训练的预设分类模型,基于预先训练的预设分类模型对待分类的目标应用程序进行分类。该方法具体可以包括以下步骤:
在步骤S202中,接收第一设备发送的应用程序的分类规则信息,基于应用程序的分类规则信息生成第一智能合约,并将第一智能合约部署于区块链系统中。
在实施中,上述区块链系统在接收到第一设备发送的应用程序的分类规则信息后,可以基于应用程序的分类规则生成第一智能合约,并将该第一智能合约部署于上述区块链系统中。
在步骤S204中,在获取到第一设备发送的目标应用程序的分类请求时,基于第一智能合约执行以下处理:
获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;
上述步骤的具体处理过程可以参见前述步骤S102的处理过程。
基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。
上述步骤的具体处理过程可以参见前述步骤S104的处理过程。
对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息。
上述步骤的具体处理过程可以参见前述步骤S106的处理过程。
将分类特征信息输入至基于第一智能合约获取的预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
上述步骤的具体处理过程可以参见前述步骤S108的处理过程。
由以上本说明书实施例提供的技术方案可见,本说明书实施例通过接收第一设备发送的应用程序的分类规则信息,基于应用程序的分类规则信息生成第一智能合约,并将第一智能合约部署于所述区块链系统中;在获取到第一设备发送的目标应用程序的分类请求时,基于第一智能合约执行以下处理:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息;对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息;将分类特征信息输入至基于第一智能合约获取的预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。这样,通过采用预先训练的预设分类模型对待分类的目标应用程序进行分类的方法,有效提高了对待分类的目标应用程序进行分类的准确率。
进一步的,上述应用类别获取于基于第一智能合约确定的第一应用类别群组,和/或,第二应用类别群组,第一应用类别群组中包括通过第一种分类方式对应用程序进行分类的应用类别,第二应用类别群组中包括通过第二种分类方式对应用程序进行分类的应用类别,属性信息包括:目标应用程序对应的目标应用类别,和/或,至少包括与目标应用程序对应的标识、描述信息中的一个或多个,目标应用类别属于第一应用类别群组。
进一步的,上述属性信息为至少包括:目标应用程序的标识、描述信息中的一个或多个,上述基于属性信息,确定目标应用程序对应的属性表征信息,包括下述步骤L2-步骤L8的具体处理过程:
在步骤L2中,对属性信息中包含的不同种类的信息进行合并处理,得到属性文本信息。
上述步骤L2的具体处理过程可以参见前述步骤S1042的处理过程。
在步骤L4中,对属性文本信息进行分词处理,得到属性文本信息对应的一个或多个第一分词。
上述步骤L4的具体处理过程可以参见前述步骤S1044的处理过程。
在步骤L6中,基于第一分词对应的词向量、第一分词的数量以及目标应用程序的数量信息,确定属性信息对应的初始表征信息。
上述步骤L6的具体处理过程可以参见前述步骤S1046的处理过程。
在步骤L8中,将初始表征信息输入到CNN模型中,以对初始表征信息进行特征提取,得到属性表征信息。
上述步骤L8的具体处理过程可以参见前述步骤S1048的处理过程。
进一步的,上述属性信息可以包括目标应用程序对应的目标应用类别,上述基于属性信息,确定目标应用程序对应的属性表征信息,包括步骤M2-步骤M4的具体处理过程:
在步骤M2中,获取目标应用类别对应的表征信息。
在步骤M4中,对多个表征信息进行平均词向量处理,得到目标应用程序对应的属性表征信息。
进一步的,上述基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息,包括下述步骤N2-步骤N8的具体处理过程:
在步骤N2中,对多个应用类别的信息进行预设分词处理,确定与应用类别的信息对应的多个应用类别分词。
上述步骤N2的具体处理过程可以参见前述步骤A2的处理过程。
在步骤N4中,获取与应用类别分词对应的词向量维度信息。
上述步骤N4的具体处理过程可以参见前述步骤A4的处理过程。
在步骤N6中,基于应用类别分词的数量信息以及词向量维度信息,生成与多个应用类别的信息对应的多个主题词信息。
上述步骤N6的具体处理过程可以参见前述步骤A6的处理过程。
在步骤N8中,基于多个主题词信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。
上述步骤N8的具体处理过程可以参见前述步骤A8的处理过程。
进一步的,上述步骤N2的处理过程可以多种多样,以下再提供一种可选的处理方法,具体可以参见下述步骤N22-步骤N24的具体处理过程。
在步骤N22中,对多个应用类别的信息进行分词处理,得到多个初始应用类别分词。
在步骤N24中,对多个初始应用类别分词进行去重处理,得到多个应用类别分词。
进一步的,上述方法还可以包括下述步骤T2-步骤T18的具体处理过程。
在步骤T2中,接收第二设备发送的样本应用程序的分类规则信息,基于样本应用程序的分类规则信息生成第二智能合约,并将第二智能合约部署于区块链系统中。
在实施中,上述区块链系统在接收到第二设备发送的样本应用程序的分类规则信息后,可以基于上述样本应用程序的分类规则信息生成第二智能合约,并将上述第二智能合约部署于上述区块链系统中。
在步骤T4中,在获取到第二设备发送的预设分类模型构建请求时,基于第二智能合约执行以下处理:
获取用于训练预设分类模型的待分类的目标样本应用程序的样本属性信息,并获取对样本应用程序进行分类的多个样本应用类别的信息。
上述步骤的处理过程可以参见上述步骤K2的具体处理过程。
基于样本属性信息,确定目标样本应用程序对应的样本属性表征信息,并基于多个样本应用类别的信息和样本属性表征信息,通过注意力算法,确定目标样本应用程序对应的样本关系表征信息。
上述步骤的处理过程可以参见上述步骤K4的具体处理过程。
对样本属性表征信息和样本关系表征信息进行合并处理,得到目标样本应用程序对应的样本分类特征信息。
上述步骤的处理过程可以参见上述步骤K6的具体处理过程。
将样本分类特征信息输入至基于第二智能合约预先构建的预设分类模型的初始架构,得到与目标样本应用程序对应的应用类别预测信息。
基于应用类别预测信息与目标样本应用程序对应的样本应用类别信息之间的损失值,对初始架构的模型参数进行调整,直至损失值小于预设损失值。
上述步骤的处理过程可以参加上述步骤K8的具体处理过程。
将与损失值小于预设损失值时所对应的模型参数确定为目标模型参数。
上述步骤的处理过程可以参加上述步骤K10的具体处理过程。
将与目标模型参数所对应的分类模型确定为预设分类模型。
上述步骤的处理过程可以参加上述步骤K12的具体处理过程。
需要说明的是,在实际应用中,预先训练的预设分类模型可以存储于区块链系统中,也可以存储于其它存储设备中,对于该分类模型存储于其它存储设备中的情况,考虑到分类模型可能需要进行定期或不定期更新,由于区块链系统具有不可篡改的特征,因此如果分类模型存储于区块链系统中,后续需要对区块链系统中的分类模型进行频繁的上传、删除和上传者的身份验证等操作,增大区块链系统的处理压力,为了提高处理效率,降低区块链系统的处理压力,可以预先在上述存储设备中训练该分类模型,并可以将训练后的分类模型存储于存储设备的指定存储地址内,而将该存储地址上传于区块链系统中,由于该存储地址可以固定不变,并存储于区块链系统中,从而既保证了区块链系统中的数据的防篡改性,同时,分类模型还可以在上述存储设备中进行定期或不定期的更新,从而保证通过区块链系统中的存储地址获取到的始终是最新的分类模型。
由以上本说明书实施例提供的技术方案可见,本说明书实施例通过接收第一设备发送的应用程序的分类规则信息,基于应用程序的分类规则信息生成第一智能合约,并将第一智能合约部署于所述区块链系统中;在获取到第一设备发送的目标应用程序的分类请求时,基于第一智能合约执行以下处理:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息;对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息;将分类特征信息输入至基于第一智能合约获取的预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。这样,通过采用预先训练的预设分类模型对待分类的目标应用程序进行分类的方法,有效提高了对待分类的目标应用程序进行分类的准确率。
对应上述实施例提供的应用的分类方法,基于相同的技术构思,本说明书实施例还提供了一种应用的分类装置,图5为本说明书实施例提供的应用的分类装置的第一种模块组成示意图,该应用的分类装置用于执行上述图1-图3描述的应用的分类方法,如图5所示,该装置包括:
第一获取模块501,获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;
第一确定模块502,基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息;
第一合并模块503,对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息;
第一处理模块504,将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
可选地,应用类别获取于第一应用类别群组,和/或,第二应用类别群组,第一应用类别群组中包括通过第一种分类方式对应用程序进行分类的应用类别,第二应用类别群组中包括通过第二种分类方式对应用程序进行分类的应用类别,属性信息包括:目标应用程序对应的目标应用类别,和/或,至少包括与目标应用程序对应的标识、描述信息中的一个或多个,目标应用类别属于第一应用类别群组。
可选地,属性信息为至少包括:目标应用程序的标识、描述信息中的一个或多个,第一确定模块,包括:
第一合并单元,对属性信息中包含的不同种类的信息进行合并处理,得到属性文本信息;
第一处理单元,对属性文本信息进行分词处理,得到属性文本信息对应的一个或多个第一分词;
第一确定单元,基于第一分词对应的词向量、第一分词的数量以及目标应用程序的数量信息,确定属性信息对应的初始表征信息;
第一提取单元,将初始表征信息输入到CNN模型中,以对初始表征信息进行特征提取,得到属性表征信息。
可选地,属性信息包括目标应用程序对应的目标应用类别,第一确定模块,包括:
第一获取单元,获取目标应用类别对应的表征信息;
第二处理单元,对多个表征信息进行平均词向量处理,得到目标应用程序对应的属性表征信息。
可选地,第一确定模块,包括:
第三处理单元,对多个应用类别的信息进行预设分词处理,确定与应用类别的信息对应的多个应用类别分词;
第三获取单元,获取与应用类别分词对应的词向量维度信息;
第一生成单元,基于应用类别分词的数量信息以及词向量维度信息,生成与多个应用类别的信息对应的多个主题词信息;
第二确定单元,基于多个主题词信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。
可选地,第三处理单元,包括:
第一处理子单元,对多个应用类别的信息进行分词处理,得到多个初始应用类别分词;
第二处理子单元,对多个初始应用类别分词进行去重处理,得到多个应用类别分词。
可选地,装置还包括:
第二获取模块,获取用于训练预设分类模型的待分类的目标样本应用程序的样本属性信息,并获取对样本应用程序进行分类的多个样本应用类别的信息;
第二确定模块,基于样本属性信息,确定目标样本应用程序对应的样本属性表征信息,并基于多个样本应用类别的信息和样本属性表征信息,通过注意力算法,确定目标样本应用程序对应的样本关系表征信息;
第二合并模块,对样本属性表征信息和样本关系表征信息进行合并处理,得到目标样本应用程序对应的样本分类特征信息;将样本分类特征信息输入至预先构建的预设分类模型的初始架构,得到与目标样本应用程序对应的应用类别预测信息;
第一调整模块,基于应用类别预测信息与目标样本应用程序对应的样本应用类别信息之间的损失值,对初始架构的模型参数进行调整,直至损失值小于预设损失值;
第三确定模块,将与损失值小于预设损失值时所对应的模型参数确定为目标模型参数;
第四确定模块,将与目标模型参数所对应的分类模型确定为预设分类模型。
由以上本说明书实施例提供的技术方案可见,本说明书实施例通过获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息,基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息,然后,对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息,之后,将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。这样,通过采用预先训练的预设分类模型对待分类的目标应用程序进行分类的方法,有效提高了对待分类的目标应用程序进行分类的准确率。
本说明书实施例提供的应用的分类装置能够实现上述应用的分类方法对应的实施例中的各个过程,为避免重复,这里不再赘述。
需要说明的是,本说明书实施例提供的应用的分类装置与本说明书实施例提供的应用的分类方法基于同一发明构思,因此该实施例的具体实施可以参见上述应用的分类方法的实施,重复之处不再赘述。
对应上述实施例提供的应用的分类方法,基于相同的技术构思,本说明书实施例还提供了一种应用的分类装置,图6为本说明书实施例提供的应用的分类装置的模块组成示意图,该应用的分类装置用于执行上述图4A和图4B描述的应用的分类方法,该应用的分类装置为区块链系统中的装置,如图6所示,该装置包括:
第一接收模块601,接收第一设备发送的应用程序的分类规则信息,基于应用程序的分类规则信息生成第一智能合约,并将第一智能合约部署于区块链系统中;
第二处理模块602,在获取到第一设备发送的目标应用程序的分类请求时,基于第一智能合约执行以下处理:
获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;
基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息;
对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息;
将分类特征信息输入至基于第一智能合约获取的预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
可选地,应用类别获取于基于第一智能合约确定的第一应用类别群组,和/或,第二应用类别群组,第一应用类别群组中包括通过第一种分类方式对应用程序进行分类的应用类别,第二应用类别群组中包括通过第二种分类方式对应用程序进行分类的应用类别,属性信息包括:目标应用程序对应的目标应用类别,和/或,至少包括与目标应用程序对应的标识、描述信息中的一个或多个,目标应用类别属于第一应用类别群组。
可选地,属性信息为至少包括:目标应用程序的标识、描述信息中的一个或多个,第二处理模块,包括:
第二合并单元,对属性信息中包含的不同种类的信息进行合并处理,得到属性文本信息;
第四处理单元,对属性文本信息进行分词处理,得到属性文本信息对应的一个或多个第一分词;
第三确定单元,基于第一分词对应的词向量、第一分词的数量以及目标应用程序的数量信息,确定属性信息对应的初始表征信息;
第二提取单元,将初始表征信息输入到CNN模型中,以对初始表征信息进行特征提取,得到属性表征信息。
可选地,属性信息包括目标应用程序对应的目标应用类别,第二处理模块,包括:
第二获取单元,获取目标应用类别对应的表征信息;
第五处理单元,对多个表征信息进行平均词向量处理,得到目标应用程序对应的属性表征信息。
可选地,第二处理模块,包括:
第六处理单元,对多个应用类别的信息进行预设分词处理,确定与应用类别的信息对应的多个应用类别分词;
第四获取单元,获取与应用类别分词对应的词向量维度信息;
第二生成单元,基于应用类别分词的数量信息以及词向量维度信息,生成与多个应用类别的信息对应的多个主题词信息;
第四确定单元,基于多个主题词信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。
可选地,第六处理单元,包括:
第三处理子单元,对多个应用类别的信息进行分词处理,得到多个初始应用类别分词;
第四处理子单元,对多个初始应用类别分词进行去重处理,得到多个应用类别分词。
可选地,上述装置还包括:
第二接收模块,接收第二设备发送的样本应用程序的分类规则信息,基于样本应用程序的分类规则信息生成第二智能合约,并将第二智能合约部署于区块链系统中;
第三处理模块,在获取到第二设备发送的预设分类模型构建请求时,基于第二智能合约执行以下处理:
获取用于训练预设分类模型的待分类的目标样本应用程序的样本属性信息,并获取对样本应用程序进行分类的多个样本应用类别的信息;基于样本属性信息,确定目标样本应用程序对应的样本属性表征信息,并基于多个样本应用类别的信息和样本属性表征信息,通过注意力算法,确定目标样本应用程序对应的样本关系表征信息;
对样本属性表征信息和样本关系表征信息进行合并处理,得到目标样本应用程序对应的样本分类特征信息;
将样本分类特征信息输入至基于第二智能合约预先构建的预设分类模型的初始架构,得到与目标样本应用程序对应的应用类别预测信息;
基于应用类别预测信息与目标样本应用程序对应的样本应用类别信息之间的损失值,对初始架构的模型参数进行调整,直至损失值小于预设损失值;
将与损失值小于预设损失值时所对应的模型参数确定为目标模型参数;
将与目标模型参数所对应的分类模型确定为预设分类模型。
由以上本说明书实施例提供的技术方案可见,本说明书实施例通过接收第一设备发送的应用程序的分类规则信息,基于应用程序的分类规则信息生成第一智能合约,并将第一智能合约部署于区块链系统中;在获取到第一设备发送的目标应用程序的分类请求时,基于第一智能合约执行以下处理:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息;对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息;将分类特征信息输入至基于第一智能合约获取的预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。这样,通过采用预先训练的预设分类模型对待分类的目标应用程序进行分类的方法,有效提高了对待分类的目标应用程序进行分类的准确率。
本说明书实施例提供的应用的分类装置能够实现上述应用的分类方法对应的实施例中的各个过程,为避免重复,这里不再赘述。
需要说明的是,本说明书实施例提供的应用的分类装置与本说明书实施例提供的应用的分类方法基于同一发明构思,因此该实施例的具体实施可以参见上述应用的分类方法的实施,重复之处不再赘述。
对应上述实施例提供的应用的分类方法,基于相同的技术构思,本说明书实施例还提供了一种应用的分类设备,如图7所示,图7为本说明书实施例提供的应用的分类设备的硬件结构示意图,该应用的分类设备用于执行图1A、图1B、图2-图3,或图4A、图4B描述的应用的分类方法。
应用的分类设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器701和存储器702,存储器702中可以存储有一个或一个以上存储应用程序或数据。其中,存储器702可以是短暂存储或持久存储。存储在存储器702的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对任务的分配设备中的一系列计算机可执行指令。更进一步地,处理器701可以设置为与存储器702通信,在数据访问设备上执行存储器702中的一系列计算机可执行指令。数据访问设备还可以包括一个或一个以上电源703,一个或一个以上有线或无线网络接口704,一个或一个以上输入输出接口705,一个或一个以上键盘706。
具体在本实施例中,应用的分类设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对任务的分配设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;
基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息;
对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息;
将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
可选地,应用类别获取于第一应用类别群组,和/或,第二应用类别群组,第一应用类别群组中包括通过第一种分类方式对应用程序进行分类的应用类别,第二应用类别群组中包括通过第二种分类方式对应用程序进行分类的应用类别,属性信息包括:目标应用程序对应的目标应用类别,和/或,至少包括与目标应用程序对应的标识、描述信息中的一个或多个,目标应用类别属于第一应用类别群组。
可选地,属性信息为至少包括:目标应用程序的标识、描述信息中的一个或多个,基于属性信息,确定目标应用程序对应的属性表征信息,包括:
对属性信息中包含的不同种类的信息进行合并处理,得到属性文本信息;
对属性文本信息进行分词处理,得到属性文本信息对应的一个或多个第一分词;
基于第一分词对应的词向量、第一分词的数量以及目标应用程序的数量信息,确定属性信息对应的初始表征信息;
将初始表征信息输入到CNN模型中,以对初始表征信息进行特征提取,得到属性表征信息。
可选地,属性信息包括目标应用程序对应的目标应用类别,基于属性信息,确定目标应用程序对应的属性表征信息,包括:
获取目标应用类别对应的表征信息;
对多个表征信息进行平均词向量处理,得到目标应用程序对应的属性表征信息。
可选地,基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息,包括:
对多个应用类别的信息进行预设分词处理,确定与应用类别的信息对应的多个应用类别分词;
获取与应用类别分词对应的词向量维度信息;
基于应用类别分词的数量信息以及词向量维度信息,生成与多个应用类别的信息对应的多个主题词信息;
基于多个主题词信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息。
可选地,对多个应用类别的信息进行预设分词处理,确定与应用类别的信息对应的多个应用类别分词,包括:
对多个应用类别的信息进行分词处理,得到多个初始应用类别分词;
对多个初始应用类别分词进行去重处理,得到多个应用类别分词。
可选地,方法还包括:
获取用于训练预设分类模型的待分类的目标样本应用程序的样本属性信息,并获取对样本应用程序进行分类的多个样本应用类别的信息;
基于样本属性信息,确定目标样本应用程序对应的样本属性表征信息,并基于多个样本应用类别的信息和样本属性表征信息,通过注意力算法,确定目标样本应用程序对应的样本关系表征信息;
对样本属性表征信息和样本关系表征信息进行合并处理,得到目标样本应用程序对应的样本分类特征信息;将样本分类特征信息输入至预先构建的预设分类模型的初始架构,得到与目标样本应用程序对应的应用类别预测信息;
基于应用类别预测信息与目标样本应用程序对应的样本应用类别信息之间的损失值,对初始架构的模型参数进行调整,直至损失值小于预设损失值;
将与损失值小于预设损失值时所对应的模型参数确定为目标模型参数;
将与目标模型参数所对应的分类模型确定为预设分类模型。
由以上本说明书实施例提供的技术方案可见,本说明书实施例通过获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息,基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息,然后,对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息,之后,将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。这样,通过采用预先训练的预设分类模型对待分类的目标应用程序进行分类的方法,有效提高了对待分类的目标应用程序进行分类的准确率。
或者,上述应用的分类设备还可以为区块链系统中的设备,用于进行以下计算机可执行指令:
接收第一设备发送的应用程序的分类规则信息,基于应用程序的分类规则信息生成第一智能合约,并将第一智能合约部署于区块链系统中;
在获取到第一设备发送的目标应用程序的分类请求时,基于第一智能合约执行以下处理:
获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;
基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息;
对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息;
将分类特征信息输入至基于第一智能合约获取的预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
可选地,上述方法还包括:
接收第二设备发送的样本应用程序的分类规则信息,基于样本应用程序的分类规则信息生成第二智能合约,并将第二智能合约部署于区块链系统中;
在获取到第二设备发送的预设分类模型构建请求时,基于第二智能合约执行以下处理:
获取用于训练预设分类模型的待分类的目标样本应用程序的样本属性信息,并获取对样本应用程序进行分类的多个样本应用类别的信息;基于样本属性信息,确定目标样本应用程序对应的样本属性表征信息,并基于多个样本应用类别的信息和样本属性表征信息,通过注意力算法,确定目标样本应用程序对应的样本关系表征信息;
对样本属性表征信息和样本关系表征信息进行合并处理,得到目标样本应用程序对应的样本分类特征信息;
将样本分类特征信息输入至基于第二智能合约预先构建的预设分类模型的初始架构,得到与目标样本应用程序对应的应用类别预测信息;
基于应用类别预测信息与目标样本应用程序对应的样本应用类别信息之间的损失值,对初始架构的模型参数进行调整,直至损失值小于预设损失值;
将与损失值小于预设损失值时所对应的模型参数确定为目标模型参数;
将与目标模型参数所对应的分类模型确定为预设分类模型。
由以上本说明书实施例提供的技术方案可见,本说明书实施例通过接收第一设备发送的应用程序的分类规则信息,基于应用程序的分类规则信息生成第一智能合约,并将第一智能合约部署于区块链系统中;在获取到第一设备发送的目标应用程序的分类请求时,基于第一智能合约执行以下处理:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息;对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息;将分类特征信息输入至基于第一智能合约获取的预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。这样,通过采用预先训练的预设分类模型对待分类的目标应用程序进行分类的方法,有效提高了对待分类的目标应用程序进行分类的准确率。
进一步的,对应上述实施例提供的应用的分类方法,本说明书实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器1101执行时实现如上述应用的分类方法实施例的各步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,的计算机可读存储介质,如只读存储器(Read-OnlyMemory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,本说明书实施例提供的应用的分类设备和计算机可读存储介质能够实现上述应用的分类方法实施例中的各个过程,为避免重复,这里不再赘述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM) 和/或非易失性内存等形式,如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
可以理解的是,本说明书实施例描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits,ASIC)、数字信号处 理器(DigitalSignal Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable Logic Device,PLD)、现场可编程门阵列(Field-Programmable GateArray,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本说明书功能的其它电子单元或其组合中。
对于软件实现,可通过执行本说明书实施例上述功能的模块(例如过程、函数等)来实现本说明书实施例上述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括上述要素的过程、方法、商品或者设备中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本说明书各个实施例的上述方法。
上面结合附图对本说明书的实施例进行了描述,但是本说明书并不局限于上述的具体实施方式,上述具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本说明书的启示下,在不脱离本说明书宗旨和权利要求所保护的范围情况下,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (15)
1.一种应用的分类方法,所述方法包括:
获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;
基于所述属性信息,确定所述目标应用程序对应的属性表征信息,并基于所述多个应用类别的信息和所述属性表征信息,通过注意力算法,确定所述目标应用程序对应的关系表征信息;
对所述属性表征信息和所述关系表征信息进行合并处理,得到所述目标应用程序对应的分类特征信息;
将所述分类特征信息输入至预设分类模型中,得到所述目标应用程序对应的应用类别,其中,所述预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
2.根据权利要求1所述的方法,所述应用类别获取于第一应用类别群组,和/或,第二应用类别群组,所述第一应用类别群组中包括通过第一种分类方式对应用程序进行分类的应用类别,所述第二应用类别群组中包括通过第二种分类方式对应用程序进行分类的应用类别,所述属性信息包括:所述目标应用程序对应的目标应用类别,和/或,至少包括与所述目标应用程序对应的标识、描述信息中的一个或多个,所述目标应用类别属于所述第一应用类别群组。
3.根据权利要求2所述的方法,所述属性信息为至少包括:所述目标应用程序的标识、描述信息中的一个或多个,所述基于所述属性信息,确定所述目标应用程序对应的属性表征信息,包括:
对所述属性信息中包含的不同种类的信息进行合并处理,得到属性文本信息;
对所述属性文本信息进行分词处理,得到所述属性文本信息对应的一个或多个第一分词;
基于所述第一分词对应的词向量、所述第一分词的数量以及所述目标应用程序的数量信息,确定所述属性信息对应的初始表征信息;
将所述初始表征信息输入到CNN模型中,以对所述初始表征信息进行特征提取,得到所述属性表征信息。
4.根据权利要求2所述的方法,所述属性信息包括所述目标应用程序对应的目标应用类别,所述基于所述属性信息,确定所述目标应用程序对应的属性表征信息,包括:
获取所述目标应用类别对应的表征信息;
对多个所述表征信息进行平均词向量处理,得到所述目标应用程序对应的属性表征信息。
5.根据权利要求2所述的方法,所述基于所述多个应用类别的信息和所述属性表征信息,通过注意力算法,确定所述目标应用程序对应的关系表征信息,包括:
对多个所述应用类别的信息进行预设分词处理,确定与所述应用类别的信息对应的多个应用类别分词;
获取与所述应用类别分词对应的词向量维度信息;
基于所述应用类别分词的数量信息以及所述词向量维度信息,生成与多个所述应用类别的信息对应的多个主题词信息;
基于多个所述主题词信息和所述属性表征信息,通过注意力算法,确定所述目标应用程序对应的关系表征信息。
6.根据权利要求5所述的方法,所述对多个所述应用类别的信息进行预设分词处理,确定与所述应用类别的信息对应的多个应用类别分词,包括:
对多个所述应用类别的信息进行分词处理,得到多个初始应用类别分词;
对多个所述初始应用类别分词进行去重处理,得到多个应用类别分词。
7.根据权利要求1所述的方法,所述方法还包括:
获取用于训练所述预设分类模型的待分类的目标样本应用程序的样本属性信息,并获取对样本应用程序进行分类的多个样本应用类别的信息;
基于所述样本属性信息,确定所述目标样本应用程序对应的样本属性表征信息,并基于所述多个样本应用类别的信息和所述样本属性表征信息,通过注意力算法,确定所述目标样本应用程序对应的样本关系表征信息;
对所述样本属性表征信息和所述样本关系表征信息进行合并处理,得到所述目标样本应用程序对应的样本分类特征信息;将所述样本分类特征信息输入至预先构建的预设分类模型的初始架构,得到与所述目标样本应用程序对应的应用类别预测信息;
基于所述应用类别预测信息与所述目标样本应用程序对应的样本应用类别信息之间的损失值,对所述初始架构的模型参数进行调整,直至所述损失值小于预设损失值;
将与所述损失值小于所述预设损失值时所对应的模型参数确定为目标模型参数;
将与所述目标模型参数所对应的分类模型确定为预设分类模型。
8.一种应用的分类方法,应用于区块链系统,所述方法包括:
接收第一设备发送的应用程序的分类规则信息,基于所述应用程序的分类规则信息生成第一智能合约,并将所述第一智能合约部署于所述区块链系统中;
在获取到所述第一设备发送的目标应用程序的分类请求时,基于所述第一智能合约执行以下处理:
获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;
基于所述属性信息,确定所述目标应用程序对应的属性表征信息,并基于所述多个应用类别的信息和所述属性表征信息,通过注意力算法,确定所述目标应用程序对应的关系表征信息;
对所述属性表征信息和所述关系表征信息进行合并处理,得到所述目标应用程序对应的分类特征信息;
将所述分类特征信息输入至基于所述第一智能合约获取的预设分类模型中,得到所述目标应用程序对应的应用类别,其中,所述预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
9.根据权利要求8所述的方法,所述方法还包括:
接收第二设备发送的样本应用程序的分类规则信息,基于所述样本应用程序的分类规则信息生成第二智能合约,并将所述第二智能合约部署于所述区块链系统中;
在获取到所述第二设备发送的预设分类模型构建请求时,基于所述第二智能合约执行以下处理:
获取用于训练所述预设分类模型的待分类的目标样本应用程序的样本属性信息,并获取对样本应用程序进行分类的多个样本应用类别的信息;基于所述样本属性信息,确定所述目标样本应用程序对应的样本属性表征信息,并基于所述多个样本应用类别的信息和所述样本属性表征信息,通过注意力算法,确定所述目标样本应用程序对应的样本关系表征信息;
对所述样本属性表征信息和所述样本关系表征信息进行合并处理,得到所述目标样本应用程序对应的样本分类特征信息;
将所述样本分类特征信息输入至基于所述第二智能合约预先构建的预设分类模型的初始架构,得到与所述目标样本应用程序对应的应用类别预测信息;
基于所述应用类别预测信息与所述目标样本应用程序对应的样本应用类别信息之间的损失值,对所述初始架构的模型参数进行调整,直至所述损失值小于预设损失值;
将与所述损失值小于所述预设损失值时所对应的模型参数确定为目标模型参数;
将与所述目标模型参数所对应的分类模型确定为预设分类模型。
10.一种应用的分类装置,所述装置包括:
第一获取模块,获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;
第一确定模块,基于所述属性信息,确定所述目标应用程序对应的属性表征信息,并基于所述多个应用类别的信息和所述属性表征信息,通过注意力算法,确定所述目标应用程序对应的关系表征信息;
第一合并模块,对所述属性表征信息和所述关系表征信息进行合并处理,得到所述目标应用程序对应的分类特征信息;
第一处理模块,将所述分类特征信息输入至预设分类模型中,得到所述目标应用程序对应的应用类别,其中,所述预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
11.一种应用的分类装置,所述装置为区块链系统中的装置,所述装置包括:
第一接收模块,接收第一设备发送的应用程序的分类规则信息,基于所述应用程序的分类规则信息生成第一智能合约,并将所述第一智能合约部署于所述区块链系统中;
第二处理模块,在获取到所述第一设备发送的目标应用程序的分类请求时,基于所述第一智能合约执行以下处理:
获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;
基于所述属性信息,确定所述目标应用程序对应的属性表征信息,并基于所述多个应用类别的信息和所述属性表征信息,通过注意力算法,确定所述目标应用程序对应的关系表征信息;
对所述属性表征信息和所述关系表征信息进行合并处理,得到所述目标应用程序对应的分类特征信息;
将所述分类特征信息输入至基于所述第一智能合约获取的预设分类模型中,得到所述目标应用程序对应的应用类别,其中,所述预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
12.一种应用的分类设备,所述设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;
基于所述属性信息,确定所述目标应用程序对应的属性表征信息,并基于所述多个应用类别的信息和所述属性表征信息,通过注意力算法,确定所述目标应用程序对应的关系表征信息;
对所述属性表征信息和所述关系表征信息进行合并处理,得到所述目标应用程序对应的分类特征信息;
将所述分类特征信息输入至预设分类模型中,得到所述目标应用程序对应的应用类别,其中,所述预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
13.一种应用的分类设备,所述设备为区块链系统中的设备,所述设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
接收第一设备发送的应用程序的分类规则信息,基于所述应用程序的分类规则信息生成第一智能合约,并将所述第一智能合约部署于所述区块链系统中;
在获取到所述第一设备发送的目标应用程序的分类请求时,基于所述第一智能合约执行以下处理:
获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;
基于所述属性信息,确定所述目标应用程序对应的属性表征信息,并基于所述多个应用类别的信息和所述属性表征信息,通过注意力算法,确定所述目标应用程序对应的关系表征信息;
对所述属性表征信息和所述关系表征信息进行合并处理,得到所述目标应用程序对应的分类特征信息;
将所述分类特征信息输入至基于所述第一智能合约获取的预设分类模型中,得到所述目标应用程序对应的应用类别,其中,所述预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
14.一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;
基于所述属性信息,确定所述目标应用程序对应的属性表征信息,并基于所述多个应用类别的信息和所述属性表征信息,通过注意力算法,确定所述目标应用程序对应的关系表征信息;
对所述属性表征信息和所述关系表征信息进行合并处理,得到所述目标应用程序对应的分类特征信息;
将所述分类特征信息输入至预设分类模型中,得到所述目标应用程序对应的应用类别,其中,所述预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
15.一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
接收第一设备发送的应用程序的分类规则信息,基于所述应用程序的分类规则信息生成第一智能合约,并将所述第一智能合约部署于区块链系统中;
在获取到所述第一设备发送的目标应用程序的分类请求时,基于所述第一智能合约执行以下处理:
获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;
基于所述属性信息,确定所述目标应用程序对应的属性表征信息,并基于所述多个应用类别的信息和所述属性表征信息,通过注意力算法,确定所述目标应用程序对应的关系表征信息;
对所述属性表征信息和所述关系表征信息进行合并处理,得到所述目标应用程序对应的分类特征信息;
将所述分类特征信息输入至基于所述第一智能合约获取的预设分类模型中,得到所述目标应用程序对应的应用类别,其中,所述预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111094272.9A CN113553434B (zh) | 2021-09-17 | 2021-09-17 | 一种应用的分类方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111094272.9A CN113553434B (zh) | 2021-09-17 | 2021-09-17 | 一种应用的分类方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113553434A true CN113553434A (zh) | 2021-10-26 |
CN113553434B CN113553434B (zh) | 2021-11-30 |
Family
ID=78134656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111094272.9A Active CN113553434B (zh) | 2021-09-17 | 2021-09-17 | 一种应用的分类方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113553434B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114818987A (zh) * | 2022-06-20 | 2022-07-29 | 中山大学深圳研究院 | 一种科技服务数据的处理方法、装置以及系统 |
CN117056836A (zh) * | 2023-10-13 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 程序分类模型的训练、程序类目识别方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111797239A (zh) * | 2020-09-08 | 2020-10-20 | 中山大学深圳研究院 | 应用程序的分类方法、装置及终端设备 |
US20210056718A1 (en) * | 2019-08-20 | 2021-02-25 | GM Global Technology Operations LLC | Domain adaptation for analysis of images |
CN113168489A (zh) * | 2018-08-09 | 2021-07-23 | 欧特克公司 | 用于生成反映风格偏好的设计的技术 |
-
2021
- 2021-09-17 CN CN202111094272.9A patent/CN113553434B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113168489A (zh) * | 2018-08-09 | 2021-07-23 | 欧特克公司 | 用于生成反映风格偏好的设计的技术 |
US20210056718A1 (en) * | 2019-08-20 | 2021-02-25 | GM Global Technology Operations LLC | Domain adaptation for analysis of images |
CN111797239A (zh) * | 2020-09-08 | 2020-10-20 | 中山大学深圳研究院 | 应用程序的分类方法、装置及终端设备 |
Non-Patent Citations (2)
Title |
---|
XI LIU 等: "Intelligent radar software defect classification approach based on the latent Dirichlet allocation topic model", 《EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING》 * |
赵世林: "网络大数据驱动的应用程序智能分类与识别", 《中国优秀硕士论文全文》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114818987A (zh) * | 2022-06-20 | 2022-07-29 | 中山大学深圳研究院 | 一种科技服务数据的处理方法、装置以及系统 |
CN114818987B (zh) * | 2022-06-20 | 2022-11-08 | 中山大学深圳研究院 | 一种科技服务数据的处理方法、装置以及系统 |
CN117056836A (zh) * | 2023-10-13 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 程序分类模型的训练、程序类目识别方法及装置 |
CN117056836B (zh) * | 2023-10-13 | 2023-12-12 | 腾讯科技(深圳)有限公司 | 程序分类模型的训练、程序类目识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113553434B (zh) | 2021-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113553434B (zh) | 一种应用的分类方法、装置及设备 | |
US20150213376A1 (en) | Methods and systems for generating classifiers for software applications | |
US9116879B2 (en) | Dynamic rule reordering for message classification | |
US9977995B2 (en) | Image clustering method, image clustering system, and image clustering server | |
US20220075750A1 (en) | Article, device, and techniques for serverless streaming message processing | |
US12026386B2 (en) | Method and system of differential compression | |
TW201734780A (zh) | 行動終端應用程式的更新方法和裝置 | |
US20170177316A1 (en) | Mobile application deployment for distributed computing environments | |
CN114244611B (zh) | 异常攻击检测方法、装置、设备及存储介质 | |
US20240004993A1 (en) | Malware detection in containerized environments | |
CN114328029B (zh) | 一种应用资源的备份方法、装置、电子设备及存储介质 | |
US11556595B2 (en) | Attribute diversity for frequent pattern analysis | |
US11636185B2 (en) | AI governance using tamper proof model metrics | |
CN107562703B (zh) | 字典树重构方法及系统 | |
CN111611228B (zh) | 一种基于分布式数据库的负载均衡调整方法及装置 | |
CN112418864A (zh) | 一种数据发送的方法及装置 | |
CN113992429B (zh) | 一种事件的处理方法、装置及设备 | |
Pruengkarn et al. | Data cleaning using complementary fuzzy support vector machine technique | |
CN109800775B (zh) | 文件聚类方法、装置、设备及可读介质 | |
CN114238223A (zh) | 图片移除方法、装置、计算机设备及计算机可读存储介质 | |
JP2022151837A (ja) | 方法、システム、及びコンピュータプログラム(コンテンツ解析メッセージルーティング) | |
CN112818119B (zh) | 一种信息的处理方法、装置及设备 | |
CN110968580A (zh) | 一种数据存储结构的创建方法及装置 | |
US9256851B2 (en) | Intelligent cloning of a business object graph | |
US20230013075A1 (en) | Determining candidates for circuit breaker patterns in cloud applications using machine learning techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |