CN110717521A - 智能业务实现方法、装置及计算机可读存储介质 - Google Patents
智能业务实现方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110717521A CN110717521A CN201910868096.6A CN201910868096A CN110717521A CN 110717521 A CN110717521 A CN 110717521A CN 201910868096 A CN201910868096 A CN 201910868096A CN 110717521 A CN110717521 A CN 110717521A
- Authority
- CN
- China
- Prior art keywords
- data set
- equipment
- layer
- feature
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000013598 vector Substances 0.000 claims abstract description 60
- 238000000605 extraction Methods 0.000 claims abstract description 42
- 238000012549 training Methods 0.000 claims abstract description 32
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 24
- 238000012790 confirmation Methods 0.000 claims abstract description 9
- 238000005516 engineering process Methods 0.000 claims abstract description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 48
- 230000006870 function Effects 0.000 claims description 36
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000011176 pooling Methods 0.000 claims description 15
- 238000004140 cleaning Methods 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 8
- 230000003370 grooming effect Effects 0.000 claims 1
- 238000013473 artificial intelligence Methods 0.000 abstract 1
- 210000002569 neuron Anatomy 0.000 description 16
- 238000013528 artificial neural network Methods 0.000 description 8
- 238000013507 mapping Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000012706 support-vector machine Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000012850 discrimination method Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 235000001968 nicotinic acid Nutrition 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000004883 computer application Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种人工智能技术,揭露了一种智能业务实现方法,包括:收集设备安装时基于安全权限要求的源数据集,通过预先构建的特征提取模型对所述源数据集进行特征提取,得到特征数据集;将所述特征数据集作为训练集输入至预先构建的智能设备识别模型中,输出所述设备的信任程度特征;利用支持向量算法计算所述信任程度特征的信任值,并根据所述信任值识别出所述设备是否值得信任;当所述设备值得信任时,在所述设备上进行推广业务,并在接收到用户在所述设备上执行的确认操作时,完成所述业务的实现,当所述设备不值得信任时,对所述设备不作处理。本发明还提出一种智能业务实现装置以及一种计算机可读存储介质。本发明实现了业务的高效完成。
Description
技术领域
本发明涉及大数据技术领域,尤其涉及一种基于大数据+智能设备的智能业务实现方法、装置及计算机可读存储介质。
背景技术
随着计算机应用技术和存储技术的发展,越来越多的企业在经营过程中产生大量的数据,研究表明,现如今大数据的应用,己经渗透到了社会生活的每一个领域。目前行业内基于大数据+智能设备一扫就实现的业务功能通常需要进行复杂或冗余的多步操作实现或业务人员参与,需要花费大量的时间和精力在设备维护上,造成了极高的人力成本以及工作效率的低下。
发明内容
本发明提供一种智能业务实现方法、装置及计算机可读存储介质,其主要目的在于当用户在进行设备推广业务时,给用户呈现出高效的业务实现结果。
为实现上述目的,本发明提供的一种智能业务实现方法,包括:
收集设备安装时基于安全权限要求的源数据集,通过预先构建的特征提取模型对所述源数据集进行特征提取,得到特征数据集;
将所述特征数据集作为训练集输入至预先构建的智能设备识别模型中,输出所述设备的信任程度特征;
利用支持向量算法计算所述信任程度特征的信任值,并根据所述信任值识别出所述设备是否值得信任;
当所述设备值得信任时,在所述设备上进行推广业务,并在接收到用户在所述设备上执行的确认操作时,完成所述业务的实现,当所述设备不值得信任时,对所述设备不作处理。
可选地,所述特征提取模型包括kafka消息队列、清洗层、存储层、计算层和应用层;及所述通过预先构建的特征提取模型对所述源数据集进行特征提取,包括:
将所述源数据集输入至所述kafka消息队列进行存储;
通过所述清洗层对所述kafka消息队列中的源数据集进行预处理操作,得到目标数据集,并将所述目标数据集输入至所述存储层,以供所述计算层和应用层直接调用;
利用所述计算层的spark计算框架对所述目标数据集进行逻辑运算,完成所述源数据集的特征提取,得到所述特征数据集,并通过所述应用层的API接口传输所述特征数据集。
可选地,所述预处理操作包括数据整理和数据清洗;
其中,所述数据整理包括:
利用集群技术对所述源数据集的数据格式、各维度数值的离散化、聚类以及关联关系进行分析,得到所述源数据集的数据之间的关系和所述源数据集的数据边界值;
所述数据清洗包括:
通过数据的归一化对所述源数据集的数据进行缩放处理,并通过数据选择对所述源数据集中无关的信息数据集进行剔除,其中,所述数据的归一化计算方法如下所示:
x=(x-μ)/σ
其中,x为归一化的数据,μ为数据的均值,σ为数据的方差。
可选地,所述将所述特征数据集作为训练集输入至预先构建的智能设备模型中,输出所述设备的信任程度特征,包括:
搭建包括卷积神经网络的智能设备识别模型;
将所述训练集输入至所述卷积神经网络的输入层,通过在所述卷积神经网络的卷积层中预设一组过滤器对所述训练集进行卷积操作,并提取出特征向量;
利用所述卷积神经网络的池化层对所述特征向量进行池化操作并将池化后的特征向量输入至全连接层,通过所述卷积神经网络的激活函数对所述池化后的特征向量输入分类的设备信任程度特征标签,并利用所述卷积神经网络输出层输出所述设备的信任程度特征的标签概率。
可选地,所述支持向量算法为:
其中,sgn是一种符号函数,符号<>是向量的内积运算符,是已知的向量,x表示所述设备的信任程度特征,b是已知的实数,数据xi指的是n维空间的向量,yi代表第i个数据的类别,k指的是数据的总数,ai表示第i个数据的学习率。
此外,为实现上述目的,本发明还提供一种智能业务实现装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的智能业务实现程序,所述智能业务实现程序被所述处理器执行时实现如下步骤:
收集设备安装时基于安全权限要求的源数据集,通过预先构建的特征提取模型对所述源数据集进行特征提取,得到特征数据集;
将所述特征数据集作为训练集输入至预先构建的智能设备识别模型中,输出所述设备的信任程度特征;
利用支持向量算法计算所述信任程度特征的信任值,并根据所述信任值识别出所述设备是否值得信任;
当所述设备值得信任时,在所述设备上进行推广业务,并在接收到用户在所述设备上执行的确认操作时,完成所述业务的实现,当所述设备不值得信任时,对所述设备不作处理。
可选地,所述特征提取模型包括kafka消息队列、清洗层、存储层、计算层和应用层;及所述通过预先构建的特征提取模型对所述源数据集进行特征提取,包括:
将所述源数据集输入至所述kafka消息队列进行存储;
通过所述清洗层对所述kafka消息队列中的源数据集进行预处理操作,得到目标数据集,并将所述目标数据集输入至所述存储层,以供所述计算层和应用层直接调用;
利用所述计算层的spark计算框架对所述目标数据集进行逻辑运算,完成所述源数据集的特征提取,得到所述特征数据集,并通过所述应用层的API接口传输所述特征数据集。
可选地,所述将所述特征数据集作为训练集输入至预先构建的智能设备模型中,输出所述设备的信任程度特征,包括:
搭建包括卷积神经网络的智能设备识别模型;
将所述训练集输入至所述卷积神经网络的输入层,通过在所述卷积神经网络的卷积层中预设一组过滤器对所述训练集进行卷积操作,并提取出特征向量;
利用所述卷积神经网络的池化层对所述特征向量进行池化操作并将池化后的特征向量输入至全连接层,通过所述卷积神经网络的激活函数对所述池化后的特征向量输入分类的设备信任程度特征标签,并利用所述卷积神经网络输出层输出所述设备的信任程度特征的标签概率。
可选地,所述支持向量算法为:
其中,sgn是一种符号函数,符号<>是向量的内积运算符,是已知的向量,x表示所述设备的信任程度特征,b是已知的实数,数据xi指的是n维空间的向量,yi代表第i个数据的类别,k指的是数据的总数,ai表示第i个数据的学习率。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有智能业务实现程序,所述智能业务实现程序可被一个或者多个处理器执行,以实现如上所述的智能业务实现方法的步骤。
本发明提出的智能业务实现方法、装置及计算机可读存储介质,在用户通过设备进行推广业务时,对收集设备安装时基于安全权限要求的源数据集进行分析处理,得到所述设备的信任程度特征,并利用支持向量算法对所述设备的信任程度特征进行识别,判断出所述设备是否值得信任,从而可以给用户呈现出高效的业务实现结果。
附图说明
图1为本发明一实施例提供的智能业务实现方法的流程示意图;
图2为本发明一实施例提供的智能业务实现装置的内部结构示意图;
图3为本发明一实施例提供的智能业务实现装置中智能业务实现程序的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种智能业务实现方法。参照图1所示,为本发明一实施例提供的智能业务实现方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,智能业务实现方法包括:
S1、收集设备安装时基于安全权限要求的源数据集,通过预先构建的特征提取模型对所述源数据集进行特征提取,得到特征数据集,并将所述特征数据集作为训练集。
本发明较佳实施例中,所述收集设备安装时基于安全权限要求的源数据集来源于以下两种方式:方式一、用户在提供设备安装时,基于安全管控的权限要求所产生的数据集;方式二、根据关键词在搜索引擎上获取的数据集。其中,所述用户可以为从事关于保险行业的企业,例如,中国平安。所述设备可以为手机APP等。
进一步地,本发明较佳实施例中,所述预先构建的特征提取模型包含kafka消息队列、清洗层、存储层、计算层以及应用层。优选地,本发明将所述源数据集输入至所述kafka消息队列进行存储;通过所述清洗层对所述kafka消息队列中的源数据集进行预处理操作,得到目标数据集,并将所述目标数据集输入至所述存储层,其中,所述存储层的目标数据集供所述特征提取模型的计算层和应用层直接调用;利用所述计算层的spark计算框架对所述目标数据集进行逻辑运算,完成所述源数据集的特征提取,并通过所述应用层的API接口将提取后的所述源数据集与外界进行传输。
进一步地,所述预处理操作包括数据整理和数据清洗。详细地,所述数据整理包括:利用集群技术对所述源数据集的数据格式、各维度数值的离散化、聚类以及关联关系进行分析,得到所述源数据集的数据之间的关系以及数据的边界值。进一步地,本发明通过全数校验方法对进行分析后的所述源数据集进行质量检验,保证进行分析后的所述源数据集的完整性、唯一性、权威性、合法性以及一致性。所述数据清洗包括:通过数据的归一化对所述源数据集的数据进行缩放处理,并通过数据选择对所述源数据集中无关的信息数据集进行剔除,其中,所述数据的归一化计算方法如下所示:
x=(x-μ)/σ
其中,x为归一化的数据,μ为数据的均值,σ为数据的方差。
S2、将所述特征数据集作为训练集输入至预先构建的智能设备识别模型中,输出所述设备的信任程度特征。
本本发明较佳实施例搭建包括卷积神经网络的智能设备识别模型。所述卷积神经网络是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,其基本结构包括两层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。
本发明较佳实施例中,所述卷积神经网络包含输入层、卷积层、池化层以及输出层。本发明较佳实施例将所述训练集输入至所述卷积神经网络的输入层,通过在所述卷积层中预设一组过滤器对所述训练集进行卷积操作,提取出特征向量,所述过滤器可以为{filter0,filter1},分别用于在相似通道和相异通道上来生成一组特征;利用所述池化层对所述特征向量进行池化操作并将池化后的特征向量输入至全连接层,通过所述卷积神经网络的激活函数对所述池化后的特征向量输入分类的设备信任程度特征标签,并利用所述卷积神经网络输出层输出所述设备的信任程度特征的标签概率。其中,所述softmax激活函数核心公式为:其中,xj表示生成的分类的设备信任程度特征标签为j,其中k表示共有k种标签。
进一步地,本发明还可以包括通过在所述卷积神经网络中构建损失函数进行不断提高所述卷积神经网络的性能。所述损失函数用来评价网络模型输出的预测值与真实值Y之间的差异。其中,当损失函数值越小,网络模型的性能越好。优选地,本发明通过来表示损失函数,根据深度学习中神经元基本公式,所述卷积神经网络各层输入、输出为:
其中,为第l层网络第i个神经元的输入,Wsi-1为第l层网络第i个神经元到第l+1层网络中第j个神经元的链接,Cj为输出层各单元的输出值,本发明根据所述输入输出公式,并利用均方误差(Mean Square Error,MSE)建立损失函数进一步地,本发明通过ReLU函数relu(x)=max(0,x)缓解所述卷积神网络的梯度消散问题,所述ReLU函数满足仿生学中的稀疏性,只有当输入值高于一定数目时才激活该神经元节点,当输入值低于0时进行限制,当输入上升到某一阙值以上时,函数中自变量与因变量呈线性关系。
进一步地,本发明还可以通过FTRL优化器对损失函数进行优化,从而更新神经网络的参数并得到更深层的特征。所述FTRL是一种优化算法,对于给定模型参数x和第t个样本vt,定义pt=1/(1+exp(-x*vt)为该样本标准为1的概率;定义lt(xt)=-ytlogpt-(1-yt)log(1-pt)表示第t个样本的对数损失,第t个样本的梯度就可以表示为根据所述FTRL优化器中的FTRL算法进行损失函数参数的更新,从而得到最优的神经网络参数和经过神经网络训练得到的更深层的特征。其中,FTRL算法:
S3、利用支持向量算法计算所述信任程度特征的信任值,并根据所述信任值识别出所述设备是否值得信任。
所述支持向量算法(Support Vector Machine,SVM)是一种常见机器学习领域中的判别方法,其通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。
本发明通过支持向量机学习算法对所述设备的信任程度特征进行识别。进一步地,本发明预设所述设备的信任程度特征的训练样本的数据集合为{(xi,yi)|xi∈Rn,yi∈R},其中,数据xi是n维空间的向量,所述向量描述了待分类数据的特征,被称为特征向量,yi代表数据的类别,根据yi的不同来将样本分为不同样本。本发明实施例中,每一个样本的得分都可作为一个点,假设在此空间存在一个超平面其中符号<>是向量的内积运算符,是已知的向量,b是已知的实数,因此,所述支持向量算法为:
其中,k指的是数据的总数,ai表示第i个数据的学习率,sgn是一种符号函数,当返回值数字大于0,则所述Sgn返回信任程度特征的信任值为1;当返回值数字等于0,则所述Sgn返回信任程度特征的信任值为0;当返回值数字小于0,则所述Sgn返回信任程度特征的信任值为-1。其中,数字参数的符号决定了Sgn函数返回值。本发明中根据所述信任程度特征的信任值判断所述设备是否可信,若所得到信任值为1时,即代表所述设备可信;若所得到信任值是0或-1时,即代表所述设备不可信。
S4、当所述设备值得信任时,在所述设备上进行推广业务,并在接收到用户在所述设备上执行的确认操作时,完成所述业务的实现,当所述设备不值得信任时,对所述设备不作处理。
发明还提供一种智能业务实现装置。参照图2所示,为本发明一实施例提供的智能业务实现装置的内部结构示意图。
在本实施例中,所述智能业务实现装置1可以是PC(Personal Computer,个人电脑),或者是智能手机、平板电脑、便携计算机等终端设备,也可以是一种服务器等。该智能业务实现装置1至少包括存储器11、处理器12,通信总线13,以及网络接口14。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是智能业务实现装置1的内部存储单元,例如该智能业务实现装置1的硬盘。存储器11在另一些实施例中也可以是智能业务实现装置1的外部存储设备,例如智能业务实现装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括智能业务实现装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于智能业务实现装置1的应用软件及各类数据,例如智能业务实现程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行智能业务实现程序01等。
通信总线13用于实现这些组件之间的连接通信。
网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该装置1与其他电子设备之间建立通信连接。
可选地,该装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在智能业务实现装置1中处理的信息以及用于显示可视化的用户界面。
图2仅示出了具有组件11-14以及智能业务实现程序01的智能业务实现装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对智能业务实现装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在图2所示的装置1实施例中,存储器11中存储有智能业务实现程序01;处理器12执行存储器11中存储的智能业务实现程序01时实现如下步骤:
步骤一、收集设备安装时基于安全权限要求的源数据集,通过预先构建的特征提取模型对所述源数据集进行特征提取,得到特征数据集,并将所述特征数据集作为训练集。
本发明较佳实施例中,所述收集设备安装时基于安全权限要求的源数据集来源于以下两种方式:方式一、用户在提供设备安装时,基于安全管控的权限要求所产生的数据集;方式二、根据关键词在搜索引擎上获取的数据集。其中,所述用户可以为从事关于保险行业的企业,例如,中国平安。所述设备可以为手机APP等。
进一步地,本发明较佳实施例中,所述预先构建的特征提取模型包含kafka消息队列、清洗层、存储层、计算层以及应用层。优选地,本发明将所述源数据集输入至所述kafka消息队列进行存储;通过所述清洗层对所述kafka消息队列中的源数据集进行预处理操作,得到目标数据集,并将所述目标数据集输入至所述存储层,其中,所述存储层的特征数据集供所述特征提取模型的计算层和应用层直接调用;利用所述计算层的spark计算框架对所述目标数据集进行逻辑运算,完成所述源数据集的特征提取,并通过所述应用层的API接口将提取后的所述源数据集与外界进行传输。
进一步地,所述预处理操作包括数据整理和数据清洗。详细地,所述数据整理包括:利用集群技术对所述源数据集的数据格式、各维度数值的离散化、聚类以及关联关系进行分析,得到所述源数据集的数据之间的关系以及数据的边界值。进一步地,本发明通过全数校验方法对进行分析后的所述源数据集进行质量检验,保证进行分析后的所述源数据集的完整性、唯一性、权威性、合法性以及一致性。所述数据清洗包括:通过数据的归一化对所述源数据集的数据进行缩放处理,并通过数据选择对所述源数据集中无关的信息数据集进行剔除,其中,所述数据的归一化计算方法如下所示:
x=(x-μ)/σ
其中,x为归一化的数据,μ为数据的均值,σ为数据的方差。
步骤二、将所述特征数据集作为训练集输入至预先构建的智能设备识别模型中,输出所述设备的信任程度特征。
本本发明较佳实施例搭建包括卷积神经网络的智能设备识别模型。所述卷积神经网络是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,其基本结构包括两层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。
本发明较佳实施例中,所述卷积神经网络包含输入层、卷积层、池化层以及输出层。本发明较佳实施例将所述训练集输入至所述卷积神经网络的输入层,通过在所述卷积层中预设一组过滤器对所述训练集进行卷积操作,提取出特征向量,所述过滤器可以为{filter0,filter1},分别用于在相似通道和相异通道上来生成一组特征;利用所述池化层对所述特征向量进行池化操作并将池化后的特征向量输入至全连接层,通过所述卷积神经网络的激活函数对所述池化后的特征向量输入分类的设备信任程度特征标签,并利用所述卷积神经网络输出层输出所述设备的信任程度特征的标签概率。其中,所述softmax激活函数核心公式为:其中,xj表示生成的分类的设备信任程度特征标签为j,其中k表示共有k种标签。
进一步地,本发明还可以包括通过在所述卷积神经网络中构建损失函数进行不断提高所述卷积神经网络的性能。所述损失函数用来评价网络模型输出的预测值与真实值Y之间的差异。其中,当损失函数值越小,网络模型的性能越好。优选地,本发明通过来表示损失函数,根据深度学习中神经元基本公式,所述卷积神经网络各层输入、输出为:
Ci=f(zi)
其中,为第l层网络第i个神经元的输入,Wsi-1为第l层网络第i个神经元到第l+1层网络中第j个神经元的链接,Cj为输出层各单元的输出值,本发明根据所述输入输出公式,并利用均方误差(Mean Square Error,MSE)建立损失函数进一步地,本发明通过ReLU函数relu(x)=max(0,x)缓解所述卷积神网络的梯度消散问题,所述ReLU函数满足仿生学中的稀疏性,只有当输入值高于一定数目时才激活该神经元节点,当输入值低于0时进行限制,当输入上升到某一阙值以上时,函数中自变量与因变量呈线性关系。
进一步地,本发明还可以通过FTRL优化器对损失函数进行优化,从而更新神经网络的参数并得到更深层的特征。所述FTRL是一种优化算法,对于给定模型参数x和第t个样本vt,定义pt=1/(1+exp(-x*vt)为该样本标准为1的概率;定义lt(xt)=-ytlogpt-(1-yt)log(1-pt)表示第t个样本的对数损失,第t个样本的梯度就可以表示为根据所述FTRL优化器中的FTRL算法进行损失函数参数的更新,从而得到最优的神经网络参数和经过神经网络训练得到的更深层的特征。其中,FTRL算法为:
步骤三、利用支持向量算法计算所述信任程度特征的信任值,并根据所述信任值识别出所述设备是否值得信任。
所述支持向量算法(Support Vector Machine,SVM)是一种常见机器学习领域中的判别方法,其通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。
本发明通过支持向量机学习算法对所述设备的信任程度特征进行识别。进一步地,本发明预设所述设备的信任程度特征的训练样本的数据集合为{(xi,yi)|xi∈Rn,yi∈R},其中,数据xi是n维空间的向量,所述向量描述了待分类数据的特征,被称为特征向量,yi代表数据的类别,根据yi的不同来将样本分为不同样本。本发明实施例中,每一个样本的得分都可作为一个点,假设在此空间存在一个超平面其中符号<>是向量的内积运算符,是已知的向量,b是已知的实数,因此,所述支持向量算法为:
其中,k指的是数据的总数,ai表示第i个数据的学习率,sgn是一种符号函数,当返回值数字大于0,则Sgn返回1;当返回值数字等于0,则返回0;当返回值数字小于0,则返回-1。其中,数字参数的符号决定了Sgn函数的返回值。根据所述返回值是1还是-1进行判断设备是否可信,若所得到返回值为1时,即代表所述设备可信;若返回值是0或-1时,即代表所述设备不可信。
步骤四、当所述设备值得信任时,在所述设备上进行推广业务,并在接收到用户在所述设备上执行的确认操作时,完成所述业务的实现,当所述设备不值得信任时,对所述设备不作处理。
可选地,在其他实施例中,智能业务实现程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述智能业务实现程序在智能业务实现装置中的执行过程。
例如,参照图3所示,为本发明智能业务实现装置一实施例中的智能业务实现程序的程序模块示意图,该实施例中,所述智能业务实现程序可以被分割为特征获取模块10、特征处理模块20、特征识别模块30以及判断模块40,示例性地:
所述特征获取模块10用于:收集设备安装时基于安全权限要求的源数据集,通过预先构建的特征提取模型对所述源数据集进行特征提取,得到特征数据集,并将所述特征数据集作为训练集。
所述特征处理模块20用于:将所述特征数据集作为训练集输入至预先构建的智能设备识别模型中,输出所述设备的信任程度特征。
所述特征识别模块30用于:利用支持向量算法计算所述信任程度特征的信任值,并根据所述信任值识别出所述设备是否值得信任。
所述判断模块40用于:当所述设备值得信任时,在所述设备上进行推广业务,并在接收到用户在所述设备上执行的确认操作时,完成所述业务的实现,当所述设备不值得信任时,对所述设备不作处理。
上述特征获取模块10、特征处理模块20、特征识别模块30以及判断模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有智能业务实现程序,所述智能业务实现程序可被一个或多个处理器执行,以实现如下操作:
收集设备安装时基于安全权限要求的源数据集,通过预先构建的特征提取模型对所述源数据集进行特征提取,得到特征数据集;
将所述特征数据集作为训练集输入至预先构建的智能设备识别模型中,输出所述设备的信任程度特征;
利用支持向量算法计算所述信任程度特征的信任值,并根据所述信任值识别出所述设备是否值得信任;
当所述设备值得信任时,在所述设备上进行推广业务,并在接收到用户在所述设备上执行的确认操作时,完成所述业务的实现,当所述设备不值得信任时,对所述设备不作处理。
本发明计算机可读存储介质具体实施方式与上述智能业务实现装置和方法各实施例基本相同,在此不作累述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种智能业务实现方法,其特征在于,所述方法包括:
收集设备安装时基于安全权限要求的源数据集,通过预先构建的特征提取模型对所述源数据集进行特征提取,得到特征数据集;
将所述特征数据集作为训练集输入至预先构建的智能设备识别模型中,输出所述设备的信任程度特征;
利用支持向量算法计算所述信任程度特征的信任值,并根据所述信任值识别出所述设备是否值得信任;
当所述设备值得信任时,在所述设备上进行推广业务,并在接收到用户在所述设备上执行的确认操作时,完成所述业务的实现,当所述设备不值得信任时,对所述设备不作处理。
2.如权利要求1所述的智能业务实现方法,其特征在于,所述特征提取模型包括kafka消息队列、清洗层、存储层、计算层和应用层;及所述通过预先构建的特征提取模型对所述源数据集进行特征提取,包括:
将所述源数据集输入至所述kafka消息队列进行存储;
通过所述清洗层对所述kafka消息队列中的源数据集进行预处理操作,得到目标数据集,并将所述目标数据集输入至所述存储层,以供所述计算层和应用层直接调用;
利用所述计算层的spark计算框架对所述目标数据集进行逻辑运算,完成所述源数据集的特征提取,得到所述特征数据集,并通过所述应用层的API接口传输所述特征数据集。
3.如权利要求2所述的智能业务实现方法,其特征在于,所述预处理操作包括数据整理和数据清洗;
其中,所述数据整理包括:
利用集群技术对所述源数据集的数据格式、各维度数值的离散化、聚类以及关联关系进行分析,得到所述源数据集的数据之间的关系和所述源数据集的数据边界值;
所述数据清洗包括:
通过数据的归一化对所述源数据集的数据进行缩放处理,并通过数据选择对所述源数据集中无关的信息数据集进行剔除,其中,所述数据的归一化计算方法如下所示:
x=(x-μ)/σ
其中,x为归一化的数据,μ为数据的均值,σ为数据的方差。
4.如权利要求1所述的智能业务实现方法,其特征在于,所述将所述特征数据集作为训练集输入至预先构建的智能设备识别模型中,输出所述设备的信任程度特征,包括:
搭建包括卷积神经网络的智能设备识别模型;
将所述训练集输入至所述卷积神经网络的输入层,通过在所述卷积神经网络的卷积层中预设一组过滤器对所述训练集进行卷积操作,并提取出特征向量;
利用所述卷积神经网络的池化层对所述特征向量进行池化操作并将池化后的特征向量输入至全连接层,通过所述卷积神经网络的激活函数对所述池化后的特征向量输入分类的设备信任程度特征标签,并利用所述卷积神经网络输出层输出所述设备的信任程度特征的标签概率。
6.一种智能业务实现装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的智能业务实现程序,所述智能业务实现程序被所述处理器执行时实现如下步骤:
收集设备安装时基于安全权限要求的源数据集,通过预先构建的特征提取模型对所述源数据集进行特征提取,得到特征数据集;
将所述特征数据集作为训练集输入至预先构建的智能设备识别模型中,输出所述设备的信任程度特征;
利用支持向量算法计算所述信任程度特征的信任值,并根据所述信任值识别出所述设备是否值得信任;
当所述设备值得信任时,在所述设备上进行推广业务,并在接收到用户在所述设备上执行的确认操作时,完成所述业务的实现,当所述设备不值得信任时,对所述设备不作处理。
7.如权利要求6所述的智能业务实现装置,其特征在于,所述特征提取模型包括kafka消息队列、清洗层、存储层、计算层和应用层;及所述通过预先构建的特征提取模型对所述源数据集进行特征提取,包括:
将所述源数据集输入至所述kafka消息队列进行存储;
通过所述清洗层对所述kafka消息队列中的源数据集进行预处理操作,得到目标数据集,并将所述目标数据集输入至所述存储层,以供所述计算层和应用层直接调用;
利用所述计算层的spark计算框架对所述目标数据集进行逻辑运算,完成所述源数据集的特征提取,得到所述特征数据集,并通过所述应用层的API接口传输所述特征数据集。
8.如权利要求6所述的智能业务实现装置,其特征在于,所述将所述特征数据集作为训练集输入至预先构建的智能设备模型中,输出所述设备的信任程度特征,包括:
搭建包括卷积神经网络的智能设备识别模型;
将所述训练集输入至所述卷积神经网络的输入层,通过在所述卷积神经网络的卷积层中预设一组过滤器对所述训练集进行卷积操作,并提取出特征向量;
利用所述卷积神经网络的池化层对所述特征向量进行池化操作并将池化后的特征向量输入至全连接层,通过所述卷积神经网络的激活函数对所述池化后的特征向量输入分类的设备信任程度特征标签,并利用所述卷积神经网络输出层输出所述设备的信任程度特征的标签概率。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有智能业务实现程序,所述智能业务实现程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的智能业务实现方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910868096.6A CN110717521B (zh) | 2019-09-09 | 2019-09-09 | 智能业务实现方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910868096.6A CN110717521B (zh) | 2019-09-09 | 2019-09-09 | 智能业务实现方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110717521A true CN110717521A (zh) | 2020-01-21 |
CN110717521B CN110717521B (zh) | 2024-04-30 |
Family
ID=69210462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910868096.6A Active CN110717521B (zh) | 2019-09-09 | 2019-09-09 | 智能业务实现方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110717521B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401691A (zh) * | 2020-02-21 | 2020-07-10 | 中国平安财产保险股份有限公司 | 业务进度监控方法、装置及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101608639B1 (ko) * | 2015-10-28 | 2016-04-04 | (주)아이티엔제이 | 스마트 정보 보안 통합 시스템 |
US20180367573A1 (en) * | 2017-06-16 | 2018-12-20 | Sap Se | Stereotyping for trust management in iot systems |
CN109961009A (zh) * | 2019-02-15 | 2019-07-02 | 平安科技(深圳)有限公司 | 基于深度学习的行人检测方法、系统、装置及存储介质 |
CN110032632A (zh) * | 2019-04-04 | 2019-07-19 | 平安科技(深圳)有限公司 | 基于文本相似度的智能客服问答方法、装置及存储介质 |
-
2019
- 2019-09-09 CN CN201910868096.6A patent/CN110717521B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101608639B1 (ko) * | 2015-10-28 | 2016-04-04 | (주)아이티엔제이 | 스마트 정보 보안 통합 시스템 |
US20180367573A1 (en) * | 2017-06-16 | 2018-12-20 | Sap Se | Stereotyping for trust management in iot systems |
CN109961009A (zh) * | 2019-02-15 | 2019-07-02 | 平安科技(深圳)有限公司 | 基于深度学习的行人检测方法、系统、装置及存储介质 |
CN110032632A (zh) * | 2019-04-04 | 2019-07-19 | 平安科技(深圳)有限公司 | 基于文本相似度的智能客服问答方法、装置及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401691A (zh) * | 2020-02-21 | 2020-07-10 | 中国平安财产保险股份有限公司 | 业务进度监控方法、装置及计算机可读存储介质 |
CN111401691B (zh) * | 2020-02-21 | 2024-02-09 | 中国平安财产保险股份有限公司 | 业务进度监控方法、装置及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110717521B (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11487941B2 (en) | Techniques for determining categorized text | |
CN109284371B (zh) | 反欺诈方法、电子装置及计算机可读存储介质 | |
US20200004815A1 (en) | Text entity detection and recognition from images | |
CN110413786B (zh) | 基于网页文本分类的数据处理方法、智能终端及存储介质 | |
CN110780965B (zh) | 基于视觉的流程自动化方法、设备及可读存储介质 | |
CN112995414B (zh) | 基于语音通话的行为质检方法、装置、设备及存储介质 | |
CN111190967B (zh) | 用户多维度数据处理方法、装置及电子设备 | |
CN114090601B (zh) | 一种数据筛选方法、装置、设备以及存储介质 | |
Ali et al. | Fake accounts detection on social media using stack ensemble system | |
US11941792B2 (en) | Machine learning-based analysis of computing device images included in requests to service computing devices | |
Saha et al. | ChurnNet: Deep Learning Enhanced Customer Churn Prediction in Telecommunication Industry | |
CN110717521B (zh) | 智能业务实现方法、装置及计算机可读存储介质 | |
CN117234844A (zh) | 云服务器异常管理方法、装置、计算机设备及存储介质 | |
CN116776150A (zh) | 接口异常访问识别方法、装置、计算机设备及存储介质 | |
CN115146653B (zh) | 对话剧本构建方法、装置、设备及存储介质 | |
CN113722437B (zh) | 基于人工智能的用户标签识别方法、装置、设备及介质 | |
CN113254672B (zh) | 异常账号的识别方法、系统、设备及可读存储介质 | |
CN113469237A (zh) | 用户意图识别方法、装置、电子设备及存储介质 | |
CN110929118B (zh) | 网络数据处理方法、设备、装置、介质 | |
CN113515591A (zh) | 文本不良信息识别方法、装置、电子设备及存储介质 | |
CN111291180A (zh) | 一种工单数据分类方法、终端及存储介质 | |
CN116775889B (zh) | 基于自然语言处理的威胁情报自动提取方法、系统、设备和存储介质 | |
Arvind et al. | An energy efficient artificial intelligence based innovation detection for complex data communication model | |
CN117333478A (zh) | 一种图像模糊检测方法、装置、计算机设备及存储介质 | |
Xu et al. | DCEL: Classifier Fusion Model for Android Malware Detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |