CN112926126B

CN112926126B - 一种基于马尔可夫随机场的联邦学习方法

Info

Publication number: CN112926126B
Application number: CN202110345776.7A
Authority: CN
Inventors: 李姚根; 胡凯; 吴佳胜; 陆美霞; 庞子超; 李凌霄
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2021-03-31
Filing date: 2021-03-31
Publication date: 2023-04-25
Anticipated expiration: 2041-03-31
Also published as: CN112926126A

Abstract

本发明公开了一种基于马尔可夫随机场的联邦学习方法，利用联邦学习将用户在不同设备的存储的声纹特征、智能设备拍摄异常照片等特定情形，设置一键紧急呼救等报警信息，共同建立本地模型传输到云端，在确保用户隐私不泄露的前提下，将各个设备参数加入到马尔科夫随机场概率图模型G(V，E)，最后上传到云端建立出一个泛化性能高的全局模型。本发明在马尔可夫随机场的加入下，使得联邦建模的参数得到进一步优化，并举例将联合建模的模型应用到家用智能家居上。

Description

一种基于马尔可夫随机场的联邦学习方法

技术领域

本发明涉及人工智能技术领域，尤其是一种基于马尔可夫随机场的联邦学习方法。

背景技术

所谓智能家居是现代电子技术、自动化技术以及通信技术相结合的产物。它能够自动控制和管理家电设备，对家庭环境的安全进行监控报警，并且能够为住户提供安全舒适、高效便利的学习生活环境。家居智能化系统将家庭中各种信息相关的通信设备、家用电器以及家庭保安装置通过有线或者无线的方式链接起来，并进行集中或异地的监控、管理，保持家庭住宅环境的舒适、协调。与普通的家居相比，智能家居不仅具备传统的居住功能，提供温馨、高效安全的高品位生活环境，还将一个被动静止的居住环境提升一个有一定智慧协助能力的体贴的生活帮手，进一步优化住户的生活质量。现有技术中，家用智能设备报警系统存有部分缺陷，例如单一的家用智能设备对于人的声纹特征并不能特别准确识别，对于监控拍摄到的异常画面会出现错误报警。

发明内容

本发明所要解决的技术问题在于，提供一种基于马尔可夫随机场的联邦学习方法，使得联邦建模的参数得到进一步优化，并将联合建模的模型应用到家用智能家居上。

为解决上述技术问题，本发明提供一种基于马尔可夫随机场的联邦学习方法，包括如下步骤：

步骤1：设备A和设备B分别接受大量声音信息，分别得到各自的数据集D_A和D_B；

步骤2：设备A和设备B在本地进行语音识别,对输入数据进行数据提取，识别出虚假信息并剔除，将有用信息进行参数信息提取，提取有效的参数信息，进入步骤3；

步骤3：对步骤2中提取的参数进行归一化处理，设备A的参数记为x_Ai，设备B的参数记为x_Bi，根据公式(1)

将参数范围控制在[0,1]之间；

步骤4：步骤3中参数的取值范围进行归一化处理之后，将参数进行K-MEANS聚类处理，聚类之后的参数相关性更加紧密，后续马尔可夫随机性也是基于参数之间的相关性进行模型建设；

步骤5：在步骤3中参数进行K-MEANS聚类处理之后，参数出现概率的准确性与采样次数是正相关的，而且未出现的参数不一定就是不可能出现为了数据的平滑性，对参数进行Good-Turning平滑处理；

步骤6：定义势函数随后构建马尔可夫随机场最佳的全局模型参数，在最大后验概率MAP框架下，需要通过先验概率和似然概率获得后验概率，进而求得MAP分析出各参数之间的相关性，最终得到概率图模型G(V，E)；

步骤7：步骤1到步骤6为参数的预处理，预处理之后设备A和设备B在本地开始进行建模，本地模型参数基于前向神经网络和马尔可夫随机场，每次迭代更新选择的参数仅仅与上一次的参数相关；

步骤8：步骤7为参数基于马尔可夫性在本地建立模型，因为每次迭代仅仅与上一次参数相关，在迭代到上一次参数与本次迭代无区别时，本地迭代结束，至此设备A和B在本地建立好模型，构建全局神经网络根据公式(2)

其中m为最大团中的节点的个数，

是新的全局神经网络神经元的值，

是由阈值法挑选出的A，B客户端中相关性大的一对节点；

步骤9：将步骤8中已经迭代好的本地模型参数，上传到服务器端进行来联合建模，服务器端建模基于BPN-马尔可夫模型进一步得到最优的联合训练参数，每次联合训练完成返回至各个本地设备，与本地模型进行对比，若模型不优于本地模型则进行BPN-马尔可夫模型进行迭代训练联合模型，直至联合训练的模型优于本地模型，服务器端建模完成；

步骤10：步骤9之后，联邦建模的参数返回分发给设备A和设备B，设备A和B在优化的参数基础上更新自己的本地模型，若有新的参数输入进来，重复步骤1-8进行将新的参数开始基于马尔可夫的联邦学习模型迭代。

优选的，步骤1中，大量声音信息具体为：有效数据包括声音的音色、振幅、响度、临界距离和混响程度，噪声声音包含电视、手机发出的虚假报警信息。

优选的，步骤2中，参数内容包括：反映时间、识别准确率、分析时间、单词中选定位置上的基音、激励频谱的估计斜率、选定语言环境中提前发声的存在、鼻辅音中极点频率的位置、选定元音的频谱特性、鼻辅音的频谱特性、选定元音的时长、擦音的频谱特性、元音的共振峰频率和共振峰带宽以及声门源的极点。

本发明的有益效果为：本发明利用联邦学习将用户在不同设备的存储的声纹特征、智能设备拍摄异常照片等特定情形，设置一键紧急呼救等报警信息，共同建立本地模型传输到云端，在确保用户隐私不泄露的前提下，将各个设备参数加入到马尔科夫随机场概率图模型G(V，E)，最后上传到云端建立出一个泛化性能高的全局模型；在马尔可夫随机场的加入下，使得联邦建模的参数得到进一步优化，并将联合建模的模型应用到家用智能家居上。

附图说明

图1为本发明的单层神经网络联邦建模示意图。

图2为本发明的联邦马尔可夫建模示意图。

图3为本发明的联邦建模流程示意图。

图4为本发明的设备报警流程示意图。

图5为本发明的家用智能设备安防架构示意图。

具体实施方式

一种基于马尔可夫随机场的联邦学习方法，包括如下步骤：

将参数范围控制在[0,1]之间；

步骤6：定义势函数随后构建马尔可夫随机场最佳的全局模型参数，在最大后验概率MAP框架下，需要通过先验概率和似然概率获得后验概率，进而求得MAP分析出各参数之间的相关性，最终得到概率图模型G(V，E)，具体如图1所示；

步骤8：步骤7为参数基于马尔可夫性在本地建立模型，因为每次迭代仅仅与上一次参数相关，在迭代到上一次参数与本次迭代无区别时，本地迭代结束，至此设备A和B在本地建立好模型；

步骤9：将步骤8中已经迭代好的本地模型参数，上传到服务器端进行来联合建模，服务器端建模基于BPN-马尔可夫模型进一步得到最优的联合训练参数，每次联合训练完成返回至各个本地设备，与本地模型进行对比，若模型不优于本地模型则进行BPN-马尔可夫模型进行迭代训练联合模型，直至联合训练的模型优于本地模型，服务器端建模完成具体流程如图2所示；

步骤10：步骤9之后，联邦建模的参数返回分发给设备A和设备B，设备A和B在优化的参数基础上更新自己的本地模型，若有新的参数输入进来，重复步骤1-8进行将新的参数开始基于马尔可夫的联邦学习模型迭代，具体流程如图3所示。

某家庭内，存在两个家用智能设备A和设备B，输入不同人的说话声音但内容相同，均为“帮我拨打急救电话，120”。设备A和设备B分别得到大量的语音信息，将其保存在各自的存储器内，归纳整理为两个数据集D_A和D_B，数据集内容包括声音的音色、振幅、响度、临界距离和混响程度等。在设备A和设备B本地建模分别获得了8个参数和10个参数。在此假设设备A和设备B的模型是一样的。设备A的参数记为x_Ai，设备B的参数记为x_Bi，i的取值范围1-10。参数内容包括：反映时间、识别准确率、分析时间、单词中选定位置上的基音、激励频谱的估计斜率、选定语言环境中提前发声的存在、鼻辅音中极点频率的位置、选定元音的频谱特性、鼻辅音的频谱特性、选定元音的时长、擦音的频谱特性、元音的共振峰频率和共振峰带宽以及声门源的极点等。对应于智能设备报警系统参数为U，报警参数本地存储对应U_Q集合。特征参数的取值范围进行归一化处理，得到

和

由于设备B参数仅有8个，在归一化处理之后补充两个参数0，将设备B补充两个参数0为了与设备A参数个数在各自本地训练时保持同一数目。这些参数在本地训练模型时，都满足马尔科夫性，在每次训练的参数都与上一时刻的参数相关，但不同类型的参数互相不干扰，因而在参数训练前加入参数的无监督聚类。在本地建模时，参数的提取由于报警信息的不确定性和未知性，在参数的本地建模过程中加入先验概率，在一定程度上能够提高本地模型的泛化性能。

由于参数的种类繁多，不同设备提取的参数个数不同，为了减少训练的时间，进行参数无监督分类对应与智能家具设备的各种报警设备报警的状况，报警状况也具有很大的随机性，达到报警状态即会触发报警装置。每个设备报警系统相互独立，各个报警参数都独立无标签满足无监督要求。在智能设备报警系统中，每次报警的参数都不一样，在设定报警参数如声音，每次即便输入同一个指令但是每次声音都有随机性从不同角度输入到设备，获取的声音参数每次都与上一次进行比较，满足马尔可夫随机性。由于每次获得的参数仅与上次对比，既提高了处理速度又能保证一定的准确率。

参数进行K-MEANS聚类和古德图灵(Good-Turning)平滑处理，定义势函数随后构建马尔可夫随机场最佳的全局模型参数,在最大后验概率(MAP)框架下，需要通过先验概率和似然概率获得后验概率，进而求得MAP分析出各参数之间的相关性，利用吉布斯分布函数p(u)，来简化计算，最终我们得到概率图模型G(V，E)。在这里定义一个势函数的作用为了在马尔可夫随机场中求解吉布斯函数。隐藏层参数至此可以求解出概率图模型G(V，E)。将概率图模型G(V，E)上传到云端处理数据得到一个智能设备A和设备B共建联邦模型，根据BPN梯度计算，进一步求解出最优的隐藏层参数。将基于BPN和马尔可夫随机场优化后的参数联邦学习模型，返回至客户端运用在设备A和设备B上，使得设备A和设备B具有更好的报警系统。

联合建模之后的设备A和设备B获取语音：“帮我拨打小明电话，123456”，设备分别得到数据D'_A和D'_B，联合建模设备A和设备B分别得到了12个参数，对比建模前两个设备对语音分析的参数变多，这些参数在一定程度上都是提高了对语音识别的精度，在一段时间的积累后，在本地建模多次训练的参数会再次更新上传，再次重复上面的训练步骤，使得模型更加完善。设备A和设备B以后的识别准确率会大大提高，识别的时间会大大减少，在此基础上智能设备的报警系统更加完善，使用的效率也极大的提高，具体流程如图4所示。

本发明利用联邦学习将用户在不同设备的存储的声纹特征、智能设备拍摄异常照片等特定情形，设置一键紧急呼救等报警信息，共同建立本地模型传输到云端。在确保用户隐私不泄露的前提下，将各个设备参数加入到马尔科夫随机场概率图模型G(V，E)，最后上传到云端建立出一个泛化性能高的全局模型。在马尔可夫随机场的加入下，使得联邦建模的参数得到进一步优化，并举例将联合建模的模型应用到家用智能家居上，具体流程如图5所示。

Claims

1.一种基于马尔可夫随机场的联邦学习方法，其特征在于，包括如下步骤：

将参数范围控制在[0,1]之间；

其中m为最大团中的节点的个数，

是新的全局神经网络神经元的值，

是由阈值法挑选出的A，B客户端中相关性大的一对节点；

2.如权利要求1所述的基于马尔可夫随机场的联邦学习方法，其特征在于，步骤1中，大量声音信息具体为：有效数据包括声音的音色、振幅、响度、临界距离和混响程度，噪声声音包含电视、手机发出的虚假报警信息。

3.如权利要求1所述的基于马尔可夫随机场的联邦学习方法，其特征在于，步骤2中，参数内容包括：反映时间、识别准确率、分析时间、单词中选定位置上的基音、激励频谱的估计斜率、选定语言环境中提前发声的存在、鼻辅音中极点频率的位置、选定元音的频谱特性、鼻辅音的频谱特性、选定元音的时长、擦音的频谱特性、元音的共振峰频率和共振峰带宽以及声门源的极点。