CN112926126B - 一种基于马尔可夫随机场的联邦学习方法 - Google Patents
一种基于马尔可夫随机场的联邦学习方法 Download PDFInfo
- Publication number
- CN112926126B CN112926126B CN202110345776.7A CN202110345776A CN112926126B CN 112926126 B CN112926126 B CN 112926126B CN 202110345776 A CN202110345776 A CN 202110345776A CN 112926126 B CN112926126 B CN 112926126B
- Authority
- CN
- China
- Prior art keywords
- parameters
- model
- equipment
- markov
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/13—Architectural design, e.g. computer-aided architectural design [CAAD] related to design of buildings, bridges, landscapes, production plants or roads
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
- G06F18/295—Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Architecture (AREA)
- Civil Engineering (AREA)
- Probability & Statistics with Applications (AREA)
- Structural Engineering (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Alarm Systems (AREA)
Abstract
本发明公开了一种基于马尔可夫随机场的联邦学习方法,利用联邦学习将用户在不同设备的存储的声纹特征、智能设备拍摄异常照片等特定情形,设置一键紧急呼救等报警信息,共同建立本地模型传输到云端,在确保用户隐私不泄露的前提下,将各个设备参数加入到马尔科夫随机场概率图模型G(V,E),最后上传到云端建立出一个泛化性能高的全局模型。本发明在马尔可夫随机场的加入下,使得联邦建模的参数得到进一步优化,并举例将联合建模的模型应用到家用智能家居上。
Description
技术领域
本发明涉及人工智能技术领域,尤其是一种基于马尔可夫随机场的联邦学习方法。
背景技术
所谓智能家居是现代电子技术、自动化技术以及通信技术相结合的产物。它能够自动控制和管理家电设备,对家庭环境的安全进行监控报警,并且能够为住户提供安全舒适、高效便利的学习生活环境。家居智能化系统将家庭中各种信息相关的通信设备、家用电器以及家庭保安装置通过有线或者无线的方式链接起来,并进行集中或异地的监控、管理,保持家庭住宅环境的舒适、协调。与普通的家居相比,智能家居不仅具备传统的居住功能,提供温馨、高效安全的高品位生活环境,还将一个被动静止的居住环境提升一个有一定智慧协助能力的体贴的生活帮手,进一步优化住户的生活质量。现有技术中,家用智能设备报警系统存有部分缺陷,例如单一的家用智能设备对于人的声纹特征并不能特别准确识别,对于监控拍摄到的异常画面会出现错误报警。
发明内容
本发明所要解决的技术问题在于,提供一种基于马尔可夫随机场的联邦学习方法,使得联邦建模的参数得到进一步优化,并将联合建模的模型应用到家用智能家居上。
为解决上述技术问题,本发明提供一种基于马尔可夫随机场的联邦学习方法,包括如下步骤:
步骤1:设备A和设备B分别接受大量声音信息,分别得到各自的数据集DA和DB;
步骤2:设备A和设备B在本地进行语音识别,对输入数据进行数据提取,识别出虚假信息并剔除,将有用信息进行参数信息提取,提取有效的参数信息,进入步骤3;
步骤4:步骤3中参数的取值范围进行归一化处理之后,将参数进行K-MEANS聚类处理,聚类之后的参数相关性更加紧密,后续马尔可夫随机性也是基于参数之间的相关性进行模型建设;
步骤5:在步骤3中参数进行K-MEANS聚类处理之后,参数出现概率的准确性与采样次数是正相关的,而且未出现的参数不一定就是不可能出现为了数据的平滑性,对参数进行Good-Turning平滑处理;
步骤6:定义势函数随后构建马尔可夫随机场最佳的全局模型参数,在最大后验概率MAP框架下,需要通过先验概率和似然概率获得后验概率,进而求得MAP分析出各参数之间的相关性,最终得到概率图模型G(V,E);
步骤7:步骤1到步骤6为参数的预处理,预处理之后设备A和设备B在本地开始进行建模,本地模型参数基于前向神经网络和马尔可夫随机场,每次迭代更新选择的参数仅仅与上一次的参数相关;
步骤8:步骤7为参数基于马尔可夫性在本地建立模型,因为每次迭代仅仅与上一次参数相关,在迭代到上一次参数与本次迭代无区别时,本地迭代结束,至此设备A和B在本地建立好模型,构建全局神经网络根据公式(2)其中m为最大团中的节点的个数,是新的全局神经网络神经元的值,是由阈值法挑选出的A,B客户端中相关性大的一对节点;
步骤9:将步骤8中已经迭代好的本地模型参数,上传到服务器端进行来联合建模,服务器端建模基于BPN-马尔可夫模型进一步得到最优的联合训练参数,每次联合训练完成返回至各个本地设备,与本地模型进行对比,若模型不优于本地模型则进行BPN-马尔可夫模型进行迭代训练联合模型,直至联合训练的模型优于本地模型,服务器端建模完成;
步骤10:步骤9之后,联邦建模的参数返回分发给设备A和设备B,设备A和B在优化的参数基础上更新自己的本地模型,若有新的参数输入进来,重复步骤1-8进行将新的参数开始基于马尔可夫的联邦学习模型迭代。
优选的,步骤1中,大量声音信息具体为:有效数据包括声音的音色、振幅、响度、临界距离和混响程度,噪声声音包含电视、手机发出的虚假报警信息。
优选的,步骤2中,参数内容包括:反映时间、识别准确率、分析时间、单词中选定位置上的基音、激励频谱的估计斜率、选定语言环境中提前发声的存在、鼻辅音中极点频率的位置、选定元音的频谱特性、鼻辅音的频谱特性、选定元音的时长、擦音的频谱特性、元音的共振峰频率和共振峰带宽以及声门源的极点。
本发明的有益效果为:本发明利用联邦学习将用户在不同设备的存储的声纹特征、智能设备拍摄异常照片等特定情形,设置一键紧急呼救等报警信息,共同建立本地模型传输到云端,在确保用户隐私不泄露的前提下,将各个设备参数加入到马尔科夫随机场概率图模型G(V,E),最后上传到云端建立出一个泛化性能高的全局模型;在马尔可夫随机场的加入下,使得联邦建模的参数得到进一步优化,并将联合建模的模型应用到家用智能家居上。
附图说明
图1为本发明的单层神经网络联邦建模示意图。
图2为本发明的联邦马尔可夫建模示意图。
图3为本发明的联邦建模流程示意图。
图4为本发明的设备报警流程示意图。
图5为本发明的家用智能设备安防架构示意图。
具体实施方式
一种基于马尔可夫随机场的联邦学习方法,包括如下步骤:
步骤1:设备A和设备B分别接受大量声音信息,分别得到各自的数据集DA和DB;
步骤2:设备A和设备B在本地进行语音识别,对输入数据进行数据提取,识别出虚假信息并剔除,将有用信息进行参数信息提取,提取有效的参数信息,进入步骤3;
步骤4:步骤3中参数的取值范围进行归一化处理之后,将参数进行K-MEANS聚类处理,聚类之后的参数相关性更加紧密,后续马尔可夫随机性也是基于参数之间的相关性进行模型建设;
步骤5:在步骤3中参数进行K-MEANS聚类处理之后,参数出现概率的准确性与采样次数是正相关的,而且未出现的参数不一定就是不可能出现为了数据的平滑性,对参数进行Good-Turning平滑处理;
步骤6:定义势函数随后构建马尔可夫随机场最佳的全局模型参数,在最大后验概率MAP框架下,需要通过先验概率和似然概率获得后验概率,进而求得MAP分析出各参数之间的相关性,最终得到概率图模型G(V,E),具体如图1所示;
步骤7:步骤1到步骤6为参数的预处理,预处理之后设备A和设备B在本地开始进行建模,本地模型参数基于前向神经网络和马尔可夫随机场,每次迭代更新选择的参数仅仅与上一次的参数相关;
步骤8:步骤7为参数基于马尔可夫性在本地建立模型,因为每次迭代仅仅与上一次参数相关,在迭代到上一次参数与本次迭代无区别时,本地迭代结束,至此设备A和B在本地建立好模型;
步骤9:将步骤8中已经迭代好的本地模型参数,上传到服务器端进行来联合建模,服务器端建模基于BPN-马尔可夫模型进一步得到最优的联合训练参数,每次联合训练完成返回至各个本地设备,与本地模型进行对比,若模型不优于本地模型则进行BPN-马尔可夫模型进行迭代训练联合模型,直至联合训练的模型优于本地模型,服务器端建模完成具体流程如图2所示;
步骤10:步骤9之后,联邦建模的参数返回分发给设备A和设备B,设备A和B在优化的参数基础上更新自己的本地模型,若有新的参数输入进来,重复步骤1-8进行将新的参数开始基于马尔可夫的联邦学习模型迭代,具体流程如图3所示。
某家庭内,存在两个家用智能设备A和设备B,输入不同人的说话声音但内容相同,均为“帮我拨打急救电话,120”。设备A和设备B分别得到大量的语音信息,将其保存在各自的存储器内,归纳整理为两个数据集DA和DB,数据集内容包括声音的音色、振幅、响度、临界距离和混响程度等。在设备A和设备B本地建模分别获得了8个参数和10个参数。在此假设设备A和设备B的模型是一样的。设备A的参数记为xAi,设备B的参数记为xBi,i的取值范围1-10。参数内容包括:反映时间、识别准确率、分析时间、单词中选定位置上的基音、激励频谱的估计斜率、选定语言环境中提前发声的存在、鼻辅音中极点频率的位置、选定元音的频谱特性、鼻辅音的频谱特性、选定元音的时长、擦音的频谱特性、元音的共振峰频率和共振峰带宽以及声门源的极点等。对应于智能设备报警系统参数为U,报警参数本地存储对应UQ集合。特征参数的取值范围进行归一化处理,得到和由于设备B参数仅有8个,在归一化处理之后补充两个参数0,将设备B补充两个参数0为了与设备A参数个数在各自本地训练时保持同一数目。这些参数在本地训练模型时,都满足马尔科夫性,在每次训练的参数都与上一时刻的参数相关,但不同类型的参数互相不干扰,因而在参数训练前加入参数的无监督聚类。在本地建模时,参数的提取由于报警信息的不确定性和未知性,在参数的本地建模过程中加入先验概率,在一定程度上能够提高本地模型的泛化性能。
由于参数的种类繁多,不同设备提取的参数个数不同,为了减少训练的时间,进行参数无监督分类对应与智能家具设备的各种报警设备报警的状况,报警状况也具有很大的随机性,达到报警状态即会触发报警装置。每个设备报警系统相互独立,各个报警参数都独立无标签满足无监督要求。在智能设备报警系统中,每次报警的参数都不一样,在设定报警参数如声音,每次即便输入同一个指令但是每次声音都有随机性从不同角度输入到设备,获取的声音参数每次都与上一次进行比较,满足马尔可夫随机性。由于每次获得的参数仅与上次对比,既提高了处理速度又能保证一定的准确率。
参数进行K-MEANS聚类和古德图灵(Good-Turning)平滑处理,定义势函数随后构建马尔可夫随机场最佳的全局模型参数,在最大后验概率(MAP)框架下,需要通过先验概率和似然概率获得后验概率,进而求得MAP分析出各参数之间的相关性,利用吉布斯分布函数p(u),来简化计算,最终我们得到概率图模型G(V,E)。在这里定义一个势函数的作用为了在马尔可夫随机场中求解吉布斯函数。隐藏层参数至此可以求解出概率图模型G(V,E)。将概率图模型G(V,E)上传到云端处理数据得到一个智能设备A和设备B共建联邦模型,根据BPN梯度计算,进一步求解出最优的隐藏层参数。将基于BPN和马尔可夫随机场优化后的参数联邦学习模型,返回至客户端运用在设备A和设备B上,使得设备A和设备B具有更好的报警系统。
联合建模之后的设备A和设备B获取语音:“帮我拨打小明电话,123456”,设备分别得到数据D'A和D'B,联合建模设备A和设备B分别得到了12个参数,对比建模前两个设备对语音分析的参数变多,这些参数在一定程度上都是提高了对语音识别的精度,在一段时间的积累后,在本地建模多次训练的参数会再次更新上传,再次重复上面的训练步骤,使得模型更加完善。设备A和设备B以后的识别准确率会大大提高,识别的时间会大大减少,在此基础上智能设备的报警系统更加完善,使用的效率也极大的提高,具体流程如图4所示。
本发明利用联邦学习将用户在不同设备的存储的声纹特征、智能设备拍摄异常照片等特定情形,设置一键紧急呼救等报警信息,共同建立本地模型传输到云端。在确保用户隐私不泄露的前提下,将各个设备参数加入到马尔科夫随机场概率图模型G(V,E),最后上传到云端建立出一个泛化性能高的全局模型。在马尔可夫随机场的加入下,使得联邦建模的参数得到进一步优化,并举例将联合建模的模型应用到家用智能家居上,具体流程如图5所示。
Claims (3)
1.一种基于马尔可夫随机场的联邦学习方法,其特征在于,包括如下步骤:
步骤1:设备A和设备B分别接受大量声音信息,分别得到各自的数据集DA和DB;
步骤2:设备A和设备B在本地进行语音识别,对输入数据进行数据提取,识别出虚假信息并剔除,将有用信息进行参数信息提取,提取有效的参数信息,进入步骤3;
步骤4:步骤3中参数的取值范围进行归一化处理之后,将参数进行K-MEANS聚类处理,聚类之后的参数相关性更加紧密,后续马尔可夫随机性也是基于参数之间的相关性进行模型建设;
步骤5:在步骤3中参数进行K-MEANS聚类处理之后,参数出现概率的准确性与采样次数是正相关的,而且未出现的参数不一定就是不可能出现为了数据的平滑性,对参数进行Good-Turning平滑处理;
步骤6:定义势函数随后构建马尔可夫随机场最佳的全局模型参数,在最大后验概率MAP框架下,需要通过先验概率和似然概率获得后验概率,进而求得MAP分析出各参数之间的相关性,最终得到概率图模型G(V,E);
步骤7:步骤1到步骤6为参数的预处理,预处理之后设备A和设备B在本地开始进行建模,本地模型参数基于前向神经网络和马尔可夫随机场,每次迭代更新选择的参数仅仅与上一次的参数相关;
步骤8:步骤7为参数基于马尔可夫性在本地建立模型,因为每次迭代仅仅与上一次参数相关,在迭代到上一次参数与本次迭代无区别时,本地迭代结束,至此设备A和B在本地建立好模型,构建全局神经网络根据公式(2)其中m为最大团中的节点的个数,是新的全局神经网络神经元的值,是由阈值法挑选出的A,B客户端中相关性大的一对节点;
步骤9:将步骤8中已经迭代好的本地模型参数,上传到服务器端进行来联合建模,服务器端建模基于BPN-马尔可夫模型进一步得到最优的联合训练参数,每次联合训练完成返回至各个本地设备,与本地模型进行对比,若模型不优于本地模型则进行BPN-马尔可夫模型进行迭代训练联合模型,直至联合训练的模型优于本地模型,服务器端建模完成;
步骤10:步骤9之后,联邦建模的参数返回分发给设备A和设备B,设备A和B在优化的参数基础上更新自己的本地模型,若有新的参数输入进来,重复步骤1-8进行将新的参数开始基于马尔可夫的联邦学习模型迭代。
2.如权利要求1所述的基于马尔可夫随机场的联邦学习方法,其特征在于,步骤1中,大量声音信息具体为:有效数据包括声音的音色、振幅、响度、临界距离和混响程度,噪声声音包含电视、手机发出的虚假报警信息。
3.如权利要求1所述的基于马尔可夫随机场的联邦学习方法,其特征在于,步骤2中,参数内容包括:反映时间、识别准确率、分析时间、单词中选定位置上的基音、激励频谱的估计斜率、选定语言环境中提前发声的存在、鼻辅音中极点频率的位置、选定元音的频谱特性、鼻辅音的频谱特性、选定元音的时长、擦音的频谱特性、元音的共振峰频率和共振峰带宽以及声门源的极点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110345776.7A CN112926126B (zh) | 2021-03-31 | 2021-03-31 | 一种基于马尔可夫随机场的联邦学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110345776.7A CN112926126B (zh) | 2021-03-31 | 2021-03-31 | 一种基于马尔可夫随机场的联邦学习方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112926126A CN112926126A (zh) | 2021-06-08 |
CN112926126B true CN112926126B (zh) | 2023-04-25 |
Family
ID=76176698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110345776.7A Active CN112926126B (zh) | 2021-03-31 | 2021-03-31 | 一种基于马尔可夫随机场的联邦学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112926126B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114331761B (zh) * | 2022-03-15 | 2022-07-08 | 浙江万胜智能科技股份有限公司 | 一种专变采集终端的设备参数分析调整方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103295236A (zh) * | 2013-05-29 | 2013-09-11 | 湘潭大学 | 马尔可夫多特征随机场模型构建方法及其脑部mr图像分割技术 |
CN108389175A (zh) * | 2018-04-26 | 2018-08-10 | 长安大学 | 融合变差函数和颜色衰减先验的图像去雾方法 |
CN111190487A (zh) * | 2019-12-30 | 2020-05-22 | 中国科学院计算技术研究所 | 一种建立数据分析模型的方法 |
CN111581429A (zh) * | 2020-05-14 | 2020-08-25 | 深圳前海微众银行股份有限公司 | 音乐推送方法、装置、设备及计算机可读存储介质 |
CN111797302A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 模型处理方法、装置、存储介质及电子设备 |
CN111832503A (zh) * | 2020-07-20 | 2020-10-27 | 中国人民武装警察部队工程大学 | 一种基于联邦学习的分心驾驶识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190106867A (ko) * | 2019-08-27 | 2019-09-18 | 엘지전자 주식회사 | 가구의 배치 위치를 가이드하는 인공 지능 장치 및 그의 동작 방법 |
-
2021
- 2021-03-31 CN CN202110345776.7A patent/CN112926126B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103295236A (zh) * | 2013-05-29 | 2013-09-11 | 湘潭大学 | 马尔可夫多特征随机场模型构建方法及其脑部mr图像分割技术 |
CN108389175A (zh) * | 2018-04-26 | 2018-08-10 | 长安大学 | 融合变差函数和颜色衰减先验的图像去雾方法 |
CN111797302A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 模型处理方法、装置、存储介质及电子设备 |
CN111190487A (zh) * | 2019-12-30 | 2020-05-22 | 中国科学院计算技术研究所 | 一种建立数据分析模型的方法 |
CN111581429A (zh) * | 2020-05-14 | 2020-08-25 | 深圳前海微众银行股份有限公司 | 音乐推送方法、装置、设备及计算机可读存储介质 |
CN111832503A (zh) * | 2020-07-20 | 2020-10-27 | 中国人民武装警察部队工程大学 | 一种基于联邦学习的分心驾驶识别方法 |
Non-Patent Citations (2)
Title |
---|
Dongyu Wang ; Xinqiao Tian ; Haoran Cui ; Zhaolin Liu ; .Reinforcement Learning-Based Joint Task Offloading and Migration Schemes Optimization in Mobility-Aware MEC Network.中国通信.2020,(第08期),第46-59页. * |
Ian Read 等.Stochastic and syntactic techniques for predicting phrase breaks.《Computer Speech and Language 21 (2007)》.2006,第519–542页. * |
Also Published As
Publication number | Publication date |
---|---|
CN112926126A (zh) | 2021-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Leroy et al. | Federated learning for keyword spotting | |
US11948552B2 (en) | Speech processing method, apparatus, electronic device, and computer-readable storage medium | |
CN108962237A (zh) | 混合语音识别方法、装置及计算机可读存储介质 | |
CN103971680B (zh) | 一种语音识别的方法、装置 | |
CN110164452A (zh) | 一种声纹识别的方法、模型训练的方法以及服务器 | |
Tong et al. | A comparative study of robustness of deep learning approaches for VAD | |
CN108597496A (zh) | 一种基于生成式对抗网络的语音生成方法及装置 | |
CN108847244A (zh) | 基于mfcc和改进bp神经网络的声纹识别方法及系统 | |
CN111667818B (zh) | 一种训练唤醒模型的方法及装置 | |
CN116738284A (zh) | 通过感测瞬态事件和连续事件的智能装置的情境感知 | |
CN110610709A (zh) | 基于声纹识别的身份辨别方法 | |
DE112020002531T5 (de) | Emotionsdetektion unter verwendung der sprechergrundlinie | |
CN107071193A (zh) | 互动应答系统接入用户的方法和装置 | |
CN105895082A (zh) | 声学模型训练方法、语音识别方法及装置 | |
US11217270B2 (en) | Training data generating method for training filled pause detecting model and device therefor | |
CN112967725A (zh) | 语音对话数据处理方法、装置、计算机设备及存储介质 | |
CN112017632A (zh) | 一种自动化会议记录生成方法 | |
CN112926126B (zh) | 一种基于马尔可夫随机场的联邦学习方法 | |
CN112418059A (zh) | 一种情绪识别的方法、装置、计算机设备及存储介质 | |
CN109242089B (zh) | 递进监督深度学习神经网络训练方法、系统、介质和设备 | |
Lei et al. | Speaker Recognition Using Wavelet Packet Entropy, I‐Vector, and Cosine Distance Scoring | |
CN112017690A (zh) | 一种音频处理方法、装置、设备和介质 | |
CN107393539A (zh) | 一种声音密码控制方法 | |
CN116434758A (zh) | 声纹识别模型训练方法、装置、电子设备及存储介质 | |
CN108831486B (zh) | 基于dnn与gmm模型的说话人识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |