CN116561584A - 基于变分量子电路的语音隐私推断方法、装置及存储介质 - Google Patents
基于变分量子电路的语音隐私推断方法、装置及存储介质 Download PDFInfo
- Publication number
- CN116561584A CN116561584A CN202310633209.0A CN202310633209A CN116561584A CN 116561584 A CN116561584 A CN 116561584A CN 202310633209 A CN202310633209 A CN 202310633209A CN 116561584 A CN116561584 A CN 116561584A
- Authority
- CN
- China
- Prior art keywords
- voice
- processing
- variable component
- component sub
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 110
- 238000003860 storage Methods 0.000 title claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 142
- 238000012549 training Methods 0.000 claims abstract description 76
- 238000001228 spectrum Methods 0.000 claims abstract description 42
- 238000004364 calculation method Methods 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 230000008569 process Effects 0.000 claims description 27
- 238000011176 pooling Methods 0.000 claims description 26
- 238000005457 optimization Methods 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 5
- 238000009432 framing Methods 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 18
- 230000006870 function Effects 0.000 description 14
- 238000013473 artificial intelligence Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000006872 improvement Effects 0.000 description 8
- 238000003062 neural network model Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 108010015780 Viral Core Proteins Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003925 brain function Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000005312 nonlinear dynamic Methods 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
- G06F17/13—Differential equations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Life Sciences & Earth Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Operations Research (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及金融科技技术领域,提供了一种基于变分量子电路的语音隐私推断方法、装置、电子设备及计算机可读存储介质,方法包括:获取语音信号;对语音信号进行预处理得到语音数据;基于第一变分量子电路模型对语音数据进行量子计算处理,得到语音频谱信息,其中,第一变分量子电路模型由预设的第二变分量子电路模型经过稀疏化训练处理而得到;基于预训练的云端网络模型对语音频谱信息进行识别处理,得到语音识别信息,其中,语音识别信息包括语义信息;对语义信息进行推断处理得到语音推断结果。通过上述技术方案可以减少语音推断的计算时间,提高金融行业语音推断的效率。
Description
技术领域
本申请实施例涉及但不限于金融科技技术领域,尤其涉及一种基于变分量子电路的语音隐私推断方法、装置、电子设备及计算机可读存储介质。
背景技术
随着社会经济的不断发展,科技的不断进步,人们的生活水平也在不断地提升,人们也越来越关注个人隐私的保护;隐私计算是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据“可用”但“不可见”的目的;在金融行业中,在充分保护数据和隐私安全的前提下,需要实现数据价值的转化和释放。但是目前的金融行业语音隐私推断方法的计算量大并且比较费时,导致金融行业语音推断的效率较低。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
为了解决上述背景技术中提到的问题,本申请实施例提供了一种基于变分量子电路的语音隐私推断方法、装置、电子设备及计算机可读存储介质,可以减少语音推断的计算时间,提高金融行业语音推断的效率。
第一方面,本申请实施例提供了一种基于变分量子电路的语音隐私推断方法,所述方法包括:
获取语音信号;
对所述语音信号进行预处理得到语音数据;
基于第一变分量子电路模型对所述语音数据进行量子计算处理,得到语音频谱信息,其中,所述第一变分量子电路模型由预设的第二变分量子电路模型经过稀疏化训练处理而得到;
基于预训练的云端网络模型对所述语音频谱信息进行识别处理,得到语音识别信息,其中,所述语音识别信息包括语义信息;
对所述语义信息进行推断处理得到语音推断结果。
根据本申请的一些实施例,所述第二变分量子电路模型包括损失确定模块、量子计算模块和优化模块,所述量子计算模块包括多个门电路,所述第一变分量子电路模型可以通过以下方式得到:
获取初始训练参数;
将所述初始训练参数输入至所述损失确定模块进行计算处理得到问题损失值;
基于预设的选定概率对所述量子计算模块中的多个所述门电路进行选定处理,并且基于选定后的所述门电路对所述问题损失值进行能量预测处理得到能量期望值;
基于所述优化模块对所述初始训练参数进行更新以对所述量子计算模块进行训练处理,直至所述能量期望值处于预设的阈值范围内。
根据本申请的一些实施例,所述云端网络模型包括卷积层、池化层、全连接层,所述云端网络模型的训练过程如下:
获取语音训练频谱集,所述语音训练频谱集包括多个语音训练样本以及与每个所述语音训练样本对应的目标语音输出值;
将所述语音训练样本输入至所述卷积层进行特征提取得到语音特征信息;
将所述语音特征信息输入至所述池化层进行池化操作得到语音采样信息;
将所述语音采样信息输入至所述全连接层进行识别分类处理得到训练语音输出值;
基于所述目标语音输出值和所述训练语音输出值得到误差值;
基于所述误差值对所述卷积层、所述池化层和所述全连接层三者的网络参数进行调整处理。
根据本申请的一些实施例,所述对所述语音信号进行预处理得到语音数据,包括:
对所述语音信号进行预加重处理得到第一语音信号;
对所述第一语音信号进行数字滤波处理得到第二语音信号;
对所述第二语音信号进行加窗分帧处理得到所述语音数据。
根据本申请的一些实施例,所述对所述语义信息进行推断处理得到语音推断结果,包括:
对所述语义信息进行关键词识别处理得到关键词信息;
对所述关键词信息进行分析得到所述语音推断结果。
根据本申请的一些实施例,所述基于第一变分量子电路模型对所述语音数据进行量子处理,得到语音频谱信息,包括:
通过所述第一变分量子电路模型根据量子计算算法对所述语音数据进行量子计算处理,得到所述语音频谱信息;
其中,量子计算算法表示如下:
其中,
R表示旋转门,表示CNOT门操作,M表示测量操作,Ui(θ)为U(θ1,…,θm),m是3,x表示所述语音数据,p表示预设概率,f(x;θ)表示所述语音频谱信息,θ表示门电路调节参数。
根据本申请的一些实施例,所述基于所述误差值对所述卷积层、所述池化层和所述全连接层三者的网络参数进行调整处理,包括:
根据所述误差值对所述全连接层进行第一网络参数修正处理;
根据所述误差值对所述池化层进行第二网络参数修正处理;
根据所述误差值对所述卷积层进行第三网络参数修正处理。
第二方面,本申请实施例还提供了一种基于变分量子电路的语音隐私推断装置,所述装置包括:
第一处理模块,用于获取语音信号;
第二处理模块,用于对所述语音信号进行预处理得到语音数据;
第三处理模块,用于基于第一变分量子电路模型对所述语音数据进行量子计算处理,得到语音频谱信息,其中,所述第一变分量子电路模型由预设的第二变分量子电路模型经过稀疏化训练处理而得到;
第四处理模块,用于基于预训练的云端网络模型对所述语音频谱信息进行识别处理,得到语音识别信息,其中,所述语音识别信息包括语义信息;
第五处理模块,用于对所述语义信息进行推断处理得到语音推断结果。
第三方面,本申请实施例还提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面所述的基于变分量子电路的语音隐私推断方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行如上第一方面所述的基于变分量子电路的语音隐私推断方法。
根据本申请提供的实施例的基于变分量子电路的语音隐私推断方法,至少具有如下有益效果:首先获取语音信号;接着对语音信号进行预处理得到语音数据;接着基于第一变分量子电路模型对语音数据进行量子计算处理,得到语音频谱信息,其中,第一变分量子电路模型由预设的第二变分量子电路模型经过稀疏化训练处理而得到;接着基于预训练的云端网络模型对语音频谱信息进行识别处理,从而得到语音识别信息,其中,语音识别信息包括语义信息;最后对语义信息进行推断处理得到语音推断结果。通过上述技术方案,提高数据的加密性,并且可以减少金融行业语音推断的计算时间,提高金融行业语音推断的效率。
附图说明
附图用来提供对本申请技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1是本申请一个实施例提供的基于变分量子电路的语音隐私推断方法的流程图;
图2是本申请一个实施例提供的基于变分量子电路的语音隐私推断方法中,第二变分量子电路模型的训练过程的流程图;
图3是本申请一个实施例提供的基于变分量子电路的语音隐私推断方法中,云端网络模型的训练过程的流程图;
图4是本申请一个实施例提供的基于变分量子电路的语音隐私推断方法中,对语音信号进行预处理的流程图;
图5是本申请一个实施例提供的基于变分量子电路的语音隐私推断方法中,对语义信息进行推断处理的流程图;
图6是本申请一个实施例提供的基于变分量子电路的语音隐私推断方法中,对语音数据进行量子计算处理的流程图;
图7是本申请一个实施例提供的基于变分量子电路的语音隐私推断方法中,对云端网络模型进行网络参数调整的流程图;
图8是本申请一个实施例提供的基于变分量子电路的语音隐私推断装置的示意图;
图9是本申请一个实施例提供的电子设备的示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要注意的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
需要说明的是,除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;人工智能是计算机科学的一个分支,人工智能企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
人工智能即为AI,AI是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能技术所涉及的服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
本申请提供了一种基于变分量子电路的语音隐私推断方法、装置、电子设备及计算机可读存储介质,首先获取语音信号;接着对语音信号进行预处理得到语音数据;接着基于第一变分量子电路模型对语音数据进行量子计算处理,得到语音频谱信息,其中,第一变分量子电路模型由预设的第二变分量子电路模型经过稀疏化训练处理而得到;接着基于预训练的云端网络模型对语音频谱信息进行识别处理,从而得到语音识别信息,其中,语音识别信息包括语义信息;最后对语义信息进行推断处理得到语音推断结果。通过上述技术方案,提高数据的加密性,并且可以减少语音推断的计算时间,提高金融行业语音推断的效率。
本申请实施例提供的基于变分量子电路的语音隐私推断方法,涉及金融科技技术领域。本申请实施例提供的基于变分量子电路的语音隐私推断方法可应用于终端中,也可应用于服务器端中,还可以是运行于终端或服务器端中的软件。在一些实施例中,终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等;服务器端可以配置成独立的物理服务器,也可以配置成多个物理服务器构成的服务器集群或者分布式系统,还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN以及大数据和人工智能平台等基础云计算服务的云服务器;软件可以是实现基于变分量子电路的语音隐私推断方法的应用等,但并不局限于以上形式。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
需要说明的是,在本申请的各个具体实施方式中,当涉及到需要根据用户信息、用户行为数据,用户历史数据以及用户位置信息等与用户身份或特性相关的数据进行相关处理时,都会先获得用户的许可或者同意,而且,对这些数据的收集、使用和处理等,都会遵守相关法律法规和标准。此外,当本申请实施例需要获取用户的敏感个人信息时,会通过弹窗或者跳转到确认页面等方式获得用户的单独许可或者单独同意,在明确获得用户的单独许可或者单独同意之后,再获取用于使本申请实施例能够正常运行的必要的用户相关数据。
下面结合附图,对本申请实施例作进一步阐述。
如图1所示,图1是本申请一个实施例提供的基于变分量子电路的语音隐私推断方法的流程图,该基于变分量子电路的语音隐私推断方法包括但不限于步骤S100至S500。
步骤S100,获取语音信号;
步骤S200,对语音信号进行预处理得到语音数据;
步骤S300,基于第一变分量子电路模型对语音数据进行量子计算处理,得到语音频谱信息,其中,第一变分量子电路模型由预设的第二变分量子电路模型经过稀疏化训练处理而得到;
步骤S400,基于预训练的云端网络模型对语音频谱信息进行识别处理,得到语音识别信息,其中,语音识别信息包括语义信息;
步骤S500,对语义信息进行推断处理得到语音推断结果。
需要说明的是,首先获取语音信号;接着对语音信号进行预处理得到语音数据;接着基于第一变分量子电路模型对语音数据进行量子计算处理,得到语音频谱信息,其中,第一变分量子电路模型由预设的第二变分量子电路模型经过稀疏化训练处理而得到;接着基于预训练的云端网络模型对语音频谱信息进行识别处理,从而得到语音识别信息,其中,语音识别信息包括语义信息;最后对语义信息进行推断处理得到语音推断结果。通过上述技术方案,提高数据的加密性,并且可以减少语音推断的计算时间,提高语音推断的效率。其中,在金融行业中,例如为银行业务,基于变分量子电路的语音隐私推断方法可以包括获取语音信号,接着对语音信号进行预处理就可以得到语音数据;接着基于第一变分量子电路模型对语音数据进行量子计算处理就可以得到语音频谱信息,其中,第一变分量子电路模型由预设的第二变分量子电路模型经过稀疏化训练处理而得到,接着基于预训练的云端网络模型对语音频谱信息进行识别处理就可以得到语音识别信息,其中,语音识别信息包括语义信息;最后对语义信息进行推断处理就可以得到相应的银行业务推断结果。
值得注意的是,本申请实施例中的语音信号的获取是需要经过用户认可确定的,并非在用户不知情的情况下而获得;在获取语音信号的过程中都会先获得用户的许可或者同意,而且,对这些数据的收集、使用和处理等,都会遵守相关国家和地区的相关法律法规和标准。当本申请实施例需要获取用户的敏感个人信息时,会通过弹窗或者跳转到确认页面等方式获得用户的单独许可或者单独同意,在明确获得用户的单独许可或者单独同意之后,再获取用于使本申请实施例能够正常运行的必要的用户相关数据。
值得注意的是,第一变分量子电路模型是由预设的第二变分量子电路模型经过稀疏化训练处理而得到的,稀疏化处理能够很好地简化后续的量子计算的复杂度,能够减少语音推断的计算时间,从而提高语音推断的效率。
需要说明的是,变分量子算法就是用一个经典优化器来训练一个含参量子电路,整个算法的思路有点类似机器学习;变分量子算法的主要优点之一是它们提供了一个通用的框架,可用于解决各种各样的问题;对于一个优化问题,由一个参数化量子电路产生的可观测状态的期望值来定义损失函数;然后将参数优化外包给经典优化器,经典计算机通过优化电路参数的期望值来训练量子电路。
值得注意的是,云端网络模型即位于云端服务器的网络模型;其中,云服务器(Elastic Compute Service,ECS)是一种简单高效、安全可靠、处理能力可弹性伸缩的计算服务;其管理方式比物理服务器更简单高效。用户无需提前购买硬件,即可迅速创建或释放任意多台云服务器;云服务器是云计算服务的重要组成部分,是面向各类互联网用户提供综合业务能力的服务平台。平台整合了传统意义上的互联网应用三大核心要素:计算、存储、网络,面向用户提供公用化的互联网基础设施服务;云服务器服务包括两个核心产品:面向中小企业用户与高端用户的云服务器租用服务;面向大中型互联网用户的弹性计算平台服务;云服务器平台的每个集群节点被部署在互联网的骨干数据中心,可独立提供计算、存储、在线备份、托管、带宽等互联网基础设施服务。
需要说明的是,网络模型可以为神经网络模型,神经网络模型可以包括前馈神经网络模型和反馈神经网络模型,而前馈神经网络模型又可以包括卷积神经网络模型、全连接神经网络模型和生成对抗网络模型。其中,神经网络在系统辨识、模式识别、智能控制等领域有着广泛而吸引人的前景,特别在智能控制中,人们对神经网络的自学习功能尤其感兴趣,并且把神经网络这一重要特点看作是解决自动控制中控制器适应能力这个难题的关键钥匙之一。神经网络是由大量的、简单的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统。神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。
在一些实施例中,如图2所示,第二变分量子电路模型包括损失确定模块、量子计算模块和优化模块,量子计算模块包括多个门电路,第一变分量子电路模型可以通过但不限于步骤S310至步骤S340而得到。
步骤S310,获取初始训练参数;
步骤S320,将初始训练参数输入至损失确定模块进行计算处理得到问题损失值;
步骤S330,基于预设的选定概率对量子计算模块中的多个门电路进行选定处理,并且基于选定后的门电路对问题损失值进行能量预测处理得到能量期望值;
步骤S340,基于优化模块对初始训练参数进行更新以对量子计算模块进行训练处理,直至能量期望值处于预设的阈值范围内。
需要说明的是,预设的第二变分量子电路模型包括损失确定模块、量子计算模块和优化模块,其中,量子计算模块包括多个门电路;在对第二变分量子电路模型进行训练的过程中,首先获取初始训练参数;接着将初始训练参数输入到损失确定模块进行计算处理就可以得到问题损失值;接着基于预设的选定概率对量子计算模块中的门电路进行选定处理,并且基于选定后的门电路对问题损失值进行能量预测处理得到能量期望值;最后基于优化模块对初始训练参数进行更新以对量子计算模块进行训练迭代处理,直至能量期望值处于预设的阈值范围内。
值得注意的是,基于预设的选定概率对量子计算模块中的多个门电路进行选定处理,从而能够很好地简化后续的计算复杂度,即对量子计算模块进行稀疏化处理。
可以理解的是,基于优化模块对初始训练参数进行更新处理,并且基于更新后的训练参数重新对量子计算模块进行训练处理,直至通过量子计算模块得到的能量期望值处于预设的阈值范围内。示例性地,如果设定的能量阈值范围为10-15,当上次计算得到的能量期望值为9的情况下,继续对训练参数进行更新处理,重新对量子计算模块进行训练处理,当这次得到的能量期望值为11的情况下,就会停止更新训练参数,对量子计算模块完成训练处理。
需要说明的是,在对银行行业的语音进行隐私推断处理之前,可以获取初始训练参数,接着将初始训练参数输入至损失确定模块进行计算处理得到问题损失值;接着基于预设的选定概率对量子计算模块中的多个门电路进行选定处理,并且基于选定后的门电路对问题损失值进行能量预测处理得到能量期望值;最后基于优化模块对初始训练参数进行更新以对量子计算模块进行训练处理,直至能量期望值处于预设的阈值范围内。
在一些实施例中,如图3所示,云端网络模型包括卷积层、池化层、全连接层,云端网络模型的训练过程可以包括但不限于步骤S410至步骤S460。
步骤S410,获取语音训练频谱集,语音训练频谱集包括多个语音训练样本以及与每个语音训练样本对应的目标语音输出值;
步骤S420,将语音训练样本输入至卷积层进行特征提取得到语音特征信息;
步骤S430,将语音特征信息输入至池化层进行池化操作得到语音采样信息;
步骤S440,将语音采样信息输入至全连接层进行识别分类处理得到训练语音输出值;
步骤S450,基于目标语音输出值和训练语音输出值得到误差值;
步骤S460,基于误差值对卷积层、池化层和全连接层三者的网络参数进行调整处理。
需要说明的是,在对云端网络模型进行训练的过程中,首先获取语音训练频谱集,其中,语音训练频谱集包括多个语音训练样本以及与每个语音训练样本对应的目标语音输出值;接着将语音训练样本输入至卷积层进行特征提取得到语音特征信息;接着将语音特征信息输入至池化层进行池化操作得到语音采样信息;然后将语音采样信息输入至全连接层进行识别分类处理得到训练语音输出值;接着基于目标语音输出值和训练语音输出值得到误差值;最后基于误差值对卷积层、池化层和全连接层三者的网络参数进行调整处理。
值得注意的是,云端网络模型包括卷积层、池化层和全连接层,其中,卷积层能够进行特征提取,池化层能够进行采样处理,全连接层能够进行分类处理。
值得注意的是,在金融行业中,对云端网络模型的训练过程可以通过以下方式,获取语音训练频谱集,接着将语音训练样本输入至卷积层进行特征提取得到语音特征信息;接着将语音特征信息输入至池化层进行池化操作得到语音采样信息;然后将语音采样信息输入至全连接层进行识别分类处理得到训练语音输出值;接着基于目标语音输出值和训练语音输出值得到误差值;最后基于误差值对卷积层、池化层和全连接层三者的网络参数进行调整处理。
在一些实施例中,如图4所示,上述步骤S200可以包括但不限于步骤S210、步骤S220和步骤S230。
步骤S210,对语音信号进行预加重处理得到第一语音信号;
步骤S220,对第一语音信号进行数字滤波处理得到第二语音信号;
步骤S230,对第二语音信号进行加窗分帧处理得到语音数据。
需要说明的是,在对语音信号进行预处理的过程中,首先对语音信号进行预加重处理得到第一语音信号;接着对第一语音信号进行数字滤波处理得到第二语音信号;最后对第二语音信号进行加窗分帧处理就可以得到语音数据。
值得注意的是,语音信号是一种非平稳的时变信号,它携带着各种信息;在语音编码、语音合成、语音识别和语音增强等语音处理中都需要提取语音中包含的各种信息。一般而言语音处理的目的有两种:一种是对语音信号进行分析,提取特征参数,用于后续处理;另一种是加工语音信号,例如在语音增强中对含噪语音进行背景噪声抑制,以获得相对“干净”的语音;在语音合成方中需要对分段语音进行拼接平滑,获得主观音质较高的合成语音,这方面的应用同样是建立在分析并提取语音信号信息的基础上的;总之,语音信号分析的目的就在于方便有效地提取并表示语音信号所携带的信息。其中,在保险行业中,对保险语音信号进行预加重处理就可以得到第一语音信号;然后对第一语音信号进行数字滤波处理就可以得到第二语音信号;最后对第二语音信号进行加窗分帧处理就可以得到语音数据。
在一些实施例中,如图5所示,上述步骤S500之后还可以包括但不限于步骤S510和步骤S520。
步骤S510,对语义信息进行关键词识别处理得到关键词信息;
步骤S520,对关键词信息进行分析得到语音推断结果。
需要说明的是,在对语义信息进行推断的过程中,首先对语义信息进行关键词识别处理,从而得到关键词信息;接着对关键词信息进行分析处理就可以得到语音推断结果。
值得注意的是,对语义信息进行关键词识别处理即从语义信息中提取出关键词;接着对上述提取得到的关键词进行分析处理就可以得到相应的语音推断结果。其中,可以利用卷积神经网络对语义信息进行关键词识别处理。
在一些实施例中,如图6所示,上述步骤S300可以包括但不限于步骤S350。
步骤S350,通过第一变分量子电路模型根据量子计算算法对语音数据进行量子计算处理,得到语音频谱信息。
其中,量子计算算法表示如下:
其中,
R表示旋转门,表示CNOT门操作,M表示测量操作,Ui(θ)为U(θ1,…,θm),m是3,x表示语音数据,p表示预设概率,f(x;θ)表示语音频谱信息,θ表示门电路调节参数。
需要说明的是,基于上述的量子计算算法就可以对语音数据进行量子计算处理,得到相应的语音频谱信息。
在一些实施例中,如图7所示,上述步骤S460可以包括但不限于步骤S461、步骤S462和步骤S463。
步骤S461,根据误差值对全连接层进行第一网络参数修正处理;
步骤S462,根据误差值对池化层进行第二网络参数修正处理;
步骤S463,根据误差值对卷积层进行第三网络参数修正处理。
需要说明的是,在对云端网络模型进行训练过程中,需要对云端网络模型进行网络参数调整处理,首先根据误差值对全连接层进行第一网络参数修正处理,接着根据误差值对池化层进行第二网络参数修正处理,最后根据误差值对卷积层进行第三网络参数修正处理,通过上述方式实现反向传播,对相关的网络参数进行修正处理。
另外,如图8所示,本申请的一个实施例还提供了一种基于变分量子电路的语音隐私推断装置10,包括:
第一处理模块100,用于获取语音信号;
第二处理模块200,用于对语音信号进行预处理得到语音数据;
第三处理模块300,用于基于第一变分量子电路模型对语音数据进行量子计算处理,得到语音频谱信息,其中,第一变分量子电路模型由预设的第二变分量子电路模型经过稀疏化训练处理而得到;
第四处理模块400,用于基于预训练的云端网络模型对语音频谱信息进行识别处理,得到语音识别信息,其中,语音识别信息包括语义信息;
第五处理模块500,用于对语义信息进行推断处理得到语音推断结果。
需要说明的是,首先获取语音信号;接着对语音信号进行预处理得到语音数据;接着基于第一变分量子电路模型对语音数据进行量子计算处理,得到语音频谱信息,其中,第一变分量子电路模型由预设的第二变分量子电路模型经过稀疏化训练处理而得到;接着基于预训练的云端网络模型对语音频谱信息进行识别处理,从而得到语音识别信息,其中,语音识别信息包括语义信息;最后对语义信息进行推断处理得到语音推断结果。通过上述技术方案,提高数据的加密性,并且可以减少语音推断的计算时间,提高语音推断的效率。
值得注意的是,第一变分量子电路模型是由预设的第二变分量子电路模型经过稀疏化训练处理而得到的,稀疏化处理能够很好地简化后续的量子计算的复杂度,能够减少语音推断的计算时间,从而提高语音推断的效率。
需要说明的是,变分量子算法就是用一个经典优化器来训练一个含参量子电路,整个算法的思路有点类似机器学习;变分量子算法的主要优点之一是它们提供了一个通用的框架,可用于解决各种各样的问题;对于一个优化问题,由一个参数化量子电路产生的可观测状态的期望值来定义损失函数;然后将参数优化外包给经典优化器,经典计算机通过优化电路参数的期望值来训练量子电路。
该基于变分量子电路的语音隐私推断装置的具体实施方式与上述基于变分量子电路的语音隐私推断方法的具体实施例基本相同,在此不再赘述。
另外,如图9所示,本申请的一个实施例还提供了一种电子设备700,该设备包括:存储器720、处理器710及存储在存储器720上并可在处理器710上运行的计算机程序。
处理器710和存储器720可以通过总线或者其他方式连接。
实现上述实施例的基于变分量子电路的语音隐私推断方法所需的非暂态软件程序以及指令存储在存储器720中,当被处理器710执行时,执行上述各实施例的基于变分量子电路的语音隐私推断方法,例如,执行以上描述的图1中的方法步骤S100至S500、图2中的方法步骤S310至S340、图3中的方法步骤S410至S460、图4中的方法步骤S210至S230、图5中的方法步骤S510至S520、图6中的方法步骤S350和图7中的方法步骤S461至S463。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
此外,本申请的一个实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个处理器710或控制器执行,例如,被上述设备实施例中的一个处理器710执行,可使得上述处理器710执行上述实施例中的基于变分量子电路的语音隐私推断方法,例如,执行以上描述的图1中的方法步骤S100至S500、图2中的方法步骤S310至S340、图3中的方法步骤S410至S460、图4中的方法步骤S210至S230、图5中的方法步骤S510至S520、图6中的方法步骤S350和图7中的方法步骤S461至S463。
上述各实施例可以结合使用,不同实施例之间名称相同的模块可相同可不同。
上述对本申请特定实施例进行了描述,其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,附图中描绘的过程不一定必须按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例提供的装置、设备、计算机可读存储介质与方法是对应的,因此,装置、设备、非易失性计算机存储介质也具有与对应方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述对应装置、设备、计算机存储介质的有益技术效果。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请实施例可提供为方法、系统、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(Flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(Transitory Media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本申请实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示单独存在A、同时存在A和B、单独存在B的情况。其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达,是指的这些项中的任意组合,包括单项或复数项的任意组合。例如,a,b和c中的至少一项可以表示:a,b,c,a和b,a和c,b和c或a和b和c,其中a,b,c可以是单个,也可以是多个。
本申请实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种基于变分量子电路的语音隐私推断方法,其特征在于,所述方法包括:
获取语音信号;
对所述语音信号进行预处理得到语音数据;
基于第一变分量子电路模型对所述语音数据进行量子计算处理,得到语音频谱信息,其中,所述第一变分量子电路模型由预设的第二变分量子电路模型经过稀疏化训练处理而得到;
基于预训练的云端网络模型对所述语音频谱信息进行识别处理,得到语音识别信息,其中,所述语音识别信息包括语义信息;
对所述语义信息进行推断处理得到语音推断结果。
2.根据权利要求1所述的基于变分量子电路的语音隐私推断方法,其特征在于,所述第二变分量子电路模型包括损失确定模块、量子计算模块和优化模块,所述量子计算模块包括多个门电路,所述第一变分量子电路模型可以通过以下方式得到:
获取初始训练参数;
将所述初始训练参数输入至所述损失确定模块进行计算处理得到问题损失值;
基于预设的选定概率对所述量子计算模块中的多个所述门电路进行选定处理,并且基于选定后的所述门电路对所述问题损失值进行能量预测处理得到能量期望值;
基于所述优化模块对所述初始训练参数进行更新以对所述量子计算模块进行训练处理,直至所述能量期望值处于预设的阈值范围内。
3.根据权利要求1所述的基于变分量子电路的语音隐私推断方法,其特征在于,所述云端网络模型包括卷积层、池化层、全连接层,所述云端网络模型的训练过程如下:
获取语音训练频谱集,所述语音训练频谱集包括多个语音训练样本以及与每个所述语音训练样本对应的目标语音输出值;
将所述语音训练样本输入至所述卷积层进行特征提取得到语音特征信息;
将所述语音特征信息输入至所述池化层进行池化操作得到语音采样信息;
将所述语音采样信息输入至所述全连接层进行识别分类处理得到训练语音输出值;
基于所述目标语音输出值和所述训练语音输出值得到误差值;
基于所述误差值对所述卷积层、所述池化层和所述全连接层三者的网络参数进行调整处理。
4.根据权利要求1所述的基于变分量子电路的语音隐私推断方法,其特征在于,所述对所述语音信号进行预处理得到语音数据,包括:
对所述语音信号进行预加重处理得到第一语音信号;
对所述第一语音信号进行数字滤波处理得到第二语音信号;
对所述第二语音信号进行加窗分帧处理得到所述语音数据。
5.根据权利要求1所述的基于变分量子电路的语音隐私推断方法,其特征在于,所述对所述语义信息进行推断处理得到语音推断结果,包括:
对所述语义信息进行关键词识别处理得到关键词信息;
对所述关键词信息进行分析得到所述语音推断结果。
6.根据权利要求1所述的基于变分量子电路的语音隐私推断方法,其特征在于,所述基于第一变分量子电路模型对所述语音数据进行量子处理,得到语音频谱信息,包括:
通过所述第一变分量子电路模型根据量子计算算法对所述语音数据进行量子计算处理,得到所述语音频谱信息;
其中,量子计算算法表示如下:
其中,
R表示旋转门,表示CNOT门操作,M表示测量操作,Ui(θ)为U(θ1,…,θm),m是3,x表示所述语音数据,p表示预设概率,f(x;θ)表示所述语音频谱信息,θ表示门电路调节参数。
7.根据权利要求3所述的基于变分量子电路的语音隐私推断方法,其特征在于,所述基于所述误差值对所述卷积层、所述池化层和所述全连接层三者的网络参数进行调整处理,包括:
根据所述误差值对所述全连接层进行第一网络参数修正处理;
根据所述误差值对所述池化层进行第二网络参数修正处理;
根据所述误差值对所述卷积层进行第三网络参数修正处理。
8.一种基于变分量子电路的语音隐私推断装置,其特征在于,所述装置包括:
第一处理模块,用于获取语音信号;
第二处理模块,用于对所述语音信号进行预处理得到语音数据;
第三处理模块,用于基于第一变分量子电路模型对所述语音数据进行量子计算处理,得到语音频谱信息,其中,所述第一变分量子电路模型由预设的第二变分量子电路模型经过稀疏化训练处理而得到;
第四处理模块,用于基于预训练的云端网络模型对所述语音频谱信息进行识别处理,得到语音识别信息,其中,所述语音识别信息包括语义信息;
第五处理模块,用于对所述语义信息进行推断处理得到语音推断结果。
9.一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述的基于变分量子电路的语音隐私推断方法。
10.一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令用于执行权利要求1至7中任意一项所述的基于变分量子电路的语音隐私推断方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310633209.0A CN116561584A (zh) | 2023-05-31 | 2023-05-31 | 基于变分量子电路的语音隐私推断方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310633209.0A CN116561584A (zh) | 2023-05-31 | 2023-05-31 | 基于变分量子电路的语音隐私推断方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116561584A true CN116561584A (zh) | 2023-08-08 |
Family
ID=87489855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310633209.0A Pending CN116561584A (zh) | 2023-05-31 | 2023-05-31 | 基于变分量子电路的语音隐私推断方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116561584A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407922A (zh) * | 2023-12-11 | 2024-01-16 | 成都信息工程大学 | 一种基于量子噪声的联邦学习隐私保护系统及方法 |
-
2023
- 2023-05-31 CN CN202310633209.0A patent/CN116561584A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407922A (zh) * | 2023-12-11 | 2024-01-16 | 成都信息工程大学 | 一种基于量子噪声的联邦学习隐私保护系统及方法 |
CN117407922B (zh) * | 2023-12-11 | 2024-03-22 | 成都信息工程大学 | 一种基于量子噪声的联邦学习隐私保护系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112699991B (zh) | 用于加速神经网络训练的信息处理的方法、电子设备和计算机可读介质 | |
CN112257858B (zh) | 一种模型压缩方法及装置 | |
JP2021508866A (ja) | 対象領域およびクライアント固有のアプリケーション・プログラム・インタフェース推奨の促進 | |
US20200342893A1 (en) | Electronic device and control method therefor | |
US20210383205A1 (en) | Taxonomy Construction via Graph-Based Cross-domain Knowledge Transfer | |
US20230401382A1 (en) | Dynamic Language Models for Continuously Evolving Content | |
WO2021127982A1 (zh) | 语音情感识别方法、智能装置和计算机可读存储介质 | |
CN114091466B (zh) | 一种基于Transformer和多任务学习的多模态情感分析方法及系统 | |
US20220277031A1 (en) | Guided exploration for conversational business intelligence | |
US20230092274A1 (en) | Training example generation to create new intents for chatbots | |
CN112580352A (zh) | 关键词提取方法、装置和设备及计算机存储介质 | |
CN116561584A (zh) | 基于变分量子电路的语音隐私推断方法、装置及存储介质 | |
WO2022009005A1 (en) | Continual learning using cross connections | |
US20190034408A1 (en) | Unsupervised Template Extraction | |
Yu et al. | A Deep Domain‐Adversarial Transfer Fault Diagnosis Method for Rolling Bearing Based on Ensemble Empirical Mode Decomposition | |
CN116306672A (zh) | 一种数据处理方法及其装置 | |
CN116957006A (zh) | 预测模型的训练方法、装置、设备、介质及程序产品 | |
CN116450943A (zh) | 基于人工智能的话术推荐方法、装置、设备及存储介质 | |
US11762896B2 (en) | Relationship discovery and quantification | |
Zhang et al. | An encrypted speech retrieval scheme based on long short-term memory neural network and deep hashing | |
Vavra et al. | Optimization of the novelty detection model based on LSTM autoencoder for ICS environment | |
Jiang et al. | SROC: a speaker recognition with data decision level fusion method in cloud environment | |
Ramírez-Hernández et al. | A Comparison Between MFCC and MSE Features for Text-Independent Speaker Recognition Using Machine Learning Algorithms | |
CN117216107B (zh) | 人员信息存储方法、装置、电子设备和计算机可读介质 | |
Bhatt et al. | Neuromorphic computing in speech recognition using nano-devices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |