CN111199740B - 一种基于边缘计算加速自动语音识别任务的卸载方法 - Google Patents

一种基于边缘计算加速自动语音识别任务的卸载方法 Download PDF

Info

Publication number
CN111199740B
CN111199740B CN201911408237.2A CN201911408237A CN111199740B CN 111199740 B CN111199740 B CN 111199740B CN 201911408237 A CN201911408237 A CN 201911408237A CN 111199740 B CN111199740 B CN 111199740B
Authority
CN
China
Prior art keywords
task
recognition task
voice recognition
base station
automatic voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911408237.2A
Other languages
English (en)
Other versions
CN111199740A (zh
Inventor
李秀华
徐峥辉
袁传奇
程诗桐
毛玉星
李剑
范琪琳
王悦阳
唐永川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201911408237.2A priority Critical patent/CN111199740B/zh
Publication of CN111199740A publication Critical patent/CN111199740A/zh
Application granted granted Critical
Publication of CN111199740B publication Critical patent/CN111199740B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于边缘计算加速自动语音识别任务的卸载方法,主要步骤为:1)建立边缘通信系统,包括云服务器、若干基站和若干用户端。每个基站均设有边缘服务器。2)用户端向基站发送自动语音识别任务。3)基站接收到自动语音识别任务后,将自动语音识别任务发送至云服务器。4)建立自动语音识别任务卸载模型。5)利用交替迭代的方法对自动语音识别任务卸载模型进行解算,得到最后任务卸载策略。本发明缓解了云服务器的压力,提高了用户使用智能应用时的体验,满足高精度、低时延的任务需求。

Description

一种基于边缘计算加速自动语音识别任务的卸载方法
技术领域
本发明涉及边缘计算和深度学习,具体是一种基于边缘计算加速自动语音识别任务的卸载方法。
背景技术
随着当前移动网络中智能应用的快速增长,用户在使用移动设备时更喜欢音频输入,而不是文本输入。因此,生成了大量音频转化文字的自动语音识别任务,这些任务的主要目的是满足移动用户的音频服务要求,但是移动设备受电池电量和计算能力的限制,在处理海量任务时通常不能保证用户的服务质量。为了应对上述挑战,有必要在为下一代移动网络(即5G)开发的新网络架构上引入先进的自动语音识别技术和网络技术。
目前,有关自动语音识别最成功的应用是智能个人助理,如AppleSiri、GoogleNow和MicrosoftCortana。然而,它们所用神经网络模型的计算量也呈爆炸式增长,导致个人的移动设备很难进行处理。因此,这是由于云平台具有充足的资源,此类自动语音识别任务的计算通常是在云平台上进行的。但由于云服务器部署在远离移动用户的地方,基于云平台的自动语音识别任务处理延迟一般较大。
边缘计算是近年来出现的一种能够减轻云服务器工作量的技术,通过将部分任务卸载到更接近用户的边缘服务器上,使网络传输时延大大降低从而达到用户体验显著提高的效果。因此,边缘计算技术在处理任务方面具有更广阔的应用前景,但是现有的边缘计算技术仍然存在着一些漏洞:第一,一旦边缘计算系统中出现大量移动终端时,由于计算能力的限制,边缘服务器将无法很好地进行处理导致计算时延增长,用户体验下降;第二,边缘计算的研究者仅考虑了一般任务而没有考虑自动语音识别任务,并且这方面的卸载问题也没有得到很好的解决。
发明内容
本发明的目的是解决现有自动语音识别技术应用中存在的问题。
为实现本发明目的而采用的技术方案为一种基于边缘计算加速自动语音识别任务的卸载方法,主要包括以下步骤:
1)建立边缘通信系统,包括云服务器、若干基站和若干用户端。每个基站均设有边缘服务器。
2)用户端向基站发送携带音频文件的自动语音识别任务。
3)基站接收到自动语音识别任务后,采集音频数据,再将自动语音识别任务发送至云服务器,发送方式包括以下两种:
I)基站对自动语音识别任务进行数据压缩,再发送至云服务器,主要步骤如下:
a)基站在接收到自动语音识别任务后,将所述自动语音识别任务输入到存储在边缘服务器内的梅尔滤波器中,对自动语音识别任务进行滤波,将自动语音识别任务的音频数据转换为梅尔频率倒谱系数。梅尔滤波器对自动语音识别任务进行压缩的压缩率为
Figure BDA0002349252590000021
b)将处理后的自动语音识别任务输入到存储在边缘服务器内的深度神经网络中。所述深度神经网络包括P层卷积层和Q层池化层。
深度神经网络对滤波后的自动语音识别任务进行压缩的压缩率Cs如下所示:
Figure BDA0002349252590000022
式中,
Figure BDA0002349252590000023
Figure BDA0002349252590000024
为初始自动语音识别任务的长和宽。
Figure BDA0002349252590000025
Figure BDA0002349252590000026
为压缩完成后自动语音识别任务的长与宽。H0为自动语音识别任务的深度。
II)基站直接将自动语音识别任务发送至云服务器。
4)建立自动语音识别任务卸载模型。
建立自动语音识别任务卸载模型的主要步骤如下:
4.1)计算第s个用户端的自动语音识别任务传输到第t个基站的传输时延
Figure BDA0002349252590000027
即:
Figure BDA0002349252590000028
式中,Xts表示第s个任务和第t个边缘服务器之间的传输速率。vts表示第t个边缘服务器分配给第s个任务的计算资源。wts∈{0,1}表示第s个任务是否被卸载和处理。wts=1表示第t个边缘服务器使用编码器对第s个任务进行数据压缩,wts=0表示第t个边缘服务器不进行数据压缩。i0为常数。gts表示基站和自动语音识别任务的关联性。gts=1表示第s个任务与第t个基站之间有关联。gts=0表示第s个任务与第t个基站之间没有关联。ks表示第s个任务需要的计算周期。os表示第s个任务的数据大小。T为基站总数,S为任务总数。
第s个任务和第t个边缘服务器之间的传输速率Rnm如下所示:
Figure BDA0002349252590000031
式中,Bs、Ps、rts
Figure BDA0002349252590000032
分别表示第s个用户端到第t个基站的传输带宽、传输功率、信道增益和噪声功率。
4.2)计算第s个用户端的自动语音识别任务传输到第t个基站的计算时延
Figure BDA0002349252590000033
即:
Figure BDA0002349252590000034
式中,Cs为压缩率。Xt表示将第t个基站发送数据压缩后的第s个任务和云服务器处理第s个任务之间的平均链路传输速率。X0表示云服务器处理任务的平均计算速度。
4.3)计算第s个用户端将第s个任务通过第t个基站传送到云服务器,并由云服务器处理第s个任务的时延
Figure BDA0002349252590000035
即:
Figure BDA0002349252590000036
4.4)建立自动语音识别任务卸载模型的总时延函数Dtot,即:
Figure BDA0002349252590000037
5)利用交替迭代的方法对自动语音识别任务卸载模型进行解算,得到最短传输时延的自动语音识别任务卸载策略。
利用交替迭代的方法对自动语音识别任务卸载模型进行解算的方法为:利用交替迭代方法对自动语音识别任务卸载模型的目标函数Dtot进行迭代解算,计算出时延最大的任务对应的表征第s个任务是否被卸载和处理的参数wts和计算资源vts的值,从而得到最短传输延迟的卸载策略。
总的来说,本发明将部分用户使用智能终端后产生的自动语音识别任务卸载至边缘服务器,其中满足用户关联和边缘服务器的存储、计算能力等约束条件。使用梅尔滤波器将卸载至边缘服务器的音频数据转换为梅尔频率倒谱系数。在边缘服务器上部署卷积神经网络模型,作为编码器,将梅尔滤波器处理过后的数据进行一系列卷积与池化操作,提取深层特征。最后将处理完成的音频数据特征值上传至云服务器,进行解码。
使用本发明能够带来一定的增益效果。本发明合理地选择自动语音识别任务卸载到边缘服务器上,通过在边缘服务器上部署卷积神经网络模型对用户上传的数据进行压缩,大大减少了自动语音识别任务的处理时延,缓解了云服务器的压力,提高了用户使用智能应用时的体验,满足高精度、低时延的任务需求。
附图说明
图1为边缘通信系统示意图;
图2为基于边缘计算加速自动语音识别任务的卸载方法流程图;
图3为得出卸载策略的算法流程图;
图4为在不同计算能力下本发明与其他卸载策略的结果对比图;
图5为在不同存储能力下本发明与其他卸载策略的结果对比图。
具体实施方式
下面结合实施例对本发明作进一步说明,但不应该理解为本发明上述主题范围仅限于下述实施例。在不脱离本发明上述技术思想的情况下,根据本领域普通技术知识和惯用手段,做出各种替换和变更,均应包括在本发明的保护范围内。
实施例1:
参照图1至图2,一种基于边缘计算加速自动语音识别任务的卸载方法,主要包括以下步骤:
1)建立边缘通信系统,包括云服务器、若干基站和若干用户端。每个基站均设有边缘服务器。
进一步,S个移动用户生成S个语音自动识别任务,并通过无线蜂窝链路将其发送到本地基站,本发明使用集合
Figure BDA0002349252590000041
表示所有语音自动识别任务,{o1,o2,…,os}和{k1,k2,…,kS}分别表示任务的数据大小和需要计算周期。在边缘层,每个本地基站都部署有一个边缘服务器,并通过大容量有线光缆连接到云服务器,本发明使用集合
Figure BDA0002349252590000051
表示所有的边缘服务器且每个边缘服务器的计算能力和存储能力有限。
对于自动语音识别任务,本发明使用算法将选择部分自动语音识别任务卸载至边缘服务器上。当任务被卸载至边缘端时,本发明考虑使用编码器译码器模型进行神经机器翻译,其中每个边缘服务器执行特征提取作为编码器以实现数据卷积压缩。当任务不被卸载时将直接通过基站传输到云端处理,云服务器不仅可以充当解码器的角色而且可以完整地处理整个自动语音识别任务。此外,边缘服务器和云服务器可以分别在所考虑的网络中对自动语音识别任务进行分布式管理和集中管理。
2)用户端向基站发送自动语音识别任务。自动语音识别任务包含音频文件。
3)基站接收到自动语音识别任务后,采集音频数据,再将自动语音识别任务发送至云服务器,发送方式包括以下两种:
I)基站对自动语音识别任务进行数据压缩,再发送至云服务器进行统一处理,主要步骤如下:
a)基站在接收到自动语音识别任务后,将所述自动语音识别任务输入到存储在边缘服务器内的梅尔滤波器中,对自动语音识别任务进行滤波,将自动语音识别任务的音频数据转换为梅尔频率倒谱系数。梅尔滤波器对自动语音识别任务进行压缩的压缩率为
Figure BDA0002349252590000052
b)将处理后的自动语音识别任务输入到存储在边缘服务器内的深度神经网络中。所述深度神经网络包括P层卷积层和Q层池化层。
深度神经网络对滤波后的自动语音识别任务进行压缩的压缩率λm如下所示:
Figure BDA0002349252590000053
式中,
Figure BDA0002349252590000054
Figure BDA0002349252590000055
为初始自动语音识别任务的长和宽。
Figure BDA0002349252590000056
Figure BDA0002349252590000057
为压缩完成后自动语音识别任务的长与宽。H0为自动语音识别任务的深度。
II)基站直接将自动语音识别任务发送至云服务器进行处理。
4)建立自动语音识别任务卸载模型,主要步骤如下:
4.1)计算第s个用户端的自动语音识别任务传输到第t个基站的传输时延
Figure BDA0002349252590000061
即:
Figure BDA0002349252590000062
式中,Xts表示第s个任务和第t个边缘服务器之间的传输速率。vts表示第t个边缘服务器分配给第s个任务的计算资源。wts∈{0,1}表征第s个任务是否被卸载和处理。wts=1表示第t个边缘服务器使用编码器对第s个任务进行数据压缩,wts=0表示第t个边缘服务器不进行数据压缩。i0为常数。gts表示基站和自动语音识别任务的关联性。gts=1表示第s个任务与第t个基站之间有关联。gts=0表示第s个任务与第t个基站之间没有关联。ks表示第s个任务需要的计算周期。os表示第s个任务的数据大小。T为基站总数,也即边缘服务器总数。S为任务总数。一次任务处理周期内,每个用户端向边缘服务器发送一个任务。
第s个任务和第t个边缘服务器之间的传输速率Xts如下所示:
Figure BDA0002349252590000063
式中,Bs、Ps、rts
Figure BDA0002349252590000064
分别表示第s个用户端到第t个基站的传输带宽、传输功率、信道增益和噪声功率。
4.2)计算第s个基站的第t个语音识别任务传输到云端的时延
Figure BDA0002349252590000065
即:
Figure BDA0002349252590000066
式中,Cs为压缩率。Xt表示第t个基站发送数据压缩后的第s个任务到云服务器处理第s个任务为止的平均链路传输速率。X0表示云服务器处理任务的平均计算速度。
4.3)计算第s个用户端将第s个任务通过第t个基站传送到云服务器,并由云服务器处理第s个任务的时延
Figure BDA0002349252590000067
即:
Figure BDA0002349252590000071
4.4)建立自动语音识别任务卸载模型的目标函数Dtot,即:
Figure BDA0002349252590000072
其中,时延D0如下所示:
Figure BDA0002349252590000073
自动语音识别任务卸载模型的约束条件如下所示:
Figure BDA0002349252590000074
bts=gtsks≥0。 (9)
进一步,第s个任务是否被卸载和处理的参数wts=0或第t个边缘服务器分配给第s个任务的计算资源vts=0时,目标函数Dtot=D0
5)如图3所示,利用交替迭代的方法对自动语音识别任务卸载模型进行解算,主要步骤如下:
5.1)首先是将卸载模型初始化,将wts和vts设置为0,用n来指代当前迭代次数并置0,集合M为空。
5.2)将最大迭代次数设为MAX,并在迭代中选择最佳的n值,使时延最小。
5.3)给定
Figure BDA0002349252590000075
的值,对wts使用贪心算法,即在满足边缘服务器计算能力和存储能力约束的情况下,选择其指代任务的最大值,即得解
Figure BDA0002349252590000076
5.4)将
Figure BDA0002349252590000077
初始化为0。
5.5)将
Figure BDA0002349252590000078
置为1并加入到集合M,利用公式(10)计算出
Figure BDA0002349252590000079
的值:
Figure BDA00023492525900000710
5.6)找出在0到n之间找到令时延最小的值n*,将
Figure BDA00023492525900000711
设置为
Figure BDA00023492525900000712
Figure BDA00023492525900000713
设置为
Figure BDA00023492525900000714
5.7)将当前迭代阶段由n设置为n+1。
5.8)重复步骤5.3至5.7直到n>MAX或者时延函数收敛。
最后得出本发明的卸载策略。
本发明使用Matlab进行仿真实验,如图4所示,模拟边缘服务器在不同计算能力的情况下,本发明与随机选择语音自动识别任务进行卸载的情况以及随机迭代的情况相比,本发明总是比随机选择和随机迭代方案分别提高400%和33%的性能。
如图5所示,模拟边缘服务器在不同存储能力的情况下,本发明与随机选择语音自动识别任务进行卸载的情况以及随机迭代的情况相比,本发明比随机选择和随机迭代方案分别减少了119%和21%的延迟。
实施例2:
一种基于边缘计算加速自动语音识别任务的卸载方法,主要包括以下步骤:
1)建立边缘通信系统,包括云服务器、若干基站和若干移动终端(也即用户端);每个基站均设有边缘服务器;
2)移动终端向基站发送携带音频文件的自动语音识别任务;
3)基站接收到自动语音识别任务后,采集音频数据,利用编码器得到特征矩阵,再将自动语音识别任务的特征矩阵发送至云服务器,发送方式包括以下两种:
I)基站对自动语音识别任务进行数据压缩,再发送至云服务器;
II)基站直接将自动语音识别任务发送至云服务器;
4)建立自动语音识别任务卸载模型;
5)利用交替迭代的方法对自动语音识别任务卸载模型进行解算,即利用解码器还原自动语音识别任务字符文件,得到最后任务卸载策略。
实施例3:
一种基于边缘计算加速自动语音识别任务的卸载方法,主要步骤见实施例2,其中,基站对自动语音识别任务进行数据压缩的主要步骤如下:
1)基站在接收到自动语音识别任务后,将所述自动语音识别任务输入到存储在边缘服务器内的梅尔滤波器中,对自动语音识别任务进行滤波,将自动语音识别任务的音频数据转换为梅尔频率倒谱系数;梅尔滤波器对自动语音识别任务进行压缩的压缩率为
Figure BDA0002349252590000091
2)将处理后的自动语音识别任务输入到存储在边缘服务器内的深度神经网络中;所述深度神经网络包括P层卷积层和Q层池化层;
深度神经网络对滤波后的自动语音识别任务进行压缩的压缩率Cs如下所示:
Figure BDA0002349252590000092
式中,
Figure BDA0002349252590000093
Figure BDA0002349252590000094
为初始自动语音识别任务的长和宽;
Figure BDA0002349252590000095
Figure BDA0002349252590000096
为压缩完成后自动语音识别任务的长与宽;H0为自动语音识别任务的深度。
实施例4:
一种基于边缘计算加速自动语音识别任务的卸载方法,主要步骤见实施例2,其中,建立自动语音识别任务卸载模型的主要步骤如下:
1)计算第s个用户端的自动语音识别任务传输到第t个基站的传输时延
Figure BDA0002349252590000097
即:
Figure BDA0002349252590000098
式中,Xts表示第s个任务和第t个边缘服务器之间的传输速率;vts表示第t个边缘服务器分配给第s个任务的计算资源;wts∈{0,1}表示第s个任务是否被卸载和处理;wts=1表示第t个边缘服务器使用编码器对第s个任务进行数据压缩,wts=0表示第t个边缘服务器不进行数据压缩;i0为常数;gts表示基站和自动语音识别任务的关联性;gts=1表示第s个任务与第t个基站之间有关联;gts=0表示第s个任务与第t个基站之间没有关联;ks表示第s个任务需要的计算周期;os表示第s个任务的数据大小;
第s个任务和第t个边缘服务器之间的传输速率Xts如下所示:
Figure BDA0002349252590000099
式中,Bs、Ps、rts
Figure BDA0002349252590000101
分别表示第s个用户端到第t个基站的传输带宽、传输功率、信道增益和噪声功率;
2)计算第s个基站的第t个语音识别任务传输到云端的时延
Figure BDA0002349252590000102
即:
Figure BDA0002349252590000103
式中,Cs为压缩率;Xt表示第t个基站发送数据压缩后的第s个任务到云服务器处理第s个任务为止的平均链路传输速率;X0表示云服务器处理任务的平均计算速度;
3)计算第s个用户端将第s个任务通过第t个基站传送到云服务器,并由云服务器处理第s个任务的时延
Figure BDA0002349252590000104
即:
Figure BDA0002349252590000105
4)建立自动语音识别任务卸载模型的目标函数Dtot,即:
Figure BDA0002349252590000106

Claims (3)

1.一种基于边缘计算加速自动语音识别任务的卸载方法,其特征在于,主要包括以下步骤:
1)建立边缘通信系统,包括云服务器、若干基站和若干用户端;每个基站均设有边缘服务器;
2)用户端向基站发送携带音频文件的自动语音识别任务;
3)基站接收到自动语音识别任务后,采集音频数据,再将自动语音识别任务发送至云服务器,发送方式包括以下两种:
I)基站对自动语音识别任务进行数据压缩,再发送至云服务器;
II)基站直接将自动语音识别任务发送至云服务器;
4)建立自动语音识别任务卸载模型;
建立自动语音识别任务卸载模型的主要步骤如下:
4.1)计算第s个用户端的自动语音识别任务传输到第t个基站的传输时延
Figure FDA0003745503360000011
即:
Figure FDA0003745503360000012
式中,Xts表示第s个任务和第t个边缘服务器之间的传输速率;vts表示第t个边缘服务器分配给第s个任务的计算资源;wts∈{0,1}表示第s个任务是否被卸载和处理;wts=1表示第t个边缘服务器使用编码器对第s个任务进行数据压缩,wts=0表示第t个边缘服务器不进行数据压缩;i0为常数;gts表示基站和自动语音识别任务的关联性;gts=1表示第s个任务与第t个基站之间有关联;gts=0表示第s个任务与第t个基站之间没有关联;ks表示第s个任务需要的计算周期;os表示第s个任务的数据大小;T为基站总数,S为任务总数;
第s个任务和第t个边缘服务器之间的传输速率Xts如下所示:
Figure FDA0003745503360000013
式中,Bs、Ps、rts
Figure FDA0003745503360000014
分别表示第s个用户端到第t个基站的传输带宽、传输功率、信道增益和噪声功率;
4.2)计算第s个基站的第t个语音识别任务传输到云端的时延
Figure FDA0003745503360000015
即:
Figure FDA0003745503360000021
式中,Cs为压缩率;Xt表示第t个基站发送数据压缩后的第s个任务到云服务器处理第s个任务为止的平均链路传输速率;X0表示云服务器处理任务的平均计算速度;
4.3)计算第s个用户端将第s个任务通过第t个基站传送到云服务器,并由云服务器处理第s个任务的时延
Figure FDA0003745503360000022
即:
Figure FDA0003745503360000023
4.4)建立自动语音识别任务卸载模型的目标函数Dtot,即:
Figure FDA0003745503360000024
5)利用交替迭代的方法对自动语音识别任务卸载模型进行解算,得到最后任务卸载策略。
2.根据权利要求1所述的一种基于边缘计算加速自动语音识别任务的卸载方法,其特征在于,基站对自动语音识别任务进行数据压缩的主要步骤如下:
1)基站在接收到自动语音识别任务后,将所述自动语音识别任务输入到存储在边缘服务器内的梅尔滤波器中,对自动语音识别任务进行滤波,将自动语音识别任务的音频数据转换为梅尔频率倒谱系数;梅尔滤波器对自动语音识别任务进行压缩的压缩率为
Figure FDA0003745503360000025
2)将处理后的自动语音识别任务输入到存储在边缘服务器内的深度神经网络中;所述深度神经网络包括P层卷积层和Q层池化层;
深度神经网络对滤波后的自动语音识别任务进行压缩的压缩率Cs如下所示:
Figure FDA0003745503360000026
式中,
Figure FDA0003745503360000027
Figure FDA0003745503360000028
为初始自动语音识别任务的长和宽;
Figure FDA0003745503360000029
Figure FDA00037455033600000210
为压缩完成后自动语音识别任务的长与宽;H0为自动语音识别任务的深度。
3.根据权利要求1所述的一种基于边缘计算加速自动语音识别任务的卸载方法,其特征在于,利用交替迭代的方法对自动语音识别任务卸载模型进行解算的方法为:利用交替迭代方法对自动语音识别任务卸载模型的目标函数Dtot进行迭代解算,计算出时延最大的任务对应的表征第s个任务是否被卸载和处理的参数wts和计算资源vts的值,从而得到最短传输延迟的卸载策略。
CN201911408237.2A 2019-12-31 2019-12-31 一种基于边缘计算加速自动语音识别任务的卸载方法 Active CN111199740B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911408237.2A CN111199740B (zh) 2019-12-31 2019-12-31 一种基于边缘计算加速自动语音识别任务的卸载方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911408237.2A CN111199740B (zh) 2019-12-31 2019-12-31 一种基于边缘计算加速自动语音识别任务的卸载方法

Publications (2)

Publication Number Publication Date
CN111199740A CN111199740A (zh) 2020-05-26
CN111199740B true CN111199740B (zh) 2022-09-09

Family

ID=70746199

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911408237.2A Active CN111199740B (zh) 2019-12-31 2019-12-31 一种基于边缘计算加速自动语音识别任务的卸载方法

Country Status (1)

Country Link
CN (1) CN111199740B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753967A (zh) * 2020-07-05 2020-10-09 刀锋 基于深度学习反馈结合边缘计算的大数据处理系统
CN112286666B (zh) * 2020-11-17 2022-07-15 重庆邮电大学 基于回调机制的细粒度数据流可靠卸载方法
CN112860429B (zh) * 2020-12-29 2023-06-16 重庆大学 一种移动边缘计算系统中任务卸载的成本效率优化系统及方法
CN113613270B (zh) * 2021-07-22 2024-02-20 深圳市中安通信科技有限公司 一种基于数据压缩的雾接入网计算卸载方法
CN114820443B (zh) * 2022-03-18 2024-05-07 重庆大学 一种基于迁移学习的边缘检测方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3368976A1 (en) * 2015-10-30 2018-09-05 British Telecommunications public limited company Mobile information processing
CN108809723A (zh) * 2018-06-14 2018-11-13 重庆邮电大学 一种边缘服务器联合任务卸载及卷积神经网络层调度方法
CN109684075A (zh) * 2018-11-28 2019-04-26 深圳供电局有限公司 一种基于边缘计算和云计算协同进行计算任务卸载的方法
CN109729543A (zh) * 2018-12-29 2019-05-07 南京邮电大学 一种基于数据压缩的高能效计算任务卸载方法
CN109814951A (zh) * 2019-01-22 2019-05-28 南京邮电大学 移动边缘计算网络中任务卸载及资源分配的联合优化方法
KR101989249B1 (ko) * 2017-12-14 2019-06-13 연세대학교 산학협력단 이동 단말기의 오프로딩 방법 및 그 이동 단말기
CN109922152A (zh) * 2019-03-13 2019-06-21 中南大学 一种移动边缘计算中的计算卸载方法及系统
CN110018834A (zh) * 2019-04-11 2019-07-16 北京理工大学 一种混合移动云/边缘计算的任务卸载和数据缓存方法
CN110418418A (zh) * 2019-07-08 2019-11-05 广州海格通信集团股份有限公司 基于移动边缘计算的无线资源调度方法和装置
CN110493360A (zh) * 2019-09-26 2019-11-22 重庆大学 多服务器下降低系统能耗的移动边缘计算卸载方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190043496A1 (en) * 2017-09-28 2019-02-07 Intel Corporation Distributed speech processing
US10659526B2 (en) * 2018-01-03 2020-05-19 Verizon Patent And Licensing Inc. Edge compute systems and methods

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3368976A1 (en) * 2015-10-30 2018-09-05 British Telecommunications public limited company Mobile information processing
KR101989249B1 (ko) * 2017-12-14 2019-06-13 연세대학교 산학협력단 이동 단말기의 오프로딩 방법 및 그 이동 단말기
CN108809723A (zh) * 2018-06-14 2018-11-13 重庆邮电大学 一种边缘服务器联合任务卸载及卷积神经网络层调度方法
CN109684075A (zh) * 2018-11-28 2019-04-26 深圳供电局有限公司 一种基于边缘计算和云计算协同进行计算任务卸载的方法
CN109729543A (zh) * 2018-12-29 2019-05-07 南京邮电大学 一种基于数据压缩的高能效计算任务卸载方法
CN109814951A (zh) * 2019-01-22 2019-05-28 南京邮电大学 移动边缘计算网络中任务卸载及资源分配的联合优化方法
CN109922152A (zh) * 2019-03-13 2019-06-21 中南大学 一种移动边缘计算中的计算卸载方法及系统
CN110018834A (zh) * 2019-04-11 2019-07-16 北京理工大学 一种混合移动云/边缘计算的任务卸载和数据缓存方法
CN110418418A (zh) * 2019-07-08 2019-11-05 广州海格通信集团股份有限公司 基于移动边缘计算的无线资源调度方法和装置
CN110493360A (zh) * 2019-09-26 2019-11-22 重庆大学 多服务器下降低系统能耗的移动边缘计算卸载方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A Dynamic Service Migration Mechanism in Edge Cognitive Computing;MIN CHEN et al;《ACM Transactions on Internet Technology》;20190403;全文 *
Intelligent Traffic Adaptive Resource Allocation for Edge Computing-Based 5G Networks;Min Chen et al;《IEEE TRANSACTIONS ON COGNITIVE COMMUNICATIONS AND NETWORKING》;20191112;全文 *
Task Offloading for Automatic Speech Recognition in Edge-Cloud Computing Based Mobile Networks;Shitong Cheng et al;《2020 IEEE Symposium on Computers and Communications (ISCC)》;20201012;全文 *
移动边缘计算任务迁移与资源管理研究;吕昕晨;《中国优秀博硕士学位论文全文数据库(博士)信息科技辑》;20190815;全文 *

Also Published As

Publication number Publication date
CN111199740A (zh) 2020-05-26

Similar Documents

Publication Publication Date Title
CN111199740B (zh) 一种基于边缘计算加速自动语音识别任务的卸载方法
CN109814951B (zh) 移动边缘计算网络中任务卸载及资源分配的联合优化方法
CN111401552B (zh) 基于调整批量大小与梯度压缩率的联邦学习方法和系统
CN109978142B (zh) 神经网络模型的压缩方法和装置
CN111586720B (zh) 一种多小区场景下的任务卸载和资源分配的联合优化方法
CN111372314A (zh) 基于移动边缘计算场景下的任务卸载方法及任务卸载装置
CN108809723B (zh) 一种边缘服务器联合任务卸载及卷积神经网络层调度方法
CN111240701A (zh) 一种端-边-云协同计算的任务卸载优化方法
CN110505644B (zh) 用户任务卸载与资源分配联合优化方法
CN110535936B (zh) 一种基于深度学习的能量高效雾计算迁移方法
CN109743713B (zh) 一种电力物联网系统的资源分配方法及装置
US20220237454A1 (en) Linear neural reconstruction for deep neural network compression
KR102409974B1 (ko) 인공신경망 기반의 소스, 채널부호율 및 전력제어 최적화 방법 및 시스템
CN109618285B (zh) 一种基于覆盖树的基站控制方法、装置及设备
CN113507712B (zh) 一种基于交替方向乘子的资源分配与计算任务卸载方法
Chen et al. A channel aggregation based dynamic pruning method in federated learning
CN112423320A (zh) 一种基于QoS和用户行为预测的多用户计算卸载方法
CN109561129B (zh) 一种基于光纤-无线网络的协同计算卸载方法
CN111260049A (zh) 一种基于国产嵌入式系统的神经网络实现方法
CN112910716B (zh) 一种基于分布式dnn的移动雾计算损耗联合优化系统和方法
CN113784372A (zh) 一种面向终端多业务模型的联合优化方法
CN114116052A (zh) 一种边缘计算方法及装置
CN113556760A (zh) 一种移动边缘计算成本效益优化方法、系统及应用
CN112584351B (zh) 一种面向车联雾计算的“通信-计算”一体化资源分配方法
CN116390163A (zh) 一种多接入网切片场景下基于遗传算法的边缘计算卸载方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant