CN111124490A

CN111124490A - 使用posit的无精度损失低功耗mfcc提取加速器

Info

Publication number: CN111124490A
Application number: CN201911067668.7A
Authority: CN
Inventors: 杨景森; 张子豪; 刘诗玮; 史传进
Original assignee: Fudan University
Current assignee: Fudan University
Priority date: 2019-11-05
Filing date: 2019-11-05
Publication date: 2020-05-08

Abstract

本发明属于集成电路技术领域，具体为一种使用POSIT的无精度损失低功耗MFCC提取加速器。本发明加速器装置包括：两个片上存储模块，用于存储运算过程中的中间数据以及运算时需要用到的相关参数；一个运算单元，包含一个支持posit数据格式运算的乘法器和一个支持posit数据格式运算的加法器，用于实现快速傅里叶变化以及离散余弦变换等运算；一个控制单元，用于控制计算过程和数据流向，和同外界的数据进行交互。计算过程中按照控制单元的指令，所有的运算不断复用同一个运算单元，通过相比于浮点运算而言极短的寄存器长度，实现无精度损失的MFCC数据运算，减少了数据运算中的能耗，提高了加速器的能效。

Description

使用POSIT的无精度损失低功耗MFCC提取加速器

技术领域

本发明属于集成电路技术领域，具体涉及一种进行梅尔特征频谱倒谱系数提取加速器装置。

背景技术

当今，语音识别技术被广泛的运用到人机交互、智能家居、智能机器人、机器翻译等诸多领域中。随着语音识别被更广泛的使用，传统移动端cpu在能效上越发显得捉襟见肘，一些针对梅尔特征频谱倒谱系数（MFCC）提取的应运而生。

在运算梅尔特征频谱倒谱系数求取的过程中，包含众多需要累加的运算，例如离散余弦变换，快速傅里叶变换等等，在传统的float数据格式运算中，为了保持运算过程中的高精度要求，中间寄存器需要使用很大的位宽，来满足中间数据的存储，从而加大了运算过程中的能量消耗。然而在移动端的设备上，为了长时间的使用设备，低功耗是很重的一个要素。

如果在float数据格式的累加运算中降低中间寄存器的位宽的话，又会截断中间数据的尾端，从而使运算过程中的精度下降，最后的输出与正确值会有一定的误差。然如今对语音识别的要求越来越高，输入数据的误差极大地影响了最后的结果。

综上所述，如何在降低梅尔特征频谱倒谱系数运算过程中的误差的同时，减少功耗损失，是该技术领域亟待解决的一个问题。

Posit数据格式于2017年提出，posit数据格式相比于float数据格式，同样的比特可以表达更大范围的数据，因此在累加过程中，可以使用远小于float累加运算时所需的寄存器长度，达到无精度损失的累加运算。

发明内容

本发明的目的在于提供一种基于posit数据格式的、无误差低功耗的语音输入梅尔特征频谱倒谱系数提取加速器。

本发明提出的梅尔特征频谱倒谱系数（MFCC）提取加速器，包括：

两块片上存储模块，用于存储运算过程中的中间数据与输出结果，以及运算中用到的权重参数；

一个支持posit数据格式运算的运算单元，内含一个乘法器与一个加法器，用于实现MFCC提取中的所有算法，包括快速傅里叶变换以及离散余弦变换的运算；

控制单元，用于控制计算过程以及数据流向，以及同外界数据的交互；

其中，所述的支持posit数据格式运算的运算单元，由一个支持posit格式运算的乘法器，一个支持posit数据格式运算的加法器，四个存储中间过程的寄存器，以及四个控制内部数据流向的多路选择器组成。运算单元可以支持posit格式的乘法、加法与乘加运算，并且可通过内部的寄存器直接将当前的输出作为下一次运算的输入，节省数据读取的时间，从而提升运算单元的能效。

本发明中，所述控制单元按照MFCC算法中的运算顺序，控制片上存储单元的读取使能信号以及数据读取地址信号，控制片上多路选择器的选择信号，控制信号的输入通路，传递给运算单元相应的输入，同时将运算单元的输出存储到对应的位置上。

本发明中，所述两块片上存储模块中，第一块片上存储模块，可以存储MFCC运算过程中的所有中间数据以及输出结果。第二块片上存储模块，可以存储运算中的所有参数，包括快速傅里叶变换中的参数W，离散余弦变换中的参数COS值等等。

本发明在计算过程中按照控制单元的指令，所有的运算不断复用同一个运算单元，在不断的重复运算过程中，根据posit表示范围更大的特性，通过相比于浮点运算而言极短的寄存器长度，实现无精度损失的MFCC数据运算，减少了数据运算中的能耗，从而提高了加速器的能效。

附图说明

图1是本发明实施例的顶层模块框图。

图2是本发明实施例的运算单元框图。

具体实施方式

以下结合具体实施例和附图对本发明的技术方案做进一步说明。应理解，以下描述的实施例是用于对本发明技术方案的说明而非限制。附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

实施例是一个语音输入的梅尔频谱倒谱系数运算的加速器。图1为其顶层模块框图。该所述加速器包括片上存储模块11，运算模块12，控制单元13。

存储模块中包含一个存储中间数据与结果的存储器111，与一个存储运算参数的存储器112。存储器111支持双端口读取，即运算模块可以同时从存储器111中读取两个数值。同时存储器111与片外数据进行交互，片外向其传入语音原始信号，其向片外传出MFCC数值。

运算模块12中包含三个多路选择器121，以及一个运算单元122。多路选择器负责选择将哪些数据传入运算单元中的A、B、C三个输入端口，从而实现MFCC中包含的不同算法。运算单元的输出端口D与存储器111相连，将中间结果以及MFCC输出写回到存储器中去。

图2为其运算单元的框图。其中含有一个posit数据格式乘法器，一个posit格式运算的加法器，四个支持posit累加运算无精度损失的寄存器，四个多路选择器，分别控制乘法器，加法器，寄存器的输入，以及哪个寄存器的值作为输出。运算单元支持加法，乘法，乘加三种运算。

控制单元13分别与存储模块，运算模块相连。通过与存储器相连的控制信号，决定当存储器读取的时候，哪些值会被读取，以及当输出结果写回时，数据需要写入到哪些位置上；通过与运算模块中多路选择器相连的控制信号，决定哪些数据最终被传入运算单元中去；通过与运算单元相连的控制信号，决定运算单元的运算模式是什么，并且决定运算单元输出是否写回到运算单元的输入中去。控制单元会根据MFCC的算法，按顺序的调用存储模块与计算模块，以此实现MFCC中的每一个算法。

Claims

1.一种使用POSIT的无精度损失低功耗MFCC提取加速器，其特征在于，包括：

两块片上存储模块，用于存储运算过程中的中间数据与输出结果，以及运算中会用到的权重参数；

控制单元，用于控制计算过程以及数据流向，以及同外界数据的交互。

2.根据权利要求1所述的MFCC提取加速器，其特征在于，所述支持posit数据格式运算的运算单元，由一个支持posit格式运算的乘法器，一个支持posit数据格式运算的加法器，四个存储中间过程的寄存器，以及四个控制内部数据流向的多路选择器组成；运算单元支持posit格式的乘法、加法与乘加运算，并且通过内部的寄存器直接将当前的输出作为下一次运算的输入，节省数据读取的时间，提升运算单元的能效。

3.根据权利要求1所述的MFCC提取加速器，其特征在于，所述控制单元，按照MFCC算法中的运算顺序，控制片上存储单元的读取使能信号以及数据读取地址信号，控制片上多路选择器的选择信号，控制信号的输入通路，传递给运算单元相应的输入，同时将运算单元的输出存储到对应的位置上。

4.根据权利要求1所述的MFCC提取加速器，其特征在于，所述两块片上存储模块中，第一块片上存储模块，存储MFCC运算过程中的所有中间数据以及输出结果；第二块片上存储模块，存储运算中的所有参数，包括快速傅里叶变换中的参数W，离散余弦变换中的参数COS值。

5.根据权利要求1所述的MFCC提取加速器，其特征在于，计算过程中，按照控制单元的指令，所有的运算不断复用同一个运算单元，在不断的重复运算过程中，根据posit表示范围更大的特性，通过相比于浮点运算而言极短的寄存器长度，实现无精度损失的MFCC数据运算，减少了数据运算中的能耗，提高了加速器的能效。