CN110969246A - 信号处理装置及相关产品 - Google Patents

信号处理装置及相关产品 Download PDF

Info

Publication number
CN110969246A
CN110969246A CN201811152999.6A CN201811152999A CN110969246A CN 110969246 A CN110969246 A CN 110969246A CN 201811152999 A CN201811152999 A CN 201811152999A CN 110969246 A CN110969246 A CN 110969246A
Authority
CN
China
Prior art keywords
processing
signal
instruction
data
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811152999.6A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cambricon Information Technology Co Ltd
Original Assignee
Shanghai Cambricon Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cambricon Information Technology Co Ltd filed Critical Shanghai Cambricon Information Technology Co Ltd
Priority to CN201811152999.6A priority Critical patent/CN110969246A/zh
Priority to PCT/CN2018/112528 priority patent/WO2020062392A1/zh
Priority to US16/620,540 priority patent/US11703939B2/en
Priority to EP18920196.5A priority patent/EP3859488A4/en
Publication of CN110969246A publication Critical patent/CN110969246A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7839Architectures of general purpose stored program computers comprising a single central processing unit with memory
    • G06F15/7864Architectures of general purpose stored program computers comprising a single central processing unit with memory on more than one IC chip

Abstract

本发明公开了一种信号处理装置,包括:信号采集器、指令转换器和处理器。采用本发明实施例能够实现精准识别用户用意,给用户带来操作便捷性。

Description

信号处理装置及相关产品
技术领域
本发明涉及数据处理领域,尤其涉及一种信号处理装置及相关产品。
背景技术
随着电子设备(如手机、平板电脑、服务器等计算机设备)的大量普及应用,电子设备能够支持的应用越来越多,功能越来越强大,电子设备向着多样化、个性化的方向发展,成为用户生活中不可缺少的电子用品。
目前来看,语音识别、图像识别是电子设备的常用技术手段,但是,目前的电子设备尚不能精准识别用户的真实用意,因此,在实际应用过程中,给用户带来各种操作不便。
发明内容
本发明实施例提供一种信号处理装置及相关产品,实现了输入信号即可对数据进行处理的功能,能够实现精准识别用户用意,给用户带来操作便捷性。
第一方面,本发明实施例提供一种信号处理装置,包括:
信号采集器,用于采集用户输入的信号;
指令转换器,用于根据目标信号指令转换模型将所述信号转换成处理指令和目标数据,所述目标数据为待处理数据的处理数据;
处理器,用于根据所述处理指令和目标处理模型对所述目标数据进行处理。
第二方面,本发明实施例还提供了一种机器学习运算装置,所述机器学习运算装置包括一个或多个如第一方面所述的信号处理装置,用于从其他处理装置中获取待运算输入数据和控制信息,并执行指定的机器学习运算,将执行结果通过I/O接口传递给其他处理装置;
当所述机器学习运算装置包含多个所述信号处理装置时,所述多个所述信号处理装置间可以通过特定的结构进行连接并传输数据;
其中,多个所述信号处理装置通过快速外部设备互连总线PCIE总线进行互联并传输数据,以支持更大规模的机器学习的运算;多个所述信号处理装置共享同一控制系统或拥有各自的控制系统;多个所述信号处理装置共享内存或者拥有各自的内存;多个所述信号处理装置的互联方式是任意互联拓扑。
第三方面,本发明实施例还提供了一种组合处理装置,所述组合处理装置包括如第二方面所述的机器学习运算装置,通用互联接口和其他处理装置;
所述机器学习运算装置与所述其他处理装置进行交互,共同完成用户指定的计算操作。
第四方面,本发明实施例还提供了一种神经网络芯片,所述机器学习芯片包括如第二方面所述的机器学习运算装置或如第三方面所述的组合处理装置。
第五方面,本发明实施例还提供了一种电子设备,所述电子设备包括如第四方面所述的芯片。
第六方面,本发明实施例还提供了一种板卡,其特征在于,所述板卡包括:存储器件、接口装置和控制器件以及如第六方面所述的神经网络芯片;
其中,所述神经网络芯片与所述存储器件、所述控制器件以及所述接口装置分别连接;
所述存储器件,用于存储数据;
所述接口装置,用于实现所述芯片与外部设备之间的数据传输;
所述控制器件,用于对所述芯片的状态进行监控。
第七方面,本发明实施例还提供了一种信号处理方法,包括:
采集用户输入的信号;
根据目标信号指令转换模型将所述信号转换成处理指令和目标数据,所述目标数据为待处理数据的处理数据;
根据所述处理指令和目标处理模型对所述目标数据进行处理。
第八方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第七方面中所描述的部分或全部步骤。
第九方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第七方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
可以看出,在本发明实施例的方案中,信号采集器采集用户输入的语音信号;指令转换器根据目标信号指令转换模型将所述语音信号转换成处理指令和目标数据,所述目标数据为待处理数据的处理数据;处理器根据所述处理指令和目标处理模型对所述目标数据进行处理。与现有的处理技术相比,本发明通过信号进行识别处理,能够实现精准识别用户用意,给用户带来操作便捷性。
本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种信号处理装置的结构示意图;
图2为本发明实施例提供的另一种信号处理装置的局部结构示意图;
图3为本发明实施例提供的另一种信号处理装置的局部结构示意图;
图4为本发明实施例提供的另一种信号处理装置的局部结构示意图;
图5A是本申请实施例提供的一种计算装置的结构示意图;
图5B是本申请一个实施例提供的计算装置的结构图;
图5C是本申请另一个实施例提供的计算装置的结构图;
图5D是本申请实施例提供的主处理电路的结构图;
图5E是本申请实施例提供的另一种计算装置的结构图;
图5F是本申请实施例提供的树型模块的结构示意图;
图5G是本申请实施例提供的又一种计算装置的结构图;
图5H是本申请实施例提供的还一种计算装置的结构图;
图6A是本申请实施例提供的一种组合处理装置的结构图;
图6B是本申请实施例提供的一种计算装置的结构示意图;
图7A是本申请实施例提供的另一种组合处理装置的结构图;
图7B是本申请实施例提供的一种板卡的结构示意图;
图8为本发明实施例提供的一种电子设备的结构示意图;
图9为本发明实施例提供的一种信号处理方法的流程示意图。
具体实施方式
以下分别进行详细说明。
本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
请参见图1,图1为本发明实施例提供的一种信号处理装置的结构示意图。如图1所示,该信号处理装置100包括:
信号采集器1019,用于采集用户输入的信号。
其中,上述信号包括但不限于语音信号、图像信号、文本信号、感应信号等。该信号采集装置可以只采集其中一种信号,也可以支持采集多种信号。
可选地,上述信号处理装置100还包括信号过滤器,上述信号采集器101采集到上述信号后,上述信号过滤器对该输入的信号进行降噪处理,降低信号中无用数据的干扰。
可选地,该信号采集器可为语音信号采集器,可以包括但不仅限于:语音传感器、麦克风、拾音器,或者,获取其他音频采集装置,在此不作限定;该信号采集器还可为图像采集器,可以包括但不仅限于:照相机、摄像机及其他图像采集装置,在此不作限定;该信号采集器也可为感应信号采集器,可以包括但不仅限于:触摸屏、触控板、体感传感器、超声波传感器、脑电波传感器及其他感应信号采集装置。
具体地,以上述步骤101中的信号为语音信号为例,上述信号采集器1019可在接收语音信号时,还接收环境声音信号。上述信号过滤器可根据上述环境声音信号对上述语音信号进行降噪处理。该环境声音信号对上述语音信号来说是噪声。进一步地,上述该信号采集器101可包括对麦克风阵列,既可用于采集上述语音信号和上述环境声音信号,又实现了降噪处理。
具体地,以上述步骤101中的信号为图像信号为例,上述信号采集器1019可在接收图像信号时,图像信息中只有部分内容为有效信息,譬如手势、面部表情、动作趋势。上述信号过滤器用于过滤掉无用信息,仅仅提取出图像中的有用信息,如手势、面部表情、动作趋势。进一步地,上述该图像采集器101可包括体感传感器,可用于采集图像后提取出人的体感动作和指向进行定位,得到有用信息。
具体地,以上述步骤101中的信号为文本信号为例,上述信号采集器1019可在接收文本信号时,文本信息中并非全部内容均为有效信息。上述文本信号过滤器用于过滤掉无用信息,提取文本信号的有用信息,具体地,例如,提取关键字。
可选地,在一种可行的实施例中,上述信号处理装置还包括第一存储模块。上述信号采集器采集到上述信号后,上述信号处理装置将上述信号存储到第一存储模块中。
指令转换器1029,用于根据目标信号指令转换模型将所述信号转换成处理指令和目标数据,所述目标数据为待处理数据的处理数据。
其中,处理指令可以用于实现如下功能:数据修改、数据编辑、数据整合、数据拼接、数据删除等,在此不作限定。处理指令可以包括以下至少一种:图像处理指令、语音处理指令、文本处理指令等等,在此不作限定。以图像处理指令为例,可以用于实现如下功能:改变图像部分或全部颜色,改变图像部分或全部的亮度,改变图像的一部分或全部的对比度等,替换图像部分内容为其他内容,编辑图像部分或全部内容进行扩大/缩小,编辑部分内容或全部内容进行虚化或马赛克化,将多张图像进行拼接,将多张图像进行整合,删除图像中的部分内容等,在此不作限定,以语音处理指令为例,可以用于实现如下功能:改变语音数据的部分或全部响度、频率和音色,替换语音数据部分内容为其他内容,修改语音内容的部分或全部内容,删除语音数据部分内容并将剩余内容进行拼接,对多段语音数据进行整合等,在此不作限定。以文本处理指令为例,可以用于实现如下功能:删除文本文件、对文本文件进行编辑、创建文件夹、文件加密/解密、文件传输、文件压缩,等等,在此不作限定。
本发明实施例中,处理指令可以定义如下三类处理指令,具体地:逻辑处理指令、精确处理指令、模糊处理指令,当然还可以包括其他处理指令。处理指令可至少包括操作类型、操作区域,当然,处理指令还可以包括操作数据。操作类型可以包括以下至少一种:图像识别、图像分割、图像增强、图像复原、图像去噪、背景虚化、图像拼接、图像整合、语音识别、语音合成、语音降噪、语音分离、文本截图、文本编辑等,在此不作限定。
逻辑处理指令,用于处理给定具有逻辑含义的操作需求,以针对图像的逻辑处理指令为例,如把图中的足球移走,该操作包括对图中足球的区域的检测和定位,将足球的区域删除,以及将该区域和区域周围的内容进行融合。该逻辑处理指令中可包括操作类型,逻辑操作区域,逻辑操作数据。
精确处理指令,用于处理给定精确数据的操作需求,如给定坐标范围,以针对图像的精确处理指令为例,如以图中心点为原点,半径为10个像素点的圆形区域内,改变该区间的颜色为RGB各值分别为255、0、0。该精准处理指令中可包括操作类型,精确操作区域,精确操作数据。
模糊处理指令,用于处理给出模糊数据的操作需求,如对“中心点附近”的区域进行操作。该模糊处理指令中可包括操作类型,模糊操作区域,模糊操作数据。
其他处理指令,包括对数据输入输出、数据判断等相关操作指令。
其中,上述操作类型可为编码的形式,通过某种编码方式定义而来,如依次按序编码的方式。操作类型包括但不限于移动,删除,替换,修改参数(如变色、亮度、对比度),修改形状(缩小、放大、变形)等,具体而言,可包括改变操作区域的颜色,改变操作区域的亮度,改变操作区域的对比度等,删除操作区域的内容,替换操作区域的内容为其他内容,扩大/缩小/旋转操作区域的内容,虚化/雾化/马赛克化操作区域的内容,合成操作区域,拼接操作区域,对操作区域建模等,在此不作限定。
其中,上述操作区域可为整幅图像,可以为图像中的部分区域,根据其给定的方式可包括上述逻辑区域、精确区域、模糊区域或者其他区域。逻辑区域可指为具有某种特定的逻辑含义的区域,包括指定物品(如足球、书桌、小狗等)、指定背景(如海、山等)、指定部分(如人脸、骨骼框架、鸟的翅膀等)等。这些逻辑区域采用机器学习等算法进行离线训练而得,并且可以通过在线训练的方式,为用户定制个性化方案。精确区域可指具有精确定位的区域,包括精确坐标及范围,精确要求及范围。譬如,以图中心点为原点,半径为10个像素点的圆形区域;图中所有颜色RGB值为(255,0,0)的位置等。模糊区域为给出一个指向但定位和范围略有模糊的区域,如图像左上角,红色系的地方等。该部分内容的定位和确定可以通过机器学习算法离线训练得到的选取模型,针对待处理图像的特征,智能选取待处理的范围。
可选地,操作指令中还包括操作数据,包括逻辑操作数据、精确操作数据、模糊操作数据。逻辑操作数据具有某种特定的逻辑含义的数据,包括指定物品(如足球、书桌、小狗等)、指定背景(如海、山等)、指定部分(如人脸、骨骼框架、鸟的翅膀等)等。精确数据可包括精确的数值参数或者指向数据的精确地址,以逻辑指令类为例,逻辑指令:人脸换足球,操作类型:替换,操作区域:人脸区域,操作数据:足球(或指向最求图形的地址)。模糊数据可包括模糊的描述,如颜色“深一点”、亮度“暗一点”等。
举例说明下,输入单张图像,输出单张图像。信号采集器,接收语音信号,并进行预处理,降低无效信息,如噪音等,将经过预处理后的语音信号送入指令转换单元,利用语音识别技术,对语音信号进行解析,并将其转换为预先定义的图像处理指令,图像处理单元接收图像处理指令,根据指令利用图像识别技术对待处理图像进行定位和划分,得到待处理图像的目标区域,如果需要操作数据,则从存储单元中读取所需要的操作数据,送入图像处理单元。图像处理单元根据处理指令,利用操作数据对待处理图像的目标区域完成给定操作,操作完成,输出图像。
举例说明下,给出该处理的一个实例,该实例为输入的待处理数据为一幅站立的人像图片,输入的处理要求是一条语音信号,即“换背景,站到海边”,接收一幅人像图像作为待处理数据,而后送入待处理器等待处理,信号处理器1019接收通过麦克风阵列接收语音信号并进行降噪处理后得到有效语音要求即“换背景,站到海边”,指令转换器1029对传入的语音信号利用语音识别技术将语音信号转化成为了文本信息,利用自然语言处理技术将文本信息转化成为了处理指令和目标区域(目标数据),说明待处理的操作为替换,目标区域为待处理图像中的“人”和图像库中的海边图中的“背景”,而后将解析后的内容传入存储器1049中暂时存储,处理器1039从存储模块中提取待处理数据和处理指令解析出的目标区域,而后利用图像处理技术对待处理图像进行区域划分,得到相对应的目标区域,存储到存储器1049中;从存储器1049中搜索选出所需的已知数据,即海边背景图,利用图像处理技术对已知数据进行区域划分,得到相对应的已知数据的目标区域,存储到存储器1049中;从存储器1049中获取待处理数据的目标区域和已知数据的目标区域,对二者进行智能整合,即对人像根据背景进行适当的缩放,根据预设的环境,即需要一个庄重而严肃的姿势和表情,适当变换人像的姿势和表情,而后将其整合到背景图中,并进行边缘柔化、根据阳光加人物阴影等操作得到处理后的图像,如果接收到用户发出的结束的信息,则处理过程结束,输出数据即可;否则继续接受用户的处理请求,直到接收到用户的结束的信息。其中,不限制结束信息的形式,可以为语音形式、图像形式,也可以通过令用户通过点击结束按键得到信息的形式。譬如,用户对姿势不满意,想要换为另一幅图像中人物的姿势,此时用户可以在输入一幅新的图像作为参考图像,并输入语音要求,信号采集器1019采集语音要求并送入处理器1039对要求进行解析,根据解析结果,获取参考图像的目标区域,及参考图像的人像姿势。检验用户需求是否合理,即参考图像的人像姿势非常不适合摆在海边前,那么处理器1039主动向用户发送一条确认信息,询问用户是否确定进行该操作。如检测不存在不合理的情况或者用户确定进行该操作,那么根据参考人像姿势编辑原处理后的图像中的人像姿势,而后进行边界柔化等处理获得新的处理后的图像,在此过程中,用户的需求可以采用多种输入形式相结合的方式,举例来说,当用户此时希望移动人物位置,通过语音要求“人”对人物整体进行选定作为目标区域,而后通过摄像头获取用户手势,对人物进行左右移动。类似地,直到接收到用户发出的结束的信息,则处理过程结束。
可选地,上述指令转换器1029在根据语音识别技术、自然语言处理技术和图像识别技术等技术将所述信号转换成处理指令和目标数据之前,上述指令转换器1029从上述第一存储模块中获取上述步骤101中的信号。
其中,如图2所示,所述指令转换器1029包括:
第一信号识别器1021,用于将所述信号转换成文本信息。可选的,该识别器可包含一个或多个子识别器,如语音信号子识别器通过语音识别技术将语音信号转换成文本信息,图像信号子识别器通过图像识别技术将一幅图像或一组图像的有效信号转换成文本信息等;
可选的,在将所述信号转换成文本信息的过程中还可以同时处理多种类型信号,如同时输入语音信号和图像信号,分别利用语音信号子识别器和图像信号子识别器对其进行识别。
图像识别技术,即对输入的图像信号进行识别和分析,可包括但不限于以下算法:利用OTSU算法、Roberts算子、Sobel算子、Normalized Cuts算法进行图像分割、利用Bag ofwords(BoW)方法、Partsand structure方法、生成性(generative)方法与鉴别性(Discriminative)方法等方法进行目标识别和目标检测,利用核相关滤波(KDF)算法、DSST(Discriminative Scale Space Tracker)算法等进行目标跟踪。用以从一张或一组图像中提取出图像信号所表达的操作。
举例说明下,上述图像信号处理一组图像的过程。具体地,假设利用摄像头采集多幅图像,利用图像信号子识别器,对采集到的图像进行分割,剔除无效信息,即将图像的前景和背景进行分割,剔除背景信息,获取前景信息,接着,确定一个或多个目标的位置及大小等相关信息,具体地,如进行利用边缘检测和分割技术,如:边缘检测算法:sobel边缘检测算法、laplace边缘检测算法等,又如分割算法:基于阈值的图像分割算法、基于边缘的图像分割算法、基于区域的边缘分割算法、基于图论的边缘分割算法、基于能量泛函的分割算法、基于小波变换的分割算法、基于神经网络的分割算法,从而,确定人脸、人手、人的骨骼架构的位置及范围;其次,对目标进行识别并提取特征,特征提取技术可包括SIFT、SURF等角点检测包括HARRIS fast等,如果具有多个备选目标,则确定各备选目标备选的优先级;最后,筛选出有效目标,并利用目标追踪技术,如:相关滤波和深度学习方法,在此不做限定,追踪目标运动轨迹,得到该目标所表达的含义,如获取到人脸、人的骨骼架构基本没有变化,而人手从左边滑到右边,得到该有效信息是将待处理图像的目标区域从左边移动到右边,而后将有效的图像信息将其转化为文本信息。
再举例说明下,上述文本信号处理一段文本的过程。假设利用文本信息采集器获取到了一段文本信息,利用文本信号子识别器,对采集到的文本进行切分,形成文本矢量。而后利用文本特征提取技术,文本特征提取技术可以包括以下至少一种:TF-IDF、词频方法、文档频次方法、互信息、期望交叉熵、二次信息熵、二次信息熵、x2统计量方法、文本证据权、遗传算法、主成分分析法、模拟退火算法、N—Gram算法等等,在此不做限定,筛选出有效文本信息。结合离线训练而成的文本匹配模型,将有效的采集文本信息转化成为可送入信号文本转换器的文本信息。
再举例说明下,上述多种类型信号的处理过程。假设两个或以上信号采集器采集到信息,假设是语音信息和图像信息,那么将语音信息通过语音信号子识别器处理成为了语音信号对应的文本信息,将图像信息通过图像信号子识别器处理成为了图像信号对应的预设类型信息,预设类型信息可以为以下至少一种:文本信息、图像信息、语音信息、投影信息、振动信息等等,在此不作限定。
信号文本转换器1022,用于将所述一条或多条文本信息通过自然语言处理技术和所述目标信号指令转换模型转换成所述处理指令;
第一数据识别器1023,用于根据所述处理指令中的语义区域的粒度和图像识别技术对所述待处理数据进行区域划分,得到所述目标数据。
进一步地,上述指令转换器1029还包括:
获取模块1026,用于获取上述处理指令中的语义区域的粒度。
举例说明上述语义区域,假设上述信号处理装置100根据语音信号确定对上述目标数据为人脸区域时,则上述语义区域为上述待处理数据中的人脸区域,上述信号处理装置以人脸为粒度,获取上述待处理数据中的多个人脸区域;当上述目标数据为背景,上述信号处理装置将上述待处理数据划分为背景区域和非背景区域;当上述目标数据为红颜色区域时,上述信号处理装置将上述待处理数据按照颜色划分为不同颜色的区域。
可选的,上述指令转换器1029还包括交互模块,用于完成系统与用户之间的交互操作,可以通过发送交互信息给用户,接收用户反馈信息,并依据该反馈信息生成相应的指令,可将该指令传输给处理器1039执行相应操作,交互信息可以为提示用户进行指定操作的指示信息,指定操作可以由用户自行设置或者系统默认,反馈信息可以由用户输入,输入方式可包括但不仅限于:语音输入、触控输入、肢体动作输入等等,在此不做限定。例如,交互模块用户判断目标区域和处理指令是否符合判断模型的预设要求,预设要求可以由用户自行设置,或者,系统默认。例如,要求头脚互换,则不符合常理。如果不符合,返回提示信息给用户,如询问用户是否确定执行该操作。其中,判断模型是通过离线训练得到的模型,也可以是用户自定义得到的模型。如收到确认的信息,则继续执行。用户确认的方式可以包括以下至少一种:可通过点击按钮、语音输入、图像输入等多种方式,在此不作限定。又如交互模块用于根据预设顺序或根据用户习惯,依次缩放待处理图像的一个局部区域和/或几个局部区域,便于进行更为细节的操作,具体地,如用户习惯为修改人像图像时,依次眉、眼、嘴的调整顺序,那么该装置检测到待处理图像为人像图像时,依次取眉、眼、嘴部分进行放大,便于用户对其进行操作。
具体地,本发明中使用的语音识别技术包括但不限于采用人工神经网络(Artificial Neural Network,ANN)、隐马尔科夫模型(Hidden Markov Model,HMM)等模型,上述第一信号识别器中的语音信号子识别器可根据上述语音识别技术处理上述语音信号;上述自然语言处理技术包括但不限于利用统计机器学习、ANN等方法,上述语义理解单元可根据上述自然语言处理技术提取出语义信息;上述图像识别技术包括但不限于利用基于边缘检测的方法、阈值分割方法、区域生长与分水岭算法、灰度积分投影曲线分析、模板匹配、可变形模板、Hough变换、Snake算子、基于Gabor小波变换的弹性图匹配技术、主动形状模型和主动外观模型等方法等算法,上述图像信号子识别器可根据上述图像识别技术将上述待处理数据分割成不同的区域。
上述自然语言处理技术,即让计算机能够理解输入的语音或者文本信息。包括但不限于最大匹配算法,word2vec算法,doc2vec算法,潜在语音索引算法,潜在狄利克雷分布算法,以及机器学习算法,包括支持向量机、神经网络、AdaBoost等算法。用以完成词法分析、语法分析、语义分析、情感倾向性分析等,得到输入信号中所表达的观点和意义。譬如,读取信号数据之后,对数据进行去噪音。而后对数据进行分词和标注,利用TF-IDF、word2vec等算法建立词袋模型。利用WLLR(Weighted Log Likelihood Ration)加权对数似然、WFO(Weighted Frequency and Odds)加权频率和可能性等算法对特征进行选择。得到输入信号的特征。根据该特征直接转换为相应的文本信息,或者根据该特征和预训练而成的模型得到相应的文本信息。譬如,以语义理解技术为例,利用语义树、主题模型、词向量等技术对输入信号的语义进行分析,得到输入信号所表达的主题和操作,便于后续选择合适的模型进行处理。
举例说明下,给出该处理的另一个实例,该实例为输入的待处理数据为一段语音,参考数据是一段文本,输入的处理要求是一段语音,要求将文本读出来插在待处理语音中间。信号采集器1019接收一段语音,经过降噪等预处理后作为待处理数据,送入存储器1049中暂时存储。信号采集器1019接收通过麦克风阵列接收语音信号并进行降噪处理后得到有效语音要求,送入处理器1039。处理器1039对传入的语音信号利用语音识别技术直接将语音信号转化成为了待处理数据处理指令和目标区域,根据待处理数据处理指令,利用文本转语音技术将输入的文本形式的参考数据转换成为参考语音,而后从存储器1049中读取待处理数据,根据待处理数据的语音的语音特性,如语音语调,对参考语音进行处理。最后,将参考语音插入到待处理语音中的目标区域内,并进行平滑处理,得到处理后的语音数据。如果接收到用户发出的结束的信息,则处理过程结束,数据即可,否则继续接受用户的处理请求,直到接收到用户的结束的信息。其中,不限制结束信息的形式,不限制结束信息的形式,可以为语音形式、图像形式,也可以通过令用户通过点击结束按键得到信息的形式。
再举例说明下,给出该处理的又一个实例,该实例为输入的待处理数据为一段中文文本,输入的处理要求是一段语音,要求将中文文本翻译成为一段适用于正式场合的英语语音。指令转换模块1029将语音处理要求解析成为了操作指令和目标区域。处理器1039根据输入的语音要求,首先将中文文本翻译成为正式用词和正式语法的英文文本,而后通过文本转语音的相关技术,调用存储器1049中处理后的语音数据库,将英文文本转换为较为正式的语音语调的语音数据。如果接收到用户发出的结束的信息,则处理过程结束,数据即可;否则继续接受用户的处理请求,直到接收到用户的结束的信息。其中,不限制结束信息的形式,不限制结束信息的形式,可以为语音形式、图像形式,也可以通过令用户通过点击结束按键得到信息的形式。
在一种可行的实施例中,上述第一信号识别器1021将上述信号通过上述语音识别技术、图像识别技术、自然语言处理等转换成有效的文本信息,并将该文本信息保存到上述第一存储模块中。上述信号文本转换器1022从上述第一存储模块中获取上述文本信息,并将该文本信息通过自然语言处理技术和上述目标信号指令转换模型转换成处理指令,并将上述处理指令保存到上述第一存储模块中;上述第一数据识别器1023根据上述处理指令中的语义区域的粒度和图像识别技术对上述待处理数据进行区域划分,得到上述目标数据,并将上述划分结果和上述目标数据存储到上述第二存储模块中。
在一种可行的实施例中,如图3所示,上述指令转换器1029也可以包括:
第二信号识别器1025,用于根据语音识别技术、自然语言处理技术和上述目标信号指令转换模型将上述信号直接转化为上述处理指令,并将该处理指令保存到第一存储模块中;
可选地,第二信号识别器1025包括一个或多个子识别器,如语音信号子识别器通过语音识别技术来识别语音信号,图像信号子识别器通过图像识别技术来识别一幅图像或多幅图像的有效信号。
举例说明下,上述图像信号处理一组图像的过程。具体地,假设利用摄像头采集多幅图像,利用图像信号子识别器,对采集到的图像进行分割,剔除无效信息,即将图像的前景和背景进行分割,剔除背景信息,获取前景信息,接着,确定一个或多个目标的位置及大小等相关信息,具体地,如进行利用边缘检测技术,确定人脸、人手、人的骨骼架构的位置及范围;其次,对目标进行识别,如果具有多个备选目标,则确定各备选目标备选的优先级;最后,筛选出有效目标,并利用目标追踪技术,追踪目标运动轨迹,得到该目标所表达的含义,如获取到人脸、人的骨骼架构基本没有变化,而人手从左边滑到右边,得到该有效信息是将待处理数据的目标数据从左边移动到右边,而后将有效的图像信息将其转化为文本信息。
再举例说明下,上述文本信号处理一段文本的过程。假设利用文本信息采集器获取到了一段文本信息,利用文本信号子识别器,对采集到的文本进行切分,形成文本矢量。而后利用文本特征提取技术,筛选出有效文本信息。结合离线训练而成的文本匹配模型,将有效的采集文本信息转化成为可送入信号文本转换器的文本信息。
再举例说明下,上述多种类型信号的处理过程。假设两个或以上信号采集器采集到信息,假设是语音信息和图像信息,那么将语音信息通过语音信号子识别器处理成为了语音信号对应的文本信息,将图像信息通过图像信号子识别器处理成为了图像信号对应的文本信息。
第二数据识别器1025,根据上述处理指令对上述待处理数据进行操作的语义区域的粒度,将该待处理数据按照该语义区域的粒度进行划分,获取目标数据,该目标数据为对上述待处理数据进行处理的区域,并将划分后的结果以及上述目标数据存储到第二存储模块中。
可选地,在上述信号采集器1019接收上述信号和上述待处理数据之前,上述指令转换器1029对信号指令转换模型进行自适应训练,以得到上述目标信号指令转换模型。
其中,上述对信号指令转换模型进行自适应训练是离线进行的或者是在线进行的。
具体地,上述对信号指令转换模型进行自适应训练是离线进行的具体是上述指令转换器1029在其硬件的基础上对上述信号指令转换模型进行自适应训练,以得到目标信号指令转换模型;上述对信号指令转换模型进行自适应训练是在线进行的具体是一个不同于上述信号转换器102的云端服务器对上述信号指令转换模型进行自适应训练,以得到目标信号指令转换模型。上述指令转换器1029在需要使用上述目标信号指令转换模型时,该指令转换器1029从上述云端服务器中获取该目标信号指令转换模型。
可选地,上述对信号指令转换模型进行自适应训练是有监督的或者是监督的。
具体地,上述对上述信号指令转换模型进行自适应训练是有监督的具体为:
上述指令转换器1029根据信号指令转换模型将上述信号换成预测指令;然后确定上述预测指令与其对应的指令集合的相关系数,该指令集合为人工根据信号得到的指令的集合;上述指令转换器1029根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
在一种可行的实施例中,上述信号处理装置100还包括:
训练器1059,用于根据所述信号指令转换模型将所述信号换成预测指令;确定所述预测指令与其对应的指令集合的相关系数;根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
举例说明,上述对信号指令转换模型进行自适应训练是有监督的具体包括:上述指令转换器1029或者训练器1059接收一段包含相关命令的语音信号,如改变图像的颜色、旋转图片等。每种命令对应一个指令集合。对用于自适应训练的输入的语音信号来说,对应的指令集合是已知的,上述指令转换器1029或者训练器1059以这些语音信号作为信号指令转换模型的输入数据,获取输出后的预测指令。上述指令转换器1029或者训练器1059计算上述预测指令与其对应的指令集合的相关系数,并根据该自适应地更新上述信号指令转换模型中的参数(如权值、偏置等等),以提高上述信号指令转换模型的性能,进而得到上述目标信号指令转换模型。
又以图像信号为例,上述指令转换器1029或者训练器1059接收一段包含相关命令的图像信号,如通过手势指定图像中某物体,而后要求将其向右移动等。每种命令对应一个指令集合。对用于自适应训练的输入的图像信号来说,对应的指令集合是已知的,上述指令转换器1029或者训练器1059以这些图像信号作为信号指令转换模型的输入数据,获取输出后的预测指令。上述指令转换器1029或者训练器1059计算上述预测指令与其对应的指令集合的相关系数,并根据该自适应地更新上述信号指令转换模型中的参数(如权值、偏置等等),以提高上述信号指令转换模型的性能,进而得到上述目标信号指令转换模型。
所述信号处理装置100还包括:
存储器1049,用于存储所述文本信息或者所述处理指令或者所述目标数据。
在一种可行的实施例中,上述存储器1049与上述第一存储模块和第二存储模块可以是同一个存储模块,还可以是不同的存储模块。
处理器1039,用于根据所述处理指令和目标处理模型对所述待处理数据进行处理。
其中,如图4所示,所述处理器1039包括:
取指令模块1031,用于在预设时间窗口内从所述存储模块中获取M条处理指令,所述M为大于1的整数;
处理模块1032,用于根据所述M条处理指令和所述目标处理模型对所述目标数据进行处理。
可选地,所述处理模块1032用于:
删除所述M条处理指令中,功能相同的处理指令,以得到N条处理指令,所述N为小于所述M的整数;
根据所述N条处理指令和所述目标处理模型对所述目标数据进行处理。
具体地,上述预设时间窗口可以理解成预设时长。在预设时长内上述获取单元1031从上述存储模块104中获取M条处理指令后,上述处理模块1032对上述M条处理指令进行两两比较,将该M条处理指令中功能相同的指令删除,得到N条处理指令。上述处理模块1032根据上述N条处理指令和上述目标处理模型对上述待处理数据进行处理。
举例说明,上述处理模块1032对上述M条处理指令进行两两比较。当处理指令A和处理指令B一样时,上述处理模块1032删除上述处理指令A和B中开销最大的一条;当处理指令A和处理指令B不一样时,上述处理模块1032获取上述处理指令A和上述处理指令B的相似系数。当该相似系数大于相似阈值时,确定上述处理指令A和上述处理指令B功能相同,上述处理模块1032删除上述处理指令A和B中开销最大的一条;当上述相似系数小于上述相似阈值时,上述处理模块1032确定上述处理指令A和B的功能不同。该处理指令A和B为上述M条处理指令中的任意两条。
具体地,针对上述处理器1039,其输入和输出均为图像。上述处理器1039可以通过包括但不限定于ANN和传统计算机视觉方法对上述待处理数据进行的处理包括但不局限于:美体(例如美腿,隆胸),换脸、美化脸,换物体(猫换狗、斑马变马,苹果换桔子等),换背景(后面的森林换成田野),去遮挡(例如人脸遮住了一个眼睛,重新把眼睛重构出来),风格转换(一秒钟变梵高画风),位姿转换(例如站着变坐着,正脸变侧脸)、非油画变油画、更换图像背景的颜色和更换图像中物体所处的季节背景、图像合成、图像融合、消除物体或阴影、图片着色、图片压缩、图片矢量化等。
可选地,在上述信号采集器1019接收上述信号之前,上述处理器1039对处理模型进行自适应训练,以得到上述目标处理模型。
其中,上述对处理模型进行自适应训练是离线进行的或者是在线进行的。
具体地,上述对处理模型进行自适应训练是离线进行的具体是上述处理器1039在其硬件的基础上对上述处理模型进行自适应训练,以得到目标信号指令转换模型;上述对处理模型进行自适应训练是在线进行的具体是一个不同于上述处理器1039的云端服务器对上述处理模型进行自适应训练,以得到目标处理模型。上述处理器1039在需要使用上述目标处理模型时,该处理器1039从上述云端服务器中获取该目标处理模型。
可选地,上述对处理模型进行自适应训练是有监督的或者是监督的。
具体地,上述对上述处理模型进行自适应训练是有监督的具体为:
以语音信号为例,上述处理器1039根据处理模型将上述语音信号换成预测数据;然后确定上述预测数据与其对应的训练数据的相关系数,该目标为人工根据语音信号对待处理数据进行处理得到的图像;上述处理器1039根据所述预测数据与其对应的训练数据的相关系数优化所述处理模型,以得到所述目标处理模型。
以图像信号为例,上述处理器1039根据处理模型将上述图像信号换成预测数据;然后确定上述预测数据与其对应的训练数据的相关系数,该目标为人工根据语音信号对待处理数据进行处理得到的图像;上述处理器1039根据所述预测数据与其对应的训练数据的相关系数优化所述处理模型,以得到所述目标处理模型。
在一种可行的实施例中,上述信号处理装置100还包括:
训练器1059,用于根据所述信号指令转换模型将所述信号换成预测指令;确定所述预测指令与其对应的指令集合的相关系数;根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
举例说明,上述对处理模型进行自适应训练是有监督的具体包括:以语音信号为例,上述处理器1039或者训练器1059接收一段包含相关命令的语音信号,如改变图像的颜色、旋转图片等。每种命令对应一张训练数据。对用于自适应训练的输入的语音信号来说,对应的训练数据是已知的,上述处理器1039或者训练器1059以这些语音信号作为处理模型的输入数据,获取输出后的预测数据。上述处理器1039或者训练器1059计算上述预测数据与其对应的训练数据的相关系数,并根据该自适应地更新上述处理模型中的参数(如权值、偏置等等),以提高上述处理模型的性能,进而得到上述目标处理模型。
以图像信号为例,上述处理器1039或者训练器1059接收一段包含相关命令的图像信号,如改变图像的颜色、旋转图片等。每种命令对应一张训练数据。对用于自适应训练的输入的语音信号来说,对应的训练数据是已知的,上述处理器1039或者训练器1059以这些图像信号作为处理模型的输入数据,获取输出后的预测数据。上述处理器1039或者训练器1059计算上述预测数据与其对应的训练数据的相关系数,并根据该自适应地更新上述处理模型中的参数(如权值、偏置等等),以提高上述处理模型的性能,进而得到上述目标处理模型。
在一种可行的实施例中,所述信号处理装置100的指令转换器1029可以用于对指令转换器1029中的信号指令转换模型进行自适应训练,以得到目标信号指令转换模型:所述信号处理装置100的处理器1039可以用于对处理器1039中的处理模型进行自适应训练,以得到目标处理模型。
在一种可行的实施例中,所述信号处理装置100还包括:
训练其105,用于对指令转换器1029中的信号指令转换模型和处理器1039中的处理模型分别进行自适应训练,以得到目标信号指令转换模型和目标处理模型。
上述训练器1059可以通过有监督的方法或者无监督的方法调整上述信号指令转换模型中或者上述处理模型中的结构与参数,以提高该信号指令转换模型或者处理模型的性能,最终得到目标信号指令转换模型或者目标处理模型。
在本实施例中,信号处理装置100是以模块的形式来呈现。这里的“模块”可以指特定应用集成电路(application-specific integrated circuit,ASIC),执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。此外,以上信号采集器1019、指令转换器1029、处理器1039、存储模块104和训练器1059可通过图5A~图8所示的装置来实现。
可选地,上述信号处理装置100的指令转换器1029或者处理器1039的处理模块1032为人工神经网络芯片,即上述指令转换器1029和上述处理器1039的处理模块1032可以是两块独立的人工神经网络芯片,其结构分别如图5A~图8所示。
在本装置中,指令转换器1029和处理器1039既可以串行执行,也可以通过软流水的方式执行,即处理器1039在处理上一个图像时,指令转换器1029可以处理下一个图像,这样可以提高硬件的吞吐率,提高图像处理效率。
参阅图5A,提供了一种计算装置,该计算装置用于执行机器学习计算,该计算装置包括:控制器单元11和运算单元12,其中,控制器单元11与运算单元12连接,该运算单元12包括:一个主处理电路和多个从处理电路;
控制器单元11,用于获取输入数据以及计算指令;在一种可选方案中,具体的,获取输入数据以及计算指令方式可以通过数据输入输出单元得到,该数据输入输出单元具体可以为一个或多个数据I/O接口或I/O引脚。
上述计算指令包括但不限于:正向运算指令或反向训练指令,或其他神经网络运算指令等等,例如卷积运算指令,本申请具体实施方式并不限制上述计算指令的具体表现形式。
控制器单元11,还用于解析该计算指令得到多个运算指令,将该多个运算指令以及所述输入数据发送给所述主处理电路;
主处理电路101,用于对所述输入数据执行前序处理以及与所述多个从处理电路之间传输数据以及运算指令;
多个从处理电路102,用于依据从所述主处理电路传输的数据以及运算指令并行执行中间运算得到多个中间结果,并将多个中间结果传输给所述主处理电路;
主处理电路101,用于对所述多个中间结果执行后续处理得到所述计算指令的计算结果。
本申请提供的技术方案将运算单元设置成一主多从结构,对于正向运算的计算指令,其可以将依据正向运算的计算指令将数据进行拆分,这样通过多个从处理电路即能够对计算量较大的部分进行并行运算,从而提高运算速度,节省运算时间,进而降低功耗。
可选的,上述机器学习计算具体可以包括:人工神经网络运算,上述输入数据具体可以包括:输入神经元数据和权值数据。上述计算结果具体可以为:人工神经网络运算的结果即输出神经元数据。
对于神经网络中的运算可以为神经网络中的一层的运算,对于多层神经网络,其实现过程是,在正向运算中,当上一层人工神经网络执行完成之后,下一层的运算指令会将运算单元中计算出的输出神经元作为下一层的输入神经元进行运算(或者是对该输出神经元进行某些操作再作为下一层的输入神经元),同时,将权值也替换为下一层的权值;在反向运算中,当上一层人工神经网络的反向运算执行完成后,下一层运算指令会将运算单元中计算出的输入神经元梯度作为下一层的输出神经元梯度进行运算(或者是对该输入神经元梯度进行某些操作再作为下一层的输出神经元梯度),同时将权值替换为下一层的权值。
上述机器学习计算还可以包括支持向量机运算,k-近邻(k-nn)运算,k-均值(k-means)运算,主成分分析运算等等。为了描述的方便,下面以人工神经网络运算为例来说明机器学习计算的具体方案。
对于人工神经网络运算,如果该人工神经网络运算具有多层运算,多层运算的输入神经元和输出神经元并非是指整个神经网络的输入层中神经元和输出层中神经元,而是对于网络中任意相邻的两层,处于网络正向运算下层中的神经元即为输入神经元,处于网络正向运算上层中的神经元即为输出神经元。以卷积神经网络为例,设一个卷积神经网络有L层,K=1,2,...,L-1,对于第K层和第K+1层来说,我们将第K层称为输入层,其中的神经元为所述输入神经元,第K+1层称为输出层,其中的神经元为所述输出神经元。即除最顶层外,每一层都可以作为输入层,其下一层为对应的输出层。
可选的,上述计算装置还可以包括:该存储单元10和直接内存访问单元50,存储单元10可以包括:寄存器、缓存中的一个或任意组合,具体的,所述缓存,用于存储所述计算指令;所述寄存器,用于存储所述输入数据和标量;所述缓存为高速暂存缓存。直接内存访问单元50用于从存储单元10读取或存储数据。
可选的,该控制器单元包括:指令存储单元110、指令处理单元111和存储队列单元113;
指令存储单元110,用于存储所述人工神经网络运算关联的计算指令;
所述指令处理单元111,用于对所述计算指令解析得到多个运算指令;
存储队列单元113,用于存储指令队列,该指令队列包括:按该队列的前后顺序待执行的多个运算指令或计算指令。
举例说明,在一个可选的技术方案中,主运算处理电路也可以包括一个控制器单元,该控制器单元可以包括主指令处理单元,具体用于将指令译码成微指令。当然在另一种可选方案中,从运算处理电路也可以包括另一个控制器单元,该另一个控制器单元包括从指令处理单元,具体用于接收并处理微指令。上述微指令可以为指令的下一级指令,该微指令可以通过对指令的拆分或解码后获得,能被进一步解码为各部件、各单元或各处理电路的控制信号。
在一种可选方案中,该计算指令的结构可以如下表所示。
操作码 寄存器或立即数 寄存器/立即数 ...
上表中的省略号表示可以包括多个寄存器或立即数。
在另一种可选方案中,该计算指令可以包括:一个或多个操作域以及一个操作码。该计算指令可以包括神经网络运算指令。以神经网络运算指令为例,如表1所示,其中,寄存器号0、寄存器号1、寄存器号2、寄存器号3、寄存器号4可以为操作域。其中,每个寄存器号0、寄存器号1、寄存器号2、寄存器号3、寄存器号4可以是一个或者多个寄存器的号码。
Figure BDA0001816059530000211
上述寄存器可以为片外存储器,当然在实际应用中,也可以为片内存储器,用于存储数据,该数据具体可以为n维数据,n为大于等于1的整数,例如,n=1时,为1维数据,即向量,如n=2时,为2维数据,即矩阵,如n=3或3以上时,为多维张量。
可选的,该控制器单元还可以包括:
所述依赖关系处理单元108,用于在具有多个运算指令时,确定第一运算指令与所述第一运算指令之前的第零运算指令是否存在关联关系,如所述第一运算指令与所述第零运算指令存在关联关系,则将所述第一运算指令缓存在所述指令存储单元内,在所述第零运算指令执行完毕后,从所述指令存储单元提取所述第一运算指令传输至所述运算单元;
所述确定该第一运算指令与第一运算指令之前的第零运算指令是否存在关联关系包括:
依据所述第一运算指令提取所述第一运算指令中所需数据(例如矩阵)的第一存储地址区间,依据所述第零运算指令提取所述第零运算指令中所需矩阵的第零存储地址区间,如所述第一存储地址区间与所述第零存储地址区间具有重叠的区域,则确定所述第一运算指令与所述第零运算指令具有关联关系,如所述第一存储地址区间与所述第零存储地址区间不具有重叠的区域,则确定所述第一运算指令与所述第零运算指令不具有关联关系。
在另一种可选实施例中,运算单元12如图5C所示,可以包括一个主处理电路101和多个从处理电路102。在一个实施例里,如图5C所示,多个从处理电路呈阵列分布;每个从处理电路与相邻的其他从处理电路连接,主处理电路连接所述多个从处理电路中的k个从处理电路,所述k个从处理电路为:第1行的n个从处理电路、第m行的n个从处理电路以及第1列的m个从处理电路,需要说明的是,如图5C所示的K个从处理电路仅包括第1行的n个从处理电路、第m行的n个从处理电路以及第1列的m个从处理电路,即该k个从处理电路为多个从处理电路中直接与主处理电路连接的从处理电路。
K个从处理电路,用于在所述主处理电路以及多个从处理电路之间的数据以及指令的转发。
可选的,如图5D所示,该主处理电路还可以包括:转换处理电路110、激活处理电路111、加法处理电路112中的一种或任意组合;
转换处理电路110,用于将主处理电路接收的数据块或中间结果执行第一数据结构与第二数据结构之间的互换(例如连续数据与离散数据的转换);或将主处理电路接收的数据块或中间结果执行第一数据类型与第二数据类型之间的互换(例如定点类型与浮点类型的转换);
激活处理电路111,用于执行主处理电路内数据的激活运算;
加法处理电路112,用于执行加法运算或累加运算。
所述主处理电路,用于将确定所述输入神经元为广播数据,权值为分发数据,将分发数据分配成多个数据块,将所述多个数据块中的至少一个数据块以及多个运算指令中的至少一个运算指令发送给所述从处理电路;
所述多个从处理电路,用于依据该运算指令对接收到的数据块执行运算得到中间结果,并将运算结果传输给所述主处理电路;
所述主处理电路,用于将多个从处理电路发送的中间结果进行处理得到该计算指令的结果,将该计算指令的结果发送给所述控制器单元。
所述从处理电路包括:乘法处理电路;
所述乘法处理电路,用于对接收到的数据块执行乘积运算得到乘积结果;
转发处理电路(可选的),用于将接收到的数据块或乘积结果转发。
累加处理电路,所述累加处理电路,用于对该乘积结果执行累加运算得到该中间结果。
另一个实施例里,该运算指令为矩阵乘以矩阵的指令、累加指令、激活指令等等计算指令。
下面通过神经网络运算指令来说明如图5A所示的计算装置的具体计算方法。对于神经网络运算指令来说,其实际需要执行的公式可以为:s=s(∑wxi+b),其中,即将权值w乘以输入数据xi,进行求和,然后加上偏置b后做激活运算s(h),得到最终的输出结果s。
在一种可选的实施方案中,如图5E所示,所述运算单元包括:树型模块40,所述树型模块包括:一个根端口401和多个支端口404,所述树型模块的根端口连接所述主处理电路,所述树型模块的多个支端口分别连接多个从处理电路中的一个从处理电路;
上述树型模块具有收发功能,例如如图5E所示,该树型模块即为发送功能,如图6B所示,该树型模块即为接收功能。
所述树型模块,用于转发所述主处理电路与所述多个从处理电路之间的数据块、权值以及运算指令。
可选的,该树型模块为计算装置的可选择结果,其可以包括至少1层节点,该节点为具有转发功能的线结构,该节点本身可以不具有计算功能。如树型模块具有零层节点,即无需该树型模块。
可选的,该树型模块可以为n叉树结构,例如,如图5F所示的二叉树结构,当然也可以为三叉树结构,该n可以为大于等于2的整数。本申请具体实施方式并不限制上述n的具体取值,上述层数也可以为2,从处理电路可以连接除倒数第二层节点以外的其他层的节点,例如可以连接如图5F所示的倒数第一层的节点。
可选的,上述运算单元可以携带单独的缓存,如图5G所示,可以包括:神经元缓存单元,该神经元缓存单元63缓存该从处理电路的输入神经元向量数据和输出神经元值数据。
如图5H所示,该运算单元还可以包括:权值缓存单元64,用于缓存该从处理电路在计算过程中需要的权值数据。
在一种可选实施例中,运算单元12如图5B所示,可以包括分支处理电路103;其具体的连接结构如图5B所示,其中,
主处理电路101与分支处理电路103(一个或多个)连接,分支处理电路103与一个或多个从处理电路102连接;
分支处理电路103,用于执行转发主处理电路101与从处理电路102之间的数据或指令。
在一种可选实施例中,以神经网络运算中的全连接运算为例,过程可以为:y=f(wx+b),其中,x为输入神经元矩阵,w为权值矩阵,b为偏置标量,f为激活函数,具体可以为:sigmoid函数,tanh、relu、softmax函数中的任意一个。这里假设为二叉树结构,具有8个从处理电路,其实现的方法可以为:
控制器单元从存储单元内获取输入神经元矩阵x,权值矩阵w以及全连接运算指令,将输入神经元矩阵x,权值矩阵w以及全连接运算指令传输给主处理电路;
主处理电路确定该输入神经元矩阵x为广播数据,确定权值矩阵w为分发数据,将权值矩阵w拆分成8个子矩阵,然后将8个子矩阵通过树型模块分发给8个从处理电路,将输入神经元矩阵x广播给8个从处理电路,
从处理电路并行执行8个子矩阵与输入神经元矩阵x的乘法运算和累加运算得到8个中间结果,将8个中间结果发送给主处理电路;
主处理电路,用于将8个中间结果排序得到wx的运算结果,将该运算结果执行偏置b的运算后执行激活操作得到最终结果y,将最终结果y发送至控制器单元,控制器单元将该最终结果y输出或存储至存储单元内。
如图5A所示的计算装置执行神经网络正向运算指令的方法具体可以为:
控制器单元从指令存储单元内提取神经网络正向运算指令、神经网络运算指令对应的操作域以及至少一个操作码,控制器单元将该操作域传输至数据访问单元,将该至少一个操作码发送至运算单元。
控制器单元从存储单元内提取该操作域对应的权值w和偏置b(当b为0时,不需要提取偏置b),将权值w和偏置b传输至运算单元的主处理电路,控制器单元从存储单元内提取输入数据Xi,将该输入数据Xi发送至主处理电路。
主处理电路依据该至少一个操作码确定为乘法运算,确定输入数据Xi为广播数据,确定权值数据为分发数据,将权值w拆分成n个数据块;
控制器单元的指令处理单元依据该至少一个操作码确定乘法指令、偏置指令和累加指令,将乘法指令、偏置指令和累加指令发送至主处理电路,主处理电路将该乘法指令、输入数据Xi以广播的方式发送给多个从处理电路,将该n个数据块分发给该多个从处理电路(例如具有n个从处理电路,那么每个从处理电路发送一个数据块);多个从处理电路,用于依据该乘法指令将该输入数据Xi与接收到的数据块执行乘法运算得到中间结果,将该中间结果发送至主处理电路,该主处理电路依据该累加指令将多个从处理电路发送的中间结果执行累加运算得到累加结果,依据该偏置指令将该累加结果执行加偏置b得到最终结果,将该最终结果发送至该控制器单元。
另外,加法运算和乘法运算的顺序可以调换。
本申请提供的技术方案通过一个指令即神经网络运算指令即实现了神经网络的乘法运算以及偏置运算,在神经网络计算的中间结果均无需存储或提取,减少了中间数据的存储以及提取操作,所以其具有减少对应的操作步骤,提高神经网络的计算效果的优点。
本申请还揭露了一个机器学习运算装置,其包括一个或多个在本申请中提到的计算装置,用于从其他处理装置中获取待运算数据和控制信息,执行指定的机器学习运算,执行结果通过I/O接口传递给外围设备。外围设备譬如摄像头,显示器,鼠标,键盘,网卡,wifi接口,服务器。当包含一个以上计算装置时,计算装置间可以通过特定的结构进行链接并传输数据,譬如,通过PCIE总线进行互联并传输数据,以支持更大规模的机器学习的运算。此时,可以共享同一控制系统,也可以有各自独立的控制系统;可以共享内存,也可以每个加速器有各自的内存。此外,其互联方式可以是任意互联拓扑。
该机器学习运算装置具有较高的兼容性,可通过PCIE接口与各种类型的服务器相连接。
本申请还揭露了一个组合处理装置,其包括上述的机器学习运算装置,通用互联接口,和其他处理装置。机器学习运算装置与其他处理装置进行交互,共同完成用户指定的操作。图6A为组合处理装置的示意图。
其他处理装置,包括中央处理器CPU、图形处理器GPU、神经网络处理器等通用/专用处理器中的一种或以上的处理器类型。其他处理装置所包括的处理器数量不做限制。其他处理装置作为机器学习运算装置与外部数据和控制的接口,包括数据搬运,完成对本机器学习运算装置的开启、停止等基本控制;其他处理装置也可以和机器学习运算装置协作共同完成运算任务。
通用互联接口,用于在所述机器学习运算装置与其他处理装置间传输数据和控制指令。该机器学习运算装置从其他处理装置中获取所需的输入数据,写入机器学习运算装置片上的存储装置;可以从其他处理装置中获取控制指令,写入机器学习运算装置片上的控制缓存;也可以读取机器学习运算装置的存储模块中的数据并传输给其他处理装置。
可选的,该结构如图7A所示,还可以包括存储装置,存储装置分别与所述机器学习运算装置和所述其他处理装置连接。存储装置用于保存在所述机器学习运算装置和所述其他处理装置的数据,尤其适用于所需要运算的数据在本机器学习运算装置或其他处理装置的内部存储中无法全部保存的数据。
该组合处理装置可以作为手机、机器人、无人机、视频监控设备等设备的SOC片上系统,有效降低控制部分的核心面积,提高处理速度,降低整体功耗。此情况时,该组合处理装置的通用互联接口与设备的某些部件相连接。某些部件譬如摄像头,显示器,鼠标,键盘,网卡,wifi接口。
在一些实施例里,还申请了一种芯片,其包括了上述机器学习运算装置或组合处理装置。
在一些实施例里,申请了一种芯片封装结构,其包括了上述芯片。
在一些实施例里,申请了一种板卡,其包括了上述芯片封装结构。参阅图7B,图7B提供了一种板卡,上述板卡除了包括上述芯片389以外,还可以包括其他的配套部件,该配套部件包括但不限于:存储器件390、接口装置391和控制器件392;
所述存储器件390与所述芯片封装结构内的芯片通过总线连接,用于存储数据。所述存储器件可以包括多组存储单元393。每一组所述存储单元与所述芯片通过总线连接。可以理解,每一组所述存储单元可以是DDR SDRAM(英文:Double Data Rate SDRAM,双倍速率同步动态随机存储器)。
DDR不需要提高时钟频率就能加倍提高SDRAM的速度。DDR允许在时钟脉冲的上升沿和下降沿读出数据。DDR的速度是标准SDRAM的两倍。在一个实施例中,所述存储装置可以包括4组所述存储单元。每一组所述存储单元可以包括多个DDR4颗粒(芯片)。在一个实施例中,所述芯片内部可以包括4个72位DDR4控制器,上述72位DDR4控制器中64bit用于传输数据,8bit用于ECC校验。可以理解,当每一组所述存储单元中采用DDR4-3200颗粒时,数据传输的理论带宽可达到25600MB/s。
在一个实施例中,每一组所述存储单元包括多个并联设置的双倍速率同步动态随机存储器。DDR在一个时钟周期内可以传输两次数据。在所述芯片中设置控制DDR的控制器,用于对每个所述存储单元的数据传输与数据存储的控制。
所述接口装置与所述芯片封装结构内的芯片电连接。所述接口装置用于实现所述芯片与外部设备(例如服务器或计算机)之间的数据传输。例如在一个实施例中,所述接口装置可以为标准PCIE接口。比如,待处理的数据由服务器通过标准PCIE接口传递至所述芯片,实现数据转移。可选的,当采用PCIE 3.0X 16接口传输时,理论带宽可达到16000MB/s。在另一个实施例中,所述接口装置还可以是其他的接口,本申请并不限制上述其他的接口的具体表现形式,所述接口单元能够实现转接功能即可。另外,所述芯片的计算结果仍由所述接口装置传送回外部设备(例如服务器)。
所述控制器件与所述芯片电连接。所述控制器件用于对所述芯片的状态进行监控。具体的,所述芯片与所述控制器件可以通过SPI接口电连接。所述控制器件可以包括单片机(Micro Controller Unit,MCU)。如所述芯片可以包括多个处理芯片、多个处理核或多个处理电路,可以带动多个负载。因此,所述芯片可以处于多负载和轻负载等不同的工作状态。通过所述控制装置可以实现对所述芯片中多个处理芯片、多个处理和或多个处理电路的工作状态的调控。
在一些实施例里,申请了一种电子设备,其包括了上述板卡。
电子设备包括数据处理装置、机器人、电脑、打印机、扫描仪、平板电脑、智能终端、手机、行车记录仪、导航仪、传感器、摄像头、服务器、云端服务器、相机、摄像机、投影仪、手表、耳机、移动存储、可穿戴设备、交通工具、家用电器、和/或医疗设备。
所述交通工具包括飞机、轮船和/或车辆;所述家用电器包括电视、空调、微波炉、冰箱、电饭煲、加湿器、洗衣机、电灯、燃气灶、油烟机;所述医疗设备包括核磁共振仪、B超仪和/或心电图仪。
如图8所示,信号采集器用于接收信号,并将信号和待处理数据作为输入数据传递给板卡内部的芯片。
可选地,上述图像处理芯片可为人工神经网络处理芯片。
可选地,信号采集器为麦克风或者多阵列麦克风。
其中板卡内部的芯片的包括同上述所示的实施例,用于得到对应的输出数据(即处理后的图像),并将其传输至交互界面中。
其中交互界面接收上述芯片(可以看成人工神经网络处理器)的输出数据,并将其转化为合适形式的反馈信息显示给用户。
其中控制器单元接收用户的操作或命令,并控制整个信号处理装置的运作。
可选地,上述电子设备可为数据处理装置、机器人、电脑、平板电脑、智能终端、手机、云端服务器、相机、摄像机、投影仪、手表、耳机、移动存储或者可穿戴设备。
参见图9,图9为本发明实施例提供的一种信号处理方法的流程示意图。如图9所示,该方法包括:
901、信号处理装置采集用户输入的信号。
902、所述信号处理装置根据目标信号指令转换模型将所述信号转换成处理指令和目标数据,所述目标数据为待处理数据的处理数据。
在一种可行的实施例中,所述根据目标信号指令转换模型将所述信号转换成处理指令和目标数据,包括:
将所述信号通过语音识别技术、图像识别技术、自然语言处理技术等转换成文本信息;
将所述文本信息通过自然语言处理技术和所述目标信号指令转换模型转换成所述处理指令;
用于根据所述处理指令中的语义区域的粒度和图像识别技术对所述待处理数据进行区域划分,得到所述目标数据。
在一种可行的实施例中,所述根据目标信号指令转换模型将所述信号转换成处理指令和目标数据,包括:
将所述信号通过语音识别技术、语义理解技术、图像识别技术、自然语言处理技术和所述信号指令转换模型转换成所述处理指令;
根据所述处理指令中的语义区域的粒度和图像识别技术对所述待处理数据进行区域划分,得到所述目标数据。
在一种可行的实施例中,所述方法还包括:
存储所述文本信息或者所述处理指令或者所述目标数据。
903、所述信号处理装置根据所述处理指令和目标处理模型对所述目标数据进行处理。
在一种可行的实施例中,所述根据所述处理指令和目标处理模型对所述目标数据进行处理,包括:
在预设时间窗口内从所述存储模块中获取M条处理指令,所述M为大于1的整数;
根据所述M条处理指令和所述目标处理模型对所述目标数据进行处理。
在一种可行的实施例中,所述根据所述M条处理指令和所述目标处理模型对所述目标数据进行处理,包括:
删除所述M条处理指令中,功能相同的处理指令,以得到N条处理指令,所述N为小于所述M的整数;
根据所述N条处理指令和所述目标处理模型对所述目标数据进行处理。
在一种可行的实施例中,所述接收信号和待处理数据之前,所述方法还包括:
对信号指令转换模型进行自适应训练,以得到目标信号指令转换模型。
在一种可行的实施例中,所述对所述信号指令转换模型进行自适应训练是离线进行的或者是离线进行的。
在一种可行的实施例中,所述对所述信号指令转换模型进行自适应训练是有监督的或者是无监督的。
在一种可行的实施例中,所述对信号指令转换模型进行自适应训练,以得到目标信号指令转换模型,包括:
根据所述信号指令转换模型将所述信号换成预测指令;
确定所述预测指令与其对应的指令集合的相关系数;
根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
在一种可行的实施例中,所述采集用户输入的信号之前,所述方法还包括:
对处理模型进行自适应训练,以得到目标处理模型。
在一种可行的实施例中,所述对所述处理模型进行自适应训练是离线进行的或者是离线进行的。
在一种可行的实施例中,所述对所述处理模型进行自适应训练是有监督或者无监督的。
在一种可行的实施例中,所述对处理模型进行自适应训练,以得到目标处理模型,包括:
根据所述处理模型对所述待处理数据进行处理,以得到预测数据;
确定所述预测数据与其对应的训练数据的相关系数;
根据所述预测数据与其对应的训练数据的相关系数优化所述处理模型,以得到所述目标处理模型。
在一种可行的实施例中,所述方法还包括:
发送交互信息给用户,接收用户反馈信息,并依据该反馈信息生成相应的指令。
需要说明的是,图9所示的方法的各个步骤的具体实现过程可参见上述信号处理装置的具体实现过程,在此不再叙述。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
本发明实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元可以采用硬件的形式实现。
以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上上述,本说明书内容不应理解为对本发明的限制。

Claims (30)

1.一种信号处理装置,其特征在于,包括:
信号采集器,用于采集用户输入的信号;
指令转换器,用于根据目标信号指令转换模型将所述信号转换成处理指令和目标数据,所述目标数据为待处理数据的处理数据;
处理器,用于根据所述处理指令和目标处理模型对所述目标数据进行处理。
2.根据权利要求1所述的信号处理装置,其特征在于,所述指令转换器包括:
第一信号识别器,用于将信号通过信号识别技术转换成文本信息,所述信号识别技术为以下至少一种:语音识别技术、语义理解技术、图像识别技术、自然语言处理技术;
信号文本转换器,用于将文本信息通过自然语言处理技术和所述目标信号指令转换模型转换成所述处理指令;
第一数据识别器,用于根据所述处理指令中的语义区域的粒度和识别技术对所述待处理数据进行划分,获取所述目标数据。
3.根据权利要求1所述的信号处理装置,其特征在于,所述指令转换器包括:
第二信号识别器,用于将所述信号通过所述信号识别技术和所述目标信号指令转换模型转换成所述处理指令;
第二数据识别器,用于根据所述处理指令中的语义区域的粒度和识别技术对所述待处理数据进行划分,得到所述目标数据。
4.根据权利要求1-3任一项所述的信号处理装置,其特征在于,所述信号处理装置还包括:
存储器,用于存储所述文本信息或者所述处理指令或者所述目标数据。
5.根据权利要求4所述的信号处理装置,其特征在于,所述处理器包括:
取指令模块,用于在预设时间窗口内从所述存储器中获取M条处理指令;
处理模块,用于根据所述M条处理指令和所述目标处理模型对所述目标数据进行处理。
6.根据权利要求5所述的信号处理装置,其特征在于,所述处理模块用于:
删除所述M条处理指令中功能相同的处理指令,得到N条处理指令,所述M为大于1的整数,所述N为小于所述M的整数;
根据所述N条处理指令和所述目标处理模型对所述目标数据进行处理。
7.根据权利要求1的信号处理装置,其特征在于,所述指令转换器用于:
对信号指令转换模型进行自适应训练,以得到所述目标信号指令转换模型。
8.根据权利要求7所述的信号处理装置,其特征在于,所述指令转换器还用于:
根据所述信号指令转换模型将所述信号换成预测指令;
确定所述预测指令与其对应的指令集合的相关系数;
根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
9.根据权利要求1所述的信号处理装置,其特征在于,所述信号处理装置还包括:
训练器,用于根据所述信号指令转换模型将所述信号换成预测指令;确定所述预测指令与其对应的指令集合的相关系数;根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
10.根据权利要求1所述的信号处理装置,其特征在于,所述处理器用于:
对处理模型进行自适应训练,以得到所述目标处理模型。
11.根据权利要求10所述的信号处理装置,其特征在于,所述处理器还用于:
根据所述处理模型对所述待处理数据进行处理,以得到预测数据;
确定所述预测数据与其对应的训练数据的相关系数;
根据所述预测数据与其对应的训练数据的相关系数优化所述处理模型,以得到所述目标处理模型。
12.根据权利要求1所述的信号处理装置,其特征在于,所述训练器还用于:
根据所述处理模型对所述待处理数据进行处理,以得到预测数据;
确定所述预测数据与其对应的训练数据的相关系数;
根据所述预测数据与其对应的训练数据的相关系数优化所述处理模型,以得到所述目标处理模型。
13.根据权利要求1所述的信号处理装置,其特征在于,所述采集用户输入的信号之前,所述信号处理装置还用于:
对信号指令转换模型进行自适应训练,以得到所述目标信号指令转换模型。
14.根据权利要求13所述的信号处理装置,其特征在于,所述信号处理装置具体用于
根据所述信号指令转换模型将所述语音信号换成预测指令;
确定所述预测指令与其对应的指令集合的相关系数;
根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
15.根据权利要求1所述的信号处理装置,其特征在于,所述信号处理装置还用于:
对处理模型进行自适应训练,以得到所述目标处理模型。
16.根据权利要求15所述的信号处理装置,其特征在于,所述信号处理装置具体用于:
根据所述处理模型对所述待处理数据进行处理,以得到预测数据;
确定所述预测数据与其对应的训练数据的相关系数;
根据所述预测数据与其对应的训练数据的相关系数优化所述处理模型,以得到所述目标处理模型。
17.根据权利要求1-16任一项所述的信号处理装置,其特征在于,所述指令转换器还包括:
交互模块,用于发送交互信息给用户,接收用户反馈信息,并依据该反馈信息生成相应的指令。
18.一种机器学习运算装置,其特征在于,所述机器学习运算装置包括一个或多个如权利要求1-17任一项所述的信号处理装置,用于从其他处理装置中获取待运算输入数据和控制信息,并执行指定的机器学习运算,将执行结果通过I/O接口传递给其他处理装置;
当所述机器学习运算装置包含多个所述信号处理装置时,所述多个所述信号处理装置间可以通过特定的结构进行连接并传输数据;
其中,多个所述信号处理装置通过快速外部设备互连总线PCIE总线进行互联并传输数据,以支持更大规模的机器学习的运算;多个所述信号处理装置共享同一控制系统或拥有各自的控制系统;多个所述信号处理装置共享内存或者拥有各自的内存;多个所述信号处理装置的互联方式是任意互联拓扑。
19.一种组合处理装置,其特征在于,所述组合处理装置包括如权利要求18所述的机器学习运算装置,通用互联接口和其他处理装置;
所述机器学习运算装置与所述其他处理装置进行交互,共同完成用户指定的计算操作。
20.根据权利要求19所述的组合处理装置,其特征在于,还包括:存储装置,该存储装置分别与所述机器学习运算装置和所述其他处理装置连接,用于保存所述机器学习运算装置和所述其他处理装置的数据。
21.一种神经网络芯片,其特征在于,所述机器学习芯片包括如权利要求18所述的机器学习运算装置或如权利要求19所述的组合处理装置或如权利要求20所述的组合处理装置。
22.一种电子设备,其特征在于,所述电子设备包括如所述权利要求20所述的芯片。
23.一种板卡,其特征在于,所述板卡包括:存储器件、接口装置和控制器件以及如权利要求21所述的神经网络芯片;
其中,所述神经网络芯片与所述存储器件、所述控制器件以及所述接口装置分别连接;
所述存储器件,用于存储数据;
所述接口装置,用于实现所述芯片与外部设备之间的数据传输;
所述控制器件,用于对所述芯片的状态进行监控。
24.一种信号处理方法,其特征在于,包括:
采集用户输入的信号;
根据目标信号指令转换模型将所述信号转换成处理指令和目标数据,所述目标数据为待处理数据的部分数据;
根据所述处理指令和目标处理模型对所述目标数据进行处理。
25.根据权利要求24所述的信号处理方法,其特征在于,所述根据目标信号指令转换模型将所述信号转换成处理指令和处理数据,包括:
将信号通过信号识别技术转换成文本信息,所述信号识别技术为以下至少一种:语音识别技术、语义理解技术、图像识别技术、自然语言处理技术;
将文本信息通过自然语言处理技术和所述目标信号指令转换模型转换成所述处理指令;
根据所述处理指令中的语义区域的粒度和图像识别技术对所述待处理数据进行区域划分,得到所述目标数据。
26.根据权利要求24所述的信号处理方法,其特征在于,所述根据目标信号指令转换模型将所述信号转换成处理指令和目标数据,包括:
将所述信号通过所述信号识别技术和所述目标信号指令转换模型转换成所述处理指令;
根据所述处理指令中的语义区域的粒度和图像识别技术对所述待处理数据进行区域划分,得到所述目标数据。
27.根据权利要求24-26任一项所述的信号处理方法,其特征在于,所述方法还包括:
存储所述文本信息或者所述处理指令或者所述目标数据。
28.根据权利要求27所述的信号处理方法,其特征在于,所述根据所述处理指令和目标处理模型对所述目标数据进行处理,包括:
在预设时间窗口内从所述存储器中获取M条处理指令;
根据所述M条处理指令和所述目标处理模型对所述目标数据进行处理。
29.根据权利要求28所述的信号处理方法,其特征在于,所述根据所述M条处理指令和所述目标处理模型对所述目标数据进行处理,包括:
删除所述M条处理指令中功能相同的处理指令,得到N条处理指令,所述M为大于1的整数,所述N为小于所述M的整数;
根据所述N条处理指令和所述目标处理模型对所述目标数据进行处理。
30.根据权利要求24的信号处理方法,其特征在于,所述方法还包括:
对信号指令转换模型进行自适应训练,以得到所述目标信号指令转换模型。
CN201811152999.6A 2018-09-28 2018-09-28 信号处理装置及相关产品 Pending CN110969246A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201811152999.6A CN110969246A (zh) 2018-09-28 2018-09-28 信号处理装置及相关产品
PCT/CN2018/112528 WO2020062392A1 (zh) 2018-09-28 2018-10-30 信号处理装置、信号处理方法及相关产品
US16/620,540 US11703939B2 (en) 2018-09-28 2018-10-30 Signal processing device and related products
EP18920196.5A EP3859488A4 (en) 2018-09-28 2018-10-30 Signal processing device, signal processing method and related product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811152999.6A CN110969246A (zh) 2018-09-28 2018-09-28 信号处理装置及相关产品

Publications (1)

Publication Number Publication Date
CN110969246A true CN110969246A (zh) 2020-04-07

Family

ID=70027592

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811152999.6A Pending CN110969246A (zh) 2018-09-28 2018-09-28 信号处理装置及相关产品

Country Status (1)

Country Link
CN (1) CN110969246A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112240910A (zh) * 2020-09-16 2021-01-19 华中科技大学 一种磁致伸缩导波拓扑信号处理方法及无损检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9412366B2 (en) * 2012-09-18 2016-08-09 Adobe Systems Incorporated Natural language image spatial and tonal localization
CN105979035A (zh) * 2016-06-28 2016-09-28 广东欧珀移动通信有限公司 一种增强现实ar图像处理方法、装置及智能终端
CN107832844A (zh) * 2017-10-30 2018-03-23 上海寒武纪信息科技有限公司 一种信息处理方法及相关产品

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9412366B2 (en) * 2012-09-18 2016-08-09 Adobe Systems Incorporated Natural language image spatial and tonal localization
CN105979035A (zh) * 2016-06-28 2016-09-28 广东欧珀移动通信有限公司 一种增强现实ar图像处理方法、装置及智能终端
CN107832844A (zh) * 2017-10-30 2018-03-23 上海寒武纪信息科技有限公司 一种信息处理方法及相关产品

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112240910A (zh) * 2020-09-16 2021-01-19 华中科技大学 一种磁致伸缩导波拓扑信号处理方法及无损检测方法

Similar Documents

Publication Publication Date Title
US11703939B2 (en) Signal processing device and related products
CN111383638A (zh) 信号处理装置、信号处理方法及相关产品
JP6893968B2 (ja) 画像処理装置及び方法
CN109359538B (zh) 卷积神经网络的训练方法、手势识别方法、装置及设备
Mahmood et al. Facial expression recognition in image sequences using 1D transform and gabor wavelet transform
CN110968235B (zh) 信号处理装置及相关产品
CN108073851B (zh) 一种抓取手势识别的方法、装置及电子设备
Santhalingam et al. Sign language recognition analysis using multimodal data
CN110688897A (zh) 一种基于联合判断与生成学习的行人重识别方法及装置
CN109584864B (zh) 图像处理装置和方法
Wang et al. Real-time block-based embedded CNN for gesture classification on an FPGA
CN116861850A (zh) 一种数据处理方法及其装置
CN110969246A (zh) 信号处理装置及相关产品
Bayegizova et al. EFFECTIVENESS OF THE USE OF ALGORITHMS AND METHODS OF ARTIFICIAL TECHNOLOGIES FOR SIGN LANGUAGE RECOGNITION FOR PEOPLE WITH DISABILITIES.
CN109785843B (zh) 图像处理装置和方法
CN110968285A (zh) 信号处理装置及相关产品
Goyal et al. A brief review of deep learning based approaches for facial expression and gesture recognition based on visual information
Zhang et al. 3D Graph Convolutional Feature Selection and Dense Pre-Estimation for Skeleton Action Recognition
CN109584862B (zh) 图像处理装置和方法
Gupta et al. Real-Time Hand Tracking and Gesture Recognizing Communication System for Physically Disabled People
Tian et al. Guest editorial: multimedia computing with interpretable machine learning
Jintanachaiwat et al. Using LSTM to translate Thai sign language to text in real time
Huu et al. Designing Language Recognition System for Deaf through Hand Gestures Using MediaPipe and LSTM
Al Farid et al. Single Shot Detector CNN and Deep Dilated Masks for Vision-Based Hand Gesture Recognition from Video Sequences
Verulkar et al. Detection of Indian Sign Language using Deep Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination