CN110928216B

CN110928216B - 人工智能装置

Info

Publication number: CN110928216B
Application number: CN201911115686.8A
Authority: CN
Inventors: 李爱军; 王和国
Original assignee: Shenzhen Intellifusion Technologies Co Ltd
Current assignee: Shenzhen Intellifusion Technologies Co Ltd
Priority date: 2019-11-14
Filing date: 2019-11-14
Publication date: 2020-12-15
Anticipated expiration: 2039-11-14
Also published as: CN110928216A

Abstract

一种人工智能装置包括：接口、第一存储器、第一处理器、第二存储器、第二处理器、调整器及第三处理器。接口用于与数据采集模块通讯。第一存储器用于存储数据采集模块在第一精度下采集的第一数据。第一处理器用于判断第一数据中是否存在待识别对象。第一处理器还用于在判断出第一数据中存在待识别对象时，控制第二存储器、第二处理器、调整器及第三处理器开始工作。调整器用于将数据采集模块采集数据的精度调整为到第二精度。第二存储器用于存储数据采集模块在第二精度下采集的第二数据。第二处理器用于识别第二数据中的待识别对象是否为目标对象，并将识别结果输出给第三处理器。本发明提供的人工智能装置精度高且功耗低。

Description

人工智能装置

技术领域

本发明涉及计算机技术领域，具体涉及一种人工智能装置。

背景技术

现有的人工智能装置要么为了保证高可靠性而追求高精度，要么通过牺牲系统的精度来保证低功耗，因此，如何让人工智能装置兼具高精度和低功耗成为当前亟待解决的技术问题。

发明内容

本发明实施例提供一种精度高且功耗低的人工智能装置。

一种人工智能装置包括：接口、第一存储器、第一处理器、第二存储器、第二处理器、调整器及第三处理器；所述接口用于与数据采集模块通讯；所述第一存储器用于存储所述数据采集模块在第一精度下采集的第一数据；所述第一处理器用于判断所述第一数据中是否存在待识别对象；所述第一处理器还用于在判断出所述第一数据中存在所述待识别对象时，控制所述第二存储器、所述第二处理器、所述调整器及所述第三处理器开始工作；所述调整器用于将所述数据采集模块采集数据的精度调整为到第二精度；所述第二存储器用于存储所述数据采集模块在所述第二精度下采集的第二数据；所述第二处理器用于识别所述第二数据中的所述待识别对象是否为目标对象，并将识别结果输出给所述第三处理器；所述第三处理器用于根据所述识别结果进行相应的处理；所述第一精度小于所述第二精度，所述第一存储器的存储容量及功耗小于所述第二存储器的存储容量及功耗，所述第一处理器的功耗小于所述第二处理器及所述第三处理器的功耗。

在本发明中，功耗较大的所述第二存储器、所述第二处理器及所述第三处理器，只在所述第一处理器判断出所述第一数据中存在所述待识别对象时才开始工作；而在所述第一处理器判断所述第一数据中不存在所述待识别对象的时间段内，所述第二存储器、所述第二处理器及所述第三处理器均不工作；这样一来，大功耗的器件(如所述第二处理器等)不用一直工作，从而确保了所述人工智能装置的低功耗。另外，当所述第二存储器、所述第二处理器及所述第三处理器工作时，所述第二处理器会在所述第一处理器判断出存在所述待识别对象的前提下，以在所述第二精度(大于所述第一精度)下采集的所述第二数据为基础，进一步识别所述第二数据中的所述待识别对象是否为目标对象，从而确保了所述人工智能装置的高精度。由此可知，本发明人工智能装置既具有低功耗，又具有高精度。

作为一种可能的实施方式，所述第一处理器包括第一控制单元、驱动单元、第一计算单元、转换单元及处理单元；所述第一控制单元用于控制所述驱动单元从所述第一存储器中读取数据，并将读取的数据输出给所述第一计算单元；所述第一计算单元用于将接收到的数据与预先存储的权重进行卷积神经网络计算，以得到第一计算结果，并将所述第一计算结果输出给所述转换单元；所述转换单元用于将所述第一计算结果转换成数字信号，并将所述数字信号输出给所述处理单元；所述处理单元用于对接收到的所述数字信号做非线性处理，并将处理得到的第一信号输出给所述第一控制单元；所述第一控制单元还用于根据所述第一信号判断所述第一数据中是否存在待识别对象，并在判断出所述第一数据中存在所述待识别对象时，控制所述第二存储器、所述第二处理器、所述调整器及所述第三处理器开始工作。

在本发明中，由于所述第一计算单元中预先存储了计算时所需的权重，因此，所述第一计算单元在进行卷积神经网络计算时，不需从外部读取并缓存权重，从而节省了从外部读取并缓存权重的功耗和时间，且提高了计算的效率。

作为一种可能的实施方式，所述驱动单元包括用于与所述第一存储器相连的输入端及用于与所述第一计算单元相连的M个输出端，所述驱动单元通过所述输入端从所述第一存储器中读取数据，并将读取的数据转换成M个模拟信号，且通过所述M个输出端将所述M个模拟信号输出给所述第一计算单元，M为正整数。

作为一种可能的实施方式，所述第一计算单元包括多个相互连接的子单元，所述多个子单元设置成M行N列的矩阵，每个子单元包括电子开关及用于存储预先设置的权重的存储元件；第I行中每个子单元的电子开关的第一端与所述驱动单元的第I个输出端相连，以接收所述第I个输出端输出的第I个模拟信号；第J列中每个子单元的电子开关的第二端与第J个电源相连，所述第J列中每个子单元的电子开关的第三端通过相应的存储元件与所述转换单元的第J个输入端相连，N为正整数，1≤I≤M，1≤J≤N；每个子单元用于将接收到的模拟信息与预先设置的权重进行卷积神经网络计算，并将计算的结果输出所述转换单元。

在本发明中，所述第一计算单元通过在每个子单元中设置用于存储预先设置的权重的存储元件，以使所述第一计算单元在进行卷积神经网络计算时，不需从外部读取并缓存权重，从而节省了从外部读取并缓存权重的功耗和时间，且提高了计算的效率。所述第一计算单元还通过将所述多个子单元设置成M行N列的矩阵，以对所述驱动单元输出的M个模拟信号进行并行运算，从而进一步提供了计算的效率。

作为一种可能的实施方式，所述电子开关为三极管或场效应管；当所述电子开关为三极管时，所述电子开关的第一端、第二端及第三端分别对应三极管的基极、集电极及发射极，或分别对应三极管的基极、发射极及集电极；当所述电子开关为场效应管时，所述电子开关的第一端、第二端及第三端分别对应场效应管的栅极、漏极及源极，或分别对应场效应管的栅极、源极及漏极。

作为一种可能的实施方式，所述第二处理器包括多个处理元件及第二控制单元；每个处理元件包括输入缓存单元、权重缓存单元、第二计算单元及输出缓存单元；每个输入缓存单元用于从所述第二存储器中读取并存储相应的处理元件计算时需要用到的输入数据；每个权重缓存单元用于从所述第二存储器中读取并存储相应的处理元件计算时需要用到的权重数据；每个第二计算单元用于从相应的输入缓存单元中读取输入数据，并从相应的权重缓存单元中读取权重数据，且将读取到的输入数据及权重数据进行卷积神经网络计算，以得到第二计算结果，还将所述第二计算结果输出给所述第二控制单元；所述第二控制单元用于根据所述多个处理元件输出的所述第二计算结果，识别所述第二数据中的所述待识别对象是否为目标对象，并将识别结果输出给所述第三处理器。

在本发明中，由于所述第二处理器通过设置多个处理元件来对接收到的第二数据进行并行处理，从而提高了识别所述第二数据中的所述待识别对象是否为目标对象的效率。

作为一种可能的实施方式，所述第三处理器包括中央处理单元、数字信号处理器、专用集成电路、现成可编程门阵列、微控制单元中的一种或多种。

作为一种可能的实施方式，所述接口通过有线或无线的方式与所述数据采集模块通讯，所述数据采集模块包括图像采集单元及/或声音采集单元，所述第一数据及所述第二数据包括图像数据及/或声音数据。

作为一种可能的实施方式，所述第一存储器为内存储器，所述第二存储器为外存储器。

作为一种可能的实施方式，所述人工智能装置还包括任务管理器，所述任务管理器用于对所述第一存储器、所述第一处理器、所述第二存储器、所述第二处理器、所述调整器及所述第三处理器执行的任务进行管理。

本发明采用所述任务管理器来对所述第一存储器、所述第一处理器、所述第二存储器、所述第二处理器、所述调整器及所述第三处理器执行的任务进行统一管理，从而提高了所述人工智能装置工作的稳定性和可靠性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种人工智能装置的原理框图；

图2是本发明实施例提供的图1中第一处理器的原理框图；

图3是本发明实施例提供的图2中驱动单元、第一计算单元及转换单元的原理框图；

图4是本发明实施例提供的图1中第二处理器的原理框图；

图5是本发明实施例提供的图1中人工智能装置的功耗示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序；术语“包括”以及它们任何变形，意图在于覆盖不排他的包含；术语“相连”表示一个器件可以直接连接到另一个器件，也可以通过其它居中器件连接到另一个器件。

除非另有定义，本申请所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。本申请所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

另外，在本申请中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本申请所描述的实施例可以与其它实施例相结合。

本发明实施例提供一种精度高且功耗低的人工智能装置100，所述人工智能装置100可以应用于一些既需要低功耗，又需要高精度的场景。例如，可以应用门禁管理场景，由于门禁系统使用电池供电，因此需要系统具有较低功耗，同时为了保证门禁的安全性和可靠性，又需要系统具有高精度。可以理解，所述人工智能装置100还可以应用于其他的场景，例如，验证授权场景等。

下面将对本发明实施例提供的人工智能装置100进行详细说明。

请参阅图1，图1是本发明实施例提供的一种人工智能装置100的原理框图。所述人工智能装置100包括接口10、第一存储器30、第一处理器40、第二存储器50、第二处理器60、调整器70及第三处理器80。所述接口10用于与数据采集模块20通讯，并通过所述第一存储器30与所述第一处理器40相连，且通过所述第二存储器50与所述第二处理器60相连，还通过所述调整器70与所述第一处理器40相连。所述第一处理器40与所述第二存储器50、所述第二处理器60及所述第三处理器80相连。所述第二处理器60与所述第三处理器80相连。

所述第一存储器30用于存储所述数据采集模块20在第一精度下采集的第一数据。所述第一处理器40用于判断所述第一数据中是否存在待识别对象。所述第一处理器40还用于在判断出所述第一数据中存在所述待识别对象时，控制所述第二存储器50、所述第二处理器60、所述调整器70及所述第三处理器80开始工作。所述调整器70用于将所述数据采集模块20采集数据的精度调整为到第二精度。所述第二存储器50用于存储所述数据采集模块20在所述第二精度下采集的第二数据。所述第二处理器60用于识别所述第二数据中的所述待识别对象是否为目标对象，并将识别结果输出给所述第三处理器80。所述第三处理器80用于根据所述识别结果进行相应的处理(例如，控制门禁开启等)。所述第一精度小于所述第二精度，所述第一存储器30的存储容量及功耗小于所述第二存储器50的存储容量及功耗，所述第一处理器40的功耗小于所述第二处理器60及所述第三处理器80的功耗。

在一个实施例中，所述第三处理器80在根据所述识别结果完成相应的处理后，所述第二存储器50、所述第二处理器60及所述第三处理器80停止工作，且所述调整器70将所述数据采集模块20采集数据的精度调整为到所述第一精度。当所述第一处理器40再次判断出所述第一数据中存在所述待识别对象时，所述第二存储器50、所述第二处理器60、所述调整器70及所述第三处理器80才再次开始工作。在所述第一处理器40判断所述第一数据中不存在所述待识别对象的时间段内，所述第二存储器50、所述第二处理器60、所述调整器70及所述第三处理器80均不工作。

在本发明中，功耗较大的所述第二存储器50、所述第二处理器60及所述第三处理器80，只在所述第一处理器40判断出所述第一数据中存在所述待识别对象时才开始工作；而在所述第一处理器40判断所述第一数据中不存在所述待识别对象的时间段内，所述第二存储器50、所述第二处理器60及所述第三处理器80均不工作；这样一来，大功耗的器件(如所述第二处理器60等)不用一直工作，从而确保了所述人工智能装置100的低功耗。另外，当所述第二存储器50、所述第二处理器60及所述第三处理器80工作时，所述第二处理器60会在所述第一处理器40判断出存在所述待识别对象的前提下，以在所述第二精度(大于所述第一精度)下采集的所述第二数据为基础，进一步识别所述第二数据中的所述待识别对象是否为目标对象，从而确保了所述人工智能装置100的高精度。由此可知，本发明人工智能装置100既具有低功耗，又具有高精度。

在一个实施例中，所述接口10通过有线或无线的方式与所述数据采集模块20通讯。所述数据采集模块20通讯可以设置在所述人工智能装置100上，并通过有线的方式与所述接口10通讯；所述数据采集模块20通讯也可以与所述人工智能装置100分离，并通过无线的方式与所述接口10通讯。所述调整器70通过所述接口10调整所述数据采集模块20采集数据的精度。所述数据采集模块20将采集到的数据通过所述接口10传输给所述第一存储器30或所述第二存储器50。

在一个实施例中，所述数据采集模块20包括图像采集单元及/或声音采集单元，所述第一数据及所述第二数据包括图像数据及/或声音数据。具体地，当所述数据采集模块20包括所述图像采集单元时，所述第一数据及所述第二数据包括所述图像数据；当所述数据采集模块20包括所述声音采集单元时，所述第一数据及所述第二数据包括所述声音数据；所述数据采集模块20包括图像采集单元及声音采集单元，所述第一数据及所述第二数据包括所述图像数据及所述声音数据。可以理解，所述图像采集单元包括摄像头、抓拍机等，所述声音采集单元包括麦克风等。

在一个实施例中，所述第一精度及所述第二精度包括图像及/或声音的分辨率，精度越高，分辨率越高，采集的数据量也越大。由于所述第一精度小于所述第二精度，因此，所述第一数据的数据量小于所述第二数据的数据量，且存储所述第一数据所需的存储空间也小于存储所述第二数据所需的存储空间，即，所述第一存储器30的存储容量及功耗可以小于所述第二存储器50的存储容量及功耗。可以理解，所述第一精度及所述第二精度所包括的具体参数以及每个参数的具体数值或数值范围均可以根据实际情况进行相应的调整。

在一个实施例中，所述第一存储器30为内存储器，如SRAM(Static Random-AccessMemory，静态随机存取存储器)等。所述第二存储器50为外存储器，如DDR(Double DataRate Synchronous Dynamic Random Access Memory，双倍数据率同步动态随机存取存储器)等。

在一个实施例中，所述人工智能装置100还包括任务管理器90。所述任务管理与所述第一存储器30、所述第一处理器40、所述第二存储器50、所述第二处理器60、所述调整器70及所述第三处理器80相连。所述任务管理器90用于对所述第一存储器30、所述第一处理器40、所述第二存储器50、所述第二处理器60、所述调整器70及所述第三处理器80执行的任务进行管理。

本发明采用所述任务管理器90来对所述第一存储器30、所述第一处理器40、所述第二存储器50、所述第二处理器60、所述调整器70及所述第三处理器80执行的任务进行统一管理，从而提高了所述人工智能装置100工作的稳定性和可靠性。

可以理解，所述人工智能装置100还可以包括其他器件，如视频解码器、音频解码器、第三存储器等。

请参阅图2，图2是本发明实施例提供的所述第一处理器40的原理框图。所述第一处理器40包括第一控制单元41、驱动单元43、第一计算单元45、转换单元46及处理单元48。所述第一控制单元41与所述第二存储器50、所述第二处理器60、所述第三处理器80、所述调整器70、所述驱动单元43及所述处理单元48相连。所述驱动单元43与所述第一存储器30及所述第一计算单元45相连。所述转换单元46与所述第一计算单元45及所述处理单元48相连。

所述第一控制单元41用于控制所述驱动单元43从所述第一存储器30中读取数据，并将读取的数据输出给所述第一计算单元45。所述第一计算单元45用于将接收到的数据与预先存储的权重进行卷积神经网络计算，以得到第一计算结果，并将所述第一计算结果输出给所述转换单元46。所述转换单元46用于将所述第一计算结果转换成数字信号，并将所述数字信号输出给所述处理单元48。所述处理单元48用于对接收到的所述数字信号做非线性处理，并将处理得到的第一信号输出给所述第一控制单元41。所述第一控制单元41还用于根据所述第一信号判断所述第一数据中是否存在待识别对象，并在判断出所述第一数据中存在所述待识别对象时，控制所述第二存储器50、所述第二处理器60、所述调整器70及所述第三处理器80开始工作。

由于所述第一计算单元45中预先存储了计算时所需的权重，因此，所述第一计算单元45在进行卷积神经网络计算时，不需从外部读取并缓存权重，从而节省了从外部读取并缓存权重的功耗和时间，且提高了计算的效率。

请参阅图3，图3是本发明实施例提供的所述驱动单元43、所述第一计算单元45及所述转换单元46的原理框图。所述驱动单元43包括用于与所述第一存储器30相连的输入端in及用于与所述第一计算单元45相连的M个输出端O1-OM，所述驱动单元43通过所述输入端in从所述第一存储器30中读取数据，并将读取的数据转换成M个模拟信号，且通过所述M个输出端O1-OM将所述M个模拟信号输出给所述第一计算单元45，M为正整数。

所述第一计算单元45包括多个相互连接的子单元11-MN，所述多个子单元11-MN设置成M行N列的矩阵。每个子单元包括电子开关T及用于存储预先设置的权重的存储元件S。在所述M行N列的矩阵中，第I行中每个子单元的电子开关T的第一端与所述驱动单元43的第I个输出端相连，以接收所述第I个输出端输出的第I个模拟信号；第J列中每个子单元的电子开关T的第二端与第J个电源相连，所述第J列中每个子单元的电子开关T的第三端通过相应的存储元件S与所述转换单元46的第J个输入端相连；其中，N为正整数，1≤I≤M，1≤J≤N。每个子单元用于将接收到的模拟信息与预先设置的权重进行卷积神经网络计算，并将计算的结果输出所述转换单元46。

具体地，在所述M行N列的矩阵中，每一行有N个子单元，例如，第1行有N个子单元11-1N，第M行有N个子单元M1-MN；每一列有M个子单元，例如，第1列有M个子单元11-M1，第N行有M个子单元1N-MN。

所述第1行中N个子单元11-1N的电子开关T的第一端与所述驱动单元43的第1个输出端O1相连，以接收所述第1个输出端O1输出的第1个模拟信号；第2行中N个子单元21-2N的电子开关T的第一端与所述驱动单元43的第2个输出端相连，以接收所述第2个输出端输出的第2个模拟信号；以此类推，所述第M行中N个子单元M1-MN的电子开关T的第一端与所述驱动单元43的第M个输出端OM相连，以接收所述第M个输出端OM输出的第M个模拟信号。

所述第1列中M个子单元11-M1的电子开关T的第二端与第1个电源V1相连，所述第1列中M个子单元11-M1的电子开关T的第三端通过相应的存储元件S与所述转换单元46的第1个输入端I1相连；第2列中M个子单元12-M2的电子开关T的第二端与第2个电源相连，所述第2列中M个子单元12-M2的电子开关T的第三端通过相应的存储元件S与所述转换单元46的第2个输入端相连；以此类推，所述第N列中M个子单元1N-MN的电子开关T的第二端与第N个电源VN相连，所述第N列中M个子单元1N-MN的电子开关T的第三端通过相应的存储元件S与所述转换单元46的第N个输入端IN相连。可以理解，N个电源V1-VN可以相同也可以不同。

所述第一计算单元45通过在每个子单元中设置用于存储预先设置的权重的存储元件S，以使所述第一计算单元45在进行卷积神经网络计算时，不需从外部读取并缓存权重，从而节省了从外部读取并缓存权重的功耗和时间，且提高了计算的效率。所述第一计算单元45还通过将所述多个子单元设置成M行N列的矩阵，以对所述驱动单元43输出的M个模拟信号进行并行运算，从而进一步提供了计算的效率。

在一个实施例中，所述电子开关T为三极管或场效应管。当所述电子开关T为三极管时，所述电子开关T的第一端、第二端及第三端分别对应三极管的基极、集电极及发射极，或分别对应三极管的基极、发射极及集电极；当所述电子开关T为场效应管时，所述电子开关T的第一端、第二端及第三端分别对应场效应管的栅极、漏极及源极，或分别对应场效应管的栅极、源极及漏极。可以理解，所述三极管包括NPN型三极管和PNP三极管，所述场效应管包括N沟通场效应管和P沟道场效应管。

在一个实施例中，所述存储元件S包括电阻、电容、电感中的一种或多种。

请参阅图4，图4是本发明实施例提供的所述第二处理器60的原理框图。所述第二处理器60包括多个处理元件(process element，PE)PE1-PEn及第二控制单元68。每个处理元件包括输入缓存单元61、权重缓存单元63、第二计算单元65及输出缓存单元66。每个第二计算单元65通过相应的输入缓存单元61与所述第二存储器50相连，并通过相应的权重缓存单元63与所述第二存储器50相连，且通过相应的输出缓存单元66与所述第二控制单元68相连。所述第二控制单元68与所述第三处理单元48相连。

每个输入缓存单元61用于从所述第二存储器50中读取并存储相应的处理元件计算时需要用到的输入数据。每个权重缓存单元63用于从所述第二存储器50中读取并存储相应的处理元件计算时需要用到的权重数据。每个第二计算单元65用于从相应的输入缓存单元61中读取输入数据，并从相应的权重缓存单元63中读取权重数据，且将读取到的输入数据及权重数据进行卷积神经网络计算，以得到第二计算结果，还将所述第二计算结果输出给所述第二控制单元68。所述第二控制单元68用于根据所述多个处理元件输出的所述第二计算结果，识别所述第二数据中的所述待识别对象是否为目标对象，并将识别结果输出给所述第三处理器80。

由于所述第二处理器60通过设置所述多个处理元件PE1-PEn来对接收到的第二数据进行并行处理，从而提高了识别所述第二数据中的所述待识别对象是否为目标对象的效率。

在一个实施例中，每个第二计算单元65包括多个MAC(Multiply Accumulateunit，乘法累加单元)，每个MAC用于对接收到输入数据及权重数据执行乘法和累加操作。可以理解，每个第二计算单元65还可以包括其它的元件，如部分和加法器等。

在一个实施例中，所述第一处理器40为用于实现低精度神经网络模型相关功能处理器，如CIM(computer in memory，存内计算)等。所述第二处理器60为用于实现高精度神经网络模型相关功能的处理器，如NNP(Neural NetworkProcessor，神经网络处理器)等。所述第一处理器40的精度小于4bit，如1bit；所述第二处理器60的精度大于8bit，例如32bit。可以理解，所述第一处理器40及所述第二处理器60的精度的具体数值可以根据实际情况进行相应的调整。

可以理解，低精度神经网络模型与高精度神经网络模型都是神经网络模型，只是为了满足精度的不同而存在差异。通常，神经网络模型包括多个功能层，如卷积层、池化层、全连接层等，因此，所述第一处理器40的第一计算单元45及所述第二处理器60的第二计算单元65均能满足所述神经网络模型的多个功能层的功能计算，只是所述第二计算单元65计算的数据量以及复杂度都远大于所述第一计算单元45。

由于本发明先通过低精度的第一处理器40进行粗略判断，再通过高精度的第二处理器60进行精确识别，从而确保了所述人工智能装置100的高精度。

在一个实施例中，所述第三处理器80为通用处理器，所述第三处理器80包括中央处理单元48(Central Processing Unit，CPU)、数字信号处理器(Digital SignalProcessor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)、微控制单元(MicroController Unit，MCU)中的一种或多种。

请参阅图5，图5是本发明实施例提供的所述人工智能装置100的功耗示意图。在图5中，横轴代表时间time，纵轴代表功耗power，矩形P1代表所述人工智能装置100的静态功耗，矩形P2代表所述第一处理器40工作时的功耗，矩形P3代表所述第二处理器60及所述第三处理器80工作时的功耗。

如图5所示，静态功耗一直存在且功耗极低，通常在微瓦(uw)级别，例如，2uw。所述第一处理器40工作时的功耗周期性出现且功耗较低，通常在毫瓦(mw)级别，例如，2mw。所述第二处理器60及所述第三处理器80工作时的功耗偶尔出现且功耗相对较高，通常在瓦(w)级别，例如，0.3w。

由图5可知，所述第一处理器40工作时的功耗远小于所述第二处理器60及所述第三处理器80工作时的功耗(0.3w是2mw的150倍)。因此，功耗较大的所述第二存储器50、所述第二处理器60及所述第三处理器80，只在所述第一处理器40判断出所述第一数据中存在所述待识别对象时才开始工作；而在所述第一处理器40判断所述第一数据中不存在所述待识别对象的时间段内均不工作；这样一来，大功耗的器件(如所述第二处理器60等)不用一直工作，从而极大地降低了所述人工智能装置100的功耗，进而确保了所述人工智能装置100的低功耗。

另外，所述第一处理器40是周期性工作的，而非一直工作，从而进一步降低了所述人工智能装置100的功耗。在一个实施例中，所述第一处理器40用于判断图像数据中是否存在待识别对象，且所述第一处理器40每隔i帧判断一次，即所述第一处理器40的工作周期为i帧，i为大于或等于1的正整数。在其它实施例中，所述第一处理器40的工作周期可以根据实际情况进行相应的调整。

下面将结合门禁管理的应用场景对本发明人工智能装置100的工作原理进行说明。

当所述人工智能装置100应用于门禁管理时，所述数据采集模块20周期性地通过所述图像采集单元以所述第一精度采集预设范围内的图像数据，及/或通过所述声音采集单元以所述第一精度采集预设范围内的声音数据。所述数据采集模块20还将采集到的图像数据及/或声音数据作为所述第一数据，通过所述接口10传输给所述第一存储器30。可以理解，所述数据采集模块20的周期时间长短可以根据实际情况进行相应的调整。

所述第一处理器40周期性地从所述第一存储器30中读取所述第一数据，并用低精度神经网络模型的相关算法判断所述第一数据中是否存在待识别对象。可以理解，所述第一处理器40周期可以等于所述数据采集模块20的周期，也可以是所述数据采集模块20的周期的整数倍。可以理解，由于所述第一存储器30的存储容量较小，所述第一处理器40可以在判断完所述第一数据中是否存在待识别对象后，将所述第一存储器30中存储的第一数据删除，或将所述第一存储器30中存储的第一数据转存到其它的存储设备中，如所述第三存储器中。

当所述第一数据包括图像数据时，所述第一处理器40用低精度神经网络模型的相关算法判断所述图像数据中是否存在待识别对象。当所述第一数据包括声音数据时，所述第一处理器40用低精度神经网络模型的相关算法判断所述声音数据中是否存在待识别对象。当所述第一数据包括图像数据和声音数据时，所述第一处理器40用低精度神经网络模型的相关算法判断所述图像数据和声音数据中是否存在待识别对象。可以理解，当结合所述图像数据和所述声音数据进行判断时，判断的准确性会高一些。

当所述第一处理器40判断出所述第一数据中存在所述待识别对象时，所述第一处理器40控制所述第二存储器50、所述第二处理器60、所述调整器70及所述第三处理器80开始工作。此时，所述人工智能装置100的功耗变大。

所述调整器70通过所述接口10将所述数据采集模块20采集数据的精度调整为到所述第二精度。所述数据采集模块20周期性地通过所述图像采集单元以所述第二精度采集预设范围内的图像数据，及/或通过所述声音采集单元以所述第二精度采集预设范围内的声音数据。所述数据采集模块20还将采集到的图像数据及/或声音数据作为所述第二数据，通过所述接口10传输给所述第二存储器50。

所述第二处理器60从所述第二存储器50中读取所述第二数据，并用高精度神经网络模型的相关算法识别所述第二数据中的所述待识别对象是否为目标对象，并将识别结果输出给所述第三处理器80。

当所述第二数据包括图像数据时，所述第二处理器60用高精度神经网络模型的相关算法识别所述图像数据中的所述待识别对象是否为目标对象。当所述第二数据包括声音数据时，所述第二处理器60用高精度神经网络模型的相关算法识别所述声音数据中的所述待识别对象是否为目标对象。当所述第二数据包括图像数据和声音数据时，所述第二处理器60用高精度神经网络模型的相关算法识别所述图像数据和所述声音数据中的所述待识别对象是否为目标对象。可以理解，当结合所述图像数据和所述声音数据进行识别时，识别的准确性会更高一些。

所述第三处理器80接收到所述识别结果后，会根据所述识别结果进行相应的处理。当所述识别结果为所述第二数据中的所述待识别对象是所述目标对象时，所述第三处理器80的处理方式是控制所述门禁开启；当所述识别结果为所述第二数据中的所述待识别对象不是所述目标对象时，所述第三处理器80的处理方式是控制所述门禁保持关闭状态。可以理解，所述第三处理器80根据所述识别结果进行相应的处理的处理方式，会随着应用场景的不同而不同。

所述第三处理器80在根据所述识别结果完成相应的处理后，所述第二存储器50、所述第二处理器60及所述第三处理器80停止工作，且所述调整器70将所述数据采集模块20采集数据的精度调整为到所述第一精度，此时，所述人工智能装置100的功耗变小。当所述第一处理器40再次判断出所述第一数据中存在所述待识别对象时，所述第二存储器50、所述第二处理器60、所述调整器70及所述第三处理器80才再次开始工作。在所述第一处理器40判断所述第一数据中不存在所述待识别对象的时间段内，所述第二存储器50、所述第二处理器60、所述调整器70及所述第三处理器80均不工作。

可以理解，在其它的应用场景中，所述人工智能装置100的工作原理与在所述门禁管理场景中的工作原理类似，主要区别在于，所述第三处理器80根据所述识别结果进行相应的处理的处理方式，会随着应用场景的不同而不同。

在本发明中，功耗较大的所述第二存储器50、所述第二处理器60及所述第三处理器80，只在所述第一处理器40判断出所述第一数据中存在所述待识别对象时才开始工作；而在所述第一处理器40判断所述第一数据中不存在所述待识别对象的时间段内，所述第二存储器50、所述第二处理器60及所述第三处理器80均不工作；这样一来，大功耗的器件(如所述第二处理器60等)不用一直工作，从而确保了所述人工智能装置100的低功耗。另外，当所述第二存储器50、所述第二处理器60及所述第三处理器80工作时，所述第二处理器60会在所述第一处理器40判断出存在所述待识别对象的前提下，以大于所述第一精度的第二精度进一步识别所述第二数据中的所述待识别对象是否为目标对象，从而确保了所述人工智能装置100的高精度。由此可知，本发明人工智能装置100既具有低功耗，又具有高精度。

以上对本发明实施例进行了详细介绍，本申请中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种人工智能装置，其特征在于，所述人工智能装置包括：接口、第一存储器、第一处理器、第二存储器、第二处理器、调整器及第三处理器；所述接口用于与数据采集模块通讯；所述第一存储器用于存储所述数据采集模块在第一精度下采集的第一数据；所述第一处理器用于判断所述第一数据中是否存在待识别对象；所述第一处理器还用于在判断出所述第一数据中存在所述待识别对象时，控制所述第二存储器、所述第二处理器、所述调整器及所述第三处理器开始工作；所述调整器用于将所述数据采集模块采集数据的精度调整为第二精度；所述第二存储器用于存储所述数据采集模块在所述第二精度下采集的第二数据；所述第二处理器用于识别所述第二数据中的所述待识别对象是否为目标对象，并将识别结果输出给所述第三处理器；所述第三处理器用于根据所述识别结果进行相应的处理；所述第一精度小于所述第二精度，所述第一存储器的存储容量及功耗小于所述第二存储器的存储容量及功耗，所述第一处理器的功耗小于所述第二处理器及所述第三处理器的功耗；

其中，所述第一处理器包括第一控制单元、驱动单元、第一计算单元、转换单元及处理单元；所述第一控制单元用于控制所述驱动单元从所述第一存储器中读取数据，并将读取的数据输出给所述第一计算单元；所述第一计算单元用于将接收到的数据与预先存储的权重进行卷积神经网络计算，以得到第一计算结果，并将所述第一计算结果输出给所述转换单元；所述转换单元用于将所述第一计算结果转换成数字信号，并将所述数字信号输出给所述处理单元；所述处理单元用于对接收到的所述数字信号做非线性处理，并将处理得到的第一信号输出给所述第一控制单元；所述第一控制单元还用于根据所述第一信号判断所述第一数据中是否存在待识别对象，并在判断出所述第一数据中存在所述待识别对象时，控制所述第二存储器、所述第二处理器、所述调整器及所述第三处理器开始工作；

其中，所述第一计算单元包括多个相互连接的子单元，所述多个子单元设置成M行N列的矩阵，每个子单元包括电子开关及用于存储预先设置的权重的存储元件；第I行中每个子单元的电子开关的第一端与所述驱动单元的第I个输出端相连，以接收所述第I个输出端输出的第I个模拟信号；第J列中每个子单元的电子开关的第二端与第J个电源相连，所述第J列中每个子单元的电子开关的第三端通过相应的存储元件与所述转换单元的第J个输入端相连，N为正整数，1≤I≤M，1≤J≤N；每个子单元用于将接收到的模拟信息与预先设置的权重进行卷积神经网络计算，并将计算的结果输出给所述转换单元；

其中，所述第二处理器包括多个处理元件及第二控制单元；每个处理元件包括输入缓存单元、权重缓存单元、第二计算单元及输出缓存单元；每个输入缓存单元用于从所述第二存储器中读取并存储相应的处理元件计算时需要用到的输入数据；每个权重缓存单元用于从所述第二存储器中读取并存储相应的处理元件计算时需要用到的权重数据；每个第二计算单元用于从相应的输入缓存单元中读取输入数据，并从相应的权重缓存单元中读取权重数据，且将读取到的输入数据及权重数据进行卷积神经网络计算，以得到第二计算结果，还将所述第二计算结果输出给所述第二控制单元；所述第二控制单元用于根据所述多个处理元件输出的所述第二计算结果，识别所述第二数据中的所述待识别对象是否为目标对象，并将识别结果输出给所述第三处理器。

2.如权利要求1所述的人工智能装置，其特征在于，所述驱动单元包括用于与所述第一存储器相连的输入端及用于与所述第一计算单元相连的M个输出端，所述驱动单元通过所述输入端从所述第一存储器中读取数据，并将读取的数据转换成M个模拟信号，且通过所述M个输出端将所述M个模拟信号输出给所述第一计算单元，M为正整数。

3.如权利要求1所述的人工智能装置，其特征在于，所述电子开关为三极管或场效应管；当所述电子开关为三极管时，所述电子开关的第一端、第二端及第三端分别对应三极管的基极、集电极及发射极，或分别对应三极管的基极、发射极及集电极；当所述电子开关为场效应管时，所述电子开关的第一端、第二端及第三端分别对应场效应管的栅极、漏极及源极，或分别对应场效应管的栅极、源极及漏极。

4.如权利要求1所述的人工智能装置，其特征在于，所述第三处理器包括中央处理单元、数字信号处理器、专用集成电路、现成可编程门阵列、微控制单元中的一种或多种。

5.如权利要求1所述的人工智能装置，其特征在于，所述接口通过有线或无线的方式与所述数据采集模块通讯，所述数据采集模块包括图像采集单元及/或声音采集单元，所述第一数据及所述第二数据包括图像数据及/或声音数据。

6.如权利要求1所述的人工智能装置，其特征在于，所述第一存储器为内存储器，所述第二存储器为外存储器。

7.如权利要求1所述的人工智能装置，其特征在于，所述人工智能装置还包括任务管理器，所述任务管理器用于对所述第一存储器、所述第一处理器、所述第二存储器、所述第二处理器、所述调整器及所述第三处理器执行的任务进行管理。