CN108399349A

CN108399349A - 图像识别方法及装置

Info

Publication number: CN108399349A
Application number: CN201810240853.0A
Authority: CN
Inventors: 冯舟; 吴正山
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-03-22
Filing date: 2018-03-22
Publication date: 2018-08-14
Anticipated expiration: 2038-03-22
Also published as: WO2019179283A1; US10902234B2; CN108399349B; US20200356742A1

Abstract

本申请是关于一种图像识别方法及装置。该方法包括：接收到启动图像识别的操作时，启动图像采集组件采集获取图像流；从所述图像流中提取第一图像；确定所述第一图像的图像类型，所述图像类型包括物体图像或者编码图像；按照所述图像类型对应的识别方式对所述图像流中的图像进行识别。通过本申请所示的方案，用户通过同一操作即可以触发对物体图像和编码图像这两种图像的识别，不需要为这两种图像分别设置入口控件，在切换识别不同类型图像时能够简化用户的操作步骤，从而提高切换识别不同类型图像的效率。

Description

图像识别方法及装置

技术领域

本申请涉及互联网应用技术领域，特别涉及一种图像识别方法及装置。

背景技术

随着移动互联网应用的不断发展，即时图像识别的应用也越来越广泛。其中，即时图像识别通常包含识别图像所包含物体的物体图像识别，以及识别图像中包含的图形编码的编码图像识别。

在相关技术中，同时提供物体图像识别功能和编码图像识别功能的识别应用，通常针对两种识别功能，在相同或者不同的界面中分别展示对应的识别入口。当用户点击物体图像识别功能对应的识别入口后，识别应用可以对图像采集组件实时采集到的图像进行物体识别，以识别图像中包含的物体；而当用户点击编码图像识别功能对应的识别入口后，识别应用可以对图像采集组件实时采集到的图像进行图形编码识别，以识别图像中包含的图形编码所携带的编码内容。

然而，相关技术中的方案需要对两种识别功能分别设置对应的识别入口，当用户需要识别不同类型的图像时，需要切换不同的识别入口，导致用户操作过程较为繁琐，切换识别不同类型图像的效率较低。

发明内容

本申请实施例提供了一种图像识别方法及装置，可以用于解决相关技术中需要对两种识别功能分别设置对应的识别入口，切换识别不同类型图像的效率较低的问题，该技术方案如下：

一方面，提供了一种图像识别方法，所述方法包括：

接收到启动图像识别的操作时，启动图像采集组件采集获取图像流；

从所述图像流中提取第一图像；

确定所述第一图像的图像类型，所述图像类型包括物体图像或者编码图像；

按照所述图像类型对应的识别方式对所述图像流中的图像进行识别。

另一方面，提供了一种图像识别方法，所述方法包括：

展示一识别入口控件；

接收到对所述识别入口控件执行的预定操作时，展示图像取景界面，所述图像取景界面是用于显示所述图像采集组件实时取景获得的图像的界面；

展示所述图像采集组件采集获取到的图像流中所包含图像的图像类型以及所述图像类型对应的识别结果，所述图像类型包括物体图像或者编码图像。

另一方面，提供了一种图像识别装置，所述装置包括：

采集模块，用于在接收到启动图像识别的操作时，启动图像采集组件采集获取图像流；

第一图像提取模块，用于从所述图像流中提取第一图像；

图像类型确定模块，用于确定所述第一图像的图像类型，所述图像类型包括物体图像或者编码图像；

识别模块，用于按照所述图像类型对应的识别方式对所述图像流中的图像进行识别。

另一方面，提供了一种计算机设备，所述计算机设备包含处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述的图像识别方法。

又一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述的图像识别方法。

本申请提供的技术方案可以包括以下有益效果：

通过本申请所示的方案，用户可以通过同一操作触发对物体图像和编码图像这两种图像的识别，不需要为这两种图像分别设置入口控件，也就是说，用户通过同一种启动图像识别的操作，既可以调用图像采集组件拍摄识别物体，也可以调用图像采集组件拍摄识别图形编码，不需要在两个入口控件之间进行切换，在切换识别不同类型图像时能够简化用户的操作步骤，从而提高切换识别不同类型图像的效率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1是根据一示例性实施例示出的一种图像识别系统的结构示意图；

图2是是根据一示例性实施例示出的一种图像识别方法的流程图；

图3是图2所示实施例涉及的一种识别入口控件展示示意图；

图4是根据一示例性实施例示出的一种图像识别方法的流程图；

图5是图4所示实施例涉及的一种默认对焦图像的示意图；

图6是图4所示实施例涉及的一种主动对焦图像的示意图；

图7是图4所示实施例涉及的一种待识别图像的示意图；

图8是图4所示实施例涉及的一种图像识别流程的示意图；

图9是根据一示例性实施例示出的一种图像识别方法的流程图；

图10是根据一示例性实施例示出的一种图像识别系统的实现架构图；

图11是根据一示例性实施例示出的图像识别装置的结构方框图；

图12是根据一示例性实施例示出的一种终端的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种图像识别系统的结构示意图。该系统包括：若干个终端120和服务器集群140。

终端120可以是手机、平板电脑、电子书阅读器、智能眼镜、智能手表、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

终端120对应有图像采集组件。其中，该图像采集组件可以是终端120的一部分，比如，该图像采集组件可以是终端120内置的摄像头；或者，该图像采集组件也可以作为终端120的外设设备与该终端120相连接。

终端120与服务器集群140之间通过通信网络相连。可选的，通信网络是有线网络或无线网络。

在本申请实施例中，终端120可以在本地对图像采集组件采集到的图像进行识别，或者，终端120也可以将图像采集组件采集到的图像上传给服务器集群140，由服务器140对终端120上传的图像进行识别，并向终端120返回识别结果。其中，上述对图像进行识别的过程，可以是识别图像中包含的物体，或者识别并解析图像中包含的图形编码的过程。

其中，上述的图形编码可以是条形码或者二维码等可以携带额外信息的图案。

服务器集群140是一台服务器，或者由若干台服务器，或者是一个虚拟化平台，或者是一个云计算服务中心。

可选的，服务器集群140包括用于实现物体图像识别平台142的服务器。物体图像识别平台142可以识别终端120上传的图像中是否存在的物体，并将识别结果返回给终端120。

可选的，服务器集群140还包括用于实现编码图像识别平台144的服务器。编码图像识别平台144可以识别终端120上传的图像中是否存在的图形编码，并将识别结果返回给终端120。

可选的，服务器集群140还可以包括识别算法管理平台146的服务器。该识别算法管理平台146可以维护和更新物体图像识别平台142和编码图像识别平台144分别使用的图像识别算法。

需要说明的是，上述用于实现物体图像识别平台142、编码图像识别平台144以及识别算法管理平台146的服务器可以是相互之间独立的服务器；或者，上述物体图像识别平台142、编码图像识别平台144以及识别算法管理平台146中的两个平台可以实现在同一个服务器中，而另外一个平台可以实现在另一个服务器中；或者，用于实现上述三个平台的服务器也可以是同一个服务器。当上述三个平台实现在两个或者三个服务器中时，这两个或者三个服务器之间通过通信网络相连。

可选的，该系统还可以包括管理设备(图1未示出)，该管理设备与服务器集群140之间通过通信网络相连。可选的，通信网络是有线网络或无线网络。

可选的，上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络，包括但不限于局域网(Local Area Network，LAN)、城域网(Metropolitan Area Network，MAN)、广域网(Wide Area Network，WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合)。在一些实施例中，使用包括超文本标记语言(Hyper Text Mark-up Language，HTML)、可扩展标记语言(Extensible MarkupLanguage，XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(Secure Socket Layer，SSL)、传输层安全(Transport Layer Security，TLS)、虚拟专用网络(Virtual Private Network，VPN)、网际协议安全(Internet ProtocolSecurity，IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中，还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。

图2是根据一示例性实施例示出的一种图像识别方法的流程图，该图像识别方法可以用于终端中，比如，该方法可以用于上述图1所示的终端120中。如图2所示，该图像识别方法可以包括如下步骤：

步骤21，接收到启动图像识别的操作时，启动图像采集组件采集获取图像流。

在本申请实施例中，用户可以通过同一操作触发启动对物体图像和编码图像这两种不同类型的图像的识别。比如，用户可以通过同一个识别入口控件触发对物体图像和编码图像这两种不同类型的图像的识别；或者，用户也可以通过同一个不依赖识别入口控件的操作触发对物体图像和编码图像这两种不同类型的图像的识别。

当用户通过识别入口控件触发图像识别时，对于物体图像识别和图形编码识别，仅需要在终端显示的应用界面中设置单独的一个识别入口控件，用户通过该识别入口控件，可以同时触发对物体图像进行物体识别以及图形编码识别这两种功能。

比如，请参考图3，其示出了本申请实施例涉及的一种识别入口控件展示示意图。如图3所示，在应用程序界面31中，仅包含一个识别入口控件32，该识别入口控件同时对应应用程序界面31对应的应用程序所提供的物体图像识别功能和图形编码识别功能。

在另一种可能的实现方式中，当用户通过不依赖识别入口控件的操作触发图像识别时，用户可以在某一个指定页面(比如某个浏览器的页面)中通过滑动页面(比如下拉、左滑或者右滑页面等)的操作触发物体图像识别功能和图形编码识别功能，或者，用户也可以通过点击快捷按键、语音控制或者摇一摇等操作触发物体图像识别功能和图形编码识别功能。

步骤22，从该图像流中提取第一图像。

步骤23，确定该第一图像的图像类型，该图像类型包括物体图像或者编码图像。

其中，物体图像可以是包含实际物体的图像，比如，该实际物体可以是一个杯子、一个盆栽、一幅画、一个人或者一个动物等等。而编码图像可以是包含图形编码的图像。

在本申请实施例中，在对图像采集组件采集到的图像进行图像识别和/或图形编码识别之前，终端首先从图像采集组件采集到的图像流中提取出第一图像，其中，该第一图像可以是一帧图像，或者该第一图像也可以包含两帧或者两帧以上图像，终端根据该第一图像初步判别该第一图像是物体图像还是编码图像。

步骤24，按照该图像类型对应的识别方式对该图像流中的图像进行识别。

在本申请实施例中，在初步判别该第一图像是物体图像还是编码图像之后，终端选择第一图像的图像类型对应的识别方式(即物体识别或者图形编码识别)，对图像采集组件采集获取到的图像流中的图像进行识别，以获得识别结果。

通过上述图2所示的方案，用户只需要执行一个启动图像识别的操作，即可以触发对物体图像和编码图像这两种图像的识别，不需要为这两种图像分别设置入口控件，也就是说，用户通过该启动图像识别的操作，既可以调用图像采集组件拍摄识别物体，也可以调用图像采集组件拍摄识别图形编码，不需要在两个入口控件之间进行切换，在切换识别不同类型图像时能够简化用户的操作步骤，从而提高切换识别不同类型图像的效率。

由于确定出的第一图像的图像类型不一定准确，当第一图像的图像类型确定错误时，可能会导致按照图像类型对应的识别方式对图像流进行识别的过程失败，为了提高图像识别的准确性，本申请可以通过图4所示的方案来增强识别的容错率。

图4是根据一示例性实施例示出的一种图像识别方法的流程图，该图像识别方法可以用于终端中，比如，该方法可以用于上述图1所示的终端120。以通过一个识别入口控件触发对两种图像的识别为例，如图4所示，该图像识别方法可以包括如下步骤：

步骤401，展示一识别入口控件。

在本申请实施例中，终端在运行同时提供物体识别功能和图形编码识别功能的应用程序时，可以展示包含识别入口控件的应用程序界面，且该识别入口控件可以实现上述物体识别功能和图形编码识别功能这两种功能。该应用程序界面可以如图3所示，此处不再赘述。

步骤402，接收到对该识别入口控件执行的预定操作时，启动图像采集组件采集获取图像流。

在本申请实施例中，当用户需要识别物体或者编码图像时，可以通过点击或者其它类型的操作触发终端开启图像采集组件进行图像流的采集。其中，图像采集组件在采集图像流时，可以展示图像取景界面，该图像取景界面是用于显示图像采集组件实时取景获得的图像的界面，该图像取景界面中显示的各帧图像即组成上述图像流。

步骤403，从该图像流中提取第一图像。

在本申请实施例中，终端启动图像采集组件采集图像流之后，首先从图像流中提取出一帧或者多帧图像作为第一图像。比如，终端可以按照预设的采样频率从图像流中提取第一图像；或者，终端也可以随机抽取至少一帧图像作为第一图像。

步骤404，确定该第一图像的图像类型，该图像类型包括物体图像或者编码图像。

在本申请实施例中，在确定该第一图像的图像类型时，终端可以获取该第一图像是编码图像的概率，当该概率大于预设的概率阈值时，确定该第一图像是编码图像；当该概率不大于该概率阈值时，确定该第一图像是物体图像。

比如，以上述概率阈值为95％为例，终端首先检测第一图像是编码图像的概率，若该第一图像是编码图像的概率大于95％，则终端确定该第一图像是编码图像，反之，若该第一图像是编码图像的概率不大于95％，则终端确定该第一图像是物体图像。

在本申请实施例中，终端可以通过图形编码识别算法识别第一图像是编码图像的概率。该图形编码识别算法可以包括条形码识别算法以及二维码识别算法等等。

其中，上述概率阈值可以是开发人员预先设置的阈值。

可选的，在获取该第一图像是编码图像的概率时，终端也可以将该第一图像输入图像分类模型，获得该第一图像是编码图像的概率，该图像分类模型是通过训练样本训练获得的机器学习模型，该训练样本包含预先标注为编码图像的样本图像。

在本申请实施例中，终端也可以通过机器学习模型(即上述图像分类模型)来获得第一图像是编码图像的概率。比如，开发人员可以预先标注若干个训练样本，每个训练样本是一个包含图形编码的图像，开发人员将若干个训练样本输入到预设的机器学习模型(比如卷积神经网络模型)中进行机器学习，以获得该图像分类模型。在执行上述步骤404时，终端将第一图像输入该图像分类模型后，该图像分类模型可以根据第一图像的图像内容获得该第一图像中包含图形编码的概率(即第一图像是编码图像的概率)。

在另一种可能的实现方式中，终端将上述第一图像输入图像分类模型后，图像分类模型也可以直接输出该第一图像是否为编码图像的分类结果，当分类结果指示该第一图像是编码图像时，终端确定该第一图像的图像类型是编码图像，而当该分类结果指示该第一图像不是编码图像时，终端可以确定该第一图像的图像类型是物体图像。

步骤405，当该第一图像的图像类型是物体图像时，从该图像流中提取第二图像。

在一种可能的实现方式中，当该第一图像的图像类型是物体图像时，终端可以将该图像流中满足预设提取条件的目标图像获取为该第二图像。

可选的，该预设提取条件包括以下条件中的至少一种：

该目标图像与参考图像之间的差异值低于预设的差异阈值，该差异值用于指示两帧图像之间的差异大小，该参考图像是该图像流中处于该目标图像的预设相对位置的图像；

该目标图像对应的采集时刻的环境光亮度高于预设亮度阈值；

该目标图像对应的采集时刻的终端加速度低于预设的加速度阈值；

该目标图像对应的采集时刻处于第一时刻之后，且该采集时刻与该第一时刻之间相隔的时长大于预设的时长阈值，该第一时刻是该第一图像被采集的时刻。

其中，上述差异阈值、亮度阈值、加速度阈值以及时长阈值可以是由开发人员预先设置的阈值。

在实际应用中，终端通过图像采集组件采集到的图像流中，并不是每一幅图像都适合用来进行图像识别。在本申请实施例中，终端可以通过预设提取条件动态获取适合进行图像识别的第二图像，比如，终端可以根据预设提取条件触发提取第二图像。例如，终端可以通过图像采集组件的驱动程序控制图像采集组件不断采集图像流(Preview Data)，图像流的格式可以为YUV格式，比如YVU9、YUV411以及YUV420等格式，或者图像流的格式也可以为RGB(Red Green Blue，红绿蓝)格式，比如RGB4、RGB8以及RGB32等格式。对于图像流的格式，本申请实施例不做限定。

若某一时刻采集到的图像满足以下条件，则触发将该图像提取为上述第二图像：

1)邻帧差分条件。

在本申请实施例中，终端可以根据当前采集到的图像的RGB像素与相邻帧图像或隔帧图像的RGB像素之间的差异(即两帧图像之间的变化)来检测运动目标，从而实现实时且有效处理对物体运动的变化造成扫描识别干扰。

其中帧间差分公式可以表示如下：

D_t(i,j)＝|C_t(i,j)-C_t-s(i,j)|；

其中s为间隔帧数，通常情况下，s的取值可以取1-3之间。定义C_t(i,j)为图像流中的第t帧图像的RGB像素，C_t-s(i,j)为图像流中的第t-s帧图像的RGB像素，D_t(i,j)是图像流中的第t帧图像与第t-s帧图像之间的前景噪声。

其中，以上述第t帧图像为目标图像，第t-s帧图像为目标图像对应的参考图像为例，在本申请实施例中，终端可以将上述D_t(i,j)获取为第t帧图像与第t-s帧图像之间的差异值。若上述D_t(i,j)不低于预设的差异阈值，则说明两幅图像之间的差别较大，可能是因为在这段时间内用户正在调整拍摄角度或者拍摄方向，此时，上述第t帧图像不满足邻帧差分条件，终端可以跳过该第t帧图像，继续判断其它图像是否满足邻帧差分条件；反之，如果上述D_t(i,j)低于预设的差异阈值，则说明两幅图像之间的差别较小，可能是因为在这段时间内用户已经调整完成拍摄角度和拍摄方向，此时，上述第t帧图像满足邻帧差分条件，终端可以将该第t帧图像获取为第二图像。

其中，上述举例以第t帧图像为目标图像，第t-s帧图像为目标图像对应的参考图像为例进行说明，在实际应用中，也可以将第t-s帧图像作为目标图像，而第t帧图像作为目标图像对应的参考图像。

2)光照条件。

在本申请实施例中，终端可以通过光线传感器获取周围的环境光线的亮度值，当环境光亮度较暗时，则可以认为此时通过图像采集组件采集到的图像的画面也可能较暗，不满足图像识别所要求的光照条件，此时，终端可以忽略该图像，继续采集下一帧图像数据，直至环境光亮度高于预设亮度阈值时，终端将采集到的图像获取为第二图像。

3)终端运动状态条件。

在本申请实施例中，终端可以通过内置的加速度传感器，获取终端在空间坐标系中的x，y和z轴三个方向的加速度，若某一时刻，终端在全部或者部分方向上的加速度数值超过一定的加速度阈值，则可能是用户正在调整图像采集组件的拍摄方向或者拍摄角度，此时图像采集组件采集到的图像画面可能比较模糊，且此时采集到的图像中通常并不包含用户想要进行识别的物体，即此时采集到的图像不满足终端运动状态条件，终端可以跳过当前图像，继续采集下一帧图像。当某个时刻终端在空间坐标系中的x，y和z轴三个方向的加速度都不超过相应的加速度阈值时，则可能是因为在这段时间内用户已经调整完成拍摄角度和拍摄方向，此时，终端可以将该时刻采集到的图像获取的第二图像。

4)时长阈值条件。

在实际应用中，用户通常在终端开启图像采集组件一段时间后，才能将图像采集组件的镜头对准想要识别的物体，因此，在本申请实施例中，当终端中的图像采集组件采集图像流超过一定的时长阈值时(比如3秒)时，终端可以认为后续采集到的图像满足时长阈值条件，并从后续采集到的图像中提取第二图像。

在本申请实施例中，上述四种条件可以单独使用，即终端的图像采集组件采集到的图像流中，某一帧图像满足上述四种条件中的任意条件，则该帧图像即可以被提取为第二图像。

或者，上述四种条件也可以结合使用，即终端的图像采集组件采集到的图像流中，某一帧图像同时满足上述四种条件中指定的至少两个条件时，该帧图像才可以被提取为第二图像。

比如，以同时满足上述四种条件的图像才可以被提取为第二图像为例，触发提取第二图像的公式可以如下：

其中，D_t(i,j)是图像流中的第t帧图像与第t-s帧图像之间的前景噪声，d是差异阈值；L_t是图像流中的第t帧图像被采集时，光线传感器采集到的环境光亮度，l是亮度阈值；M_t是图像流中的第t帧图像被采集时，终端中的加速度传感器获取到的加速度数值，m为加速度阈值；S_t是图像流中的第t帧图像被采集时，终端中的图像采集组件开始采集图像的时长，s为时长阈值。其中，f_t＝1表示终端可以将图像流中的第t帧图像提取为第二图像，而f_t＝0则表示终端不可以将图像流中的第t帧图像提取为第二图像。

通过本申请实施例所示的方案，终端可以通过多样化的触发条件来触发动态扫描行为(即终端自动提取用于物体识别的第二图像)，从而更准确的满足用户期望，以免出现误识别，提高识别效果和识别准确率。在终端侧，可以很容易获取或者计算以上多种条件，通过将这些条件结合使用能够显著提高识别效率和准确率。

在另一种可能的实现方式中，当该第一图像的图像类型是物体图像时，终端还可以展示图像取景界面，该图像取景界面是用于显示该图像采集组件实时取景获得的图像的界面；根据在该图像采集界面中执行的对焦操作确定该图像采集组件的对焦参数；将该图像采集组件按照该对焦参数采集到的图像提取为该第二图像。

在实际应用中，通过图像采集组件采集图像流时，由于图像采集组件的自动对焦功能并不一定能够准确对焦至用户想要识别的物体，导致采集到的图像中包含的用户想要识别的物体的清晰度不够，从而影响后续的物体识别的准确性。因此，在本申请实施例中，可以由用户主动触发终端静态获取第二图像。

比如，请参考图5，其示出了本申请实施例涉及的一种默认对焦图像的示意图。如图5所示，相机预览界面(即上述图像取景界面)中显示有盆栽以及书本等多个物体，在用户未主动操作时，图像采集组件以默认的对焦参数进行对焦，相机预览界面中展示图5所示的图像。在图5所示的状态下，如果用户欲捕捉最佳镜头，比如想要识别其中的盆栽，则可以点击屏幕中的盆栽位置，此时，图像采集组件在相机预览界面中显示一对焦虚拟图标51，以指示用户的触摸位置。

请参考图6，其示出了本申请实施例涉及的一种主动对焦图像的示意图。如图6所示，在图5的基础上，终端接收到用户对盆栽位置的点击操作并显示对焦虚拟图标后，触发相机应用开始以对焦虚拟图标所对应的焦点参数进行自动对焦(StartFocus)，等待相机应用成功回调(onAutoFocus)后，选择一帧清晰的图像进行显示。

请参考图7，其示出了本申请实施例涉及的一种待识别图像的示意图。如图7所示，在图6的基础上，终端重新对焦后采集获得的图像即作为待进行物品识别的第二图像。

本申请所示的方案，可以将第二图像的动态获取和静态获取过程相结合，比如，在实际应用过程中，当用户不主动触发对焦时，终端通过预设提取条件动态获取适合进行图像识别的第二图像，当用户主动触发对焦时，可以中断上述动态获取过程，转为静态获取第二图像。

步骤406，向识别服务器发送识别请求，该识别请求用于请求该服务器识别该第二图像中包含的物体。

在本申请实施例中，终端可以借助云端的服务器来进行物体识别，即终端可以将第二图像携带在识别请求中，并将识别请求发送给服务器，服务器通过预设的识别算法识别第二图像中包含的物体。

步骤407，接收该服务器返回的第一识别结果。

在本申请实施例中，当服务器识别出第二图像中包含的物体时，可以向终端返回包含识别出的物体对应的物体信息的第一识别结果；而当服务器未能识别出第二图像中包含的物体时，可以向终端返回包含识别失败指示的第一识别结果。

若第一识别结果中包含识别出的物体对应的物体信息，则终端在接收到该第一识别结果后，可以将展示该物体信息。

在本申请实施例中，仅以通过服务器来进行物体图像的识别为例进行说明，在实际应用中，也可以由终端自行识别上述第二图像中包含的物体。

步骤408，当该第一识别结果指示该服务器对该第二图像识别失败时，识别该第二图像中包含的图形编码。

比如，当终端接收到的第一识别结果中包含识别失败指示时，终端可以确定该第二图像中不包含物体，即该第二图像可能是编码图像，此时，终端可以按照预设的图形编码识别算法对第二图像进行识别，以识别出第二图像中是否包含图形编码，以及当包含图形编码时，解析出该图形编码中包含的编码内容。

若识别出第二图像中包含图形编码，则终端还可以展示该图形编码中包含的编码内容。

在另一种可能的实现方式中，当该第一识别结果指示该服务器对该第二图像识别失败时，终端也可以不对第二图像进行图形编码的识别，而是按照对应的采集时间从先到后的顺序，逐帧识别该图像流中的至少一帧图像中包含的图形编码。

步骤409，当该第一图像的图像类型是编码图像时，按照对应的采集时间从先到后的顺序，逐帧识别该图像流中的至少一帧图像中包含的图形编码。

在本申请实施例中，当终端确定出第一图像的图像类型是编码图像时，可以认为用户想要识别图形编码，此时，终端可以按照预设的图形编码识别算法对图像流中的至少一帧图像逐帧进行识别，以识别出图像流包含的各帧图像中是否包含图形编码，以及当包含图形编码时，解析出该图形编码中包含的编码内容。

其中，上述图像流中的至少一帧图像的提取方式与上述第二图像的提取方式类似，此处不再赘述。

若终端识别出该图像流中的至少一帧图像中包含图形编码，则终端还可以展示该图形编码中包含的编码内容。

在本申请实施例中，仅以终端执行编码图像的识别为例进行说明，在实际应用中，终端也可以将图像流中的至少一帧图像上传给服务器，由服务器识别该至少一帧图像包含的图形编码。

步骤410，若在识别初始时刻之后的预设长度时间段内未识别出图形编码，则从该图像流中提取新的第一图像。

步骤411，确定该新的第一图像的图像类型。

步骤412，按照该新的第一图像的图像类型对应的识别方式对该图像流中的图像进行识别。

其中，上述步骤410至步骤413所示的方案，与步骤401至步骤409类似，此处不再赘述。

在本申请实施例中，若第一图像的图像类型是编码图像，且终端在开始逐帧识别该图像流中的至少一帧图像中包含的图形编码之后，若在一定时间内没有识别出图形编码，则可能是第一图像实际的图像类型不是编码图像，或者，用户此时不想要识别编码图像，此时，终端可以重新获取第一图像，并根据新的第一图像的图像类型对应的识别方式对图像流中的图像进行识别。

比如，请参考图8，其示出了本申请实施例涉及的一种图像识别流程的示意图。如图8所示，在终端开始通过图像采集组件采集获取图像流81之后，终端首先从图像流81中提取第一图像82，并确定的第一图像82的图像类型。

当第一图像82的图像类型是编码图像时，终端从图像流81中提取出至少一帧图像83，并按照采集时间顺序对提取出的至少一帧图像83逐帧进行图形编码的识别，若在预定时间(比如2s)内识别出至少一帧图像83中包含图形编码，则展示该图形编码中包含的编码内容，若该预定时间内未能识别出至少一帧图像83中包含图形编码，则终端可以获取新的第一图像84，并重复前述步骤。

当第一图像82的图像类型是物体图像时，终端从图像流81中提取第二图像85，并借助于云端服务器识别第二图像85中包含的物体，获得第一识别结果，若该第一识别结果指示该第二图像85中包含物体，则展示相应的物体信息。若该第一识别结果指示对该第二图像85中包含的物体识别失败，则终端可以执行上述提取至少一帧图像83，并对至少一帧图像83逐帧进行图形编码的识别的步骤。或者，在另一种可能的实现方式中，当第一识别结果指示对该第二图像85中包含的物体识别失败时，终端也可以进一步识别第二图像83中包含的图形编码，若成功识别出图形编码，则终端展示该图形编码中包含的编码内容。

综上所述，通过本申请实施例所示的方案，只需要在应用界面中提供一个入口控件，即可以触发对物体图像和编码图像这两种图像的识别，不需要为这两种图像分别设置入口控件，在切换识别不同类型图像时能够简化用户的操作步骤，从而提高切换识别不同类型图像的效率。

此外，通过本申请实施例所示的方案，在确定出第一图像是物体图像，但是在提取出的第二图像中未能成功识别出物体时，终端可以进一步对该第二图像进行图形编码识别，以识别该第二图像中是否包含图形编码，以及图形编码中包含的编码内容，避免因错误的将第一图像确定为物体图像而导致无法识别出图形编码的问题，提高图像识别的准确性。

另外，通过本申请实施例所示的方案，在确定出第一图像是编码图像，但是在预定时间内未能成功识别出图形编码时，终端可以获取新的第一图像，重新确定图像类型并根据图像类型进行物体图像识别或者编码图像识别，避免因错误的将第一图像确定为编码图像而导致无法识别出图像中的物体的问题，提高图像识别的准确性。

通过上述图4所示的实施例，终端可以展示一识别入口控件，并在接收到对该识别入口控件执行的预定操作时，展示图像取景界面，该图像取景界面是用于显示该图像采集组件实时取景获得的图像的界面，进一步的，在对图像取景界面中的图像进行识别后，终端进一步展示该图像采集组件采集获取到的图像流中所包含图像的图像类型以及该图像类型对应的识别结果，该图像类型包括物体图像或者编码图像。从用户侧来说，对于终端展示的单个识别入口，当用户通过该识别入口触发识别进程后，若用户通过终端中的图像采集组件扫描物体，则终端可以展示该物体的名称等信息，若用户通过该终端中的图像采集组件扫描图形编码(比如二维码)，则终端可以展示该图形编码中携带的内容。

在上述图4所示的实施例中，当终端将第一图像确定为物体图像后，若后续未能成功从第二图像中识别出物体信息，则终端再对第二图像进行编码图像识别，该过程需要消耗一定的处理时间，也就是说，当用户想要识别图形编码时，若终端错误的将第一图像确定为物体图像，则终端需要首先对第二图像进行物体图像识别，在识别失败后，再对第二图像进行编码图像识别，导致图形编码的识别延时较高。本申请所示的方案，可以通过图9所示的方法来缩短上述情况下对图形编码的识别延时。

图9是根据一示例性实施例示出的一种图像识别方法的流程图，该图像识别方法可以用于终端中，比如，该方法可以用于上述图1所示的终端120。以图4为基础，如图9所示，该图像识别方法可以包括如下步骤：

步骤413，当确定出第一图像的图像类型是物体图像时，按照预设的采样时间间隔，从该图像流中提取第三图像。

在本申请实施例中，当通过上述图4所示实施例中的步骤404确定出第一图像是物体图像时，终端在执行步骤405至步骤408的同时，还每隔预设的采样时间间隔从图像流中提取第三图像。

其中，终端从图像流中提取第三图像的方式，与图4所示实施例中终端根据预设提取条件提取第二图像的方式类似，此处不再赘述。

步骤414，识别该第三图像中包含的图形编码。

每次提取到第三图像之后，终端即可以识别该第三图像中是否包含图形编码，并在该第三图像中包含图形编码时，解码获得该图形编码中包含的编码内容并展示。其中，若成功识别并解码出第三图像中包含的图形编码，则终端可以结束本次图像识别流程。

综上所述，通过本申请实施例所示的方案，在确定出第一图像是物体图像后，在提取第二图像并识别第二图像中包含的物体的过程中，终端还每隔一段时间提取一帧图像来识别图形编码，避免因错误的将第一图像确定为物体图像而导致最终识别出图形编码的时延过长的问题，提高图形编码的识别效率。

上述图4和图9所示的实施例，仅以用户通过一识别入口控件触发对物体图像和图形编码图像的识别为例进行说明，在实际应用中，用户也可以通过单次不依赖识别入口控件的操作触发对物体图像和图形编码图像的识别，其中，用户通过单次不依赖识别入口控件的操作同时触发对物体图像和图形编码图像的识别的方案中，对图像进行识别的过程与上述图4和图9所示出的图像识别过程类似，此处不再赘述。

图10是根据一示例性实施例示出的一种图像识别系统的实现架构图。以上述图形编码是二维码为例，该系统中的模块如下：

注1：预分类模块，该模块是可以实现识别当前图像是否为二维码的模块。

注2：二维码解码模块，该模块是通过图像采集组件采集的图像流进行二维码识别并解码的模块，解码成功率高。

注3：单帧二维码解码模块，该模块是通过单帧图像进行二维码识别并解码的模块，解码速度快。

注4：物体识别模块，该模块是通过图像采集组件采集的图像流进行物体识别的模块。

在实际应用中，二维码解码和物品识别如果直接做结合(即将图像流直接输入到注2的二维码解码模块和物体识别模块)，则两个模块都会进行图像处理，会导致终端的性能受到影响，使得二维码识别速度和准确率都会大幅降低。同时，物体识别的定帧判断(即提取第二图像)和图像展示也会受到影响。也就是说，如果单纯的将图像数据传给两个模块进行处理，在当前的终端硬件条件下，二维码识别解码和物体识别的体验都会受影响。

注1所示的预分类模块有一定的误判率，存在未识别出二维码或将其他非二维码物品识别为二维码的几率，因此，如果单纯使用预分类模块进行二选一的处理，虽然可以解决性能问题，但是会引起二维码识别失败或者物品识别失败这两种情况。

注2和注3的两种二维码识别模块的区别如下：注2是图像流识别，其可以根据前后帧信息来做二维码判断和解码，识别率最高，但是识别处理过程通常需要100ms以上的时间，且对处理器的占用率也较高。而注3的单帧二维码识别模块是接受单帧图像，并基于单帧图像进行二维码的识别与解码，识别率低于注2的模块，但是对处理器的占用很小，处理速度也很快。

而图10所示的方案可以将上述注1、注2以及注3所示的模块相结合，来提高二维码和物体识别的准确性和识别速度，上述识别流程如下：

流程1：如图10中所示的物体识别流程，终端打开图像采集组件后，图像流不间断的传递给预分类模块。若预分类判断图像流中的第一图像不是二维码，则该图像流将走物体识别流程(即该流程1)，终端中预设的算法会根据图像采集组件对焦数据，运动传感器反馈终端是否在大幅运动，光照条件是否合适以及拍摄时长是否达到阈值等信息来判断用户是否已经对准感兴趣的物体，如果触发预定提取条件，会将对焦准确的清晰图像(即上述的第二图像)传给云端服务器进行物体识别；或者，终端可以根据用户的触控操作控制图像采集组件自动对焦并选取清晰的图像并传给云端服务器进行物体识别。如果云端服务器识别出该物体，则返回识别结果，整个流程结束。如果云端服务器未能识别出物体，则会通知终端，终端会将图像流传输给二维码识别模块，以从流程1转入下述的流程2；或者，终端也可以将第二图像传递给单帧二维码识别模块进行二维码识别，若成功过识别出第二图像中的二维码，则整个识别流程结束。

流程2：终端打开图像采集组件后，图像流不间断的传递给预分类模块。预分类模块判断图像流中的第一图像是二维码后，进入流程2，即终端从图像流中提取至少一帧图像，并将至少一帧图像输入二维码识别模块，由二维码识别模块识别至少一帧图像中的二维码并进行解码。

对于预分类模块将非二维码错误的识别为二维码的情况，如果不做处理，则终端将始终执行流程2，无法回到初始状态进行修正。如图10所示，本申请实施例可以设定一个流程2的最长执行时间(比如2秒)，如果在2秒钟内还未识别出二维码，则图像流将重新进入预分类模块进行判断。如果2秒内识别出二维码，则整个识别流程结束。

由于预分类模块的引入，使得流程1和流程2互斥，同一时间只会有一个流程在运行，可以解决处理器占用过高问题，同时又在两个流程中都加入了相应的容错机制，以应对预分类模块的两类错误：第一类错误，本来是二维码，但进入了物体识别流程，这种情况下，终端会根据流程1的识别结果确定是否转入流程2，进一步降低这种错误导致的二维码未被识别出的问题。第二类错误，是将物体错误的识别为二维码，这种情况下，终端使用超时时间来重置流程，保证如果不是二维码的物体在二维码识别流程中可以重新回到预分类算法进行判断。

然而，上述流程1和流程2还是会有一个问题，就是在发生上述第一类错误时，二维码图像需要经过图像提取的处理传给云端服务器，再经过云端服务器识别回到终端，终端在进行二维码识别，这个时间通常会比较长。一旦出现这类问题，用户需要耗费较长的时间将图像采集组件对准二维码才能识别。为了解决这种问题，本申请新增了下面的流程3。

流程3：在流程1和流程2运行的同时，终端可以按照一个较短的时间间隔(比如500ms)提取图像流中的当前帧，并将提取出的当前帧传给单帧二维码识别模块，直接进行二维码识别，如果二维码识别有结果，则整个算法结束。这个流程可以保证每500ms有一次识别二维码的机会，提升上述提到的二维码被错误识别为物体时的识别速度。

本申请所示的方案将上述三个流程相结合，从而提升整体的二维码识别成功率，同时保证物体识别能够正常运行，并且有一定的错误修正机制。

图11是根据一示例性实施例示出的一种图像识别装置的结构方框图。该图像识别装置可以用于如图1所示系统所包含的终端120中，以执行图2、图4或者图9所示实施例提供的方法的全部或者部分步骤。该图像识别装置可以包括：

采集模块1101，用于在接收到启动图像识别的操作时，启动图像采集组件采集获取图像流；

第一图像提取模块1102，用于从所述图像流中提取第一图像；

图像类型确定模块1103，用于确定所述第一图像的图像类型，所述图像类型包括物体图像或者编码图像；

识别模块1104，用于按照所述图像类型对应的识别方式对所述图像流中的图像进行识别。

可选的，所述识别模块1104，具体用于，

当所述第一图像的图像类型是物体图像时，从所述图像流中提取第二图像；

向识别服务器发送识别请求，所述识别请求用于请求所述服务器识别所述第二图像中包含的物体；

接收所述服务器返回的第一识别结果。

可选的，所述识别模块1104，还用于，

当所述第一识别结果指示所述服务器对所述第二图像识别失败时，识别所述第二图像中包含的图形编码；

或者，

当所述第一识别结果指示所述服务器对所述第二图像识别失败时，按照对应的采集时间从先到后的顺序，逐帧识别所述图像流中的至少一帧图像中包含的图形编码。

可选的，在从所述图像流中提取第二图像时，所述识别模块1104，具体用于，

展示图像取景界面，所述图像取景界面是用于显示所述图像采集组件实时取景获得的图像的界面；

根据在所述图像采集界面中执行的对焦操作确定所述图像采集组件的对焦参数；

将所述图像采集组件按照所述对焦参数采集到的图像提取为所述第二图像。

可选的，在从所述图像流中提取第二图像时，所述识别模块1105，具体用于，将所述图像流中满足预设提取条件的目标图像获取为所述第二图像。

可选的，所述预设提取条件包括以下条件中的至少一种：

所述目标图像与参考图像之间的差异值低于预设的差异阈值，所述差异值用于指示两帧图像之间的差异大小，所述参考图像是所述图像流中处于所述目标图像的预设相对位置的图像；

所述目标图像对应的采集时刻的环境光亮度高于预设亮度阈值；

所述目标图像对应的采集时刻的终端加速度低于预设的加速度阈值；

所述目标图像对应的采集时刻处于第一时刻之后，且所述采集时刻与所述第一时刻之间相隔的时长大于预设的时长阈值，所述第一时刻是所述第一图像被采集的时刻。

可选的，所述识别模块1104，还用于按照预设的采样时间间隔，从所述图像流中提取第三图像；识别所述第三图像中包含的图形编码。

可选的，所述识别模块1104，具体用于当所述第一图像的图像类型是编码图像时，按照对应的采集时间从先到后的顺序，逐帧识别所述图像流中的至少一帧图像中包含的图形编码。

可选的，所述第一图像提取模块1102，还用于若在识别初始时刻之后的预设长度时间段内未识别出图形编码，则从所述图像流中提取新的第一图像；

所述图像类型确定模块1103，还用于确定所述新的第一图像的图像类型；

所述识别模块，还用于按照所述新的第一图像的图像类型对应的识别方式对所述图像流中的图像进行识别。

可选的，所述图像类型确定模块1103，具体用于，

获取所述第一图像是编码图像的概率；

当所述概率大于预设的概率阈值时，确定所述第一图像是编码图像；

当所述概率不大于所述概率阈值时，确定所述第一图像是物体图像。

可选的，在获取所述第一图像是编码图像的概率时，所述图像类型确定模块1103，具体用于，将所述第一图像输入图像分类模型，获得所述第一图像是编码图像的概率，所述图像分类模型是通过训练样本训练获得的机器学习模型，所述训练样本包含预先标注为编码图像的样本图像。

综上所述，本申请实施例所示的装置，用户只需要通过一个启动图像识别的操作，即可以触发对物体图像和编码图像这两种图像的识别，不需要为这两种图像分别设置入口控件，在切换识别不同类型图像时能够简化用户的操作步骤，从而提高切换识别不同类型图像的效率。

此外，通过本申请实施例所示的装置，在确定出第一图像是物体图像，但是在提取出的第二图像中未能成功识别出物体时，终端可以进一步对该第二图像进行图形编码识别，以识别该第二图像中是否包含图形编码，以及图形编码中包含的编码内容，避免因错误的将第一图像确定为物体图像而导致无法识别出图形编码的问题，提高图像识别的准确性。

另外，通过本申请实施例所示的装置，在确定出第一图像是编码图像，但是在预定时间内未能成功识别出图形编码时，终端可以获取新的第一图像，重新确定图像类型并根据图像类型进行物体图像识别或者编码图像识别，避免因错误的将第一图像确定为编码图像而导致无法识别出图像中的物体的问题，提高图像识别的准确性。

另外，通过本申请实施例所示的装置，在确定出第一图像是物体图像后，在提取第二图像并识别第二图像中包含的物体的过程中，终端还每隔一段时间提取一帧图像来识别图形编码，避免因错误的将第一图像确定为物体图像而导致最终识别出图形编码的时延过长的问题，提高图形编码的识别效率。

图12是根据一示例性实施例示出的终端1200的结构框图。该终端1200可以是用户终端，比如智能手机、平板电脑、电子书阅读器、智能眼镜、智能手表、MP3播放器(MovingPicture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1200还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端1200包括有：处理器1201和存储器1202。

处理器1201可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1201可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1201也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1201可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1201还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1202可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1202还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1202中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器1201所执行以实现本申请中方法实施例提供的图像识别方法。

在一些实施例中，终端1200还可选包括有：外围设备接口1203和至少一个外围设备。处理器1201、存储器1202和外围设备接口1203之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1203相连。具体地，外围设备包括：射频电路1204、触摸显示屏1205、图像采集组件1206、音频电路1207、定位组件1208和电源1209中的至少一种。

外围设备接口1203可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器1201和存储器1202。在一些实施例中，处理器1201、存储器1202和外围设备接口1203被集成在同一芯片或电路板上；在一些其他实施例中，处理器1201、存储器1202和外围设备接口1203中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路1204用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1204通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1204将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1204包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1204可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路1204还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏1205用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1205是触摸显示屏时，显示屏1205还具有采集在显示屏1205的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1201进行处理。此时，显示屏1205还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1205可以为一个，设置终端1200的前面板；在另一些实施例中，显示屏1205可以为至少两个，分别设置在终端1200的不同表面或呈折叠设计；在再一些实施例中，显示屏1205可以是柔性显示屏，设置在终端1200的弯曲表面上或折叠面上。甚至，显示屏1205还可以设置成非矩形的不规则图形，也即异形屏。显示屏1205可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

图像采集组件1206用于采集图像或视频。可选地，图像采集组件1206包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，图像采集组件1206还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1207可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1201进行处理，或者输入至射频电路1204以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端1200的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1201或射频电路1204的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1207还可以包括耳机插孔。

定位组件1208用于定位终端1200的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件1208可以是基于美国的GPS(GlobalPositioning System，全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

电源1209用于为终端1200中的各个组件进行供电。电源1209可以是交流电、直流电、一次性电池或可充电电池。当电源1209包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端1200还包括有一个或多个传感器1210。该一个或多个传感器1210包括但不限于：加速度传感器1211、陀螺仪传感器1212、压力传感器1213、指纹传感器1214、光学传感器1215以及接近传感器1216。

加速度传感器1211可以检测以终端1200建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1211可以用于检测重力加速度在三个坐标轴上的分量。处理器1201可以根据加速度传感器1211采集的重力加速度信号，控制触摸显示屏1205以横向视图或纵向视图进行用户界面的显示。加速度传感器1211还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1212可以检测终端1200的机体方向及转动角度，陀螺仪传感器1212可以与加速度传感器1211协同采集用户对终端1200的3D动作。处理器1201根据陀螺仪传感器1212采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1213可以设置在终端1200的侧边框和/或触摸显示屏1205的下层。当压力传感器1213设置在终端1200的侧边框时，可以检测用户对终端1200的握持信号，由处理器1201根据压力传感器1213采集的握持信号进行左右手识别或快捷操作。当压力传感器1213设置在触摸显示屏1205的下层时，由处理器1201根据用户对触摸显示屏1205的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器1214用于采集用户的指纹，由处理器1201根据指纹传感器1214采集到的指纹识别用户的身份，或者，由指纹传感器1214根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器1201授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1214可以被设置终端1200的正面、背面或侧面。当终端1200上设置有物理按键或厂商Logo时，指纹传感器1214可以与物理按键或厂商Logo集成在一起。

光学传感器1215用于采集环境光强度。在一个实施例中，处理器1201可以根据光学传感器1215采集的环境光强度，控制触摸显示屏1205的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏1205的显示亮度；当环境光强度较低时，调低触摸显示屏1205的显示亮度。在另一个实施例中，处理器1201还可以根据光学传感器1215采集的环境光强度，动态调整图像采集组件1206的拍摄参数。

接近传感器1216，也称距离传感器，通常设置在终端1200的前面板。接近传感器1216用于采集用户与终端1200的正面之间的距离。在一个实施例中，当接近传感器1216检测到用户与终端1200的正面之间的距离逐渐变小时，由处理器1201控制触摸显示屏1205从亮屏状态切换为息屏状态；当接近传感器1216检测到用户与终端1200的正面之间的距离逐渐变大时，由处理器1201控制触摸显示屏1205从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图12中示出的结构并不构成对终端1200的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括计算机程序(指令)的存储器，上述程序(指令)可由服务器的处理器执行以完成本申请各个实施例所示的图像识别方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由下面的权利要求指出。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims

1.一种图像识别方法，其特征在于，所述方法包括：

从所述图像流中提取第一图像；

2.根据权利要求1所述的方法，其特征在于，所述按照所述图像类型对应的识别方式对所述图像流中的图像进行识别，包括：

接收所述服务器返回的第一识别结果。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

或者，

4.根据权利要求2所述的方法，其特征在于，所述当所述第一图像的图像类型是物体图像时，从所述图像流中提取第二图像，包括：

5.根据权利要求2所述的方法，其特征在于，所述当所述第一图像的图像类型是物体图像时，从所述图像流中提取第二图像，包括：

将所述图像流中满足预设提取条件的目标图像获取为所述第二图像。

6.根据权利要求5所述的方法，其特征在于，所述预设提取条件包括以下条件中的至少一种：

7.根据权利要求2所述的方法，其特征在于，所述方法还包括：

按照预设的采样时间间隔，从所述图像流中提取第三图像；

识别所述第三图像中包含的图形编码。

8.根据权利要求2所述的方法，其特征在于，所述按照所述图像类型对应的识别方式对所述图像流中的图像进行识别，包括：

当所述第一图像的图像类型是编码图像时，按照对应的采集时间从先到后的顺序，逐帧识别所述图像流中的至少一帧图像中包含的图形编码。

9.根据权利要求8所述的方法，其特征在于，所述方法还包括：

若在识别初始时刻之后的预设长度时间段内未识别出图形编码，则从所述图像流中提取新的第一图像；

确定所述新的第一图像的图像类型；

按照所述新的第一图像的图像类型对应的识别方式对所述图像流中的图像进行识别。

10.根据权利要求1至9任一所述的方法，其特征在于，所述确定所述第一图像的图像类型，包括：

获取所述第一图像是编码图像的概率；

11.根据权利要求10所述的方法，其特征在于，所述获取所述第一图像是编码图像的概率，包括：

将所述第一图像输入图像分类模型，获得所述第一图像是编码图像的概率，所述图像分类模型是通过训练样本训练获得的机器学习模型，所述训练样本包含预先标注为编码图像的样本图像。

12.一种图像识别方法，其特征在于，所述方法包括：

展示一识别入口控件；

13.一种图像识别装置，其特征在于，所述装置包括：

第一图像提取模块，用于从所述图像流中提取第一图像；

14.一种计算机设备，其特征在于，所述计算机设备包含处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至11任一所述的图像识别方法。

15.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至11任一所述的图像识别方法。