CN103425993B

CN103425993B - 图像识别方法和系统

Info

Publication number: CN103425993B
Application number: CN201210160305.XA
Authority: CN
Inventors: 查文; 刘海龙; 侯杰; 刘骁; 栾昊; 姜炳楠; 陈波
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd; Tencent Cloud Computing Beijing Co Ltd
Priority date: 2012-05-22
Filing date: 2012-05-22
Publication date: 2016-09-28
Anticipated expiration: 2032-05-22
Also published as: CN103425993A

Abstract

一种图像识别方法，包括以下步骤：获取待识别图像；采用多个分类器对所述待识别图像进行特征提取，得到对应不同图像类别的图像特征数据；根据所述图像类别从对应的数据库中提取与对应的图像特征数据匹配的摘要信息。所述图像识别方法能够从不同的图像类别对同一图像进行识别，得到多个图像类别的识别结果，因此提高了图像识别的灵活性。此外，还提供了一种图像识别系统。

Description

图像识别方法和系统

技术领域

本发明涉及图像识别技术领域，特别是涉及一种图像识别方法和系统。

背景技术

传统的图像识别方法，通常仅针对某一个特定领域的内容进行识别。例如，要么仅针对人脸进行识别，要么仅针对文字或条码进行识别等。传统的图像识别方法中，也有对一幅图像中的不同区域进行识别，得到不同领域的识别结果。例如可以识别出一幅图像中的物体、人脸、文字等特征，针对不同的领域进行特征匹配，然后在一幅图像中的不同区域显示对应的识别结果。

然而，传统的这些图片识别方法中，若仅针对某一个特定领域的内容进行识别，则要求用户清楚所要识别的图像是哪个领域的，而往往在图像识别之前用户并不了解图像的信息。而传统的对一幅图像中的不同区域进行识别的方法中，对于某一区域的图像，往往也只能给出单一的识别结果，例如，对于一张刘德华的照片，用户可能希望了解他的微博信息，也可能希望了解他的电影等，因此传统的这些图片识别方法，其灵活性并不高。

发明内容

基于此，有必要针对上述灵活性不高的问题，提供一种能提高图像识别的灵活性的图片识别方法。

一种图像识别方法，包括以下步骤：获取待识别图像；采用多个分类器对所述待识别图像进行特征提取，得到对应不同图像类别的图像特征数据；根据所述图像类别从对应的数据库中提取与对应的图像特征数据匹配的摘要信息。

在其中一个实施例中，在根据所述图像类别从对应的数据库中提取与对应的图像特征数据匹配的摘要信息的步骤之后，还包括：

根据所述图像类别获取预设的与所述图像类别对应的第三方服务提供端；

从所述第三方服务提供端中查找与所述摘要信息匹配的服务信息。

在其中一个实施例中，在从所述服务提供端中查找与所述摘要信息匹配的服务信息的步骤之后，还包括：

从所述服务信息中提取服务类别信息；

将所述摘要信息和服务类别信息对应进行展现。

在其中一个实施例中，所述服务类别信息包含对应的服务提供页面的链接；所述方法还包括：

获取所述服务类别信息的点击指令；

根据所述服务提供页面的链接跳转至与所述服务类别信息对应的服务提供页面。

将所述摘要信息和服务信息对应进行展现。

此外，还有必要提供一种能提高图片识别的灵活性的图片识别系统。

一种图像识别系统，包括服务器端，所述服务器端包括：

图像分类识别模块，包含多个分类器，用于获取待识别图像，对所述待识别图像进行特征提取，得到对应不同图像类别的图像特征数据；

结果提取模块，用于根据所述图像类别从对应的数据库中提取与对应的图像特征数据匹配的摘要信息。

在其中一个实施例中，所述服务器端还包括：

服务提供模块，用于根据所述图像类别获取预设的与所述图像类别对应的第三方服务提供端，从所述第三方服务提供端中查找与所述摘要信息匹配的服务信息。

在其中一个实施例中，所述服务提供模块还用于从所述服务信息中提取服务类别信息；所述系统还包括客户端，所述客户端包括用于将所述摘要信息和服务类别信息对应进行展现的结果展现模块。

在其中一个实施例中，所述服务类别信息包含对应的服务提供页面的链接；所述客户端还包括：

页面跳转模块，用于获取所述服务类别信息的点击指令，根据所述服务提供页面的链接跳转至与所述服务类别信息对应的服务提供页面。

在其中一个实施例中，所述结果展现模块还用于将所述摘要信息和服务信息对应进行展现。

上述图像识别方法和系统中，采用多个分类器对待识别图像进行特征提取，得到对应不同图像类别的图像特征数据，还可从不同图像类别的数据库中提取对应的摘要信息，由于可以采用多个分类器针对不同的图像类别进行图像识别，同一图像（或同一区域）可得到不同图像类别的识别结果，相对于传统的图像识别方法，其灵活性更高。

附图说明

图1为一个实施例中图像识别方法的流程示意图；

图2为另一个实施例中图像识别方法的流程示意图；

图3为一个实施例中结果展现的界面示意图；

图4为一个实施例中图像识别系统的结构示意图；

图5为另一个实施例中图像识别系统的结构示意图；

图6为一个实施例中图像识别系统的应用场景示意图。

具体实施方式

如图1所示，在一个实施例中，一种图像识别方法，包括以下步骤：

步骤S10，获取待识别图像。

具体的，可通过客户端将本地已存储的图像通过网络上传至服务器端，由服务器端获取待识别图像并进行图像识别。也可通过终端设备上的图像采集模块（如摄像头）进行实时拍照，并将拍照得到的图像通过网络上传至服务器端，由服务器端获取待识别图像并进行图像识别。

步骤S20，采用多个分类器对待识别图像进行特征提取，得到对应不同图像类别的图像特征数据。

在一个实施例中，在服务器端设有多个对应不同图像类别的分类器，不同的分类器针对不同的图像类别对待识别图像进行特征提取。对于同一图像，所得到的图像特征数据包含很多种类，进一步的，还可对不同图像类别的图像特征数据进行打分，将分数超过预设阈值的结果作为最终的图像特征数据。

进一步的，不同的图像类别包含图书类别、光盘类别、LOGO类别、海报类别、广告类别、人物类别、服装类别等等。对应不同图像类别的图像特征数据则包含图书特征数据、光碟特征数据、LOGO特征数据、海报特征数据、广告特征数据、人物特征数据、服装特征数据等等。例如，待识别图像为一本封面为乔布斯的图书，则采用不同图像类别对应的分类器对该待识别图像进行特征提取后，得到最终的图像特征数据则包含有关乔布斯的图书特征数据和人物特征数据。

步骤S30，根据图像类别从对应的数据库中提取与对应的图像特征数据匹配的摘要信息。

具体的，在服务器端设有对应不同图像类别的数据库，包括图书数据库、光碟数据库、LOGO数据库、海报数据库、广告数据库、人物数据库、服装数据库等等。在数据库中存储了对应不同图像类别的图像信息。如上例中，可从图书数据库中提取与对应的图书特征数据匹配的摘要信息，还可从人物数据库中提取与对应的人物特征数据匹配的摘要信息。如，摘要信息为“《乔布斯传》，作者XXX，定价X元等”。

上述图像识别方法中，由于可以从不同图像类别对同一图像进行识别，能够提高图像识别的灵活性。此外，由于分类器和数据库都可设于服务器端，在服务器端进行扩展和更新，可以通过挂接更多的分类器来识别更多种类的图像，通过这种开放式的设计可以灵活扩展更多图像类别，进一步提高了灵活性。

在另一个实施例中，如图2所示，在步骤S30之后，还可包括：

步骤S40，根据图像类别获取预设的与图像类别对应的第三方服务提供端。

第三方服务提供端为独立于上述设置分类器的服务器端的服务提供商所在的服务器端。不同的第三方服务提供端可以提供不同的应用。进一步的，第三方服务提供端所提供的服务信息包含官方网站、价格比较、搜索结果、百科全书、微博信息等。

本实施例中，预先设定了图像类别和第三方服务提供端的对应关系，即不同的图像类别对应了一个或多个不同的第三方服务提供端。例如，图书类别对应提供比价、购买、书评等服务的第三方服务提供端；人物类别对应提供微博、电影、百科等服务的第三方服务提供端；LOGO类别对应提供优惠卷、地图等服务的第三方服务提供端；海报类别对应提供电影、影评、购买等服务的第三方服务提供端。

在步骤S40中可根据图像类别获取预设的与图像类别对应的第三方服务提供端的标识，可以是预设的第三方服务提供端的标识号或第三方服务提供端的网络地址等，根据该标识即可确定对应的第三方服务提供端。

步骤S50，从第三方服务提供端中查找与摘要信息匹配的服务信息。

具体的，在得到对应多个图像类别的摘要信息后，根据图像类别可确定对应的第三方服务提供端，从所确定的第三方服务提供端中即可查找到与摘要信息匹配的服务信息。

例如，待识别图像为一本封面为乔布斯的图书，提取了图书类别的摘要信息和人物类别的摘要信息后，根据图书类别可从提供比价、购买、书评等服务的第三方服务提供端中查找与图书类别的摘要信息匹配的服务信息，如图书购买网站、书评网站等。根据人物类别可从用来提供微博、电影、百科等服务的第三方服务提供端中查找与人物类别的摘要信息匹配的服务信息，如有关乔布斯的微博信息等。

由于第三方服务提供端是独立于图像识别服务器端的另一服务器端，因此服务信息可不由图像识别服务器端提供，而是通过第三方提供服务端提供的接口，图像识别服务器端即可查找到服务信息。当需要扩展更多的服务种类时，仅需要更多的第三方提供服务端提供对应的接口即可，因此本实施例所提供的第三方提供服务端是开放式的，可以十分方便的扩展更多的服务种类，灵活性很高。

步骤S60，从服务信息中提取服务类别信息。

具体的，服务类别信息包含各种服务类别，如官网、比价、搜索、百科、微博、购物、书评、影评等。在查找得到服务信息后，可从服务信息中提取相应的服务类别信息。

步骤S70，将摘要信息和服务类别信息对应进行展现。

在一个实施例中，可对应不同图像类别的摘要信息直接展现在待识别图像上，并将与摘要信息匹配的服务类别信息对应展现在待识别图像的同一区域中。在另一个实施例中，还可仅将对应不同图像类别的摘要信息直接展现在待识别图像上，当摘要信息被选中时，再将摘要信息及与摘要信息匹配的服务类别信息通过对话框的形式进行展现。

如图3所示，在待识别图像上展现对应不同图像类别的摘要信息包含“《浪潮之巅》作者：吴军”等信息，在选中该摘要信息后，则弹出对话框，将该摘要信息及对应的服务类别信息进行展现。将摘要信息及对应的服务类别信息进行展现的方式可以有效节省显示界面，特别适用于一些显示界面较小的手持终端设备（如手机、平板电脑等）。

在一个实施例中，服务类别信息还可包含对应的服务提供页面的链接。上述图像识别方法还可包括：获取服务类别信息的点击指令，根据服务提供页面的链接跳转至与服务类别信息对应的服务提供页面。

如图3所示，服务类别信息包含购物、比价、书评、搜索，其中包含了对应的服务提供页面的链接，当用户点击服务类别信息，则跳转至对应的服务提供页面，如点击去购物，则跳转至图书购买网站，如点击去搜索，则跳转至搜索网站提供的搜索页面。

在另一个实施例中，在查找到与摘要信息匹配的服务信息后，也可将摘要信息和服务信息对应进行展现。具体的，可在待识别图像上直接展现对应不同图像类别的摘要信息，当某一个图像类别的摘要信息被选中时，则在弹出的对话框中展现该摘要信息及其对应的服务信息。

如图4所示，在一个实施例中，一种图像识别系统，包括服务器端100，该服务器端100包括图像分类识别模块110和结果提取模块120，其中：

图像分类识别模块110包含多个分类器111，用于获取待识别图像，对待识别图像进行特征提取，得到对应不同图像类别的图像特征数据。

不同的图像类别对应了不同的分类器111，不同的分类器11针对不同的图像类别对待识别图像进行特征提取。对于同一图像，所得到的图像特征数据包含很多种类，进一步的，分类器111还可对不同图像类别的图像特征数据进行打分，将分数超过预设阈值的结果作为最终的图像特征数据。

进一步的，不同的图像类别包含图书类别、光盘类别、LOGO类别、海报类别、广告类别、人物类别、服装类别等等。对应不同图像类别的图像特征数据则包含图书特征数据、光碟特征数据、LOGO特征数据、海报特征数据、广告特征数据、人物特征数据、服装特征数据等等。

结果提取模块120用于根据图像类别从对应的数据库中提取与对应的图像特征数据匹配的摘要信息。

具体的，在服务器端100设有对应不同图像类别的数据库，包括图书数据库、光碟数据库、LOGO数据库、海报数据库、广告数据库、人物数据库、服装数据库等等。在数据库中存储了对应不同图像类别的图像信息。

在一个实施例中，分类器111在服务器端100可进行扩展和更新，可以通过挂接更多对应图像类别的分类器111来识别更多种类的图像，通过这种开放式的设计可以灵活扩展更多图像类别，进一步提高了灵活性。

在另一个实施例中，如图5所示，服务器端100还包括服务提供模块130，其中，服务提供模块130用于根据图像类别获取预设的与图像类别对应的第三方服务提供端300，从第三方服务提供端300中查找与摘要信息匹配的服务信息。

第三方服务提供端300为独立于上述设置分类器的服务器端100的服务提供商所在的服务器端。不同的第三方服务提供端300可以提供不同的应用。进一步的，第三方服务提供端300所提供的服务信息包含官方网站、价格比较、搜索结果、百科全书、微博信息等。

本实施例中，预先设定了图像类别和第三方服务提供端300的对应关系，即不同的图像类别对应了一个或多个不同的第三方服务提供端300。例如，图书类别对应提供比价、购买、书评等服务的第三方服务提供端；人物类别对应提供微博、电影、百科等服务的第三方服务提供端；LOGO类别对应提供优惠卷、地图等服务的第三方服务提供端；海报类别对应提供电影、影评、购买等服务的第三方服务提供端。

服务提供模块130可用于根据图像类别获取预设的与图像类别对应的第三方服务提供端的标识，可以是预设的第三方服务提供端的标识号或第三方服务提供端的网络地址等，根据该标识即可确定对应的第三方服务提供端300。

进一步的，服务提供模块130在得到对应多个图像类别的摘要信息后，根据图像类别可确定对应的第三方服务提供端300，从所确定的第三方服务提供端300中即可查找到与摘要信息匹配的服务信息。

由于第三方服务提供端300是独立于图像识别服务器端100的另一服务器端，因此服务信息可不由图像识别服务器端100提供，而是通过第三方提供服务端300提供的接口，图像识别服务器端100即可查找到服务信息。当需要扩展更多的服务种类时，仅需要更多的第三方提供服务端300提供对应的接口即可，因此本实施例所提供的第三方提供服务端300是开放式的，可以十分方便的扩展更多的服务种类，灵活性很高。

在一个实施例中，服务提供模块130还可用于从服务信息中提取服务类别信息。具体的，服务类别信息包含各种服务类别，如官网、比价、搜索、百科、微博、购物、书评、影评等。服务提供模块130在查找得到服务信息后，可从服务信息中提取相应的服务类别信息。

本实施例中，如图6所示，图像识别系统还可包括客户端200，客户端200包括用于将摘要信息和服务类别信息对应进行展现的结果展现模块210。

在一个实施例中，结果展现模块210可对应不同图像类别的摘要信息直接展现在待识别图像上，并将与摘要信息匹配的服务类别信息展现在待识别图像的同一区域中。在另一个实施例中，结果展现模块210还可仅将对应不同图像类别的摘要信息直接展现在待识别图像上，当摘要信息被选中时，再将摘要信息及与摘要信息匹配的服务类别信息通过对话框的形式进行展现。

在一个实施例中，服务类别信息还可包含对应的服务提供页面的链接。本实施例中，客户端200还可包括页面跳转模块220，用于获取服务类别信息的点击指令，根据服务提供页面的链接跳转至与服务类别信息对应的服务提供页面。

在另一个实施例中，结果展现模块210还可将摘要信息和服务信息对应进行展现。具体的，结果展现模块210可在待识别图像上直接展现对应不同图像类别的摘要信息，当某一个图像类别的摘要信息被选中时，则在弹出的对话框中展现该摘要信息及其对应的服务信息。

上述图像识别方法和系统的一个应用场景如图6所示，该应用场景中，客户端200还可包括图像输入模块230，用于获取待识别图像，并将待识别图像通过网络上传到服务器端100。图像输入模块230获取的待识别图像也可以客户端200本地已存储的图像或者通过客户端200的图像采集模块（如摄像头）实时进行拍照得到的图像。

该应用场景下，图像识别系统包含服务器端100和客户端200，服务端100接收图像输入模块230上传的待识别图像，通过对应不同图像类别的多个分类器111进行特征提取，得到对应不同图像类别的图像特征数据，然后对得到的这些图像类别的图像特征数据，从对应图像类别的数据库中提取与其匹配的摘要信息，所提取的摘要信息可返回至客户端200，通过客户端200的结果展现模块210进行展现。可以对服务器端100中的分类器111进行扩展，挂接更多的分类器111或对原有的分类器111进行更新，以提供更多类别的图像识别，使用起来灵活方便。

该应用场景下，服务器端100可通过服务提供模块130从第三方服务提供端300查找与摘要信息匹配的服务信息，并将查找到的服务信息或从中提取的服务类别信息返回至客户端200，由结果展现模块210将服务信息或服务类别信息和摘要信息对应展现。第三方服务提供端300可仅提供接口给服务器端100，因此，服务器端100可通过增加更多的接口来对所提供的服务类别进行扩展，以提供更多类别的服务信息，有效提高了图像识别的灵活性。

上述图像识别方法和系统，对同一图像除了可提供不同图像类别的识别结果外，还可进一步提供更多的网络应用（服务），引导用户了解与图像相关的服务，使用更灵活多样，充分满足了用户的体验需求。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种图像识别方法，包括以下步骤：

获取待识别图像；

采用多个分类器对所述待识别图像进行特征提取，得到对应不同图像类别的图像特征数据；

根据所述图像类别从对应的数据库中提取与对应的图像特征数据匹配的摘要信息；

从所述第三方服务提供端中查找与所述摘要信息匹配的服务信息，其中，所述第三方服务提供端是独立于设置分类器的服务器端的服务提供商所在的服务器端，不同的第三方服务提供端提供不同的应用。

2.根据权利要求1所述的图像识别方法，其特征在于，在从所述服务提供端中查找与所述摘要信息匹配的服务信息的步骤之后，还包括：

从所述服务信息中提取服务类别信息；

将所述摘要信息和服务类别信息对应进行展现。

3.根据权利要求2所述的图像识别方法，其特征在于，所述服务类别信息包含对应的服务提供页面的链接；所述方法还包括：

获取所述服务类别信息的点击指令；

4.根据权利要求1所述的图像识别方法，其特征在于，在从所述服务提供端中查找与所述摘要信息匹配的服务信息的步骤之后，还包括：

将所述摘要信息和服务信息对应进行展现。

5.一种图像识别系统，其特征在于，包括服务器端，所述服务器端包括：

结果提取模块，用于根据所述图像类别从对应的数据库中提取与对应的图像特征数据匹配的摘要信息；

服务提供模块，用于根据所述图像类别获取预设的与所述图像类别对应的第三方服务提供端，从所述第三方服务提供端中查找与所述摘要信息匹配的服务信息，其中，所述第三方服务提供端是独立于设置分类器的服务器端的服务提供商所在的服务器端，不同的第三方服务提供端提供不同的应用。

6.根据权利要求5所述的图像识别系统，其特征在于，所述服务提供模块还用于从所述服务信息中提取服务类别信息；所述系统还包括客户端，所述客户端包括用于将所述摘要信息和服务类别信息对应进行展现的结果展现模块。

7.根据权利要求6所述的图像识别系统，其特征在于，所述服务类别信息包含对应的服务提供页面的链接；所述客户端还包括：

8.根据权利要求6所述的图像识别系统，其特征在于，所述结果展现模块还用于将所述摘要信息和服务信息对应进行展现。