CN110909776A - 一种图像识别方法及电子设备 - Google Patents

一种图像识别方法及电子设备 Download PDF

Info

Publication number
CN110909776A
CN110909776A CN201911093906.1A CN201911093906A CN110909776A CN 110909776 A CN110909776 A CN 110909776A CN 201911093906 A CN201911093906 A CN 201911093906A CN 110909776 A CN110909776 A CN 110909776A
Authority
CN
China
Prior art keywords
target object
target
symbol
marking
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911093906.1A
Other languages
English (en)
Inventor
陈涵秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN201911093906.1A priority Critical patent/CN110909776A/zh
Publication of CN110909776A publication Critical patent/CN110909776A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Abstract

本发明提供了一种图像识别方法及电子设备,其中,该方法包括:在图像识别拍摄界面,对所显示的每个目标对象采用标记符号进行标记;接收用户对目标标记符号的第一输入;响应于第一输入,在与目标标记符号对应的第一目标对象的预设位置显示第一目标对象的识别结果。本发明实施例通过在图像识别拍摄界面中引入标记符号,对所显示的目标对象采用标记符号进行标记,并根据用户对标记符号的输入显示相应目标对象的识别结果,可以提高图像识别的准确性,同时实现识图的交互性。

Description

一种图像识别方法及电子设备
技术领域
本发明涉及通信技术领域,尤其涉及一种图像识别方法及电子设备。
背景技术
随着人工智能图像识别技术的发展,电子设备通过搭载人工智能识图功能,可实现对用户拍摄的图片进行快速、准确的解析并返回文字描述、搜索等功能。目前各大电子设备厂商的图像智能识别已经涵盖了条码、翻译、风景等功能,且已能够跳过拍摄步骤直接在扫描界面返回识别结果。
但目前应用中的识图功能,存在识别缺乏交互性,用户无法快速地指定场景中某一样物体进行识别的问题。
发明内容
本发明实施例提供一种图像识别方法及电子设备,以解决现有技术中识图缺乏交互性、无法快速地对指定物体进行识别的问题。
为了解决上述问题,本发明实施例是这样实现的:
第一方面,本发明实施例提供一种图像识别方法,应用于电子设备,该方法包括:
在图像识别拍摄界面,对所显示的每个目标对象采用标记符号进行标记;
接收用户对目标标记符号的第一输入;
响应于第一输入,在与目标标记符号对应的第一目标对象的预设位置显示第一目标对象的识别结果。
第二方面,本发明实施例提供一种电子设备,包括:
标记模块,用于在图像识别拍摄界面,对所显示的每个目标对象采用标记符号进行标记;
第一接收模块,用于接收用户对目标标记符号的第一输入;
第一显示模块,用于响应于第一输入,在与目标标记符号对应的第一目标对象的预设位置显示第一目标对象的识别结果。
第三方面,本发明实施例还提供一种电子设备,包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被处理器执行时实现上述的图像识别方法的步骤。
第四方面,本发明实施例提供一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现上述的图像识别方法的步骤。
本发明技术方案,通过在图像识别拍摄界面对所显示的每个目标对象采用标记符号进行标记,根据用户对目标标记符号的第一输入,在与目标标记符号对应的第一目标对象的预设位置显示第一目标对象的识别结果,可以在引入标记符号的基础上,提高图像识别的准确性,且通过对目标标记符号进行控制,可以实现图像识别的交互性。
附图说明
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1表示本发明实施例图像识别方法示意图;
图2表示本发明实施例显示目标对象的识别结果的方法示意图;
图3表示本发明实施例显示目标对象的关联内容的方法示意图;
图4表示本发明实施例移动标记符号进行目标对象识别的方法示意图;
图5表示本发明实施例图像识别的整体实施流程示意图;
图6表示本发明实施例电子设备示意图;
图7表示本发明实施例电子设备硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种图像识别方法,应用于电子设备,如图1所示,该方法包括:
步骤101、在图像识别拍摄界面,对所显示的每个目标对象采用标记符号进行标记。
电子设备在开启图像识别拍摄界面的情况下,开始对当前界面进行物体检测,并在检测之后,采用标记符号对所检测到的每个目标对象进行标记,其中,所显示的目标对象的数量至少为一个,相应的标记符号的数量也至少为一个。通过对每个目标对象进行标记,可以便于目标对象之间的区分。
步骤102、接收用户对目标标记符号的第一输入。
在对所显示的每个目标对象采用标记符号进行标记之后,可以接收用户对目标标记符号所执行的第一输入,这里的第一输入包括但不限于触控操作或者滑动操作,其中触控操作可以为点击操作、长按操作等。且目标标记符号为至少一个标记符号,可以理解为接收用户的第一输入的标记符号为目标标记符号。
步骤103、响应于第一输入,在与目标标记符号对应的第一目标对象的预设位置显示第一目标对象的识别结果。
在接收用户对目标标记符号的第一输入之后,可以响应于第一输入,在目标标记符号对应的第一目标对象的预设位置,对第一目标对象的识别结果进行显示。
其中,在目标标记符号为一个标记符号时,可以根据第一输入显示一个第一目标对象的识别结果。若目标标记符号为两个或者多个标记符号时,可以根据对两个或者多个标记符号的第一输入,显示两个或者多个第一目标对象的识别结果,进而可以实现多个目标对象的识别。
针对于用户而言,用户可以同时对两个或者两个以上的标记符号执行第一输入,也可以对两个或者两个以上的标记符号依次执行第一输入,根据用户所执行的第一输入,可以显示两个或者两个以上的识别结果。
本发明技术方案,通过在图像识别拍摄界面中引入标记符号,在所显示的多个目标对象的对应位置,采用标记符号进行标记,可以提高图像识别的准确性,且通过对至少一个标记符号进行控制,可以使得拍摄界面内的多个目标对象被识别,同时还可实现识图的交互性。
在本发明一实施例中,标记符号为根据增强现实技术所生成的增强现实标记符号。
在用户开启AR(Augmented Reality,增强现实)图像识别拍摄界面的情况下,可以针对每个目标对象,采用增强现实标记符号进行标记。这里的增强现实标记符号为采用增强现实技术生成,增强现实技术是一种将虚拟信息模拟仿真后,应用到真实世界中的技术。通过采用增强现实标记符号,可以在三维场景下进行标记,增强用户的使用体验。
其中,在可穿戴设备中,还可以采用VR(Virtual Reality,虚拟现实)标记符号来代替增强现实标记符号,以提高可穿戴设备用户的体验。
在本发明一实施例中,对所显示的每个目标对象采用标记符号进行标记的步骤,包括:
获取每个目标对象在显示屏幕内所对应的区域顶点坐标;根据区域顶点坐标,计算目标对象的标记坐标;在标记坐标所对应的位置,采用标记符号标记目标对象。
在针对每个目标对象采用标记符号进行标记时,需要针对当前显示屏幕建立一坐标系,然后获取每个目标对象在显示屏幕内所对应的区域顶点坐标,根据区域顶点坐标确定横坐标最大值、最小值和纵坐标最大值、最小值(x_min,x_max,y_min,y_max)。然后根据横坐标最大值、最小值和纵坐标最大值、最小值,计算每个目标对象的标记坐标。在计算标记坐标时,可以根据横坐标最大值与最小值的平均值、纵坐标最大值与最小值的平均值((x_min+x_max)/2,(y_min+y_max)/2)确定标记坐标。在计算出标记坐标之后,确定标记坐标所对应的位置,并在标记坐标所对应的位置,采用标记符号标记目标对象。
通过根据目标对象的区域顶点坐标确定标记坐标,进而在标记坐标对应的位置采用标记符号标记目标对象,可以保证每个标记符号在对应的目标对象处进行显示,避免出现标记符号无规律显示的情况。
在本发明一实施例中,对所显示的每个目标对象采用标记符号进行标记的步骤,包括:
获取图像识别拍摄界面内目标对象的数目;根据目标对象的数目确定第一标记类别,其中,每个目标对象对应于一个第一标记类别;根据第一标记类别确定标记符号;根据标记符号对目标对象进行标记。
在针对每个目标对象采用标记符号进行标记时,可以首先统计图像识别拍摄界面内所包含的目标对象的数目,由于每个目标对象对应于一个第一标记类别,因此在确定目标对象的数目之后,可以根据所统计的数目确定数目相同的第一标记类别,然后根据第一标记类别确定标记符号,即每个第一标记类别对应于一个标记符号,然后采用所确定的标记符号对目标对象进行标记。
其中,针对第一标记类别而言,可以是每个第一标记类别对应于一种颜色,也可以是每个第一标记类别对应于一种形状,当然还可以是其他情况这里不再一一阐述。
下面以每个第一标记类别对应于一种颜色为例进行说明,图像识别拍摄界面内显示有4个目标对象,针对每个目标对象可对应于一个第一标记类别,针对每个第一标记类别可分配一种对应的颜色。如目标对象1对应的第一标记类别为红色,目标对象2对应的第一标记类别为蓝色,目标对象3对应的第一标记类别为黄色,目标对象4对应的第一标记类别为紫色,则采用红色的标记符号对目标对象1进行标记,采用蓝色的标记符号对目标对象2进行标记,采用黄色的标记符号对目标对象3进行标记,采用紫色的标记符号对目标对象4进行标记。通过设置每个第一标记类别对应于一种颜色,可以使得各标记符号对应显示不同的颜色,便于标记符号的区分。
通过根据目标对象的数目确定第一标记类别,根据第一标记类别确定标记符号,采用所确定的标记符号对目标对象进行标记,可以保证各标记符号分别对应于不同的第一标记类别,便于标记符号的区分,提高图像识别的准确性。
在本发明另一实施例中,对所显示的每个目标对象采用标记符号进行标记的步骤,包括:
接收用户对图像识别拍摄界面内的分类按键的第二输入;响应于第二输入,确定图像识别拍摄界面所对应的第一分类模式;获取第一分类模式所对应的第一映射列表;根据第一映射列表确定每个目标对象分别对应的类别信息;根据类别信息确定第二标记类别,其中,相同类别信息的目标对象对应于一个第二标记类别;根据第二标记类别确定标记符号;根据标记符号对目标对象进行标记。
在图像识别拍摄界面内显示有一活动条,活动条内包括分类按键以及其他类型的按键,在针对每个目标对象采用标记符号进行标记时,可以接收用户对分类按键的第二输入,响应于用户所执行的第二输入,根据图像识别拍摄界面内所显示的内容确定当前图像识别拍摄界面所对应的第一分类模式。
在确定第一分类模式之后,调用后台所存储的与第一分类模式所对应的第一映射列表,其中第一映射列表包括物体与类别信息的对应关系。在调用第一映射列表之后,可以针对各目标对象分别确定所对应的类别信息。
在确定类别信息之后,可以针对每一个类别信息确定一个第二标记类别,其中相同类别信息的目标对象对应于一个第二标记类别,根据第二标记类别确定标记符号,即每个第二标记类别对应于一个标记符号,相同类别信息的目标对象对应的标记符号相同。在对每个目标对象进行标记时,可以针对属于相同类别信息的目标对象采用相同的标记符号进行标记。
其中,针对第二标记类别而言,可以是每个第二标记类别对应于一种颜色,也可以是每个第二标记类别对应于一种形状,当然还可以是其他情况这里不再一一阐述。
下面以每个第二标记类别对应于一种形状、且分类模式为垃圾分类为例进行说明,加载垃圾分类模式所对应的垃圾映射列表,根据垃圾映射列表获取图像识别拍摄界面内4个目标对象分别所归属的类别信息。其中目标对象1和目标对象2属于可回收垃圾,目标对象3属于厨余垃圾,目标对象4属于有害垃圾。则根据3个类别信息确定3个第二标记类别,如与可回收垃圾对应的第二标记类别A对应于正方形,与厨余垃圾对应的第二标记类别B对应于长方形,与有害垃圾对应的第二标记类别C对应于三角形,然后确定正方形的标记符号、长方形的标记符号以及三角形的标记符号,采用正方形的标记符号对目标对象1和目标对象2进行标记,采用长方形的标记符号对目标对象3进行标记,采用三角形的标记符号对目标对象4进行标记。
通过将同一类别的目标对象采用相同颜色或形状的标记符号进行标记,可以保证同分类的目标对象的标记符号具有相同的颜色或形状,进而可实现对拍摄界面内的多个目标对象进行分类,并以直观的方式对用户进行展示,以解决现有的智能识图技术中在有分类需求时,由于缺乏标示和交互,分类结果无法被直观地显示出来的问题。
在本发明一实施例中,在与目标标记符号对应的第一目标对象的预设位置显示第一目标对象的识别结果的步骤,如图2所示,包括:
步骤201、在以目标标记符号为中心的第一预设区域内进行背景扫描。
在接收用户对目标标记符号所执行的第一输入之后,可以响应于第一输入,确定目标标记符号的坐标,然后以目标标记符号的坐标为中心划定第一预设区域,并在第一预设区域内进行背景扫描。
步骤202、确定与目标标记符号对应的第一目标对象的颜色相区别的第一位置。
在第一预设区域进行背景扫描之后,确定与第一目标对象颜色相区别的第一位置,这里的第一位置优选背景颜色较淡的位置。如在以目标标记符号为中心的5cm*5cm方形区域扫描背景较淡区域,确定第一位置。在确定第一位置之后执行步骤203。
步骤203、在第一位置通过第一文字内容显示第一目标对象的识别结果。
在确定第一位置之后,在第一位置通过第一文字内容显示第一目标对象的识别结果,其中各标记符号可对应于不同的颜色,第一文字内容的颜色与当前的目标标记符号的颜色相同。通过将标记符号与对应的目标对象的识别结果设定为相同的颜色,可以保证标记符号与识别结果的对应关系,便于用户查看,避免出现标记符号与识别结果不对应的情况。
其中针对目标标记符号为两个或者多个标记符号的情况,需要针对每个标记符号均划定第一预设区域并执行扫描,根据扫描结果确定第一位置,在第一位置处显示对应的第一目标对象的识别结果。
其中,在第一位置通过第一文字内容显示第一目标对象的识别结果后,如图3所示,该方法还包括:
步骤301、接收用户对第一文字内容的第三输入。
步骤302、响应于第三输入,在与第一目标对象所对应的第二预设区域通过悬浮窗显示与第一目标对象关联的第一内容。
在第一位置通过第一文字内容显示第一目标对象所对应的识别结果之后,可以接收用户对第一文字内容所执行的第三输入,根据用户的第三输入,确定与第一目标对象所对应的第二预设区域,并在第二预设区域内生成悬浮窗,通过所生成的悬浮窗显示与第一目标对象相关联的第一内容,便于进一步对第一目标对象进行展示,使得用户更全面的了解第一目标对象。其中悬浮窗可以根据用户的操作切换至关闭状态。与第一目标对象关联的第一内容可以通过文字进行显示,也可以通过图片,或者网页链接的形式进行显示,这里不再详细限定。
如通过接收用户对第一文字内容的点击操作,在显示屏幕的左下方与第一目标对象所对应的第二预设区域开启悬浮窗,通过悬浮窗展示更多的与第一目标对象相关的智能搜索结果。
上述过程,响应于用户对文字内容的输入,通过悬浮窗展示更多的与第一目标对象关联的内容,可以便于用户进一步获取第一目标对象的相关信息。
在本发明实施例中,如图4所示,该方法还包括:
步骤401、接收用户对目标标记符号的第四输入。
步骤402、响应于第四输入,移动目标标记符号,并记录目标标记符号移动之前的第一坐标和目标标记符号移动之后的第二坐标。
步骤403、在以第二坐标为中心的第三预设区域内进行目标对象识别。
步骤404、在识别失败的情况下,控制目标标记符号移动至第一坐标。
步骤405、在识别成功的情况下,通过第二文字内容显示识别结果。电子设备可以接收用户对目标标记符号所执行的第四输入,根据用户的第四输入,控制目标标记符号进行移动,并记录目标标记符号移动之前所对应的第一坐标以及目标标记符号移动之后所对应的第二坐标。
在对目标标记符号移动前后的坐标信息进行记录之后,确定以第二坐标为中心的第三预设区域,并在第三预设区域内进行目标对象识别,若识别成功则通过第二文字内容显示识别结果,在识别失败的情况下,控制目标标记符号重新移动至第一坐标处,此时相当于目标标记符号未发生移动,用户的第四输入无效。
如,监听目标标记符号的移动,并在移动前记录坐标X,移动后即在当前坐标为中心的6cm*6cm方形(可通过设置调整)范围内重新识别目标对象,若识别失败则控制目标标记符号返回坐标X处。
通过改变目标标记符号的位置,可以改变检测范围,方便对大型目标对象的细节进行检测和查询。
本发明实施例的图像识别方法,实现了图像识别应用中的交互功能,使得用户可通过控制标记符号和检测范围来识别不同的目标对象,且通过对多个标记符号进行操作可以实现多个目标对象的检测和查询的功能,进一步的还可以实现目标对象分类场景的直观展现。
下面以一整体实施流程对本发明实施例的图像识别方法进行阐述,如图5所示,包括:
步骤501、开启图像识别拍摄界面。
步骤502、检测当前是常规识别模式还是分类识别模式。若当前属于常规识别模式则执行步骤503,若当前属于分类识别模式则执行步骤504。
步骤503、通过常规识别功能进行目标对象识别,通过文字内容显示识别结果,然后执行步骤505。
在通过常规识别功能进行目标对象识别时,可以针对每一个目标对象采用标记符号进行标记,各目标对象对应的标记符号不同。
步骤504、通过分类识别功能进行目标对象识别,通过文字内容显示识别结果,然后执行步骤505。
在通过分别识别功能进行目标对象识别时,可以确定各目标对象分别对应的类别信息,根据类别信息确定标记符号,且相同类别信息的目标对象对应的标记符号相同。
步骤505、检测用户是否移动目标对象所对应的标记符号,若没有移动则执行步骤506,否则执行步骤507。
步骤506、根据用户对目标对象所对应的文字内容的操作,通过悬浮窗显示目标对象的详细信息,然后结束流程。
步骤507、执行重新识别过程,并返回步骤502。
上述流程,在图像识别拍摄界面检测到一或多个目标对象时会在目标对象周围采用标记符号(如箭头)进行标记,并通过侦听用户的操作来控制标记符号的移动,实现用户与电子设备的交互。
本发明实施例还可扩展至更多具有实用性而又需要用户交互的场景,如AR划词翻译、食物分类等,还可基于大数据对返回的内容和形式进行丰富的调整。
综上,为本发明图像识别方法的整体实施流程,通过在图像识别拍摄界面中引入标记符号,在所显示的一个或者多个目标对象的对应位置,采用标记符号进行标记,可以提高图像识别的准确性,且通过对至少一个标记符号进行控制,可以使得拍摄界面内的多个目标对象被识别,实现提高图像识别的交互性,以及应对识别多个目标的需求的能力。
通过定义标记符号的颜色和式样,可实现对拍摄界面内的多个目标对象进行分类,并以直观的方式对用户展现出来,通过移动标记符号的位置,可以改变检测范围,方便对大型目标对象的细节进行检测和查询。
本发明实施例还提供一种电子设备,如图6所示,包括:
标记模块10,用于在图像识别拍摄界面,对所显示的每个目标对象采用标记符号进行标记;
第一接收模块20,用于接收用户对目标标记符号的第一输入;
第一显示模块30,用于响应于第一输入,在与目标标记符号对应的第一目标对象的预设位置显示第一目标对象的识别结果。
其中,标记符号为根据增强现实技术所生成的增强现实标记符号。
其中,标记模块包括:
第一获取子模块,用于获取每个目标对象在显示屏幕内所对应的区域顶点坐标;
计算子模块,用于根据区域顶点坐标,计算目标对象的标记坐标;
第一标记子模块,用于在标记坐标所对应的位置,采用标记符号标记目标对象。
其中,标记模块包括:
第二获取子模块,用于获取图像识别拍摄界面内目标对象的数目;
第一确定子模块,用于根据目标对象的数目确定第一标记类别,其中,每个目标对象对应于一个第一标记类别;
第二确定子模块,用于根据第一标记类别确定标记符号;
第二标记子模块,用于根据标记符号对目标对象进行标记。
其中,标记模块包括:
第一接收子模块,用于接收用户对图像识别拍摄界面内的分类按键的第二输入;
第三确定子模块,用于响应于第二输入,确定图像识别拍摄界面所对应的第一分类模式;
第三获取子模块,用于获取第一分类模式所对应的第一映射列表;
第四确定子模块,用于根据第一映射列表确定每个目标对象分别对应的类别信息;
第五确定子模块,用于根据类别信息确定第二标记类别,其中,相同类别信息的目标对象对应于一个第二标记类别;
第六确定子模块,用于根据第二标记类别确定标记符号;
第三标记子模块,用于根据标记符号对目标对象进行标记。
其中,第一显示模块包括:
扫描子模块,用于在以目标标记符号为中心的第一预设区域内进行背景扫描;
第七确定子模块,用于确定与目标标记符号对应的第一目标对象的颜色相区别的第一位置;
第一显示子模块,用于在第一位置通过第一文字内容显示第一目标对象的识别结果。
其中,第一显示模块还包括:
第二接收子模块,用于接收用户对第一文字内容的第三输入;
第二显示子模块,用于响应于第三输入,在与第一目标对象所对应的第二预设区域通过悬浮窗显示与第一目标对象关联的第一内容。
其中,电子设备还包括:
第二接收模块,用于接收用户对目标标记符号的第四输入;
处理模块,用于响应于第四输入,移动目标标记符号,并记录目标标记符号移动之前的第一坐标和目标标记符号移动之后的第二坐标;
识别模块,用于在以第二坐标为中心的第三预设区域内进行目标对象识别;
控制模块,用于在识别失败的情况下,控制目标标记符号移动至第一坐标;
第二显示模块,用于在识别成功的情况下,通过第二文字内容显示识别结果。
本发明实施例的电子设备,通过在图像识别拍摄界面中引入标记符号,在所显示的一个或者多个目标对象的对应位置,采用标记符号进行标记,可以提高图像识别的准确性,且通过对至少一个标记符号进行控制,可以使得拍摄界面内的多个目标对象被识别,实现提高图像识别的交互性,以及应对识别多个目标的需求的能力。
通过根据标记类别确定标记符号,可实现对拍摄界面内的多个目标对象进行分类,并以直观的方式对用户展现出来,通过移动标记符号的位置,可以改变检测范围,方便对大型目标对象的细节进行检测和查询。
图7为实现本发明各个实施例的一种电子设备的硬件结构示意图,该电子设备700包括但不限于:射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709、处理器710、以及电源711等部件。
本领域技术人员可以理解,图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,处理器710用于:在图像识别拍摄界面,对所显示的每个目标对象采用标记符号进行标记;射频单元701用于:接收用户对目标标记符号的第一输入;处理器710用于:响应于第一输入,控制显示单元706在与目标标记符号对应的第一目标对象的预设位置显示第一目标对象的识别结果。
其中,标记符号为根据增强现实技术所生成的增强现实标记符号。
其中,在对所显示的每个目标对象采用标记符号进行标记时,处理器710还用于:获取每个目标对象在显示屏幕内所对应的区域顶点坐标;根据区域顶点坐标,计算目标对象的标记坐标;在标记坐标所对应的位置,采用标记符号标记目标对象。
其中,在对所显示的每个目标对象采用标记符号进行标记时,处理器710还用于:获取图像识别拍摄界面内目标对象的数目;根据目标对象的数目确定第一标记类别,其中,每个目标对象对应于一个第一标记类别;根据第一标记类别确定标记符号;根据标记符号对目标对象进行标记。
其中,在对所显示的每个目标对象采用标记符号进行标记时,射频单元701还用于:接收用户对图像识别拍摄界面内的分类按键的第二输入;处理器710还用于:响应于第二输入,确定图像识别拍摄界面所对应的第一分类模式;获取第一分类模式所对应的第一映射列表;根据第一映射列表确定每个目标对象分别对应的类别信息;根据类别信息确定第二标记类别,其中,相同类别信息的目标对象对应于一个第二标记类别;根据第二标记类别确定标记符号;根据标记符号对目标对象进行标记。
其中,在与目标标记符号对应的第一目标对象的预设位置显示第一目标对象的识别结果时,处理器710还用于:在以目标标记符号为中心的第一预设区域内进行背景扫描;确定与目标标记符号对应的第一目标对象的颜色相区别的第一位置;控制显示单元706在第一位置通过第一文字内容显示第一目标对象的识别结果。
其中,射频单元701还用于:接收用户对第一文字内容的第三输入;处理器710还用于:响应于第三输入,控制显示单元706在与第一目标对象所对应的第二预设区域通过悬浮窗显示与第一目标对象关联的第一内容。
其中,射频单元701还用于:接收用户对目标标记符号的第四输入;处理器710还用于:响应于第四输入,移动目标标记符号,并记录目标标记符号移动之前的第一坐标和目标标记符号移动之后的第二坐标;在以第二坐标为中心的第三预设区域内进行目标对象识别;在识别失败的情况下,控制目标标记符号移动至第一坐标;在识别成功的情况下,控制显示单元706通过第二文字内容显示识别结果。
这样,通过在图像识别拍摄界面中引入标记符号,在所显示的一个或者多个目标对象的对应位置,采用标记符号进行标记,可以提高图像识别的准确性,且通过对至少一个标记符号进行控制,可以使得拍摄界面内的多个目标对象被识别,实现提高图像识别的交互性,以及应对识别多个目标的需求的能力。
通过根据标记类别确定标记符号,可实现对拍摄界面内的多个目标对象进行分类,并以直观的方式对用户展现出来,通过移动标记符号的位置,可以改变检测范围,方便对大型目标对象的细节进行检测和查询。
应理解的是,本发明实施例中,射频单元701可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器710处理;另外,将上行的数据发送给基站。通常,射频单元701包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元701还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块702为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元703可以将射频单元701或网络模块702接收的或者在存储器709中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元703还可以提供与电子设备700执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元703包括扬声器、蜂鸣器以及受话器等。
输入单元704用于接收音频或视频信号。输入单元704可以包括图形处理器(Graphics Processing Unit,GPU)7041和麦克风7042,图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元706上。经图形处理器7041处理后的图像帧可以存储在存储器709(或其它存储介质)中或者经由射频单元701或网络模块702进行发送。麦克风7042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元701发送到移动通信基站的格式输出。
电子设备700还包括至少一种传感器705,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板7061的亮度,接近传感器可在电子设备700移动到耳边时,关闭显示面板7061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器705还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元706用于显示由用户输入的信息或提供给用户的信息。显示单元706可包括显示面板7061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板7061。
用户输入单元707可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元707包括触控面板7071以及其他输入设备7072。触控面板7071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板7071上或在触控面板7071附近的操作)。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器710,接收处理器710发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板7071。除了触控面板7071,用户输入单元707还可以包括其他输入设备7072。具体地,其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板7071可覆盖在显示面板7061上,当触控面板7071检测到在其上或附近的触摸操作后,传送给处理器710以确定触摸事件的类型,随后处理器710根据触摸事件的类型在显示面板7061上提供相应的视觉输出。虽然在图7中,触控面板7071与显示面板7061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板7071与显示面板7061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元708为外部装置与电子设备700连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元708可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备700内的一个或多个元件或者可以用于在电子设备700和外部装置之间传输数据。
存储器709可用于存储软件程序以及各种数据。存储器709可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器709可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器710是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器709内的软件程序和/或模块,以及调用存储在存储器709内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器710可包括一个或多个处理单元;优选的,处理器710可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器710中。
电子设备700还可以包括给各个部件供电的电源711(比如电池),优选的,电源711可以通过电源管理系统与处理器710逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备700包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种电子设备,包括处理器710,存储器709,存储在存储器709上并可在处理器710上运行的计算机程序,该计算机程序被处理器710执行时实现上述图像识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述图像识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (10)

1.一种图像识别方法,应用于电子设备,其特征在于,所述方法包括:
在图像识别拍摄界面,对所显示的每个目标对象采用标记符号进行标记;
接收用户对目标标记符号的第一输入;
响应于所述第一输入,在与所述目标标记符号对应的第一目标对象的预设位置显示所述第一目标对象的识别结果。
2.根据权利要求1所述的方法,其特征在于,
所述标记符号为根据增强现实技术所生成的增强现实标记符号。
3.根据权利要求1所述的方法,其特征在于,所述对所显示的每个目标对象采用标记符号进行标记的步骤,包括:
获取每个所述目标对象在显示屏幕内所对应的区域顶点坐标;
根据所述区域顶点坐标,计算所述目标对象的标记坐标;
在所述标记坐标所对应的位置,采用所述标记符号标记所述目标对象。
4.根据权利要求1所述的方法,其特征在于,所述对所显示的每个目标对象采用标记符号进行标记的步骤,包括:
获取所述图像识别拍摄界面内所述目标对象的数目;
根据所述目标对象的数目确定第一标记类别,其中,每个所述目标对象对应于一个所述第一标记类别;
根据所述第一标记类别确定所述标记符号;
根据所述标记符号对所述目标对象进行标记。
5.根据权利要求1所述的方法,其特征在于,所述对所显示的每个目标对象采用标记符号进行标记的步骤,包括:
接收用户对所述图像识别拍摄界面内的分类按键的第二输入;
响应于所述第二输入,确定所述图像识别拍摄界面所对应的第一分类模式;
获取所述第一分类模式所对应的第一映射列表;
根据所述第一映射列表确定每个所述目标对象分别对应的类别信息;
根据所述类别信息确定第二标记类别,其中,相同类别信息的所述目标对象对应于一个所述第二标记类别;
根据所述第二标记类别确定所述标记符号;
根据所述标记符号对所述目标对象进行标记。
6.根据权利要求1所述的方法,其特征在于,所述在与所述目标标记符号对应的第一目标对象的预设位置显示所述第一目标对象的识别结果的步骤,包括:
在以所述目标标记符号为中心的第一预设区域内进行背景扫描;
确定与所述目标标记符号对应的所述第一目标对象的颜色相区别的第一位置;
在所述第一位置通过第一文字内容显示所述第一目标对象的识别结果。
7.根据权利要求6所述的方法,其特征在于,还包括:
接收用户对所述第一文字内容的第三输入;
响应于所述第三输入,在与所述第一目标对象所对应的第二预设区域通过悬浮窗显示与所述第一目标对象关联的第一内容。
8.根据权利要求1所述的方法,其特征在于,还包括:
接收用户对所述目标标记符号的第四输入;
响应于所述第四输入,移动所述目标标记符号,并记录所述目标标记符号移动之前的第一坐标和所述目标标记符号移动之后的第二坐标;
在以所述第二坐标为中心的第三预设区域内进行目标对象识别;
在识别失败的情况下,控制所述目标标记符号移动至所述第一坐标;
在识别成功的情况下,通过第二文字内容显示识别结果。
9.一种电子设备,其特征在于,所述电子设备包括:
标记模块,用于在图像识别拍摄界面,对所显示的每个目标对象采用标记符号进行标记;
第一接收模块,用于接收用户对目标标记符号的第一输入;
第一显示模块,用于响应于所述第一输入,在与所述目标标记符号对应的第一目标对象的预设位置显示所述第一目标对象的识别结果。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的图像识别方法的步骤。
CN201911093906.1A 2019-11-11 2019-11-11 一种图像识别方法及电子设备 Pending CN110909776A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911093906.1A CN110909776A (zh) 2019-11-11 2019-11-11 一种图像识别方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911093906.1A CN110909776A (zh) 2019-11-11 2019-11-11 一种图像识别方法及电子设备

Publications (1)

Publication Number Publication Date
CN110909776A true CN110909776A (zh) 2020-03-24

Family

ID=69817025

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911093906.1A Pending CN110909776A (zh) 2019-11-11 2019-11-11 一种图像识别方法及电子设备

Country Status (1)

Country Link
CN (1) CN110909776A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113067983A (zh) * 2021-03-29 2021-07-02 维沃移动通信(杭州)有限公司 视频处理方法、装置、电子设备和存储介质
CN113110785A (zh) * 2021-05-12 2021-07-13 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备以及计算机可读存储介质
CN114071005A (zh) * 2020-08-07 2022-02-18 华为技术有限公司 一种对象检测方法、电子设备和计算机可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542014A (zh) * 2011-12-16 2012-07-04 华中科技大学 基于内容的图像检索反馈方法
JP2013012223A (ja) * 2012-08-29 2013-01-17 Canon Software Inc 画像処理装置及び方法、並びにプログラム
CN106951893A (zh) * 2017-05-08 2017-07-14 奇酷互联网络科技(深圳)有限公司 文字信息获取方法、装置及移动终端
CN107103016A (zh) * 2016-02-23 2017-08-29 百度(美国)有限责任公司 基于关键词表示使图像与内容匹配的方法
CN107423392A (zh) * 2017-07-24 2017-12-01 上海明数数字出版科技有限公司 基于ar技术的字、词典查询方法、系统及装置
CN107908685A (zh) * 2017-10-31 2018-04-13 西安交通大学 基于迁移学习的多视角商品图像检索与识别方法
CN109034115A (zh) * 2018-08-22 2018-12-18 Oppo广东移动通信有限公司 视频识图方法、装置、终端及存储介质
CN109271983A (zh) * 2018-09-27 2019-01-25 青岛海信电器股份有限公司 屏幕画面截图中识别物体的显示方法及显示终端
CN110175590A (zh) * 2019-05-31 2019-08-27 北京华捷艾米科技有限公司 一种商品识别方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542014A (zh) * 2011-12-16 2012-07-04 华中科技大学 基于内容的图像检索反馈方法
JP2013012223A (ja) * 2012-08-29 2013-01-17 Canon Software Inc 画像処理装置及び方法、並びにプログラム
CN107103016A (zh) * 2016-02-23 2017-08-29 百度(美国)有限责任公司 基于关键词表示使图像与内容匹配的方法
CN106951893A (zh) * 2017-05-08 2017-07-14 奇酷互联网络科技(深圳)有限公司 文字信息获取方法、装置及移动终端
CN107423392A (zh) * 2017-07-24 2017-12-01 上海明数数字出版科技有限公司 基于ar技术的字、词典查询方法、系统及装置
CN107908685A (zh) * 2017-10-31 2018-04-13 西安交通大学 基于迁移学习的多视角商品图像检索与识别方法
CN109034115A (zh) * 2018-08-22 2018-12-18 Oppo广东移动通信有限公司 视频识图方法、装置、终端及存储介质
CN109271983A (zh) * 2018-09-27 2019-01-25 青岛海信电器股份有限公司 屏幕画面截图中识别物体的显示方法及显示终端
CN110175590A (zh) * 2019-05-31 2019-08-27 北京华捷艾米科技有限公司 一种商品识别方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114071005A (zh) * 2020-08-07 2022-02-18 华为技术有限公司 一种对象检测方法、电子设备和计算机可读存储介质
CN114071005B (zh) * 2020-08-07 2022-12-27 华为技术有限公司 一种对象检测方法、电子设备和计算机可读存储介质
CN113067983A (zh) * 2021-03-29 2021-07-02 维沃移动通信(杭州)有限公司 视频处理方法、装置、电子设备和存储介质
CN113110785A (zh) * 2021-05-12 2021-07-13 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备以及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN107977652B (zh) 一种屏幕显示内容的提取方法及移动终端
CN109240577B (zh) 一种截屏方法及终端
CN110109593B (zh) 一种截屏方法及终端设备
CN111338530B (zh) 应用程序图标的控制方法和电子设备
CN108763317B (zh) 一种辅助选取图片的方法和终端设备
CN110618969B (zh) 一种图标显示方法及电子设备
CN109495616B (zh) 一种拍照方法及终端设备
CN112689201B (zh) 弹幕信息识别方法、显示方法、服务器及电子设备
CN110830363B (zh) 一种信息分享方法及电子设备
CN110913067A (zh) 一种信息发送方法及电子设备
CN110909776A (zh) 一种图像识别方法及电子设备
CN107783709B (zh) 一种图像的查看方法及移动终端
CN111610904B (zh) 图标整理方法、电子设备及存储介质
CN110703972B (zh) 一种文件控制方法及电子设备
CN110730298A (zh) 一种显示控制方法及电子设备
CN109144393B (zh) 一种图像显示方法及移动终端
CN111352547A (zh) 显示方法及电子设备
CN109670507B (zh) 图片处理方法、装置及移动终端
CN109885490B (zh) 一种图片对比方法和装置
CN107908329B (zh) 应用图标的管理方法和移动终端
CN111026300B (zh) 一种屏幕显示方法及电子设备
CN110908751B (zh) 信息显示、收藏的方法、装置、电子设备及介质
CN110515507B (zh) 一种图标显示方法及终端
CN108471549B (zh) 一种遥控方法及终端
CN111443968A (zh) 一种截图方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200324