CN117636290A - 图像处理方法、装置、电子设备及存储介质 - Google Patents

图像处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117636290A
CN117636290A CN202210970119.6A CN202210970119A CN117636290A CN 117636290 A CN117636290 A CN 117636290A CN 202210970119 A CN202210970119 A CN 202210970119A CN 117636290 A CN117636290 A CN 117636290A
Authority
CN
China
Prior art keywords
target
image
prompt
display interface
target object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210970119.6A
Other languages
English (en)
Inventor
陆敏慎
王赞丞
王毅
吴婧祎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Original Assignee
Douyin Vision Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Douyin Vision Co Ltd filed Critical Douyin Vision Co Ltd
Priority to CN202210970119.6A priority Critical patent/CN117636290A/zh
Priority to PCT/CN2023/111671 priority patent/WO2024032586A1/zh
Publication of CN117636290A publication Critical patent/CN117636290A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开实施例提供了一种图像处理方法、装置、电子设备及存储介质,该方法包括:在检测到对显示界面的触发操作时,启动摄像装置,以基于摄像装置拍摄包括目标对象的待处理图像;通过对待处理图像分析处理,确定与目标对象相对应的目标识别结果;调取与目标识别结果相对应的目标提示内容,以基于目标提示内容对目标用户进行提示。本公开实施例所提供的技术方案,解决了现有技术中无法对用户进行有效提示的问题,实现了在准确识别图像中的图像内容后,可以基于目标识别结果对用户进行有效提示的效果。

Description

图像处理方法、装置、电子设备及存储介质
技术领域
本公开实施例涉及图像处理技术领域,尤其涉及一种图像处理方法、装置、电子设备及存储介质。
背景技术
图像识别技术在图像处理技术领域应用越来越广泛,目前,对图像的识别存在不准确,以及无法基于识别到的结果对用户进行有效提示,导致存在普适性较差的问题。
发明内容
本公开提供了一种图像处理方法、装置、电子设备及存储介质,以实现对采集的图像进行有效识别,并基于识别结果进行相应提示的效果。
第一方面,本公开实施例提供了一种图像处理方法,该方法包括:
在检测到对显示界面的触发操作时,启动摄像装置,以基于所述摄像装置拍摄包括目标对象的待处理图像;
通过对所述待处理图像分析处理,确定与所述目标对象相对应的目标识别结果;
调取与所述目标识别结果相对应的目标提示内容,以基于所述目标提示内容对目标用户进行提示。
第二方面,本公开实施例还提供了一种图像处理装置,该装置包括:
图像采集模块,用于在检测到对显示界面的触发操作时,启动摄像装置,以基于所述摄像装置拍摄包括目标对象的待处理图像;
图像识别模块,用于通过对所述待处理图像分析处理,确定与所述目标对象相对应的目标识别结果;
提示模块,用于调取与所述目标识别结果相对应的目标提示内容,以基于所述目标提示内容对目标用户进行提示。
第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实时例任一所述的图像处理方法。。
第四方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本公开实施例任一所述的图像处理方法。
本公开实施例所提供的技术方案,在检测到对显示界面的触发操作时,启动摄像装置,以基于摄像装置拍摄包括目标对象的待处理图像,通过对待处理图像分析处理,确定与目标对象相对应的目标识别结果,进而调取与目标识别结果相对应的目标提示内容,以基于目标提示内容对目标用户进行提示,解决了现有技术中对图像识别不准确,以及未根据识别结果进行有效提示,导致普适性较差的问题,实现了在对图像内容进行有效识别后,可以依据识别结果确定相应的提示内容,以基于提示内容对用户进行提示,提高了提示有效性和普适性的效果。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例所提供的一种图像处理方法的流程示意图;
图2为本公开实施例所提供的一种图像处理方法的流程示意图;
图3为本公开实施例所提供的一种图像处理方法的流程示意图;
图4为本公开实施例所提供的一种图像处理方法的流程示意图;
图5为本公开实施例所提供的一种图像处理装置的结构框图;
图6为本公开实施例所提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
在介绍本技术方案之前,可以先对应用场景进行示例性说明。对于存在视觉障碍的用户来说,可选的,视觉障碍的用户可以是盲人或者弱视用户;亦或是,对于不具备识别能力的用户来说,可以采用本公开实施例的方案实现对周围场景中的内容或者文字进行识别,并对其进行提示。
还需要说明的是,可以基于本公开实施例提供的方案专门研发出相应的应用程序,或者将其集成在移动终端设备中,以实现快速便捷的为用户提供服务的效果。
图1为本公开实施例所提供的一种图像处理方法的流程示意图,本公开实施例适用于对采集的图像内容进行图像内容识别,并基于识别结果对用户进行提示的场景中,该方法可以由图像处理装置来执行,该装置可以通过软件和/或硬件的形式实现,可选的,通过电子设备来实现,该电子设备可以是移动终端、 PC端或服务器等。执行本公开实施例所提供的图像处理方法可以由服务端执行,可以由客户端执行,还可以是客户端和服务端配合执行。
如图1所示,所述方法包括:
S110、在检测到对显示界面的触发操作时,启动摄像装置,以基于摄像装置拍摄包括目标对象的待处理图像。
其中,目标对象可以是现实场景中的任意需要进行识别的物体或者场景,待处理图像可以是摄像装置拍摄得到的包含目标对象的图像。触发操作可以是触发显示界面中的某个控件,或者是,触发终端设备的某个区域。摄像装置可以是终端设备上自带的摄像头等。
具体的,对于智能终端设备来说,可以在移动终端的显示界面或者应用程序的显示界面上设置触发控件。当检测到用户触发该触发控件时,可以自动调用终端设备内自带的摄像装置,以拍摄待处理图像。对于具有功能按键的终端设备来说,可以通过触发终端设备上的某个功能按键来调用摄像装置,例如,功能按键可以包括电源键、拨号键、接听键等。在摄像装置启动后,可以通过摄像装置对需要进行识别的目标对象进行拍摄,将拍摄得到的包含目标对象的图像作为待处理图像。
还需要说明的是,对于移动终端设备来说,为了提高移动终端设备对摄像装置的启动效率,可以将移动终端某个区域设置为一个热区,例如,可以将移动终端的背面设置为热区,在移动终端处于休眠状态下,当用户在该热区连续点击多次,即可启动移动终端的摄像装置,以拍摄得到待处理图像。
在上述技术方案的基础上,所述显示界面整体对应于一个操作控件。
在实际应用中,为了进一步实现快速调用摄像装置的效果,可以在整个显示界面上设置一个操作控件,即整个显示屏幕均为操作热区,当检测到点击显示屏幕时,就说明要触发摄像装置。当然,此种方式主要是研发了相应的应用程序,可以将程序的主界面作为操作热区,只要检测到于操作热区的触发操作,就说明需要调用摄像装置。在本实施例中,所述在检测到对显示界面的触发操作时,启动摄像装置的方式有多种,本实施例对不同的方式进行介绍:
第一种可以是:当检测到于显示界面的单击操作时,启动摄像装置。
具体的,在检测到用户在显示界面上的单击操作时,可以触发摄像装置的启动控件,进而启动摄像装置。
第二种方式是:当检测到于显示界面的双击操作时,启动摄像装置。
为了避免用户误触的情况,可以设置双击操作的触发方式,当用户双击显示界面时,说明需要调用摄像装置拍摄待处理图像,则可以启动摄像装置以拍摄待处理图像。第三种方式是:当检测到于显示界面的按压时长达到预设时长阈值时,启动摄像装置。
其中,预设时长阈值可以理解为预先设置的时长,用于判断是否启动摄像装置。当检测到界面上被按压的时长超过预先设置的时长,代表需要开启摄像装置,例如,预设时长为2S,当检测到显示界面被按压的时长超过2S,即可开启摄像装置,如果小于2S,则不能开启摄像装置。
第四方式是:当检测到于显示界面的触摸轨迹满足预设轨迹时,启动摄像装置。
其中,预设轨迹指的是在显示界面的触摸轨迹,如预设轨迹为“S”形或“Z”字形,当检测到用户在显示界面上的触摸轨迹与预先设置的轨迹相同时,说明需要开启摄像装置,并启动摄像装置。
第五种方式是:当检测到于显示界面的手部姿态与至少一个预设姿态相对应时,启动摄像装置。
其中,预设姿态可以理解为预先设置的手势动作等,或者是,终端设备的运动姿态。
具体的,通常终端设备内设置有陀螺仪,在终端设备运动过程中,可以基于陀螺仪确定终端设备的运动轨迹。若运动轨迹对应的动作与预设姿态相一致,则启动摄像装置。可以基于终端设备的运动信息,确定手部握持终端设备的姿态,可选的,手部姿态可以是抬起或者放下。当手部姿态与胳膊抬起的姿态相对应,则说明可以启动摄像装置。
S120、通过对待处理图像分析处理,确定与目标对象相对应的目标识别结果。
其中,目标识别结果是与待处理图像中的目标对象相关联的,例如,当目标对象为通行指示灯时,对目标识别结果可以为指示灯的状态。可选的,指示灯的状态可以是绿色指示灯亮、红色指示灯亮或黄色指示灯亮灯。
具体的,在采集到待处理图像后,可以基于客户端对待处理图像分析处理,也可以将待处理图像发送至相应的服务端,以使服务端对其进行分析处理,得到相应的目标识别结果。分析处理可以基于预先构建的神经网络来实现,基于该神经网络可以有效识别红绿指示灯的指示灯状态。示例性的,待处理图像为包含有通行指示灯灯的图像,可以对待处理图像进行分析处理,可以确定当前的通行指示灯颜色为红色还是绿色,基于识别结果确定是否为可通行状态。
S130、调取与目标识别结果相对应的目标提示内容,以基于目标提示内容对目标用户进行提示。
其中,目标提示内容指的是需要提醒目标用户的内容,不同的目标识别结果对应于不同的提示内容,例如,目标识别结果A,对应的提示内容为内容1,目标识别结果为B,对应的提示内容为内容2。目标用户可以理解为当前使用图像处理装置的用户或者触发显示界面的用户。
具体的,可以预先存储不同识别结果所对应的提示内容,在确定出目标识别结果后,可以基于目标识别结果从内存中调取与目标识别结果相匹配的目标提示内容,进而通过语音播报的方式或者震动的方式,基于目标提示内容对用户进行相应的提示。
示例性的,识别结果A对应于提示内容1,识别结果B对应于提示内容2。当确目标识别结果为A,可以调取出提示内容1并通过语音播报的方式将提示内容1对应的文本进行播报,以对目标用户进行提示。
本公开实施例所提供的技术方案,在检测到对显示界面的触发操作时,启动摄像装置,以基于摄像装置拍摄包括目标对象的待处理图像,通过对待处理图像分析处理,确定与目标对象相对应的目标识别结果,进而调取与目标识别结果相对应的目标提示内容,以基于目标提示内容对目标用户进行提示,解决了现有技术中对图像识别不准确,以及未根据识别结果进行有效提示,导致普适性较差的问题,实现了在对图像内容进行有效识别后,可以依据识别结果确定相应的提示内容,以基于提示内容对用户进行提示,提高了提示有效性和普适性的效果。
图2为本公开实施例所提供的一种图像处理方法流程示意图,在前述实施例的基础上,检测于显示界面的触发操作的时机是不同的,本实施例可以详细阐述从何时还是检测于显示界面的触发操作。其具体的实施方式可以参见本实施例技术方案。其中,与上述实施例相同或者相应的技术术语在此不再赘述。
如图2所示,所述方法包括:
S210、确定目标用户对显示界面的触发操作的检测时机。
可选的,获取目标用户的当前位置信息;若当前位置信息与至少一个预设位置信息相对应,则检测目标用户对显示界面的触发操作。
其中,当前位置信息可以理解为目标用户当前所处的位置。通常,终端设备中带有定位模块,可以基于定位模块确定目标用户的当前位置信息。预设位置信息可以理解为开发人员预先标定或者设置的地理位置,预设位置信息可以有一个或者多个。可选的,预设位置可以是红绿灯路口所对应的经纬度信息,对于存在视觉障碍的用户来说,如何安全通过红绿灯是比较重要的,可以获取该视觉障碍用户所对应的当前位置信息。基于当前位置信息和预设位置信息,确定是否检测于显示界面的触发操作。
具体的,可以预先设置多个预设位置,如,可以确定各红绿灯路口的位置,并作为预设位置。如果当前位置信息在预设位置的邻域范围内的位置相对应,则确定目标用户位于红绿灯路口,可以检测目标用户是否对显示界面进行相应的触发操作。这样的好处在于可以避免误识别、误触发的情况,提高了调用摄像装置的准确性,以及图像采集的有效性。
可以理解为,为了及时并准确的检测到目标用户对显示界面的触发操作,并进行图像的拍摄与识别,可以实时获取目标用户的当前位置坐标信息。通常可以基于移动终端上的定位模块获取目标用户的当前位置信息。进一步,将获取到的当前位置信息与各预设位置信息比对,例如,确定当前位置信息与某个预设位置信息是否重合或者相距较近,如果是,则可以确定当前位置信息与该预设位置信息相对应,此时检测目标用户在显示界面上的触发操作。
在上述技术方案的基础上,在检测到目标运动主体的当前位置信息与所述目标用户的目标位置信息相对应时,检测所述目标用户于所述显示界面的触发操作。
为了提高本公开实施例中应用程序的普适性的,基于应用程序不仅可以对静态的物体进行识别,还可以对动态的运动主体进行识别。例如,在网络约车的情况下,由于一些视障用户无法识别当前车辆是否为约的目标车辆,导致上错车的情形,因此可以基于本公开实施例所提供的方案,确定来往车辆是否为目标车辆,即确定目标识别结果。其中,可以将与目标用户存在相对位移的主体均作为目标运动主体。通常,在不同的应用场景中,目标运动主体是不同的,例如,在网络约车的场景中,目标运动主体可以理解为目标用户当前约定的目标车辆。
具体的,当目标运动主体与目标用户建立约定关系后,目标运动主体可以基于通讯网络将其位置信息发送至目标用户所使用的终端设备,终端设备可以实时比对目标运动主体的位置信息与目标用户的目标位置信息。当目标运动主体的当前位置信息与目标位置信息相对应时,可以是目标运动主体的当前位置信息与目标位置信息之间的距离小于20m。此种情况下,可以通过语音或者振动的方式提醒目标用户,目标移动主体距离当前位置较近,可以触发显示界面,以拍摄包括目标运动主体的待处理图像。
S220、在检测到对显示界面的触发操作时,启动摄像装置,以基于摄像装置拍摄包括目标对象的待处理图像。
在上述技术方案的基础,在所述检测所述目标用户对所述显示界面的触发操作之前,还包括:启动目标应用程序,以进入所述目标应用程序的主界面,并在检测到所述目标用户于所述主界面的触发操作时,启动摄像装置。
其中,目标程序可以理解为专门研发的实现本公开实施例的应用程序,主界面对应于显示界面。
具体的,在检测目标用户在显示界面上的触发操作之前,可以先启动目标程序,以进入目标应用程序的主界面,即显示界面。当检测到在显示界面上的触发操作后,可以启动摄像装置,基于摄像装置拍摄包括目标对象的待处理图像。
在上述技术方案的基础上,在启动所述目标应用程序之后,还包括:对所述目标用户进行程序启动提示,以基于所述程序启动提示于显示界面上触发操作。
其中,程序启动提示包括语音提示和/或震动提示,语音提示的内容包括启动摄像装置的触发操作内容和/或进入启动界面的内容提示。
具体的,对于存在视觉障碍的用户来说,可能存在应用程序还没有启动,用户就开始触摸操作,此时无法实现对应用程序的显示界面的触发操作。因此,在应用程序启动之后,可以对目标用户进行语音或者震动提示,以有效的触发显示界面,从而达到启动摄像装置的效果。可选的,在应用程序启动后,语音播报内容可以是“你好,XX应用程序已启动,可以点击显示界面以进行拍照”。还可以是,在应用程序启动后,通过终端设备振动的方式提醒应用程序已启动。
S230、通过对待处理图像分析处理,确定与目标对象相对应的目标识别结果。
S240、调取与目标识别结果相对应的目标提示内容,以基于目标提示内容对目标用户进行提示。
本公开实施例的技术方案,对应于不同的应用场景来说,可以确定检测目标用户对显示界面的触发操作时机,从而有效的获取目标用户对显示界面上的触发操作,从而达到有效便捷调取相应的摄像装置,并拍摄包括目标对象的待处理图像的效果,提高了图像拍摄有效性的技术效果。
图3为本公开实施例所提供的一种图像处理方法的流程示意图,在前述实施例的基础上,可以通过预先训练得到的图像处理模型识别待处理图像中的目标对象,并确定出不同目标对象对应的目标识别结果,基于目标识别结果进行提示。其具体的实施方式可以参见本实施例技术方案。其中,与上述实施例相同或者相应的技术术语在此不再赘述。
如图3所示,所述方法包括:
S310、在检测到对显示界面的触发操作时,启动摄像装置,以基于摄像装置拍摄包括目标对象的待处理图像。
S320、基于预先训练得到的图像处理模型识别待处理图像中的目标对象,以得到与目标对象相对应的目标识别结果。
其中,图像处理模型可以是预先训练好的,用于确定待处理图像对应的目标识别结果。
需要说明的是,可以预先将大量的图像以及相对应的识别结果作为训练集合,基于训练集合可以训练出一个用于确定待处理对象对应的目标识别结果的模型,作为图像处理模型。
具体的,将待处理图像作为图像处理模型的输入,图像处理模型可以对该待处理图像进行处理,识别待处理图像中的目标对象,最终图像模型可以输出与待处理对象中目标对象相对应的目标识别结果。
在上述技术方案基础上,所述目标对象为红绿指示灯,所述基于预先训练得到的图像处理模型识别所述待处理图像中的目标对象,以得到与所述目标对象相对应的目标识别结果,包括:将所述待处理图像输入至所述图像处理模型中,以基于所述图像处理模型确定与所述红绿指示灯相对应的通行状态,并将所述通行状态作为所述目标识别结果。
其中,通行状态包括可通行状态或不可通行状态。
具体的,当目标对象为红绿指示灯时,可以将待处理图像输入至图像处理模型中,图像处理模型可以识别出待处理图像中的红绿灯,即识别出当前是红灯还是绿灯,进而输出与红绿指示灯颜色相对应的通行状态,将其作为目标识别结果。可选的,待处理图像中指示灯为红色,那么图像处理模型的输出结果为不可通行状态,反之,如果待处理图像中指示灯为绿色,图像处理模型的输出结果为可通行状态。
在上述技术方案的基础上,目标对象为目标车辆或文字信息,基于预先训练得到的图像处理模型识别待处理图像中的目标对象,以得到与目标对象相对应的目标识别结果,包括:基于图像处理模型识别待处理图像中目标对象的车辆信息或文字内容,得到与目标对象相对应的目标识别结果。
具体的,当目标对象为目标车辆时,可以基于图像模型对待处理图像中的车辆信息进行识别,如对车辆的车型、颜色、车牌号等进行识别,将识别后得到的车型信息、颜色信息以及车牌号信息作为目标识别结果。当目标对象为文字信息时,可以拍摄文字信息,得到包含文字信息的待处理图像,并将该图像输入至图像识别模型中,图像识别模型可以对图像中的文字进行识别,将识别出的文字内容作为目标识别结果。
S330、调取与目标识别结果相对应的目标提示内容,以基于目标提示内容对目标用户进行提示。
本公开实施例所提供的技术方案,可以基于图像处理模型对待处理图像中的目标对象进行识别处理,以基于目标识别结果确定目标提示内容,进而基于目标提示内容对目标对象进行提示,不仅提高了识别准确性,还提高了提示有效性的效果。
图4为本公开实施例所提供的一种图像处理方法的流程示意图,在前述实施例的基础上,为了进一步提高识别结果的准确性,可以结合其他终端设备的识别结果,来确定目标识别结果,其具体的实施方式可以参见本实施例技术方案。其中,与上述实施例相同或者相应的技术术语在此不再赘述。
如图4所示,所述方法包括:
S410、在检测到对显示界面的触发操作时,启动摄像装置,以基于摄像装置拍摄包括目标对象的待处理图像。
在上述技术方案的基础上,在启动摄像装置进入拍摄界面之后,还包括:若检测到于所述拍摄界面的触发操作,满足从所述拍摄界面回退至所述显示界面的条件,则回退至所述显示界面,并播报回退至所述显示界面的提示信息。
具体的,在启动摄像装置后可以进入拍摄界面,在拍摄完成后或者想停止拍摄时,可以在拍摄界面上进行触发操作,以从拍摄界面回退至显示界面。从拍摄界面回退至显示界面的条件可以是:在拍摄界面上的滑动操作或者双击操作。当检测到为上述操作中的一种或者多种时,可以从拍摄界面回退至显示界面,并通过语音的形式进行播报提示。
S420、获取至少一个终端设备所确定的与目标对象相对应的待使用识别结果。
其中,终端设备可以用于对目标对象进行识别或者拍摄的设备,此时的终端设备区别于目标用户所使用的终端设备。终端的数量可以是一个或者多个,为了提高目标识别结果的准确性,可以尽可能多的获取其他终端设备所识别到的识别结果。将其他终端设备识别到的识别结果,作为待使用识别结果。
可以理解为,在确定待处理图像的目标识别结果的过程中,可以获取同一时刻或者预设间隔时长内,可选的,300ms内,与预设位置信息相一致的其他终端设备识别到的目标识别结果,作为待使用识别结果。
在上述技术方案的基础上,获取至少一个终端设备所确定的与所述目标对象相对应的待使用识别结果的方式有种,接下来对每一种方式进行介绍:
为了避免由于外界光照、拍摄角度等差异,引起待处理图像的画面内容不清晰或者无法对目标对象进行有效识别的问题,可以结合其他终端设备的识别结果,来最终确定与该待处理图像所对应的目标识别结果,提高了确定目标识别结果准确性的技术效果。
第一种方式可以是:基于至少一个终端设备对采集的包括所述目标对象的待处理图像进行处理,得到相应的待使用识别结果。
具体的,其他用也可以使用相应的终端设备来拍摄包括目标对象的待处理图像,并确定与该待处理图像相对应的待使用识别结果。
第二种方式可以是:基于至少一个终端设备接收到的与所述目标对象相对应的待使用识别结果。
可以理解为:工作人员(或志愿者)可以基于相应的应用软件上传该指示灯的指示灯状态,或者预先获取各指示灯的指示灯规律,以得到不同时刻所对应的指示灯状态,并将该指示灯状态作为待使用识别结果。
第三种方式可以是:基于与所述目标用户相对应的地图数据信息,确定所述待使用识别结果。
可以理解为:现有导航软件中均可以显示红绿灯等信息,可以结合地图数据综合来确定当前位置信息中目标对象所对应的待使用识别结果。
S430、根据待使用识别结果和图像处理模型所输出的目标识别结果,更新目标识别结果。
具体的,可以为不同的待使用识别结果以及目标识别结果分配相应权重值,基于目标识别结果和权重分值以及待使用识别结果的权重和分值确定出新的目标识别结果,基于新的目标识别结果更新之前确定出的目标识别结果。
S440、调取与目标识别结果相对应的目标提示内容,以基于目标提示内容对目标用户进行提示。
在上述技术方案的基础上,目标对象与红绿指示灯相对应,目标识别结果包括通行状态,调取与目标识别结果相对应的目标提示内容,包括:在通行状态为不可通行状态的条件下,确定目标提示内容为与不可通行状态相对应的音频信息以及第一振动频率;在通行状态为可通行状态的条件下,则确定目标提示内容为与可通行状态相对应的音频信息以及第二振动频率。
具体的,不可通行状态相对应的音频信息可以是“当前不可通行,请稍等”,第一振动频率可以是连续的性的振动。可通行状态对应的音频信息可以是“当前可通行,请尽快通行”,第二振动频率可以是间歇性的振动。这样设置的好处在于,不同的目标识别结果对应于不同的提示方式,可以实现有效对用户进行提示的效果。
在上述技术方案的基础上,所述基于所述目标提示内容进行提示,包括:播放相应的音频信息以及控制与所述目标用户相对应的终端设备以相应振动频率进行振动。
具体的,如果当前的通行状态为不可通行,则用户使用的终端设备通过语音播报不可通行状态的音频信息,并通过连续不间断的振动,着重提醒用户不要通行,避免对用户造成危险。相应的,如果当前的通行状态是可通行,则可以语音播报提示用户尽快通行,并且使终端以第二振动频率进行振动,振动频率可以设置的与大多数用户运动的步频相对应。
本公开实施例所提供的技术方案,在确定与目标对象相对应的目标识别结果时,可以结合其他终端设备的识别结果,更新目标识别结果,提高了目标识别结果准确性的效果。
在上述各技术方案的基础上,基于语音信息进行提醒时,可以采用相应的语言类型进行提示,可选的,方言、不同国家所对应的语言类型等,以达到个性化提示的技术效果。
图5为本公开实施例所提供的一种图像处理装置的结构框图,可执行本公开任意实施例所提供的图像处理方法,具备执行方法相应的功能模块和有益效果。如图5所示,该装置具体包括:图像采集模块510、图像识别模块520、提示模块530。
图像采集模块510,用于在检测到对显示界面的触发操作时,启动摄像装置,以基于所述摄像装置拍摄包括目标对象的待处理图像;
图像识别模块520,用于通过对所述待处理图像分析处理,确定与所述目标对象相对应的目标识别结果;
提示模块530,用于调取与所述目标识别结果相对应的目标提示内容,以基于所述目标提示内容对目标用户进行提示。
在上述装置的基础上,所述图像处理装置还包括:
当前位置信息获取模块,用于获取所述目标用户的当前位置信息;
当前位置信息比对模块,用于若所述当前位置信息与至少一个预设位置信息相对应,则检测所述目标用户对所述显示界面的触发操作。
在上述装置的基础上,所述图像处理装置还包括:
目标运动主体位置比对模块,用于在检测到目标运动主体的当前位置信息与所述目标用户的目标位置信息相对应时,检测所述目标用户于所述显示界面的触发操作。
在上述装置的基础上,所述图像处理装置还包括:
应用程序启动模块,用于在所述检测所述目标用户对所述显示界面的触发操作之前,启动目标应用程序,以进入所述目标应用程序的主界面,并在检测到所述目标用户于所述主界面的触发操作时,启动摄像装置;
其中,所述主界面对应于所述显示界面。
在上述装置的基础上,所述图像处理装置还包括:在启动所述目标应用程序之后,还包括:
应用程序提示模块,用于对所述目标用户进行程序启动提示,以基于所述程序启动提示对显示界面上触发操作;
其中,所述程序启动提示包括语音提示和/或震动提示,所述语音提示的内容包括启动摄像装置的触发操作内容和/或进入启动界面的内容提示。
在上述装置的基础上,所述显示界面整体对应于一个操作控件。
在上述装置的基础上,所述图像采集模块510包括:
单击检测模块,用于当检测到于所述显示界面的单击操作时,启动所述摄像装置;
双击检测模块,用于当检测到于所述显示界面的双击操作时,启动摄像装置;
摄像检测模块,用于当检测到于所述显示界面的按压时长达到预设时长阈值时,启动所述摄像装置;
轨迹检测模块,用于当检测到于所述显示界面的触摸轨迹满足预设轨迹时,启动所述摄像装置;
姿态检测模块,用于当检测到于所述显示界面的手部姿态与至少一个预设姿态相对应时,启动所述摄像装置。
在上述装置的基础上,所述图像识别模块520包括:
模型识别模块,用于基于预先训练得到的图像处理模型识别所述待处理图像中的目标对象,以得到与所述目标对象相对应的目标识别结果。
在上述装置的基础上,所述目标对象为红绿指示灯,所述模型识别模块包括:
通行状态识别单元,用于将所述待处理图像输入至所述图像处理模型中,以基于所述图像处理模型确定与所述红绿指示灯相对应的通行状态,并将所述通行状态作为所述目标识别结果;
其中,所述通行状态包括可通行状态或不可通行状态。
在上述装置的基础上,所述目标对象为目标车辆或文字信息,所述模型识别模块还包括:
车辆、文字识别单元,用于基于所述图像处理模型识别所述待处理图像中目标对象的车辆信息或文字内容,得到与所述目标对象相对应的目标识别结果。
在上述装置的基础上,所述图像处理装置还包括:
待使用识别结果获取模块,用于获取至少一个终端设备所确定的与所述目标对象相对应的待使用识别结果;
目标识别结果更新模块,用于根据所述待使用识别结果和所述图像处理模型所输出的目标识别结果,更新所述目标识别结果。
在上述装置的基础上,所述待使用识别结果获取模块包括:
采集单元,用于基于至少一个终端设备对采集的包括所述目标对象的待处理图像进行处理,得到相应的待使用识别结果;
识别单元,用于基于至少一个终端设备接收到的与所述目标对象相对应的待使用识别结果;和/或,
确定单元,用于基于与所述目标用户相对应的地图数据信息,确定所述待使用识别结果。
在上述装置的基础上,所述目标对象与红绿指示灯相对应,所述提示模块 530包括:
第一提示内容确定单元,用于在所述通行状态为不可通行状态的条件下,确定所述目标提示内容为与所述不可通行状态相对应的音频信息以及第一振动频率;
第二提示内容确定单元,用于在所述通行状态为可通行状态的条件下,则确定所述目标提示内容为与所述可通行状态相对应的音频信息以及第二振动频率。
在上述装置的基础上,所述提示模块530,包括:
提示单元,用于播放相应的音频信息以及控制与所述目标用户相对应的终端设备以相应振动频率进行振动。
在上述装置的基础上,所述图像处理装置还包括:
回退模块,用于在启动摄像装置进入拍摄界面之后,若检测到于所述拍摄界面的触发操作,满足从所述拍摄界面回退至所述显示界面的条件,则回退至所述显示界面,并播报回退至所述显示界面的提示信息。
本公开实施例所提供的技术方案,在检测到对显示界面的触发操作时,启动摄像装置,以基于摄像装置拍摄包括目标对象的待处理图像,通过对待处理图像分析处理,确定与目标对象相对应的目标识别结果,进而调取与目标识别结果相对应的目标提示内容,以基于目标提示内容对目标用户进行提示,解决了现有技术中对图像识别不准确,以及未根据识别结果进行有效提示,导致普适性较差的问题,实现了在对图像内容进行有效识别后,可以依据识别结果确定相应的提示内容,以基于提示内容对用户进行提示,提高了提示有效性和普适性的效果。
本公开实施例所提供的图像处理装置可执行本公开任意实施例所提供图像处理方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,上述装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开实施例的保护范围。
图6为本公开实施例所提供的一种电子设备的结构示意图。下面参考图6,其示出了适于用来实现本公开实施例的电子设备(例如图6中的终端设备或服务器)600的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。编辑/输出(I/O) 接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602 被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
本公开实施例提供的电子设备与上述实施例提供的图像处理方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
本公开实施例提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所提供的图像处理方法。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM 或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、 RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:
在检测到对显示界面的触发操作时,启动摄像装置,以基于所述摄像装置拍摄包括目标对象的待处理图像;通过对所述待处理图像分析处理,确定与所述目标对象相对应的目标识别结果;调取与所述目标识别结果相对应的目标提示内容,以基于所述目标提示内容对目标用户进行提示。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器 (EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,【示例一】提供了一种图像处理方法,包括:
在检测到对显示界面的触发操作时,启动摄像装置,以基于所述摄像装置拍摄包括目标对象的待处理图像;
通过对所述待处理图像分析处理,确定与所述目标对象相对应的目标识别结果;
调取与所述目标识别结果相对应的目标提示内容,以基于所述目标提示内容对目标用户进行提示。
根据本公开的一个或多个实施例,【示例二】提供了一种图像处理方法,还包括:
可选的,获取所述目标用户的当前位置信息;
若所述当前位置信息与至少一个预设位置信息相对应,则检测所述目标用户对所述显示界面的触发操作。
根据本公开的一个或多个实施例,【示例三】提供了一种图像处理方法,还包括:
可选的,在检测到目标运动主体的当前位置信息与所述目标用户的目标位置信息相对应时,检测所述目标用户于所述显示界面的触发操作。
根据本公开的一个或多个实施例,【示例四】提供了一种图像处理方法,还包括:
可选的,在所述检测所述目标用户于所述显示界面的触发操作之前,还包括:启动目标应用程序,以进入所述目标应用程序的主界面,并在检测到所述目标用户对所述主界面的触发操作时,启动摄像装置;
其中,所述主界面对应于所述显示界面。
根据本公开的一个或多个实施例,【示例五】提供了一种图像处理方法,还包括:
可选的,在启动所述目标应用程序之后,还包括:
对所述目标用户进行程序启动提示,以基于所述程序启动提示于显示界面上触发操作;
其中,所述程序启动提示包括语音提示和/或震动提示,所述语音提示的内容包括启动摄像装置的触发操作内容和/或进入启动界面的内容提示。
根据本公开的一个或多个实施例,【示例六】提供了一种图像处理方法,还包括:
可选的,所述显示界面整体对应于一个操作控件。
根据本公开的一个或多个实施例,【示例七】提供了一种图像处理方法,还包括:
可选的,所述在检测到于显示界面的触发操作时,启动摄像装置,包括:
当检测到于所述显示界面的单击操作时,启动所述摄像装置;和/或,
当检测到于所述显示界面的双击操作时,启动摄像装置;和/或,
当检测到于所述显示界面的按压时长达到预设时长阈值时,启动所述摄像装置;和/或,
当检测到于所述显示界面的触摸轨迹满足预设轨迹时,启动所述摄像装置;和/或,
当检测到于所述显示界面的手部姿态与至少一个预设姿态相对应时,启动所述摄像装置。
根据本公开的一个或多个实施例,【示例八】提供了一种图像处理方法,还包括:
可选的,通过对所述待处理图像分析处理,确定与所述目标对象相对应的目标识别结果,包括:
基于预先训练得到的图像处理模型识别所述待处理图像中的目标对象,以得到与所述目标对象相对应的目标识别结果。
根据本公开的一个或多个实施例,【示例九】提供了一种图像处理方法,还包括:
可选的,所述目标对象为红绿指示灯,所述基于预先训练得到的图像处理模型识别所述待处理图像中的目标对象,以得到与所述目标对象相对应的目标识别结果,包括:
将所述待处理图像输入至所述图像处理模型中,以基于所述图像处理模型确定与所述红绿指示灯相对应的通行状态,并将所述通行状态作为所述目标识别结果;
其中,所述通行状态包括可通行状态或不可通行状态。
根据本公开的一个或多个实施例,【示例十】提供了一种图像处理方法,还包括:
可选的,所述目标对象为目标车辆或文字信息,所述基于预先训练得到的图像处理模型识别所述待处理图像中的目标对象,以得到与所述目标对象相对应的目标识别结果,包括:
基于所述图像处理模型识别所述待处理图像中目标对象的车辆信息或文字内容,得到与所述目标对象相对应的目标识别结果。
根据本公开的一个或多个实施例,【示例十一】提供了一种图像处理方法,还包括:
可选的,获取至少一个终端设备所确定的与所述目标对象相对应的待使用识别结果;
根据所述待使用识别结果和所述图像处理模型所输出的目标识别结果,更新所述目标识别结果。
根据本公开的一个或多个实施例,【示例十二】提供了一种图像处理方法,还包括:
可选的,所述获取至少一个终端设备所确定的与所述目标对象相对应的待使用识别结果,包括:
基于至少一个终端设备对采集的包括所述目标对象的待处理图像进行处理,得到相应的待使用识别结果;和/或,
基于至少一个终端设备接收到的与所述目标对象相对应的待使用识别结果;和/或,
基于与所述目标用户相对应的地图数据信息,确定所述待使用识别结果。
根据本公开的一个或多个实施例,【示例十三】提供了一种图像处理方法,还包括:
可选的,所述目标对象与红绿指示灯相对应,所述目标识别结果包括通行状态,所述调取与所述目标识别结果相对应的目标提示内容,包括:
在所述通行状态为不可通行状态的条件下,确定所述目标提示内容为与所述不可通行状态相对应的音频信息以及第一振动频率;
在所述通行状态为可通行状态的条件下,则确定所述目标提示内容为与所述可通行状态相对应的音频信息以及第二振动频率。
根据本公开的一个或多个实施例,【示例十五】提供了一种图像处理方法,还包括:
可选的,在启动摄像装置进入拍摄界面之后,还包括:
若检测到于所述拍摄界面的触发操作,满足从所述拍摄界面回退至所述显示界面的条件,则回退至所述显示界面,并播报回退至所述显示界面的提示信息。
根据本公开的一个或多个实施例,【示例十六】提供了一种图像处理装置,包括:
图像采集模块,用于在检测到对显示界面的触发操作时,启动摄像装置,以基于所述摄像装置拍摄包括目标对象的待处理图像;
图像识别模块,用于通过对所述待处理图像分析处理,确定与所述目标对象相对应的目标识别结果;
提示模块,用于调取与所述目标识别结果相对应的目标提示内容,以基于所述目标提示内容对目标用户进行提示。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (18)

1.一种图像处理方法,其特征在于,包括:
在检测到对显示界面的触发操作时,启动摄像装置,以基于所述摄像装置拍摄包括目标对象的待处理图像;
通过对所述待处理图像分析处理,确定与所述目标对象相对应的目标识别结果;
调取与所述目标识别结果相对应的目标提示内容,以基于所述目标提示内容对目标用户进行提示。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取所述目标用户的当前位置信息;
若所述当前位置信息与至少一个预设位置信息相对应,则检测所述目标用户对所述显示界面的触发操作。
3.根据权利要求1所述的方法,其特征在于,还包括:
在检测到目标运动主体的当前位置信息与所述目标用户的目标位置信息相对应时,检测所述目标用户于所述显示界面的触发操作。
4.根据权利要求2或3所述的方法,其特征在于,在所述检测所述目标用户对所述显示界面的触发操作之前,还包括:
启动目标应用程序,以进入所述目标应用程序的主界面,并在检测到所述目标用户于所述主界面的触发操作时,启动摄像装置;
其中,所述主界面对应于所述显示界面。
5.根据权利要求4所述的方法,其特征在于,在启动所述目标应用程序之后,还包括:
对所述目标用户进行程序启动提示,以基于所述程序启动提示于显示界面上触发操作;
其中,所述程序启动提示包括语音提示和/或震动提示,所述语音提示的内容包括启动摄像装置的触发操作内容和/或进入启动界面的内容提示。
6.根据权利要求1所述的方法,其特征在于,所述显示界面整体对应于一个操作控件。
7.根据权利要求1所述的方法,其特征在于,所述在检测到对显示界面的触发操作时,启动摄像装置,包括:
当检测到于所述显示界面的单击操作时,启动所述摄像装置;和/或,
当检测到于所述显示界面的双击操作时,启动摄像装置;和/或,
当检测到于所述显示界面的按压时长达到预设时长阈值时,启动所述摄像装置;和/或,
当检测到于所述显示界面的触摸轨迹满足预设轨迹时,启动所述摄像装置;和/或,
当检测到于所述显示界面的手部姿态与至少一个预设姿态相对应时,启动所述摄像装置。
8.根据权利要求1所述的方法,其特征在于,通过对所述待处理图像分析处理,确定与所述目标对象相对应的目标识别结果,包括:
基于预先训练得到的图像处理模型识别所述待处理图像中的目标对象,以得到与所述目标对象相对应的目标识别结果。
9.根据权利要求8所述的方法,其特征在于,所述目标对象为红绿指示灯,所述基于预先训练得到的图像处理模型识别所述待处理图像中的目标对象,以得到与所述目标对象相对应的目标识别结果,包括:
将所述待处理图像输入至所述图像处理模型中,以基于所述图像处理模型确定与所述红绿指示灯相对应的通行状态,并将所述通行状态作为所述目标识别结果;
其中,所述通行状态包括可通行状态或不可通行状态。
10.根据权利要求8所述的方法,其特征在于,所述目标对象为目标车辆或文字信息,所述基于预先训练得到的图像处理模型识别所述待处理图像中的目标对象,以得到与所述目标对象相对应的目标识别结果,包括:
基于所述图像处理模型识别所述待处理图像中目标对象的车辆信息或文字内容,得到与所述目标对象相对应的目标识别结果。
11.根据权利要求8所述的方法,其特征在于,还包括:
获取至少一个终端设备所确定的与所述目标对象相对应的待使用识别结果;
根据所述待使用识别结果和所述图像处理模型所输出的目标识别结果,更新所述目标识别结果。
12.根据权利要求11所述的方法,其特征在于,所述获取至少一个终端设备所确定的与所述目标对象相对应的待使用识别结果,包括:
基于至少一个终端设备对采集的包括所述目标对象的待处理图像进行处理,得到相应的待使用识别结果;和/或,
基于至少一个终端设备接收到的与所述目标对象相对应的待使用识别结果;和/或,
基于与所述目标用户相对应的地图数据信息,确定所述待使用识别结果。
13.根据权利要求1所述的方法,其特征在于,所述目标对象与红绿指示灯相对应,所述目标识别结果包括通行状态,所述调取与所述目标识别结果相对应的目标提示内容,包括:
在所述通行状态为不可通行状态的条件下,确定所述目标提示内容为与所述不可通行状态相对应的音频信息以及第一振动频率;
在所述通行状态为可通行状态的条件下,则确定所述目标提示内容为与所述可通行状态相对应的音频信息以及第二振动频率。
14.根据权利要求13所述的方法,其特征在于,所述基于所述目标提示内容进行提示,包括:
播放相应的音频信息以及控制与所述目标用户相对应的终端设备以相应振动频率进行振动。
15.根据权利要求1所述方法,其特征在于,在启动摄像装置进入拍摄界面之后,还包括:
若检测到于所述拍摄界面的触发操作,满足从所述拍摄界面回退至所述显示界面的条件,则回退至所述显示界面,并播报回退至所述显示界面的提示信息。
16.一种图像处理装置,其特征在于,包括:
图像采集模块,用于在检测到对显示界面的触发操作时,启动摄像装置,以基于所述摄像装置拍摄包括目标对象的待处理图像;
图像识别模块,用于通过对所述待处理图像分析处理,确定与所述目标对象相对应的目标识别结果;
提示模块,用于调取与所述目标识别结果相对应的目标提示内容,以基于所述目标提示内容对目标用户进行提示。
17.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-15中任一所述的图像处理方法。
18.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-15中任一所述的图像处理方法。
CN202210970119.6A 2022-08-12 2022-08-12 图像处理方法、装置、电子设备及存储介质 Pending CN117636290A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210970119.6A CN117636290A (zh) 2022-08-12 2022-08-12 图像处理方法、装置、电子设备及存储介质
PCT/CN2023/111671 WO2024032586A1 (zh) 2022-08-12 2023-08-08 图像处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210970119.6A CN117636290A (zh) 2022-08-12 2022-08-12 图像处理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117636290A true CN117636290A (zh) 2024-03-01

Family

ID=89850882

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210970119.6A Pending CN117636290A (zh) 2022-08-12 2022-08-12 图像处理方法、装置、电子设备及存储介质

Country Status (2)

Country Link
CN (1) CN117636290A (zh)
WO (1) WO2024032586A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118642970A (zh) * 2024-08-14 2024-09-13 浙江大华技术股份有限公司 可视化验证方法、电子设备和计算机可读存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101783964A (zh) * 2010-03-18 2010-07-21 上海乐毅信息科技有限公司 基于图像识别技术的色盲或色弱者辅助驾驶系统
CN101950478A (zh) * 2010-08-24 2011-01-19 宇龙计算机通信科技(深圳)有限公司 一种红绿灯状态信息的提示方法、系统及移动终端
CN106375448A (zh) * 2016-09-05 2017-02-01 腾讯科技(深圳)有限公司 图像处理方法和装置及系统
CN106791421A (zh) * 2016-12-30 2017-05-31 珠海市魅族科技有限公司 拍摄控制方法及拍摄控制装置
KR102047988B1 (ko) * 2017-12-14 2019-11-22 주식회사 코이노 시력 취약계층을 위한 시력 보조장치와 원격관리장치 및 시력 보조방법
CN109246358B (zh) * 2018-10-30 2020-11-10 广州小鹏汽车科技有限公司 一种车顶摄像头的控制方法及系统
CN110335486A (zh) * 2019-07-08 2019-10-15 盐城工学院 一种新型色盲辅助驾驶系统
US20220065650A1 (en) * 2020-07-16 2022-03-03 Eyal Shlomot Universal Pointing and Interacting Device for the Guidance of the Blind and Visually Impaired
CN113409608A (zh) * 2021-06-25 2021-09-17 阿波罗智联(北京)科技有限公司 针对交通信号灯的提示方法、装置、车辆和电子设备
KR102407126B1 (ko) * 2021-09-13 2022-06-08 김규석 형상 및 색채 인식 카메라를 채용한 시각장애인용 스마트 안경 시스템

Also Published As

Publication number Publication date
WO2024032586A1 (zh) 2024-02-15

Similar Documents

Publication Publication Date Title
TWI765304B (zh) 圖像重建方法及圖像重建裝置、電子設備和電腦可讀儲存媒體
US11048983B2 (en) Method, terminal, and computer storage medium for image classification
CN110147705B (zh) 一种基于视觉感知的车辆定位方法及电子设备
US20210110522A1 (en) Image processing method and apparatus, and storage medium
US11443438B2 (en) Network module and distribution method and apparatus, electronic device, and storage medium
US20210166040A1 (en) Method and system for detecting companions, electronic device and storage medium
CN106407984B (zh) 目标对象识别方法及装置
US11120707B2 (en) Cognitive snapshots for visually-impaired users
EP3901827B1 (en) Image processing method and apparatus based on super network, intelligent device and computer storage medium
CN109190648B (zh) 模拟环境生成方法、装置、移动终端及计算机可读取存储介质
TW202201273A (zh) 姿態檢測及視頻處理方法、電子設備和電腦可讀儲存介質
CN110619027B (zh) 一种房源信息的推荐方法、装置、终端设备及介质
CN109670458A (zh) 一种车牌识别方法及装置
CN110457571B (zh) 获取兴趣点信息的方法、装置、设备及存储介质
CN110347875B (zh) 一种视频场景分类方法、装置、移动终端及存储介质
WO2024032586A1 (zh) 图像处理方法、装置、电子设备及存储介质
CN110866524A (zh) 车牌检测方法、装置、设备及存储介质
CN111126159A (zh) 用于实时跟踪行人的方法、装置、电子设备和介质
CN111310595B (zh) 用于生成信息的方法和装置
CN111723124B (zh) 数据碰撞分析的方法、装置、电子设备和存储介质
CN111586295A (zh) 图像生成方法、装置和电子设备
CN112231023A (zh) 一种信息显示方法、装置、设备及存储介质
WO2022110801A1 (zh) 数据处理方法及装置、电子设备和存储介质
CN110334763B (zh) 模型数据文件生成、图像识别方法、装置、设备及介质
CN114648315A (zh) 虚拟面试的方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination