CN116434253A - 图像处理方法、装置、设备、存储介质及产品 - Google Patents

图像处理方法、装置、设备、存储介质及产品 Download PDF

Info

Publication number
CN116434253A
CN116434253A CN202210001773.6A CN202210001773A CN116434253A CN 116434253 A CN116434253 A CN 116434253A CN 202210001773 A CN202210001773 A CN 202210001773A CN 116434253 A CN116434253 A CN 116434253A
Authority
CN
China
Prior art keywords
image
processed
prompt information
information
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210001773.6A
Other languages
English (en)
Inventor
权星辉
刘玉林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202210001773.6A priority Critical patent/CN116434253A/zh
Publication of CN116434253A publication Critical patent/CN116434253A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Technology (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种图像处理方法、装置、设备、存储介质及产品,属于人工智能技术领域。所述方法包括:在每获取到一帧待处理图像之后,检测待处理图像是否包括第一对象;在检测到第一待处理图像包括第一对象的情况下,展示第一对象对应的展示图像,以及展示图像对应的操作提示信息;在第一对象的摆放状态符合预设条件的情况下,将展示图像确定为第一对象对应的目标图像。本申请实施例可应用于云技术、人工智能、智慧教育等场景,通过展示待处理图像中第一对象对应的部分图像,缩减无关展示内容;通过展示操作提示信息提示用户调整第一对象摆放状态,在摆放状态符合条件的情况下将展示图像作为目标图像,简化了操作步骤,提升了图像处理的整体效率。

Description

图像处理方法、装置、设备、存储介质及产品
技术领域
本申请涉及人工智能技术领域,特别涉及一种图像处理方法、装置、设备、存储介质及产品。
背景技术
随着计算机技术的不断发展,智能教育终端被广泛应用到日常的教育学习生活中,实现了电子产品与教育行业的融合,为人们的生活和学习提供了便捷。
相关技术中,学生用户可以在终端摄像头下方摆放作业本,并自行调整作业本的位置。学生用户将作业本位置调整好之后,手动点击拍照按钮,终端会在固定范围对作业进行拍照,并将拍摄的作业照片显示在屏幕中进行作业照片上传前的预览。学生用户看到预览照片后,自行判断是否可以上传,如果判断可以上传,学生用户可以手动点击上传按钮,进行作业照片上传。
相关技术中,图像拍照上传的操作繁琐、图像质量依赖人工调整、拍照得到的图像质量较低,整体效率低下。
发明内容
本申请实施例提供了一种图像处理方法、装置、设备、存储介质及产品,能够降低图像处理操作的复杂度,提升图像处理的整体效率,优化用户体验。
根据本申请实施例的一个方面,提供了一种图像处理方法,所述方法包括:
在每获取到一帧待处理图像之后,检测所述待处理图像是否包括第一对象;
在检测到第一待处理图像包括所述第一对象的情况下,展示所述第一对象对应的展示图像,以及所述展示图像对应的操作提示信息;其中,所述展示图像为所述第一待处理图像中所述第一对象所在的定位区域对应的图像,所述操作提示信息用于提示目标对象调整所述第一对象的摆放状态;
在所述第一对象的摆放状态符合预设条件的情况下,将所述展示图像确定为所述第一对象对应的目标图像。
根据本申请实施例的一个方面,提供了一种图像处理装置,所述装置包括:
对象检测模块,用于在每获取到一帧待处理图像之后,检测所述待处理图像是否包括第一对象;
信息展示模块,用于在检测到第一待处理图像包括所述第一对象的情况下,展示所述第一对象对应的展示图像,以及所述展示图像对应的操作提示信息;其中,所述展示图像为所述第一待处理图像中所述第一对象所在的定位区域对应的图像,所述操作提示信息用于提示目标对象调整所述第一对象的摆放状态;
图像确定模块,用于在所述第一对象的摆放状态符合预设条件的情况下,将所述展示图像确定为所述第一对象对应的目标图像。
根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述图像处理方法。
根据本申请实施例的一个方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述图像处理方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行以实现上述图像处理方法。
本申请实施例提供的技术方案可以带来如下有益效果:
通过在获取到一帧待处理图像之后检测获取到的待处理图像是否包含第一对象,可以快速检测到包含第一对象的待处理图像;在检测到第一待处理图像包含第一对象的情况下,便会展示第一对象在待处理图像中所在的定位区域对应的部分图像,有效缩减了待处理图像中与第一对象无关的图像内容,提升了图像质量;并且还会展示相对应的操作提示信息,以提示用户及时调整第一对象的摆放状态,在摆放状态符合预设条件的情况下即可将展示图像确定为目标图像,降低了图像处理操作的复杂度,提升了图像处理的整体效率,优化了用户体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示例性示出了一种作业拍照批改功能的页面交互流程图;
图2是本申请一个实施例提供的应用程序运行环境的示意图;
图3示例性示出了一种智能教育台灯的示意图;
图4是本申请一个实施例提供的图像处理方法的流程图一;
图5是本申请一个实施例提供的图像处理方法的流程图二;
图6示出了本申请实施例提供的一种通过跟踪对象位置进行对象显示的场景示意图;
图7示例性示出了一种作业拍摄的场景示意图;
图8示例性示出了作业拍照页面中预览作业图像的示意图;
图9示例性示出了一种根据对象摆放状态展示操作提示信息的示意图;
图10是本申请一个实施例提供的图像处理方法的流程图三;
图11示例性示出了一种作业拍照批改的流程图;
图12是本申请一个实施例提供的图像处理方法的流程图四;
图13是本申请一个实施例提供的图像处理装置的框图;
图14是本申请一个实施例提供的计算机设备的结构框图;
图15是本申请另一个实施例提供的计算机设备的结构框图。
具体实施方式
本申请实施例提供的图像处理方法涉及人工智能技术,下面对此进行简要说明,以便于本领域技术人员理解。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建、自动驾驶、智慧交通等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。在本申请实施例中,可以基于上述计算机视觉技术对采集到的图像进行对象识别、文本识别、图像检索等处理,得到相关的处理结果。
语音技术(Speech Technology)的关键技术有自动语音识别技术和语音合成技术以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。在本申请实施例中,终端可以对采集的音频进行识别。比如,根据用户音频识别其中的操作指令,比如用户说“拍照”,终端根据上述语音技术识别到“拍照”之后,对目标对象进行拍照,得到目标图像。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。在本申请实施例中,终端可以对采集的图像进行文本识别,对识别到的文本还可以进一步进行自然语言处理,得到处理结果。比如,在智能教育场景中,终端拍摄到作业问题之后可以自动输出该问题对应的标准答案,或者根据标准答案对识别到的答案进行批改。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。在本申请实施例中,可通过训练机器学习模型执行相关的信息处理任务,本申请实施例对此不作限定。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。智能教育是本申请实施例一种的典型的应用场景,智能教育场景中,上述人工智能技术可以在教育辅导任务中起到重要作用,比如智能作业批改、智能解题、智能搜题等,都可以通过对采集的图像进行处理得以实现。
此外,本申请实施例提供的图像处理方法还涉及云技术领域,比如下述云教育场景。
云教育(Cloud Computing Education简称:CCEDU),是指基于云计算商业模式应用的教育平台服务。在云平台上,所有的教育机构,培训机构,招生服务机构,宣传机构,行业协会,管理机构,行业媒体,法律结构等都集中云整合成资源池,各个资源相互展示和互动,按需交流,达成意向,从而降低教育成本,提高效率。
下面对本申请实施例中可能涉及的相关术语或者名词进行简要介绍,以便于本申请领域技术人员理解。
智能教育台灯是一种辅助学生群体学习的智能带屏台灯产品,一般会配置两颗摄像头,位于灯头向下的摄像头用于拍摄书桌和作业,向前的摄像头用于拍摄人的坐姿和视频通话,通常支持的功能有作业拍照批改、不良坐姿检测、指尖点读单词等。
作业拍照是指通过台灯的顶部摄像头,对书桌上的作业本进行拍摄,上传后台进行作业批改,或提交给家长、老师侧的客户端。
作业批改是指通过对学生拍照上传的作业图片进行OCR(Optical CharacterRecognition,光学字符识别),将图片内容转换为文字,识别出科目、题型等,并对学生的作答自动进行批改。批改对图片的分辨率、清晰度、作业本的位置等都有要求,质量越好的图片,批改结果的准确率越高。
在一个示例中,如图1所示,其示例性示出了一种作业拍照批改功能的页面交互流程图。学生用户可以在终端摄像头下方摆放作业本,并自行调整作业本的位置,页面01的预览区域02中可以显示摄像头自的采集图像。学生用户将作业本位置调整好之后,手动点击页面01中的拍照按钮03,终端会在固定范围对作业进行拍照,并将拍摄的作业照片显示在预览区域02中进行作业照片上传前的预览。学生用户看到预览照片后,自行判断是否可以上传,如果判断可以上传,学生用户可以手动点击页面01中上传批改按钮04,进行作业照片上传。
拍照取景区域:作业拍照过程中,台灯的屏幕上会实时显示相机的实际预览区域,用户可以明确拍照后的效果,一般是固定的矩形区域。
图片分辨率:图像中存储的信息量,每英寸图像内有多少像素点,分辨率越高图片越清晰。
边缘检测:边缘检测是图像处理中的一种分析图像的方法,目的是找到图像中亮度变化剧烈的像素点的集合,表现出来的一般是物体的轮廓;如轮廓可以精准检测,则可以物体的形状可以被测量。
运动检测:(Motion Detection),是指在序列图像中检测出变化区域并将运动目标从背景图像中提取出来,通常用于检测某个特定物体的运动/静止状态。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
请参考图2,其示出了本申请一个实施例提供的应用程序运行环境的示意图。该应用程序运行环境可以包括:终端10和服务器20。
终端10包括但不限于手机、电脑、智能语音交互设备、智能音箱、智能手表、智能电视、智能台灯、智能家电、车载终端、游戏主机、电子书阅读器、多媒体播放设备、可穿戴设备等电子设备。终端10中可以安装应用程序的客户端。
在本申请实施例中,上述应用程序可以是任何能够提供智能教育服务的应用程序。典型地,该应用程序为学习类应用程序。当然,除了学习类应用程序之外,其它类型的应用程序中也可以提供智能教育服务。例如,教育管理类应用程序、作业批改类应用程序、教辅类应用程序、互动教育类应用程序、办公类应用程序、虚拟现实(Virtual Reality,VR)类应用程序、增强现实(Augmented Reality,AR)类应用程序等,本申请实施例对此不作限定。
在示例性实施例中,上述终端10可以是智能教育台灯。请参阅图3,图3 示例性示出了一种智能教育台灯的示意图。在一种可能的实施方式中,智能教育台灯101搭载有摄像头1011,光线传感器1012和显示器1013。摄像头1011 用于采集图像,采集的图像会传输到搭载在智能教育台灯101内部的图像处理器进行处理(该图像处理器还可以搭载在显示器1013内部)。光线传感器1012用于检测周围环境光线强度,以及用于在满足补光条件时进行补光辅助处理。显示器1013用于显示用户交互界面,该显示器1013可以是一个触摸显示屏,不仅能够显示用户交互界面,还可以接收用户的操作。如图2所示,摄像头1011 安装在智能教育台灯101的杆部,实践发现,将摄像头1011安装在智能教育台灯101的杆部既可以较完整的采集作业图像,又可以确保采集图像的清晰度较高。光线传感器1012位于摄像头1011的旁边,具体可以是摄像头1011周围的任一位置,将光线传感器1012安装在摄像头1011的旁边有助于更加准确的检测摄像头在采集图像时周围环境的光线强度,便于在满足补光条件时进行补光。显示器1013位于智能教育台灯101的底座上方,在一种实施方式中,显示器1013 还搭载有声音输出装置(如扬声器),以便于在用户摆放作业过程中向用户播放操作提示信息,以优化作业摆放状态,进而提升拍照图像质量。此外,智能教育台灯101还搭载有光源1014,可以理解的是,智能教育台灯101可以通过光源 1014进行补光(增强周围环境光线强度);在不使用智能功能的情况下,智能教育台灯101可以作为普通台灯进行使用。在智能教育台灯101的设备主体1015还可以搭载有声音输出装置,蓄电池,数据传输接口(USB接口,充电接口等),对此本申请不作限制。在一种典型的应用场景中,比如作业拍照上传的场景,智能教育台灯101可通过摄像头1011采集作业图像。采集作业图像后,可以识别作业图像中作业的位置,或者识别作业图中用户手指的位置,通过上述两种位置均可对作业进行定位,从而在显示器1013中以最大分辨率显示作业内容。
在图2示例中,服务器20用于为终端10中的应用程序的客户端提供后台服务。例如,服务器20可以是上述应用程序的后台服务器。服务器20可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(ContentDelivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。可选地,服务器20同时为多个终端10中的应用程序提供后台服务。
可选地,终端10和服务器20之间可通过网络30进行互相通信。终端10 以及服务器20可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
请参考图4,其示出了本申请一个实施例提供的图像处理方法的流程图一。该方法可应用于计算机设备中,所述计算机设备是指具备数据计算和处理能力的电子设备,如各步骤的执行主体可以是图2所示的应用程序运行环境中的终端10。该方法可以包括以下几个步骤(410~430)。
步骤410,在每获取到一帧待处理图像之后,检测待处理图像是否包括第一对象。
可选地,待处理图像为按照预设频率从相机采集的图像帧序列中进行抽取得到的图像。相应的,在每从图像帧序列抽取到一帧图像之后,将其作为上述待处理图像并检测待处理图像是否包括第一对象。
可选地,上述第一对象为拍摄对象,本申请实施例对第一对象的类型、形状等信息不作限定,第一对象可以为任一种拍摄对象。在智能教育场景中,上述第一对象包括但不限于学生作业、试题、书本等拍摄对象。
在示例性实施例中,如图5所示,上述步骤410的实施过程包括如下步骤 (411~412),图5示出了本申请一个实施例提供的图像处理方法的流程图二。
步骤411,在每获取到一帧待处理图像之后,对待处理图像进行第一对象检测处理,得到第一检测结果。
在一种可能的实施方式中,上述第一对象检测处理为与第一对象对应的边缘检测处理。在每获取到一帧待处理图像之后,对待处理图像进行边缘检测处理,得到第一检测结果。上述第一检测结果包括第一对象对应的边缘信息。可选地,上述边缘信息包括第一对象对应的定位点的坐标。可选地,上述定位点为第一对象对应的顶点。
如果待处理图像中包括完整的第一对象,那么第一检测结果中包括第一对象的整体边缘信息。上述整体边缘信息包括第一对象对应的全部定位点的坐标信息。例如,第一对象的形状为矩形,上述第一对象的全部定位点的坐标信息包括矩形对应的四个顶点的坐标信息。
如果待处理图像中包括局部的第一对象,那么第一检测结果中包括第一对象的局部边缘信息。上述局部边缘信息包括第一对象对应的部分定位点的坐标信息。这里同样以第一对象的形状为矩形为例,上述第一对象的部分定位点的坐标信息包括矩形对应的四个顶点中部分顶点的坐标信息。
步骤412,若第一待处理图像对应的第一检测结果指示第一待处理图像包括第一对象的整体边缘信息或局部边缘信息,则确定第一待处理图像包括第一对象。
在一种可能的实施方式中,待处理图像中包括第一对象的情况可分为两种,一种是待处理图像包括完整的第一对象,即待处理图像包括第一对象的整体边缘信息;另一种是待处理图像包括不完整的第一对象,即待处理图像包括第一对象的局部边缘信息。
步骤420,在检测到第一待处理图像包括第一对象的情况下,展示第一对象对应的展示图像,以及展示图像对应的操作提示信息。
其中,展示图像为第一待处理图像中第一对象所在的定位区域对应的图像,操作提示信息用于提示目标对象调整第一对象的摆放状态。
可选地,上述定位区域为待处理图像中包括第一对象的部分区域。上述部分区域可以为待处理图像中包括第一对象的最小区域。上述定位区域中包括第一对象在待处理图像中对应的全部边缘信息,待处理图像中的定位区域外的图像内容是与第一对象无关的内容图像内容。例如,上述第一对象为矩形,那么第一对象在待处理图像可能会占据一个矩形区域,终端仅可展示该矩形区域对应的图像内容即可。上述展示图像中第一对象占据的图像面积大于等于预设比例阈值。上述第一对象在上述展示图像中处于居中位置。
在一种可能的实施方式中,展示第一对象对应的展示图像包括:在预设页面的预览区域中显示上述展示图像。
上述操作提示信息包括至少一种媒体类型的提示信息,上述媒体类型包括但不限于文本类型、图像类型、音频类型、视频类型。
在一种可能的实施方式中,展示操作提示信息包括:在操作提示信息为文本类型的情况下,在上述预设页面中显示文本提示信息;在操作提示信息为图像或视频类型的情况下,在上述预设页面中显示图像提示信息或视频提示信息;在操作提示信息为音频类型的情况下,播放语音提示信息。
可选地,上述操作提示信息包括角度调整提示信息、卷角调整提示信息、位置调整提示信息、静止提示信息。上述角度调整提示信息用于提升目标对象调整第一对象的摆放角度;上述卷角调整提示信息用于提示目标对象调整第一对象的卷角;上述位置调整提示信息用于提示目标对象调整第一对象的摆放位置;上述静止提示信息用于提示目标对象静止放置第一对象。可选地,每种操作提示信息都对应有各种媒体类型的提示信息。
通过只展示待处理图像中第一对象所在定位区域对应的图像,可以实现对第一对象的跟踪显示,无论第一对象在待处理图像中的什么位置,都可确保第一对象在页面预览区域中以最大分辨率居中展示,取消显示定位区域之外的无关图像内容,能够有效提升展示图像质量。
在示例性实施例中,如图5所示,上述步骤420的实施过程包括如下步骤 (421~423)。
步骤421,若第一待处理图像包括第一对象的整体边缘信息,则基于整体边缘信息确定定位区域以及第一对象的摆放角度。
在一种可能的实施方式中,基于整体边缘信息中的定位点的坐标信息,确定上述定位区域。可选地,基于整体边缘信息中的顶点的坐标信息,确定上述定位区域。可选地,基于第一对象的整体边缘信息,确定第一对象在纵向方向上对应的纵向间距极大值以及在横向方向上对应的横向间距极大值。基于上述纵向最大间距以及横向最大间距,可以确定第一对象对应的定位区域。比如,将纵向最大间距与横向最大间距确定的边界向外延伸预设像素值,得到上述定位区域,可选地,上述预设像素值为20像素。
在一种可能的实施方式中,基于整体边缘信息中的定位点的坐标信息,确定上述摆放角度。可选地,基于整体边缘信息中的顶点的坐标信息,确定上述摆放角度。比如,基于顶点的坐标可以确定顶点之间的连线,即对象边;将顶点间连线与水平方向的形成的夹角的角度,或者将顶点间连线与竖直方向形成的夹角的角度,确定为上述摆放角度。
步骤422,展示定位区域对应的展示图像。
可选地,在预设页面的预设区域显示上述展示图像。
在一种坑可能的应用场景中,上述第一对象在待处理图像中是斜向放置的。因此可以确定斜向定位区域,然后再预设区域进行显示时将斜向定位区域进行旋转,在上述预设区域显示旋转后的斜向定位区域对应的展示图像。
在一个示例中,如图6所示,图6示出了本申请实施例提供的一种通过跟踪对象位置进行对象显示的场景示意图。在图6的示例中,上述第一对象为作业本61,进行对象显示的设备为智能教育台灯62。智能教育台灯62在其拍摄范围内,可以自动跟踪作业本62的位置,并根据作业本62的位置确定作业本 62所在的定位区域63,进而可以在屏幕的预览区域64中显示定位区域63对应的图像,这样能够使得作业本62始终位于预览区域64的中心,并以最大分辨率在预览区域64中进行显示。
在另一个示例中,如图7所示,图7示例性示出了一种作业拍摄的场景示意图。在图7中,作业拍照设备的预览区域71限制严格,一般位于设备正下方,位置固定。学生必须手动把作业本72放到设备正下方之后点击拍摄按钮进行拍照,否则可能出现拍不全等问题。此种方式下的图片质量完全取决于学生的操作和摆放规范,如学生摆放离台灯较远则作业本分辨率会降低,且可能出现作业本摆放方向、四角不全、作业发生卷曲等,导致后台批改准确率下降。如图8 所示,图8示例性示出了作业拍照页面中预览作业图像的示意图。在预览页面 81中,由于作业本72与摄像头之间的距离远,作业本72在预览页面81的尺寸较小;在预览页面82中,由于图7中预览区域71位置固定,学生未将作业本 72摆放至预览区域71中,导致作业本72在预览页面82中出现缺角;由于学生未将作业本72摆放至预览区域71中,导致作业本72在预览页面83中角度不对的问题;在预览页面84中,出现作业本72存在折角或弯曲的问题。
相比于图7示例对应的作业拍摄方案,图6示例对应的跟踪作业位置进行作业预览拍摄的方式,能够在作业本在相机拍摄范围内的情况下,始终保持作业本位于预览区域中心,并以最大分辨率在预览区域中进行显示,有效提升了图像质量。
步骤423,在摆放角度大于角度阈值的情况下,展示角度调整提示信息。
操作提示信息包括角度调整提示信息。
上述摆放角度若大于角度阈值,则说明第一对象的没有摆正,即可展示上述角度调整信息,提示目标对象将第一对象摆正。可选地,上述角度阈值为10 度。
在一种可能的实施方式中,上述角度调整提示信息包括角度调整语音提示信息。相应的,在摆放角度大于角度阈值的情况下,播放角度调整语音提示信息。比如,角度调整语音提示信息为“方向不对,请将第一对象正向放置”。相应的,上述角度调整提示信息还包括角度调整文本提示信息,在摆放角度大于角度阈值的情况下,在预设页面显示角度调整文本提示信息。
在一种可能的实施方式中,上述角度调整提示信息还包括边框提示信息。相应的,在摆放角度大于角度阈值的情况下,在预览区域中给第一对象添加第一样式的边框。比如,在展示图像中第一对象的边缘处添加红色边框。
在示例性实施例中,如图5所示,上述步骤420的实施过程还包括如下步骤(424~425)。
步骤424,对展示图像进行卷角检测处理,得到第一对象的卷角检测结果。
在一种可能的实施方式中,根据椭圆检测算法对展示图像进行处理,检测展示图像中是否包括卷角。
在一种可能的实施方式中,将展示图像输入至卷角检测模型进行卷角检测处理,得到第一对象的卷角检测结果。可选地,卷角检测模型是基于训练样本图像和样本图像对应的标签进行训练得到的机器学习模型。上述样本图像包括包含卷角的对象图像,上述标签指示图像是否包括卷角。
上述卷角检测结果用于指示第一对象是否存在卷角。卷角检测结果包括两种情况,一种是第一对象存在卷角;另一种是第一对象不存在卷角。在第一对象存在卷角的情况下,卷角检测结果还包括卷角定位信息,用于指示卷角位置。
步骤425,在卷角检测结果指示第一对象存在卷角的情况下,展示卷角调整提示信息。
操作提示信息包括卷角调整提示信息。
在一种可能的实施方式中,上述卷角调整提示信息包括卷角调整语音提示信息。相应的,在卷角检测结果指示第一对象存在卷角的情况下,播放卷角调整语音提示信息。比如,卷角调整语音提示信息为“作业本存在卷曲,请保持四角完整”。相应的,上述卷角调整提示信息还包括卷角调整文本提示信息,在卷角检测结果指示第一对象存在卷角的情况下,在预设页面显示卷角调整文本提示信息。
在一种可能的实施方式中,上述卷角调整提示信息还包括边框提示信息。相应的,在卷角检测结果指示第一对象存在卷角的情况下,在预览区域中给第一对象添加第一样式的边框。比如,在展示图像中第一对象的边缘处添加红色边框。
在示例性实施例中,如图5所示,上述步骤420的实施过程还包括如下步骤(426~427)。
步骤426,若第一待处理图像包括第一对象的局部边缘信息,则基于局部边缘信息确定定位区域。
在一种可能的实施方式中,基于局部边缘信息中的定位点的坐标信息,确定上述定位区域。可选地,基于局部边缘信息中的顶点的坐标信息,确定上述定位区域。
步骤427,展示定位区域对应的展示图像,以及局部边缘信息对应的位置调整提示信息。
操作提示信息包括位置调整提示信息。基于局部边缘信息确定出的定位区域对应的展示图像中,包括不完整的第一对象。
在一种可能的实施方式中,上述位置调整提示信息包括位置调整语音提示信息。相应的,在第一待处理图像包括第一对象的局部边缘信息的情况下,播放位置调整语音提示信息。比如,位置调整语音提示信息为“未检测到完整作业本,请调整位置”。相应的,上述位置调整提示信息还包括位置调整文本提示信息,在第一待处理图像包括第一对象的局部边缘信息的情况下,在预设页面显示位置调整文本提示信息。
在一种可能的实施方式中,上述位置调整提示信息还包括边框提示信息。相应的,在第一待处理图像包括第一对象的局部边缘信息的情况下,在预览区域中给第一对象添加第一样式的边框。比如,在第一对象在展示图像中的局部边缘添加红色边框。
在一个示例中,如图9所示,其示例性示出了一种根据对象摆放状态展示操作提示信息的示意图。可选地,图9中的第一对象为作业本。本申请实施例应用于作业拍照批改场景中,可实时检测作业摆放的正确性,如不正确则做出相应语音提示,且在作业本边缘画红框;如正确则在作业本边缘画绿框,语音提示正确。比如,在预览区域95中的作业本91不完整的情况下,在作业本91 边缘绘制红色边框,并播放第一语音提示信息“未检测到完整作业本,请调整位置”;在预览区域95中的作业本92未正向摆放的情况下,在作业本92边缘绘制红色边框,并播放第二语音提示信息“方向不对,请将作业本正向放置”;在预览区域95中的作业本93存在卷角的情况下,在作业本93边缘绘制红色边框,并播放第三语音提示信息“作业本存在卷曲,请保持四角完整”;在预览区域95中的作业本94摆放正确的情况下,在作业本94边缘绘制绿色边框,并播放第四语音提示信息“摆放正确,请保持静止”。
步骤430,在第一对象的摆放状态符合预设条件的情况下,将展示图像确定为第一对象对应的目标图像。
上述预设条件是指判断摆放状态的条件。上述摆放状态爱用于表征对象展示质量。
上述摆放状态包括第一对象的对象边缘状态、摆放角度状态、卷角状态、运动状态。
上述预设条件包括对象完整条件、摆放角度条件、卷角条件、静止条件。可选地,上述对象完整条件为图像包括完整边缘信息。可选地,上述摆放角度条件为摆放角度小于等于角度阈值。可选地,卷角条件为无卷角。可选地,静止条件为对象处于静止状态。
在示例性实施例中,如图5所示,上述步骤430的实施过程还包括如下步骤(431~434)。
步骤431,在摆放角度小于等于角度阈值,且卷角检测结果指示第一对象不存在卷角的情况下,对第一对象进行运动检测处理,得到运动检测结果。
可选地,将第一对象在当前待处理图像的位置信息,与第一对象在前序待处理图像中的位置信息进行比较,得到运动检测结果。
若第一对象在当前待处理图像与前序待处理图像之前的位置发生变化,则确定第一对象处于运动状态;若第一对象在当前待处理图像与前序待处理图像之前的位置发生未变化,则确定第一对象处于静止状态。
上述前序待处理对象是指在当前待处理图像之前的待处理图像。
步骤432,若运动检测结果指示第一对象处于静止状态,则将展示图像确定为目标图像。
第一对象不再移动,说明目标对象摆放第一对象完成,即可进行拍照处理,得到第一对象的快照图像。可选地,上述目标图像为第一对象的快照图像。
步骤433,若运动检测结果指示第一对象处于运动状态,则显示静止提示信息。
在一种可能的实施方式中,上述静止提示信息包括静止语音提示信息。相应的,在运动检测结果指示第一对象处于运动状态的情况下,播放静止语音提示信息。比如,静止语音提示信息为“摆放正确,请保持静止”。相应的,上述静止提示信息还包括静止提示文本信息,在运动检测结果指示第一对象处于运动状态的情况下,在预设页面显示静止提示文本信息。
在一种可能的实施方式中,上述静止提示信息还包括边框提示信息。相应的,在运动检测结果指示第一对象处于运动状态的情况下,在预览区域中给第一对象添加第二样式的边框。比如,在第一对象在展示图像中的局部边缘添加绿色边框。
步骤434,获取下一待处理图像。并再次从上述步骤411开始执行。
若第一对象处于运动状态,说明目标对象对第一对象的调整过程还未结束,只展示上述操作提示信息,并不进行拍照,获取下一帧重复进行上述流程即可;如第一对象在一定时间内处于静止状态,且摆放正确,则自动触发拍照,将展示图像确定为目标图像,并可将目标图像送入后续流程,比如上传,无需用户做任何的点击操作,降低操作复杂度。
在示例性实施例中,如图5所示,上述步骤430之后,还包括如下步骤(440)。
步骤440,将目标图像送入目标信息识别流程,得到目标图像对应的信息识别结果。
上述目标信息识别流程为任一种信息识别流程,上述信息识别流程中对上述目标图像进行多媒体处理,从而得到目标图像对应的信息识别结果。本申请实施例对信息识别流程以及多媒体处理的方式不作限定,可以根据具体的应用场景进行设置。
在智慧教育场景中上述第一对象为学生作业,相应的,上述信息识别流程可以为作业批改流程。
综上所述,本申请实施例提供的技术方案,在获取到一帧待处理图像之后会检测获取到的待处理图像是否包含第一对象,可以快速检测到包含第一对象的待处理图像;在检测到第一待处理图像包含第一对象的情况下,便会展示第一对象在待处理图像中所在的定位区域对应的部分图像,有效缩减了待处理图像中与第一对象无关的图像内容,提升了图像质量;并且还会展示相对应的操作提示信息,以提示用户及时调整第一对象的摆放状态,在摆放状态符合预设条件的情况下即可将展示图像确定为目标图像,降低了图像处理操作的复杂度,提升了图像处理的整体效率,优化了用户体验。
请参考图10,其示出了本申请一个实施例提供的图像处理方法的流程图三。该方法可应用于计算机设备中,所述计算机设备是指具备数据计算和处理能力的电子设备,如各步骤的执行主体可以是图2所示的应用程序运行环境中的终端10。该方法可以包括以下几个步骤(1001~1016)。
步骤1001,在每获取到一帧待处理图像之后,检测待处理图像是否包括第一对象。
在每获取到一帧待处理图像之后,对待处理图像进行第一对象检测处理,得到第一检测结果。
若第二待处理图像对应的第一检测结果指示第二待处理图像包括第一对象的整体边缘信息或局部边缘信息,则确定第二待处理图像包括第一对象。
步骤1002,在检测到第二待处理图像包括第一对象的局部边缘信息的情况下,根据局部边缘信息确定第二待处理图像中第一对象对应的边缘缺失方向。
上述边缘缺失方向是指待处理图像缺失的第一对象的部分边缘对应的方向。比如,待处理图像中只包括第一对象的左半部分,缺失第一对象的右半部分,那么上述边缘缺失方向即是待处理图像的左侧。
在一种可能的实施方式中,根据局部边缘信息中的定位点的坐标信息,确定上述边缘缺失方向。根据第一对象在待处理图像中对应的定位点的坐标可以确定上述边缘缺失方向。
在一种可能的实施方式中,根据局部边缘信息中的局部对象轮廓信息,确定上述边缘缺失方向。第一对象的整体轮廓通常情况下可视为闭合轮廓,上述局部对象轮廓通常无法构成一个闭合轮廓,那么可以根据局部对象轮廓确定轮廓缺口的位置,基于上述轮廓缺口位置即可确定上述边缘缺失方向。
在一种可能的实施方式中,可通过判断待处理图像中与第一对象的部分边缘接触的图像边,来上述边缘缺失方向。本申请实施例中,待处理图像未包括完整的第一对象的原因通常是相机取景框的取景区域未能完全覆盖到第一对象所在区域,而不是第一对象被遮挡的原因。因此,待处理图像包括的第一对象的局部边缘是与图像边接触的,第一对象也位于相机取景框的边界处。因此根据上述局部边缘信息,可以确定与第一对象在待处理图像中的局部边缘对应的图像边,将上述图像边所在方向确定为上述边缘缺失方向。
步骤1003,根据边缘缺失方向,将相机拍摄区域中的图像取景框由第一位置移动至第二位置。
其中,第一位置为图像取景框的当前位置,第二位置为图像取景框移动后的位置。
上述相机拍摄区域是指摄像头对应的最大可拍摄区域,是摄像头拍摄范围极限。上述相机取景框是指摄像头用于确定摄像头在相机拍摄区域内的取景区域。上述待处理图像是取景区域内的图像,并不一定是相机能拍摄到的最大范围图像。
可选地,在相机拍摄区域中,将图像取景框由第一位置向边缘缺失方向移动目标距离,到达至第二位置。上述目标距离可以是固定的预设值,也可以是根据上述局部边缘信息确定的移动距离。可选地,上述目标距离的单位为像素。
在执行上述步骤1003之前,可以先判断图像取景框是否已到达相机拍摄区域的边缘。
步骤1004,在图像取景框位于第二位置的情况下,对相机拍摄区域进行图像采集,重新获取待处理图像。
并再次从上述步骤1001开始执行。
图像取景框移动至第二位置后,重新对相机拍摄区域进行图像采集,将采集到的图像帧添加到相机对应的图像帧序列中。设备可以从图像帧序列中继续按照预设帧率抽取图像帧作为待处理图像,只不过此时在抽取到的待处理图像是第二位置的图像取景框在相机拍摄区域中对应的取景区域的图像。
步骤1005,在检测到第一待处理图像包括第一对象的局部边缘信息,且图像取景框到达相机拍摄区域的区域边缘的情况下,基于局部边缘信息确定定位区域。
若图像取景框移动到相机拍摄区域的区域边缘还是未能拍到第一对象,或者未能拍到完整的第一对象,那就说明第一对象的位置超出相机拍摄区域。除显示局部第一对象的展示图像之外,需要向用户发出位置调整提示信息,以使用户将第一对象移动至相机拍摄区域内。
步骤1006,展示定位区域对应的展示图像,以及局部边缘信息对应的位置调整提示信息。
其中,第一待处理图像是图像取景框到达区域边缘采集到的图像,操作提示信息包括位置调整提示信息。
步骤1007,在检测到第三待处理图像包括第一对象的整体边缘信息的情况下,基于整体边缘信息确定定位区域以及第一对象的摆放角度。
上述第一待处理图像、第二待处理图像、第三待处理图像都是相机采集的图像帧序列中不同的图像帧。
步骤1008,展示定位区域对应的展示图像。
步骤1009,在摆放角度大于角度阈值的情况下,展示角度调整提示信息。
操作提示信息包括角度调整提示信息。
步骤1010,在摆放角度小于等于角度阈值的情况下,对展示图像进行卷角检测处理,得到第一对象的卷角检测结果。
步骤1011,在卷角检测结果指示第一对象存在卷角的情况下,展示卷角调整提示信息。
操作提示信息包括卷角调整提示信息。
步骤1012,在卷角检测结果指示第一对象不存在卷角的情况下,对第一对象进行运动检测处理,得到运动检测结果。
步骤1013,若运动检测结果指示第一对象处于运动状态,则显示静止提示信息。
步骤1014,获取下一待处理图像。并再次从上述步骤1001开始执行。
步骤1015,若运动检测结果指示第一对象处于静止状态,则将展示图像确定为目标图像。
步骤1016,将目标图像送入目标信息识别流程,得到目标图像对应的信息识别结果。
本申请实施例的一种典型应用场景为智慧教育场景。在一种可能的实施方式中,本申请实施例提供的技术方案可应用于智能教育台灯中的作业拍照批改功能。请参考图11,其示例性示出了一种作业拍照批改的流程图。图11所示的流程如下:
s1、打开相机。
智能教育台灯响应于目标操作进入作业拍照流程,开启相机。
可选地,设置取景区域在正中间(台灯相机的拍照范围是正下方的一个长方形区域)。
s2、按一定帧率定期循环从相机取图。
可选地,帧率设置为每秒15帧。
s3、从相机获取待处理图片。
取到图片后,首先对待处理图片进行图像分辨率调整,从2560*1920调整到640*480,目的是减少后续图像检测的耗时。
s4、显示待处理图片到台灯屏幕的预览区域。
s5、调整后的图片传入边缘检测流程,获取作业本四个顶点。
通过边缘检测算法获取四个顶点的坐标,算法会返回坐标数据以及每个点的置信度,如置信度过低也认为顶点未检测到。
s6、判断四个顶点坐标是否齐全。若不全,执行s7;若齐全,执行s10。
判断四个顶点是否全部检测到,如不全,则将相机取景框自动向未纳入预览界面的顶点方向移动固定的像素值,以调整取景区域并再次检测相机拍摄到的待处理图片,直到四个顶点均在取景区域内,或者已经到了台灯拍照范围的边缘,无法再移动。
s7、判断取景区域是否已经在相机拍摄范围边缘无法移动。若取景区域无法再移动,执行s8;若取景区域可以继续移动,执行s9。
s8、提示用户:“未检测到完整作业本,请调整位置”。
如取景区域无法再移动,但四个顶点仍然不全,则语音提示用户:“未检测到完整作业本,请调整位置”。
s9、向顶点缺失方向移动相机的取景区域。再从s3开始执行。
可选地,将相机取景框自动向未纳入预览界面的顶点方向移动固定的像素值。
s10、基于四个顶点缩放待处理图像,让作业本最大分辨率显示。
让作业尽可能大的显示在屏幕预览区域。
如四个顶点均已在取景框内,可以确定一个矩形(定位区域),让每个点都在一条边上,缩放待处理图像,让这个矩形尽可能大在预览区域进行显示。可选地,矩形每条边距离屏幕的预览区域边缘的距离是20像素。
s11、根据顶点坐标判断作业本是否正放。若不正,执行s12;若正,执行 s14。
根据顶点坐标判断当前作业本方向是否正确,为了提高灵活性,这里设置角度的误差在10度左右。
s12、提示用户:“方向不对,请将作业本正向放置”。
如角度不正,则语音提示“方向不对,请将作业本正向放置”。
s13、在预览区域绘制红色边缘边框。
在角度不正的情况下,在预览界面给作业本绘制红色边框。
在存在卷角的情况下,在预览界面给作业本绘制红色边框。
s14、判断作业本是否存在卷角。若存在卷角,执行s15;若正常,执行s16。
可选地,利用椭圆检测算法,判断作业本的各个边缘是否存在卷角的情况。
s15、提示用户:“作业存在卷曲,请保证四角完整”。并执行s13。
如存在卷角,则语音提示“作业存在卷曲,请保证四角完整”
s16、提示用户:“摆放正确,请保持静止”。
语音提示用户“摆放正确,请保持静止”。可选地,在预览界面给作业本绘制绿色边框。
s17、判断作业本是否在运动。若静止,执行s18;若运动,执行s3。
检测以上一次传入的图片为基准,判断作业本处于移动还是静止状态。
如在运动状态,则不做其他处理,等待下一次相机取图。
s18、上传作业图像后台批改。
作业本如在静止状态,则自动将拍照的原图压缩为90质量的JPG(JointPhotographic Experts Group,联合图像专家组)图片,并上传到后台进行作业批改。
在图11所示的作业拍照批改上传的流程中,设备可以在学生移动和摆放作业本的过程中,通过边缘检测算法实时跟踪作业本的位置变化,让作业本始终以最大分辨率显示在屏幕预览的中心位置,并且还实时检测预览中作业本的摆放是否正确,绘制不同颜色的边框提示学生进行相应的调整,比如,当作业本方向不正、存在卷曲等情况绘制红色提示框;当摆正正确的时候绘制绿框提示摆放正确;在设备检测作业本的运动状态从运动中变为静止,且摆放正确的时候即可自动拍照上传作业图像。
应用本申请实施例提供的图像处理方法之后的作业拍照批改上传流程交互方式友好,学生的手始终可以保持在作业本的位置,无需单独点击拍照或上传按钮,系统会自动检测图片,满足条件后就会自动拍照并完成上传。另外,本申请实施例通过前置的一些检测和辅助,可引导学生拍出高质量的图片,减少由学生摸索操作导致的不确定性,使上传到云端的作业图片保证最大的分辨率,并且作业摆放方向和质量均可满足批改的要求。
综上所述,本申请实施例提供的技术方案,通过对待处理图像进行第一对象的检测处理,可以确定第一对象的边缘信息;在第一对象不完整的情况下,无需用户手动调整第一对象的摆放位置,设备自动向边缘缺失方向移动相机取景框,以便于采集包括完整的第一对象的图像,有效降低图像处理的操作复杂度;采集图像中包括完整的第一对象之后,根据第一对象的边缘信息可以确定出第一对象在待处理图像中所在的定位区域,并对该定位区域的图像进行展示,有效缩减的展示图像中的无关内容,有效提升了图像质量;此外,还对第一对象在展示图像中的摆放状态进行检测,在摆放状态不佳的情况下可以向用户发出操作提示,以提示用户调整第一对象的摆放状态;在摆放状态符合预设条件的情况下将展示图像确定为目标图像并送入后续的信息识别流程,有效提升了图像质量,降低了图像处理操作的复杂度,提升了图像处理的整体效率,优化了用户体验。
请参考图12,其示出了本申请一个实施例提供的图像处理方法的流程图四。该方法可应用于计算机设备中,所述计算机设备是指具备数据计算和处理能力的电子设备,如各步骤的执行主体可以是图2所示的应用程序运行环境中的终端10。该方法可以包括以下几个步骤(1201~1209)。
步骤1201,在每获取到一帧待处理图像之后,对待处理图像进行第二对象检测处理,得到第二检测结果。
在示例性实施例中,上述第二对象为用户手势。上述实施例中进行的边缘检测或者顶点检测的结果有时候会受图像中无关内容干扰,此时可通过摄像头实时检测学生手指位置,由学生触发手势,来确定检测对象的边缘信息或者顶点位置。比如,在智慧教育场景中,作业本顶点的检测有时候会因为桌上物品的干扰不准,此时可通过摄像头,实时检测学生的手指位置,由学生触发手势,以确定作业本的四个角位置。
在一种可能的实施方式中,对于上述第二对象的检测识别,可以单独训练第二对象检测模型。可选地,上述第二对象检测模型为机器学习模型,训练样本为包含样本用户手势的图像,样本标签为像素点类型,比如像素点类型是否为用户手势。
这样,在每获取到一帧待处理图像之后,将待处理图像输入至第二对象检测模型进行第二对象检测处理,得到第二检测结果。
上述第二检测结果用于指示待处理图像中是否包括第二对象。在待处理图像中是否包括第二对象的情况下,上述第二检测结果包括第二对象对应的定位点坐标。
步骤1202,若连续n帧待处理图像对应的第二检测结果指示连续n帧待处理图像包括第二对象,则确定第二对象在连续n帧待处理图像之间的滑动轨迹。
上述n为大于等于2的正整数。
在示例性实施例中,可根据第二对象在连续n帧待处理图像中对应的定位点坐标,确定第二对象在连续n帧待处理图像之间的滑动轨迹。可选地,上述滑动轨迹由上述第二对象在连续n帧待处理图像中对应的定位点连接而成。
若滑动轨迹符合预设轨迹条件,则确定连续n帧待处理图像包括第一对象,滑动轨迹用于定位第一对象。可选地,预设轨迹条件包括第二对象的滑动轨迹与第一对象的对象形状对应的对角线或者轮廓线相匹配。比如,用户沿着作业本的对角线方向滑动手指,或者沿着作业本的轮廓滑动手指,得到上述滑动轨迹。
用户作出手势滑动动作,也就说明连续n帧待处理图像包括第一对象。
步骤1203,在滑动轨迹符合预设轨迹条件的情况下,基于滑动轨迹确定定位区域。
系统检测到上述符合预设轨迹条件的滑动轨迹之后,可以根据滑动轨迹在第一待处理图像中确定一个定位区域,这个定位区域为第一对象在第一待处理图像中所在的区域。可选地,上述第一待处理图像为连续n帧待处理图像中任一帧图像,也可以是连续n帧待处理图像中之后的图像。
步骤1204,展示定位区域对应的展示图像。
将定位区域对应的图像,即上述展示图像,在目标页面的预览区域中进行显示,实现对第一对象的跟踪显示。
步骤1205,确定展示图像中第一对象的摆放状态。
步骤1206,基于摆放状态,展示操作提示信息。
在示例性实施例中,确定展示图像中第一对象的摆放角度。
在摆放角度大于角度阈值的情况下,展示角度调整提示信息。操作提示信息包括角度调整提示信息。
在摆放角度小于等于角度阈值的情况下,对展示图像进行卷角检测处理,得到第一对象的卷角检测结果。
在卷角检测结果指示第一对象存在卷角的情况下,展示卷角调整提示信息。操作提示信息包括卷角调整提示信息。
在卷角检测结果指示第一对象不存在卷角的情况下,对第一对象进行运动检测处理,得到运动检测结果。
若运动检测结果指示第一对象处于运动状态,则显示静止提示信息。
步骤1207,在第一对象的摆放状态符合预设条件的情况下,将展示图像确定为第一对象对应的目标图像。
若运动检测结果指示第一对象处于静止状态,则将展示图像确定为目标图像。
步骤1208,将目标图像送入目标信息识别流程,得到目标图像对应的信息识别结果。
综上所述,本申请实施例提供的技术方案,通过对待处理图像进行第二对象的检测处理,可以确定第二对象的滑动轨迹,进而可以根据第二对象的滑动轨迹对第一对象进行定位,确定出第一对象所在的定位区域,并对该定位区域的图像进行展示。此外,还对第一对象在展示图像中的摆放状态进行检测,在符合预设条件的条件下将展示图像确定为目标图像并送入后续的信息识别流程,提升了图像质量、降低了图像处理操作的复杂度、提升了图像处理的整体效率。
下述为本申请装置实施例,可用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图13,其示出了本申请一个实施例提供的图像处理装置的框图。该装置具有实现上述图像处理方法的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是计算机设备,也可以设置在计算机设备中。该装置1300可以包括:对象检测模块1310、信息展示模块1320、图像确定模块1330。
对象检测模块1310,用于在每获取到一帧待处理图像之后,检测所述待处理图像是否包括第一对象。
信息展示模块1320,用于在检测到第一待处理图像包括所述第一对象的情况下,展示所述第一对象对应的展示图像,以及所述展示图像对应的操作提示信息;其中,所述展示图像为所述第一待处理图像中所述第一对象所在的定位区域对应的图像,所述操作提示信息用于提示目标对象调整所述第一对象的摆放状态。
图像确定模块1330,用于在所述第一对象的摆放状态符合预设条件的情况下,将所述展示图像确定为所述第一对象对应的目标图像。
在示例性实施例中,所述信息展示模块1320,包括:对象定位单元、图像展示单元、信息提示单元。
对象定位单元,用于若所述第一待处理图像包括所述第一对象的整体边缘信息,则基于所述整体边缘信息确定所述定位区域以及所述第一对象的摆放角度;
图像展示单元,用于展示所述定位区域对应的所述展示图像;
信息提示单元,用于在所述摆放角度大于角度阈值的情况下,展示角度调整提示信息,所述操作提示信息包括所述角度调整提示信息。
在示例性实施例中,所述信息展示模块1320还包括:卷角检测单元。
卷角检测单元,用于对所述展示图像进行卷角检测处理,得到所述第一对象的卷角检测结果;
所述信息提示单元,还用于在所述卷角检测结果指示所述第一对象存在卷角的情况下,展示卷角调整提示信息,所述操作提示信息包括所述卷角调整提示信息。
在示例性实施例中,所述图像确定模块1330,包括:运动检测单元、图像确定单元。
运动检测单元,用于在所述摆放角度小于等于所述角度阈值,且所述卷角检测结果指示所述第一对象不存在卷角的情况下,对所述第一对象进行运动检测处理,得到运动检测结果;
图像确定单元,用于若所述运动检测结果指示所述第一对象处于静止状态,则将所述展示图像确定为所述目标图像。
在示例性实施例中,所述信息展示模块1320,包括:局部对象定位单元、信息展示单元。
局部对象定位单元,用于若所述第一待处理图像包括所述第一对象的局部边缘信息,则基于所述局部边缘信息确定所述定位区域;
信息展示单元,用于展示所述定位区域对应的所述展示图像,以及所述局部边缘信息对应的位置调整提示信息,所述操作提示信息包括所述位置调整提示信息。
在示例性实施例中,所述装置1300还包括:取景方向确定模块、取景框移动模块、图像采集模块。
取景方向确定模块,用于在检测到第二待处理图像包括所述第一对象的局部边缘信息的情况下,根据所述局部边缘信息确定所述第二待处理图像中所述第一对象对应的边缘缺失方向;
取景框移动模块,用于根据所述边缘缺失方向,将相机拍摄区域中的图像取景框由第一位置移动至第二位置;其中,所述第一位置为所述图像取景框的当前位置,所述第二位置为所述图像取景框移动后的位置;
图像采集模块,用于在所述图像取景框位于所述第二位置的情况下,对所述相机拍摄区域进行图像采集,重新获取所述待处理图像,并再次从所述在每获取到一帧待处理图像之后,检测所述待处理图像是否包括第一对象的步骤开始执行。
在示例性实施例中,所述局部对象定位单元,还用于在检测到所述第一待处理图像包括所述第一对象的局部边缘信息,且所述图像取景框到达所述相机拍摄区域的区域边缘的情况下,基于所述局部边缘信息确定所述定位区域;
信息展示单元,用于展示所述定位区域对应的所述展示图像,以及所述局部边缘信息对应的位置调整提示信息;
其中,所述第一待处理图像是所述图像取景框到达所述区域边缘采集到的图像,所述操作提示信息包括所述位置调整提示信息。
在示例性实施例中,所述对象检测模块1310,包括:第一对象检测单元、第一对象确定单元。
第一对象检测单元,用于对所述待处理图像进行第一对象检测处理,得到第一检测结果;
第一对象确定单元,用于若所述第一待处理图像对应的第一检测结果指示所述第一待处理图像包括所述第一对象的整体边缘信息或局部边缘信息,则确定所述第一待处理图像包括所述第一对象。
在示例性实施例中,所述对象检测模块1310,还包括:第二对象检测单元、滑动轨迹确定单元。
第二对象检测单元,用于对所述待处理图像进行第二对象检测处理,得到第二检测结果;
滑动轨迹确定单元,用于若连续n帧待处理图像对应的第二检测结果指示所述连续n帧待处理图像包括所述第二对象,则确定所述第二对象在所述连续n 帧待处理图像之间的滑动轨迹,所述n为大于等于2的正整数;
所述第一对象确定单元,还用于若所述滑动轨迹符合预设轨迹条件,则确定所述连续n帧待处理图像包括所述第一对象,所述滑动轨迹用于定位所述第一对象。
在示例性实施例中,所述信息展示模块1320,还包括:滑动轨迹定位单元、对象摆放状态确定单元。
滑动轨迹定位单元,用于在所述滑动轨迹符合所述预设轨迹条件的情况下,基于所述滑动轨迹确定所述定位区域;
所述图像展示单元,还用于展示所述定位区域对应的展示图像;
对象摆放状态确定单元,用于确定所述展示图像中所述第一对象的摆放状态;
所述信息提示单元,还用于基于所述摆放状态,展示所述操作提示信息。
在示例性实施例中,所述装置1300还包括:信息识别模块。
信息识别模块,用于将所述目标图像送入目标信息识别流程,得到所述目标图像对应的信息识别结果。
综上所述,本申请实施例提供的技术方案,在获取到一帧待处理图像之后会检测获取到的待处理图像是否包含第一对象,可以快速检测到包含第一对象的待处理图像;在检测到第一待处理图像包含第一对象的情况下,便会展示第一对象在待处理图像中所在的定位区域对应的部分图像,有效缩减了待处理图像中与第一对象无关的图像内容,提升了图像质量;并且还会展示相对应的操作提示信息,以提示用户及时调整第一对象的摆放状态,在摆放状态符合预设条件的情况下即可将展示图像确定为目标图像,降低了图像处理操作的复杂度,提升了图像处理的整体效率,优化了用户体验。
需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图14,其示出了本申请一个实施例提供的计算机设备的结构框图。该计算机设备可以是终端。该计算机设备用于实施上述实施例中提供的图像处理方法。具体来讲:
通常,计算机设备1400包括有:处理器1401和存储器1402。
处理器1401可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1401可以采用DSP(Digital Signal Processing,数字信号处理)、 FPGA(FieldProgrammable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1401也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器 1401可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1401还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1402可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1402还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1402中的非暂态的计算机可读存储介质用于存储至少一个指令,至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集,且经配置以由一个或者一个以上处理器执行,以实现上述图像处理方法。
在一些实施例中,计算机设备1400还可选包括有:外围设备接口1403和至少一个外围设备。处理器1401、存储器1402和外围设备接口1403之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1403相连。具体地,外围设备包括:射频电路1404、触摸显示屏1405、摄像头组件1406、音频电路1407、定位组件1408和电源1409中的至少一种。
本领域技术人员可以理解,图14中示出的结构并不构成对计算机设备1400 的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置,如图15,图15是本申请另一个实施例提供的计算机设备的结构框图。
在示例性实施例中,上述计算机设备为点读设备。可选地,上述点读设备包括上述智能教育台灯。
在示例性实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被处理器执行时以实现上述图像处理方法。
可选地,该计算机可读存储介质可以包括:ROM(Read Only Memory,只读存储器)、RAM(Random Access Memory,随机存取记忆体)、SSD(Solid State Drives,固态硬盘)或光盘等。其中,随机存取记忆体可以包括ReRAM(Resistance Random Access Memory,电阻式随机存取记忆体)和DRAM(Dynamic Random Access Memory,动态随机存取存储器)。
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述图像处理方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。另外,本文中描述的步骤编号,仅示例性示出了步骤间的一种可能的执行先后顺序,在一些其它实施例中,上述步骤也可以不按照编号顺序来执行,如两个不同编号的步骤同时执行,或者两个不同编号的步骤按照与图示相反的顺序执行,本申请实施例对此不作限定。
另外,在本申请的具体实施方式中,涉及到用户信息等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种图像处理方法,其特征在于,所述方法包括:
在每获取到一帧待处理图像之后,检测所述待处理图像是否包括第一对象;
在检测到第一待处理图像包括所述第一对象的情况下,展示所述第一对象对应的展示图像,以及所述展示图像对应的操作提示信息;其中,所述展示图像为所述第一待处理图像中所述第一对象所在的定位区域对应的图像,所述操作提示信息用于提示目标对象调整所述第一对象的摆放状态;
在所述第一对象的摆放状态符合预设条件的情况下,将所述展示图像确定为所述第一对象对应的目标图像。
2.根据权利要求1所述的方法,其特征在于,所述在检测到第一待处理图像包括所述第一对象的情况下,展示所述第一对象对应的展示图像,以及所述展示图像对应的操作提示信息,包括:
若所述第一待处理图像包括所述第一对象的整体边缘信息,则基于所述整体边缘信息确定所述定位区域以及所述第一对象的摆放角度;
展示所述定位区域对应的所述展示图像;
在所述摆放角度大于角度阈值的情况下,展示角度调整提示信息,所述操作提示信息包括所述角度调整提示信息。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
对所述展示图像进行卷角检测处理,得到所述第一对象的卷角检测结果;
在所述卷角检测结果指示所述第一对象存在卷角的情况下,展示卷角调整提示信息,所述操作提示信息包括所述卷角调整提示信息。
4.根据权利要求3所述的方法,其特征在于,所述在所述第一对象的摆放状态符合预设条件的情况下,将所述展示图像确定为所述第一对象对应的目标图像,包括:
在所述摆放角度小于等于所述角度阈值,且所述卷角检测结果指示所述第一对象不存在卷角的情况下,对所述第一对象进行运动检测处理,得到运动检测结果;
若所述运动检测结果指示所述第一对象处于静止状态,则将所述展示图像确定为所述目标图像。
5.根据权利要求1所述的方法,其特征在于,所述在检测到第一待处理图像包括所述第一对象的情况下,展示所述第一对象对应的展示图像,以及所述展示图像对应的操作提示信息,包括:
若所述第一待处理图像包括所述第一对象的局部边缘信息,则基于所述局部边缘信息确定所述定位区域;
展示所述定位区域对应的所述展示图像,以及所述局部边缘信息对应的位置调整提示信息,所述操作提示信息包括所述位置调整提示信息。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在检测到第二待处理图像包括所述第一对象的局部边缘信息的情况下,根据所述局部边缘信息确定所述第二待处理图像中所述第一对象对应的边缘缺失方向;
根据所述边缘缺失方向,将相机拍摄区域中的图像取景框由第一位置移动至第二位置;其中,所述第一位置为所述图像取景框的当前位置,所述第二位置为所述图像取景框移动后的位置;
在所述图像取景框位于所述第二位置的情况下,对所述相机拍摄区域进行图像采集,重新获取所述待处理图像,并再次从所述在每获取到一帧待处理图像之后,检测所述待处理图像是否包括第一对象的步骤开始执行。
7.根据权利要求6所述的方法,其特征在于,所述在检测到第一待处理图像包括所述第一对象的情况下,展示所述第一对象对应的展示图像,以及所述展示图像对应的操作提示信息,包括:
在检测到所述第一待处理图像包括所述第一对象的局部边缘信息,且所述图像取景框到达所述相机拍摄区域的区域边缘的情况下,基于所述局部边缘信息确定所述定位区域;
展示所述定位区域对应的所述展示图像,以及所述局部边缘信息对应的位置调整提示信息;
其中,所述第一待处理图像是所述图像取景框到达所述区域边缘采集到的图像,所述操作提示信息包括所述位置调整提示信息。
8.根据权利要求1所述的方法,其特征在于,所述检测所述待处理图像是否包括第一对象,包括:
对所述待处理图像进行第一对象检测处理,得到第一检测结果;
若所述第一待处理图像对应的第一检测结果指示所述第一待处理图像包括所述第一对象的整体边缘信息或局部边缘信息,则确定所述第一待处理图像包括所述第一对象。
9.根据权利要求1所述的方法,其特征在于,所述检测所述待处理图像是否包括第一对象,包括:
对所述待处理图像进行第二对象检测处理,得到第二检测结果;
若连续n帧待处理图像对应的第二检测结果指示所述连续n帧待处理图像包括所述第二对象,则确定所述第二对象在所述连续n帧待处理图像之间的滑动轨迹,所述n为大于等于2的正整数;
若所述滑动轨迹符合预设轨迹条件,则确定所述连续n帧待处理图像包括所述第一对象,所述滑动轨迹用于定位所述第一对象。
10.根据权利要求9所述的方法,其特征在于,所述在检测到第一待处理图像包括所述第一对象的情况下,展示所述第一对象对应的展示图像,以及所述展示图像对应的操作提示信息,包括:
在所述滑动轨迹符合所述预设轨迹条件的情况下,基于所述滑动轨迹确定所述定位区域;
展示所述定位区域对应的展示图像;
确定所述展示图像中所述第一对象的摆放状态;
基于所述摆放状态,展示所述操作提示信息。
11.根据权利要求1至10任一项所述的方法,其特征在于,所述方法还包括:
将所述目标图像送入目标信息识别流程,得到所述目标图像对应的信息识别结果。
12.一种图像处理装置,其特征在于,所述装置包括:
对象检测模块,用于在每获取到一帧待处理图像之后,检测所述待处理图像是否包括第一对象;
信息展示模块,用于在检测到第一待处理图像包括所述第一对象的情况下,展示所述第一对象对应的展示图像,以及所述展示图像对应的操作提示信息;其中,所述展示图像为所述第一待处理图像中所述第一对象所在的定位区域对应的图像,所述操作提示信息用于提示目标对象调整所述第一对象的摆放状态;
图像确定模块,用于在所述第一对象的摆放状态符合预设条件的情况下,将所述展示图像确定为所述第一对象对应的目标图像。
13.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至11任一项所述的图像处理方法。
14.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至11任一项所述的图像处理方法。
15.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行以实现如权利要求1至11任一项所述的图像处理方法。
CN202210001773.6A 2022-01-04 2022-01-04 图像处理方法、装置、设备、存储介质及产品 Pending CN116434253A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210001773.6A CN116434253A (zh) 2022-01-04 2022-01-04 图像处理方法、装置、设备、存储介质及产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210001773.6A CN116434253A (zh) 2022-01-04 2022-01-04 图像处理方法、装置、设备、存储介质及产品

Publications (1)

Publication Number Publication Date
CN116434253A true CN116434253A (zh) 2023-07-14

Family

ID=87093051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210001773.6A Pending CN116434253A (zh) 2022-01-04 2022-01-04 图像处理方法、装置、设备、存储介质及产品

Country Status (1)

Country Link
CN (1) CN116434253A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117423111A (zh) * 2023-12-18 2024-01-19 广州乐庚信息科技有限公司 基于计算机视觉和深度学习的纸稿提取、纠正方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117423111A (zh) * 2023-12-18 2024-01-19 广州乐庚信息科技有限公司 基于计算机视觉和深度学习的纸稿提取、纠正方法及系统
CN117423111B (zh) * 2023-12-18 2024-04-02 广州乐庚信息科技有限公司 基于计算机视觉和深度学习的纸稿提取、纠正方法及系统

Similar Documents

Publication Publication Date Title
EP3916627A1 (en) Living body detection method based on facial recognition, and electronic device and storage medium
CN109271945B (zh) 一种在线实现作业批改的方法和系统
CN109522815B (zh) 一种专注度评估方法、装置及电子设备
EP4198814A1 (en) Gaze correction method and apparatus for image, electronic device, computer-readable storage medium, and computer program product
CN112200062B (zh) 一种基于神经网络的目标检测方法、装置、机器可读介质及设备
WO2022156622A1 (zh) 脸部图像的视线矫正方法、装置、设备、计算机可读存储介质及计算机程序产品
CN107909022B (zh) 一种视频处理方法、装置、终端设备和存储介质
US20230054515A1 (en) Image gaze correction method, apparatus, electronic device, computer-readable storage medium, and computer program product
CN111563502A (zh) 图像的文本识别方法、装置、电子设备及计算机存储介质
CN110163211B (zh) 一种图像识别方法、装置和存储介质
US20230091549A1 (en) Image processing method and apparatus, computer device, and storage medium
CN111008542A (zh) 对象专注度分析方法、装置、电子终端及存储介质
US20210012201A1 (en) Center-biased machine learning techniques to determine saliency in digital images
CN106649629A (zh) 一种关联书本与电子资源的系统
CN114120163A (zh) 视频帧处理方法、装置及其相关设备和存储介质
CN112200230A (zh) 一种训练板的识别方法、装置及机器人
CN111325107A (zh) 检测模型训练方法、装置、电子设备和可读存储介质
WO2022267653A1 (zh) 图像处理方法、电子设备及计算机可读存储介质
CN114373050A (zh) 一种基于HoloLens的化学实验教学系统及方法
CN114677644A (zh) 一种基于教室监控视频的学生入座分布识别方法及系统
CN116434253A (zh) 图像处理方法、装置、设备、存储介质及产品
Zhang Innovation of English teaching model based on machine learning neural network and image super resolution
WO2023047162A1 (en) Object sequence recognition method, network training method, apparatuses, device, and medium
CN111275610A (zh) 一种人脸变老图像处理方法及系统
Cai How many pixels do we need to see things?

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40088368

Country of ref document: HK