CN109559313A - 图像处理方法、介质、装置和计算设备 - Google Patents

图像处理方法、介质、装置和计算设备 Download PDF

Info

Publication number
CN109559313A
CN109559313A CN201811488895.2A CN201811488895A CN109559313A CN 109559313 A CN109559313 A CN 109559313A CN 201811488895 A CN201811488895 A CN 201811488895A CN 109559313 A CN109559313 A CN 109559313A
Authority
CN
China
Prior art keywords
presentation page
page
identification information
image
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811488895.2A
Other languages
English (en)
Other versions
CN109559313B (zh
Inventor
李超
林肖琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN201811488895.2A priority Critical patent/CN109559313B/zh
Publication of CN109559313A publication Critical patent/CN109559313A/zh
Application granted granted Critical
Publication of CN109559313B publication Critical patent/CN109559313B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明的实施方式提供了一种图像处理方法、装置、介质及计算设备。该图像处理方法包括:获取多个演示页面;确定各所述演示页面对应的标识信息;获取针对于所述演示页面的记号信息,根据所述标识信息从各所述演示页面中确定记号信息对应的目标演示页面;将所述目标演示页面与其对应的所述记号信息做关联保存。本发明的方法可以将记号信息与对应的演示页面进行关联,从而在用户编辑图像时,能够实现对图像所做的记号进行保存,极大地方便了用户,为用户带来了更好的体验。

Description

图像处理方法、介质、装置和计算设备
技术领域
本发明的实施方式涉及通信及计算机技术领域,更具体地,本发明的实施方式涉及一种图像处理方法、存储介质、图像处理装置和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着图像处理技术的发展,用户可以对各种图像进行编辑处理,例如在图像上进行标注、涂鸦等等。
目前,已经出现一些能够提供单帧图像编辑功能的应用,用户可以对图像进行编辑,并且还能够将用户编辑后的图像进行保存。以直播应用为例,用户可以在直播应用中对打开的图像进行涂鸦,同时将用户的涂鸦共享给其他观看直播的用户。但是,对于动态的多帧图像而言,用户在某一帧图像上进行涂鸦后,如果跳转到下一帧,则需要将前面的涂鸦全部擦掉,再重新涂鸦,并且再翻回到该帧图像上时,之前在该帧图像上的涂鸦无法再显示。
发明内容
但是,由于现有技术中,多帧图像动态变化时无法确定多帧图像中的某一帧图像被用户涂鸦,即现有技术无法将用户的涂鸦准确定位在对应的图像上。
为此,非常需要一种改进的图像处理方法,以使在多帧图像时,可以对图像的涂鸦进行准确定位,从而实现将用户的涂鸦保存在正确的图像中。
在本上下文中,本发明的实施方式期望提供一种图像处理方法、图像处理装置、存储介质和计算设备。
在本发明实施方式的第一方面中,提供了一种图像处理方法,包括:获取多个演示页面;确定各演示页面对应的标识信息;获取针对于演示页面的记号信息,根据标识信息从各演示页面中确定记号信息对应的目标演示页面;将目标演示页面与其对应的记号信息做关联保存。
可选地,确定各演示页面对应的标识信息可以包括:将演示页面输入训练后的机器学习模型中,将机器学习模型的输出值作为演示页面的标识信息。
可选地,将演示页面输入训练后的机器学习模型之前还可以包括:获取大量样本图像,将样本图像按照预设像素大小进行分割,获得多帧子图像;计算每帧子图像的平均颜色值,以获取样本图像的多个子颜色值;按照预设规则将多个子颜色值组合成颜色值序列;通过颜色值序列标记各样本图像,得到训练样本集,基于训练样本集训练机器学习模型。
可选地,该方法还可以包括:计算样本图像的平均颜色值,得到参考颜色值;调整机器学习模型的损失函数,以使得机器学习模型的输出值与参考颜色值之间的差值小于或等于预设阈值。
可选地,确定各演示页面的标识信息可以包括:获取各演示页面的多个子页面;通过演示页面对应的应用程序的接口函数获取子页面的页码标识,将页码标识作为各子页面的标识信息。
可选地,该方法还可以包括:在目标演示页面演示时显示对应的记号信息。
可选地,该方法还可以包括:基于窗口共享技术在目标演示页面演示时显示对应的记号信息。
在本发明实施方式的第二方面中,提供了一种存储介质,其上存储有程序,该程序被处理器执行时可以实现上述图像处理方法。
在本发明实施方式的第三方面中,提供了一种图像处理装置,包括:获取单元,用于获取多个演示页面;标识确定单元,用于确定各演示页面对应的标识信息;图像确定单元,用于获取针对于演示页面的记号信息,根据标识信息从各演示页面中确定记号信息对应的目标演示页面;保存单元,用于将目标演示页面与其对应的记号信息做关联保存。
可选地,标识确定单元可以包括:第一子确定单元,用于将演示页面输入训练后的机器学习模型中,将机器学习模型的输出值作为演示页面的标识信息。
可选地,该装置还包括:样本获取单元,用于获取大量样本图像,将样本图像按照预设像素大小进行分割,获得多帧子图像;第一计算单元,用于计算每帧子图像的平均颜色值,以获取样本图像的多个子颜色值;组合单元,用于按照预设规则将多个子颜色值组合成颜色值序列;训练单元,用于通过颜色值序列标记各样本图像,得到训练样本集,基于所述训练样本集训练机器学习模型。
可选地,该装置还可以包括:第二计算单元,用于计算样本图像的平均颜色值,得到参考颜色值;模型调整单元,用于调整机器学习模型的损失函数,以使得机器学习模型的输出值与参考颜色值之间的差值小于或等于预设阈值。
可选地,标识确定单元可以包括:页面确定单元,用于获取各演示页面的多个子页面;页码获取单元,用于通过演示页面对应的应用程序的接口函数获取子页面的页码标识,将页码标识作为各子页面的标识信息。
可选地,该装置还可以包括:处理单元,用于在目标演示页面演示时显示对应的记号信息。
可选地,该装置还可以包括:显示单元,用于基于窗口共享技术在目标演示页面演示时显示对应的记号信息。
在本发明实施方式的第四方面中,提供了一种计算设备,包括处理器和存储器,存储器存储有可执行指令,处理器用于调用存储器存储的可执行指令执行如上述的图像处理方法。
根据本发明实施方式的图像处理方法,可以确定各个记号信息对应的目标演示页面,并且将目标演示页面与对应的记号信息进行关联保存,从而可以准确定位记号信息所在的演示页面,提高演示页面的标记效率;并且减少了用户在演示页面做标记时的反复操作,为用户带来了更好的体验。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的特点和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示意性示出了根据本发明实施方式的图像处理方法的第一个流程图。
图2示意性示出了根据本发明实施方式的图像处理方法的第二个流程图。
图3示意性示出了根据本发明实施方式的图像处理方法的第三个流程图。
图4示意性示出了根据本发明实施方式的图像处理方法的第四个流程图。
图5示意性地示出了根据本发明实施方式的图像处理装置的框图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本发明可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种图像处理的方法和设备。
在本文中,需要理解的是,所涉及的术语涂鸦表示在图像上进行的各种编辑操作,例如画圈、画直线、标注等等。
所涉及的术语授课工具表示通过实时共享窗口进行在线互动、教学授课的平台工具。
此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
发明概述
本发明人发现,在授课工具中,老师在一个PPT页面上涂鸦后,如果翻到其它页,再翻回来,之前在这个页面上做的标记、涂鸦,无法显示。或者,老师在一个页面上画了很多涂鸦,当下一页需要涂鸦时,只能先把前面的涂鸦全部擦掉,才能在下一页进行涂鸦。
因此,本发明的实施方式提供一种图像处理方法、存储介质、图像处理装置以及计算设备。从而对用户所做的记号信息进行准确定位,确定记号信息对应的演示页面,提高图像标记的效率。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
应用场景总览
需要注意的是,下述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
用户在授课工具中演示授课页面时,对各个页面所做的记号信息不能正确地与对应的页面进行关联,导致再次对之前做过记号的页面进行演示时,不能显示之前所做的记号信息。
示例性方法
下面结合上述的应用场景,参考图1至图4来描述根据本发明示例性实施方式的图像处理方法。
首先,图1示意性示出了根据本发明实施方式的图像处理方法的第一个流程图。
参考图1所示,本发明实施方式的图像处理方法可以包括:
步骤S11.获取多个演示页面;
步骤S12.确定各所述演示页面对应的标识信息;
步骤S13.获取针对于所述演示页面的记号信息,根据所述标识信息从各所述演示页面中确定记号信息对应的目标演示页面;
步骤S14.将所述目标演示页面与其对应的所述记号信息做关联保存。
图1所示的图像处理方法通过获取多个演示页面,确定各个演示页面的标识信息,然后获取针对于各个演示页面的记号信息,根据标识信息从各演示页面中确定该记号信息对应的目标演示页面,进而将目标演示页面与其对应的记号信息做关联保存,从而实现对各个图像的记号信息进行准确定位。并且,可以提高演示页面的标记效率;减少用户在演示页面做标记时的反复操作,为用户带来更好的体验。
以下对图1所示的各个步骤的实现细节进行详细说明:
在步骤S11中,可以获取多个演示页面。演示页面可以包含各种类型的信息页面,例如图像、文字、视频等。或者,演示页面也可以是各种类型的文件中包含的页面,例如PPT文件中的多个页面、word中的多个页面、视频中的各帧图像等,本示例实施方式对此不做限定。
本示例性实施方式中,演示页面可以由用户预先编辑,并且将编辑好的演示页面可以保存为文件,在需要演示时将该文件导入演示设备中,例如电脑、智能手机等等。详细而言,可以通过用户导入的文件获取该文件中的各个页面。如果用户导入的文件为视频文件,则可以获取该视频文件中的每一帧图像;或者,用户也可以直接导入多个图像,直接将这些图像作为演示页面。同样,用户也可以导入其他类型的文件,例如PPT文件,word文件等等。
在步骤S12中,可以确定各演示页面对应的标识信息。该标识信息可以用来唯一标识各个演示页面。该标识信息可以是数字、字母,或者数字与字母的组合;也可以是其他内容,例如符号、文字等,本示例实施方式对此不做限定。
在用户编辑演示页面时,用户可以使用编辑工具为各个演示页面生成对应的标识信息,例如PPT的各个页码。因此,用户可以通过编辑工具的接口函数确定各个演示页面对应的标识信息;或者,可以通过其他手段对各个演示页面生成特定的标识信息,例如根据特定的规则对各个演示页面进行编号,生成各个演示页面对应的标识信息等。
在步骤S13中,获取针对于演示页面的记号信息,根据各演示页面的标识信息从各个演示页面中确定记号信息对应的目标演示页面。在本示例实施方式中,该记号信息可以包括用户在演示页面上的涂鸦,或者用户对演示页面所做的其他标记,例如添加的表情、符号等,本示例实施方式对此不做特殊限定。
在演示页面进行演示时,用户可以在演示页面上进行标记,并且可以将用户的标记的记号信息进行记录。在用户标记时,可以根据演示页面的标识信息从各个演示页面中确定用户标记的记号信息对应的目标演示页面,对记号信息进行定位。在用户进行了多次标记生成了多个记号信息时,可以确定每一记号信息对应的目标演示页面。
在步骤S14中,可以将目标演示页面与记号信息进行关联。可以将目标演示页面与记号信息的保存路径进行关联;也可以通过将目标演示页面对应的标识信息作为该页面的记号信息对应的标识信息,从而利用该标识信息将目标演示页面与记号信息进行关联保存。然而,目标演示页面与记号信息还可以通过其他方式进行关联,例如对记号信息进行编号,生成记号信息的标识信息,进而将记号信息的标识信息与目标演示页面的标识信息作为键值对进行保存等。
在本发明的一些实施例中,有多个演示页面时,可以将各个演示页面输入训练后的机器学习模型中,从而将机器学习模型的输出值作为各个演示页面的标识信息。并且,演示页面可以是图像,因此,每一演示页面就是一帧图像,将每一帧图像输入训练后的机器学习模型中,该机器学习模型可以输出针对于该图像的输出值,该输出值可以作为该图像对应的标识信息。此外,演示页面还可以是其他信息,例如文字、符号等,此时可以对演示页面进行截图,以得到演示页面的图像。因此该图像处理方法还可以包括步骤S21至步骤S23,如图2所示,图2示意性示出了根据本发明实施方式的图像处理方法的第二个流程图。其中:
在步骤S21中,获取大量样本图像,将各个样本图像可以按照像素大小进行分割,获得每个样本图像的多帧子图像。详细而言,可以预设一像素大小,将每个样本图像根据该像素大小进行分割,例如预设像素大小为100,可以将样本图像分割为多个像素为100的子图像。或者,可以确定多个层级,并且确定每一层级的像素大小,进而可以将样本图像按照不同的层级分为多个子图像,例如设置三个层级,每个层级的像素大小分别为100、200、300,那么可以将样本图像进行第一次分割,得到多个像素为100的子图像,然后对样本图像进行第二次分割得到多个像素为200的子图像,然后再对样本图像进行第三次分割得到多个像素为300的子图像,进而获得该样本图像的所有子图像。然而,也可以根据其他规则对样本图像进行分割得到样本图像的子图像,例如将样本图像分割为预设数量的子图像等。
在步骤S22中,得到每个样本图像的多帧子图像后,可以计算每帧子图像的平均颜色值,进而获取到各样本图像的多个子颜色值。每帧子图像的平均颜色值可以通过将子图像的各像素点的颜色值相加再与该子图像的像素大小相除,从而得到该子图像的平均颜色值,将该平均颜色值作为该子图像的子颜色值。对样本图像的每帧子图像计算平均颜色值后可以得到该样本图像的多个子颜色值。
在步骤S23中,得到每个样本图像的多个子颜色值后,可以按照预设规则对子颜色值进行组合,得到颜色值序列。详细来说,可以将多个子颜色值按照各子图像在样本图像中的位置顺序进行组合;也可以将多个子颜色值按照各子图像的像素从大到小的顺序进行组合,或者将多个子颜色值按照其他规则进行组合,例如按照子颜色值从大到小或从小到大的顺序进行组合等。
然后,在步骤S24中,通过组合成的颜色值序列对样本图像进行标记,见标记后的样本图像作为训练样本集,再基于训练样本集训练机器学习模型。该机器学习模型可以是神经网络模型、随机森林模型等,也可以是其他模型,例如深度学习模型等,本示例实施方式对此不做特殊限定。
进一步地,在训练该机器学习模型时,还可以包括步骤S31和步骤S32,如图3所示,图3示意性示出了根据本发明实施方式的图像处理方法的第三个流程图。
参考图3,在步骤31中,计算样本图像的平均颜色值,得到参考颜色值。其中,对每一样本图像可以计算一平均颜色值,进而可以得到每个样本图像的参考颜色值。
然后,在步骤S32中,可以调整该机器学习模型的损失函数,使得该机器学习模型的输出值与参考颜色值之间的差值小于或等于预设阈值。详细来说,将标记后的样本图像输入机器学习模型进行训练,根据该机器学习模型的输出值可以对模型的损失函数进行调整。通过多次调整,使得该机器学习模型的输出值与输入的样本图像的参考颜色值之间的差值小于或等于预设阈值。其中,该预设阈值可以根据实际需求设定,例如1、0.5、0.1等等,本示例实施方式对此不做特殊限定。当机器学习模型的输出值与参考颜色值之间的差值小于或等于预设阈值时,可以确定机器学习模型训练完成。进一步地,将各个演示页面输入训练后的机器学习模型中,从而将机器学习模型的输出值作为各个演示页面的标识信息。
在本发明的一些实施方式中,确定各个演示页面对应的标识信息可以通过步骤S41和步骤S42,如图4所示,图4示意性示出了根据本发明实施方式的图像处理方法的第四个流程图。
参考图4,在步骤S41中,获取各个演示页面的多个子页面。其中演示页面中可以包括其他页面,例如某一PPT页面中可以包含一视频页面、某PPT页面可以包含多个子页面等。因此可以确定每一演示页面的子页面,多个子页面可以组成该演示页面的动态演示效果。
进而,在步骤S42中,可以通过演示页面对应的应用程序的接口函数获取子页面的页码标识,将该页码标识作为该子页面的标识信息。演示页面对应的应用程序可以包括能够对该演示页面进行编辑的应用程序,例如图像制作工具等。该应用程序可以为每一演示页面确定一标识信息,例如页码标识,因此可以通过该应用程序的接口函数获取每一子页面的页码标识信息作为每一子页面的标识信息。例如某PPT文件由t张PPT页面组成,每一张PPT页面可能由多张子页面组成,假如第一张PPT页面包含n张子页面,那么就可以用一个二维数组记录第一张PPT页面的页码标识,如(1-1,1-2……1-n),即可以理解为第一张PPT页面的第一张子页面的标识信息为1-1,以此类推,可以获取每一张PPT页面,每一张子页面的标识信息。
在本发明的一些实施方式中,还可以在目标演示页面演示时,显示目标演示页面对应的记号信息。举例而言,用户对演示页面可以进行涂鸦,在确定用户的涂鸦对应的目标演示页面后,在该目标演示页面显示时,可以将该涂鸦显示在该目标演示页面中,从而使得涂鸦页面在任何时刻都可以被回放。可选的,还可以基于窗口共享技术,在目标演示页面演示时显示对应的所述记号信息。也就是说,在窗口共享时,将共享用户的记号信息与对应的目标演示页面进行关联,在该共享窗口中显示该目标演示页面时,同时将该记号信息显示在该目标演示页面中。然而,进一步地,用户还可以根据自己的需要选择显示记号信息,或者不显示记号信息。
示例性介质
在介绍了本发明示例性实施方式的方法之后,接下来,对本发明示例性实施方式的介质进行说明。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种介质,其上存储有程序代码,当所述程序代码被设备的处理器执行时用于实现本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的图像处理方法中的步骤。
具体地,所述设备的处理器执行所述程序代码时用于实现如下步骤:获取多个演示页面;确定各演示页面对应的标识信息;获取针对于演示页面的记号信息,根据标识信息从各演示页面中确定记号信息对应的目标演示页面;将目标演示页面与其对应的记号信息做关联保存。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:将演示页面输入训练后的机器学习模型中,将机器学习模型的输出值作为演示页面的标识信息。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:获取大量样本图像,将样本图像按照预设像素大小进行分割,获得多帧子图像;计算每帧子图像的平均颜色值,以获取样本图像的多个子颜色值;按照预设规则将多个子颜色值组合成颜色值序列;通过颜色值序列标记各样本图像,得到训练样本集,基于训练样本集训练机器学习模型。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:计算样本图像的平均颜色值,得到参考颜色值;调整机器学习模型的损失函数,以使得机器学习模型的输出值与参考颜色值之间的差值小于或等于预设阈值。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:获取各演示页面的多个子页面;通过演示页面对应的应用程序的接口函数获取子页面的页码标识,将页码标识作为各子页面的标识信息。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:在目标演示页面演示时显示对应的记号信息。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:基于窗口共享技术在目标演示页面演示时显示对应的记号信息。
需要说明的是:上述的介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于:电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线、光缆、RF等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
示例性装置
在介绍了本发明示例性实施方式的介质之后,接下来,参考图5对本发明示例性实施方式的图像处理装置进行说明。
图5示意性地示出了根据本发明实施方式的图像处理装置的框图。
参考图5所示,根据本发明的实施方式的图像处理装置50,可以包括获取单元51,标识确定单元52,图像确定单元53,保存单元54。
具体地,获取单元51,用于获取多个演示页面;标识确定单元52,用于确定各所述演示页面对应的标识信息;图像确定单元53,用于获取针对于所述演示页面的记号信息,根据所述标识信息从各所述演示页面中确定记号信息对应的目标演示页面;保存单元54,用于将所述目标演示页面与其对应的所述记号信息做关联保存。
在本发明的一些实施例中,标识确定单元52包括:第一子确定单元501,用于将所述演示页面输入训练后的机器学习模型中,将所述机器学习模型的输出值作为所述演示页面的标识信息。
在本发明的一些实施例中,所述装置50还包括:样本获取单元502,用于获取大量样本图像,将所述样本图像按照预设像素大小进行分割,获得多帧子图像;第一计算单元503,用于计算每帧子图像的平均颜色值,以获取所述样本图像的多个子颜色值;组合单元504,用于按照预设规则将所述多个子颜色值组合成颜色值序列;训练单元505,用于通过所述颜色值序列标记所述样本图像,得到训练样本集,基于所述训练样本集训练所述机器学习模型。
在本发明的一些实施例中,所述装置50还包括:第二计算单元506,用于计算所述样本图像的平均颜色值,得到参考颜色值;模型调整单元507,用于调整所述机器学习模型的损失函数,以使得所述机器学习模型的输出值与所述参考颜色值之间的差值小于或等于预设阈值。
在本发明的一些实施例中,标识确定单元52包括:页面确定单元508,用于获取各所述演示页面的多个子页面;页码获取单元509,用于通过所述演示页面对应的应用程序的接口函数获取所述子页面的页码标识,将所述页码标识作为各所述子页面的标识信息。
在本发明的一些实施例中,所述装置50还包括:处理单元510,用于在所述目标演示页面演示时显示对应的所述记号信息。
在本发明的一些实施例中,所述装置50还包括:显示单元511,用于基于窗口共享技术在所述目标演示页面演示时显示对应的所述记号信息。
示例性计算设备
在介绍了本发明示例性实施方式的方法、介质和装置之后,接下来,介绍根据本发明的另一示例性实施方式的计算设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明实施方式的计算设备可以至少包括至少一个处理器、以及至少一个存储器。其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的图像处理方法中的步骤。例如,所述处理器可以执行如图1中所示的步骤S11.获取多个演示页面;步骤S12.确定各所述演示页面对应的标识信息;步骤S13.获取针对于所述演示页面的记号信息,根据所述标识信息从各所述演示页面中确定记号信息对应的目标演示页面;步骤S14.将所述目标演示页面与其对应的所述记号信息做关联保存。又如,所述处理器也可以行如图2中所示的步骤。
应当注意,尽管在上文详细描述中提及了图像处理装置的若干单元或子单元,但是这种划分仅仅是示例性的,并非是强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或单元的特征和功能可以在一个模块或单元中具体化。反之,上文描述的一个模块或单元的特征和功能可以进一步划分为由多个模块或单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所发明的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以得到其他有益效果,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (10)

1.一种图像处理方法,包括:
获取多个演示页面;
确定各所述演示页面对应的标识信息;
获取针对于所述演示页面的记号信息,根据所述标识信息从各所述演示页面中确定记号信息对应的目标演示页面;
将所述目标演示页面与其对应的所述记号信息做关联保存。
2.根据权利要求1所述的图像处理方法,所述确定各所述演示页面对应的标识信息,包括:
将所述演示页面输入训练后的机器学习模型中,将所述机器学习模型的输出值作为所述演示页面的标识信息。
3.根据权利要求2所述的图像处理方法,所述将所述演示页面输入训练后的机器学习模型之前,还包括:
获取大量样本图像,将所述样本图像按照预设像素大小进行分割,获得多帧子图像;
计算每帧子图像的平均颜色值,以获取所述样本图像的多个子颜色值;
按照预设规则将所述多个子颜色值组合成颜色值序列;
通过所述颜色值序列标记所述样本图像,得到训练样本集,基于所述训练样本集训练所述机器学习模型。
4.根据权利要求3所述的图像处理方法,还包括:
计算所述样本图像的平均颜色值,得到参考颜色值;
调整所述机器学习模型的损失函数,以使得所述机器学习模型的输出值与所述参考颜色值之间的差值小于或等于预设阈值。
5.根据权利要求1所述的图像处理方法,所述确定各所述演示页面的标识信息,包括:
获取各所述演示页面的多个子页面;
通过所述演示页面对应的应用程序的接口函数获取所述子页面的页码标识,将所述页码标识作为各所述子页面的标识信息。
6.根据权利要求1所述的图像处理方法,所述方法还包括:在所述目标演示页面演示时显示对应的所述记号信息。
7.根据权利要求6所述的图像处理方法,所述方法还包括:
基于窗口共享技术在所述目标演示页面演示时显示对应的所述记号信息。
8.一种介质,其上存储有程序,该程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
9.一种图像处理装置,包括:
获取单元,用于获取多个演示页面;
标识确定单元,用于确定各所述演示页面对应的标识信息;
图像确定单元,用于获取针对于所述演示页面的记号信息,根据所述标识信息从各所述演示页面中确定记号信息对应的目标演示页面;
保存单元,用于将所述目标演示页面与其对应的所述记号信息做关联保存。
10.一种计算设备,包括:处理器和存储器,所述存储器存储有可执行指令,所述处理器用于调用所述存储器存储的可执行指令执行如权利要求1至7中任一项所述的方法。
CN201811488895.2A 2018-12-06 2018-12-06 图像处理方法、介质、装置和计算设备 Active CN109559313B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811488895.2A CN109559313B (zh) 2018-12-06 2018-12-06 图像处理方法、介质、装置和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811488895.2A CN109559313B (zh) 2018-12-06 2018-12-06 图像处理方法、介质、装置和计算设备

Publications (2)

Publication Number Publication Date
CN109559313A true CN109559313A (zh) 2019-04-02
CN109559313B CN109559313B (zh) 2021-11-12

Family

ID=65869449

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811488895.2A Active CN109559313B (zh) 2018-12-06 2018-12-06 图像处理方法、介质、装置和计算设备

Country Status (1)

Country Link
CN (1) CN109559313B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112269886A (zh) * 2020-11-11 2021-01-26 游密科技(深圳)有限公司 共享图像采集方法、窗口共享方法和共享图像采集装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116763A (zh) * 2013-01-30 2013-05-22 宁波大学 一种基于hsv 颜色空间统计特征的活体人脸检测方法
CN104516865A (zh) * 2014-12-29 2015-04-15 北京大学 基于Web的关联桌面演示子文档的在线演示文档编辑方法
CN104933094A (zh) * 2015-05-19 2015-09-23 深圳市松特高新实业有限公司 一种ppt文档构建方法及构建系统
US9691096B1 (en) * 2013-09-16 2017-06-27 Amazon Technologies, Inc. Identifying item recommendations through recognized navigational patterns
CN107784034A (zh) * 2016-08-31 2018-03-09 北京搜狗科技发展有限公司 页面类别识别方法及装置、用于页面类别识别的装置
CN108228873A (zh) * 2018-01-17 2018-06-29 腾讯科技(深圳)有限公司 对象推荐、发布内容推送方法、装置、存储介质和设备
CN108459836A (zh) * 2018-01-19 2018-08-28 广州视源电子科技股份有限公司 批注显示方法、装置、设备及存储介质
US20180335989A1 (en) * 2000-11-01 2018-11-22 Flexiworld Technologies, Inc. Wireless output devices or wireless controllers for establishing wireless connectivity and for receiving audio or video digital content

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180335989A1 (en) * 2000-11-01 2018-11-22 Flexiworld Technologies, Inc. Wireless output devices or wireless controllers for establishing wireless connectivity and for receiving audio or video digital content
CN103116763A (zh) * 2013-01-30 2013-05-22 宁波大学 一种基于hsv 颜色空间统计特征的活体人脸检测方法
US9691096B1 (en) * 2013-09-16 2017-06-27 Amazon Technologies, Inc. Identifying item recommendations through recognized navigational patterns
CN104516865A (zh) * 2014-12-29 2015-04-15 北京大学 基于Web的关联桌面演示子文档的在线演示文档编辑方法
CN104933094A (zh) * 2015-05-19 2015-09-23 深圳市松特高新实业有限公司 一种ppt文档构建方法及构建系统
CN107784034A (zh) * 2016-08-31 2018-03-09 北京搜狗科技发展有限公司 页面类别识别方法及装置、用于页面类别识别的装置
CN108228873A (zh) * 2018-01-17 2018-06-29 腾讯科技(深圳)有限公司 对象推荐、发布内容推送方法、装置、存储介质和设备
CN108459836A (zh) * 2018-01-19 2018-08-28 广州视源电子科技股份有限公司 批注显示方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蒋黎星 等: "基于集成分类算法的自动图像标注", 《自动化学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112269886A (zh) * 2020-11-11 2021-01-26 游密科技(深圳)有限公司 共享图像采集方法、窗口共享方法和共享图像采集装置
CN112269886B (zh) * 2020-11-11 2021-05-25 游密科技(深圳)有限公司 共享图像采集方法、窗口共享方法和共享图像采集装置

Also Published As

Publication number Publication date
CN109559313B (zh) 2021-11-12

Similar Documents

Publication Publication Date Title
US10776970B2 (en) Method and apparatus for processing video image and computer readable medium
US11481572B2 (en) Method and apparatus for evaluating article value based on artificial intelligence, and storage medium
CN107341805B (zh) 图像前背景分割及网络模型训练、图像处理方法和装置
CN109803180B (zh) 视频预览图生成方法、装置、计算机设备及存储介质
CN110414519A (zh) 一种图片文字的识别方法及其识别装置
CN108229336A (zh) 视频识别及训练方法和装置、电子设备、程序和介质
CN113365147B (zh) 基于音乐卡点的视频剪辑方法、装置、设备及存储介质
CN110458918A (zh) 用于输出信息的方法和装置
CN109995601A (zh) 一种网络流量识别方法及装置
CN108236784B (zh) 模型的训练方法和装置、存储介质、电子装置
CN106303723A (zh) 视频处理方法和装置
EP3759682A1 (en) Systems and methods for automated content evaluation and delivery
CN110446063A (zh) 视频封面的生成方法、装置及电子设备
CN108228835B (zh) 用于处理视频的方法和装置
CN110465089B (zh) 基于图像识别的地图探索方法、装置、介质及电子设备
CN111126610B (zh) 题目分析方法、装置、电子设备和存储介质
CN109785687A (zh) 一种用于在线视频教学的数据处理方法、装置及系统
CN108924598A (zh) 视频字幕显示方法及装置
CN111614986A (zh) 基于在线教育的弹幕生成方法、系统、设备及存储介质
US11501655B2 (en) Automated skill tagging, knowledge graph, and customized assessment and exercise generation
US11247101B2 (en) Methods and systems for facilitating the memorization of exercise routines to users
CN111353439A (zh) 一种教学行为的分析方法、装置、系统及设备
CN113259763B (zh) 教学视频处理方法、装置和电子设备
CN109559313A (zh) 图像处理方法、介质、装置和计算设备
US20210081727A1 (en) Image object anomaly detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant