CN114913276A - 用于图像处理的方法、装置、设备和存储介质 - Google Patents

用于图像处理的方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN114913276A
CN114913276A CN202210514331.1A CN202210514331A CN114913276A CN 114913276 A CN114913276 A CN 114913276A CN 202210514331 A CN202210514331 A CN 202210514331A CN 114913276 A CN114913276 A CN 114913276A
Authority
CN
China
Prior art keywords
sub
user
images
panoramic image
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210514331.1A
Other languages
English (en)
Inventor
方凯能
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Youzhuju Network Technology Co Ltd
Original Assignee
Beijing Youzhuju Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Youzhuju Network Technology Co Ltd filed Critical Beijing Youzhuju Network Technology Co Ltd
Priority to CN202210514331.1A priority Critical patent/CN114913276A/zh
Publication of CN114913276A publication Critical patent/CN114913276A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

根据本公开的实施例,提供了用于图像处理的方法、装置、设备和存储介质。该图像处理的方法包括将全景图像分割为多张子图像以及呈现多张子图像。该方法还包括接收对多张子图像各自的用户标记,以及基于对多张子图像各自的用户标记,获取与全景图像相对应的标记后的全景图像。以此方式,可以显著地提高图像标记的准确度和效率。

Description

用于图像处理的方法、装置、设备和存储介质
技术领域
本公开的示例实施例总体涉及计算机领域,特别地涉及用于图像处理的方法、装置、设备和计算机可读存储介质。
背景技术
全景图像可以提供特定场景的广角视图,其中一些全景图像能够呈现特定场景中水平360°、俯仰180°的视觉信息。这种新颖展现方式正在被各行各业所应用。全景图像可以由全景相机直接采集到,或者由多张图像拼接得到。无论全景图像的来源如何,当在平面上平铺呈现时,图像中的部分物体可能会出现畸变和失真,与人眼正常看到的画面有所不同。
发明内容
根据本公开的示例实施例,提供了一种用于图像处理的方案。
在本公开的第一方面,提供了一种图像处理的方法。该方法包括:将全景图像分割为多张子图像;呈现多张子图像;接收对多张子图像各自的用户标记;以及基于对多张子图像各自的用户标记,确定与全景图像相对应的标记后的全景图像。
在本公开的第二方面,提供了一种用于图像处理的装置。该装置包括:分割模块,被配置为将全景图像分割为多张子图像;呈现模块,被配置为呈现多张子图像;接收模块,被配置为接收对多张子图像各自的用户标记;以及确定模块,被配置为基于对多张子图像各自的用户标记,确定与全景图像相对应的标记后的全景图像。
在本公开的第三方面,提供了一种电子设备。该设备包括至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令。指令在由至少一个处理单元执行时使设备执行第一方面的方法。
在本公开的第四方面,提供了一种计算机可读存储介质。计算机可读存储介质上存储有计算机程序,计算机程序可由处理器执行以实现第一方面的方法。
应当理解,本发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键特征或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的描述而变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
图1示出了本公开的实施例能够在其中实现的示例环境的示意图;
图2示出了根据本公开的一些实施例的用于图像处理的过程的流程图;
图3示出根据本公开的一些实施例的图像处理流的示意图;
图4A至图4D示出了根据本公开的一些实施例的用于用户标记的示例用户界面的示意图;
图5示出了根据本公开的一些实施例的用于图像处理的装置的框图;以及
图6示出了其中可以实现本公开的一个或多个实施例的计算设备的框图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中示出了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“一些实施例”应当理解为“至少一些实施例”。下文还可能包括其他明确的和隐含的定义。
可以理解的是,本技术方案所涉及的数据(包括但不限于数据本身、数据的获取或使用)应当遵循相应法律法规及相关规定的要求。
可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当根据相关法律法规通过适当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确地提示用户,其请求执行的操作将需要获取和使用到用户的个人信息,从而使得用户可以根据提示信息来自主地选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
作为一种可选的但非限制性的实现方式,响应于接收到用户的主动请求,向用户发送提示信息的方式,例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或“不同意”向电子设备提供个人信息的选择控件。
可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本公开的实现方式构成限定,其他满足相关法律法规的方式也可应用于本公开的实现方式中。
图1示出了本公开的实施例能够在其中实现的示例环境100的示意图。在该示例环境100中,终端设备110可以提供针对全景图像120的标记功能,以输出标记后的全景图像122。
在一些示例中,终端设备110可以安装有图像标记应用112,该应用可以提供与用户102的交互,以实现针对图像(包括全景全景)的标记功能。在其他示例中,可以不需要安装图像标记应用112,并且终端设备110可以以其他方式,例如通过网页访问的方式提供与用户102的交互,以实现针对全景图像的标记功能。
全景图像120是以广角方式呈现视觉信息的二维图像,其可以具有任何格式。在一些实施例中,全景图像120可以呈现特定场景中水平360°、俯仰180°的视觉信息。在其他实施例中,全景图像120还可以以其他角度呈现视觉信息。在一些实施例中,全景图像120可以具有2:1的长宽比例,或者可以具有其他任何适当的尺寸。全景图像120可以由全景图像采集设备捕获到,或者可以由在特定场景采集到的多张图像拼接得到。本公开的实施例在此方面不受限制。
在很多应用场景中可能都需要针对全景图像120的标记操作,例如图像发布、图像审核、基于图像的场景审核等等,以达到避免隐私泄露、图像美观、符合规定等各种目的。对全景图像120的标记操作可以基于用户102的操作来确定。
对全景图像120的标记操作可以包括对全景图像120的全局或特定区域的审核和标记。举例而言,在一些场景中,在发布全景图像120前,可能要对全景图像120中的部分区域执行隐私化处理,例如隐去对其中的个人物品、不期望出现的信息等(诸如通过打马赛克的方式)。在另一些场景中,可能还期望在全景图像120的特定区域中添加内容,例如文字、特定图形或者贴纸;或者还可能期望检查全景图像120呈现的各个视觉细节是否符合相关规定。
在一些实施例中,终端设备110可以与远端的计算设备132通信,以实现对全景图像120的标记过程。举例而言,计算设备132可以提供对全景图像120的存储功能、特定处理任务等等,以扩展终端设备110的存储和处理能力。计算设备132可以是能够提供计算能力的各种类型的计算系统/服务器,包括但不限于大型机、边缘计算节点、云环境中的计算设备,等等。在图1示出的示例中,计算设备132可以位于云环境130中。
终端设备110可以是任意类型的移动终端、固定终端或便携式终端,包括移动手机、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、媒体计算机、多媒体平板、个人通信系统(PCS)设备、个人导航设备、个人数字助理(PDA)、音频/视频播放器、数码相机/摄像机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者前述各项的任意组合,包括这些设备的配件和外设或者其任意组合。在一些实施例中,终端设备110也能够支持任意类型的针对用户的接口(诸如“可佩戴”电路等)。
应当理解,仅出于示例性的目的描述环境100的结构和功能,而不暗示对于本公开的范围的任何限制。例如,终端设备110可以不与远端的计算设备132通信,因此计算设备132可以省略。
在针对全景图像进行标记的传统方案中,全景图像被直接呈现为用户,以供用户进行查看,并基于需要对全景图像进行编辑类的标记,或者仔细核查图像是否存在违规内容,等等。
由于全景图像的广角特点,当在二维平面上平铺呈现全景图像时,图像中的部分物体可能会出现畸变和失真。在对全景图像进行标记时,往往需要用户仔细查看和分析视觉细节,图像中的畸变和失真会带来极大干扰,降低标记效率,且极易导致标记错误、漏标等问题。
根据本公开的实施例,提出了一种对全景图像进行标记的改进方案。在该方案中,将全景图像转换成视觉上便于查看的多张子图像用于呈现和标记。通过全景图像分割,各个子图像所呈现的视觉信息更符合人眼在特定视角下观察到的画面,因此在子图像基础上执行的用户标记可以确保更高的准确度,对于用户视觉更友好,避免了标记错误或者在畸变区域花费过多时间进行查看,这可以显著提高图像标记的准确度和效率。
以下将继续参考附图描述本公开的一些示例实施例。
图2示出了根据本公开的一些实施例的用于图像处理的过程200的流程图。过程200可以在终端设备110处实现。为便于讨论,将参考图1的环境100来描述过程200。
在框210,终端设备110将全景图像120分割为多张子图像。
全景图像120可以从各个图像来源被提供到终端设备110进行处理。根据本公开的实施例,不同于将全景图像120直接呈现给用户进行标记,取而代之,对全景图像120进行图像分割,以获得多张子图像。与全景图像120相比,每张子图像呈现更小视觉角度下的视觉信息。经过全景图像分割,全景图像120中的畸变和失真将会被处理,使得每张子图像能够呈现特定视觉角度下的无畸变和失真的视觉信息。
为更好理解本公开的一些实施例,图3示出根据本公开的一些实施例的图像处理流300的示意图。如图3所示,全景图像120被分割为多张(N张)子图像310-1、310-2、……、310-N,其中N是大于1的整数。为便于讨论,下文中将子图像310-1、310-2、……、310-N统称为或单独称为子图像310。
可以利用各种针对全景图像的分割算法来执行对全景图像120的分割。在一些实施例中,可以从全景图像120分割出符合人体视觉感知的多张子图像310。
具体地,可以确定与全景图像120呈现的场景相关联的多个视图。全景图像120所涉及的视图可以与全景图像120所呈现的角度相关。取决于全景图像120所捕获的具体场景,相关联的视图具体数目可能不同。在一个示例中,假设全景图像120是六面体全景图像或球形全景图像,并且呈现场景中水平360°、俯仰180°的视觉信息。这样的全景图像例如可以包括房屋全景图像,用于呈现房屋空间的全貌。在这样的示例中,全景图像120可以关联到场景的仰视图、俯视图、左视图、右视图、前视图和后视图。相应地,可以按照六面体切图法对全景图像120进行分割,以获得多张子图像310。在另一示例中,如果全景图像120呈现的是场景中水平270°、俯仰180°的视觉信息,那么可能关联到场景的仰视图、俯视图、左视图、右视图和前视图。
在确定全景图像120相关联的多个视图后,终端设备110可以将全景图像120分割为与多个视图相对应的多张子图像310。子图像310的数目与视图的数目可以相同。在每个视图下呈现的视觉信息是符合人眼的正常视角的视觉信息。例如,对于六面体全景图像或球形全景图像,可以将其分割为与场景的仰视图、俯视图、左视图、右视图、前视图和后视图分别对应的六张子图像。
在分割与多个视图相对应的多张子图像时,可以将全景图像120中划分出与该视图对应的图像区域,并基于该视图对该图像区域进行后续图像处理,诸如形变、去畸变、尺寸伸缩等等。各种当前可用的或将来开发的全景图像分割算法均可以被应用于对全景图像120的分割。
在一些实施例中,多个子图像310可以具有任何适当的尺寸,例如适合被呈现给用户进行标记的尺寸。本公开的实施例在此方面不受限制。
在框220,终端设备110呈现多张子图像310。在一些实施例中,多张子图像310可以由终端设备110的输出设备,例如显示屏幕,进行呈现。多张子图像310可以被呈现在用户界面上以便用户102进行查看。用户102可以对全景图像120的各个子图像310进行标记。
要对执行全景图像标记的示例场景可以包括图像发布、图像审核、基于图像的场景审核等。作为示例,在公共平台发布全景图像时,可能需要对图像中的某些区域进行编辑。编辑操作的一个示例可以包括对图像中包含隐私信息的区域进行隐私化处理,这样的区域例如包括人脸、私人物品、杂乱区域、电脑屏幕或文件等。编辑操作的另一些示例包括在图像的某些区域上叠加可视化标记,诸如文字、贴纸、各类图形等等。
在另外一些场景中,可能要标记全景图像是否符合预定规则或全景图像所呈现的场景是否符合预定规则,以便决定是否允许全景图像发布或者针对全景图像或场景的下一步操作。预定规则可以包括全景图像是否包含敏感信息、全景图像是否符合某个图像分类规则(例如,在图像分类场景中)、全景图像是否符合图像发布规定或者任何其他预定规则。这些规则可以根据具体场景需要进行设置,在本文中不做限制。
作为一个具体示例,在发布待出售或出租的房屋的全景图像之前,可能需要标记全景图像是否符合发布规则,要对其中呈现的隐私信息进行隐私化处理,和/或要在全景图像上叠加某些标记等等。
在各种场景中,对全景图像的标记会涉及对全景图像中的细节进行检查。在本公开的实施例中,通过对全景图像120的分割,可以将更符合人体视觉感知的多张子图像310呈现给用户进行标记。
在一些实施例中,由全景图像120分割得到的多张子图像310可以全部或部分呈现在用户界面上,以供用户102进行标记。在一些实施例中,一张或多张子图像310可以响应于用户触发而被呈现。例如,用户102可以在完成一张子图像310的标记后发起触发后续一张或多张子图像310的呈现。
在一些实施例中,在标记场景中可能需要标记多张全景图像,这些全景图像可以分别被分割为多张子图像。终端设备110可以记录每张全景图像及其分割的多张子图像之间的关联关系。在向用户呈现子图像时,可以按顺序呈现单张全景图像对应的子图像,或者将多张全景图像的子图像全集按任意顺序呈现。由此,在子图像级别的呈现上,可以使用户关注于所呈现的子图像,而不需要关注全景图像整体。
在一些实施例中,为了方便用户了解子图像的更多信息,终端设备110可以将多张子图像310与多个视图的指示相关联地呈现。这样,在对每张子图像310进行标记时,用户102可以获知该子图像在全景图像120的整体呈现角度中的具体哪个视角。
为便于理解,下文将参考用户界面图来进一步讨论。
图4A示出了根据本公开的一些实施例的用于用户标记的示例用户界面400的示意图。图4A的用户界面400可以是终端设备110上的图像标记应用112的用户界面,或者是可呈现在终端设备110上的其他用户界面。用户界面400用于呈现子图像310,并可以提供相应的用户对子图像310进行标记的功能选项。
应当理解,图4A以及后续附图中示出的用户界面仅仅是示例,实际可以存在各种界面设计。用户界面中的各个图形元素可以具有不同的布置和不同的视觉表示,其中的一个或多个元素可以省略或被替换,并且还可以存在一个或多个其他元素。本公开的实施例在此方面不受限制。
在图4A的示例中,假设全景图像120被分割为与前视图、后视图、仰视图、俯视图、左视图和右视图分别对应的六张子图像310。用户界面400呈现六张子图像310的缩略图420-1、420-2、420-3、420-4、420-5和420-6(为便于讨论,统称为或单独称为缩略图420)。注意,图中缩略图以及子图像的细节仅是示例,并且有些缩略图的视觉信息被省略。
在每张子图像310的缩略图420上还相关联地呈现关于对应视图的指示402,例如文字指示“前视图”、“后视图”、“仰视图”、“俯视图”、“左视图”和“右视图”。这样可以清楚指示每张子图像对应的视图。
通过检测对各个缩略图420的用户选择,对应的子图像310被呈现在用户界面400。如图所示,在缩略图420-1被选择的情况下,对应的子图像310-1被呈现在用户界面400。在所呈现的子图像310上,用户102可以根据标记需要执行对应的标记。
继续返回图2的过程200,在呈现子图像310后,在框230,终端设备110接收对多张子图像310各自的用户标记。
在子图像310的呈现时,可以检测用户102对所呈现的子图像310的标记操作。在一些实施例中,可以经由终端设备110的输入设备(例如,显示屏幕、鼠标等)接收用户标记。针对每张子图像310,可以检测用户102对该子图像310的一个或多个区域的用户编辑标记,包括隐私化处理标记和/或可视化标记。还可以附加地或备选地检测用户102对每张子图像310的用户判定标记,以指示该子图像310是否符合预定规则。
在一些实施例中,可以在终端设备110的用户界面上呈现对子图像310可执行的标记功能,以供用户选择。例如,图4A的用户界面400还呈现标记功能列表,以列出可以对子图像310执行的标记操作。标记功能列表中的编辑区410包括可以对子图像310执行的隐私化处理功能412以及叠加可视化标记功能414。在叠加可视化标记功能414下,还提供可叠加的可视化标记,包括文字标记411、贴纸标记413、图形标记415。此外,标记列表还包括规则判定区418,其中可以接收用户对子图像310是否符合预定规则的判定,例如通过检测用户对选项“是”417或选项“否”419的选择。
应当理解,这些标记功能仅是示例,可以根据需要提供更多或更少的标记功能。例如,在一些情况中不需要用户判定全景图像或子图像是否符合预定规则,那么相应地可以从用户界面400中省略规则判定区418。此外,用户界面400还提供“提交”选项405,对该选项的用户选择指示用户完成对当前子图像310的标记。
在图4A所示的用户界面400上,用户102可以根据需要对各个子图像310进行相应标记。在一些实施例中,如果用户没有对当前子图像310执行编辑标记或关于规则判定的标记,在检测到对“提交”选项405的用户选择后,可以确定针对该子图像310的用户标记为空。在一些实施例中,用户标记可以指示针对子图像310的一个或多个区域的隐私化处理标记,在子图像310的一个或多个区域中叠加的一个或多个可视化标记,和/或可以用户判定标记,其指示子图像310是否符合预定规则。
图4B和图4D示出了根据本公开的一些实施例的用于用户标记的示例用户界面的示意图。在图4B的示例中,检测到用户对当前呈现的子图像310-1的区域430的隐私化处理标记440。例如,用户可以通过鼠标、触摸屏等输入设备指示子图像310-1的区域430需要进行隐私化处理,进而可以在该区域添加隐私化处理标记440。在该示例中,隐私化处理标记440可以包括马赛克标记。在其他示例中,隐私化处理标记440还可以包括对子图像310的特定区域的其他标记,以便遮挡或隐藏该区域所呈现的视觉信息。
在图4C的示例中,可以检测到用户在子图像310-1的一个区域上叠加的可视化标记,例如文本标记442,其中包含输入的文本。在图4D的示例中,可以检测到用户对子图像310-1的用户判定标记,其指示图像310-1不符合预定规则。此外,还可以检测到用户在子图像310-1的一个区域上叠加的可视化标记,例如包围框标记446,以指示该区域导致图像310-1不符合预定规则(例如,由于包含隐私信息)。
继续返回参考图2的过程200,在接收到针对多张子图像310各自的用户标记后,在框240,终端设备110基于对多张子图像310各自的用户标记,确定与全景图像120相对应的标记后的全景图像122。
取决于具体的用户标记的类型,可以用不同方式确定标记后的全景图像122。对于用户编辑标记,可能需要利用用户编辑标记来生成新的子图像,并且基于新的子图像来生成编辑后的全景图像122。如果对多张子图像310的用户标记仅包括用户判定标记,而不包括用户编辑标记,这意味着不需要对子图像进行编辑。用户判定标记可以被记录或被提供给后续任务作为输入。
具体地,在一些实施例中,对于某张子图像310,如果针对该子图像310的用户标记包括用户编辑标记(例如,隐私化处理标记或可视化标记的叠加),终端设备110可以基于用户编辑标记来生成标记后的子图像。在一些实施例中,接收到的用户编辑标记可以指示在子图像310中施加用户编辑标记的一个或多个区域的坐标信息,以及用户编辑标记的类型指示。终端设备110可以在本地或者借助远端设备(例如,计算设备132),基于坐标信息和用户编辑标记的类型指示,生成标记后的子图像,使得该标记后的子图像具有对应的用户编辑标记。在一些实施例中,如果多张子图像中的某张子图像310的用户标记指示为空,那么终端设备110可以将该子图像310确定为标记后的子图像。
如果多张子图像310中的一张或一张以上的子图像310的用户标记包括用户编辑标记,终端设备110可以合并标记后的多张子图像,以生成标记后的全景图像122。也就是说,在子图像310被编辑的情况下,标记后的子图像的视觉信息不同于原始的子图像310,因此需要利用标记后的多张子图像执行反合成(或拼接),以便获得带有用户编辑标记的标记后的全景图像122。在一些实施例中,对标记后的多张子图像的合并过程可以是多张子图像的分割过程的逆过程,使得标记后的全景图像122可以具有与全景图像120相同的呈现方式、尺寸以及比例。
在一些实施例中,如果针对全景图像120的多张子图像310的用户标记不包括除用户判定标记之外的其他用户标记,这意味着多张子图像310的视觉信息不会因为用户标记而改变,那么终端设备110可以将全景图像120确定为标记后的全景图像122,而不需要在子图像基础上执行合成操作。
在一些实施例中,如果除用户编辑标记之外,针对某张子图像310的用户标记还额外包括用户判定标记,那么终端设备110也可以记录这些用户判定标记。
在一些实施例中,在用户标记包括用户判定标记的情况下,终端设备110可以基于针对多张子图像310的用户判定标记,确定针对全景图像120(或标记后的全景图像122)的总体用户判定标记。例如,如果某张子图像310的用户判定标记指示该子图像不符合预定规则,那么终端设备110可以确定全景图像120(或标记后的全景图像122)不符合预定规则。如果全部子图像310的用户判定标记均指示这些子图像符合预定规则,那么终端设备110可以确定全景图像120(或标记后的全景图像122)符合预定规则。
在一些实施例中,终端设备110可以存储标记后的全景图像122,例如存储在本地和/或存储在远端设备(例如,计算设备132)。在一些实施例中,标记后的全景图像122可以被提供给后续任务作为输入,例如可以被发布,或者被提供进行其他处理等等。这里不做限制。
在涉及到用户判定标记的一些实施例中,终端设备110可以将标记后的全景图像122与总体用户判定标记相关联地存储。在一些实施例中,附加地或备选地,终端设备110还可以存储针对各个子图像310的用户判定标记。
参考图3的图像处理流300中,分割后的子图像310经过用户标记后,取决于用户标记的类型,可以具有不同的处理分支。具体地,如果对多张子图像310的用户标记包括用户编辑标记,可以生成与多张子图像310分别相对应的多张标记后的子图像320-1、320-2、……、320-N(统称为或单独称为标记后的子图像320)。多张标记后的子图像320经过合并后得到标记后的全景图像122。如果对多张子图像310的用户标记仅包括用户判定标记,而不包括用户编辑标记,那么可以将全景图像120直接确定为标记后的全景图像122。
在一些实施例中,在用户标记仅包括用户判定标记的分支下,还可以基于针对各个子图像310的用户判定标记,确定针对标记后的全景图像122的总体用户判定标记322,并可以将总体用户判定标记322与标记后的全景图像122相关联地存储。在一些实施例中,在用户标记包括用户编辑标记的分支下,可能也会存在用户判定标记。此时,也可以以类似地方式确定针对标记后的全景图像122的总体用户判定标记324,并将总体用户判定标记324与标记后的全景图像122相关联地存储。
在一些实施例中,除总体用户判定标记之外,还可以存储针对子图像的个体用户判定标记,这可以根据实际应用需要确定,在此不做具体限制。
在一些实施例中,相对于子图像310的呈现和标记,对全景图像120的分割以及对标记后的全景图像122的合成可以在后台异步执行,对用户102是透明的。换言之,对于执行标记的用户而言,仅需要关注对所呈现的子图像的标记,而不需要关注输入的全景图像和输出的标记后的全景图像。这样可以显著提高标注效率和准确度。
在需要执行多张全景图像的标记的场景中,可以按消息队列的方式,自动执行各个全景图像的分割和合成。这样,可以提高终端设备110的处理能力。应当理解,终端设备110还可以根据处理能力和处理任务的需要,以任何适当的串行或并行方式来处理全景图像的标记过程,本公开的实施例在此方面不受限制。
图5示出了根据本公开的某些实施例的用于图像处理的装置500的示意性结构框图。装置500可以被实现为或者被包括在终端设备15中。装置500中的各个模块/组件可以由硬件、软件、固件或者它们的任意组合来实现。
如图所示,装置500包括分割模块510,被配置为将全景图像分割为多张子图像,以及呈现模块520,被配置为呈现多张子图像。装置500还包括接收模块530,被配置为接收对多张子图像各自的用户标记,以及获取模块540,被配置为基于对多张子图像各自的用户标记,获取与全景图像相对应的标记后的全景图像。
在一些实施例中,分割模块510包括:视图获取模块,被配置为确定与全景图像呈现的场景相关联的多个视图;以及基于视图的分割模块,被配置为将全景图像分割为与多个视图相对应的多张子图像。
在一些实施例中,场景的多个视图包括以下至少一项:仰视图、俯视图、左视图、右视图、前视图和后视图。
在一些实施例中,呈现模块520被配置为:将多张子图像与多个视图的指示相关联地呈现。
在一些实施例中,对多张子图像各自的用户标记包括以下至少一项:针对多张图像中的至少一个区域的用户编辑标记,以及用户判定标记,用户判定标记指示多张子图像是否分别符合预定规则。
在一些实施例中,用户编辑标记包括以下至少一项:对多张图像中的至少一个区域的隐私化处理标记,以及在多张图像中的至少一个区域上叠加的可视化标记。
在一些实施例中,获取模块540包括:子图像生成模块,被配置为如果用户标记包括用户编辑标记,基于用户编辑标记来生成标记后的多张子图像;以及合并模块,被配置为通过合并标记后的多张子图像来生成标记后的全景图像。
在一些实施例中,获取模块540被配置为:如果用户标记不包括除用户判定标记之外的其他用户标记,将全景图像获取为标记后的全景图像。
在一些实施例中,针对多张子图像各自的用户标记包括针对多张子图像各自的用户判定标记。装置500还包括:总体判定生成模块,被配置为基于针对多张子图像各自的用户标记确定针对标记后的全景图像的总体用户判定标记;以及存储模块,被配置为将总体用户判定标记和标记后的全景图像相关联地存储。
图6示出了其中可以实现本公开的一个或多个实施例的计算设备600的框图。应当理解,图6所示出的计算设备600仅仅是示例性的,而不应当构成对本文所描述的实施例的功能和范围的任何限制。图6所示出的计算设备600可以用于实现图1的终端设备110。
如图6所示,计算设备600是通用计算设备的形式。计算设备600的组件可以包括但不限于一个或多个处理器或处理单元610、存储器620、存储设备630、一个或多个通信单元640、一个或多个输入设备650以及一个或多个输出设备660。处理单元610可以是实际或虚拟处理器并且能够根据存储器620中存储的程序来执行各种处理。在多处理器系统中,多个处理单元并行执行计算机可执行指令,以提高计算设备600的并行处理能力。
计算设备600通常包括多个计算机存储介质。这样的介质可以是计算设备600可访问的任何可以获得的介质,包括但不限于易失性和非易失性介质、可拆卸和不可拆卸介质。存储器620可以是易失性存储器(例如寄存器、高速缓存、随机访问存储器(RAM))、非易失性存储器(例如,只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、闪存)或它们的某种组合。存储设备630可以是可拆卸或不可拆卸的介质,并且可以包括机器可读介质,诸如闪存驱动、磁盘或者任何其他介质,其可以能够用于存储信息和/或数据(例如用于训练的训练数据)并且可以在计算设备600内被访问。
计算设备600可以进一步包括另外的可拆卸/不可拆卸、易失性/非易失性存储介质。尽管未在图6中示出,可以提供用于从可拆卸、非易失性磁盘(例如“软盘”)进行读取或写入的磁盘驱动和用于从可拆卸、非易失性光盘进行读取或写入的光盘驱动。在这些情况中,每个驱动可以由一个或多个数据介质接口被连接至总线(未示出)。存储器620可以包括计算机程序产品625,其具有一个或多个程序模块,这些程序模块被配置为执行本公开的各种实施例的各种方法或动作。
通信单元640实现通过通信介质与其他计算设备进行通信。附加地,计算设备600的组件的功能可以以单个计算集群或多个计算机器来实现,这些计算机器能够通过通信连接进行通信。因此,计算设备600可以使用与一个或多个其他服务器、网络个人计算机(PC)或者另一个网络节点的逻辑连接来在联网环境中进行操作。
输入设备650可以是一个或多个输入设备,例如鼠标、键盘、追踪球等。输出设备660可以是一个或多个输出设备,例如显示器、扬声器、打印机等。计算设备600还可以根据需要通过通信单元640与一个或多个外部设备(未示出)进行通信,外部设备诸如存储设备、显示设备等,与一个或多个使得用户与计算设备600交互的设备进行通信,或者与使得计算设备600与一个或多个其他计算设备通信的任何设备(例如,网卡、调制解调器等)进行通信。这样的通信可以经由输入/输出(I/O)接口(未示出)来执行。
根据本公开的示例性实现方式,提供了一种计算机可读存储介质,其上存储有计算机可执行指令,其中计算机可执行指令被处理器执行以实现上文描述的方法。根据本公开的示例性实现方式,还提供了一种计算机程序产品,计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括计算机可执行指令,而计算机可执行指令被处理器执行以实现上文描述的方法。
这里参照根据本公开实现的方法、装置、设备和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其他可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实现的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实现,上述说明是示例性的,并非穷尽性的,并且也不限于所公开的各实现。在不偏离所说明的各实现的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实现的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文公开的各个实现方式。

Claims (20)

1.一种图像处理的方法,包括:
将全景图像分割为多张子图像;
呈现所述多张子图像;
接收对所述多张子图像各自的用户标记;以及
基于对所述多张子图像各自的所述用户标记,获取与所述全景图像相对应的标记后的全景图像。
2.根据权利要求1所述的方法,其中将所述全景图像分割为所述多张子图像包括:
确定与所述全景图像呈现的场景相关联的多个视图;以及
将所述全景图像分割为与所述多个视图相对应的多张子图像。
3.根据权利要求2所述的方法,其中所述场景的所述多个视图包括以下至少一项:仰视图、俯视图、左视图、右视图、前视图和后视图。
4.根据权利要求2所述的方法,其中呈现所述多张子图像包括:
将所述多张子图像与所述多个视图的指示相关联地呈现。
5.根据权利要求1所述的方法,其中对所述多张子图像各自的用户标记包括以下至少一项:
针对所述多张图像中的至少一个区域的用户编辑标记,以及
用户判定标记,所述用户判定标记指示所述多张子图像是否分别符合预定规则。
6.根据权利要求5所述的方法,其中所述用户编辑标记包括以下至少一项:
对所述多张图像中的至少一个区域的隐私化处理标记,以及
在所述多张图像中的至少一个区域上叠加的可视化标记。
7.根据权利要求5所述的方法,其中获取与所述全景图像相对应的标记后的全景图像包括:
如果所述用户标记包括所述用户编辑标记,基于所述用户编辑标记来生成标记后的多张子图像;以及
通过合并所述标记后的多张子图像来生成所述标记后的全景图像。
8.根据权利要求5所述的方法,其中获取与所述全景图像相对应的标记后的全景图像包括:
如果所述用户标记不包括除所述用户判定标记之外的其他用户标记,将所述全景图像获取为所述标记后的全景图像。
9.根据权利要求5所述的方法,其中针对所述多张子图像各自的用户标记包括针对所述多张子图像各自的用户判定标记,所述方法还包括:
基于针对所述多张子图像各自的用户标记确定针对所述标记后的全景图像的总体用户判定标记;以及
将所述总体用户判定标记和所述标记后的全景图像相关联地存储。
10.一种用于图像处理的装置,包括:
分割模块,被配置为将全景图像分割为多张子图像;
呈现模块,被配置为呈现所述多张子图像;
接收模块,被配置为接收对所述多张子图像各自的用户标记;以及
获取模块,被配置为基于对所述多张子图像各自的所述用户标记,获取与所述全景图像相对应的标记后的全景图像。
11.根据权利要求10所述的装置,其中所述分割模块包括:
视图确定模块,被配置为确定与所述全景图像呈现的场景相关联的多个视图;以及
基于视图的分割模块,被配置为将所述全景图像分割为与所述多个视图相对应的多张子图像。
12.根据权利要求11所述的装置,其中所述场景的所述多个视图包括以下至少一项:仰视图、俯视图、左视图、右视图、前视图和后视图。
13.根据权利要求11所述的装置,其中所述呈现模块被配置为:
将所述多张子图像与所述多个视图的指示相关联地呈现。
14.根据权利要求10所述的装置,其中对所述多张子图像各自的用户标记包括以下至少一项:
针对所述多张图像中的至少一个区域的用户编辑标记,以及
用户判定标记,所述用户判定标记指示所述多张子图像是否分别符合预定规则。
15.根据权利要求14所述的装置,其中所述用户编辑标记包括以下至少一项:
对所述多张图像中的至少一个区域的隐私化处理标记,以及
在所述多张图像中的至少一个区域上叠加的可视化标记。
16.根据权利要求14所述的装置,其中所述获取模块包括:
子图像生成模块,被配置为如果所述用户标记包括所述用户编辑标记,基于所述用户编辑标记来生成标记后的多张子图像;以及
合并模块,被配置为通过合并所述标记后的多张子图像来生成所述标记后的全景图像。
17.根据权利要求14所述的装置,其中所述获取模块被配置为:
如果所述用户标记不包括除所述用户判定标记之外的其他用户标记,将所述全景图像获取为所述标记后的全景图像。
18.根据权利要求14所述的装置,其中针对所述多张子图像各自的用户标记包括针对所述多张子图像各自的用户判定标记,所述装置还包括:
总体判定生成模块,被配置为基于针对所述多张子图像各自的用户标记确定针对所述标记后的全景图像的总体用户判定标记;以及
存储模块,被配置为将所述总体用户判定标记和所述标记后的全景图像相关联地存储。
19.一种电子设备,包括:
至少一个处理单元;以及
至少一个存储器,所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于由所述至少一个处理单元执行的指令,所述指令在由所述至少一个处理单元执行时使所述设备执行根据权利要求1至9中任一项所述的方法。
20.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序可由处理器执行以实现根据权利要求1至9中任一项所述的方法。
CN202210514331.1A 2022-05-11 2022-05-11 用于图像处理的方法、装置、设备和存储介质 Pending CN114913276A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210514331.1A CN114913276A (zh) 2022-05-11 2022-05-11 用于图像处理的方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210514331.1A CN114913276A (zh) 2022-05-11 2022-05-11 用于图像处理的方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN114913276A true CN114913276A (zh) 2022-08-16

Family

ID=82766245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210514331.1A Pending CN114913276A (zh) 2022-05-11 2022-05-11 用于图像处理的方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN114913276A (zh)

Similar Documents

Publication Publication Date Title
US10210659B2 (en) Augmented reality system, method, and apparatus for displaying an item image in a contextual environment
US9633479B2 (en) Time constrained augmented reality
US8625908B2 (en) Managing raw and processed image file pairs
EP2560145A2 (en) Methods and systems for enabling the creation of augmented reality content
CN111652796A (zh) 图像处理方法、电子设备及计算机可读存储介质
US20090316961A1 (en) Method for tagging image content
CN104036476A (zh) 用于提供增强现实的方法以及便携式终端
CN108509621B (zh) 景区全景图的景点识别方法、装置、服务器和存储介质
JP2014071850A (ja) 画像処理装置、端末装置、画像処理方法、およびプログラム
CN110532497B (zh) 生成全景图的方法、生成三维页面的方法以及计算设备
CN111597628B (zh) 一种模型标记方法、装置、存储介质及电子设备
CN103327246A (zh) 一种多媒体拍摄处理方法、装置及智能终端
US10779031B2 (en) Video sticky notes information processing apparatus and non-transitory computer readable medium
CN114913276A (zh) 用于图像处理的方法、装置、设备和存储介质
CN114089836B (zh) 标注方法、终端、服务器和存储介质
CN111246140A (zh) 数字标示显示方法和数字标示显示系统
US20130004036A1 (en) Systems And Methods For Customizing Pregnancy Imagery
CN113273167B (zh) 数据处理设备、方法和存储介质
JP5846378B2 (ja) 情報管理方法及び情報管理システム
CN112365402A (zh) 智能组卷方法、装置、存储介质及电子设备
JP4330637B2 (ja) 携帯機器
JP2009259254A (ja) コンテンツ表現制御装置、コンテンツ表現制御システム、コンテンツ表現制御用基準物体およびコンテンツ表現制御プログラム
JP2005284882A (ja) コンテンツ表現制御装置、コンテンツ表現制御システム、コンテンツ表現制御用基準物体、コンテンツ表現制御方法、コンテンツ表現制御プログラム、およびコンテンツ表現制御プログラムを記録した記録媒体
CN111083552A (zh) 一种缩略图生成方法、装置、设备和介质
CN116206014A (zh) 图像预览方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 802, Information Building, 13 Linyin North Street, Pinggu District, Beijing, 101299

Applicant after: Beijing youzhuju Network Technology Co.,Ltd.

Address before: 101299 Room 802, information building, No. 13, linmeng North Street, Pinggu District, Beijing

Applicant before: Beijing youzhuju Network Technology Co.,Ltd.