CN110650239A - 图像处理方法、装置、计算机设备及存储介质 - Google Patents

图像处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110650239A
CN110650239A CN201810671033.7A CN201810671033A CN110650239A CN 110650239 A CN110650239 A CN 110650239A CN 201810671033 A CN201810671033 A CN 201810671033A CN 110650239 A CN110650239 A CN 110650239A
Authority
CN
China
Prior art keywords
image
image processing
shooting angle
displayed
feature space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810671033.7A
Other languages
English (en)
Other versions
CN110650239B (zh
Inventor
刘慧�
吴云鹏
王洪志
肖乾隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810671033.7A priority Critical patent/CN110650239B/zh
Publication of CN110650239A publication Critical patent/CN110650239A/zh
Application granted granted Critical
Publication of CN110650239B publication Critical patent/CN110650239B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72439User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for image or video messaging

Abstract

本发明实施例公开了一种图像处理方法、装置、计算机设备及存储介质,其中该方法包括:获取POI的待展示图像;将所述待展示图像输入至预先训练的图像处理模型,以生成适合展示的最佳拍摄角度的图像;将所述图像处理模型输出的图像,作为所述POI的最终展示图像。本发明实施例利用图像处理模型根据拍摄角度较偏的图像生成最佳拍摄角度的图像,由此针对POI图像展示,能够获得较好的展示效果,提升用户体验。

Description

图像处理方法、装置、计算机设备及存储介质
技术领域
本发明实施例涉及图像处理技术,尤其涉及一种图像处理方法、装置、计算机设备及存储介质。
背景技术
地图已经成为人们行前决策的最重要的参考依据之一,一个POI(Point ofInterest,兴趣点)下有很多的图像,图像的来源很多,如用户贡献的、外业采集的、互联网上获取的等,图像的类型也有很多,如店外的门脸、店内的环境、菜式、服务等。因此这些图像的拍摄角度很不统一。在手机的交互界面上,一个POI的详情页上最多展示一张图像,称为头图,这张头图位于详情页最顶部,是POI表达的直接入口,给用户出行决策提供了极大的参考意见。
目前在众多图像中挑选POI头图的方法,主要是根据现有参考数据和一定规则,从POI的可选图像中选择展示效果最好,最适合展示的图像,作为头图进行展示。
但是,当该POI下所有可选图像的拍摄角度都很偏时,所选取的图像的拍摄角度仍然是偏斜的,展示效果并不是最佳,影响了用户体验。
发明内容
本发明实施例提供一种图像处理方法、装置、计算机设备及存储介质,以根据拍摄角度较偏的图像生成最佳拍摄角度的图像,获得较好的展示效果。
第一方面,本发明实施例提供了一种图像处理方法,包括:
获取POI的待展示图像;
将所述待展示图像输入至预先训练的图像处理模型,以生成适合展示的最佳拍摄角度的图像;
将所述图像处理模型输出的图像,作为所述POI的最终展示图像。
第二方面,本发明实施例还提供了一种图像处理装置,包括:
图像获取模块,用于获取POI的待展示图像;
图像处理模块,用于将所述待展示图像输入至预先训练的图像处理模型,以生成适合展示的最佳拍摄角度的图像;
图像展示模块,用于将所述图像处理模型输出的图像,作为所述POI的最终展示图像。
第三方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的图像处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的图像处理方法。
本发明实施例的技术方案,利用图像处理模型根据拍摄角度较偏的图像生成最佳拍摄角度的图像,由此针对POI图像展示,能够获得较好的展示效果,提升用户体验。
附图说明
图1是本发明实施例一提供的图像处理方法的流程图;
图2是本发明实施例二提供的图像处理方法的流程图;
图3是本发明实施例二提供的图像处理模型的网络结构示意图;
图4是本发明实施例三提供的图像处理装置的结构示意图;
图5是本发明实施例四提供的计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的图像处理方法的流程图,本实施例可适用于地图产品中选取POI头图的情况,该方法可以由图像处理装置来执行,该装置可以由软件和/或硬件来实现,一般可集成在服务器等具备计算处理功能的计算机设备中。如图1所示,该方法具体包括:
S110,获取POI的待展示图像。
其中,本实施例中POI的待展示图像是指按照现有POI头图选取方法从该POI的所有可选图像中选取的作为该POI的头图的图像。本发明实施例对具体的POI头图选取方法不进行限制。
S120,将所述待展示图像输入至预先训练的图像处理模型,以生成适合展示的最佳拍摄角度的图像。
其中,图像处理模型用于根据图像的属性对输入的图像进行处理以生成新图像,该新图像具有适合展示的最佳拍摄角度,展示效果较好。图像处理模型可以基于多种方法实现,例如,DNN(Deep Neural Network,深度神经网络)、RNN(Recurrent Neural Network,循环神经网络)等,较优的,图像处理模型基于GAN(Generative Adversarial Networks,生成式对抗网络)实现。
拍摄角度是指拍摄图像时镜头相对于拍摄目标的参数,拍摄角度包括:拍摄高度、拍摄方向和拍摄距离,拍摄高度包括平拍、俯拍和仰拍;拍摄方向包括正面角度、侧面角度、斜侧角度和背面角度等;拍摄距离是指镜头相对于拍摄目标的距离。
最佳拍摄角度是指最适合展示图像的拍摄角度,例如正面拍摄角度。最佳拍摄角度并非固定不变的角度,针对每个POI可以是不同的,例如,在正对店面10米的地方对店面进行平拍;又如,对于招牌安装在二楼的店面,则正对店面且采取合适角度的仰拍更适合展示。
可选的,图像处理模型可以根据图像的不变属性和可变属性对图像进行处理,以生成适合展示的最佳拍摄角度的图像。具体的,将所述待展示图像输入至预先训练的图像处理模型,以生成适合展示的最佳拍摄角度的图像,包括:将所述待展示图像的不变属性映射到不变属性特征空间;将所述待展示图像的拍摄角度映射到可变属性特征空间,并将所述待展示图像的拍摄角度变换为适合展示的最佳拍摄角度;根据所述待展示图像的不变属性特征和可变属性特征中的所述最佳拍摄角度,生成所述最终展示图像。
其中,图像的不变属性是指在本发明实施例的图像处理过程中不能被改变的图像特征,包括:图像中的内容(如文字、物体形状结构、颜色等)和图像大小等,例如,图像中的店面招牌是牛肉拉面,这属于不变属性。图像的不变属性可以从图像中提取,具体可以使用现有的图像特征提取方法,较优的使用特征空间映射的方法提取图像的不变属性。
图像的可变属性是指在本发明实施例的图像处理过程中可以被改变的图像特征,在本发明实施例中,图像的可变属性即为拍摄角度。图像的可变属性可以从图像的拍摄参数中提取,较优的使用特征空间映射的方法提取图像的可变属性,具体可以在获取POI可选图像的同时获取拍摄该图像时相应的拍摄参数。
可选的,将所述待展示图像的拍摄角度变换为适合展示的最佳拍摄角度,包括:根据所述待展示图像中的拍摄目标,确定相应的适合展示的最佳拍摄角度;将所述拍摄角度变换为所述最佳拍摄角度。
其中,最佳拍摄角度不是一个固定值,可以根据具体图像中的拍摄目标的情况进行确定。具体的,可以对图像特征进行识别,识别出图像中的拍摄目标(如店面招牌、具体菜式、店内桌椅等),根据拍摄目标在图像中的位置确定最佳拍摄角度。
将图像的拍摄角度变换为最佳拍摄角度后,结合图像的不变属性特征和可变属性特征(即最佳拍摄角度),即可生成新的适合展示的图像。
S130,将所述图像处理模型输出的图像,作为所述POI的最终展示图像。
其中,图像处理模型输出的图像即为适合展示的最佳拍摄角度的图像,将该图像作为POI的最终展示图像,能够保证POI头图的展示效果较佳。
在实际应用中,可以对每个POI头图的选取均执行本实施例的方法,也可以仅针对待展示图像拍摄角度偏斜的POI执行本实施例的方法。
本实施例的技术方案,利用图像处理模型根据拍摄角度较偏的图像生成最佳拍摄角度的图像,由此针对POI图像展示,能够获得较好的展示效果,提升用户体验。
实施例二
图2是本发明实施例二提供的图像处理方法的流程图,本实施例在上述实施例的基础上,提供了图像处理模型训练过程的实施方式。如图2所示,该方法具体包括:
S210,获取至少一个用户采集的预设数量的POI图像及其拍摄参数,作为训练样本,其中所述拍摄参数包括拍摄角度。
其中,可以根据实际需求获取合适数量的样本数据。具体可以利用众包方式淘金用户采集的POI图像及其拍摄参数,从中能够获取图像拍摄时的拍摄角度。每个样本数据包括:POI图像及其对应的拍摄参数。
S220,将图像特征空间分为不变属性特征空间和可变属性特征空间。
S230,利用所述训练样本,进行图像不变属性特征空间映射、图像可变属性特征空间映射以及从图像不变属性特征空间和可变属性特征空间生成新图像的学习,以确定所述图像处理模型的参数。
其中,图像处理模型的功能主要涉及:图像不变属性特征空间映射、图像可变属性特征空间映射以及从图像不变属性特征空间和可变属性特征空间生成新图像这三个方面,因此,图像处理模型的训练也是针对这三个过程的学习,从而确定模型参数。
下面以生成式对抗网络为例进行模型训练的说明。
首先需要设计生成式对抗网络,具体的,基于IcGAN(InvertibleConditionalGAN,可逆条件GAN),设计一个输入为拍摄角度偏斜的图像,输出为最佳拍摄角度(如正面拍摄)的图像的网络。网络结构如图3所示,包括IcGAN部分和CGAN(ConditionalGenerative Adversarial Networks,条件生成式对抗网络)部分。输入拍摄偏斜的POI图像X,图像X的不变属性经过编码器(Encode)Ez映射到特征空间Z,图像X的可变属性(即拍摄角度)经过编码器Ey映射到特征空间Y,将Y变换为最佳拍摄角度Y’,将图像不变属性Z和最佳拍摄角度Y’一起输入到生成器(Generator)中,生成由Y’决定的图像X’,即得到了最佳拍摄角度的POI图像,也就是说,图像X’就是图像X保持其他属性不变,仅改变拍摄角度属性的新图像。
具体的训练如下:
(1)训练CGAN网络部分。CGAN包括生成器和辨别器,生成器的目的是根据输入的数据输出图像,且让输出的伪造图像看起来像训练样本;辨别器的输入是随机选择一张真实样本或者生成器的输出,输出是其输入图片来自于真实样本或者生成器的概率。也就是说,辨别器的目标是对于所有的真实图片,输出为1,对于所有的假图片,输出为0。生成器的目标是愚弄辨别器蒙混过关,需要达到的目标是对于生成的图片,输出为1(正好和辨别器相反)。在训练过程中,生成器和辨别器不断相互学习,直到辨别器无法分辨出生成器生成的图像是真是假,则训练成功。在图像处理模型的使用阶段,仅使用生成器。
(2)训练编码器Ez。Ez用于将输入图像编码为特征向量Z,也就是特征向量Z提取了图像的不变属性。编码器Ez的训练目标是能够有效映射图像的不变属性。
(3)训练编码器Ey。Ey用于将输入图像编码为特征向量Y。编码器Ey的训练目标是能够有效映射图像的可变属性。
S240,获取POI的待展示图像。
S250,将所述待展示图像输入至预先训练的图像处理模型,以生成适合展示的最佳拍摄角度的图像。
S260,将所述图像处理模型输出的图像,作为所述POI的最终展示图像。
对于图像处理模型的训练,可以在参数指标达到优化目标时结束训练,确定模型参数,例如损失函数Loss最小。当然,也可以使用测试样本进行模型效果的测试,并不断更新模型参数,直到效果符合预设要求时,才认为模型参数是合适的。具体的,S230包括:利用所述训练样本得到所述图像处理模型的学习参数;利用测试样本测试所述图像处理模型输出的图像是否符合预设要求,其中所述预设要求包括:图像完整无损且具有适合展示的最佳拍摄角度;若不符合所述预设要求,则再次训练所述图像处理模型,以更新所述学习参数,直到符合所述预设要求为止。
其中,测试样本的获取与训练样本的获取类似,此处不再赘述。预设要求包括图像完整无损,是考虑到通过图像处理模型生成的新图像不能丢失应有的信息。此外,预设要求还可以包括测试样本中的图像处理成功率达到预设阈值,例如,50个测试样本中有45个测试样本的输出图像满足预设要求,成功率为90%,预设阈值为85%,则认为模型参数满足使用需求,停止模型训练。
本实施例的技术方案,利用训练样本对图像处理模型进行训练,以确定其参数,且利用测试样本进行模型效果的验证和模型参数的优化,能够保证图像处理模型的准确度,使得生成的新图像适合展示,从而优化POI头图的展示效果,提高用户体验。
实施例三
图4是本发明实施例三提供的图像处理装置的结构示意图,如图4所示,该装置包括:
图像获取模块410,用于获取POI的待展示图像;
图像处理模块420,用于将所述待展示图像输入至预先训练的图像处理模型,以生成适合展示的最佳拍摄角度的图像;
图像展示模块430,用于将所述图像处理模型输出的图像,作为所述POI的最终展示图像。
可选的,图像处理模块420包括:
第一映射单元,用于将所述待展示图像的不变属性映射到不变属性特征空间;
第二映射单元,用于将所述待展示图像的拍摄角度映射到可变属性特征空间,并将所述待展示图像的拍摄角度变换为适合展示的最佳拍摄角度;
图像生成单元,用于根据所述待展示图像的不变属性特征和可变属性特征中的所述最佳拍摄角度,生成所述最终展示图像。
可选的,第二映射单元具体用于:根据所述待展示图像中的拍摄目标,确定相应的适合展示的最佳拍摄角度;将所述拍摄角度变换为所述最佳拍摄角度。
可选的,上述装置还包括:
样本获取模块,用于获取至少一个用户采集的预设数量的POI图像及其拍摄参数,作为训练样本,其中所述拍摄参数包括拍摄角度;
特征空间划分模块,用于将图像特征空间分为不变属性特征空间和可变属性特征空间;
参数确定模块,用于利用所述训练样本,进行图像不变属性特征空间映射、图像可变属性特征空间映射以及从图像不变属性特征空间和可变属性特征空间生成新图像的学习,以确定所述图像处理模型的参数。
可选的,上述参数确定模块包括:
参数获取单元,用于利用所述训练样本得到所述图像处理模型的学习参数;
模型测试单元,用于利用测试样本测试所述图像处理模型输出的图像是否符合预设要求,其中所述预设要求包括:图像完整无损且具有适合展示的最佳拍摄角度;
参数更新单元,用于若不符合所述预设要求,则再次训练所述图像处理模型,以更新所述学习参数,直到符合所述预设要求为止。
可选的,所述图像处理模型基于生成式对抗网络实现。
本发明实施例所提供的图像处理装置可执行本发明任意实施例所提供的图像处理方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的图像处理方法。
实施例四
本实施例提供了一种计算机设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的图像处理方法。
图5是本发明实施例四提供的计算机设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图5显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图5所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的图像处理方法。
实施例五
本发明实施例五提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的图像处理方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (14)

1.一种图像处理方法,其特征在于,包括:
获取兴趣点POI的待展示图像;
将所述待展示图像输入至预先训练的图像处理模型,以生成适合展示的最佳拍摄角度的图像;
将所述图像处理模型输出的图像,作为所述POI的最终展示图像。
2.根据权利要求1所述的方法,其特征在于,将所述待展示图像输入至预先训练的图像处理模型,以生成适合展示的最佳拍摄角度的图像,包括:
将所述待展示图像的不变属性映射到不变属性特征空间;
将所述待展示图像的拍摄角度映射到可变属性特征空间,并将所述待展示图像的拍摄角度变换为适合展示的最佳拍摄角度;
根据所述待展示图像的不变属性特征和可变属性特征中的所述最佳拍摄角度,生成所述最终展示图像。
3.根据权利要求2所述的方法,其特征在于,将所述待展示图像的拍摄角度变换为适合展示的最佳拍摄角度,包括:
根据所述待展示图像中的拍摄目标,确定相应的适合展示的最佳拍摄角度;
将所述拍摄角度变换为所述最佳拍摄角度。
4.根据权利要求1所述的方法,其特征在于,在获取POI的待展示图像之前,还包括:
获取至少一个用户采集的预设数量的POI图像及其拍摄参数,作为训练样本,其中所述拍摄参数包括拍摄角度;
将图像特征空间分为不变属性特征空间和可变属性特征空间;
利用所述训练样本,进行图像不变属性特征空间映射、图像可变属性特征空间映射以及从图像不变属性特征空间和可变属性特征空间生成新图像的学习,以确定所述图像处理模型的参数。
5.根据权利要求4所述的方法,其特征在于,利用所述训练样本,进行图像不变属性特征空间映射、图像可变属性特征空间映射以及从图像不变属性特征空间和可变属性特征空间生成新图像的学习,以确定所述图像处理模型的参数,包括:
利用所述训练样本得到所述图像处理模型的学习参数;
利用测试样本测试所述图像处理模型输出的图像是否符合预设要求,其中所述预设要求包括:图像完整无损且具有适合展示的最佳拍摄角度;
若不符合所述预设要求,则再次训练所述图像处理模型,以更新所述学习参数,直到符合所述预设要求为止。
6.根据权利要求1至5中任一所述的方法,其特征在于,所述图像处理模型基于生成式对抗网络实现。
7.一种图像处理装置,其特征在于,包括:
图像获取模块,用于获取兴趣点POI的待展示图像;
图像处理模块,用于将所述待展示图像输入至预先训练的图像处理模型,以生成适合展示的最佳拍摄角度的图像;
图像展示模块,用于将所述图像处理模型输出的图像,作为所述POI的最终展示图像。
8.根据权利要求7所述的装置,其特征在于,所述图像处理模块包括:
第一映射单元,用于将所述待展示图像的不变属性映射到不变属性特征空间;
第二映射单元,用于将所述待展示图像的拍摄角度映射到可变属性特征空间,并将所述待展示图像的拍摄角度变换为适合展示的最佳拍摄角度;
图像生成单元,用于根据所述待展示图像的不变属性特征和可变属性特征中的所述最佳拍摄角度,生成所述最终展示图像。
9.根据权利要求8所述的装置,其特征在于,所述第二映射单元具体用于:
根据所述待展示图像中的拍摄目标,确定相应的适合展示的最佳拍摄角度;
将所述拍摄角度变换为所述最佳拍摄角度。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
样本获取模块,用于获取至少一个用户采集的预设数量的POI图像及其拍摄参数,作为训练样本,其中所述拍摄参数包括拍摄角度;
特征空间划分模块,用于将图像特征空间分为不变属性特征空间和可变属性特征空间;
参数确定模块,用于利用所述训练样本,进行图像不变属性特征空间映射、图像可变属性特征空间映射以及从图像不变属性特征空间和可变属性特征空间生成新图像的学习,以确定所述图像处理模型的参数。
11.根据权利要求10所述的装置,其特征在于,所述参数确定模块包括:
参数获取单元,用于利用所述训练样本得到所述图像处理模型的学习参数;
模型测试单元,用于利用测试样本测试所述图像处理模型输出的图像是否符合预设要求,其中所述预设要求包括:图像完整无损且具有适合展示的最佳拍摄角度;
参数更新单元,用于若不符合所述预设要求,则再次训练所述图像处理模型,以更新所述学习参数,直到符合所述预设要求为止。
12.根据权利要求7至11中任一所述的装置,其特征在于,所述图像处理模型基于生成式对抗网络实现。
13.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至6中任一所述的图像处理方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任一所述的图像处理方法。
CN201810671033.7A 2018-06-26 2018-06-26 图像处理方法、装置、计算机设备及存储介质 Active CN110650239B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810671033.7A CN110650239B (zh) 2018-06-26 2018-06-26 图像处理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810671033.7A CN110650239B (zh) 2018-06-26 2018-06-26 图像处理方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN110650239A true CN110650239A (zh) 2020-01-03
CN110650239B CN110650239B (zh) 2021-03-16

Family

ID=68988675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810671033.7A Active CN110650239B (zh) 2018-06-26 2018-06-26 图像处理方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110650239B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113762015A (zh) * 2021-01-05 2021-12-07 北京沃东天骏信息技术有限公司 一种图像处理方法和装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101124820A (zh) * 2004-06-30 2008-02-13 索尼爱立信移动通讯股份有限公司 面部图像校正
CN102656605A (zh) * 2009-10-20 2012-09-05 乐天株式会社 图像处理装置、图像处理方法、图像处理程序以及记录介质
CN103258316A (zh) * 2013-03-29 2013-08-21 东莞宇龙通信科技有限公司 一种图片处理方法和装置
CN103514446A (zh) * 2013-10-16 2014-01-15 北京理工大学 一种融合传感器信息的室外场景识别方法
CN103761274A (zh) * 2014-01-09 2014-04-30 深圳先进技术研究院 以全景摄像机对街景数据库进行更新的方法
CN103971126A (zh) * 2014-05-12 2014-08-06 百度在线网络技术(北京)有限公司 一种交通标志识别方法和装置
US9134534B2 (en) * 2010-02-28 2015-09-15 Microsoft Technology Licensing, Llc See-through near-eye display glasses including a modular image source
CN105184273A (zh) * 2015-09-18 2015-12-23 桂林远望智能通信科技有限公司 一种基于asm的动态图像正面人脸重建系统及方法
CN107203556A (zh) * 2016-03-17 2017-09-26 高德软件有限公司 一种新增兴趣点信息的方法及装置
CN107451953A (zh) * 2017-08-07 2017-12-08 珠海格力电器股份有限公司 一种合影照片生成方法及其装置、电子设备
CN108133207A (zh) * 2017-11-24 2018-06-08 阿里巴巴集团控股有限公司 辅助物品的图像合规的方法、装置和电子设备
KR20180068932A (ko) * 2018-06-12 2018-06-22 네이버랩스 주식회사 지역 분할과 파노라마 분할 기법을 이용한 위치기반 관심지점 정보 검색 시스템 및 방법

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101124820A (zh) * 2004-06-30 2008-02-13 索尼爱立信移动通讯股份有限公司 面部图像校正
CN102656605A (zh) * 2009-10-20 2012-09-05 乐天株式会社 图像处理装置、图像处理方法、图像处理程序以及记录介质
US9134534B2 (en) * 2010-02-28 2015-09-15 Microsoft Technology Licensing, Llc See-through near-eye display glasses including a modular image source
CN103258316A (zh) * 2013-03-29 2013-08-21 东莞宇龙通信科技有限公司 一种图片处理方法和装置
CN103514446A (zh) * 2013-10-16 2014-01-15 北京理工大学 一种融合传感器信息的室外场景识别方法
CN103761274A (zh) * 2014-01-09 2014-04-30 深圳先进技术研究院 以全景摄像机对街景数据库进行更新的方法
CN103971126A (zh) * 2014-05-12 2014-08-06 百度在线网络技术(北京)有限公司 一种交通标志识别方法和装置
CN105184273A (zh) * 2015-09-18 2015-12-23 桂林远望智能通信科技有限公司 一种基于asm的动态图像正面人脸重建系统及方法
CN107203556A (zh) * 2016-03-17 2017-09-26 高德软件有限公司 一种新增兴趣点信息的方法及装置
CN107451953A (zh) * 2017-08-07 2017-12-08 珠海格力电器股份有限公司 一种合影照片生成方法及其装置、电子设备
CN108133207A (zh) * 2017-11-24 2018-06-08 阿里巴巴集团控股有限公司 辅助物品的图像合规的方法、装置和电子设备
KR20180068932A (ko) * 2018-06-12 2018-06-22 네이버랩스 주식회사 지역 분할과 파노라마 분할 기법을 이용한 위치기반 관심지점 정보 검색 시스템 및 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113762015A (zh) * 2021-01-05 2021-12-07 北京沃东天骏信息技术有限公司 一种图像处理方法和装置

Also Published As

Publication number Publication date
CN110650239B (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
CN108898186B (zh) 用于提取图像的方法和装置
CN109117831B (zh) 物体检测网络的训练方法和装置
CN109582880B (zh) 兴趣点信息处理方法、装置、终端及存储介质
CN110363810B (zh) 建立图像检测模型的方法、装置、设备和计算机存储介质
CN110942011B (zh) 一种视频事件识别方法、系统、电子设备及介质
CN115063875B (zh) 模型训练方法、图像处理方法、装置和电子设备
CN111784776B (zh) 视觉定位方法及装置、计算机可读介质和电子设备
CN110674349B (zh) 视频poi识别方法、装置及电子设备
CN110647675B (zh) 停留点识别及预测模型训练方法、装置及存储介质
CN114511661A (zh) 图像渲染方法、装置、电子设备及存储介质
CN108597034B (zh) 用于生成信息的方法和装置
CN114332977A (zh) 关键点检测方法、装置、电子设备及存储介质
CN114581794B (zh) 地理数字孪生信息获取方法、装置、电子设备及存储介质
CN110910445A (zh) 一种物件尺寸检测方法、装置、检测设备及存储介质
CN112580666A (zh) 图像特征的提取方法、训练方法、装置、电子设备及介质
CN108921138B (zh) 用于生成信息的方法和装置
CN110909889A (zh) 一种基于特征分布的训练集生成、模型训练方法及装置
CN113705390B (zh) 定位方法、装置、电子设备和存储介质
CN112925470B (zh) 交互式电子白板的触摸控制方法、系统和可读介质
CN114299366A (zh) 一种图像检测方法、装置、电子设备及存储介质
CN110650239B (zh) 图像处理方法、装置、计算机设备及存储介质
CN113934297A (zh) 一种基于增强现实的交互方法、装置、电子设备及介质
WO2021104274A1 (zh) 图文联合表征的搜索方法、系统、服务器和存储介质
CN109461203B (zh) 手势三维图像生成方法、装置、计算机设备及存储介质
CN115393423A (zh) 目标检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant