CN112766997A - 图片投放方法、装置、设备和存储介质 - Google Patents

图片投放方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN112766997A
CN112766997A CN201911061688.3A CN201911061688A CN112766997A CN 112766997 A CN112766997 A CN 112766997A CN 201911061688 A CN201911061688 A CN 201911061688A CN 112766997 A CN112766997 A CN 112766997A
Authority
CN
China
Prior art keywords
picture
released
landing page
pictures
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911061688.3A
Other languages
English (en)
Inventor
张弦
郭海文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201911061688.3A priority Critical patent/CN112766997A/zh
Publication of CN112766997A publication Critical patent/CN112766997A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0276Advertisement creation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection

Abstract

本申请实施例公开了一种图片投放方法、装置、设备和存储介质,涉及互联网技术领域。具体实现方案为:抓取目标对象的落地页页面;根据所述落地页页面的文档对象模型,提取所述目标对象在所述落地页页面中所配置的待投放图片;对所述待投放图片进行裁剪,并对裁剪后的待投放图片进行投放。本申请实施例通过从落地页中提取待投放图片,能够得到目标对象比较认可、内容相关性强且图像质量高的待投放图片,进而基于提取的待投放图片进行裁剪和投放,不仅使得目标对象所配置的待投放图片能够符合投放要求进行投放,而且提高了图片的投放效果。

Description

图片投放方法、装置、设备和存储介质
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及互联网技术领域,具体涉及一种图片投放方法、装置、设备和存储介质。
背景技术
搜索广告场景中,为广告预留的广告位通常是尺寸固定的,而广告主提供的原始图片通常大小形状不一。因此如何在广告主落地页对用户所编辑的图片进行裁剪尤为重要。
目前,现有技术依赖人工进行图片的调整,不仅图片获取的方式以及获取的图片受限,而且容易导致原始图片中完整的图片内容被截断,或导致图片内容变形,影响广告图片的展示效果。
发明内容
本申请实施例提供了一种图片投放方法、装置、设备和存储介质,能够提高投放图片质量以及图片的投放效果。
第一方面,本申请实施例提供了一种图片投放方法,包括:
抓取目标对象的落地页页面;
根据所述落地页页面的文档对象模型,提取所述目标对象在所述落地页页面中所配置的待投放图片;
对所述待投放图片进行裁剪,并对裁剪后的待投放图片进行投放。
上述申请中的一个实施例具有如下优点或有益效果:通过从落地页中提取待投放图片,能够得到目标对象比较认可、内容相关性强且图像质量高的待投放图片,进而基于提取的待投放图片进行裁剪和投放,不仅使得目标对象所配置的待投放图片能够符合投放要求进行投放,而且提高了图片的投放效果。
可选的,所述根据所述落地页页面的文档对象模型,提取所述目标对象在所述落地页页面中所配置的待投放图片,包括:
根据所述文档对象模型的节点中所包含的页面内容,确定所述落地页页面中所述目标对象所配置的候选投放图片;
对所述候选投放图片进行合格性检测,确定所述待投放图片。
上述申请中的一个实施例具有如下优点或有益效果:通过从落地页上挖掘待投放图片,由于落地页页面是目标对象自己配置的,因此能够得到目标对象比较认可、内容相关性强且图像质量高的待投放图片,突出目标对象的个性化优势和物料的多样性。
可选的,所述根据所述文档对象模型的节点中所包含的页面内容,确定所述落地页页面中所述目标对象所配置的候选投放图片,包括:
根据所述文档对象模型的节点中所包含页面内容的内容类型、页面位置以及节点属性信息中的至少一项,确定所述落地页页面中所述目标对象所配置的候选投放图片。
上述申请中的一个实施例具有如下优点或有益效果:并非落地页中的所有图片都是待投放图片,通过对落地页页面进行内容类型、配置位置以及信息关键字等进行待投放图片的识别,避免将落地页中的所有图片都作为候选投放图片。
可选的,所述对所述候选投放图片进行合格性检测,确定所述待投放图片,包括:
对所述候选投放图片进行编码;
根据所述候选投放图片的编码,以及上一次落地页检测周期内的历史投放图片编码,确定所述候选投放图片相对于所述历史投放图片是否更新;
若检测到所述候选投放图片为更新图片,则对所述候选投放图片进行质量检测和内容检测,确定所述待投放图片。
上述申请中的一个实施例具有如下优点或有益效果:基于候选投放图片的编码识别更新过的候选投放图片,将更新过的且图像质量和内容均通过检测的候选投放图片作为待投放图片,避免对未更新的图片进行重复的裁剪投放,以及避免对图像质量较差和内容非法的图片进行投放。
可选的,所述对所述待投放图片进行裁剪,并对裁剪后的待投放图片进行投放,包括:
对所述待投放图片进行文字识别,根据文字识别结果对所述待投放图片进行裁剪;
根据裁剪后的待投放图片动态更新投放页面中的配图。
上述申请中的一个实施例具有如下优点或有益效果:通过对待投放图片进行文字识别再裁剪,避免将文字类较为容易变形或截断的内容进行裁剪,从而提高图片的投放效果。
可选的,所述对所述待投放图片进行文字识别,根据文字识别结果对所述待投放图片进行裁剪,包括:
对所述待投放图片进行文字识别,确定文字区域;
将所述文字区域从所述待投放图片中裁剪掉;
对文字区域裁剪后的待投放图片进行主体识别,确定主体区域;
根据投放尺寸要求对所述主体区域进行裁剪。
上述申请中的一个实施例具有如下优点或有益效果:通过对含有文字的待投放图片首先裁剪去掉文字区域,再进行主体区域的二次裁剪,解决了一次智能裁剪导致的图片内容被截断的问题,提高了裁剪的准确率。
第二方面,本申请实施例提供了一种图片投放装置,包括:
落地页抓取模块,用于抓取目标对象的落地页页面;
待投放图片提取模块,用于根据所述落地页页面的文档对象模型,提取所述目标对象在所述落地页页面中所配置的待投放图片;
裁剪模块,用于对所述待投放图片进行裁剪,并对裁剪后的待投放图片进行投放。
第三方面,本申请实施例提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任意实施例所述的图片投放方法。
第四方面,本申请实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请任意实施例所述的图片投放方法。
上述申请中的一个实施例具有如下优点或有益效果:通过抓取目标对象所编辑的落地页页面,根据落地页页面的文档对象模型,提取目标对象在落地页中配置的待投放图片,进而对待投放图片裁剪后再进行投放。本申请实施例通过从落地页中提取待投放图片,能够得到目标对象比较认可、内容相关性强且图像质量高的待投放图片,进而基于提取的待投放图片进行裁剪和投放,不仅使得目标对象所配置的待投放图片能够符合投放要求进行投放,而且提高了图片的投放效果。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的一种图片投放方法的流程图;
图2是根据本申请第二实施例的一种图片投放方法的流程图;
图3是根据本申请第三实施例的一种图片投放方法的流程图;
图4是根据本申请第四实施例的一种图片投放装置的结构示意图;
图5是用来实现本申请实施例的图片投放方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
第一实施例
图1是根据本申请第一实施例的一种图片投放方法的流程图,本实施例可适用于对广告主等目标对象所提供的广告海报图等配图进行投放的情况,该方法可由一种图片投放装置来执行,该装置采用软件和/或硬件的方式实现,优选是配置于电子设备中,例如电脑、手机或服务器等。如图1所示,该方法具体包括如下:
S110、抓取目标对象的落地页页面。
在本申请具体实施例中,目标对象是指配置落地页的对象,例如通过广告系统,对展示广告详情的落地页页面进行配置的广告主。落地页页面是指网民点击广告链接之后着陆“驻足”的地方,它承载着广告主想要呈现给网民的一切资讯。其中,广告主基于广告系统,可以进行广告标题、广告描述信息、广告所推广商品的价位以及广告海报图等,最终形成目标对象所配置的落地页页面。
其中,由于在为目标对象提供广告业务的页面或站点中,对于所预留广告位中广告配图的尺寸是预先固定且符合国家标准的,而广告主所配置的落地页页面中所提供的广告海报图的形状和尺寸各异。因此在对目标对象所配置的落地页进行正式投放之前,需要对落地页页面中的广告海报图进行裁剪,以得到满足形状、尺寸、内容和质量等要求的广告配图进行投放。
具体的,可以预先设定检测周期,基于预设检测周期,根据目标对象提交到广告系统的落地页页面的URL(Uniform Resource Locator,统一资源定位符),定时抓取目标对象的落地页页面,以此为广告海报图的裁剪、广告配图的投放和更新等做好基础。其中,广告海报图可以是指落地页页面上的图片,广告配图可以是指广告系统所投放的图片。
S120、根据落地页页面的文档对象模型,提取目标对象在落地页页面中所配置的待投放图片。
在本申请具体实施例中,文档对象模型(Document Object Model,DOM)是一种基于树的API(Application Programming Interface,应用程序编程接口),用对象的模式来描述表示对应的HTML、CSS等,可以动态地访问程序和脚本,更新其内容、结构和页面文档风格。例如,根据页面底层程序代码,可以将页面文档转化为以html为根节点,以head、body等为子节点的树形结构。
本实施例中,根据落地页页面的文档对象模型的树形结构,遍历文档对象模型中的各个节点,获取各节点中所包含的页面内容。首先根据各节点中所包含的页面内容,识别出目标对象所配置的候选投放图片。其次从候选投放图片中确定相对上一检测周期为更新了的候选投放图片。最后对确定为更新图片的候选投放图片进行内容和图像质量的检测,得到待投放图片。
具体的,首先根据文档对象模型的节点中所包含页面内容的内容类型、页面位置以及节点属性信息中的至少一项,确定落地页页面中目标对象所配置的候选投放图片。从而避免将太小的图片,或落地页页面中与广告内容无关的页面标识图片,作为候选投放图片。其次,可以对候选投放图片进行编码,根据候选投放图片的二进制编码,以及上一次落地页检测周期内的历史投放图片编码,确定候选投放图片相对于历史投放图片是否更新。最终,对于更新了的候选投放图片,可以进行内容和图像质量等方面的合格性检测,例如内容合法且图像清晰度较佳的候选投放图片,作为待投放图片以备裁剪处理。
值得注意的是,由于落地页页面是目标对象根据推广需求自己配置的,因此落地页页面中的广告海报图必然是目标对象比较认可的图片,且广告海报图与广告内容之间的相关性更强,图像质量较高,更有利于突出广告展现的个性化优势。
S130、对待投放图片进行裁剪,并对裁剪后的待投放图片进行投放。
在本申请具体实施例中,由于在为目标对象提供广告业务的页面或站点中,对于所预留广告位中广告配图的尺寸是预先固定且符合国家标准的,而广告主所配置的落地页页面中所提供的广告海报图的形状和尺寸各异。因此需要对提取的待投放图片进行裁剪,以便得到符合投放尺寸要求的图片进行投放。
具体的,可以通过主体区域识别技术,以主体为中心点对待投放图片进行指定尺寸的裁剪,以便去掉待投放图片中与主体内容无关的区域。其中,鉴于待投放图片中有可能包含文字,而文字经过缩放、拉伸或裁剪后,极易出现文字清晰度降低、文字变形或文字被截断等现象。因此为了避免文字对图片裁剪的影响,可以在主体区域识别之前,对待投放图片进行文字识别,根据文字识别结果对待投放图片进行裁剪,根据裁剪后的待投放图片动态更新投放页面中的配图。例如,对待投放图片进行文字识别,确定文字区域;将文字区域从待投放图片中裁剪掉;对文字区域裁剪后的待投放图片进行主体识别,确定主体区域;根据投放尺寸要求对主体区域进行裁剪。
本实施例的技术方案,通过抓取目标对象所编辑的落地页页面,根据落地页页面的文档对象模型,提取目标对象在落地页中配置的待投放图片,进而对待投放图片裁剪后再进行投放。本申请实施例通过从落地页中提取待投放图片,能够得到目标对象比较认可、内容相关性强且图像质量高的待投放图片,进而基于提取的待投放图片进行裁剪和投放,不仅使得目标对象所配置的待投放图片能够符合投放要求进行投放,而且提高了图片的投放效果。
第二实施例
图2是根据本申请第二实施例的一种图片投放方法的流程图,本实施例在上述第一实施例的基础上,进一步对基于落地页页面进行待投放图片的提取进行解释说明,能够从落地页页面中提取到内容正确且图像质量较佳的待投放候选图片。如图2所示,该方法具体包括如下:
S210、抓取目标对象的落地页页面。
S220、根据文档对象模型的节点中所包含的页面内容,确定落地页页面中目标对象所配置的候选投放图片。
在本申请具体实施例中,候选投放图片是指基于内容类型和页面布局等信息,初步识别到的落地页页面中目标对象所配置的海报图。例如,在落地页首屏的中间位置有一张较大的图片,则该图片可以视为候选投放图片,而落地页右下角中有一张较小的标识图片,而该图片不能作为候选投放图片。
可选的,根据文档对象模型的节点中所包含页面内容的内容类型、页面位置以及节点属性信息中的至少一项,确定落地页页面中目标对象所配置的候选投放图片。
本实施例中,内容类型可以包括图片、文档、字符等。相应的,在进行候选投放图片识别时,主要识别内容类型为图片格式的内容。其中,还可以识别尺寸大于尺寸阈值的图片,避免图片较小而影响图片裁剪后的清晰度。页面位置是指内容在落地页页面中的页面布局位置。相应的,在进行候选投放图片识别时,主要识别以较为显眼的位置为基准,例如落地页首屏中间位置等。节点属性信息是指文档对象模型的节点中所包含的一切属性信息,判断节点属性信息中是否包含广告关键字。相应的,在进行候选投放图片识别时,例如主要识别id和clas节点的属性信息中含有banner或focus等预设关键字。具体的,根据落地页页面的文档对象模型的树形结构,遍历文档对象模型中的各个节点,获取各节点中所包含的页面内容。根据各节点中所包含的页面内容,识别出目标对象所配置的候选投放图片。
示例性的,若检测到落地页页面中存在一张图像格式的且图像尺寸大于尺寸阈值的图片,则可以将该图片作为候选投放图片。若检测到落地页首屏中间有一张图像格式的图片,则可以将该图片作为候选投放图片。若检测到落地页的文档对象模型的id和clas节点的属性信息中含有banner或focus等预设关键字,且检测到落地页中存在一张图像格式的图片,则可以将该图片作为候选投放图片。值得注意的是,候选投放图片的识别标准可以基于实际的广告投放情况而定,而不局限于上述三项条件中的至少一项。
S230、对候选投放图片进行合格性检测,确定待投放图片。
在本申请具体实施例中,合格性检测是指至少包括投放图片更新检测、图片内容检测和图像质量检测。其中,投放图片更新检测用于检测候选投放图片相对于当前的已投放图片是否不同,即目标对象是否已更新掉当前已投放图片,对于更新图片才有必要进行裁剪和更新投放。投放图片更新检测可以作为合格性检测的第一步,即后续合格性检测的前提条件。图片内容检测用于检测候选投放图片中是否存在黄、赌、毒等非法内容,对于非法图片不予使用;图像质量检测用户检测图片的成像效果,避免提取到图像清晰度较差的图片。图片内容检测和图像质量检测可以作为合格性检测的第二步,两者之间可以没有先后顺序区分。从而将落地页页面中通过合格性检测的候选投放图片作为待投放图片,供裁剪投放使用。
可选的,对候选投放图片进行编码;根据候选投放图片的编码,以及上一次落地页检测周期内的历史投放图片编码,确定候选投放图片相对于历史投放图片是否更新;若检测到候选投放图片为更新图片,则对候选投放图片进行质量检测和内容检测,确定待投放图片。
本实施例中,在对候选投放图片进行更新检测时,可以采用统一的编码算法,例如base64编码方式,对候选投放图片进行编码。将候选投放图片的编码,与上一次落地页检测周期内的历史投放图片编码进行比对,若比对结果不同,则确定候选投放图片相对于历史投放图片为更新图片。可以理解的是,对于检测未更新的图片可以保留其投放效果,无需重复的裁剪操作。进而对于检测为更新图片的候选投放图片进行质量检测和内容检测,例如分辨率检测等图像质量检测,以及图像识别等内容检测,将满足图像质量要求和内容要求的候选投放图片,作为待投放图片。并根据文档对象模型的节点中待投放图片的链接,提取出待投放图片供裁剪使用。
S240、对待投放图片进行裁剪,并对裁剪后的待投放图片进行投放。
本实施例的技术方案,通过抓取目标对象所编辑的落地页页面,根据落地页页面的文档对象模型的节点中所包含的页面内容,确定目标对象所编辑的候选投放图片,根据对候选投放图片的合格性检测结果提取待投放图片,进而对待投放图片裁剪后再进行投放。本申请实施例通过从落地页中提取待投放图片,能够得到目标对象比较认可、内容相关性强且图像质量高的待投放图片,进而基于提取的待投放图片进行裁剪和投放,不仅使得目标对象所配置的待投放图片能够符合投放要求进行投放,而且提高了图片的投放效果。
第三实施例
图3是根据本申请第三实施例的一种图片投放方法的流程图,本实施例在上述第一实施例的基础上,进一步对待投放图片的二次裁剪进行解释说明,能够首先裁剪去掉文字区域,再进行主体区域的二次裁剪。如图3所示,该方法具体包括如下:
S310、抓取目标对象的落地页页面。
S320、根据落地页页面的文档对象模型,提取目标对象在落地页页面中所配置的待投放图片。
S330、对待投放图片进行文字识别,确定文字区域。
在本申请具体实施例中,并非直接对待投放图片进行裁剪,而是先识别待投放图片中的文字。其中,本实施例不对文字识别算法进行限定,任何能够实现文字识别的算法都能够应用于本实施例中。若检测到待投放图片中包含文字,则可以将所识别文字的最大外接矩形确定为文字区域。
S340、将文字区域从待投放图片中裁剪掉。
在本申请具体实施例中,鉴于文字经过缩放、拉伸或裁剪后,极易出现文字清晰度降低、文字变形或文字被截断等现象。因此为了避免文字对图片裁剪的影响,将所确定的文字区域从待投放图片中裁剪掉。
S350、对文字区域裁剪后的待投放图片进行主体识别,确定主体区域。
在本申请具体实施例中,通过对文字区域裁剪后的待投放图片进行主体识别,确定主体区域。文字区域裁剪后的待投放图片,不仅避免了文字清晰度降低、文字变形或文字被截断等现象的产生,而且避免了文字区域对于主体识别的干扰,提高主体识别的准确率。本实施例中不对主体识别算法进行限定,任何能够实现主体识别的算法都可以应用于本实施例中,例如基于显著性区域的主体检测或基于深度神经网络的主体检测等。其中,对于文字区域与主体区域之间具有重叠区域的待投放图片,通常可以丢弃不予使用;对于检测不含有文字的待投放图片,可以直接对待投放图片进行主体识别,得到主体区域。
S360、根据投放尺寸要求对主体区域进行裁剪。
在本申请具体实施例中,投放尺寸是指在为目标对象提供广告业务的页面或站点中,对于所预留广告位中广告配图所规定的尺寸。可以根据投放尺寸要求对主体区域进行裁剪、缩放等处理。由于待投放图片的图像质量是通过合格性检测具有保障的,因此即使对主体区域进行缩放或拉伸,也不会影响主体区域的展现效果。
S370、根据裁剪后的待投放图片动态更新投放页面中的配图。
在本申请具体实施例中,投放页面是指待投放图片经过处理后最终所要投放的页面或站点等,处理后的待投放图片在投放页面中作为广告的配图进行展示。在待投放图片裁剪后,利用裁剪后的待投放图片,对预留广告位中的广告配图进行动态更新。从而目标对象不仅能够自主的对落地页页面进行编辑配置,而且由落地页页面编辑完成至广告配图的更新,完全避免了人工的干预,实现了广告配图的自动裁剪和更新,从广告配图的展示以及目标对象的满意度上都得到了保障。
本实施例的技术方案,通过抓取目标对象所编辑的落地页页面,根据落地页页面的文档对象模型,提取目标对象在落地页中配置的待投放图片,进而对待投放图片进行文字识别,裁剪掉待投放图片中的文字区域,基于一次裁剪后的待投放图片进行主体识别,根据投放尺寸对主体区域进行二次裁剪,以此动态更新投放页面中的配图。本申请实施例通过从落地页中提取待投放图片,能够得到目标对象比较认可、内容相关性强且图像质量高的待投放图片,进而基于提取的待投放图片进行裁剪和投放,不仅使得目标对象所配置的待投放图片能够符合投放要求进行投放,而且提高了图片的投放效果。
第四实施例
图4是根据本申请第四实施例的一种图片投放装置的结构示意图,本实施例可适用于对广告主等目标对象所提供的广告海报图等配图进行投放的情况,该装置可实现本申请任意实施例所述的图片投放方法。该装置400具体包括如下:
落地页抓取模块410,用于抓取目标对象的落地页页面;
待投放图片提取模块420,用于根据所述落地页页面的文档对象模型,提取所述目标对象在所述落地页页面中所配置的待投放图片;
裁剪模块430,用于对所述待投放图片进行裁剪,并对裁剪后的待投放图片进行投放。
可选的,所述待投放图片提取模块420具体用于:
根据所述文档对象模型的节点中所包含的页面内容,确定所述落地页页面中所述目标对象所配置的候选投放图片;
对所述候选投放图片进行合格性检测,确定满足合格性要求的待投放图片。
可选的,所述待投放图片提取模块420具体用于:
根据所述文档对象模型的节点中所包含页面内容的内容类型、页面位置以及节点属性信息中的至少一项,确定所述落地页页面中所述目标对象所配置的候选投放图片。
可选的,所述待投放图片提取模块420具体用于:
对所述候选投放图片进行编码;
根据所述候选投放图片的编码,以及上一次落地页检测周期内的历史投放图片编码,确定所述候选投放图片相对于所述历史投放图片是否更新;
若检测到所述候选投放图片为更新图片,则对所述候选投放图片进行质量检测和内容检测,确定所述待投放图片。
可选的,所述裁剪模块430具体用于:
对所述待投放图片进行文字识别,根据文字识别结果对所述待投放图片进行裁剪;
根据裁剪后的待投放图片动态更新投放页面中的配图。
可选的,所述裁剪模块430具体用于:
对所述待投放图片进行文字识别,确定文字区域;
将所述文字区域从所述待投放图片中裁剪掉;
对文字区域裁剪后的待投放图片进行主体识别,确定主体区域;
根据投放尺寸要求对所述主体区域进行裁剪。
本实施例的技术方案,通过各个功能模块之间的相互配合,实现了落地页页面的抓取、候选投放图片的确定、图片的检测、待投放图片的提取、文字的识别、主体的识别、待投放图片的裁剪和投放等功能。本申请实施例通过从落地页中提取待投放图片,能够得到目标对象比较认可、内容相关性强且图像质量高的待投放图片,进而基于提取的待投放图片进行裁剪和投放,不仅使得目标对象所配置的待投放图片能够符合投放要求进行投放,而且提高了图片的投放效果。
第五实施例
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图5所示,是根据本申请实施例的图片投放方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图5所示,该电子设备包括:一个或多个处理器501、存储器502,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置,诸如,耦合至接口的显示设备,其上显示图形用户界面(Graphical User Interface,GUI)的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作,例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统。图5中以一个处理器501为例。
存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的图片投放方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的图片投放方法。
存储器502作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的图片投放方法对应的程序指令/模块,例如,附图4所示的落地页抓取模块410、待投放图片提取模块420和裁剪模块430。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的图片投放方法。
存储器502可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据图片投放方法的电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器502可选包括相对于处理器501远程设置的存储器,这些远程存储器可以通过网络连接至图片投放方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
图片投放方法的电子设备还可以包括:输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线或者其他方式连接,图5中以通过总线连接为例。
输入装置503可接收输入的数字或字符信息,以及产生与图片投放方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置和触觉反馈装置等,其中,辅助照明装置例如发光二极管(LightEmitting Diode,LED);触觉反馈装置例如,振动电机等。该显示设备可以包括但不限于,液晶显示器(Liquid Crystal Display,LCD)、LED显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用集成电路(Application Specific Integrated Circuit,ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序,也称作程序、软件、软件应用、或者代码,包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置,例如,磁盘、光盘、存储器、可编程逻辑装置(Programmable Logic Device,PLD),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置,例如,阴极射线管(Cathode Ray Tube,CRT)或者LCD监视器;以及键盘和指向装置,例如,鼠标或者轨迹球,用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈,例如,视觉反馈、听觉反馈、或者触觉反馈;并且可以用任何形式,包括声输入、语音输入或者、触觉输入,来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统,例如,数据服务器,或者实施在包括中间件部件的计算系统,例如,应用服务器、或者实施在包括前端部件的计算系统,例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互,或者实施在包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信,例如,通信网络,来将系统的部件相互连接。通信网络的示例包括:局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,通过从落地页中提取待投放图片,能够得到目标对象比较认可、内容相关性强且图像质量高的待投放图片,进而基于提取的待投放图片进行裁剪和投放,不仅使得目标对象所配置的待投放图片能够符合投放要求进行投放,而且提高了图片的投放效果。
另外,上述申请中的一个实施例具有如下优点或有益效果:通过从落地页上挖掘待投放图片,由于落地页页面是目标对象自己配置的,因此能够得到目标对象比较认可、内容相关性强且图像质量高的待投放图片,突出目标对象的个性化优势和物料的多样性。
另外,上述申请中的一个实施例具有如下优点或有益效果:并非落地页中的所有图片都是待投放图片,通过对落地页页面进行内容类型、配置位置以及信息关键字等进行待投放图片的识别,避免将落地页中的所有图片都作为候选投放图片。
另外,上述申请中的一个实施例具有如下优点或有益效果:基于候选投放图片的编码识别更新过的候选投放图片,将更新过的且图像质量和内容均通过检测的候选投放图片作为待投放图片,避免对未更新的图片进行重复的裁剪投放,以及避免对图像质量较差和内容非法的图片进行投放。
另外,上述申请中的一个实施例具有如下优点或有益效果:通过对待投放图片进行文字识别再裁剪,避免将文字类较为容易变形或截断的内容进行裁剪,从而提高图片的投放效果。
另外,上述申请中的一个实施例具有如下优点或有益效果:通过对含有文字的待投放图片首先裁剪去掉文字区域,再进行主体区域的二次裁剪,解决了一次智能裁剪导致的图片内容被截断的问题,提高了裁剪的准确率。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (10)

1.一种图片投放方法,其特征在于,包括:
抓取目标对象的落地页页面;
根据所述落地页页面的文档对象模型,提取所述目标对象在所述落地页页面中所配置的待投放图片;
对所述待投放图片进行裁剪,并对裁剪后的待投放图片进行投放。
2.根据权利要求1所述的方法,其特征在于,所述根据所述落地页页面的文档对象模型,提取所述目标对象在所述落地页页面中所配置的待投放图片,包括:
根据所述文档对象模型的节点中所包含的页面内容,确定所述落地页页面中所述目标对象所配置的候选投放图片;
对所述候选投放图片进行合格性检测,确定所述待投放图片。
3.根据权利要求2所述的方法,其特征在于,所述根据所述文档对象模型的节点中所包含的页面内容,确定所述落地页页面中所述目标对象所配置的候选投放图片,包括:
根据所述文档对象模型的节点中所包含页面内容的内容类型、页面位置以及节点属性信息中的至少一项,确定所述落地页页面中所述目标对象所配置的候选投放图片。
4.根据权利要求2所述的方法,其特征在于,所述对所述候选投放图片进行合格性检测,确定所述待投放图片,包括:
对所述候选投放图片进行编码;
根据所述候选投放图片的编码,以及上一次落地页检测周期内的历史投放图片编码,确定所述候选投放图片相对于所述历史投放图片是否更新;
若检测到所述候选投放图片为更新图片,则对所述候选投放图片进行质量检测和内容检测,确定所述待投放图片。
5.根据权利要求1所述的方法,其特征在于,所述对所述待投放图片进行裁剪,并对裁剪后的待投放图片进行投放,包括:
对所述待投放图片进行文字识别,根据文字识别结果对所述待投放图片进行裁剪;
根据裁剪后的待投放图片动态更新投放页面中的配图。
6.根据权利要求5所述的方法,其特征在于,所述对所述待投放图片进行文字识别,根据文字识别结果对所述待投放图片进行裁剪,包括:
对所述待投放图片进行文字识别,确定文字区域;
将所述文字区域从所述待投放图片中裁剪掉;
对文字区域裁剪后的待投放图片进行主体识别,确定主体区域;
根据投放尺寸要求对所述主体区域进行裁剪。
7.一种图片投放装置,其特征在于,包括:
落地页抓取模块,用于抓取目标对象的落地页页面;
待投放图片提取模块,用于根据所述落地页页面的文档对象模型,提取所述目标对象在所述落地页页面中所配置的待投放图片;
裁剪模块,用于对所述待投放图片进行裁剪,并对裁剪后的待投放图片进行投放。
8.根据权利要求7所述的装置,其特征在于,所述待投放图片提取模块具体用于:
根据所述文档对象模型的节点中所包含的页面内容,确定所述落地页页面中所述目标对象所配置的候选投放图片;
对所述候选投放图片进行合格性检测,确定满足合格性要求的待投放图片。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的图片投放方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的图片投放方法。
CN201911061688.3A 2019-11-01 2019-11-01 图片投放方法、装置、设备和存储介质 Pending CN112766997A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911061688.3A CN112766997A (zh) 2019-11-01 2019-11-01 图片投放方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911061688.3A CN112766997A (zh) 2019-11-01 2019-11-01 图片投放方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN112766997A true CN112766997A (zh) 2021-05-07

Family

ID=75692384

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911061688.3A Pending CN112766997A (zh) 2019-11-01 2019-11-01 图片投放方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112766997A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505565A (zh) * 2021-05-25 2021-10-15 北京北大方正电子有限公司 页面对象组合方法、装置、电子设备、介质及程序产品

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365862A (zh) * 2012-03-28 2013-10-23 北京百度网讯科技有限公司 一种用于生成与页面对应的图片的方法与设备
CN104077387A (zh) * 2014-06-27 2014-10-01 北京奇虎科技有限公司 一种网页内容显示方法和浏览器装置
CN105761205A (zh) * 2016-03-17 2016-07-13 网易有道信息技术(北京)有限公司 一种图片投放方法和装置
CN105956878A (zh) * 2016-04-25 2016-09-21 广州出益信息科技有限公司 一种网络广告推送的方法及装置
CN108256886A (zh) * 2016-12-29 2018-07-06 北京奇虎科技有限公司 广告投放方法和装置
CN108419143A (zh) * 2018-05-08 2018-08-17 多盟睿达科技(中国)有限公司 一种基于移动视频广告的制作方法和系统
CN109325197A (zh) * 2018-08-17 2019-02-12 百度在线网络技术(北京)有限公司 用于提取信息的方法和装置
CN109933389A (zh) * 2017-12-19 2019-06-25 阿里巴巴集团控股有限公司 数据对象信息处理、页面展示方法及装置
CN109977337A (zh) * 2019-02-25 2019-07-05 北京三快在线科技有限公司 一种网页设计对比方法、装置、设备及可读存储介质
US20190332859A1 (en) * 2016-12-30 2019-10-31 Baidu Online Network Technology (Beijing) Co., Ltd. Method for identifying main picture in web page

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365862A (zh) * 2012-03-28 2013-10-23 北京百度网讯科技有限公司 一种用于生成与页面对应的图片的方法与设备
CN104077387A (zh) * 2014-06-27 2014-10-01 北京奇虎科技有限公司 一种网页内容显示方法和浏览器装置
CN105761205A (zh) * 2016-03-17 2016-07-13 网易有道信息技术(北京)有限公司 一种图片投放方法和装置
CN105956878A (zh) * 2016-04-25 2016-09-21 广州出益信息科技有限公司 一种网络广告推送的方法及装置
CN108256886A (zh) * 2016-12-29 2018-07-06 北京奇虎科技有限公司 广告投放方法和装置
US20190332859A1 (en) * 2016-12-30 2019-10-31 Baidu Online Network Technology (Beijing) Co., Ltd. Method for identifying main picture in web page
CN109933389A (zh) * 2017-12-19 2019-06-25 阿里巴巴集团控股有限公司 数据对象信息处理、页面展示方法及装置
CN108419143A (zh) * 2018-05-08 2018-08-17 多盟睿达科技(中国)有限公司 一种基于移动视频广告的制作方法和系统
CN109325197A (zh) * 2018-08-17 2019-02-12 百度在线网络技术(北京)有限公司 用于提取信息的方法和装置
CN109977337A (zh) * 2019-02-25 2019-07-05 北京三快在线科技有限公司 一种网页设计对比方法、装置、设备及可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505565A (zh) * 2021-05-25 2021-10-15 北京北大方正电子有限公司 页面对象组合方法、装置、电子设备、介质及程序产品
CN113505565B (zh) * 2021-05-25 2024-02-13 北京北大方正电子有限公司 页面对象组合方法、装置、电子设备、介质及程序产品

Similar Documents

Publication Publication Date Title
US9959467B2 (en) Image processing client
US9830522B2 (en) Image processing including object selection
CN104036011B (zh) 网页元素的显示方法以及浏览器装置
CN111782977B (zh) 兴趣点处理方法、装置、设备及计算机可读存储介质
US9575995B2 (en) Image processing methods
US10255243B2 (en) Data processing method and data processing system
CA2885880C (en) Image processing including object selection
US20160342624A1 (en) Image Tagging System
CA2885879C (en) Image processing methods
US10140631B2 (en) Image processing server
CA2885874A1 (en) Image processing system including image priority
CN113538450B (zh) 用于生成图像的方法及装置
JP7051190B2 (ja) コンテンツ埋込方法、装置、電子デバイス、記憶媒体、及びプログラム
CN110532404B (zh) 一种源多媒体确定方法、装置、设备及存储介质
CN111967304A (zh) 基于边缘计算的获取物品信息方法、装置和结算台
US9639867B2 (en) Image processing system including image priority
EP3901892A2 (en) Commodity guiding method and apparatus, electronic device, storage medium, and computer program product
CN112822539B (zh) 信息显示方法、装置、服务器及存储介质
CN112766997A (zh) 图片投放方法、装置、设备和存储介质
CN111368184B (zh) 智能语音设备的屏保投放方法、设备及存储介质
CN113011298A (zh) 截断物体样本生成、目标检测方法、路侧设备和云控平台
CN114554257A (zh) 资源分配方法、装置、电子设备及存储介质
CN112100530A (zh) 网页分类方法、装置、电子设备及存储介质
CN113010767A (zh) 搜索方法、装置、设备和存储介质
CN115101069A (zh) 语音控制方法、装置、设备、存储介质以及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination