CN113256660A - 图片处理方法、装置和电子设备 - Google Patents

图片处理方法、装置和电子设备 Download PDF

Info

Publication number
CN113256660A
CN113256660A CN202110628799.9A CN202110628799A CN113256660A CN 113256660 A CN113256660 A CN 113256660A CN 202110628799 A CN202110628799 A CN 202110628799A CN 113256660 A CN113256660 A CN 113256660A
Authority
CN
China
Prior art keywords
picture
processed
description information
target object
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110628799.9A
Other languages
English (en)
Inventor
周杰
王长虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Youzhuju Network Technology Co Ltd
Original Assignee
Beijing Youzhuju Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Youzhuju Network Technology Co Ltd filed Critical Beijing Youzhuju Network Technology Co Ltd
Priority to CN202110628799.9A priority Critical patent/CN113256660A/zh
Publication of CN113256660A publication Critical patent/CN113256660A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开实施例公开了图片处理方法、装置和电子设备。该方法的一具体实施方式包括:基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息;根据描述信息,确定待处理图片中展示的目标物体的目标物体类型;根据所述目标物体类型,确定目标物体图像在待处理图片中的展示区域;基于所述展示区域,对所述待处理图片进行处理得到处理后图片。由此,可以提供一种新的图片处理方式。

Description

图片处理方法、装置和电子设备
技术领域
本公开涉及互联网技术领域,尤其涉及一种图片处理方法、装置和电子设备。
背景技术
随着计算机技术的发展,可以越来越多地利用计算机实现各种功能。
在一些应用场景中,可以利用计算机处理图片。例如可以对图片进行尺寸变换等处理。再例如,可以对图片进行裁剪,得到包括图片主要内容的子图片。
发明内容
提供该公开内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该公开内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开实施例提供了一种图片处理方法,该方法包括:基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息;根据描述信息,确定待处理图片中展示的目标物体的目标物体类型;根据所述目标物体类型,确定目标物体图像在待处理图片中的展示区域;基于所述展示区域,对所述待处理图片进行处理得到处理后图片。
第二方面,本公开实施例提供了一种图片处理装置,包括:获取单元,用于基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息;第一确定单元,用于根据描述信息,确定待处理图片中展示的目标物体的目标物体类型;第二确定单元,用于根据所述目标物体类型,确定目标物体图像在待处理图片中的展示区域;处理单元,用于基于所述展示区域,对所述待处理图片进行处理得到处理后图片。
第三方面,本公开实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的图片处理方法。
第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的图片处理方法的步骤。
本公开实施例提供的图片处理方法、装置和电子设备,通过从待处理图片的图片展示界面中,获取与待处理图片相关的描述信息;然后,根据描述信息,确定待处理图片中展示的目标物体的目标物体类型;再根据所述目标物体类型,确定目标物体在待处理图片中的展示区域;最后,基于所述展示区域,对处理图片进行处理得到处理后图片。由此,可以利用图片展示界面中描述信息的特点(即很可能会描述待处理图片中的目标物体),快速确定待裁剪中的目标物体。这种方式,不仅可以减少人工处理量,提高处理速度和节省人力成本;而且,对比来说,文本处理的计算量和准确率较高,可以实现快速而准确地确定待处理图片中的目标物体,进而快速得到处理后图片。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1是根据本公开的图片处理方法的一个实施例的流程图;
图2是根据本公开的图片处理装置的一个实施例的结构示意图;
图3是本公开的一个实施例的图片处理方法可以应用于其中的示例性系统架构;
图4是根据本公开实施例提供的电子设备的基本结构的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
请参考图1,其示出了根据本公开的图片处理方法的一个实施例的流程。如图1所示该图片处理方法,包括以下步骤:
步骤101,基于包括待裁剪图像的图片展示界面,获取与待处理图片相关的描述信息。
在本实施例中,图片处理方法的执行主体(例如终端设备或者服务器)可以基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息。
在本实施例中,图片展示界面,可以包括展示待处理图片的电子媒介。
在本实施例中,上述描述信息,可能会描述上述待处理图片的图片内容。
作为示例,作为图片展示界面的电子媒介,可以包括展示电子图片的网页(包括但不限于web页面、原生页面等)。在该网页中,可能包括待处理图片的介绍文字、对待处理图片的评论等。待处理图片相关的描述信息可以包括这些介绍文字和评论。
步骤102,根据所获取的描述信息,确定待处理图片中展示目标物体的目标物体类型。
在本实施例中,上述执行主体可以根据所获取的描述信息,确定待处理图片中展示的目标物体的目标物体类型。
在这里,待处理图片中可能具有主要物体,即待处理图片中主要展示的是什么。这个主要物体可以理解为目标物体。可以理解,在步骤102的时候,图片中存在目标物体而机器不确定目标物体是什么。
在这里,目标物体图像所对应的物体类型,可以是目标物体图像所指示的目标物体的物体类型。
可以理解,物体类型的划分依据和物体类型的具体项,可以根据实际应用场景确定,在此不做限定。
作为示例,上述物体可以包括但是不限于:裙子、裤子、帽子、鞋子、猫、狗、鸡腿等。
在这里,描述信息所描述的内容,可能会涉及待处理图片中的目标物体。作为示例,用户可能在评论中写到“这条裤子材质不错”,由此,可以确定待处理图片中的目标物体可能是裤子。
步骤103,根据目标物体类型,确定目标物体图像在待处理图片中的展示区域。
在本实施例中,上述执行主体可以根据目标物体类型,确定目标物体在待处理图片中的展示区域。
在这里,确定目标物体类型,再根据目标物体类型去找待处理图片中的目标物体,可以利用预先设置的物体类型与物体特征之间的对应关系实现,在此不再赘述。
步骤104,基于所述展示区域,对所述待处理图片进行处理得到处理后图片。
在本实施例中,上述执行主体可以基于所述展示区域,对所述待处理图片进行处理得到处理后图片。
在一些应用场景中,可以所确定的展示区域,从待处理图片中裁剪下来作为处理后图片。
在一些应用场景中,可以对所确定的展示区域,进行补边、扩展或者缩放等处理,得到处理后图片。
需要说明的是,本实施例提供的图片处理方法,通过从待处理图片的图片展示界面中,获取与待处理图片相关的描述信息;然后,根据描述信息,确定待处理图片中展示的目标物体的目标物体类型;再根据所述目标物体类型,确定目标物体在待处理图片中的展示区域;最后,基于所述展示区域,对处理图片进行处理得到处理后图片。由此,可以利用图片展示界面中描述信息的特点(即很可能会描述待处理图片中的目标物体),快速确定待裁剪中的目标物体。这种方式,不仅可以减少人工处理量,提高处理速度和节省人力成本;而且,对比来说,文本处理的计算量和准确率较高,可以实现快速而准确地确定待处理图片中的目标物体,进而快速得到处理后图片。
对比来说,在一些相关技术中,采用对待处理图片进行图像显著性分析的方式,可能会因图像中物体比例问题而出现对目标物体的误判。例如,图片展示了女孩斜跨了一个小包包,由于小包包的展示面积比较小,所以这张图片利用对图片的显著性分析等方式,可能难以确定出正确的目标物体。
在一些实施例中,上述步骤101,可以包括:对待处理图片进行光学字符识别,得到待处理图片中展示的第一子描述信息。
在这里,待处理图片中可能包括描述信息。通过光学字符识别,可以将待处理图片中的字符,转换为计算机可读取的字符。从待处理图片中识别得到的描述信息,可以称为第一子描述信息。
需要说明的是,通过对待处理图片进行光学字符识别,可以将待处理图片自身展示的描述性文字,作为获取待处理图片所展示的物体的基础,这种基础可以较为准确地指示图片所展示的图片内容,换句话说,显示在图片上的字符与图片的主要内容相关是高概率。由此,可以提高确定目标物体的物体类型的准确度,进而提高对待处理图片进行处理的准确度。
在一些实施例中,上述步骤101,可以包括:将触发展示所述图片展示界面的搜索词,确定为第二子描述信息。
在一些应用场景中,用户可以在搜索引擎的搜索框中,输入搜索词。搜索引擎可以基于搜索词,搜索与该搜索词相关的网页。在这里,用户输入的这个搜索词,可以认为是触发展示该网页的搜索词。
需要说明的是,将触发展示该图片展示界面的搜索词确定为第二子描述信息,可以利用搜索引擎在相关性判断方面的可靠性,为待处理图片确定大概率相关的描述信息,由此,可以提高所确定的目标物体类型的准确性。并且,一般情况下,搜索词较为简短,比较简短的搜索词的冗余信息较少,将搜索词确定为描述信息,然后根据描述信息确定目标物体类型,不仅可以减少因处理描述信息而产生的计算量,而且可以提高所确定的目标物体类型的准确率。
在一些实施例中,上述步骤101,可以包括:从所述图片展示界面中,获取除所述待处理图片之外的字符作为第三子描述信息。
在一些应用场景中,图片展示界面可以展示图片,也可以展示一些与图片相关的介绍性文字。
需要说明的是,将图片展示界面中的字符作为第三子描述信息,可以利用展示在同一场景的文字与图片大概率相关这一特点,并且能够大概率会对图片的主要物体进行说明,由此,可以避免漏掉主要物体的描述信息,保证从描述信息中可以提取到目标物体类型。
在一些实施例中,上述第三子描述信息可以包括以下至少一项:标题、正文和评论信息。
在这里,图片展示界面中可能包括标题区域,标题区域中的信息可以作为标题。上述标题,可能包括指示对待处理图片中展示的物体的文字。由此,可以通过标题获取图片中展示的物体的物体类型,准确确定出上述物体类型。
在这里,图片展示界面中可能包括正文区域,正文区域中的信息可以作为正文。正文可能在描述物体特征中涉及到物体名称,例如“这条裤子有点紧”这句物体的描述性文本,虽然句子表述重点在穿着感(紧),但是涉及到物体名称(裤子)。由此,可以准确确定上述物体类型,进而提高裁剪的准确度。
在这里,图片展示界面中可能包括评论区域,评论区域中的信息可以作为评论信息。上述图片展示界面中的评论信息,可能包括针对待处理图片中展示的物体的评论。由此,可以通过用户对物体的评论信息,反推得到待处理图片的图片内容。从而,可以提高确定物体类型的准确度,进而提高裁剪的准确度。
在一些实施例中,上述步骤102,可以包括:对所述描述信息进行信息抽取,以及将抽取得到的物体类型确定为所述目标物体类型。
在一些实施例中,可以利用自然语音处理相关技术,对描述信息进行信息抽取。
在一些应用场景中,可以利用统计分析的方式,将描述信息中出现频率较高的词语确定为目标物体类型。
在一些应用场景中,可以利用预先训练的分类模型处理所述描述信息,得到所述目标物体类型。
在这里,上述分类模型的训练过程,可以包括:获取图像和与图像关联的描述信息,其中,所述图像与指示图像的物体类型的标签关联。将所述描述信息导入初始分类网络,得到所述初始分类网络生成的预估类型。根据所述预估类型与所述标签,生成损失值。利用所述损失值更新初始分类网络,得到所述分类模型。
作为示例,可以对待处理图片相关的描述信息进行数据预处理和数据清洗。例如,可以使用已有分词工具对描述信息进行分词,然后去除描述信息中的停用词和标点符号。可选的,还可以统计每个词在总体文本中出现的次数,去除总出现次数小于预设次数阈值的词。最后,可以将经过处理的描述信息作为导入分类模型。
需要说明的是,上述对描述信息进行信息抽取,可以实现快速而准确地确定物体类型。
在一些实施例中,描述信息可以包括至少一项子描述信息。各项子描述信息,可以根据各种方式进行划分。
在一些应用场景中,描述信息可以包括以下至少一项但不限于:第一子描述信息、第二子描述信息和第三子描述信息。第一子描述信息可以基于对待处理图片进行光学字符识别得到。第二子描述信息可以指示触发展示所述图片搜索场景的搜索词。第三子描述信息可以包括图片展示界面中除待处理图片之外的字符。
在一些实施例中,上述步骤对所述描述信息进行信息抽取,以及将抽取得到的物体类型确定为所述目标物体类型,可以包括:拼接所获取到的子描述信息,得到拼接后描述信息;然后,对所述拼接后描述信息进行信息抽取,得到所述目标物体类型。
在一些实施例中,可以将拼接后描述信息导入分类模型,得到拼接后描述信息对应的目标物体类型。
需要说明的是,将各个子描述信息进行拼接,得到拼接后描述信息。可以结合各个子描述信息的总情况,确定上述目标物体的目标物体类型。由此,可以利用拼接后描述信息的全面性,尽量保证不遗漏可能体现目标物体类型的信息,从而,可以提高所确定的目标物体类型的准确性。
一些实施例中,上述步骤对所述描述信息进行信息抽取,以及将抽取得到的物体类型确定为所述目标物体类型,可以包括:对各个子描述信息分别进行信息抽取,得到至少一个候选类型;从至少一个候选类型中,确定目标物体类型。
在这里,可以对每个子描述信息,进行信息抽取,得到候选类型。由此,可以得到若干个候选类型。然后,从候选类型中,可以根据各种判断规则,选取出目标物体类型。
在一些应用场景中,可以根据预先设置的与子描述信息对应的优先级,从候选类型中确定目标物体类型。作为示例,第一子描述信息与第一优先级对应的,第二子描述信息与第二优先级对应,第三子描述信息与第三优先级对应。第一优先级高于第二优先级,第二优先级高于第三优先级。如果各个子描述信息对应的候选类型不一致,则可以将从选取最高优先级对应的子描述信息抽取得到的候选类型,确定为目标物体类型。
需要说明的是,分别处理各个子描述信息,得到与子描述信息对应若干种可能的物体类型,然后,通过设置的判断规则,从若干种可能的物体类型中,确定目标物体的物体类型。由此,可以基于粒度较小的信息(子描述信息)确定物体类型,尽量避免丢失信息,从而,提高确定的目标物体类型的准确率。
在一些实施例中,上述步骤103,可以包括:从所述待处理图片中,确定目标物体类型指示的物体的物体区域。
在这里,可以使用各种图像识别算法,从所述待处理图片中,识别目标物体类型指示的目标物体。
作为示例,可以预先训练图像检测模型,图像检测模型可以用于表征物体类型与图像特征之间的对应关系。将待处理图片和目标物体类型,可以得到图像检测模型输出的物体区域。在这里,上述图形检测模型可以基于各种基础结构的网络(例如ssd、yolo、faster rcnn等)训练得到。
在一些实施例中,上述步骤104,可以包括:针对所确定展示区域,执行以下至少一项操作得到待裁剪区域:合并、扩展、补边、缩放和移动。
在一些应用场景中,从待处理图片中识别出的目标物体的个数,可能是一个,也可能是至少两个。如果待处理图片中的目标物体的个数为至少两个,可以对各个物体单独裁剪,也可以对将至少两个目标物体的展示区域进行合并。
在一些应用场景中,可能预先设置了目标图像尺寸,目标图像尺寸可以期望将图片处理至的尺寸。
需要说明的是,针对展示区域,执行合并操作,可以将分散的展示区域合并为较为整体的展示区域,由此,可以避免分割具有关联的各个区域,保证处理后图片的意思完整性。
需要说明的是,针对展示区域,执行扩展操作,可以实现采用原图片的内容改变展示区域的尺寸比例,从而尽量保证处理后图片的尺寸符合目标尺寸,并且处理后图片的内容没有引入其它内容,可以使得处理后图片的图片内容或者画风的统一。
需要说明的是,针对展示区域进行补边操作,可以实现在展示区域难以符合目标尺寸的情况下,不改变图片原始长宽比而得到符合目标尺寸的处理后图片。
需要说明的是,对展示区域进行缩放,可以快速改变展示区域的尺寸以符合目标尺寸。并且,可以尽量避免引入此待处理图片之外的其它内容,可以使得处理后图片的图片内容或者画风的统一。
在一些实施例中,上述步骤针对所确定的展示区域,执行以下至少一项操作得到目标裁剪区域:合并、扩展、补边、缩放和移动,可以包括:响应于得到至少两个展示区域,根据展示区域中心点之间的距离,确定是否合并展示区域以得到新的展示区域。
在一些应用场景中,如果待处理图片中识别出的目标物体的个数为至少两个,可以以矩形框圈定每个目标物体区域。然后,将确定每个矩形框的中点,以及确定中点之间的距离。如果中点之间的距离小于两个中点所属矩形的对角线长度之和的一半,则可以将这两个矩形框合并。
需要说明的是,采用上述展示区域中心点之间的距离,判断是否合并展示区域,可以尽量避免展示区域面积的影响,而以展示区域中心点这一位于展示区域中心的指示点为依据,确定距离较近的展示区域,进而快速合并展示区域。
在一些实施例中,上述步骤响应于得到至少两个展示区域,根据展示区域中心点之间的距离,确定是否合并展示区域以得到新的展示区域,可以包括:根据目标尺寸和展示区域的尺寸,确定所述展示区域的尺寸调节方向;沿着所述尺寸调节方向,对指示展示区域的第一裁剪框进行扩展,得到第二裁剪框;响应于第二裁剪框是否截断所述待处理图片中的物体图像;如果是,在所述待处理图片上平移第二裁剪框。
然后,可以判断第二裁剪框指示的区域是否符合所述目标尺寸,如果符合,可以将第二裁剪框指示的区域确定为目标裁剪区域;如果不符合,并且如果两边都扩展到了待处理图片的边界,可以对横向的区域进行补边或者拉伸,得到目标裁剪区域;裁剪出所述目标裁剪区域,得到所述处理后图片。
在这里,展示区域可以是物体检测模型输出的展示区域,也可以是经过合并得到的展示区域。
作为示例,目标尺寸的长宽比为2:1,展示区域的长宽比为3:1。那么,将展示区域的宽度方向确定为尺寸调节方向,在所述尺寸调节方向进增加尺寸到相对的1.5,既可以实现展示区域的长宽比为2:1。
在这里,指示展示区域的裁剪框,可以是指示待处理图片中的区域,可以理解,在扩展和平移的过程中,以裁剪框指示区域,可以避免在改变待处理图片本身的图像内容。
在一些应用场景中,可以以所确定的展示区域为中心,沿着尺寸调节方向进行扩展,例如可以先向横向的第一方向扩展,然后向横向的第二方向扩展,第一方向和第二方向的矢量夹角为180度。
在一些应用场景中,对展示区域扩展后得到的裁剪框,如果截断了某个物体图像(例如旗帜或者商标等),使得该物体失去了完整性,则可以在保留目标物体的前提下,对裁剪框进行移动。
需要说明的是,在扩展之后确定是否截断了待处理图片中的物体图像,可以保证扩展之后得到图像区域内容的相对完整性。
进一步参考图2,作为对上述各图所示方法的实现,本公开提供了一种图片处理装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图2所示,本实施例的图片处理装置包括:获取单元201、第一确定单元202、第二确定单元203和处理单元204。其中,获取单元,用于基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息;第一确定单元,用于根据描述信息,确定待处理图片中展示的目标物体的目标物体类型;第二确定单元,用于根据所述目标物体类型,确定目标物体图像在待处理图片中的展示区域;处理单元,用于基于所述展示区域,对所述待处理图片进行处理得到处理后图片。
在本实施例中,图片处理装置的获取单元201、第一确定单元202、第二确定单元203和处理单元204的具体处理及其所带来的技术效果可分别参考图1对应实施例中步骤101、步骤102、步骤103和步骤104的相关说明,在此不再赘述。
在一些实施例中,所述基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息,包括:对所述待处理图片进行光学字符识别,得到待处理图片中展示的第一子描述信息。
在一些实施例中,所述基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息,包括:将触发展示所述图片展示界面的搜索词,确定为第二子描述信息。
在一些实施例中,所述基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息,包括:从所述图片展示界面中,获取除所述待处理图片之外的字符作为第三子描述信息。
在一些实施例中,所述第三子描述信息包括以下至少一项:标题、正文和评论信息。
在一些实施例中,所述根据描述信息,确定待处理图片中展示的目标物体的目标物体类型,包括:对所述描述信息进行信息抽取,以及将抽取得到的物体类型确定为所述目标物体类型。
在一些实施例中,所述描述信息可以包括至少一项子描述信息;以及所述对所述描述信息进行信息抽取,以及将抽取得到的物体类型确定为所述目标物体类型,包括:拼接所获取到的子描述信息,得到拼接后描述信息;对所述拼接后描述信息进行信息抽取,得到所述目标物体类型。
在一些实施例中,所述描述信息可以包括至少一项子描述信息;以及所述对所述描述信息进行信息抽取,以及将抽取得到的物体类型确定为所述目标物体类型,包括:对各个子描述信息分别进行信息抽取,得到至少一个候选类型;从至少一个候选类型中,确定目标物体类型。
在一些实施例中,所述基于所述展示区域,对所述待处理图片进行处理得到处理后图片,包括:针对所确定的展示区域,执行以下至少一项操作得到目标裁剪区域:合并、扩展、补边、缩放和移动。
在一些实施例中,所述针对所确定的展示区域,执行以下至少一项操作得到目标裁剪区域:合并、扩展、补边、缩放和移动,包括:响应于得到至少两个展示区域,根据展示区域中心点之间的距离,确定是否合并展示区域以得到新的展示区域。
在一些实施例中,所述针对所确定的展示区域,执行以下至少一项操作得到目标裁剪区域:合并、扩展、补边、缩放和移动,包括:根据目标尺寸和展示区域的尺寸,确定所述展示区域的尺寸调节方向;沿着所述尺寸调节方向,对指示展示区域的第一裁剪框进行扩展,得到第二裁剪框;响应于第二裁剪框是否截断所述待处理图片中的物体图像;如果是,在所述待处理图片上平移第二裁剪框。
请参考图3,图3示出了本公开的一个实施例的图片处理方法可以应用于其中的示例性系统架构。
如图3所示,系统架构可以包括终端设备301、302、303,网络304,服务器305。网络304用以在终端设备301、302、303和服务器305之间提供通信链路的介质。网络304可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备301、302、303可以通过网络304与服务器305交互,以接收或发送消息等。终端设备301、302、303上可以安装有各种客户端应用,例如网页浏览器应用、搜索类应用、新闻资讯类应用。终端设备301、302、303中的客户端应用可以接收用户的指令,并根据用户的指令完成相应的功能,例如根据用户的指令在信息中添加相应信息。
终端设备301、302、303可以是硬件,也可以是软件。当终端设备301、302、303为硬件时,可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。当终端设备301、302、303为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器305可以是提供各种服务的服务器,例如接收终端设备301、302、303发送的信息获取请求,根据信息获取请求通过各种方式获取信息获取请求对应的展示信息。并展示信息的相关数据发送给终端设备301、302、303。
需要说明的是,本公开实施例所提供的图片处理方法可以由终端设备执行,相应地,图片处理装置可以设置在终端设备301、302、303中。此外,本公开实施例所提供的图片处理方法还可以由服务器305执行,相应地,图片处理装置可以设置于服务器305中。
应该理解,图3中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图4,其示出了适于用来实现本公开实施例的电子设备(例如图3中的终端设备或服务器)的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperTextTransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息;根据描述信息,确定待处理图片中展示的目标物体的目标物体类型;根据所述目标物体类型,确定目标物体图像在待处理图片中的展示区域;基于所述展示区域,对所述待处理图片进行处理得到处理后图片。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取描述信息的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (14)

1.一种图片处理方法,其特征在于,包括:
基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息;
根据描述信息,确定待处理图片中展示的目标物体的目标物体类型;
根据所述目标物体类型,确定目标物体图像在待处理图片中的展示区域;
基于所述展示区域,对所述待处理图片进行处理得到处理后图片。
2.根据权利要求1所述的方法,其特征在于,所述基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息,包括:
对所述待处理图片进行光学字符识别,得到待处理图片中展示的第一子描述信息。
3.根据权利要求1所述的方法,其特征在于,所述基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息,包括:
将触发展示所述图片展示界面的搜索词,确定为第二子描述信息。
4.根据权利要求1所述的方法,其特征在于,所述基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息,包括:
从所述图片展示界面中,获取除所述待处理图片之外的字符作为第三子描述信息。
5.根据权利要求4所述的方法,其特征在于,所述第三子描述信息包括以下至少一项:标题、正文和评论信息。
6.根据权利要求1所述的方法,其特征在于,所述根据描述信息,确定待处理图片中展示的目标物体的目标物体类型,包括:
对所述描述信息进行信息抽取,以及将抽取得到的物体类型确定为所述目标物体类型。
7.根据权利要求6所述的方法,其特征在于,所述描述信息可以包括至少一项子描述信息;以及
所述对所述描述信息进行信息抽取,以及将抽取得到的物体类型确定为所述目标物体类型,包括:
拼接所获取到的子描述信息,得到拼接后描述信息;
对所述拼接后描述信息进行信息抽取,得到所述目标物体类型。
8.根据权利要求6所述的方法,其特征在于,所述描述信息可以包括至少一项子描述信息;以及
所述对所述描述信息进行信息抽取,以及将抽取得到的物体类型确定为所述目标物体类型,包括:
对各个子描述信息分别进行信息抽取,得到至少一个候选类型;
从至少一个候选类型中,确定目标物体类型。
9.根据权利要求1所述的方法,其特征在于,所述基于所述展示区域,对所述待处理图片进行处理得到处理后图片,包括:
针对所确定的展示区域,执行以下至少一项操作得到目标裁剪区域:合并、扩展、补边、缩放和移动。
10.根据权利要求9所述的方法,其特征在于,所述针对所确定的展示区域,执行以下至少一项操作得到目标裁剪区域:合并、扩展、补边、缩放和移动,包括:
响应于得到至少两个展示区域,根据展示区域中心点之间的距离,确定是否合并展示区域以得到新的展示区域。
11.根据权利要求9所述的方法,其特征在于,所述针对所确定的展示区域,执行以下至少一项操作得到目标裁剪区域:合并、扩展、补边、缩放和移动,包括:
根据目标尺寸和展示区域的尺寸,确定所述展示区域的尺寸调节方向;
沿着所述尺寸调节方向,对指示展示区域的第一裁剪框进行扩展,得到第二裁剪框;
响应于第二裁剪框是否截断所述待处理图片中的物体图像;如果是,在所述待处理图片上平移第二裁剪框。
12.一种图片处理装置,其特征在于,包括:
获取单元,用于基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息;
第一确定单元,用于根据描述信息,确定待处理图片中展示的目标物体的目标物体类型;
第二确定单元,用于根据所述目标物体类型,确定目标物体图像在待处理图片中的展示区域;
处理单元,用于基于所述展示区域,对所述待处理图片进行处理得到处理后图片。
13.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-11中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-11中任一所述的方法。
CN202110628799.9A 2021-06-04 2021-06-04 图片处理方法、装置和电子设备 Pending CN113256660A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110628799.9A CN113256660A (zh) 2021-06-04 2021-06-04 图片处理方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110628799.9A CN113256660A (zh) 2021-06-04 2021-06-04 图片处理方法、装置和电子设备

Publications (1)

Publication Number Publication Date
CN113256660A true CN113256660A (zh) 2021-08-13

Family

ID=77186553

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110628799.9A Pending CN113256660A (zh) 2021-06-04 2021-06-04 图片处理方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN113256660A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504104A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 用于搜索引擎的图片物料处理方法、装置和搜索引擎
CN108154515A (zh) * 2017-12-27 2018-06-12 三星电子(中国)研发中心 图片展现方法和装置
CN108550127A (zh) * 2018-04-19 2018-09-18 北京小米移动软件有限公司 图片处理方法、装置、终端及存储介质
CN109242802A (zh) * 2018-09-28 2019-01-18 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及计算机可读介质
WO2020056901A1 (zh) * 2018-09-20 2020-03-26 北京字节跳动网络技术有限公司 用于处理图像的方法和装置
CN111461965A (zh) * 2020-04-01 2020-07-28 北京字节跳动网络技术有限公司 图片处理方法、装置、电子设备和计算机可读介质
CN111461967A (zh) * 2020-04-01 2020-07-28 北京字节跳动网络技术有限公司 图片处理方法、装置、设备和计算机可读介质
CN111539341A (zh) * 2020-04-26 2020-08-14 香港中文大学(深圳) 目标定位方法、装置、电子设备和介质
CN112184284A (zh) * 2020-09-03 2021-01-05 北京三快在线科技有限公司 图片分类方法、装置、电子设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504104A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 用于搜索引擎的图片物料处理方法、装置和搜索引擎
CN108154515A (zh) * 2017-12-27 2018-06-12 三星电子(中国)研发中心 图片展现方法和装置
CN108550127A (zh) * 2018-04-19 2018-09-18 北京小米移动软件有限公司 图片处理方法、装置、终端及存储介质
WO2020056901A1 (zh) * 2018-09-20 2020-03-26 北京字节跳动网络技术有限公司 用于处理图像的方法和装置
CN109242802A (zh) * 2018-09-28 2019-01-18 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及计算机可读介质
CN111461965A (zh) * 2020-04-01 2020-07-28 北京字节跳动网络技术有限公司 图片处理方法、装置、电子设备和计算机可读介质
CN111461967A (zh) * 2020-04-01 2020-07-28 北京字节跳动网络技术有限公司 图片处理方法、装置、设备和计算机可读介质
CN111539341A (zh) * 2020-04-26 2020-08-14 香港中文大学(深圳) 目标定位方法、装置、电子设备和介质
CN112184284A (zh) * 2020-09-03 2021-01-05 北京三快在线科技有限公司 图片分类方法、装置、电子设备

Similar Documents

Publication Publication Date Title
US11758088B2 (en) Method and apparatus for aligning paragraph and video
JP7394809B2 (ja) ビデオを処理するための方法、装置、電子機器、媒体及びコンピュータプログラム
CN112287206A (zh) 信息处理方法、装置和电子设备
CN115982376B (zh) 基于文本、多模数据和知识训练模型的方法和装置
CN111897950A (zh) 用于生成信息的方法和装置
CN112488095A (zh) 印章图像识别方法、装置和电子设备
CN111680491A (zh) 文档信息的抽取方法、装置和电子设备
CN114445754A (zh) 视频处理方法、装置、可读介质及电子设备
CN112990176B (zh) 书写质量评价方法、装置和电子设备
CN113971400B (zh) 一种文本检测方法、装置、电子设备及存储介质
CN112084441A (zh) 信息检索方法、装置和电子设备
CN113256660A (zh) 图片处理方法、装置和电子设备
CN113033552B (zh) 文本识别方法、装置和电子设备
CN113033682B (zh) 视频分类方法、装置、可读介质、电子设备
CN110837560B (zh) 标签挖掘方法、装置、设备、存储介质
CN113343069A (zh) 用户信息的处理方法、装置、介质及电子设备
CN113283436B (zh) 图片处理方法、装置和电子设备
CN112214695A (zh) 信息处理方法、装置和电子设备
CN110825909A (zh) 视频图像的识别方法、装置、服务器、终端和存储介质
CN112766285B (zh) 图像样本生成方法、装置和电子设备
CN112990349B (zh) 书写质量评价方法、装置和电子设备
CN114697761B (zh) 一种处理方法、装置、终端设备及介质
CN113256659B (zh) 图片处理方法、装置和电子设备
CN114697762B (zh) 一种处理方法、装置、终端设备及介质
CN111797591B (zh) 版面恢复方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination