CN105684046A - 生成图像组成 - Google Patents

生成图像组成 Download PDF

Info

Publication number
CN105684046A
CN105684046A CN201480059105.2A CN201480059105A CN105684046A CN 105684046 A CN105684046 A CN 105684046A CN 201480059105 A CN201480059105 A CN 201480059105A CN 105684046 A CN105684046 A CN 105684046A
Authority
CN
China
Prior art keywords
composition
photo
clutter
action
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480059105.2A
Other languages
English (en)
Other versions
CN105684046B (zh
Inventor
埃里克·墨菲-琼托利安
马修·斯坦纳
戴声扬
瓦希德·卡齐米
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN105684046A publication Critical patent/CN105684046A/zh
Application granted granted Critical
Publication of CN105684046B publication Critical patent/CN105684046B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/272Means for inserting a foreground image in a background image, i.e. inlay, outlay
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/265Mixing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Processing (AREA)
  • Processing Or Creating Images (AREA)

Abstract

各种实施方式一般地涉及生成图像组成。在一些实施方式中,一种方法包括:从用户接收多张照片并且从所述照片确定一个或者多个组成类型。所述方法进一步包括:基于所述一个或者多个所确定的组成类型从所接收到的照片生成一个或者多个组成,其中,每个组成基于所述照片的经修改的前景。所述方法进一步包括:将所述一个或者多个所生成的组成提供给所述用户。

Description

生成图像组成
相关申请的交叉引用
本申请要求2013年10月27日提交的序列号为14/064,164的美国非临时申请的优先权,出于所有目的起见,上述申请以引用的方式全部并入本申请。
背景技术
社交网络系统通常使得用户能够上传照片并且创建相册。社交网络系统还使得用户能够彼此分享照片。例如,用户可以与朋友和家人分享照片,这在社交网络系统的用户之中提供了愉快而亲密的体验。用户可以创建与用户的简档相关联的相册。然后,作为该相册的所有者,该用户可以允许其他用户在访问用户的简档的照片部分时浏览该相册。
发明内容
各种实施方式大体上涉及生成图像组成。在一些实施方式中,一种方法包括:从用户接收多张照片并且从照片确定一个或者多个组成类型。该方法进一步包括:基于一个或者多个所确定的组成类型从所接收到的照片生成一个或者多个组成,其中每个组成基于照片的经修改的前景。该方法进一步包括:将一个或者多个所生成的组成提供给用户。
进一步针对该方法,在一些实施方式中,该确定包括确定在照片中的相似内容。在一些实施方式中,该一个或者多个组成类型包括一个或者多个动作组成。在一些实施方式中,该一个或者多个组成类型包括一个或者多个无杂波组成。在一些实施方式中,该生成包括对准在每个所生成的组成中使用的照片。在一些实施方式中,该生成包括标准化在每个所生成的组成中使用的照片。在一些实施方式中,该生成包括平滑在每个所生成的组成中使用的照片。在一些实施方式中,该方法进一步包括:基于预定动作选择标准从所接收到的照片选择针对动作组成的照片;以及生成动作组成,其中,在该动作组成中,活动对象被示出在不同位置中。在一些实施方式中,该方法进一步包括:基于预定无杂波选择标准从所接收到的照片选择针对无杂波组成的照片;以及生成无杂波组成,其中,在动作组成中不存在一个或者多个杂波对象。
在一些实施方式中,一种方法包括:从用户接收多张照片并且从照片确定一个或者多个组成类型,其中,该一个或者多个组成类型包括动作组成和无杂波组成中的一个或者多个。该方法进一步包括:基于该一个或者多个所确定的组成类型从所接收到的照片生成一个或者多个组成,其中,每个组成基于照片的经修改的前景,其中,该生成包括以下中的一个或多个:对准、标准化、平滑以及混合在每个所生成的组成中使用的照片。该方法进一步包括:将该一个或者多个所生成的组成提供给用户。
进一步针对该方法,在一些实施方式中,该一个或者多个组成类型包括一个或者多个动作组成。在一些实施方式中,该一个或者多个组成类型包括一个或者多个无杂波组成。在一些实施方式中,该确定包括确定在照片中的相似内容。
在一些实施方式中,一种系统包括:一个或者多个处理器;以及逻辑,该逻辑被编码在一个或者多个有形介质中以由该一个或者多个处理器执行。该逻辑在被执行时可操作为执行操作,该操作包括:从用户接收多张照片;从照片确定一个或者多个组成类型;基于一个或者多个所确定的组成类型从所接收到的照片生成一个或者多个组成,其中,每个组成基于照片的经修改的前景;以及将一个或者多个所生成的组成提供给用户。
进一步关于该系统,在一些实施方式中,为了确定一个或者多个组成类型,该逻辑在被执行时可进一步操作为执行操作,该操作包括确定在照片中的相似内容。在一些实施方式中,一个或者多个组成类型包括一个或者多个动作组成。在一些实施方式中,一个或者多个组成类型包括一个或者多个无杂波组成。在一些实施方式中,为了生成一个或者多个组成,该逻辑在被执行时可进一步操作为执行操作,该操作包括对准在每个所生成的组成中使用的照片。在一些实施方式中,为了生成一个或者多个组成,该逻辑在被执行时可进一步操作为执行操作,该操作包括标准化在每个所生成的组成中使用的照片。在一些实施方式中,为了生成一个或者多个组成,该逻辑在被执行时可进一步操作为执行操作,该操作包括平滑在每个所生成的组成中使用的照片。
附图说明
图1图示了可以用于实施本文所描述的实施方式的示例网络环境的框图。
图2图示了根据一些实施方式的用于生成组成的示例简化流程图。
图3图示了根据一些实施方式的用于生成动作组成的示例简化流程图。
图4图示了根据一些实施方式的针对动作组成的示例所选照片。
图5图示了根据一些实施方式的示例初步动作组成。
图6图示了根据一些实施方式的示例动作组成。
图7图示了根据一些实施方式的用于生成无杂波(clutter-free)组成的示例简化流程图。
图8图示了根据一些实施方式的针对无杂波组成的示例所选照片。
图9图示了根据一些实施方式的针对无杂波组成的示例所选照片。
图10图示了根据一些实施方式的示例初步动作组成。
图11图示了根据一些实施方式的示例无杂波动作组成。
图12图示了可以用于实施本文所描述的实施方式的示例服务器装置的框图。
具体实施方式
对用于在社交网络系统中生成组成的各种实施方式进行描述。在各种实施方式中,系统从用户接收照片。然后,系统从所述照片确定一个或者多个组成类型。例如,该一个或者多个组成类型可以包括动作组成和无杂波组成。下面将对组成的这些类型进行更详细地描述。
然后,系统基于该一个或者多个所确定的组成类型从所接收到的照片生成组成,其中每个组成基于照片的经修改的前景,其中该生成包括以下中的一个或多个:对准、标准化、平滑以及混合在每个所生成的组成中使用的照片。
在一些实施方式中,该一个或者多个组成类型包括一个或者多个动作组成。在一些实施方式中,该一个或者多个组成的生成包括:基于预定动作选择标准从所接收到的照片选择针对动作组成的照片;基于预定动作检测标准检测在所选照片中的每一张中的活动对象;以及生成动作组成,其中,在动作组成中,活动对象被示出在不同位置中。
在一些实施方式中,该一个或者多个组成类型包括一个或者多个无杂波组成。在一些实施方式中,该一个或者多个组成的生成包括:基于预定无杂波选择标准从所接收到的照片选择针对无杂波组成的照片;基于预定无杂波检测标准检测在所选照片中的每一张中的一个或者多个杂波对象;以及生成无杂波组成,其中在动作组成中不存在一个或者多个杂波对象。然后,系统将一个或者多个所生成的组成提供给用户。
图1图示了可以用于实施本文所描述的实施方式的示例网络环境100的框图。在一些实施方式中,网络环境100包括系统102,该系统102包括服务器装置104和社交网络数据库106。在各种实施方式中,术语系统102和短语“社交网络系统”可以互换使用。网络环境100还包括客户端装置110、120、130和140,该客户端装置110、120、130和140可以经由系统102和网络150相互通信。
为了便于图示,图1示出了系统102、服务器装置104和社交网络数据库106中的每一个的一个方框,并且示出了客户端装置110、120、130和140的四个方框。方框102、104和106可以表示多个系统、服务器装置和社交网络数据库。同样,可以存在任意数量的客户端装置。在其它实施方式中,网络环境100可以不具有所有示出的部件并且/或者可以具有其它元件,这种元件包括替代本文所示出的元件或者除了本文所示出的元件之外的其它类型的元件。
在各种实施方式中,用户U1、U2、U3和U4可以使用相应客户端装置110、120、130和140相互通信。例如,用户U1、U2、U3和U4可以相互交互,其中,相应客户端装置110、120、130和140向彼此传送组成媒体内容。
虽然本文以社交网络系统为背景描述了一些实施方式,但是这些实施方式可以应用在除了社交网络之外的背景中。例如,实施方式可以本地应用于单独的用户。例如,系统102可以在独立计算机、平板计算机、智能手机等上执行本文所描述的实施方式。
图2图示了根据一些实施方式的用于生成组成的示例简化流程图。在各种实施方式中,系统102可以在社交网络系统中或者可以使用并且/或者浏览视觉媒体的任何地方中生成组成。参照图1和图2两者,在方框202中发起方法,其中,系统102从用户接收照片集合。在各种实施方式中,当用户将照片上传至系统102时或者在用户将照片添加至一个或者多个相册之后,可以接收到照片。在一些实施方式中,系统102可以使得用户的照相机装置(例如,智能手机)能够在照相机装置捕获照片时将照片自动上传至系统102。
在方框204中,系统102从照片确定一个或者多个组成类型。组成类型可以包括动作组成和/或无杂波组成中的一个或者多个。如下面更详细描述的,系统102确定哪些类型的组成可以从照片生成。为此,在各种实施方式中,系统102分析照片以确定,针对每种类型的组成,哪些照片合适。
在各种实施方式中,系统102将依次拍摄的并且多帧照片内视觉上相似的照片视为针对动作组成和/或针对无杂波组成的候选。
在各种实施方式中,为了确定可以从照片制成的组成类型,系统102利用辨别算法来分析照片以寻找针对不同组成类型合适的照片。在各种实施方式中,系统102分析照片的序列以检测哪些成分是前景和背景,包括哪些对象在前景中而哪些对象在背景中。
例如,系统102可以利用辨别算法来在一系列照片中辨别前景对象,其中,相对于静态背景,前景对象在不同的照片中处于不同的位置。系统102可以确定这种照片是针对动作组成的良好候选。下面将对辨别算法的示例实施方式进行更详细地描述。
在一些实施方式中,为了从照片确定组成类型,系统102可以确定在照片群组中的不同照片中的相似内容。例如,系统102可以辨别在该组照片的中心区域中的相同对象。在另一示例中,系统102可以辨别在该组照片中的相同纪念碑。在一些实施方式中,系统102可以基于在照片中的元数据来确定照片的相似度。例如,元数据诸如标签、时间戳、地理位置等可以指示相似照片。
在方框206中,系统102基于一个或者多个所确定的组成类型从所接收到的照片生成一个或者多个组成。在各种实施方式中,为了从照片生成组成,系统102基于所确定的组成类型从照片集合或群组选择候选照片。选择过程可以作为生成过程的一部分或者在生成过程之前发生。下面将对用于选择候选照片的各种实施方式进行更详细地描述。
在各种实施方式中,每个组成基于照片的经修改的前景。例如,系统102可以生成动作组成,该动作组成示出了在相对于背景场景移动的前景中的对象,其中,相对于背景场景,对象被示出在不同位置中。下面将结合图3至图6对涉及动作组成的各种实施方式进行更详细地描述。
在另一示例实施方式中,系统102可以生成无杂波组成,该无杂波组成示出了不存在视觉障碍诸如旁观者、车等的对象,诸如,建筑、纪念碑、景观等。为了生成无杂波组成,系统102去除或者“擦除”这种视觉障碍。下面将结合图7至图11对涉及动作组成的各种实施方式进行更详细地描述。
如下面更详细描述的,当生成组成时,系统102可以执行以下中的一个或者多个:对准在每个所生成的组成中使用的照片;标准化在每个所生成的组成中使用的照片;平滑在每个所生成的组成中使用的照片;以及混合在每个所生成的组成中使用的照片。
在各种实施方式中,为了确保高质量的组成,预定选择标准可以包括确定用于对准、标准化、平滑以及混合中的一种或者多种的算法可以应用于在每个所生成的组成中使用的照片。下面将对这种算法的示例实施方式进行更详细地描述。
在方框208中,系统102将一个或者多个所生成的组成提供给用户。例如,在一些实施方式中,系统102可以向用户发送消息,该消息指示系统102已经生成一个或者多个组成并且已经将该组成添加至用户的上传流或者相册。在各种实施方式中,系统102可以生成并且使视觉标记覆盖与组成相关联的图像。在各种实施方式中,系统102可以生成第二或者组合视觉标记并且使该第二或者组合视觉标记覆盖组成,其中,视觉标记指示组成的类型(例如,动作组成、无杂波组成等)。
在一些实施方式中,系统102可以允许一些用户交互或者反馈。例如,不是自动生成动画,而是系统102可以检测将制成具体组成的照片并且然后提示用户发起组成的生成(例如,通过单击按钮或者选择按钮)。
图3图示了根据一些实施方式的用于生成动作组成的示例简化流程图。参照图1和图3两者,在方框302中发起方法,其中,系统102从用户接收照片集合。
在方框304中,系统102通过照片确定动作组成。换言之,系统102确定所接收到的照片中的至少一些是用于构建动作组成的良好候选。
如上所示,动作组成基于照片的经修改的前景。例如,系统102可以生成动作组成,该动作组成示出了在相对于背景场景移动的前景中的对象,其中,相对于背景场景,对象被示出在不同位置中。
在另一示例实施方式中,系统102可以生成无杂波组成,该无杂波组成示出了不存在视觉障碍诸如旁观者、车等的对象,诸如,建筑、纪念碑、景观等。
在方框306中,系统102基于预定动作选择标准从所接收到的照片选择针对动作组成的照片。例如,预定选择标准可以包括确定照片是依次捕获的。
在各种实施方式中,预定动作选择标准可以包括确定,在不同的照片,在前景中的相似内容相对于场景和/或背景而改变位置。在一些实施方式中,预定动作选择标准可以包括确定变化位置的内容在照片的中心部分中。在一些实施方式中,系统102可以使得用户能够选择哪些照片序列适合动作组成。
图4图示了根据一些实施方式的针对动作组成的示例所选照片400。如图所示,在场景中,在前景中的人402坐在椅子404上。在随后的照片中,人402在不同的照片中相对于场景改变位置(例如,从椅子404变到椅子406、变到408、以及变到410),如图5所示。
在方框308中,系统102生成动作组成,其中,在动作组成中,活动对象被示出在不同位置中。
图5图示了根据一些实施方式的示例初步动作组成500。在各种实施方式中,动作组成500包括照片的多个部分,其中,对象(例如,人402)在不同的照片中相对于场景改变位置。例如,在该系列照片中,人402从椅子404改变位置至椅子406、至408、以及至410。动作组成500包括如图所示的这些照片的多个部分。
在各种实施方式中,系统102可以应用分段算法来将照片分为多个部分,称为图块(patch)。如图所示,图块506、508和510示出了人402坐在相应椅子406、408和410的多个部分,其中,每个图块取自不同的照片。
在一些实施方式中,将来自一些照片的图块添加至一张照片,该张照片可以称为基本照片。在该示例实施方式中,基本照片为图4的人402坐在椅子404上的照片400。虽然图块506、508和510用不同深浅的灰色示出,但是在一些实施方式中,图块506、508和510可以具有其它不同的颜色(例如,蓝色、红色、黄色等)。
在一些实施方式中,系统102通过将照片与照片序列中的其它照片进行比较来将给定照片分为一个或者多个图块,其中,系统102通过识别不同照片中的独特像素来确定不同的对象。在一些实施方式中,系统102可以提示用户手动地选择待去除或者复制的在照片中的区域。系统102通过确定具体识别出来的对象周围的边界来指定一个或者多个图块。结果,系统在对象周围生成图块,这些对象在照片的给定部分是不同的。系统102添加图块或者将图块拼在一起以构建组成。
在一些实施方式中,针对动作组成,如果更多像素具有相同值,那么存在像素较高的置信度。例如,如果在5张照片的给定位置中存在5个像素,并且4个像素具有相同值但是1个像素具有不同的值,那么存在像素中存在运动的高置信度。
在一些实施方式中,针对无杂波组成(下面所描述的),如果像素具有相同颜色,那么存在像素较高的置信度。例如,如果在5张照片的给定位置中存在5个像素,若4个像素具有相同颜色值,那么存在高置信度。
在一些实施方式中,系统102应用对区域进行划分的分段算法。该分段算法还可以称为图形切割算法。在一些实施方式中,分段算法解决了将图形节点划分为两个集合从而使得在两个集合之间的连接边缘范围内限定的权重之和最小的问题。在一些实施方式中,最小切割和最大流的问题相等,并且可以使用任何合适的算法,诸如,最短扩增路径(shortestaugmentingpath)或者推动重标号(pushrelabel)算法,来有效解决。这对二进制划分情景起作用。
在各种实施方式中,系统102应用混合算法来添加图块或者将图块组合在一起。在各种实施方式中,当生成动作组成和/或无杂波组成时,系统102应用分段算法和混合算法。
图6图示了根据一些实施方式的示例动作组成600。如图所示,在相同组成中,人402坐在椅子404、406、408和410上。根据零用户动作或者用户意图,系统102生成单个组成或者照片,该单个组成或者照片混合来自多张照片的前景动作。
虽然以人处于不同座位为背景对一些示例实施方式进行了描述,但是这种实施方式及其它实施方式也可以应用于其它影片动作(例如,将滑雪者跳跃的四张连续照片组合为一张照片等)。
在各种实施方式中,为了生成高质量的组成,系统102应用对准、标准化、平滑和混合在每个所生成的组成中使用的照片(包括照片的图块)的各种算法。在一些实施方式中,如果照片不能被对准、标准化、平滑并且/或者混合以生成高质量组成,那么系统102可能不会生成针对照片序列的组成。这避免部分地示出诸如人的对象或者在组成中对象出现两次的组成。在各种实施方式中,系统102应用用于对准、标准化、平滑以及混合生成动作组成和/或无杂波组成的照片的算法。
在各种实施方式中,当生成组成时,系统102应用对准照片的对准算法。具体而言,系统102可以将照片的静态部分对准在一起。系统102还可以匹配穿插多对照片的特征点。在一些实施方式中,系统102可以通过单应(例如,单应变换,一种在视频稳定中使用的技术)来对准照片。
在各种实施方式中,当生成组成时,系统102应用对照片执行颜色调节和颜色投票的标准化算法。为了进行颜色调节,系统102将每张照片的颜色标准化为参照色。这调节了照明变化并且使颜色在照片中保持一致。
在一些实施方式中,系统102应用颜色投票,其中,用于对准序列的每个重叠像素使用像素颜色来投票。偏离大多数颜色的像素被视为潜在前景。在一些实施方式中,系统102可以将标准化算法应用于照片以便标准化在照片中的多种其它图像参数(例如,曝光度、亮度、对比度等)。
在一些实施方式中,系统102可以将平滑算法应用于照片以便使用能量最小化算法来平滑像素得票数。在各种实施方式中,能量最小化算法102优选在边界上的颜色一致性。能量最小化算法102还可以针对小区域或者不连贯区域应用惩罚。
在一些实施方式中,系统102可以应用混合算法以在拼接边界上执行混合以便减少伪影(artifact)。在一些实施方式中,系统102可以应用使用了广义距离变换以填充孔的图像修复算法,其中,没有照片具有合适的背景示例。在一些实施方式中,图像修复算法可以使用广义距离变换以发现至每个低置信像素具有最小距离的像素,并且将其用作参照。图像修复算法还可以发现用于匹配该参照的每个像素的最接近标签。
在一些实施方式中,系统102可以应用用于以随机森林进行颜色建模的建模算法。在一些实施方式中,建模算法可以使用随机森林分类器来在前景/背景像素之间判别。
在一些实施方式中,拼接伪影可以通过在边缘上执行高斯平滑来减少。在一些实施方式中,为了避免与前景像素合并,系统102可以跳过高对比区域。在一些情景中,分段算法产生平滑边界,其可以最小化对混合的需要。
图7图示了根据一些实施方式的用于生成无杂波组成的示例简化流程图。参照图1和图7两者,方法在方框702中发起,其中,系统102从用户接收照片集合。
在方框704中,系统102从照片确定无杂波组成。换言之,系统102确定所接收到的照片中的至少一些为用于构成无杂波组成的良好候选。
如上所示,无杂波组成基于照片的经修改的前景。例如,系统102可以生成无杂波组成,该无杂波组成示出了不存在视觉障碍诸如旁观者、车等的对象,诸如,建筑、纪念碑、景观等。系统102可以使用来自照片集合的多张照片来构成无杂波组成,其中每张照片揭示了对象的不同部分(例如,纪念碑的不同部分)。
在方框706中,系统102基于预定无杂波选择标准从所接收到的照片选择针对无杂波组成的照片。例如,预定无杂波选择标准可以包括确定照片是依次捕获的。在各种实施方式中,预定动作选择标准可以包括确定在照片中的相似内容并且这种内容通常被人遮挡:木板路、桥、建筑、城市、市区、房屋、住宅、道路、摩天大楼、街道、结构、塔等,或者具有与物理地点(例如,地标等)匹配的对象辨别。系统102可以利用任何合适的算法来注释照片并且匹配地标。在各种实施方式中,系统102可以利用用于场景的任何适合的计算机视觉注释。在一些实施方式中,系统102可以使得用户能够选择哪一些照片序列适用无杂波组成。
图8图示了根据一些实施方式的针对无杂波组成的示例选择照片800。图8示出了纪念碑802,在场景的前景中有人804和车806。
图9图示了根据一些实施方式的针对无杂波组成的示例选择照片900。图9示出了纪念碑802,在场景的前景中有人908和车806。
在方框708中,系统102生成无杂波组成,其中,在动作组成中,不存在一个或者多个杂波对象。
图10图示了根据一些实施方式的示例初步动作组成1000。在各种实施方式中,动作组成1000包括照片的去除或者“擦除”了对象(例如,在图8和图9的相应照片800和900中的人804、车806和人908)的多个部分。系统102通过用在场景的具体部分中的不具有杂波的图块替代在那些相同部分中具有“杂波”的图块来实现这种效果,其中,不具有杂波的图块取自照片序列中的其它照片。
在该示例实施方式中,基本照片为图8的示出了纪念碑802的照片800。其它照片的图块1002、1004、1006和1008示出了场景不存在人804、车806、人908和其它对象的部分。在各种实施方式中,系统102识别照片序列中的不存在对象的对应图块,并且使用这些图块来提供无杂波组成。
在各种实施方式中,系统102去除尽可能多的杂波对象以便创建无杂波组成。如上所示,在各种实施方式中,系统102应用用于对准、标准化、平滑以及混合生成无杂波组成的照片的算法。
图11图示了根据一些实施方式的示例无杂波组成1100。图11示出了纪念碑802,无阻挡纪念碑802的视图的特定对象(例如,人、车等)。如图所示,在零用户动作或者用户意图下,系统102通过混合来自多张照片的无杂波背景来生成消除不期望的前景的单个组成或者照片。
虽然以纪念碑为背景描述了一些示例实施方式,但是这种实施方式及其它实施方式可以应用于其它对象(例如,建筑、景观等)。
在各种实施方式中,系统102确定是否擦除或者去除特定前景对象。在一些情景中,用户可能不期望将特定对象,诸如,朋友、家人等,从照片去除,即使他们在纪念碑前面。在这种情况下,拍摄照片的人(例如,照片的所有者)意欲保留在照片中的人很可能居中并且没有移动太多。在一些实施方式中,系统102可以将照片中的人辨别为与拍摄该照片的人存在社交联系。如此,系统102将人保留下来,同时去除路过的其他人。
在一些实施方式中,本文所描述的组成的多个类型可以应用于一张照片或者照片群组。在各种实施方式中,系统102可以生成包括动作组成、无杂波组成等的不同组合的组成。例如,在一些实施方式中,系统102可以在无杂波组成内生成动作组成。实际组合将取决于具体的实施方式。
虽然可以按照特定顺序提出在本文所描述的方法实施方式中的步骤、操作或者计算,但是该顺序在具体实施方式中可以改变。步骤的其它排序是可能的,这取决于具体实施方式。在一些具体实施方式中,可以同时执行按照在本说明书中的顺序示出的多个步骤。同样,一些实施方式可以不具有所有示出的步骤并且/或者可以具有替代本文所示出的步骤或者除了本文所示出的步骤之外的其它步骤。
虽然将系统102描述为执行如在本文的实施方式中所描述的步骤,但是系统102的任何合适的部件或者部件的组合或者与系统102关联的任何合适的处理器也可以执行所描述的步骤。
在各种实施方式中,系统102可以利用多种辨别算法来辨别在照片中的人脸、地标、对象等。这种辨别算法可以集成到系统102。系统102还可以访问由在系统102外部的并且该系统102访问的软件提供的辨别算法。
在各种实施方式中,系统102使得社交网络系统的用户能够指定和/或同意对个人信息的使用,其可以包括:系统102使用他们在照片中的人脸或者使用他们的身份信息来辨别在照片中识别的人。例如,系统102可以向用户提供多种选择,这些选择涉及指定和/或同意对个人信息的使用。例如,关于指定和/或同意的选择可以与个人照片、所有照片、个人相册、所有相册等关联。可以通过多种方式来实施该选择。例如,系统102可以使按钮或者复选框紧靠着各个选择而显示。在一些实施方式中,系统102使得社交网络的用户能够指定并且/或者同意对使用他们的照片进行一般的面部辨别的使用。下面将对用于辨别人脸和其它对象的示例实施方式进行更详细地描述。
在本文所讨论的系统收集与用户有关的个人信息,或者可以利用个人信息的情况下,用户可以有机会控制程序或者特征是否收集了用户信息(例如,与用户社交网络、社交动作或者活动、职业、用户偏好、或者用户当前位置有关的信息)、或者控制是否和/或如何从可能与用户更相关的内容服务器接收内容。另外,在存储或者使用特定数据之前,可以通过一种或者多种方式对该特定数据进行处理,从而去除个人可识别信息。例如,可以将用户身份处理为使得,针对该用户,不能确定个人可识别信息,或者可以将获得位置信息的用户的地理位置一般化(诸如,一般化为城市、邮政编码、或者州级),从而不能确定用户的具体位置。由此,用户可以对如何收集用户相关的信息并且内容服务器如何使用该信息进行控制。
在各种实施方式中,系统102获得社交网络系统的用户的参照图像,其中,每个参照图像包括与已知用户关联的人脸的图像。用户知道,系统102具有用户的身份信息诸如用户名字和其它简档信息。在一些实施方式中,参照图像可以是例如用户上传了的简档图像。在一些实施方式中,参照图像可以基于参照图像群组的组成。
在一些实施方式中,为了辨别在照片中的人脸,系统102可以将人脸(即,人脸的图像)与社交网络系统的用户的参照图像进行比较并且匹配。注意,术语“人脸”和短语“人脸的图像”是互换使用的。为了便于图示,在本文所描述的一些示例实施方式中,描述了对一个人脸的辨别。这些实施方式还可以应用于待辨别的多个人脸中的每一个人脸。
在一些实施方式中,系统102可以搜索参照图像以便识别与在照片中的人脸相似的任何一个或者多个参照图像。在一些实施方式中,针对给定参照图像,系统102可以从照片中的人脸的图像提取特征用于分析,并且然后将那些特征与一个或者多个参照图像中的那些特征进行比较。例如,系统102可以分析面部特征诸如眼睛、鼻子、颧骨、嘴、下巴等的相对位置、大小、和/或形状。在一些实施方式中,系统102可以使用从分析收集的数据来将在照片中的人脸与具有匹配或类似特征的一个或多个参照图像进行匹配。在一些实施方式中,系统102可以标准化多张参照图像,并且将来自那些图像的人脸数据压缩为具有信息(例如,面部特征数据)的组成表示,并且然后将在照片中的人脸与组成表示进行比较用于面部辨别。
例如,在一些方案中,在照片中的人脸可以类似于与相同用户关联的多张参照图像。如此,与在照片中的人脸关联的人是与参照图像关联的相同的人的概率可能较高。
在一些方案中,在照片中的人脸可以类似于与不同用户关联的多张参照图像。如此,在照片中的人匹配与参照图像关联的任何给定人的概率中等高,但该概率还是降低了。为了应对这种情况,系统102可以使用多种类型的面部辨别算法来将可能性理想地缩小到一个最佳候选。
例如,在一些实施方式中,为了促进面部辨别,系统102可以使用几何面部辨别算法,该几何面部辨别算法基于特征判别。系统102还可以使用光度算法,该光度算法基于将面部特征提取为值用于比较的统计方法。当将在照片中的人脸与一个或者多个参照进行比较时,还可以使用几何方法和光度方法的组合。
可以使用其它面部辨别算法。例如,系统102可以使用面部辨别算法,该面部辨别算法使用主成分分析、线性判别分析、弹性束图匹配、隐式马尔可夫模型和动态链接匹配中的一种或者多种。要理解,系统102可以使用其它已知的或者将来开发的面部辨别算法、技术和/或系统。
在一些实施方式中,系统102可以生成指示在照片中的人脸匹配给定参照图像的可能性(或概率)的输出。在一些实施方式中,可以将输出表示为与在照片中的人脸匹配给定参照图像的置信度关联的度量(或者数字值),诸如,百分比。例如,1.0的值可以表示100%匹配置信度。例如,这可以在所比较的图像相同或者近乎相同时发生。该值可以较低,例如,当存在50%的匹配可能时,该值可以是0.5。其它类型的输出是可能的。例如,在一些实施方式中,输出可以是用于匹配的置信度分数。
为了便于图示,已经以面部辨别算法为背景描述了上面所描述的一些示例实施方式。可以使用其它相似的辨别算法和/或视觉搜索系统来辨别对象,诸如,地标、商标、实体、事件等,以便实施本文所描述的实施方式。
本文所描述的实施方式提供了多种益处。例如,实施方式自动生成用户可以与他们的朋友分享的动作组成和无杂波组成。这种实施方式不需要来自用户的人工操作,并且具体而言,实施方式不需要用户了解如何创建组成。本文所描述的实施方式还增加了在社交网络环境中的用户之中的全面接触。
图12图示了可以用于实施本文所描述的实施方式的示例服务器装置1200的框图。例如,可以使用服务器装置1200来实施图1的服务器装置104,并且执行本文所描述的方法实施方式。在一些实施方式中,服务器装置1200包括处理器1202、操作系统1204、存储器1206、和输入/输出(I/O)接口1208。服务器装置1200还包括:社交网络引擎1210和介质应用1212,其可以存储在存储器1206中或者存储在任何其它合适的存储位置或者计算机可读介质上。介质应用1212提供指令,该指令使得处理器1202能够执行本文所描述的功能和其它功能。
为了便于图示,图12示出了用于处理器1202、操作系统1204、存储器1206、I/O接口1208、社交网络引擎1210和介质应用1212中的每一个的一个方框。这些方框1202、1204、1206、1208、1210和1212可以表示多个处理器、操作系统、存储器、I/O接口、社交网络引擎和介质应用。在其它实施方式中,服务器装置1200可以不具有所有示出的部件并且/或者可以具有其它元件,这种元件包括替代本文示出的元件或者除了本文示出的元件之外的其它类型的元件。
虽然已经相对于本说明的具体实施例对其进行了描述,但是这些具体实施例仅仅是图示性的,并且无限制性。在示例中示出的构思可以应用于其它示例和实施方式。
注意,在本公开中描述的功能块、方法、装置和系统可以一体化或者分为系统、装置和功能块的不同组合,如本领域技术人员将已知的。
可以使用任何合适的编程语言和编程技术来实施具体实施例的例程。可以采用不同的编程技术,诸如,面向过程或者面向对象的编程技术。例程可以在单个处理装置或者多个处理器上执行。虽然可以按照特定顺序提出步骤、操作或者计算,但是该顺序在不同具体实施例中可以改变。在一些具体实施例中,可以同时执行按照在本说明书中的顺序示出的多个步骤。
“处理器”包括处理数据、信号或者其它信息的任何合适的硬件和/或软件系统、机构、或部件。处理器可以包括具有通用中央处理单元、多个处理单元、用于实现功能的专用电路的系统、或者其它系统。处理器不受限于地理位置、或者具有时间限制。例如,处理器可以在“批处理模式”等中“实时”、“离线”地执行其功能。处理的多个部分可以在不同时间和不同位置、通过不同(或者相同)处理系统来执行。计算机可以是与存储器通信的任何处理器。存储器可以是任何合适的处理器可读存储介质,诸如,随机存取存储器(RAM)、只读存储器(ROM)、磁盘或者光盘、或者适用于存储用于由处理器执行的指令的其它有形介质。

Claims (20)

1.一种方法,包括:
从用户接收多张照片;
从所述照片确定一个或者多个组成类型,其中所述一个或者多个组成类型包括动作组成和无杂波组成中的一个或者多个;
基于一个或者多个所确定的组成类型从所接收的照片生成一个或者多个组成,其中每个组成基于所述照片的经修改的前景,其中所述生成包括以下中的一个或者多个:对准、标准化、平滑以及混合在每个所生成的组成中使用的照片;以及
将一个或者多个所生成的组成提供给所述用户。
2.根据权利要求1所述的方法,其中,所述一个或者多个组成类型包括一个或者多个动作组成。
3.根据权利要求1所述的方法,其中,所述一个或者多个组成类型包括一个或者多个无杂波组成。
4.根据权利要求1所述的方法,其中,所述确定包括确定在所述照片中的相似内容。
5.一种方法,包括:
从用户接收多张照片;
从所述照片确定一个或者多个组成类型;
基于一个或者多个所确定的组成类型从所接收的照片生成一个或者多个组成,其中每个组成基于所述照片的经修改的前景;以及
将一个或者多个所生成的组成提供给所述用户。
6.根据权利要求5所述的方法,其中,所述确定包括确定在所述照片中的相似内容。
7.根据权利要求5所述的方法,其中,所述一个或者多个组成类型包括一个或者多个动作组成。
8.根据权利要求5所述的方法,其中,所述一个或者多个组成类型包括一个或者多个无杂波组成。
9.根据权利要求5所述的方法,其中,所述生成包括对准在每个所生成的组成中使用的照片。
10.根据权利要求5所述的方法,其中,所述生成包括标准化在每个所生成的组成中使用的照片。
11.根据权利要求5所述的方法,其中,所述生成包括平滑在每个所生成的组成中使用的照片。
12.根据权利要求5所述的方法,进一步包括:
基于预定动作选择标准从所接收的照片选择针对动作组成的照片;以及
生成动作组成,其中,在所述动作组成中,活动对象被示出在不同位置中。
13.根据权利要求5所述的方法,进一步包括:
基于预定的无杂波选择标准从所接收到的照片选择针对无杂波组成的照片;以及
生成无杂波组成,其中,在所述动作组成中不存在一个或者多个杂波对象。
14.一种系统,包括:
一个或者多个处理器;以及
逻辑,所述逻辑被编码在一个或者多个有形介质中以便由所述一个或者多个处理器执行,并且所述逻辑在被执行时可操作为执行操作,所述操作包括:
从用户接收多张照片;
从所述照片确定一个或者多个组成类型;
基于一个或者多个所确定的组成类型从所接收的照片生成一个或者多个组成,其中每个组成基于所述照片的经修改的前景;以及
将一个或者多个所生成的组成提供给所述用户。
15.根据权利要求14所述的系统,其中,为了确定所述一个或者多个组成类型,所述逻辑在被执行时可进一步操作为执行操作,所述操作包括确定在所述照片中的相似内容。
16.根据权利要求14所述的系统,其中,所述一个或者多个组成类型包括一个或者多个动作组成。
17.根据权利要求14所述的系统,其中,所述一个或者多个组成类型包括一个或者多个无杂波组成。
18.根据权利要求14所述的系统,其中,为了生成所述一个或者多个组成,所述逻辑在被执行时可进一步操作为执行操作,所述操作包括对准在每个所生成的组成中使用的照片。
19.根据权利要求14所述的系统,其中,为了生成所述一个或者多个组成,所述逻辑在被执行时可进一步操作为执行操作,所述操作包括标准化在每个所生成的组成中使用的照片。
20.根据权利要求14所述的系统,其中,为了生成所述一个或者多个组成,所述逻辑在被执行时可进一步操作为执行操作,所述操作包括平滑在每个所生成的组成中使用的照片。
CN201480059105.2A 2013-10-27 2014-10-24 生成图像组成 Active CN105684046B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/064,164 US9460533B2 (en) 2013-10-27 2013-10-27 Generating image compositions
US14/064,164 2013-10-27
PCT/US2014/062296 WO2015061763A1 (en) 2013-10-27 2014-10-24 Generating image compositions

Publications (2)

Publication Number Publication Date
CN105684046A true CN105684046A (zh) 2016-06-15
CN105684046B CN105684046B (zh) 2019-07-05

Family

ID=51894235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480059105.2A Active CN105684046B (zh) 2013-10-27 2014-10-24 生成图像组成

Country Status (7)

Country Link
US (2) US9460533B2 (zh)
EP (1) EP3061069A1 (zh)
KR (1) KR101807979B1 (zh)
CN (1) CN105684046B (zh)
AU (1) AU2014339827B2 (zh)
CA (1) CA2928086A1 (zh)
WO (1) WO2015061763A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9609236B2 (en) 2013-09-16 2017-03-28 Kyle L. Baltz Camera and image processing method
US9460533B2 (en) * 2013-10-27 2016-10-04 Google Inc. Generating image compositions
US9286707B1 (en) 2014-01-27 2016-03-15 Google Inc. Removing transient objects to synthesize an unobstructed image
US10127945B2 (en) 2016-03-15 2018-11-13 Google Llc Visualization of image themes based on image content
US10642893B2 (en) * 2016-09-05 2020-05-05 Google Llc Generating theme-based videos
US10944921B2 (en) 2019-03-27 2021-03-09 Rovi Guides, Inc. Replacing a background portion of an image
US10887531B2 (en) * 2019-03-27 2021-01-05 Rovi Guides, Inc. Replacing a background portion of an image
KR102271521B1 (ko) 2019-12-31 2021-07-01 씨제이포디플렉스 주식회사 주변 영상 생성 방법 및 이를 수행하는 서버

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236890A (zh) * 2010-05-03 2011-11-09 微软公司 从多个图像生成组合图像
CN102685365A (zh) * 2011-03-11 2012-09-19 索尼公司 图像合成装置、图像合成方法和图像合成程序
CN102881032A (zh) * 2012-09-14 2013-01-16 北京理工大学 一种基于改进算法的图片拼接方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1826723B1 (en) 2006-02-28 2015-03-25 Microsoft Corporation Object-level image editing
US7577314B2 (en) * 2006-04-06 2009-08-18 Seiko Epson Corporation Method and apparatus for generating a panorama background from a set of images
JP4341662B2 (ja) 2006-10-06 2009-10-07 ソニー株式会社 映像合成装置
US8135182B2 (en) 2008-04-22 2012-03-13 Eastman Kodak Company Method for creating photo cutouts and collages
US8693780B2 (en) 2009-06-22 2014-04-08 Technion Research & Development Foundation Limited Automated collage formation from photographic images
JP5012967B2 (ja) 2010-07-05 2012-08-29 カシオ計算機株式会社 画像処理装置及び方法、並びにプログラム
US8588548B2 (en) * 2010-07-29 2013-11-19 Kodak Alaris Inc. Method for forming a composite image
WO2012024830A1 (en) * 2010-08-24 2012-03-01 Hewlett-Packard Development Company, L.P. Stitched digital images
US8526763B2 (en) * 2011-05-27 2013-09-03 Adobe Systems Incorporated Seamless image composition
US8823745B2 (en) 2011-06-02 2014-09-02 Yoostar Entertainment Group, Inc. Image processing based on depth information and color data of a scene
US8994834B2 (en) * 2012-12-20 2015-03-31 Google Inc. Capturing photos
US9076270B2 (en) * 2013-05-14 2015-07-07 Google Inc. Generating compositions
US9299004B2 (en) * 2013-10-24 2016-03-29 Adobe Systems Incorporated Image foreground detection
US10019823B2 (en) * 2013-10-24 2018-07-10 Adobe Systems Incorporated Combined composition and change-based models for image cropping
US9460533B2 (en) * 2013-10-27 2016-10-04 Google Inc. Generating image compositions

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236890A (zh) * 2010-05-03 2011-11-09 微软公司 从多个图像生成组合图像
CN102685365A (zh) * 2011-03-11 2012-09-19 索尼公司 图像合成装置、图像合成方法和图像合成程序
CN102881032A (zh) * 2012-09-14 2013-01-16 北京理工大学 一种基于改进算法的图片拼接方法

Also Published As

Publication number Publication date
AU2014339827B2 (en) 2017-02-16
AU2014339827A1 (en) 2016-04-28
US9460533B2 (en) 2016-10-04
US20170024919A1 (en) 2017-01-26
US9965882B2 (en) 2018-05-08
US20150117794A1 (en) 2015-04-30
WO2015061763A1 (en) 2015-04-30
EP3061069A1 (en) 2016-08-31
KR20160078964A (ko) 2016-07-05
CA2928086A1 (en) 2015-04-30
KR101807979B1 (ko) 2017-12-11
CN105684046B (zh) 2019-07-05

Similar Documents

Publication Publication Date Title
CN105684046A (zh) 生成图像组成
CN108596277B (zh) 一种车辆身份识别方法、装置和存储介质
CN110210276A (zh) 一种移动轨迹获取方法及其设备、存储介质、终端
US20140153832A1 (en) Facial expression editing in images based on collections of images
CN104750737B (zh) 一种相册管理方法及装置
CN105684038A (zh) 用于替换图像的部分的图像缓存
US20160034785A1 (en) Generating compositions
CN109635783A (zh) 视频监控方法、装置、终端和介质
GB2434933A (en) Segmenting an image for image labelling
US20190332854A1 (en) Hybrid deep learning method for recognizing facial expressions
JP2005148900A (ja) 画像分類装置、画像分類方法、および、プログラム
CN114973349A (zh) 面部图像处理方法和面部图像处理模型的训练方法
CN111046213B (zh) 一种基于图像识别的知识库构建方法
CN105580050A (zh) 提供图像中的控制点
CN114972016A (zh) 图像处理方法、装置、计算机设备、存储介质及程序产品
US9286707B1 (en) Removing transient objects to synthesize an unobstructed image
Abdallah et al. A new color image database for benchmarking of automatic face detection and human skin segmentation techniques
CN115115552B (zh) 图像矫正模型训练及图像矫正方法、装置和计算机设备
La Cava et al. 3D face reconstruction: the road to forensics
CN116109911A (zh) 一种三维场景审核方法、装置及计算机存储介质
CN110348404B (zh) 一种农村道路景观视觉评价分析方法
JPH11283036A (ja) 対象物検出装置及び対象物検出方法
CN115830517B (zh) 基于视频的考场异常帧提取方法及系统
CN116704221B (zh) 图像处理方法、装置、设备和计算机可读存储介质
CN116935209A (zh) 神经网络训练方法、图像检测方法、装置、设备及产品

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: American California

Applicant after: Google limited liability company

Address before: American California

Applicant before: Google Inc.

GR01 Patent grant
GR01 Patent grant