CN108713313B - 多媒体数据处理方法、装置和设备/终端/服务器 - Google Patents

多媒体数据处理方法、装置和设备/终端/服务器 Download PDF

Info

Publication number
CN108713313B
CN108713313B CN201880001162.3A CN201880001162A CN108713313B CN 108713313 B CN108713313 B CN 108713313B CN 201880001162 A CN201880001162 A CN 201880001162A CN 108713313 B CN108713313 B CN 108713313B
Authority
CN
China
Prior art keywords
detection result
multimedia content
information
user terminal
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880001162.3A
Other languages
English (en)
Other versions
CN108713313A (zh
Inventor
胡月鹏
孙超男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Publication of CN108713313A publication Critical patent/CN108713313A/zh
Application granted granted Critical
Publication of CN108713313B publication Critical patent/CN108713313B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/131Protocols for games, networked simulations or virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请实施例提供了一种多媒体数据处理方法、装置和设备/终端/服务器,其中,多媒体数据处理方法包括:第一用户终端获取第二用户终端分享的多媒体内容;对所述多媒体内容进行目标检测,获得目标检测结果,其中,所述目标检测包括对所述多媒体内容进行模板信息检测;根据所述目标检测结果和所述第一用户终端采集的图像,生成增强现实AR对象,并展示所述AR对象。通过本申请实施例,可以有效进行用户间交互,提升交互效果。

Description

多媒体数据处理方法、装置和设备/终端/服务器
技术领域
本申请实施例涉及互联网技术领域,尤其涉及一种多媒体数据处理方法、装置和设备/终端/服务器。
背景技术
随着互联网技术的发展,多媒体内容的分享成为了扩展社交的主要工具之一,用户通过视频分享等多媒体内容分享手段与其他用户建立交流,从而实现基于内容的社交。目前的多媒体内容分享主要通过即时聊天工具等社交软件实现,但是目前多媒体内容的分享主要通过多媒体内容的播放观看以及评价讨论来实现,用户之间无法通过多媒体内容本身实现信息交互。
因此,如何通过对多媒体内容本身的处理实现用户间的有效交互,成为现有技术中亟待解决的技术问题。
发明内容
本申请实施例提供了一种多媒体数据处理方法、装置和设备/终端/服务器,以解决上述现有技术中的问题。
根据本申请实施例的一个方面,提供了一种多媒体数据处理方法,包括:第一用户终端获取第二用户终端分享的多媒体内容;对所述多媒体内容进行目标检测,获得目标检测结果,其中,所述目标检测包括对所述多媒体内容进行模板信息检测;根据所述目标检测结果和所述第一用户终端采集的图像,生成AR(Augmented Reality,增强现实)对象,并展示所述AR对象。
根据本申请实施例的另一个方面,还提供了一种多媒体数据处理装置,设置于第一用户终端,所述装置包括:获取模块,配置为获取第二用户终端分享的多媒体内容;检测模块,配置为对所述多媒体内容进行目标检测,获得目标检测结果,其中,所述目标检测包括对所述多媒体内容进行模板信息检测;生成模块,配置为根据所述目标检测结果和所述第一用户终端采集的图像,生成AR对象,并展示所述AR对象。
根据本申请实施例的又一个方面,还提供了一种设备/终端/服务器,包括:一个或多个处理器;存储装置,配置为存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的多媒体数据处理方法。
根据本申请实施例的再一个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的多媒体数据处理方法。
根据本申请实施例提供的技术方案,第一用户终端通过对多媒体内容进行包括模板信息检测在内的目标检测,获得相应的目标检测结果(包括多媒体内容的模板信息),进而,以第一用户终端采集的图像和目标检测结果为依据,生成相应的AR对象。其中,模板信息可以表征第二用户终端生成所述多媒体内容时使用的多媒体模板的信息,通过模板信息可以了解第二用户终端的用户想通过所述多媒体内容分享的诸如表情、心情、场景等等特征信息,以便第一用户终端的用户生成与分享的多媒体内容风格类似或匹配的AR对象,具有更好的表达效果,通过该AR对象可以进行用户间交互,提升交互效果。
附图说明
图1是根据本申请实施例一的一种多媒体数据处理方法的步骤流程图;
图2是根据本申请实施例二的一种多媒体数据处理方法的步骤流程图;
图3是图2所示实施例中的一种多媒体数据处理的结果示意图;
图4是图2所示实施例中的另一种多媒体数据处理的结果示意图;
图5是根据本申请实施例三的一种多媒体数据处理装置的结构框图;
图6是根据本申请实施例四的一种多媒体数据处理装置的结构框图;
图7是根据本申请实施例五的一种设备/终端/服务器的结构示意图。
具体实施方式
下面结合附图(若干附图中相同的标号表示相同的元素)和实施例,对本申请实施例的具体实施方式作进一步详细说明。以下实施例用于说明本申请,但不用来限制本申请的范围。
本领域技术人员可以理解,本申请实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
实施例一
参照图1,示出了根据本申请实施例一的一种多媒体数据处理方法的步骤流程图。
本实施例的多媒体数据处理方法包括以下步骤:
步骤S102:第一用户终端获取第二用户终端分享的多媒体内容。
本申请实施例中,主要针对通过相应的模板信息生成的多媒体内容进行处理。也即,第二用户终端分享的多媒体内容通过模板信息生成。
其中,多媒体内容包括但不限于:图像、音频、视频、文字、AR、特效等内容。
模板信息用于提供具有一定规则的拍摄模板的信息,以供生成具有相应主题或风格或模式的多媒体内容,如,各种魔法表情模板、各种场景或剧情模板,等等。模板信息除具有一定规则外,可选地,还可以包括设定的文字、图像、音频、视频中的至少一种。
步骤S104:第一用户终端对多媒体内容进行目标检测,获得目标检测结果。
其中,所述目标检测包括对多媒体内容进行模板信息检测,以获得多媒体内容使用的模板信息。进一步地,通过模板信息可以了解分享者想要分享的特征信息,如表情、心情、场景等等。
步骤S106:第一用户终端根据目标检测结果和第一用户终端采集的图像,生成AR对象,并展示所述AR对象。
在获得了多媒体内容使用的模板信息后,第一用户终端的用户可以通过第一用户终端的图像采集设备采集相应的图像包括但不限于用户图像,以与分享的多媒体内容匹配生成AR对象并进行展示。
例如,若目标检测结果指示多媒体内容使用了大笑魔法表情模板,则可以将该多媒体内容与第一用户终端当前所处的某一搞笑场景相结合,生成相应的AR对象;或者,采集第一用户终端的用户的面部图像,将该面部图像替换原多媒体内容中的面部图像,结合大笑魔法表情模板生成第一用户终端的用户的大笑魔法表情;或者,采集第一用户终端的用户的面部图像,结合大笑魔法表情模板生成第一用户终端的用户的大笑魔法表情,将第一用户终端的用户的大笑魔法表情与第二用户终端分享的大笑魔法表情组合,形成AR对象,等等。
通过本实施例,第一用户终端通过对多媒体内容进行包括模板信息检测在内的目标检测,获得相应的目标检测结果(包括多媒体内容的模板信息),进而,以第一用户终端采集的图像和目标检测结果为依据,生成相应的AR对象。其中,模板信息可以表征第二用户终端生成所述多媒体内容时使用的多媒体模板的信息,通过模板信息可以了解第二用户终端的用户想通过所述多媒体内容分享的诸如表情、心情、场景等等特征信息,以便第一用户终端的用户生成与分享的多媒体内容风格类似或匹配的AR对象,具有更好的表达效果,通过该AR对象可以进行用户间交互,提升交互效果。
本实施例的多媒体数据处理方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:各种终端设备或者服务器,如,PC机、平板电脑、移动终端等。
实施例二
参照图2,示出了根据本申请实施例二的一种多媒体数据处理方法的步骤流程图。
本实施例的多媒体数据处理方法包括以下步骤:
步骤S202:第一用户终端获取第二用户终端分享的多媒体内容。
如前所述,本申请实施例中,主要针对通过相应的模板信息生成的多媒体内容进行处理。也即,第二用户终端分享的多媒体内容通过如实施例一中所述的模板信息生成。
其中,多媒体内容包括但不限于:图像、音频、视频、文字、AR、特效等内容。该多媒体内容可以是第二用户终端的用户拍摄的多媒体内容,也可以是该用户通过互联网下载或者本地保存的多媒体内容。
第二用户终端分享的多媒体内容可能是针对第一用户终端的,也可以是针对一个特定范围或非特定范围的用户终端的。
步骤S204:第一用户终端对多媒体内容进行目标检测,获得目标检测结果。
其中,所述目标检测包括对多媒体内容进行模板信息检测。如前所述,模板信息用于提供具有一定规则的拍摄模板的信息,以供生成具有相应主题或风格或模式的多媒体内容。
在一种可行方式中,可以根据第二用户终端分享所述多媒体内容时所采用的传输协议,对所述多媒体内容进行模板信息检测,获得检测结果。将多媒体内容的模板信息携带在传输协议中,多媒体内容的接收方无需安装生成所述多媒体内容的应用软件即可获取相应的模板信息,进而生成与接收的多媒体内容对应或匹配的本地多媒体内容,在减轻多媒体内容接收方操作负担的同时,也实现了用户之间有效的信息交互。
其中,可以携带模板信息的传输协议可以是任意适当的协议,包括但不限于HTTP协议。例如,多媒体内容发送方将多媒体模板信息进行编码,如,分别对“魔法表情:A”,“美颜:开”、“音乐:X”进行编码,并将这些编码信息携带在HTTP协议中,多媒体内容接收方通过对该传输协议的解析,获取其中的编码信息,进而,依据该编码信息从相应服务器中获得对应的模板信息,然后,即可根据该模板信息进行相应的操作。其中,具体的编码规则和方式可以由本领域技术人员根据实际情况和使用的传输协议的需求,采用任意适当方式实现,本申请实施例对此不作限制。
可选地,根据第二用户终端分享多媒体内容时所采用的传输协议,对多媒体内容进行模板信息检测,获得检测结果可以包括:解析第二用户终端分享多媒体内容时所采用的传输协议,获得多媒体内容拍摄的特征信息与编辑信息;根据所述特征信息与所述编辑信息,获得多媒体内容的模板信息。
其中,特征信息表征了多媒体内容的模板的特征,可选地,所述特征信息可以包括:表情信息、动作信息、剧本信息、声音信息、色彩信息、场景信息中的至少一种。例如,所述表情信息包括用户拍摄和/或编辑魔法表情的应用软件和/或表情内容;所述动作信息包括用户拍摄和/或编辑魔法动作的应用软件和/或动作内容;所述剧本信息包括用户拍摄和/或编辑视频的应用软件和/或剧情内容;所述声音信息包括用户录制和/或编辑音频的应用软件和/或声音内容;所述色彩信息包括用户拍摄和/或编辑视频的应用软件和/或色彩内容;所述场景信息包括用户拍摄和/或编辑视频的应用软件和/或场景内容。
编辑信息表征了使用多媒体内容的模板进行多媒体内容编辑的信息,可选地,所述编辑信息可以包括:生成所述多媒体内容的应用程序信息。例如,所述编辑信息可以包括所述多媒体内容的拍摄应用程序和/或编辑应用程序;可选地,所述编辑信息还可以包括所述多媒体内容的拍摄应用程序和/或编辑应用程序以外其他可以实现同样拍摄和/或编辑的类似应用程序;进一步可选地,所述编辑信息还可以包括所述多媒体内容的拍摄和/或编辑手段。例如,曝光时长、光圈选择、色彩调教、人物空间分配、拍摄角度、光线选择、人物动作等。
通过上述特征信息和编辑信息,即可获取多媒体内容的模板信息。多媒体内容接收方可以根据获得的所述模板信息进行本地的多媒体内容生成操作,也可以根据获得的所述模板信息对接收的或待生成多媒体内容的元素进行编辑处理,也可以根据获得的所述模板信息先对待生成多媒体内容的元素进行拍摄后再根据获得的所述模板信息对这些元素进行相应的编辑处理,还可以先对模板信息进行编辑处理后进行本地的多媒体内容生成操作,还可以先对模板信息进行编辑处理,再对待生成多媒体内容的元素进行编辑处理,然后再进行本地的多媒体内容生成操作。无需多媒体内容接收方用户下载和/或安装相应的多媒体内容生成程序或应用,减轻了用户负担,提高了多媒体内容分享、交互和生成效率。
例如,多媒体内容接收方通过解析所述传输协议,获得魔法表情视频对应的模板信息,例如包括魔法表情视频所采用的拍摄应用程序以及拍摄手段和表情内容的信息。多媒体内容接收方无需安装拍摄和/或编辑应用程序,即可根据所述模板信息登录服务器来通过所述拍摄应用程序,利用所述拍摄手段拍摄同样的一段魔法表情视频,进一步地,还可以将拍摄的所述魔法表情视频分享至其它用户。当然其它用户也可以选择将所述魔法表情拍摄和/或编辑应用程序下载至本地实现魔法表情视频的拍摄和/或编辑。
再例如,多媒体内容接收方通过解析所述传输协议,获得剧情视频对应的模板信息,例如包括所述剧情视频所采用的拍摄应用程序以及拍摄手段和剧本内容。多媒体内容接收方无需安装拍摄和/或编辑应用程序,即可根据所述模板信息登录服务器来通过所述拍摄应用程序,利用所述拍摄手段按照所述剧本拍摄同样的一段视频,进一步地,还可以将拍摄的所述视频分享至其它用户。当然其它用户也可以选择将所述拍摄和/或编辑应用程序下载至本地实现视频的拍摄和/或编辑。
此外,可选地,除对多媒体内容进行模板信息检测之外,目标检测还可以包括:对所述多媒体内容进行目标对象的检测。其中,目标对象可以由本领域技术人员根据实际需求适当设定,如,进行人体整体或面部或表情或动作等的检测、进行动物检测、进行场景或背景检测等等,本申请实施例对此不作限制。
步骤S206:第一用户终端根据所述目标检测结果和第一用户终端采集的图像,生成AR对象。
在获得了相应的目标检测结果后,即可根据所述目标检测结果和第一用户终端采集的图像,生成AR对象。
在第一种可行方式中,可以将目标检测结果中对模板信息的检测结果作为第一检测结果,对目标对象的检测结果作为第二检测结果;对第一用户终端采集的图像进行所述目标对象(与多媒体内容的目标对象相同,如均为人体或均为面部或均为表情或动作等)的检测,获得第三检测结果;使用所述第三检测结果替换所述第二检测结果,并根据替换后的第二检测结果和所述第一检测结果,生成AR对象。此种方式可以生成与分享的多媒体内容风格较为接近的新的多媒体内容,提升了分享多媒体内容的趣味性。
在第二种可行方式中,可以将目标检测结果中对模板信息的检测结果作为第四检测结果;对第一用户终端采集的图像进行目标对象的检测,获得第五检测结果;根据第四检测结果和第五检测结果,生成AR对象。此种方式中,可以不对多媒体内容进行目标对象检测,根据模板信息对第一用户终端采集的图像进行相匹配的目标对象检测;当然,也可以仍对多媒体内容进行目标对象检测,并对第一用户终端采集的图像进行相同的目标对象检测。通过对第一用户终端采集的图像进行目标对象检测,可以更有效地匹配模板信息,提升用户间的交互效果。当然,在某些情况下,也可以不对第一用户终端采集的图像进行目标对象检测。此种方式仅需检测多媒体内容的模板信息,减轻了多媒体内容接收方的检测负担,提高了多媒体内容分享效率以及AR对象的生成效率。
在第三种可行方式中,可以将目标检测结果中对模板信息的检测结果作为第六检测结果;对第一用户终端采集的图像进行目标对象的检测,获得第七检测结果;根据第六检测结果和第七检测结果,生成第一AR对象;根据第一AR对象和所述多媒体内容,生成第二AR对象。与前种方式类似,此种方式中,对或不对多媒体内容进行目标对象检测均可。与前种方式不同的是,此种方式中,将本地生成的第一AR对象与分享的多媒体内容相结合,生成内容更为丰富的第二AR对象,进一步提升了用户间的交互效果。
在第四种可行方式中,可以将目标检测结果中对模板信息的检测结果作为第八检测结果;接收对第八检测结果的修改请求,其中,所述修改请求中包含有修改参数;根据修改请求对第八检测结果进行修改,获得修改结果;对第一用户终端采集的图像进行目标对象的检测,获得第九检测结果;根据所述修改结果和第九检测结果,生成AR对象。例如,可以通过相应的界面提供对模板信息中的内容如某个或某些特征信息进行修改,形成新的特征信息;进而,以修改后的模板信息为依据,根据对采集的图像的目标对象的检测结果,生成AR对象。通过这种方式,增强了多媒体内容生成的趣味性和交互性。
基于上述描述,采用第一种可行方式时,一种多媒体数据处理的结果示意图如图3所示。图3中左侧图像为第二用户终端分享的多媒体内容,对其进行目标对象检测获取到相应的第一人体信息,对其进行模板信息检测获取到相应的模板信息。进而,对第一用户终端采集的图像进行人体检测,获取到图像中的第二人体信息。然后,使用第二人体信息替换第一人体信息,结合模板信息生成新的多媒体内容,如图3中右侧图像所示。
采用第二种可行方式时,多媒体数据处理的结果与图3所示相同。但在该种方式中,仅对第一用户终端采集的图像进行了人体检测,进而使用第二人体信息与模板信息相结合,生成如图3中右侧所示的多媒体内容。
采用第三种可行方式时,一种多媒体数据处理的结果示意图如图4所示。图4中左侧图像为第二用户终端分享的多媒体内容,对其进行模板信息检测获取到相应的模板信息。然后,对第一用户终端采集的图像进行人体检测,获取到图像中的人体信息。接着,使用图像中的人体信息结合模板信息生成新的图像(如图4中右侧图像的左半部分所示)。再接着,将新生成的图像与第二用户终端分享的图像相结合,生成最终的图像(如图4中右侧完整图像所示)。
但不限于上述描述的方式,在实际应用中,本领域技术人员还可以根据实际需求,采用其它适当的根据模板信息和目标对象检测结果生成AR对象的方式。此外,在某些方式中,也可以只对多媒体内容进行模板信息检测,并直接与第一用户终端采集的图像相结合,既不必对多媒体内容进行目标对象检测,也不必对第一用户终端采集的图像进行目标对象检测,以提高AR对象生成效率。但通过目标对象检测,可以使得目标对象更好地与模板信息相结合,生成的AR对象的效果和交互性都更好。
步骤S208:第一用户终端展示生成的所述AR对象。
生成的AR对象既可以在本地展示,也可以分享到特定或非特定范围,以进一步提升用户间的交互效果。
通过本实施例,第一用户终端通过对多媒体内容进行包括模板信息检测在内的目标检测,获得相应的目标检测结果(包括多媒体内容的模板信息),进而,以第一用户终端采集的图像和目标检测结果为依据,生成相应的AR对象。其中,模板信息可以表征第二用户终端生成所述多媒体内容时使用的多媒体模板的信息,通过模板信息可以了解第二用户终端的用户想通过所述多媒体内容分享的诸如表情、心情、场景等等特征信息,以便第一用户终端的用户拍摄更为恰当或匹配的图像,以便第一用户终端的用户生成与分享的多媒体内容风格类似或匹配的AR对象,具有更好的表达效果,通过该AR对象可以进行用户间交互,提升交互效果。
本实施例的多媒体数据处理方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:各种终端设备或者服务器,如,PC机、平板电脑、移动终端等。
实施例三
参照图5,示出了根据本申请实施例三的一种多媒体数据处理装置的结构框图。
本实施例的多媒体数据处理装置设置于第一用户终端,该装置包括:获取模块302,配置为获取第二用户终端分享的多媒体内容;检测模块304,配置为对多媒体内容进行目标检测,获得目标检测结果,其中,所述目标检测包括对多媒体内容进行模板信息检测;生成模块306,配置为根据所述目标检测结果和第一用户终端采集的图像,生成AR对象,并展示所述AR对象。
本实施例的多媒体数据处理装置用于实现前述多个方法实施例中相应的多媒体数据处理方法,并具有相应方法实施例的有益效果,在此不再赘述。
实施例四
参照图6,示出了根据本申请实施例四的一种多媒体数据处理装置的结构框图。
本实施例的多媒体数据处理装置设置于第一用户终端,该装置包括:获取模块402,配置为获取第二用户终端分享的多媒体内容;检测模块404,配置为对多媒体内容进行目标检测,获得目标检测结果,其中,所述目标检测包括对多媒体内容进行模板信息检测;生成模块406,配置为根据所述目标检测结果和第一用户终端采集的图像,生成AR对象,并展示所述AR对象。
可选地,所述目标检测还包括:对多媒体内容进行目标对象的检测。
可选地,生成模块406包括:第一生成模块4062,配置为将所述目标检测结果中对模板信息的检测结果作为第一检测结果,对目标对象的检测结果作为第二检测结果;对第一用户终端采集的图像进行所述目标对象的检测,获得第三检测结果;使用第三检测结果替换第二检测结果,并根据替换后的第二检测结果和第一检测结果,生成AR对象;展示所述AR对象。
可选地,生成模块406包括:第二生成模块4064,配置为将所述目标检测结果中对模板信息的检测结果作为第四检测结果;对第一用户终端采集的图像进行目标对象的检测,获得第五检测结果;根据第四检测结果和第五检测结果,生成AR对象;或者,第三生成模块4066,配置为将所述目标检测结果中对模板信息的检测结果作为第六检测结果;对第一用户终端采集的图像进行目标对象的检测,获得第七检测结果;根据第六检测结果和第七检测结果,生成第一AR对象;根据第一AR对象和所述多媒体内容,生成第二AR对象;或者,第四生成模块4068,配置为将目标检测结果中对模板信息的检测结果作为第八检测结果;接收对第八检测结果的修改请求,其中,所述修改请求中包含有修改参数;根据所述修改请求对所述第八检测结果进行修改,获得修改结果;对第一用户终端采集的图像进行目标对象的检测,获得第九检测结果;根据所述修改结果和第九检测结果,生成AR对象。
可选地,检测模块402配置为根据所述第二用户终端分享所述多媒体内容时所采用的传输协议,对所述多媒体内容进行模板信息检测,获得检测结果。
可选地,检测模块402配置为解析第二用户终端分享所述多媒体内容时所采用的传输协议,获得所述多媒体内容拍摄的特征信息与编辑信息;根据所述特征信息与所述编辑信息,获得所述多媒体内容的模板信息。
可选地,所述特征信息包括:表情信息、动作信息、剧本信息、声音信息、色彩信息、场景信息中至少其一。
可选地,所述编辑信息包括:生成所述多媒体内容的应用程序信息。
本实施例的多媒体数据处理装置用于实现前述多个方法实施例中相应的多媒体数据处理方法,并具有相应方法实施例的有益效果,在此不再赘述。
实施例五
参照图7,示出了根据本申请实施例五的一种设备/终端/服务器的结构示意图,本申请具体实施例并不对设备/终端/服务器的具体实现做限定。
如图7所示,该设备/终端/服务器可以包括:处理器(processor)502、存储装置(memory)504。
存储装置处理器502,配置为执行程序506,具体可以执行上述多媒体数据处理方法实施例中的相关步骤。
具体地,程序506可以包括程序代码,该程序代码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。设备/终端/服务器包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储装置504,配置为存放一个或多个程序506。存储装置504可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序506具体可以用于使得处理器502执行以下操作:第一用户终端获取第二用户终端分享的多媒体内容;对所述多媒体内容进行目标检测,获得目标检测结果,其中,所述目标检测包括对所述多媒体内容进行模板信息检测;根据所述目标检测结果和所述第一用户终端采集的图像,生成AR对象,并展示所述AR对象。
在一种可选的实施方式中,所述目标检测还包括:对所述多媒体内容进行目标对象的检测。
在一种可选的实施方式中,程序506还用于使得处理器502在根据所述目标检测结果和所述第一用户终端采集的图像,生成增强现实AR对象时,将所述目标检测结果中对模板信息的检测结果作为第一检测结果,对目标对象的检测结果作为第二检测结果;对所述第一用户终端采集的图像进行所述目标对象的检测,获得第三检测结果;使用所述第三检测结果替换所述第二检测结果,并根据替换后的第二检测结果和所述第一检测结果,生成AR对象。
在一种可选的实施方式中,程序506还用于使得处理器502在根据所述目标检测结果和所述第一用户终端采集的图像,生成增强现实AR对象时,将所述目标检测结果中对模板信息的检测结果作为第四检测结果;对所述第一用户终端采集的图像进行目标对象的检测,获得第五检测结果;根据所述第四检测结果和所述第五检测结果,生成AR对象;或者,将所述目标检测结果中对模板信息的检测结果作为第六检测结果;对所述第一用户终端采集的图像进行目标对象的检测,获得第七检测结果;根据所述第六检测结果和所述第七检测结果,生成第一AR对象;根据所述第一AR对象和所述多媒体内容,生成第二AR对象;或者,将所述目标检测结果中对模板信息的检测结果作为第八检测结果;接收对所述第八检测结果的修改请求,其中,所述修改请求中包含有修改参数;根据所述修改请求对所述第八检测结果进行修改,获得修改结果;对所述第一用户终端采集的图像进行目标对象的检测,获得第九检测结果;根据所述修改结果和所述第九检测结果,生成AR对象。
在一种可选的实施方式中,程序506还用于使得处理器502在对所述多媒体内容进行目标检测,获得目标检测结果时,根据所述第二用户终端分享所述多媒体内容时所采用的传输协议,对所述多媒体内容进行模板信息检测,获得检测结果。
在一种可选的实施方式中,程序506还用于使得处理器502在根据所述第二用户终端分享所述多媒体内容时所采用的传输协议,对所述多媒体内容进行模板信息检测,获得检测结果时,解析所述第二用户终端分享所述多媒体内容时所采用的传输协议,获得所述多媒体内容拍摄的特征信息与编辑信息;根据所述特征信息与所述编辑信息,获得所述多媒体内容的模板信息。
在一种可选的实施方式中,所述特征信息包括:表情信息、动作信息、剧本信息、声音信息、色彩信息、场景信息中至少其一。
在一种可选的实施方式中,所述编辑信息包括:生成所述多媒体内容的应用程序信息。
程序506中各步骤的具体实现可以参见上述多媒体数据处理方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
通过本实施例的设备/终端/服务器,第一用户终端通过对多媒体内容进行包括模板信息检测在内的目标检测,获得相应的目标检测结果(包括多媒体内容的模板信息),进而,以第一用户终端采集的图像和目标检测结果为依据,生成相应的AR对象。其中,模板信息可以表征第二用户终端生成所述多媒体内容时使用的多媒体模板的信息,通过模板信息可以了解第二用户终端的用户想通过所述多媒体内容分享的诸如表情、心情、场景等等特征信息,以便第一用户终端的用户生成与分享的多媒体内容风格类似或匹配的AR对象,具有更好的表达效果,通过该AR对象可以进行用户间交互,提升交互效果。
需要指出,根据实施的需要,可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本申请实施例的目的。特别地,根据本申请实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行上文多个方法实施例中所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)执行时,执行本申请实施例示出的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是,但不限于,电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储装置(RAM)、只读存储装置(ROM)、可擦式可编程只读存储装置(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储装置(CD-ROM)、光存储装置件、磁存储装置件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言------诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言------诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络------包括局域网(LAN)或广域网(WAN)------连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、检测单元、和生成单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取第二用户终端分离的多媒体内容的单元”。
作为另一方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一实施例所描述的方法。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取第二用户终端分享的多媒体内容;对所述多媒体内容进行目标检测,获得目标检测结果,其中,所述目标检测包括对所述多媒体内容进行模板信息检测;根据所述目标检测结果和所述第一用户终端采集的图像,生成增强现实AR对象,并展示所述AR对象。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (16)

1.一种多媒体数据处理方法,其特征在于,包括:
第一用户终端获取第二用户终端分享的多媒体内容;
对所述多媒体内容进行目标检测,获得目标检测结果,其中,所述目标检测包括对所述多媒体内容进行模板信息检测和对所述多媒体内容进行目标对象的检测,所述模板信息表征第二用户终端生成所述多媒体内容时使用的多媒体模板的信息;
根据所述目标检测结果和所述第一用户终端采集的图像,生成增强现实AR对象,并展示所述AR对象。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标检测结果和所述第一用户终端采集的图像,生成增强现实AR对象,包括:
将所述目标检测结果中对模板信息的检测结果作为第一检测结果,对目标对象的检测结果作为第二检测结果;对所述第一用户终端采集的图像进行所述目标对象的检测,获得第三检测结果;使用所述第三检测结果替换所述第二检测结果,并根据替换后的第二检测结果和所述第一检测结果,生成AR对象。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标检测结果和所述第一用户终端采集的图像,生成增强现实AR对象,包括:
将所述目标检测结果中对模板信息的检测结果作为第四检测结果;对所述第一用户终端采集的图像进行目标对象的检测,获得第五检测结果;根据所述第四检测结果和所述第五检测结果,生成AR对象;
或者,
将所述目标检测结果中对模板信息的检测结果作为第六检测结果;对所述第一用户终端采集的图像进行目标对象的检测,获得第七检测结果;根据所述第六检测结果和所述第七检测结果,生成第一AR对象;根据所述第一AR对象和所述多媒体内容,生成第二AR对象;
或者,
将所述目标检测结果中对模板信息的检测结果作为第八检测结果;接收对所述第八检测结果的修改请求,其中,所述修改请求中包含有修改参数;根据所述修改请求对所述第八检测结果进行修改,获得修改结果;对所述第一用户终端采集的图像进行目标对象的检测,获得第九检测结果;根据所述修改结果和所述第九检测结果,生成AR对象。
4.根据权利要求1-2任一项所述的方法,其特征在于,所述对所述多媒体内容进行目标检测,获得目标检测结果,包括:
根据所述第二用户终端分享所述多媒体内容时所采用的传输协议,对所述多媒体内容进行模板信息检测,获得检测结果。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第二用户终端分享所述多媒体内容时所采用的传输协议,对所述多媒体内容进行模板信息检测,获得检测结果,包括:
解析所述第二用户终端分享所述多媒体内容时所采用的传输协议,获得所述多媒体内容拍摄的特征信息与编辑信息;
根据所述特征信息与所述编辑信息,获得所述多媒体内容的模板信息。
6.根据权利要求5所述的方法,其特征在于,所述特征信息包括:表情信息、动作信息、剧本信息、声音信息、色彩信息、场景信息中至少其一。
7.根据权利要求5所述的方法,其特征在于,所述编辑信息包括:生成所述多媒体内容的应用程序信息。
8.一种多媒体数据处理装置,设置于第一用户终端,其特征在于,所述装置包括:
获取模块,配置为获取第二用户终端分享的多媒体内容;
检测模块,配置为对所述多媒体内容进行目标检测,获得目标检测结果,其中,所述目标检测包括对所述多媒体内容进行模板信息检测和对所述多媒体内容进行目标对象的检测,所述模板信息表征第二用户终端生成所述多媒体内容时使用的多媒体模板的信息;
生成模块,配置为根据所述目标检测结果和所述第一用户终端采集的图像,生成增强现实AR对象,并展示所述AR对象。
9.根据权利要求8所述的装置,其特征在于,所述生成模块包括:
第一生成模块,配置为将所述目标检测结果中对模板信息的检测结果作为第一检测结果,对目标对象的检测结果作为第二检测结果;对所述第一用户终端采集的图像进行所述目标对象的检测,获得第三检测结果;使用所述第三检测结果替换所述第二检测结果,并根据替换后的第二检测结果和所述第一检测结果,生成AR对象;展示所述AR对象。
10.根据权利要求8或者9所述的装置,其特征在于,所述生成模块包括:
第二生成模块,配置为将所述目标检测结果中对模板信息的检测结果作为第四检测结果;对所述第一用户终端采集的图像进行目标对象的检测,获得第五检测结果;根据所述第四检测结果和所述第五检测结果,生成AR对象;
或者,
第三生成模块,配置为将所述目标检测结果中对模板信息的检测结果作为第六检测结果;对所述第一用户终端采集的图像进行目标对象的检测,获得第七检测结果;根据所述第六检测结果和所述第七检测结果,生成第一AR对象;根据所述第一AR对象和所述多媒体内容,生成第二AR对象;
或者,
第四生成模块,配置为将所述目标检测结果中对模板信息的检测结果作为第八检测结果;接收对所述第八检测结果的修改请求,其中,所述修改请求中包含有修改参数;根据所述修改请求对所述第八检测结果进行修改,获得修改结果;对所述第一用户终端采集的图像进行目标对象的检测,获得第九检测结果;根据所述修改结果和所述第九检测结果,生成AR对象。
11.根据权利要求8-9任一项所述的装置,其特征在于,所述检测模块,配置为根据所述第二用户终端分享所述多媒体内容时所采用的传输协议,对所述多媒体内容进行模板信息检测,获得检测结果。
12.根据权利要求11所述的装置,其特征在于,所述检测模块,配置为解析所述第二用户终端分享所述多媒体内容时所采用的传输协议,获得所述多媒体内容拍摄的特征信息与编辑信息;根据所述特征信息与所述编辑信息,获得所述多媒体内容的模板信息。
13.根据权利要求12所述的装置,其特征在于,所述特征信息包括:表情信息、动作信息、剧本信息、声音信息、色彩信息、场景信息中至少其一。
14.根据权利要求12所述的装置,其特征在于,所述编辑信息包括:生成所述多媒体内容的应用程序信息。
15.一种设备/终端/服务器,包括:
一个或多个处理器;
存储装置,配置为存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
16.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN201880001162.3A 2018-05-31 2018-05-31 多媒体数据处理方法、装置和设备/终端/服务器 Active CN108713313B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2018/089357 WO2019227426A1 (zh) 2018-05-31 2018-05-31 多媒体数据处理方法、装置和设备/终端/服务器

Publications (2)

Publication Number Publication Date
CN108713313A CN108713313A (zh) 2018-10-26
CN108713313B true CN108713313B (zh) 2021-10-15

Family

ID=63873590

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880001162.3A Active CN108713313B (zh) 2018-05-31 2018-05-31 多媒体数据处理方法、装置和设备/终端/服务器

Country Status (4)

Country Link
US (1) US20190371022A1 (zh)
CN (1) CN108713313B (zh)
PH (1) PH12018502031A1 (zh)
WO (1) WO2019227426A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110046313B (zh) * 2019-02-19 2023-09-22 创新先进技术有限公司 信息分享的方法、客户端和服务器
CN112188116B (zh) * 2020-08-29 2021-11-30 上海量明科技发展有限公司 基于对象的视频合成方法、客户端及系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070230794A1 (en) * 2006-04-04 2007-10-04 Logitech Europe S.A. Real-time automatic facial feature replacement
US20100309225A1 (en) * 2009-06-03 2010-12-09 Gray Douglas R Image matching for mobile augmented reality
US20120069028A1 (en) * 2010-09-20 2012-03-22 Yahoo! Inc. Real-time animations of emoticons using facial recognition during a video chat
KR20120099814A (ko) * 2011-01-27 2012-09-12 리얼타임비쥬얼(주) 증강현실 컨텐츠 서비스 시스템과 장치 및 그 방법
US9292758B2 (en) * 2012-05-14 2016-03-22 Sphero, Inc. Augmentation of elements in data content
WO2015026338A1 (en) * 2013-08-21 2015-02-26 Intel Corporation Media content including a perceptual property and/or a contextual property
CN103561382B (zh) * 2013-10-22 2017-08-04 华为终端有限公司 一种移动终端的消息呈现方法及移动终端
CN105353878B (zh) * 2015-11-10 2019-02-01 华勤通讯技术有限公司 现实增强信息处理方法、装置及系统
CN105468142A (zh) * 2015-11-16 2016-04-06 上海璟世数字科技有限公司 基于增强现实技术的互动方法、系统和终端
CN105323252A (zh) * 2015-11-16 2016-02-10 上海璟世数字科技有限公司 基于增强现实技术实现互动的方法、系统和终端
CN105824412A (zh) * 2016-03-09 2016-08-03 北京奇虎科技有限公司 在移动终端上呈现自定义虚拟特效的方法及装置
CN108076128A (zh) * 2016-12-28 2018-05-25 北京市商汤科技开发有限公司 用户属性提取方法、装置和电子设备

Also Published As

Publication number Publication date
US20190371022A1 (en) 2019-12-05
WO2019227426A1 (zh) 2019-12-05
CN108713313A (zh) 2018-10-26
PH12018502031A1 (en) 2019-07-15

Similar Documents

Publication Publication Date Title
CN113411642B (zh) 投屏方法、装置、电子设备和存储介质
WO2019227429A1 (zh) 多媒体内容生成方法、装置和设备/终端/服务器
CN111800668B (zh) 弹幕的处理方法、装置、设备及存储介质
CN114331820A (zh) 图像处理方法、装置、电子设备及存储介质
US20190199763A1 (en) Systems and methods for previewing content
CN113542902B (zh) 一种视频处理方法、装置、电子设备和存储介质
JP2023528958A (ja) ビデオ複合撮影方法、装置、電子機器及びコンピュータ可読媒体
CN112153422B (zh) 视频融合方法和设备
CN108713313B (zh) 多媒体数据处理方法、装置和设备/终端/服务器
CN108124170A (zh) 一种视频播放方法、装置和终端设备
US11893770B2 (en) Method for converting a picture into a video, device, and storage medium
CN113589982A (zh) 一种资源播放方法、装置、电子设备和存储介质
KR101915792B1 (ko) 얼굴인식을 이용한 광고 삽입 시스템 및 방법
US10631022B2 (en) Method to insert ad content into a video scene
WO2021057644A1 (zh) 拍摄方法和装置
CN113473165A (zh) 直播控制系统、直播控制方法、装置、介质与设备
CN113542909A (zh) 视频处理方法、装置、电子设备及计算机存储介质
CN111541905A (zh) 一种直播方法、装置、计算机设备和存储介质
US20220070501A1 (en) Social video platform for generating and experiencing content
CN116847147A (zh) 特效视频确定方法、装置、电子设备及存储介质
US10282633B2 (en) Cross-asset media analysis and processing
CN114666622A (zh) 特效视频确定方法、装置、电子设备及存储介质
CN114466145A (zh) 视频处理方法、装置、设备和存储介质
CN114500879A (zh) 视频数据处理方法、装置、设备及存储介质
CN114143429A (zh) 图像拍摄方法、装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200515

Address after: 310051 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 10, galley quay, 10-01, offshore financial center, Singapore

Applicant before: YOUSHI TECHNOLOGY SINGAPORE Co.,Ltd.

Applicant before: UC MOBILE Ltd.

GR01 Patent grant
GR01 Patent grant