CN111191054A - 媒体数据的推荐方法、装置 - Google Patents

媒体数据的推荐方法、装置 Download PDF

Info

Publication number
CN111191054A
CN111191054A CN201911308680.2A CN201911308680A CN111191054A CN 111191054 A CN111191054 A CN 111191054A CN 201911308680 A CN201911308680 A CN 201911308680A CN 111191054 A CN111191054 A CN 111191054A
Authority
CN
China
Prior art keywords
recommended
media data
image
training
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911308680.2A
Other languages
English (en)
Other versions
CN111191054B (zh
Inventor
刘刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911308680.2A priority Critical patent/CN111191054B/zh
Publication of CN111191054A publication Critical patent/CN111191054A/zh
Application granted granted Critical
Publication of CN111191054B publication Critical patent/CN111191054B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Image Analysis (AREA)

Abstract

本申请的实施例提供了一种媒体数据的推荐方法、装置。该推荐方法包括:获取待推荐媒体数据,以从所述待推荐媒体数据中确定图像帧集;基于图像评价模型,对所述图像帧集中的图像进行评价,以得到针对所述待推荐媒体数据的目标评价信息,其中,所述图像评价模型由神经网络对图像子评价模型进行融合得到。根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据。本申请实施例的技术方案可以提高对于推荐媒体数据的准确性。

Description

媒体数据的推荐方法、装置
技术领域
本申请涉及计算机及互联网技术领域,具体而言,涉及一种媒体数据的推荐方法、装置。
背景技术
在媒体数据的推荐场景中,比如在给用户推荐包含图片或视频在内的媒体数据的场景,通常是通过直接参考与视觉退化相关的特征(例如图像的模糊度、噪声等特征)或原始未损坏图像或视频的特征来评价图像或视频质量,从而根据评价结果确定推荐包含图片或视频在内的媒体数据。然而,如何提高媒体数据推荐的准确性是亟待解决的技术问题。
发明内容
本申请的实施例提供了一种媒体数据的推荐方法、装置、计算机可读介质及电子设备,进而至少在一定程度上可以提高媒体数据推荐的准确性。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种媒体数据的推荐方法,包括:获取待推荐媒体数据,以从所述待推荐媒体数据中确定图像帧集;基于图像评价模型,对所述图像帧集中的图像进行评价,以得到针对所述待推荐媒体数据的目标评价信息,其中,所述图像评价模型由神经网络对图像子评价模型进行融合得到;根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据。
根据本申请实施例的一个方面,提供了一种媒体数据的推荐装置,包括:获取单元,被用于获取待推荐媒体数据,以从所述待推荐媒体数据中确定图像帧集;评价单元,被用于基于图像评价模型,对所述图像帧集中的图像进行评价,以得到针对所述待推荐媒体数据的目标评价信息,其中,所述图像评价模型由神经网络对图像子评价模型进行融合得到;确定单元,被用于根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据。
在本申请的一些实施例中,基于前述方案,所述待推荐媒体数据为待推荐视频,所述装置还包括确定单元,被用于从所述待推荐媒体数据中确定图像帧集。
在本申请的一些实施例中,基于前述方案,所述确定单元配置为:确定所述待推荐视频中所有帧图像的亮度值,以在所述待推荐视频中的所有帧图像中抽取具有不同亮度值的图像,得到待推荐视频中的图像帧集。
在本申请的一些实施例中,基于前述方案,所述确定单元配置为:在所述待推荐视频中随机抽取复数帧图像,得到待推荐视频中的图像帧集。
在本申请的一些实施例中,基于前述方案,所述确定单元配置为:在所述待推荐视频中等时间间隔的抽取复数帧图像,得到待推荐视频中的图像帧集。
在本申请的一些实施例中,基于前述方案,所述图像帧集中包括复数张图像,所述评价单元配置为:基于图像评价模型,分别对所述图像帧集中的复数张图像进行评价,得到复数个评价信息;对所述复数个评价信息进行数学统计,得到所述目标评价信息。
在本申请的一些实施例中,基于前述方案,所述评价单元配置为:将所述图像帧集中的复数张图像对应的复数个清晰度分数的平均值确定为所述目标评价信息。
在本申请的一些实施例中,基于前述方案,所述评价单元配置为:将所述图像帧集中的复数张图像对应的复数个清晰度分数中的最高清晰度分数确定为所述目标评价信息。
在本申请的一些实施例中,基于前述方案,所述装置还包括训练单元,被用于获取训练图像数据,所述训练图像数据中带有预先建立的训练标签;采用带有训练标签的训练图像数据对预设模型进行训练,得到图像子评价模型。
在本申请的一些实施例中,基于前述方案,所述训练标签包括清晰度标签和语义标签和分类标签,所述训练单元配置为:采用带有清晰度标签和语义标签和分类标签的训练图像数据对预设模型进行训练,得到图像子评价模型。
在本申请的一些实施例中,基于前述方案,所述预设模型包括迁移学习模型、分类模型以及回归模型,所述训练单元配置为:采用带有训练标签的训练图像数据分别对所述迁移学习模型、分类模型以及回归模型进行训练,以得到图像子评价模型。
在本申请的一些实施例中,基于前述方案,所述确定单元配置为:获取用户的行为数据,所述行为数据用于表征用户对于媒体数据的浏览习惯;根据所述目标评价信息,以及所述用户的行为数据,从所述待推荐媒体数据中确定推荐的媒体数据。
在本申请的一些实施例中,基于前述方案,所述训练单元配置为:在根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据之后,获取用户对于所推荐的媒体数据的反馈信息;基于所述用户的反馈信息,训练所述图像评价模型。
根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的媒体数据的推荐方法。
根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的媒体数据的推荐方法。
在本申请的一些实施例所提供的技术方案中,一方面,确定待推荐媒体数据中的图像帧集。另一方面,通过由神经网络融合图像子评价模型而得到的图像评价模型对确定的图像帧集进行评价,得到针对所述待推荐媒体数据的目标评价信息。最后,根据得到的目标评价信息确定推荐的媒体数据。由于确定的图像帧集可以基本反映待推荐媒体数据中图像或视频的质量,而由神经网络融合图像子评价模型而得到的图像评价模型又可以更全面的从整体上对图像进行评价,所以,通过图像评价模型对图像帧集进行评价而得到的目标评价信息能够客观评价待推荐媒体数据的质量,进而提高对媒体数据进行推荐的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图;
图2示出了根据本申请的一个实施例的媒体数据推荐的界面示意图图;
图3示出了根据本申请的一个实施例的媒体数据的推荐方法的流程图;
图4示出了根据本申请的一个实施例的获取针对媒体数据的目标评价信息的细节流程图;
图5示出了根据本申请的一个实施例的训练图像子评价模型的细节流程图;
图6示出了根据本申请的一个实施例的确定推荐的媒体数据的细节流程图;
图7示出了根据本申请的一个实施例的在确定推荐的媒体数据之后的流程图;
图8示出了根据本申请的一个实施例的媒体数据推荐的系统框架图;
图9示出了根据本申请的一个实施例的媒体数据的推荐装置的框图;
图10示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。
如图1所示,系统架构可以包括终端设备(如图1中所示智能手机101、平板电脑102和便携式计算机103中的一种或多种,当然也可以是台式计算机等等)、网络104和服务器105。网络104用以在终端设备和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线通信链路、无线通信链路等等。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
在本申请的一个实施例中,用户可以通过终端设备向服务器105请求获取推荐的媒体数据,服务器105在接收到所述请求之后,获取推荐的媒体数据,然后基于设置在服务器105中的图像评价模型,对从待推荐媒体数据中确定的图像帧集进行评价,从而得到针对待推荐媒体数据的目标评价信息,进而根据所述目标评价信息确定推荐的媒体数据,最后将确定的推荐的媒体数据发送给终端设备。
在本申请的一个实施例中,用户也可以通过终端设备在服务器105中获取待推荐的媒体数据,然后基于设置在终端设备的图像评价模型,对从待推荐媒体数据中确定的图像帧集进行评价,从而得到针对待推荐媒体数据的目标评价信息,并进一步的根据所述目标评价信息确定推荐的媒体数据。
需要说明的是,本申请实施例所提供的媒体数据的推荐方法一般由服务器105执行,相应地,媒体数据的推荐装置一般设置于服务器105中。但是,在本申请的其它实施例中,终端设备也可以与服务器具有相似的功能,从而执行本申请实施例所提供的媒体数据的推荐方案。此外,本申请实施例所提供的媒体数据的推荐方案还可以在其它与服务器具有相似的功能的环境中执行,比如在不同设备中分阶段、分步骤执行,还比如在虚拟服务器中执行等等。
图2示出了根据本申请的一个实施例的媒体数据推荐的界面示意图图。
在本申请的一个实施例中,推荐的媒体数据可以展现在如图2所示的终端界面上。具体的,当用户选择客户端的“推荐”栏目时,客户端或者后台通过执行本申请所公开的媒体数据推荐方法,将推荐的媒体数据展示在界面上。其中,如图2所示,在所述界面上展示的媒体数据可以是含有视频的媒体数据201,也可以是单一的图片集合202,还可以是含有图片的文章或者新闻203。
以下对本申请实施例的技术方案的实现细节进行详细阐述:
根据本公开的第一方面,提供了一种媒体数据的推荐方法。
参见图3,示出了根据本申请的一个实施例的媒体数据的推荐方法的流程图,该媒体数据的推荐方法可以由具有计算处理功能的设备来执行,比如可以由图1中所示的服务器105来执行,或者由终端设备来执行,还或者由多个设备之间的配合执行。如图3所示,该媒体数据的推荐方法至少包括步骤310至步骤350:
步骤310,获取待推荐媒体数据,以从所述待推荐媒体数据中确定图像帧集。
步骤330,基于图像评价模型,对所述图像帧集中的图像进行评价,以得到针对所述待推荐媒体数据的目标评价信息,其中,所述图像评价模型由神经网络对图像子评价模型进行融合得到。
步骤350,根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据。
下面将对如上实施步骤进行详细说明:
在步骤310中,获取待推荐媒体数据,以从所述待推荐媒体数据中确定图像帧集。
在本申请中,获取的待推荐媒体数据的数据类型可以是包含视频或者图片在内的媒体数据。
在本申请的一个实施例中,所述待推荐媒体数据为待推荐视频。进一步的,从所述待推荐媒体数据中确定图像帧集,可以是将所述待推荐视频中的部分帧图像的集合作为确定的图像帧集。
在一个实施例的具体实现中,从所述待推荐媒体数据中确定图像帧集可以首先确定所述待推荐视频中所有帧图像的亮度值,然后在所述待推荐视频中的所有帧图像中抽取具有不同亮度值的图像,以得到待推荐视频中的图像帧集。
在本具体实现中,将视频中具有不同亮度值的图像的集合作为图像帧集,可以使得在对待推荐视频中的图像帧集的图像进行评价时,可以减少因为亮度值不同而带来的对待推荐视频中的图像评价不客观的影响。
在一个实施例的具体实现中,从所述待推荐媒体数据中确定图像帧集也可以在所述待推荐视频中随机抽取复数帧图像,得到待推荐视频中的图像帧集。
在一个实施例的具体实现中,从所述待推荐媒体数据中确定图像帧集还可以在所述待推荐视频中等时间间隔的抽取复数帧图像,得到待推荐视频中的图像帧集。
在本实施例中,将视频数据中的部分帧图像的集合作为确定的图像帧集可以减轻视频抽帧的负担和计算量,减少计算成本。
在本申请的一个实施例中,所述待推荐媒体数据中包括带有图像的文本数据。进一步的,从所述待推荐媒体数据中确定图像帧集,可以是将带有图像的文本数据中的部分图像的集合作为确定的图像帧集。还可以是将带有图像的文本数据中的全部图像的集合作为确定的图像帧集。
在本申请的一个实施例中,所述待推荐媒体数据也可以是完全的图像数据。
继续参照图3,在步骤330,基于图像评价模型,对所述图像帧集中的图像进行评价,以得到针对所述待推荐媒体数据的目标评价信息,其中,所述图像评价模型由神经网络对图像子评价模型进行融合得到。
在本申请的一个实施例中,所述图像帧集中可以包括复数张图像,所述基于图像评价模型,对所述图像帧集中的图像进行评价,以得到针对所述待推荐媒体数据的目标评价信息可以通过如图4所述的步骤实现。
参见图4,示出了根据本申请的一个实施例的获取针对媒体数据的目标评价信息的细节流程图,具体可包括步骤331至332:
步骤331,基于图像评价模型,分别对所述图像帧集中的复数张图像进行评价,得到复数个评价信息。
步骤332,对所述复数个评价信息进行数学统计,得到所述目标评价信息。
在一个实施例的具体实现中,所述评价信息可以包括用于衡量图像清晰度的清晰度分数,对所述复数个评价信息进行数学统计,得到所述目标评价信息可以通过如下任意一种方式实现:
第一种、将所述图像帧集中的复数张图像对应的复数个清晰度分数的平均值确定为所述目标评价信息。
第二种、将所述图像帧集中的复数张图像对应的复数个清晰度分数中的最高清晰度分数确定为所述目标评价信息。
在一个实施例的具体实现中,所述评价信息还可以包括图像的语义信息。
具体的,图像的语义信息可以是指图像是否经过特殊或者专业的处理,比如由特殊拍摄手法而获得的图像,还比如对于背景经过虚化或者具有特别艺术风格的图像。
在本申请中,评价图像语义信息的好处在于,可以将真实模糊的图像和非真实模糊的图像区分开来,进而得到关于图像的真实评价信息。
在一个实施例的具体实现中,所述评价信息还可以包括对图像内容的分类信息。
具体的,图像内容的分类可以是体育类、可以是艺术类,也可以是军事类,还可以是生活类。
在一个实施例的具体实现中,所述评价信息还可以是图像清晰度分数、图像语义信息以及图像内容分类信息的部分组合或者全部组合。
对于本领域技术人员而言,应该理解的是,所述对图像的评价信息还可以包括其它内容,并不限于如上所示出的那些。
在本申请的一个实施例中,所述图像子评价模型可以通过如图5所示的步骤得到。
参见图5,示出了根据本申请的一个实施例的训练图像子评价模型的细节流程图,具体可包括步骤333至334:
步骤333,获取训练图像数据,所述训练图像数据中带有预先建立的训练标签。
步骤333,采用带有训练标签的训练图像数据对预设模型进行训练,得到图像子评价模型。
在一个实施例的具体实现中,所述训练标签包括清晰度标签和语义标签和分类标签。
具体的,所述清晰度标签可以是指图像清晰度的等级,例如,图像清晰度的等级范围为1至10,等级越高,则表示图像越清晰。也可以是指图像清晰度的分数,例如,图像清晰度的分数范围为1至100分,分数越高,则表示图像越清晰。
具体的,所述语义标签可以用于表示图像的语义信息,例如,图像的语义标签可以是“背景虚化”、“马赛克”等等。
具体的,所述分类标签可以用于表示图像内容的分类信息,例如,图像的分类标签可以是“体育”、“美术”以及“美食”等等。
进一步的,对于本领域的技术人员而言,应该理解的是,所述采用带有训练标签的训练图像数据对预设模型进行训练,得到图像子评价模型,可以是采用带有清晰度标签和语义标签和分类标签的训练图像数据对预设模型进行训练,得到图像子评价模型。
在一个实施例的具体实现中,所述训练标签也可以是清晰度标签、语义标签以及分类标签中的一种或者部分组合。
在一个实施例的具体实现中,所述预设模型可以包括迁移学习模型、分类模型以及回归模型。
进一步的,对于本领域的技术人员而言,应该理解的是,所述采用带有训练标签的训练图像数据对预设模型进行训练,得到图像子评价模型,采用带有训练标签的训练图像数据分别对所述迁移学习模型、分类模型以及回归模型进行训练,以得到图像子评价模型。
具体的,所述迁移学习模型可以是Fine-tune CNN模型,其中,F-CNN可以实现多尺度信息和图像浅层及深层信息融合。在本申请中,可以通过标注有清晰度标签的图像数据来训练所述迁移学习模型。具体的,所述需要注意的是,所述清晰度标签可以由人工来进行标注。
具体的,所述分类模型可以是利用高斯分布的标签分发方法来编码图片分数概率分布,以量化真实分数概率分布与预测概率分数分布的差异度,其总体思想是通过每个标签中的描述度来表示实例的标签,这里使用的描述度是高斯标签分布,并采用交叉熵作为损失函数训练。
具体的,所述回归模型可以是在一维输出层后添加Sigmoid函数,使输出规一化为[0,1],进而回归预测归一化到[0,1]的图像质量分数据。
在本申请中,所述图像评价模型由神经网络对图像子评价模型进行融合得到。
具体的,在神经网络的不同层分别拉出3个损失函数,共同反向传播训练,其中,3个损失函数分别对应于迁移学习模型、分类模型以及回归模型。
继续参照图3,在步骤350,根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据。
在本申请的一个实施例中,根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据可以通过如图6所示的步骤实现。
参见图6,示出了根据本申请的一个实施例的确定推荐的媒体数据的细节流程图,具体可包括步骤351至352:
步骤351,获取用户的行为数据,所述行为数据用于表征用户对于媒体数据的浏览习惯。
在本申请中,所述用户的行为数据可以是指用户在历史上对于所阅读内容的分类、媒体数据的质量(媒体数据中图像的清晰度)以及所推荐的媒体数据的阅读速度,阅读时间,加载时间等信息。
步骤352,根据所述目标评价信息,以及所述用户的行为数据,从所述待推荐媒体数据中确定推荐的媒体数据。
在本申请的一个实施例中,在根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据之后,还可以实现如图7所示的步骤。
参见图7,示出了根据本申请的一个实施例的在确定推荐的媒体数据之后的流程图,具体可包括步骤370至390:
步骤370,获取用户对于所推荐的媒体数据的反馈信息。
具体的,用户在浏览所推荐的媒体数据时,可以将进行反馈不符合自己阅读口味的媒体数据(清晰度不够或者内容模糊的媒体数据)。
步骤390,基于所述用户的反馈信息,训练所述图像评价模型。
在本申请中,基于所述用户的反馈信息,训练所述图像评价模型的好处就在于,可以持续优化所述图像评价模型,进而保证图像评价模型所述输出评价信息的准确性。
在本申请的一个实施例中,还提出了一种媒体数据推荐的系统框架。
参见图8,示出了根据本申请的一个实施例的媒体数据推荐的系统框架图。下面将对所述媒体数据推荐的系统框架进行说明。
如图所示,所述媒体数据推荐的系统框架共7个功能模块,具体包括功能模块801至807:
功能模块801,包括媒体数据生产端、上下行内容接口服务器以及媒体数据元信息及存储库。其中,媒体数据生产端,可以提供本地或者拍摄的视频内容或者撰写的自媒体文章或者图集,作者可以选择主动上传对应内容的封面图;上下行内容接口服务器,可以和媒体数据生产端直接通讯,将从前端提交的媒体数据内容,通常是媒体数据以及媒体数据内容的标题,发布者,摘要,封面图,发布时间、文件大小,封面图链接,码率,文件格式等信息写入媒体数据元信息及存储库;数据元信息及存储库,作为视频内容的核心数据库,所有生产者发布的媒体数据的元信息都保存在这个数据库当中,重点是视频内容和图文内容本身的元信息。
功能模块802,包括图像评价模型和训练图像数据库。其中,图像评价模型,采用基于深度学习方式,将分类和回归模型结合,得到一个细粒度的有监督的却别与传统的模型,此外,依据媒体数据消费端反馈不清晰的内容,按照一定的周期,定期获取新的标记样本来更新训练,升级模型;训练图像数据库,从媒体数据元信息及存储库中获取人工审核标记的图片内容,以此作为建立图像评价模型的原型库,同时,按照一定的周期进行数据更新,捞取不清晰图片样本库来重新更新训练模型,以使得线上的服务升级。
功能模块803,包括视频数据抽帧服务。其中,视频数据抽帧服务可以将媒体数据元信息及存储库内存储的视频文件下载到本地,以进行视频文件抽帧,这里核心问题在于时长不同视频的挑战,无法使用均匀抽帧策略,均匀的抽帧策略会导致采用频率不够,同时全部抽取也会增加抽帧的负担和计算量,计算成本急剧增大。因此,这里可以抽取明亮度变化明显的场景切换帧,前后等间隔抽帧补齐。
功能模块804,包括图像评价服务。其中,图像评价服务,主要是将构建的图像评价模型服务化,构建能够在链路上被调用的服务来实现对待推荐媒体数据的评价。
功能模块805,包括媒体数据入库服务、媒体数据分发数据库以及媒体数据分发出口服务。其中,媒体数据入库服务,负责媒体数据流转的整个调度过程。媒体数据分发数据库,通常是一组分布范围很广,离媒体数据消费端就近接入的存储数据库,通常外围还有CDN加速服务器进行分布式缓存加速,通过上下行内容接口服务器将内容生产者上传的视频和图片内容保存起来,媒体数据消费端在获取内容索引信息后,也可以直接访问媒体数据元信息及存储库下载对应的内容。
功能模块806,包括媒体数据消费端。其中,媒体数据消费端和媒体数据分发出口服务器通讯,获取对应内容的索引信息,下载对应的流媒体文件并且通过本地浏览,同时将上传和下载用户浏览媒体数据的行为数据。
功能模块807,包括人工审核服务。其中,人工审核服务,通常是一个WEB系统,在链路上,接收机器过滤的结果和来自媒体数据消费端对于推荐的媒体数据的反馈结果,对结果进行人工确认和复核,将复核的结果传回给训练图像数据库。
在本申请的一些实施例所提供的技术方案中,一方面,确定待推荐媒体数据中的图像帧集。另一方面,通过由神经网络融合图像子评价模型而得到的图像评价模型对确定的图像帧集进行评价,得到针对所述待推荐媒体数据的目标评价信息。最后,根据得到的目标评价信息确定推荐的媒体数据。由于确定的图像帧集可以基本反映待推荐媒体数据中图像或视频的质量,而由神经网络融合图像子评价模型而得到的图像评价模型又可以更全面的从整体上对图像进行评价,所以,通过图像评价模型对图像帧集进行评价而得到的目标评价信息能够客观评价待推荐媒体数据的质量,进而提高对媒体数据进行推荐的准确性。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的媒体数据的推荐方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的媒体数据的推荐方法的实施例。
图9示出了根据本申请的一个实施例的媒体数据的推荐装置的框图。
参照图9所示,根据本申请的一个实施例的媒体数据的推荐装置900,包括:获取单元901、评价单元902和确定单元903。
其中,获取单元901,被用于获取待推荐媒体数据,以从所述待推荐媒体数据中确定图像帧集;评价单元902,被用于基于图像评价模型,对所述图像帧集中的图像进行评价,以得到针对所述待推荐媒体数据的目标评价信息,其中,所述图像评价模型由神经网络对图像子评价模型进行融合得到;确定单元903,被用于根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据。
在本申请的一些实施例中,基于前述方案,所述待推荐媒体数据为待推荐视频,所述装置还包括确定单元,被用于从所述待推荐媒体数据中确定图像帧集。
在本申请的一些实施例中,基于前述方案,所述确定单元配置为:确定所述待推荐视频中所有帧图像的亮度值,以在所述待推荐视频中的所有帧图像中抽取具有不同亮度值的图像,得到待推荐视频中的图像帧集。
在本申请的一些实施例中,基于前述方案,所述确定单元配置为:在所述待推荐视频中随机抽取复数帧图像,得到待推荐视频中的图像帧集。
在本申请的一些实施例中,基于前述方案,所述确定单元配置为:在所述待推荐视频中等时间间隔的抽取复数帧图像,得到待推荐视频中的图像帧集。
在本申请的一些实施例中,基于前述方案,所述图像帧集中包括复数张图像,所述评价单元902配置为:基于图像评价模型,分别对所述图像帧集中的复数张图像进行评价,得到复数个评价信息;对所述复数个评价信息进行数学统计,得到所述目标评价信息。
在本申请的一些实施例中,基于前述方案,所述评价单元902配置为:将所述图像帧集中的复数张图像对应的复数个清晰度分数的平均值确定为所述目标评价信息。
在本申请的一些实施例中,基于前述方案,所述评价单元902配置为:将所述图像帧集中的复数张图像对应的复数个清晰度分数中的最高清晰度分数确定为所述目标评价信息。
在本申请的一些实施例中,基于前述方案,所述装置还包括训练单元,被用于获取训练图像数据,所述训练图像数据中带有预先建立的训练标签;采用带有训练标签的训练图像数据对预设模型进行训练,得到图像子评价模型。
在本申请的一些实施例中,基于前述方案,所述训练标签包括清晰度标签和语义标签和分类标签,所述训练单元配置为:采用带有清晰度标签和语义标签和分类标签的训练图像数据对预设模型进行训练,得到图像子评价模型。
在本申请的一些实施例中,基于前述方案,所述预设模型包括迁移学习模型、分类模型以及回归模型,所述训练单元配置为:采用带有训练标签的训练图像数据分别对所述迁移学习模型、分类模型以及回归模型进行训练,以得到图像子评价模型。
在本申请的一些实施例中,基于前述方案,所述确定单元903配置为:获取用户的行为数据,所述行为数据用于表征用户对于媒体数据的浏览习惯;根据所述目标评价信息,以及所述用户的行为数据,从所述待推荐媒体数据中确定推荐的媒体数据。
在本申请的一些实施例中,基于前述方案,所述训练单元配置为:在根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据之后,获取用户对于所推荐的媒体数据的反馈信息;基于所述用户的反馈信息,训练所述图像评价模型。
图10示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图10示出的电子设备的计算机系统1000仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图10所示,计算机系统1000包括中央处理单元(Central Processing Unit,CPU)1001,其可以根据存储在只读存储器(Read-Only Memory,ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(Random Access Memory,RAM)1003中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 1003中,还存储有系统操作所需的各种程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(Input/Output,I/O)接口1005也连接至总线1004。
以下部件连接至I/O接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(CPU)1001执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种媒体数据的推荐方法,其特征在于,所述方法包括:
获取待推荐媒体数据,以从所述待推荐媒体数据中确定图像帧集;
基于图像评价模型,对所述图像帧集中的图像进行评价,以得到针对所述待推荐媒体数据的目标评价信息,其中,所述图像评价模型由神经网络对图像子评价模型进行融合得到;
根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据。
2.根据权利要求1所述的方法,其特征在于,所述待推荐媒体数据为待推荐视频,所述从所述待推荐媒体数据中确定图像帧集,具体包括如下任意一种:
确定所述待推荐视频中所有帧图像的亮度值,以在所述待推荐视频中的所有帧图像中抽取具有不同亮度值的图像,得到待推荐视频中的图像帧集;
在所述待推荐视频中随机抽取复数帧图像,得到待推荐视频中的图像帧集;
在所述待推荐视频中等时间间隔的抽取复数帧图像,得到待推荐视频中的图像帧集。
3.根据权利要求1所述的方法,其特征在于,所述图像帧集中包括复数张图像,所述基于图像评价模型,对所述图像帧集中的图像进行评价,以得到针对所述待推荐媒体数据的目标评价信息,包括:
基于图像评价模型,分别对所述图像帧集中的复数张图像进行评价,得到复数个评价信息;
对所述复数个评价信息进行数学统计,得到所述目标评价信息。
4.根据权利要求3所述的方法,其特征在于,所述评价信息包括清晰度分数,所述对所述复数个评价信息进行数学统计,得到所述目标评价信息,具体包括如下任意一种:
将所述图像帧集中的复数张图像对应的复数个清晰度分数的平均值确定为所述目标评价信息;
将所述图像帧集中的复数张图像对应的复数个清晰度分数中的最高清晰度分数确定为所述目标评价信息。
5.根据权利要求1所述的方法,其特征在于,所述图像子评价模型通过如下方式得到:
获取训练图像数据,所述训练图像数据中带有预先建立的训练标签;
采用带有训练标签的训练图像数据对预设模型进行训练,得到图像子评价模型。
6.根据权利要求5所述的方法,其特征在于,所述训练标签包括清晰度标签和语义标签和分类标签,所述采用带有训练标签的训练图像数据对预设模型进行训练,得到图像子评价模型,包括:
采用带有清晰度标签和语义标签和分类标签的训练图像数据对预设模型进行训练,得到图像子评价模型。
7.根据权利要求5所述的方法,其特征在于,所述预设模型包括迁移学习模型、分类模型以及回归模型,所述采用带有训练标签的训练图像数据对预设模型进行训练,得到图像子评价模型,包括:
采用带有训练标签的训练图像数据分别对所述迁移学习模型、分类模型以及回归模型进行训练,以得到图像子评价模型。
8.根据权利要求1所述的方法,其特征在于,根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据,包括:
获取用户的行为数据,所述行为数据用于表征用户对于媒体数据的浏览习惯;
根据所述目标评价信息,以及所述用户的行为数据,从所述待推荐媒体数据中确定推荐的媒体数据。
9.根据权利要求1所述的方法,其特征在于,在根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据之后,所述方法还包括:
获取用户对于所推荐的媒体数据的反馈信息;
基于所述用户的反馈信息,训练所述图像评价模型。
10.一种媒体数据的推荐装置,其特征在于,包括:
获取单元,被用于获取待推荐媒体数据,以从所述待推荐媒体数据中确定图像帧集;
评价单元,被用于基于图像评价模型,对所述图像帧集中的图像进行评价,以得到针对所述待推荐媒体数据的目标评价信息,其中,所述图像评价模型由神经网络对图像子评价模型进行融合得到;
确定单元,被用于根据所述目标评价信息,从所述待推荐媒体数据中确定推荐的媒体数据。
CN201911308680.2A 2019-12-18 2019-12-18 媒体数据的推荐方法、装置 Active CN111191054B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911308680.2A CN111191054B (zh) 2019-12-18 2019-12-18 媒体数据的推荐方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911308680.2A CN111191054B (zh) 2019-12-18 2019-12-18 媒体数据的推荐方法、装置

Publications (2)

Publication Number Publication Date
CN111191054A true CN111191054A (zh) 2020-05-22
CN111191054B CN111191054B (zh) 2024-02-13

Family

ID=70707350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911308680.2A Active CN111191054B (zh) 2019-12-18 2019-12-18 媒体数据的推荐方法、装置

Country Status (1)

Country Link
CN (1) CN111191054B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112131472A (zh) * 2020-09-24 2020-12-25 腾讯科技(深圳)有限公司 信息推荐方法、装置、电子设备和存储介质
CN117253061A (zh) * 2023-09-12 2023-12-19 鲸湾科技(南通)有限公司 数据推荐方法、装置及计算机可读介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678329A (zh) * 2012-09-04 2014-03-26 中兴通讯股份有限公司 推荐方法及装置
US20160098844A1 (en) * 2014-10-03 2016-04-07 EyeEm Mobile GmbH Systems, methods, and computer program products for searching and sorting images by aesthetic quality
CN105809704A (zh) * 2016-03-30 2016-07-27 北京小米移动软件有限公司 识别图像清晰度的方法及装置
CN105825511A (zh) * 2016-03-18 2016-08-03 南京邮电大学 一种基于深度学习的图片背景清晰度检测方法
CN106469435A (zh) * 2015-08-13 2017-03-01 株式会社理光 图像处理方法、装置及设备
CN106650795A (zh) * 2016-12-01 2017-05-10 携程计算机技术(上海)有限公司 酒店房型图像的排序方法
CN106779073A (zh) * 2016-12-27 2017-05-31 西安石油大学 基于深度神经网络的媒体信息分类方法及装置
CN107194898A (zh) * 2017-06-23 2017-09-22 携程计算机技术(上海)有限公司 酒店图像的展示方法、存储介质及酒店信息的推送方法
WO2018157746A1 (zh) * 2017-02-28 2018-09-07 阿里巴巴集团控股有限公司 一种视频数据的推荐方法和装置
CN108921178A (zh) * 2018-06-22 2018-11-30 北京小米移动软件有限公司 获取图像模糊程度分类的方法、装置、电子设备
CN108986075A (zh) * 2018-06-13 2018-12-11 浙江大华技术股份有限公司 一种优选图像的判断方法及装置
CN109272045A (zh) * 2018-09-25 2019-01-25 华南农业大学 一种基于神经网络和迁移学习的水果图像分类方法及装置
CN109978833A (zh) * 2019-03-05 2019-07-05 上海扩博智能技术有限公司 图像质量自动检测方法、系统、设备及存储介质
CN110263189A (zh) * 2019-06-24 2019-09-20 腾讯科技(深圳)有限公司 媒体内容的推荐方法、装置、存储介质和计算机设备

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678329A (zh) * 2012-09-04 2014-03-26 中兴通讯股份有限公司 推荐方法及装置
US20160098844A1 (en) * 2014-10-03 2016-04-07 EyeEm Mobile GmbH Systems, methods, and computer program products for searching and sorting images by aesthetic quality
CN106469435A (zh) * 2015-08-13 2017-03-01 株式会社理光 图像处理方法、装置及设备
CN105825511A (zh) * 2016-03-18 2016-08-03 南京邮电大学 一种基于深度学习的图片背景清晰度检测方法
CN105809704A (zh) * 2016-03-30 2016-07-27 北京小米移动软件有限公司 识别图像清晰度的方法及装置
CN106650795A (zh) * 2016-12-01 2017-05-10 携程计算机技术(上海)有限公司 酒店房型图像的排序方法
CN106779073A (zh) * 2016-12-27 2017-05-31 西安石油大学 基于深度神经网络的媒体信息分类方法及装置
WO2018157746A1 (zh) * 2017-02-28 2018-09-07 阿里巴巴集团控股有限公司 一种视频数据的推荐方法和装置
CN107194898A (zh) * 2017-06-23 2017-09-22 携程计算机技术(上海)有限公司 酒店图像的展示方法、存储介质及酒店信息的推送方法
CN108986075A (zh) * 2018-06-13 2018-12-11 浙江大华技术股份有限公司 一种优选图像的判断方法及装置
CN108921178A (zh) * 2018-06-22 2018-11-30 北京小米移动软件有限公司 获取图像模糊程度分类的方法、装置、电子设备
CN109272045A (zh) * 2018-09-25 2019-01-25 华南农业大学 一种基于神经网络和迁移学习的水果图像分类方法及装置
CN109978833A (zh) * 2019-03-05 2019-07-05 上海扩博智能技术有限公司 图像质量自动检测方法、系统、设备及存储介质
CN110263189A (zh) * 2019-06-24 2019-09-20 腾讯科技(深圳)有限公司 媒体内容的推荐方法、装置、存储介质和计算机设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112131472A (zh) * 2020-09-24 2020-12-25 腾讯科技(深圳)有限公司 信息推荐方法、装置、电子设备和存储介质
CN117253061A (zh) * 2023-09-12 2023-12-19 鲸湾科技(南通)有限公司 数据推荐方法、装置及计算机可读介质

Also Published As

Publication number Publication date
CN111191054B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
CN110225373B (zh) 一种视频审核方法、装置及电子设备
CN111680219B (zh) 内容推荐方法、装置、设备及可读存储介质
KR102533972B1 (ko) 시각적 검색 플랫폼용 영상 인제스트 프레임워크
CN105320766B (zh) 信息推送方法和装置
US20190362154A1 (en) Object Detection From Visual Search Queries
US10334328B1 (en) Automatic video generation using auto-adaptive video story models
WO2021159719A1 (zh) 页面配置方法、装置、电子设备和计算机可读介质
CN107545301B (zh) 页面展示方法及装置
CN111191054B (zh) 媒体数据的推荐方法、装置
CN111259192A (zh) 音频推荐方法和装置
US10339469B2 (en) Self-adaptive display layout system
CN110598095B (zh) 一种识别包含指定信息文章的方法、装置及存储介质
CN111831855A (zh) 用于匹配视频的方法、装置、电子设备和介质
US20230334555A1 (en) Vehicle listing generation and optimization system
CN113646773A (zh) 图像扩展神经网络
CN114996486A (zh) 一种数据推荐方法、装置、服务器以及存储介质
CN110648167A (zh) 对于用户生成的游戏内容的微支付补偿
WO2016077103A1 (en) Automatic selection of images for an application
CN111695041B (zh) 用于推荐信息的方法和装置
CN112449217B (zh) 一种推送视频的方法、装置、电子设备和计算机可读介质
CN112989174A (zh) 信息推荐方法及装置、介质和设备
CN112269942B (zh) 一种推荐对象的方法、装置、系统及电子设备
WO2022271661A1 (en) Training data generation, model serving, and machine learning techniques for advanced frequency management
US11727681B2 (en) Media annotation with product source linking
CN112446738A (zh) 广告数据处理方法、装置、介质以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant