CN111754493A - 图像噪点强度评估方法、装置、电子设备及存储介质 - Google Patents

图像噪点强度评估方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111754493A
CN111754493A CN202010600093.7A CN202010600093A CN111754493A CN 111754493 A CN111754493 A CN 111754493A CN 202010600093 A CN202010600093 A CN 202010600093A CN 111754493 A CN111754493 A CN 111754493A
Authority
CN
China
Prior art keywords
image
noise
value
pixel point
stream data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010600093.7A
Other languages
English (en)
Inventor
龙翔
何栋梁
孙昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010600093.7A priority Critical patent/CN111754493A/zh
Publication of CN111754493A publication Critical patent/CN111754493A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

本申请公开了图像噪点强度评估方法、装置、电子设备及存储介质,涉及人工智能、深度学习、图像处理领域。具体实现方案为:解析视频流数据,得到至少一帧的第一图像;响应于去噪操作,对所述至少一帧的第一图像去噪,得到去噪后至少一帧的第二图像;根据所述第二图像中各像素点平坦程度估计值、及所述第一图像相对所述第二图像各像素点的噪点程度估计值,得到针对所述视频流数据的噪点程度评估结果。采用本申请实施例,可以提高视频噪点强度评估结果的准确性。

Description

图像噪点强度评估方法、装置、电子设备及存储介质
技术领域
本申请涉及信息处理领域。本申请尤其涉及人工智能、深度学习、图像 处理领域、可应用于与视频信息相关的视频采集、视频搜索、视频推荐、视 频显示等领域。
背景技术
用户感知外界信息的方式有多种多样,用户之间传播信息的方式也有多 种多样,比如,可以感知或传播图文信息、视频信息等。便携设备、手机终 端等电子设备相比以往更加智能化,芯片的解析能力更强,尤其对视频信息 的解析、画面渲染等比以往更快、更清晰,使得用户感知或彼此传播信息的 用户习惯已经从图文信息向视频信息转移。
视频信息的质量,会受到视频噪点强度的影响,视频噪点强度的高低会 直接影响视频的清晰度和美观度,若视频噪点强度高,则会干扰对视频的观 感。然而,相关技术中,对视频噪点强度的评估,更多依赖人工评估,从而 影响到最终噪点强度评估结果的准确性。
发明内容
本申请提供了一种图像噪点强度评估方法、装置、电子设备及存储介质。
根据本申请的一方面,提供了一种图像噪点强度评估方法,包括:
解析视频流数据,得到至少一帧的第一图像;
响应于去噪操作,对所述至少一帧的第一图像去噪,得到去噪后至少一 帧的第二图像;
根据所述第二图像中各像素点平坦程度估计值、及所述第一图像相对所 述第二图像各像素点的噪点程度估计值,得到针对所述视频流数据的噪点程 度评估结果。
根据本申请的另一方面,提供了一种图像噪点强度评估装置,包括:
解析模块,用于解析视频流数据,得到至少一帧的第一图像;
响应模块,用于响应于去噪操作,对所述至少一帧的第一图像去噪,得 到去噪后至少一帧的第二图像;
评估模块,用于根据所述第二图像中各像素点平坦程度估计值、及所述 第一图像相对所述第二图像各像素点的噪点程度估计值,得到针对所述视频 流数据的噪点程度评估结果。
根据本申请的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一 个处理器执行,以使该至少一个处理器能够执行本申请任意一实施例所提供 的方法。
根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机 可读存储介质,该计算机指令用于使该计算机执行本申请任意一项实施例所 提供的方法。
采用本申请实施例,可以解析视频流数据,以得到至少一帧的第一图 像,响应于去噪操作,对所述至少一帧的第一图像去噪,得到去噪后至少 一帧的第二图像。根据所述第二图像中各像素点平坦程度估计值、及所述 第一图像相对所述第二图像各像素点的噪点程度估计值,得到针对所述视 频流数据的噪点程度评估结果。由于是对任意的视频流数据进行去噪、及 进行视频噪点程度的估计,因此,使得视频噪点程度与视频内容建立关联,且不依赖于特定的噪点数据进行估计,即具备了针对视频流数据的多种应 用场景的通用性,且更能反映出视频噪点程度与视频内容本身的关联性, 从而提高了视频噪点强度评估结果的准确性。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或 重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说 明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是应用于本申请实施例的一视频信息交互的硬件实体示意图;
图2是根据本申请实施例的图像噪点强度评估方法的流程示意图;
图3是根据本申请实施例的图像噪点强度评估方法的流程示意图;
图4是根据本申请实施例的图像噪点强度评估装置的组成结构示意图;
图5是用来实现本申请实施例的图像噪点强度评估方法的电子设备的框 图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施 例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域 普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改, 而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省 略了对公知功能和结构的描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以 存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B, 单独存在B这三种情况。本文中术语“至少一种”表示多种中的任意一种或 多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表 示包括从A、B和C构成的集合中选择的任意一个或多个元素。本文中术语 “第一”、“第二”表示指代多个类似的技术用语并对其进行区分,并不是 限定顺序的意思,或者限定只有两个的意思,例如,第一特征和第二特征, 是指代有两类/两个特征,第一特征可以为一个或多个,第二特征也可以为一 个或多个。
另外,为了更好的说明本申请,在下文的具体实施方式中给出了众多的 具体细节。本领域技术人员应当理解,没有某些具体细节,本申请同样可以 实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路 未作详细描述,以便于凸显本申请的主旨。
图1是应用于本申请实施例的一视频信息交互的硬件实体示意图,图1 中包括:流媒体服务器11(如由多个服务器构成的服务器集群)、各终端(终 端21-终端26),比如台式机,PC机,手机,一体机等类型,及各硬件实体 之间彼此分享的视频信息31-视频信息33。其中,各终端可以通过有线网络 或者无线网络与流媒体服务器11进行视频信息交互。视频信息31-视频信息 33可以通过各终端进行视频采集得到,也可以通过网络从流媒体服务器11的视频数据库得到,视频信息31-视频信息33还可以提供给视频搜索、视频 推荐、视频显示等场景使用。
上述图1的例子只是实现本申请实施例的一个系统架构实例,本申请实 施例并不限于上述图1所述的系统结构,基于该系统架构,提出本申请各个 实施例。
针对视频信息而言,视频信息的质量,会受到视频噪点强度的影响,视 频噪点强度的高低会直接影响视频的清晰度和美观度,若视频噪点强度高, 则会干扰对视频的观感。这里,视频噪点强度指的是人类对于观看视频感受 到噪点对视频观感的干扰程度。
评估视频噪点强度是精细化评估视频清晰度和视频美观度的基础,对于 终端厂商(如手机终端厂商)、设置于终端侧的视频采集软件、视频搜索、 视频推荐、视频显示等各个方面,针对视频噪点强度进行评估的方法具有重 要意义,可以基于视频噪点强度的评估,使得上述各个方面在实际应用可以 满足用户主观感觉层面上对高质量、高清晰度视频数据流的设计要求,从而 吸引用户眼球,有助于视频信息的交互传播,提高了传播转化率。
针对视频噪点强度进行评估的方法,相关技术中的一些方法主要是针对 特定类型的噪点,设计专有的算法来评估噪点强度,由于其是专有的算法, 不可兼容,因此,可复用性、通用性较差,只能针对特定类型噪点的评估使 用。或者,更多依赖人工评估,比如,采用取值范围内的得分进行视频噪点 强度的评估,该取值范围可以为0-10分的取值,其中,0分为噪点无影响的 视频,10分为噪点影响严重的视频,对于任意视频打分就会落在0-10分之前, 数值越大,代表视频噪点影响越严重。可这种依赖人工评估的主观打分,并 不精确,从而影响到最终视频噪点强度评估结果的准确性。
根据本申请的实施例,提供了一种图像噪点强度评估方法,图2是根据 本申请实施例的图像噪点强度评估方法的流程示意图,该方法可以应用于图 像噪点强度评估装置,例如,该装置可以部署于终端或服务器或其它处理设 备执行的情况下,可以执行视频帧提取、曝光质量统计、曝光质量评估等等。 其中,终端可以为用户设备(UE,User Equipment)、移动设备、蜂窝电话、 无绳电话、个人数字处理(PDA,Personal Digital Assistant)、手持设备、计 算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该方法还可 以通过处理器调用存储器中存储的计算机可读指令的方式来实现。如图2所 示,包括:
S101、解析视频流数据,得到至少一帧的第一图像。
一示例中,视频流数据可以为用户自制的各短视频,各视频播放平台提 供的电影、电视剧、综艺节目等。
一示例中,可以基于固定帧率对所述视频流数据进行视频帧提取操作, 以得到所述第一图像。比如,其中,固定帧率可以是25FPS,“FPS”是图像 领域中的定义,指画面每秒传输帧数,则25FPS指一秒25帧。每秒的帧数愈 多,视频流数据所显示的动作就会越流畅。一般来说,要使得动作流畅,帧 率最低可以设置为30帧,一些视频流数据的视频格式,每秒还可以提供15 帧来显示。
一示例中,还可以基于等时间间隔的采样方式对所述视频流数据进行视 频帧采样操作,以得到所述第一图像。比如,可以固定采样N帧(N为帧数, 至少为一帧),N可以固定取32,则对应N帧,可以固定取32个第一图像。
S102、响应于去噪操作,对所述至少一帧的第一图像去噪,得到去噪后 至少一帧的第二图像。
需要指出的是,为了简化描述,本实施例后续描述中,直接采用“第一 图像”及“第二图像”对每帧图像进行描述。
一示例中,所述第一图像可以为去噪前的图像,所述第二图像可以为经 去噪后得到的第二图像。
响应于去噪操作所执行去噪的处理,只要可以进行图像去噪,都在本申 请实施例的保护范围之内。
考虑到视频流数据在数字化和传输过程中,常受到成像设备与外部环境 噪声等干扰影响,最终只能得到构成视频流数据的多帧含噪图像(或噪声图 像),比如,针对所述图像去噪,可以通过小波去噪处理,小波去噪处理可 以包括:对所述第一图像进行图像信号的小波分解;对经过多层次小波分解 后得到的高频小波系数进行阈值量化;利用二维小波重构出第一图像对应的 图象信号,以得到所述第二图像,从而达到尽量还原出所述第一图像,即原 始图像质量的目的。
S103、根据所述第二图像中各像素点平坦程度估计值、及所述第一图像 相对所述第二图像各像素点的噪点程度估计值,得到针对所述视频流数据的 噪点程度评估结果。
一示例中,所述平坦程度估计值可以为第二图像中各像素点的方差值; 所述噪点程度估计值可以为第一图像相对所述第二图像各像素点的噪点差值。
采用本申请实施例,可以解析视频流数据,以得到至少一帧的第一图 像,响应于去噪操作,对所述至少一帧的第一图像去噪,得到去噪后至少 一帧的第二图像。根据所述第二图像中各像素点平坦程度估计值、及所述 第一图像相对所述第二图像各像素点的噪点程度估计值,得到针对所述视 频流数据的噪点程度评估结果。由于是对任意的视频流数据进行去噪、及 进行视频噪点程度的估计,因此,使得视频噪点程度与视频内容建立关联,且不依赖于特定的噪点数据进行估计,即具备了针对视频流数据的多种应 用场景的通用性,且更能反映出视频噪点程度与视频内容本身的关联性, 从而提高了视频噪点强度评估结果的准确性。
根据本申请的实施例,提供了一种图像噪点强度评估方法,图3是根据 本申请实施例的图像噪点强度评估方法的流程示意图,如图3所示,包括:
S201、解析视频流数据,得到至少一帧的第一图像。
一示例中,视频流数据可以为用户自制的各短视频,各视频播放平台提 供的电影、电视剧、综艺节目等。
一示例中,可以基于固定帧率对所述视频流数据进行视频帧提取操作, 以得到所述第一图像。比如,其中,固定帧率可以是25FPS,“FPS”是图像 领域中的定义,指画面每秒传输帧数,则25FPS指一秒25帧。每秒的帧数愈 多,视频流数据所显示的动作就会越流畅。一般来说,要使得动作流畅,帧 率最低可以设置为30帧,一些视频流数据的视频格式,每秒还可以提供15 帧来显示。
一示例中,还可以基于等时间间隔的采样方式对所述视频流数据进行视 频帧采样操作,以得到所述第一图像。比如,可以固定采样N帧(N为帧数, 至少为一帧),N可以固定取32,则对应N帧,可以固定取32个第一图像。
S202、响应于去噪操作,对所述至少一帧的第一图像去噪,得到去噪后 至少一帧的第二图像。
需要指出的是,为了简化描述,本实施例后续描述中,直接采用“第一 图像”及“第二图像”对每帧图像进行描述。
S203、响应于平坦程度估计操作,得到所述第二图像中各像素点的方差 值。
一示例中,可以将所述第二图像转化为对应的灰度图后,获取所述灰度 图中作为特征点的目标像素点(如可以体现各像素点平坦程度差异的特征点 作为该目标像素点),以目标像素点为中心,得到评估区域,根据目标像素 点对应灰度值、及评估区域中围绕该目标像素点的各像素点对应灰度值进行 运算,得到上述方差值(如局部方差值)。
S204、响应于噪点程度估计操作,得到所述第一图像相对所述第二图像 各像素点的噪点差值。
一示例中,可以将所述第一图像及所述第二图像分别转化为对应的灰度 图,得到第一灰度图及第二灰度图。根据第一灰度图及第二灰度图中各对应 像素点灰度值的运算,得到上述噪点差值(相比于第二图像的局部方差值而 言,这个噪点差值是个绝对差值)。
S205、根据所述方差值及所述噪点差值,得到针对所述视频流数据的噪 点程度评估结果。
一示例中,可以将方差值(如局部方差值)作为局部调整值,将所述噪 点差值作为相对于所述局部调整值的绝对值,根据局部调整值,对噪点差值 进行调整,得到针对上述视频流数据的噪点程度评估结果。
采用本申请实施例,可以解析视频流数据,以得到所述第一图像,响应 于去噪操作,对所述第一图像去噪,得到所述第二图像。根据所述第二图 像中各像素点方差值、及所述第一图像相对所述第二图像各像素点的噪点 差值,得到针对所述视频流数据的噪点程度评估结果。由于是对任意的视 频流数据进行去噪、及进行视频噪点程度的估计,因此,使得视频噪点程 度与视频内容建立关联,且不依赖于特定的噪点数据进行估计,即具备了针对视频流数据的多种应用场景的通用性,且更能反映出视频噪点程度与 视频内容本身的关联性,从而提高了视频噪点强度评估结果的准确性。
如若根据针对所述视频流数据的噪点程度评估结果,可以得出去噪前 的所述第一图像与去噪后的第二图像噪点程度相比较差不多的结论,则说 明去噪前的所述第一图像(即视频流数据中的多帧原图像)本身就视频噪 音强度低,则可以满足用户主观感觉层面上对高质量、高清晰度视频数据 流的设计要求,从而吸引用户眼球,有助于视频信息的交互传播,提高了 传播转化率。
本申请一实施方式中,还可以预先收集多种不同应用场景(如终端厂 商所需设计场景、设置于终端侧的视频采集软件所需采集场景、视频搜索 场景、视频推荐场景、视频显示场景)所用到的视频流数据,将该视频流 数据输入预先训练得到的图像处理网络,在该图像处理网络中可以进行去 噪、及得到上述方差值及上述噪点差值,最终,该图像处理网络输出得到 针对所述视频流数据的噪点程度评估结果。其中,图像处理网络的网络类 型可以为回归神经网络,本申请实施例不限于该网络类型,只要能实现本 申请实施例视频噪点程度评估的神经网络都在本申请实施例的保护范围 之内。
一实施方式中,还包括网络训练过程,针对该网络训练过程,可以将 视频流数据作为样本数据来训练第一图像处理网络,得到所述第一图像处 理网络输出的用于噪点程度评估结果的预测值。其中,为了区分训练前后 的图像处理网络,本实施方式中,将第一图像处理网络指代“训练前的图 像处理网络”,将图像处理网络自身指代“训练后的图像处理网络”
一示例中,所述样本数据还包括:用于噪点程度评估结果的标注数据 (如噪点程度、是否为平坦程度等),可以根据所述标注数据及所述预测 值得到损失函数,如平均绝对误差损失函数(L1-Loss)。根据所述损失函 数的反向传播,对所述第一图像处理网络进行训练,直至网络收敛,从而 网络训练结束,训练后得到所述图像处理网络。
采用本申请实施例,可以预先根据多种不同应用场景所用到的视频流 数据、用于噪点程度评估结果的标注数据(如噪点程度、是否为平坦程度 等)进行网络训练,则后续可以直接应用该训练后得到的图像处理网络, 以直接输出得到针对所述视频流数据的噪点程度评估结果,由于训练过程 是基于多种不同应用场景所用到的视频流数据,而不是适应特定应用场景 的特定类型数据,因此,更符合人对视频的主观感觉,且相比依赖于人工 评估所得到的针对所述视频流数据的噪点程度评估结果更为准确,从而提 高了针对所述视频流数据的噪点程度评估结果。
应用示例:
应用本申请实施例一处理流程包括如下内容:
一、获取视频流数据,解析得到至少一帧的第一图像,记为图像v,应 用去噪算法去除图像噪点,去噪后得到至少一帧的第二图像,记为图像u。
可以采用任何一种去噪算法执行去噪,去噪效果越好的去噪算法,可以 辅助后续运算得到更为准确的针对上述视频流数据的噪点程度评估结果。且, 先通过去噪算法执行去噪,由于去噪算法发展比较成熟,相对于噪点强度评 估来说也相对成熟,可以选用多种去噪算法对不同噪点种类的图像进行去噪 从而可以得到更稳定的去噪效果。
二、计算图像u中各个像素点的局部方差值,该局部方差值越小,说明 该图像的评估区域越平坦,计算局部方差值的公式如下:
Figure BDA0002558801280000091
上述公式中,S(i,j,k)指局部方差值;U(i,j,k)指上述作为特征点的目标 像素点对应灰度值;R指评估区域中围绕目标像素点的像素点个数;U(a,b,c) 指上述在评估区域中围绕该目标像素点的各像素点对应灰度值;a的取值范围, 以“i-R+1”及“i+R-1”所界定;b的取值范围,以“j-R+1”及“j+R-1” 所界定;c的取值范围,以“k-R+1”及“k+R-1”所界定;其中,对于i,j,k的 含义:以灰度值U(i,j,k)为例,i代表视频流数据的第i帧图像,j代表该第i 帧图像中第j行,k代表该第i帧图像中第k列。
通过针对视频流数据去噪后的每一帧的图像u,用固定帧率抽帧(可以 取25FPS),以将所有帧图像转化为对应灰度图,由于灰度值组成3维数组 U,得到该U(i,j,k)。对其中的一个像素点的灰度值U(i,j,k),取以该像素点为 中心的其周围R个像素点以内的评估区域(可以是方形区域)内的所有灰度 值计算局部方差值,并将其作为该像素点位置平坦程度的一个估计。对于超 出边界(超出每一帧的图像u的边界,a小于0,就认为a=0)的像素,即abc 小于1或者大于N(视频流数据的帧数)的情况,设定U(a,b,c)取值可以 等于U(i,j,k)。
三、计算每一帧图像v和每一帧图像u各像素点的噪点差值,相比于上 述局部方差值而言,这个噪点差值是个绝对差值。计算噪点差值,并根据方 差进行加权,还可以得到各像素点的噪点强度评估结果,如下公式所示:
Figure BDA0002558801280000101
上述公式中,F(i,j,k)指上述各像素点的噪点强度评估结果;S(i,j,k)指局 部方差值;U(i,j,k)上述图像u对应灰度值,可以为灰度值数组;V(i,j,k)指 对应图像u的像素点对应灰度值,可以为灰度值数组;α和β为设定的参数。
通过对视频流数据去噪前的每一帧图像v进行上述同样的抽帧,即用固 定帧率抽帧(可以取25FPS)并转化为灰度图,计算图像v的V(i,j,k)和视频 流数据去噪后的每一帧图像u的U(i,j,k)之间的噪点差值,并根据局部方差值 进行加权运算,从而得到上述各像素点的噪点强度评估结果。其中,根据用 具体数据集对α和β进行调整,比如,预先人工标注一堆数据评分,将该数据 评分与上述通过公式计算得到各像素点的噪点强度评分对比,并根据人工标 注一堆数据评分来调整α和β,这样调整,可以使得到的各像素点的噪点强度更接近于人的主观评估感受。
进一步的,还可以将整个视频流数据的噪点强度评估结果,进行各像素 点的噪点强度平均,并通过线性变换后转化到所需要的噪音强度的设计范围, 计算公式如下:
Figure BDA0002558801280000102
上述公式中,F指噪点强度评估结果线性变换后的结果;F(i,j,k)指上述 各像素点的噪点强度评估结果;ω为权重;N指视频流数据的帧数;H指每个 视频帧的高度;W指每个视频帧的宽度,μ为设定的参数,可以根据具体要 求的输出范围调整,比如,预先人工标注一堆噪音强度设计范围的评分,将 该数据评分与上述通过公式计算得到噪点强度评估结果线性变换后的结果评 分对比,并根据人工标注一堆数据评分来调整ω和μ,这样调整,可以使得到 的各像素点的噪点强度经线性变换后更接近于人的主观评估感受。
采用本应用示例,考虑到了视频内容是否平坦对于人类主观的噪点强度 评估的影响,能够适应更多种类的噪点,可以得到更为准确的噪音强度评估 结果。
根据本申请的实施例,提供了一种图像噪点强度评估装置,图4是根据 本申请实施例的图像噪点强度评估装置的组成结构示意图,如图4所示,包 括:解析模块41,用于解析视频流数据,得到至少一帧的第一图像;响应模 块42,用于响应于去噪操作,对所述至少一帧的第一图像去噪,得到去噪后 至少一帧的第二图像;评估模块43,用于根据所述第二图像中各像素点平坦 程度估计值、及所述第一图像相对所述第二图像各像素点的噪点程度估计值, 得到针对所述视频流数据的噪点程度评估结果。
一实施方式中,评估模块43,包括:第一评估子模块,用于响应于平坦 程度估计操作,得到所述第二图像中各像素点的方差值,将所述方差值作为 所述平坦程度估计值;第二评估子模块,用于响应于噪点程度估计操作,得 到所述第一图像相对所述第二图像各像素点的噪点差值,将所述噪点差值作 为所述噪点程度估计值;第三评估子模块,用于根据所述方差值及所述噪点 差值,得到针对所述视频流数据的噪点程度评估结果。
一实施方式中,还包括:第一转化模块,用于将所述第二图像转化为对 应的灰度图。所述第一评估子模块,还用于:获取所述灰度图中作为特征点 的目标像素点;以所述目标像素点为中心,得到评估区域;根据所述目标像 素点对应灰度值、及所述评估区域中围绕所述目标像素点的各像素点对应灰 度值进行运算,得到所述方差值。
一实施方式中,还包括:第二转化模块,用于将所述第一图像及所述第 二图像分别转化为对应的灰度图,得到第一灰度图及第二灰度图。所述第二 评估子模块,还用于:根据所述第一灰度图及所述第二灰度图中各对应像素 点灰度值的运算,得到所述噪点差值。
一实施方式中,所述第三评估子模块,还用于将所述方差值作为局部调 整值;将所述噪点差值作为相对于所述局部调整值的绝对值;根据所述局部 调整值,对所述噪点差值进行调整,得到针对所述视频流数据的噪点程度评 估结果。
一实施方式中,所述解析模块,还用于基于固定帧率对所述视频流数据 进行视频帧提取操作,得到所述第一图像;或者,基于等时间间隔的采样方 式对所述视频流数据进行视频帧采样操作,得到所述第一图像。
本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述, 在此不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介 质。
如图5所示,是用来实现本申请实施例的图像噪点强度评估方法的电子 设备的框图。该电子设备可以为前述部署设备或代理设备。电子设备旨在表 示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个 人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。 电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、 智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连 接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/ 或者要求的本申请的实现。
如图5所示,该电子设备包括:一个或多个处理器801、存储器802,以 及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的 总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。 处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者 存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示 GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/ 或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子 设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式 服务器、或者多处理器系统)。图5中以一个处理器801为例。
存储器802即为本申请所提供的非瞬时计算机可读存储介质。其中,所 述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器 执行本申请所提供的图像噪点强度评估方法。本申请的非瞬时计算机可读存 储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的图 像噪点强度评估方法。
存储器802作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软 件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的图像噪点 强度评估方法对应的程序指令/模块(例如,附图4所示的解析模块、响应模 块、评估模块等模块)。处理器801通过运行存储在存储器802中的非瞬时 软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理, 即实现上述方法实施例中的图像噪点强度评估方法。
存储器802可以包括存储程序区和存储数据区,其中,存储程序区可存 储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据电子 设备的使用所创建的数据等。此外,存储器802可以包括高速随机存取存储 器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或 其他非瞬时固态存储器件。在一些实施例中,存储器802可选包括相对于处 理器801远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。 上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及 其组合。
图像噪点强度评估方法的电子设备,还可以包括:输入装置803和输出 装置804。处理器801、存储器802、输入装置803和输出装置804可以通过 总线或者其他方式连接,图5中以通过总线连接为例。
输入装置803可接收输入的数字或字符信息,以及产生与电子设备的用 户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹 板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。 输出装置804可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈 装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、 发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设 备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成 电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或 它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算 机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可 编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理 器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和 指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至 少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程 处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/ 或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质” 和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的 任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编 程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可 读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程 处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术, 该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管) 或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者 轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它 种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是 任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户 的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如, 作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、 或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的 用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述 的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或 者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数 据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括: 局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并 且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客 户端-服务器关系的计算机程序来产生客户端和服务器的关系。
采用本申请实施例,可以解析视频流数据,以得到至少一帧的第一图 像,响应于去噪操作,对所述至少一帧的第一图像去噪,得到去噪后至少 一帧的第二图像。根据所述第二图像中各像素点平坦程度估计值、及所述 第一图像相对所述第二图像各像素点的噪点程度估计值,得到针对所述视 频流数据的噪点程度评估结果。由于是对任意的视频流数据进行去噪、及 进行视频噪点程度的估计,因此,使得视频噪点程度与视频内容建立关联,且不依赖于特定的噪点数据进行估计,即具备了针对视频流数据的多种应 用场景的通用性,且更能反映出视频噪点程度与视频内容本身的关联性, 从而提高了视频噪点强度评估结果的准确性。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删 除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行 也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果, 本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人 员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子 组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进 等,均应包含在本申请保护范围之内。

Claims (14)

1.一种图像噪点强度评估方法,所述方法包括:
解析视频流数据,得到至少一帧的第一图像;
响应于去噪操作,对所述至少一帧的第一图像去噪,得到去噪后至少一帧的第二图像;
根据所述第二图像中各像素点平坦程度估计值、及所述第一图像相对所述第二图像各像素点的噪点程度估计值,得到针对所述视频流数据的噪点程度评估结果。
2.根据权利要求1所述的方法,其中,所述根据所述第二图像中各像素点平坦程度估计值、及所述第一图像相对所述第二图像各像素点的噪点程度估计值,得到针对所述视频流数据的噪点程度评估结果,包括:
响应于平坦程度估计操作,得到所述第二图像中各像素点的方差值,将所述方差值作为所述平坦程度估计值;
响应于噪点程度估计操作,得到所述第一图像相对所述第二图像各像素点的噪点差值,将所述噪点差值作为所述噪点程度估计值;
根据所述方差值及所述噪点差值,得到针对所述视频流数据的噪点程度评估结果。
3.根据权利要求2所述的方法,还包括:
将所述第二图像转化为对应的灰度图;
其中,所述响应于平坦程度估计操作,得到所述第二图像中各像素点的方差值,包括:
获取所述灰度图中作为特征点的目标像素点;
以所述目标像素点为中心,得到评估区域;
根据所述目标像素点对应灰度值、及所述评估区域中围绕所述目标像素点的各像素点对应灰度值进行运算,得到所述方差值。
4.根据权利要求2所述的方法,还包括:
将所述第一图像及所述第二图像分别转化为对应的灰度图,得到第一灰度图及第二灰度图;
其中,所述响应于噪点程度估计操作,得到所述第一图像相对所述第二图像各像素点的噪点差值,包括:
根据所述第一灰度图及所述第二灰度图中各对应像素点灰度值的运算,得到所述噪点差值。
5.根据权利要求2所述的方法,其中,所述根据所述第二图像中各像素点平坦程度估计值、及所述第一图像相对所述第二图像各像素点的噪点程度估计值,得到针对所述视频流数据的噪点程度评估结果,包括:
将所述方差值作为局部调整值;
将所述噪点差值作为相对于所述局部调整值的绝对值;
根据所述局部调整值,对所述噪点差值进行调整,得到针对所述视频流数据的噪点程度评估结果。
6.根据权利要求1-5中任一项所述的方法,其中,所述解析视频流数据,得到至少一帧的第一图像,包括:
基于固定帧率对所述视频流数据进行视频帧提取操作,得到所述第一图像;或者,
基于等时间间隔的采样方式对所述视频流数据进行视频帧采样操作,得到所述第一图像。
7.一种图像噪点强度评估装置,所述装置包括:
解析模块,用于解析视频流数据,得到至少一帧的第一图像;
响应模块,用于响应于去噪操作,对所述至少一帧的第一图像去噪,得到去噪后至少一帧的第二图像;
评估模块,用于根据所述第二图像中各像素点平坦程度估计值、及所述第一图像相对所述第二图像各像素点的噪点程度估计值,得到针对所述视频流数据的噪点程度评估结果。
8.根据权利要求7所述的装置,其中,所述评估模块,包括:
第一评估子模块,用于响应于平坦程度估计操作,得到所述第二图像中各像素点的方差值,将所述方差值作为所述平坦程度估计值;
第二评估子模块,用于响应于噪点程度估计操作,得到所述第一图像相对所述第二图像各像素点的噪点差值,将所述噪点差值作为所述噪点程度估计值;
第三评估子模块,用于根据所述方差值及所述噪点差值,得到针对所述视频流数据的噪点程度评估结果。
9.根据权利要求8所述的装置,还包括:
第一转化模块,用于将所述第二图像转化为对应的灰度图;
所述第一评估子模块,还用于:
获取所述灰度图中作为特征点的目标像素点;
以所述目标像素点为中心,得到评估区域;
根据所述目标像素点对应灰度值、及所述评估区域中围绕所述目标像素点的各像素点对应灰度值进行运算,得到所述方差值。
10.根据权利要求8所述的装置,还包括:
第二转化模块,用于将所述第一图像及所述第二图像分别转化为对应的灰度图,得到第一灰度图及第二灰度图;
所述第二评估子模块,还用于:
根据所述第一灰度图及所述第二灰度图中各对应像素点灰度值的运算,得到所述噪点差值。
11.根据权利要求8所述的装置,其中,所述第三评估子模块,还用于:
将所述方差值作为局部调整值;
将所述噪点差值作为相对于所述局部调整值的绝对值;
根据所述局部调整值,对所述噪点差值进行调整,得到针对所述视频流数据的噪点程度评估结果。
12.根据权利要求7-11中任一项所述的装置,其中,所述解析模块,还用于:
基于固定帧率对所述视频流数据进行视频帧提取操作,得到所述第一图像;或者,
基于等时间间隔的采样方式对所述视频流数据进行视频帧采样操作,得到所述第一图像。
13.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的方法。
CN202010600093.7A 2020-06-28 2020-06-28 图像噪点强度评估方法、装置、电子设备及存储介质 Pending CN111754493A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010600093.7A CN111754493A (zh) 2020-06-28 2020-06-28 图像噪点强度评估方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010600093.7A CN111754493A (zh) 2020-06-28 2020-06-28 图像噪点强度评估方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN111754493A true CN111754493A (zh) 2020-10-09

Family

ID=72677672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010600093.7A Pending CN111754493A (zh) 2020-06-28 2020-06-28 图像噪点强度评估方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111754493A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113709560A (zh) * 2021-03-31 2021-11-26 腾讯科技(深圳)有限公司 视频剪辑方法、装置、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120020415A1 (en) * 2008-01-18 2012-01-26 Hua Yang Method for assessing perceptual quality
CN106303156A (zh) * 2016-08-29 2017-01-04 厦门美图之家科技有限公司 对视频去噪的方法、应用及移动终端
CN107230208A (zh) * 2017-06-27 2017-10-03 江苏开放大学 一种高斯噪声的图像噪声强度估计方法
CN109584204A (zh) * 2018-10-15 2019-04-05 上海途擎微电子有限公司 一种图像噪声强度估计方法、存储介质、处理及识别装置
CN110278485A (zh) * 2019-07-29 2019-09-24 北京华雨天成文化传播有限公司 一种评估视频质量的方法及装置
CN111047587A (zh) * 2019-12-27 2020-04-21 山东超越数控电子股份有限公司 图像的噪声估计方法、计算机设备和存储介质
WO2020105520A1 (ja) * 2018-11-21 2020-05-28 日本電信電話株式会社 評価装置、評価方法、及びプログラム。

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120020415A1 (en) * 2008-01-18 2012-01-26 Hua Yang Method for assessing perceptual quality
CN106303156A (zh) * 2016-08-29 2017-01-04 厦门美图之家科技有限公司 对视频去噪的方法、应用及移动终端
CN107230208A (zh) * 2017-06-27 2017-10-03 江苏开放大学 一种高斯噪声的图像噪声强度估计方法
CN109584204A (zh) * 2018-10-15 2019-04-05 上海途擎微电子有限公司 一种图像噪声强度估计方法、存储介质、处理及识别装置
WO2020105520A1 (ja) * 2018-11-21 2020-05-28 日本電信電話株式会社 評価装置、評価方法、及びプログラム。
CN110278485A (zh) * 2019-07-29 2019-09-24 北京华雨天成文化传播有限公司 一种评估视频质量的方法及装置
CN111047587A (zh) * 2019-12-27 2020-04-21 山东超越数控电子股份有限公司 图像的噪声估计方法、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王宇庆: "局部方差在图像质量评价中的应用", 中国光学, vol. 4, no. 5, 31 October 2011 (2011-10-31), pages 531 - 536 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113709560A (zh) * 2021-03-31 2021-11-26 腾讯科技(深圳)有限公司 视频剪辑方法、装置、设备及存储介质
CN113709560B (zh) * 2021-03-31 2024-01-02 腾讯科技(深圳)有限公司 视频剪辑方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US20220261960A1 (en) Super-resolution reconstruction method and related apparatus
EP3852068A1 (en) Method for training generative network, method for generating near-infrared image and apparatuses
CN111182254B (zh) 一种视频处理方法、装置、设备及存储介质
CN111556278B (zh) 一种视频处理的方法、视频展示的方法、装置及存储介质
CN112492388B (zh) 视频处理方法、装置、设备以及存储介质
JP6735927B2 (ja) ビデオコンテンツの要約処理
US20150003727A1 (en) Background detection as an optimization for gesture recognition
CN111654746B (zh) 视频的插帧方法、装置、电子设备和存储介质
CN106254952A (zh) 视频质量动态控制方法及装置
CN110287891B (zh) 基于人体关键点的手势控制方法、装置及电子设备
CN111654723B (zh) 视频质量提升方法、装置、电子设备和存储介质
CN111524166B (zh) 视频帧的处理方法和装置
CN108369750B (zh) 用于虚拟现实图像的图像增强的方法和装置
CN112584077A (zh) 视频的插帧方法、装置及电子设备
CN113014936B (zh) 视频插帧方法、装置、设备以及存储介质
CN113688907B (zh) 模型训练、视频处理方法,装置,设备以及存储介质
CN112584076B (zh) 视频的插帧方法、装置及电子设备
CN111524123B (zh) 用于处理图像的方法和装置
US10572764B1 (en) Adaptive stereo rendering to reduce motion sickness
CN111768377B (zh) 图像色彩评估方法、装置、电子设备及存储介质
JP7367187B2 (ja) 非遮蔽ビデオオーバーレイ
CN112102462A (zh) 图像的渲染方法、装置
CN111539948B (zh) 视频质量评估的方法、装置、电子设备及存储介质
US20180314916A1 (en) Object detection with adaptive channel features
CN111784757A (zh) 深度估计模型的训练方法、深度估计方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination