CN116543373A - 基于区块链的直播视频大数据智能分析和优化方法及系统 - Google Patents

基于区块链的直播视频大数据智能分析和优化方法及系统 Download PDF

Info

Publication number
CN116543373A
CN116543373A CN202310402959.7A CN202310402959A CN116543373A CN 116543373 A CN116543373 A CN 116543373A CN 202310402959 A CN202310402959 A CN 202310402959A CN 116543373 A CN116543373 A CN 116543373A
Authority
CN
China
Prior art keywords
image
signal
noise ratio
denoising
live video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310402959.7A
Other languages
English (en)
Other versions
CN116543373B (zh
Inventor
王军利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiamuan Technology Co ltd
Original Assignee
Beijing Jiamuan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiamuan Technology Co ltd filed Critical Beijing Jiamuan Technology Co ltd
Priority to CN202310402959.7A priority Critical patent/CN116543373B/zh
Publication of CN116543373A publication Critical patent/CN116543373A/zh
Application granted granted Critical
Publication of CN116543373B publication Critical patent/CN116543373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/164Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/50Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using hash chains, e.g. blockchains or hash trees
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于区块链的直播视频大数据智能分析和优化方法及系统,涉及图像识别技术领域。该方法包括:对于某一段直播视频,对第一帧图像进行图像信噪比检测;基于检测结果,采用不同方式去噪,以确定待识别图像;利用基于超分辨率编码纠错的OCR模型,对待识别图像中的文字进行识别;若文字识别结果中包含预置的非法词汇,则直接将图像中对应的非法词汇区域进行遮挡;重复上述步骤,直至完成整个直播视频的分析和优化;完成优化后,获取并将操作人员身份、原直播视频、优化后直播视频和优化时间上传至区块链,完成上链存储。本发明结合多种数据模型,实现高效精准的图像文字识别;并利用区块链技术实现核心数据上链存储,确保数据安全。

Description

基于区块链的直播视频大数据智能分析和优化方法及系统
技术领域
本发明涉及图像识别技术领域,具体而言,涉及一种基于区块链的直播视频大数据智能分析和优化方法及系统。
背景技术
随着直播行业的高速发展,越来越多的直播视频出现在网络中。然而在海量的直播视频中,经常会出现部分低质量视频,严重影响了直播行业的良性发展。尽管部分信息技术已经应用于直播视频的分析和优化,但分析和优化效果仍然不够理想。
随着信息技术的不断更新换代,能够为海量直播视频的智能分析和优化提供直接的支持;同时,随着区块链技术的不断发展,也能够有效地提升直播视频优化过程的安全性。因此,深度结合现代信息技术和区块链技术,提出一种基于区块链的直播视频大数据智能分析和优化方法及系统有非常重要的价值和意义。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种基于区块链的直播视频大数据智能分析和优化方法及系统,结合基于能量泛函分割的像素加权去噪模型、基于层级递增式多网络模块智能连接的低耗图像去噪模型、基于超分辨率编码纠错的OCR模型,实现高效精准的图像文字识别;并利用区块链技术实现核心数据上链存储,确保数据安全。
为解决上述技术问题,本发明采用的技术方案为:
第一方面,本发明实施例提供一种基于区块链的直播视频大数据智能分析和优化方法,包括以下步骤:
对于某一段直播视频,对第一帧图像进行图像信噪比检测,以得到图像信噪比;
若图像信噪比大于预置的第一信噪比阈值,则直接将该图像作为待识别图像;
若图像信噪比小于预置的第一信噪比阈值且大于预置的第二信噪比阈值,则利用基于能量泛函分割的像素加权去噪模型对该图像进行去噪,将去噪后的图像作为待识别图像;其中,第一信噪比阈值大于第二信噪比阈值;
若图像信噪比小于预置的第二信噪比阈值,则利用基于层级递增式多网络模块智能连接的低耗图像去噪模型对该图像进行去噪,将去噪后的图像作为待识别图像;
利用基于超分辨率编码纠错的OCR模型,对待识别图像中的文字进行识别,得到文字识别结果;
若文字识别结果中包含预置的非法词汇,则直接将图像中对应的非法词汇区域进行遮挡;
重复上述步骤,对直播视频中的每一帧图像进行分析和优化,直至完成整个直播视频的分析和优化;完成优化后,获取并将操作人员身份、原直播视频、优化后直播视频和优化时间上传至区块链,完成上链存储。
本方法结合信噪比检测,针对不同信噪比的图像采用不同方式进行针对性的去噪处理;对信噪比较低的图像,利用基于能量泛函分割的像素加权去噪模型进行去噪处理,该模型使用能量泛函最小化方法对图像进行精准分割,并根据分割结果对像素加权平均过程中的所有像素分配合理的权重,确保了图像去噪的有效性;对信噪比极低的图像,利用基于层级递增式多网络模块智能连接的低耗图像去噪模型进行去噪处理,该模型的智能连接方式不仅能够保证实现高质量的图像去噪,而且能够最大限度地降低计算资源消耗。针对图像中的文字,利用基于超分辨率编码纠错的OCR模型进行识别,该模型能够在初步的文字识别基础上,较为精准地检测出识别错误并完成纠错过程,确保了文字识别的精准度。对于每一段完成优化的直播视频,利用区块链技术将相关操作人员身份、原直播视频、优化后直播视频、优化时间进行上链存储,确保了系统的安全性。
基于第一方面,在本发明的一些实施例中,上述利用基于能量泛函分割的像素加权去噪模型对该图像进行去噪的方法包括以下步骤:
利用能量泛函最小化方法对图像进行分割,将图像分割为多个区域;
对图像中的每一个像素,根据该像素所在分割区域确定对应区域的像素权重,利用图像内所有像素点的加权平均值来进行像素值更新。
基于第一方面,在本发明的一些实施例中,上述利用基于层级递增式多网络模块智能连接的低耗图像去噪模型对该图像进行去噪的方法包括以下步骤:
分别设置初始的n层卷积神经网络模块、2n层卷积神经网络模块、3n层卷积神经网络模块,并基于预设的噪声图像样本分别进行卷积神经网络优化训练,以得到对应的n层图像去噪网络模块、2n层图像去噪网络模块、3n层图像去噪网络模块;
将n层图像去噪网络模块、噪声检测网络模块、2n层图像去噪网络模块、噪声检测网络模块以及3n层图像去噪网络模块依次进行拼接,以得到并利用基于层级递增式多网络模块智能连接的低耗图像去噪模型对该图像进行去噪。
基于第一方面,在本发明的一些实施例中,上述利用基于超分辨率编码纠错的OCR模型,对待识别图像中的文字进行识别的方法包括以下步骤:
利用普通的OCR模型对待识别图像中的文字进行识别,以得到初步文字识别结果;
针对初步文字识别结果中的任意一个文字,在预置的文字模板图像库中提取对应的文字模板图像,并将对应的文字区域图像和该文字模板图像分别进行超分辨率重建;
对重建后的文字区域图像和文字模板图像分别进行编码,利用欧氏距离计算并根据文字区域图像和文字模板图像之间的相似度进行文字纠错,以得到最终文字识别结果。
第二方面,本发明实施例提供一种基于区块链的直播视频大数据智能分析和优化系统,包括信噪比检测模块、去噪判别处理模块、文字识别模块、图像遮挡模块以及上链存储模块,其中:
信噪比检测模块,用于对于某一段直播视频,对第一帧图像进行图像信噪比检测,以得到图像信噪比;
去噪判别处理模块,用于若图像信噪比大于预置的第一信噪比阈值,则直接将该图像作为待识别图像;若图像信噪比小于预置的第一信噪比阈值且大于预置的第二信噪比阈值,则利用基于能量泛函分割的像素加权去噪模型对该图像进行去噪,将去噪后的图像作为待识别图像;其中,第一信噪比阈值大于第二信噪比阈值;若图像信噪比小于预置的第二信噪比阈值,则利用基于层级递增式多网络模块智能连接的低耗图像去噪模型对该图像进行去噪,将去噪后的图像作为待识别图像;
文字识别模块,用于利用基于超分辨率编码纠错的OCR模型,对待识别图像中的文字进行识别,得到文字识别结果;
图像遮挡模块,用于若文字识别结果中包含预置的非法词汇,则直接将图像中对应的非法词汇区域进行遮挡;
上链存储模块,用于完成优化后,获取并将操作人员身份、原直播视频、优化后直播视频和优化时间上传至区块链,完成上链存储。
本系统通过信噪比检测模块、去噪判别处理模块、文字识别模块、图像遮挡模块以及上链存储模块等多个模块的结合,基于信噪比检测,针对不同信噪比的图像采用不同方式进行针对性的去噪处理;对信噪比较低的图像,利用基于能量泛函分割的像素加权去噪模型进行去噪处理,该模型使用能量泛函最小化方法对图像进行精准分割,并根据分割结果对像素加权平均过程中的所有像素分配合理的权重,确保了图像去噪的有效性;对信噪比极低的图像,利用基于层级递增式多网络模块智能连接的低耗图像去噪模型进行去噪处理,该模型的智能连接方式不仅能够保证实现高质量的图像去噪,而且能够最大限度地降低计算资源消耗。针对图像中的文字,利用基于超分辨率编码纠错的OCR模型进行识别,该模型能够在初步的文字识别基础上,较为精准地检测出识别错误并完成纠错过程,确保了文字识别的精准度。对于每一段完成优化的直播视频,利用区块链技术将相关操作人员身份、原直播视频、优化后直播视频、优化时间进行上链存储,确保了系统的安全性。
第三方面,本申请实施例提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
本发明实施例至少具有如下优点或有益效果:
本发明实施例提供一种基于区块链的直播视频大数据智能分析和优化方法及系统,结合信噪比检测,针对不同信噪比的图像采用不同方式进行针对性的去噪处理;对信噪比较低的图像,利用基于能量泛函分割的像素加权去噪模型进行去噪处理,该模型使用能量泛函最小化方法对图像进行精准分割,并根据分割结果对像素加权平均过程中的所有像素分配合理的权重,确保了图像去噪的有效性;对信噪比极低的图像,利用基于层级递增式多网络模块智能连接的低耗图像去噪模型进行去噪处理,该模型的智能连接方式不仅能够保证实现高质量的图像去噪,而且能够最大限度地降低计算资源消耗。针对图像中的文字,利用基于超分辨率编码纠错的OCR模型进行识别,该模型能够在初步的文字识别基础上,较为精准地检测出识别错误并完成纠错过程,确保了文字识别的精准度。对于每一段完成优化的直播视频,利用区块链技术将相关操作人员身份、原直播视频、优化后直播视频、优化时间进行上链存储,确保了系统的安全性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例一种基于区块链的直播视频大数据智能分析和优化方法的流程图;
图2为本发明实施例一种基于区块链的直播视频大数据智能分析和优化方法中对信噪比较低的图像进行去噪处理的流程图;
图3为本发明实施例一种基于区块链的直播视频大数据智能分析和优化方法中对信噪比极低的图像进行去噪处理的流程图;
图4为本发明实施例一种基于区块链的直播视频大数据智能分析和优化系统的原理框图;
图5为本发明实施例提供的一种电子设备的结构框图。
附图标记说明:100、信噪比检测模块;200、去噪判别处理模块;300、文字识别模块;400、图像遮挡模块;500、上链存储模块;101、存储器;102、处理器;103、通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本发明实施例的描述中,“多个”代表至少2个。
实施例:
如图1-图3所示,第一方面,本发明实施例提供一种基于区块链的直播视频大数据智能分析和优化方法,包括以下步骤:
S1、对于某一段直播视频,对第一帧图像进行图像信噪比检测,以得到图像信噪比;
S2、若图像信噪比大于预置的第一信噪比阈值,则直接将该图像作为待识别图像,无需进行图像优化处理;
S3、若图像信噪比小于预置的第一信噪比阈值且大于预置的第二信噪比阈值,则利用基于能量泛函分割的像素加权去噪模型对该图像进行去噪,将去噪后的图像作为待识别图像;其中,第一信噪比阈值大于第二信噪比阈值;
进一步地,如图2所示,包括:
S31、利用能量泛函最小化方法对图像进行分割,将图像分割为多个区域;
S32、对图像中的每一个像素,根据该像素所在分割区域确定对应区域的像素权重,利用图像内所有像素点的加权平均值来进行像素值更新。
在本发明的一些实施例中,如果图像信噪比较低,利用基于能量泛函分割的像素加权去噪模型对该图像进行去噪,包括:利用能量泛函最小化方法对图像进行分割,将图像分割为多个区域;对图像中的每一个像素,都利用图像内所有像素点的加权平均值来进行像素值更新,具体地,对于任意一个像素,该像素所在分割区域外的像素占1倍权重,该像素所在分割区域内的像素占n倍权重(n可以灵活设置,通常不小于2)。
S4、若图像信噪比小于预置的第二信噪比阈值,则利用基于层级递增式多网络模块智能连接的低耗图像去噪模型对该图像进行去噪,将去噪后的图像作为待识别图像;
进一步地,如图3所示,包括:
S41、分别设置初始的n层卷积神经网络模块、2n层卷积神经网络模块、3n层卷积神经网络模块,并基于预设的噪声图像样本分别进行卷积神经网络优化训练,以得到对应的n层图像去噪网络模块、2n层图像去噪网络模块、3n层图像去噪网络模块;
S42、将n层图像去噪网络模块、噪声检测网络模块、2n层图像去噪网络模块、噪声检测网络模块以及3n层图像去噪网络模块依次进行拼接,以得到并利用基于层级递增式多网络模块智能连接的低耗图像去噪模型对该图像进行去噪。
在本发明的一些实施例中,如果图像信噪比极低,利用基于层级递增式多网络模块智能连接的低耗图像去噪模型对该图像进行去噪,包括:设置一个初始的n层卷积神经网络模块,利用一定数量的含有噪声的图像作为输入,将它们对应的无噪图像作为基准输出,对该卷积神经网络进行多轮次训练优化,得到n层图像去噪网络模块;设置一个初始的2n层卷积神经网络模块,利用更多数量(相比n层图像去噪网络模块训练过程)的含有噪声的图像作为输入,将它们对应的无噪图像作为基准输出,对该卷积神经网络进行多轮次训练优化,得到2n层图像去噪网络模块;设置一个初始的3n层的卷积神经网络模块,利用更多数量(相比2n层图像去噪网络模块训练过程)的含有噪声的图像作为输入,将它们对应的无噪图像作为基准输出,对该卷积神经网络进行多轮次训练优化,得到3n层图像去噪网络模块。将n层图像去噪网络模块、噪声检测网络模块、2n层图像去噪网络模块、噪声检测网络模块、3n层图像去噪网络模块依次进行智能拼接,同时每个图像去噪网络模块末端都可以和最终输出端直接连接,得到基于层级递增式多网络模块智能连接的低耗图像去噪模型。对于噪声检测网络模块,如果计算出图像峰值信噪比较高或极高,发出信号直接让上个图像去噪网络模块输出的图像去噪结果作为最终的输出结果;如果计算出图像峰值信噪比较低或极低,发出信号让上个图像去噪网络模块输出的图像去噪结果继续进入后面的图像去噪网络模块。
S5、利用基于超分辨率编码纠错的OCR模型,对待识别图像中的文字进行识别,得到文字识别结果;
进一步地,包括:利用普通的OCR模型对待识别图像中的文字进行识别,以得到初步文字识别结果;针对初步文字识别结果中的任意一个文字,在预置的文字模板图像库中提取对应的文字模板图像,并将对应的文字区域图像和该文字模板图像分别进行超分辨率重建;对重建后的文字区域图像和文字模板图像分别进行编码,利用欧氏距离计算并根据文字区域图像和文字模板图像之间的相似度进行文字纠错,以得到最终文字识别结果。
在本发明的一些实施例中,首先,利用普通的OCR模型对图像中的文字进行识别,得到初步的文字识别结果。接下来,对于每一个识别出的文字,都进一步完成检测和纠错。具体地,对于任意一个识别出的文字,将该文字区域图像和该文字模板图像(系统中已经存储)分别进行图像超分辨率重建。在此基础上,对该文字区域图像和该文字模板图像分别进行编码,并利用欧式距离计算二者的相似度。如果相似度很高,则认定识别结果准确;如果相似度很低,则认定识别结果不准确,并对该文字进行重新识别(在重新识别过程中,通常利用更复杂的、正确率更高的OCR模型),从而完成纠错过程。
S6、若文字识别结果中包含预置的非法词汇,则直接将图像中对应的非法词汇区域进行遮挡;
S7、重复上述步骤,对直播视频中的每一帧图像进行分析和优化,直至完成整个直播视频的分析和优化;完成优化后,获取并将操作人员身份、原直播视频、优化后直播视频和优化时间上传至区块链,完成上链存储。
本方法结合信噪比检测,针对不同信噪比的图像采用不同方式进行针对性的去噪处理;对信噪比较低的图像,利用基于能量泛函分割的像素加权去噪模型进行去噪处理,该模型使用能量泛函最小化方法对图像进行精准分割,并根据分割结果对像素加权平均过程中的所有像素分配合理的权重,确保了图像去噪的有效性;对信噪比极低的图像,利用基于层级递增式多网络模块智能连接的低耗图像去噪模型进行去噪处理,该模型的智能连接方式不仅能够保证实现高质量的图像去噪,而且能够最大限度地降低计算资源消耗。针对图像中的文字,利用基于超分辨率编码纠错的OCR模型进行识别,该模型能够在初步的文字识别基础上,较为精准地检测出识别错误并完成纠错过程,确保了文字识别的精准度。对于每一段完成优化的直播视频,利用区块链技术将相关操作人员身份、原直播视频、优化后直播视频、优化时间进行上链存储,确保了系统的安全性。
如图4所示,第二方面,本发明实施例提供一种基于区块链的直播视频大数据智能分析和优化系统,包括信噪比检测模块100、去噪判别处理模块200、文字识别模块300、图像遮挡模块400以及上链存储模块500,其中:
信噪比检测模块100,用于对于某一段直播视频,对第一帧图像进行图像信噪比检测,以得到图像信噪比;
去噪判别处理模块200,用于若图像信噪比大于预置的第一信噪比阈值,则直接将该图像作为待识别图像;若图像信噪比小于预置的第一信噪比阈值且大于预置的第二信噪比阈值,则利用基于能量泛函分割的像素加权去噪模型对该图像进行去噪,将去噪后的图像作为待识别图像;其中,第一信噪比阈值大于第二信噪比阈值;若图像信噪比小于预置的第二信噪比阈值,则利用基于层级递增式多网络模块智能连接的低耗图像去噪模型对该图像进行去噪,将去噪后的图像作为待识别图像;
文字识别模块300,用于利用基于超分辨率编码纠错的OCR模型,对待识别图像中的文字进行识别,得到文字识别结果;
图像遮挡模块400,用于若文字识别结果中包含预置的非法词汇,则直接将图像中对应的非法词汇区域进行遮挡;
上链存储模块500,用于完成优化后,获取并将操作人员身份、原直播视频、优化后直播视频和优化时间上传至区块链,完成上链存储。
本系统通过信噪比检测模块100、去噪判别处理模块200、文字识别模块300、图像遮挡模块400以及上链存储模块500等多个模块的结合,基于信噪比检测,针对不同信噪比的图像采用不同方式进行针对性的去噪处理;对信噪比较低的图像,利用基于能量泛函分割的像素加权去噪模型进行去噪处理,该模型使用能量泛函最小化方法对图像进行精准分割,并根据分割结果对像素加权平均过程中的所有像素分配合理的权重,确保了图像去噪的有效性;对信噪比极低的图像,利用基于层级递增式多网络模块智能连接的低耗图像去噪模型进行去噪处理,该模型的智能连接方式不仅能够保证实现高质量的图像去噪,而且能够最大限度地降低计算资源消耗。针对图像中的文字,利用基于超分辨率编码纠错的OCR模型进行识别,该模型能够在初步的文字识别基础上,较为精准地检测出识别错误并完成纠错过程,确保了文字识别的精准度。对于每一段完成优化的直播视频,利用区块链技术将相关操作人员身份、原直播视频、优化后直播视频、优化时间进行上链存储,确保了系统的安全性。
如图5所示,第三方面,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的方法及系统,也可以通过其它的方式实现。以上所描述的方法及系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (7)

1.一种基于区块链的直播视频大数据智能分析和优化方法,其特征在于,包括以下步骤:
对于某一段直播视频,对第一帧图像进行图像信噪比检测,以得到图像信噪比;
若图像信噪比大于预置的第一信噪比阈值,则直接将该图像作为待识别图像;
若图像信噪比小于预置的第一信噪比阈值且大于预置的第二信噪比阈值,则利用基于能量泛函分割的像素加权去噪模型对该图像进行去噪,将去噪后的图像作为待识别图像;其中,第一信噪比阈值大于第二信噪比阈值;
若图像信噪比小于预置的第二信噪比阈值,则利用基于层级递增式多网络模块智能连接的低耗图像去噪模型对该图像进行去噪,将去噪后的图像作为待识别图像;
利用基于超分辨率编码纠错的OCR模型,对待识别图像中的文字进行识别,得到文字识别结果;
若文字识别结果中包含预置的非法词汇,则直接将图像中对应的非法词汇区域进行遮挡;
重复上述步骤,对直播视频中的每一帧图像进行分析和优化,直至完成整个直播视频的分析和优化;完成优化后,获取并将操作人员身份、原直播视频、优化后直播视频和优化时间上传至区块链,完成上链存储。
2.根据权利要求1所述的一种基于区块链的直播视频大数据智能分析和优化方法,其特征在于,所述利用基于能量泛函分割的像素加权去噪模型对该图像进行去噪的方法包括以下步骤:
利用能量泛函最小化方法对图像进行分割,将图像分割为多个区域;
对图像中的每一个像素,根据该像素所在分割区域确定对应区域的像素权重,利用图像内所有像素点的加权平均值来进行像素值更新。
3.根据权利要求1所述的一种基于区块链的直播视频大数据智能分析和优化方法,其特征在于,所述利用基于层级递增式多网络模块智能连接的低耗图像去噪模型对该图像进行去噪的方法包括以下步骤:
分别设置初始的n层卷积神经网络模块、2n层卷积神经网络模块、3n层卷积神经网络模块,并基于预设的噪声图像样本分别进行卷积神经网络优化训练,以得到对应的n层图像去噪网络模块、2n层图像去噪网络模块、3n层图像去噪网络模块;
将n层图像去噪网络模块、噪声检测网络模块、2n层图像去噪网络模块、噪声检测网络模块以及3n层图像去噪网络模块依次进行拼接,以得到并利用基于层级递增式多网络模块智能连接的低耗图像去噪模型对该图像进行去噪。
4.根据权利要求1所述的一种基于区块链的直播视频大数据智能分析和优化方法,其特征在于,所述利用基于超分辨率编码纠错的OCR模型,对待识别图像中的文字进行识别的方法包括以下步骤:
利用普通的OCR模型对待识别图像中的文字进行识别,以得到初步文字识别结果;
针对初步文字识别结果中的任意一个文字,在预置的文字模板图像库中提取对应的文字模板图像,并将对应的文字区域图像和该文字模板图像分别进行超分辨率重建;
对重建后的文字区域图像和文字模板图像分别进行编码,利用欧氏距离计算并根据文字区域图像和文字模板图像之间的相似度进行文字纠错,以得到最终文字识别结果。
5.一种基于区块链的直播视频大数据智能分析和优化系统,其特征在于,包括信噪比检测模块、去噪判别处理模块、文字识别模块、图像遮挡模块以及上链存储模块,其中:
信噪比检测模块,用于对于某一段直播视频,对第一帧图像进行图像信噪比检测,以得到图像信噪比;
去噪判别处理模块,用于若图像信噪比大于预置的第一信噪比阈值,则直接将该图像作为待识别图像;若图像信噪比小于预置的第一信噪比阈值且大于预置的第二信噪比阈值,则利用基于能量泛函分割的像素加权去噪模型对该图像进行去噪,将去噪后的图像作为待识别图像;其中,第一信噪比阈值大于第二信噪比阈值;若图像信噪比小于预置的第二信噪比阈值,则利用基于层级递增式多网络模块智能连接的低耗图像去噪模型对该图像进行去噪,将去噪后的图像作为待识别图像;
文字识别模块,用于利用基于超分辨率编码纠错的OCR模型,对待识别图像中的文字进行识别,得到文字识别结果;
图像遮挡模块,用于若文字识别结果中包含预置的非法词汇,则直接将图像中对应的非法词汇区域进行遮挡;
上链存储模块,用于完成优化后,获取并将操作人员身份、原直播视频、优化后直播视频和优化时间上传至区块链,完成上链存储。
6.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-4中任一项所述的方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-4中任一项所述的方法。
CN202310402959.7A 2023-04-14 2023-04-14 基于区块链的直播视频大数据智能分析和优化方法及系统 Active CN116543373B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310402959.7A CN116543373B (zh) 2023-04-14 2023-04-14 基于区块链的直播视频大数据智能分析和优化方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310402959.7A CN116543373B (zh) 2023-04-14 2023-04-14 基于区块链的直播视频大数据智能分析和优化方法及系统

Publications (2)

Publication Number Publication Date
CN116543373A true CN116543373A (zh) 2023-08-04
CN116543373B CN116543373B (zh) 2024-05-28

Family

ID=87455247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310402959.7A Active CN116543373B (zh) 2023-04-14 2023-04-14 基于区块链的直播视频大数据智能分析和优化方法及系统

Country Status (1)

Country Link
CN (1) CN116543373B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116723343A (zh) * 2023-08-08 2023-09-08 北京赛博日新科技有限公司 基于区块链的网络直播大数据智能监测和存储方法及系统
CN116723343B (zh) * 2023-08-08 2024-06-07 北京赛博日新科技有限公司 基于区块链的网络直播大数据智能监测和存储方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636733A (zh) * 2018-10-26 2019-04-16 华中科技大学 基于深度神经网络的荧光图像解卷积方法及系统
US20190266703A1 (en) * 2018-02-26 2019-08-29 Abc Fintech Co., Ltd. Image preprocessing method and device for jpeg compressed file
CN111860377A (zh) * 2020-07-24 2020-10-30 中国平安人寿保险股份有限公司 基于人工智能的直播方法、装置、电子设备及存储介质
CN114241484A (zh) * 2022-02-23 2022-03-25 北京嘉沐安科技有限公司 一种面向社交网络的图像大数据精准检索方法及系统
CN114494982A (zh) * 2022-04-08 2022-05-13 北京嘉沐安科技有限公司 一种基于人工智能的直播视频大数据精准推荐方法及系统
CN114581207A (zh) * 2022-05-09 2022-06-03 北京嘉沐安科技有限公司 一种面向电商平台的商品图像大数据精准推送方法及系统
CN114596441A (zh) * 2022-03-17 2022-06-07 北京嘉沐安科技有限公司 一种面向网络直播社交大数据的海量图像去噪方法及系统
CN115100640A (zh) * 2022-08-29 2022-09-23 北京海上升科技有限公司 基于人工智能的智慧超市商品销售大数据检测方法及系统
CN115171144A (zh) * 2022-09-05 2022-10-11 北京吉道尔科技有限公司 一种基于区块链的智慧教育试卷大数据评阅方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190266703A1 (en) * 2018-02-26 2019-08-29 Abc Fintech Co., Ltd. Image preprocessing method and device for jpeg compressed file
CN109636733A (zh) * 2018-10-26 2019-04-16 华中科技大学 基于深度神经网络的荧光图像解卷积方法及系统
CN111860377A (zh) * 2020-07-24 2020-10-30 中国平安人寿保险股份有限公司 基于人工智能的直播方法、装置、电子设备及存储介质
CN114241484A (zh) * 2022-02-23 2022-03-25 北京嘉沐安科技有限公司 一种面向社交网络的图像大数据精准检索方法及系统
CN114596441A (zh) * 2022-03-17 2022-06-07 北京嘉沐安科技有限公司 一种面向网络直播社交大数据的海量图像去噪方法及系统
CN114494982A (zh) * 2022-04-08 2022-05-13 北京嘉沐安科技有限公司 一种基于人工智能的直播视频大数据精准推荐方法及系统
CN114581207A (zh) * 2022-05-09 2022-06-03 北京嘉沐安科技有限公司 一种面向电商平台的商品图像大数据精准推送方法及系统
CN115100640A (zh) * 2022-08-29 2022-09-23 北京海上升科技有限公司 基于人工智能的智慧超市商品销售大数据检测方法及系统
CN115171144A (zh) * 2022-09-05 2022-10-11 北京吉道尔科技有限公司 一种基于区块链的智慧教育试卷大数据评阅方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘会林;罗聪;秦琴;张紫茵;: "基于偏微分方程的图像去噪算法对比和改进", 数码设计, no. 03 *
毕国堂;唐权华;陈立伟;: "基于视频流体模型的图像超分辨率重建", 计算机工程, no. 04 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116723343A (zh) * 2023-08-08 2023-09-08 北京赛博日新科技有限公司 基于区块链的网络直播大数据智能监测和存储方法及系统
CN116723343B (zh) * 2023-08-08 2024-06-07 北京赛博日新科技有限公司 基于区块链的网络直播大数据智能监测和存储方法及系统

Also Published As

Publication number Publication date
CN116543373B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
US11113816B2 (en) Image segmentation apparatus, method and relevant computing device
US10423852B1 (en) Text image processing using word spacing equalization for ICR system employing artificial neural network
CN111369565B (zh) 一种基于图卷积网络的数字病理图像的分割与分类方法
CN110321913B (zh) 一种文本识别方法及装置
CN110084172B (zh) 文字识别方法、装置和电子设备
CN115661144A (zh) 基于可变形U-Net的自适应医学图像分割方法
CN111914654B (zh) 一种文本版面分析方法、装置、设备和介质
CN113191969A (zh) 一种基于注意力对抗生成网络的无监督图像除雨方法
CN110070548B (zh) 一种深度学习训练样本优化方法
CN112464845B (zh) 票据识别方法、设备及计算机存储介质
CN116562991B (zh) 面向元宇宙电商平台的商品大数据信息识别方法及系统
CN116311214B (zh) 车牌识别方法和装置
US20220262006A1 (en) Device for detecting an edge using segmentation information and method thereof
CN112597997A (zh) 感兴趣区域确定方法、图像内容识别方法及装置
CN116543373B (zh) 基于区块链的直播视频大数据智能分析和优化方法及系统
CN110796003B (zh) 车道线检测方法、装置及电子设备
CN116705250A (zh) 一种医疗影像大数据的低耗优化和智能存储方法及系统
CN114925239B (zh) 基于人工智能的智慧教育目标视频大数据检索方法及系统
CN115358952A (zh) 一种基于元学习的图像增强方法、系统、设备和存储介质
Yousef et al. Automatic license plate detection and recognition for Jordanian vehicles
CN115424250A (zh) 一种车牌识别方法及装置
CN116092105B (zh) 表格结构的解析方法和装置
CN111507956B (zh) 一种纳米线数量统计方法及系统
CN115796145B (zh) 一种网页文本的采集方法、系统、服务器及可读存储介质
CN116469106A (zh) 文档图像矫正方法、装置、电子设备及可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant