CN116684626A - 视频压缩方法和共享售卖柜 - Google Patents

视频压缩方法和共享售卖柜 Download PDF

Info

Publication number
CN116684626A
CN116684626A CN202310976445.2A CN202310976445A CN116684626A CN 116684626 A CN116684626 A CN 116684626A CN 202310976445 A CN202310976445 A CN 202310976445A CN 116684626 A CN116684626 A CN 116684626A
Authority
CN
China
Prior art keywords
video
target
image
time range
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310976445.2A
Other languages
English (en)
Other versions
CN116684626B (zh
Inventor
刘振杰
刘航
熊伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Xingyun Kaiwu Technology Co ltd
Original Assignee
Guangdong Xingyun Kaiwu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Xingyun Kaiwu Technology Co ltd filed Critical Guangdong Xingyun Kaiwu Technology Co ltd
Priority to CN202310976445.2A priority Critical patent/CN116684626B/zh
Publication of CN116684626A publication Critical patent/CN116684626A/zh
Application granted granted Critical
Publication of CN116684626B publication Critical patent/CN116684626B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07FCOIN-FREED OR LIKE APPARATUS
    • G07F9/00Details other than those peculiar to special kinds or types of apparatus
    • G07F9/002Vending machines being part of a centrally controlled network of vending machines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

本发明提供一种视频压缩方法和共享售卖柜,应用于售卖机技术领域,该方法应用于共享售卖柜,共享售卖柜包括摄像头,该方法包括:获取所述摄像头拍摄的用户取放货品过程的第一视频;确定所述第一视频中的目标视频片段,所述目标视频片段中包括多个目标图像帧,多个所述目标图像帧中相邻的图像帧中第一图像区域不同;所述第一图像区域为所述摄像头对目标区域拍摄得到的;基于所述目标视频片段,对所述第一视频进行压缩,得到第二视频;将所述第二视频上传至服务器;所述第二视频用于对所述用户取放的货品进行识别。该方案中,一方面可以减少带宽压力,另一方面可以缩短传输时间,减少识别和结算时间,缩短了结算周期,提高了结算效率。

Description

视频压缩方法和共享售卖柜
技术领域
本发明涉及售卖机技术领域,尤其涉及一种视频压缩方法和共享售卖柜。
背景技术
目前售卖机主要分为两类,一类是传统的货道售卖机,用户完成支付后售卖机从货道上推出对应的货物。另一类是开放式的售卖柜,此类售卖柜基于用户的授信,用户可以解锁柜门自行取用设备中的商品,然后基于传感器感知的结果进行商品识别和结算。
现有技术中,存在一种开放式的售卖柜基于摄像头进行感知,摄像头采集的图像通过图像分析模型确定用户所取出的商品。通常限制于技术能力,大多数设备厂商没有复杂的视频图像处理模型的开发能力,基于摄像头图像识别的方案通常基于第三方的付费接口,因此,此类设备的结算周期较长,短则数十秒,长则数分钟。
发明内容
本发明提供一种视频压缩方法和共享售卖柜,用以解决现有技术中结算周期较长的缺陷,实现一种结算时间较短、结算效率高的方案。
本发明提供一种视频压缩方法,应用于共享售卖柜,所述共享售卖柜包括摄像头,所述方法包括:
获取所述摄像头拍摄的用户取放货品过程的第一视频;
确定所述第一视频中的目标视频片段,所述目标视频片段中包括多个目标图像帧,多个所述目标图像帧中相邻的图像帧中第一图像区域不同;所述第一图像区域为所述摄像头对目标区域拍摄得到的;
基于所述目标视频片段,对所述第一视频进行压缩,得到第二视频;将所述第二视频上传至服务器;所述第二视频用于对所述用户取放的货品进行识别。
根据本发明提供的一种视频压缩方法,所述确定所述第一视频中的目标视频片段,包括:
从所述第一视频中按照第一预设时间间隔抽取多个图像帧;
利用图像检测模型,确定所述多个图像帧中相邻的图像帧中第一图像区域是否相同;
若所述相邻的图像帧中第一图像区域不同,则将所述相邻的图像帧作为所述目标图像帧;
根据确定出的多个目标图像帧,得到所述目标视频片段;
基于所述目标视频片段,对所述第一视频进行压缩,得到第二视频,包括:
基于所述目标视频片段的时间范围,对所述第一视频进行压缩,得到第二视频。
根据本发明提供的一种视频压缩方法,所述基于所述目标视频片段的时间范围,对所述第一视频进行压缩,得到所述第二视频,包括:
截取所述第一视频中处于目标时间范围的视频片段,得到所述第二视频;
对所述第一视频中处于目标时间范围外的视频片段进行图像压缩处理,得到所述第二视频;
所述目标时间范围为基于所述目标视频片段的时间范围得到的。
根据本发明提供的一种视频压缩方法,所述方法还包括:
将所述目标视频片段的时间范围之前的第一预设时长,所述目标视频片段的时间范围之后的第二预设时长,以及所述目标视频片段的时间范围,作为所述目标时间范围。
根据本发明提供的一种视频压缩方法,所述截取所述第一视频中处于目标时间范围的视频片段之后,还包括:
对截取的视频片段中每个图像帧的第二图像区域进行裁剪,得到所述第二视频;所述第二图像区域为所述图像帧中所述第一图像区域之外的区域。
根据本发明提供的一种视频压缩方法,所述对所述第一视频中处于所述目标时间范围外的视频片段进行图像压缩处理,得到所述第二视频,包括:
降低所述第一视频在所述目标时间范围外的视频帧的分辨率,得到所述第二视频;或,
对所述第一视频在所述目标时间范围外的视频帧按照第二预设时间间隔进行抽帧,得到所述第二视频。
根据本发明提供的一种视频压缩方法,所述方法还包括:
在所述目标视频片段的数量为多个的情况下,按照所述目标视频片段在所述第一视频中的时间顺序进行拼接。
本发明还提供一种视频压缩方法,应用于服务器,所述方法包括:
接收共享售卖柜发送的第二视频,所述第二视频为所述共享售卖柜基于目标视频片段对第一视频进行压缩得到的;所述第一视频为所述共享售卖柜的摄像头拍摄的用户取放货品过程的视频;所述目标视频片段中包括多个目标图像帧,多个所述目标图像帧中相邻的图像帧中第一图像区域不同;所述第一图像区域为所述摄像头对目标区域拍摄得到的;
向第三方设备发送所述第二视频,所述第二视频用于对所述用户取放的货品进行识别。
本发明还提供一种视频压缩装置,应用于共享售卖柜,所述共享售卖柜包括摄像头,所述装置包括:
获取模块,用于获取所述摄像头拍摄的用户取放货品过程的第一视频;
处理模块,用于确定所述第一视频中的目标视频片段,所述目标视频片段中包括多个目标图像帧,多个所述目标图像帧中相邻的图像帧中第一图像区域不同;所述第一图像区域为所述摄像头对目标区域拍摄得到的;
基于所述目标视频片段,对所述第一视频进行压缩,得到第二视频;
发送模块,用于将所述第二视频上传至服务器;所述第二视频用于对所述用户取放的货品进行识别。
本发明还提供一种视频压缩装置,应用于服务器,所述装置包括:
接收模块,用于接收共享售卖柜发送的第二视频,所述第二视频为所述共享售卖柜基于目标视频片段对第一视频进行压缩得到的;所述第一视频为所述共享售卖柜的摄像头拍摄的用户取放货品过程的视频;所述目标视频片段中包括多个目标图像帧,多个所述目标图像帧中相邻的图像帧中第一图像区域不同;所述第一图像区域为所述摄像头对目标区域拍摄得到的;
发送模块,用于向第三方设备发送所述第二视频,所述第二视频用于对所述用户取放的货品进行识别。
本发明还提供一种共享售卖柜,包括:
柜体,摄像头,以及与所述摄像头连接的主控板;
其中,所述摄像头和所述主控板设置在所述柜体内;
所述摄像头采集的数据,用于与所述共享售卖柜通信的服务器基于所述采集的数据以及用户的支付信息进行订单结算;
以及所述主控板用于执行如上述任一种所述视频压缩方法。
本发明还提供一种主控设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述视频压缩方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述视频压缩方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述视频压缩方法。
本发明提供的视频压缩方法和共享售卖柜,由于在共享售卖柜侧基于图像帧中第一图像区域的变化对第一视频进行了压缩处理,第一图像区域为摄像头对目标区域拍摄得到的;因此传输的数据量较少,可以减少带宽压力,而且可以缩短传输时间,减少识别和结算时间,提高了结算效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的视频压缩方法的流程示意图之一;
图2是本发明提供的视频压缩方法的摄像头拍摄的用户取放货物过程的图像示意图;
图3是本发明提供的视频压缩方法的共享售卖柜原理示意图;
图4是本发明提供的视频压缩方法的视频截取原理示意图之一;
图5是本发明提供的视频压缩方法的流程示意图之二;
图6是本发明提供的视频压缩装置的结构示意图之一;
图7是本发明提供的视频压缩装置的结构示意图之二;
图8是本发明提供的主控设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先,对本发明实施例涉及的名词和应用场景进行介绍:
目前售卖机主要分为两类,一类是传统的货道售卖机,用户完成支付后售卖机从货道上推出对应的货物。另一类是开放式的售卖柜,此类售卖柜基于用户的授信,用户可以解锁柜门自行取用设备中的商品,然后基于传感器感知的结果进行商品识别和结算。
本发明实施例的方法主要针对开放式的售卖柜,如共享售卖柜。
在现有技术中,对于基于摄像头进行感知识别并结算的方案,一般情况下考虑到第三方接口的安全性,不会向共享售卖柜设备下放调用权限,而是共享售卖柜设备将视频片段先传输到服务器,然后经过服务器进行调用。该方案在识别结算时,时间比较长。
因此,本发明实施例中对传输的视频片段进行压缩,在减少数据传输量,减少传输时间的基础上,而且能保证识别的准确性。
下面结合图1-图8以具体的实施例对本发明实施例的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1是本发明提供的视频压缩方法的流程示意图之一。本实施例的方法应用于共享售卖柜,所述共享售卖柜包括摄像头,如图1所示,本实施例提供的方法包括:
步骤101、获取摄像头拍摄的用户取放货品过程的第一视频;
具体的,如图3所示,共享售卖柜包括柜体、设置在所述柜体内的多层货架、主控板和摄像头;例如,摄像头安装在共享售卖柜的上方;
其中,主控板与摄像头连接,并基于摄像头采集的数据进行货品识别以及订单结算,例如,主控板与服务器进行通信,将摄像头采集的数据上传至服务器,由服务器确定用户拿了什么商品,并进行订单结算。
需要说明的是,图3中只是示意,摄像头可以不止一个,例如一层货架可以有一个摄像头。
从摄像头的拍摄角度可以知道,摄像头可以拍共享售卖柜的完整货架,然后对外还会延伸一部分。这与货品识别算法有关,货品识别算法需要拍到货品被拿出以及放入的过程。
步骤102、确定第一视频中的目标视频片段,目标视频片段中包括多个目标图像帧,多个目标图像帧中相邻的图像帧中第一图像区域不同;所述第一图像区域为所述摄像头对目标区域拍摄得到的;
具体的,如果只是单纯检测画面变化,摄像头可能会拍到用户,用户在取放货品过程中通常是动的,而非静止,因此,拍摄到的视频片段中图像帧之间通常会有差异,即会将较多对识别货品没有帮助的图像帧作为关键片段,压缩效果较差。因此,感知用户是否有取货的行为,需要对特定的目标区域进行监视才有意义。图2为摄像头拍摄的用户取货过程的图像20,该图像20中除了货架区域图像10还包括大面积其它的图像区域,该图像区域中可能包含用户肢体的图像,以及其它无关区域的图像。
首先需要对检测变化的目标区域进行设定,目标区域对应的第一图像区域如图2中货架区域图像10的区域,该区域为摄像头拍摄的货架区域的图像。该目标区域一般选择货架区域,或者也可以选择取货必经的区域,该区域可以在共享售卖柜出厂前设定。
可以通过图像检测模型,利用共享售卖柜设备的边缘算力检测第一视频包括的图像帧中第一图像区域是否发生变化,并记录变化的时间。
图像检测模型可以是经过训练得到的,图像检测模型例如为基于神经网络算法建立的人工智能(Artificial Intelligence,AI)模型。
图像检测模型可以是在服务器训练之后,安装在共享售卖柜的主控板中。
步骤103、基于目标视频片段对第一视频进行压缩,得到第二视频;将第二视频上传至服务器;第二视频用于对用户取放的货品进行识别。
具体的,为了减少数据传输量,以及货品识别和结算的周期,提高结算效率,可以对摄像头拍摄的第一视频进行压缩处理,例如只截取关键片段或对非关键片段降低图像质量等,截取的原则是要截取用户取放货品过程的关键片段,即拿货品或放货品的视频片段,因此,基于第一图像区域发生变化的视频片段,对第一视频进行压缩处理,得到第二视频;将第二视频上传至服务器,由服务器调用第三方接口进行货品识别并对用户的订单进行结算。
本实施例中,在视频上报过程中,可以在共享售卖柜设备本地完成压缩后进行传输,一方面可以减少带宽压力,另一方面可以缩短传输时间,减少识别时间。
综上,共享售卖柜设备在本地对摄像头拍摄的视频进行压缩,然后将重要的视频片段上报至服务器,服务器基于上报的视频,调用第三方视频识别服务接口,对用户取放的货品进行识别以及订单结算。
本实施例的方法,由于在共享售卖柜侧基于图像帧中第一图像区域的变化对第一视频进行了压缩处理,第一图像区域为所述摄像头对目标区域拍摄得到的;因此传输的数据量较少,可以减少带宽压力,而且可以缩短传输时间,减少识别和结算时间,提高了结算效率。
可选地,步骤102具体可以通过如下方式实现:
从所述第一视频中按照第一预设时间间隔抽取多个图像帧;
利用图像检测模型,确定所述多个图像帧中相邻的图像帧中第一图像区域是否相同;
若所述相邻的图像帧中第一图像区域不同,则将所述相邻的图像帧作为所述目标图像帧;
根据确定出的多个目标图像帧,得到所述目标视频片段;
步骤103中“基于所述目标视频片段对所述第一视频进行压缩,得到所述第二视频”具体可以通过如下方式实现:
基于所述目标视频片段的时间范围,对所述第一视频进行压缩,得到所述第二视频。
具体的,从第一视频中按照第一预设时间间隔抽取多个图像帧,对多个所述图像帧中第一图像区域进行比较,确定相邻的图像帧中第一图像区域是否发生变化,若发生变化,则将该相邻的图像帧作为目标图像帧,将多个目标图像帧以及相邻的图像帧之间的图像帧(由于图像帧为按照第一预设时间间隔抽取的)进行拼接,得到目标视频片段。可以理解的是,对于多个连续相邻的目标图像帧可以归类到一组,在进行拼接处理时,需要将同组的目标图像帧以及同组目标图像帧之间的图像帧连贯拼接成目标视频片段。意味着,在一个订单过程中,可以包括多个目标视频片段。每个目标视频片段其实都对应用户的一次进入目标区域的动作行为。在部分实施例中,可以直接将所有的目标视频片段裁剪出来拼接成第二视频,以用作上传服务器的商品识别片段。
其中,第一预设时间间隔可以基于识别效果的准确性以及图像检测的效率进行综合考虑。
目标视频片段对应的时间区间,为发生变化的时间范围,基于发生变化的时间范围,对第一视频进行压缩,得到第二视频,例如,对该时间范围之外的视频片段进行删除,或降低图像质量等。
上述实施方式中,从所述第一视频中按照第一预设时间间隔抽取多个图像帧;利用图像检测模型,确定所述多个图像帧中相邻的图像帧中第一图像区域是否相同;进而根据确定出的多个目标图像帧,得到所述目标视频片段,效率较高,进一步,基于所述目标视频片段的时间范围,对所述第一视频进行压缩,得到所述第二视频,由于目标视频片段为识别用户取放货品的重要片段,因此基于该目标视频片段的时间范围,对所述第一视频进行压缩,在减少数据传输量的基础上,可以保证识别结果的准确性。
可选地,“基于所述目标视频片段的时间范围,对所述第一视频进行压缩,得到所述第二视频”可以通过如下方式实现:
截取所述第一视频中处于目标时间范围的视频片段,得到所述第二视频;或,
对所述第一视频中处于目标时间范围外的视频片段进行图像压缩处理,得到所述第二视频;
所述目标时间范围为基于所述目标视频片段的时间范围得到的。
具体的,为了保证识别准确性,可以先确定目标时间范围,即在目标视频片段的时间范围基础上进行前后延伸,得到目标时间范围。
可选地,将所述目标视频片段的时间范围之前的第一预设时长,所述目标视频片段的时间范围之后的第二预设时长,以及所述目标视频片段的时间范围,作为所述目标时间范围。
可选地,第一预设时长与第二预设时长可以相同,也可以不同。
如图4所示,根据检测到区域画面发生变化的目标视频片段,向该目标视频片段的前后拓展若干时间,确定出重要的关键片段;原因是识别图像变化的时候,本方案只是识别了第一图像区域,但是为了保证过程连贯,降低对识别结果准确性的影响,向前后也延伸一定的时间,例如,前后延长0.5s。
压缩可以通过如下几种方式实现:
截取第一视频中处于目标时间范围的视频片段,例如图4中的关键片段,得到该第二视频;或,
对第一视频中处于目标时间范围外的视频片段进行图像压缩处理,得到该第二视频,进行图像压缩处理,可以减少数据传输量。
可选地,“对所述第一视频中处于所述目标时间范围外的视频片段进行图像压缩处理,得到所述第二视频”具体可以采用如下方式实现:
降低所述第一视频在所述目标时间范围外的视频帧的分辨率,得到所述第二视频;或,
对所述第一视频在所述目标时间范围外的视频帧按照第二预设时间间隔进行抽帧,得到所述第二视频。
具体的,关于图像压缩处理,可以通过降低图像质量的方式来实现,例如降低分辨率或者按照第二预设时间间隔进行抽帧,例如可以间隔多帧抽取一帧图像。
在其它实施例中,还可以对目标时间范围内的视频帧适当的降低分辨率,以减小数据传输量,但降低后的分辨率需要保证能够识别出用户取放的货品。
上述方案简单来说,就是根据图像检测模型确定哪些视频片段是重要的,然后抽取这些重要视频片段重新拼接或者区分质量地压缩来实现数据传输量的减少,而且为了保障识别结果的准确性,向前后延伸了一定的时长。
可选地,其实摄像头所拍摄的全景图像中,第一图像区域之外的大部分区域对于识别是没有帮助的,意味着可以对这些区域进行裁剪,进一下减小数据传输量,步骤“截取所述第一视频中处于目标时间范围的视频片段”之后,还可以进行如下操作:
对截取的视频片段中每个图像帧的第二图像区域进行裁剪,得到所述第二视频;所述第二图像区域为所述图像帧中所述第一图像区域之外的区域。
具体的,第二图像区域例如图2中虚线框左右边缘的区域,将每个图像帧中的第二图像区域进行裁剪,即裁剪掉图像帧中第二图像区域,得到第二视频,可以进一步减少数据传输量,减少传输时间,提高识别和结算效率,结算周期较短。
可选地,如果第三方接口对图像有特定的尺寸要求,可以通过填充纯色的方式来减少数据传输量。
可选地,步骤“对所述第一视频中处于目标时间范围外的视频片段进行图像压缩处理”之后还可以进行如下操作:
对处理后的第一视频中每个图像帧的第二图像区域进行裁剪,得到所述第二视频;所述第二图像区域为所述图像帧中所述第一图像区域之外的区域。
具体的,该方式中,与前一方式类似,此处不再赘述。
可选地,该方法还包括:
在所述目标视频片段的数量为多个的情况下,按照所述目标视频片段在所述第一视频中的时间顺序进行拼接。
具体的,在目标视频片段的数量为多个的情况下,即如图4中所示的关键片段有多个,且多个关键片段之间不连续,例如间隔时长大于或等于预设时长阈值,则将该多个目标视频片段按照在原第一视频中的时间顺序进行拼接。
由于关键片段被按顺序重新拼接形成新的视频片段中,识别的效果和完整的第一视频没有实际的差异,识别效果较好。
图5是本发明提供的视频压缩方法的流程示意图之二。本实施例的视频压缩方法可以应用于服务器,如图5所示,本实施例提供的视频压缩方法,包括:
步骤501、接收共享售卖柜发送的第二视频,第二视频为共享售卖柜基于目标视频片段对第一视频进行压缩得到的;第一视频为共享售卖柜的摄像头拍摄的用户取放货品过程的视频;目标视频片段中包括多个目标图像帧,多个目标图像帧中相邻的图像帧中第一图像区域不同;第一图像区域为摄像头对目标区域拍摄得到的;
步骤502、向第三方设备发送第二视频,第二视频用于对用户取放的货品进行识别。
本发明实施例的方法,与前述共享售卖柜侧任一方法实施例中的方法,其实现原理和技术效果类似,此次不再赘述。
下面对本发明提供的视频压缩装置进行描述,下文描述的视频压缩装置与上文描述的视频压缩方法可相互对应参照。
图6是本发明提供的视频压缩装置的结构示意图之一。本实施例的视频压缩装置可以应用于共享售卖柜,所述共享售卖柜包括摄像头,如图6所示,本实施例提供的视频压缩装置,包括:
获取模块110,用于获取所述摄像头拍摄的用户取放货品过程的第一视频;
处理模块120,用于确定所述第一视频中的目标视频片段,所述目标视频片段中包括多个目标图像帧,多个所述目标图像帧中相邻的图像帧中第一图像区域不同;所述第一图像区域为所述摄像头对目标区域拍摄得到的;
基于所述目标视频片段,对所述第一视频进行压缩,得到第二视频;
发送模块130,用于将所述第二视频上传至服务器;所述第二视频用于对所述用户取放的货品进行识别。
可选地,所述处理模块120,具体用于:
从所述第一视频中按照第一预设时间间隔抽取多个图像帧;
利用图像检测模型,确定所述多个图像帧中相邻的图像帧中第一图像区域是否相同;
若所述相邻的图像帧中第一图像区域不同,则将所述相邻的图像帧作为所述目标图像帧;
根据确定出的多个目标图像帧,得到所述目标视频片段;
基于所述目标视频片段的时间范围,对所述第一视频进行压缩,得到第二视频。
可选地,所述处理模块120,具体用于:
截取所述第一视频中处于目标时间范围的视频片段,得到所述第二视频;
对所述第一视频中处于目标时间范围外的视频片段进行图像压缩处理,得到所述第二视频;
所述目标时间范围为基于所述目标视频片段的时间范围得到的。
可选地,所述处理模块120,还用于:
将所述目标视频片段的时间范围之前的第一预设时长,所述目标视频片段的时间范围之后的第二预设时长,以及所述目标视频片段的时间范围,作为所述目标时间范围。
可选地,所述处理模块120,还用于:
对截取的视频片段中每个图像帧的第二图像区域进行裁剪,得到所述第二视频;所述第二图像区域为所述图像帧中所述第一图像区域之外的区域。
可选地,所述处理模块120,具体用于:
降低所述第一视频在所述目标时间范围外的视频帧的分辨率,得到所述第二视频;或,
对所述第一视频在所述目标时间范围外的视频帧按照第二预设时间间隔进行抽帧,得到所述第二视频。
可选地,所述处理模块120,还用于:
在所述目标视频片段的数量为多个的情况下,按照所述目标视频片段在所述第一视频中的时间顺序进行拼接。
本发明实施例的装置,其用于执行前述共享售卖柜侧任一方法实施例中的方法,其实现原理和技术效果类似,此次不再赘述。
图7是本发明提供的视频压缩装置的结构示意图之二。本实施例的视频压缩装置可以应用于服务器,如图7所示,本实施例提供的视频压缩装置,包括:
接收模块210,用于接收共享售卖柜发送的第二视频,所述第二视频为所述共享售卖柜基于目标视频片段对所述第一视频进行压缩得到的;所述第一视频为所述共享售卖柜的摄像头拍摄的用户取放货品过程的视频;所述目标视频片段中包括多个目标图像帧,多个所述目标图像帧中相邻的图像帧中第一图像区域不同;所述第一图像区域为所述摄像头对目标区域拍摄得到的;
发送模块220,用于向第三方设备发送所述第二视频,所述第二视频用于对所述用户取放的货品进行识别。
本发明实施例的装置,其用于执行前述服务器侧任一方法实施例中的方法,其实现原理和技术效果类似,此次不再赘述。
图8示例了一种主控设备的实体结构示意图,如图8所示,该主控设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行视频压缩方法,该方法包括:
获取所述摄像头拍摄的用户取放货品过程的第一视频;
确定所述第一视频中的目标视频片段,所述目标视频片段中包括多个目标图像帧,多个所述目标图像帧中相邻的图像帧中第一图像区域不同;所述第一图像区域为所述摄像头对目标区域拍摄得到的;
基于所述目标视频片段对所述第一视频进行压缩,得到第二视频;将所述第二视频上传至服务器;所述第二视频用于对所述用户取放的货品进行识别。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的视频压缩方法,该方法包括:
获取所述摄像头拍摄的用户取放货品过程的第一视频;
确定所述第一视频中的目标视频片段,所述目标视频片段中包括多个目标图像帧,多个所述目标图像帧中相邻的图像帧中第一图像区域不同;所述第一图像区域为所述摄像头对目标区域拍摄得到的;
基于所述目标视频片段对所述第一视频进行压缩,得到第二视频;将所述第二视频上传至服务器;所述第二视频用于对所述用户取放的货品进行识别。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的视频压缩方法,该方法包括:
获取所述摄像头拍摄的用户取放货品过程的第一视频;
确定所述第一视频中的目标视频片段,所述目标视频片段中包括多个目标图像帧,多个所述目标图像帧中相邻的图像帧中第一图像区域不同;所述第一图像区域为所述摄像头对目标区域拍摄得到的;
基于所述目标视频片段对所述第一视频进行压缩,得到第二视频;将所述第二视频上传至服务器;所述第二视频用于对所述用户取放的货品进行识别。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种视频压缩方法,其特征在于,应用于共享售卖柜,所述共享售卖柜包括摄像头,所述方法包括:
获取所述摄像头拍摄的用户取放货品过程的第一视频;
确定所述第一视频中的目标视频片段,所述目标视频片段中包括多个目标图像帧,多个所述目标图像帧中相邻的图像帧中第一图像区域不同;所述第一图像区域为所述摄像头对目标区域拍摄得到的;
基于所述目标视频片段对所述第一视频进行压缩,得到第二视频;将所述第二视频上传至服务器;所述第二视频用于对所述用户取放的货品进行识别。
2.根据权利要求1所述的视频压缩方法,其特征在于,所述确定所述第一视频中的目标视频片段,包括:
从所述第一视频中按照第一预设时间间隔抽取多个图像帧;
利用图像检测模型,确定所述多个图像帧中相邻的图像帧中第一图像区域是否相同;
若所述相邻的图像帧中第一图像区域不同,则将所述相邻的图像帧作为所述目标图像帧;
根据确定出的多个目标图像帧,得到所述目标视频片段;
基于所述目标视频片段,对所述第一视频进行压缩,得到第二视频,包括:
基于所述目标视频片段的时间范围,对所述第一视频进行压缩,得到第二视频。
3.根据权利要求2所述的视频压缩方法,其特征在于,所述基于所述目标视频片段的时间范围,对所述第一视频进行压缩,得到第二视频,包括:
截取所述第一视频中处于目标时间范围的视频片段,得到所述第二视频;或,
对所述第一视频中处于目标时间范围外的视频片段进行图像压缩处理,得到所述第二视频;
所述目标时间范围为基于所述目标视频片段的时间范围得到的。
4.根据权利要求3所述的视频压缩方法,其特征在于,所述方法还包括:
将所述目标视频片段的时间范围之前的第一预设时长,所述目标视频片段的时间范围之后的第二预设时长,以及所述目标视频片段的时间范围,作为所述目标时间范围。
5.根据权利要求3或4所述的视频压缩方法,其特征在于,所述截取所述第一视频中处于目标时间范围的视频片段之后,还包括:
对截取的视频片段中每个图像帧的第二图像区域进行裁剪,得到所述第二视频;所述第二图像区域为所述图像帧中所述第一图像区域之外的区域。
6.根据权利要求3或4所述的视频压缩方法,其特征在于,所述对所述第一视频中处于目标时间范围外的视频片段进行图像压缩处理,得到所述第二视频,包括:
降低所述第一视频在所述目标时间范围外的视频帧的分辨率,得到所述第二视频;或,
对所述第一视频在所述目标时间范围外的视频帧按照第二预设时间间隔进行抽帧,得到所述第二视频。
7.一种视频压缩方法,其特征在于,应用于服务器,所述方法包括:
接收共享售卖柜发送的第二视频,所述第二视频为所述共享售卖柜基于目标视频片段对第一视频进行压缩得到的;所述第一视频为所述共享售卖柜的摄像头拍摄的用户取放货品过程的视频;所述目标视频片段中包括多个目标图像帧,多个所述目标图像帧中相邻的图像帧中第一图像区域不同;所述第一图像区域为所述摄像头对目标区域拍摄得到的;
向第三方设备发送所述第二视频,所述第二视频用于对所述用户取放的货品进行识别。
8.一种共享售卖柜,其特征在于,包括:
柜体,摄像头,以及与所述摄像头连接的主控板;
其中,所述摄像头和所述主控板设置在所述柜体内;
所述摄像头采集的数据,用于与所述共享售卖柜通信的服务器基于所述采集的数据以及用户的支付信息进行订单结算;
以及所述主控板用于执行如权利要求1至6任一项所述视频压缩方法。
9.一种主控设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述视频压缩方法,或如权利要求7所述视频压缩方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述视频压缩方法,或如权利要求7所述视频压缩方法。
CN202310976445.2A 2023-08-04 2023-08-04 视频压缩方法和共享售卖柜 Active CN116684626B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310976445.2A CN116684626B (zh) 2023-08-04 2023-08-04 视频压缩方法和共享售卖柜

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310976445.2A CN116684626B (zh) 2023-08-04 2023-08-04 视频压缩方法和共享售卖柜

Publications (2)

Publication Number Publication Date
CN116684626A true CN116684626A (zh) 2023-09-01
CN116684626B CN116684626B (zh) 2023-11-24

Family

ID=87784122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310976445.2A Active CN116684626B (zh) 2023-08-04 2023-08-04 视频压缩方法和共享售卖柜

Country Status (1)

Country Link
CN (1) CN116684626B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109559331A (zh) * 2017-09-27 2019-04-02 九阳股份有限公司 一种基于视频图像的食材管理方法
WO2019219065A1 (zh) * 2018-05-17 2019-11-21 杭州海康威视数字技术股份有限公司 视频分析的方法和装置
CN110769262A (zh) * 2018-07-25 2020-02-07 清华大学 一种视频图像压缩方法及系统
WO2020047919A1 (zh) * 2018-09-06 2020-03-12 深圳码隆科技有限公司 无人售货方法、装置、系统、服务器及计算机可读存储介质
WO2020151084A1 (zh) * 2019-01-24 2020-07-30 北京明略软件系统有限公司 目标对象的监控方法、装置及系统
CN113723384A (zh) * 2021-11-03 2021-11-30 武汉星巡智能科技有限公司 多视角采集图像后融合的智能生成订单方法及智能售货机
CN113743530A (zh) * 2021-09-16 2021-12-03 广东佩服科技有限公司 一种基于动态视觉的自动售货识别方法
CN114359973A (zh) * 2022-03-04 2022-04-15 广州市玄武无线科技股份有限公司 基于视频的商品状态识别方法、设备及计算机可读介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109559331A (zh) * 2017-09-27 2019-04-02 九阳股份有限公司 一种基于视频图像的食材管理方法
WO2019219065A1 (zh) * 2018-05-17 2019-11-21 杭州海康威视数字技术股份有限公司 视频分析的方法和装置
CN110769262A (zh) * 2018-07-25 2020-02-07 清华大学 一种视频图像压缩方法及系统
WO2020047919A1 (zh) * 2018-09-06 2020-03-12 深圳码隆科技有限公司 无人售货方法、装置、系统、服务器及计算机可读存储介质
WO2020151084A1 (zh) * 2019-01-24 2020-07-30 北京明略软件系统有限公司 目标对象的监控方法、装置及系统
CN113743530A (zh) * 2021-09-16 2021-12-03 广东佩服科技有限公司 一种基于动态视觉的自动售货识别方法
CN113723384A (zh) * 2021-11-03 2021-11-30 武汉星巡智能科技有限公司 多视角采集图像后融合的智能生成订单方法及智能售货机
CN114359973A (zh) * 2022-03-04 2022-04-15 广州市玄武无线科技股份有限公司 基于视频的商品状态识别方法、设备及计算机可读介质

Also Published As

Publication number Publication date
CN116684626B (zh) 2023-11-24

Similar Documents

Publication Publication Date Title
Verdoliva Extracting camera-based fingerprints for video forensics
WO2019047789A1 (zh) 关于增强现实场景的处理方法、终端设备、系统及计算机存储介质
CN104574331B (zh) 一种数据处理方法、装置、计算机存储介质及用户终端
CN110675433A (zh) 视频处理方法、装置、电子设备及存储介质
CN111901604B (zh) 视频压缩、重构方法及对应装置、摄像头及视频处理设备
CN110366001B (zh) 视频清晰度的确定方法和装置、存储介质、电子装置
CN110532746B (zh) 人脸校验方法、装置、服务器及可读存储介质
CN111241938A (zh) 基于图像校验的人脸识别方法、装置和计算机设备
CN109308704B (zh) 背景剔除方法、装置、计算机设备及存储介质
CN110334568B (zh) 轨迹生成与监控方法、装置、设备及存储介质
CN107577973B (zh) 一种图像显示方法、图像识别方法及设备
US10299117B2 (en) Method for authenticating a mobile device and establishing a direct mirroring connection between the authenticated mobile device and a target screen device
Chen et al. Detecting anti-forensic attacks on demosaicing-based camera model identification
CN113158773B (zh) 一种活体检测模型的训练方法及训练装置
CN116684626B (zh) 视频压缩方法和共享售卖柜
US20210099772A1 (en) System and method for verification of video integrity based on blockchain
CN111967529B (zh) 识别方法、装置、设备及系统
CN111369557B (zh) 图像处理方法、装置、计算设备和存储介质
CN111314395A (zh) 一种图像的传输方法及终端、存储介质
CN116597421A (zh) 基于图像识别的停车位监测方法、装置及设备
CN116708801B (zh) 视频压缩方法、共享售卖柜和存储介质
CN113421241B (zh) 异常事件上报方法、装置、计算机设备及存储介质
CN115082326A (zh) 视频去模糊的处理方法、边缘计算设备及中心处理器
CN109328373B (zh) 图像处理方法及其相关设备、存储介质
CN116939171B (zh) 输电线路监控方法、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant