CN116091985B - 押运编码方法及押运安防系统 - Google Patents
押运编码方法及押运安防系统 Download PDFInfo
- Publication number
- CN116091985B CN116091985B CN202310388398.XA CN202310388398A CN116091985B CN 116091985 B CN116091985 B CN 116091985B CN 202310388398 A CN202310388398 A CN 202310388398A CN 116091985 B CN116091985 B CN 116091985B
- Authority
- CN
- China
- Prior art keywords
- escort
- voxels
- difference
- voxel
- linkage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 185
- 230000008569 process Effects 0.000 claims abstract description 128
- 230000033001 locomotion Effects 0.000 claims abstract description 75
- 230000002159 abnormal effect Effects 0.000 claims abstract description 50
- 238000013528 artificial neural network Methods 0.000 claims abstract description 24
- 230000007246 mechanism Effects 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 10
- 230000001133 acceleration Effects 0.000 claims description 44
- 238000013139 quantization Methods 0.000 claims description 24
- 238000011156 evaluation Methods 0.000 claims description 18
- 230000005856 abnormality Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 6
- 230000003213 activating effect Effects 0.000 claims 1
- 108091026890 Coding region Proteins 0.000 abstract description 4
- 238000004422 calculation algorithm Methods 0.000 description 11
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 208000012661 Dyskinesia Diseases 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000005303 weighing Methods 0.000 description 2
- RDJLIBMVLWBMKX-UHFFFAOYSA-N 1-(3,4-dihydro-2h-chromen-2-ylmethyl)piperidine Chemical compound C1CC2=CC=CC=C2OC1CN1CCCCC1 RDJLIBMVLWBMKX-UHFFFAOYSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Security & Cryptography (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及自适应编码技术领域,具体涉及一种押运编码方法及押运安防系统。该方法首先将押运对象划分为多个押运体素;构建押运体素的联动特征码;根据联动指标值得到押运体素的差异特征码;基于联动特征码和差异特征码,将押运对象划分至多个运动模式类别;构建图像描述子;根据押运对象的运动模式类别和图像描述子得到差异可达距离;基于差异可达距离得到每个押运对象的局部异常因子;根据图像描述子、局部异常因子和联动特征码训练神经网络;输入实时押运视频的图像描述子和联动特征码至神经网络中,得到预测局部异常因子,控制启动码率控制机制。本发明针对性优化视频编码区域,提高押运过程的实时视频画质。
Description
技术领域
本发明涉及自适应编码技术领域,具体涉及一种押运编码方法及押运安防系统。
背景技术
对于押运对象,如现金、物资等敏感对象在码放和押运过程中,一般通过压力传感器、震动传感器和红外探测器实现对非法入侵物体信息的采集和警报。这些信息的信息量有限,且无法准确描述押运对象所处的情况,使得在押运过程中容易出现误报和漏报的现象。
目前,押运对象押运的数字孪生以及相关的押运管理平台,对数据的需求和保真度要求越来越高。业界已经能够查询具体车辆的详细信息,如车牌号、车辆类型、所属单位和运单信息,以实现对物流车辆的全方位运行监控,其中运单信息包括驾驶员、押运员和货物信息等。然而,对于押运容器的详细状态以及车内的视频数据等仍无法做到持续的精确采集,尤其是押运的视频数据。车内的环境采光条件较差,导致暗部特征容易基于传统的码率控制和降噪策略过度压缩,影响回放取证的难度,大大降低了视频的价值。此外,由于采光问题,相机的降噪策略同样影响画面的质量,长时间高码率的采集不符合实用性,因此缺少一种针对押运的编码方法和押运系统,分析押运对象在押运过程中受外力的异动特征,在异动的情况下自动管理码率。
发明内容
为了解决传统的码率控制和降噪策略过度压缩会影响视频回放取证的技术问题,本发明的目的在于提供一种押运编码方法及押运安防系统,所采用的技术方案具体如下。
根据第一方面,本发明一个实施例提供了一种押运编码方法,包括:获取押运车辆的三轴加速度,将押运车辆承载的押运对象划分为至少两个押运体素,并获取每个押运体素的压力值;根据押运体素和邻域内其他押运体素的压力值得到押运体素对应的联动指标值;由所述联动指标值和所述三轴加速度构建押运体素的联动特征码;根据押运体素和其他押运体素的联动指标值的差异,得到押运体素的差异特征码;基于各个押运过程中压力值最大的押运体素的联动特征码和差异特征码,将各个押运过程对应的押运对象分为至少两个运动模式类别;根据押运视频中图像组的所有图像中同一位置处的宏块的量化参数、熵和逆方差构建图像描述子;根据任意两个押运过程中押运对象的运动模式类别和图像描述子得到两个押运对象的差异可达距离;基于所述差异可达距离得到每个押运对象对应的局部异常因子;根据押运视频中图像组对应的图像描述子、局部异常因子和联动特征码训练神经网络;输入实时押运视频中图像组对应的图像描述子和联动特征码至神经网络中,得到预测局部异常因子;根据预测局部异常因子判断押运是否异常,当押运异常时启动码率控制机制。
优选地,根据押运体素和其他押运体素的联动指标值的差异,得到押运体素的差异特征码,包括:获取每种联动指标值对应的联动指标序列;将任意押运体素作为目标押运体素,根据目标押运体素和其他押运体素之间对应联动指标序列的差异程度,得到序列差异值;由目标押运体素和其他所有押运体素对应的联动指标序列的序列差异值,构建目标押运体素对应的差异特征码。
优选地,基于各个押运过程中压力值最大的押运体素的联动特征码和差异特征码,将不同押运过程对应的押运对象分为至少两个运动模式类别,包括:获取各个押运过程中压力值最大的押运体素作为初始押运体素;根据任意两个押运过程中初始押运体素的联动特征码的相似程度和差异特征码的相似程度,得到两个押运过程对应的押运对象之间的差异评价值;基于所述差异评价值,将不同押运过程对应的押运对象分为至少两个运动模式类别。
优选地,根据任意两个押运过程中初始押运体素的联动特征码的相似程度和差异特征码的相似程度,得到两个押运过程对应的押运对象之间的差异评价值,包括:计算任意两个押运过程对应初始押运体素的联动特征码的相似度,作为第一相似度;计算所述两个押运过程对应初始押运体素的差异特征码的相似度,作为第二相似度;根据第一相似度和第二相似度得到两个押运过程对应的押运对象之间的差异评价值。
优选地,根据任意两个押运过程中押运对象的运动模式类别和图像描述子得到两个押运对象的差异可达距离,包括:根据任意两个押运过程中押运对象的运动模式类别的差异,得到第一差异度;根据所述两个押运过程对应押运视频中所有图像组的图像描述子的相似度,得到第三相似度;根据第一差异度和第三相似度得到两个押运过程中押运对象的差异可达距离。
优选地,当押运异常时启动码率控制机制,包括:当押运异常时,对初始码率增加预设码率步长得到第一码率;基于第一码率更新图像组,当更新后的图像组中存在有宏块对应的量化参数大于预设参数值时,对第一码率增加预设码率步长,得到第二码率;基于第二码率更新图像组,当再次更新后的图像组中存在有宏块对应的量化参数大于预设参数值时,对第二码率增加预设码率步长,得到第三码率;以此类推,直至当图像组中所有宏块对应的量化参数小于或等于预设参数值,保持当前码率。
优选地,根据押运体素和邻域内其他押运体素的压力值得到押运体素对应的联动指标值,包括:所述联动指标值包括:押运体素自身的压力值、押运体素对应邻域内其他押运体素的压力值均值、押运体素对应邻域内其他押运体素的最大压力值和押运体素对应邻域内其他押运体素的最小压力值。
优选地,根据押运视频中图像组的所有图像中同一位置处的宏块的量化参数、熵和逆方差构建图像描述子,包括:由押运视频中图像组的所有图像中同一位置处的宏块的量化参数的均值、熵的均值和逆方差的均值构建图像描述子。
优选地,根据预测局部异常因子判断押运是否异常,包括:当预测局部异常因子大于或等于预设异常阈值时,判定押运过程异常。
根据第二方面,本发明一个实施例提供了一种押运安防系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述押运编码方法。
本发明实施例至少具有如下有益效果。
本发明涉及自适应编码技术领域,该方法根据押运对象的相邻押运体素的压力值构建的联动指标值和三轴加速度构建押运体素的联动特征码,该联动特征码能够反映押运体素和邻域内押运体素在具体加速度下的相关状态,以便于后续根据押运体素的相关特征对不同押运过程的押运对象进行分类;根据押运体素之间联动指标值的差异,得到押运体素的差异特征码,该差异特征码反映了押运体素之间在具体加速度下的相关状态的差异,表达押运对象内在结构上的特征;基于各个押运过程中压力值最大的押运体素的联动特征码和差异特征码,将各个押运过程对应的押运对象分为至少两个运动模式类别,利用差异特征码表示内部结构上的特征,利用联动特征码反映押运体素和邻域内押运体素在具体加速度下的相关状态,结合联动特征码和差异特征码共同为押运体素所处的运动特征进行联合约束,并对押运对象进行分类,以便于后续得到异常的押运对象;根据押运视频中图像组构建图像描述子,图像描述子能够反映押运车辆内的环境;根据任意两个押运过程中押运对象的运动模式类别和图像描述子得到两个押运对象的差异可达距离,基于差异可达距离得到每个押运对象对应的局部异常因子,基于押运对象的局部异常因子可以反映出押运对象的异常程度;根据押运视频中图像组对应的图像描述子、局部异常因子和联动特征码训练神经网络;输入实时押运视频中图像组对应的图像描述子和联动特征码至神经网络中,得到预测局部异常因子,可以反映出押运过程的异常,以便于后续当出现押运异常时对码率进行调整控制;根据预测局部异常因子判断押运是否异常,当押运异常时启动码率控制机制。本发明借助押运容器的分布式压力传感器和车辆位姿,提出一种基于押运容器和车辆姿态数据,自动学习押运过程中的异动现象,从而针对性优化视频编码区域的方法。该方法无需分析画面的具体内容,便可提高押运过程的实时视频画质,极大降低敏感监控设施的参数调优时对人工的依赖。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的押运编码方法的流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种押运编码方法及押运系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和术语与属于本发明的技术领域的技术人员通常理解的含义相同。
本发明实施例提供了一种押运编码方法及押运安防系统的具体实施方法,该方法适用于物体押运场景。该场景下通过压力传感器获取押运对象的压力值,通过摄像头或者其他视频采集设备采集押运过程中押运车辆内的押运视频,通过IMU获取押运车辆的三轴加速度。为了解决传统的码率控制和降噪策略过度压缩会影响视频回放取证的问题。本发明借助押运容器的分布式压力传感器和车辆位姿,提出一种基于押运容器和车辆姿态数据,自动学习押运过程中的异动现象,从而针对性优化视频编码区域的方法。该方法无需分析画面的具体内容,便可提高押运过程的实时视频画质,极大降低敏感监控设施的参数调优时对人工的依赖。
下面结合附图具体的说明本发明所提供的一种押运编码方法及押运系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种押运编码方法及押运安防系统的方法流程图,该方法包括以下步骤。
步骤S100,获取押运车辆的三轴加速度,将押运车辆承载的押运对象划分为至少两个押运体素,并获取每个押运体素的压力值。
利用押运车辆搭载的惯性测量单元(Inertial measurement unit, IMU)得到押运车辆的直线加速度分量。IMU是测量物体三轴姿态角及加速度的装置,一般IMU包括三轴陀螺仪及三轴加速度计,部分集成度较高的IMU还会融合三轴磁力计。IMU是一种常见的传感器,广泛分布在民用手机、手环和汽车的位姿传感器中,能够通过SPI、IIC、OBD等常见的数字接口读出。本发明实施例中利用IMU的直线加速度分量,联合多个压力传感器共同采集押运车辆和押运对象在押运过程中的运动情况。该IMU最终读出的是三轴的加速度,即车辆行驶方向、车辆平移方向和车辆上下跳动方向三个正交轴。对于三轴的加速度,与托盘的行列以及垂直方向应一一对应。需要说明的是,如何矫正和旋转正交坐标轴的操作方法是本领域技术人员公知的,在此不再赘述。
定义一种押运对象的押运容器,押运容器与押运车辆的布局严格绑定,使得多辆押运车的容器布局相同。押运容器是一种托盘型载体,外形为矩形,托盘的面积不限。
对押运容器进行网格化分区,押运容器由多个压力传感器构成,以准确的从二维空间感知押运容器中押运对象在押运过程中呈现的压力特征。押运容器能以均分的方式,将一个矩形托盘均分为若干行列的子块。本发明实施例中,押运容器分为5*5的子块,即对于一个和押运容器大小相同的押运对象,正好能够测量整个押运对象的25个区域的压力分布情况。需要说明的是,对于大小与押运容器不相同的押运对象,根据押运容器的子块,将押运对象划分为一个或多个押运体素。每个押运体素有各自对应压力值,能够得到整个押运对象多个区域的压力分布情况。
如当押运对象和押运容器大小相同,正好放置在押运容器上时,根据押运容器的子块,将押运对象划分为25个体素,将由押运对象划分成的体素称之为押运对象对应的押运体素,即无视被押运的押运对象的形态、包装方式和竖直方向,将押运对象划分为25块,联合直线加速度的分量,从而按照押运容器的子块位置的对应关系进行表示。其中,体素是指当押运对象的实体是三维的物体,将其底面直接按照25个子块进行划分,可以得到25个子实体,因为子实体是三维的,因此称之为体素。切分为体素的作用是将押运对象视为统一的三维对象,三维对象之间由于并没有切开,实质上存在刚性或者柔性的连接,因此压力是互相关的。
其中,压力传感器用多种现有技术能够实施,应变式压力传感器应用较广,适合在多种称重设备中使用。在本发明实施例中优选应变式压力传感器作为体素的传感器,每个体素对应一个或者多个压力传感器,当一个体素对应多个压力传感器时,以得到的多个压力传感器的读数的均值作为体素对应的压力值。对于押运对象容器的压力传感器,实质作用是为了满足局部称重功能,铺设压力传感器的结构和方法是多样的,在此不再进行赘述。
将上述各押运体素的压力值和IMU的三轴加速度同步读出,更新率为1Hz。其中,压力传感器以及IMU的内部刷新率快于1Hz,因此对于1Hz的同步读出,按照压力值以及加速度各自在1s内的读数的均值作为1Hz的输出值。由于IMU的三轴加速度是押运车体自身的,因此是表示押运对象统一的受力影响,对于任意一个押运体素,无时无刻能够通过押运体素自身的压力值、押运体素邻域押运体素的压力值和IMU的三轴加速度反映其押运体素的运动情况。
步骤S200,根据押运体素和邻域内其他押运体素的压力值得到押运体素对应的联动指标值;由所述联动指标值和所述三轴加速度构建押运体素的联动特征码。
在本发明实施例中押运体素邻域内其他押运体素是指,押运体素的八邻域内的其他押运体素。
任意一个押运体素都可以获取某一时刻的压力值、邻域内其他押运体素的压力值和IMU的三轴加速度。在押运过程中,对押运对象的押运体素计算时间-空间特征编码,从而区分一个押运容器中针对不同的车辆运动情况,体素所处的压力的变动特征,然后利用体素压力、体素邻域压力、车辆加速度特征联合时间前后的变动情况,从通过每个体素的计算时间-空间特征,最后为押运物体构建反映全局特征的联动特征码。
在被押运物体未知的情况下描述体素的压力特征,不但能够描述整体的运动情况,还能根据各个体素的运动特征来统一描述押运对象的内部运动关系。对于不同的绑扎、固定、打包和码垛的方式,都有不同的内部运动特征,具体可以通过各个体素的压力和加速度的特征来表示。
对于一个体素进行压力-加速度特征编码,作为联动特征码,其编码方式具体为如下。
步骤S201,根据押运体素和邻域内其他押运体素的压力值得到押运体素对应的联动指标值。
记录押运体素自身的压力值和其邻域内其他押运体素的压力值,进而得到押运体素对应的联动指标值。该联动指标值包括:押运体素自身的压力值、押运体素对应邻域内其他押运体素的压力值均值、押运体素对应邻域内其他押运体素的最大压力值和押运体素对应邻域内其他押运体素的最小压力值。在本发明实施例中押运体素的邻域为八邻域,对于邻域数量不足8的押运体素,将押运体素四周相邻的押运体素作为邻域内的其他押运体素即可。
步骤S202,由所述联动指标值和所述三轴加速度构建押运体素的联动特征码。
在得到押运体素的四个联动指标值之后,将四个联动指标值和押运体素的三轴加速度的三个分量,构成押运体素的联动特征码。该联动特征码有7个维度,也即一个联动特征码对应7个数值。
联动特征码能够描述押运体素与邻域内其他押运体素在具体加速度下的相关状态,从而为一个押运对象构建内部的多个联动特征码N。
步骤S300,根据押运体素和其他押运体素的联动指标值的差异,得到押运体素的差异特征码。
各个押运体素的联动特征码在整个押运过程中同步且持续的更新,因此对于一次押运任务中,每个体素的联动特征码都可以构成一个7维的序列,其中加速度占3个维度。对于一个押运对象,其对应的每个押运体素的三轴加速度的3个序列是相同,剩下的4个联动指标值与押运体素的位置有关。获取每种联动指标值对应的联动指标序列;对于任意一种联动指标序列,该联动指标序列也即由按照时间顺序采集的不同时刻的联动指标值构成的联动指标序列。由于在本发明实施例中联动指标值为4种,故每个押运体素对应四个联动指标序列。对每个体素对应的四个联动指标序列进行分析,可以得到能够反映全局特征的差异特征码。
假设一次押运任务的起始到结束过程中存在至少多次晃动,那么每当发生晃动时,押运体素所对应的压力是存在同步和非同步的现象的。对于一个押运体素,存在由4个联动指标值构成的4个联动指标序列。
其中,差异特征码的获取方法为:将任意押运体素作为目标押运体素,根据目标押运体素和其他押运体素之间对应联动指标序列的差异程度,得到序列差异值;由目标押运体素和其他所有押运体素对应的联动指标序列的序列差异值,构建目标押运体素对应的押运体素的差异特征码。
对于一个押运体素的四个联动指标序列和其他押运体素的四个联动指标序列,分别利用皮尔逊相关系数和由动态时间规整算法得到的动态时间规整距离,来反映两个押运体素对应的四个联动指标序列的差异程度。其中皮尔逊相关系数在时间同步性上十分敏感,动态时间规整距离在时间同步性上不敏感,故结合两者得到的联动指标序列的差异程度更为精确。需要说明是,在进行差异程度计算时,分别对两个押运体素的各联动指标序列进行计算,如分别计算由两个押运体素自身的压力值构成的两个联动指标序列的差异程度,计算由两个押运体素和对应邻域内其他押运体素的压力值均值构成的两个联动指标序列的差异程度。
其中,根据目标押运体素和其他押运体素之间对应联动指标序列的差异程度,得到序列差异值的方法,具体的:计算目标押运体素和其他押运体素之间对应的联动指标序列的皮尔逊相关系数;计算目标押运体素和其他押运体素之间对应的联动指标序列的动态时间规整距离;将皮尔逊相关系数和预设第一阈值的和值作为调节相关系数;将动态时间规整距离和所述调节相关系数的比值作为序列差异值。目标押运体素有对应的四个联动指标序列,故目标押运体素和每个其他的押运体素均有对应的四个序列差异值。在本发明实施例中预设第一阈值的取值为1.1,在其他实施例中实施者可根据实际情况调节该取值。在比值的分母上加上预设第一阈值的目的是为了避免出现分母为0的情况出现。
以押运体素B作为目标押运体素,以押运体素A作为其他押运体素为例,序列差异值的计算公式为:w(Aa,Ba')=DTW(Aa,Ba')/(1.1+PPMCC(Aa,Ba') )其中,w(Aa,Ba')为目标押运体素B的联动指标序列a和其他押运体素A的联动指标序列a'序列差异值;DTW(Aa,Ba')为目标押运体素B的联动指标序列a和其他押运体素A的联动指标序列a'的动态时间规整距离,PPMCC(Aa,Ba')为目标押运体素B的联动指标序列a和其他押运体素A的联动指标序列a'的皮尔逊相关系数;1.1为预设第一阈值;1.1+ PPMCC(Aa,Ba')为目标押运体素B的联动指标序列a和其他押运体素A的联动指标序列a'的调节相关系数。
其中,皮尔逊相关系数的取值范围为[-1,1],皮尔逊相关系数越接近于1,则反映两个押运体素的联动指标序列越同步,则两个联动指标序列的序列差异值越小,其序列差异值和皮尔逊相关系数呈负相关关系;反之,皮尔逊相关系数越接近于0,则反映两个押运体素的联动指标序列越不同步;当皮尔逊相关系数为-1时,两个押运体素的联动指标序列是负相关,在长期的押运过程中不可能出现。因此当皮尔逊相关系数的取值小于0时,则可以视为0对待。动态时间规整距离的取值则大于0,动态时间规整距离越大,则反映两个联动指标序列之间的序列差异越大,对应的序列差异值越大,故动态时间规整距离和联动指标序列呈正比关系;反之,当动态时间规整距离越小,则反映两个联动指标序列之间的序列差异越小,对应的序列差异值越小。
对于目标押运体素B和其他押运体素A的联动指标序列,分别进行对应的序列差异值的计算,每种联动指标序列对应一个序列差异值。
例如对于分为了25个押运体素的押运对象,目标押运体素和其他的24个押运体素的联动指标序列进行计算,共得到96个序列差异值;由目标押运体素和其他所有押运体素对应的联动指标序列的序列差异值,构建目标押运体素对应的押运体素的差异特征码M。
对于一个押运容器,每次押运任务都可以得到对应的差异特征码,一次押运任务也即一次押运过程。得到差异特征码M的作用是根据一段时间的运动情况,为结合押运物体的固定方式、内部分布和联动的特征来反映押运物体为何种物体。原因是押运对象的多样性有限,但不同固定方式所代表的异动情况不同,基于差异特征码M能够表示内在的结构上的特性,从而可以结合联动特征码N,为短时间的运动提供上下文特征。
步骤S400,基于各个押运过程中压力值最大的押运体素的联动特征码和差异特征码,将各个押运过程对应的押运对象分为至少两个运动模式类别。
获取各个押运过程中压力值最大的押运体素作为初始押运体素。需要说明的是,基于各个押运过程中压力值最大的押运体素的联动特征码的相似程度和差异特征码的相似程度代表押运对象来进行分类的原因是受质量影响,重量最大的体素存在较大的滞后性,以及牵动其它体素的能力较强,无论何种押运对象的固定方式和结构,压力值最大的押运体素都能保证运动存在一定滞后性,且其它押运体素的运动情况受到该押运体素的影响是较大的,故进而基于压力值最大时的押运体素和其他押运体素之间对应的联动指标码和差异特征码的相似程度对各个押运过程对应的押运对象进行分类。
基于联动特征码和差异特征码,根据压力值最大的押运体素来描述押运对应的运动特征,构建不同种的运动模式。
基于多次押运任务积累的数据,可以结合每次押运过程中押运对象对应的差异特征码M和联动特征码N,分析数据的分布中所能够表示的运动模式。
在进行分析之前,先进行数据过滤,当押运车辆处于加速度较小的情况下,差异特征码和联动特征码的联合表示无法准确代表运动特征,因此在构建假想空间之前,先对加速度较小的数据进行过滤。具体的:根据IMU的三个轴的三轴加速度的模进行过滤;在1Hz的读数中,当模长连续预设第二阈值次高于预设第三阈值时,则认为自第一次高于预设第三阈值开始到不再高于预设第三阈值结束的时间段内的记录是能够表示运动特征的,因此,将不符合条件的时刻记录的数据进行过滤,不再参与后续处理。在本发明实施例中预设第二阈值和预设第三阈值的取值由实施者根据实际情况进行设定。
将过滤后的时间段内的差异特征码和联动特征码作为样本构成样本集合,其中样本集合中的样本为差异特征码M和联动特征码N的联动表示,即由一个样本中可知其对应的押运数据记录的差异特征码M和联动特征码N。
由于体素的运动所导致的压力以及邻域的压力会通过相邻部分的联动和惯性等因素发生变化,根据差异特征码M和联动特征码N的联合表示,能够为非特定押运对象的押运体素的运动特性进行分析,从而得出异常运动的模式和常见的运动模式。
如果一个押运体素周围存在较大空隙,可能晃动幅度较大,进而导致邻域内押运体素的压力剧烈变化,使得差异特征码M和联动特征码N联合表示后的样本在数据分布上更加随机,对于押运来说,视频需要准确表示这种运动。这种运动特征在假想空间中能够体现出分布疏密的特征,即常见且相似的运动特征以及不常见的运动特征。
首先,根据任意两个押运过程中初始押运体素的联动特征码的相似程度和差异特征码的相似程度,得到两个押运过程对应的押运对象之间的差异评价值;基于所述差异评价值,将不同押运过程对应的押运对象分为至少两个运动模式类别。具体的:计算任意两个押运过程对应初始押运体素的联动特征码的相似度,作为第一相似度;计算所述两个押运过程对应初始押运体素的差异特征码的相似度,作为第二相似度;根据第一相似度和第二相似度得到两个押运过程对应的押运对象之间的差异评价值。
其中,第一相似度为两个押运过程对应初始押运体素的联动特征码的余弦相似度,第二相似度为两个押运过程对应初始押运体素的差异特征码的余弦相似度。需要说明的是,这里的初始押运体素可以用来表征对应的押运对象,因为每个押运对象对应的仅有一个初始押运体素。
其中,根据第一相似度和第二相似度得到两个押运过程对应的押运对象之间的差异评价值法的方法,具体的:将第一相似度和第二相似度的乘积作为调节相似度,将预设第四阈值和调节相似度的差值作为两个押运过程对应的押运对象之间的差异评价值。在本发明实施例中预设第四阈值的取值为1,在其他实施例中实施者可根据实际情况调整该取值。
该差异评价值的计算公式为:S(d,c)=1-Similarity(Md,Mc)*Similarity(Nd,Nc)其中,S(d,c)为押运过程d和押运过程c对应的押运对象之间的差异评价值;Md为押运过程d对应的初始押运体素的差异特征码;Mc为押运过程c对应的初始押运体素的差异特征码;Nd为押运过程d对应的初始押运体素的联动特征码;Nc为押运过程c对应的初始押运体素的联动特征码;Similarity为余弦相似度函数Similarity(Md,Mc)为押运过程d和押运过程c对应初始押运体素的第二相似度;Similarity(Nd,Nc)为押运过程d和押运过程c对应的初始押运体素的第一相似度;1为预设第四阈值;Similarity(Md,Mc)*Similarity(Nd,Nc)为押运过程d和押运过程c对应的押运对象之间的调节相似度。
通过联合差异特征码M和联动特征码N的余弦相似度,利用差异特征码M能够表示内在的结构上的特性,利用联动特征码N表示押运体素与邻域在具体加速度下的相关状态,共同为一个体素所处的运动特征进行相似度上的联合约束。当两个押运过程对应的初始押运体素之间的差异特征码越相似,则对应的第二相似度越大;当两个押运过程对应的初始押运体素之间的联动特征码越相似,则对应的第一相似度越大。两个押运过程对应初始押运体素的第一相似度和两个押运过程对应初始押运体素的第二相似度,均与差异评价值呈反比。基于此,可以由计算得来的差异评价值取决于押运物体的结构特性、押运体素的相关性和加速度的状态。
进一步的,基于所述差异评价值,将不同押运过程对应的押运对象分为至少两个运动模式类别。
使用OPTICS算法进行无监督聚类。OPTICS算法中需要输入两个参数:ε和MinPts,由于视频的检测任务的不同,选择不同的参数会导致最终分类的结果差异很大。OPTICS算法可以选择合适的参数,降低输入参数的敏感度,提高对预期分类的合理性。由于OPTICS是一种公知的算法,且实施方式唯一,本发明不再赘述OPTICS原理相关的样本邻域、核心对象、密度直达、密度可达和密度相连等进一步的计算方法。在本发明实施例中ε取无穷大,MinPts的取值为5,MinPts需要根据前面步骤中采集的样本的多少来选取,实施者应采集足够多的样本当差异特征值M的数量足够多时,即本发明实施例在中MinPts的取值范围不会显著影响分类的结果。
对于本发明实施例,由于押运对象实体至少分为被押运对象的中心、边角、侧面三个支撑结构和关系,且晃动又分为剧烈的平移和车体的轴向扭转,加速度的状态被分为至少4种,分别为:加速、减速和沿车头两种方向的顺逆时针轴向扭转。实施者需要调整MinPts或基于OPTICS算法同时调整MinPts和ε,使分类结果中,除离群点外,得到至少3*4=12个及以上的运动特征。
实现将不同押运过程对应的押运对象分为至少两个运动模式类别,每个运动模式类别代表不同押运过程的押运体素的运动模式。
步骤S500,根据押运视频中图像组的所有图像中同一位置处的宏块的量化参数、熵和逆方差构建图像描述子。
对押运视频的一个图像组(Group of Pictures, GoP)的宏块进行量化参数QP分布特征分析,得到图像描述子。
由于视频码率是根据GoP来控制的,将GoP与前面的压力传感器读取速率设定为同步,即GoP的时长为1秒,当GoP结束时,同步读到各个压力传感器的压力值以及IMU的加速度值。
常见的视频编码都由I帧和P帧构成,且P帧宏块级QP值是浮动的,原因是视频流编码的码率控制一般使用动态比特率(Variable Bit Rate, VBR)或可用比特率(AvailableBit-Rate, ABR),其中ABR能够在静态机位场景提供较为可靠的码率控制效果,其中静态机位场景例如监控的场景下。
ABR会为编码器设置一个目标码率,然后让编码器来计算如何才能达到实施者设定的目标码率。量化参数QP用于描述和反馈每帧视频中每一个宏块的压缩量。实际上,QP反映了空间细节压缩情况。QP越小,就会保留越多的细节信息,视频质量也会越高,同时码率越大。QP越大,细节信息丢失的越多,码率也会随之降低,但图像失真也会越严重。也就是说,QP和码率成反比,QP越大,码率越低;QP越小,码率越高。
为了保证后续的码率控制有效性,本发明对于宏块的分割是均匀的,不采用动态分割的方法,也即宏块的大小根据分辨率参数已经固定。
对于一个图像组GoP的宏块,假设有32*18个,则根据P帧中宏块对应的QP。
计算GoP中每个P帧中宏块的平均QP,基于GoP的每个P帧,将宏块对应的图像转化至HLS色彩空间,取L亮度通道,即转换为灰度图像,然后逐帧计算宏块的灰度共生矩阵,并获取熵和逆方差两个参数,其具体为两个浮点数。最后针对GoP的所有帧的同一位置处的宏块,基于GoP中每帧熵和逆方差计算GoP中该宏块的熵和逆方差的均值。即对于一个GoP,共得到576个量化参数的均值,576个熵的均值和576个逆方差的均值,由量化参数的均值、熵的均值和逆方差的均值构建图像描述子,具体的:由押运视频中图像组的所有图像中同一位置处的宏块的量化参数的均值、熵的均值和逆方差的均值构建图像组对应的图像描述子。
其中熵代表了宏块对应的图像包含信息量的随机性。熵值表明了图像灰度分布的复杂程度,熵值越大,图像越复杂。而对于压缩编码,熵值越大,越难压缩。逆方差反映了图像纹理局部变化的大小,若图像纹理的不同区域间较均匀,变化缓慢,逆方差会较大;反之较小。一个宏块对应的逆方差越小,说明纹理细节越少,对于押运车辆内这种采光较差的环境,极大可能是压缩失真导致的。
实现了基于576个量化参数的均值,576个熵的均值和576个逆方差的均值进行维度拼接,得到1728维的图像描述子Q。
步骤S600,根据任意两个押运过程中押运对象的运动模式类别和图像描述子得到两个押运对象的差异可达距离;基于所述差异可达距离得到每个押运对象对应的局部异常因子。
基于图像描述子与运动模式进行联合表示,利用LOF算法对罕见的情形进行评价。由于前面以及剔除了加速度较低时的情况,因此,对于一段时间内存在记录的数据一定表明了当前的时刻前后一小段时间内,车辆存在较为明显的速度变化的情况。
对于不同的运动模式,使用One-Hot编码的方式与图像描述子进行联合表示,从而表达的一个高维的空间中,具体的:假设一个时刻的视频中,图像描述子已知,且对应前面聚类结果中的不少于一个押运体素的运动模式的记录,则认为这一秒的视频的图像描述子对应较为大的运动,且存在不同押运对象的运动模式。这一秒的视频的图像描述子对应较为大的运动,对应出若干个Q-N的关系,将每一个Q-N的对应关系联合表示为样本,即一个图像描述子对应出若干各样本。这样实现了样本集合G中,每个押运对象的运动模式对应时刻图像的图像描述子建立了关联。使用图像描述子能够与押运对象的运动特征进行关联的原因在于物体的晃动在视频中属于小幅度的刚性运动,因此容易导致运动预测算法将画面中直接对纹理进行平移,进而导致各个宏块的QP的下降。如果此时出现了较为细致的纹理的变动,则有可能导致画面失真,无法保留足够多的细节。
样本集合G中所有押运对象的运动模式都与图像描述子建立关联后,联合表示的样本即为样本集合F。如果图像描述子和对应的押运体素运动的样本是罕见的,则说明在有限的码率下,有较为异常的运动发生。
对样本进行局部异常因子算法的评估,使用局部异常因子来表明罕见程度。局部异常因子算法,也称为局部离群因子算法,是一种根据样本空间分布进行无监督的离群检测的方法。该方法为每个样本点计算一个局部异常因子LOF,通过判断局部异常因子LOF是否接近于1来判定是否是离群因子。局部异常因子LOF越大于1,越有可能是离群点,局部异常因子越接近于1,越有可能是正常点。
由于每个体素的运动模式和图像组的图像描述子建立了关联。基于样本集合F,可以评估有限码率下运动的局部异常因子。
首先建立一个假设空间,通过差异可达距离J为样本集合建立空间的分布关系。
根据任意两个押运过程中押运对象的运动模式类别和图像描述子得到两个押运对象的差异可达距离的方法,具体的:根据任意两个押运过程中押运对象的运动模式类别的差异,得到第一差异度;根据所述两个押运过程对应押运视频中所有图像组的图像描述子的相似度,得到第三相似度;根据第一差异度和第三相似度得到两个押运过程中押运对象的差异可达距离。
其中,根据任意两个押运过程中押运对象的运动模式类别的差异,得到第一差异度的方法,具体的:当任意两个押运过程中押运对象的属于同一运动模式类别时,则其对应的第一差异度为0;反之,当任意两个押运过程中押运对象不属于同一运动模式类别时,则其对应的第一差异度为1。
其中,根据所述两个押运过程对应押运视频中所有图像组的图像描述子的相似度,得到第三相似度的方法,具体的:将所述两个押运过程对应押运视频中所有对应的图像组的图像描述子的均值的余弦相似度,作为第三相似度。第三相似度越小,则两个押运过程对应押运视频中对应的图像描述子差异越小,反之,第三相似度越大,则两个押运过程对应押运视频中所有图像组的图像描述子差异越大。需要说明的是两个押运过程对应押运视频中对应的图像组为,两个押运视频同一时间段对应的图像组,如,对于押运过程对应的押运视频f中时刻h对应的图像组与另一押运过程对应的押运视频g中时刻h对应的图像组为对应的图像组。
其中,根据第一差异度和第三相似度得到两个押运过程中押运对象的差异可达距离的方法,具体的:将预设第四阈值和第一差异度的和值作为第一可达距离;将预设第四阈值和第三相似度的差值作为第二可达距离;将第一可达距离和第二可达距离的乘积作为差异可达距离。
该差异可达距离的计算公式为:J(e,f)=(1+Cond(e,f))*(1-Sim(e,f))。其中,J(e,f)为押运过程中押运对象e和另一押运过程中押运对象f的差异可达距离;Cond(e,f)为押运过程中押运对象e和另一押运过程中押运对象f的第一差异度;Sim(e,f)为押运过程中押运对象e和另一押运过程中押运对象f的第三相似度;Cond为条件函数;1+Cond(e,f)为押运过程中押运对象e和另一押运过程中押运对象f的第一可达距离;1-Sim(e,f)为押运过程中押运对象e和另一押运过程中押运对象f的第二可达距离。
Cond为条件函数,当两个押运过程中押运对象对应的属于同一个运动模式类别,则其对应的第一差异度为0;反之,当两个押运过程中押运对象对应的不属于同一个运动模式类别,则其对应的第一差异度为1。在运动模式不同的情况下,即使两个押运过程对应的押运视频中图像组的图像描述子相同,这两个押运过程中押运对象对应的差异可达距离也大一倍,从而达到保证运动模式不同的押运过程的押运对象之间分布较为分散的效果。
基于K-近邻可达距离的计算,计算每个样本点的局部可达密度lrd。也即计算得到的差异可达距离得到每个押运体素对应的局部可达密度。需要说明的是,由于局部可达密度的计算是本领域技术人员的公知技术,在此不再赘述。
进一步的,根据基于差异可达距离得到的局部可达密度,计算每个押运对象对应的局部异常因子。
假设一个样本点p,这里的样本点也即押运对象,局部异常因子表示样本点p的K邻域点的局部可达密度与样本点p的局部可达密度之比的平均数,这样,局部异常因子可以表示样本点p是离群点的程度。当局部异常因子越接近于1,则反映样本点p和其邻域点密度差异较小,样本点p可能和邻域内的样本点属于同一簇;当局部异常因子越接近于0,则反映样本点p的密度高于其邻域点密度,样本点p为密集点;当局部异常因子越大于1,则反映样本点p的密度小于其邻域点密度,样本点p越可能是异常点。
因此,基于图像描述子以及运动模式类别得到的差异可达距离J来决定样本之间的距离,进而计算局部异常因子的大小。局部异常因子越大,则对应的样本点越罕见。
步骤S700,根据押运视频中图像组对应的图像描述子、局部异常因子和联动特征码训练神经网络;输入实时押运视频中图像组对应的图像描述子和联动特征码至神经网络中,得到预测局部异常因子;根据预测局部异常因子判断押运是否异常,当押运异常时启动码率控制机制。
对于局部异常因子LOF,取值越高于1的为越罕见的情况,十分接近1的则为常见的晃动,因此,对于每次押运过程中,都有随着时间变动而变动的LOF值,且根据加速度的模,在1Hz的读数中,加速度的模连续预设第二阈值次高于预设第三阈值时,则认为自第一次高于预设第三阈值开始到不再高于预设第三阈值结束的时间段内的记录才有LOF值,对于加速度的模没有高于预设第三阈值的情况下,视其为常见的场景,LOF置为1;对于LOF低于1的,同样置为1。
基于此,则可以实现根据每个押运过程的记录,都可以通过图像描述子Q和各个体素此时的联动特征码N来反映押运过程中的押运对象的运动情形,无需分析视频画面。
根据押运视频中图像对应的图像描述子、局部异常因子和联动特征码训练神经网络,也即将押运视频中图像对应的图像描述子、局部异常因子和联动特征码作为训练集训练神经网络。该神经网络为RNN神经网络。训练RNN神经网络不断识别能够反映宏块的QP特征的图像描述子Q和各个体素的联动特征码N,以使切换高斯码率,在不感知敏感信息的前提下控制视频压缩的码率。
需要说明的是,RNN神经网络是一种输入高维序列,感知时域特征,实时输出新的序列的网络,对于RNN神经网络,隐含层的规模是多样的,本发明不再赘述。根据每个押运过程的数据记录,构建了一种根据押运记录的各个时刻下,图像描述子Q和各个体素的联动特征码N的数据集,根据各个时刻的LOF值,RNN能够学习不断变化的图像描述子Q和多个联动特征码N的隐含的时域特征,从而实现实时预测LOF的大小。实现输入实时押运视频中图像组对应的图像描述子和联动特征码至神经网络中,得到预测局部异常因子。
当LOF越大,则认为此时的情形越难以见到,因此要保护各个宏块的QP值,从而确保能够在较合理的QP值下,为异常情况的视频画面进行高保真记录。
实现了使得输入图像描述子和联动特征码至神经网络中,得到预测局部异常因子。也即通过神经网络对图像描述子和各体素的联动特征码的实时感知,实时输出预测的LOF值。
进一步的,可由实施者设定LOF的上限,当预测的LOF值超过上限,则启动码率控制机制。也可以说,根据预测局部异常因子判断押运是否异常,当押运异常时启动码率控制机制。
根据预测局部异常因子判断押运是否异常的方法,具体的:当预测局部异常因子大于或等于预设异常阈值时,判定押运过程出现异常。进一步的启动码率控制机制。在本发明实施例中预设异常阈值的取值由实施者根据实际情况进行设定。
所述码率控制机制是指提高目标码率,使得各个宏块的QP不得高于预测的QP值的机制。具体基于码率控制机制控制码率,提高目标码率的方法是:当押运异常时,对初始码率增加预设码率步长得到第一码率。需要说明的是,初始码率也即为还没有启动码率控制机制时的实时码率。在本发明实施例中预设码率步长为1Mbps,在其他实施例中由实施者根据实际情况调整该取值。基于第一码率,更新图像组,当更新后的图像组中存在有宏块对应的量化参数大于预设参数值时,对第一码率增加预设码率步长,得到第二码率;基于第二码率更新图像组,当再次更新后的图像组中存在有宏块对应的量化参数大于预设参数值时,对第二码率增加预设码率步长,得到第三码率;以此类推,直至当更新后的图像组中所有宏块对应的量化参数小于或等于预设参数值时,则恢复码率至初始码率。在本发明实施例中由实施者根据实际情况设置预设参数值的取值。
例如此时的GoP的初始码率为3.2Mbps,则启动码率控制机制后的第一码率为4.2Mbps,也即下一个GoP的平均码率为4.2Mbps。如果下一个GoP中依然存在有宏块中QP值高于预设的QP值时,则对平均码率进行进一步的增大,即第二码率为5.2Mbps,以此类推,直到满足GoP中各个宏块中QP值均不高于预测的QP值时,也可以说直至当GoP中所有宏块对应的QP值均小于或等于预设参考值时,保持当前码率。如当基于第二码率5.2Mbps更新图像组后,当更新后的图像组中所有宏块对应的量化参数均小于或等于预设参考值时,则保持最新的当前码率5.2Mbps进行后续的数据采集。
当通过神经网络预测的预测局部异常因子不再高于上限,也即预测局部异常因子不再高于预设异常阈值时,则恢复至默认码率。也即当得到的预测局部异常因子小于预设异常阈值时,恢复为默认码率。
至此,当神经网络RNN根据画面得到的图像描述子Q以及各押运体素的联动特征码N的特征进行局部异常因子LOF的预测,并调节目标码率,保证视频的画质。
综上所述,本发明涉及自适应编码技术领域。该方法首先获取押运车辆的三轴加速度,将押运对象划分为至少两个押运体素,并获取每个押运体素的压力值;根据压力值得到押运体素对应的联动指标值;由联动指标值和三轴加速度构建押运体素的联动特征码;根据押运体素之间联动指标值的差异,得到押运体素的差异特征码;基于各个押运过程中压力值最大的押运体素的联动特征码和差异特征码,将各个押运过程对应的押运对象分为至少两个运动模式类别;根据押运视频中图像组中同一位置处的宏块的量化参数、熵和逆方差构建图像描述子;根据任意两个押运过程中押运对象的运动模式类别和图像描述子得到两个押运对象的差异可达距离;基于差异可达距离得到每个押运对象对应的局部异常因子;根据押运视频中图像组对应的图像描述子、局部异常因子和联动特征码训练神经网络;输入实时押运视频中图像组对应的图像描述子和联动特征码至神经网络中,得到预测局部异常因子;根据预测局部异常因子判断押运是否异常,当押运异常时启动码率控制机制。本发明借助押运容器的分布式压力传感器和车辆位姿,提出一种基于押运容器和车辆姿态数据,自动学习押运过程中的异动现象,从而针对性优化视频编码区域的方法。该方法无需分析画面的具体内容,便可提高押运过程的实时视频画质,极大降低敏感监控设施的参数调优时对人工的依赖。
本发明实施例还提出了一种押运安防系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。由于押运编码方法在上述给出了详细描述,不再赘述。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
Claims (7)
1.一种押运编码方法,其特征在于,包括:
获取押运车辆的三轴加速度,将押运车辆承载的押运对象划分为至少两个押运体素,并获取每个押运体素的压力值;
根据押运体素和邻域内其他押运体素的压力值得到押运体素对应的联动指标值;由所述联动指标值和所述三轴加速度构建押运体素的联动特征码;
根据押运体素和其他押运体素的联动指标值的差异,得到押运体素的差异特征码;
基于各个押运过程中压力值最大的押运体素的联动特征码和差异特征码,将各个押运过程对应的押运对象分为至少两个运动模式类别;
根据押运视频中图像组的所有图像中同一位置处的宏块的量化参数、熵和逆方差构建图像描述子;
根据任意两个押运过程中押运对象的运动模式类别和图像描述子得到两个押运对象的差异可达距离;基于所述差异可达距离得到每个押运对象对应的局部异常因子;以及
根据押运视频中图像组对应的图像描述子、局部异常因子和联动特征码训练神经网络;输入实时押运视频中图像组对应的图像描述子和联动特征码至神经网络中,得到预测局部异常因子;根据预测局部异常因子判断押运是否异常,当押运异常时启动码率控制机制;
其中,所述联动指标值包括:押运体素自身的压力值、押运体素对应邻域内其他押运体素的压力值均值、押运体素对应邻域内其他押运体素的最大压力值和押运体素对应邻域内其他押运体素的最小压力值;
其中,运动模式类别的获取方法为:获取各个押运过程中压力值最大的押运体素作为初始押运体素;根据任意两个押运过程中初始押运体素的联动特征码的相似程度和差异特征码的相似程度,得到两个押运过程对应的押运对象之间的差异评价值;基于所述差异评价值,将不同押运过程对应的押运对象分为至少两个运动模式类别;
其中,差异可达距离的获取方法为:根据任意两个押运过程中押运对象的运动模式类别的差异,得到第一差异度;根据所述两个押运过程对应押运视频中所有图像组的图像描述子的相似度,得到第三相似度;根据第一差异度和第三相似度得到两个押运过程中押运对象的差异可达距离。
2.根据权利要求1所述的押运编码方法,其特征在于,根据押运体素和其他押运体素的联动指标值的差异,得到押运体素的差异特征码,包括:
获取每种联动指标值对应的联动指标序列;
将任意押运体素作为目标押运体素,根据目标押运体素和其他押运体素之间对应联动指标序列的差异程度,得到序列差异值;由目标押运体素和其他所有押运体素对应的联动指标序列的序列差异值,构建目标押运体素对应的差异特征码。
3.根据权利要求1所述的押运编码方法,其特征在于,根据任意两个押运过程中初始押运体素的联动特征码的相似程度和差异特征码的相似程度,得到两个押运过程对应的押运对象之间的差异评价值,包括:
计算任意两个押运过程对应初始押运体素的联动特征码的相似度,作为第一相似度;计算所述两个押运过程对应初始押运体素的差异特征码的相似度,作为第二相似度;
根据第一相似度和第二相似度得到两个押运过程对应的押运对象之间的差异评价值。
4.根据权利要求1所述的押运编码方法,其特征在于,当押运异常时启动码率控制机制,包括:
当押运异常时,对初始码率增加预设码率步长得到第一码率;基于第一码率更新图像组,当更新后的图像组中存在有宏块对应的量化参数大于预设参数值时,对第一码率增加预设码率步长,得到第二码率;基于第二码率更新图像组,当再次更新后的图像组中存在有宏块对应的量化参数大于预设参数值时,对第二码率增加预设码率步长,得到第三码率;以此类推,直至当图像组中所有宏块对应的量化参数小于或等于预设参数值,保持当前码率。
5.根据权利要求1所述的押运编码方法,其特征在于,根据押运视频中图像组的所有图像中同一位置处的宏块的量化参数、熵和逆方差构建图像描述子,包括:
由押运视频中图像组的所有图像中同一位置处的宏块的量化参数的均值、熵的均值和逆方差的均值构建图像描述子。
6.根据权利要求1所述的押运编码方法,其特征在于,根据预测局部异常因子判断押运是否异常,包括:
当预测局部异常因子大于或等于预设异常阈值时,判定押运过程异常。
7.一种押运安防系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~6任一项所述押运编码方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310388398.XA CN116091985B (zh) | 2023-04-12 | 2023-04-12 | 押运编码方法及押运安防系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310388398.XA CN116091985B (zh) | 2023-04-12 | 2023-04-12 | 押运编码方法及押运安防系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116091985A CN116091985A (zh) | 2023-05-09 |
CN116091985B true CN116091985B (zh) | 2023-06-13 |
Family
ID=86208721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310388398.XA Active CN116091985B (zh) | 2023-04-12 | 2023-04-12 | 押运编码方法及押运安防系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116091985B (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3862927A1 (en) * | 2020-02-05 | 2021-08-11 | Another Brain | Anomaly detector, method of anomaly detection and method of training an anomaly detector |
CN113766226A (zh) * | 2020-06-05 | 2021-12-07 | 深圳市中兴微电子技术有限公司 | 图像编码方法、装置、设备及存储介质 |
CN113255620B (zh) * | 2021-07-12 | 2021-10-19 | 杭州远眺科技有限公司 | 一种基于视频中车辆群体轨迹分析的异常事件检测方法 |
CN114143505B (zh) * | 2021-08-16 | 2024-10-01 | 云钞机器人科技(北京)有限公司 | 押运处理方法及押运系统 |
CN115590505B (zh) * | 2022-12-15 | 2023-03-14 | 楠楠聚智信息科技有限责任公司 | 一种智能运动监测装置数据异常分析方法 |
-
2023
- 2023-04-12 CN CN202310388398.XA patent/CN116091985B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN116091985A (zh) | 2023-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1041043C (zh) | 运动预测方法及其装置 | |
Tu et al. | Real-time streaming point cloud compression for 3d lidar sensor using u-net | |
US5684898A (en) | Method and apparatus for background determination and subtraction for a monocular vision system | |
CN111950394B (zh) | 一种车辆变道的预测方法、装置及计算机存储介质 | |
CN111260738A (zh) | 基于相关滤波和自适应特征融合的多尺度目标跟踪方法 | |
WO1992002894A1 (de) | Verfahren zur analyse zeitlicher folgen digitaler bilder | |
CN112528961B (zh) | 一种基于Jetson Nano的视频分析方法 | |
CN112270692B (zh) | 一种基于超分辨的单目视频结构和运动预测的自监督方法 | |
CN111735523B (zh) | 基于视频识别的车重检测方法、装置及存储介质 | |
AP504A (en) | Computer compression of video images. | |
CN116645563A (zh) | 一种基于深度学习的典型交通事件检测系统 | |
KR100646302B1 (ko) | 움직임 벡터 검출 장치 및 움직임 벡터 검출 방법 | |
CN116091985B (zh) | 押运编码方法及押运安防系统 | |
CN112036381A (zh) | 视觉跟踪方法、视频监控方法及终端设备 | |
CN112270691A (zh) | 一种基于动态滤波器网络的单目视频结构和运动预测方法 | |
CN115439339A (zh) | 图像矫正 | |
CN115565130A (zh) | 一种无人值守系统及其基于光流的监控方法 | |
CN117516581A (zh) | 融合BEVFormer和邻域注意力Transformer端到端自动驾驶轨迹规划系统、方法及训练方法 | |
CN117292346A (zh) | 面向驾驶人和车辆状态一体感知的车辆行驶风险预警方法 | |
EP0592128B1 (en) | Motion vector detection and prediction | |
CN116777956A (zh) | 基于多尺度航迹管理的运动目标筛选方法 | |
CN113573058B (zh) | 一种基于时空显著性融合的帧间图像编码方法 | |
CN112652000B (zh) | 一种针对图像小尺度运动方向判定的方法 | |
JP4200165B2 (ja) | ステレオカメラによるオブジェクトの分類のための方法 | |
CN112449124A (zh) | 用于预处理摄像机原始数据的方法和预处理设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |