CN102457713B - 轨道侧故障检测系统及其实现方法和装置 - Google Patents

轨道侧故障检测系统及其实现方法和装置 Download PDF

Info

Publication number
CN102457713B
CN102457713B CN201010526759.5A CN201010526759A CN102457713B CN 102457713 B CN102457713 B CN 102457713B CN 201010526759 A CN201010526759 A CN 201010526759A CN 102457713 B CN102457713 B CN 102457713B
Authority
CN
China
Prior art keywords
block
pixels
module
submodule
filled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010526759.5A
Other languages
English (en)
Other versions
CN102457713A (zh
Inventor
介鸣
龙飞
潘莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to CN201010526759.5A priority Critical patent/CN102457713B/zh
Priority to EP11184896A priority patent/EP2448267A1/en
Priority to US13/317,854 priority patent/US20120113259A1/en
Publication of CN102457713A publication Critical patent/CN102457713A/zh
Application granted granted Critical
Publication of CN102457713B publication Critical patent/CN102457713B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/181Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Abstract

本发明实施例提供了一种轨道侧故障检测系统(TFDS),该系统包括:中心站和至少一个位于轨道侧的现场站,所述现场站包括控制装置和至少两个摄像机:所述摄像机,用于在列车经过时对所述列车进行拍摄,并将拍摄到的图像数据传送至所述控制装置;所述控制装置,用于利用内置的GPU对来自所述摄像机的图像数据进行图像处理,并将处理后的图像数据通过网络发送至所述中心站;及,所述中心站,用于根据来自所述现场站的控制装置的图像数据检测所述列车的故障。本发明实施例还提出了应用于TFDS中轨道侧的方法及装置。采用本发明实施例能显著提高TFDS的图像数据处理能力和效率,并能显著降低现场站的安装成本。

Description

轨道侧故障检测系统及其实现方法和装置
技术领域
本发明涉及故障检测技术,特别涉及一种轨道侧故障检测系统(TFDS,Track-side Fault DetectionSystem)、图像处理方法、数据发送方法、图像处理装置和控制装置。
背景技术
TFDS是部署在轨道交通系统(如:铁路、地铁等)上的安全系统,也称为列车运行故障动态图像检测系统或者货车动态故障检测系统,是一套集高速数字图像采集、大容量图像数据实时处理、精确定位技术、模式识别技术、智能化、网络化和信息化技术、自动控制技术于一体的智能系统,该系统能利用所拍摄到的列车图像对列车隐蔽和常见故障进行动态检测。
图1为现有技术中TFDS的组成结构示意图。如图1所示,TFDS包括两部分:现场站(Field Station)和中心站(Central Station),现场站位于轨道旁,其与中心站通过光纤连接。在现场站中,安装有多个高速高分辨率(比如1400×1024)的摄像机(Camera),这些摄像机用于当列车以高速行驶经过时对列车进行拍照以得到列车的图像数据(比如:列车的照片),之后,现场站中的计算机对列车的图像数据进行压缩等处理,然后将处理后的图像数据通过光纤传送到远程的中心站。在中心站,这些图像数据被保存下来并可由维护人员人工检查或由机器视觉系统(Machine Vision System)自动检查,以检测列车的故障,比如:通过查看列车的照片,维护人员或机器视觉系统可以判断车轮是否出现破损、列车是否有螺栓脱落、车厢底部承重结构是否出现裂痕等等。
可见,TFDS能够利用所拍摄到的列车的图像数据对列车的故障进行动态检测,以及时发现列车出现的安全问题,进而能够及时有效的对轨道交通系统进行维修,可以有效的提高轨道交通系统的维护效率及质量。
然而,TFDS的有效运行基于实时的图像数据,因此,如何能提高图像数据的处理能力以及效率已成为TFDS技术中的关键问题。
发明内容
本发明实施例提出了一种TFDS、图像处理方法、数据发送方法以及图像处理装置和控制装置,以提高TFDS的图像数据处理能力和效率。
为了解决上述技术问题,本发明实施例提供了以下技术方案。
本发明实施例提供了一种图像处理装置,所述图像处理装置包括:
第一模块,用于将所述原始图像数据划分为至少一个N×N像素块;其中,N为任意正整数;
第二模块,用于对来自所述第一模块的N×N像素块执行离散余弦变换DCT;
第三模块,用于对所述第二模块输出的经过DCT的N×N像素块进行量化;
第四模块,用于对所述第三模块输出的经过量化的N×N像素块执行锯齿形串行化;及,
第五模块,用于对所述第四模块输出的经过锯齿形串行化的N×N像素块进行块熵编码,以得到目标压缩文件,所述目标压缩文件包括与所述N×N像素块对应的压缩数据块。
本发明实施例还提供了一种控制装置,所述控制装置包括:
数据接收模块,用于接收由摄像机拍摄的图像数据;
图像处理模块,其内置有图形处理器(GPU,Graphic Processing Unit),用于利用所述GPU对所述数据接收模块接收到的图像数据进行图像处理;及,
数据发送模块,用于将所述图像处理模块处理后的图像数据发送至所述TFDS中的中心站。
本发明实施例还提出了一种TFDS,该TFDS包括:中心站和至少一个位于轨道侧的现场站,所述现场站包括控制装置和至少两个摄像机:
所述摄像机,用于在列车经过时对所述列车进行拍摄,并将拍摄到的图像数据传送至所述控制装置;
所述控制装置,用于利用内置的GPU对来自所述摄像机的图像数据进行图像处理,并将处理后的图像数据通过网络发送至所述中心站;及,
所述中心站,用于根据来自所述现场站的控制装置的图像数据检测所述列车的故障。
本发明实施例还提出了一种轨道侧故障检测系统TFDS中的图像处理方法,所述方法包括:
接收摄像机拍摄到的原始图像数据;
利用图形处理器GPU对所述原始图像数据进行图像处理;及,
将经过图像处理的图像数据通过网络发送至中心站。
本发明实施例还提出了一种轨道侧故障检测系统TFDS中的数据发送方法,所述方法包括:
将原始图像数据划分为至少两个N×N像素块;其中,N为任意正整数;
并行的对所述N×N像素块执行离散余弦变换DCT、量化和锯齿形串行化;
对所述锯齿形串行化后的N×N像素块进行块熵编码以得到目标压缩文件;其中,所述目标压缩文件包括与所述N×N像素块对应的压缩数据块;及,
将所述目标压缩文件通过网络发送至中心站。
采用本发明实施例提供的系统、方法及装置能够显著提高TFDS的图像数据处理能力和效率,并能显著降低现场站的安装成本。
附图说明
下面将通过参照附图详细描述本发明的示例性实施例,使本领域的普通技术人员更清楚本发明的上述及其它特征和优点,附图中:
图1为现有技术中TFDS的组成结构示意图;
图2为本发明的发明人所提出的TFDS中一现场站实例的组成结构示意图;
图3为本发明的发明人所提出的TFDS中一现场站实例中摄像机与工业计算机(IPC,Industrial PersonalComputer)的连接关系示意图;
图4为依据本发明实施例的摄像机与IPC之间的连接关系示意图;
图5为依据本发明实施例的图像压缩方法流程示意图;
图6为图5所示图像压缩流程中的离散余弦变换(DCT,Discrete Cosine Transforming)实现流程示意图;
图7为本发明实施例中锯齿形串行化(Zig-zag Serialization)的示意图;
图8为本发明实施例中锯齿形串行化后的直流(DC)值和交流(AC)值示意图;
图9为依据本发明实施例的压缩数据块结构示意图;
图10为依据本发明实施例的应用于TFDS中轨道侧的控制装置的组成结构示意图;
图11为依据本发明实施例的一现场站应用实例示意图;
图12为依据本发明实施例的一图像处理装置的结构示意图;
图13为依据本发明实施例的一TFDS中数据发送方法的流程示意图。
具体实施方式
以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
本发明实施例提出了一种TFDS,其中,一现场站实例的组成结构如图2所示。如图2所示,现场站部署在铁轨侧并通过以太网连接远程的中心站;现场站包括:控制装置以及分别与控制装置连接的灯光组(Lamp Group)、光度计(Photometer)、铁轮传感器(Iron Wheel Sensor)和摄像机组。其中,铁轮传感器安装在铁轨上,用于感应铁轨上是否有列车行驶经过,以使控制装置启动摄像机组进行拍摄;灯光组用于根据光度计的测量结果进行照明;摄像机组包括三组共五个摄像机:第一组(包括一个摄像机)安装于铁轨右侧,第二组(包括一个摄像机)安装于铁轨左侧,第三组(包括三个摄像机)安装于铁轨底部,这三组摄像机能够从全方位对列车进行拍摄,并将拍摄到的图像数据传送到控制装置。此外,为了在摄像机空闲时(即不进行拍摄时)对其加以保护,现场站还进一步包括三个门以分别对这三组摄像机进行保护,这三个门也连接控制装置,由控制装置控制它们的开/关。如图2所示,用于保护安装于铁轨右侧的一组摄像机的门安装在铁轨右侧,被称为“右门”;用于保护安装于铁轨左侧的一组摄像机的门安装在铁轨左侧,被称为“左门”;用于保护安装于铁轨底部的一组摄像机的门安装在铁轨底部,被称为“底门”。控制装置除了对其所连接的各个设备进行控制,还要对来自各个摄像机的图像数据进行处理。本发明的各实施例中,摄像机可以为能够拍照和/或摄制视频的影像设备。
上述的控制装置可采用IPC来实现。由于,TFDS对图像数据的实时性要求较高,即:摄像机拍摄到图像数据以后这些图像数据应在短时间内被处理完,以便及时发现列车的故障并指示列车在附近的车站停留以进行维修。所以,在本发明实施例提供的TFDS中,现场站可以包括多个IPC来并行的对多个摄像机拍摄到的图像数据进行处理,以使图像数据处理速度能够满足TFDS的动态故障检测的要求。假定:摄像机拍摄到的图像数据为图片,这些图片需要被压缩为JPEG格式,同时考虑列车的行驶速度,则现场站需要具有至少200张/秒的图片压缩速度才能满足TFDS的动态故障检测的要求。图3为本发明实施例提供的TFDS中一现场站实例中摄像机与IPC的连接关系示意图。如图3所示,现场站中包括五个摄像机(Camera1、Camera 2、Camera 3、Camera 4、Camera 5),则现场站的控制装置需要包括至少五个IPC,它们分别连接这五个摄像机,分别用于对其各自连接的摄像机所拍摄到的图像数据进行处理;这五个IPC再通过交换机(Switch)将处理后的图像数据通过网络传送到中心站。
但是,本发明的发明人发现,图3所示的现场站实现方案存在如下问题:由于采用多个IPC,使现场站的安装尺寸太大,其实现成本将随IPC的数量增加而显著增加,同时现场站的维护复杂度也将大大提高。
为了能够降低现场站的维护复杂度同时也降低其实现成本,本发明实施例进一步对现场站进行了改进,其中的控制装置采用图形处理器(GPU,Graphic Processing Unit)来进行图像处理。这里,GPU是一种专门的针对图形的核心处理器,其能够以高度并行的方式对原始图像数据进行处理,因此,采用GPU之后,控制装置的图像处理速度显著提高,如果控制装置采用IPC来实现,则采用数量较少的IPC,甚至单一IPC,就能以满足TFDS系统要求的速度并行处理来自多个摄像机的图像数据。本发明并不限定现场站所使用的IPC数量,总之,通过使用GPU来进行图像处理之后,IPC的数量可以大大减少,任何一种应用于TFDS中的基于GPU进行图像处理的实现方案均落入本发明的保护范围之内。
图4为依据本发明实施例的摄像机与IPC之间的连接关系示意图。如图4所示,现场站中包括五个摄像机(Camera 1、Camera 2、Camera 3、Camera 4、Camera 5),现场站的控制装置仅包括一个IPC,它连接这五个摄像机,用于并行的对这五个摄像机所拍摄到的图像数据进行处理,再通过交换机(Switch)将处理后的图像数据通过网络传送到中心站。因为采用了GPU进行图像处理,所以本发明实施例中,现场站的安装尺寸将大大减小,安装成本将显著降低,维护成本和复杂度也会明显降低。
本发明实施例中,控制装置可采用GPU进行各种图像处理,包括:图像预处理(例如图像增强)、图像压缩及编码、和图像分析(例如特征识别和定位)等等中的任一者或任意组合;本发明实施例中图像处理所针对的图像数据可以为各种格式的文件,比如:图片、视频文件等等。以下以图像压缩为例,对本发明实施例中基于GPU的图像处理的具体实现方案加以说明。
图5为依据本发明实施例的图像压缩方法流程示意图。在图5所示的流程中,IPC将来自摄像机的原始图像数据(Raw Image Data)压缩成JPEG格式的图片,该流程包括:
步骤501:IPC将来自摄像机的原始图像数据加载到全局存储器(Global Memory)中。
步骤502:IPC中的GPU依据JPEG压缩算法对全局存储器中的原始图像数据进行压缩编码,依次包括步骤:离散余弦变换(DCT,Discrete Cosine Transforming)、量化(Quantization)、块的锯齿形串行化(Block-wise Zig-zag Serialization)和块熵编码(Block Entropy Encoding)。这里,关于DCT、量化、锯齿形串行化和块熵编码的具体实现方法,以下将结合图6~9加以详述。
步骤503:IPC将全局存储器中的压缩编码后的图像数据(即:JPEG格式的图像数据)复制到主存储器(Main Memory),再输出JPEG格式的图像数据到中心站。
如图12所示,本发明实施例提供了一种图像处理装置,该装置例如可以包括五个模块:第一模块1201,用于将原始图像数据划分为至少一个N×N像素块;其中,N为任意正整数;第二模块1202,用于对来自第一模块1201的N×N像素块执行DCT;第三模块1203,用于对第二模块1202输出的经过DCT的N×N像素块进行量化;第四模块1204,用于对第三模块1203输出的经过量化的N×N像素块执行锯齿形串行化;及,第五模块1205,用于对第四模块1204输出的经过锯齿形串行化的N×N像素块进行块熵编码,以得到目标压缩文件,此目标压缩文件包括与N×N像素块分别对应的压缩数据块。
本实施例中,该图像处理装置特别的安装在TFDS中的现场站中。
本实施例中,该图像处理装置中的第一模块1201例如可以将原始图像数据划分为至少两个N×N像素块。此时,第二模块1202、第三模块1203、第四模块1204以及第五模块1205均可以并行的对多个像素快进行处理,能够满足高速图像处理的需求。
本实施例中,第五模块1205例如可以包括:计算子模块1215,用于计算N×N像素块的编码长度和该N×N像素块对应的压缩数据块的目的地址;长度填充子模块1225,用于向计算子模块1215得到的目的地址填充编码长度;偏移量填充子模块1235,用于填充偏移量,该偏移量为第四模块1204锯齿串行化后得到的AC值的编码的偏移量;DC值填充子模块1245,用于填充第四模块1204锯齿串行化后得到的DC值;霍夫曼编码填充子模块1255,用于计算AC值的霍夫曼编码并填充该霍夫曼编码;空偏移量填充子模块1265,用于填充空比特以补齐当前字节。由于该图像处理装置包括空偏移量填充子模块1265,可以使各个压缩数据块成为整字节对齐的存储空间,由此各个8×8像素块的AC值的霍夫曼编码可以并行的执行,进而能显著提高压缩编码效率,满足高速图像处理的需求。
具体的,本实施例中,第五模块1205包括的子模块满足以下条件之一或其任意组合:长度填充子模块1225填充的编码长度占一个字节;偏移量填充子模块1235填充的偏移量占一个字节;偏移量填充子模块1235向长度填充子模块1225填充的编码长度之后的位置填充该偏移量;DC值填充子模块1245填充的DC值占两个字节;DC值填充子模块1245向偏移量填充子模块1235填充的偏移量之后的位置填充该DC值;霍夫曼编码填充子模块1255向DC值填充子模块1245填充的DC值之后的位置填充该霍夫曼编码;空偏移量填充子模块1265向霍夫曼编码子模块1255填充的霍夫曼编码之后的位置填充该空比特。
具体的,本实施例中,在N大于1时,第二模块1202采用多个线程对一个N×N像素块执行DCT。特别的,第二模块1202对一个N×N像素块中的每个像素采用一个线程执行DCT。
具体的,本实施例中,第三模块1203包括第一量化子模块1213和/或第二量化子模块1223。第一量化子模块1213采用基于采集的图像数据的亮度平均值的统计的量化表。第二量化子模块1223采用基于一天内不同时间段的亮度的量化表。
图6为图5所示图像压缩流程中的DCT实现流程示意图,其中,本流程实现的是二维DCT。如图6所示,该流程包括:
步骤601:原始的图像数据被划分为多个8×8像素块(8×8 pixel Block)。这里,本发明并不限定将图像数据划分为多大的块,原始的图像数据可以被划分为任意像素大小的块,比如:划分为16×16像素块。
步骤602:运行多个线程来计算各个像素块的DCT系数,其中,一个线程用于计算一个像素的DCT系数,则对于一个8×8像素的块,需要运行64个线程来计算64个像素的DCT系数。
这里,GPU可基于通用并行计算构架——计算统一设备构架(CUDA,Compute Unified DeviceArchitecture),来进行图像处理,在具体实现时,可并行的运行多个CUDA块,一个CUDA块相当于一个流处理块,其可并行的运行大量的线程(比如:128×128个线程),因此,利用GPU可以并行的运行大量CUDA线程来并行的对多个像素块进行处理。
对多个8×8像素块进行并行的二维DCT处理,其中,对于每一个8×8像素块,执行如下步骤603~606:
步骤603:64个线程并行的将其各自对应的像素加载到共享存储器(Shared Memory),进而将它们对应的一个完整的8×8像素块加载到共享存储器。
具体的,为了确定一个完整的8×8像素块是否已被加载到共享存储器,对应于此8×8像素块的64个线程之间需要进行同步,当这64个线程都经过同步点(Synchronization Point)时,则可确定此8×8像素块已被加载到共享存储器中,这里,关于如何实现多个线程的同步以及同步点的设定属现有技术。
这里,每一个像素可由一个二维坐标(ThreadIdx.x,ThreadIdx.y)来标识,每一个线程也相应的可由一个二维坐标(ThreadIdx.x,ThreadIdx.y)来标识。
步骤604:64个线程计算各自对应的像素的两个向量之间的点乘积ATX,并将此计算结果保存在共享存储器中。
这里,对于每一个8×8像素块,所有的波形被预先计算并保存在常数存储器(constant memory)中,并构成一个二维数组A,此二维数组A中每一列保存着一个基函数A(x,u)的值;假定一个线程的坐标为(ThreadIdx.x,ThreadIdx.y),则要计算余弦系数的ThreadIdx.y列和输入块的ThreadIdx.x列的点乘积。这里,余弦系数的ThreadIdx.y列相当于AT的ThreadIdx.y行,输入块的ThreadIdx.x列指的是加载到共享存储器的8×8像素块的ThreadIdx.x列。
具体的,为了确定一个完整的8×8像素块中各个像素的ATX是否已被计算完,对应于此8×8像素块的64个线程之间需要进行同步,当这64个线程都经过同步点时,则可确定此8×8像素块中的各个像素的ATX已被计算完。
步骤605:在步骤604得到的计算结果基础之上,64个线程计算各自对应的像素的(ATX)A(即,DCT系数),并将此计算结果保存在共享存储器中。
具体的,为了确定一个完整的8×8像素块中各个像素的(ATX)A是否已被计算完,对应于此8×8像素块的64个线程之间需要进行同步,当这64个线程都经过同步点时,则可确定此8×8像素块中的各个像素的(ATX)A已被计算完。
步骤606:64个线程分别将各自对应的像素的(ATX)A从共享存储器复制到全局存储器的输出,进而将它们对应的一个完整的8×8像素块的DCT系数复制到全局存储器的输出。
具体的,为了确定一个完整的8×8像素块的DCT系数是否已被复制到全局存储器的输出,对应于此8×8像素块的64个线程之间需要进行同步,当这64个线程都经过同步点时,则可确定此8×8像素块的DCT系数已被复制到全局存储器的输出。
本发明实施例中,在执行量化时,可采用两种量化表:一种是基于列车的图像数据的亮度平均值的统计,另一种是基于一天内不同时间段的亮度。这里,关于量化的具体实现步骤,本发明可采用现有的各种技术来实现,本文不再详述。
在执行完DCT和量化之后,GPU将对每一个8×8像素块进行锯齿形串行化。其中,GPU可以运行多个线程来并行的对多个8×8像素块进行处理,每一个线程用于对一个8×8像素块进行锯齿形串行化。这里,关于锯齿形串行化的具体实现步骤,可采用现有的各种技术来实现,具体的实现过程如图7所示,此处不再详述。
在锯齿形串行化结束后,对于一个8×8像素块,将得到一个直流(DC)值以及多个交流(AC)值。如图8所示,在一个经过锯齿形串行化的8×8像素块中,第一个元素,即坐标为(0,0)的元素,为DC值,而剩余的元素为AC值。
在本发明实施例中,为了加快熵编码的速度,对标准的JPEG压缩数据块的结构进行了改进,以适用GPU的高度并行化特征。
图9为依据本发明实施例的压缩数据块结构示意图。在图9中,目标压缩文件由多个压缩数据块组成,其中,每一个压缩数据块代表一个8×8像素块,其结构如图9所示。一个压缩数据块包括如下字段:一字节(Byte)的编码长度(Length)、一字节的偏移量(Offset)、两字节的DC值、AC值的霍夫曼编码(HuffmanCoding)、空偏移量比特(Empty Offset Bit)。其中,编码长度代表8×8像素块的字节长度;偏移量代表AC值的编码的偏移量,即最后一个字节的有效位长度(其用于解码时定位无效数据);空偏移量比特代表最后一个字节的无效位。
具体的,在锯齿形串行化之后,GPU运行多个线程来并行的生成多个上述压缩数据块,其中,每一线程对应一个8×8像素块及其压缩数据块,其计算自身对应的8×8像素块的编码长度和其压缩数据块的目的地址,并按如下方式进行编码并向目的地址填充压缩数据块:
步骤1:向目的地址填充计算得到的编码长度;
步骤2:填充偏移量和DC值;及,
步骤3:计算并填充AC值的霍夫曼编码,之后,填充空比特以补齐当前字节,这些空比特被称为空偏移量比特(Empty Offset Bit)。
由于上述压缩数据块的最后一位为无效位(即空偏移量比特),则使各个压缩数据块成为整字节对齐的存储空间,进而各个8×8像素块的AC值的霍夫曼编码可以并行的执行,进而能显著提高压缩编码效率。
经过上述处理,原始的图像数据被压缩成一个个压缩数据块,这些压缩数据块被保存为二进制的目标压缩文件并通过光纤被发送到中心站。在中心站,此压缩文件被调整为典型的JPEG文件并保存在数据库中。
本发明实施例还提出了一种应用于TFDS中轨道侧的控制装置。此控制装置例如位于上述TFDS中的现场站。图10为依据本发明实施例的应用于TFDS中轨道侧的控制装置的组成结构示意图。如图10所示,该控制装置至少包括:数据接收模块1001、图像处理模块1002和数据发送模块1003。其中:
数据接收模块1001用于接收由摄像机拍摄的图像数据;
图像处理模块1002内置有GPU,用于利用此GPU对数据接收模块1001接收到的图像数据进行图像处理;及,
数据发送模块1003用于将图像处理模块1002处理后的图像数据发送至中心站。
本实施例中,该图像处理模块1002中的GPU例如可以由图12中所示的图像处理装置实现。
图10示出的控制装置涉及与图像处理有关的功能模块,关于图像处理的各种具体实现方法前面已有详述,这里不再赘述,该控制装置还可以进一步包括现有的各种功能模块来实现对于现场站中各个组成部分(如:灯光组、摄像机、铁轮传感器等等)的控制,这里不再将这些功能模块示出,但均落入本发明的保护范围之内。此外,上述控制装置可以实现为硬件设备,也可以以软件的方式实现为虚拟装置,该虚拟装置可运行在现场站中用于做集中控制的设备(如:IPC)中,以完成基于GPU的图像处理。
本发明实施例还提供了一种TFDS中的数据发送方法,如图13所示,该方法包括:
步骤1301:将原始图像数据划分为至少两个N×N像素块;其中,N为任意正整数;
步骤1302:并行的对各N×N像素块执行DCT、量化和锯齿形串行化;
步骤1303:对锯齿形串行化后的各N×N像素块进行块熵编码以得到目标压缩文件;其中,目标压缩文件包括与各所述N×N像素块对应的压缩数据块;及,
步骤1304:将目标压缩文件通过网络发送至中心站。
在本实施例中,具体的DCT、量化、锯齿形串行化以及熵编码的具体实现可以参照上述实施例,此处不再赘述。
图11为依据本发明实施例的一现场站应用实例示意图。如图11所示,该现场站包括单一IPC,此IPC安装了GPU和过程监视系统SIMANTIC WinAC,此WinAC系统能够通过ProfiBUS通信卡(如:CP5613)和ProfiBUS远程输入/输出端口(如:ET200S)对灯光组、各个门、各个摄像机等进行控制。图11中的数字信号处理/现场可编程门阵列(DSP/FPGA)接口板用于处理来自铁轮传感器(如:Axis sensor)的信号并触发五个摄像机(如:DALSA数字摄像机)。IPC通过一个4端口的千兆以太网卡(Giga-Ethernet card)或四个一端口以太网卡接收未压缩的图像数据,再通过千兆以太网卡通过光纤交换机输出压缩后的图像数据至中心站。
采用上述各种本发明实施例,能够显著提高TFDS的现场站的图像处理速度,以图像压缩为例,计算机PC(E5420+GTX 260+)对1400×1024像素的图像的压缩速度可达到大约4.9毫秒;此外,由于现场站采用单一的基于GPU的IPC处理图像数据,进而使现场站的安装尺寸及材料成本显著降低,其维护成本和难度也相应降低。
上述各实施例之间可以相互参照,例如装置的具体实现以及使用方法可以参照方法实施例,而方法实施例也可以参照对于装置实施例的具体描述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种控制装置,所述控制装置包括:
数据接收模块,用于接收由摄像机拍摄的图像数据;
图像处理模块,其内置有图形处理器GPU,用于利用所述GPU对所述数据接收模块接收到的图像数据进行图像处理;及,
数据发送模块,用于将所述图像处理模块处理后的图像数据发送至中心站,其中所述图像处理模块包括:
第一模块,用于将原始图像数据划分为至少一个N×N像素块;其中,N为任意正整数;
第二模块,用于对来自所述第一模块的N×N像素块执行离散余弦变换DCT;
第三模块,用于对所述第二模块输出的经过DCT的N×N像素块进行量化;
第四模块,用于对所述第三模块输出的经过量化的N×N像素块执行锯齿形串行化;及,
第五模块,用于对所述第四模块输出的经过锯齿形串行化的N×N像素块进行块熵编码,以得到目标压缩文件,所述目标压缩文件包括与所述N×N像素块对应的压缩数据块,
其中所述第五模块包括:
计算子模块,用于计算所述N×N像素块的编码长度和所述N×N像素块对应的压缩数据块的目的地址;
长度填充子模块,用于向所述计算子模块得到的目的地址填充所述编码长度;
偏移量填充子模块,用于填充偏移量,所述偏移量为所述第四模块锯齿串行化后得到的交流AC值的编码的偏移量;
直流DC值填充子模块,用于填充所述第四模块锯齿串行化后得到的DC值;
霍夫曼编码填充子模块,用于计算所述AC值的霍夫曼编码并填充所述霍夫曼编码;
空偏移量填充子模块,用于填充空比特以补齐当前字节。
2.根据权利要求1所述的控制装置,其中
所述第一模块具体用于将所述原始数据图像划分为至少两个N×N像素块;
所述第二模块具体用于并行的对来自于所述第一模块的N×N像素块执行DCT;
所述第三模块具体用于并行的对所述第二模块输出的经过DCT的N×N像素块进行量化;
所述第四模块具体用于并行的对所述第三模块输出的经过量化的N×N像素块执行锯齿形串行化;
所述第五模块具体用于并行的对所述第四模块输出的经过锯齿形串行化的N×N像素块进行块熵编码,以得到目标压缩文件。
3.根据权利要求1所述的控制装置,其中,所述第五模块包括的子模块满足以下条件之一或其任意组合:
所述长度填充子模块填充的所述编码长度占一个字节;
所述偏移量填充子模块填充的所述偏移量占一个字节;
所述偏移量填充子模块向所述长度填充子模块填充的所述编码长度之后的位置填充所述偏移量;
所述DC值填充子模块填充的所述DC值占两个字节;
所述DC值填充子模块向所述偏移量填充子模块填充的所述偏移量之后的位置填充所述DC值;
所述霍夫曼编码填充子模块向所述DC值填充子模块填充的所述DC值之后的位置填充所述霍夫曼编码;
所述空偏移量填充子模块向所述霍夫曼编码子模块填充的所述霍夫曼编码之后的位置填充所述空比特。
4.根据权利要求1-3中任一项所述的控制装置,其中,在N大于1时,所述第二模块采用多个线程对一个N×N像素块执行DCT。
5.根据权利要求1-3中任一项所述的控制装置,其中,所述装置应用于轨道侧故障检测系统TFDS中的现场站。
6.一种现场站,所述现场站位于轨道侧,且所述现场站包括如权利要求1-5中任一项所述的控制装置。
7.一种轨道侧故障检测系统TFDS中的图像处理方法,所述方法包括:
接收摄像机拍摄到的原始图像数据;
利用图形处理器GPU对所述原始图像数据进行图像处理;及,
将经过图像处理的图像数据通过网络发送至中心站,
其中,所述利用所述GPU进行的图像处理包括图像压缩,
其中所述利用所述GPU对所述原始图像数据进行图像压缩包括:
将所述原始图像数据划分为至少两个N×N像素块;其中,N为任意正整数;及,
运行至少两个线程以并行的对所述N×N像素块进行图像压缩并生成目标压缩文件;其中,对于一个N×N像素块的图像压缩包括:离散余弦变换DCT、量化、锯齿形串行化、块熵编码;所述目标压缩文件包括与所述N×N像素块对应的多个压缩数据块,
其中,对于一个N×N像素块的块熵编码包括:
运行一个线程以执行如下步骤;
计算所述N×N像素块的编码长度以及所述N×N像素块的压缩数据块的目的地址;
向所述目的地址填充所述编码长度;
填充偏移量和所述锯齿形串行化后得到的直流DC值;其中,所述偏移量为所述锯齿形串行化后得到的交流AC值的编码的偏移量;
计算所述AC值的霍夫曼编码并填充所述AC值的霍夫曼编码;及,
填充空比特以补齐当前字节。
8.根据权利要求7所述的方法,其中,当N大于1时,对于一个N×N像素块的DCT包括:运行至少两个线程来对所述N×N像素块的各个像素分别执行DCT,其中,一个线程用于对一个像素执行DCT。
9.根据权利要求7所述的方法,其中,所述量化中采用的量化表为:基于所述图像数据的亮度平均值的统计的量化表,或者,基于一天内不同时间段的亮度的量化表。
CN201010526759.5A 2010-10-29 2010-10-29 轨道侧故障检测系统及其实现方法和装置 Active CN102457713B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201010526759.5A CN102457713B (zh) 2010-10-29 2010-10-29 轨道侧故障检测系统及其实现方法和装置
EP11184896A EP2448267A1 (en) 2010-10-29 2011-10-12 Track-side fault detection system and method and apparatus for implementing the same
US13/317,854 US20120113259A1 (en) 2010-10-29 2011-10-31 Track-side fault detection system and method and apparatus for implementing the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010526759.5A CN102457713B (zh) 2010-10-29 2010-10-29 轨道侧故障检测系统及其实现方法和装置

Publications (2)

Publication Number Publication Date
CN102457713A CN102457713A (zh) 2012-05-16
CN102457713B true CN102457713B (zh) 2014-06-25

Family

ID=44785601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010526759.5A Active CN102457713B (zh) 2010-10-29 2010-10-29 轨道侧故障检测系统及其实现方法和装置

Country Status (3)

Country Link
US (1) US20120113259A1 (zh)
EP (1) EP2448267A1 (zh)
CN (1) CN102457713B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105531995B (zh) * 2013-05-10 2019-01-08 罗伯特·博世有限公司 用于使用多个摄像机进行对象和事件识别的系统和方法
CN104184961A (zh) * 2013-05-22 2014-12-03 辉达公司 用于生成全景视频的移动设备和系统
CN103871021B (zh) * 2014-02-27 2017-10-17 电子科技大学 一种由cpu和gpu协同工作的目标航迹初始化方法
CN106600581B (zh) * 2016-12-02 2019-09-24 北京航空航天大学 一种基于双目立体视觉的列车运行故障自动检测系统及方法
CN108280467B (zh) * 2018-01-12 2020-10-16 北京摩拜科技有限公司 车辆故障检测方法、检测设备、服务器及车辆系统
CN108447240A (zh) * 2018-03-26 2018-08-24 广东溢达纺织有限公司 自动分绞机远程操控系统、方法、计算机设备和存储介质
CN108957237B (zh) * 2018-08-01 2020-12-01 歌尔光学科技有限公司 一种异常线路检测方法、装置、设备及存储介质
CN110243615A (zh) * 2019-06-21 2019-09-17 中国神华能源股份有限公司 车辆全方位图像监控系统及车辆监控系统
CN113132716B (zh) * 2019-12-31 2023-02-03 中国铁路北京局集团有限公司石家庄车辆段 一种tfds线性扫描相机的校正方法
CN111292218A (zh) * 2020-03-10 2020-06-16 上海申铁信息工程有限公司 一种铁路车站设备智能化监控系统的构建方法与装置
CN111986174A (zh) * 2020-08-17 2020-11-24 深圳市商汤科技有限公司 缺陷检测方法、装置、电子设备及计算机存储介质
CN116046430B (zh) * 2023-01-06 2023-06-27 哈尔滨市科佳通用机电股份有限公司 轨旁故障图像检测设备工况的测试方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5568278A (en) * 1991-03-19 1996-10-22 Olympus Optical Co., Ltd. Image data coding and decoding method and apparatus with a plurality of DCT's, quantizers, and VLC's

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7869660B2 (en) * 2005-10-31 2011-01-11 Intel Corporation Parallel entropy encoding of dependent image blocks

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5568278A (en) * 1991-03-19 1996-10-22 Olympus Optical Co., Ltd. Image data coding and decoding method and apparatus with a plurality of DCT's, quantizers, and VLC's

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Course Project for ECE 1724.JPEG Compression Algorithm Using CUDA.《http://www.eecg.toronto.edu/~moshovos/CUDA08/arx/JPEG_report.pdf》.2009,全文.
CUDA WUDA SHUDA:CUDA Compression Project;Leiwen Wu et al.;《http://ppl.stanford.edu/cs315a/pub/Main/CS315a/CUDA_Compression_Final_Report.pdf》;20090317;全文 *
EVOC.Trouble of Moving Freight Car Detection System (TFDS).《http://www.evoc.com/solutions/Vehicle-Dynamic-Image-Detection-System/detail.aspx》.2010,全文.
JPEG Compression Algorithm Using CUDA;Course Project for ECE 1724;《http://www.eecg.toronto.edu/~moshovos/CUDA08/arx/JPEG_report.pdf》;20090603;全文 *
Leiwen Wu et al..CUDA WUDA SHUDA:CUDA Compression Project.《http://ppl.stanford.edu/cs315a/pub/Main/CS315a/CUDA_Compression_Final_Report.pdf》.2009,全文.
Trouble of Moving Freight Car Detection System (TFDS);EVOC;《http://www.evoc.com/solutions/Vehicle-Dynamic-Image-Detection-System/detail.aspx》;20100311;全文 *

Also Published As

Publication number Publication date
CN102457713A (zh) 2012-05-16
US20120113259A1 (en) 2012-05-10
EP2448267A1 (en) 2012-05-02

Similar Documents

Publication Publication Date Title
CN102457713B (zh) 轨道侧故障检测系统及其实现方法和装置
CN102148988B (zh) 基于fpga的高速jpeg图像处理系统及其处理方法
CN108616722A (zh) 一种嵌入式高清视频采集与数据流传输系统
CN1819658A (zh) 用于以帧间或帧内模式编码视频图像的方法和设备
CN1707545A (zh) 超速车辆拍照管理系统
CN107659784B (zh) CameraLink图像处理装置和光电转塔
CN101841713B (zh) 降低编码码率的视频编码方法及系统
CN102148983A (zh) 一种解决处理高清图像资源占用过高的方法
CN202352075U (zh) 五合一电子警察系统
CN105825680A (zh) 智能识别闯红灯系统及装置
CN102123275B (zh) 一种视频分量数据信息获取及提取的方法
CN107360380B (zh) 一种双码率压缩摄像装置及其上位机解码装置
CN115209147B (zh) 摄像头视频传输带宽优化方法、装置、设备及存储介质
CN1158058A (zh) 数字视频信号编码的方法和设备
CN1953556A (zh) 一种网络摄像装置
CN201540568U (zh) 一种具有协同处理功能的双cpu系统平台
WO2014205690A1 (zh) 视频压缩编码方法及编码器
CN101277436A (zh) 多串流式网络摄影机控制系统及其控制方法
CN104683768A (zh) 一种嵌入式智能视频分析系统
US20010014123A1 (en) Method for processing video
CN103546745B (zh) 高清晰低码率网络摄像机
CN202059481U (zh) 一种基于全硬件的数字高清摄像机
CN106534774A (zh) 一种图像传输系统
CN215529159U (zh) 一种监控系统
CN1226880C (zh) 值得注意图像显示方法与装置以及远程图像监视系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant