WO2017206935A1

WO2017206935A1 - 一种音视频同步测试的系统及方法

Info

Publication number: WO2017206935A1
Application number: PCT/CN2017/086916
Authority: WO
Inventors: 戎玲; 史源; 鲍逸明; 杨竹莹
Original assignee: 公安部第三研究所
Priority date: 2016-06-03
Filing date: 2017-06-02
Publication date: 2017-12-07
Also published as: EP3468183B1; ES2921057T3; CN106060534A; EP3468183A4; EP3468183A1

Abstract

本发明涉及音视频设备测试技术领域，具体涉及一种音视频同步测试的系统及方法，可应用于对音视频同步传输播放设备的同步测试中，尤其可简单、精准地实现对音视频同步性能要求较高的实时的音视频传输播放系统(如楼宇安防系统、视频通讯系统等)的性能测试，即可通过分别利用视频延时测试装置及音频延时测试装置，可简单、精准、易实施地获取音视频同步传输播放设备的视频延时时间及音频延时时间，并对获取的视频延时时间及音频延时时间进行比较后就能精确地获悉该音视频同步传输播放设备的音视频同步性能。

Description

一种音视频同步测试的系统及方法

技术领域

本发明涉及音视频设备测试技术领域，具体涉及一种音视频同步测试的系统及方法。

背景技术

在音视频同步传输的系统中，采用无标准接口或传输协议非标准或采取加密技术的数字端对端设备非常多，但由于当前的数字端对端设备中对于音视频数据传输所产生的延时不同，进而会出现诸如视频通话过程中唇音不同步等缺陷的产生，尤其是诸如实时远程音视频通讯等对于音视频同步性能要求较高的应用中，会大大降低音视频设备的用户体验；例如，在当前的住宅安全技术防范产品楼寓对讲系统中，当访客在楼栋门口访客呼叫机端按下房号，室内接收机端的主人在听到呼叫声音并回答时，最好能及时观看到访客的实时图像，进而以便于主人较为准确的辨别来者为谁，而为了能使室内收机端听到呼叫者声音的同时观看到呼叫者的容貌，就需要使得设备能够实现唇音同步，而一旦唇音不同步，不但会降低用户体验，同时还会使得主人无法辨别访客身份，进而带来安全隐患。

目前，为了提升所研发或测试即将推广应用的远程音视频通讯设备的音视频同步的性能，一般是采用电信号-图像信号测试方法进行测试(如唇音同步测试等)，但由于其采用的诸如接口、视频设备等均可能为非标准的，所以只能采用诸如端对端的全程图像信号测试，进而会使得测试效果不甚理想，即无法准确的获取当前待测设备的音视频同步性能，从而也无法对研发的或待推广应用的产品的性能进行准备的评估。

发明内容

针对现有技术的不足，本发明提供了一种可应用于无标准接口或传输协议非标准或采取加密技术的数字端对端设备的音视频同步测试的系统及方法，该技术方案具体为：

一种音视频同步测试的系统，可应用于对传输播放音视频的待测设备的性能测试中，尤其可针对实时远程音视频通讯(例如居家安防设备中的楼宇可视对讲设备)等对于音视频同步性能要求较高的设备中进行的音视频同步性能测试，所述系统包括：

视频信号发生装置，临近所述待测设备设置，所述视频信号发生装置产生图像测试信号；所述待测设备采集并传送所述图像测试信号至该待测设备的第一输出端，以输出传输图像测试信号；

视频延时测试装置，分别采集并对比所述待测设备所输出的所述传输图像测试信号和所述视频信号发生装置当前所产生的实时图像测试信号，以获取所述待测设备的视频延时时间；

音频信号发生装置，临近所述待测设备设置，所述音频信号发生装置产生声音测试信号；所述待测设备采集并传送所述声音测试信号至该待测设备的第二输出端，以输出传输声音测试信号；

音频延时测试装置，分别采集并对比所述待测设备所输出的所述传输声音测试信号和所述音频信号发生装置当前所产生的实时声音测试信号，以获取所述待测设备的音频延时时间；

处理装置，分别与所述视频延时测试装置及所述音频延时测试装置连接，以获取所述视频延时时间与所述音频延时时间之间的时间差。

作为一个优选的实施例，上述的音视频同步测试的系统，还可包括：

判断装置，与所述处理模块连接；

其中，所述判断装置中预存有时间差与音视频同步性能参数对应的数据表，所述判断装置接收并根据所述时间差从所述数据表中调取与该时间差所对应的音视频同步性能参数进行输出。

作为一个优选的实施例，上述的音视频同步测试的系统，所述处理装置可以所述音频延时时间为基准获取所述时间差。

作为一个优选的实施例，上述的音视频同步测试的系统，所述处理装置可根据公式ΔT＝T₁-T₂计算所述时间差；

其中，所述ΔT为所述时间差，所述T₁为所述音频延时时间，所述T₂为所述视频延时时间，且所述ΔT、所述T₁及所述T₂的时间单位均相同。

作为一个优选的实施例，上述的音视频同步测试的系统，所述ΔT的值为0时，所述判断装置输出的所述音视频同步性能参数为所述待测设备的音视频同步性能最优参数；

所述ΔT的值为负值时，所述判断装置输出的所述音视频同步性能参数为所述待测设备同时传输的视频信号滞后音频信号|ΔT|毫秒；以及

所述ΔT的值为正值时，所述判断装置输出的所述音视频同步性能参数为所述待测设备同时传输的音频信号滞后视频信号ΔT毫秒；

其中，所述ΔT、所述T₁及所述T₂的时间单位均为毫秒。

作为一个优选的实施例，上述的音视频同步测试的系统，所述视频信号发生装置包括LED图形发生器，所述待测设备包括图像采集单元、视频传输单元和图像显示单元；所述视频延时测试装置包括视频采集单元、第一比较单元和第一计算单元；

其中，所述LED图形发生器产生所述图形测试信号，所述图像采集单元采集所述图形测试信号并通过所述视频传输单元传送至所述图形显示单元以显示传输图像测试信号，所述视频采集单元同时采集所述LED图形发生器当前所生成的实时图像测试信号和所述图像显示单元当前所显示的传输图像测试信号，所述第一比较单元将采集的所述实时图像测试信号和所述传输图像测试信号进行比对，所述第一计算单元根据所述第一比较单元输出的比较结果获取并输出所述视频延时时间至所述处理装置。

作为一个优选的实施例，上述的音视频同步测试的系统，所述LED图形发生器包括至少一行沿直线排列的N个LED灯；且所述N个LED灯沿其延伸的同一方向上以频率f依次点亮每个LED灯，且每个所述LED灯的点亮时间为1/(N*f)，所述视频延时时间为：

T₃＝0，n＝0；

其中，T₃为所述视频延时时间，N为大于或等于5的正整数，n为所述实时图像测试信号的脉冲图形中点亮的LED与所述传输图像测试信号的脉冲图形点亮的LED之间的序号差，所述n为自然数，且所述T₃的误差范围在

作为一个优选的实施例，上述的音视频同步测试的系统，所述LED灯之间点亮的频率f的值大于或等于人眼所能分辨的帧率的值，所述图像采集单元的采集图形的帧率的值大于所述频率f的值。

作为一个优选的实施例，上述的音视频同步测试的系统，所述音频信号发生装置包括音频信号发生器，所述待测设备还包括声音采集单元、音频传输单元和声音播放单元；所述音频延时测试装置包括音频采集单元和音频分析单元；

其中，所述音频信号发生器产生所述声音测试信号，所述声音采集单元采集所述声音测试信号并通过所述音频传输单元传送至所述声音播放单元以输出传输声音测试信号，所述音频采集单元同时采集所述音频信号发生器当前所生成的实时声音测试信号和所述声音播放单元当前所输出的传输声音测试信号；所述音频分析单元对所述音频采集单元采集的所述实时声音测试信号和所述传输声音测试信号进行分析处理后，输出所述音频延时时间至所述处理装置。

作为一个优选的实施例，上述的音视频同步测试的系统，所述音频信号发生装置还包括仿真嘴，以对所述音频信号发生器生成的所述声音测试信号进行均衡，且所述声音采集单元采集均衡后的所述声音测试信号；以及

所述音频采集单元包括自由场传声器，所述音频分析单元包括音频分析仪，所述音频分析仪通过对所述自由场传声器所采集的所述传输声音测试信号输出所述音频延时时间。

本申请还提供了一种音视频同步测试的方法，可应用于对传输播放音视频的待测设备的性能测试中，尤其是针对音视频同步性能要求较高的诸如实时音视频传输播放设备中，所述方法可包括：

于一视频信号发生装置产生图像测试信号后，利用所述待测设备采集并传送所述图像测试信号至该待测设备的第一输出端，以输出传输图像测试信号；

利用一视频延时测试装置分别采集并对比所述待测设备所输出的所述传输图像测试信号和所述视频信号发生装置当前所产生的实时图像测试信号，以获取所述待测设备的视频延时时间；

于一音频信号发生装置产生声音测试信号后，利用所述待测设备采集并传送所述声音测试信号至该待测设备的第二输出端，以输出传输声音测试信号；

利用一音频延时测试装置分别采集并对比所述待测设备所输出的所述传输声音测试信号和所述音频信号发生装置当前所产生的实时声音测试信号，以获取所述待测设备的音频延时时间；

利用一处理装置接收并计算出所述视频延时时间与所述音频延时时间之间的时间差。

提供一预存有时间差与音视频同步性能参数对应的数据表的判断装置；

利用所述判断装置接收并根据所述时间差从所述数据表中调取与该时间差所对应的音视频同步性能参数进行输出。

作为一个优选的实施例，上述的音视频同步测试的系统，所述处理装置以所述音频延时时间为基准计算并输出所述时间差。

作为一个优选的实施例，上述的音视频同步测试的系统，所述处理装置根据公式ΔT＝T₁-T₂计算所述时间差；

作为一个优选的实施例，上述的音视频同步测试的系统，所述方法中：

当所述ΔT的值为0时，所述判断装置输出所述待测设备的音视频同步性能最优参数；

当所述ΔT的值为负值时，所述判断装置输出所述待测设备同时传输的视频信号滞后音频信号|ΔT|毫秒；以及

当所述ΔT的值为正值时，所述判断装置输出所述待测设备同时传输的音频信号滞后视频信号ΔT毫秒；

其中，所述ΔT、所述T₁及所述T₂的时间单位均为毫秒。

T₃＝0，n＝0；

作为一个优选的实施例，上述的音视频同步测试的系统，所述LED灯之间点亮的频率f的值大于或等于人眼所能分辨帧率的值，所述图像采集单元的采集图形的帧率的值大于所述频率f的值。

与现有技术相比，本发明的优点是：

本申请中的音视频同步测试的系统及方法，可应用于对音视频同步传输播放设备的同步测试中，尤其可简单、精准地实现对音视频同步性能要求较高的实时的音视频传输播放系统(如楼宇安防系统、视频通讯系统等)的性能测试，即可通过分别利用视频延时测试装置及音频延时测试装置，可简单、精准、易实施地获取音视频同步传输播放设备的视频延时时间及音频延时时间，并对获取的视频延时时间及音频延时时间进行比较后就能精确地获悉该音视频同步传输播放设备的音视频同步性能。

附图说明

图1为本发明实施例中音视频同步测试的系统的结构示意图；

图2为本发明实施例中视频延时测试的结构示意图；

图3为本发明实施例中音频延时测试的结构示意图；

图4为本发明实施例中对待测楼宇可视对讲设备进行音频延时测试的结构示意图；

图5为本发明实施例中音频延时的CSS测试信号组；

图6为本发明实施例中音视频同步测试的方法的流程示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明，但不作为本发明的限定。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有付出创造性劳动的前提下所获得的所有其他实施方式，都属于本发明保护的范围。

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

图1为本发明实施例中音视频同步测试的系统的结构示意图，如图1所示，本实施例提供了一种音视频同步测试的系统，可应用于对传输播放音视频的待测设备(如影音设备等)的性能测试中，尤其可针对实时远程音视频通讯(例如居家安防设备中的楼宇可视对讲设备)等对于音视频同步性能要求较高的设备中进行的音视频同步性能测试，该系统可包括：

视频信号发生装置，可临近待测设备设置，以便于待测设备获取该视频信号发生装置所显示的图形测试信号；该视频信号发生装置可产生图像测试信号(一般可通过显示动态的光影显示信息)，如可通过显示屏或LED灯矩阵等来产生上述的图形测试信号；在视频信号发生装置产生上述的图形测试信号后，利用上述的待测设备采集并传送该图像测试信号至该待测设备的第一输出端(图像输出端，如显示屏等)，进而输出传输图像测试信号(即经待测设备采集并传送后所输出的图像信息)；

视频延时(Video Delay)测试装置，则临近上述的视频信号发生装置及待测设备的第一输出端，以便于分别采集待测设备所输出的传输图像测试信号及视频信号发生装置当前所产生的实时图像测试信号，并将所采集的传输图像测试信号与实时图像测试信号进行比对和/或运算，进而获取并输出待测设备的视频延时时间；

音频信号发生装置，同样可临近待测设备设置，以便于该待测设备采集音频信号发生装置所产生的声音测试信号；待测设备采集音频信号发生装置所产生的声音测试信号(一般可为利用喇叭模仿人的声音进行声音测试信号的生成)后，将采集到的声音测试信号传送至该待测设备的第二输出端(声音输出端，如音响设备等)，以输出传输声音测试信号(即经待测设备采集并传送后所输出的声音信息)；

音频延时(audio delay)测试装置，分别采集并对比待测设备所输出的传输声音测试信号和音频信号发生装置当前所产生的实时声音测试信号，以获取待测设备的音频延时时间；

处理装置，分别与视频延时测试装置及音频延时测试装置连接，以获取所述视频延时时间与所述音频延时时间之间的时间差。

具体的，上述的视频信号发生装置产生图像测试信号，而待测设备则采集该图形测试信号并进行传输后输送到远端的第一输出端，以输出传输图像测试信号后，视频延时测试装置则同时采集该传输图像测试信号和此时视频信号发生装置所显示的实时图像测试信号并进行比对，即因为该待测设备传输图像测试信号需要花费一定的时间，进而会造成该待测设备所输出的传输图像测试信号并不是当前视频信号发生装置所显示的实时图像测试信号，所以待测设备传输图像测试信号有一定的延时，而通过将采集的传输图像测试信号与实时图像测试信号进行比较而获取的差异信号，可利用视频信号发生装置产生图像测试信号的规则就能获取该待测设备的视频延时时间；同样的，上述的音频信号发生装置产生声音测试信号，而待测设备则采集该声音测试信号并进行传输后输送到远端的第二输出端，以输出传输声音测试信号后，音频延时测试装置则同时采集该传输声音测试信号和此时音频信号发生装置所播放的实时声音测试信号并进行比对，即因为该待测设备传输声音测试信号也需要花费一定的时间，进而会造成该待测设备所输出的传输声音测试信号也并不是当前音频信号发生装置所产生的实时声音测试信号，所以待测设备传输声音测试信号也有一定的延时，而通过将采集的传输声音测试信号与实时声音测试信号进行比较而获取的声音差异信号，可利用音频信号发生装置产生声音测试信号的规则就能获取该待测设备的音频延时时间(需要注意到的是，获取上述的视频延时时间的步骤与获取音频延时时间的步骤之间的顺序不分先后，甚至在互相不影响的条件下可同时进行)；最后，利用处理装置获取上述的视频延时时间及音频延时时间进行比对运算后就能获取该待测设备同步传输音视频时所音频数据与视频数据之间的时间差，并可依据该时间差来判断该待测设备的音视频同步性能。

优选的，上述的音视频同步测试的系统还可包括一个与处理模块连接的判断装置(该判断装置可与上述的处理模块集成为一体或能够实现该两个功能的同一个部件)，且该判断装置中可预存有时间差与音视频同步性能参数对应的数据表，这样判断装置就能根据接收到的时间差从数据表中快速地调取与该时间差所对应的音视频同步性能参数进行输出，进而及时的将待测设备的音视频同步性能快速、形象的输出。

优选的，为了较为方便地获取上述的时间差(因为视频数据一般相较于音频数据较大，故一般视频会在待测设备中滞后于音频的传输)，一般可以音频延时时间为基准进行时间差的计算，如通过将音频延时时间减去视频延时时间就能知悉该待测设备的音视频同步性能中视频滞后音频多久了；当然，也可将视频延时时间作为基准进行时间差的计算，具体可以实际的测试需求而设定。

下面就以音频延时时间为基准进行举例说明，在获取上述的时间差时，处理装置可根据公式ΔT＝T₁-T₂计算所述时间差；ΔT为时间差，T₁为音频延时时间，T₂为视频延时时间，且ΔT、T₁及T₂的时间单位均相同；例如，若获取的ΔT的值为0时，则说明该待测设备的音视频传输延时时间相同；相应的，判断装置就会输出的音视频同步性能参数为待测设备的音视频同步性能最优参数，即无论其延时时间为多少，只要相同，就说明该待测设备的音视频同步性能达到了理想状态，为最佳性能；而ΔT的值为负值时，就说明该待测设备传输音频的延时时间小于传输视频的延时时间，即判断装置就会输出的音视频同步性能参数为待测设备同时传输的视频信号滞后音频信号|ΔT|毫秒；同时ΔT的值为正值时，则说明该待测设备传输音频的延时时间大于传输视频的延时时间，即判断装置输出的音视频同步性能参数为待测设备同时传输的音频信号滞后视频信号ΔT毫秒；其中，ΔT、T₁及T₂的时间单位可均为毫秒。

进一步的，如图2所示，上述的视频信号发生装置可包括LED图形发生器(如LED灯阵列等)，待测设备则可包括图像采集单元、视频传输单元和图像显示单元等，而视频延时测试装置则可包括视频采集单元、第一比较单元和第一计算单元等；利用LED图形发生器产生图形测试信号，而图像采集单元则采集图形测试信号并通过视频传输单元传送至图形显示单元以显示传输图像测试信号，视频采集单元同时采集LED图形发生器当前所生成的实时图像测试信号和图像显示单元当前所显示的传输图像测试信号，第一比较单元再将采集的实时图像测试信号和传输图像测试信号进行比对并输出比对结果，而第一计算单元则根据第一比较单元输出的比较结果获取并输出视频延时时间至上述处理装置。

优选的，上述LED图形发生器可包括至少一行沿直线排列的N个LED灯(如N*N的LED灯阵列，可选一行LED灯作为测试使用)；且N个LED灯沿其延伸的同一方向上以频率f依次点亮每个LED灯，且每个LED灯的点亮时间可为1/(N*f)，而第一比较单元对采集的实时图像测试信号和传输图像测试信号进行比对，进而获取实时图像测试信号与传输图像测试信号之间相差n个LED灯(即点亮的LED灯之间相差n个LED灯)，而计算单就可以利用下面的公式获取视频延时时间，具体为：

T₃＝0，n＝0；

其中，T₃为视频延时时间，N为大于或等于5的正整数，n为实时图像测试信号的脉冲图形中点亮的LED与传输图像测试信号的脉冲图形点亮的LED之间的序号差，n为自然数，且T₃的误差范围应在

之间。

优选的，相邻的LED灯之间点亮的频率f的值应大于或等于人眼所能分辨的帧率的值，且图像采集单元的采集图形的帧率的值也要大于频率f的值，否则就无法采集图形了。

进一步的，如图3所示，上述的音频信号发生装置包括音频信号发生器，待测设备还可包括声音采集单元、音频传输单元和声音播放单元；而音频延时测试装置可包括音频采集单元和音频分析单元；音频信号发生器产生声音测试信号，声音采集单元采集声音测试信号并通过音频传输单元传送至声音播放单元以输出传输声音测试信号，音频采集单元同时采集音频信号发生器当前所生成的实时声音测试信号和声音播放单元当前所输出的传输声音测试信号，音频分析单元将采集的实时声音测试信号和传输声音测试信号进行分析计算处理后输出音频延时时间至处理装置。

优选的，上述的音频信号发生装置还可包括仿真嘴，以对音频信号发生器生成的声音测试信号进行均衡，且声音采集单元采集均衡后的声音测试信号；以及音频采集单元包括自由场传声器，音频分析单元可包括音频分析仪，音频信号发生器还可具有显示实时图像测试信号的脉冲图形的相关仪器设备，音频分析仪通过自由场传声器采集的实时声音测试信号及传输声音测试信号的脉冲进行分析比对处理后，输出该待测设备的音频延时时间。

下面就以楼宇可视对讲设备的唇音同步(lip sync)测试为例进行详细说明，如图4所示，由于楼宇可视对讲设备中两个用户端需要对话通讯，故在待测楼宇可视对讲设备两个安装在挡板上的免提终端(需要注意的是，当被测的设备为手柄终端设备时，需去除图4中的挡板，并将仿真嘴及自由场传声器安装在LRGP(loudness rating guard-ring position，响度评定值保护环位置)头型架上进行音频延时测试)的处均设置有产生声音测试信号的音频信号发生器和仿真嘴，以及接受传输声音测试信号的自由场传声器和音频分析仪，即包括两路音频延时测试装置，每路音频延时测试装置均包括音频信号发生器、仿真嘴、自由场传声器和音频分析仪；为了避免两路音频延时测试装置之间相互干扰，可将位于同一免提终端的用以产生声音测试信号的音频信号发生器和仿真嘴与用以接收传输声音测试信号的自由场传声器和音频分析仪之间的线路夹角设置为大于或等于32°的夹角，而仿真嘴和/或自由场传声器与免提终端之间的距离大于或等于10cm且小于50cm(以避免距离近而导致干扰，距离远又使得免提终端无法收集足够的声音进行测试，具体的值可依据实际设备的性能参数及测试需求而设定)；较优的，为了避免两路音频延时测试装置之间的干扰，可分别异步对两路音频延时测试装置各进行一次测试，以确保每次测试结果的精确性；即每次仅在待测楼宇可视对讲设备的一免提终端设置音频信号发生器和仿真嘴，而在临近另一免提终端的位置处设置自由场传声器和音频分析仪。

为了阐述简便，下面就以一路音频延时测试装置进行说明，即先利用音频信号发生器生成包括多组(如四组)CSS(composite source signal，合成源信号)信号的测试单元信号，其中前几组(如前三组)CSS信号可用于训练以使得信道传输到达正常状态，并将剩余组(如第四组)CSS信号作为测试信号，即可利用第四组CSS信号的持续高电平信号部分用于延时测量；优选的，每组CSS信号的脉宽为248.62ms，相邻的CSS信号间隔101.38ms，这样每个测试单元信号长度为1298.62ms(上述具体的数值可依据实际测试需求而适应性的调整，在此仅作为示例进行说明)；具体的，上述的音频信号发生器所产生的测试信号(如包括四组CSS信号的测试单元信号)经仿真嘴均衡后激励本地对讲终端(即待测楼宇可视对讲设备一免提终端中的麦克风)工作，并经传输网络传送至远端的对讲终端(即待测楼宇可视对讲设备一免提终端中的音响)进行播放，同时利用位于该免提终端位置处附近的自由场传声器对传输测试信号进行采集，以获取音频信号，通过利用音频分析仪就能比较判断出上述的诸如第四组CSS信号(即测试信号)与通过系统端对端传输采集到的信号之间的音频延时时间。

本申请还提供了一种音视频同步测试的方法，可基于上述音视频同步测试的系统的基础上，应用于诸如对传输播放音视频等待测设备的性能测试中，尤其是针对音视频同步性能要求较高的诸如实时音视频传输播放设备中，所述方法可包括：

进一步的，上述的方法还可包括：

需要注意的是，上述获取视频延时时间的步骤与获取音频延时时间的步骤之间的先后顺序可以颠倒，也可在不影响测试结果的前提下同时进行。

由于本实施例中的音视频同步测试的方法可基于上述实施例中一种音视频同步测试的系统的基础上进行，及其相互之间可为相互对应的产品及方法，故两实施例之间相同或近似的技术特征均可相互的适用，而为了阐述简便，在此不予赘述，但其不应理解为对本申请的限制，只要本领域技术人员在看到两者中任何一个在不付出创造性劳动时所能延伸的技术方案，均应在本申请所记载的范围内。

另外，上述有关楼宇可视对讲设备的实施例中所指的音频延时一般为音频信号由本地对讲终端嘴参考点发送，并经楼宇可视对讲系统各部件后，至远端对讲终端的耳参考点接收所需要的单向传输时间；而视频延时则一般为由本地对讲终端摄像头摄取，并经楼宇可视对讲系统各部件后，至远端对讲终端的显示装置显示同一帧所需要的单向传输时间；而唇音同步则为楼宇可视对讲系统传输声音和图像信号间的时域关系，其值可用于描述声音和图像信号的同步关系，可用时间差范围表示(其他实施例方式也可参照上述语义进行定义)；符合标准的楼宇可视对讲设备中音频延时及视频延时均应不大于300ms，而视频帧率应不低于20fps，而待测设备进行唇音同步过程中，音频延时时间与视频延时时间之间的时间差范围为-90ms～+185ms，也即系统在同时传输音视频信号时，输出的音频信号超前相对应的视频信号的时间应不大于90ms，滞后时间应不大于185ms。

同时，在对楼宇可视对讲设备进行上述音视频同步性能测试时，进行音频延时测试时测试境噪声不应超过40dB，而在进行视频延时测试，EUT(equipment under test，受试设备)即可视对讲设备应处于正常图像传输状态，且当EUT的音频通讯不能切断需要进行音视频同步测试时则必须保证其相互之间不会引起视频特性参数和/或音频特性参数的改变。

例如，在进行视频帧率、视频延时、唇音同步测试可使用LED图像发生器作为信号源，而LED图像信号发生器则应置于视频捕捉设备的正前方，并可通过调整LED矩阵与视频接受设备之间的距离使得视频接受设备屏幕上的LED矩阵图像在横轴或纵轴上充满屏幕，且视频接受设备屏幕上的图像还需应能聚焦。

优选的，上述LED图形发生器可由10×10的LED阵列和编程控制器组成，该LED阵列可被用于产生测量用的图形图案，即可以单个LED为基本单元，在纵向或横向通过依次点亮每个LED灯以使得呈现的图像做连续滚动，而编程控制器可按设定频率控制LED阵列产生变化的图案。LED图形发生器还可具有LED位置信息显示功能，并具有输出2个下降沿同步信号的输出接口。另外，为防止音频对试验的影响，可使得LED图形发生器同步控制A、B两组相同的LED阵列，即A组LED阵列置于VCU摄像头的正前方，作为测试信号；而B组LED阵列置于对讲终端显示屏端，以便于数字照相机能摄取。同时，数码摄像机可调整视频捕捉帧率(视频延时测试中使用)并能在接受到出发信号后捕捉静态图像(唇音同步中使用)。

优选的，在进行视频帧率试验时，可选择LED阵列中间区域的一行10个LED灯组产生的连续变化图像作为测试信号，激活音视频通讯；然后，从1Hz起，由低向高逐渐调节LED图形发生器的设置频率(每个LED每秒激活1次，闪烁时间为1/(10f)s)，使LED灯组按设置循环依次以水平方向滚动点亮。在被测对讲终端显示屏观察经系统传输后得到的输出影像，当观察到测试用10个LED灯组影像保持稳定不滚动时停止调整，观察当该状态保持时间大于10s，即确认状态有效。最后，记录此时LED图形发生器的发生频率即为被检测IP BIS的帧率(fr)。

进一步的，将系统的帧率(fr)即f作为LED图形发生器的设置频率，并以LED图形发生器控制LED阵列产生的连续变化图像作为测试信号。然后，利用视频采集装置(VCD)抓拍到LED图像发生器A产生的图像，数字摄像机每一帧应能同时捕捉视频接受设备屏幕上的图像以及LED信号发生器B上的图像，同时采集3秒。之后，比较LED图像信号发生器B上所激活的LED灯位置和相同帧中视频接受设备屏幕上激活的LED灯的位置，计算二者间相隔n个LED灯，进而获取视频延时时间。最后，对所测得的视频延时值做统计处理，将其90％置信区间的上限作为的视频延时Td。

需要注意的是，如果BIS可以静音或者将音量调小以避免啸叫，该测试可以使用LED矩阵上1个LED灯与视频接受设备相邻一起置于视频捕捉设备前方进行测试。这将会替代上述测试方法中使用LED图像发生器A和B进行测试。

优选的，在进行唇音同步测试时，可将音频延时和视频延时测试同步进行，试验条件和试验方法应同时满足音频延时和视频延时要求：

首先，音频信号发生器应该播放连续的CSS信号直到测试结束。前3组CSS信号用于训练，第4组信号用于进行音频延时测试(如7.3.3中描述)。在第4组信号高频信号结束，下降沿开始时(即CSS信号的248.62ms)，数字摄像机开始捕捉每一帧图像。所以每一组CSS信号第248.62ms的时候都会测量一次音频延时和视频延时。

其次，该测试应持续10s(28次测试)，并用视频延时方法计算视频延时，然后控制音频分析仪计算音频延时时间，最后将同时捕捉的视频延时值和音频延时值进行计算：

唇音同步＝视频延时-音频延时(如为负值，则说明音频比视频延时大)；

同样的，对所测得的唇音同步值做统计处理，将其90％置信区间的下限和上限分别作为前向和后向唇音同步测量值。

综上所述，可应用于对音视频同步传输播放设备的同步测试中，尤其可简单、精准地实现对音视频同步性能要求较高的实时的音视频传输播放系统(如楼宇安防系统、视频通讯系统等)的性能测试，即可通过分别利用视频延时测试装置及音频延时测试装置，可简单、精准、易实施地获取音视频同步传输播放设备的视频延时时间及音频延时时间，并对获取的视频延时时间及音频延时时间进行比较后就能精确地获悉该音视频同步传输播放设备的音视频同步性能。

以上所述仅为本发明较佳的实施例，并非因此限制本发明的实施方式及保护范围，对于本领域技术人员而言，应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案，均应当包含在本发明的保护范围内。

Claims

一种音视频同步测试的系统，其特征在于，应用于对传输播放音视频的待测设备的性能测试中，所述系统包括：

视频信号发生装置，临近所述待测设备设置，所述视频信号发生装置产生图像测试信号；所述待测设备采集并传送所述图像测试信号至该待测设备的第一输出端，以输出传输图像测试信号；

视频延时测试装置，分别采集并对比所述待测设备所输出的所述传输图像测试信号和所述视频信号发生装置当前所产生的实时图像测试信号，以获取所述待测设备的视频延时时间；

音频信号发生装置，临近所述待测设备设置，所述音频信号发生装置产生声音测试信号；所述待测设备采集并传送所述声音测试信号至该待测设备的第二输出端，以输出传输声音测试信号；

音频延时测试装置，分别采集并对比所述待测设备所输出的所述传输声音测试信号和所述音频信号发生装置当前所产生的实时声音测试信号，以获取所述待测设备的音频延时时间；

处理装置，分别与所述视频延时测试装置及所述音频延时测试装置连接，以获取所述视频延时时间与所述音频延时时间之间的时间差。
如权利要求1所述的音视频同步测试的系统，其特征在于，还包括：

判断装置，与所述处理模块连接；

其中，所述判断装置中预存有时间差与音视频同步性能参数对应的数据表，所述判断装置接收并根据所述时间差从所述数据表中调取与该时间差所对应的音视频同步性能参数进行输出。
如权利要求2所述的音视频同步测试的系统，其特征在于，所述处理装置以所述音频延时时间为基准获取所述时间差。
如权利要求3所述的音视频同步测试的系统，其特征在于，所述处理装置根据公式ΔT＝T₁-T₂计算所述时间差；

其中，所述ΔT为所述时间差，所述T₁为所述音频延时时间，所述T₂为所述视频延时时间，且所述ΔT、所述T₁及所述T₂的时间单位均相同。
如权利要求4所述的音视频同步测试的系统，其特征在于，所述ΔT的值为0时，所述判断装置输出的所述音视频同步性能参数为所述待测设备的音视频同步性能最优参数；

所述ΔT的值为负值时，所述判断装置输出的所述音视频同步性能参数为所述待测设备同时传输的视频信号滞后音频信号|ΔT|毫秒；以及

所述ΔT的值为正值时，所述判断装置输出的所述音视频同步性能参数为所述待测设备同时传输的音频信号滞后视频信号ΔT毫秒；

其中，所述ΔT、所述T₁及所述T₂的时间单位均为毫秒。
如权利要求1所述的音视频同步测试的系统，其特征在于，所述视频信号发生装置包括LED图形发生器，所述待测设备包括图像采集单元、视频传输单元和图像显示单元；所述视频延时测试装置包括视频采集单元、第一比较单元和第一计算单元；

其中，所述LED图形发生器产生所述图形测试信号，所述图像采集单元采集所述图形测试信号并通过所述视频传输单元传送至所述图形显示单元以显示传输图像测试信号，所述视频采集单元同时采集所述LED图形发生器当前所生成的实时图像测试信号和所述图像显示单元当前所显示的传输图像测试信号，所述第一比较单元将采集的所述实时图像测试信号和所述传输图像测试信号进行比对，所述第一计算单元根据所述第一比较单元输出的比较结果获取并输出所述视频延时时间至所述处理装置。
如权利要求6所述的音视频同步测试的系统，其特征在于，所述LED图形发生器包括至少一行沿直线排列的N个LED灯；且所述N个LED灯沿其延伸的同一方向上以频率f依次点亮每个LED灯，且每个所述LED灯的点亮时间为1/(N*f)，所述视频延时时间为：

T₃＝0，n＝0；

其中，T₃为所述视频延时时间，N为大于或等于5的正整数，n为所述实时图像测试信号的脉冲图形中点亮的LED与所述传输图像测试信号的脉冲图形点亮的LED之间的序号差，所述n为自然数，且所述T₃的误差范围在
如权利要求7所述的音视频同步测试的系统，其特征在于，所述LED灯之间点亮的频率f的值大于或等于人眼分辨帧率的值，所述图像采集单元的采集图形的帧率的值大于所述频率f的值。
如权利要求1所述的音视频同步测试的系统，其特征在于，所述音频信号发生装置包括音频信号发生器，所述待测设备还包括声音采集单元、音频传输单元和声音播放单元；所述音频延时测试装置包括音频采集单元和音频分析单元；

其中，所述音频信号发生器产生所述声音测试信号，所述声音采集单元采集所述声音测试信号并通过所述音频传输单元传送至所述声音播放单元以输出传输声音测试信号，所述音频采集单元同时采集所述音频信号发生器当前所生成的实时声音测试信号和所述声音播放单元当前所输出的传输声音测试信号；所述音频分析单元对所述音频采集单元采集的所述实时声音测试信号和所述传输声音测试信号进行分析处理后，输出所述音频延时时间至所述处理装置。
如权利要求9所述的音视频同步测试的系统，其特征在于，所述音频信号发生装置还包括仿真嘴，以对所述音频信号发生器生成的所述声音测试信号进行均衡，且所述声音采集单元采集均衡后的所述声音测试信号；以及

所述音频采集单元包括自由场传声器，所述音频分析单元包括音频分析仪，所述音频分析仪通过对所述自由场传声器所采集的所述传输声音测试信号输出所述音频延时时间。
一种音视频同步测试的方法，其特征在于，应用于对传输播放音视频的待测设备的性能测试中，所述方法包括：

于一视频信号发生装置产生图像测试信号后，利用所述待测设备采集并传送所述图像测试信号至该待测设备的第一输出端，以输出传输图像测试信号；

利用一视频延时测试装置分别采集并对比所述待测设备所输出的所述传输图像测试信号和所述视频信号发生装置当前所产生的实时图像测试信号，以获取所述待测设备的视频延时时间；

于一音频信号发生装置产生声音测试信号后，利用所述待测设备采集并传送所述声音测试信号至该待测设备的第二输出端，以输出传输声音测试信号；

利用一音频延时测试装置分别采集并对比所述待测设备所输出的所述传输声音测试信号和所述音频信号发生装置当前所产生的实时声音测试信号，以获取所述待测设备的音频延时时间；

利用一处理装置接收并计算出所述视频延时时间与所述音频延时时间之间的时间差。
如权利要求11所述的音视频同步测试的方法，其特征在于，还包括：

提供一预存有时间差与音视频同步性能参数对应的数据表的判断装置；

利用所述判断装置接收并根据所述时间差从所述数据表中调取与该时间差所对应的音视频同步性能参数进行输出。
如权利要求12所述的音视频同步测试的方法，其特征在于，所述处理装置以所述音频延时时间为基准计算并输出所述时间差。
如权利要求13所述的音视频同步测试的方法，其特征在于，所述处理装置根据公式ΔT＝T₁-T₂计算所述时间差；

其中，所述ΔT为所述时间差，所述T₁为所述音频延时时间，所述T₂为所述视频延时时间，且所述ΔT、所述T₁及所述T₂的时间单位均相同。
如权利要求14所述的音视频同步测试的方法，其特征在于，所述方法中：

当所述ΔT的值为0时，所述判断装置输出所述待测设备的音视频同步性能最优参数；

当所述ΔT的值为负值时，所述判断装置输出所述待测设备同时传输的视频信号滞后音频信号|ΔT|毫秒；以及

当所述ΔT的值为正值时，所述判断装置输出所述待测设备同时传输的音频信号滞后视频信号ΔT毫秒；

其中，所述ΔT、所述T₁及所述T₂的时间单位均为毫秒。
如权利要求11所述的音视频同步测试的方法，其特征在于，所述视频信号发生装置包括LED图形发生器，所述待测设备包括图像采集单元、视频传输单元和图像显示单元；所述视频延时测试装置包括视频采集单元、第一比较单元和第一计算单元；

其中，所述LED图形发生器产生所述图形测试信号，所述图像采集单元采集所述图形测试信号并通过所述视频传输单元传送至所述图形显示单元以显示传输图像测试信号，所述视频采集单元同时采集所述LED图形发生器当前所生成的实时图像测试信号和所述图像显示单元当前所显示的传输图像测试信号，所述第一比较单元将采集的所述实时图像测试信号和所述传输图像测试信号进行比对，所述第一计算单元根据所述第一比较单元输出的比较结果获取并输出所述视频延时时间至所述处理装置。
如权利要求16所述的音视频同步测试的方法，其特征在于，所述LED图形发生器包括至少一行沿直线排列的N个LED灯；且所述N个LED灯沿其延伸的同一方向上以频率f依次点亮每个LED灯，且每个所述LED灯的点亮时间为1/(N*f)，所述视频延时时间为：

T₃＝0，n＝0；

其中，T₃为所述视频延时时间，N为大于或等于5的正整数，n为所述实时图像测试信号的脉冲图形中点亮的LED与所述传输图像测试信号的脉冲图形点亮的LED之间的序号差，所述n为自然数，且所述T₃的误差范围在
如权利要求17所述的音视频同步测试的方法，其特征在于，所述LED灯之间点亮的频率f的值大于或等于人眼所能分辨帧率的值，所述图像采集单元的采集图形的帧率的值大于所述频率f的值。
如权利要求11所述的音视频同步测试的方法，其特征在于，所述音频信号发生装置包括音频信号发生器，所述待测设备还包括声音采集单元、音频传输单元和声音播放单元；所述音频延时测试装置包括音频采集单元和音频分析单元；

其中，所述音频信号发生器产生所述声音测试信号，所述声音采集单元采集所述声音测试信号并通过所述音频传输单元传送至所述声音播放单元以输出传输声音测试信号，所述音频采集单元同时采集所述音频信号发生器当前所生成的实时声音测试信号和所述声音播放单元当前所输出的传输声音测试信号；所述音频分析单元对所述音频采集单元采集的所述实时声音测试信号和所述传输声音测试信号进行分析处理后，输出所述音频延时时间至所述处理装置。
如权利要求19所述的音视频同步测试的方法，其特征在于，所述音频信号发生装置还包括仿真嘴，以对所述音频信号发生器生成的所述声音测试信号进行均衡，且所述声音采集单元采集均衡后的所述声音测试信号；以及

所述音频采集单元包括自由场传声器，所述音频分析单元包括音频分析仪，所述音频分析仪通过对所述自由场传声器所采集的所述传输声音测试信号输出所述音频延时时间。