WO2021072878A1

WO2021072878A1 - 基于rtmp的音视频数据加解密方法、装置及可读存储介质

Info

Publication number: WO2021072878A1
Application number: PCT/CN2019/118438
Authority: WO
Inventors: 林国雄
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-10-15
Filing date: 2019-11-14
Publication date: 2021-04-22
Also published as: CN110881142A

Abstract

一种基于rtmp的音视频数据加解密方法、装置及可读存储介质，涉及数据处理技术领域，其中方法包括：采集视频数据和音频数据，并将采集到的视频数据和音频数据进行编码，形成rtmp流(S10)；在rtmp meta data添加加密标志位字段encrypt，判断加密设置是否生效(S20)；如果加密设置生效，对rtmp流的视频数据和音频数据分别采用字节混淆的方式加密(S30)；读取加密后的rtmp流(S40)；读取rtmp meta data中的加密标志位字段encrypt，判断加密设置是否生效(S50)；如果加密设置生效，对读取加密后的rtmp流进行解密(S60)；对解密后的rtmp流进行解码，获取清晰的rtmp流(S70)。通过对视频数据和音频数据分别使用字节混淆方式进行加密，能够解决加密方式复杂以及避免视频流被盗取造成数据安全性低的问题。

Description

基于rtmp的音视频数据加解密方法、装置及可读存储介质

本申请要求申请号为201910978214.9，申请日为2019年10月15日，发明创造名称为“基于rtmp的音视频数据加解密方法、装置及可读存储介质”的专利申请的优先权。

技术领域

本申请涉及数据处理技术领域，尤其涉及一种基于rtmp的音视频数据加解密方法、系统、装置及可读存储介质。

背景技术

在各种业务场景下，例如直播时主播在推送rtmp(Real Time Messaging Protocol，实时消息传输协议)多媒体流的过程中，流地址很容易被明文获取，或者被黑客使用破解手段获取到，并使用第三方工具直接播放，存在被窃听风险，对企业直播运营、营收等方面造成巨大损失。

申请人意识到，现在常规的rtmp防盗播的解决方案有如下几种：

1、防盗链：给rtmp url增加相关参数，rtmp server根据参数做验证，缺陷在于，没有对传输的音视频数据包做加密，只要截取到rtmp包解析后就能解码播放。

2、使用rtmp加密协议rtmpe协议，不足之处在于，要求用户自行搭流媒体服务器平台，增加系统复杂度，数据不能缓存，用户每次播放都要占用服务器带宽，不容易结合CDN加速，增加服务器带宽压力。

3、使用分布式编码技术，将视频物理分片，每一片视频采用不同的加密算法，同一个视频片段能同时使用多种加密算法混合型加密；不足之处在于，加密过程过于复杂，增加实现难度，并且还会增加每一个视频帧的传输前的处理时间，消耗客户端计算性能。

基于上述问题，亟需一种能够避免被盗取并且加减密过程简单的方法。

发明内容

本申请提供一种音视频数据加解密方法、系统、电子装置及可读存储介质及可读存储介质，其主要目的在于通过对视频数据和音频数据分别使用字节混淆方式进行加密，能够解决加密方式复杂以及避免视频流被盗取造成数据安全性低的问题。

为实现上述目的，本申请提供一种音视频数据加解密方法，包括：

采集视频数据和音频数据，并将采集到的视频数据和音频数据进行编码，形成rtmp流；在rtmp meta data数据元添加加密标志位字段encrypt，并根据加密标志位字段encrypt判断对所述rtmp流的加密设置是否生效；如果加密设置生效，对所述rtmp流的视频数据和音频数据分别采用字节混淆的方式加密；将加密后的rtmp流上传至多媒体服务器，通过所述多媒体服务器的客户端读取加密后的rtmp流；读取rtmp meta data数据元中的加密标志位字段encrypt，并判断所述rtmp流的加密设置是否生效；如果加密设置生效，对读取加密后的rtmp流进行解密；对解密后的rtmp流进行解码，获取清晰的rtmp流。

为实现上述目的，本申请提供一种音视频数据加解密系统，包括：

采集编码模块，用于采集视频数据和音频数据，并将采集到的视频数据和音频数据进行编码，形成rtmp流；第一判断模块，用于在rtmp meta data数据元添加加密标志位字段encrypt，并根据所述加密标志位字段encrypt判断对所述rtmp流的加密设置是否生效；rtmp流加密模块，用于在所述加密设置生效的情况下，对所述rtmp流的视频数据和音频数据分别采用字节混淆的方式加密；rtmp流上传模块，用于将加密后的rtmp流上传至多媒体服务器；rtmp流读取模块，用于通过所述多媒体服务器的客户端读取加密后的rtmp流；第二判断模块，用于读取rtmp meta data数据元中的加密标志位字段encrypt，并判断所述rtmp流的加密设置是否生效；rtmp流解密模块，用于在所述加密设置生效的情况下，对读取加密后的rtmp流进行解密；rtmp流解码模块，用于对解密后的rtmp流进行解码，获取清晰的rtmp流。

此外，为实现上述目的，本申请还提供一种电子装置，该电子装置包括：存储器、处理器及摄像装置，所述存储器中包括基于rtmp的音视频数据加解密程序，所述基于rtmp的音视频数据加解密程序被所述处理器执行时实现如下步骤：

采集视频数据和音频数据，并将采集到的视频数据和音频数据进行编码，形成rtmp流；在rtmp meta data数据元添加加密标志位字段encrypt，并根据加密标志位字段encrypt判断对所述rtmp流的加密设置是否生效；如果加密设置生效，对rtmp流的视频数据和音频数据分别采用字节混淆的方式加密；将加密后的rtmp流上传至多媒体服务器，通过所述多媒体服务器的客户端读取加密后的rtmp流；读取rtmp meta data数据元中的加密标志位字段encrypt，并判断所述rtmp流的加密设置是否生效；如果加密设置生效，对读取加密后的rtmp流进行解密；对解密后的rtmp流进行解码，获取清晰的rtmp流。

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质中包括基于rtmp的音视频数据加解密程序，所述基于rtmp的音视频数据加解密程序被处理器执行时，实现如上所述的音视频数据加解密方法中的任意步骤。

本申请提出的基于rtmp的音视频数据加解密方法、电子装置及计算机可读存储介质，通过对H.264视频数据和AAC音频数据分别使用字节混淆方式对rtmp流进行加密；在客户端播放端获取加密后的rtmp流，进行解码播放前，采用字节混淆方式对数据取补码后再采用异或特定字节的解密方法对rtmp流中的H.264视频数据数据帧I帧、P帧以及AAC音频数据中的audio specification config进行解密；通过字节混淆方式加解密，实现过程简单，不会对服务器带来额外的带宽压力，并且不需要消耗客户端计算性能就能进行加密解密，此外，即使rtmp流或者流地址url被截取，播放出来的画面和声音都不是有效的信息，从而提高数据的安全性。

附图说明

图1为本申请基于rtmp的音视频数据加解密方法较佳实施例的应用环境示意图；

图2为图1中基于rtmp的音视频数据加解密程序较佳实施例的模块示意图；

图3为本申请基于rtmp的音视频数据加解密方法较佳实施例的流程图；

图4为本申请基于rtmp的音视频数据加解密系统的逻辑结构框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供一种基于rtmp的音视频数据加解密方法，应用于一种电子装置1。参照图1所示，为本申请基于rtmp的音视频数据加解密方法较佳实施例的应用环境示意图。

在本实施例中，电子装置1可以是服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有运算功能的终端设备。

该电子装置1包括：处理器12、存储器11、摄像装置13、网络接口14及通信总线15。

存储器11包括至少一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器11等的非易失性存储介质。在一些实施例中，所述可读存储介质可以是所述电子装置1的内部存储单元，例如该电子装置1的硬盘。在另一些实施例中，所述可读存储介质也可以是所述电子装置1的外部存储器11，例如所述电子装置1上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。

在本实施例中，所述存储器11的可读存储介质通常用于存储安装于所述电子装置1的基于rtmp的音视频数据加解密方法程序10等。所述存储器11还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)，微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行人物情绪分析程序10等。

摄像装置13既可以是所述电子装置1的一部分，也可以独立于电子装置1。在一些实施例中，所述电子装置1为智能手机、平板电脑、便携计算机等具有摄像头的终端设备，则所述摄像装置13即为所述电子装置1的摄像头。在其他实施例中，所述电子装置1可以为服务器，所述摄像装置13独立于该电子装置1、与该电子装置1通过网络连接，例如，该摄像装置13安装于特定场所，如办公场所、监控区域，对进入该特定场所的目标实时拍摄得到实时图像，通过网络将拍摄得到的实时图像传输至处理器12。

网络接口14可选地可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该电子装置1与其他电子设备之间建立通信连接。

通信总线15用于实现这些组件之间的连接通信。

图1仅示出了具有组件11-15的电子装置1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

可选地，该电子装置1还可以包括用户接口、显示器、触摸传感器以及射频(Radio Frequency，RF)电路，传感器、音频电路等等。

在图1所示的装置实施例中，作为一种计算机存储介质的存储器11中可以包括操作系统、以及基于rtmp的音视频数据加解密程序10；处理器12执行存储器11中存储的基于rtmp的音视频数据加解密程序10时实现如下步骤：

通过摄像装置13采集视频数据和音频数据，并将采集到的视频数据和音频数据进行编码，形成rtmp流；

在rtmp meta data数据元添加加密标志位字段encrypt，并根据所述加密标志位字段encrypt判断对所述rtmp流的加密设置是否生效；

如果加密设置生效，对所述rtmp流的视频数据和音频数据分别采用字节混淆的方式加密；

将加密后的rtmp流上传至多媒体服务器，通过所述多媒体服务器的客户端读取加密后的rtmp流；

读取rtmp meta data数据元中的加密标志位字段encrypt，并判断所述rtmp流的加密设置是否生效；

如果加密设置生效，对读取加密后的rtmp流进行解密；

对解密后的rtmp流进行解码，获取清晰的rtmp流。

其中，优选地，所述rtmp meta data数据元为码流的属性名称及其值，具体包括：视频宽、视频高、视频编码格式、视频帧率、音频编码格式、音频采样率。

优选地，所述在rtmp meta data数据元添加加密标志位字段encrypt，并根据所述加密标志位字段encrypt判断对所述rtmp流的加密设置是否生效的步骤包括如下：

在rtmp meta data数据元添加加密标志位字段encrypt；

若所述加密标志位字段encrypt为true，对所述rtmp流的加密设置则生效；

若所述加密标志位字段encrypt为false，对所述rtmp流的加密设置则不生效。

优选地，所述视频数据为H.264视频数据，采用H.264进行编码压缩形成的；

所述音频数据为AAC音频数据，采用AAC进行编码压缩形成的。

优选地，对所述rtmp流的视频数据和音频数据分别采用字节混淆的方式加密的步骤包括：

通过第一加密公式对H.264视频数据NAL层的I帧及P帧RBSP数组中的随机数个位单字节进行混淆，其中，所述第一加密公式如下：

NALU[NALU_Length％10]＝～NALU[NALU_Length％10+1]^NALU[11]

其中，随机数为NALU_Length％10；

NALU_Length为NALU结构体的总长度。

优选地，对所述rtmp流的视频数据和音频数据分别采用字节混淆的方式加密的步骤还包括：

通过第二加密公式对AAC每一帧的头部信息双字节进行加密，其中，所述第二加密公式如下：

AAC sequence header[2]＝～AAC sequence header[2]^0xAAAA

其中，所述AAC sequence header为所述AAC每一帧的头部信息。

优选地，所述读取加密后的rtmp流进行解密的步骤包括：

对加密后的rtmp流的视频数据进行解密，以及，对加密后的rtmp流的音频数据进行解密；

其中，对加密后的rtmp流的视频数据进行解密的步骤包括：

通过第一解密公式对H.264视频数据NAL层的I帧及P帧RBSP数组中的随机数个位单字节进行解密，其中，所述第一解密公式如下：

NALU[NALU_Length％10]＝～NALU[NALU_Length％10+1]^NALU[11]

其中，随机数为NALU_Length％10；

NALU_Length为NALU结构体的总长度。

优选地，所述对加密后的rtmp流的音频数据进行解密的步骤包括：

通过第二解密公式对AAC每一帧的头部信息双字节进行解密，其中，所述第二解密公式如下：

AAC sequence header[2]＝～AAC sequence header[2]^0xAAAA

其中，所述AAC sequence header为所述AAC每一帧的头部信息。

上述实施例提出的电子装置1，通过对H.264视频数据和AAC音频数据分别使用字节混淆方式对rtmp流进行加密；在客户端播放端获取加密后的 rtmp流，进行解码播放前，采用字节混淆方式对数据取补码后再采用异或特定字节的解密方法对rtmp流中的H.264视频数据数据帧I帧、P帧以及AAC音频数据中的audio specification config进行解密；在本申请的实施例中，通过字节混淆方式加解密，实现过程简单，不会对服务器带来额外的带宽压力，并且不需要消耗客户端计算性能就能进行加密解密，此外，即使rtmp流或者流地址url被截取，播放出来的画面和声音都不是有效的信息，从而提高数据的安全性。

在其他实施例中，基于rtmp的音视频数据加解密程序10还可以被分割为一个或者多个模块，一个或者多个模块被存储于存储器11中，并由处理器12执行，以完成本申请。本申请所称的模块是指能够完成特定功能的一系列计算机程序指令段。参照图2所示，为图1中基于rtmp的音视频数据加解密程序10较佳实施例的程序模块图。所述基于rtmp的音视频数据加解密程序10可以被分割为：采集编码模块110、第一判断模块120、rtmp流加密模块130、rtmp流上传模块140、rtmp流读取模块150、第二判断模块160、rtmp流解密模块170和rtmp流解码模块180。所述模块110-180所实现的功能或操作步骤均与上文类似，此处不再详述，示例性地，例如其中：

采集编码模块110，用于采集视频数据和音频数据，并将采集到的视频数据和音频数据进行编码，形成rtmp流；

第一判断模块120，用于在rtmp meta data数据元添加加密标志位字段encrypt，并根据所述加密标志位字段encrypt判断对所述rtmp流的加密设置是否生效；

rtmp流加密模块130，用于如果加密设置生效，对所述rtmp流的视频数据和音频数据分别采用字节混淆的方式加密；

rtmp流上传模块140，用于将加密后的rtmp流上传至多媒体服务器；

rtmp流读取模块150，用于通过所述多媒体服务器的客户端读取加密后的rtmp流；

第二判断模块160，用于读取rtmp meta data数据元中的加密标志位字段encrypt，并判断所述rtmp流的加密设置是否生效；

rtmp流解密模块170，用于如果加密设置生效，对读取加密后的rtmp流进行解密；

rtmp流解码模块180，用于对解密后的rtmp流进行解码，获取清晰的rtmp流。

此外，本申请还提供一种基于rtmp的音视频数据加解密方法。参照图3所示，为本申请基于rtmp的音视频数据加解密方法较佳实施例的流程图。该方法可以由一个装置执行，该装置可以由软件和/或硬件实现。

在本实施例中，基于rtmp的音视频数据加解密方法包括：步骤S10-步骤S70。

步骤S10：采集视频数据和音频数据，并将采集到的视频数据和音频数据进行编码，形成rtmp流；

步骤S20：在rtmp meta data数据元添加加密标志位字段encrypt，并根据加密标志位字段encrypt判断对rtmp流的加密设置是否生效；

步骤S30：如果加密设置生效，对所述rtmp流的视频数据和音频数据分别采用字节混淆的方式加密；

步骤S40：将加密后的rtmp流上传至多媒体服务器，通过所述多媒体服务器的客户端读取加密后的rtmp流；

步骤S50：读取rtmp meta data数据元中的加密标志位字段encrypt，并判断所述rtmp流的加密设置是否生效；

步骤S60：如果加密设置生效，对读取加密后的rtmp流进行解密；

步骤S70：对解密后的rtmp流进行解码，获取清晰的rtmp流。

采用本申请的加解密方法主要基于以下原因的考虑：1.客户端推流采用多种软硬编码方式，不便于加密编码过程参数。2.流传输协议采用现在流行的公有实时消息传输协议，且CDN(Content Delivery Network，内容分发网络)不支持实时消息传输协议协议，在协议层处理会影响CDN分发。3.如果加密SPS(Software Product Specification，中文名称：软件产品规格说明)和PPS(Programmable Power Supply，中文名称：快速充电技术规范)头信息会CDN录制转码生成错误，不便于区分错误及提取。4.尽量不要对每个音视频数据都进行加密，避免加密消耗客户端计算性能。

基于上述问题，本申请采用步骤S10至步骤S70解决上述问题。

在步骤S10中，采集的视频数据是指从摄像装置、文件、屏幕等数据输入源采集到的图像数据，该图像数据是yuv或rgb格式表示的。若干个图像数据就能组成视频数据。采集的音频数据是指从麦克风、文件等数据输入源采集到的音频数据，该音频数据的格式是pcm。

其中，对采集出来的数据进行编码，是指对音频数据和视频数据进行编码。对视频数据进行编码是对视频像素数据(rgb，yuv等)压缩成视频码流，从而降低视频的数据量，节省视频存储和传输带宽，而H.264就是其中一种视频编码压缩方案，本申请采用的就是H.264视频编码压缩方案。

其中，需要说明的是，H.264是一种高性能的视频编解码技术，它是由两个组织联合组建的联合视频组(JVT)共同制定的新数字视频编码标准，所以它既是ITU-T的H.264，又是ISO/IEC的MPEG-4高级视频编码(Advanced Video Coding，AVC)。

对音频数据进行编码是是对音频采样数据(pcm等)压缩成为音频码流，从而降低音频的数据量，节省音频存储和传输带宽，而AAC就是其中一种音频编码压缩方案，本申请采用的就是AAC音频编码压缩方案。

其中，需要说明的是，AAC(Advanced Audio Coding，中文名称：高级音频编码)，最早出现于1997年，基于MPEG-2的音频编码技术，在2000年MPEG-4标准出现后，AAC重新集成了其特性，加入了SBR技术和PS技术，为了区别于传统的MPEG-2，AAC又称为MPEG-4AAC。

其中，rtmp(real time messaging protocol，中文名称为：实时信息传输协议)传输的视频数据就是使用H.264进行编码压缩的，传输的音频数据就是使用AAC进行编码压缩的。

其中，rtmp是一种协议，rtmp流就是指直播流，包括传输的视频数据和音频数据，也就是说，将视频数据和音频数据封装成可以播放的rtmp流。

在步骤S20中，rtmp封装的内容有meta data元数据以及编码后的视频数据和音频数据，其中，rtmp协议通常情况下会先封装meta data元数据，然后再封装编码后的视频数据和音频数据。meta data元数据一般是码流的一些属性名称及其值，例如视频宽高，视频编码格式，视频帧率、音频编码格式、音频采样率等等。

所述在rtmp meta data数据元添加加密标志位字段encrypt，并根据所述加密标志位字段encrypt判断对所述rtmp流的加密设置是否生效的步骤包括如下：

在rtmp meta data数据元添加加密标志位字段encrypt；

若所述加密meta dataencrypt为true，对所述rtmp流的加密设置则生效；

若所述加密标志位字段encrypt为false，对所述rtmp流的加密设置加密则不生效。

在步骤S30中，对编码后的rtmp流进行加密，其中，加密方式是采用字节混淆的方式，对部分数据采用异或特定字节后取补码。对于视频数据而言，这部分数据是指NALU结构体中RBSP数据下标为NALU_Length％10的数据。对于音频而言，这部分数据是指每一帧的头部信息的下标为2的数据。

对编码后的视频数据加密：

通过第一加密公式对H.264编码数据NAL层的I帧及P帧RBSP数组中的随机数个位单字节进行混淆，其中随机数为NALU_Length％10。第一加密公式如下：

NALU[NALU_Length％10]＝～(NALU[NALU_Length％10+1]^NALU[11])

具体地，使用该视频加密公式对每一帧使用H.264压缩编码后的视频进行加密。而H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT：joint video team)开发的一个新的数字视频编码标准。H.264压缩编码数据是有一个接一个的NALU组成的，而它的功能分为两层:视频编码层(VCL,Video Coding Layer)和网络提取层(NAL,Network Abstraction Layer)。

VCL数据即编码处理的输出，它表示被压缩编码后的视频数据序列。在VCL数据传输或存储之前，这些编码的VCL数据，先被映射或封装进NAL单元(以下简称NALU，Nal Unit)中。每个NALU包括一个原始字节序列负荷(RBSP，Raw Byte Sequence Payload)、一组对应于视频编码的NALU头部信息。

基于上述概念介绍后，视频加密公式解释如下：对NALU结构体中RBSP数据下标为NALU_Length％10的数据进行加密修改，其中NALU_Length为NALU结构体的总长度，该数据修改为它下一个数据(下标+1)和下标11的数据进行异或后取反的值。

其中，对rtmp流的音频数据进行加密的方式为：

通过第二加密公式对AAC每一帧的头部信息的下标为2的数据进行加密修改，其值变为原始值和十六进制数0xAAAA的异或后取反的值；

对所述rtmp流的音频数据的第二加密公式如下：

AAC sequence header[2]＝～AAC sequence header[2]^0xAAAA

其中，所述AAC sequence header为所述AAC每一帧的头部信息。

使用该音频加密公式对每一个音频数据帧使用AAC压缩编码后的音频数据进行加密。

其中AAC(Advanced Audio Coding)，中文名：高级音频编码，出现于1997年，基于MPEG-2的音频编码技术。由Fraunhofer IIS、杜比实验室、AT&T、Sony等公司共同开发，目的是取代MP3格式。

AAC每一帧的头部信息为AAC sequence header，加密公式解释如下，对每一帧的头部信息的下标为2的数据进行加密修改，其值变为原始值和十六进制数0xAAAA的异或后取反的值。

在步骤S50中，用户开始拉rtmp流时，读取rtmp meta data中的加密标志位字段encrypt；判断rtmp meta data加密标志位字段encrypt生效，对编码数据解密，实现动态判断加解密状态；具体过程如下：

读取rtmp meta data中的加密标志位字段encrypt；

在步骤S60中，如果加密生效，对读取加密后的rtmp流进行解密；所述对读取加密后的rtmp流进行解密包括：对加密后的rtmp流的视频数据进行解密，以及对加密后的rtmp流的音频数据进行解密。

其中，解密方式是采用字节混淆方式，对数据取补码后再采用异或特定字节。对于视频数据而言，这部分数据是指NALU结构体中RBSP数据下标为NALU_Length％10的数据。对于音频而言，这部分数据是指每一帧的头部信息的下标为2的数据。

对视频数据解密方式为：

通过第一解密公式对H.264编码数据NAL层的I帧及P帧RBSP数组中的随机数个位单字节进行解密，其中，第一解密公式如下：

NALU[NALU_Length％10]＝～NALU[NALU_Length％10+1]^NALU[11]

其中，NALU_Length为NALU结构体的总长度。修改NALU结构体中 RBSP数据下标为NALU_Length％10的数据，其中NALU_Length表示NALU数据的长度。修改为下一个数据(下标+1)取反后的值异或下标为11的RBSP数据后的结果。

对音频数据解密方式为：

通过第二解密公式对AAC每一帧的头部信息双字节进行解密，其中，第二解密公式如下：

AAC sequence header[2]＝～AAC sequence header[2]^0xAAAA

其中，所述AAC sequence header为所述AAC每一帧的头部信息。对每一帧的头部信息的下标为2的数据进行解密修改，其值变为原始值取反后异或十六进制数0xAAAA的结果。

在步骤S70中，解码是指将音视频压缩后的数据解压缩的操作。解码是编码的一个反过程，类似压缩和解压缩。视频解码是将视频码流解压缩成视频像素数据(rgb或yuv格式)，视频解码有两种方式进行解码：硬件解码(有的设备客户端带有硬件解码器，使用该解码器可以对视频进行解码)；软件解码(可使用开源的第三方库如ffmpeg进行软件解码)。

音频解码是将音频码流解压缩成音频采样数据(pcm格式)。音频解码也有两种方式进行解码：硬件解码(有的设备客户端带有硬件解码器，使用该解码器可以对视频进行解码)；软件解码(可使用开源的第三方库如ffmpeg进行软件解码。

在本申请的实施例中，如果用户直接拉取加密后的rtmp流，不经过解密处理的话，就会出现画面无法辨认，声音无法听到有效信息的现象，从一定程度上保障了rtmp流的安全性。

上述实施例提出的基于rtmp的音视频数据加解密方法，通过对H.264视频数据和AAC音频数据分别使用字节混淆方式对rtmp流进行加密；在客户端播放端获取加密后的rtmp流，进行解码播放前，采用字节混淆方式对数据取补码后再采用异或特定字节的解密方法对rtmp流中的H.264视频数据数据帧I帧、P帧以及AAC音频数据中的audio specification config进行解密；在本申请的实施例中，通过字节混淆方式加解密，实现过程简单，不会对服务器带来额外的带宽压力，并且不需要消耗客户端计算性能就能进行加密解密，此外，即使rtmp流或者流地址url被截取，播放出来的画面和声音都不是有效的信息，从而提高数据的安全性。

相应的，本申请还提供一种基于rtmp的音视频数据加解密系统，该系统的逻辑结构与前述基于rtmp的音视频数据加解密程序10的分割结构相对应。

图4示出了根据本实施例的基于rtmp的音视频数据加解密系统逻辑框架，该系统也对应于基于rtmp的音视频数据加解密方法，可以设置于基于rtmp的音视频数据加解密电子装置中。

如图4所示，该基于rtmp的音视频数据加解密系统包括采集编码模块110、第一判断模块120、rtmp流加密模块130、rtmp流上传模块140、rtmp流读取模块150、第二判断模块160、rtmp流解密模块170和rtmp流解码模块180。模块110-180所实现的功能或操作步骤均与前述实施例的采集编码模块110、第一判断模块120、rtmp流加密模块130、rtmp流上传模块140、rtmp流读取模块150、第二判断模块160、rtmp流解密模块170和rtmp流解码模块180。所述模块110-180所实现的功能或操作步骤均与上文类似。

比如，采集编码模块110，用于采集视频数据和音频数据，并将采集到的视频数据和音频数据进行编码，形成rtmp流；

rtmp流加密模块130，用于在所述加密设置生效的情况下，对所述rtmp流的视频数据和音频数据分别采用字节混淆的方式加密；

rtmp流解密模块170，用于在所述加密设置生效的情况下，对读取加密后的rtmp流进行解密；

其中采集编码模块采集的视频数据为从数据输入源采集到的yuv或rgb 格式的图像数据；所述采集编码模块采集的音频数据为从数据输入源采集到的pcm格式的音频数据。在本申请的一个具体实施方式中，视频数据为采用H.264进行编码压缩形成的视频数据；所述音频数据为采用AAC进行编码压缩形成的音频数据。

rtmp meta data数据元为码流的属性名称及其值，可以包括：视频宽、视频高、视频编码格式、视频帧率、音频编码格式、音频采样率。

在本实施例的一个优选实施方式中，rtmp流加密模块通过第一加密公式对H.264视频数据NAL层的I帧及P帧RBSP数组中的随机数个位单字节进行混淆，其中，所述第一加密公式如下：

NALU[NALU_Length％10]＝～(NALU[NALU_Length％10+1]^NALU[11])

其中，随机数为NALU_Length％10；

NALU_Length为NALU结构体的总长度。

对于rtmp流的音频数据rtmp流，加密模块通过第二加密公式对AAC每一帧的头部信息双字节进行加密，其中，所述第二加密公式如下：

AAC sequence header[2]＝～AAC sequence header[2]^0xAAAA

其中，所述AAC sequence header为所述AAC每一帧的头部信息。

在解密阶段，rtmp流解密模块分别对加密后的rtmp流的视频数据和加密后的rtmp流的音频数据进行解密；

其中，rtmp流解密模块通过第一解密公式对H.264视频数据NAL层的I帧及P帧RBSP数组中的随机数个位单字节进行解密，其中，第一解密公式如下：

NALU[NALU_Length％10]＝～NALU[NALU_Length％10+1]^NALU[11]

其中，随机数为NALU_Length％10；

NALU_Length为NALU结构体的总长度。

另一方面，rtmp流解密模块通过第二解密公式对AAC每一帧的头部信息双字节进行解密，其中，第二解密公式如下：

AAC sequence header[2]＝～AAC sequence header[2]^0xAAAA

其中，AAC sequence header为AAC每一帧的头部信息。对每一帧的头部信息的下标为2的数据进行解密修改，其值变为原始值取反后异或十六进制数0xAAAA的结果。上述实施例提出的基于rtmp的音视频数据加解密系统，通过字节混淆方式加解密，实现过程简单，不会对服务器带来额外的带宽压力，并且不需要消耗客户端计算性能就能进行加密解密，此外，即使rtmp流或者流地址url被截取，播放出来的画面和声音都不是有效的信息，从而提高数据的安全性。

此外，本申请实施例还提出一种计算机可读存储介质，所述计算机可读存储介质中包括基于rtmp的音视频数据加解密程序，所述基于rtmp的音视频数据加解密序被处理器执行时实现如前所述的基于rtmp的音视频数据加解密方法的步骤。

本申请之计算机可读存储介质的具体实施方式与上述基于rtmp的音视频数据加解密方法、系统、电子装置的具体实施方式大致相同，在此不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种基于rtmp的音视频数据加解密方法，应用于电子装置，其特征在于，所述方法包括如下步骤：

S10：采集视频数据和音频数据，并将采集到的视频数据和音频数据进行编码，形成rtmp流；

S20：在rtmp meta data数据元添加加密标志位字段encrypt，并根据所述加密标志位字段encrypt判断对所述rtmp流的加密设置是否生效；

S30：如果加密设置生效，对所述rtmp流的视频数据和音频数据分别采用字节混淆的方式加密；

S40：将加密后的rtmp流上传至多媒体服务器，通过所述多媒体服务器的客户端读取加密后的rtmp流；

S50：读取rtmp meta data数据元中的加密标志位字段encrypt，并判断所述rtmp流的加密设置是否生效；

S60：如果加密设置生效，对读取加密后的rtmp流进行解密；

S70：对解密后的rtmp流进行解码，获取清晰的rtmp流。
根据权利要求1所述的基于rtmp的音视频数据加解密方法，其特征在于，

所述视频数据为从数据输入源采集到的yuv或rgb格式的图像数据；

所述音频数据为从数据输入源采集到的pcm格式的音频数据。
根据权利要求1所述的基于rtmp的音视频数据加解密方法，其特征在于，所述rtmp meta data数据元为码流的属性名称及其值，包括：视频宽、视频高、视频编码格式、视频帧率、音频编码格式、音频采样率。
根据权利要求1所述的基于rtmp的音视频数据加解密方法，其特征在于，所述步骤S20中断对所述rtmp流的加密设置是否生效的方法包括：

若所述加密标志位字段encrypt为true，对所述rtmp流的加密设置生效；

若所述加密标志位字段encrypt为false，对所述rtmp流的加密设置不生效。
根据权利要求1所述的基于rtmp的音视频据加解密方法，其特征在于，所述视频数据为采用H.264进行编码压缩形成的视频数据；所述音频数据为采用AAC进行编码压缩形成的音频数据。
根据权利要求5所述的基于rtmp的音视频数据加解密方法，其特征在于，在所述步骤S30中对所述rtmp流的视频数据和音频数据分别采用字节混淆的方式加密的步骤包括：

通过第一加密公式对H.264视频数据NAL层的I帧及P帧RBSP数组中的随机数个位单字节进行混淆，其中，所述第一加密公式如下：

NALU[NALU_Length％10]＝～(NALU[NALU_Length％10+1]^NALU[11])

其中，随机数为NALU_Length％10；

NALU_Length为NALU结构体的总长度。
根据权利要求6所述的基于rtmp的音视频数据加解密方法，其特征在于，在所述步骤S30中对所述rtmp流的视频数据和音频数据分别采用字节混淆的方式加密的步骤还包括：

通过第二加密公式对AAC每一帧的头部信息双字节进行加密，其中，所述第二加密公式如下：

AAC sequence header[2]＝～AAC sequence header[2]^0xAAAA

其中，所述AAC sequence header为所述AAC每一帧的头部信息。
根据权利要求1所述的基于rtmp的音视频数据加解密方法，其特征在于，在所述步骤S50中断所述rtmp流的加密设置是否生效的方法包括：

若所述加密标志位字段encrypt为true，对所述rtmp流的加密设置则生效；

若所述加密标志位字段encrypt为false，对所述rtmp流的加密设置则不生效。
根据权利要求5所述的基于rtmp的音视频数据加解密方法，其特征在于，在所述步骤S60中对所述读取加密后的rtmp流进行解密的步骤包括：

对加密后的rtmp流的视频数据进行解密，以及，对加密后的rtmp流的音频数据进行解密；

其中，对加密后的rtmp流的视频数据进行解密的步骤包括：

通过第一解密公式对H.264视频数据NAL层的I帧及P帧RBSP数组中的随机数个位单字节进行解密，其中，所述第一解密公式如下：

NALU[NALU_Length％10]＝～NALU[NALU_Length％10+1]^NALU[11] 其中，随机数为NALU_Length％10；

NALU_Length为NALU结构体的总长度。
根据权利要求9所述的基于rtmp的音视频数据加解密方法，其特征在于，所述对加密后的rtmp流的音频数据进行解密的步骤包括：

通过第二解密公式对AAC每一帧的头部信息双字节进行解密，其中，所述第二解密公式如下：

AAC sequence header[2]＝～AAC sequence header[2]^0xAAAA

其中，所述AAC sequence header为所述AAC每一帧的头部信息。
一种基于rtmp的音视频数据加解密系统，其特征在于，包括：

采集编码模块，用于采集视频数据和音频数据，并将采集到的视频数据和音频数据进行编码，形成rtmp流；

第一判断模块，用于在rtmp meta data数据元添加加密标志位字段encrypt，并根据所述加密标志位字段encrypt判断对所述rtmp流的加密设置是否生效；

rtmp流加密模块，用于在所述加密设置生效的情况下，对所述rtmp流的视频数据和音频数据分别采用字节混淆的方式加密；

rtmp流上传模块，用于将加密后的rtmp流上传至多媒体服务器；

rtmp流读取模块，用于通过所述多媒体服务器的客户端读取加密后的rtmp流；

第二判断模块，用于读取rtmp meta data数据元中的加密标志位字段encrypt，并判断所述rtmp流的加密设置是否生效；

rtmp流解密模块，用于在所述加密设置生效的情况下，对读取加密后的rtmp流进行解密；

rtmp流解码模块，用于对解密后的rtmp流进行解码，获取清晰的rtmp流。
根据权利要求11所述的基于rtmp的音视频数据加解密系统，其特征在于，所述采集编码模块采集的视频数据为从数据输入源采集到的yuv或rgb格式的图像数据；所述采集编码模块采集的音频数据为从数据输入源采集到的pcm格式的音频数据。
根据权利要求11所述的基于rtmp的音视频数据加解密系统，其特征在于，所述rtmp meta data数据元为码流的属性名称及其值，包括：视频宽、视频高、视频编码格式、视频帧率、音频编码格式、音频采样率。
根据权利要求11所述的基于rtmp的音视频数据加解密系统，其特征在于，所述视频数据为采用H.264进行编码压缩形成的视频数据；所述音频数据为采用AAC进行编码压缩形成的音频数据。
根据权利要求14所述的基于rtmp的音视频数据加解密系统，其特征在于，所述rtmp流加密模块通过第一加密公式对H.264视频数据NAL层的I帧及P帧RBSP数组中的随机数个位单字节进行混淆，其中，所述第一加密公式如下：

NALU[NALU_Length％10]＝～(NALU[NALU_Length％10+1]^NALU[11])

其中，随机数为NALU_Length％10；

NALU_Length为NALU结构体的总长度。
根据权利要求15所述的基于rtmp的音视频数据加解密系统，其特征在于，所述rtmp流加密模块通过第二加密公式对AAC每一帧的头部信息双字节进行加密，其中，所述第二加密公式如下：

AAC sequence header[2]＝～AAC sequence header[2]^0xAAAA

其中，所述AAC sequence header为所述AAC每一帧的头部信息。
根据权利要求14所述的基于rtmp的音视频数据加解密系统，其特征在于，所述rtmp流解密模块分别对加密后的rtmp流的视频数据和加密后的rtmp流的音频数据进行解密；

其中，所述rtmp流解密模块通过第一解密公式对H.264视频数据NAL层的I帧及P帧RBSP数组中的随机数个位单字节进行解密，其中，所述第一解密公式如下：

NALU[NALU_Length％10]＝～NALU[NALU_Length％10+1]^NALU[11]

其中，随机数为NALU_Length％10；

NALU_Length为NALU结构体的总长度。
根据权利要求17所述的基于rtmp的音视频数据加解密系统，其特征在于，所述rtmp流解密模块通过第二解密公式对AAC每一帧的头部信息双字节进行解密，其中，所述第二解密公式如下：

AAC sequence header[2]＝～AAC sequence header[2]^0xAAAA

其中，所述AAC sequence header为所述AAC每一帧的头部信息。
一种电子装置，其特征在于，该电子装置包括：存储器、处理器及摄像装置，所述存储器中包括基于rtmp的音视频数据加解密程序，所述基于rtmp的音视频数据加解密程序被所述处理器执行时实现如权利要求1至10中任一项所述的基于rtmp的音视频数据加解密方法的步骤。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中包括基于rtmp的音视频数据加解密程序，所述基于rtmp的音视频数据加解密程序被处理器执行时，实现如权利要求1至10中任一项所述的基于rtmp的音视频数据加解密方法的步骤。