CN106550240A - 一种带宽节省方法和系统 - Google Patents
一种带宽节省方法和系统 Download PDFInfo
- Publication number
- CN106550240A CN106550240A CN201611129506.8A CN201611129506A CN106550240A CN 106550240 A CN106550240 A CN 106550240A CN 201611129506 A CN201611129506 A CN 201611129506A CN 106550240 A CN106550240 A CN 106550240A
- Authority
- CN
- China
- Prior art keywords
- macro block
- interest
- area
- coordinate
- predetermined number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000001514 detection method Methods 0.000 claims description 24
- 238000002372 labelling Methods 0.000 claims description 8
- 230000001815 facial effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- RSXXGWGVKBYFGH-UHFFFAOYSA-N grandone Natural products CC(=CCC1=C(O)C(CC=C(C)C)(CC=C(C)C)C(=C(C(=O)c2ccccc2)C1=O)O)C RSXXGWGVKBYFGH-UHFFFAOYSA-N 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2187—Live feed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234363—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25866—Management of end-user data
- H04N21/25891—Management of end-user data being end-user preferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440263—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Computer Graphics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明提供一种带宽节省方法和系统,应用于直播视频中。该方法首先将实时视频图像划分成预设数量个宏块,然后检测实时视频图像中的感兴趣区域,并判断预设数量个宏块是否位于感兴趣区域,将位于该感兴趣区域内的宏块标记为第一宏块,将位于该感兴趣区域外的宏块标记为第二宏块,最后,按第一编码速率对第一宏块的图像数据进行编码,生成第一编码数据,按第二编码速率对第二宏块的图像数据进行编码,生成第二编码数据,其中,第一编码速率大于第二编码速率。本发明能够有效降低直播视频数据传输过程中的带宽成本。
Description
技术领域
本发明涉及直播应用技术领域,具体而言,涉及一种带宽节省方法和系统。
背景技术
在当前的视频直播行业中,带宽成本的投入非常巨大。经发明人研究发现,视频传输的码率、直播带宽以及视频分辨率之间有很大关系,如何根据视频画面中不同区域的重要程度,在保证重要区域视频分辨率的前提下,降低视频直播过程中的带宽成本,成为本领域技术人员亟待解决的技术问题。
发明内容
有鉴于此,本发明提供一种带宽节省方法和系统,通过对视频图像中的不同区域按照不同的编码速率进行编码,从而降低直播视频传输过程中的带宽使用成本。
本发明较佳实施例一种带宽节省方法,应用于直播视频中,所述方法包括:
将实时视频图像划分成预设数量个宏块;
检测所述实时视频图像中的感兴趣区域;
判断所述预设数量个宏块是否位于所述感兴趣区域,将所述预设数量个宏块中位于所述感兴趣区域内的宏块标记为第一宏块,将所述预设数量个宏块中位于所述感兴趣区域外的宏块标记为第二宏块;
按第一编码速率对所述第一宏块的图像数据进行编码,生成第一编码数据,按第二编码速率对所述第二宏块的图像数据进行编码,生成第二编码数据,其中,所述第一编码速率大于所述第二编码速率。
进一步地,所述判断所述预设数量个宏块是否位于所述感兴趣区域的具体步骤为:
获取所述感兴趣区域的坐标值以及所述预设数量个宏块的坐标值;
判断所述预设数量个宏块的坐标值是否位于所述感兴趣区域的坐标值范围内,将坐标值位于所述感兴趣区域的坐标值范围内的所述宏块标记为第一宏块,将坐标值位于所述感兴趣区域的坐标值范围外的所述宏块标记为第二宏块。
进一步地,所述检测所述实时视频图像中的感兴趣区域为通过人脸检测算法获取的人脸区域。
进一步地,在按第一码率将所述第一编码数据进行传输,按第二码率将所述第二编码数据进行传输的步骤之后,所述方法还包括:
通过相应的解码算法对接收到的所述第一编码数据和所述第二编码数据进行解码。
本发明另一较佳实施例提供一种带宽节省系统,应用于直播视频中,所述带宽节省系统包括:
宏块划分模块,用于将实时视频图像划分成预设数量个宏块;
检测模块,用于检测所述实时视频图像中的感兴趣区域;
判断模块,用于判断所述预设数量个宏块是否位于所述感兴趣区域,将所述预设数量个宏块中位于所述感兴趣区域内的宏块标记为第一宏块,将所述预设数量个宏块中位于所述感兴趣区域外的宏块标记为第二宏块;
编码模块,用于按第一编码速率对所述第一宏块的图像数据进行编码,生成第一编码数据,按第二编码速率对所述第二宏块的图像数据进行编码,生成第二编码数据,其中,所述第一编码速率大于所述第二编码速率。
进一步地,所述判断模块包括:
获取子模块,用于获取所述感兴趣区域的坐标值以及所述预设数量个宏块的坐标值;
判断子模块,用于判断所述预设数量个宏块的坐标值是否位于所述感兴趣区域的坐标值范围内;
标记子模块,用于将坐标值位于所述感兴趣区域的坐标值范围内的所述宏块标记为第一宏块,将坐标值位于所述感兴趣区域的坐标值范围外的所述宏块标记为第二宏块。
进一步地,所述检测模块为人脸检测模块,所述人脸检测模块用于通过人脸检测算法获取所述人脸图像区域。
进一步地,所述编码模块包括第一编码子模块和第二编码子模块;
所述第一编码子模块,用于按第一编码速率对所述第一宏块的图像数据进行编码,生成第一编码数据;
所述第二编码子模块,用于按第二编码速率对所述第二宏块的图像数据进行编码,生成第二编码数据。
进一步地,所述带宽节省系统还包括发送模块和接收模块;
所述发送模块,用于发送所述第一编码数据和所述第二编码数据;
所述接收模块,用于通过相应的解码算法对接收到的所述第一编码数据和所述第二编码数据进行解码。
本发明实施例提供的带宽节省方法和系统,应用于直播视频中,在不影响用户观看体验的前提下,通过对视频图像中的不同区域按照不同的编码速率进行编码,以降低直播视频传输过程中的带宽成本。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种应用宽带节省系统的直播终端的方框结构示意图。
图2为本发明实施例提供的一种带宽节省系统的连接框图。
图3为图2所示的判断模块130的子模块连接框图。
图4为图2所示的编码模块140的子模块连接框图。
图5为本发明另一实施例提供的一种带宽节省方法的流程示意图。
图标:10-直播终端;100-带宽节省系统;110-宏块划分模块;120-检测模块;130-判断模块;132-获取子模块;134-判断子模块;136-标记子模块;140-编码模块;142-第一编码子模块;144-第二编码子模块;200-存储器;300-存储控制器;400-处理器。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
如图1所示,为本发明实施例提供的一种应用带宽节省系统100的直播终端10的方框结构示意图。所述直播终端10包括带宽节省系统100、存储器200、存储控制器300以及处理器400。
其中,所述存储器200、存储控制器300、处理器400各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件之间通过一条或多条通讯总线或信号线实现电性连接。所述带宽节省系统100包括至少一个可以软件或固件的形式存储于所述存储器200中或固化在所述直播终端10的操作系统中的软件功能模块。所述处理器400在所述存储控制器300的控制下访问所述存储器200,以用于执行所述存储器200中存储的可执行模块,例如所述带宽节省系统100所包括的软件功能模块及计算机程序等。
进一步地,请参阅图2,为本发明实施例提供的一种带宽节省系统100的连接框图,应用于直播视频中。所述带宽节省系统100包括宏块划分模块110、检测模块120、判断模块130和编码模块140。
具体地,所述宏块划分模块110用于将实时视频图像划分成预设数量个宏块。可选地,在视频编码中,一个编码图像通常由若干宏块组成,一个宏块由一个亮度像素块和附加的两个色度像素块组成。一般来说,亮度块为16*16大小的像素块,而两个色度图像像素块的大小依据其图像的采样格式而定,例如,对于YUV420采样图像,色度块是为8*8大小的像素块。同时,每个图象中,若干宏块被排列成片的形式,视频编码算法以宏块为单位,逐个宏块进行编码,组织成连续的视频码流。应理解,所述预设数量是指在将实时视频图像进行划分前,根据视频图像的分辨率宽度和高度而预先设置的宏块数量个数。
进一步地,通过所述宏块划分模块110将所述视频图像划分成所述预设数量个宏块后,所述检测模块120检测该视频图像中的重要区域,即感兴趣区域,其中,所述感兴趣区域可以为矩形区域。
可选地,所述检测模块120可以为人脸检测模块,并根据人脸检测技术识别直播视频图像画面中的人脸位置区域。目前,人脸检测技术已经相对成熟,如Adaboost算法、支持向量机(Support Vector Machine,SVM)、隐马尔可夫模型等基于统计的人脸检测算法,以及卷积神经网络(Convolutional Neural Networks,CNN)等基于深度学习的人脸检测方法都能得到不错的检测效果。
进一步地,所述判断模块130根据所述检测模块120检测到的所述实时视频图像中的感兴趣区域,判断所述宏块划分模块110划分成的预设数量个宏块是否位于所述感兴趣区域内,并将所述预设数量个宏块中位于所述感兴趣区域内的宏块标记为第一宏块,将所述预设数量个宏块中位于所述感兴趣区域外的宏块标记为第二宏块。
具体地,如图3所示,所述判断模块130包括获取子模块132、判断子模块134和标记子模块136。其中,所述获取子模块132用于获取所述感兴趣区域的坐标值以及所述预设数量个宏块的坐标值,其中,所述预设数量个宏块的坐标值是指预设数量个宏块中每个宏块的坐标值。所述判断子模块134用于判断所述预设数量个宏块的坐标值是否位于所述感兴趣区域的坐标值范围内。所述标记子模块136用于将坐标值位于所述感兴趣区域的坐标值范围内的所述宏块标记为第一宏块,将坐标值位于所述感兴趣区域的坐标值范围外的所述宏块标记为第二宏块。
进一步地,所述编码模块140根据所述判断模块130判断并标记的所述第一宏块和所述第二宏块,选择不同的编码速率对所述感兴趣区域和非感兴趣区域的图像进行编码。具体地,在实时视频图像编码过程中,所述编码速率即码率,决定着视频图像的分辨率大小,取决于单位时间内的取样率,即取样率越大,精度就越高。在同样分辨率下,视频文件的码率越大,压缩比就越小,画面质量就越高。也就是说,码率越大,单位时间内取样率越大,数据精度越高,解码后的文件就越接近原始文件。
可选地,如图4所示,所述编码模块140包括第一编码子模块142和第二编码子模块144。其中,所述第一编码子模块142用于按第一编码速率对所述第一宏块的图像数据进行编码,生成第一编码数据。所述第二编码子模块144用于按第二编码速率对所述第二宏块的图像数据进行编码,生成第二编码数据,其中,第一编码速率大于第二编码速率。
具体地,在本发明实施例中,进行图像数据编码时,相对于所述感兴趣区域,非感兴趣区域对画质的要求较低,因此,在进行图像数据编码时,所述感兴趣区域的码率大于非感兴趣区域的码率,以使感兴趣区域保持高码率,而降低非感兴趣区域码率,实现不同图像区域的码率自动适配。例如,在分辨率微1280*720的视频画面中,将所述感兴趣区域码率设置为2Mbps,将非感兴趣区域的码率降低为1.5Mbps或者1Mbps。
进一步地,所述带宽节省系统100还包括图像获取模块、发送模块和接收模块。
其中,所述图像获取模块用于获取直播视频图像中的实时视频图像。并将所述实时视频图像传送给所述宏块划分模块110以进行宏块划分。可选地,所述获取模块可以为单独的摄像头,也可以集成于电脑、手机等电子设备上为作为视频输入设备,以使人们彼此之间可通过摄像头在网络环境中进行有影像、有声音的交谈和沟通。
进一步地,所述发送模块用于对通过所述编码模块140编码完成的所述第一编码数据和所述第二编码数据进行传输。
进一步地,所述接收模块用于通过相应的解码算法对接收到的所述第一编码数据和所述第二编码数据进行解码,以还原所述直播视频中的实时视频图像。其中,所述解码算法与所述编码模块140进行图像数据编码时采用的编码算法相匹配。
基于上述的带宽节省系统100的设计和描述,下面对基于所述带宽节省系统100的带宽节省方法作进一步阐述。具体请参阅图5,为本发明较佳实施例提供的一种带宽节省方法的流程示意图,以下步骤是对图5所示的具体流程进行的详细阐述。
步骤S201:获取实时视频图像。
步骤S202:将实时视频图像划分成预设数量个宏块。
具体地,在本发明实施例中,所述步骤S201由图像获取模块执行,所述步骤S202由所述宏块划分模块110执行。假设视频图像的分辨率宽度为W,高度为H,那么将视频画面划分为M*N个矩形宏块,可得到每个宏块的宽度和高度分别为W/M、H/N。
步骤S203:检测所述实时视频图像中的感兴趣区域。
具体地,在本发明实施例中,所述步骤S203由检测模块120执行。例如,在本发明实施例中,所述检测模块120可以为人脸检测模块,通过人脸检测技术检测人脸所在的矩形区域,同时,也可通过所述人脸检测技术获取该矩形区域左上角坐标A(left,top)和右下角坐标B(right,bottom)。
步骤S204:分别判断所述预设数量个宏块是否位于感兴趣区域,若所述宏块位于所述感兴趣区域内,则执行步骤S2051;反之,执行步骤S2052。
步骤S2051:标记为第一宏块。
步骤S2052:标记为第二宏块。
具体地,在本发明实施例中,所述步骤S204、步骤S2051和步骤S2052由判断模块130执行。例如,在本发明实施例中,首先通过所述获取子模块132获取所述人脸矩形区域的坐标值以及所述M*N个矩形宏块的坐标值,如所述矩形区域左上角坐标A(left,top)和右下角坐标B(right,bottom)。可选地,假设i的取值范围为[0,M-1],j的取值范围为[0,N-1],那么第j行第i列的宏块左上角坐标为C(i*W/M,j*H/N),右下角坐标为D((i+1)*W/M,(j+1)*H/N)。因此,判断标准需满足以下伪代码逻辑。
其中A.x=left,A.y=top,B.x=right,B.y=bottom,C.x=i*W/M,C.y=j*H/N,D.x=(i+1)*W/M,D.y=(j+1)*H/N。
进一步地,在判断过程中,通过所述标记子模块136对上述判断结果进行标记。也就是说,将坐标值位于所述人脸区域(感兴趣区域)的坐标值范围内的所述宏块标记为第一宏块,将坐标值位于所述人脸区域(感兴趣区域)的坐标值范围外的所述宏块标记为第二宏块。
步骤S2061:生成第一编码数据。
步骤S2062:生成第二编码数据。
具体地,在本发明实施例中,所述步骤S2061和步骤S2062由所述编码模块140执行。其中,所述第一编码子模块142按第一编码速率对所述第一宏块的图像数据进行编码,生成第一编码数据。所述第二编码子模块144按第二编码速率对所述第二宏块的图像数据进行编码,生成第二编码数据。应注意,在编码过程中,所述第一编码速率大于所述第二编码速率即实现动态码率的分配。具体地,完成编码后的所述人脸区域(感兴趣区域)外的视频数据总量降低,而所述人脸区域(感兴趣区域)的视频数据总量相对较大,进而保证视频图像中的重要区域的画质。应理解,在实际实施时,所述步骤S2061和步骤S2062执行顺序不分先后。
进一步地,由于人脸区域的码率并没有降低,人脸区域的画面质量并不会受到影响,而非人脸区域的码率降低了,那么编码后的视频数据总量也会降低,推送到内容分发网络(Content Delivery Network,CDN)服务器的流量也会相应减少,网络传输的带宽也会降低。
步骤S207:数据传输。
具体地,在本发明实施例中,所述步骤S207由所述发送模块执行。即所述发送模块对所述编码模块140生成的第一编码数据和第二编码数据进行传输。
步骤S208:接收并解码。
具体地,在本发明实施例中,所述步骤S208由所述接收模块执行。所述接收模块用于通过相应的解码算法对接收到的所述第一编码数据和所述第二编码数据进行解码,以还原所述直播视频中的实时视频图像。
综上所述,本发明提供的带宽节省方法和系统,对实时视频画面中的不同区域动态分配不同的编码速率(如感兴趣区域和非感兴趣区域),以完成直播视频图像的编码、传输。相比于现有技术,本发明能够在不影响用户观看体验的前提下,降低直播视频的数据传输过程中的带宽成本。
在本发明的描述中,术语“设置”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其他方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的预设数量个实施例的装置、方法和计算机程序产品可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分。所述模块、程序段或代码的一部分包含一个或预设数量个用于实现规定的逻辑功能。
也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种带宽节省方法,其特征在于,应用于直播视频中,所述方法包括:
将实时视频图像划分成预设数量个宏块;
检测所述实时视频图像中的感兴趣区域;
判断所述预设数量个宏块是否位于所述感兴趣区域,将所述预设数量个宏块中位于所述感兴趣区域内的宏块标记为第一宏块,将所述预设数量个宏块中位于所述感兴趣区域外的宏块标记为第二宏块;
按第一编码速率对所述第一宏块的图像数据进行编码,生成第一编码数据并发送,按第二编码速率对所述第二宏块的图像数据进行编码,生成第二编码数据并发送,其中,所述第一编码速率大于所述第二编码速率。
2.根据权利要求1所述的带宽节省方法,其特征在于,所述判断所述预设数量个宏块是否位于所述感兴趣区域的具体步骤为:
获取所述感兴趣区域的坐标值以及所述预设数量个宏块的坐标值;
判断所述预设数量个宏块的坐标值是否位于所述感兴趣区域的坐标值范围内,将坐标值位于所述感兴趣区域的坐标值范围内的所述宏块标记为第一宏块,将坐标值位于所述感兴趣区域的坐标值范围外的所述宏块标记为第二宏块。
3.根据权利要求1所述的带宽节省方法,其特征在于,所述检测所述实时视频图像中的感兴趣区域为通过人脸检测算法获取的人脸图像区域。
4.根据权利要求1所述的带宽节省方法,其特征在于,在生成第一编码数据和第二编码数据并发送的步骤之后,所述方法还包括:
通过相应的解码算法对接收到的所述第一编码数据和所述第二编码数据进行解码。
5.一种带宽节省系统,应用于直播视频中,其特征在于,所述带宽节省系统包括:
宏块划分模块,用于将实时视频图像划分成预设数量个宏块;
检测模块,用于检测所述实时视频图像中的感兴趣区域;
判断模块,用于判断所述预设数量个宏块是否位于所述感兴趣区域,将所述预设数量个宏块中位于所述感兴趣区域内的宏块标记为第一宏块,将所述预设数量个宏块中位于所述感兴趣区域外的宏块标记为第二宏块;
编码模块,用于按第一编码速率对所述第一宏块的图像数据进行编码,生成第一编码数据,按第二编码速率对所述第二宏块的图像数据进行编码,生成第二编码数据,其中,所述第一编码速率大于所述第二编码速率。
6.根据权利要求5所述的带宽节省系统,其特征在于,所述判断模块包括:
获取子模块,用于获取所述感兴趣区域的坐标值以及所述预设数量个宏块的坐标值;
判断子模块,用于判断所述预设数量个宏块的坐标值是否位于所述感兴趣区域的坐标值范围内;
标记子模块,用于将坐标值位于所述感兴趣区域的坐标值范围内的所述宏块标记为第一宏块,将坐标值位于所述感兴趣区域的坐标值范围外的所述宏块标记为第二宏块。
7.根据权利要求5所述的带宽节省系统,其特征在于,所述检测模块为人脸检测模块,所述人脸检测模块用于通过人脸检测算法获取人脸图像区域。
8.根据权利要求5所述的带宽节省系统,其特征在于,所述编码模块包括第一编码子模块和第二编码子模块;
所述第一编码子模块,用于按第一编码速率对所述第一宏块的图像数据进行编码,生成第一编码数据;
所述第二编码子模块,用于按第二编码速率对所述第二宏块的图像数据进行编码,生成第二编码数据。
9.根据权利要求5所述的带宽节省系统,其特征在于,所述带宽节省系统还包括发送模块和接收模块;
所述发送模块,用于发送所述第一编码数据和所述第二编码数据;
所述接收模块,用于通过相应的解码算法对接收到的所述第一编码数据和所述第二编码数据进行解码。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611129506.8A CN106550240A (zh) | 2016-12-09 | 2016-12-09 | 一种带宽节省方法和系统 |
PCT/CN2017/079588 WO2018103243A1 (zh) | 2016-12-09 | 2017-04-06 | 一种带宽节省方法、系统、直播终端及可读取存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611129506.8A CN106550240A (zh) | 2016-12-09 | 2016-12-09 | 一种带宽节省方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106550240A true CN106550240A (zh) | 2017-03-29 |
Family
ID=58397230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611129506.8A Pending CN106550240A (zh) | 2016-12-09 | 2016-12-09 | 一种带宽节省方法和系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN106550240A (zh) |
WO (1) | WO2018103243A1 (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107040794A (zh) * | 2017-04-26 | 2017-08-11 | 盯盯拍(深圳)技术股份有限公司 | 视频播放方法、服务器、虚拟现实设备以及全景虚拟现实播放系统 |
WO2018103243A1 (zh) * | 2016-12-09 | 2018-06-14 | 武汉斗鱼网络科技有限公司 | 一种带宽节省方法、系统、直播终端及可读取存储介质 |
CN108600863A (zh) * | 2018-03-28 | 2018-09-28 | 腾讯科技(深圳)有限公司 | 多媒体文件处理方法和装置、存储介质及电子装置 |
CN109005421A (zh) * | 2018-08-17 | 2018-12-14 | 青岛海信电器股份有限公司 | 图像处理方法及装置、计算机可读存储介质 |
CN109218836A (zh) * | 2017-06-30 | 2019-01-15 | 华为技术有限公司 | 一种视频处理方法及其设备 |
CN109862019A (zh) * | 2019-02-20 | 2019-06-07 | 联想(北京)有限公司 | 数据处理方法、装置以及系统 |
CN110049324A (zh) * | 2019-04-12 | 2019-07-23 | 深圳壹账通智能科技有限公司 | 视频编码方法、系统、设备及计算机可读存储介质 |
CN112118446A (zh) * | 2019-06-20 | 2020-12-22 | 杭州海康威视数字技术股份有限公司 | 图像压缩方法及装置 |
WO2021036103A1 (zh) * | 2019-08-28 | 2021-03-04 | 深圳大学 | 图像数据的压缩传输方法、系统和计算机可读存储介质 |
WO2021057477A1 (zh) * | 2019-09-27 | 2021-04-01 | 腾讯科技(深圳)有限公司 | 视频编解码方法和相关装置 |
CN113891105A (zh) * | 2021-09-28 | 2022-01-04 | 广州繁星互娱信息科技有限公司 | 画面显示方法和装置、存储介质及电子设备 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110674778B (zh) * | 2019-09-30 | 2023-05-16 | 安徽创世科技股份有限公司 | 一种高分辨视频图像目标检测方法及装置 |
US11082705B1 (en) * | 2020-06-17 | 2021-08-03 | Ambit Microsystems (Shanghai) Ltd. | Method for image transmitting, transmitting device and receiving device |
CN113301342B (zh) * | 2021-05-13 | 2022-07-22 | 广州方硅信息技术有限公司 | 视频编码方法、网络直播方法、装置和终端设备 |
CN114827684B (zh) * | 2022-04-25 | 2023-06-02 | 青岛海尔乐信云科技有限公司 | 一种基于5g的交互式视频服务方法及系统 |
CN115514969B (zh) * | 2022-11-05 | 2024-10-15 | 湖北明祥基业科技有限公司 | 一种视频大数据存储及转码优化系统 |
CN116033189B (zh) * | 2023-03-31 | 2023-06-30 | 卓望数码技术(深圳)有限公司 | 基于云边协同的直播互动视频分区智能控制方法和系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101534444A (zh) * | 2009-04-20 | 2009-09-16 | 杭州华三通信技术有限公司 | 一种图像处理方法、系统和装置 |
US20100215098A1 (en) * | 2009-02-23 | 2010-08-26 | Mondo Systems, Inc. | Apparatus and method for compressing pictures with roi-dependent compression parameters |
CN101867799A (zh) * | 2009-04-17 | 2010-10-20 | 北京大学 | 一种视频帧处理方法和视频编码器 |
CN104105006A (zh) * | 2014-07-23 | 2014-10-15 | 北京永新视博信息技术有限公司 | 一种视频图像处理方法和系统 |
CN104980740A (zh) * | 2014-04-08 | 2015-10-14 | 富士通株式会社 | 图像处理方法、装置和电子设备 |
CN106131670A (zh) * | 2016-07-12 | 2016-11-16 | 块互动(北京)科技有限公司 | 一种自适应视频编码方法及终端 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106550240A (zh) * | 2016-12-09 | 2017-03-29 | 武汉斗鱼网络科技有限公司 | 一种带宽节省方法和系统 |
-
2016
- 2016-12-09 CN CN201611129506.8A patent/CN106550240A/zh active Pending
-
2017
- 2017-04-06 WO PCT/CN2017/079588 patent/WO2018103243A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100215098A1 (en) * | 2009-02-23 | 2010-08-26 | Mondo Systems, Inc. | Apparatus and method for compressing pictures with roi-dependent compression parameters |
CN101867799A (zh) * | 2009-04-17 | 2010-10-20 | 北京大学 | 一种视频帧处理方法和视频编码器 |
CN101534444A (zh) * | 2009-04-20 | 2009-09-16 | 杭州华三通信技术有限公司 | 一种图像处理方法、系统和装置 |
CN104980740A (zh) * | 2014-04-08 | 2015-10-14 | 富士通株式会社 | 图像处理方法、装置和电子设备 |
CN104105006A (zh) * | 2014-07-23 | 2014-10-15 | 北京永新视博信息技术有限公司 | 一种视频图像处理方法和系统 |
CN106131670A (zh) * | 2016-07-12 | 2016-11-16 | 块互动(北京)科技有限公司 | 一种自适应视频编码方法及终端 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018103243A1 (zh) * | 2016-12-09 | 2018-06-14 | 武汉斗鱼网络科技有限公司 | 一种带宽节省方法、系统、直播终端及可读取存储介质 |
CN107040794A (zh) * | 2017-04-26 | 2017-08-11 | 盯盯拍(深圳)技术股份有限公司 | 视频播放方法、服务器、虚拟现实设备以及全景虚拟现实播放系统 |
CN109218836B (zh) * | 2017-06-30 | 2021-02-26 | 华为技术有限公司 | 一种视频处理方法及其设备 |
CN109218836A (zh) * | 2017-06-30 | 2019-01-15 | 华为技术有限公司 | 一种视频处理方法及其设备 |
CN108600863A (zh) * | 2018-03-28 | 2018-09-28 | 腾讯科技(深圳)有限公司 | 多媒体文件处理方法和装置、存储介质及电子装置 |
CN109005421A (zh) * | 2018-08-17 | 2018-12-14 | 青岛海信电器股份有限公司 | 图像处理方法及装置、计算机可读存储介质 |
CN109862019B (zh) * | 2019-02-20 | 2021-10-22 | 联想(北京)有限公司 | 数据处理方法、装置以及系统 |
CN109862019A (zh) * | 2019-02-20 | 2019-06-07 | 联想(北京)有限公司 | 数据处理方法、装置以及系统 |
WO2020207030A1 (zh) * | 2019-04-12 | 2020-10-15 | 深圳壹账通智能科技有限公司 | 视频编码方法、系统、设备及计算机可读存储介质 |
CN110049324A (zh) * | 2019-04-12 | 2019-07-23 | 深圳壹账通智能科技有限公司 | 视频编码方法、系统、设备及计算机可读存储介质 |
CN110049324B (zh) * | 2019-04-12 | 2022-10-14 | 深圳壹账通智能科技有限公司 | 视频编码方法、系统、设备及计算机可读存储介质 |
CN112118446A (zh) * | 2019-06-20 | 2020-12-22 | 杭州海康威视数字技术股份有限公司 | 图像压缩方法及装置 |
CN112118446B (zh) * | 2019-06-20 | 2022-04-26 | 杭州海康威视数字技术股份有限公司 | 图像压缩方法及装置 |
WO2021036103A1 (zh) * | 2019-08-28 | 2021-03-04 | 深圳大学 | 图像数据的压缩传输方法、系统和计算机可读存储介质 |
WO2021057477A1 (zh) * | 2019-09-27 | 2021-04-01 | 腾讯科技(深圳)有限公司 | 视频编解码方法和相关装置 |
US12052429B2 (en) | 2019-09-27 | 2024-07-30 | Tencent Technology (Shenzhen) Company Limited | Video encoding method, video decoding method, and related apparatuses |
CN113891105A (zh) * | 2021-09-28 | 2022-01-04 | 广州繁星互娱信息科技有限公司 | 画面显示方法和装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2018103243A1 (zh) | 2018-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106550240A (zh) | 一种带宽节省方法和系统 | |
EP3402205B1 (en) | Image encoding/decoding method and device | |
JP2021520082A (ja) | ビデオ符号化のための機械学習モデルの量子化パラメータに適用される非線形関数の使用 | |
CN110418177B (zh) | 视频编码方法、装置、设备和存储介质 | |
CN106060582B (zh) | 视频传输系统、方法及装置 | |
CN106303571B (zh) | 图像采集过程中实现自适应屏幕旋转的方法及系统 | |
Dou et al. | Edge computing-enabled deep learning for real-time video optimization in IIoT | |
US20180007269A1 (en) | Neural network to optimize video stabilization parameters | |
CN101009803A (zh) | 高清视频传输系统及方法 | |
CN111182303A (zh) | 共享屏幕的编码方法、装置、计算机可读介质及电子设备 | |
CN110650343A (zh) | 图像的编码、解码方法及装置、电子设备及系统 | |
CN110740316A (zh) | 数据编码方法及装置 | |
CN110830803A (zh) | 结合块匹配和串匹配的图像压缩方法 | |
CN105049949A (zh) | 一种即时视频的编码方法和电子设备 | |
CN112839244B (zh) | 一种基于码流级别的监控视频分级加解密方法及系统 | |
Yang et al. | Sur-driven video coding rate control for jointly optimizing perceptual quality and buffer control | |
CN113259729B (zh) | 数据切换的方法、服务器、系统及存储介质 | |
CN106921840B (zh) | 一种即时视频中的人脸美化方法、设备及系统 | |
CN109429070A (zh) | 一种移动终端视频编码方法、装置及移动终端 | |
CN114827617B (zh) | 一种基于感知模型的视频编解码方法及系统 | |
CN110570614B (zh) | 一种视频监控系统及智能相机 | |
CN106454355A (zh) | 一种视频编码方法及装置 | |
CN107071449B (zh) | 一种转码系统和方法 | |
CN112183227B (zh) | 一种智能泛人脸区域的编码方法和设备 | |
US20140118460A1 (en) | Video Coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170329 |