CN105491447A - 一种基于流媒体技术的视频技术方法 - Google Patents
一种基于流媒体技术的视频技术方法 Download PDFInfo
- Publication number
- CN105491447A CN105491447A CN201410529399.2A CN201410529399A CN105491447A CN 105491447 A CN105491447 A CN 105491447A CN 201410529399 A CN201410529399 A CN 201410529399A CN 105491447 A CN105491447 A CN 105491447A
- Authority
- CN
- China
- Prior art keywords
- video
- technology
- real
- audio
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Abstract
本技术是一种基于流媒体技术的视频综合性平台,采用浏览器/服务器模式,方便实用的实时感知交流、隐私保护、文件传输、文档共享、白板等多功能的整合实现。语音处理中采用高效的回音消除、自动增益、背景降噪、静音检测技术;视频处理中采用先进的视频优化技术、带宽自适应机制、视频多码率支持、误码掩盖技术、前向纠错编码技术,使视频更流畅,更清晰。支持超大规模用户并发,多服务器交叉级联、动态网络带宽均衡等技术。
Description
技术领域
本技术是一种基于流媒体技术的视频综合性平台,主要用于视频会议、远程协助、远程心理辅导等功能。并基于流媒体协作平台的灵活、方便的工作空间感知处理方法和保护协作者人物特征的方法,及实现具有隐私保护的远程音视频综合协作平台,具有重大的理论意义和实际应用价值。
背景技术
现有的视频会议技术大致可以分为教学型的双向视频会议技术、会议型双向视频会议技术、商务型视频会议技术(即桌面型视频会议技术)、软件视频会议技术、软件专业版高清视频会议多种类型。但其会议技术在通用技术上差别不大,效果主要受网络带宽限制和电脑配置制约。由于其技术方案原因,对于用户的软硬件要求较高,通常需配置相应的视频卡;加上未考虑到用户隐私保护,给用户带来了心理负担,不利于参与者的大胆工作。
本技术将采用基于肤色和脸部特征的视频序列中实时人脸检测与跟踪方法;采用基于PLAR(PseudoLogAreaRatio)系数曲线变换方法和基于线性预测的基音同步叠加(LP-PSOLA)算法分别对语音信号的谱参数和韵律参数进行修改。基于以上技术方案,本技术开发的基于流媒体的视频综合平台将具有特有的技术竞争优势。基于此平台,还可以方便的构建诸如远程心理诊疗技术、咨询技术、企业商务管理技术、教学技术等应用。
发明内容
本技术基于浏览器/服务器模式架构,用户通过访问网页的形式进行视频协作,在语音处理技术中采用高效的回音消除、自动增益、背景降噪、静音检测,带来比电话还清晰、接近CD播放音质的语音通话效果;并采用先进的视频编码技术,以及视频优化技术、先进的带宽自适应机制、视频多码率支持、误码掩盖技术、前向纠错编码技术,使视频更流畅,更清晰。基于矢量成像技术的文档共享使得文档大小缩放不失真;其结构组成:
(1)基于Web的流媒体协作管理子技术包括基于Web的协作会议的组织、协作会议的控制、会议安全管理、访问权限管理等关键技术,同时开发相关模块,从而构成基于Web的流媒体协作管理子技术。
(2)高效的流媒体与共享文档的传输方式实时协作技术中必须保证音视频信息的高效、实时采集、处理和传输,研究开发包括多路视频、多人混音、屏幕广播、实时录制、点播等技术和功能的实现方法。(3)研究灵活的多模式交互方式集音频、视频、文档、文字、邮件、短信等多种模式的协作交互方式,以保证在音视频会议的同时能方便地实现电子白板、资料共享、协同浏览、远程辅导、网页同步、文字讨论、技术消息、程序共享等功能。(4)视频信息隐私保护处理方法视频信息隐私保护处理方法,该方法可根据协作用户的不同要求,在视频图像序列中始终检测跟踪待保护的隐私区域,并对此区域进行模糊化处理以隐藏用户个人生物特征。
(5)音频信息隐私保护处理方法音频信息隐私保护处理方法,该方法在进行语音交流时,可根据协作用户的要求,实时改变说话人语音、语调,从而能隐藏说话人身份。(6)基于流媒体的协作综合平台的集成开发在各个子功能模块设计实现的基础上,利用基于浏览器/服务器模式的方法架构实现整个技术,从而构建基于流媒体的协作综合平台。
技术技术路线描述:(1)语音处理中采用高效的回音消除、自动增益、背景降噪、静音检测技术,提高语音通话质量;视频图像处理中采用视频优化技术、先进的带宽自适应机制、误码掩盖技术、前向纠错编码技术,使视频更流畅,更清晰。(2)以先进且流行的硬件环境作为基础支撑,集.net环境和.net公共模块、基础信息模块、FMS公共模块、音频视频处理和传输模块、PPT转换SWF模块、白板功能、技术通知模块、短信通知模块和ActiveX开发接口为一体的软件集成开发思路,设计实现整个平台软件。(3)各子技术及模块采用面向对象的方式设计开发可重用和易继承的构件,技术采用先进的软件构架支撑技术进行集成开发实现。(4)自主研究开发视频信息隐私保护处理方法采用模糊化和初略化对保护视频信息进行过滤处理,模糊化算法可采用周边象素灰度插值法,而初略化则是在一定密度的网格中,用其内象素灰度的均值代替该网格内的灰度值,从而实现具有马赛克状的图象效果。提供用户选择隐私保护区域,可综合采用基于神经网络的学习法和基于区域特征(如:颜色、形状、渐变等特征),自动跟踪该区域,进行隐私保护。(5)自主研究开发音频信息隐私保护处理方法研制音频信息过滤器,通过对特征信号进行分析,结合声学原理,加入白噪声,再与原声在能量上相当的情况下,生成新的音频信息,使原音频信息失真,实现音频信息隐私保护,同时也针对用户对音频感知的需求情形,进行柔和化处理。
Claims (4)
1.一种基于流媒体技术的视频技术,其权利要求的内容包括:
多路海量数据的实时同步传输:实时协作技术中必须保证音视频信息的高效、实时采集、处理和传输,研究开发包括多路视频、多人混音、屏幕广播、实时录制、点播等技术和功能的实现方法。
2.基于视频空间的隐私保护区域的识别和跟踪算法:该方法可根据协作用户的不同要求,在视频图像序列中始终检测跟踪待保护的隐私区域。
3.根据据权利要求2的特点并对此区域进行模糊化处理以隐藏用户个人生物特征。
4.音频信息隐私保护处理方法:该方法在进行语音交流时,可根据协作用户的要求,实时改变说话人语音、语调,从而能隐藏说话人身份。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410529399.2A CN105491447A (zh) | 2014-10-10 | 2014-10-10 | 一种基于流媒体技术的视频技术方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410529399.2A CN105491447A (zh) | 2014-10-10 | 2014-10-10 | 一种基于流媒体技术的视频技术方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105491447A true CN105491447A (zh) | 2016-04-13 |
Family
ID=55678105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410529399.2A Pending CN105491447A (zh) | 2014-10-10 | 2014-10-10 | 一种基于流媒体技术的视频技术方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105491447A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108052916A (zh) * | 2017-12-23 | 2018-05-18 | 宁波亿拍客网络科技有限公司 | 一种受限的涉及隐私信息及特定信息分析处理系统 |
CN112688965A (zh) * | 2021-03-11 | 2021-04-20 | 浙江华创视讯科技有限公司 | 一种会议音频共享方法、装置、电子设备及存储介质 |
-
2014
- 2014-10-10 CN CN201410529399.2A patent/CN105491447A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108052916A (zh) * | 2017-12-23 | 2018-05-18 | 宁波亿拍客网络科技有限公司 | 一种受限的涉及隐私信息及特定信息分析处理系统 |
CN112688965A (zh) * | 2021-03-11 | 2021-04-20 | 浙江华创视讯科技有限公司 | 一种会议音频共享方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Van Es | Liveness redux: on media and their claim to be live | |
Donley et al. | Easycom: An augmented reality dataset to support algorithms for easy communication in noisy environments | |
EP2893700B1 (en) | Generating and rendering synthesized views with multiple video streams in telepresence video conference sessions | |
AU2011200857B2 (en) | Method and system for adding translation in a videoconference | |
Ziegler et al. | Present? Remote? Remotely present! New technological approaches to remote simultaneous conference interpreting | |
CN108366216A (zh) | 会议视频录制、记录及传播方法、装置及服务器 | |
CN102984496B (zh) | 视频会议中的视音频信息的处理方法、装置及系统 | |
US20140068681A1 (en) | Method and system for synchronized multi-venue experience and production | |
Belmudez | Audiovisual quality assessment and prediction for videotelephony | |
CN103796034A (zh) | 基于流媒体技术的协作平台系统架构下的视频综合系统 | |
CN101729850A (zh) | 基于笔迹特征数据流的视频通信方法及其处理系统 | |
CN109525800A (zh) | 一种远程会议语音识别数据传输方法 | |
CN111010529A (zh) | 可多人实时批注的视频会议方法及系统 | |
Ezell et al. | The need for speed: The importance of next-generation broadband networks | |
CN109788221A (zh) | 一种录播方法及装置 | |
CN105491447A (zh) | 一种基于流媒体技术的视频技术方法 | |
Ikeda et al. | New recording application for software defined media | |
CN108461089A (zh) | 基于流媒体技术的视频综合系统 | |
Nguyen et al. | ITEM: Immersive telepresence for entertainment and meetings—A practical approach | |
CN103164990A (zh) | 一种方舱医院远程示教会诊系统 | |
CN105898235B (zh) | Osce客观结构化临床考试的远程访问系统 | |
CN101945260A (zh) | 基于流媒体技术的视频综合系统 | |
Basso et al. | AI-based media coding standards | |
CN205265824U (zh) | 庭审主机系统 | |
CN102263929A (zh) | 会议视像信息实时发布系统和相应装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160413 |