CN114827518A - 一种投影视频会议系统 - Google Patents
一种投影视频会议系统 Download PDFInfo
- Publication number
- CN114827518A CN114827518A CN202110287542.1A CN202110287542A CN114827518A CN 114827518 A CN114827518 A CN 114827518A CN 202110287542 A CN202110287542 A CN 202110287542A CN 114827518 A CN114827518 A CN 114827518A
- Authority
- CN
- China
- Prior art keywords
- video
- module
- conference
- video conference
- projection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 29
- 238000012790 confirmation Methods 0.000 claims description 25
- 230000011664 signaling Effects 0.000 claims description 25
- 230000009471 action Effects 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 15
- 238000012546 transfer Methods 0.000 claims description 15
- 230000001629 suppression Effects 0.000 claims description 12
- 230000003993 interaction Effects 0.000 claims description 11
- 230000008030 elimination Effects 0.000 claims description 8
- 238000003379 elimination reaction Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 3
- 230000033228 biological regulation Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 230000009467 reduction Effects 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 46
- 238000000034 method Methods 0.000 description 25
- 230000000875 corresponding effect Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 16
- 230000000694 effects Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 5
- 230000004807 localization Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000010191 image analysis Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
- H04L12/1818—Conference organisation arrangements, e.g. handling schedules, setting up parameters needed by nodes to attend a conference, booking network resources, notifying involved parties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/10—Architectures or entities
- H04L65/1059—End-user terminal functionalities specially adapted for real-time communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1073—Registration or de-registration
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1083—In-session procedures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/403—Arrangements for multi-party communication, e.g. for conferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/262—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
- H04N21/26208—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints
- H04N21/26241—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints involving the time of distribution, e.g. the best time of the day for inserting an advertisement or airing a children program
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/262—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
- H04N21/26283—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for associating distribution time parameters to content, e.g. to generate electronic program guide data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请公开了一种投影视频会议系统,包括:视频会议装置与云服务系统,所述云服务系统用于向所述视频会议装置提供服务,其中,所述视频会议装置包括:摄像模组,用于获取会议场景的图像信息并生成会议视频;音频输入模组,用于采集会议场景的语音信号,所述语音信号包含可识别的语音指令;投影模组,用于显示所述会议视频;其中,所述视频会议装置可识别所述语音指令,并根据所述语音指令执行与所述语音指令对应的操作。通过上述方式,本申请能够对视频会议装置进行语音控制,且集成度高,方便携带。
Description
技术领域
本申请涉及视频会议技术领域,具体涉及一种投影视频会议系统。
背景技术
近些年来视频会议发展迅速,远程工作、远程教育以及远程协作已经变成一个趋势,也越来越被人们接受;视频会议系统主要有两个类别,一种是以软件应用为主的云视频会议,此种会议系统主要依赖电脑或手机等带屏终端提供的软件应用,在云端软件服务系统的组织和协调下实施视频会议,适合多个个体加入群组会议,对网络性能依赖比较大,通常需要提前组织会议并发出邀请。另一种是以硬件为主的视频会议系统,通过对摄像头、电视屏、音响、麦克风和会议控制设备(比如电脑)进行组合,跟对方视频会议系统建立即拨即通的视频会议,缺点是设备比较昂贵,安装和使用灵活度差,而且体积较大,不方便携带。
发明内容
本申请提供一种投影视频会议系统,能够对视频会议装置进行语音控制,且集成度高,可即拨即通,方便携带。
为解决上述技术问题,本申请采用的技术方案是:提供一种投影视频会议系统,包括:视频会议装置与云服务系统,所述云服务系统用于向所述视频会议装置提供服务,其中,所述视频会议装置包括:摄像模组,用于获取会议场景的图像信息并生成会议视频;音频输入模组,用于采集会议场景的语音信号,所述语音信号包含可识别的语音指令;投影模组,用于显示所述会议视频;其中,所述视频会议装置可识别所述语音指令,并根据所述语音指令执行与所述语音指令对应的操作。
在一实施方式中,所述投影模组包括投影处理器,所述投影处理器用于对所述语音指令进行识别,得到关键词信息,执行与所述关键词信息相应的操作。
在一实施方式中,所述视频会议装置还包括主处理器,所述主处理器用于对所述语音指令进行识别,得到关键词信息,执行与所述关键词信息相应的操作。
在一实施方式中,所述投影处理器或所述主处理器用于检测所述关键词信息与词库中的关键词是否相同,若相同,则执行与所述关键词信息相应的操作;其中,所述关键词信息包括命令关键词/词组或确认关键词/词组,所述命令关键词/词组包括打开/关闭所述投影模组、打开/关闭所述摄像模组、关机、调高音量或调低音量,所述确认关键词/词组包括是或否。
在一实施方式中,所述语音指令包含唤醒关键词/词组,所述唤醒关键词/词组为自定义的关键词/词组,所述投影处理器或主处理器用于在识别出所述唤醒关键词/词组后,对所述音频输入模组输出的后续语音信号进行截取,直至超出预设时间未检测到语音信号,生成待分析语音指令,将所述待分析语音指令输入至所述云服务系统,以使得所述云服务系统对所述待分析语音指令进行语义分析生成可执行的语音指令,并将所述可执行的语音指令反馈回所述投影处理器或主处理器。
在一实施方式中,所述音频输入模组还用于对采集的所述语音信号进行降噪处理,生成脉冲密度调制数字信号;所述投影处理器或主处理器还包括:数字信号处理模块,用于对所述脉冲密度调制数字信号进行数字滤波、抽取以及调节,以生成脉冲编码调制数据流;回声消除模块,用于对所述脉冲编码调制数据流进行回声消除处理;波束形成模块,用于对所述回声消除模块输出的信号进行过滤;声源定位模块,用于基于所述回声消除模块输出的信号与所述波束形成模块的信号,检测出声源的方向,形成拾音波束区域;噪声抑制模块,用于对所述声源定位模块输出的信号进行噪声抑制处理;混响消除模块,用于对所述噪声抑制模块输出的信号进行混响消除处理;识别模块,用于对所述混响消除模块输出的信号进行关键词/词组识别,生成识别结果,将所述识别结果发送至动作执行模块,或者将所述识别结果发送至云服务系统,以使得所述云服务系统进行识别;动作执行模块,用于执行与所述识别结果相应的动作。
在一实施方式中,所述投影视频会议系统还包括音频输出模组,所述音频输出模组用于播放所述投影处理器或所述主处理器发送的音频信号。
在一实施方式中,所述云服务系统包括管理认证服务模块,所述管理认证服务模块用于向所述电子设备提供注册服务和登录服务,当所述管理认证服务模块接收到所述电子设备发送的注册请求时,发送确认邮件至用户指定的注册邮箱,其中,在所述用户登录所述注册邮箱确认后,所述管理认证服务模块将所述用户标记为可信任用户;在注册成功后,当所述用户进行登录时,所述管理认证服务模块对所述用户进行认证,以确定所述用户是否为所述可信任用户。
在一实施方式中,所述云服务系统还包括接入管理服务模块,所述接入管理服务模块用于对所述视频会议装置发送的连接请求进行认证,建立所述云服务系统和所述视频会议装置之间的安全信令通道,对所述安全信令通道进行监听和管理。
在一实施方式中,所述电子设备将控制命令发送给所述云服务系统的接入管理服务模块,通过所述安全信令通道将所述控制命令传递给所述视频会议装置。
在一实施方式中,所述视频会议装置还包括无线通信模组,无线通信模组通过网关设备接入互联网。
在一实施方式中,所述无线通信模组具有第一无线接口与第二无线接口,所述视频会议装置通过所述第一无线接口与所述互联网连接通信,且通过所述第二无线接口与所述电子设备进行通信,以实现与所述电子设备的连接交互。
在一实施方式中,所述无线通信模组可工作在双频混合模式,所述第一无线接口为2.4GHz无线接口,所述2.4GHz无线接口工作在客户端模式,通过所述网关设备与所述互联网通信;所述第二无线接口为5GHz无线接口,所述5GHz无线接口工作在接入点模式或无线路由模式。
在一实施方式中,所述电子设备和所述视频会议装置加入同一个WIFI无线网络,所述无线通信模组与所述电子设备工作在客户端模式。
在一实施方式中,所述电子设备工作在客户端模式,所述无线通信模组工作在所述客户端模式和接入点模式。
在一实施方式中,所述电子设备工作在客户端模式,所述无线通信模组工作在所述客户端模式,且所述电子设备与所述视频会议装置之间建立蓝牙通道。
在一实施方式中,所述视频会议装置还包括可充电电池,用于为所述摄像模组、所述投影模组以及所述音频输入模组供电;所述视频会议装置在检测到所述充电电池的电池电量低于设定百分比时,在所述投影模组所显示的视频画面上显示当前电池电量,以进行电量提醒;或者通过所述云服务系统向所述电子设备推送通知消息,所述通知消息包括当前电池电量;或者所述视频会议装置还包括至少一个LED,通过所述至少一个LED进行电量提醒。
在一实施方式中,所述云服务系统还包括视频会议连接服务模块,视频会议连接服务模块用于接收所述视频会议装置发送的会议连接请求,在确认对方会议设备接受会议邀请后,将所述对方会议设备的安全信令通道标识符返回给所述视频会议装置并将所述视频会议装置的安全信令通道标识符返回给所述对方会议设备,所述视频会议装置和所述对方会议设备在后续协商视频会议参数时均需提供对方的安全信令通道标识符;在接收到所述视频会议装置与所述对方会议设备发送的寻址请求后,将所述视频会议装置的可外部访问的地址端口信息发送给所述视频会议装置,将所述对方会议设备的可外部访问的地址端口信息发送至所述对方会议设备,同时协助所述视频会议装置和所述对方会议设备协商视频会议参数,以使得所述对方会议设备与所述视频会议装置根据所述视频会议参数获得对方可外部访问的地址端口信息,建立音视频网络连接路径;其中,所述会议连接请求至少包括所述对方会议设备的注册账户名和标识码,所述地址端口信息包括可外部访问的网络地址信息与端口信息,所述视频会议参数包括摄像头参数、投影参数或地址端口信息。
在一实施方式中,所述云服务系统还包括视频流中转服务模块,所述视频流中转服务模块用于在未发现满足预设条件的音视频网络连接路径时,提供视频流中转服务地址给所述视频会议装置,在所述视频会议装置确认将所述视频流中转服务地址作为目标地址后,将所述视频会议装置发送的会议音视频流转发至所述对方会议设备进行播放。
在一实施方式中,所述云服务系统还包括视频存储服务模块,所述视频会议装置在接收到视频会议存储命令后将当前会议的音频流与视频流上传至所述视频会议存储服务模块,所述视频会议存储服务模块用于对所述音频流和所述视频流进行编码合并处理,转换成可播放的视频文件进行存储。
在一实施方式中,所述云服务系统还包括订阅收费服务模块,所述订阅收费服务模块用于接收电子设备发送的订阅信息与收费信息,对用户的订阅进行管理,与第三方支付平台连接以执行收费并生成相应的电子收据和税务记录,发送给所述电子设备。
在一实施方式中,所述云服务系统还包括事件推送服务模块,所述事件推送服务模块用于接收所述视频会议装置或所述云服务系统中其它服务模块发送的事件,将所述事件转换成事件信息推送给电子设备,以使得所述电子设备在消息提示中心显示所述事件信息。
在一实施方式中,所述云服务系统还包括第三方接口服务模块,所述第三方接口服务模块用于接收所述视频会议装置发送的第三方会议系统信息,与第三方会议系统建立视频连接,将第三方会议系统生成的会议音视频流中转给所述视频会议装置进行投影和播放,并将所述视频会议装置产生的会议音视频流中转给所述第三方会议系统,其中,所述第三方会议系统信息包括会议提供方网络地址、会议拨入号码或会议密码。
在一实施方式中,所述摄像模组包括壳体、摄像头、电机以及升降平台,所述电机与所述升降平台设置于所述壳体内,且所述升降平台设置于所述电机的上方,用于承载所述摄像头,所述摄像头设置于所述升降平台的上方,所述电机用于在接收到信号指令后驱动所述升降平台上下移动,以带动所述摄像头上下移动,进而将所述摄像头隐藏于所述壳体内或从所述壳体伸出。
通过上述方案,本申请的有益效果是:本申请中的投影视频会议系统包括视频会议装置与云服务器系统,该视频会议装置集成了摄像模组、投影模组以及音频输入模组,集成度较高,摄像模组可摄入会议场景,提供高清全景的效果;利用投影模组来对摄像模组拍摄到的高清视频或会议对方发送的视频进行投影,由于采用投影模组来显示会议场景,可直接将视频投影在墙上,无需显示屏即可进行显示,体积较小,方便用户携带;此外,还将语音控制引进了视频会议装置,提供语音识别和语音控制功能,通过语音识别和控制来实现对视频会议装置的控制,比如,可通过语音控制连接会议、调节音量、开启/关闭摄像头或投影模组等,实现智能控制,无需用户用手来控制设备,简化用户的操作。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
图1是本申请提供的视频会议装置一实施例的结构示意图;
图2是本申请提供的音频输入模组、音频输出模组以及云端服务系统的连接示意图;
图3是图1所示的实施例中视频会议装置与电子设备的连接示意图;
图4是图1所示的实施例中视频会议装置与电子设备的连接示意图;
图5是图1所示的实施例中视频会议装置与电子设备的连接示意图;
图6是图1所示的实施例中视频会议装置与电子设备的连接示意图;
图7是图1所示的实施例中视频会议装置与电子设备的连接示意图;
图8是本申请提供的投影视频会议系统一实施例的结构示意图;
图9是图8所示的实施例中云服务系统的结构示意图;
图10是图8所示的实施例中注册与登录的交互示意图;
图11是图8所示的实施例中设备接入和管理的交互示意图;
图12是图8所示的实施例中视频会议连接的交互示意图;
图13是本申请提供的手机终端的示意图;
图14是本申请提供的手机终端、视频会议装置以及云服务系统的交互示意图;
图15是本申请提供的一种视频会议方法的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性的劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前视频会议系统通常有两种,一种是大屏会议系统,由电视屏、摄像头、麦克风、音箱、遥控器和电脑等各自独立的设备组合而成,摄像头通常安装在电视屏顶部,用来极大化摄入会议场景,其缺点是人员较多时会出现重叠现象,通过视频传给远端后会出现部分人员比较清晰,越往后要么被重叠挡住视野,要么因为距离摄像头太远看不清楚;麦克风和音箱通常远离电视屏,布置在会议桌面上,方便采集会议人员的语音信息以及播出会议对方发送过来的语音信息;由于音频设备和视频设备互相独立,在网络情况不佳时会存在同步失真,会议质量会变得较差;电脑用来启动和管理视频会议或分享屏幕等。这种视频会议系统需要事先安装,会议房间比较固定,各种走线需要通过地板连到桌面,比如:电视电源线、摄像头电源线、高清多媒体接口(High Definition Multimedia Interface,HDMI)数据线、麦克风连接线或通用串行总线(Universal Serial Bus,USB)等,既不美观使用起来多设备协同工作也不方便。另一种视频会议系统是小屏会议系统,其是面向个人和个人之间的视频会议,在数字电话设备的基础上内置显示屏和摄像头,电话接通后可以互相显示视频,但不适合于屏幕分享的会议场景,受限于屏幕尺寸和摄像头视角,也不适合群组和群组之间的会议;此外,该视频会议系统需要以太网接口和数字电话网关支持,位置比较固定,不适合商务差旅和家庭使用。
本申请旨在解决现有视频会议系统所存在的问题,给用户带来新的视频会议体验,可便携,无须走线,随时需要随时使用,集高清全景音视频于一体,并采用高清高亮的投影模组来取代传统的电视屏幕或显示器,投影尺寸根据投影距离来调整,既适合群组会议,也适合家庭和个人使用,且成本较低。而且可通过手机或电脑来进行配置和管理,在云服务系统的各功能模块的协助下,可以与对方会议设备建立点到点的最优视频连接,以达到最佳视频会议效果。
请参阅图1至图7,图1是本申请提供的视频会议装置一实施例的结构示意图,视频会议装置10包括:摄像模组11、音频输入模组12、投影模组13以及音频输出模组14。
摄像模组11用于获取会议场景的全景视频,摄像模组11包括摄像头,摄像头可以为广角镜头,其可为360度全景摄像头或覆盖局部场景的摄像头,可采用两个或三个广角镜头,每个广角镜头支持1080P或者4K等更高的分辨率,对所有广角镜头采集到的视频利用软件进行拼接,可以生成360度场景的高清视频,高清全景视频保持在1080P。在会议过程中可以通过对全景视频进行人工智能(Artificial Intelligence,AI)图像分析来实时跟踪所有参与会议的人员,并对发言者进行定位和标识;摄像模组11可将采集到的图像信息传输至投影模组13。
进一步地,摄像模组11还包括壳体、摄像头、电机以及升降平台,电机与升降平台设置于壳体内,且升降平台设置于电机的上方,用于承载摄像头,摄像头设置于升降平台的上方;电机用于在接收到信号指令后驱动升降平台上下移动,以带动摄像头上下移动,实现将摄像头伸出或隐藏于壳体内。
音频输入模组12用于采集语音信号,音频输入模组12可以为麦克风,可支持水平方向360度环绕的麦克风阵列,可采用6个水平平面均匀环绕的具有脉冲密度调制(PulseDensity Modulation,PDM)功能的数字微机电系统(MEMS,Micro Electro MechanicalSystem)麦克风阵列来进行远近场交互,或者采用6+1麦克风阵列,一个麦克风位于中间,来捕获远场音频;具体地,数字麦克风阵列可通过波束形成技术,抑制非目标方向的拾音,实现抑制噪音的目的,也可以增强声源角度内的人声,将处理后的语音信号传输至投影模组数字信号处理模块1311。
可利用数字信号处理模块1311对数字麦克风阵列输出的PDM数字信号进行数字滤波、抽取以及调节,以将1位PDM高频数字信号转换为具有合适音频频率的16位脉冲编码调制(Pulse Code Modulation,PCM)数据流;回声消除模块1312与数字信号处理模块1311连接,可对PCM数据流进行回声消除处理;波束形成模块1314与回声消除模块1312连接,可对回声消除模块1312输出的信号进行过滤;声源定位模块1313与回声消除模块1312以及波束形成模块1314连接,其基于回声消除模块1312输出的信号与波束形成模块1314的信号,检测出声源的方向,形成拾音波束区域;具体地,其可采用基于到达时间差(Time DifferenceOf Arrival,TDOA)的方法,通过计算信号到达各个麦克风之间的时间差,计算出声源的位置目标,检测出声源的方向,形成拾音波束区域;噪声抑制模块1315与声源定位模块1313连接,可对声源定位模块1313输出的信号进行噪声抑制处理;混响消除模块1316与噪声抑制模块1315连接,可对噪声抑制模块1315输出的信号进行混响消除处理。识别模块1317与混响消除模块1316连接,可对经过前端处理后的语音信号进行关键词/词组识别,并可将识别结果发送至动作执行模块1318,以使得动作执行模块1318执行与识别结果相应的动作,或者将识别结果发送至云服务系统20,由云服务系统20来进一步识别,需要说明的是,识别模块1317如何对混响消除模块1316输出的信号进行识别,以及对识别后需要通过云服务系统再次进行分析的过程下文会重点说明。
可以理解地,数字信号处理模块1311、回声消除模块1312、声源定位模块1313、波束形成模块1314、噪声抑制模块1315、混响消除模块1316、识别模块1317、动作执行模块1318以及音频解码模块1319可以为投影模组13中的模块,即由投影模组13来执行对音频输入模组12输出的语音信号进行后续处理的操作;或者视频会议装置10包括一主处理器,该主处理器包括数字信号处理模块1311、回声消除模块1312、声源定位模块1313、波束形成模块1314、噪声抑制模块1315、混响消除模块1316、识别模块1317、动作执行模块1318以及音频解码模块1319,即由该主处理器来执行对音频输入模组12输出的语音信号进行后续处理的操作。
投影模组13用于显示会议视频信息,具体来说,可以显示电脑或外接终端设备输入信号的视频,也可以显示摄像模组拍摄到的全景视频或对方会议设备发送的对方会议场景视频,可通过在电脑及外接电子终端的会议系统上进行选择所要显示的会议画面信息;具体地,投影模组13包括投影处理器131,由投影处理器131来执行对音频输入模组12输出的语音信号进行后续处理,以及接收其他装置发送的视频,并进行投影显示;投影处理器131还可支持通过图像分析和处理算法对参与会议的人员进行局部标识和勾画,然后将标识和勾画后的图像平列/竖列投影在投影区的上侧、下侧、左侧或右侧;还可支持通过图像分析和处理算法辅助麦克风阵列对视频会议发言者进行定位、聚焦或者放大。
优选地,由于激光具有高亮度、色域广、色彩真实、方向性强以及使用寿命长等优点,投影模组13采用基于激光光源的投影技术,输出亮度可以达到500流明以上,视频会议装置10输出视频达到1080P以上的分辨率,可用来投射会议对方的视频或实现电脑/手机等电子终端设备的屏幕共享。可以理解的是,投影模组13并不局限于采用基于激光光源的投影技术,也可以采用LED光源的投影技术。
音频输出模组14用于播放投影处理器131或主处理器发送的音频信号其可以为扬声器或音响,可采用360度环绕音响或采用局部方向的音响。
继续参阅图1,视频会议装置10还包括无线通信模组15,其可通过WIFI接入互联网50,在云服务系统20协助下接入视频会议,云服务系统也可以接入互联网50,需要说明的是,云服务系统是一种基于云计算,通过互联网提供的在线服务,通常通过互联网来提供动态和易扩展的个性服务;具体地,无线通信模组15可以为WIFI无线通信模块,如图3所示,无线通信模组15与投影处理器131连接,无线通信模组15具有第一无线接口151与第二无线接口152,视频会议装置10通过第一无线接口151与互联网50连接通信;视频会议装置10通过第二无线接口152与电子设备30进行通信,以实现与电子设备30之间的连接交互。
进一步地,视频会议装置10中的无线通信模组15工作在双频混合模式,第一无线接口151可以为2.4GHz无线接口,第二无线接口152可以为5GHz无线接口,电子设备30可以为手机或电脑,电子设备30上运行有软件应用,用户通过操作该软件应用可与视频会议装置10进行交互;在这种模式下,视频会议装置10通过2.4GHz通信协议加入无线网络,工作在客户端(Station,STA)模式,通过网关设备40与互联网50连接和通信;而5GHz无线接口工作在接入点(Access Point,AP)模式或无线路由模式,电子设备30加入AP网络或无线路由网络,跟视频会议装置10直接通信,可用于将电子设备30的屏幕信息通过投影显示,可以看作电子设备30与视频会议装置10之间建立了屏幕分享数据通道,视频会议装置10和互联网50之间建立了视频会议数据通道;可以理解地,还可以配置5GHz无线接口工作在STA模式,而2.4GHz无线接口工作在AP模式。无论是屏幕分享投影还是视频会议,可以同时进行并保持各自数据速率极大化,而且不同频段互不干扰;由于电子设备30的屏幕分享绕过了网关设备40,而分享屏幕时电子设备30与视频会议装置10之间的距离非常近,无论是投影时延上还是通信速率都极具优势。
在另一具体的实施方式中,如图4所示,电子设备30可与视频会议装置10进行网络通信,网络连接方式可以是电子设备30和视频会议装置10加入同一个WIFI网络,通过网关设备40进行通信。视频会议装置10与电子设备30工作时都配置在STA模式,通过网关设备40来加入WIFI无线网络,电子设备30通过网关设备40来发现视频会议装置10、管理视频会议装置10以及与视频会议装置10通信,视频会议装置10无论是从云端获取数据还是进行视频分享均需通过网关设备40,占用同一频段和接口资源。
在又一具体的实施方式中,如图5所示,电子设备30可直接加入视频会议装置10的无线网络以进行通信,视频会议装置10中的无线通信模组15可以同时工作在STA模式和AP模式,属于单频分时通信,相比双频混合模式,数据速率将减半。
在另一具体的实施方式中,如图6所示,电子设备30也可以通过无线蓝牙与视频会议装置10进行通信,即电子设备30与视频会议装置10之间建立蓝牙通道,电子设备30与视频会议装置10中的无线通信模组15均工作在STA模式,可通过WIFI处理高速数据,比如播放视频流。
在其他具体的实施方式中,如图7所示,电子设备30通过云服务系统20与视频会议装置10远程通信;在远程通信时,电子设备30与视频会议装置10不需要在同一个网络,电子设备30将控制命令发送给云服务系统20的接入管理服务模块,通过视频会议装置10和云服务系统20建立的安全信令通道将命令传递给视频会议装置10,从而达到与视频会议装置10通信的目的,需要说明的是,此种模式还可以实现不同视频会议装置之间的通信交互。
继续参阅图1,视频会议装置10内置有可拆卸的可充电电池16与充电电路17,可充电电池16与摄像模组11、投影模组13、音频输入模组12以及音频输出模组14连接,其用于为摄像模组11、投影模组13、音频输入模组12和音频输出模组14供电;充电电路17与可充电电池16连接,其用于向可充电电池16充电。
采用可充电电池16供电,方便携带,随时需要随时使用,每次充电可以支持四个小时的视频会议和更长时间的音频会议,电量不足时可通过USB端口充电,也可通过直流适配器接口充电。
进一步地,可充电电池16可以为3.7V锂电子电池,采用15V/3A的直流充电方式,在使用过程中可实时检测电池电量,用户可通过软件应用配置一种或多种电池电量不足时的提醒方式,比如:在投影过程中开辟小窗口进行提醒,可以在电池电量低于某一个设定百分比(比如30%)时将电量信息显示在视频画面中,可设置成需要参与会议的人员通过遥控或终端设备点击确认,否则该电量信息将一直出显示在视频画面上;在参与会议的人员确认了后,如果过了设定时间或者电池电量低于下一个百分比(比如20%)时,再次进行提醒,同样需要参与会议的人员进行点击确认;如果电池电量持续减少至某一较低的百分比(比如5%)时,视频画面可显示报警语句:“系统电量仅可维持几分钟,如不充电,将自动关机”等;或者还可以通过LED的状态进行提醒或通过语音提醒,或者还可以发送软件应用短信提醒,即如果电池电量低于某个阈值,视频会议装置10可通过云服务系统20的事件推送服务模块28推送通知消息到手机或电脑软件应用,该通知消息包括当前电池电量。此外,还可在投影和视频会议过程中,通过当前的电池电量和功耗预估可以持续投影或继续会议的时长,在投影屏幕或墙面的适当位置进行显示。
视频会议装置10还包括多功能LED与导光柱,多功能LED可以用来表征当前音量、无线连接状态、云服务关联状态、电池电量、会议连接状态、静音或视频关闭状态等;导光柱用来协助LED,以使得LED显示的位置比较集中,带来更好的用户体验;比如,绿色LED慢闪表示当前正处于无线连接过程中,绿色LED常亮表示无线连接成功并成功获取网际互连协议(Internet Protocol,IP)地址。
视频会议装置10还可设置有多个物理按键,包括但不仅限于支持音量控制、隐私保护、系统启动或唤醒、恢复出厂配置、视频会议接入允许或挂断等按键。
视频会议装置10还可包括安全数码卡(Secure Digital Memory Card,SD卡)18,对于投影模组13来说,其可以下载视频并存储到SD卡18中,以便在聚会或娱乐等不在线时播放;此外,还可以将会议视频存储在SD卡18上以便随时投影重播。
基于上面描述的视频会议装置10中的各个模块,下面对视频会议装置10的工作原理进行描述。
首先,用户可通过数字麦克风阵列输入语音,数字麦克风阵列可采集用户输入的语音信息,将其调制成PDM编码的数字信号输出,然后将该数字信号输入至投影处理器131的音频输入接口或主处理器。
投影处理器131或主处理器可以对音频输入模组12输出的语音信号进行识别,得到关键词信息,执行与关键词信息相应的操作,或将关键词信息发送至摄像模组11,以使得摄像模组11执行与关键词信息相应的操作,该关键词信息包括命令关键词/词组、确认关键词/词组或唤醒关键词/词组,确认关键词/词组包括“是”或“否”。
在一具体的实施例中,可基于本地内置词库进行语音控制,即预先在本地存储一些命令关键词/词组,形成一个词库,该命令关键词/词组包括“打开投影模组”、“关闭投影模组”、“打开/关闭摄像模组”、“请关机”、“调高音量”或“调低音量”等;在实际使用时,检测识别出的用户输入的语音与该词库中的关键词是否相同,如果相同,则执行相应的操作;例如,如果主处理器可识别出用户下发的语音指令是“打开投影模组”,则控制投影模组13打开。
进一步地,投影处理器131或主处理器采用的语音识别模型经过范本训练和参数调优后能够对这些关键词/词组进行有效识别,如果识别出命令关键词/词组,直接执行相应动作,比如识别出“请关机”,投影处理器131或主处理器执行关机动作。对于一些重要动作,在执行之前可以要求用户确认“是”或者“否”,如果在指定时长间隔内没有识别出任何确认关键词/词组,默认取消上述命令。
在另一具体的实施例中,可在进行语音控制之前唤醒语音控制功能,即设置唤醒关键词/词组,该唤醒关键词/词组用于使得视频会议装置10进入工作状态,唤醒关键词/词组为自定义的关键词/词语,比如:“Alexa”、“Hey Google”或“小爱同学”等;在唤醒语音控制功能之后再进行语音控制,此种情况下,投影处理器131或主处理器在识别出唤醒关键词/词组后,可对音频输入模组12输出的后续语音信号进行截取,直至在唤醒词声源方向超出预设时间(比如三秒)未检测到有效的语音信号,生成待分析语音信号,将待分析语音信号输入至云服务系统20,此时进入云端语义分析阶段;云服务系统20对待分析语音信号进行语义分析生成分析结果,对分析结果进行转换并将转换的结果反馈至视频会议装置10。
需要说明的是,由于本申请的视频会议装置10有声源定位功能,因此当唤醒语音控制功能的是人员A,此时视频会议装置10已定位到此人员A的声音拾取,此时,视频会议装置10会截取人员A在唤醒语音控制功能后的语音信号,并生成待分析信号,将待分析信号输入至云服务系统20,实现正常的语音控制;但实际会存在一种情况,当人员A唤醒语音控制功能后,而人员B发出控制信号,例如“打开摄像头”,此时视频会议装置10还是会对控制信号进行截取并生成视待分析信号,将待分析信号输入至云服务系统20,云服务系统20在分析后发现与控制信号的发起者B与唤醒语音控制功能的人员A不是同一人,会将此情况反馈回视频会议装置10,并请求确认是否继续执行与唤醒语音控制功能的人员A不同的人员B的控制指令,如继续执行则按照与上述正常情况来处理,如不执行,则清除当前语音控制指令,重新开始。
当然可以理解的,当在唤醒语音功能后,截取的语音控制信号包含多个指令时,此时可以设置指令的优先级,优先处理与投影模组相关的指令,其次处理摄像模组相关的指令,最后是语音输出相关的指令。
通过事先定义的语义规则,云服务系统20返回视频会议装置10可以理解的动作,或者返回一段语音给扬声器播放,例如:音频输入“ABC,请加入Zoom会议225533,密码是1234”、“ABC,请加入Zoom会议,密码是1234,会议号码是225533”或其它类似涵义的短语,这样的短语视频会议装置10很难识别。而云端具有强大的运算能力,可扩展性较强,具有自动语音识别(Automatic Speech Recognition,ASR)、自然语言处理(Natural LanguageProcessing,NLP)和语义分析模型,并且可以实时更新和优化各种参数,实时处理语音分析和响应,并将结果转换成可执行命令返回给视频会议装置10。比如,上述的语音经过云端分析后返回给视频会议装置10的信息是:会议类型是“Zoom”、会议号码是“225533”以及会议密码是“1234”,视频会议装置10根据这些参数执行相应的动作。云端也可以合成语音发送给视频会议装置10,比如告知无法理解用户的语音需求或对某些语音需求做语音回答,这些可通过音频解码模块1319解码后发送至扬声器,同时可对输出音频作回声消除处理。
进一步地,云服务系统20可将分析结果转换成可执行命令并反馈至投影处理器131,以使得投影处理器131执行与可执行命令匹配的动作;或者云服务系统20将分析结果转换成语音,将语音发送至扬声器播放。
本实施例提供了一种便携式电池供电的基于高清投影模组和高清360度全景摄像模组的视频会议装置,将声控人机交互引进视频会议装置,视频会议装置包括360度全景高清摄像模组、高清投影模组、360度音频输入模组、360度音频输出模组、可充电电池、WIFI无线通信模组、多功能LED、导光柱、SD卡以及不同用途的物理按键。采用两个或三个广角镜头来摄入会议场景,通过软件图像拼接达到1080P以上的高清全景效果。投影模组采用高清高亮的激光投影技术,亮度是目前会议投影类产品的一到五倍,而且可以根据距离自动调节投影尺寸,足以支持中型会议,并可作为多媒体家庭无屏电视使用;使用激光投影技术取代传统电视机屏幕极大地提高了性价比和用户体验,既适合商务场景,也适合家庭和个人使用。在不需要视频时可以控制摄像模组下降以隐藏到壳体内或者自动闭合镜头盖来保护用户隐私。音频输出模组采用360度的水平环绕音响效果设计,极大提高了会议效果;音频输入模组采用水平方向均匀环绕分布的麦克风阵列和音频算法来支持360度远程语音与近程语音接收,并在此基础上提供语音识别和语音控制功能,通过语音识别和控制来实现对视频会议装置的控制,可通过语音控制连接会议、调节音量、开启/关闭摄像模组或投影模组等。此外,支持可充电电池供电,便于携带,并支持多功能LED,可通过编程来实现不同状态的指示。
请参阅图8至图12,图8是本申请提供的投影视频会议系统一实施例的结构示意图,投影视频会议系统包括互相连接的视频会议装置10、云服务系统20以及电子设备30,视频会议装置10为上述实施例中的视频会议装置。
云服务系统20为运行在云端的软件服务系统,其用于向视频会议装置10提供服务,云服务系统20支持视频连接和管理,其可由多个业务模块组成,如图9所示,云服务系统20提供的业务包括设备接入和管理服务、视频会议连接服务、视频流中转服务、视频会议存储服务、用户管理和认证服务、第三方集成和接口服务、市场推广和广告服务、订阅和收费服务以及事件推送服务。
电子设备30上设置有软件应用,该软件应用可用来配置和管理设备,该软件应用所提供的功能包括但不仅限于用户注册和登录管理、设备配置和管理、视频会议管理、屏幕分享、订阅和收费或市场推广。
在一具体的实施例中,如图10所示,该软件应用可用于提供用户注册和用户登录,在用户第一次使用软件应用时,需通过软件应用注册,以便能够配置和管理视频会议装置10以及使用视频会议功能;当用户打开软件应用后需要登录账户,如果还没有账户,用户需要注册账户,即向软件应用输入注册信息,注册账户时用户可提供注册邮箱地址或手机号码,软件应用将用户提供的注册信息发送给云服务系统20的管理认证服务模块21,管理认证服务模块21发送确认邮件至用户提供的注册邮箱地址或发送确认信息至用户提供的手机号码,以请求用户确认,在用户确认后电子设备30返回确认信息至管理认证服务模块21,管理认证服务模块21创建用户信息,以便后续用户登录认证。
在用户预登录软件应用时,可输入登录信息,该登录信息至少包括用以创建账户的注册邮箱地址和登录密码,或创建账户的手机号码和登录密码,软件应用将该登录信息通过互联网50发送给管理认证服务模块21,管理认证服务模块21对登录信息进行认证,认证完毕后通过互联网50返回认证结果给软件应用,该认证结果包括认证成功信息或认证失败信息。
在注册成功后用户可以登录软件应用来配置视频会议装置10,查看视频会议装置10的情况,比如:软硬件版本、系统配置、电池电量,更新视频会议装置10的固件,启动视频会议,启动屏幕分享,浏览会议记录或重播存储的会议视频等。
在另一具体的实施例中,该软件应用在用户登录后用来配置视频会议装置10,配置内容包括但不仅限于视频会议装置10的名字、视频会议装置10的无线网络参数、用来与云服务系统20通信的用户账户和密匙、音视频参数、投影模组参数、所在的时区和时间、事件提醒(比如电池电量预警或会议结束的提示)或视频存储在本地还是云端等,该无线网络参数包括视频会议装置10自身加入WIFI网络的参数和双频模式下视频会议装置10建立自身WIFI网络的参数。在进行配置后配置内容可出现在用户设备清单中,用户可以通过软件应用对视频会议装置10进行重新配置。
在另一具体的实施例中,该软件应用在用户登录后可用来管理视频会议装置10,包括但不仅限于从该用户设备清单中删除视频会议装置10、恢复视频会议装置10的出厂设置、更新视频会议装置10的固件、打开或关闭摄像模组、打开或关闭投影模组或实时播放来自视频会议装置10的视频/音频等。
在另一具体的实施例中,该软件应用在用户登录后用来管理视频会议,包括启动视频会议、终止视频会议、启动或终止视频会议存储、选择和加入第三方会议系统、浏览会议记录、回放存储的视频会议、创建视频会议黑名单或创建视频会议通信录等。
在另一具体的实施例中,软件应用还提供屏幕分享功能,该软件应用在用户登录后用来控制屏幕共享,当启动屏幕共享后,电子设备30的屏幕共享到视频会议装置10,视频会议装置10可以将共享屏幕投影,也可以将共享屏幕发送给对方会议设备60进行显示;使用该屏幕分享功能可以将电子设备30的屏幕分享到投影模组,方便商务展示、家庭或朋友共享。
可以理解地,软件应用还可通过别的方式来进行交互,比如:语音识别控制,但语音识别需要在视频会议装置启动的情况下;或者可在视频会议系统上设置物理按键,以通过物理按键来实现各种功能;或者采用投影分支来实现虚拟键盘等。
在一具体的实施例中,云服务系统20包括管理认证服务模块21,管理认证服务模块21用以提供用户管理和认证服务,可接收和处理来自软件应用的注册信息或登录信息;具体地,管理认证服务模块21向电子设备30提供注册服务和登录服务,当用户注册时,管理认证服务模块21接收到电子设备30发送的注册请求,然后发送确认邮件至用户指定的注册邮箱或发送确认信息至用户指定的注册手机号;在用户登录注册邮箱或点击手机信息确认后,管理认证服务模块21将该用户标记为可信任用户;在注册成功后,当用户每次进行登录时,管理认证服务模块21对用户进行认证,以确定用户是否为可信任用户,认证的信息包括但不仅限于密码,还可包括其它认证信息,比如:发送到注册手机号码或注册邮箱的短信码。
在另一具体的实施例中,如图11所示,云服务系统20还包括接入管理服务模块22,接入管理服务模块22主要服务于视频会议装置10的接入和管理,包括但不仅限于云服务系统20和视频会议装置10建立安全信令通道、验证视频会议装置10的真实性和合法性、对视频会议装置10派送来自软件应用的命令或协助视频会议装置10进行固件升级等。
进一步地,接入管理服务模块22可对视频会议装置10发送的连接请求进行认证,建立云服务系统20和视频会议装置10之间的安全信令通道,对安全信令通道进行监听和管理。
视频会议装置10经过电子设备30中的软件应用配置后加入WIFI无线网络,从而接入互联网50,通过互联网50向接入管理服务模块22发送连接请求,该连接请求包括但不仅限于用户账户、视频会议装置10的唯一标识码、媒体存取控制(Media Access ControlAddress,MAC)地址、视频会议装置10的电子证书等;接入管理服务模块22对该连接请求进行用户认证和设备认证,确保账户和设备的真实性,在此基础上视频会议装置10和云服务系统20经过通信协议建立加密数据安全信令通道,可以是基于标准的安全通信协议,比如:安全传输层协议(Transport Layer Security,TLS)/安全套接字协议(Secure SocketsLayer,SSL),也可以是用户自定义的安全通信协议。接入管理服务模块22可对该安全信令通道进行监听和管理,比如:接收来自视频会议装置10的定时验证信息、接收来自视频会议装置10的事件信息、判断视频会议装置10的在线状态、向视频会议装置10发送云端命令、中转来自软件应用对视频会议装置10的指令以及视频会议装置10对该指令的回复等。
在另一具体的实施例中,如图12所示,云服务系统20还包括视频会议连接服务模块23,其提供视频会议连接服务,主要协助视频会议装置10找到最佳音视频网络连接路径,协助视频会议装置10与对方会议设备60建立点对点的实时双向音频流和视频流数据通道。
用户通过软件应用的视频会议管理功能或者通过语音控制指定的视频会议装置10启动视频会议,即电子设备30发送一视频会议启动指令至视频会议装置10,该视频会议启动指令至少包括对方会议设备60的注册账户名和视频会议装置10的唯一标识码。
视频会议装置10接收到视频会议启动指令后向视频会议连接服务模块23提出会议连接请求,该会议连接请求至少包括对方会议设备60的注册账户名和视频会议装置10的唯一标识码。
视频会议连接服务模块23可接收视频会议装置10发送的会议连接请求,在确认对方会议设备60接受会议邀请后,将对方会议设备60的安全信令通道标识符返回给视频会议装置10;具体地,视频会议连接服务模块23可根据视频会议装置10提供的会议连接请求获取对方会议设备60的安全信令通道,通过该安全信令通道向对方会议设备60发送会议连接请求,该会议连接请求至少包括对方会议设备60的注册账户名和标识码;在获知对方会议设备60同意会议接入后,视频会议连接服务模块23将对方会议设备60的安全信令通道标识符返回给视频会议装置10,并将视频会议装置10的安全信令通道标识符发送给对方会议设备60,视频会议装置10和对方会议设备60在后续协商视频会议参数时均需提供各自和对方的安全信令标识符,以便视频会议连接服务模块23提供数据中转。
双方设备(包括视频会议装置10与对方会议设备60)可向视频会议连接服务模块23提出寻址请求,视频会议连接服务模块23提供寻址服务,可以是基于标准的网络地址转换会话穿越协议(Session Traversal Utilities for Network Address Translation,STUN),也可以是私有协议;具体地,视频会议连接服务模块23在接收到视频会议装置10与对方会议设备60发送的寻址请求后,将视频会议装置10的可外部访问的地址端口信息发送给视频会议装置10,将对方会议设备60的可外部访问的地址端口信息发送至对方会议设备60,即视频会议装置10与对方会议设备60通过视频会议连接服务模块23可以获取各自可以被外部访问的公有IP地址和端口信息,可以是一组或多组;在此基础上协助视频会议装置10和对方会议设备60协商视频会议参数,以使得对方会议设备60与视频会议装置10根据视频会议参数获得对方可外部访问的地址端口信息,建立音视频网络连接路径;地址端口信息包括可外部访问的IP地址信息与端口信息,视频会议参数包括但不仅限于各自的摄像头参数、投影参数、可外部访问的IP地址信息和端口信息等。双方设备根据互相提供的IP地址和端口信息建立点对点的音视频网络连接路径,同时根据双方协商后均能接受的最佳音视频参数进行视频通信,以达到最佳视频会议播放效果。
在另一具体的实施例中,不是所有会议都能建立点对点的音视频网络连接路径,有些设备受限于防火墙规则无法提供可以被外部访问的公有IP地址或端口,在这种情况下,利用视频流中转服务模块24进行中转,即在没有合适路径的情况下,视频流中转服务模块24可提供视频中转服务,确保视频会议能够连接成功。
进一步地,视频流中转服务模块24用于在未发现满足预设条件的音视频网络连接路径时,提供视频流中转服务地址给视频会议装置10,并提供视频流中转服务地址给对方会议设备60,双方设备在会议连接协商过程中可同意将视频流中转服务地址作为目标地址发送会议音视频流;在视频会议装置10确认将视频流中转服务地址作为目标地址后,将视频会议装置10发送的会议音视频流转发至对方会议设备60进行投影和播放;对方会议设备60将会议音视频流发送给视频流中转服务模块24,通过该视频流中转服务模块24将会议音视频流传送给视频会议装置10,以进行投影和播放,从而实现实时视频会议。视频流中转服务可以是基于标准的网络地址转换使用中继穿透(Traversal Using Relay NAT,TURN)协议,也可以是私有的协议。
在另一具体的实施例中,云服务系统20还包括视频存储服务模块25,视频存储服务模块25提供视频存储服务,视频存储服务用来存储会议视频以及支持软件应用重播录存的会议视频;具体地,视频会议装置10在接收到视频会议存储命令后将当前会议的音频流与视频流上传至视频会议存储服务模块,视频会议存储服务模块对音频流和视频流进行编码合并处理,转换成可播放的视频文件进行存储。
在视频会议进行过程中,用户可通过软件应用或者通过语音控制要求视频会议装置10对视频会议进行存储;视频会议装置10在接收到视频会议存储命令后将当前会议的音频流和视频流同时上传一份给视频存储服务模块25,视频存储服务模块25对音频流和视频流进行编码合并处理,转换成可播放的视频文件进行存储,该视频文件可以为支持MP4格式(MPEG Layer 4)的视频文件。进一步地,视频存储服务模块25对视频会议的存储可以连续存储,也可以分成片段存储。
在会议进行过程中,用户可以通过软件应用或者通过语音控制要求视频会议装置10取消视频会议存储,视频会议装置10在接收到会议存储取消命令后停止将会议音视频流上传给视频存储服务模块25。在视频会议结束后,会议存储功能自动终结。
视频存储服务模块25还提供视频访问,软件应用可以通过访问视频存储服务模块25来获取存放的视频文件,从而重播视频会议。
在另一具体的实施例中,云服务系统20还包括推广和广告服务模块26,该推广和广告服务模块26提供市场推广和广告服务,市场推广和广告服务提供了向上销售(Up-Sell)、交叉销售(Cross-Sell)、市场推广以及投放广告的平台。视频会议装置10在启动等待时间或视频投影过程中,可以从推广和广告服务模块26获取市场推广的信息或广告。
具体来说,手机或电脑中的软件应用在用户登录后用来提供市场推广服务,可以在软件应用的适当页面和适当位置提醒用户有新品推出、有新的折扣信息或新的公司活动等。需要说明的是,软件应用的市场推广服务有多种实现方式,可以在用户打开软件应用时,通过弹窗提醒有新品推出、有新的折扣信息或新的公司活动等,且需要人工手动关闭弹窗或弹窗无响应一分钟后自行关闭才可以正常登录帐号;另外市场推广服务也可以通过软件应用页面滚动条的方式,即在软件应用页面循环滚动消息的方式提醒用户有新品推出、有新的折扣信息或新的公司活动等;在不影响用户情绪和体验的情况下,视频会议装置10还可以从推广和广告服务模块26获取市场推广的信息或广告,然后通过投影模组投影在合适区域、适量投放这些信息,比如:新品推出、折扣信息甚至是商用广告信息,可以在适当位置、适当时间以适当尺寸投射这些信息。
在另一具体的实施例中,云服务系统20还包括订阅收费服务模块27,订阅收费服务模块27提供订阅和收费服务,订阅收费服务模块27用于接收电子设备30发送的订阅信息与收费信息,对用户的订阅进行管理,并可按时与第三方支付平台交互,以执行收费并生成相应的电子收据和税务记录,发送给注册手机或注册邮箱。该订阅和收费服务还负责处理用户的退阅和退款服务,并形成文件记录发送给在电子设备30注册的注册账户。
进一步地,电子设备30可以向用户提供对某些收费服务的订阅,用户可以按月订阅,也可以按年订阅,比如:会议视频存储服务,可根据云端存储空间的大小收取不同的订阅费用;收费方式可以是信用卡支付、储蓄卡支付、支付宝支付、微信支付或PayPal支付等。订阅和收费服务可提供订阅和收费清单,并发送到用户注册的电子邮箱,同时软件应用可显示订阅状态。
在另一具体的实施例中,该软件应用在用户登录后用来配置订阅和收费服务,用户可以按月/年订购一些收费服务,比如:视频会议云端存储服务、多方视频会议服务或投影视频内容服务等;该软件应用提供收费功能,支持多平台支付,比如威士卡(Visa卡)、万事达卡(Master卡)、美国运通、支付宝、微信支付或银联支付等。
进一步地,软件应用的订阅和收费服务只负责采集用户的输入信息,不负责处理和执行用户的订阅和支付,软件应用可将采集的用户的输入信息传给云服务系统20的订阅收费服务模块27来具体处理和执行,使得订阅收费服务模块27为此用户开通订阅功能,然后用户可根据自己的需求在软件应用中选择需要的订阅功能。需要说明的是,由于订阅服务的类型较多,部分订阅功能是免费,即在每个用户注册成功后,默认为此用户开通部分免费的订阅功能,用户可以在软件应用中选择是否接受免费订阅功能,例如电池电量提醒等,但此时其它的高阶订阅功能是无法使用的;当用户需要使用部分高阶订阅功能时,在收费页面完成付费后,云服务系统20便为付费用户开通高阶订阅功能,此时用户可以在软件应用中选择是否接受免费订阅功能,需要说明的是,无论是免费订阅功能还是付费订阅功能,都需要用户在软件应用中自行选择是否接受订阅提醒等,云服务系统20本身不会为用户打开接受订阅提醒功能。
在另一具体的实施例中,云服务系统20还包括事件推送服务模块28,事件推送服务模块28提供事件推送服务,事件推送服务模块28用于接收视频会议装置10或云服务系统20中其它服务模块发送的事件,比如:上线、掉线、电池电量不足、对方会议请求或收费成功等;将这些事件转换成事件信息推送给电子设备30中的软件应用,以使得电子设备30中的软件应用在消息提示中心显示事件信息。
事件推送服务在指定事件发生时可推送信息给软件应用,提醒用户该指定事件发生。例如,当视频会议装置10检测到电池电量不足时产生事件,发送给事件推送服务模块28,事件推送服务模块28推送信息给软件应用,以提醒用户电池电量不足。或者,订阅和收费服务模块在指定收费日与支付宝平台收取订阅费用成功后产生事件,发送事件给事件推送服务模块28,事件推送服务模块28推送信息给软件应用,以提醒用户本月或本年订阅某项服务的收费交易成功。或者,会议对方请求视频会议,软件应用接到通知信息,方便用户及时应答。
在另一具体的实施例中,云服务系统20还包括第三方接口服务模块29,第三方接口服务模块29提供跟别的产品或应用对接的功能,视频会议装置10可通过第三方接口服务模块29与会议对方的云端通信,从而通过会议对方的云端来实现与对方会议设备60通信的目的,或者视频会议装置10通过第三方接口服务模块29与别的云服务相关联,从而获取别的云服务,比如:视频内容服务。
进一步地,用户通过语音控制或软件应用的视频会议管理,要求视频会议装置10加入第三方会议系统,该第三方会议系统包括但不仅限于Zoom、WebEx或腾讯会议等第三方会议系统;视频会议装置10可以通过第三方接口服务模块29加入第三方会议系统的会议邀请,视频会议装置10将第三方会议系统信息汇报给第三方接口服务模块29,该第三方会议系统信息包括但不仅限于会议提供方网络地址、会议拨入号码或会议密码等信息;第三方接口服务模块29可接收视频会议装置10发送的第三方会议系统信息,与第三方会议系统建立视频连接,然后将第三方会议系统生成的会议音视频流中转给视频会议装置10进行投影和播放,并将视频会议装置10产生的会议音视频流中转给第三方会议系统;具体地,可将摄像模组摄入的会议场景视频流和麦克风阵列摄入的音频流中转给会议对方,以使得会议双方建立基于云对云连接的视频会议。
在其他实施例中,还可不需要云服务系统20来建立视频连接和视频中转,直接指定会议对方的IP地址和端口,来达到建立会议连接和视频通信的目的,适用于事先分配各个设备的IP地址和端口的情况。
在一具体的应用场景中,电子设备30可以为手机终端31,如图13所示,该手机终端31运行有软件应用,该软件应用具有用户注册和登录、设备配置和管理、视频会议管理、屏幕分享、订阅和收费以及市场推广等功能,以下将视频会议装置10简称为设备。
该软件应用通过手机终端31与设备进行网络通信,网络连接的方式可以是手机终端31和设备加入同一个WIFI网络,通过网关设备40进行通信,如图4所示;或者手机终端31直接加入设备自己的无线网络进行通信,如图3与图5所示;或者也可以通过无线蓝牙连接跟设备进行通信,并通过WIFI处理高速数据,比如播放设备产生的视频流,如图6所示;或者该软件应用可以通过云服务系统20跟设备进行远程通信,如图7所示。进一步地,在远程通信时,手机终端31上的软件应用和设备不需要在同一个网络,手机终端31将控制命令发送给云服务系统20的接入管理服务模块22,通过设备和云服务系统20建立的安全信令通道将命令传递给设备,从而达到和设备通信的目的。
1)用户注册和登录功能:该软件应用可以用来向用户提供注册和登录,当用户打开手机终端31上的软件应用时,需要登录账户,如果该用户还没有账户,用户需要注册账户,注册账户时用户需要至少提供电子邮箱地址,手机终端31上的软件应用将用户提供的注册信息发送给云服务系统20的管理认证服务模块21,管理认证服务模块21发送电子邮件至用户提供的电子邮箱地址要求用户确认,用户在确认信息后会返回给云服务系统20的管理认证服务模块21,以使得管理认证服务模块21创建用户信息,方便后续用户登录时进行认证。当用户登录时,需要输入登录信息,该登录信息至少包括用以创建账户的电子邮箱地址和登录密码,手机终端31上的软件应用将用户输入的登录信息通过网络发送给云服务系统20的管理认证服务模块21管理认证服务模块21对用户输入的登录信息进行验证,验证完毕后返回登录成功码或登录失败码,如图14所示。
2)设备配置和管理功能
该软件应用还可在用户登录后用来配置设备,配置内容包括但不仅限于设备的名称、设备的无线网络参数(包括设备自己加入WIFI网络的参数和双频模式下设备建立自己WIFI网络的参数)、用来跟云服务系统20通信的用户账户和设备密匙、音视频参数、投影机参数、服务系统20所在的时区和时间、事件提醒(比如电池电量预警或会议结束)、视频存储在本地还是云端等。在对设备进行配置后,内置内容可出现在用户设备清单,用户可以通过手机终端31上的软件应用对设备进行重新配置。
该软件应用在用户登录后可用来管理设备,包括但不仅限于从用户设备清单里删除设备、恢复设备出厂设置、更新设备的固件、打开或关闭摄像头、打开或关闭投影仪以及实时播放来自设备的视频和音频等。
3)视频会议管理功能:该软件应用在用户登录后用来管理视频会议,包括对指定设备启动视频会议、终止视频会议、启动或终止视频会议存储、回放存储的视频会议、创建视频会议黑名单或创建视频会议通信录等。
4)屏幕共享功能:该软件应用在用户登录后可用来控制屏幕共享,当启动屏幕共享后,手机终端31的屏幕共享到设备,设备可以将共享屏幕投影,或者设备也可以将共享屏幕发送给对方会议设备60进行投影显示。
5)订阅和收费功能
该软件应用在用户登录后用来配置订阅和收费服务,用户可以按月或按年订购一些收费服务,比如,视频会议云端存储服务、多方视频会议服务或投影视频内容服务等。
该软件应用提供收费功能,支持多平台支付,比如Visa卡、Master卡、美国运通、支付宝、微信支付或银联支付等;软件应用的订阅和收费服务只负责采集用户的输入信息,不负责处理和执行用户的订阅和支付,该订阅和收费服务将采集的输入信息传给云服务系统20的订阅收费服务模块27来具体处理和执行。
订阅收费服务模块27在接收到手机终端31发送的订阅信息与收费信息后,对用户的订阅进行管理,并可按时与第三方支付平台交互,以执行收费并生成相应的电子收据和税务记录,发送给注册手机或注册邮箱。
6)市场推广功能:该软件应用在用户登录后用来提供市场推广服务,在软件应用的适当页面和适当位置提醒用户有新品推出、有新的折扣信息或新的公司活动等。
进一步地,该软件应用还可接收云服务系统20中的推广和广告服务模块26发送的市场推广的信息或广告,进行显示或发送至用户的注册邮箱地址。
在实际应用中,用户可在第一次使用时,通过该软件应用进行账户注册,该软件应用可获取用户输入的注册信息,然后将该注册信息发送至管理认证服务模块21,管理认证服务模块21可返回确认信息要求用户进行信息的确认,在用户确认信息无误时,就完成了账户的注册;在注册成功后,用户可对设备进行配置或使用默认配置,比如,用户可修改设备的名称;在完成配置后,用户可控制设备开启,并与对方会议设备60进行通信连接;在视频会议的过程中,用户可通过软件应用来控制设备的声音大小、是否进行屏幕共享、是否关闭摄像头或中止会议等,而且用户还可通过语音对设备进行调控,实现语音控制;在视频会议结束后,用户还可通过软件应用来确定是否保存所存储的视频,以便进行回看,如果需要存储,则发送指令至设备,以使得设备对会议视频保存在SD卡中;通过软件应用手机终端31能够与设备以及云服务系统20进行交互,使得对设备的控制更加便捷,方便用户使用。
请参考图15,本申请提供一种视频会议方法,所述视频会议方法包括步骤S1501~S1507。
步骤S1501:获取视频会议的会议场景图像信息,并生成会议视频。
具体来说,通过视频会议装置10的摄像模组11来获取会议现场的图像信息。
步骤S1503:采集会议场景的语音信号,语音信号包括可识别的语音指令。
具体来说,通过视频会议装置10的音频输入模组12来采集语音信号,音频输入模组可以为麦克风,可支持水平方向360度环绕的麦克风阵列。
进一步,所述语音信号包括可被投影处理器131或主处理器进行识别的语音指令,所述语音指令为与视频会议装置10相关的操作,在一具体的实施例中,所述语音指令包括“打开投影模组”、“关闭投影模组”、“打开/关闭摄像模组”、“请关机”、“调高音量”或“调低音量”等。
步骤S1505:投影会议视频。
具体来说,通过视频会议装置10的投影模组13投射会议视频,进一步,投影模组13用于显示摄像模组11采集到的全景视频或对方会议设备发送的对方会议场景视频,可通过在电脑及外接电子终端的会议系统上进行选择所要显示的会议视频画面信息。
步骤S1507,识别语音指令,并根据该语音指令执行与之相应的操作。
具体来说,投影处理器131或主处理器可以对音频输入模组12输出的语音信号进行识别,得到关键词信息,执行与关键词信息相应的操作,或将关键词信息发送至摄像模组11,以使得摄像模组11执行与关键词信息相应的操作,该关键词信息包括命令关键词/词组、确认关键词/词组或唤醒关键词/词组,确认关键词/词组包括“是”或“否”。
在一具体的实施例中,可基于本地内置词库进行语音控制,即预先在本地存储一些命令关键词/词组,形成一个词库,该命令关键词/词组包括“打开投影模组”、“关闭投影模组”、“打开/关闭摄像模组”、“请关机”、“调高音量”或“调低音量”等;在实际使用时,检测识别出的用户输入的语音与该词库中的关键词是否相同,如果相同,则执行相应的操作;例如,如果主处理器可识别出用户下发的语音指令是“打开投影模组”,则控制投影模组13打开。
进一步地,投影处理器131或主处理器采用的语音识别模型经过范本训练和参数调优后能够对这些关键词/词组进行有效识别,如果识别出命令关键词/词组,直接执行相应动作,比如识别出“请关机”,投影处理器131或主处理器执行关机动作。对于一些重要动作,在执行之前可以要求用户确认“是”或者“否”,如果在指定时长间隔内没有识别出任何确认关键词/词组,默认取消上述命令。
在另一具体的实施例中,可在进行语音控制之前唤醒语音控制功能,即设置唤醒关键词/词组,该唤醒关键词/词组用于使得视频会议装置10进入工作状态,唤醒关键词/词组为自定义的关键词/词语,比如:“Alexa”、“Hey Google”或“小爱同学”等;在唤醒语音控制功能之后再进行语音控制,此种情况下,投影处理器131或主处理器在识别出唤醒关键词/词组后,可对音频输入模组12输出的后续语音信号进行截取,直至在唤醒词声源方向超出预设时间(比如三秒)未检测到有效的语音信号,生成待分析语音信号,将待分析语音信号输入至云服务系统20,此时进入云端语义分析阶段;云服务系统20对待分析语音信号进行语义分析生成分析结果,对分析结果进行转换并将转换的结果反馈至视频会议装置10。
本申请提供了一种便携式高清投影视频会议系统,该系统包括一个基于高清高亮投影模组的视频会议装置、支持视频连接和管理的云服务系统以及用来配置和管理视频会议装置的软件应用。视频会议装置是一个集多功能于一体的便携式高清高亮投影模组,其顶部集成带隐私保护的高清全景摄像模组,摄像模组可升降,在不需要视频时可下降隐藏于壳体内;视频会议装置还集成了360度麦克风阵列和音频输入模组、WIFI无线通信模块、可充电电池以及SD卡存等其它物理模块。云服务系统提供接入和管理服务、视频会议连接服务、视频流中转服务、视频会议存储服务、用户管理和认证服务、订阅和收费服务以及事件推送服务。软件应用是运行在手机、平板电脑或其它电脑等电子终端设备上的软件,用户通过该软件应用来配置视频会议装置和管理视频会议,并且可以分享电子设备的屏幕到视频会议装置进行投影。视频会议装置经过软件应用配置后跟云服务系统相联,用户通过软件应用可控制视频会议装置启动视频会议,在云服务系统中各功能模块的协助下与对方会议设备建立点到点或点到多点的实时双向视频流和音频流数据通道,视频会议装置顶部的摄像头和内置麦克风阵列摄入本地场景的视频和音频,通过音视频流数据通道实时发送给对方会议设备进行视频投影和音频播放,同时对方会议设备将采集的视频和音频通过音视频流数据通道同步发送给本地视频会议装置进行投影和播放,形成视频会议。
综上所述,本申请提供的系统是一个多功能合一的无线便携式视频会议系统,方便实用,使用简单,解决了目前视频会议系统的诸多痛点,具备以下优势:
1)视频会议装置方便携带,且采用电池供电,能够随时需要随时使用,集全景高清的摄像模组和高清高亮投影模组于一体化,具备隐私保护的功能,通过高清高亮投影模组来取代传统的电视屏幕或显示器,投影尺寸可调整,可以用来做家庭影院。支持与笔记本电脑、手机或Tablet等多种带显示屏的设备进行无线配对,通过投影达到屏幕分享和内容展示的目的,既适合本地商务演讲,也适合家庭和朋友之间使用,适合远程会议屏幕共享;而且支持本地SD卡存储功能,能够用SD卡来存储会议视频,以便重播会议视频。
2)目前的视频会议系统都需要事先安排,通知对方在指定的时间拨入指定的会议号码,失去了传统电话即拨即通的优势,而且很多会议无法事先预测,临时安排又无法确认对方是否接收到会议信息。本申请所提供的系统在任何需要会议时可以向对方直接拨号,每个视频会议装置都有唯一的辨识号码,通过云服务系统来实现最优化的数据连接,不需要传统的电话系统和线路,拨号过程可以采用语音拨号或者通过软件应用来实现,方便快速;对方在收到会议邀请提示后可以选择接受或挂断,具有传统电话的按需拨号快速接通的优势。
3)具有云服务功能,可通过云服务系统来实现最优化的点对点或点对多点的视频会议连接,并可以通过云服务系统来实现订阅和收费服务,比如:视频内容服务、广告业务服务或会议存储服务;通过云服务系统来实现跟第三方会议系统进行交互;此外,还可提供设备接入和管理服务、视频流中转服务、用户管理和认证服务以及事件推送服务等,以实现电子设备、视频会议装置以及云服务系统之间的交互。
4)提供软件应用,支持语音识别和语音控制,方便用户通过手机或其它带显示屏的设备来配置视频会议装置、管理视频会议装置和控制会议、屏幕分享或调整音视频参数等。
以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (24)
1.一种投影视频会议系统,其特征在于,包括:视频会议装置与云服务系统,所述云服务系统用于向所述视频会议装置提供服务,其中,所述视频会议装置包括:
摄像模组,用于获取会议场景的图像信息并生成会议视频;
音频输入模组,用于采集会议场景的语音信号,所述语音信号包含可识别的语音指令;
投影模组,用于显示所述会议视频;
其中,所述视频会议装置可识别所述语音指令,并根据所述语音指令执行与所述语音指令对应的操作。
2.根据权利要求1所述的投影视频会议系统,其特征在于,
所述投影模组包括投影处理器,所述投影处理器用于对所述语音指令进行识别,得到关键词信息,执行与所述关键词信息相应的操作。
3.根据权利要求1所述的投影视频会议系统,其特征在于,
所述视频会议装置还包括主处理器,所述主处理器用于对所述语音指令进行识别,得到关键词信息,执行与所述关键词信息相应的操作。
4.根据权利要求3所述的投影视频会议系统,其特征在于,
所述投影处理器或所述主处理器用于检测所述关键词信息与预设的词库中的关键词信息是否相同,若相同,则执行与所述关键词信息相应的操作;
其中,所述关键词信息包括命令关键词/词组或确认关键词/词组,所述命令关键词/词组包括打开/关闭所述投影模组、打开/关闭所述摄像模组、关机、调高音量或调低音量,所述确认关键词/词组包括是或否。
5.根据权利要求2或3所述的投影视频会议系统,其特征在于,
所述语音指令包含唤醒关键词/词组,所述唤醒关键词/词组为自定义的关键词/词组,所述投影处理器或主处理器用于在识别出所述唤醒关键词/词组后,对所述音频输入模组输出的后续语音信号进行截取,直至超出预设时间未检测到语音信号,生成待分析语音指令,将所述待分析语音指令输入至所述云服务系统,以使得所述云服务系统对所述待分析语音指令进行语义分析生成可执行的语音指令,并将所述可执行的语音指令反馈回所述投影处理器或主处理器。
6.根据权利要求2或3所述的投影视频会议系统,其特征在于,所述音频输入模组还用于对采集的所述语音信号进行降噪处理,生成脉冲密度调制数字信号;所述投影处理器或主处理器还包括:
数字信号处理模块,用于对所述脉冲密度调制数字信号进行数字滤波、抽取以及调节,以生成脉冲编码调制数据流;
回声消除模块,用于对所述脉冲编码调制数据流进行回声消除处理;
波束形成模块,用于对所述回声消除模块输出的信号进行过滤;
声源定位模块,用于基于所述回声消除模块输出的信号与所述波束形成模块的信号,检测出声源的方向,形成拾音波束区域;
噪声抑制模块,用于对所述声源定位模块输出的信号进行噪声抑制处理;
混响消除模块,用于对所述噪声抑制模块输出的信号进行混响消除处理;
识别模块,用于对所述混响消除模块输出的信号进行关键词/词组识别,生成识别结果,将所述识别结果发送至动作执行模块,或者将所述识别结果发送至云服务系统,以使得所述云服务系统进行识别;
动作执行模块,用于执行与所述识别结果相应的动作。
7.根据权利要求3所述的投影视频会议系统,其特征在于,
所述投影视频会议系统还包括音频输出模组,所述音频输出模组用于播放所述投影处理器或所述主处理器发送的音频信号。
8.根据权利要求1所述的投影视频会议系统,其特征在于,
所述云服务系统包括管理认证服务模块,所述管理认证服务模块用于向电子设备提供注册服务和登录服务,当所述管理认证服务模块接收到所述电子设备发送的注册请求时,发送确认邮件至用户指定的注册邮箱,其中,在所述用户登录所述注册邮箱确认后,所述管理认证服务模块将所述用户标记为可信任用户;在注册成功后,当所述用户进行登录时,所述管理认证服务模块对所述用户进行认证,以确定所述用户是否为所述可信任用户。
9.根据权利要求8所述的投影视频会议系统,其特征在于,
所述云服务系统还包括接入管理服务模块,所述接入管理服务模块用于对所述视频会议装置发送的连接请求进行认证,建立所述云服务系统和所述视频会议装置之间的安全信令通道,对所述安全信令通道进行监听和管理。
10.根据权利要求9所述的投影视频会议系统,其特征在于,
所述电子设备将控制命令发送给所述云服务系统的接入管理服务模块,通过所述安全信令通道将所述控制命令传递给所述视频会议装置。
11.根据权利要求8所述的投影视频会议系统,其特征在于,
所述视频会议装置还包括无线通信模组,所述无线通信模组通过网关设备接入互联网。
12.根据权利要求11所述的投影视频会议系统,其特征在于,
所述无线通信模组具有第一无线接口与第二无线接口,所述视频会议装置通过所述第一无线接口与所述互联网连接通信,且通过所述第二无线接口与所述电子设备进行通信,以实现与所述电子设备的连接交互。
13.根据权利要求12所述的投影视频会议系统,其特征在于,
所述无线通信模组工作在双频混合模式,所述第一无线接口为2.4GHz无线接口,所述2.4GHz无线接口工作在客户端模式,通过所述网关设备与所述互联网通信;所述第二无线接口为5GHz无线接口,所述5GHz无线接口工作在接入点模式或无线路由模式。
14.根据权利要求11所述的投影视频会议系统,其特征在于,
所述电子设备和所述视频会议装置加入同一个WIFI无线网络,所述视频会议装置与所述无线通信模组工作在客户端模式。
15.根据权利要求11所述的投影视频会议系统,其特征在于,
所述电子设备工作在客户端模式,所述无线通信模组工作在所述客户端模式和接入点模式。
16.根据权利要求11所述的投影视频会议系统,其特征在于,
所述电子设备工作在客户端模式,所述无线通信模组工作在所述客户端模式,且所述电子设备与所述视频会议装置之间建立蓝牙通道。
17.根据权利要求8所述的投影视频会议系统,其特征在于,
所述视频会议装置还包括可充电电池,用于为所述摄像模组、所述投影模组以及所述音频输入模组供电;所述视频会议装置在检测到所述充电电池的电池电量低于设定百分比时,在所述投影模组所显示的视频画面上显示当前电池电量,以进行电量提醒;或者通过所述云服务系统向所述电子设备推送通知消息,所述通知消息包括当前电池电量;或者所述视频会议装置还包括至少一个LED,通过所述至少一个LED进行电量提醒。
18.根据权利要求8所述的投影视频会议系统,其特征在于,
所述云服务系统还包括视频会议连接服务模块,所述视频会议连接服务模块用于接收所述视频会议装置发送的会议连接请求,在确认对方会议设备接受会议邀请后,将所述对方会议设备的安全信令通道标识符返回给所述视频会议装置并将所述视频会议装置的安全信令通道标识符返回给所述对方会议设备,所述视频会议装置和所述对方会议设备在后续协商视频会议参数时均需提供对方的安全信令通道标识符;在接收到所述视频会议装置与所述对方会议设备发送的寻址请求后,将所述视频会议装置的可外部访问的地址端口信息发送给所述视频会议装置,将所述对方会议设备的可外部访问的地址端口信息发送至所述对方会议设备,同时协助所述视频会议装置和所述对方会议设备协商视频会议参数,以使得所述对方会议设备与所述视频会议装置根据所述视频会议参数获得对方可外部访问的地址端口信息,建立音视频网络连接路径;其中,所述会议连接请求至少包括所述对方会议设备的注册账户名和标识码,所述地址端口信息包括可外部访问的网络地址信息与端口信息,所述视频会议参数包括摄像头参数、投影参数或地址端口信息。
19.根据权利要求18所述的投影视频会议系统,其特征在于,
所述云服务系统还包括视频流中转服务模块,所述视频流中转服务模块用于在未发现满足预设条件的音视频网络连接路径时,提供视频流中转服务地址给所述视频会议装置,在所述视频会议装置确认将所述视频流中转服务地址作为目标地址后,将所述视频会议装置发送的会议音视频流转发至所述对方会议设备进行播放。
20.根据权利要求8所述的投影视频会议系统,其特征在于,
所述云服务系统还包括视频存储服务模块,所述视频会议装置在接收到视频会议存储命令后将当前会议的音频流与视频流上传至所述视频会议存储服务模块,所述视频会议存储服务模块用于对所述音频流和所述视频流进行编码合并处理,转换成可播放的视频文件进行存储。
21.根据权利要求8所述的投影视频会议系统,其特征在于,
所述云服务系统还包括订阅收费服务模块,所述订阅收费服务模块用于接收电子设备发送的订阅信息与收费信息,对用户的订阅进行管理,与第三方支付平台连接以执行收费并生成相应的电子收据和税务记录,发送给所述电子设备。
22.根据权利要求8所述的投影视频会议系统,其特征在于,
所述云服务系统还包括事件推送服务模块,所述事件推送服务模块用于接收所述视频会议装置或所述云服务系统中其它服务模块发送的事件,将所述事件转换成事件信息推送给电子设备,以使得所述电子设备在消息提示中心显示所述事件信息。
23.根据权利要求8所述的投影视频会议系统,其特征在于,
所述云服务系统还包括第三方接口服务模块,所述第三方接口服务模块用于接收所述视频会议装置发送的第三方会议系统信息,与第三方会议系统建立视频连接,将第三方会议系统生成的会议音视频流中转给所述视频会议装置进行投影和播放,并将所述视频会议装置产生的会议音视频流中转给所述第三方会议系统,其中,所述第三方会议系统信息包括会议提供方网络地址、会议拨入号码或会议密码。
24.根据权利要求1所述的投影视频会议系统,其特征在于,
所述摄像模组包括壳体、摄像头、电机以及升降平台,所述电机与所述升降平台设置于所述壳体内,且所述升降平台设置于所述电机的上方,用于承载所述摄像头,所述摄像头设置于所述升降平台的上方,所述电机用于在接收到信号指令后驱动所述升降平台上下移动,以带动所述摄像头上下移动,进而将所述摄像头隐藏于所述壳体内或从所述壳体伸出。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/159174 | 2021-01-27 | ||
US17/159,174 US11206372B1 (en) | 2021-01-27 | 2021-01-27 | Projection-type video conference system |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114827518A true CN114827518A (zh) | 2022-07-29 |
Family
ID=78918428
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110272522.7A Pending CN114900637A (zh) | 2021-01-27 | 2021-03-12 | 一种视频会议方法、系统及其投影终端 |
CN202110272521.2A Pending CN114827517A (zh) | 2021-01-27 | 2021-03-12 | 一种投影视频会议系统及视频投影方法 |
CN202110269782.9A Pending CN114900636A (zh) | 2021-01-27 | 2021-03-12 | 一种视频会议装置的消息推送处理方法及系统 |
CN202110269781.4A Pending CN114900635A (zh) | 2021-01-27 | 2021-03-12 | 一种投影视频会议系统 |
CN202110272530.1A Pending CN114900638A (zh) | 2021-01-27 | 2021-03-12 | 一种投影视频会议系统 |
CN202110287542.1A Pending CN114827518A (zh) | 2021-01-27 | 2021-03-17 | 一种投影视频会议系统 |
Family Applications Before (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110272522.7A Pending CN114900637A (zh) | 2021-01-27 | 2021-03-12 | 一种视频会议方法、系统及其投影终端 |
CN202110272521.2A Pending CN114827517A (zh) | 2021-01-27 | 2021-03-12 | 一种投影视频会议系统及视频投影方法 |
CN202110269782.9A Pending CN114900636A (zh) | 2021-01-27 | 2021-03-12 | 一种视频会议装置的消息推送处理方法及系统 |
CN202110269781.4A Pending CN114900635A (zh) | 2021-01-27 | 2021-03-12 | 一种投影视频会议系统 |
CN202110272530.1A Pending CN114900638A (zh) | 2021-01-27 | 2021-03-12 | 一种投影视频会议系统 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11206372B1 (zh) |
CN (6) | CN114900637A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116347134A (zh) * | 2023-03-29 | 2023-06-27 | 深圳市联合信息技术有限公司 | 基于人工智能教学课堂的机顶盒音频处理系统及其方法 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114915553A (zh) * | 2021-01-29 | 2022-08-16 | Zoom视频通讯公司 | 设备管理工具 |
CN114827362A (zh) * | 2021-01-29 | 2022-07-29 | Zoom视频通讯公司 | 用于设备管理的方法和装置 |
CN114757155B (zh) * | 2022-06-14 | 2022-09-27 | 深圳乐播科技有限公司 | 一种会议文档的生成方法及装置 |
CN116795316B (zh) * | 2023-08-24 | 2023-11-03 | 南京维赛客网络科技有限公司 | 投屏时小窗口播放场景内画面的方法、系统及存储介质 |
CN117061717B (zh) * | 2023-10-12 | 2024-01-09 | 杭州罗莱迪思科技股份有限公司 | 投影拼接视频有效控制方法、系统及其应用 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7260538B2 (en) * | 2002-01-08 | 2007-08-21 | Promptu Systems Corporation | Method and apparatus for voice control of a television control device |
US20080180519A1 (en) * | 2007-01-31 | 2008-07-31 | Cok Ronald S | Presentation control system |
CN104769563B (zh) * | 2012-11-09 | 2018-03-06 | 日立麦克赛尔株式会社 | 影像信息终端装置和影像显示系统 |
US9215406B2 (en) * | 2013-03-14 | 2015-12-15 | Polycom, Inc. | Immersive telepresence anywhere |
US9374554B1 (en) * | 2014-03-25 | 2016-06-21 | Amazon Technologies, Inc. | Display selection for video conferencing |
US11043303B2 (en) * | 2019-03-18 | 2021-06-22 | My Virtual Exam, Inc. | Remote communication portal and method of use |
-
2021
- 2021-01-27 US US17/159,174 patent/US11206372B1/en active Active
- 2021-03-12 CN CN202110272522.7A patent/CN114900637A/zh active Pending
- 2021-03-12 CN CN202110272521.2A patent/CN114827517A/zh active Pending
- 2021-03-12 CN CN202110269782.9A patent/CN114900636A/zh active Pending
- 2021-03-12 CN CN202110269781.4A patent/CN114900635A/zh active Pending
- 2021-03-12 CN CN202110272530.1A patent/CN114900638A/zh active Pending
- 2021-03-17 CN CN202110287542.1A patent/CN114827518A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116347134A (zh) * | 2023-03-29 | 2023-06-27 | 深圳市联合信息技术有限公司 | 基于人工智能教学课堂的机顶盒音频处理系统及其方法 |
CN116347134B (zh) * | 2023-03-29 | 2024-01-30 | 深圳市联合信息技术有限公司 | 基于人工智能教学课堂的机顶盒音频处理系统及其方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114900637A (zh) | 2022-08-12 |
CN114900636A (zh) | 2022-08-12 |
CN114827517A (zh) | 2022-07-29 |
CN114900635A (zh) | 2022-08-12 |
CN114900638A (zh) | 2022-08-12 |
US11206372B1 (en) | 2021-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11206372B1 (en) | Projection-type video conference system | |
US10225527B2 (en) | Wireless entrance communication device | |
CN109788236B (zh) | 音视频会议控制方法、装置、设备以及存储介质 | |
US10142597B2 (en) | Wireless entrance communication device | |
CN103238178B (zh) | 用于在视频环境中提供增强的图形的系统和方法 | |
CN107872732B (zh) | 一种自助式互动视频直播系统 | |
CN106105246B (zh) | 直播显示方法、装置及系统 | |
US9742849B2 (en) | Methods and systems for establishing collaborative communications between devices using ambient audio | |
US20150022618A1 (en) | Wireless Entrance Communication Device | |
CN107371044A (zh) | 电子设备互动方法、电子设备、用户终端及服务器 | |
WO2020063675A1 (zh) | 一种智能音箱及智能音箱使用的方法 | |
CN103888699A (zh) | 具有视频功能的投影装置及利用其进行视频会谈的方法 | |
US20170244909A1 (en) | Portable video studio kits, systems, and methods | |
WO2022068557A1 (zh) | 生物信息验证方法及设备 | |
WO2021190404A1 (zh) | 建立会议、会议创建方法、设备、系统及存储介质 | |
WO2017117137A1 (en) | Wireless entrance communication device | |
WO2021213057A1 (zh) | 求助信息的发送、响应方法、装置、终端及存储介质 | |
US9762744B2 (en) | Charge management system, charge management method, program, program providing system, and maintenance system | |
KR100860112B1 (ko) | 인터넷 프로토콜 비디오 폰 및 광고 제공 시스템 | |
WO2017173996A1 (zh) | 云会议系统的应用方法及支付服务平台系统、存储介质 | |
US11363236B1 (en) | Projection-type video conference system | |
US11729489B2 (en) | Video chat with plural users using same camera | |
CN114374880B (zh) | 联合直播方法、装置、电子设备及计算机可读存储介质 | |
CN113518198A (zh) | 会话界面显示方法、会议界面显示方法、装置及电子设备 | |
CN217546174U (zh) | 智能会议系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |