CN101895717A - 一种视频会议中显示纯语音终端图像的方法 - Google Patents

一种视频会议中显示纯语音终端图像的方法 Download PDF

Info

Publication number
CN101895717A
CN101895717A CN 201010213447 CN201010213447A CN101895717A CN 101895717 A CN101895717 A CN 101895717A CN 201010213447 CN201010213447 CN 201010213447 CN 201010213447 A CN201010213447 A CN 201010213447A CN 101895717 A CN101895717 A CN 101895717A
Authority
CN
China
Prior art keywords
voice terminal
code stream
terminal
facial image
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201010213447
Other languages
English (en)
Inventor
罗奇勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI ZINAN INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI ZINAN INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI ZINAN INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI ZINAN INFORMATION TECHNOLOGY Co Ltd
Priority to CN 201010213447 priority Critical patent/CN101895717A/zh
Publication of CN101895717A publication Critical patent/CN101895717A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及一种视频会议中显示纯语音终端图像的方法,包括如下步骤:(1)在MCU上建立与会语音终端库;(2)MCU按照预定规则找到所述语音终端使用者的人脸图像码流;(3)MCU根据当前会议的协议支持情况,将对应的一样的协议人脸图像码流和音频流一起发送到各个终端;(4)所述各个终端接收到所述人脸图像码流和音频码流,进行解码后在显示设备与声音播放设备上显示与播放。本发明的视频会议中显示纯语音终端图像的方法,使纯音频终端加入视频会议可以让其他终端看到此音频终端的图像,会议效果得到质的提升,且具有普遍实用价值。

Description

一种视频会议中显示纯语音终端图像的方法
技术领域
本发明涉及多媒体通信领域,特别是涉及一种视频会议中显示纯语音终端图像的方法。
背景技术
视频会议中,终端一般都是支持视频的终端,但在特定的情况下,也可能存在不支持视频的纯语音终端,比如IP电话,或者PSTN电话,或者移动的手机等等。这些终端加入视频会议时只能闻其声,而不能观其形,对视频会议的直观性有较大的损伤。
发明内容
本发明的目的在于提供一种视频会议中显示纯语音终端图像的方法,可将纯语音终端的个人图像显示在视频会议系统中其他终端。
为实现上述目的,本发明的技术方案如下:
一种视频会议中显示纯语音终端图像的方法,包括如下步骤:
(1)在MCU上建立与会语音终端库;
(2)MCU按照预定规则找到所述语音终端使用者的人脸图像码流;
(3)MCU根据当前会议的协议支持情况,将对应的一样的协议人脸图像码流和音频流一起发送到各个终端;
(4)所述各个终端接收到所述人脸图像码流和音频码流,进行解码后在显示设备与声音播放设备上显示与播放。
所述与会语音终端库中的每条记录主要包括所述语音终端的E.164号码,IP地址,对应的语音终端使用者的人脸图像码流,和/或对应的语音终端使用者的声音录音。
所述人脸图像码流支持H264、H263等常用协议,可配置支持多种,例如CIF、或4CIF、或720P、或1080P的图像格式。
步骤(2)中,所述预定规则是根据语音终端E.164号码以及IP地址查找到本语音终端使用者的人脸图像码流,或根据语音终端库中声音通过语音分析算法实现和实际声音的匹配,找到本语音终端使用者的人脸图像码流。
语音分析算法通过会议中的语音终端语音与语音终端数据库中的语音进行语音参数分析,识别出匹配的语音,从而得到使用者的人脸图像码流。语音参数包括语音基频频谱、声门激励数值、声道形状数值,不同的语音具有不同的语音参数数值,通过对语音频谱等语音参数的分析实现语音识别。
采用本发明的视频会议中显示纯语音终端图像的方法,使纯音频终端加入视频会议可以让其他终端看到此音频终端的图像,使会议效果得到质的提升。并且,无论是PSTN音频、移动电话、IP语音电话都可以使用本发明实现音频终端带图像入会,具有普遍实用价值。
附图说明
图1是本发明视频会议中显示纯语音终端图像的方法的流程图;
图2音频终端数据库建立过程的流程图;
图3音频终端人脸图像匹配过程的流程图;
图4MCU人脸图像码流发送过程的流程图。
具体实施方式
为便于理解视频会议是如何工作的,先简要介绍视频会议的组成。视频会议主要由三部分关键设备组成:第一部分是外围设备,又分为采集与显示设备,比如摄像头、MIC就是属于采集设备,而显示器或者电视机就是属于显示设备;第二部分是视频终端设备,主要的功能是视频压缩解压缩与信令呼叫处理,视频终端放置在各个会场,纯语音的IP电话、PSTN电话等也可以归于这类设备;第三部分是中心处理设备,称为MCU,多点控制单元,这类设备放置在系统中心位置,用于调度与控制会议、转换码流、形成多画面等。对于每个加入视频会议的终端,都有唯一分配的一个号码,称为E164号码。
参考附图1-4,本发明的技术方案如下:
步骤(1):在MCU上建立与会语音终端库,库中的每条记录主要包括此语音终端的E.164号码,IP地址(无IP地址则全0表示),对应语音终端使用者的人脸图像码流,该人脸图像可配置支持多种大小,包括CIF、4CIF、720P、1080P等格式,码流协议支持H264、H263等常用协议,以及对应语音终端使用者声音录音,可根据要求配置录音时间,一般在5到10秒即可。
其中,建立音频终端数据库建立过程如图2所示,首先,设置E.164号码,设置IP地址,然后设置声音录音,录入人头图像格式,MCU根据当前会议终端的协议,如H264,或H263,压缩可支持的头像码流。
步骤(2),MCU按照预定规则找到所述语音终端使用者的人脸图像码流;MCU实现下面两种算法或者其中一种:(1)根据语音终端E.164号码以及IP地址查找到本语音终端使用者的人脸图像码流。(2)根据语音终端库中声音通过声音分析算法实现和实际声音的匹配,找到本语音终端使用者的人脸图像码流。
其中,MCU根据音频终端人脸图像匹配过程,如图3所示。MCU开启会议,设置发言人,当发言人是纯音频终端时,根据步骤(1)中的数据库进行音频终端匹配,MCU支持声音匹配算法,然后声音算法匹配终端人脸图像,最后人脸图像匹配成功。
或者,MCU支持E164号码匹配算法,然后E164号码算法匹配终端人脸图像。其他步骤与声音算法匹配过程均相同。
步骤(3),MCU找到对应的人脸图像码流后,当发言人是次语音终端时,MCU根据当前会议的协议支持情况,将对应的一样的协议人脸图像码流和音频流一起发送到各个终端。
最后,步骤(4)所述各个终端接收到所述人脸图像码流和音频码流,进行解码后在显示设备与声音播放设备上显示与播放。
图4所示的是图4MCU人脸图像码流发送过程,当步骤(2)的人脸图像匹配成功会,如会议支持H264协议,则MCU从数据库中读取H264码流,将该H264头像码流发送至支持H264的会议终端。
如会议支持的协议是H263或其他协议,则相应的MCU从数据库中读取MCU从数据库中读取H263或其他协议码流,将该H264或其他协议头像码流发送至支持H264的会议终端。
本发明的主要优点与效益是:
(1)使纯音频终端加入视频会议可以让其他终端看到此音频终端的图像,使会议效果得到质的提升。
(2)无论是PSTN音频、移动电话、IP语音电话都可以使用本发明实现音频终端带图像入会,具有普遍实用价值。
前面提供了对较佳实施例的描述,以使本领域内的任何技术人员可使用或利用本发明。对该较佳实施例,本领域内的技术人员在不脱离本发明原理的基础上,可以作出各种修改或者变换。应当理解,说明书中所举的实施例仅是一种较佳实施例,对该实施例做出的修改或者变换都不脱离本发明的保护范围。

Claims (8)

1.一种视频会议中显示纯语音终端图像的方法,其特征在于,包括如下步骤:
(1)在MCU上建立与会语音终端库;
(2)MCU按照预定规则识别所述语音终端使用者的人脸图像特定码流,或者说通过预定规则关联到使用者的人脸图像特定码流;
(3)MCU根据当前会议的协议支持情况,将对应的一样的协议人脸图像码流和音频流一起发送到各个终端;
(4)所述各个终端接收到所述人脸图像码流和音频码流,进行解码后在显示设备与声音播放设备上显示与播放。
2.根据权利要求1所述的视频会议中显示纯语音终端图像的方法,其特征在于,所述与会语音终端库中的每条记录主要包括所述语音终端的E.164号码,IP地址,对应的语音终端使用者的人脸图像码流,和/或对应的语音终端使用者的声音录音。
3.根据权利要求2所述的视频会议中显示纯语音终端图像的方法,其特征在于,所述人脸图像码流支持H264、H263等常用协议。
4.根据权利要求2所述的视频会议中显示纯语音终端图像的方法,其特征在于,所述人脸图像可配置支持多种图像格式。
5.根据权利要求4所述的视频会议中显示纯语音终端图像的方法,其特征在于,所述图像格式包括CIF、或4CIF、或720P、或1080P。
6.根据权利要求2-5中任一项所述的视频会议中显示纯语音终端图像的方法,其特征在于,步骤(2)中,所述预定规则是根据语音终端E.164号码以及IP地址查找到本语音终端使用者的人脸图像码流。
7.根据权利要求2所述的视频会议中显示纯语音终端图像的方法,其特征在于,所述声音录音为5至10秒。
8.根据权利要求2或7所述的视频会议中显示纯语音终端图像的方法,其特征在于,步骤(2)中,所述预定规则是根据语音终端库中声音通过语音分析算法实现和实际声音的匹配,找到本语音终端使用者的人脸图像码流。
CN 201010213447 2010-06-29 2010-06-29 一种视频会议中显示纯语音终端图像的方法 Pending CN101895717A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010213447 CN101895717A (zh) 2010-06-29 2010-06-29 一种视频会议中显示纯语音终端图像的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010213447 CN101895717A (zh) 2010-06-29 2010-06-29 一种视频会议中显示纯语音终端图像的方法

Publications (1)

Publication Number Publication Date
CN101895717A true CN101895717A (zh) 2010-11-24

Family

ID=43104763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010213447 Pending CN101895717A (zh) 2010-06-29 2010-06-29 一种视频会议中显示纯语音终端图像的方法

Country Status (1)

Country Link
CN (1) CN101895717A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105247854A (zh) * 2013-05-31 2016-01-13 佩克普股份公司 用于将外部设备关联到视频会议会话的方法和系统
CN105706443A (zh) * 2016-01-20 2016-06-22 王晓光 一种视频网络会议的人物识别方法及系统
WO2016165261A1 (zh) * 2015-04-13 2016-10-20 中兴通讯股份有限公司 一种视频会议的方法、服务器及终端
CN108965776A (zh) * 2017-08-21 2018-12-07 北京视联动力国际信息技术有限公司 一种通信方法以及通信系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1433209A (zh) * 2003-02-26 2003-07-30 北京艾尼通科技有限公司 固定电话/移动电话/ip电话接入ip视频会议系统的方法
US20050041646A1 (en) * 2003-06-27 2005-02-24 Marconi Communications, Inc. Audio mixer and method
CN1710924A (zh) * 2005-05-30 2005-12-21 杭州海康威视数字技术有限公司 用于ip视频会议终端的电话语音网关控制电路
CN1762145A (zh) * 2002-12-12 2006-04-19 皇家飞利浦电子股份有限公司 用于移动视频通信的化身数据库
CN1326400C (zh) * 2001-12-20 2007-07-11 松下电器产业株式会社 虚拟电视通话装置
CN101352039A (zh) * 2005-11-15 2009-01-21 通用仪表公司 具有自动用户检测和识别能力的视频电话设备
CN101437140A (zh) * 2008-12-17 2009-05-20 杭州华三通信技术有限公司 一种多画面传输方法和一种多点控制单元

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1326400C (zh) * 2001-12-20 2007-07-11 松下电器产业株式会社 虚拟电视通话装置
CN1762145A (zh) * 2002-12-12 2006-04-19 皇家飞利浦电子股份有限公司 用于移动视频通信的化身数据库
CN1433209A (zh) * 2003-02-26 2003-07-30 北京艾尼通科技有限公司 固定电话/移动电话/ip电话接入ip视频会议系统的方法
US20050041646A1 (en) * 2003-06-27 2005-02-24 Marconi Communications, Inc. Audio mixer and method
CN1710924A (zh) * 2005-05-30 2005-12-21 杭州海康威视数字技术有限公司 用于ip视频会议终端的电话语音网关控制电路
CN101352039A (zh) * 2005-11-15 2009-01-21 通用仪表公司 具有自动用户检测和识别能力的视频电话设备
CN101437140A (zh) * 2008-12-17 2009-05-20 杭州华三通信技术有限公司 一种多画面传输方法和一种多点控制单元

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105247854A (zh) * 2013-05-31 2016-01-13 佩克普股份公司 用于将外部设备关联到视频会议会话的方法和系统
WO2016165261A1 (zh) * 2015-04-13 2016-10-20 中兴通讯股份有限公司 一种视频会议的方法、服务器及终端
CN105706443A (zh) * 2016-01-20 2016-06-22 王晓光 一种视频网络会议的人物识别方法及系统
WO2017124340A1 (zh) * 2016-01-20 2017-07-27 王晓光 一种视频网络会议的人物识别方法及系统
CN108965776A (zh) * 2017-08-21 2018-12-07 北京视联动力国际信息技术有限公司 一种通信方法以及通信系统

Similar Documents

Publication Publication Date Title
EP2154885B1 (en) A caption display method and a video communication control device
JP5638997B2 (ja) 会議出席者間の相互作用に従ってcp配置を適合させるための方法およびシステム
CN100459711C (zh) 一种视频压缩方法及使用该方法的视频系统
US7508413B2 (en) Video conference data transmission device and data transmission method adapted for small display of mobile terminals
US20020093531A1 (en) Adaptive display for video conferences
EP2214410A2 (en) Method and system for conducting continuous presence conferences
US8743172B2 (en) Image capturing for video conference system
CN103096020B (zh) 视讯会议系统、视讯会议装置及其方法
CN101645952A (zh) 会议电话终端、系统及共享数据的方法
CN108933914B (zh) 一种使用移动终端进行视频会议的方法及系统
WO2014154065A2 (zh) 传输数据方法、媒体采集设备、视频会议终端及存储介质
CN112272281B (zh) 一种区域分布式视频会议系统
CN102892032A (zh) 实时互动高清网络视频通讯系统
US20050021620A1 (en) Web data conferencing system and method with full motion interactive video
CN101895717A (zh) 一种视频会议中显示纯语音终端图像的方法
CN103957391A (zh) 在可视对讲中多方通话时同时显示各方视频的方法及系统
CN102438119B (zh) 一种数字电视的音视频通讯系统
JP2001268078A (ja) 通信制御装置、その方法およびその提供媒体と通信装置
CN101635820B (zh) 一种具有多媒体通信功能的机顶盒系统
CN100531360C (zh) 一种具有多媒体通信功能的机顶盒系统
JP3031320B2 (ja) ビデオ会議装置
JP2000217091A (ja) テレビ会議システム
KR20080047683A (ko) 휴대용 단말기에서 스트리밍 서비스 전송 방법 및 장치
JP3475541B2 (ja) 画像通信端末装置
KR20050105542A (ko) 화면 분할 기능을 가지는 이동통신단말기

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20101124