CN110225288A - 一种信息处理转化装置 - Google Patents

一种信息处理转化装置 Download PDF

Info

Publication number
CN110225288A
CN110225288A CN201910385649.2A CN201910385649A CN110225288A CN 110225288 A CN110225288 A CN 110225288A CN 201910385649 A CN201910385649 A CN 201910385649A CN 110225288 A CN110225288 A CN 110225288A
Authority
CN
China
Prior art keywords
module
electrically connected
output end
terminal
input terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910385649.2A
Other languages
English (en)
Inventor
黄河
吕燕仪
马云鹏
叶舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201910385649.2A priority Critical patent/CN110225288A/zh
Publication of CN110225288A publication Critical patent/CN110225288A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Telephone Function (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及信息处理与转化技术领域,且公开了一种信息处理转化装置,包括输入设备,所述输入设备的输入端与摄像头的输出端电连接,所述输入设备的输出端与视频会议终端的输入端电连接,所述视频会议终端的输出端与扬声器的输入端电连接,所述视频会议终端与接收处理模块双向电连接,所述视频会议终端与外接移动移动终端双向电连接,所述接收处理模块与识别模块双向电连接,识别模块与转化模块双向电连接,所述转化模块的输出端与储存单元的输入端电连接,所述转化模块的输出端与旋转控制器的输入端电连接,并将此信息传递至视频会议终端,选择开启或关闭扬声器,达到对精神不集中的参议人员提醒的效果。

Description

一种信息处理转化装置
技术领域
本发明涉及信息处理与转化技术领域,具体为一种信息处理转化装置。
背景技术
视频会议,是指位于两个或多个地点的人们,通过通信设备和网络,进行面对面交谈的会议,根据参会地点数目不同,视频会议可分为点对点会议和多点会议,随着科技与网络的迅速发展,通过移动设备就可开启视频会议,在一些大型的的公司与企业里,通常设置有专用的视频会议室,视频会议往往会围绕一个主题而展开,人们通过摄像头与音频输入设备表达自己的观点,这时需要对一些有用的信息进行记录,但大多数人记录的手速远比不上别人表达观点的语速,这就会导致信息记录不完整,随着科技的发展,信息转化技术也慢慢应用于人们的日常生活中,最常见的便是将语音信息转化为文字信息,将此项功能应用于视频会议中可弥补手速慢带来的缺陷,此外因为视频会议不能做到真实的面对面交流,不能对一些精神不集中的会议员进行提醒,导致会议精神不能准确的传达,因此一种新型信息处理转化装置应运而生。
发明内容
为实现上述根据关键字自动记录信息及提醒会议成员的目的,本发明提供如下技术方案:一种信息处理转化装置,包括输入设备,所述输入设备的输入端与摄像头的输出端电连接,所述输入设备的输出端与视频会议终端的输入端电连接,所述视频会议终端的输出端与扬声器的输入端电连接,所述视频会议终端与接收处理模块双向电连接,所述视频会议终端与外接移动移动终端双向电连接,所述接收处理模块与识别模块双向电连接,所述识别模块与转化模块双向电连接,所述转化模块的输出端与储存单元的输入端电连接,所述转化模块的输出端与旋转控制器的输入端电连接,所述旋转控制器的输出端与摄像头的输入端电连接,所述视频会议终端与外接移动终端双向电连接。
本发明的有益效果是:该该信息处理及转化装置,通过摄像头和输入设备的配合,将会议的内容及人员呈现在双方的面前,根据提前设定好的会议关键字,接收处理模块将相关信息处理并转换为文字记录保存下来,达到自动记录的效果,通过识别系统内的人脸识别技术,既可以确保参议人员的准确性,又能真切的观察到参议人员的表情及神态变化,通过旋转控制器调节摄像头的角度,并将此信息传递至视频会议终端,选择开启或关闭扬声器,达到对精神不集中的参议人员提醒的效果。
优选的,所述输入设备包括音频和视频信号输入端。
优选的,所述接收处理模板包括处理并保存语音模块、处理并保存视频模板。
优选的,所述识别模块包括关键字模块、人脸识别模块。
优选的,所述转化模块包括语音转化成文字模块、记录并保存人的形态模块。
优选的,所述处理并保存语音模块、处理并保存视频模块依次与关键字模块、人脸识别模块双向电性连接,所述关键字模块的输出端与语音转化成文字模块的输入端电连接,所述人脸识别模块的输出端与记录并保存人的形态模块的输入端电性连接。
附图说明
图1为本发明系统示意;
图2为本发明电脑终端处理示意图;
图3为本发明关键字处理示意图;
图4为接收处理模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-4,一种信息处理转化装置,包括输入设备,输入设备包括音频和视频信号输入端,输入设备的输入端与摄像头的输出端电连接,摄像头采用微软LifeCam HD,输入设备的输出端与视频会议终端的输入端电连接,视频会议终端采用V2 conference视频会议,视频会议终端的输出端与扬声器的输入端电连接,扬声器采用静点式低频扬声器,视频会议终端与接收处理模块双向电连接,接收处理模板包括处理并保存语音模块、处理并保存视频模板,视频会议终端与外接移动移动终端双向电连接,接收处理模块与识别模块双向电连接,识别模块包括关键字模块、人脸识别模块,识别模块与转化模块双向电连接,转化模块包括语音转化成文字模块、记录并保存人的形态模块,处理并保存语音模块、处理并保存视频模块依次与关键字模块、人脸识别模块双向电性连接,关键字模块的输出端与语音转化成文字模块的输入端电连接,人脸识别模块的输出端与记录并保存人的形态模块的输入端电性连接,转化模块的输出端与储存单元的输入端电连接,转化模块的输出端与旋转控制器的输入端电连接,旋转控制器的输出端与摄像头的输入端电连接,视频会议终端与外接移动终端双向电连接,首先,我们知道声音实际上是一种波,在开始语音识别之前,有时需要把首尾端的静音切除,降低对后续步骤造成的干扰。这个静音切除的操作一般称为VAD,需要用到信号处理的一些技术,分帧后,语音就变成了很多小段。但波形在时域上几乎没有描述能力,因此必须将波形作变换。常见的一种变换方法是提取MFCC特征,根据人耳的生理特性,把每一帧波形变成一个多维向量,可以简单地理解为这个向量包含了这帧语音的内容信息。这个过程叫做声学特征提取,最后可以利用某门语言本身的统计规律来帮助提升识别正确率,整个过程即完成了语音转化为文字的过程。
要对声音进行分析,需要对声音分帧,也就是把声音切开成一小段一小段,每小段称为一帧。分帧操作一般不是简单的切开,而是使用移动窗函数来实现
在使用时,调整好摄像头的位置,通过输入端将音频信号和视频信号输入到视频会议终端,根据提前设定好的会议关键字,音频信号经接收处理模块内的处理并保存信息模块进行处理,将与关键字有关的音频信号通过转化模块转化文字并进行记录保存,避免了记录员跟不上而漏掉信息的现象,当有参议人员出现精神不集中的现象时,面部和姿态都会有所变化,此变化通过视频信号的方式传递至视频会议终端,并经接收处理模块和人脸识别模块进行处理,然后通过转化模块转化成能够驱动旋转控制器驱动的信号,调整摄像头的位置准确找到该成员,并由视频会议终端开启扬声器,提醒该成员。
以上,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种信息处理转化装置,包括输入设备,其特征在于:所述输入设备的输入端与摄像头的输出端电连接,所述输入设备的输出端与视频会议终端的输入端电连接,所述视频会议终端的输出端与扬声器的输入端电连接,所述视频会议终端与接收处理模块双向电连接,所述视频会议终端与外接移动移动终端双向电连接,所述接收处理模块与识别模块双向电连接,所述识别模块与转化模块双向电连接,所述转化模块的输出端与储存单元的输入端电连接,所述转化模块的输出端与旋转控制器的输入端电连接,所述旋转控制器的输出端与摄像头的输入端电连接,所述视频会议终端与外接移动终端双向电连接。
2.根据权利要求1所述的一种信息处理转化装置,其特征在于:所述输入设备包括音频和视频信号输入端。
3.根据权利要求1所述的一种信息处理转化装置,其特征在于:所述接收处理模板包括处理并保存语音模块、处理并保存视频模板。
4.根据权利要求1所述的一种信息处理转化装置,其特征在于:所述识别模块包括关键字模块、人脸识别模块。
5.根据权利要求1所述的一种信息处理转化装置,其特征在于:所述转化模块包括语音转化成文字模块、记录并保存人的形态模块。
6.根据权利要求1所述的一种信息处理转化装置,其特征在于:所述处理并保存语音模块、处理并保存视频模块依次与关键字模块、人脸识别模块双向电性连接,所述关键字模块的输出端与语音转化成文字模块的输入端电连接,所述人脸识别模块的输出端与记录并保存人的形态模块的输入端电性连接。
CN201910385649.2A 2019-05-09 2019-05-09 一种信息处理转化装置 Withdrawn CN110225288A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910385649.2A CN110225288A (zh) 2019-05-09 2019-05-09 一种信息处理转化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910385649.2A CN110225288A (zh) 2019-05-09 2019-05-09 一种信息处理转化装置

Publications (1)

Publication Number Publication Date
CN110225288A true CN110225288A (zh) 2019-09-10

Family

ID=67820764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910385649.2A Withdrawn CN110225288A (zh) 2019-05-09 2019-05-09 一种信息处理转化装置

Country Status (1)

Country Link
CN (1) CN110225288A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101309390A (zh) * 2007-05-17 2008-11-19 华为技术有限公司 视讯通信系统、装置及其字幕显示方法
CN103186663A (zh) * 2012-12-28 2013-07-03 中联竞成(北京)科技有限公司 一种基于视频的网络舆情监测方法及系统
US20130297650A1 (en) * 2011-09-12 2013-11-07 Wenlong Li Using Multimedia Search to Identify Products
CN104994335A (zh) * 2015-06-11 2015-10-21 广东欧珀移动通信有限公司 一种报警的方法及终端
CN109523441A (zh) * 2018-12-20 2019-03-26 合肥凌极西雅电子科技有限公司 一种基于视频识别的教学管理方法和系统
CN109670395A (zh) * 2018-10-29 2019-04-23 四川文轩教育科技有限公司 一种基于人工智能的学生专注度监测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101309390A (zh) * 2007-05-17 2008-11-19 华为技术有限公司 视讯通信系统、装置及其字幕显示方法
US20130297650A1 (en) * 2011-09-12 2013-11-07 Wenlong Li Using Multimedia Search to Identify Products
CN103186663A (zh) * 2012-12-28 2013-07-03 中联竞成(北京)科技有限公司 一种基于视频的网络舆情监测方法及系统
CN104994335A (zh) * 2015-06-11 2015-10-21 广东欧珀移动通信有限公司 一种报警的方法及终端
CN109670395A (zh) * 2018-10-29 2019-04-23 四川文轩教育科技有限公司 一种基于人工智能的学生专注度监测方法
CN109523441A (zh) * 2018-12-20 2019-03-26 合肥凌极西雅电子科技有限公司 一种基于视频识别的教学管理方法和系统

Similar Documents

Publication Publication Date Title
US10249304B2 (en) Method and system for using conversational biometrics and speaker identification/verification to filter voice streams
CN103888581B (zh) 一种通信终端及其记录通话信息的方法
CN110049270B (zh) 多人会议语音转写方法、装置、系统、设备及存储介质
US9571638B1 (en) Segment-based queueing for audio captioning
US10776588B2 (en) Smartphone-based telephone translation system
CN101308654B (zh) 一种语音分析识别方法、系统与装置
CN109309804A (zh) 一种智能会议系统
US20150310863A1 (en) Method and apparatus for speaker diarization
WO2020073633A1 (zh) 会议音箱及会议记录方法、设备、系统和计算机存储介质
CN103327181A (zh) 可提高用户获知语音信息效率的语音聊天方法
CN104766608A (zh) 一种语音控制方法及装置
US9497413B2 (en) Filtering video for video telephony and video conferencing
CN111683317B (zh) 一种应用于耳机的提示方法、装置、终端及存储介质
CN109560941A (zh) 会议记录方法、装置、智能终端及存储介质
CN108320761B (zh) 音频录制方法、智能录音设备及计算机可读存储介质
CN107910006A (zh) 语音识别方法、装置和多信源语音区分识别系统
CN207718803U (zh) 多信源语音区分识别系统
CN112908336A (zh) 一种用于语音处理装置的角色分离方法及其语音处理装置
CN107656923A (zh) 语音翻译方法和装置
CN110225288A (zh) 一种信息处理转化装置
CN208656882U (zh) 呼叫中心话务管理系统
CN110232919A (zh) 实时语音流提取与语音识别系统及方法
CN102932517A (zh) 通话内容存储方法及系统
US7912454B2 (en) Method and system for archiving data in real-time communications
CN110519470A (zh) 一种语音处理方法、服务器和语音接入装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20190910

WW01 Invention patent application withdrawn after publication