CN111508486A - 一种语音控制大屏展示系统 - Google Patents
一种语音控制大屏展示系统 Download PDFInfo
- Publication number
- CN111508486A CN111508486A CN202010283169.8A CN202010283169A CN111508486A CN 111508486 A CN111508486 A CN 111508486A CN 202010283169 A CN202010283169 A CN 202010283169A CN 111508486 A CN111508486 A CN 111508486A
- Authority
- CN
- China
- Prior art keywords
- module
- voice
- instruction
- screen display
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09F—DISPLAYING; ADVERTISING; SIGNS; LABELS OR NAME-PLATES; SEALS
- G09F9/00—Indicating arrangements for variable information in which the information is built-up on a support by selection or combination of individual elements
- G09F9/30—Indicating arrangements for variable information in which the information is built-up on a support by selection or combination of individual elements in which the desired character or characters are formed by combining individual elements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
本发明公开了一种语音控制大屏展示系统,包括应用显示模块、控制设备连接模块、语音采集模块、语音处理模块、指令理解模块、指令唤醒模块、大屏展示模块。本发明通过通过各个模块之间的相互配合能够实现语音控制大屏展示,代替了传统的手动鼠标按键控制大屏展示,不仅大大简化了投屏操作步骤,节约了用户的指挥控制时间,提高了工作效率,而且使用户得到了更好的使用体验。
Description
技术领域
本发明属于大屏应用系统控制领域,尤其涉及一种语音控制大屏展示系统。
背景技术
大屏展示,是指将图形、图像、视频等影像通过大屏幕展示出来,目前,传统的大屏展示控制系统还停留在通过鼠标按键频繁操作执行,不仅操作繁琐,而且浪费时间,效率低下。
发明内容
本发明的目的在于克服现有技术存在的以上问题,提供一种语音控制大屏展示系统,代替了传统的手动鼠标按键控制大屏展示系统,不仅大大简化了投屏操作步骤,节约了用户的指挥控制时间,提高了工作效率,而且使用户得到了更好的使用体验。
为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
一种语音控制大屏展示系统,包括应用显示模块、控制设备连接模块、语音采集模块、语音处理模块、指令理解模块、指令唤醒模块、大屏展示模块;
所述应用显示模块包括底图机、显示屏、应用显示框架,底图机用于接入需要大屏展示的影像材料,并将影像材料发送至应用显示框架,显示屏用于显示应用显示框架,应用显示框架内预先设定有业务执行命令文字,应用显示框架与匹配模块、大屏展示模块相连;
所述控制设备连接模块包括无线麦克风、有线麦克风、蓝牙麦克风和麦克风合成器,三组麦克风同时工作,麦克风合成器用于将三组麦克风采集语音合成一个语音,保证大屏控制工作不会出现断连和跳连的状况;
所述语音采集模块用于通过麦克风采集用户输入的语音,并将采集到的语音发送到语音处理模块,从而使语音处理模块对采集到的音频进行处理;
所述语音处理模块包括音频接收单元、音频识别单元、有效音频提取单元、音频存储单元、音频转换单元,音频接收单元用于接收语音采集模块采集的音频并将接收到的音频发送至音频识别单元,音频识别单元用于识别音频中的有效音频和噪音音频并将有效音频和噪音音频区分开,有效音频提取单元用于将噪音音频消除而保留有效音频信号,音频存储单元用于将有效音频进行存储并发送给音频转换单元,音频转换单元用于将有效音频信号转换成指令文字信号并将指令文字信号发送至指令理解模块;
所述指令理解模块包括文字信号接收单元、匹配单元,文字信号接收单元用于接收音频转换单元发送的指令文字信号并将指令文字信号发送至匹配单元,匹配单元用于将指令文字与应用显示框架内呈现出的当前业务执行命令文字进行匹配理解,若指令文字与当前业务执行命令文字相同时表示匹配成功则应用显示框架内跳转出下一步业务执行命令文字,并将最终的业务执行命令发送至指令唤醒模块,若指令文字与设定的执行命令文字不相同时表示匹配理解失败,则表示用户语音输入有误,应用显示框架内的当前业务执行命令文字不跳转,用户重新输入指令语音;
所述指令唤醒模块用于用户通过语音或按键指令启动大屏展示模块,大屏展示模块被唤醒后,指令唤醒模块最终将业务执行命令发送至大屏显示模块;
所述大屏展示模块包括控制器、大屏显示器,控制器输入接口与应用显示模块相连接,控制器输出接口与大屏显示器连接,控制器被指令唤醒模块唤醒启动后,控制器接收到最终业务执行命令信号后将应用显示框架内需要展示的影像内容发送至大屏显示器,通过大屏显示器展示出来。
进一步地,所述底图机使用windows系统。
进一步地,所述应用显示框架为Electron显示框架,支持C语言开发,同时针对底图机提供对应的本地化影像编解码接口。
本发明的有益效果是:
1、本发明通过通过各个模块之间的相互配合能够实现语音控制大屏展示,代替了传统的手动鼠标按键控制大屏展示,不仅大大简化了投屏操作步骤,节约了用户的指挥控制时间,提高了工作效率,而且使用户得到了更好的使用体验;
2、通过语音采集模块榆语音处理模块的相互配合,能够对输入的语音进行噪音消除处理,从而能够准确获取用户的有效指令语音,保证了大屏展示工作的顺利进行。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本系统的整体结构示意图;
图2是本系统的局部结构示意图;
图3是本系统的局部结构示意图;
图4是本系统的局部结构示意图;
图5是本系统的局部结构示意图;
图6是本系统的局部结构示意图;
图7是本系统的局部结构示意图;
图8是本系统的局部结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
一种语音控制大屏展示系统,其特征在于:包括应用显示模块、控制设备连接模块、语音采集模块、语音处理模块、指令理解模块、指令唤醒模块、大屏展示模块,
如图1所示的一种语音控制大屏展示系统,包括应用显示模块、控制设备连接模块、语音采集模块、语音处理模块、指令理解模块、指令唤醒模块、大屏展示模块,控制设备连接模块与语音采集模块相连接,语音处理模块与语音采集模块相连接,指令理解模块与语音处理模块、应用显示模块、指令唤醒模块相连接,指令唤醒模块与大屏展示模块相连接,大屏展示模块与应用显示模块相连接;
如图2所示应用显示模块包括底图机、显示屏、应用显示框架,底图机使用windows系统,底图机用于接入需要大屏展示的影像材料,并将影像材料发送至应用显示框架,显示屏用于显示应用显示框架,且显示屏上安装有摄像头,应用显示框架为Electron显示框架,支持C语言开发,同时针对底图机提供对应的本地化影像编码接口,应用显示框架内预先设定有业务执行命令文字,应用显示框架与匹配模块、大屏展示模块相连,使用时用户需要先启动底图机,将需要大屏展示的影像拷贝进底图机,同时底图机将影像通过本地化影像接口将影像自动输入到应用显示框架内部;
如图3所示控制设备连接模块包括无线麦克风、有线麦克风、蓝牙麦克风和麦克风合成器,三组麦克风同时工作,麦克风合成器用于将三组麦克风采集语音合成一个语音,保证大屏控制工作不会出现断连和跳连的状况;
如图4所示所述语音采集模块用于通过麦克风采集用户输入的语音,并将采集到的语音发送到语音处理模块,从而使语音处理模块对采集到的音频进行处理;
如图5所示语音处理模块包括音频接收单元、音频识别单元、有效音频提取单元、音频存储单元、音频转换单元,音频接收单元用于接收语音采集模块采集的音频并将接收到的音频发送至音频识别单元,音频识别单元用于识别音频中的有效音频和噪音音频并将有效音频和噪音音频区分开,有效音频提取单元用于将噪音音频消除而保留有效音频信号,音频存储单元用于将有效音频进行存储并发送给音频转换单元,音频转换单元用于将有效音频信号转换成指令文字信号并将指令文字信号发送至指令理解模块;
如图6所示指令理解模块包括文字信号接收单元、匹配单元,文字信号接收单元用于接收音频转换单元发送的指令文字信号并将指令文字信号发送至匹配单元,匹配单元用于将指令文字与应用显示框架内呈现出的当前业务执行命令文字进行匹配,若指令文字与当前业务执行命令文字相同时表示匹配成功则应用显示框架内跳转出下一步业务执行命令文字,直至应用显示框架内出现“完成”字样,此时应用显示框架将完成信号发送至指令唤醒模块,若指令文字与设定的执行命令文字不相同时表示匹配失败,则表示用户语音输入有误,应用显示框架内的当前业务执行命令文字不跳转,用户重新输入指令语音;
如图7所示指令唤醒模块用于用户通过语音或按键指令启动大屏展示模块,大屏展示模块被唤醒后,指令唤醒模块将最终业务执行命令发送至大屏显示模块;
如图8所示大屏展示模块包括控制器、大屏显示器,控制器输入接口与应用显示模块相连接,控制器输出接口与大屏显示器连接,控制器被指令唤醒模块唤醒启动后,控制器接收到最终业务执行命令信号后将应用显示框架内需要展示的影像内容发送至大屏显示器,通过大屏显示器展示出来。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
Claims (3)
1.一种语音控制大屏展示系统,其特征在于:包括应用显示模块、控制设备连接模块、语音采集模块、语音处理模块、指令理解模块、指令唤醒模块、大屏展示模块;
所述应用显示模块包括底图机、显示屏、应用显示框架,底图机用于接入需要大屏展示的影像材料,并将影像材料发送至应用显示框架,显示屏用于显示应用显示框架,应用显示框架内预先设定有业务执行命令文字,应用显示框架与匹配模块、大屏展示模块相连;
所述控制设备连接模块包括无线麦克风、有线麦克风、蓝牙麦克风和麦克风合成器,三组麦克风同时工作,麦克风合成器用于将三组麦克风采集语音合成一个语音,保证大屏控制工作不会出现断连和跳连的状况;
所述语音采集模块用于通过麦克风采集用户输入的语音,并将采集到的语音发送到语音处理模块,从而使语音处理模块对采集到的音频进行处理;
所述语音处理模块包括音频接收单元、音频识别单元、有效音频提取单元、音频存储单元、音频转换单元,音频接收单元用于接收语音采集模块采集的音频并将接收到的音频发送至音频识别单元,音频识别单元用于识别音频中的有效音频和噪音音频并将有效音频和噪音音频区分开,有效音频提取单元用于将噪音音频消除而保留有效音频信号,音频存储单元用于将有效音频进行存储并发送给音频转换单元,音频转换单元用于将有效音频信号转换成指令文字信号并将指令文字信号发送至指令理解模块;
所述指令理解模块包括文字信号接收单元、匹配单元,文字信号接收单元用于接收音频转换单元发送的指令文字信号并将指令文字信号发送至匹配单元,匹配单元用于将指令文字与应用显示框架内呈现出的当前业务执行命令文字进行匹配理解,若指令文字与当前业务执行命令文字相同时表示匹配成功则应用显示框架内跳转出下一步业务执行命令文字,并将最终的业务执行命令发送至指令唤醒模块,若指令文字与设定的执行命令文字不相同时表示匹配理解失败,则表示用户语音输入有误,应用显示框架内的当前业务执行命令文字不跳转,用户重新输入指令语音;
所述指令唤醒模块用于用户通过语音或按键指令启动大屏展示模块,大屏展示模块被唤醒后,指令唤醒模块最终将业务执行命令发送至大屏显示模块;
所述大屏展示模块包括控制器、大屏显示器,控制器输入接口与应用显示模块相连接,控制器输出接口与大屏显示器连接,控制器被指令唤醒模块唤醒启动后,控制器接收到最终业务执行命令信号后将应用显示框架内需要展示的影像内容发送至大屏显示器,通过大屏显示器展示出来。
2.根据权利要求1所述的一种语音控制大屏展示系统,其特征在于:所述底图机使用windows系统。
3.根据权利要求1所述的一种语音控制大屏展示系统,其特征在于:所述应用显示框架为Electron显示框架,支持C语言开发,同时针对底图机提供对应的本地化影像编解码接口。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010283169.8A CN111508486A (zh) | 2020-04-13 | 2020-04-13 | 一种语音控制大屏展示系统 |
CN202011362357.6A CN112509576A (zh) | 2020-04-13 | 2020-11-27 | 一种语音控制大屏展示系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010283169.8A CN111508486A (zh) | 2020-04-13 | 2020-04-13 | 一种语音控制大屏展示系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111508486A true CN111508486A (zh) | 2020-08-07 |
Family
ID=71864083
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010283169.8A Pending CN111508486A (zh) | 2020-04-13 | 2020-04-13 | 一种语音控制大屏展示系统 |
CN202011362357.6A Pending CN112509576A (zh) | 2020-04-13 | 2020-11-27 | 一种语音控制大屏展示系统 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011362357.6A Pending CN112509576A (zh) | 2020-04-13 | 2020-11-27 | 一种语音控制大屏展示系统 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN111508486A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112201237A (zh) * | 2020-09-23 | 2021-01-08 | 安徽中科新辰技术有限公司 | 一种基于com口实现语音集中控制指挥大厅多媒体设备的方法 |
CN112562694A (zh) * | 2020-12-02 | 2021-03-26 | 珠海格力电器股份有限公司 | 一种语音唤醒工业触摸屏的方法及装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114385291A (zh) * | 2021-12-29 | 2022-04-22 | 南京财经大学 | 一种基于外挂透明显示屏的标准工作流程引导方法及装置 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902501B (zh) * | 2012-09-26 | 2015-06-17 | 成都飞视美视频技术有限公司 | 文件多屏扩展显示的方法 |
CN203419063U (zh) * | 2013-04-08 | 2014-02-05 | 浙江海联电子有限公司 | 一种出租车顶灯语音控制系统 |
KR102106920B1 (ko) * | 2013-11-26 | 2020-05-06 | 엘지전자 주식회사 | 이동 단말기 및 이동 단말기의 제어 방법 |
KR20150112337A (ko) * | 2014-03-27 | 2015-10-07 | 삼성전자주식회사 | 디스플레이 장치 및 그 사용자 인터랙션 방법 |
CN104202506B (zh) * | 2014-09-10 | 2017-12-12 | 北京淳中科技股份有限公司 | 图像拼接处理器及其图像处理方法 |
CN204258972U (zh) * | 2014-11-26 | 2015-04-08 | 宁波蓝科电子工程有限公司 | 一种lcd无拼缝显示组合屏 |
CN204790967U (zh) * | 2015-06-30 | 2015-11-18 | 南京欧帝科技股份有限公司 | 一种可以显示高清图片的拼接处理器 |
CN105681579B (zh) * | 2016-03-11 | 2020-01-10 | Oppo广东移动通信有限公司 | 终端及其处于导航状态时的屏幕控制方法以及装置 |
CN107688447B (zh) * | 2016-08-05 | 2021-07-06 | 宁波Gqy视讯股份有限公司 | 图像处理服务器及具有其的超高分辨率显示系统 |
CN206575517U (zh) * | 2017-03-30 | 2017-10-20 | 南京洛菲特数码科技有限公司 | 一种高清图像处理拼接器 |
CN107507623A (zh) * | 2017-10-09 | 2017-12-22 | 维拓智能科技(深圳)有限公司 | 基于麦克风阵列语音交互的自助服务终端 |
CN207399423U (zh) * | 2017-11-02 | 2018-05-22 | 北京威泰嘉业科技有限公司 | 一种分布式网络视频处理装置 |
CN207399375U (zh) * | 2017-11-02 | 2018-05-22 | 北京威泰嘉业科技有限公司 | 一种图像拼接控制装置 |
CN207731259U (zh) * | 2018-01-04 | 2018-08-14 | 曲靖师范学院 | 一种多媒体金融股票数据展示装置 |
CN110062177A (zh) * | 2019-04-22 | 2019-07-26 | 安徽辰希科技有限公司 | 一种超高分应用投屏管理系统 |
CN110225386B (zh) * | 2019-05-09 | 2021-09-14 | 海信视像科技股份有限公司 | 一种显示控制方法、显示设备 |
CN110928468B (zh) * | 2019-10-09 | 2021-06-25 | 广州视源电子科技股份有限公司 | 智能交互平板的页面显示方法、装置、设备和存储介质 |
-
2020
- 2020-04-13 CN CN202010283169.8A patent/CN111508486A/zh active Pending
- 2020-11-27 CN CN202011362357.6A patent/CN112509576A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112201237A (zh) * | 2020-09-23 | 2021-01-08 | 安徽中科新辰技术有限公司 | 一种基于com口实现语音集中控制指挥大厅多媒体设备的方法 |
CN112201237B (zh) * | 2020-09-23 | 2024-04-19 | 安徽中科新辰技术有限公司 | 一种基于com口实现语音集中控制指挥大厅多媒体设备的方法 |
CN112562694A (zh) * | 2020-12-02 | 2021-03-26 | 珠海格力电器股份有限公司 | 一种语音唤醒工业触摸屏的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112509576A (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111508486A (zh) | 一种语音控制大屏展示系统 | |
CN102687197B (zh) | 声音识别用词典制作装置、声音识别装置及声音合成装置 | |
EP3537277A1 (en) | Screen capturing method and system for electronic device, and electronic device | |
US20110274311A1 (en) | Sign language recognition system and method | |
CN101902587A (zh) | 一种通过语音对电视机进行控制的系统 | |
CN113763958B (zh) | 语音唤醒方法、装置、电子设备和存储介质 | |
JP2012109901A (ja) | 資料提示装置 | |
JP2019036914A (ja) | 連携表示システム | |
CN102546953A (zh) | 一种全语音操控移动终端的系统及方法 | |
CN101576901A (zh) | 搜索请求的产生方法及移动通信设备 | |
EP3866475A1 (en) | Image text broadcasting method and device, electronic circuit, and computer program product | |
CN104122979A (zh) | 一种语音控制大屏幕的方法及装置 | |
CN116229977A (zh) | 基于虚拟数字人实现智能化实时交互问答的系统及其处理方法 | |
CN105529025B (zh) | 一种语音操作输入方法及电子设备 | |
CN1856142A (zh) | 设置移动终端中的主语言的方法和实现该方法的移动终端 | |
CN109614971A (zh) | 一种比对式文件检验仪 | |
CN111488744A (zh) | 多模态语言信息ai翻译方法、系统和终端 | |
CN103200363A (zh) | 存储照相机捕获图像的方法及装置 | |
CN107274886B (zh) | 一种语音识别方法和装置 | |
CN101964850A (zh) | 一种视频客服系统中数据推送的方法及视频客服系统 | |
CN113223520B (zh) | 一种软件操作实景语义理解的语音互动方法、系统及平台 | |
US20220319347A1 (en) | Text processing method and apparatus, and electronic device and non-transitory computer-readable medium | |
CN115453903A (zh) | 一种智能家居控制方法、装置、可穿戴设备及存储介质 | |
CN112578965A (zh) | 处理方法、装置和电子设备 | |
JPWO2020026360A1 (ja) | コンピュータシステム、画面共有方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200807 |
|
WD01 | Invention patent application deemed withdrawn after publication |