CN111554301A - 进行现场会议的方法、系统及装置、外接语音助手设备 - Google Patents

进行现场会议的方法、系统及装置、外接语音助手设备 Download PDF

Info

Publication number
CN111554301A
CN111554301A CN202010353929.8A CN202010353929A CN111554301A CN 111554301 A CN111554301 A CN 111554301A CN 202010353929 A CN202010353929 A CN 202010353929A CN 111554301 A CN111554301 A CN 111554301A
Authority
CN
China
Prior art keywords
voice
cloud
conference
voice information
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010353929.8A
Other languages
English (en)
Inventor
李智诚
张云翔
饶竹一
李厚恩
黄安子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Bureau Co Ltd
Original Assignee
Shenzhen Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Bureau Co Ltd filed Critical Shenzhen Power Supply Bureau Co Ltd
Priority to CN202010353929.8A priority Critical patent/CN111554301A/zh
Publication of CN111554301A publication Critical patent/CN111554301A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及进行现场会议的方法及其系统、外接语音助手设备,所述方法包括:进行现场会议时,接收参会人员发出的第一语音信息,并将所述第一语音信息发送至云端以唤醒云端的语音识别功能;在唤醒云端的语音识别功能之后,接收参会人员发出的第二语音信息,并将所述第二语音信息发送至云端;将所述第二语音信息发送至云端之后,接收云端返回的控制指令;将所述控制指令发送至会议计算机设备,以控制所述会议计算机设备执行相应任务。所述系统与所述方法对应,所述外接语音助手设备包括所述系统,实施本发明能够提高现场会议的会议效率和流畅度。

Description

进行现场会议的方法、系统及装置、外接语音助手设备
技术领域
本发明涉及语音技术领域,具体涉及进行现场会议的方法、系统及装置、外接语音助手设备。
背景技术
现场会议是日常工作中最常用的交流方式之一,主要用于日常问题的讨论,会议过程很多时候会用到会议计算机设备,例如通过电脑、投影仪等会议设备进行演示PPT材料、打开某一个文档等,这些操作目前都是手动操作,影响会议流畅度,耗时耗力,导致会议效率不高。
发明内容
本发明旨在提出进行现场会议的方法、系统及装置、外接语音助手设备,能够提高现场会议的会议效率和流畅度。
第一方面,本发明实施例提出一种进行现场会议的方法,包括:
进行现场会议时,接收参会人员发出的第一语音信息,并将所述第一语音信息发送至云端以唤醒云端的语音识别功能;
在唤醒云端的语音识别功能之后,接收参会人员发出的第二语音信息,并将所述第二语音信息发送至云端;
将所述第二语音信息发送至云端之后,接收云端返回的控制指令;
将所述控制指令发送至会议计算机设备,以控制所述会议计算机设备执行相应任务。
作为可选实施方式,当云端接收到第一语音信息时,云端对所述第一语音信息进行语音识别得到第一语音文本,将所述第一语音文本与预设的唤醒关键词进行匹配,若语音文本与预设的唤醒关键词匹配一致,则唤醒云端的语音识别功能。
作为可选实施方式,所述控制指令为云端对所述第二语音信息进行语音文本识别得到第二语音文本,对第二语音文本进行意图识别得到语音意图,并根据所述语音意图生成。
作为可选实施方式,在唤醒云端的语音识别功能之后,若在预设时间内云端未接收到第二语音信息,则云端的语音识别功能进入休眠。
第二方面,本发明实施例提出一种进行现场会议的装置,包括:
第一语音处理单元,用于进行现场会议时,接收参会人员发出的第一语音信息,并将所述第一语音信息发送至云端以唤醒云端的语音识别功能;
第二语音处理单元,用于在唤醒云端的语音识别功能之后,接收参会人员发出的第二语音信息,并将所述第二语音信息发送至云端;
指令接收单元,用于将所述第二语音信息发送至云端之后,接收云端返回的控制指令;以及
指令发送单元,用于将所述控制指令发送至会议计算机设备,以控制所述会议计算机设备执行相应任务。
作为可选实施方式,所述控制指令为云端对所述第二语音信息进行语音文本识别得到第二语音文本,对第二语音文本进行意图识别得到语音意图,并根据所述语音意图生成。
第三方面,本发明实施例提出一种进行现场会议的系统,包括云端以及根据第二方面实施例所述的进行现场会议的装置;所述云端用于接收第一语音信息,并对所述第一语音信息进行语音识别得到第一语音文本,将所述第一语音文本与预设的唤醒关键词进行匹配,若语音文本与预设的唤醒关键词匹配一致,则唤醒云端的语音识别功能;在唤醒云端的语音识别功能之后,若在预设时间内云端未接收到第二语音信息,则云端的语音识别功能进入休眠。
第四方面,本发明实施例提出一种外接语音助手设备,包括麦克风、以及根据第二方面实施例所述的进行现场会议的装置,所述麦克风包括壳体以及设置于该壳体内的语音采集模块,所述语音采集模块用于采用阵列语音采集方式采集第一语音信息、第二语音信息,对采集得到的语音信息进行时域滤波、频域滤波后发送至所述进行现场会议的装置;所述进行现场会议的装置设置于所述麦克风的壳体内。
作为可选实施方式,所述进行现场会议的装置连接信号传输线一端,所述信号传输线另一端连接有USB接头,所述USB接头用于与所述会议计算机设备连接。
作为可选实施方式,所述信号传输线与所述USB接头连接处套接有防护套。
以上实施例方案至少具有以下优点:进行现场会议时,接收参会人员发出的语音信息,并将所述语音信息发送至云端进行语音识别,并接收云端返回的通过语音识别得到的控制指令,最后将所述控制指令发送至会议计算机设备,以控制所述会议计算机设备执行相应任务,例如是演示PPT材料、打开某一个文档等等,能够实现智能化语音控制,提高会议流畅度和会议效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而得以体现。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的在一些实施例中,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例中一种进行现场会议的方法流程图。
图2为本发明一实施例中一种进行现场会议的装置框架图。
图3为本发明一实施例中一种进行现场会议的系统框架图。
图4为本发明一实施例中一种外接语音助手设备的一视角的结构示意图。
图5为本发明一实施例中一种外接语音助手设备的另一视角的结构示意图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
另外,为了更好的说明本发明,在下文的具体实施例中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的手段、元件和电路未作详细描述,以便于凸显本发明的主旨。
如图1所示,本发明实施例提出一种进行现场会议的方法,包括:
步骤S1、进行现场会议时,接收参会人员发出的第一语音信息,并将所述第一语音信息发送至云端以唤醒云端的语音识别功能;
其中,当云端接收到第一语音信息时,云端对所述第一语音信息进行语音识别得到第一语音文本,将所述第一语音文本与预设的唤醒关键词进行匹配,若语音文本与预设的唤醒关键词匹配一致,则唤醒云端的语音识别功能。
其中,所述唤醒关键词可以预先自定义设置,例如为“启动语音控制”。
其中,所述云端设置有语音识别系统,能够对语音信息进行语音识别并将语音信息转换为语音文本。
步骤S2、在唤醒云端的语音识别功能之后,接收参会人员发出的第二语音信息,并将所述第二语音信息发送至云端;
步骤S3、将所述第二语音信息发送至云端之后,接收云端返回的控制指令;
其中,所述控制指令为云端对所述第二语音信息进行语音文本识别得到第二语音文本,对第二语音文本进行意图识别得到语音意图,并根据所述语音意图生成。
具体而言,步骤中首先将第二语音信息转换为第二语音文本,然后利用NLP引擎识别第二语音文本的意图,具体地,第二语音文本应当为预设的语料,也就是说,云端的NPL引擎的语料库存储有第二语音文本这一个语料,否则,云端的NPL引擎无法识别语音文本的意图。例如,“下一页PPT”,此时,NPL引擎识别出语音文本的意图为打开下一页PPT,则生成与意图对应的控制指令。
步骤S4、将所述控制指令发送至会议计算机设备,以控制所述会议计算机设备执行相应任务。
具体而言,所述会议计算机设备例如是电脑、投影仪,电脑是工作会议中常用的会议设备,开会时经常性会使用电脑和投影仪来显示会议需要讨论的内容,常用的形式例如是PPT投影、打开某个功能系统、打开某一个文档等等。
使用本实施例方法进行现场会议时,接收参会人员发出的语音信息,并将所述语音信息发送至云端进行语音识别,并接收云端返回的通过语音识别得到的控制指令,最后将所述控制指令发送至会议计算机设备,以控制所述会议计算机设备执行相应任务,例如是演示PPT材料、打开某一个文档等等,能够实现智能化语音控制,提高会议流畅度和会议效率。
在一较佳实施例中,在唤醒云端的语音识别功能之后,若在预设时间内云端未接收到第二语音信息,则云端的语音识别功能进入休眠。
具体而言,本实施例为了节省耗电,云端在一定时间内如果没有接收到第二语音信息,则云端的语音识别功能自动进行休眠状态。
如图2所示,本发明另一实施例提出一种进行现场会议的装置1,包括:
第一语音处理单元11,用于进行现场会议时,接收参会人员发出的第一语音信息,并将所述第一语音信息发送至云端以唤醒云端的语音识别功能;
第二语音处理单元12,用于在唤醒云端的语音识别功能之后,接收参会人员发出的第二语音信息,并将所述第二语音信息发送至云端;
指令接收单元13,用于将所述第二语音信息发送至云端之后,接收云端返回的控制指令;以及
指令发送单元14,用于将所述控制指令发送至会议计算机设备100,以控制所述会议计算机设备100执行相应任务。
在一较佳实施例中,所述控制指令为云端对所述第二语音信息进行语音文本识别得到第二语音文本,对第二语音文本进行意图识别得到语音意图,并根据所述语音意图生成。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
需说明的是,上述实施例所述装置与上述实施例所述方法对应,因此,上述实施例所述装置未详述部分可以参阅上述实施例所述方法的内容得到,此处不再赘述。
并且,上述实施例所述装置如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
如图3所示,本发明实施例提出一种进行现场会议的系统,包括云端2以及根据上述实施例所述的进行现场会议的装置1;所述云端2用于接收第一语音信息,并对所述第一语音信息进行语音识别得到第一语音文本,将所述第一语音文本与预设的唤醒关键词进行匹配,若语音文本与预设的唤醒关键词匹配一致,则唤醒云端2的语音识别功能;在唤醒云端2的语音识别功能之后,若在预设时间内云端2未接收到第二语音信息,则云端2的语音识别功能进入休眠。
如图4-5所示,本发明实施例提出一种外接语音助手设备200,包括麦克风3、以及根据上述实施例所述的进行现场会议的装置1,所述麦克风3包括壳体以及设置于该壳体内的语音采集模块,所述语音采集模块用于采用阵列语音采集方式采集第一语音信息、第二语音信息,对采集得到的语音信息进行时域滤波、频域滤波后发送至所述进行现场会议的装置;所述进行现场会议的装置设置于所述麦克风的壳体内。
其中,所述进行现场会议的装置连接信号传输线4一端,所述信号传输线4另一端连接有USB接头5,所述USB接头5用于与所述会议计算机设备100连接。
其中,所述信号传输线4与所述USB接头5连接处套接有防护套6。
其中,所述麦克风壳体的下端设置一变径头7,以连接固定所述信号传输线4。
本实施例的外接语音助手设备200在使用时,将USB接头与所述会议计算机设备连接,具体工作过程可以参阅上述实施例内容得到。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (10)

1.一种进行现场会议的方法,其特征在于,包括:
进行现场会议时,接收参会人员发出的第一语音信息,并将所述第一语音信息发送至云端以唤醒云端的语音识别功能;
在唤醒云端的语音识别功能之后,接收参会人员发出的第二语音信息,并将所述第二语音信息发送至云端;
将所述第二语音信息发送至云端之后,接收云端返回的控制指令;
将所述控制指令发送至会议计算机设备,以控制所述会议计算机设备执行相应任务。
2.根据权利要求1所述的进行现场会议的方法,其特征在于,其中,当云端接收到第一语音信息时,云端对所述第一语音信息进行语音识别得到第一语音文本,将所述第一语音文本与预设的唤醒关键词进行匹配,若语音文本与预设的唤醒关键词匹配一致,则唤醒云端的语音识别功能。
3.根据权利要求1所述的进行现场会议的方法,其特征在于,其中,所述控制指令为云端对所述第二语音信息进行语音文本识别得到第二语音文本,对第二语音文本进行意图识别得到语音意图,并根据所述语音意图生成。
4.根据权利要求1所述的进行现场会议的方法,其特征在于,在唤醒云端的语音识别功能之后,若在预设时间内云端未接收到第二语音信息,则云端的语音识别功能进入休眠。
5.一种进行现场会议的装置,其特征在于,包括:
第一语音处理单元,用于进行现场会议时,接收参会人员发出的第一语音信息,并将所述第一语音信息发送至云端以唤醒云端的语音识别功能;
第二语音处理单元,用于在唤醒云端的语音识别功能之后,接收参会人员发出的第二语音信息,并将所述第二语音信息发送至云端;
指令接收单元,用于将所述第二语音信息发送至云端之后,接收云端返回的控制指令;以及
指令发送单元,用于将所述控制指令发送至会议计算机设备,以控制所述会议计算机设备执行相应任务。
6.根据权利要求5所述的进行现场会议的装置,其特征在于,其中,所述控制指令为云端对所述第二语音信息进行语音文本识别得到第二语音文本,对第二语音文本进行意图识别得到语音意图,并根据所述语音意图生成。
7.一种进行现场会议的系统,包括云端以及根据权利要求5或6所述的进行现场会议的装置;
所述云端用于接收第一语音信息,并对所述第一语音信息进行语音识别得到第一语音文本,将所述第一语音文本与预设的唤醒关键词进行匹配,若语音文本与预设的唤醒关键词匹配一致,则唤醒云端的语音识别功能;在唤醒云端的语音识别功能之后,若在预设时间内云端未接收到第二语音信息,则云端的语音识别功能进入休眠。
8.一种外接语音助手设备,包括麦克风、以及根据权利要求5-7任一项所述的进行现场会议的装置,所述麦克风包括壳体以及设置于该壳体内的语音采集模块,所述语音采集模块用于采用阵列语音采集方式采集第一语音信息、第二语音信息,对采集得到的语音信息进行时域滤波、频域滤波后发送至所述进行现场会议的装置;所述进行现场会议的装置设置于所述麦克风的壳体内。
9.根据权利要求8所述的外接语音助手设备,其特征在于,所述进行现场会议的装置连接信号传输线一端,所述信号传输线另一端连接有USB接头,所述USB接头用于与所述会议计算机设备连接。
10.根据权利要求9所述的外接语音助手设备,其特征在于,所述信号传输线与所述USB接头连接处套接有防护套。
CN202010353929.8A 2020-04-29 2020-04-29 进行现场会议的方法、系统及装置、外接语音助手设备 Pending CN111554301A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010353929.8A CN111554301A (zh) 2020-04-29 2020-04-29 进行现场会议的方法、系统及装置、外接语音助手设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010353929.8A CN111554301A (zh) 2020-04-29 2020-04-29 进行现场会议的方法、系统及装置、外接语音助手设备

Publications (1)

Publication Number Publication Date
CN111554301A true CN111554301A (zh) 2020-08-18

Family

ID=72004168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010353929.8A Pending CN111554301A (zh) 2020-04-29 2020-04-29 进行现场会议的方法、系统及装置、外接语音助手设备

Country Status (1)

Country Link
CN (1) CN111554301A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9642225B1 (en) * 2016-10-20 2017-05-02 Kai-kong Ng Voice-controlled lighting control system
CN107610702A (zh) * 2017-09-22 2018-01-19 百度在线网络技术(北京)有限公司 终端设备待机唤醒方法、装置及计算机设备
CN109003608A (zh) * 2018-08-07 2018-12-14 北京东土科技股份有限公司 庭审控制方法、系统、计算机设备及存储介质
CN109887508A (zh) * 2019-01-25 2019-06-14 广州富港万嘉智能科技有限公司 一种基于声纹的会议自动记录方法、电子设备及存储介质
CN110602432A (zh) * 2019-08-23 2019-12-20 苏州米龙信息科技有限公司 基于生物识别的会议系统及会议数据传输方法
CN110858483A (zh) * 2018-08-23 2020-03-03 深圳市冠旭电子股份有限公司 智能设备、语音唤醒方法、语音唤醒装置及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9642225B1 (en) * 2016-10-20 2017-05-02 Kai-kong Ng Voice-controlled lighting control system
CN107610702A (zh) * 2017-09-22 2018-01-19 百度在线网络技术(北京)有限公司 终端设备待机唤醒方法、装置及计算机设备
CN109003608A (zh) * 2018-08-07 2018-12-14 北京东土科技股份有限公司 庭审控制方法、系统、计算机设备及存储介质
CN110858483A (zh) * 2018-08-23 2020-03-03 深圳市冠旭电子股份有限公司 智能设备、语音唤醒方法、语音唤醒装置及存储介质
CN109887508A (zh) * 2019-01-25 2019-06-14 广州富港万嘉智能科技有限公司 一种基于声纹的会议自动记录方法、电子设备及存储介质
CN110602432A (zh) * 2019-08-23 2019-12-20 苏州米龙信息科技有限公司 基于生物识别的会议系统及会议数据传输方法

Similar Documents

Publication Publication Date Title
CN105912092B (zh) 人机交互中的语音唤醒方法及语音识别装置
CN107277904A (zh) 一种终端及语音唤醒方法
CN107358954A (zh) 一种实时更换唤醒词的设备及方法
CN104795068A (zh) 机器人的唤醒控制方法及其控制系统
CN108877802A (zh) 一种集成语音唤醒功能的电路、电视和语音控制方法
CN106502649A (zh) 一种机器人服务唤醒方法及装置
CN111554000A (zh) 进行会议的方法、装置及系统、计算机设备
CN204028959U (zh) 一种便携式ic卡充值读写器
CN205264171U (zh) 一种摩尔斯码收发训练器
CN214670566U (zh) 一种计算机唤醒电路及计算机
CN108665900B (zh) 云端唤醒方法及系统、终端以及计算机可读存储介质
CN108846779A (zh) 一种智能电子班牌教学应用系统
CN103746819A (zh) 一种终端节能方法及终端、系统
CN111968641A (zh) 语音助手唤醒控制方法及装置、存储介质和电子设备
CN104850247A (zh) 把写的内容通过互联网实时输出到网络服务器的电子笔
CN111292716A (zh) 语音芯片和电子设备
CN111554301A (zh) 进行现场会议的方法、系统及装置、外接语音助手设备
CN213392751U (zh) 基于神经网络芯片的语音交互智能电风扇及电风扇系统
CN102131304A (zh) 一种网络连接方法及通讯终端
CN110910100A (zh) 一种事件提醒方法、装置、终端、存储介质以及系统
CN109525730A (zh) 一种语音提醒方法、装置、存储介质及空调
CN210864954U (zh) 一种金融服务智能交互系统
CN204965633U (zh) 一种智能门铃
CN208985324U (zh) 一种语音播报提示电路系统
CN207663457U (zh) 具有ocr及语音识别功能的电力信息录入设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200818

RJ01 Rejection of invention patent application after publication