CN110865789A - 基于语音识别的智能开启麦克风的方法及系统 - Google Patents

基于语音识别的智能开启麦克风的方法及系统 Download PDF

Info

Publication number
CN110865789A
CN110865789A CN201911141247.4A CN201911141247A CN110865789A CN 110865789 A CN110865789 A CN 110865789A CN 201911141247 A CN201911141247 A CN 201911141247A CN 110865789 A CN110865789 A CN 110865789A
Authority
CN
China
Prior art keywords
microphone
voice recognition
prompt
participant
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911141247.4A
Other languages
English (en)
Inventor
陈洪浩
冯文澜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suirui Technology Group Co Ltd
Original Assignee
Suirui Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suirui Technology Group Co Ltd filed Critical Suirui Technology Group Co Ltd
Priority to CN201911141247.4A priority Critical patent/CN110865789A/zh
Publication of CN110865789A publication Critical patent/CN110865789A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种基于语音识别的智能开启麦克风的方法及系统,基于语音识别的智能开启麦克风的方法包括:基于签到信息和平台通讯录生成语音识别库;基于语音识别库进行会议语音识别并进行匹配;以及对匹配结果进行语义分析判断;其中,若分析判断语义为呼叫参会人时,预开启参会人所在会场的麦克风并进行检测;其中,当麦克风有语音输入,则开启参会人的麦克风。借此,本发明的基于语音识别的智能开启麦克风的方法,无需手动打开麦克风,符合开启麦克风的条件即可智能开启待发言成员所在会场的麦克风。

Description

基于语音识别的智能开启麦克风的方法及系统
技术领域
本发明是关于视频会议技术领域,特别是关于一种基于语音识别的智能开启麦克风的方法及系统。
背景技术
视频会议过程中,经常会涉及多方会议,通过各会议室终端、参会成员的移动终端(笔记本、手机)为了声音清楚不杂乱,需要让大部分成员所在会议室终端、或成员所使用的移动终端保持静音状态,在需要说话的时候打开需要发言的成员所在会场麦克风或终端的麦克风,以保证更好的会议效果,但是目前现有麦克风开启方式,需要手动开启,或只有主持人收到指令手动开启相应终端的麦克风;操作不便,而且会发生成员发言很久后发现未打开麦克风的情况,体验不好,没有真实会议场景的融入感。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本发明的目的在于提供一种基于语音识别的智能开启麦克风的方法及系统,无需手动打开麦克风,符合开启麦克风的条件即可智能开启待发言成员所在会场的麦克风。
为实现上述目的,本发明一方面提供了一种基于语音识别的智能开启麦克风的方法,包括:基于签到信息和平台通讯录生成语音识别库;基于语音识别库进行会议语音识别并进行匹配;对匹配结果进行语义分析判断;以及其中,若分析判断语义为呼叫参会人时,预开启参会人所在会场的麦克风并进行检测;其中,当麦克风有语音输入,则开启参会人的麦克风。
在本发明的一实施方式中,平台通讯录包括:参会人姓名、昵称及他人对其备注的称呼。
在本发明的一实施方式中,签到信息的获取方式包括:人脸识别、手动签到、刷卡签到及移动终端加入会议自动签到。
在本发明的一实施方式中,麦克风开启失败时,向主持人发出反馈提醒,且反馈提醒为文字提示或语音提示。
在本发明的一实施方式中,麦克风开启失败时,向参会人发出反馈提醒,且反馈提醒为文字提示或语音提示。
本发明另一方面提供了一种基于语音识别的智能开启麦克风的系统,包括:语音识别库、语音识别模块、语义分析模块以及麦克风控制模块。语音识别库,包括签到信息和平台通讯录;语音识别模块,与语音识别库通信连接,且语音识别库用以基于语音识别库进行会议语音识别并进行匹配;语义分析模块,与语音识别模块通信连接,且语义分析模块用以对语音识别模块的匹配结果进行语义分析判断;以及麦克风控制模块,与语义分析模块通信连接,且麦克风控制模块用以接收语义分析模块的分析判断语义的结果;其中,若分析判断语义为呼叫参会人时,麦克风控制模块预开启参会人所在会场的麦克风并进行检测;其中,当麦克风有语音输入,则麦克风控制模块开启参会人的麦克风。
在本发明的一实施方式中,麦克风控制模块预开启麦克风并进行检测的时长为2秒至20秒之间,若麦克风在检测时长内未应答,则麦克风开启失败。
在本发明的一实施方式中,麦克风开启失败时,麦克风控制模块向主持人发出反馈提醒,且反馈提醒为文字提示或语音提示。
在本发明的一实施方式中,麦克风开启失败时,麦克风控制模块向参会人发出反馈提醒,且反馈提醒为文字提示或语音提示。
与现有技术相比,根据本发明的基于语音识别的智能开启麦克风的方法及系统,基于签到信息和平台通讯录整合作为语音识别库,把重心由会议室变为会议成员,从而使会议更智能、真实,且提升了用户体验;会议过程中,交流自然流畅,无需对麦克风进行手动管理,符合开启麦克风的条件即可智能开启待发言成员所在会场的麦克风;通过语音开启指令和麦克风输入指令双重指令来最终开启麦克风,充分保护了参会成员的隐私。
附图说明
图1是根据本发明一实施方式的基于语音识别的智能开启麦克风的方法及系统的流程示意图;
图2是根据本发明一实施方式的基于语音识别的智能开启麦克风的方法及系统的麦克风控制模块的逻辑流程图。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
图1是根据本发明一实施方式的基于语音识别的智能开启麦克风的方法及系统的流程示意图,如图1所示,根据本发明一优选实施方式的一种基于语音识别的智能开启麦克风的方法,包括步骤S1至S4:
在步骤S1中,基于签到信息和平台通讯录生成语音识别库。优选地,签到信息的获取方式包括:人脸识别、手动签到、刷卡签到及移动终端加入会议自动签到,用于确定会议室的在场成员及所在会场等信息。优选地,平台通讯录包括:参会人姓名、昵称及他人对其备注的称呼。结合签到信息和平台通讯录生成语音识别库(语音识别库内生成有查询表)。
在步骤S2中,语音识别模块基于语音识别库进行会议语音识别并进行匹配;
在步骤S3中,语义分析模块对语音识别模块的匹配结果进行语义分析判断,分析主要语句是呼叫某人还是谈及某人或指挥操作(会议内容)。优选地,分析判断语义为呼叫某参会成员时,根据语音识别库内的查询表找到该参会人所在会场,进行麦克风的控制。优选地,语义分析模块每次分析完成后都会生成记录,且可以进行语义学习和编辑,从而更加智能。
在步骤S4中,麦克风控制模块用以接收语义分析模块的分析判断语义的结果。
图2是根据本发明一实施方式的基于语音识别的智能开启麦克风的方法及系统的麦克风控制模块的逻辑流程图,如图2所示,麦克风控制模块若分析判断语义为呼叫参会人时,麦克风控制模块预开启参会人所在会场的麦克风并进行检测(检测该参会人的麦克风),当麦克风有语音输入,则判断为开启麦克风的条件成立,从而麦克风控制模块开启参会人的麦克风,方便该参会人与其他参会人直接沟通。优选地,如麦克风没有语音输入,则判断为麦克风开启条件不成立,不开启麦克风,继续保持静音状态。
呼唤后未收到任何应答时,不确定是因为麦克风开启故障还是对方不应答原因,为此,麦克风开启失败时可以反馈提醒,如问题提示或语音提示,提示语例如可以是“对方无应答”、“该成员不在”等,也可以由参会人自定义。
呼唤后未收到任何应答也有可能是待发言参会成员溜号导致,也可在麦克风开启失败时,可以向待发言参会成员反馈提醒,提示语例如可以是“刚会议中呼唤您,您未进行应答,麦克风开启失败”等。
另外,以上均采用了开启成员所在会场的会场麦克风的情况,但实际会议中,成员可以在某个会场中还开启自己的移动终端(笔记本、手机)进行会议的过程,由于会场较大,距离麦克风较远时发言人声音较小。
因此在识别成员的麦克风时可以根据基于签到信息判断该成员在会场的同时是否也采用了移动终端进行签到,优先选择距离该成员最近的移动终端的麦克风。
根据本发明另一优选实施方式的一种基于语音识别的智能开启麦克风的系统,包括:语音识别库、语音识别模块、语义分析模块以及麦克风控制模块。语音识别库,包括签到信息和平台通讯录;语音识别模块,与语音识别库通信连接,且语音识别库用以基于语音识别库进行会议语音识别并进行匹配;语义分析模块,与语音识别模块通信连接,且语义分析模块用以对语音识别模块的匹配结果进行语义分析判断;以及麦克风控制模块,与语义分析模块通信连接,且麦克风控制模块用以接收语义分析模块的分析判断语义的结果;其中,若分析判断语义为呼叫参会人时,麦克风控制模块预开启参会人所在会场的麦克风并进行检测;其中,当麦克风有语音输入,则麦克风控制模块开启参会人的麦克风。
在本发明的一实施方式中,麦克风控制模块预开启麦克风并进行检测的时长为2秒至20秒之间,若麦克风在检测时长内未应答,则麦克风开启失败。
在本发明的一实施方式中,麦克风开启失败时,麦克风控制模块向主持人发出反馈提醒,且反馈提醒为文字提示或语音提示;麦克风控制模块向参会人发出反馈提醒,且反馈提醒为文字提示或语音提示。
总之,本发明的基于语音识别的智能开启麦克风的方法及系统,基于签到信息和平台通讯录整合作为语音识别库,把重心由会议室变为会议成员,从而使会议更智能、真实,且提升了用户体验;会议过程中,交流自然流畅,无需对麦克风进行手动管理,符合开启麦克风的条件即可智能开启待发言成员所在会场的麦克风;通过语音开启指令和麦克风输入指令双重指令来最终开启麦克风,对实际场景做更智能的判断,充分保护了参会成员的隐私。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。

Claims (10)

1.一种基于语音识别的智能开启麦克风的方法,其特征在于,包括:
基于签到信息和平台通讯录生成语音识别库;
基于所述语音识别库进行会议语音识别并进行匹配;以及
对匹配结果进行语义分析判断;
其中,若分析判断语义为呼叫参会人时,预开启所述参会人所在会场的麦克风并进行检测;
其中,当所述麦克风有语音输入,则开启所述参会人的所述麦克风。
2.如权利要求1所述的基于语音识别的智能开启麦克风的方法,其特征在于,所述平台通讯录包括:参会人姓名、昵称及他人对其备注的称呼。
3.如权利要求1所述的基于语音识别的智能开启麦克风的方法,其特征在于,所述签到信息的获取方式包括:人脸识别、手动签到、刷卡签到及移动终端加入会议自动签到。
4.如权利要求1所述的基于语音识别的智能开启麦克风的方法,其特征在于,预开启所述麦克风并进行检测的时长为2秒至20秒之间,若所述麦克风在检测时长内未应答,则所述麦克风开启失败。
5.如权利要求4所述的基于语音识别的智能开启麦克风的方法,其特征在于,所述麦克风开启失败时,向主持人发出反馈提醒,且所述反馈提醒为文字提示或语音提示。
6.如权利要求4所述的基于语音识别的智能开启麦克风的方法,其特征在于,所述麦克风开启失败时,向所述参会人发出反馈提醒,且所述反馈提醒为文字提示或语音提示。
7.一种基于语音识别的智能开启麦克风的系统,其特征在于,包括:
语音识别库,包括签到信息和平台通讯录;
语音识别模块,与所述语音识别库通信连接,且所述语音识别库用以基于所述语音识别库进行会议语音识别并进行匹配;
语义分析模块,与所述语音识别模块通信连接,且所述语义分析模块用以对所述语音识别模块的匹配结果进行语义分析判断;以及
麦克风控制模块,与所述语义分析模块通信连接,且所述麦克风控制模块用以接收所述语义分析模块的分析判断语义的结果;
其中,若分析判断语义为呼叫参会人时,所述麦克风控制模块预开启所述参会人所在会场的麦克风并进行检测;
其中,当所述麦克风有语音输入,则所述麦克风控制模块开启所述参会人的所述麦克风。
8.如权利要求7所述的基于语音识别的智能开启麦克风的系统,其特征在于,所述麦克风控制模块预开启所述麦克风并进行检测的时长为2秒至20秒之间,若所述麦克风在检测时长内未应答,则所述麦克风开启失败。
9.如权利要求8所述的基于语音识别的智能开启麦克风的系统,其特征在于,所述麦克风开启失败时,所述麦克风控制模块向主持人发出反馈提醒,且所述反馈提醒为文字提示或语音提示。
10.如权利要求8所述的基于语音识别的智能开启麦克风的系统,其特征在于,所述麦克风开启失败时,所述麦克风控制模块向所述参会人发出反馈提醒,且所述反馈提醒为文字提示或语音提示。
CN201911141247.4A 2019-11-20 2019-11-20 基于语音识别的智能开启麦克风的方法及系统 Pending CN110865789A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911141247.4A CN110865789A (zh) 2019-11-20 2019-11-20 基于语音识别的智能开启麦克风的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911141247.4A CN110865789A (zh) 2019-11-20 2019-11-20 基于语音识别的智能开启麦克风的方法及系统

Publications (1)

Publication Number Publication Date
CN110865789A true CN110865789A (zh) 2020-03-06

Family

ID=69656015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911141247.4A Pending CN110865789A (zh) 2019-11-20 2019-11-20 基于语音识别的智能开启麦克风的方法及系统

Country Status (1)

Country Link
CN (1) CN110865789A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111429914A (zh) * 2020-03-30 2020-07-17 招商局金融科技有限公司 麦克风控制方法、电子装置及计算机可读存储介质
CN113438360A (zh) * 2021-06-18 2021-09-24 当代世界(北京)信息科技研究院 一种安卓客户端基于人工智能与语音识别的截屏方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0887293A (ja) * 1994-09-16 1996-04-02 Matsushita Electric Ind Co Ltd 音声検出方法および音声検出マイクロフォン
US20070030984A1 (en) * 2005-08-02 2007-02-08 Gotfried Bradley L Conference system
US20080167868A1 (en) * 2007-01-04 2008-07-10 Dimitri Kanevsky Systems and methods for intelligent control of microphones for speech recognition applications
CN204331453U (zh) * 2015-01-05 2015-05-13 北京仁歌视听科技有限公司 用于控制会议系统的语音控制装置
CN105513596A (zh) * 2013-05-29 2016-04-20 华为技术有限公司 一种语音控制方法和控制设备
CN110430492A (zh) * 2019-08-07 2019-11-08 王家春 一种智能语音交互语音控制的无线麦克风系统及其实现方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0887293A (ja) * 1994-09-16 1996-04-02 Matsushita Electric Ind Co Ltd 音声検出方法および音声検出マイクロフォン
US20070030984A1 (en) * 2005-08-02 2007-02-08 Gotfried Bradley L Conference system
US20080167868A1 (en) * 2007-01-04 2008-07-10 Dimitri Kanevsky Systems and methods for intelligent control of microphones for speech recognition applications
CN105513596A (zh) * 2013-05-29 2016-04-20 华为技术有限公司 一种语音控制方法和控制设备
CN204331453U (zh) * 2015-01-05 2015-05-13 北京仁歌视听科技有限公司 用于控制会议系统的语音控制装置
CN110430492A (zh) * 2019-08-07 2019-11-08 王家春 一种智能语音交互语音控制的无线麦克风系统及其实现方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111429914A (zh) * 2020-03-30 2020-07-17 招商局金融科技有限公司 麦克风控制方法、电子装置及计算机可读存储介质
CN113438360A (zh) * 2021-06-18 2021-09-24 当代世界(北京)信息科技研究院 一种安卓客户端基于人工智能与语音识别的截屏方法

Similar Documents

Publication Publication Date Title
US10678501B2 (en) Context based identification of non-relevant verbal communications
US12002464B2 (en) Systems and methods for recognizing a speech of a speaker
US10958457B1 (en) Device control based on parsed meeting information
US7995732B2 (en) Managing audio in a multi-source audio environment
US7844460B2 (en) Automatic creation of an interactive log based on real-time content
US10586131B2 (en) Multimedia conferencing system for determining participant engagement
CN101860713A (zh) 为不支持视频的视频电话参与者提供非言辞通信的描述
US20150154960A1 (en) System and associated methodology for selecting meeting users based on speech
KR20200005617A (ko) 화자 구분
US10199035B2 (en) Multi-channel speech recognition
US11909784B2 (en) Automated actions in a conferencing service
CN111936964B (zh) 非中断性nui命令
CN106409286A (zh) 一种实现音频处理的方法及装置
WO2022093623A1 (en) Methods and systems for automatic queuing in conference calls
CN110865789A (zh) 基于语音识别的智能开启麦克风的方法及系统
CN106326804B (zh) 一种录音控制方法和装置
US11783836B2 (en) Personal electronic captioning based on a participant user's difficulty in understanding a speaker
US8775163B1 (en) Selectable silent mode for real-time audio communication system
US20210327416A1 (en) Voice data capture
CN113726956A (zh) 一种来电接听控制方法、装置、终端设备及存储介质
CN110600036A (zh) 基于语音识别的会议画面切换装置及其方法
CN112969000A (zh) 网络会议的控制方法、装置、电子设备和存储介质
JP6596913B2 (ja) スケジュール作成装置、スケジュール作成方法、プログラム
CN111935348A (zh) 提供通话处理服务的方法和装置
CN112365888B (zh) 意图识别方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200306