CN111724814A - 一种一键式智能语音交互麦克风系统及使用方法 - Google Patents

一种一键式智能语音交互麦克风系统及使用方法 Download PDF

Info

Publication number
CN111724814A
CN111724814A CN202010575927.3A CN202010575927A CN111724814A CN 111724814 A CN111724814 A CN 111724814A CN 202010575927 A CN202010575927 A CN 202010575927A CN 111724814 A CN111724814 A CN 111724814A
Authority
CN
China
Prior art keywords
voice
module
interaction
quality evaluation
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010575927.3A
Other languages
English (en)
Inventor
周世来
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Xieke Industry Co ltd
Original Assignee
Guangdong Xieke Industry Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Xieke Industry Co ltd filed Critical Guangdong Xieke Industry Co ltd
Priority to CN202010575927.3A priority Critical patent/CN111724814A/zh
Publication of CN111724814A publication Critical patent/CN111724814A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/80Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W76/00Connection management
    • H04W76/10Connection setup
    • H04W76/14Direct-mode setup
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/005Discovery of network devices, e.g. terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种一键式智能语音交互麦克风系统及使用方法,包括一种一键式智能语音交互麦克风系统,包括搜索模块、接入模块、语音采集模块、处理模块、识别模块、评估模块以及交互模块,以及提供了一种方法,包括获取模拟信号波形宽度最大的多个语音信号波束,对选取的语音信号波束对应的模拟信号建立语音质量评估测试模型,并训练选取的语音信号波束的语音样本,得到均匀、稳定以及连续的语音样本,并依据均匀性、稳定性以及连续性进行语音质量评估并获取语音质量评估分数,输出语音质量评估分数最高的语音样本完成交互。

Description

一种一键式智能语音交互麦克风系统及使用方法
技术领域
本发明涉及一种电子设备技术领域,尤其是一种麦克风交互技术,具体为一种一键式智能语音交互麦克风系统及使用方法。
背景技术
随着无线麦克风电路技术的高速发展,无线麦克风系统性能越来越好,抗干扰能力越来越强,功能也越来越多。更换射频频率、频谱分析、红外线对频、扫描无干扰频率、频率分配、拾音灵敏度调节、发射功率设置、各通道音量和总音量控制、防啸叫移频器设置、效果器设置、均衡器调节、音频输出静噪控制等,各项功能是通过在无线麦克风发射机或无线麦克风接收机上的按键手动操作。性能强大了功能多了随之而来的是操作非常复杂,操作繁琐操作难度越来越大。
因此,现有技术中,例如公开号为:“CN104936091A” 公开了一种基于圆形麦克风阵列的智能交互方法及系统,该方法包括:通过圆形麦克风阵列接收用户语音信号;对所述语音信号进行去噪处理,得到去噪后的语音信号;对去噪后的不同波束方向的语音信号进行预识别,并选择识别得分最高的语音信号的波束方向作为目标说话人方向,后续对在所述目标说话人方向上去噪后的语音信号进行语音识别,得到语音识别结果;根据所述语音识别结果执行操作。可以有效提高麦克风阵列波束输出的语音信号的信噪比,进而提高语音识别效果,使人机交互更智能。
在上述中,利用语音信号的信噪比很难确定输入的语音信号,比如在比较嘈杂的环境中,大声的喊得到的语音信号的信噪比是最大的,仅通过信噪比无法得到用于的输入信号,必须要对语音信号的连续性、均匀性以及稳定性做出判断。而类似于大声的喊得到的语音信号是不具有连续性、均匀性以及稳定性的,因此可以有效的排出这些侵入信号。
发明内容
有鉴于此,本发明的目的在于提供一种一键式智能语音交互麦克风系统及使用方法。
为实现上述目的,本发明提供如下技术方案:
一种一键式智能语音交互麦克风系统,包括
搜索模块,用于启动蜂窝网络模块或蓝牙模块搜索麦克风周边的可用于与麦克风接入的智能设备请求信号,
接入模块,依据所述设备请求信号将智能设备与麦克风进行匹配连接,
语音采集模块,该语音采集模块通过麦克风阵列获取用户输入的语音信号,
处理模块,该处理模块对语音采集模块采集到的外部输入的语音信号进行去噪、傅里叶变换以及模拟转换得到清晰的模拟信号;
识别模块,用于至少获取模拟信号中波形宽度最大的两个语音信号波束,
评估模块,对选取的语音信号波束对应的模拟信号建立语音质量评估测试模型,并训练选取的语音信号波束的语音样本,进行语音质量评估并获取语音质量评估分数,输出语音质量评估分数最高的语音样本;
交互模块,根据所述的语音样本与接入的智能设备完成交互。
优选的,所述动蜂窝网络模块或蓝牙模块嵌入在所述的麦克风中,且在所述麦克风上设置有按键模块,该按键模块与控制模块连接,控制模块连接蜂窝网络模块及蓝牙模块。
优选的,所述蜂窝网络模块包括WiFi模块、zigbee模块、Wlan模块以及4/5G模块中的多种。
优选的,所述评估模块建立语音质量评估测试模型方法为:
依据模拟信号的波形宽度,获取每秒模拟信号波形的均匀、稳定以及连续程度,依据模拟信号波形的均匀、稳定以及连续程度建立语音质量评估模型。
优选的,所述语音质量评估模型的具体公式是:
Y =(∑A-A)+ £ *¢
其中:
Y是语音质量得分;
A是模拟信号的波形;
∑A是模拟信号的波形平均值数学期望;
£是待确定参数;
¢是每秒模拟信号的波形的连续度。
优选的,所述交互模块接收输入模块输入的交互指令,依据交互指令与接入的智能设备完成交互。
优选的,所述输入模块接收语音质量评估分数最高的语音样本,将该语音样本转化得到其对应的模拟信号,依据模拟信号得到语音信号。
一种一键式智能语音交互麦克风的使用方法,包括如下步骤:
在建立语音交互之前,通过按键模块开启搜索模块,并打开启动蜂窝网络模块或蓝牙模块,搜索模块依据蜂窝网络模块或蓝牙模块搜索到的智能设备信号,依据提供的麦克风匹配码与智能设备建立连接;
建立连接之后,按下语音采集按键,语音采集模块通过麦克风阵列获取用户输入的语音信号;
对语音采集模块采集到的外部输入的语音信号进行去噪、傅里叶变换以及模拟转换得到清晰的模拟信号;
至少获取模拟信号中波形宽度最大的两个语音信号波束;
对选取的语音信号波束对应的模拟信号建立语音质量评估测试模型,并训练选取的语音信号波束的语音样本,进行语音质量评估并获取语音质量评估分数,输出语音质量评估分数最高的语音样本;
根据所述的语音样本与接入的智能设备完成交互。
与现有技术相比,本发明的有益效果是:
本发明通过对输入的语音信号进行转换得到模拟信号,获取模拟信号波形宽度最大的多个语音信号波束,对选取的语音信号波束对应的模拟信号建立语音质量评估测试模型,并训练选取的语音信号波束的语音样本,得到均匀、稳定以及连续的语音样本,并依据均匀性、稳定性以及连续性进行语音质量评估并获取语音质量评估分数,输出语音质量评估分数最高的语音样本完成交互,本发明对语音信号的连续性、均匀性以及稳定性做出判断评估。而类似于大声的喊得到的语音信号是不具有连续性、均匀性以及稳定性的,因此可以有效的排出这些侵入信号。
本发明通过按键操作,操作简单方便。
附图说明
图1为本发明中麦克风与智能设备的连接图;
图2为本发明中麦克风系统的原理图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,本发明提供一种一键式智能语音交互麦克风系统,包括
搜索模块,用于启动蜂窝网络模块或蓝牙模块搜索麦克风周边的可用于与麦克风接入的智能设备请求信号,
接入模块,依据所述设备请求信号将智能设备与麦克风进行匹配连接,
语音采集模块,该语音采集模块通过麦克风阵列获取用户输入的语音信号,
处理模块,该处理模块对语音采集模块采集到的外部输入的语音信号进行去噪、傅里叶变换以及模拟转换得到清晰的模拟信号;
识别模块,用于至少获取模拟信号中波形宽度最大的两个语音信号波束,
评估模块,对选取的语音信号波束对应的模拟信号建立语音质量评估测试模型,并训练选取的语音信号波束的语音样本,进行语音质量评估并获取语音质量评估分数,输出语音质量评估分数最高的语音样本;
交互模块,根据所述的语音样本与接入的智能设备完成交互。
在本发明中,所述动蜂窝网络模块或蓝牙模块嵌入在所述的麦克风中,且在所述麦克风上设置有按键模块,该按键模块与控制模块连接,控制模块连接蜂窝网络模块及蓝牙模块。
在本发明中,所述蜂窝网络模块包括WiFi模块、zigbee模块、Wlan模块以及4/5G模块中的多种。
在本发明中,所述交互模块接收输入模块输入的交互指令,依据交互指令与接入的智能设备完成交互。
在本发明中,所述输入模块接收语音质量评估分数最高的语音样本,将该语音样本转化得到其对应的模拟信号,依据模拟信号得到语音信号。
实施方式一
一种一键式智能语音交互麦克风的使用方法,包括如下步骤:
在建立语音交互之前,通过按键模块开启搜索模块,并打开启动蓝牙模块,搜索模块依据蓝牙模块搜索到的智能设备信号,依据提供的麦克风匹配码与智能设备通过蓝牙建立连接;
建立连接之后,按下语音采集按键,语音采集模块通过麦克风阵列获取用户输入的语音信号;
对语音采集模块采集到的外部输入的语音信号进行去噪、傅里叶变换以及模拟转换得到清晰的模拟信号;
至少获取模拟信号中波形宽度最大的两个语音信号波束;
对选取的语音信号波束对应的模拟信号建立语音质量评估测试模型,并训练选取的语音信号波束的语音样本,进行语音质量评估并获取语音质量评估分数,输出语音质量评估分数最高的语音样本;
根据所述的语音样本与接入的智能设备完成交互。
在上述中,所述评估模块建立语音质量评估测试模型方法为:
依据模拟信号的波形宽度,获取每秒模拟信号波形的均匀、稳定以及连续程度,依据模拟信号波形的均匀、稳定以及连续程度建立语音质量评估模型。
优选的,所述语音质量评估模型的具体公式是:
Y =(∑A-A)+ £ *¢
其中:
Y是语音质量得分;
A是模拟信号的波形;
∑A是模拟信号的波形平均值数学期望;
£是待确定参数;
¢是每秒模拟信号的波形的连续度。
实施方式二
一种一键式智能语音交互麦克风的使用方法,包括如下步骤:
在建立语音交互之前,通过按键模块开启搜索模块,并打开启动蜂窝网络模块,搜索模块依据蜂窝网络模块搜索到的智能设备信号,依据提供的麦克风匹配码与智能设备通过蜂窝网络模块建立连接;
建立连接之后,按下语音采集按键,语音采集模块通过麦克风阵列获取用户输入的语音信号;
对语音采集模块采集到的外部输入的语音信号进行去噪、傅里叶变换以及模拟转换得到清晰的模拟信号;
至少获取模拟信号中波形宽度最大的两个语音信号波束;
对选取的语音信号波束对应的模拟信号建立语音质量评估测试模型,并训练选取的语音信号波束的语音样本,进行语音质量评估并获取语音质量评估分数,输出语音质量评估分数最高的语音样本;
根据所述的语音样本与接入的智能设备完成交互。
在上述中,所述评估模块建立语音质量评估测试模型方法为:
依据模拟信号的波形宽度,获取每秒模拟信号波形的均匀、稳定以及连续程度,依据模拟信号波形的均匀、稳定以及连续程度建立语音质量评估模型。
优选的,所述语音质量评估模型的具体公式是:
Y =(∑A-A)+ £ *¢
其中:
Y是语音质量得分;
A是模拟信号的波形;
∑A是模拟信号的波形平均值数学期望;
£是待确定参数;
¢是每秒模拟信号的波形的连续度。
蜂窝网络模块包括WiFi模块、zigbee模块、Wlan模块以及4/5G模块中的多种。
本发明通过对输入的语音信号进行转换得到模拟信号,获取模拟信号波形宽度最大的多个语音信号波束,对选取的语音信号波束对应的模拟信号建立语音质量评估测试模型,并训练选取的语音信号波束的语音样本,得到均匀、稳定以及连续的语音样本,并依据均匀性、稳定性以及连续性进行语音质量评估并获取语音质量评估分数,输出语音质量评估分数最高的语音样本完成交互,本发明对语音信号的连续性、均匀性以及稳定性做出判断评估。而类似于大声的喊得到的语音信号是不具有连续性、均匀性以及稳定性的,因此可以有效的排出这些侵入信号。
本使用新型中未涉及部分均与现有技术相同或可采用现有技术加以实现。尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种一键式智能语音交互麦克风系统,包括
搜索模块,用于启动蜂窝网络模块或蓝牙模块搜索麦克风周边的可用于与麦克风接入的智能设备请求信号,
接入模块,依据所述设备请求信号将智能设备与麦克风进行匹配连接,
语音采集模块,该语音采集模块通过麦克风阵列获取用户输入的语音信号,
处理模块,该处理模块对语音采集模块采集到的外部输入的语音信号进行去噪、傅里叶变换以及模拟转换得到清晰的模拟信号;
识别模块,用于至少获取模拟信号中波形宽度最大的两个语音信号波束,
评估模块,对选取的语音信号波束对应的模拟信号建立语音质量评估测试模型,并训练选取的语音信号波束的语音样本,进行语音质量评估并获取语音质量评估分数,输出语音质量评估分数最高的语音样本;
交互模块,根据所述的语音样本与接入的智能设备完成交互。
2.根据权利要求1所述的一键式智能语音交互麦克风系统,其特征在于,所述动蜂窝网络模块或蓝牙模块嵌入在所述的麦克风中,且在所述麦克风上设置有按键模块,该按键模块与控制模块连接,控制模块连接蜂窝网络模块及蓝牙模块。
3.根据权利要求1所述的一键式智能语音交互麦克风系统,其特征在于,所述蜂窝网络模块包括WiFi模块、zigbee模块、Wlan模块以及4/5G模块中的多种。
4.根据权利要求1所述的一键式智能语音交互麦克风系统,其特征在于,所述评估模块建立语音质量评估测试模型方法为:
依据模拟信号的波形宽度,获取每秒模拟信号波形的均匀、稳定以及连续程度,依据模拟信号波形的均匀、稳定以及连续程度建立语音质量评估模型。
5.根据权利要求1或4所述的一键式智能语音交互麦克风系统,其特征在于,所述语音质量评估模型的具体公式是:
Y =(∑A-A)+ £ *¢
其中:
Y是语音质量得分;
A是模拟信号的波形;
∑A是模拟信号的波形平均值数学期望;
£是待确定参数;
¢是每秒模拟信号的波形的连续度。
6.根据权利要求1所述的一键式智能语音交互麦克风系统,其特征在于,所述交互模块接收输入模块输入的交互指令,依据交互指令与接入的智能设备完成交互。
7.根据权利要求6所述的一键式智能语音交互麦克风系统,其特征在于,所述输入模块接收语音质量评估分数最高的语音样本,将该语音样本转化得到其对应的模拟信号,依据模拟信号得到语音信号。
8.一种一键式智能语音交互麦克风的使用方法,其特征在于,包括如下步骤:
在建立语音交互之前,通过按键模块开启搜索模块,并打开启动蜂窝网络模块或蓝牙模块,搜索模块依据蜂窝网络模块或蓝牙模块搜索到的智能设备信号,依据提供的麦克风匹配码与智能设备建立连接;
建立连接之后,按下语音采集按键,语音采集模块通过麦克风阵列获取用户输入的语音信号;
对语音采集模块采集到的外部输入的语音信号进行去噪、傅里叶变换以及模拟转换得到清晰的模拟信号;
至少获取模拟信号中波形宽度最大的两个语音信号波束;
对选取的语音信号波束对应的模拟信号建立语音质量评估测试模型,并训练选取的语音信号波束的语音样本,进行语音质量评估并获取语音质量评估分数,输出语音质量评估分数最高的语音样本;
根据所述的语音样本与接入的智能设备完成交互。
CN202010575927.3A 2020-06-22 2020-06-22 一种一键式智能语音交互麦克风系统及使用方法 Pending CN111724814A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010575927.3A CN111724814A (zh) 2020-06-22 2020-06-22 一种一键式智能语音交互麦克风系统及使用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010575927.3A CN111724814A (zh) 2020-06-22 2020-06-22 一种一键式智能语音交互麦克风系统及使用方法

Publications (1)

Publication Number Publication Date
CN111724814A true CN111724814A (zh) 2020-09-29

Family

ID=72570001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010575927.3A Pending CN111724814A (zh) 2020-06-22 2020-06-22 一种一键式智能语音交互麦克风系统及使用方法

Country Status (1)

Country Link
CN (1) CN111724814A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5457783A (en) * 1992-08-07 1995-10-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear prediction
JP2015022236A (ja) * 2013-07-22 2015-02-02 日本放送協会 信号処理装置及びプログラム
CN104936091A (zh) * 2015-05-14 2015-09-23 科大讯飞股份有限公司 基于圆形麦克风阵列的智能交互方法及系统
US20180012617A1 (en) * 2015-04-29 2018-01-11 Intel Corporation Microphone array noise suppression using noise field isotropy estimation
CN109672966A (zh) * 2018-12-21 2019-04-23 歌尔股份有限公司 一种语音拾取方法、装置和系统
CN109920442A (zh) * 2019-03-15 2019-06-21 厦门大学 一种麦克风阵列语音增强的方法和系统
CN213366133U (zh) * 2020-06-22 2021-06-04 广东西欧克实业有限公司 一种一键式智能语音交互麦克风系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5457783A (en) * 1992-08-07 1995-10-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear prediction
JP2015022236A (ja) * 2013-07-22 2015-02-02 日本放送協会 信号処理装置及びプログラム
US20180012617A1 (en) * 2015-04-29 2018-01-11 Intel Corporation Microphone array noise suppression using noise field isotropy estimation
CN104936091A (zh) * 2015-05-14 2015-09-23 科大讯飞股份有限公司 基于圆形麦克风阵列的智能交互方法及系统
CN109672966A (zh) * 2018-12-21 2019-04-23 歌尔股份有限公司 一种语音拾取方法、装置和系统
CN109920442A (zh) * 2019-03-15 2019-06-21 厦门大学 一种麦克风阵列语音增强的方法和系统
CN213366133U (zh) * 2020-06-22 2021-06-04 广东西欧克实业有限公司 一种一键式智能语音交互麦克风系统

Similar Documents

Publication Publication Date Title
US9542938B2 (en) Scene recognition method, device and mobile terminal based on ambient sound
CN113810072B (zh) 宽频段双通道无线电监测接收系统及侦测信号的方法
CN111445920B (zh) 一种多声源的语音信号实时分离方法、装置和拾音器
WO2014117722A1 (zh) 语音处理方法、装置及终端设备
CN1186963C (zh) 用于互联网装置的带有送话器/扬声器的无线遥控系统以及用于控制其中遥控器工作的方法
CN206559550U (zh) 一种内置麦克风阵列的遥控器及电视系统
CN108538297B (zh) 一种基于无线麦克风阵列的智能语音交互方法及交互系统
CN107004426A (zh) 录取录像对象的声音的方法和移动终端
CN112185410B (zh) 音频处理方法及装置
CN213366133U (zh) 一种一键式智能语音交互麦克风系统
CN105744056A (zh) 音量调节方法及装置
CN110931019B (zh) 公安语音数据采集方法、装置、设备和计算机存储介质
CN105515609B (zh) 一种移动水声跳频通信接收系统的幅度均衡电路
CN111724814A (zh) 一种一键式智能语音交互麦克风系统及使用方法
CN109088611A (zh) 一种声波通信系统的自动增益控制方法和装置
CN108597513A (zh) 基于5.8GHz无线传输电视远场语音识别系统及方法
CN102322928B (zh) 电子秤、移动设备和体重测量系统及无线传输方法
CN107465987A (zh) 一种语音交互音箱成品拾音系统的测试方法及其测试系统
CN218162834U (zh) 一种音箱系统
CN111341351A (zh) 基于自注意力机制的语音活动检测方法、装置及存储介质
CN110099328A (zh) 一种智能音箱
CN112565973B (zh) 终端、终端控制方法、装置及存储介质
CN113870879A (zh) 智能家电麦克风的共享方法、智能家电和可读存储介质
CN110351690B (zh) 一种智能语音系统及其语音处理方法
CN107017006B (zh) 基于无限冲击响应滤波器的模拟亚音尾音检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination