CN112489649A - 一种无线语音控制装置、系统及方法 - Google Patents
一种无线语音控制装置、系统及方法 Download PDFInfo
- Publication number
- CN112489649A CN112489649A CN202011339137.1A CN202011339137A CN112489649A CN 112489649 A CN112489649 A CN 112489649A CN 202011339137 A CN202011339137 A CN 202011339137A CN 112489649 A CN112489649 A CN 112489649A
- Authority
- CN
- China
- Prior art keywords
- voice
- information
- wireless
- acquiring
- voice data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012545 processing Methods 0.000 claims description 40
- 238000004891 communication Methods 0.000 claims description 27
- 230000005540 biological transmission Effects 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 19
- 230000009467 reduction Effects 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 5
- 230000003993 interaction Effects 0.000 abstract description 27
- 230000000694 effects Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 2
- 240000007651 Rubus glaucus Species 0.000 description 1
- 235000011034 Rubus glaucus Nutrition 0.000 description 1
- 235000009122 Rubus idaeus Nutrition 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请提供一种无线语音控制装置、系统及方法,该装置包括语音获取单元、控制单元、无线传输单元和语音广播单元。其优点在于,解决了无法进行一对多交互、资源利用率低的问题,实现了一对多同时交互、单一问题仅需查询一次、资源利用率高的技术效果。
Description
技术领域
本申请涉及音频广播技术领域,特别是涉及一种无线语音控制装置、系统及方法。
背景技术
在相关技术中,语音采集装置包括仅具有采集功能的语音采集装置和具有采集、交互功能的语音采集装置。顾名思义,仅具有采集功能的语音采集装置,只能采集语音,无法利用采集得到的语音进行实时的识别和交互。具有采集、交互功能的语音采集装置,如在线翻译机,可以利用采集得到的语音与后台进行识别、交互。
然而,上述语音采集装置,仅能进行一对一的交互,无法进行一对多交互,导致在需要多人交互的情况下,需要配备多个语音采集装置,导致购买成本、使用成本、储存成本均大幅度增加。此外,在多人交互的情况下,会出现多人同一时间询问相同问题的情况,导致后台出现拥挤、资源利用率低的问题。
目前针对相关技术中无法进行一对多交互、资源利用率低的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种无线语音控制装置、系统及方法,以至少解决相关技术中无法进行一对多交互、资源利用率低的问题。
第一方面,本申请实施例提供了一种无线语音控制装置,包括:
语音获取单元,用于获取用户的第一语音信息,并处理所述第一语音信息以获取第一语音数据;
控制单元,用于获取所述语音获取单元传输的所述第一语音数据;
无线传输单元,用于获取所述控制单元传输的所述第一语音数据、获取与所述第一语音数据相对应的第二语音数据、以及向传输所述第二语音数据至所述控制单元;
语音广播单元,用于获取所述控制单元传输的经所述控制单元处理所述第二语音数据获取的第二语音信息、广播所述第二语音信息至若干第二语音装置;
所述控制单元还传输所述第二语音信息至第一语音装置;
其中,所述第一语音装置与所述语音获取单元、所述控制单元通信连接,若干所述第二语音装置与所述语音广播单元通信连接。
在其中一些实施例中,还包括:
定位单元,用于获取所述无线语音控制装置的实时位置信息;
所述无线传输单元还用于获取与所述实时位置信息相对应的第三语音数据;
所述控制单元还用于对所述第三语音数据进行处理,以获取与所述第三语音数据相对应的第三语音信息,并将所述第三语音信息传输至所述第一语音装置;
所述语音广播单元还用于广播所述第三语音信息至若干所述第二语音装置。
在其中一些实施例中,还包括:
图像获取单元,用于获取预设位置的图像信息;
所述无线传输单元还用于获取与所述图像信息相对应的第四语音数据;
所述控制单元还用于对所述第四语音数据进行处理,以获取与所述第四语音数据相对应的第四语音信息,并将所述第四语音信息传输至所述第一语音装置;
所述语音广播单元还用于广播所述第四语音信息至若干所述第二语音装置。
在其中一些实施例中,所述语音获取单元包括:
获取模块,用于获取用户的所述第一语音信息;
降噪模块,用于对所述第一语音信息进行降噪处理,以获取与所述第一语音信息相对应的第一语音数据。
在其中一些实施例中,所述语音获取单元还包括:
转换模块,所述转换模块与所述降噪模块进行通信连接,用于对降噪处理后的所述第一语音信息进行转换,以获取与所述第一语音信息相对应的第一语音数据。
在其中一些实施例中,所述控制单元包括:
处理模块,用于处理所述第二语音数据,以获取与所述第二语音数据相对应的所述第二语音信息。
在其中一些实施例中,所述控制单元还包括:
监控模块,所述监控模块与所述处理模块通信连接,用于监控与所述控制单元连接的所述语音获取单元、所述无线传输单元、所述语音广播单元的工作状态,并在所述语音获取单元和/或所述无线传输单元和/或所述语音广播单元出现故障的情况下,生成报警信息;
所述处理模块还用于获取所述监控模块传输的所述报警信息,并将所述报警信息传输至所述第一语音装置进行播放。
第二方面,本申请实施例提供了一种无线语音控制系统,包括:
第一语音装置,用于获取用户的第一语音信息;
无线语音控制装置,用于获取所述第一语音装置传输的所述第一语音信息,获取所述无线语音控制装置的实时位置信息,获取预设位置的图像信息,处理所述第一语音信息以获取第一语音数据;
云平台,用于获取所述无线语音控制传输的所述第一语音数据、所述实时位置信息、所述图像信息,检索并获取与所述第一语音数据相对应的第二语音数据、与所述实时位置信息相对应的第三语音数据、与所述图像信息相对应的第四语音数据,传输所述第二语音数据、所述第三语音数据、所述第四语音数据至所述无线语音控制装置;
第二语音装置,用于获取所述无线语音控制装置传输的经所述无线语音控制装置处理所述第二语音数据获取的第二语音信息、获取所述无线语音控制装置传输的经所述无线语音控制装置处理所述第三语音数据获取的第三语音信息、获取所述无线语音控制装置传输的经所述述无线语音控制装置处理所述第四语音数据获取的第四语音信息;
其中,所述第一语音装置还用于获取所述无线语音控制装置传输的所述第二语音信息、所述第三语音信息、所述第四语音信息。
在其中一些实施例中,所述第一语音装置包括:
录音单元,用于获取用户的第一语音信息;
传输单元,所述传输单元与所述录音单元通信连接,用于将所述第一语音信息传输至所述无线语音控制装置,以及获取所述无线语音控制装置传输的所述第二语音信息或所述第三语音信息或所述第四语音信息;
播放单元,所述播放单元与所述传输单元通信连接,用于播放所述第二语音信息或所述第三语音信息或所述第四语音信息。
在其中一些实施例中,所述云平台包括:
语音识别单元,用于识别所述第一语音数据,以获取与所述第一语音数据相对应的第一语音文本;
检索单元,用于检索以获取与所述第一语音文本相对应的第二语音文本;
匹配度检测单元,用于检测所述第二语音文本与所述第一语音文本的匹配度;
语音生成单元,用于在所述第二语音文本与所述第一语音文本的匹配度达到预设阈值的情况下,生成与所述第二语音文本相对应的第二语音数据;
其中,所述检索单元还用在所述第二语音文本与所述第一语音文本的匹配度未达到预设阈值的情况下,再次检索以获取与所述第一语音文本相对应的第二语音文本。
第三方面,本申请实施例提供了一种无线语音控制方法,包括:
获取第一语音信息;
处理所述第一语音信息,以获取第一语音数据;
获取与所述第一语音数据相对应的第二语音数据;
处理所述第二语音数据,以获取第二语音信息;
播放所述第二语音信息以及广播所述第二语音信息。
在其中一些实施例中,在获取第一语音信息之前,所述方法还包括:
获取实时位置信息;
获取与所述实时位置信息相对应的第三语音数据;
处理所述第三语音数据,以获取第三语音信息;
播放所述第三语音信息以及广播所述第三语音信息。
在其中一些实施例中,在获取第一语音信息之前,所述方法还包括:
获取预设位置的图像信息;
获取与所述图像信息相对应的第四语音数据;
处理所述第四语音数据,以获取第四语音信息;
播放所述第四语音信息以及广播所述第四语音信息。
相比于相关技术,本申请实施例提供的一种无线语音控制装置、系统及方法,通过获取用于的第一语音信息、处理第一语音信息以获取第一语音数据,获取与第一语音数据相对应的第二语音数据,处理第二语音数据以获取第二语音信息,播放第二语音信息至第一语音装置,广播第二语音信息至第二语音装置,解决了无法进行一对多交互、资源利用率低的问题,实现了一对多同时交互、单一问题仅需查询一次、资源利用率高的技术效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的无线语音控制系统的结构框图;
图2是根据本申请实施例的无线语音控制装置的结构框图(一);
图3是根据本申请实施例的无线语音控制装置的结构框图(二);
图4是根据本申请实施例的无线语音控制装置的结构框图(三);
图5是根据本申请实施例的语音获取单元的结构框图;
图6是根据本申请实施例的控制单元的结构框图;
图7是根据本申请实施例的第一语音装置的结构框图;
图8是根据本申请实施例的云平台的结构框图;
图9是根据本申请实施例的无线语音控制方法的流程图(一);
图10是根据本申请实施例的无线语音控制方法的流程图(二);
图11是根据本申请实施例的无线语音控制方法的流程图(三);
图12是根据本申请实施例的无线语音控制系统的具体实施方式的示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B 这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
图1是根据本申请实施例的无线语音控制系统的结构框图。如图1所示,一种无线语音控制系统包括:
第一语音装置100,用于获取用户的第一语音信息;
无线语音控制装置200,与第一语音装置100通信连接(或通信连接),用于获取第一语音装置100传输的第一语音信息,以及处理第一语音信息以获取第一语音数据;
云平台300,与无线语音控制装置200通信连接,用于获取无线语音控制装置200传输的第一语音数据以及图像信息,检索并获取与第一语音数据相对应的第二语音数据,并传输第二语音数据至无线语音控制装置200;
在无线语音控制装置200获取第二语音数据的情况下,无线语音控制装置 200处理第二语音数据以获取第二语音信息;
无线语音控制装置200传输第二语音信息至第一语音装置100进行播放;
第二语音装置400,与无线语音控制装置200通信连接,用于获取无线语音控制装置200传输的第二语音信息。
在其中的一些实施例中,第一语音装置100为具有通话功能的耳机,如有线耳机、无线耳机。
在其中的一些实施例中,第二语音装置400可以为仅具有播放功能的耳机,也可以为具有通话功能的耳机。在一般情况下,第二语音装置400为仅具有播放功能的耳机。
在其中的一些实施例中,无线语音控制装置200还用于获取无线语音控制装置200的实时位置信息;云平台300还用于获取无线语音控制装置200传输的实时位置信息,检索并获取与实时位置信息相对应的第三语音数据,并传输第三语音数据至无线语音控制装置200;在无线语音控制装置200获取第三语音数据的情况下,无线语音控制装置200处理第三语音数据以获取第三语音信息;无线语音控制装置200传输第三语音信息至第一语音装置100播放、以及广播第三语音信息至若干第二语音装置400。
在其中的一些实施例中,无线语音控制装置200还用于获取预设位置的图像信息;云平台300还用于获取无线语音控制装置200传输的图像信息,检索并获取与图像信息相对应的第四语音数据,并传输第四语音数据至无线语音控制装置 200;在无线语音控制装置200获取第四语音数据的情况下,无线语音控制装置 200处理第四语音数据以获取第四语音信息;无线语音控制装置200传输第四语音信息至第一语音装置100播放、以及广播第四语音信息至若干第二语音装置400。
通过上述系统,每一无线语音控制装置接收一第一语音装置传输的用户的第一语音信息,并将从云平台获取的与第一语音信息相对应的第二语音信息传输至第一语音装置进行播放,并广播该第二语音信息至若干第二语音装置。在相关技术中,需要给每个用户配置一个语音采集装置,才能实现多对多交互的技术效果。在本实施例中,仅需一个无线语音控制装置,就可以实现一对多交互的技术效果,减少了无线语音控制装置的配置数量,降低了相关购买成本、使用成本以及后续的维护成本。此外,通过本实施例的无线语音控制装置,仅接收单一用户的第一语音信息,云平台仅对该第一语音信息进行搜索匹配,无须重复检索,提高了检索效率、检索精度,减少了无线语音控制装置从发出第一语音信息至接收第二语音信息的时间。
图2是根据本申请实施例的无线语音控制装置的结构框图(一)。如图2所示,无线语音控制装置200包括:
语音获取单元210,用于获取用户的第一语音信息,并处理第一语音信息以获取第一语音数据;
控制单元220,与语音获取单元210通信连接,用于获取语音获取单元210 传输的第一语音数据;
无线传输单元230,与控制单元220通信连接,用于获取控制单元220传输的第一语音数据、并将该第一语音数据向外界传输,以及从外界获取与第一语音数据相对应的第二语音数据、并将该第二语音数据传输至控制单元220;
在控制单元220获取第二语音数据后,控制单元220处理该第二语音数据,以获取与第二语音数据相对应的第二语音信息;
语音广播单元240,与控制单元220通信连接,用于获取控制单元220传输的第二语音信息,并广播该第二语音信息至若干第二语音装置;
在语音广播单元240广播第二语音信息的同时,控制单元220传输第二语音信息至第一语音装置进行播放。
在其中的一些实施例中,语音获取单元210获取用户通过第一语音装置传输的第一语音信息,即用户表达的第一语音信息,通过第一语音装置传输中语音获取单元210。
在其中的一些实施例中,语音获取单元210为语音采集模块,用于将用户说出的第一语音信息进行调制转换,将为模拟信号的第一语音信息转换成为数字信号的第一语音数据。
在其中的一些实施例中,语音获取单元210为语音信号采集芯片。
在其中的一些实施例中,控制单元220为单片机、主控芯片、树莓派等。
在其中的一些实施例中,无线传输单元230为无线通信模组,如4G通信模组、5G通信模组、蓝牙通信模组、WiFi通信模组。
具体地,在房地产案场(即售楼处)一般会设置若干样板房供客户参观。在客户持有无线语音控制装置200参观样板房的情况下,该客户佩戴第一语音装置,其他同行的客户佩戴第二语音装置。当客户需要了解样板房的某些信息时,如客户询问“请介绍下整体布局”,此时无线语音控制装置200将“请介绍下整体布局”传输至服务器或云平台,服务器或云平台将与“样板房布局”相对应的第二语音数据传输至无线语音控制装置200,无线语音控制装置200对第二语音数据进行处理后得到第二语音信息(即音频信息),然后传输至第一语音装置播放,并广播至第二语音装置播放。此时,在仅有一个无线语音控制装置200的情况下,可以满足多客户同时参观、同时了解相关信息的要求。
通过上述装置,每一无线语音控制装置接收一第一语音装置传输的用户的第一语音信息,并将获取的与第一语音信息相对应的第二语音信息传输至第一语音装置进行播放,并广播该第二语音信息至若干第二语音装置。在相关技术中,需要给每个用户配置一个语音采集装置,才能实现多对多交互的技术效果。在本实施例中,仅需一个无线语音控制装置,就可以实现一对多交互的技术效果,减少了无线语音控制装置的配置数量,降低了相关购买成本、使用成本以及后续的维护成本。此外,通过本实施例的无线语音控制装置,仅接收单一用户的第一语音信息,外界仅对该第一语音信息进行搜索匹配,无须重复检索,提高了检索效率、检索精度,减少了无线语音控制装置从发出第一语音信息至接收第二语音信息的时间。
图3是根据本申请实施例的无线语音控制装置的结构框图(二)。如图3所示,无线语音控制装置200还包括:
定位单元250,与控制单元220通信连接,用于获取无线语音装置100的实时位置信息,并将实时位置信息传输至控制单元220;
无线传输单元230还用于获取控制单元220传输的实时位置信息、并将该实时位置信息向外界传输,以及从外界获取与实时位置信息相对应的第三语音数据、并将该第三语音数据传输至控制单元220;
在控制单元220获取第三语音数据后,控制单元220处理该第三语音数据,以获取与第三语音数据相对应的第三语音信息,并将该第三语音信息分别传输至第一语音装置、语音广播单元240;
语音广播单元240还用于广播该第三语音信息至若干第二语音装置。
在其中的一些实施例中,定位单元250可以是GPS模组、北斗模组。
具体地,在房地产案场(即售楼处)一般会设置若干样板房供客户参观,在开放参观前,会将样板房的各项位置参数上传至服务器或云平台。在客户持有无线语音控制装置200参观样板房的情况下,若客户停留在某一位置,无线语音控制装置200获取该位置的位置信息,即无线语音控制装置200的实时位置信息(经度、纬度以及高度),无线语音控制装置200将实时位置信息传输至服务器或云平台,服务器或云平台将与实时位置信息相对应的第三语音数据传输至无线语音控制装置200,无线语音控制装置200对第三语音数据进行处理后得到第三语音信息(即音频信息),然后传输至第一语音装置播放,并广播至第二语音装置播放。此时,在仅有一个无线语音控制装置200的情况下,可以满足多客户同时参观、同时了解相关信息的要求。
通过上述装置,通过对持有无线语音控制装置的用户的位置进行定位以获取实时位置信息,可以在无须接收用户第一语音信息的情况下,接收与实时位置信息相对应的第三语音信息,并将获取的第三语音信息传输至第一语音装置进行播放,并广播该第三语音信息至若干第二语音装置。在相关技术中,语音采集装置无法对位置进行定位,导致只有在用户进行提问的情况下,才能反馈用户所需要了解的信息。通过上述装置,利用定位单元进行位置定位,可以主动向用户反馈相关信息,在用户充分了解信息的情况下,获取用户针对性的问题,降低信息交互频次,提高信息交互质量。
图4是根据本申请实施例的无线语音控制装置的结构框图(三)。如图4所示,无线语音控制装置200还包括:
图像获取单元260,与控制单元220通信连接,用于获取预设位置的的图像信息,并将图像信息传输至控制单元220;
无线传输单元230还用于获取控制单元220传输的图像信息、并将该图像信息向外界传输,以及从外界获取与图像信息相对应的第四语音数据、并将该第四语音数据传输至控制单元220;
在控制单元220获取第四语音数据后,控制单元220处理该第四语音数据,以获取与第四语音数据相对应的第四语音信息,并将该第四语音信息分别传输至第一语音装置、语音广播单元240;
语音广播单元240还用于广播该第四语音信息至若干第二语音装置。
在其中的一些实施例中,图像获取单元260为摄像头。
具体地,在房地产案场(即售楼处)一般会设置若干样板房供客户参观,开发商会在样板房的不同位置设置二维码图像,以供客户针对性地获取相关信息。在客户持有无线语音控制装置200参观样板房的情况下,客户使用无线语音控制装置200扫描设置在主卧位置的二维码图像,并生成与二维码图像相对应的图像信息,无线语音控制装置200将图像信息传输至服务器或云平台,服务器或云平台将与图像信息相对应的第四语音数据传输至无线语音控制装置200,无线语音控制装置200对第四语音数据进行处理后得到第四语音信息(即音频信息),然后传输至第一语音装置播放,并广播至第二语音装置播放。此时,在仅有一个无线语音控制装置200的情况下,可以满足多客户同时参观、同时了解相关信息的要求。
通过上述装置,通过获取预设位置的图像信息,可以在无须接收用户第一语音信息的情况下,接收与图像信息相对应的第四语音信息,并将获取的第四语音信息传输至第一语音装置进行播放,并广播该第四语音信息至若干第二语音装置。在相关技术中,语音采集装置无法进行图像获取,导致只有在用户进行提问的情况下,才能反馈用户所需要了解的信息。通过上述装置,利用图像获取单元获取预设位置的图像信息,可以主动向用户反馈相关信息,在用户充分了解信息的情况下,获取用户针对性的问题,降低信息交互频次,提高信息交互质量。
图5是根据本申请实施例的语音获取单元的结构框图。如图5所示,语音获取单元210包括:
获取模块211,用于获取用户的第一语音信息;
降噪模块212,与获取模块211通信连接,用于对第一语音信息进行降噪处理;
转换模块213,与降噪模块212通信连接,用于对降噪处理后的第一语音信息进行模数转换,将为模拟信号的第一语音信息转换呈为数字信号的第一语音数据。
在其中的一些实施例中,降噪模块212为降噪芯片。
在其中的一些实施例中,转换模块213为模数转换芯片或模数转换电路。
通过上述实施例,可以对用户的第一语音信息进行降噪处理,从而消除环境噪音,提高后续第一语音数据的精准度。
图6是根据本申请实施例的控制单元的结构框图。如图6所示,控制单元 220包括:
处理模块121,用于对第二语音数据进行处理以获取第二语音信息、对第三语音数据进行处理以获取第三语音信息以及对第四语音数据进行处理以获取第四语音信息;
监控模块122,与处理模块121通信连接,用于监控与控制单元220连接的各单元的工作状态,并在某一单元出现故障的情况下,生成报警信息;
其中,处理模块121还用于获取监控模块122传输的报警信息,并将报警信息传输至第一语音装置进行播放。
通过上述实施例,利用监控模块可以对无线语音控制装置是否正常工作进行监控,并及时向用户反馈报警信息,使用户及时对无线语音控制装置进行维护,避免出现因故障无法使用的问题。
图7是根据本申请实施例的第一语音装置的结构框图。如图7所示,第一语音装置100包括:
录音单元110,用于获取用户的第一语音信息;
传输单元120,与录音单元110通信连接,用于将第一语音信息传输至无线语音控制装置200,以及获取无线语音控制装置200传输的第二语音信息或第三语音信息或第四语音信息;
播放单元130,与传输单元120通信连接,用于播放第二语音信息或第三语音信息或第四语音信息。
在其中的一些实施例中,第一语音装置100还包括降噪单元140,分别与录音单元110、播放单元130通信连接,用于在录音单元110获取第一语音信息的情况下,降低环境音对第一语音信息的影响,以及在播放单元130播放第二语音信息或第三语音信息或第四语音信息的情况下,降低环境音对第二语音信息或第三语音信息或第四语音信息的影响。
通过上述实施例,在用户使用第一语音装置进行语音交互时,可以最大程度的减少环境音对录音以及播放的影响,提高用户的交互体验。
图8是根据本申请实施例的云平台的结构框图。如图8所示,云平台300包括:
语音识别单元310,用于识别第一语音数据,以获取与第一语音数据相对应的第一语音文本;
检索单元320,与语音识别单元310通信连接,用于检索以获取与第一语音文本相对应的第二语音文本;
匹配度检测单元330,与检索单元320通信连接,用于检索第二语音文本与第一语音文本的匹配度;
语音生成单元340,与匹配度检测单元330通信连接,用于在第二语音文本与第一语音文本的匹配度达到预设阈值的情况下,生成与第二语音文本相对应的第二语音数据。
其中,在第二语音文本与第一语音文本的匹配度未达到预设阈值的情况下,检索单元320再次进行检索,以获取与第一语音文本相对应的第二语音文本。不断重复,直至第二语音文本与第一语音文本的匹配度达到预设阈值。
通过上述实施例,在某一时刻,云平台300接收的第一语音数据的数量是相对较少的,因此,可以通过匹配度检测单元对检索获取的第二语音数据与第一语音数据进行匹配度检测,从而提高返回至无线语音控制装置200的第二语音数据的准确度,从而提高用户体验。
图9是根据本申请实施例的无线语音控制方法的流程图(一)。如图9所示,无线语音控制方法包括:
步骤S902、获取第一语音信息;
步骤S904、处理第一语音信息,以获取第一语音数据;
步骤S906、获取与第一语音数据相对应的第二语音数据;
步骤S908、处理第二语音数据,以获取第二语音信息;
步骤S910、播放第二语音信息以及广播第二语音信息。
通过上述步骤,仅需一个无线语音控制装置,就可以实现一对多交互的技术效果,减少了无线语音控制装置的配置数量,降低了相关购买成本、使用成本以及后续的维护成本。此外,通过本实施例的无线语音控制方法,仅接收单一用户的第一语音信息,外界仅对该第一语音信息进行搜索匹配,无须重复检索,提高了检索效率、检索精度,减少了从发出第一语音信息至接收第二语音信息的时间。
图10是根据本申请实施例的无线语音控制方法的流程图(二)。如图10所示,在获取第一语音信息之前,该方法还包括:
步骤S1002、获取实时位置信息;
步骤S1004、获取与实时位置信息相对应的第三语音数据;
步骤S1006、处理第三语音数据,以获取第三语音信息;
步骤S1008、播放第三语音信息以及广播第三语音信息。
通过上述步骤,通过对持有无线语音控制装置的用户的位置进行定位以获取实时位置信息,可以在无须接收用户第一语音信息的情况下,接收与实时位置信息相对应的第三语音信息,并将获取的第三语音信息进行播放以及广播。在相关技术中,语音采集装置无法对位置进行定位,导致只有在用户进行提问的情况下,才能反馈用户所需要了解的信息。通过上述步骤,利用实时位置信息,可以主动向用户反馈相关信息,在用户充分了解信息的情况下,获取用户针对性的问题,降低信息交互频次,提高信息交互质量。
图11是根据本申请实施例的无线语音控制方法的流程图(三)。如图11所示,在获取第一语音信息之前,该方法还包括:
步骤S1102、获取预设位置的图像信息;
步骤S1104、获取与图像信息相对应的第四语音数据;
步骤S1106、处理第四语音数据,以获取第四语音信息;
步骤S1108、播放第四语音信息以及广播第四语音信息。
通过上述步骤,通过获取预设位置的图像信息,可以在无须接收用户第一语音信息的情况下,接收与图像信息相对应的第四语音信息,并将获取的第四语音信息进行播放以及广播。在相关技术中,语音采集装置无法进行图像获取,导致只有在用户进行提问的情况下,才能反馈用户所需要了解的信息。通过上述步骤,利用预设位置的图像信息,可以主动向用户反馈相关信息,在用户充分了解信息的情况下,获取用户针对性的问题,降低信息交互频次,提高信息交互质量。
图12是根据本申请实施例的无线语音控制系统的具体实施方式的示意图。如图12所示,无线语音控制系统包括耳机(第一语音装置100)、无线语音识别和广播装置(无线语音控制装置200)、云端服务器(云平台300)和指定收听用户(第二语音装置400)。其中,无线语音识别和广播装置包括语音采集模块(语音获取单元210)、主控模块(控制单元220)、无线数据传输模块(无线传输单元230)和音频广播模块(语音广播单元240)。
该方法包括:
步骤1301、使用者开启语音采集功能,打开语音采集模块;
步骤1302、使用者对着外接耳机上的麦克风开始说话,语音采集模块通过外接耳机采集使用者语音;
步骤1303、语音采集模块将采集的使用者语音数据传送到主控模块;
步骤1304、主控模块将使用者语音数据传到无线数据传输模块;
步骤1305、无线数据传输模块将使用者语音数据传送到云端后台;
步骤1306、云端后台对使用者语音数据进行语义识别,根据语义内容,返回相应的音频数据到无线数据传输模块;
步骤1307、无线数据传输模块接收云端后台音频数据,传送到主控模块;
步骤1308、主控模块接收无线数据传输模块传送的云端音频数据;
步骤1309、主控模块通过外接耳机将云端音频给使用者收听;
步骤1310、主控模块将云端音频传送到音频广播模块;
步骤1211、音频广播模块将云端音频进行无线广播;
步骤1212、指定用户收听音频广播模块无线广播的云端音频。
通过本实施例的无线语音控制系统及方法,可以采集用户的语音,将语音传送到云端后台进行识别;能实时广播云端后台传送的语音信息,由用户及其指定的多个附近人员收听,实现一对多的语音信息传递;无线语音控制装置的尺寸小巧,与普通的智能手机大小相近,便于用户携带。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种无线语音控制装置,其特征在于,包括:
语音获取单元,用于获取用户的第一语音信息,并处理所述第一语音信息以获取第一语音数据;
控制单元,用于获取所述语音获取单元传输的所述第一语音数据;
无线传输单元,用于获取所述控制单元传输的所述第一语音数据、获取与所述第一语音数据相对应的第二语音数据、以及向传输所述第二语音数据至所述控制单元;
语音广播单元,用于获取所述控制单元传输的经所述控制单元处理所述第二语音数据获取的第二语音信息、广播所述第二语音信息至若干第二语音装置;
所述控制单元还传输所述第二语音信息至第一语音装置;
其中,所述第一语音装置与所述语音获取单元、所述控制单元通信连接,若干所述第二语音装置与所述语音广播单元通信连接。
2.根据权利要求1所述的无线语音控制装置,其特征在于,还包括:
定位单元,用于获取所述无线语音控制装置的实时位置信息;
所述无线传输单元还用于获取与所述实时位置信息相对应的第三语音数据;
所述控制单元还用于对所述第三语音数据进行处理,以获取与所述第三语音数据相对应的第三语音信息,并将所述第三语音信息传输至所述第一语音装置;
所述语音广播单元还用于广播所述第三语音信息至若干所述第二语音装置。
3.根据权利要求1所述的无线语音控制装置,其特征在于,还包括:
图像获取单元,用于获取预设位置的图像信息;
所述无线传输单元还用于获取与所述图像信息相对应的第四语音数据;
所述控制单元还用于对所述第四语音数据进行处理,以获取与所述第四语音数据相对应的第四语音信息,并将所述第四语音信息传输至所述第一语音装置;
所述语音广播单元还用于广播所述第四语音信息至若干所述第二语音装置。
4.根据权利要求1所述的无线语音控制装置,其特征在于,所述语音获取单元包括:
获取模块,用于获取用户的所述第一语音信息;
降噪模块,用于对所述第一语音信息进行降噪处理,以获取与所述第一语音信息相对应的第一语音数据。
5.根据权利要求1所述的无线语音控制装置,其特征在于,所述控制单元包括:
处理模块,用于处理所述第二语音数据,以获取与所述第二语音数据相对应的所述第二语音信息。
6.一种无线语音控制系统,其特征在于,包括:
第一语音装置,用于获取用户的第一语音信息;
无线语音控制装置,用于获取所述第一语音装置传输的所述第一语音信息,获取所述无线语音控制装置的实时位置信息,获取预设位置的图像信息,处理所述第一语音信息以获取第一语音数据;
云平台,用于获取所述无线语音控制传输的所述第一语音数据、所述实时位置信息、所述图像信息,检索并获取与所述第一语音数据相对应的第二语音数据、与所述实时位置信息相对应的第三语音数据、与所述图像信息相对应的第四语音数据,传输所述第二语音数据、所述第三语音数据、所述第四语音数据至所述无线语音控制装置;
第二语音装置,用于获取所述无线语音控制装置传输的经所述无线语音控制装置处理所述第二语音数据获取的第二语音信息、获取所述无线语音控制装置传输的经所述无线语音控制装置处理所述第三语音数据获取的第三语音信息、获取所述无线语音控制装置传输的经所述述无线语音控制装置处理所述第四语音数据获取的第四语音信息;
其中,所述第一语音装置还用于获取所述无线语音控制装置传输的所述第二语音信息、所述第三语音信息、所述第四语音信息。
7.根据权利要求6所述的无线语音控制系统,其特征在于,所述云平台包括:
语音识别单元,用于识别所述第一语音数据,以获取与所述第一语音数据相对应的第一语音文本;
检索单元,用于检索以获取与所述第一语音文本相对应的第二语音文本;
匹配度检测单元,用于检测所述第二语音文本与所述第一语音文本的匹配度;
语音生成单元,用于在所述第二语音文本与所述第一语音文本的匹配度达到预设阈值的情况下,生成与所述第二语音文本相对应的第二语音数据;
其中,所述检索单元还用在所述第二语音文本与所述第一语音文本的匹配度未达到预设阈值的情况下,再次检索以获取与所述第一语音文本相对应的第二语音文本。
8.一种无线语音控制方法,其特征在于,包括:
获取第一语音信息;
处理所述第一语音信息,以获取第一语音数据;
获取与所述第一语音数据相对应的第二语音数据;
处理所述第二语音数据,以获取第二语音信息;
播放所述第二语音信息以及广播所述第二语音信息。
9.根据权利要求8所述的无线语音控制方法,其特征在于,在获取第一语音信息之前,所述方法还包括:
获取实时位置信息;
获取与所述实时位置信息相对应的第三语音数据;
处理所述第三语音数据,以获取第三语音信息;
播放所述第三语音信息以及广播所述第三语音信息。
10.根据权利要求8所述的无线语音控制方法,其特征在于,在获取第一语音信息之前,所述方法还包括:
获取预设位置的图像信息;
获取与所述图像信息相对应的第四语音数据;
处理所述第四语音数据,以获取第四语音信息;
播放所述第四语音信息以及广播所述第四语音信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011339137.1A CN112489649A (zh) | 2020-11-25 | 2020-11-25 | 一种无线语音控制装置、系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011339137.1A CN112489649A (zh) | 2020-11-25 | 2020-11-25 | 一种无线语音控制装置、系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112489649A true CN112489649A (zh) | 2021-03-12 |
Family
ID=74934715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011339137.1A Pending CN112489649A (zh) | 2020-11-25 | 2020-11-25 | 一种无线语音控制装置、系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112489649A (zh) |
-
2020
- 2020-11-25 CN CN202011339137.1A patent/CN112489649A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9825893B2 (en) | System and method for broadcasting audio tweets | |
US8578415B2 (en) | Information providing method, content display terminal, portable terminal, server device, information providing system and program | |
EP2648151A1 (en) | Method and system for the real-time collection of a feedback from the audience of a television or radio show | |
CN103886857B (zh) | 一种噪声控制方法及设备 | |
US20140006513A1 (en) | Adjacent person specifying apparatus, adjacent person specifying method, adjacent person specifying program, and adjacent person specifying system | |
US20130197903A1 (en) | Recording system, method, and device | |
CN110265004B (zh) | 智能家居操作系统中目标终端的控制方法及装置 | |
CN111095892A (zh) | 电子装置及其控制方法 | |
US20200005793A1 (en) | Method and apparatus for processing speech | |
US20160366528A1 (en) | Communication system, audio server, and method for operating a communication system | |
CN109257498B (zh) | 一种声音处理方法及移动终端 | |
CN103827859A (zh) | 使用多媒体搜索以识别产品 | |
CN103685783A (zh) | 信息处理系统和存储介质 | |
CN107862071A (zh) | 生成会议记录的方法和装置 | |
CN107896312A (zh) | 影像处理装置和影像处理方法 | |
CN111325895A (zh) | 一种智慧导游信息处理方法及系统、信息数据处理终端 | |
US10460698B2 (en) | Method for rendering an electronic content on a rendering device | |
CN103489119B (zh) | 一种广告监测方法、装置及系统 | |
CN216014804U (zh) | 一种新型无线语音控制装置及系统 | |
CN112489649A (zh) | 一种无线语音控制装置、系统及方法 | |
CN109104634A (zh) | 一种机顶盒工作方法、机顶盒及计算机可读存储介质 | |
US10497368B2 (en) | Transmitting audio to an identified recipient | |
CN106664432A (zh) | 多媒体信息播放方法及系统、采集设备、标准化服务器 | |
CN214123495U (zh) | 一种新型无线语音交互装置及系统 | |
US10142667B2 (en) | Information processing system and server apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |