CN116564300A - 一种基于语音识别自动推荐使用智能设备的方法和系统 - Google Patents
一种基于语音识别自动推荐使用智能设备的方法和系统 Download PDFInfo
- Publication number
- CN116564300A CN116564300A CN202211030314.7A CN202211030314A CN116564300A CN 116564300 A CN116564300 A CN 116564300A CN 202211030314 A CN202211030314 A CN 202211030314A CN 116564300 A CN116564300 A CN 116564300A
- Authority
- CN
- China
- Prior art keywords
- information
- corpus
- voice
- user
- intelligent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000012790 confirmation Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000009825 accumulation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 208000002173 dizziness Diseases 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于语音识别自动推荐使用智能设备的方法,其包括以下步骤:步骤S100:获取用户语音信息;步骤S200:对用户语音信息进行匹配,输出与语音信息匹配度最高的询问推荐语料信息;步骤S300:收录反馈结果信息;步骤S400:获取与反馈结果信息对应相关联的执行指令,并将执行指令进行传达;步骤S500:获取执行结果信息,并将执行结果信息进行输出。本发明其能根据用户声音及时主动推荐用户使用对应的蓝牙智能设备。
Description
技术领域
本发明涉及车联网技术领域,尤其涉及一种基于语音识别自动推荐使用智能设备的方法和系统。
背景技术
现有的车内网关设备均只能通过用户输入相应的命令、指令去控制与网关设备绑定的蓝牙智能设备,现有车内网关设备一般存在于智能语音机器人、智能带屏设备中,用户也一般使用触控显示屏和语音命令去下指令去控制蓝牙智能设备。但是有时候用户事情较多,常常在需要使用智能设备情况下会忘记及时启动,如从早上到中午天气渐渐升温,而用户正在处理一些工作事宜,未能及时感受到天气升温,有的时候自然地喊有点热之类话语,等事情处理完毕后,才感觉到自己满头大汗,需要降温,给身体带来不适感觉,还有如刚跟别人争论完,思想还停留在争辩状态中,未能及时放松平缓自己的心情,不爽的时候还容易自言自语,此时就需要车内网关设备根据用户声音及时主动推荐用户使用对应的蓝牙智能设备。
发明内容
本发明的主要目的在于针对现有技术中车内网关设备不能根据用户情绪自动推荐使用蓝牙智能设备的缺点,提供一种基于语音识别自动推荐使用智能设备的方法和系统。
为实现上述目的,本发明一种基于语音识别自动推荐使用智能设备的方法,包括以下步骤:
步骤S100:获取用户语音信息;
步骤S200:对用户语音信息进行匹配,输出与语音信息匹配度最高的询问推荐语料信息;
步骤S300:收录反馈结果信息;
步骤S400:获取与反馈结果信息对应相关联的执行指令,并将执行指令进行传达;
步骤S500:获取执行结果信息,并将执行结果信息进行输出。
优选地,网关设备捕捉用户声音,并将用户声音音频信息传输至云端语音平台,云端语音平台将用户声音音频信息转换为用户声音文本信息。
优选地,云端语音平台将用户声音文本信息输入触发语料文本数据库中,与触发语料文本数据库中的事先设置的智能设备触发语料信息进行逐一对比,通过对文字字数相同、文字字体相同、感叹语气相同三个维度上进行打分得分,选择得分最高的智能设备触发语料信息,并将得分最高的智能设备触发语料信息传输至远端服务器,远端服务器查询该智能设备触发语料信息中的智能设备是否在线,根据智能设备在线状况按第一预设语料模板输出询问推荐语料文本信息至云端语音平台,云端语音平台将询问推荐语料文本信息转换为询问推荐语料音频信息,再将询问推荐语料音频信息传输至网关设备,网关设备对询问推荐语料音频信息进行播报。
优选地,用户接收到询问推荐语料音频信息后,通过声音对询问信息进行回答形成反馈结果音频信息,网关设备对反馈结果音频信息进行收录,并将反馈结果音频信息传输至云端语音平台,云端语音平台将其转换成反馈结果文本信息传输至远端服务器。
优选地,远端服务器提取反馈结果文本信息中的选择、确认信息,结合询问推荐语料文本信息中的智能设备信息,在数据库中进行检索,选出对应智能设备的执行指令,并将执行指令传输至网关设备,网关设备将执行指令传达至对应的智能设备。
优选地,智能设备运行执行指令,并将执行结果信息反馈至网关设备,网关设备将执行结果信息反馈至远端服务器,远端服务器按第二预设语料模板输出执行结果语料文本信息至云端语音平台,云端语音平台将执行结果语料文本信息转换为执行结果语料音频信息,再将执行结果语料音频信息传输至网关设备,网关设备对执行结果语料音频信息进行播报。
优选地,所述步骤S500中的第一预设语料模板包括固定格式的询问套话,以及在询问套话中的固定位置根据智能设备的在线状态添入的智能设备名称;所述步骤S500中的第二预设语料模板包括固定格式的执行结果套话,以及在执行结果套话中的固定位置根据智能设备的执行结果添入的智能设备名称。
此外,本发明还提供了一种基于语音识别自动推荐使用智能设备的系统,包括:
获取模块,用于获取用户语音信息、用户对于询问推荐语料信息的反馈结果信息、与反馈结果信息对应相关联的执行指令以及执行结果信息;
匹配模块,用于对用户语音信息进行匹配;
输出模块,用于输出与语音信息匹配度最高的询问推荐语料信息,用于传达执行指令以及输出执行结果信息。
优选地,还包括转换模块,用于将用户声音音频信息转换为用户声音文本信息,用于将询问推荐语料文本信息转换为询问推荐语料音频信息,用于将反馈结果音频信息转换成反馈结果文本信息,用于将执行结果语料文本信息转换为执行结果语料音频信息;
查询模块,用于查询智能设备触发语料信息中的智能设备的在线状态。
优选地,所述输出模块,还用于将用户声音音频信息传输至云端语音平台,还用于将用户声音文本信息传输至远端服务器,还用于根据智能设备在线状况按第一预设语料模板输出询问推荐语料文本信息至云端语音平台,还用于将询问推荐语料音频信息传输至网关设备,还用于将反馈结果音频信息传输至云端语音平台,还用于将反馈结果文本信息传输至远端服务器,还用于将反馈结果文本信息传输至远端服务器,还用于将将执行指令传输至网关设备,还用于将执行指令传达至对应的智能设备,还用于将执行结果信息反馈至网关设备、远端服务器。
本发明提供的一种基于语音识别自动推荐使用智能设备的方法具有以下有益效果:通过获取用户语音信息,可识别当前用户的声音,提取与声音对应的文本信息,为后续对应的语音信息选择使用智能设备提供原始数据依据;通过对用户语音信息进行匹配,输出与语音信息匹配度最高的询问推荐语料信息,对当前用户声音的文本信息进行匹配,选择匹配度最高的智能设备触发语料信息,触发语料信息对应着触发该智能设备的执行指令,输出主动推荐语料信息,呈现给用户,以达到提醒用户使用的目的;通过收录反馈结果信息,对用户反馈的是否使用智能设备、使用哪些智能设备的反馈结果进行收集,为提供执行指令做出选择传输;通过获取与反馈结果信息对应相关联的执行指令,并将执行指令进行传达,智能接收到了执行指令,实现了智能设备的开启运行,达到用户使用智能设备的效果;通过获取执行结果信息,并将执行结果信息进行输出,告知用户当前使用了那些智能设备,与自己反馈的信息是否一致。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图:
图1所示为本发明一个实施例提供的一种基于语音识别自动推荐使用智能设备的方法的流程示意图;
图2所示为本发明一个实施例提供的一种基于语音识别自动推荐使用智能设备的系统的模块示意图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的典型实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本发明总的思路是:针对现有技术中车内网关设备不能根据用户声音自动推荐使用蓝牙智能设备的缺点,提供一种基于语音识别自动推荐使用智能设备的方法。本发明通过获取用户语音信息,可识别当前用户的声音,提取与声音对应的文本信息,为后续对应的语音信息选择使用智能设备提供原始数据依据;通过对用户语音信息进行匹配,输出与语音信息匹配度最高的询问推荐语料信息,对当前用户声音的文本信息进行匹配,选择匹配度最高的智能设备触发语料信息,触发语料信息对应着触发该智能设备的执行指令,输出主动推荐语料信息,呈现给用户,以达到提醒用户使用的目的;通过收录反馈结果信息,对用户反馈的是否使用智能设备、使用哪些智能设备的反馈结果进行收集,为提供执行指令做出选择传输;通过获取与反馈结果信息对应相关联的执行指令,并将执行指令进行传达,智能接收到了执行指令,实现了智能设备的开启运行,达到用户使用智能设备的效果;通过获取执行结果信息,并将执行结果信息进行输出,告知用户当前使用了那些智能设备,与自己反馈的信息是否一致。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
参照图1,图1所示为本发明一个实施例提供的一种基于语音识别自动推荐使用智能设备的方法的流程示意图,在本实施例中,一种基于语音识别自动推荐使用智能设备的方法,包括:
步骤S100:获取用户语音信息;
在车联网中,多个车载智能蓝牙设备通过蓝牙MESH网关技术与车内网关设备进行绑定,智能蓝牙设备其植入了对应的BLE模组,并且所有的智能蓝牙设备均在远端服务器的后台系统进行了信息录入,检验了智能蓝牙设备的合法性,只有合法的智能蓝牙设备才能与车内网关设备进行组网,网关设备才能通过蓝牙传输控制智能蓝牙设备。网关设备是具有与外部通过各种通讯方式联网的设备,在车联网中,网关设备可以为车机中控系统,可以为智能语音机器人,也可以为带屏的智能设备等,只有具备网络通讯功能和蓝牙传输功能即可。智能蓝牙设备为具有各种功能的蓝牙设备,比如颈枕、音乐器、风扇、空调、计时器、温度计、湿度计、按摩椅、香氛等。通过获取用户语音信息,可识别当前用户的声音,提取与声音对应的文本信息,为后续对应的语音信息选择使用智能设备提供原始数据依据。
具体地,网关设备捕捉用户声音,并将用户声音音频信息传输至云端语音平台,云端语音平台将用户声音音频信息转换为用户声音文本信息。
用户具有各种各样的说话声音,在什么环境下可能就说些与自身感受相关的话语,如开车的时候,夜深了,有点困意的时候,就说“哎呀,有点困了,必须振作起来,精神起来”,等,如在坐久了腰酸背痛的时候,就说“腰好酸啊”等,网关设备或智能语音机器人通过其自带的麦克风对用户声音进行捕捉,形成用户语音音频信息,再通过4G/5G/WIFI等网络通讯方式传输至云端语音平台,云端语音平台为一个远端大系统平台,对整个车联网中的语音进行处理,其可通过ASR、NLP技术将音频信息转换为文本信息,也可通过TTS技术将文本信息转换音频,云端语音平台将用户声音音频信息转换为用户声音文本信息,再将用户声音文本信息传输至远端服务器。
步骤S200:对用户语音信息进行匹配,输出与语音信息匹配度最高的询问推荐语料信息;
在远端语音平台中,将用户声音音频信息转换为用户声音文本信息之后,对当前用户声音的文本信息进行匹配,选择匹配度最高的智能设备触发语料信息,触发语料信息对应着触发该智能设备的执行指令,输出主动推荐语料信息,呈现给用户,以达到提醒用户使用的目的;
具体地,云端语音平台将用户声音文本信息输入触发语料文本数据库中,与触发语料文本数据库中的事先设置的智能设备触发语料信息进行逐一对比,通过对文字字数相同、文字字体相同、感叹语气相同三个维度上进行打分得分,选择得分最高的智能设备触发语料信息,并将得分最高的智能设备触发语料信息传输至远端服务器,远端服务器查询该智能设备触发语料信息中的智能设备是否在线,根据智能设备在线状况按第一预设语料模板输出询问推荐语料文本信息至云端语音平台,云端语音平台将询问推荐语料文本信息转换为询问推荐语料音频信息,再将询问推荐语料音频信息传输至网关设备,网关设备对询问推荐语料音频信息进行播报。
触发语料文本数据库存储了事先设置的智能设备触发语料信息,智能设备触发语料信息其包括语料信息及与其绑定一起的智能设备信息,如:“我好累”语料信息,绑定的智能设备“颈枕按摩仪”等,当然,为了用户声音文本信息能与触发语料文本数据库中的语料信息具有很高的匹配度,语料信息对于同一个表达意思具有很多个具体的语料信息,如:表达累的语料信息包括“我好累”,“我很累”,“我真累”,“我累得腰很酸”,“我累得头很晕”,“我要休息”,“我想躺着”等等,同一个表达意思的多个语料信息对应绑定的智能设备均为一样的,比如,“我很累”,“我要休息”对应绑定的智能设备均为“颈枕按摩仪”。在云端语音平台中,先通过将用户声音音频信息转换为文本信息,将文本信息与智能设备触发语料信息进行逐一对比匹配,选择匹配度最高的语料信息,并将语料信息传输至远端服务器。
对于文本信息和语料信息在对比匹配上,本发明按文字字数相同、文字字体相同、感叹语气相同三个维度上进行评分打分,如:文字字数相同占比得30分,文字字体相同占比得分40分,感叹语气相同占比得分30分,例如,文本信息为“我累趴了”,此时语料信息中的“我要休息”,“我想躺着”字数都是4个字,字数得分30分,字体得分20分,语气得分中,“我要休息”,得分20分,“我想躺着”字数得分30分,而“我好累”,“我很累”,字数得分20分,字体得分30分,语气得分20分,然后选择出得分最高的语料信息,将其传输至远端服务器。
此时,就需要知道场景模式绑定的智能设备是否处于可使用状态,可使用状态状态是指智能设备已与网关设备进行过绑定,且目前处于开启运行状态,即需要查询该场景模式中绑定关联的智能设备的当前状态,可以发送查询指令至网关设备,网关设备再将查询指令传达给智能设备,智能设备将其自身的运行状态原路反馈至远端服务器,远端服务器查询到智能设备的状态后,就按照第一预设语料模板生成询问推荐语料文本信息,在本发明中,第一预设语料模板包括固定格式的询问套话,以及在询问套话中的固定位置根据智能设备的状态值添入的智能设备名称,第一预设语料模板是一个输入智能设备的状态参数值,输出包括智能设备名称的语料模板,例如:高兴模式中的音乐播放器在线,礼炮筒不在线,此时,询问推荐语料文本信息为“你是否需要开启音乐播放器”,如音乐播放器和礼炮筒均在线,此时,询问推荐语料文本信息为“你是否需要开启音乐播放器和礼炮筒进行庆祝”,每个场景模式对应固定询问套话,高兴模式中固定套语为“你是否需要开启XX进行庆祝”,XX固定位置根据智能设备的在线状态进行选择显示,当询问推荐语料文本信息生成后,将询问推荐语料文本信息传输至云端语音平台,云端语音平台将询问推荐语料文本信息转换为询问推荐语料音频信息,再将询问推荐语料音频信息传输至网关设备,网关设备对询问推荐语料音频信息进行播报。
云端语音平台为一个远端大系统平台,对整个车联网中的语音进行处理,其可通过ASR、NLP技术将音频信息转换为文本信息,也可通过TTS技术将文本信息转换音频,远端服务器将询问推荐语料文本信息传输至云端语音平台,云端语音平台先通过TTS将询问推荐语料文本信息转换为询问推荐语料音频信息,然后传输智能语音机器人,智能语音机器人对该音频信息进行播报。
步骤S300:收录反馈结果信息。
在用户通过网关设备播报询问推荐语料信息之后,用户需要对询问信息进行反馈,形成反馈结果信息,并输出至远端服务器进行下一步操作。
具体地,用户接收到询问推荐语料音频信息后,通过声音对询问信息进行回答形成反馈结果音频信息,网关设备对反馈结果音频信息进行收录,并将反馈结果音频信息传输至云端语音平台,云端语音平台将其转换成反馈结果文本信息传输至远端服务器。
在本发明中,智能语音机器人能播放语音,也能收录语音,用户接收到智能语音机器人播报询问声音之后,用户直接说话回复,如同时开启音乐播放器、礼炮筒进行庆祝等,用户接收到询问推荐语料音频信息后,通过声音对询问信息进行回答形成反馈结果音频信息,智能语音机器人对反馈结果音频信息进行收录,并将反馈结果音频信息传输至云端语音平台,云端语音平台通过ASR、NLP技术将反馈结果音频信息转换为反馈结果文本信息,然后传输至远端服务器。
步骤S400:获取与反馈结果信息对应相关联的执行指令,并将执行指令进行传达。
反馈结果信息传输至远端服务器后,远端服务器将与反馈结果信息对应相关联的智能设备的执行指令通过网络通讯传输给网关设备,网关设备再通过蓝牙通讯将对应智能设备的执行指令传达给对应的智能设备。
具体地,远端服务器提取反馈结果文本信息中的选择、确认信息,结合询问推荐语料文本信息中的智能设备信息,在数据库中进行检索,选出对应智能设备的执行指令,并将执行指令传输至网关设备,网关设备将执行指令传达至对应的智能设备。
反馈结果文本信息中包括了智能设备的选择信息或同意确认信息,既从反馈结果文本信息中可以提取到使用哪些智能设备的信息,再从之前询问推荐语料文本信息中提取包括智能设备名称的信息,以确认反馈结果文本信息所反馈的使用智能设备信息是否在询问推荐语料文本信息中使用智能设备信息范围内,确认反馈结果文本信息中提取的智能设备信息也在询问推荐语料文本信息中,即反馈结果文本信息为有效信息,再从数据库中检索对应的智能设备的执行指令信息,并将执行指令信息通过网络通讯传输至网关设备,网关设备再将执行指令通过蓝牙传达给智能设备。
步骤S500:获取执行结果信息,并将执行结果信息进行输出。
智能设备运行执行指令,完成用户对智能设备的功能需求,此时需要告知用户当前的执行状况,以形成闭环,以免用户在确定中持续等待。
具体地,智能设备运行执行指令,并将执行结果信息反馈至网关设备,
网关设备将执行结果信息反馈至远端服务器,远端服务器按第二预设语料模板输出执行结果语料文本信息至云端语音平台,云端语音平台将执行结果语料文本信息转换为执行结果语料音频信息,再将执行结果语料音频信息传输至网关设备,网关设备对执行结果语料音频信息进行播报。
智能设备接收到网关设备传达过来的执行指令,智能设备系统执行指令,运行程序,开启智能设备功能模板,进行功能运行,比如音乐播放器开启音乐播放,播放后,智能设备生成执行结果信息,通过蓝牙传输至网关设备,网关设备再通过网络通讯传输至远端服务器,远端服务器接收到执行结果信息,调取存储的第二预设语料模板将执行结果信息生成执行结果语料文本信息,优先地,在本发明中,第二预设语料模板包括固定格式的执行结果套话,以及在执行结果套话中的固定位置根据智能设备的执行结果添入的智能设备名称。第二预设语料模板是一个输入智能设备的执行结果信息,输出包括智能设备名称的语料模板,例如:高兴模式中的音乐播放器已经开启,此时,执行结果语料文本信息为“已经为你开启音乐播放器”,如音乐播放器和礼炮筒均开启,此时,执行结果语料文本信息为“已经为你开启音乐播放器和礼炮筒”,远端服务器将生成的执行结果语料文本信息传输至云端语音平台,云端语音平台将执行结果语料文本信息转换为执行结果语料音频信息,再将执行结果语料音频信息传输至网关设备,网关设备对执行结果语料音频信息进行播报。
在云端语音平台中,通过TTS技术将执行结果语料文本信息转换为执行结果语料音频信息,再将执行结果语料音频信息传输至网关设备,网关设备通过喇叭进行播报告知用户,用户接收到执行结果反馈信息,即完成了整个智能设备的使用,不用持续等待。
基于以上方式,本发明通过获取用户语音信息,可识别当前用户的声音,提取与声音对应的文本信息,为后续对应的语音信息选择使用智能设备提供原始数据依据;通过对用户语音信息进行匹配,输出与语音信息匹配度最高的询问推荐语料信息,对当前用户声音的文本信息进行匹配,选择匹配度最高的智能设备触发语料信息,触发语料信息对应着触发该智能设备的执行指令,输出主动推荐语料信息,呈现给用户,以达到提醒用户使用的目的;通过收录反馈结果信息,对用户反馈的是否使用智能设备、使用哪些智能设备的反馈结果进行收集,为提供执行指令做出选择传输;通过获取与反馈结果信息对应相关联的执行指令,并将执行指令进行传达,智能接收到了执行指令,实现了智能设备的开启运行,达到用户使用智能设备的效果;通过获取执行结果信息,并将执行结果信息进行输出,告知用户当前使用了那些智能设备,与自己反馈的信息是否一致。
相应地,本发明还提供一种基于语音识别自动推荐使用智能设备的系统,参照图2,图2所示为本发明一个实施例提供的一种基于语音识别自动推荐使用智能设备的系统的模块结构示意图,该系统通过上面所讲述的基于语音识别自动推荐使用智能设备的方法自动给用户推荐使用智能设备,系统包括:
获取模块,用于获取用户语音信息、用户对于询问推荐语料信息的反馈结果信息、与反馈结果信息对应相关联的执行指令以及执行结果信息;
匹配模块,用于对用户语音信息进行匹配;
输出模块,用于输出与语音信息匹配度最高的询问推荐语料信息,用于传达执行指令以及输出执行结果信息。
获取模块设于网关设备中,通过麦克风获取用户用户语音声音、对于询问推荐语料信息的反馈声音,通过蓝牙通讯协议获取反馈结果信息对应相关联的执行指令以及执行结果信息。
匹配模块设于远端语音平台中,通过将用户声音文本信息输入触发语料文本数据库中,与触发语料文本数据库中的事先设置的智能设备触发语料信息进行逐一对比,找出最高匹配度的语料信息。
优选地,还包括转换模块,用于将用户声音音频信息转换为用户声音文本信息,用于将询问推荐语料文本信息转换为询问推荐语料音频信息,用于将反馈结果音频信息转换成反馈结果文本信息,用于将执行结果语料文本信息转换为执行结果语料音频信息;
查询模块,用于查询智能设备触发语料信息中的智能设备的在线状态。优选地,所述输出模块,还用于将用户声音音频信息传输至云端语音平台,还用于将用户声音文本信息传输至远端服务器,还用于根据智能设备在线状况按第一预设语料模板输出询问推荐语料文本信息至云端语音平台,还用于将询问推荐语料音频信息传输至网关设备,还用于将反馈结果音频信息传输至云端语音平台,还用于将反馈结果文本信息传输至远端服务器,还用于将反馈结果文本信息传输至远端服务器,还用于将将执行指令传输至网关设备,还用于将执行指令传达至对应的智能设备,还用于将执行结果信息反馈至网关设备、远端服务器。
转换模块设于远端语音平台中、转换模块通过ASR、TTS技术将用户语音信息转换为用户情绪文本信息,用于将询问推荐语料文本信息转换为询问推荐语料音频信息,用于将反馈结果音频信息转换成反馈结果文本信息,用于将执行结果语料文本信息转换为执行结果语料音频信息;
查询模块设于远端服务器中,用于查询与触发语料信息绑定的智能设备的在线状态;输出模块在智能设备、网关设备、远端服务器、云端语音平台均有设置。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (10)
1.一种基于语音识别自动推荐使用智能设备的方法,其特征在于,包括以下步骤:
步骤S100:获取用户语音信息;
步骤S200:对用户语音信息进行匹配,输出与语音信息匹配度最高的询问推荐语料信息;
步骤S300:收录反馈结果信息;
步骤S400:获取与反馈结果信息对应相关联的执行指令,并将执行指令进行传达;
步骤S500:获取执行结果信息,并将执行结果信息进行输出。
2.如权利要求1所述的语音识别自动推荐使用智能设备的方法,其特征在于,所述步骤S100包括:
网关设备捕捉用户声音,并将用户声音音频信息传输至云端语音平台,云端语音平台将用户声音音频信息转换为用户声音文本信息。
3.如权利要求2所述的基于语音识别自动推荐使用智能设备的方法,其特征在于,所述步骤S200包括:
云端语音平台将用户声音文本信息输入触发语料文本数据库中,与触发语料文本数据库中的事先设置的智能设备触发语料信息进行逐一对比,通过对文字字数相同、文字字体相同、感叹语气相同三个维度上进行打分得分,选择得分最高的智能设备触发语料信息,并将得分最高的智能设备触发语料信息传输至远端服务器,远端服务器查询该智能设备触发语料信息中的智能设备是否在线,根据智能设备在线状况按第一预设语料模板输出询问推荐语料文本信息至云端语音平台,云端语音平台将询问推荐语料文本信息转换为询问推荐语料音频信息,再将询问推荐语料音频信息传输至网关设备,网关设备对询问推荐语料音频信息进行播报。
4.如权利要求3所述的基于语音识别自动推荐使用智能设备的方法,其特征在于,所述步骤S300包括:
用户接收到询问推荐语料音频信息后,通过声音对询问信息进行回答形成反馈结果音频信息,网关设备对反馈结果音频信息进行收录,并将反馈结果音频信息传输至云端语音平台,云端语音平台将其转换成反馈结果文本信息传输至远端服务器。
5.如权利要求4所述的基于语音识别自动推荐使用智能设备的方法,其特征在于,所述步骤S400包括:
远端服务器提取反馈结果文本信息中的选择、确认信息,结合询问推荐语料文本信息中的智能设备信息,在数据库中进行检索,选出对应智能设备的执行指令,并将执行指令传输至网关设备,网关设备将执行指令传达至对应的智能设备。
6.如权利要求5所述的基于语音识别自动推荐使用智能设备的方法,其特征在于,所述步骤S500包括:
智能设备运行执行指令,并将执行结果信息反馈至网关设备,网关设备将执行结果信息反馈至远端服务器,远端服务器按第二预设语料模板输出执行结果语料文本信息至云端语音平台,云端语音平台将执行结果语料文本信息转换为执行结果语料音频信息,再将执行结果语料音频信息传输至网关设备,网关设备对执行结果语料音频信息进行播报。
7.如权利要求6所述的基于语音识别自动推荐使用智能设备的方法,其特征在于,
所述步骤S500中的第一预设语料模板包括固定格式的询问套话,以及在询问套话中的固定位置根据智能设备的在线状态添入的智能设备名称;所述步骤S500中的第二预设语料模板包括固定格式的执行结果套话,以及在执行结果套话中的固定位置根据智能设备的执行结果添入的智能设备名称。
8.一种基于语音识别自动推荐使用智能设备的系统,其特征在于,包括:
获取模块,用于获取用户语音信息、用户对于询问推荐语料信息的反馈结果信息、与反馈结果信息对应相关联的执行指令以及执行结果信息;
匹配模块,用于对用户语音信息进行匹配;
输出模块,用于输出与语音信息匹配度最高的询问推荐语料信息,用于传达执行指令以及输出执行结果信息。
9.如权利要求8所述的基于语音识别自动推荐使用智能设备的系统,其特征在于,
还包括转换模块,用于将用户声音音频信息转换为用户声音文本信息,用于将询问推荐语料文本信息转换为询问推荐语料音频信息,用于将反馈结果音频信息转换成反馈结果文本信息,用于将执行结果语料文本信息转换为执行结果语料音频信息;
查询模块,用于查询智能设备触发语料信息中的智能设备的在线状态。
10.如权利要求9所述的基于语音识别自动推荐使用智能设备的系统,其特征在于,
所述输出模块,还用于将用户声音音频信息传输至云端语音平台,还用于将用户声音文本信息传输至远端服务器,还用于根据智能设备在线状况按第一预设语料模板输出询问推荐语料文本信息至云端语音平台,还用于将询问推荐语料音频信息传输至网关设备,还用于将反馈结果音频信息传输至云端语音平台,还用于将反馈结果文本信息传输至远端服务器,还用于将反馈结果文本信息传输至远端服务器,还用于将将执行指令传输至网关设备,还用于将执行指令传达至对应的智能设备,还用于将执行结果信息反馈至网关设备、远端服务器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211030314.7A CN116564300A (zh) | 2022-08-25 | 2022-08-25 | 一种基于语音识别自动推荐使用智能设备的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211030314.7A CN116564300A (zh) | 2022-08-25 | 2022-08-25 | 一种基于语音识别自动推荐使用智能设备的方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116564300A true CN116564300A (zh) | 2023-08-08 |
Family
ID=87498836
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211030314.7A Pending CN116564300A (zh) | 2022-08-25 | 2022-08-25 | 一种基于语音识别自动推荐使用智能设备的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116564300A (zh) |
-
2022
- 2022-08-25 CN CN202211030314.7A patent/CN116564300A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7354301B2 (ja) | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 | |
US20220036882A1 (en) | Electronic apparatus, system and method for using speech recognition service | |
US11955126B2 (en) | Systems and methods for virtual assistant routing | |
US20150331665A1 (en) | Information provision method using voice recognition function and control method for device | |
CN108682419A (zh) | 语音控制方法及设备、计算机可读存储介质及设备 | |
JP6904361B2 (ja) | 情報処理装置、及び情報処理方法 | |
US9773500B2 (en) | Method for acquiring at least two pieces of information to be acquired, comprising information content to be linked, using a speech dialogue device, speech dialogue device, and motor vehicle | |
WO2017057173A1 (ja) | 対話装置及び対話方法 | |
CN110111767A (zh) | 多语言语音辅助支持 | |
US20020013860A1 (en) | Dialog control method and apparatus for controlling dialog | |
CN110050303A (zh) | 基于第三方代理内容的语音到文本转换 | |
CN112242141A (zh) | 一种语音控制方法、智能座舱、服务器、车辆和介质 | |
CN109302486B (zh) | 一种根据车内环境推送音乐的方法和系统 | |
JP7207425B2 (ja) | 対話装置、対話システムおよび対話プログラム | |
JP4385949B2 (ja) | 車載チャットシステム | |
DE112022000504T5 (de) | Interaktive Inhaltsausgabe | |
JP2017228221A (ja) | 予約装置、予約方法および車載システム | |
JP6832503B2 (ja) | 情報提示方法、情報提示プログラム及び情報提示システム | |
CN116564300A (zh) | 一种基于语音识别自动推荐使用智能设备的方法和系统 | |
US11518398B2 (en) | Agent system, agent server, method of controlling agent server, and storage medium | |
CN116524921A (zh) | 一种语音机器人的情绪表情互动方法和系统 | |
JP6598369B2 (ja) | 音声管理サーバー装置 | |
JP2021135935A (ja) | コミュニケーション管理装置及び方法 | |
JP7196426B2 (ja) | 情報処理方法および情報処理システム | |
CN110381097B (zh) | 一种语音分享音频的方法、系统及车载终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |