CN114005431A - 语音系统的配置方法、装置、设备以及可读存储介质 - Google Patents
语音系统的配置方法、装置、设备以及可读存储介质 Download PDFInfo
- Publication number
- CN114005431A CN114005431A CN202111204751.1A CN202111204751A CN114005431A CN 114005431 A CN114005431 A CN 114005431A CN 202111204751 A CN202111204751 A CN 202111204751A CN 114005431 A CN114005431 A CN 114005431A
- Authority
- CN
- China
- Prior art keywords
- skill
- voice
- target
- interface
- configuration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000001960 triggered effect Effects 0.000 claims abstract description 17
- 238000004088 simulation Methods 0.000 claims description 55
- 230000002452 interceptive effect Effects 0.000 claims description 28
- 230000004044 response Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 13
- 230000003993 interaction Effects 0.000 claims description 4
- 238000011161 development Methods 0.000 abstract description 26
- 230000000007 visual effect Effects 0.000 abstract description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 235000013372 meat Nutrition 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000004851 dishwashing Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000000275 quality assurance Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种语音系统的配置方法、装置、设备以及计算机可读存储介质,其中,该方法包括:确定待配置的目标设备的设备信息;生成与设备信息匹配的技能配置界面,并在用户界面上显示技能配置界面;响应于基于技能配置界面触发的技能选择指令,从预设的技能池中确定出技能选择指令对应的目标语音技能;基于目标语音技能生成目标设备的语音系统。采用本申请的方案,用户可以通过可视化的技能配置界面,为一个原本不具有对话系统的设备赋予智能对话的能力,在开发层面上去掉繁琐的步骤,降低开发门槛,提高了语音对话系统的开发效率。
Description
技术领域
本申请涉及计算机技术领域,具体涉及一种语音系统的配置方法、装置、设备以及计算机可读存储介质。
背景技术
随着AI(Artificial Intelligence,人工智能)技术的发展,自然语言处理技术的提升,消费者对智能设备的语音助手功能的使用在逐渐增加。在不同的电子设备上,一般会根据该产品的应用需求为其配置适配的语音技能,例如,查询天气、听音乐、点外卖、看影视、菜谱查询等等。也就是说,不同设备对于语音技能的需求可能不同,也就需要配置不同的对话策略,因此,开发人员在对设备的语音系统进行开发时,若按照传统的开发方式,需要用户具备语音对话系统的基础知识,才能进行语音对话系统的开发,导致开发效率低下。
发明内容
本申请实施例提供一种语音系统的配置方法、装置、设备以及计算机可读存储介质,能够提高语音对话系统的开发效率。
第一方面,本申请实施例提供一种语音系统的配置方法,包括:
确定待配置的目标设备的设备信息;
生成与所述设备信息匹配的技能配置界面,并在用户界面上显示所述技能配置界面;
响应于基于所述技能配置界面触发的技能选择指令,从预设的技能池中确定出所述技能选择指令对应的目标语音技能;
基于所述目标语音技能生成所述目标设备的语音系统。
第二方面,本申请实施例还提供一种语音系统的配置装置,包括:
设备管理单元,用于确定待配置的目标设备的设备信息;
界面展示单元,用于生成与所述设备信息匹配的技能配置界面,并在用户界面上显示所述技能配置界面;
技能配置单元,用于响应于基于所述技能配置界面触发的技能选择指令,从预设的技能池中确定出所述技能选择指令对应的目标语音技能;
系统生成单元,用于基于所述目标语音技能生成所述目标设备的语音系统。
第三方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如本申请任一实施例提供的语音系统的配置方法中的步骤。
第四方面,本申请实施例还提供一种电子设备,所述电子设备包括处理器、存储器以及存储于所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请任一实施例提供的语音系统的配置方法中的步骤。
本申请实施例提供的技术方案,先确定出待配置的目标设备的设备信息,然后基于该设备信息生成一个技能配置界面,并将其显示在用户界面上,以提供给用户一个可视化的界面用于进行技能配置,用户可以基于该技能配置界面触发技能选择指令,以从预设的技能池中选择出需要配置给目标设备的目标语音技能,在确定出目标语音技能之后,根据目标语音技能生成技能配置参数,基于该技能参数对目标设备的语音系统进行配置,通过本申请实施例的方案,以一种直观的方式呈现对话配置策略,用户可以通过可视化的技能配置界面,为一个原本不具有对话系统的设备赋予智能对话的能力,在开发层面上去掉繁琐的步骤,降低开发门槛,提高了语音对话系统的开发效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的语音系统的配置方法的第一种流程示意图。
图2为本申请实施例提供的语音系统的配置方法中的设备设置界面的示意图。
图3为本申请实施例提供的语音系统的配置方法中的技能配置界面的示意图。
图4为本申请实施例提供的语音系统的配置方法中的设备模拟界面的示意图。
图5为本申请实施例提供的语音系统的配置方法的第二种流程示意图。
图6为本申请实施例提供的语音系统的配置装置的结构示意图。
图7为本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本申请的保护范围。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例提供一种语音系统的配置方法,该语音系统的配置方法的执行主体可以是电子设备。其中,电子设备可以是智能手机、平板电脑、掌上电脑、笔记本电脑、或者台式电脑等设备。
请参阅图1,图1为本申请实施例提供的语音系统的配置方法的第一种流程示意图。本申请实施例提供的语音系统的配置方法的具体流程可以如下:
101、确定待配置的目标设备的设备信息。
本申请实施例中的目标设备可以为冰箱、空调、洗碗机等家用电器,也可以是汽车、电视机、音箱等其他可以提供语音对话能力的设备。
用户在为一设备进行语音系统的配置时,需要输入该目标设备的设备信息。其中设备信息包括但不限于设备类型、设备型号、设备是否有屏等。例如,目标设备的设备信息可以为,设备类型:冰箱;设备型号:X16;是否有屏:有屏。
其中,设备信息的获取方式有多种,例如,用户通过手动输入的方式在电子设备提供的信息输入框中输入具体的设备信息。又例如,电子设备在其用户界面上显示一个设备设置界面,如图2所示,图2为本申请实施例提供的语音系统的配置方法中的设备设置界面的示意图。用户可以基于该设备设置界面,通过对应的控件对设备信息进行设置。
102、生成与设备信息匹配的技能配置界面,并在用户界面上显示技能配置界面。
电子设备获取到设备信息后,生成与设备信息匹配的技能配置界面,并将该技能配置界面显示在用户界面上。
其中,在本申请的一实施例中,生成与设备信息匹配的技能配置界面,并在用户界面上显示技能配置界面,包括:从技能池中确定出与设备信息匹配的候选语音技能;基于候选语音技能生成技能配置界面,技能配置界面上包括每一候选语音技能对应的配置控件;在用户界面上显示技能配置界面。
本申请实施例提供的语音系统的配置方法,预先创建技能池,该技能池包括多种语音技能。其中,语音技能包括但不限于看影视、听音乐、天气查询、股票查询、菜谱查询、点外卖等等。由于根据设备信息的不同,设备提供给用户的语音技能可能有所不同,例如,一些具有显示屏的设备则不会提供看影视的语音技能。因此,在确定出设备信息后,可以从技能池中确定出与该设备信息匹配的候选语音技能。其中,可以为技能池中的每一语音技能添加支持的设备类型、设备型号、是否需要有显示屏等多个维度的标签,电子设备在确定出设备信息后,可以根据设备信息,以及技能池中各语音技能的标签,从中确定出该目标设备能够支持的语音技能作为候选语音技能,再基于候选语音技能生成技能配置界面,将其显示在用户界面上。
请参阅图3,图3为本申请实施例提供的语音系统的配置方法中的技能配置界面的示意图。其中,技能配置界面上包括每一候选语音技能对应的配置控件,用户可以通过对应的配置控件选择需要的语音技能。
103、响应于基于技能配置界面触发的技能选择指令,从预设的技能池中确定出技能选择指令对应的目标语音技能。
电子设备展示技能配置界面后,用户可以基于该界面进行语音技能选择指令,例如,通过勾选或者拖拽的方式触发技能选择指令,将技能选择指令对应的语音技能作为目标语音技能。
例如,在一实施例中,确定待配置的目标设备的设备信息之后,该方法还包括:生成与设备信息匹配的设备模拟界面,并在用户界面上显示设备模拟界面。
响应于基于技能配置界面触发的技能选择指令,从预设的技能池中确定出技能选择指令对应的目标语音技能之后,还包括:在设备模拟界面上显示目标语音技能对应的交互窗口。
该实施例中,在用户界面上显示技能配置界面的同时,还可以在用户界面上显示设备信息匹配的设备模拟界面。例如,目标设备为冰箱,则在用户界面上显示冰箱的外观图,同时在外观图上显示模拟显示屏的界面。请参阅图4,图4为本申请实施例提供的语音系统的配置方法中的设备模拟界面的示意图。
用户在从技能池中选择语音技能时,可以通过拖拽的方式将要选择的语音技能拖拽到设备模拟界面上,拖拽到设备模拟界面上的语音技能即为目标语音技能。
104、基于目标语音技能生成目标设备的语音系统。
在确定出目标语音技能后,基于目标语音技能生成目标设备的语音系统。例如,对各目标语音技能,以及技能配置数据进行打包处理,生成一个的语音系统。
具体实施时,本申请不受所描述的各个步骤的执行顺序的限制,在不产生冲突的情况下,某些步骤还可以采用其它顺序进行或者同时进行。
由上可知,本申请实施例提供的语音系统的配置方法,先确定出待配置的目标设备的设备信息,然后基于该设备信息生成一个技能配置界面,并将其显示在用户界面上,以提供给用户一个可视化的界面用于进行技能配置,用户可以基于该技能配置界面触发技能选择指令,以从预设的技能池中选择出需要配置给目标设备的目标语音技能,在确定出目标语音技能之后,根据目标语音技能生成技能配置参数,基于该技能参数对目标设备的语音系统进行配置,通过本申请实施例的方案,以一种直观的方式呈现对话配置策略,用户可以通过可视化的技能配置界面,为一个原本不具有对话系统的设备赋予智能对话的能力,在开发层面上去掉繁琐的步骤,降低开发门槛,提高了语音对话系统的开发效率。
在一些实施例中,响应于基于技能配置界面触发的技能选择指令,从预设的技能池中确定出技能选择指令对应的目标语音技能之后,还包括:当目标语音技能有多个时,根据多个目标语音技能各自对应的技能选择指令的触发顺序确定多个目标语音技能的优先级顺序;按照优先级顺序,生成每一目标语音技能对应的权重参数。
该实施例中,用户在选择目标语音技能时,如果目标语音技能有多个,则用户可以设置多个目标语音技能的优先级顺序,例如,按照用户选择目标语音技能的顺序确定优先级,其中,在先选择的目标语音技能的优先级高于在后选择的目标语音技能的优先级。进而根据该优先级顺序配置各个目标语音技能的权重,优先级越高,则权重越高。
当一个语音指令可以被两个或者两个以上的语音技能执行时,优先被权重高的语音技能执行。例如,如果菜谱查询的权重高于点外卖的权重,当语音信号为“鱼香肉丝”时,该语音信号会被发送给菜谱查询的语音技能,而非点外卖的语音技能。那么,在冰箱上会优先显示“鱼香肉丝”的菜谱。
在一些实施例中,在设备模拟界面上显示目标语音技能对应的交互窗口,包括:按照优先级顺序,将每一目标语音技能对应的交互窗口显示在设备模拟界面上。
在设备模拟界面上显示目标语音技能对应的交互窗口之后,还包括:当检测到基于交互窗口触发的拖拽操作时,确定拖拽操作对应的目标交互窗口;根据拖拽操作调整目标交互窗口在设备模拟界面上的位置;根据目标交互窗口调整后的位置更新权重参数。
该实施例中,在选择了目标语音技能后,用户还可以根据需要在设备模拟界面上调整各目标语音技能对应的交互窗口,以即时的查看设置效果。例如,通过拖拽操作调整目标交互窗口在设备模拟界面上的位置。如果用户调整了目标交互窗口在设备模拟界面上的位置,则电子设备根据目标交互窗口调整后的位置更新权重参数。
请参阅图5,图5为本发明实施例提供的语音系统的配置方法的第二流程示意图。方法包括:
201、确定待配置的目标设备的设备信息。
申请实施例提供的语义系统配置方法的系统架构包括设备配置系统和对话系统。设备配置系统包括如下模块:
设备管理模块,对设备的创建和删除,以及设备信息进行管理。其中,设备信息包括但不限于设备类型、设备型号、设备是否有屏等。
技能配置模块,对设备的语音技能的配置进行管理。
权重配置模块,对各目标语音技能的权重参数进行管理。
对话模拟模块,开发过程中可以随时模拟对话,查看语音配置效果。
协议输出模块,在配置完成后输出对话系统的请求协议和各个目标语音技能的返回协议,以供目标设备使用。
对话系统包括如下模块:
语音识别模块,将用户的语音请求转换为文字。
自然语言理解模块,根据文字解析用户意图。
对话管理模块,管理语音对话最终输出的用户意图,以及所使用的语音技能。
技能管理模块,实现设备操作响应以及信息展示的模块。
文字转语音模块,将技能的输出结果由文字转换为语音。
需要说明的是,对话系统和设备配置系统均可以根据需要设置为包含上述模块中的一个或者多个。并且,上述模块均为功能模块,可以根据需要进行合并或者拆分。
电子设备获取用户输入的目标设备的设备信息,其中,设备信息的获取方式有多种,例如,用户通过手动输入的方式在电子设备提供的信息输入框中输入具体的设备信息。又例如,电子设备在其用户界面上显示一个设备设置界面,如图2所示,用户可以基于该设备设置界面,通过对应的控件对设备信息进行设置。
其中,在一实施例中,该语音系统的配置方法可以门户网站的形式部署为一个开放式的开发平台。该开发平台由spring-boot(斯普瑞布特提供的用来简化新Spring应用的搭建及开发的框架)和vue(一种用于构建用户界面的渐进式框架)分别作为后端服务及前端页面的构建架构。在技能配置过程中产生的设备信息,以及目标语音技能、权重参数等数据都会存储在数据库中,设备配置系统可以通过DevOps工具拿到数据库中的数据对对话系统更新配置并自动部署。其中,DevOps是Development和Operations的组合词,是一组过程、方法与系统的统称,DevOps工具是用于促进开发、技术运营和质量保障部门之间的沟通、协作与整合的一种工具。并且设备配置系统的对话模拟模块可以通过http(Hyper TextTransfer Protocol,超文本传输协议)请求向对话系统发送请求,以进行模拟对话。
用户(开发人员)通过账户登陆该网站,在如图2所示的界面上创建一个设备,选择设备的类型、型号以及是否有显示屏等。在提交后,设备管理模块会将设备信息存储到数据库(DB)中。此外,电子设备还生成一对不会重复的appkey和apptoken作为后续对话系统鉴权使用并存入数据库。
202、生成与设备信息匹配的技能配置界面和设备模拟界面,并在用户界面上显示技能配置界面和设备模拟界面。
电子设备获取到设备信息后,生成与设备信息匹配的技能配置界面和设备模拟界面,并将其显示在用户界面上。
其中,技能配置界面用于显示候选语音技能。电子设备在确定出设备信息后,可以根据设备信息以及技能池中各语音技能的标签,从中确定出该目标设备能够支持的语音技能作为候选语音技能,再基于候选语音技能生成技能配置界面,将其显示在用户界面上。该实施例中,在用户界面上显示技能配置界面的同时,还可以在用户界面上显示设备信息匹配的设备模拟界面。设备模拟界面用于显示与用户选择的目标语音技能。
203、响应于基于技能配置界面触发的技能选择指令,从预设的技能池中确定出技能选择指令对应的目标语音技能。
电子设备展示技能配置界面后,用户可以基于该界面进行语音技能选择指令,例如,通过勾选或者拖拽的方式触发技能选择指令,将技能选择指令对应的语音技能作为目标语音技能。
当用户从技能配置界面上选择一个目标语音技能后,将该语音技能的交互窗口显示在设备模拟界面上。例如,用户在从技能池中选择语音技能时,可以通过拖拽的方式将要选择的语音技能拖拽到设备模拟界面上,拖拽到设备模拟界面上的语音技能即为目标语音技能。
204、当目标语音技能有多个时,根据多个目标语音技能各自对应的技能选择指令的触发顺序确定多个目标语音技能的优先级顺序。
205、按照优先级顺序,生成每一目标语音技能对应的权重参数。
206、按照优先级顺序,在设备模拟界面上显示目标语音技能对应的交互窗口。
用户在选择目标语音技能时,如果目标语音技能有多个,则用户可以设置多个目标语音技能的优先级顺序,例如,按照用户选择目标语音技能的顺序确定优先级,其中,在先选择的目标语音技能的优先级高于在后选择的目标语音技能的优先级。进而根据该优先级顺序配置各个目标语音技能的权重,优先级越高,则权重越高。按照优先级由高至低的顺序将多个目标语音技能显示在设备模拟界面上。
在选择了目标语音技能后,用户还可以根据需要在设备模拟界面上调整各目标语音技能对应的交互窗口,以即时的查看设置效果。例如,通过拖拽操作调整目标交互窗口在设备模拟界面上的位置。如果用户调整了目标交互窗口在设备模拟界面上的位置,则电子设备根据目标交互窗口调整后的位置更新权重参数。
207、响应于对话模拟指令,根据设备信息和技能配置数据部署对话系统。
用户在配置技能过程中,可以通过点击模拟对话来进行对话模拟,对目前配置的技能情况进行体验。在用户点击模拟对话之后DevOps工具将读取数据库中设备信息、appkey等数据将对话系统重新配置和部署。
208、响应于模拟语音指令,向对话系统发送语音请求。
209、接收对话系统根据语音请求返回的应答信息,并将应答信息显示在用户界面上。
用户可以在设备模拟界面上输入文字或者语音的查询请求,并触发模拟语音指令,对话模拟模块将带上该设备的appkey和apptoken向对话系统发出语音请求,并在获取返回的应答信息后将其显示在用户界面上,实现对设备技能的配置情况和对话能力的即时体验,并根据需要随时修改目标语音技能以及权重参数等。
当用户对设备的技能和对话效果满意之后,选择发布之后,电子设备可以下载协议文件;协议输出模块会根据数据库中的配置,自动将各个目标语音技能的协议打包下载供后续使用。
由上可知,本发明实施例提出的语音系统的配置方法,用户可以在门户网站上,通过拖拽技能池中的技能,自动地为一个原本不带有对话系统的设备赋予智能对话的能力,能够简洁快速地完成语音能力的赋能,对于产品经理来说,不需要开发门槛,配置设备后将打包好的协议交给开发人员开发就可以完成一个产品原型的定义。
在一实施例中还提供一种语音系统的配置装置。请参阅图6,图6为本申请实施例提供的语音系统的配置装置300的结构示意图。其中该语音系统的配置装置300应用于电子设备,该语音系统的配置装置300包括设备管理单元301、界面展示单元302、技能配置单元303以及系统生成单元304,如下:
设备管理单元301,用于确定待配置的目标设备的设备信息;
界面展示单元302,用于生成与所述设备信息匹配的技能配置界面,并在用户界面上显示所述技能配置界面;
技能配置单元303,用于响应于基于所述技能配置界面触发的技能选择指令,从预设的技能池中确定出所述技能选择指令对应的目标语音技能;
系统生成单元304,用于基于所述目标语音技能生成所述目标设备的语音系统。
在一些实施例中,界面展示单元302,用于从所述技能池中确定出与所述设备信息匹配的候选语音技能;
基于所述候选语音技能生成技能配置界面,所述技能配置界面上包括每一候选语音技能对应的配置控件;
在用户界面上显示所述技能配置界面。
在一些实施例中,界面展示单元302,用于生成与所述设备信息匹配的设备模拟界面,并在所述用户界面上显示所述设备模拟界面;
在所述设备模拟界面上显示所述目标语音技能对应的交互窗口。
在一些实施例中,技能配置单元303,用于当所述目标语音技能有多个时,根据多个所述目标语音技能各自对应的技能选择指令的触发顺序确定多个所述目标语音技能的优先级顺序;
按照所述优先级顺序,生成每一所述目标语音技能对应的权重参数。
在一些实施例中,界面展示单元302,用于按照所述优先级顺序,将每一所述目标语音技能对应的交互窗口显示在所述设备模拟界面上;
当检测到基于所述交互窗口触发的拖拽操作时,确定拖拽操作对应的目标交互窗口;
根据所述拖拽操作调整所述目标交互窗口在所述设备模拟界面上的位置;
系统生成单元304,用于根据所述目标交互窗口调整后的位置更新所述权重参数。
在一些实施例中,该语音系统的配置装置300还包括:
对话模拟单元,用于响应于对话模拟指令,根据所述设备信息和所述技能配置数据部署对话系统;
响应于模拟语音指令,向所述对话系统发送语音请求;
接收所述对话系统根据所述语音请求返回的应答信息,并将所述应答信息显示在用户界面上。
应当说明的是,本申请实施例提供的语音系统的配置装置与上文实施例中的语音系统的配置方法属于同一构思,通过该语音系统的配置装置可以实现语音系统的配置方法实施例中提供的任一方法,其具体实现过程详见语音系统的配置方法实施例,此处不再赘述。
由上可知,本申请实施例提出的语音系统的配置装置,先确定出待配置的目标设备的设备信息,然后基于该设备信息生成一个技能配置界面,并将其显示在用户界面上,以提供给用户一个可视化的界面用于进行技能配置,用户可以基于该技能配置界面触发技能选择指令,以从预设的技能池中选择出需要配置给目标设备的目标语音技能,在确定出目标语音技能之后,根据目标语音技能生成技能配置参数,基于该技能参数对目标设备的语音系统进行配置,通过本申请实施例的方案,以一种直观的方式呈现对话配置策略,用户可以通过可视化的技能配置界面,为一个原本不具有对话系统的设备赋予智能对话的能力,在开发层面上去掉繁琐的步骤,降低开发门槛,提高了语音对话系统的开发效率。
本申请实施例还提供一种电子设备,该电子设备可以为终端,该终端可以为智能手机、平板电脑、笔记本电脑、触控屏幕、个人计算机等终端设备。请参阅图7,图7为本申请实施例提供的电子设备的结构示意图。该电子设备400包括有一个或者一个以上处理核心的处理器401、有一个或一个以上计算机可读存储介质的存储器402及存储在存储器402上并可在处理器上运行的计算机程序。其中,处理器401与存储器402电性连接。本领域技术人员可以理解,图中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
处理器401是电子设备400的控制中心,利用各种接口和线路连接整个电子设备400的各个部分,通过运行或加载存储在存储器402内的软件程序和/或单元,以及调用存储在存储器402内的数据,执行电子设备400的各种功能和处理数据,从而对电子设备400进行整体监控。
在本申请实施例中,电子设备400中的处理器401会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能:
确定待配置的目标设备的设备信息;
生成与所述设备信息匹配的技能配置界面,并在用户界面上显示所述技能配置界面;
响应于基于所述技能配置界面触发的技能选择指令,从预设的技能池中确定出所述技能选择指令对应的目标语音技能;
基于所述目标语音技能生成所述目标设备的语音系统。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
可选的,如图7所示,电子设备400还包括:触控显示屏403、射频电路404、音频电路405、输入单元406以及电源407。其中,处理器401分别与触控显示屏403、射频电路404、音频电路405、输入单元406以及电源407电性连接。本领域技术人员可以理解,图7中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
触控显示屏403可用于显示图形用户界面以及接收用户作用于图形用户界面产生的操作指令。触控显示屏403可以包括显示面板和触控面板。其中,显示面板可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。触控面板可用于收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并生成相应的操作指令,且操作指令执行对应程序。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器401,并能接收处理器401发来的命令并加以执行。触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器401以确定触摸事件的类型,随后处理器401根据触摸事件的类型在显示面板上提供相应的视觉输出。在本申请实施例中,可以将触控面板与显示面板集成到触控显示屏403而实现输入和输出功能。但是在某些实施例中,触控面板与显示面板可以作为两个独立的部件来实现输入和输出功能。即触控显示屏403也可以作为输入单元406的一部分实现输入功能。
射频电路404可用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。
音频电路405可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。音频电路405可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路405接收后转换为音频数据,再将音频数据输出处理器401处理后,经射频电路404以发送给比如另一电子设备,或者将音频数据输出至存储器402以便进一步处理。音频电路405还可能包括耳塞插孔,以提供外设耳机与电子设备的通信。
输入单元406可用于接收输入的数字、字符信息或用户特征信息(例如指纹、虹膜、面部信息等),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
电源407用于给电子设备400的各个部件供电。可选的,电源407可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源407还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管图7中未示出,电子设备400还可以包括摄像头、传感器、无线保真单元、蓝牙单元等,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
由上可知,本实施例提供的电子设备,先确定出待配置的目标设备的设备信息,然后基于该设备信息生成一个技能配置界面,并将其显示在用户界面上,以提供给用户一个可视化的界面用于进行技能配置,用户可以基于该技能配置界面触发技能选择指令,以从预设的技能池中选择出需要配置给目标设备的目标语音技能,在确定出目标语音技能之后,根据目标语音技能生成技能配置参数,基于该技能参数对目标设备的语音系统进行配置,通过本申请实施例的方案,以一种直观的方式呈现对话配置策略,用户可以通过可视化的技能配置界面,为一个原本不具有对话系统的设备赋予智能对话的能力,在开发层面上去掉繁琐的步骤,降低开发门槛,提高了语音对话系统的开发效率。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如本申请实施例提供的任意一种语音系统的配置方法中的步骤。例如,该计算机程序可以执行如下步骤:
确定待配置的目标设备的设备信息;
生成与所述设备信息匹配的技能配置界面,并在用户界面上显示所述技能配置界面;
响应于基于所述技能配置界面触发的技能选择指令,从预设的技能池中确定出所述技能选择指令对应的目标语音技能;
基于所述目标语音技能生成所述目标设备的语音系统。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种语音系统的配置方法中的步骤,因此,可以实现本申请实施例所提供的任一种语音系统的配置方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种语音系统的配置方法、装置、设备以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种语音系统的配置方法,其特征在于,包括:
确定待配置的目标设备的设备信息;
生成与所述设备信息匹配的技能配置界面,并在用户界面上显示所述技能配置界面;
响应于基于所述技能配置界面触发的技能选择指令,从预设的技能池中确定出所述技能选择指令对应的目标语音技能;
基于所述目标语音技能生成所述目标设备的语音系统。
2.如权利要求1所述的方法,其特征在于,所述生成与所述设备信息匹配的技能配置界面,并在用户界面上显示所述技能配置界面,包括:
从所述技能池中确定出与所述设备信息匹配的候选语音技能;
基于所述候选语音技能生成技能配置界面,所述技能配置界面上包括每一候选语音技能对应的配置控件;
在用户界面上显示所述技能配置界面。
3.如权利要求1所述的方法,其特征在于,所述确定待配置的目标设备的设备信息之后,还包括:
生成与所述设备信息匹配的设备模拟界面,并在所述用户界面上显示所述设备模拟界面;
所述响应于基于所述技能配置界面触发的技能选择指令,从预设的技能池中确定出所述技能选择指令对应的目标语音技能之后,还包括:
在所述设备模拟界面上显示所述目标语音技能对应的交互窗口。
4.如权利要求3所述的方法,其特征在于,所述响应于基于所述技能配置界面触发的技能选择指令,从预设的技能池中确定出所述技能选择指令对应的目标语音技能之后,还包括:
当所述目标语音技能有多个时,根据多个所述目标语音技能各自对应的技能选择指令的触发顺序确定多个所述目标语音技能的优先级顺序;
按照所述优先级顺序,生成每一所述目标语音技能对应的权重参数。
5.如权利要求4所述的方法,其特征在于,所述在所述设备模拟界面上显示所述目标语音技能对应的交互窗口,包括:
按照所述优先级顺序,将每一所述目标语音技能对应的交互窗口显示在所述设备模拟界面上;
所述在所述设备模拟界面上显示所述目标语音技能对应的交互窗口之后,还包括:
当检测到基于所述交互窗口触发的拖拽操作时,确定拖拽操作对应的目标交互窗口;
根据所述拖拽操作调整所述目标交互窗口在所述设备模拟界面上的位置;
根据所述目标交互窗口调整后的位置更新所述权重参数。
6.如权利要求1至5任一项所述的方法,其特征在于,所述基于所述目标语音技能生成所述目标设备的语音系统之后,还包括:
响应于对话模拟指令,根据所述设备信息和所述技能配置数据部署对话系统;
响应于模拟语音指令,向所述对话系统发送语音请求;
接收所述对话系统根据所述语音请求返回的应答信息,并将所述应答信息显示在用户界面上。
7.一种语音系统的配置装置,其特征在于,包括:
设备管理单元,用于确定待配置的目标设备的设备信息;
界面展示单元,用于生成与所述设备信息匹配的技能配置界面,并在用户界面上显示所述技能配置界面;
技能配置单元,用于响应于基于所述技能配置界面触发的技能选择指令,从预设的技能池中确定出所述技能选择指令对应的目标语音技能;
系统生成单元,用于基于所述目标语音技能生成所述目标设备的语音系统。
8.如权利要求7所述的装置,其特征在于,还包括:
对话模拟模块,用于响应于对话模拟指令,根据所述设备信息和所述技能配置数据部署对话系统;
响应于模拟语音指令,向所述对话系统发送语音请求;以及
接收所述对话系统根据所述语音请求返回的应答信息,并将所述应答信息显示在用户界面上。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的语音系统的配置方法中的步骤。
10.一种电子设备,其特征在于,所述电子设备包括处理器、存储器以及存储于所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的语音系统的配置方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111204751.1A CN114005431A (zh) | 2021-10-15 | 2021-10-15 | 语音系统的配置方法、装置、设备以及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111204751.1A CN114005431A (zh) | 2021-10-15 | 2021-10-15 | 语音系统的配置方法、装置、设备以及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114005431A true CN114005431A (zh) | 2022-02-01 |
Family
ID=79923090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111204751.1A Pending CN114005431A (zh) | 2021-10-15 | 2021-10-15 | 语音系统的配置方法、装置、设备以及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114005431A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115001891A (zh) * | 2022-05-31 | 2022-09-02 | 四川虹美智能科技有限公司 | 基于分级管理的智能家电控制方法及装置 |
-
2021
- 2021-10-15 CN CN202111204751.1A patent/CN114005431A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115001891A (zh) * | 2022-05-31 | 2022-09-02 | 四川虹美智能科技有限公司 | 基于分级管理的智能家电控制方法及装置 |
CN115001891B (zh) * | 2022-05-31 | 2023-05-19 | 四川虹美智能科技有限公司 | 基于分级管理的智能家电控制方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11868680B2 (en) | Electronic device and method for generating short cut of quick command | |
CN109062479B (zh) | 分屏应用切换方法、装置、存储介质和电子设备 | |
KR102298947B1 (ko) | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 | |
US11435980B2 (en) | System for processing user utterance and controlling method thereof | |
CN108984064B (zh) | 分屏显示方法、装置、存储介质和电子设备 | |
CN108039963B (zh) | 一种容器配置方法、装置及存储介质 | |
CN109062468B (zh) | 分屏显示方法、装置、存储介质和电子设备 | |
CN108958606B (zh) | 分屏显示方法、装置、存储介质和电子设备 | |
CN109712644A (zh) | 基于语音识别情绪变化控制led显示效果的方法、用于控制led显示效果的装置及系统 | |
CN109032732B (zh) | 通知显示方法、装置、存储介质及电子设备 | |
KR20210038812A (ko) | 음성 제어 방법, 장치, 전자 기기 및 판독 가능 저장 매체 | |
CN112587925A (zh) | 引导信息的显示方法、装置、存储介质及计算机设备 | |
CN113101650A (zh) | 游戏场景切换方法、装置、计算机设备及存储介质 | |
KR102345883B1 (ko) | 그래픽 표시를 출력하는 전자 장치 | |
CN114005431A (zh) | 语音系统的配置方法、装置、设备以及可读存储介质 | |
CN109062469B (zh) | 分屏显示方法、装置、存储介质和电子设备 | |
CN110262867A (zh) | 一种基于车载系统的远程控制方法和装置 | |
CN113467659A (zh) | 图标展示方法、装置及存储介质 | |
WO2023246558A1 (zh) | 语义理解方法、装置、介质及设备 | |
CN111359210B (zh) | 一种数据处理方法、装置、电子设备以及存储介质 | |
CN112163174A (zh) | 消息的显示方法、装置、存储介质及计算机设备 | |
CN112799754B (zh) | 信息处理方法、装置、存储介质及计算机设备 | |
CN115904514A (zh) | 基于三维场景中云渲染像素流实现方法及终端设备 | |
CN115145547A (zh) | 基于语音的编程方法、装置、电子设备及存储介质 | |
CN113641439A (zh) | 文本识别和展示方法、装置、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |