CN115440223A - 智能交互方法、装置、机器人和计算机可读存储介质 - Google Patents
智能交互方法、装置、机器人和计算机可读存储介质 Download PDFInfo
- Publication number
- CN115440223A CN115440223A CN202211052292.4A CN202211052292A CN115440223A CN 115440223 A CN115440223 A CN 115440223A CN 202211052292 A CN202211052292 A CN 202211052292A CN 115440223 A CN115440223 A CN 115440223A
- Authority
- CN
- China
- Prior art keywords
- user
- voice information
- intelligent interaction
- intention
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims abstract description 69
- 230000002452 interceptive effect Effects 0.000 claims abstract description 56
- 238000004590 computer program Methods 0.000 claims description 24
- 238000013507 mapping Methods 0.000 claims description 19
- 238000005516 engineering process Methods 0.000 claims description 7
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 abstract description 20
- 238000011161 development Methods 0.000 abstract description 10
- 238000012545 processing Methods 0.000 abstract description 8
- 238000012423 maintenance Methods 0.000 abstract description 7
- 238000012360 testing method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请实施例公开了一种智能交互方法、装置、机器人和计算机可读存储介质;该方法包括:接收用户通过点击引导选项所发送的交互指令;然后根据所述交互指令模拟出对应的语音信息;接着通过语义识别模块对所述语音信息进行解析后得到用户意图;最终根据所述用户意图向所述用户展示对应的交互界面。用户通过点击引导选项发出与终端的交互指令后,把引导选项当中的文本模拟成语音信息发送给语义识别端进行处理,也就是在击按钮以后不直接按照设置进行页面跳转,而是这样就可以走语义识别的另一套流程。这种方案使终端的前端交互可以不受页面线性关系影响,同时也可以节省开发量,使得不同模块的功能之间是解耦的,便于维护。
Description
技术领域
本申请涉及互联网技术领域,具体涉及一种智能交互方法、装置、机器人和计算机可读存储介质。
背景技术
随着科学技术的发展,语音交互方式因其最符合人类的交流习惯的特点,被认为是最自然的智能交互方式,该技术渐渐被应用在机器人等智能终端上。目前,一些具有显示屏幕的智能终端上会根据用户意图显示按钮引导选项,以引导用户与终端设备进行交互。引导选项会以按钮形式显示在界面上时,一些用户会手动点击引导选项,此时若按照传统的图形用户界面(Graphical User Interface,GUI)形式进行交互,对按钮进行直接的点按后页面跳转会带来很多问题,例如:引导选项需要根据当前场景、用户意图等许多信息进行智能推荐,非常不固定,如果要对每个引导选项按钮进行跳转页面结果的编程,工作量非常大,需要运营维护工作量一样很大;进一步地,由于页面之间一般有父级子级关系,如果直接按照按钮来设置页面跳转结果,则父子页面关系将会变得非常混乱,并且难以管理,尤其是返回上一页等操作功能会受到影响。
发明内容
本申请实施例提供一种智能交互方法、装置、机器人和计算机可读存储介质,可以解决智能交互页面设置时页面关系复杂、工作量大且难以维护的技术问题。
本申请实施例提供一种智能交互方法,所述智能交互方法包括:
接收用户通过点击引导选项所发送的交互指令,其中,所述引导选项在终端设备的显示界面中进行显示;
根据所述交互指令模拟出对应的语音信息;
通过语义识别模块对所述语音信息进行解析,以得到用户意图;
根据所述用户意图向所述用户展示对应的交互界面。
优选地,所述引导选项至少包括两个,每个引导选项中包含不同类别的指引信息;
相应地,根据所述交互指令模拟出对应的语音信息,包括:
提取所述交互指令中包含的指引信息;
将所述指引信息模拟成语音信息,将所述语音信息通过自动语音识别技术转换成文本,形成用户话术。
优选地,所述通过语义识别模块对所述语音信息进行解析,以得到用户意图,包括:
按照预设规则对所述语音信息进行拆解,得到多个关键词;
根据语义关系将拆解后得到的多个关键词对应到预先设定的语义槽位中,其中,所述语义槽位包括槽和槽位值,所述槽和槽位值一一对应形成槽值对;
查询每个所述关键词所在的语义槽位对应的槽位值,从预设的槽值对和用户意图之间的映射表中解析出用户意图。
优选地,所述智能交互方法还包括:
预先获取不同类型的用户需求场景,根据所述用户场景需求扩展出当前场景下的语料数据;
将所述语料数据进行分类,并填充到预先设定的各个语义槽位中形成多个槽值对;
根据预设规则对所述槽值对进行优先级排序;
将各个分类下优先级最高的语义槽位与相应的用户需求进行匹配,形成槽值对与用户意图之间的映射表。
优选地,所述将所述语料数据进行分类,包括:
根据意图将所述语料数据进行分类,所述分类包括搜索类别或指引类别或推荐类别。
优选地,在所述形成槽值对与用户意图之间的映射表之后还包括:
获取历史匹配信息,以对所述映射表进行更新,其中,所述历史匹配信息指用户需求与所呈现的用户意图匹配度之间的信息。
优选地,在所述接收用户通过点击引导选项所发送的智能交互指令之前,包括:
接收用户发出的语音信息;
根据所述语音信息,结合当前场景及当前配置信息,在终端设备的显示界面中显示不同的引导选项。
本申请实施例还提供一种智能交互装置,所述智能交互装置包括:
指令接收模板,用于接收用户通过点击引导选项所发送的交互指令,其中,所述引导选项在终端设备的显示界面中进行显示;
模拟转换模板,用于根据所述交互指令模拟出对应的语音信息;
语义识别模块,用于对所述语音信息进行解析,以得到用户意图;
展示模块,用于根据所述用户意图向所述用户展示对应的交互界面。
此外,本申请实施例还提供一种机器人,包括处理器和存储器,上述存储器存储有计算机程序,上述处理器用于运行上述存储器内的计算机程序实现本申请实施例提供的智能交互方法。
此外,本申请实施例还提供一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序适于处理器进行加载,以执行本申请实施例所提供的任一种智能交互方法。
此外,本申请实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本申请实施例所提供的任一种智能交互方法。
在本申请实施例中,首先接收用户通过点击引导选项所发送的交互指令,其中,所述引导选项在终端设备的显示界面中进行显示;然后根据所述交互指令模拟出对应的语音信息;接着通过语义识别模块对所述语音信息进行解析,以得到用户意图;最终根据所述用户意图向所述用户展示对应的交互界面。
即在本申请实施例中,用户通过点击引导选项发出与终端的交互指令后,可以通过模拟话术的方式模拟用户说一句话,即把引导选项当中的文本模拟成语音信息发送给语义识别端进行处理,也就是在击按钮以后不直接按照设置进行页面跳转,而是这样就可以走语义识别的另一套流程,而不需要单独对引导选项进行页面跳转的开发了。这种方案使终端的前端交互可以不受页面线性关系影响,同时也可以节省开发量,使得不同模块的功能之间是解耦的,便于维护。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的智能交互方法的场景示意图;
图2是本申请实施例提供的智能交互方法的流程示意图;
图3是本申请另一实施例提供的智能交互方法的流程示意图;
图4是本申请实施例提供的智能交互方法在终端中显示界面示意图;
图5是本申请实施例提供的智能交互装置的结构示意图;
图6是本申请实施例提供的机器人的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种智能交互方法、装置、机器人和计算机可读存储介质。其中,该智能交互装置可以集成在计算机设备中,该计算机设备可以是服务器,也可以是终端等设备。
其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等具有显示界面的终端,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
另外,本申请实施例中的“多个”指两个或两个以上。本申请实施例中的“第一”和“第二”等用于区分描述,而不能理解为暗示相对重要性。
以下分别进行详细说明。需要说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
在本实施例中,将从智能交互装置的角度进行描述,为了方便对本申请的智能交互方法进行说明,以下将终端作为计算机设备进行详细说明,即以终端作为执行主体进行详细说明。
请参阅图1,图1是本申请一实施例提供的智能交互方法的场景示意图。
在商场等公共场所下经常配置有用于指引的终端设备,用户使用时,终端设备可以通过以下方式与用户进行交互,并展示出用户所需的信息,具体包括:
接收用户通过点击引导选项所发送的交互指令,其中,所述引导选项在终端设备的显示界面中进行显示;
根据所述交互指令模拟出对应的语音信息;
通过语义识别模块对所述语音信息进行解析,以得到用户意图;
根据所述用户意图向所述用户展示对应的交互界面。
此方式下,用户通过点击引导选项发出与终端的交互指令后,可以通过模拟话术的方式模拟用户说一句话,即把引导选项当中的文本模拟成语音信息发送给语义识别端进行处理,也就是在击按钮以后不直接按照设置进行页面跳转,而是这样就可以走语义识别的另一套流程,而不需要单独对引导选项进行页面跳转的开发了。这种方案使终端的前端交互可以不受页面线性关系影响,同时也可以节省开发量,使得不同模块的功能之间是解耦的,便于维护。
以下通过具体实施例对进行详细说明。请参阅图2,图2是本申请一实施例提供的智能交互方法的流程示意图。该智能交互方法可以包括:
S101、接收用户通过点击引导选项所发送的交互指令,其中,所述引导选项在终端设备的显示界面中进行显示。
目前公共场所,如商场等,经常设置有用于引导客户的智能终端(如导引功能的显示屏、机器人等),用户需要查询信息时可以直接到这些设备上进行问询。一些情况下该类的终端显示界面中常常会根据用户所处场景弹出不同的引导选项,以供用户快速找到所需信息。此时,用户可以直接点击相应的引导选项,以向终端设备发出交互指令。
该终端设备一般是包含有显示界面的终端设备,该显示界面可以直接或间接的与该终端设备保持连接,以实现信息传递。该显示界面每次可以显示一项导引选项,此时不同页面中显示不同的导引选项;也可以在同一页面中显示多个导引选项,以便于用户快速查找到预期需求想匹配的导引选项。进一步地,用户所发出的交互指令中包括了用户想要查找的内容,例如,在大型商场内用户想要找到某一家店铺的位置,便可以通过指引选项的选择,发出查找地理位置的指令;又或者用户想要购买一款手机,此时显示界面中可以显示多种的导引选项,如拍照效果最好的手机,性价比最好的手机或者XX品牌的手机等选项。
S102、根据所述交互指令模拟出对应的语音信息。
本申请提供的实施例中,终端设备在接收到用户的交互指令后,会提取交互指令中包含的信息,然后根据提取到的信息模拟用户说一句话,即模拟出相应的语音信息。
例如,用户发出的交互指令中包含地理位置信息的查询事,终端设备提取到相应的信息后,将该信息转出成语音模式下的“查找AA的地理位置”或者“带我去AA”。又如,当用户的交互指令中包含的是购买商品信息时,终端设备提取相应的信息,然后模拟出语音“我想购买XX商品”或者“买XX商品”或者“给我推荐XX商品”,再通过语音识别技术形成语音信息。
进一步地,所述引导选项至少包括两个,每个引导选项中包含不同类别的指引信息;
相应地,根据所述交互指令模拟出对应的语音信息,包括:
提取所述交互指令中包含的指引信息;
将所述指引信息模拟成语音信息,将所述语音信息通过自动语音识别技术转换成文本,形成用户话术。
本申请提供的实施例中,终端设备的显示界面中同一页面显示两个或两个以上的导引选项,如在同一界面中显示包含位置指引的选项和商品推荐选择以及天气查询选项等。此时,当用户点击其中一个指引选项时,终端便可以根据用户的选择模拟用户说一句话。例如,用户点击了天气查询选项的指引选项时,终端设备可以模拟用户说出“查询天气”或者“查询XX城市的天气情况”或者“获取A号-B号之间,X城市的天气”或者“帮我看下明天X城市天气如何”等等语音。
进一步地,终端将上述交互指令中的信息转换成用户所说的一句话之后,还可以对转换后的语音进行处理,转换成用户话术,例如,根据用户所处的位置、当前场景、商家的原始配置信息等将转换成的语音模拟成更符合用户语气或者更适合当前场景的信息,从而形成特定条件下的用户话术,以使后续语音处理过程更加精准。
本申请提供的实施例中,用户通过点击按钮发出交互指令后,终端设备并不会按照传统的GUI方式与用户进行交互,即不会对按钮进行直接的点按后页面跳转操作,而是讲用户的选择转换成语音信息,再进行后续交互流程,省去了GUI方式下各级页面的设置及维护过程。
S103、通过语义识别模块对所述语音信息进行解析,以得到用户意图。
本申请提供的交互方法中,相应终端设备包含语音识别模板,能够进行语音识别。在将用户发出的交互指令转换成语音信息后,通过语音识别模板对所转换成的语音信息进行识别,进一步辨别出用户的真实意图,从而进行语音识别与后续的交互展示流程。
进一步地,所述通过语义识别模块对所述语音信息进行解析,以得到用户意图,包括:
按照预设规则对所述语音信息进行拆解,得到多个关键词;
根据语义关系将拆解后得到的多个关键词对应到预先设定的语义槽位中,其中,所述语义槽位包括槽和槽位值,所述槽和槽位值一一对应形成一个槽值对;
查询每个所述关键词所在的语义槽位对应的槽位值,从预设的槽值对和用户意图之间的映射表中解析出用户意图。
本申请提供的智能交互方法中,在用户与终端进行交互之前,预先将交互类型进行分类,然后按照类别对所形成的语音信息进行拆解,得到关键词。如按照产品的功能设计,先将其对应出需要识别出的目标用户意图列表。例如:如果设计了产品搜索功能,就需要识别出用户对应的产品搜索意图;对于引路功能,就需要识别出用户的问路意图。若是产品推荐功能,则识别出用户需要推荐产品的意图。
上述意图列表中包含了不同的关键词,将关键词对应于各个语义槽位列表中。即,根据意图列表,设计与其对应的语义槽位列表,以及对应槽位需要提取值的值域,例如购买意图,就要设计购买的语义槽位,其值域为与购买相关表达的近义词,例如“想买、买、买这个、买吧”等。也就是说,本申请提供的交互方法中在理解用户意图时,对于一句用户说的话,在语义编辑器里进行拆解,按照一句话中的语义关系,提取到提前设计好的槽位中。对于每个槽位来说,包含槽与槽值两种数据,他们会形成槽值对,用户所说的任意一句话,可能会包含多个槽值对组合,从而终端设备判断用户的真实意图提供依据。通过这种方法可以精准的识别出用户当前的意图。
进一步地,在上述识别过程之前,本申请提供的智能交互方法还包括:
预先获取不同类型的用户需求场景,根据所述用户场景需求扩展出当前场景下的语料数据;
将所述语料数据进行分类,并填充到预先设定的各个语义槽位中形成多个槽值对;
根据预设规则对所述槽值对进行优先级排序;
将各个分类下优先级最高的语义槽位与相应的用户需求进行匹配,形成槽值对与用户意图的映射表。
其中,所述将所述语料数据进行分类,包括:
根据意图将所述语料数据进行分类,所述分类包括搜索类别或指引类别或推荐类别。
其中,在所述形成槽值对与用户意图的映射表之后还包括:
获取历史匹配信息,以对所述映射表进行更新,其中,所述历史匹配信息指用户需求与所呈现的用户意图匹配度之间的信息。
本申请提供的智能交互方法中需要预先设计出语义信息对应的关键词中每个词相应的槽值对,并通过测试验证不断优化流程来进行,最终覆盖当前需求场景下的全部可能的组合情况,具体流程如下:
首先,获取不同场景下不同类型的用户需求,即不同类型的用户需求场景,由大量人工理解需求场景后,根据需求场景来扩写当前场景下的语料数据;将这些语料数据进行分类,对应到预先设计好的的不同类型的功能列表中,该列表中含有预设设计的语义槽位形成的槽值对。按照最普遍的基础情况,对所有预设的槽值对进行优先级排序,按一句话中的最高优先级设计出对应的意图映射表;按此映射表进行初版开发,开发完成后,对之前的语料数据进行回归测试;根据测试结果中的未通过条目进行语料遍历测试,对槽值对与意图的映射表进行调整,对逻辑附加条件进行增删改;完成一轮后,继续进行扩写,并重复a-d的整体流程;最终测试结果达到99%以上,且测试用例达到评估数量要求的标准之后,则可以说达到了验收标准最终会得到一套完整的槽值对与意图映射表,使每句用户所说的话都有一个意图标识提供给机器人前端,以进行用户意图的识别。当然在进行测试验收时,可以根据需要设计不同的验收标准,以进行个性化定制,在此不做限定。
S104、根据所述用户意图向所述用户展示对应的交互界面。。
在向用户展示交互界面时,此时可以直接向用户展示出其所需的信息,例如,用户进行交互的目的是进行产品推荐,此时就向用户展示出所能推荐的系列产品。在展示时,可以按照相关度的高低,或者销量高低或者人气值高低等方式向用户展示。若用户进行交互的目的是为其引路,则直接先交互界面显示出用户目的地的位置,并提供一些方便用户理解或方便记忆的到达路径。当然,终端也可以采用其他直接或间接的方式向用户展示交互内容,例如语音+界面显示、获取用户信息直接发送到用户手机等,具体方式可以根据需要进行设置。
由以上可知,在本申请实施例中,首先接收用户通过点击引导选项所发送的交互指令,其中,所述引导选项在终端设备的显示界面中进行显示;然后根据所述交互指令模拟出对应的语音信息;接着通过语义识别模块对所述语音信息进行解析,以得到用户意图;最终根据所述用户意图向所述用户展示对应的交互界面。
即在本申请实施例中,用户通过点击引导选项发出与终端的交互指令后,可以通过模拟话术的方式模拟用户说一句话,即把引导选项当中的文本模拟成语音信息发送给语义识别端进行处理,也就是在击按钮以后不直接按照设置进行页面跳转,而是这样就可以走语义识别的另一套流程,而不需要单独对引导选项进行页面跳转的开发了。这种方案使终端的前端交互可以不受页面线性关系影响,同时也可以节省开发量,使得不同模块的功能之间是解耦的,便于维护。
请参阅图3,图3是本申请另一实施例提供的智能交互方法的流程示意图。
S201、接收用户发出的语音信息。
本申请提供的智能交互方法中,用户可以直接向终端设备发出语音信息,例如,用户可以直接说查询XX商铺位置,推荐好评度高的餐厅等。
S202、根据所述语音信息,结合当前场景及当前配置信息,在终端设备的显示界面中显示不同的引导选项。
接收到用户的语音信息后,终端设备可以先进行初步预判,然后结合当前场景及当前配置信息,向用户展示一个或多个引导选项,以供用户选择。即由语义识别端对用户意图、当前场景判断、商家平台配置等信息进行综合判断,给出2~5个数量不等的引导选项,通过接口封装传输给机器人应用侧进行显示(如图4中所展示的方式)。使用语音与机器人进行交互有一定的学习成本,引导选项希望快速教会用户使用机器人;而且用户对机器人的功能不了解,引导选项可以快速告知用户有哪些功能可以使用。
用户根据终端显示的指引选项进行选择,以继续和终端进行交互,最终得到所需的信息,后续交互过程请参见上已实施例中,步骤S101-S104中的具体实现过程,在次不再赘述。
本申请提供的实施中,根据用户提供的信息,结合当前场景和配置等信息预先向用户展示需要交互的指引选项,方便用户快速了解终端设备的使用方式,进一步提高了交互效率及交互的顺畅度。
为便于更好的实施本申请实施例提供的智能交互方法,本申请实施例还提供一种基于上述智能交互方法的装置。其中名词的含义与上述智能交互方法中相同,具体实现细节可以参考方法实施例中的说明。
例如,如图5所示,该智能交互装置可以包括:
指令接收模板501,用于接收用户通过点击引导选项所发送的交互指令,其中,所述引导选项在终端设备的显示界面中进行显示;
模拟转换模板502,用于根据所述交互指令模拟出对应的语音信息;
语义识别模块503,用于对所述语音信息进行解析,以得到用户意图;
展示模块504,用于根据所述用户意图向所述用户展示对应的交互界面。
可选地,所述引导选项至少包括两个,每个引导选项中包含不同类别的指引信息;
相应地,模拟转换模板502具体用于:
提取所述交互指令中包含的指引信息;
将所述指引信息模拟成语音信息,将所述语音信息通过自动语音识别技术转换成文本,形成用户话术。
可选地,所述语义识别模块具体用于:
按照预设规则对所述语音信息进行拆解,得到多个关键词;
根据语义关系将拆解后得到的多个关键词对应到预先设定的语义槽位中,其中,所述语义槽位包括槽和槽位值,所述槽和槽位值一一对应形成一个槽值对;
查询每个所述关键词所在的语义槽位对应的槽位值,从预设的槽值对和用户意图之间的映射表中解析出用户意图。
优选地,所述智能交互装置还包括:
场景获取模块,用户预先获取不同类型的用户需求场景,根据所述用户场景需求扩展出当前场景下的语料数据;
将所述语料数据进行分类,并填充到预先设定的各个语义槽位中形成多个槽值对;
根据预设规则对所述槽值对进行优先级排序;
将各个分类下优先级最高的语义槽位与相应的用户需求进行匹配,形成槽值对与用户意图的映射表。
可选地,所述场景获取模块在将所述语料数据进行分类时,具体用于:
根据意图将所述语料数据进行分类,所述分类包括搜索类别或指引类别或推荐类别。
可选地,所述智能交互装置还用于:
获取历史匹配信息,以对所述映射表进行更新,其中,所述历史匹配信息指用户需求与所呈现的用户意图匹配度之间的信息。
可选地,所述智能交互装置还用于:
在所述接收用户通过点击引导选项所发送的智能交互指令之前,包括:
接收用户发出的语音信息;
根据所述语音信息,结合当前场景及当前配置信息,在终端设备的显示界面中显示不同的引导选项。
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个模块的具体实施方式以及对应的有益效果可参见前面的方法实施例,在此不再赘述。
本申请实施例还提供一种机器人,如图6所示,其示出了本申请实施例所涉及的机器人的结构示意图,具体来讲:
该机器人可以包括一个或者一个以上处理核心的处理器601、一个或一个以上计算机可读存储介质的存储器602、电源603和输入单元604等部件。本领域技术人员可以理解,图6中示出的机器人结构并不构成对机器人的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器601是该机器人的控制中心,利用各种接口和线路连接整个机器人的各个部分,通过运行或执行存储在存储器602内的计算机程序和/或模块,以及调用存储在存储器602内的数据,执行机器人的各种功能和处理数据。可选的,处理器601可包括一个或多个处理核心;优选的,处理器601可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器601中。
存储器602可用于存储计算机程序以及模块,处理器601通过运行存储在存储器602的计算机程序以及模块,从而执行各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据机器人的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以包括存储器控制器,以提供处理器601对存储器602的访问。
机器人还包括给各个部件供电的电源603,优选的,电源603可以通过电源管理系统与处理器601逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源603还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该机器人还可包括输入单元604,该输入单元604可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,机器人还可以包括显示单元等,在此不再赘述。具体在本实施例中,机器人中的处理器601会按照如下的指令,将一个或一个以上的计算机程序的进程对应的可执行文件加载到存储器602中,并由处理器601来运行存储在存储器602中的计算机程序,从而实现各种功能,比如:
接收用户通过点击引导选项所发送的交互指令,其中,所述引导选项在终端设备的显示界面中进行显示;
根据所述交互指令模拟出对应的语音信息;
通过语义识别模块对所述语音信息进行解析,以得到用户意图;
根据所述用户意图向所述用户展示对应的交互界面。
以上各个操作的具体实施方式以及对应的有益效果可参见上文对智能交互方法的详细描述,在此不作赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过计算机程序来完成,或通过计算机程序控制相关的硬件来完成,该计算机程序可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种智能交互方法中的步骤。例如,该计算机程序可以执行如下步骤:
接收用户通过点击引导选项所发送的交互指令,其中,所述引导选项在终端设备的显示界面中进行显示;
根据所述交互指令模拟出对应的语音信息;
通过语义识别模块对所述语音信息进行解析,以得到用户意图;
根据所述用户意图向所述用户展示对应的交互界面。
以上各个操作的具体实施方式以及对应的有益效果可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种智能交互方法中的步骤,因此,可以实现本申请实施例所提供的任一种智能交互方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
其中,根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。机器人的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该机器人执行上述智能交互方法。
以上对本申请实施例所提供的一种智能交互方法、装置、机器人和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种智能交互方法,其特征在于,所述智能交互方法包括:
接收用户通过点击引导选项所发送的交互指令,其中,所述引导选项在终端设备的显示界面中进行显示;
根据所述交互指令模拟出对应的语音信息;
通过语义识别模块对所述语音信息进行解析,以得到用户意图;
根据所述用户意图向所述用户展示对应的交互界面。
2.根据权利要求1所述的智能交互方法,其特征在于,所述引导选项至少包括两个,每个引导选项中包含不同类别的指引信息;
相应地,根据所述交互指令模拟出对应的语音信息,包括:
提取所述交互指令中包含的指引信息;
将所述指引信息模拟成语音信息,将所述语音信息通过自动语音识别技术转换成文本,形成用户话术。
3.根据权利要求1所述的智能交互方法,其特征在于,所述通过语义识别模块对所述语音信息进行解析,以得到用户意图,包括:
按照预设规则对所述语音信息进行拆解,得到多个关键词;
根据语义关系将拆解后得到的多个关键词对应到预先设定的语义槽位中,其中,所述语义槽位包括槽和槽位值,所述槽和槽位值一一对应形成槽值对;
查询每个所述关键词所在的语义槽位对应的槽位值,从预设的槽值对和用户意图之间的映射表中解析出用户意图。
4.根据权利要求1所述的智能交互方法,其特征在于,所述智能交互方法还包括:
预先获取不同类型的用户需求场景,根据所述用户场景需求扩展出当前场景下的语料数据;
将所述语料数据进行分类,并填充到预先设定的各个语义槽位中形成多个槽值对;
根据预设规则对所述槽值对进行优先级排序;
将各个分类下优先级最高的语义槽位与相应的用户需求进行匹配,形成槽值对与用户意图之间的映射表。
5.根据权利要求4所述的智能交互方法,其特征在于,所述将所述语料数据进行分类,包括:
根据意图将所述语料数据进行分类,所述分类包括搜索类别或指引类别或推荐类别。
6.根据权利要求4或5所述的智能交互方法,其特征在于,在所述形成槽值对与用户意图之间的映射表之后还包括:
获取历史匹配信息,以对所述映射表进行更新,其中,所述历史匹配信息包括用户需求与所呈现的用户意图匹配度之间的信息。
7.根据权利要求1或2所述的智能交互方法,其特征在于,在所述接收用户通过点击引导选项所发送的智能交互指令之前,包括:
接收用户发出的语音信息;
根据所述语音信息,结合当前场景及当前配置信息,在终端设备的显示界面中显示不同的引导选项。
8.一种智能交互装置,其特征在于,所述智能交互装置包括:
指令接收模板,用于接收用户通过点击引导选项所发送的交互指令,其中,所述引导选项在终端设备的显示界面中进行显示;
模拟转换模板,用于根据所述交互指令模拟出对应的语音信息;
语义识别模块,用于对所述语音信息进行解析,以得到用户意图;
展示模块,用于根据所述用户意图向所述用户展示对应的交互界面。
9.一种机器人,其特征在于,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序,以执行权利要求1至7任一项所述的智能交互方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行权利要求1至7任一项所述的智能交互方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211052292.4A CN115440223A (zh) | 2022-08-31 | 2022-08-31 | 智能交互方法、装置、机器人和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211052292.4A CN115440223A (zh) | 2022-08-31 | 2022-08-31 | 智能交互方法、装置、机器人和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115440223A true CN115440223A (zh) | 2022-12-06 |
Family
ID=84243656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211052292.4A Pending CN115440223A (zh) | 2022-08-31 | 2022-08-31 | 智能交互方法、装置、机器人和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115440223A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117708298A (zh) * | 2023-12-25 | 2024-03-15 | 浙江大学 | 一种用于产品展示的人机交互管理系统及方法 |
-
2022
- 2022-08-31 CN CN202211052292.4A patent/CN115440223A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117708298A (zh) * | 2023-12-25 | 2024-03-15 | 浙江大学 | 一种用于产品展示的人机交互管理系统及方法 |
CN117708298B (zh) * | 2023-12-25 | 2024-05-28 | 浙江大学 | 一种用于产品展示的人机交互管理系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11868732B2 (en) | System for minimizing repetition in intelligent virtual assistant conversations | |
EP4141695A1 (en) | Response method in man-machine dialogue, dialogue system, and storage medium | |
US20170337261A1 (en) | Decision Making and Planning/Prediction System for Human Intention Resolution | |
US8156060B2 (en) | Systems and methods for generating and implementing an interactive man-machine web interface based on natural language processing and avatar virtual agent based character | |
KR20170001550A (ko) | 인공 지능에 기초한 인간-컴퓨터 지능형 채팅 방법 및 장치 | |
CN109492164A (zh) | 一种简历的推荐方法、装置、电子设备及存储介质 | |
US20130246392A1 (en) | Conversational System and Method of Searching for Information | |
US20150286943A1 (en) | Decision Making and Planning/Prediction System for Human Intention Resolution | |
US20160071510A1 (en) | Voice generation with predetermined emotion type | |
CN110795913B (zh) | 一种文本编码方法、装置、存储介质及终端 | |
US20220138770A1 (en) | Method and apparatus for analyzing sales conversation based on voice recognition | |
US20220358292A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
US20200051559A1 (en) | Electronic device and method for providing one or more items in response to user speech | |
CN110162675A (zh) | 应答语句的生成方法、装置、计算机可读介质及电子设备 | |
CN116541493A (zh) | 基于意图识别的交互应答方法、装置、设备、存储介质 | |
CN115440223A (zh) | 智能交互方法、装置、机器人和计算机可读存储介质 | |
KR20210009266A (ko) | 음성 인식 기반의 세일즈 대화 분석 방법 및 장치 | |
US20230103313A1 (en) | User assistance system | |
JP2019159696A (ja) | 検索装置および方法 | |
CN113836932A (zh) | 交互方法、装置和系统,以及智能设备 | |
CN111046161A (zh) | 用于商品营销场景的智能对话方法和装置 | |
CN114036373B (zh) | 搜索方法及装置、电子设备和存储介质 | |
CN115576435B (zh) | 意图处理方法及相关装置 | |
CN111046151A (zh) | 一种消息处理方法及装置 | |
KR102267422B1 (ko) | 증시 관련 국제 뉴스 큐레이션 서비스 제공 방법, 장치 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |