CN114360533A - 一种基于机器学习的交互方法、系统、电梯设备及介质 - Google Patents
一种基于机器学习的交互方法、系统、电梯设备及介质 Download PDFInfo
- Publication number
- CN114360533A CN114360533A CN202111562632.3A CN202111562632A CN114360533A CN 114360533 A CN114360533 A CN 114360533A CN 202111562632 A CN202111562632 A CN 202111562632A CN 114360533 A CN114360533 A CN 114360533A
- Authority
- CN
- China
- Prior art keywords
- information
- voice
- user
- intelligent
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于机器学习的交互方法、系统、电梯设备及介质,方法包括:获取乘梯用户的第一语音信息,并对所述第一语音信息进行声纹识别,确定第一用户信息,进而根据所述第一用户信息匹配确定对应的智能对话模型;对所述第一语音信息进行语音识别得到第一文本信息,并对所述第一文本信息进行语义分析,提取出关键字信息;将所述关键字信息输入到所述智能对话模型中,匹配得到第一应答信息;根据所述第一应答信息生成第二语音信息,并播放所述第二语音信息。本发明能在用户乘梯时提供高自由度和高准确度的互动交流服务,可缓解乘梯人员的压力,提高了用户的乘梯体验。本发明可广泛应用于电梯技术领域。
Description
技术领域
本发明涉及电梯技术领域,尤其是一种基于机器学习的交互方法、系统、电梯设备及介质。
背景技术
现今,当人们在乘坐电梯时,大部分人只能通过玩手机来打发时间或缓解尴尬,当一个人或少数人乘坐电梯时,往往会产生孤独感甚至恐惧感,特别是在深夜时、疲惫时以及高层住户乘梯时尤为明显,而且长时间操作手机也会带来各种弊端。
现有技术中,往往会在电梯中固定播放视频片段或广告信息,但是这种方式下用户只能被动接收电梯提供的视频片段或广告信息,无法实现与用户的智能交互,影响了用户的乘梯体验。
发明内容
本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
为此,本发明实施例的一个目的在于提供一种基于机器学习的交互方法,该方法能在用户乘梯时提供高自由度和高准确度的互动交流服务,可缓解乘梯人员的压力,提高了用户的乘梯体验。
本发明实施例的另一个目的在于提供一种基于机器学习的交互系统。
为了达到上述技术目的,本发明实施例所采取的技术方案包括:
第一方面,本发明实施例提供了一种基于机器学习的交互方法,包括以下步骤:
获取乘梯用户的第一语音信息,并对所述第一语音信息进行声纹识别,确定第一用户信息,进而根据所述第一用户信息匹配确定对应的智能对话模型;
对所述第一语音信息进行语音识别得到第一文本信息,并对所述第一文本信息进行语义分析,提取出关键字信息;
将所述关键字信息输入到所述智能对话模型中,匹配得到第一应答信息;
根据所述第一应答信息生成第二语音信息,并播放所述第二语音信息。
进一步地,在本发明的一个实施例中,所述获取乘梯用户的第一语音信息,并对所述第一语音信息进行声纹识别,确定第一用户信息,进而根据所述第一用户信息匹配确定对应的智能对话模型这一步骤,其具体包括:
通过智能聊天机器人获取所述乘梯用户的第一语音信息,并将所述第一语音信息发送至物业中心服务器,所述智能聊天机器人设置在电梯轿厢内;
通过所述物业中心服务器对所述第一语音信息进行声纹识别,得到第一声纹特征,并进而根据所述第一声纹特征在预先构建的用户特征库中匹配得到第一用户信息;
通过所述物业中心服务器根据所述第一用户信息匹配确定对应的智能对话模型。
进一步地,在本发明的一个实施例中,所述对所述第一语音信息进行语音识别得到第一文本信息,并对所述第一文本信息进行语义分析,提取出关键字信息这一步骤,其具体包括:
通过所述物业中心服务器对所述第一语音信息进行语音识别得到第一文本信息;
通过所述物业中心服务器对所述第一文本信息进行文本分类、情感分析以及意图识别,得到所述关键字信息。
进一步地,在本发明的一个实施例中,所述将所述关键字信息输入到所述智能对话模型中,匹配得到第一应答信息这一步骤,其具体包括:
确定所述物业中心服务器与云端服务器的网络连接状态;
当所述网络连接状态为可用,通过所述物业中心服务器将所述关键字信息发送到所述云端服务器,使得所述云端服务器将所述关键字信息输入到第一智能对话模型,并返回匹配得到的第一应答信息;
当所述网络连接状态为不可用,通过所述物业中心服务器将所述关键字信息输入到第二智能对话模型,匹配得到第一应答信息;
其中,所述第一智能对话模型为在线学习模型,所述第二智能对话模型为离线学习模型。
进一步地,在本发明的一个实施例中,所述交互方法还包括更新所述第一智能对话模型和所述第二智能对话模型的步骤,其具体包括:
通过所述物业中心服务器将所述第一文本信息发送至所述云端服务器,使得所述云端服务器将所述第一文本信息、所述关键词信息以及所述第一应答信息作为训练数据输入到所述第一智能对话模型,从而更新所述第一智能对话模型的模型参数;
通过所述物业中心服务器将所述第一文本信息、所述关键词信息以及所述第一应答信息作为训练数据输入到所述第二智能对话模型,从而更新所述第二智能对话模型的模型参数。
进一步地,在本发明的一个实施例中,所述根据所述第一应答信息生成第二语音信息,并播放所述第二语音信息这一步骤,其具体包括:
通过所述物业中心服务器将所述第一应答信息转换成第二语音信息,并将所述第二语音信息返回至所述智能聊天机器人;
通过所述智能聊天机器人播放所述第二语音信息。
进一步地,在本发明的一个实施例中,所述交互方法还包括以下步骤:
通过所述智能聊天机器人实时采集所述轿厢内的声音信息,当采集到预设的声音口令,启动智能聊天功能,并发送相应的触发信号至所述物业中心服务器。
第二方面,本发明实施例提供了一种基于机器学习的交互系统,包括:
用户匹配模块,用于获取乘梯用户的第一语音信息,并对所述第一语音信息进行声纹识别,确定第一用户信息,进而根据所述第一用户信息匹配确定对应的智能对话模型;
关键字提取模块,用于对所述第一语音信息进行语音识别得到第一文本信息,并对所述第一文本信息进行语义分析,提取出关键字信息;
智能对话模块,用于将所述关键字信息输入到所述智能对话模型中,匹配得到第一应答信息;
语音播放模块,用于根据所述第一应答信息生成第二语音信息,并播放所述第二语音信息。
第三方面,本发明实施例提供了一种电梯设备,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现上述的一种基于机器学习的交互方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行上述的一种基于机器学习的交互方法。
本发明的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到:
本发明实施例通过对乘梯用户的语音信息进行声纹识别确定用户身份,然后匹配确定对应的智能对话模型,再对该语音信息进行语音识别和语义分析,提取出关键字信息,进而可以将该关键字信息输入到智能对话模型中,匹配得到应答信息,从而可以根据该应答信息生成应答语音并播放。本发明实施例能在用户乘梯时提供高自由度和高准确度的互动交流服务,可缓解乘梯人员的压力,提高了用户的乘梯体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面对本发明实施例中所需要使用的附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例,对于本领域的技术人员来说,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
图1为本发明实施例提供的一种基于机器学习的交互方法的步骤流程图;
图2为本发明实施例提供的执行一种基于机器学习的交互方法的系统架构示意图;
图3为本发明实施例提供的一种基于机器学习的交互系统的结构框图;
图4为本发明实施例提供的一种电梯设备的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
在本发明的描述中,多个的含义是两个或两个以上,如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。此外,除非另有定义,本文所使用的所有的技术和科学术语与本技术领域的技术人员通常理解的含义相同。
首先对本发明实施例中执行基于机器学习的交互方法的系统架构进行说明,该系统架构应用在电梯系统,该系统结构可以在用户乘梯时提供高自由度和高准确度的互动交流服务,可缓解乘梯人员的压力,提高了用户的乘梯体验。如图2所示,该系统架构包括:
1)智能聊天机器人:安装于电梯轿厢中,连接电梯主控设备,可对接现有电梯内扬声器和声音采集设备或集成语音输入输出装置。当接收到唤醒语音时,触发聊天功能,通过电梯主控和物业中心服务器进行通信。
2)物业中心服务器:安装电梯智能聊天管理软件,具有声纹匹配、语音转文字、中文语义分析、自然语言对话等功能,还包括聊天对话数据展示以及系统配置等模块,系统配置模块可用于小区楼层、用户权限等基础信息的配置,此外,还具有对话数据库存储、升级和备份等功能。
3)云端服务器:实时提供云端最新的智能对话模型,采用HTTPS安全通信方式,提供实时网络信息,如天气、歌曲、故事等。物业中心服务器可以通过云端服务器连接外部网络,并有云端服务器的接口调用权限。
参照图1,本发明实施例提供了一种基于机器学习的交互方法,具体包括以下步骤:
S101、获取乘梯用户的第一语音信息,并对第一语音信息进行声纹识别,确定第一用户信息,进而根据第一用户信息匹配确定对应的智能对话模型。
具体地,可预先采集该区域(小区、写字楼等)所有用户的声纹特征,建立用户特征库,然后在用户乘梯时通过声纹识别确定用户信息。步骤S101具体包括以下步骤:
S1011、通过智能聊天机器人获取乘梯用户的第一语音信息,并将第一语音信息发送至物业中心服务器,智能聊天机器人设置在电梯轿厢内;
S1012、通过物业中心服务器对第一语音信息进行声纹识别,得到第一声纹特征,并进而根据第一声纹特征在预先构建的用户特征库中匹配得到第一用户信息;
S1013、通过物业中心服务器根据第一用户信息匹配确定对应的智能对话模型。
具体地,智能对话模型是根据用户的历史对话信息训练得到的,通过对不同用户按照楼层、年龄、性别等特征进行分类,训练面对不同人群的智能对话模型。在一些可选的实施例中,可针对每个用户训练单独的智能对话模型,进一步提高了用户的乘梯体验。
S102、对第一语音信息进行语音识别得到第一文本信息,并对第一文本信息进行语义分析,提取出关键字信息。
具体地,通过语音识别技术和语义分析技术对第一语音信息进行处理,识别得到用户语音中的关键字信息。步骤S102具体包括以下步骤:
S1021、通过物业中心服务器对第一语音信息进行语音识别得到第一文本信息;
S1022、通过物业中心服务器对第一文本信息进行文本分类、情感分析以及意图识别,得到关键字信息。
具体地,语音识别得到第一文本信息后,可通过自然语言处理(NLP)语义分析对第一文本信息进行文本分类、情感分析以及意图识别,再根据文本分类、情感分析以及意图识别的结果从第一文本信息中提取出符合用户情感和意图的关键字信息。
S103、将关键字信息输入到智能对话模型中,匹配得到第一应答信息。
具体地,本发明实施例提供了在线和离线两种智能对话方式,当物业中心服务器网络正常时,通过在线实时更新的智能对话模型得到应答信息,当物业中心服务器网络不正常时,通过物业中心服务器本地存储的智能对话模型得到应答消息。步骤S103具体包括以下步骤:
S1031、确定物业中心服务器与云端服务器的网络连接状态;
S1032、当网络连接状态为可用,通过物业中心服务器将关键字信息发送到云端服务器,使得云端服务器将关键字信息输入到第一智能对话模型,并返回匹配得到的第一应答信息;
S1033、当网络连接状态为不可用,通过物业中心服务器将关键字信息输入到第二智能对话模型,匹配得到第一应答信息;
其中,第一智能对话模型为在线学习模型,第二智能对话模型为离线学习模型。
进一步作为可选的实施方式,交互方法还包括更新第一智能对话模型和第二智能对话模型的步骤,其具体包括:
A1、通过物业中心服务器将第一文本信息发送至云端服务器,使得云端服务器将第一文本信息、关键词信息以及第一应答信息作为训练数据输入到第一智能对话模型,从而更新第一智能对话模型的模型参数;
A2、通过物业中心服务器将第一文本信息、关键词信息以及第一应答信息作为训练数据输入到第二智能对话模型,从而更新第二智能对话模型的模型参数。
具体地,将训练数据输入到智能对话模型后,可以得到模型输出的匹配结果,可以根据该匹配结果和前述的第一应答信息来评估识别模型匹配的准确性,从而对模型的参数进行更新。对于智能对话模型来说,模型预测结果的准确性可以通过损失函数(LossFunction)来衡量,损失函数是定义在单个训练数据上的,用于衡量一个训练数据的预测误差,具体是通过单个训练数据的标签和模型对该训练数据的预测结果确定该训练数据的损失值。而实际训练时,一个训练数据集有很多训练数据,因此一般采用代价函数(CostFunction)来衡量训练数据集的整体误差,代价函数是定义在整个训练数据集上的,用于计算所有训练数据的预测误差的平均值,能够更好地衡量出模型的预测效果。对于一般的机器学习模型来说,基于前述的代价函数,再加上衡量模型复杂度的正则项即可作为训练的目标函数,基于该目标函数便能求出整个训练数据集的损失值。常用的损失函数种类有很多,例如0-1损失函数、平方损失函数、绝对损失函数、对数损失函数、交叉熵损失函数等均可以作为机器学习模型的损失函数,在此不再一一阐述。本发明实施例中,可以从中任选一种损失函数来确定训练的损失值。基于训练的损失值,采用反向传播算法对模型的参数进行更新,迭代几轮即可得到更新后的智能对话模型。
S104、根据第一应答信息生成第二语音信息,并播放第二语音信息。
进一步作为可选的实施方式,步骤S104具体包括以下步骤:
S1041、通过物业中心服务器将第一应答信息转换成第二语音信息,并将第二语音信息返回至智能聊天机器人;
S1042、通过智能聊天机器人播放第二语音信息。
进一步作为可选的实施方式,交互方法还包括以下步骤:
S100、通过智能聊天机器人实时采集轿厢内的声音信息,当采集到预设的声音口令,启动智能聊天功能,并发送相应的触发信号至物业中心服务器。
具体地,可预先设定特定的唤醒口令,当电梯内无人或者用户未发出语音时,智能聊天机器人处于休眠状态,当检测到用户发出了唤醒口令,则启动智能聊天功能,并发送触发信息至物业中心服务器。
以上对本发明实施例的方法步骤进行了说明。下面结合一具体应用场景对本发明实施例的方法做进一步解释说明。
1)乘梯用户通过语音口令唤醒聊天功能,智能聊天机器人接收用户唤醒语音,智能聊天模式启动。通过智能聊天机器人采集用户的语音信息,将语音信息通过局域网上传至物业中心服务器。
2)物业中心服务器软件根据声纹识别用户身份并获取用户信息,如用户特征库中存在该用户则直接匹配用户信息,若不存在则创建新用户并选取标准化的初始智能对话模型进行智能对话。
3)根据用户信息匹配出对应语言数据库,并按匹配度降序排序后缓存于本地内存。
4)将语音信息转换为文本信息,方便解析语义。
5)从文本信息中解析出关键字信息,并判断是否通过在线的方式处理应答,如果为在线式,则校验网络是否正常,如不正常则自动转为离线式处理。
6)若为在线处理应答,则调用云端服务器处理应答话语,通过HTTPS方式传输用户的关键字信息,云端服务器返回匹配度最高的应答话语;若为离线处理应答,根据问题关键字匹配智能对话模型,根据智能对话模型和语言数据库匹配应答话语。如果匹配不到应答话语,则可返回“超出能力范围”友好提示。
7)将用户的语音信息、关键字信息和应答信息存储至对应的语言数据库,从而可以对智能对话模型进行更新,也便于在网络异常时使用离线数据库,不会影响到用户聊天功能。
8)将应答信息转换为语音信息,通过局域网传输至轿厢中的智能聊天机器人,并通过语音输出装置输出,并等待用户再次发出的语音信息。
9)智能聊天机器人在预设时间(如5s)内未收到用户的语音信息,则进入休眠模式。
可以理解的是,本发明实施例可以在用户乘梯时提供高自由度和高准确度的互动交流服务,可用于学习和娱乐,可缓解乘梯人员的压力、安抚乘客情绪,提高了用户的乘梯体验;通过声纹匹配确定用户特征值,结合语音识别、语义分析、自然语言对话、深度问答等人工智能技术服务,形成专属于本小区、本楼栋、本层甚至本人的对话模型,让智能对话可追溯历史交流记录,更贴合当前环境。
此外,本发明实施例可以选择在线或离线两种方式实现电梯内智能对话聊天。离线方式可以节省成本,无需和云端服务器对接,通过物业中心服务器处理对话,此方式对话模型相对固定,需要定期对模型升级;在线方式则可以提供更丰富更实时的智能对话模型,同时能及时获取反馈最新网络信息,对话内容更生动更贴近真人,娱乐性和学习价值则更高。
参照图3,本发明实施例提供了一种基于机器学习的交互系统,包括:
用户匹配模块,用于获取乘梯用户的第一语音信息,并对第一语音信息进行声纹识别,确定第一用户信息,进而根据第一用户信息匹配确定对应的智能对话模型;
关键字提取模块,用于对第一语音信息进行语音识别得到第一文本信息,并对第一文本信息进行语义分析,提取出关键字信息;
智能对话模块,用于将关键字信息输入到智能对话模型中,匹配得到第一应答信息;
语音播放模块,用于根据第一应答信息生成第二语音信息,并播放第二语音信息。
上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
参照图4,本发明实施例提供了一种电梯设备,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当上述至少一个程序被上述至少一个处理器执行时,使得上述至少一个处理器实现上述的一种基于机器学习的交互方法。
上述方法实施例中的内容均适用于本设备实施例中,本设备实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
本发明实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,该处理器可执行的程序在由处理器执行时用于执行上述一种基于机器学习的交互方法。
本发明实施例的一种计算机可读存储介质,可执行本发明方法实施例所提供的一种基于机器学习的交互方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1所示的方法。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或上述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,上述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印上述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得上述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (10)
1.一种基于机器学习的交互方法,其特征在于,包括以下步骤:
获取乘梯用户的第一语音信息,并对所述第一语音信息进行声纹识别,确定第一用户信息,进而根据所述第一用户信息匹配确定对应的智能对话模型;
对所述第一语音信息进行语音识别得到第一文本信息,并对所述第一文本信息进行语义分析,提取出关键字信息;
将所述关键字信息输入到所述智能对话模型中,匹配得到第一应答信息;
根据所述第一应答信息生成第二语音信息,并播放所述第二语音信息。
2.根据权利要求1所述的一种基于机器学习的交互方法,其特征在于,所述获取乘梯用户的第一语音信息,并对所述第一语音信息进行声纹识别,确定第一用户信息,进而根据所述第一用户信息匹配确定对应的智能对话模型这一步骤,其具体包括:
通过智能聊天机器人获取所述乘梯用户的第一语音信息,并将所述第一语音信息发送至物业中心服务器,所述智能聊天机器人设置在电梯轿厢内;
通过所述物业中心服务器对所述第一语音信息进行声纹识别,得到第一声纹特征,并进而根据所述第一声纹特征在预先构建的用户特征库中匹配得到第一用户信息;
通过所述物业中心服务器根据所述第一用户信息匹配确定对应的智能对话模型。
3.根据权利要求2所述的一种基于机器学习的交互方法,其特征在于,所述对所述第一语音信息进行语音识别得到第一文本信息,并对所述第一文本信息进行语义分析,提取出关键字信息这一步骤,其具体包括:
通过所述物业中心服务器对所述第一语音信息进行语音识别得到第一文本信息;
通过所述物业中心服务器对所述第一文本信息进行文本分类、情感分析以及意图识别,得到所述关键字信息。
4.根据权利要求2所述的一种基于机器学习的交互方法,其特征在于,所述将所述关键字信息输入到所述智能对话模型中,匹配得到第一应答信息这一步骤,其具体包括:
确定所述物业中心服务器与云端服务器的网络连接状态;
当所述网络连接状态为可用,通过所述物业中心服务器将所述关键字信息发送到所述云端服务器,使得所述云端服务器将所述关键字信息输入到第一智能对话模型,并返回匹配得到的第一应答信息;
当所述网络连接状态为不可用,通过所述物业中心服务器将所述关键字信息输入到第二智能对话模型,匹配得到第一应答信息;
其中,所述第一智能对话模型为在线学习模型,所述第二智能对话模型为离线学习模型。
5.根据权利要求4所述的一种基于机器学习的交互方法,其特征在于,所述交互方法还包括更新所述第一智能对话模型和所述第二智能对话模型的步骤,其具体包括:
通过所述物业中心服务器将所述第一文本信息发送至所述云端服务器,使得所述云端服务器将所述第一文本信息、所述关键词信息以及所述第一应答信息作为训练数据输入到所述第一智能对话模型,从而更新所述第一智能对话模型的模型参数;
通过所述物业中心服务器将所述第一文本信息、所述关键词信息以及所述第一应答信息作为训练数据输入到所述第二智能对话模型,从而更新所述第二智能对话模型的模型参数。
6.根据权利要求2所述的一种基于机器学习的交互方法,其特征在于,所述根据所述第一应答信息生成第二语音信息,并播放所述第二语音信息这一步骤,其具体包括:
通过所述物业中心服务器将所述第一应答信息转换成第二语音信息,并将所述第二语音信息返回至所述智能聊天机器人;
通过所述智能聊天机器人播放所述第二语音信息。
7.根据权利要求2至6中任一项所述的一种基于机器学习的交互方法,其特征在于,所述交互方法还包括以下步骤:
通过所述智能聊天机器人实时采集所述轿厢内的声音信息,当采集到预设的声音口令,启动智能聊天功能,并发送相应的触发信号至所述物业中心服务器。
8.一种基于机器学习的交互系统,其特征在于,包括:
用户匹配模块,用于获取乘梯用户的第一语音信息,并对所述第一语音信息进行声纹识别,确定第一用户信息,进而根据所述第一用户信息匹配确定对应的智能对话模型;
关键字提取模块,用于对所述第一语音信息进行语音识别得到第一文本信息,并对所述第一文本信息进行语义分析,提取出关键字信息;
智能对话模块,用于将所述关键字信息输入到所述智能对话模型中,匹配得到第一应答信息;
语音播放模块,用于根据所述第一应答信息生成第二语音信息,并播放所述第二语音信息。
9.一种电梯设备,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1至7中任一项所述的一种基于机器学习的交互方法。
10.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于执行如权利要求1至7中任一项所述的一种基于机器学习的交互方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111562632.3A CN114360533A (zh) | 2021-12-20 | 2021-12-20 | 一种基于机器学习的交互方法、系统、电梯设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111562632.3A CN114360533A (zh) | 2021-12-20 | 2021-12-20 | 一种基于机器学习的交互方法、系统、电梯设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114360533A true CN114360533A (zh) | 2022-04-15 |
Family
ID=81102073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111562632.3A Pending CN114360533A (zh) | 2021-12-20 | 2021-12-20 | 一种基于机器学习的交互方法、系统、电梯设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114360533A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115331340A (zh) * | 2022-08-16 | 2022-11-11 | 广东好太太智能家居有限公司 | 一种智能门锁的语音交互方法、装置及智能门锁 |
-
2021
- 2021-12-20 CN CN202111562632.3A patent/CN114360533A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115331340A (zh) * | 2022-08-16 | 2022-11-11 | 广东好太太智能家居有限公司 | 一种智能门锁的语音交互方法、装置及智能门锁 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107818798B (zh) | 客服服务质量评价方法、装置、设备及存储介质 | |
KR102543693B1 (ko) | 전자 장치 및 그의 동작 방법 | |
CN111488433B (zh) | 一种适用于银行的提升现场体验感的人工智能交互系统 | |
CN112365894B (zh) | 基于ai的复合语音交互方法、装置及计算机设备 | |
CN106201424B (zh) | 一种信息交互方法、装置及电子设备 | |
JP6502512B2 (ja) | 動的パスワード音声に基づいた自己学習機能を有する身分認証システム及び方法 | |
JP6317111B2 (ja) | ハイブリッド型クライアントサーバ音声認識 | |
CN114556354A (zh) | 自动确定和呈现来自事件的个性化动作项 | |
JP2021533397A (ja) | 話者埋め込みと訓練された生成モデルとを使用する話者ダイアライゼーション | |
CN111261151B (zh) | 一种语音处理方法、装置、电子设备及存储介质 | |
CN113362828A (zh) | 用于识别语音的方法和装置 | |
CN109637542A (zh) | 一种语音外呼系统 | |
CN109274922A (zh) | 一种基于语音识别的视频会议控制系统 | |
CN114360533A (zh) | 一种基于机器学习的交互方法、系统、电梯设备及介质 | |
CN110556111A (zh) | 语音数据处理方法及装置、系统、电子设备、存储介质 | |
CN118302810A (zh) | 声学事件检测 | |
CN114328867A (zh) | 一种人机对话中智能打断的方法及装置 | |
CN109830232A (zh) | 人机交互方法、装置和存储介质 | |
CN112420043A (zh) | 基于语音的智能唤醒方法、装置、电子设备及存储介质 | |
CN116013257A (zh) | 语音识别、语音识别模型训练方法、装置、介质及设备 | |
US11783840B2 (en) | Video conference verbal junction identification via NLP | |
CN110125946B (zh) | 自动通话方法、装置、电子设备及计算机可读介质 | |
CN113348502A (zh) | 语音识别方法、装置、存储介质及电子设备 | |
CN112150103A (zh) | 一种日程设置方法、装置和存储介质 | |
JP2005258235A (ja) | 感情発話検知による対話修正機能を備えた対話制御装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |