CN115985317A - 信息处理方法、装置、车辆及存储介质 - Google Patents

信息处理方法、装置、车辆及存储介质 Download PDF

Info

Publication number
CN115985317A
CN115985317A CN202211657077.7A CN202211657077A CN115985317A CN 115985317 A CN115985317 A CN 115985317A CN 202211657077 A CN202211657077 A CN 202211657077A CN 115985317 A CN115985317 A CN 115985317A
Authority
CN
China
Prior art keywords
information
natural language
determining
user
language information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211657077.7A
Other languages
English (en)
Inventor
冷永才
郭尧
赵晨旭
曾通
朱思邈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Geely Holding Group Co Ltd
Geely Automobile Research Institute Ningbo Co Ltd
Original Assignee
Zhejiang Geely Holding Group Co Ltd
Geely Automobile Research Institute Ningbo Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Geely Holding Group Co Ltd, Geely Automobile Research Institute Ningbo Co Ltd filed Critical Zhejiang Geely Holding Group Co Ltd
Priority to CN202211657077.7A priority Critical patent/CN115985317A/zh
Publication of CN115985317A publication Critical patent/CN115985317A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供一种信息处理方法、装置、车辆及存储介质。该方法包括:获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息;根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果;根据意图识别结果,确定应答信息,并根据应答信息执行相应的操作;根据驾驶状态信息,确定应答信息的答复模式;根据答复模式,发送应答信息。本申请的方法,提高了车辆与用户的交互效果。

Description

信息处理方法、装置、车辆及存储介质
技术领域
本申请涉及信息处理技术领域,尤其涉及一种信息处理方法、装置、车辆及存储介质。
背景技术
随着智能驾驶的发展,为了增加用户的驾驶乐趣,现有的智能驾驶车辆一般均带有人车交互的功能,使得乘员可以通过发出指令,实现对智能驾驶车辆的控制。
目前,用户在与智能驾驶车辆进行交互时,一般由用户通过麦克风等设备向智能驾驶车辆发出指令,使得智能驾驶车辆可以根据该指令,确定成员的意图,并根据该意图进行该指令的应答和相应操作的执行。
然而,现有的智能驾驶车辆在与乘员进行交互时,会出现交互的效果不好的问题,无法满足用户要求。
发明内容
本申请提供一种信息处理方法、装置、车辆及存储介质,用以解决交互的效果不好的问题。
第一方面,本申请提供一种信息处理方法,应用于信息处理系统,方法包括:
获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息;
根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果;
根据意图识别结果,确定应答信息,并根据应答信息执行相应的操作;
根据驾驶状态信息,确定应答信息的答复模式;
根据答复模式,发送应答信息。
在本申请实施例中,获取用户的驾驶状态信息,包括:
获取用户的驾驶状态、以及用户的待识别人脸图像;
对待识别人脸图像进行情绪识别,得到用户的情绪信息;
根据情绪信息和驾驶状态,得到状态信息。
在本申请实施例中,获取车辆的使用情况信息,包括:
确定信息处理系统的中控屏单元的显示图像;
对显示图像进行识别处理,得到显示图像中各个部件的使用状态信息根据使用状态信息,得到车辆的使用情况信息。
在本申请实施例中,根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果,包括:
根据自然语言信息,确定自然语言信息的信息控制领域;
根据信息控制领域和使用情况信息,对自然语言信息进行意图识别,得到意图识别结果。
在本申请实施例中,根据自然语言信息,确定自然语言信息的信息控制领域,包括:
对自然语言信息进行实体信息检索,得到实体信息检索结果,实体信息检索结果包括自然语言信息中的实体信息;
根据实体信息检索结果,确定自然语言信息的信息控制领域。
在本申请实施例中,根据意图识别结果,确定应答信息,包括:
确定自然语言信息中的关键信息,其中,关键信息包括一个以上的关键词;
根据关键信息和意图识别结果,确定应答信息。
在本申请实施例中,确定自然语言信息中的关键信息,其中,关键信息包括一个以上的关键词,包括:
对自然语言信息进行分词处理,得到多个候选词;
确定每个候选词的属性;
根据候选词的属性,对候选词进行识别,得到多个候选词中的关键词。
在本申请实施例中,在获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息之后,根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果之前,方法还包括:
判断自然语言信息的缺失状态;
若缺失状态为未缺失,则执行根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果的步骤。
在本申请实施例中,在判断自然语言信息的缺失状态之后,方法还包括:
若缺失状态为缺失,则根据目标历史交互信息,对自然语言信息进行修整,得到修整自然语言信息,其中,目标历史交互信息为自然语言信息的关联信息;
根据使用情况信息,对修整自然语言信息进行意图识别,得到修整意图识别结果;
根据修整意图识别结果,确定修整应答信息,并根据修整应答信息执行相应的操作;
根据驾驶状态信息,确定修整应答信息的答复模式;
根据答复模式,发送修整应答信息。
在本申请实施例中,在若缺失状态为缺失,则根据目标历史交互信息,对自然语言信息进行修整,得到修整自然语言信息之后,根据使用情况信息,对修整自然语言信息进行意图识别,得到修整意图识别结果之前,方法还包括:
判断修整自然语言信息的修整缺失状态;
若修整缺失状态为未缺失,则执行根据使用情况信息,对修整自然语言信息进行意图识别,得到修整意图识别结果的步骤。
第二方面,本申请提供一种信息处理装置,包括:
获取模块,用于获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息;
意图识别模块,用于根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果;
应答信息确定模块,用于根据意图识别结果,确定应答信息,并根据应答信息执行相应的操作;
答复模式确定模块,用于根据驾驶状态信息,确定应答信息的答复模式;
发送模块,用于根据答复模式,发送应答信息。
第三方面,本申请提供一种车辆,包括:处理器,以及与处理器通信连接的存储器;
存储器存储计算机执行指令;
处理器执行存储器存储的计算机执行指令,以实现上述申请实施例中的信息处理方法。
第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现上述申请实施例中的信息处理方法。
本申请提供的信息处理方法、装置、车辆及存储介质,通过获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息;根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果;根据意图识别结果,确定应答信息,并根据应答信息执行相应的操作;根据驾驶状态信息,确定应答信息的答复模式;根据答复模式,发送应答信息的手段,使得信息处理系统可以根据自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息更加准确的获取用户的真实意图,同时提高了向用户反馈应答信息的反馈效果,由此,提高了用户与车辆的交互效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的信息处理方法的流程示意图;
图2为本申请实施例提供的另一种信息处理方法的流程示意图;
图3为本申请实施例提供的另一信息处理方法的模块示意图;
图4为本申请实施例提供的信息处理装置的结构示意图;
图5为本申请实施例提供的车辆的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
用户在智能驾驶车辆进行交互时,一般是以语音输入的方式向智能驾驶车辆发送指令,以获取想要得到的信息或执行相应操作,在现有技术中,智能驾驶车辆一般是通过获取用户发送的语音指令进行识别,从而确定该语音指令的意图,并执行相应的操作,然而仅通过用户发送的语音指令与用户进行交互时,一方面无法更好的理解语音指令的真实意图,比如,语音指令为降低温度、而空调未开启时,语音指令的真实意图为开启空调,降低温度。另一方面,在交互过程中并未考虑到用户当前的情绪,使得交互过程中较为生硬,缺乏人性化交互的效果,比如,当用户处于愤怒情绪时,单一语调的进行应答可能加剧用户的愤怒情绪。因此,大大影响了与用户的交互效果。
为了解决上述问题,本申请提供信息处理方法,可以通过获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息;根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果;根据意图识别结果,确定应答信息,并根据应答信息执行相应的操作;根据驾驶状态信息,确定应答信息的答复模式;根据答复模式,发送应答信息,可以使得信息处理系统可以根据自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息更加准确的获取用户的真实意图,同时提高了向用户反馈应答信息的反馈效果,由此,提高了用户与车辆的交互效果。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
本申请实施例提供的信息处理方法的执行主体可以是服务器。其中,服务器可以为车载电脑等设备。本实施例对执行主体的实现方式不做特别限制,只要该执行主体能够获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息;根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果;根据意图识别结果,确定应答信息,并根据应答信息执行相应的操作;根据驾驶状态信息,确定应答信息的答复模式;根据答复模式,发送应答信息即可。
其中,神经网络(Artificial Neural Networks,ANNs):根据生物神经网络的原理和实际应用的需要建造实用的人工神经网络模型,设计相应的学习算法,模拟人脑的某种智能活动,然后在技术上实现出来用以解决实际问题。
OCR(Optical Character Recognition,光学字符识别):是指将文字信息转换为图像信息,然后再利用文字识别技术将图像信息转化为可以使用的输入技术。
图1为本申请实施例提供的信息处理方法的流程示意图。该方法的执行主体可以为服务器或其它服务器,本实施例此处不做特别限制,如图1所示,该方法可以包括:
S101、获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息。
其中,用户可以指乘坐车辆的驾驶人员或其他乘员。
自然语言信息可以为用户输入的、需要进行识别的自然语言信息。其中,自然语言指一种自然地随文化演化的语言,是人类交流和沟通的主要工具、及人机交互的工具。例如,英语、汉语、日语等都属于自然语言。在一些实施例中,用户可以通过信息处理系统的信息输入接口输入自然语言信息,比如,信息处理系统可以包括信息输入部件,用户可以通过信息输入部件输入自然语言信息,以实现与信息处理系统的人机交互。
在本申请实施例中,用户在发送自然语言信息时,可以采用多种输入方式输入,比如,以语音信息的方式输入,或以文本信息的方式输入,其中,当采用以语音信息的方式输入时,得到的待识别的自然语言信息为以语音信息形式呈现的信息,当采用以文本信息的方式输入时,得到的待识别的自然语言信息为以文本信息形式呈现的信息。
驾驶状态信息可以为驾驶人员在驾驶车辆时的情绪信息,其中,情绪信息可以包括极端情绪和非极端情绪,其中,极端情绪可以包括愤怒、焦虑等。
其中,在本申请实施例中,获取用户的驾驶状态信息的方法可以包括:
获取用户的驾驶状态、以及用户的待识别人脸图像;
对待识别人脸图像进行情绪识别,得到用户的情绪信息;
根据情绪信息和驾驶状态,得到状态信息。
其中,驾驶状态可以包括正在驾驶的状态或未驾驶的状态。
待识别人脸图像可以为用户的人脸图像。
情绪识别可以为将待识别人脸图像输入到面部情绪识别模型中进行识别,从而得到情绪信息的过程,其中,面部情绪识别模型可以为神经网络模型。其中,在得到用户的情绪信息后,可以结合驾驶状态,得到状态信息。在一些实施例中,用户的驾驶状态信息可以在接收到用户发送的自然语言信息的同时进行获取,也可以通过实时获取的方式进行获取。
使用情况信息可以指车辆上各个单元的使用情况,其中,该部件可以包括车窗、空调、音乐播放器等部件,使用情况可以包括打开、关闭等情况。
其中,在本申请实施例中,获取车辆的使用情况信息的方法包括:
确定信息处理系统的中控屏单元的显示图像;
对显示图像进行识别处理,得到显示图像中各个单元的使用状态信息
根据使用状态信息,得到车辆的使用情况信息。
其中,中控屏单元可以为信息处理系统中用于与车辆乘员交互的控制器,在本申请实施例中,中控屏单元可以为车辆上的显示大屏,用户通过显示大屏可以了解车辆上各个单元的使用情况。
显示图像可以为中控屏单元中显示界面所显示的图像,显示图像中可以显示车辆的当前使用状态,比如,当前使用状态可以包括:车内温度、车外温度、空调开启状态、车窗开启状态、音乐播放状态、播放音乐名称等。
识别处理可以指对显示图像进行识别,以获取各个单元的使用状态信息的过程。其中,识别处理的方法可以为图像识别,在本申请实施例中,可以采用OCR技术获取图像中的各个信息。
使用状态信息可以为当前使用状态的信息,即通过识别处理后得到的文本信息。
在一些实施例中,使用情况信息可以在接收到用户发送的自然语言信息后进行获取的信息。
其中,需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息、人脸图像等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
S102、根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果。
其中,意图识别可以为获取自然语言信息的隐层意思的过程。意图识别结果可以指获取到的自然语言信息的隐层意思。其中,隐层意思表征用户发送的自然语言信息的本意,例如,“今天下雨了吗”的隐层意思为今天天气预报是什么。在一些实施例中,可以通过预设的自然语言处理模型获取待识别的自然语言信息的隐层意思,在本申请实施例中,自然语言处理模型可以为经过样本训练的Albert模型。
在根据使用情况信息进行自然语言信息的意图识别,可以更好的确定用户的真实意图,比如,当自然语言信息为“降低温度”、使用情况信息为“空调未启动”时,则意图识别结果可以“开启空调,降低温度”。
其中,在本申请实施例中,根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果的方法包括:
根据自然语言信息,确定自然语言信息的信息控制领域;
根据信息控制领域和使用情况信息,对自然语言信息进行意图识别,得到意图识别结果。
其中,信息控制领域可以指自然语言信息中的内容属于哪个单元的控制领域,比如,当自然语言信息为“打开空调”时,则信息控制领域为空调控制单元。
在确定信息控制领域后,可以结合使用情况信息,更好的对自然语言信息进行识别,从而得到更加精准的意图识别结果。
在一些实施例中,由于自然语言信息可以包括多个控制指令,比如“打开车窗,关闭空调”,因此,在进行信息控制领域的确定时,可以更好的确定出各个控制指令所对应的信息控制领域,从而方便在后面进行意图识别时,获取自然语言信息的真实意图。
其中,在本申请实施例中,根据自然语言信息,确定自然语言信息的信息控制领域的方法可以包括:
对自然语言信息进行实体信息检索,得到实体信息检索结果,实体信息检索结果包括自然语言信息中的实体信息;
根据实体信息检索结果,确定自然语言信息的信息控制领域。
其中,实体信息可以为自然语言信息中的信息控制领域的主体名词,比如,“导航去某地”中的“导航”为信息控制领域的主体名词,则“导航去某地”为导航领域的信息控制领域,“打开空调”中的“空调”为信息控制领域的主体名词,则“空调”为空调控制领域的信息控制领域。
实体信息检索可以为将自然语言信息进行分词处理后得到的多个待检实体词,并将多个待检实体词与信息控制领域中的实体信息列表进行比对,从而确定实体信息的检索过程。
实体信息检索结果可以为确定的自然语言信息中的实体信息。
S103、根据意图识别结果,确定应答信息,并根据应答信息执行相应的操作。
其中,应答信息可以为与自然语言信息对应的答复信息,比如,当自然语言信息为“打开空调”时,应答信息可以为“好的,已打开空调”。
在一些实施例中,在得到意图识别结果后,可以根据意图识别结果,从预设的应答信息库中获取对应的应答信息,并根据应答信息执行相应操作。
其中,为了更加准确的得到应答信息,在本申请实施例中,根据意图识别结果,确定应答信息的方法可以包括:
确定自然语言信息中的关键信息,其中,关键信息包括一个以上的关键词;
根据关键信息和意图识别结果,确定应答信息。
其中,关键信息可以为自然语言信息中所表征的动作、实体和属性,关键词可以为动作、实体和属性所对应的词语。其中,动作可以指进行控制的动作,实体可以指被控制的对象,属性可以指进行控制的程度,比如,当自然语言信息为“空调设置27度”时,动作可以为“设置”,实体可以为“空调”,属性可以为“27度”。
在一些实施例中,关键信息也可以根据意图识别结果进行确定,比如,当自然语言信息为“打开车窗”时,动作可以为“打开”,实体可以为“车窗”,属性可以通过意图识别结果确定为“开启”或“打开”。
其中,在本申请实施例中,确定自然语言信息中的关键信息,其中,关键信息包括一个以上的关键词的方法可以包括:
对自然语言信息进行分词处理,得到多个候选词;
确定每个候选词的属性;
根据候选词的属性,对候选词进行识别,得到多个候选词中的关键词。
其中,分词处理可以为自然语言处理的方式,在本申请实施例中,自然语言信息可以有多个词语构成,在对自然语言信息进行分词处理后,可以得到多个候选词。
候选词可以为构成自然语言信息的词语,候选词的属性可以表征候选词的标签,比如当候选词为“空调”时,候选词的标签为实体。
对候选词进行识别可以为确定候选词的属性是否属于关键信息的过程,在本申请实施例中,可以采用自然语言处理的方式对候选词进行识别。
执行相应的操作可以为根据应答信息进行的操作,比如,当确定应答信息为“车窗已关闭”时,执行相应的操作为控制车窗关闭的操作,在关闭完车窗后,可以发送应答信息“车窗已关闭”。
S104、根据驾驶状态信息,确定应答信息的答复模式;
S105、根据答复模式,发送应答信息。
其中,答复模式可以指发送应答信息的方式,在本申请实施例中,答复模式可以包括轻柔、欢快、正常、抚慰等模式。答复模式的选择可以根据驾驶状态信息来确定,比如,当驾驶状态信息为用户正处于伤心的情绪下进行开车时,在进行应答信息的播报时,可以使用答复模式为轻柔的声音进行播报。其中,答复模式的设置可以通过技术人员预先存储各种模式所对应的音频得到。当驾驶状态信息为用户正处于愤怒的情绪下进行开车时,在进行应答信息的显示时,可以在显示答复信息的图像中显示安全提示信息的方式进行答复信息的显示,以次来提醒用户安全驾驶。
其中,在获取用户发送的自然语言信息时,所得到的自然语言信息可能为缺失信息,当自然语言信息为缺失信息时,信息处理系统无法进行识别和应答,从而无法与用户进行交互,故在本申请实施例中,在获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息之后,根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果之前的方法还可以包括:
判断自然语言信息的缺失状态;
若缺失状态为未缺失,则执行根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果的步骤。
其中,缺失状态可以表征自然语言信息中是否缺少主体信息。比如,用户发送的自然语言信息“再低点”,其中,该自然语言信息中缺少实体,信息处理系统无法对该自然语言信息进行识别,并做出应答。
判断自然语言信息的缺失状态可以为通过自然语言处理模型对自然语言信息的缺失状态进行检测,判断其在语法正确的情况下,是否缺少实体信息。
自然语言信息的缺失状态可以包括缺失和未缺失,当自然语言信息的缺失状态为未缺失时,可以执行根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果的步骤。
当自然语言信息的缺失状态为缺失时,则需要对自然语言信息的意图进行预测,以执行识别和应答,完成与用户的交互。
其中,在本申请实施例中,在判断自然语言信息的缺失状态之后的方法还可以包括:
若缺失状态为缺失,则根据目标历史交互信息,对自然语言信息进行修整,得到修整自然语言信息,其中,目标历史交互信息为自然语言信息的关联信息;
根据使用情况信息,对修整自然语言信息进行意图识别,得到修整意图识别结果;
根据修整意图识别结果,确定修整应答信息,并根据修整应答信息执行相应的操作;
根据驾驶状态信息,确定修整应答信息的答复模式;
根据答复模式,发送修整应答信息。
其中,目标历史交互信息可以为与自然语言信息关联的信息,在本申请实施例中,关联可以指与待识别的自然语言信息具有上下文联系的交互信息,比如,用户与信息处理系统的对话场景为“降低空调温度,空调温度已降低;再低点”时,当自然语言信息为“再低点”时,则目标历史交互信息可以为“降低空调温度,空调温度已降低”。
在一些实施例中,目标历史交互信息可以根据与自然语言信息的时间关系进行确定,比如,当用户在第一次发出“降低空调温度”的指令后,在得到信息处理系统的应答信息“空调温度已降低”的回复后,第二次发出“再低点”时,若第二次发出的时间和第一次发出的时间间隔在预设的时间间隔内,则确定第一次发出“降低空调温度”的指令和得到的“空调温度已降低”的回复为第二次发出“再低点”的指令的目标历史交互信息。在获取多条目标历史交互信息时,可以将发出时间最早的指令作为自然语言信息,不断重复上述过程,从而获取多条目标历史交互信息。
修整自然语言信息可以为对目标历史交互信息进行意图识别后,根据得到的目标意图识别结果,以及目标历史交互信息的语义结构,来对自然语言信息进行重写后得到的自然语言信息。
修整意图识别结果为根据使用情况信息对修整自然语言信息进行意图识别后,得到的意图识别结果,在本申请实施例中,为了保证修整自然语言信息与目标历史交互信息进行匹配,可以将修整意图识别结果与目标意图识别结果进行相似度匹配,并根据相似度匹配结果,确定该修整自然语言信息是否符合目标意图识别结果的要求,由此,可进一步地与目标历史交互信息进行关联,提高修整自然语言信息的准确性。
修整应答信息可以为根据修整意图识别结果和修整自然语言信息得到,针对修整自然语言信息的应答信息。
其中,在得到修整自然语言信息后,为了避免自然语言信息修整未完全,则可以重新对修整自然语言信息进行缺失状态判断,在本申请实施例中,在若缺失状态为缺失,则根据目标历史交互信息,对自然语言信息进行修整,得到修整自然语言信息之后,根据使用情况信息,对修整自然语言信息进行意图识别,得到修整意图识别结果之前的方法还包括:
判断修整自然语言信息的修整缺失状态;
若修整缺失状态为未缺失,则执行根据使用情况信息,对修整自然语言信息进行意图识别,得到修整意图识别结果的步骤。
本申请提供的信息处理方法,可以通过获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息;根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果;根据意图识别结果,确定应答信息,并根据应答信息执行相应的操作;根据驾驶状态信息,确定应答信息的答复模式;根据答复模式,发送应答信息,可以使得信息处理系统可以根据自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息更加准确的获取用户的真实意图,同时提高了向用户反馈应答信息的反馈效果,由此,提高了用户与车辆的交互效果。
图2为本申请实施例提供的另一种信息处理方法的流程示意图,该方法的执行主体可以为车载电脑,本实施例此处不做特别限制,如图2所示,该方法可以包括:
S201、通过语音采集单元采集用户发送的自然语言信息、通过视频采集单元获取用户的状态信息、以及通过图像处理单元采集车辆的使用情况信息。
其中,自然语言信息为用户向智能驾驶车辆发送的指令,用户的状态信息为用户在进行驾驶时的情绪信息,车辆的使用情况信息可以车辆上各个单元的使用情况信息。
S202、将自然语言信息发送至对话管理单元,判断自然语言信息的完整程度。
其中,在进行自然语言信息的完整程度判断时,可以结合目标历史交互信息进行判断,在本申请实施例中,可以通过ELECTRA模型(Efficiently Learning an Encoderthat Classifies Token Replacements Accurately,自监督语言表征学习)进行自然语言信息的完整程度的判断。
S203、若自然语言信息完整,则根据车辆的使用情况信息,确定自然语言信息的领域分类和意图识别结果。
其中,领域分类可以指执行自然语言信息的实体分类。意图识别结果可以有一个以上。
S204、根据领域分类和意图识别结果,获取自然语言信息的关键信息。
S205、根据关键信息,得到与关键信息对应的应答信息,并根据应答信息执行对应的操作;
S206、根据用户的状态信息,确定应答信息的发送模式;
S207、根据应答信息的发送模式,发送应答信息。
S208、若自然语言信息缺失,则根据目标历史交互信息,对自然语言信息进行修整,得到目标自然语言信息,其中,目标历史交互信息为自然语言信息的上下文信息;
S209、将目标自然语言信息作为完整的自然语言信息,执行步骤S203~S207。
图3为本申请实施例提供的另一种信息处理方法的模块示意图,如图3所示,该方法包括:车机信号采集模块、对话管理模块、自然语言理解模块、自然语言生成模块和车机播报话术回复及执行模块。
其中,车机信号采集模块可以包括语音采集单元、图像采集单元和视频采集单元,语音采集单元用于获取驾驶人员的语音指令信息,视频采集单元用于获取驾驶人员的表情情绪信息,图像采集单元用于获取车辆的使用情况信息。
对话管理模块用于接收车机信号采集发送的语音指令信息、表情情绪信息和使用情况信息。对话管理模块包括状态追踪单元、对话策略单元和当前话术是否完整单元,其中,状态追踪单元(DST,Dialog State Tracking)归属于DM(Dialogue Manage)对话管理器中,用于估计用户的当前轮的自然语言信息,状态追踪单元为对话管理模块中的核心组成部分,在工作过程中维护了对话管理模块的状态,并根据每一轮的自然语言信息更新当前轮的自然语言信息。对话策略单元(DPL,Design Pattern Library)是根据状态追踪单元的输出,来进行下一步的系统动作。当前话术信息单元用于根据当前轮的目标历史对话信息判断自然语言信息是否完整。
自然语言理解模块包括领域分类单元、单意图识别单元、多意图识别单元、槽位识别单元和当前话术重写单元,其中,领域分类单元用于确定自然语言信息中实体信息所属的领域。单意图识别单元和多意图识别单元用于对领域分类后的自然语言信息进行意图识别,得到意图识别结果。槽位识别单元用于确定自然语言信息中的关键信息(动作、实体、属性)。当前话术重写单元用于在自然语言信息不完整时,根据目标历史对话信息对自然语言信息进行修整重写,得到修整自然语言信息。
自然语言生成模块包括生成应答回复单元,生成应答回复单元用于根据自然语言信息得到应答信息。
车机播报话术回复及执行模块用于执行应答信息。
本申请实施例提供的信息处理方法,可以通过多方位、多类别的输入,确保对话管理可以获取更多有效信息;也可以根据历史信息可以更好的对当前话术进行回复;还可以在交互过程中实现多样化、更丰富的话术理解,以更好地提高交互效果。
图4为本申请实施例提供的信息处理装置的结构示意图。如图4所示,该信息处理装置40包括:获取模块401、意图识别模块402、应答信息确定模块403、答复模式确定模块404以及发送模块405。其中:
获取模块401,用于获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息;
意图识别模块402,用于根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果;
应答信息确定模块403,用于根据意图识别结果,确定应答信息,并根据应答信息执行相应的操作;
答复模式确定模块404,用于根据驾驶状态信息,确定应答信息的答复模式;
发送模块405,用于根据答复模式,发送应答信息。
在本申请实施例中,获取模块401还可以具体用于:
获取用户的驾驶状态、以及用户的待识别人脸图像;
对待识别人脸图像进行情绪识别,得到用户的情绪信息;
根据情绪信息和驾驶状态,得到状态信息。
在本申请实施例中,获取模块401还可以具体用于:
确定信息处理系统的中控屏单元的显示图像;
对显示图像进行识别处理,得到显示图像中各个部件的使用状态信息根据使用状态信息,得到车辆的使用情况信息。
在本申请实施例中,意图识别模块402还可以具体用于:
根据自然语言信息,确定自然语言信息的信息控制领域;
根据信息控制领域和使用情况信息,对自然语言信息进行意图识别,得到意图识别结果。
在本申请实施例中,意图识别模块402还可以具体用于:
对自然语言信息进行实体信息检索,得到实体信息检索结果,实体信息检索结果包括自然语言信息中的实体信息;
根据实体信息检索结果,确定自然语言信息的信息控制领域。
在本申请实施例中,应答信息确定模块403还可以具体用于:
确定自然语言信息中的关键信息,其中,关键信息包括一个以上的关键词;
根据关键信息和意图识别结果,确定应答信息。
在本申请实施例中,应答信息确定模块403还可以具体用于:
对自然语言信息进行分词处理,得到多个候选词;
确定每个候选词的属性;
根据候选词的属性,对候选词进行识别,得到多个候选词中的关键词。
在本申请实施例中,发送模块405还可以具体用于:
判断自然语言信息的缺失状态;
若缺失状态为未缺失,则执行根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果的步骤。
在本申请实施例中,发送模块405还可以具体用于:
若缺失状态为缺失,则根据目标历史交互信息,对自然语言信息进行修整,得到修整自然语言信息,其中,目标历史交互信息为自然语言信息的关联信息;
根据使用情况信息,对修整自然语言信息进行意图识别,得到修整意图识别结果;
根据修整意图识别结果,确定修整应答信息,并根据修整应答信息执行相应的操作;
根据驾驶状态信息,确定修整应答信息的答复模式;
根据答复模式,发送修整应答信息。
在本申请实施例中,发送模块405还可以具体用于:判断修整自然语言信息的修整缺失状态;
若修整缺失状态为未缺失,则执行根据使用情况信息,对修整自然语言信息进行意图识别,得到修整意图识别结果的步骤。
由上可知,本实施例的信息处理装置由获取模块401,用于获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息;由意图识别模块402,用于根据使用情况信息,对自然语言信息进行意图识别,得到意图识别结果;由应答信息确定模块403,用于根据意图识别结果,确定应答信息,并根据应答信息执行相应的操作;由答复模式确定模块404,用于根据驾驶状态信息,确定应答信息的答复模式;由发送模块405,用于根据答复模式,发送应答信息。由此,可以使得信息处理系统可以根据自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息更加准确的获取用户的真实意图,从而提高向用户反馈应答信息的反馈效果,进而提高了用户与车辆的交互效果。
图5为本申请实施例提供的车辆的结构示意图。如图5所示,该车辆50包括:
该电子设备50可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储器502、通信部件503等部件。其中,处理器501、存储器502以及通信部件503通过总线504连接。
在具体实现过程中,至少一个处理器501执行存储器502存储的计算机执行指令,使得至少一个处理器501执行如上的信息处理方法。
处理器501的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述的图5所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速存储器(Random Access Memory,RAM),也可能还包括非易失性存储器(Non-volatile Memory,NVM),例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
在一些实施例中,还提出一种计算机程序产品,包括计算机程序或指令,该计算机程序或指令被处理器执行时实现上述任一种信息处理方法中的步骤。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种信息处理方法中的步骤。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种信息处理方法中的步骤,因此,可以实现本申请实施例所提供的任一种信息处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims (13)

1.一种信息处理方法,其特征在于,应用于信息处理系统,所述方法包括:
获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息;
根据所述使用情况信息,对所述自然语言信息进行意图识别,得到意图识别结果;
根据所述意图识别结果,确定应答信息,并根据所述应答信息执行相应的操作;
根据所述驾驶状态信息,确定所述应答信息的答复模式;
根据所述答复模式,发送所述应答信息。
2.根据权利要求1所述的信息处理方法,其特征在于,所述获取用户的驾驶状态信息,包括:
获取用户的驾驶状态、以及用户的待识别人脸图像;
对所述待识别人脸图像进行情绪识别,得到用户的情绪信息;
根据所述情绪信息和驾驶状态,得到所述状态信息。
3.根据权利要求1所述的信息处理方法,其特征在于,所述获取车辆的使用情况信息,包括:
确定信息处理系统的中控屏单元的显示图像;
对所述显示图像进行识别处理,得到所述显示图像中各个部件的使用状态信息
根据所述使用状态信息,得到所述车辆的使用情况信息。
4.根据权利要求1所述的信息处理方法,其特征在于,所述根据所述使用情况信息,对所述自然语言信息进行意图识别,得到意图识别结果,包括:
根据所述自然语言信息,确定所述自然语言信息的信息控制领域;
根据所述信息控制领域和所述使用情况信息,对所述自然语言信息进行意图识别,得到意图识别结果。
5.根据权利要求4所述的信息处理方法,其特征在于,所述根据所述自然语言信息,确定所述自然语言信息的信息控制领域,包括:
对所述自然语言信息进行实体信息检索,得到实体信息检索结果,所述实体信息检索结果包括所述自然语言信息中的实体信息;
根据所述实体信息检索结果,确定所述自然语言信息的信息控制领域。
6.根据权利要求1所述的信息处理方法,其特征在于,所述根据所述意图识别结果,确定应答信息,包括:
确定所述自然语言信息中的关键信息,其中,所述关键信息包括一个以上的关键词;
根据所述关键信息和所述意图识别结果,确定应答信息。
7.根据权利要求6所述的信息处理方法,其特征在于,所述确定所述自然语言信息中的关键信息,其中,所述关键信息包括一个以上的关键词,包括:
对所述自然语言信息进行分词处理,得到多个候选词;
确定每个所述候选词的属性;
根据所述候选词的属性,对所述候选词进行识别,得到多个所述候选词中的关键词。
8.根据权利要求1所述的信息处理方法,其特征在于,在所述获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息之后,根据所述使用情况信息,对所述自然语言信息进行意图识别,得到意图识别结果之前,所述方法还包括:
判断所述自然语言信息的缺失状态;
若所述缺失状态为未缺失,则执行根据所述使用情况信息,对所述自然语言信息进行意图识别,得到意图识别结果的步骤。
9.根据权利要求8所述的信息处理方法,其特征在于,在所述判断所述自然语言信息的缺失状态之后,所述方法还包括:
若所述缺失状态为缺失,则根据目标历史交互信息,对所述自然语言信息进行修整,得到修整自然语言信息,其中,所述目标历史交互信息为所述自然语言信息的关联信息;
根据所述使用情况信息,对所述修整自然语言信息进行意图识别,得到修整意图识别结果;
根据所述修整意图识别结果,确定修整应答信息,并根据所述修整应答信息执行相应的操作;
根据所述驾驶状态信息,确定所述修整应答信息的答复模式;
根据所述答复模式,发送所述修整应答信息。
10.根据权利要求9所述的信息处理方法,其特征在于,在所述若所述缺失状态为缺失,则根据目标历史交互信息,对所述自然语言信息进行修整,得到修整自然语言信息之后,所述根据所述使用情况信息,对所述修整自然语言信息进行意图识别,得到修整意图识别结果之前,所述方法还包括:
判断所述修整自然语言信息的修整缺失状态;
若所述修整缺失状态为未缺失,则执行根据所述使用情况信息,对所述修整自然语言信息进行意图识别,得到修整意图识别结果的步骤。
11.一种信息处理装置,其特征在于,包括:
获取模块,用于获取用户发送的自然语言信息、用户的驾驶状态信息、以及车辆的使用情况信息;
意图识别模块,用于根据所述使用情况信息,对所述自然语言信息进行意图识别,得到意图识别结果;
应答信息确定模块,用于根据所述意图识别结果,确定应答信息,并根据所述应答信息执行相应的操作;
答复模式确定模块,用于根据所述驾驶状态信息,确定所述应答信息的答复模式;
发送模块,用于根据所述答复模式,发送所述应答信息。
12.一种车辆,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1至10中任一项所述的信息处理方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至10任一项所述的信息处理方法。
CN202211657077.7A 2022-12-22 2022-12-22 信息处理方法、装置、车辆及存储介质 Pending CN115985317A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211657077.7A CN115985317A (zh) 2022-12-22 2022-12-22 信息处理方法、装置、车辆及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211657077.7A CN115985317A (zh) 2022-12-22 2022-12-22 信息处理方法、装置、车辆及存储介质

Publications (1)

Publication Number Publication Date
CN115985317A true CN115985317A (zh) 2023-04-18

Family

ID=85969412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211657077.7A Pending CN115985317A (zh) 2022-12-22 2022-12-22 信息处理方法、装置、车辆及存储介质

Country Status (1)

Country Link
CN (1) CN115985317A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117912464A (zh) * 2023-12-19 2024-04-19 易显智能科技有限责任公司 车辆驾驶培训方法和系统、电子设备和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117912464A (zh) * 2023-12-19 2024-04-19 易显智能科技有限责任公司 车辆驾驶培训方法和系统、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN110728997B (zh) 一种基于情景感知的多模态抑郁症检测系统
JP7508533B2 (ja) 話者埋め込みと訓練された生成モデルとを使用する話者ダイアライゼーション
CN109003624B (zh) 情绪识别方法、装置、计算机设备及存储介质
CN107818798B (zh) 客服服务质量评价方法、装置、设备及存储介质
CN110147726A (zh) 业务质检方法和装置、存储介质及电子装置
JP2017016566A (ja) 情報処理装置、情報処理方法及びプログラム
CN108447471A (zh) 语音识别方法及语音识别装置
CN110047467B (zh) 语音识别方法、装置、存储介质及控制终端
CN104795065A (zh) 一种提高语音识别率的方法和电子设备
US10861459B2 (en) Apparatus and method for determining reliability of recommendation based on environment of vehicle
CN111179935A (zh) 一种语音质检的方法和设备
CN112256229B (zh) 人机语音交互方法、装置、电子设备及存储介质
CN117765981A (zh) 一种基于语音文本跨模态融合的情感识别方法及系统
CN115985317A (zh) 信息处理方法、装置、车辆及存储介质
CN117636872A (zh) 音频处理方法、装置、电子设备和可读存储介质
CN117352000A (zh) 语音分类方法、装置、电子设备及计算机可读介质
US11996099B2 (en) Dialogue system, vehicle, and method of controlling dialogue system
CN110853669A (zh) 音频识别方法、装置及设备
CN112927721A (zh) 人车互动方法、系统以及车辆和计算机可读存储介质
CN117831530A (zh) 对话场景区分方法、装置、电子设备和存储介质
CN109887490A (zh) 用于识别语音的方法和装置
CN117292688A (zh) 一种基于智能语音鼠标的控制方法及智能语音鼠标
US20220301232A1 (en) Apparatus for generating emojis, vehicle, and method for generating emojis
CN112148864B (zh) 语音交互方法、装置、计算机设备和存储介质
CN112687296B (zh) 音频不流利的识别方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination