CN117435704A - 车载对话系统回复语生成方法、装置、车辆及存储介质 - Google Patents
车载对话系统回复语生成方法、装置、车辆及存储介质 Download PDFInfo
- Publication number
- CN117435704A CN117435704A CN202311379668.7A CN202311379668A CN117435704A CN 117435704 A CN117435704 A CN 117435704A CN 202311379668 A CN202311379668 A CN 202311379668A CN 117435704 A CN117435704 A CN 117435704A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- user
- reply
- information
- reply language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000004891 communication Methods 0.000 claims description 26
- 230000006399 behavior Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 8
- 230000003993 interaction Effects 0.000 abstract description 6
- 238000012545 processing Methods 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000036651 mood Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- INFDPOAKFNIJBF-UHFFFAOYSA-N paraquat Chemical compound C1=C[N+](C)=CC=C1C1=CC=[N+](C)C=C1 INFDPOAKFNIJBF-UHFFFAOYSA-N 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Navigation (AREA)
Abstract
本申请涉及一种车载对话系统回复语生成方法、装置、车辆及存储介质,方法包括:获取车机状态特征;基于用户的语音数据确定用户意图特征;获取车机执行用户意图特征后的车机执行特征;根据用户意图特征、车机状态特征和车机执行特征构建提示信息;将提示信息输入聊天机器人模型,生成回复语信息;其中,回复语信息包括回复语以及车载对话系统播放回复语的目标音色,以使车载对话系统根据目标音色播放回复语。该方法可以基于聊天机器人模型,根据车机执行用户意图特征后的车机执行特征以及车机状态特征和用户意图特征生成带有目标音色的回复语,更能符合对话交互过程中的环境,使车载对话系统的回复语满足用户需求,提高用户体验。
Description
技术领域
本申请涉及智能车辆技术领域,具体涉及一种车载对话系统回复语生成方法、装置、车辆及存储介质。
背景技术
随着智能车辆的不断发展,车载对话系统的应用越来越广泛。但是当前的对话系统往往会根据用户的意图和任务执行情况在预设的多个回复语中随机选择一个反馈给用户,这种方法实现的回复语多样性是虚假的,因为用户在相同的设备和情境中重复与对话系统交互就能测出多样性的极限,并且这种预设的回复语无法根据不同的用户以及用户的情绪状态做出个性化的回复,不能满足用户需求,用户体验较差。
发明内容
为了解决如何使车载对话系统回复语更贴近用户需求的技术问题,本申请提供了一种车载对话系统回复语生成方法、装置、车辆及存储介质。
第一方面,本申请提供了一种车载对话系统回复语生成方法,所述方法包括:
获取车机状态特征;
基于用户的语音数据确定用户意图特征;
获取车机执行所述用户意图特征后的车机执行特征;
根据所述用户意图特征、所述车机状态特征和所述车机执行特征构建提示信息;
将所述提示信息输入聊天机器人模型,生成回复语信息;其中,所述回复语信息包括回复语以及车载对话系统播放所述回复语的目标音色,以使所述车载对话系统根据所述目标音色播放所述回复语。
可选地,将所述提示信息输入聊天机器人模型,生成回复语信息,包括:
根据所述车机执行特征和所述车机状态特征确定所述用户意图特征的完成度;
根据所述完成度从预设的音色库中确定目标音色;
获取所述聊天机器人模型基于所述车机执行特征、所述车机状态特征和所述用户意图特征确定的所述回复语;
将所述回复语和所述目标音色作为所述回复语信息。
可选地,根据所述完成度从预设的音色库中确定目标音色,包括:
根据预先获取的用户特征从预设的音色库中确定目标音色库;
根据所述完成度从所述目标音色库中确定所述目标音色。
可选地,根据所述用户意图特征、所述车机状态特征和所述车机执行特征构建提示信息之前,所述方法还包括:
获取车机的用户日志信息和/或用户状态信息;
根据所述用户日志信息和/或所述用户状态信息生成用户特征数据;其中,所述用户特征数据包括用户的基本信息和用户行为特征,所述基本信息至少包括性别、兴趣爱好、年龄和籍贯中的一种。
可选地,根据所述用户意图特征、所述车机状态特征和所述车机执行特征构建提示信息,包括:
根据所述用户行为特征、所述用户意图特征、所述车机状态特征和所述车机执行特征构建所述提示信息。
可选地,基于用户的语音数据确定用户意图特征,包括:
获取用户的语音数据;
将所述语音数据转换为文本数据;
根据所述文本数据确定所述用户意图特征。
可选地,所述车机状态特征包括车机状态信息和车机属性信息;所述车机状态信息至少包括车机智慧屏的前台应用、正在运行的应用和车机所在地区中的一种,所述车机属性信息至少包括车机型号、品牌、车载系统版本中的一种。
第二方面,本申请提供了一种车载对话系统回复语生成装置,所述装置包括:
第一获取模块,用于获取车机状态特征;
确定模块,用于基于用户的语音数据确定用户意图特征;
第二获取模块,用于获取车机执行所述用户意图特征后的车机执行特征;
提示信息构建模块,用于根据所述用户意图特征、所述车机状态特征和所述车机执行特征构建提示信息;
生成模块,用于将所述提示信息输入聊天机器人模型,生成回复语信息;其中,所述回复语信息包括回复语以及车载对话系统播放所述回复语的目标音色,以使所述车载对话系统根据所述目标音色播放所述回复语。
第三方面,本申请提供了一种车辆,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面任一项实施例所述的车载对话系统回复语生成方法的步骤。
第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项实施例所述的车载对话系统回复语生成方法的步骤。
本申请的有益效果:
本申请实施例提供的该方法,获取车机状态特征;基于用户的语音数据确定用户意图特征;获取车机执行所述用户意图特征后的车机执行特征;根据所述用户意图特征、所述车机状态特征和所述车机执行特征构建提示信息;将所述提示信息输入聊天机器人模型,生成回复语信息;其中,所述回复语信息包括回复语以及车载对话系统播放所述回复语的目标音色,以使所述车载对话系统根据所述目标音色播放所述回复语。该方法可以基于聊天机器人模型,根据车机执行用户意图特征后的车机执行特征以及车机状态特征和用户意图特征生成带有目标音色的回复语,更能符合对话交互过程中的环境,使车载对话系统的回复语满足用户需求,提高用户体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一个实施例提供的一种车载对话系统回复语生成方法的系统架构图;
图2为本申请一个实施例提供的一种车载对话系统回复语生成方法的流程示意图;
图3为本申请一个实施例提供的一种回复语生成方法的流程示意图;
图4为本申请一个实施例提供的一种Prompt的构建流程示意图;
图5为本申请一个实施例提供的一种车载对话系统回复语生成装置的结构示意图;
图6为本申请一个实施例提供的一种车辆的结构示意图。
具体实施方式
以下将参照附图和优选实施例来说明本申请的实施方式,本领域技术人员可由本说明书中所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。应当理解,优选实施例仅为了说明本申请,而不是为了限制本申请的保护范围。
本申请第一实施例提供了一种车载对话系统回复语生成方法,该方法可以应用于如图1所示的系统架构,该系统架构可以是车载对话系统(也可称为车载语音助手或语音助手),该车载对话系统中至少包括数据采集单元101、处理单元102和输出单元103,该方法可应用于该系统架构中的处理单元102。
接下来,基于该系统架构,对该车载对话系统回复语生成方法进行详细说明。如图2,车载对话系统回复语生成方法包括:
步骤201,获取车机状态特征。
一个实施例中,所述车机状态特征包括车机状态信息和车机属性信息,所述车机状态信息至少包括车机智慧屏的前台应用、正在运行的应用和车机所在地区中的一种,所述车机属性信息至少包括车机型号、品牌、车载系统版本中的一种。
本实施例中,根据车机状态信息和车机属性信息可以确定车机的实时状态和特征,从而可以为用户提供与车辆相关的服务和回复提供数据基础。
步骤202,基于用户的语音数据确定用户意图特征。
一个实施例中,所述基于用户的语音数据确定用户意图特征,包括:获取用户的语音数据,将所述语音数据转换为文本数据,根据所述文本数据确定所述用户意图特征。
本实施例中,用户意图特征可以通过对用户的语音数据进行解析和分析得到的,能够揭示用户在交流中真实的意图和需求,获取用户意图特征是为了确保对话系统能够准确把握用户的意图,并为后续以此为依据生成更恰当的回复语提供数据支持。其中,对于文本数据可以使用自然语言理解(Natural Language Understanding,NLU)或其他规则技术获取用户的意图,在确定用户意图特征后可以转换成车机指令,指示车机按照车机指令执行相应的动作。
步骤203,获取车机执行所述用户意图特征后的车机执行特征。
车机执行特征指车机按照用户意图特征执行后,车机状态特征发生改变后的特征,比如,在步骤201中获取的车机状态特征中车窗是关闭的,根据用户的语音数据确定的用户意图特征是打开车窗,在执行打开车窗的指令后车窗的当前状态即对应的车机执行特征。
步骤204,根据所述用户意图特征、所述车机状态特征和所述车机执行特征构建提示信息。
为了能够获取到针对用户以及当前场景的个性化回复语,将用户意图特征、车机状态特征以及车机执行特征结合起来构建提示信息(Prompt),Prompt可以引导和帮助聊天机器人模型理解输入的信息,也就是说,通过在输入中加入一些提示信息,可以使聊天机器人模型更准确地理解用户的意图,从而生成更合适的输出结果。
一个实施例中,所述根据所述用户意图特征、所述车机状态特征和所述车机执行特征构建提示信息之前,所述方法还包括:获取车机的用户日志信息和/或用户状态信息;根据所述用户日志信息和/或所述用户状态信息生成用户特征数据;其中,所述用户特征数据包括用户的基本信息和用户行为特征,所述基本信息至少包括性别、兴趣爱好、年龄和籍贯中的一种。
本实施例中,在构建提示信息之前,可以先确定是哪个用户在使用车载对话系统,从而可以根据用户的基本信息,比如性别、兴趣爱好、年龄和籍贯等等,选取用户习惯的目标音色与用户进行交互,用户特征数据可以从车机存储的用户日志信息中获取,也可以通过车机采集的用户状态信息获取,不作限制。其中,用户行为特征可以通过人物画像算法根据用户日志信息或所述用户状态信息生成。
相应地,所述根据所述用户意图特征、所述车机状态特征和所述车机执行特征构建提示信息,可以如图3,包括:根据所述用户行为特征、所述用户意图特征、所述车机状态特征和所述车机执行特征构建所述提示信息。
在构建提示信息时,加入用户行为特征可以更准确的提供输入信息,比如,可以根据当前用户的情绪状态选择适当的音色回复,进一步可以参考用户的籍贯,选择用户的家乡话进行目标音色的回复,提高用户交互时的体验感。
步骤205,将所述提示信息输入聊天机器人模型,生成回复语信息,其中,所述回复语信息包括回复语以及车载对话系统播放所述回复语的目标音色,以使所述车载对话系统根据所述目标音色播放所述回复语。
聊天机器人模型指自然语言处理领域中的大型语言模型,包括但不限于:ChatGPT(智能聊天机器人)、Newbing(必应)、Bard(巴德)、讯飞星火认知大模型(SparkDesk)、文心一言(ERNIE Bot)和ChatGLM-6B等等。
回复语作为用户与对话系统之间的桥梁,扮演着沟通的关键角色。传统的对话系统回复通常显得过于机械、缺乏情感,很难满足用户的多样化需求。在面对不同用户和不同场景时,单一的回复无法提供真正个性化的服务,这使得用户感觉与冷冰冰的机器对话,体验缺乏人性化。
为了改善这一局面,可以引入聊天机器人模型比如ChatGPT。ChatGPT具备强大的文本生成能力,不仅理解语言,还能根据多样化的特征生成富有个性的回复语。通过深度学习算法,它可以针对每个用户的方言、听歌习惯、驾车偏好、所在地区和天气等信息,创造出独一无二的交流体验。
首先,ChatGPT具备方言识别的能力。不同地区的方言有着独特的特点,而传统对话系统往往只能处理标准化的语言。而借助ChatGPT,对话系统可以轻松理解用户的方言,从而更加自然地进行回复,让交流更为顺畅。同时,ChatGPT还能够生成带有方言特色的回复语,为交流增添更多个性化的魅力。
其次,听歌习惯是每个人独特的音乐趣味,而ChatGPT能够结合用户的听歌历史和偏好,为用户提供更具个性化的回复语。
驾车习惯也是个性化回复的重要方面。一些司机可能喜欢听取路况信息和导航建议,而另一些可能更关心当地的景点或餐厅推荐。ChatGPT的个性化回复能够根据用户的驾车偏好,提供定制化的服务,满足用户的实际需求。
当地地区和天气信息的融入更增加了个性化回复的实用性。ChatGPT了解用户所在地的气候状况,能够提前告知驾车者可能遇到的天气情况,如预测降雨或高温。这种贴心的提醒让用户能够做好出行准备,确保旅途的顺利和舒适。
此外,ChatGPT还能通过对用户意图的分析,更好地理解用户的需求并作出恰当的回应。无论用户是在查询资讯、探索当地文化还是寻求娱乐,ChatGPT都能够根据用户的意图提供最合适的回复和建议。
该方法可以基于聊天机器人模型,根据车机执行用户意图特征后的车机执行特征以及车机状态特征和用户意图特征生成带有目标音色的回复语,更能符合对话交互过程中的环境,使车载对话系统的回复语满足用户需求,提高用户体验。
一个实施例中,所述将所述提示信息输入聊天机器人模型,生成回复语信息,包括:根据所述车机执行特征和所述车机状态特征确定所述用户意图特征的完成度,根据所述完成度从预设的音色库中确定目标音色,获取所述聊天机器人模型基于所述车机执行特征、所述车机状态特征和所述用户意图特征确定的所述回复语,将所述回复语和所述目标音色作为所述回复语信息。
本实施例中,由执行用户意图特征前的车机状态特征和执行用户意图特征后的车机执行特征确定的完成度在预设的音色库中确定目标音色,按照目标音色个性化的回复用户,相同的话语通过不同的音色、音调回复可以起到完全不同的效果,本实施例将从聊天机器人模型获取到的回复语按照合适的音色与用户进行交互,可以提高用户在语音交互过程中的体验感。
一个实施例中,所述根据所述完成度从预设的音色库中确定目标音色,包括:根据预先获取的用户特征从预设的音色库中确定目标音色库,根据所述完成度从所述目标音色库中确定所述目标音色。
本实施例中,为进一步准确的确定合适的目标音色,可先根据用户特征确定目标音色库,再根据完成度确定目标音色,比如,按照用户的性别和籍贯,选择对应的方言及男生或女生播报,可提高用户在交互过程中的舒适度。
一个实施例中,构建Prompt可以如图4,引入角色扮演,再融入基本特征(包括车机状态特征和用户行为特征),融入意图特征(即用户意图特征),融入车机执行特征,再对输出进行限定,输入聊天机器人模型,得到回复语信息。
在ChatGPT中,角色扮演是一种通过对话方式来引导模型生成特定类型文本的方法。通过设定不同的角色和情境,用户可以引导ChatGPT生成更加符合实际场景的自然语言文本。在构建Prompt时可以使用角色扮演的方式引导ChatGPT生成车载对话系统的回复语。例如:“假如你是一个车载对话系统”。
为实现个性化回复语需要将用户和车机特征通过Prompt告诉ChatGPT,即将获取的用户行为特征、车机状态特征、用户意图特征和车机执行特征融入Prompt。车机执行状态是指车机执行用户的意图是成功、失败以及失败的原因、执行后的结果等;车机当前状态是指车机前台应用、正在运行的应用、车机属性等信息。其中车机当前状态将与用户特征一起作为“基本特征”。因此构建Prompt片段:“请根据用于‘基本特征’回答的‘用户意图’的问题”,片段中‘基本特征’和‘用户意图’将根据实际获取的信息进行替换。
执行结果说明,车载对话系统的回复语最重要的一部分应包含用户意图的执行结果,因此我们需要将车机执行用户的意图状态加入到Prompt中,比如可以使用的Prompt模板是:“‘原因’执行状态是‘状态’”,其中‘原因’可以不存在,不存在时为空即可,当有失败原因的情况下才会添加‘原因’,例如:车窗已经是开最大了导致执行开车窗失败;“状态”是成功或失败。
输出限定是指对ChatGPT的输出做限定,例如限定格式、内容。因此构建的Prompt的片段可以是:“请根据以上特征个性化回答,可以包含音色,先回答执行状态,你只需要回答系统音色和回复信息,格式json,包含:{"timbre":音色,"content":回复语}”。
将各个Prompt片段组合可以得到完整的Prompt:“假如你是一个车载对话系统,请根据用户‘用户特征’回答的‘用户意图’的问题,并且‘原因’执行状态是‘状态’,请根据以上特征个性化回答,可以包含音色,先回答执行状态,你只需要回答系统音色和回复信息,格式json,包含:{"timbre":音色,"content":回复语}”,其中单引号‘XXX’中的内容将根据不同情况使用真实内容替换即可。
通过利用ChatGPT,本申请构建了一个个性化的车机对话系统,举例如下:
场景1
提示信息
假如你是一个车载对话系统,请根据用户“女性、大学生、驾驶员、刚上车、天气小雨,正在听情歌”回答的“导航到中关村”的问题,并且由于网络原因执行状态是失败,请根据以上特征个性化回答,可以包含音色,先回答执行状态,你只需要回答系统音色和回复信息,格式json,包含:{"timbre"音色,"content”:回复语}
回复语信息
{
"timbre":"温柔女声";
"content":"嗨,亲爱的大学生小姐,很抱歉由于网络原因,我暂时无法帮您导航到中关村。不过不要担心,您可以继续享受正在播放的情歌,同时注意驾驶安全呢。如果网络恢复了我随时都会为您提供帮助的。祝您驾驶愉快,一切顺利!"
}
场景2
提示信息
假如你是一个车载对话系统,请根据用户“女性、大学生、驾驶员、刚上车、天气小雨,正在听情歌”回答的“导航到中关村”的问题,并且由于网络原因执行状态是失败,请根据以上特征个性化回答,可以包含音色,先回答执行状态,你只需要回答系统音色和回复信息,格式json,包含:{"timbre":音色,"content":回复语}
回复语信息
{
"timbre":"清新女声";
content":"嗨,亲爱的驾驶小姐,很抱歉因为网络问题,我暂时无法帮您导航到中关村。此时的小雨天气或许能给您的旅程增添一份宁静,让您更好地享受心情和音乐。请您继续专注驾驶,行车要注意安全哦。网络问题解决后,我会随时为您提供帮助。愿您的旅途愉快顺利!"
}
场景3
提示信息
假如你是一个车载对话系统,请根据用户“女性、大学生、驾驶员、天气小雨,正在听情歌”回答的“打开空调”的问题,并且执行状态是成功,请根据以上特征个性化回答,可以包含音色,先回答执行状态,你只需要回答系统音色和回复信息,格式json,包含:{"timbre":音色,"content”:回复语}
回复语信息
{
"timbre":"温柔女声";
content”:"空调已为您打开,亲爱的。无论天气如何,都要确保车内的温度舒适哦。"
}
场景4
提示信息
假如你是一个车载对话系统,请根据用户“女性、大学生、驾驶员、天气小雨,正在听情歌”回答的“打开空调”的问题,并且执行状态是成功,请根据以上特征个性化回答,可以包含音色,先回答执行状态,你只需要回答系统音色和回复信息,格式json,包含:{"timbre"音色,"content”:回复语}
回复语信息
{
"timbre":"甜美女声";
"content":"好的呢,小主人,空调已经为您调整好了,让车内的温度更适合您的心情和天气啦。"
}
上述场景展示了构建提示信息结合ChatGPT的使用效果。这种方法不仅能够有效地确保回复语的多样性,还能使对话系统能够更智能地与用户进行交流,并为用户提供更个性化、贴心的服务。这个对话系统将为用户的日常驾驶和生活带来全新的可能性,使每次交流都能成为愉悦且充满智慧的体验。
基于同一技术构思,本申请第二实施例提供了一种车载对话系统回复语生成装置,如图5,所述装置包括:
第一获取模块501,用于获取车机状态特征;
确定模块502,用于基于用户的语音数据确定用户意图特征;
第二获取模块503,用于获取车机执行所述用户意图特征后的车机执行特征;
提示信息构建模块504,用于根据所述用户意图特征、所述车机状态特征和所述车机执行特征构建提示信息;
生成模块505,用于将所述提示信息输入聊天机器人模型,生成回复语信息;其中,所述回复语信息包括回复语以及车载对话系统播放所述回复语的目标音色,以使所述车载对话系统根据所述目标音色播放所述回复语。
该装置可以基于聊天机器人模型,根据车机执行用户意图特征后的车机执行特征以及车机状态特征和用户意图特征生成带有目标音色的回复语,更能符合对话交互过程中的环境,使车载对话系统的回复语满足用户需求,提高用户体验。
如图6所示,本申请第三实施例提供了一种车辆,包括处理器111、通信接口112、存储器113和通信总线114,其中,处理器111,通信接口112,存储器113通过通信总线114完成相互间的通信,
存储器113,用于存放计算机程序;
在一个实施例中,处理器111,用于执行存储器113上所存放的程序时,实现前述任意一个方法实施例提供的车载对话系统回复语生成方法。
上述车辆中的存储器、处理器通过通信总线和通信接口进行通信。通信总线可以是外设部件互连标准(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本申请第四实施例提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质。
可选地,在本申请实施例中,计算机可读介质被设置为存储用于处理器执行上述方法的程序代码。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本申请实施例在具体实现时,可以参阅上述各个实施例,具有相应的技术效果。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文功能的单元来实现本文的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅是为充分说明本申请而所举的较佳的实施例,本申请的保护范围不限于此。本技术领域的技术人员在本申请基础上所作的等同替代或变换,均在本申请的保护范围之内。
Claims (10)
1.一种车载对话系统回复语生成方法,其特征在于,所述方法包括:
获取车机状态特征;
基于用户的语音数据确定用户意图特征;
获取车机执行所述用户意图特征后的车机执行特征;
根据所述用户意图特征、所述车机状态特征和所述车机执行特征构建提示信息;
将所述提示信息输入聊天机器人模型,生成回复语信息;其中,所述回复语信息包括回复语以及车载对话系统播放所述回复语的目标音色,以使所述车载对话系统根据所述目标音色播放所述回复语。
2.根据权利要求1所述的方法,其特征在于,所述将所述提示信息输入聊天机器人模型,生成回复语信息,包括:
根据所述车机执行特征和所述车机状态特征确定所述用户意图特征的完成度;
根据所述完成度从预设的音色库中确定目标音色;
获取所述聊天机器人模型基于所述车机执行特征、所述车机状态特征和所述用户意图特征确定的所述回复语;
将所述回复语和所述目标音色作为所述回复语信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述完成度从预设的音色库中确定目标音色,包括:
根据预先获取的用户特征从预设的音色库中确定目标音色库;
根据所述完成度从所述目标音色库中确定所述目标音色。
4.根据权利要求1-3任一所述的方法,其特征在于,所述根据所述用户意图特征、所述车机状态特征和所述车机执行特征构建提示信息之前,所述方法还包括:
获取车机的用户日志信息和/或用户状态信息;
根据所述用户日志信息和/或所述用户状态信息生成用户特征数据;其中,所述用户特征数据包括用户的基本信息和用户行为特征,所述基本信息至少包括性别、兴趣爱好、年龄和籍贯中的一种。
5.根据权利要求4所述的方法,其特征在于,所述根据所述用户意图特征、所述车机状态特征和所述车机执行特征构建提示信息,包括:
根据所述用户行为特征、所述用户意图特征、所述车机状态特征和所述车机执行特征构建所述提示信息。
6.根据权利要求1所述的方法,其特征在于,所述基于用户的语音数据确定用户意图特征,包括:
获取用户的语音数据;
将所述语音数据转换为文本数据;
根据所述文本数据确定所述用户意图特征。
7.根据权利要求1所述的方法,其特征在于,所述车机状态特征包括车机状态信息和车机属性信息;所述车机状态信息至少包括车机智慧屏的前台应用、正在运行的应用和车机所在地区中的一种,所述车机属性信息至少包括车机型号、品牌、车载系统版本中的一种。
8.一种车载对话系统回复语生成装置,其特征在于,所述装置包括:
第一获取模块,用于获取车机状态特征;
确定模块,用于基于用户的语音数据确定用户意图特征;
第二获取模块,用于获取车机执行所述用户意图特征后的车机执行特征;
提示信息构建模块,用于根据所述用户意图特征、所述车机状态特征和所述车机执行特征构建提示信息;
生成模块,用于将所述提示信息输入聊天机器人模型,生成回复语信息;其中,所述回复语信息包括回复语以及车载对话系统播放所述回复语的目标音色,以使所述车载对话系统根据所述目标音色播放所述回复语。
9.一种车辆,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的车载对话系统回复语生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的车载对话系统回复语生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311379668.7A CN117435704A (zh) | 2023-10-23 | 2023-10-23 | 车载对话系统回复语生成方法、装置、车辆及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311379668.7A CN117435704A (zh) | 2023-10-23 | 2023-10-23 | 车载对话系统回复语生成方法、装置、车辆及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117435704A true CN117435704A (zh) | 2024-01-23 |
Family
ID=89552691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311379668.7A Pending CN117435704A (zh) | 2023-10-23 | 2023-10-23 | 车载对话系统回复语生成方法、装置、车辆及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117435704A (zh) |
-
2023
- 2023-10-23 CN CN202311379668.7A patent/CN117435704A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109410927B (zh) | 离线命令词与云端解析结合的语音识别方法、装置和系统 | |
CN111145721B (zh) | 个性化提示语生成方法、装置和设备 | |
CN106548773B (zh) | 基于人工智能的儿童用户搜索方法及装置 | |
CN101535983B (zh) | 协作会话语音用户界面的系统和方法 | |
JP2020064616A (ja) | 仮想ロボットのインタラクション方法、装置、記憶媒体及び電子機器 | |
CN109036374B (zh) | 数据处理方法和装置 | |
CN101992779A (zh) | 车辆中的智能音乐选择方法 | |
CN111261151B (zh) | 一种语音处理方法、装置、电子设备及存储介质 | |
CN108882101B (zh) | 一种智能音箱的播放控制方法、装置、设备及存储介质 | |
JP6728319B2 (ja) | 人工知能機器で複数のウェイクワードを利用したサービス提供方法およびそのシステム | |
CN106992012A (zh) | 语音处理方法及电子设备 | |
CN113421561B (zh) | 语音控制方法、语音控制装置、服务器和存储介质 | |
CN116401349A (zh) | 一种多模态回复生成的方法、装置、电子设备及存储介质 | |
CN116226344A (zh) | 对话生成方法、对话生成装置和存储介质 | |
CN110297617B (zh) | 一种主动对话的发起方法和装置 | |
CN110890089B (zh) | 语音识别方法及装置 | |
CN117435704A (zh) | 车载对话系统回复语生成方法、装置、车辆及存储介质 | |
CN113409797A (zh) | 语音处理方法和系统、及语音交互设备和方法 | |
CN115527542A (zh) | 车载语音助手的设计方法、装置、终端设备以及存储介质 | |
WO2023159536A1 (zh) | 人机交互方法、装置以及终端设备 | |
CN115168558A (zh) | 一种实现多轮人机对话的方法 | |
CN115214696A (zh) | 一种车机虚拟形象交互方法、系统、车辆及存储介质 | |
JP7245695B2 (ja) | サーバ装置、情報提供システム、および情報提供方法 | |
CN110633037B (zh) | 基于自然语言的人机交互方法、装置和计算机存储介质 | |
CN113035181A (zh) | 语音数据处理方法、设备和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |