CN109817208A

CN109817208A - 一种适合各地方言的驾驶员语音智能交互设备及方法

Info

Publication number: CN109817208A
Application number: CN201910037439.4A
Authority: CN
Inventors: 于钊; 林迅
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2019-01-15
Filing date: 2019-01-15
Publication date: 2019-05-28

Abstract

本发明公开了一种适合各地方言的驾驶员语音智能交互设备，涉及人工智能领域，包括语音接收器、语音记忆翻译器、语音交互控制器、任务执行模块和显示模块，所述任务执行模块包括命令执行控制器、任务执行派送器和至少一个任务处理器。还提供了一种适合各地方言的驾驶员语音智能交互方法，实现了口音和语言的识别功能，只执行设定过的人的命令，即使他人发布同样的命令，本设备也不会执行；还可区分命令和日常说话，如果日常谈话说出命令相同的语音，设备将不会执行。

Description

一种适合各地方言的驾驶员语音智能交互设备及方法

技术领域

本发明涉及人工智能领域，尤其涉及一种适合各地方言的驾驶员语音智能交互设备及方法。

背景技术

城市的道路交通日新月异，路况越来越复杂，人与车之间的交互设计也越来越复杂。如今，随处可用的连接，社会化网络服务的广泛普及和先进的人机交互技术的效用增加，提高了道路上的司机与车交互的效率，使社会信息通过汽车的钢壳没有物理限制。

然而，现有的研究大多集中在汽车内部的人机交互。如谷歌的自动驾驶技术、特斯拉的自动驾驶的司机·助理·智能系统，平视显示器(HUD)等。还有许多相互作用的研究已进行了不少人的驾驶行为，例如比尔盖茨提出的自然用户界面(NUI)，互动式设计方法从认知角度和心理角度都提供了参考依据。

而人与车交互的首要任务始终是在道路上完成驾驶任务。目前缺乏对驾驶员之间通信系统的研究。由于驾驶的安全性要求，人机交互界面需要自然直观的操作，更符合人们的认知和期望。有效地降低了驾驶员的认知负荷，保证了行车安全。相关研究包括语音和物理交互界面的探索。

语音交互是人机交互的一种重要技术，但这种技术的在汽车上的应用受到很大的限制，因为我国地域大，各地的方言都有很大的差别，有的方言与普通话的差别还很大，这种技术在汽车上运用就很难实现，因为其无法适应各地方言，无法记忆语音和语言，不能够识别不同人的口音或多个人的命令。而且现有语言交互技术设备都集成在汽车上，无法随需要更换或移动。

因此，本领域的技术人员致力于开发一种适合各地方言的驾驶员语音智能交互设备及方法，为社会车辆交互设计提供一项技术支持，令口音重的司机也可以实现语音操作，使司机的注意力不离开看路和方向盘，这样就大大提高了驾驶安全。

发明内容

有鉴于现有技术的上述缺陷，本发明所要解决的技术问题是提供一种简易的智能交互设备和方法，能够识别不同方言即口音，并且执行相应命令，打破各地方言的障碍，大大提高任务的完成效率和速度，促进了语音交互系统在汽车上的应用。

为实现上述目的，本发明提供了一种适合各地方言的驾驶员语音智能交互设备，包括语音接收器、语音翻译器、语音交互控制器、任务执行模块和显示模块，所述任务执行模块包括命令执行控制器、任务执行派送器和至少一个任务处理器，其中，

所述语音接收器被配置为将接收到的来自用户的语言命令发送给所述语言翻译器；

所述语音翻译器被配置为将所述语言命令通过文字的形式显示在显示模块上，并将所述语言命令转换为数字信号，将所述数字信号通过所述语音交互控制器发送给所述命令执行控制器；

所述命令执行控制器被配置为对所述数字信号进行任务分解，获得任务分解表，并根据所述任务分解表通过任务执行派送器将任务派送给所述至少一个任务处理器；

所述任务处理器完成所述任务后，将任务结果以数字信号的形式通过所述语音交互控制器反馈给所述语音翻译器，所述语音翻译器将表示任务结果的数字信号转换成文字，输出在所述显示模块上。

进一步地，所述显示模块还包括语音模块，所述语音翻译器还可将所述任务结果的数字信号转换成语音信号，由所述语音模块输出。

进一步地，所述语音模块与汽车的车载音响通过蓝牙连接，所述语音信号由所述车载音响输出。

进一步地，所述语音翻译器还包括记忆模块，并被配置为记录和识别用户的语音语调。

进一步地，还包括网络收发模块，用于将所述用户的语音语调的记录上传至云端服务器中存储和识别。

进一步地，所述显示模块为触摸屏。

进一步地，所述语音翻译器将所述数字信号发送给所述语音交互控制器后，所述语音交互控制器将所述数字信号发送给数字转换器，所述数字转换器被配置为将所述数字信号转换为机器语音命令，并且通过所述语音交互控制器将所述机器语音命令发送给所述命令执行控制器；和将来自于所述语音交互控制器的表示任务结果的机器语音转换为所述表示任务结果的数字信号并发回给所述语音交互控制器。

进一步地，还包括结果反馈器，并被配置为收集来自所述至少一个任务处理器的所述表示任务结果的机器语音，再将所述表示任务结果的机器语音发送给所述数字转换器。

本发明还提供了一种适合各地方言的驾驶员语音智能交互方法，包括以下步骤，

步骤S210、接收来自用户的语音命令；

步骤S220、将所述语音命令翻译成表示命令的数字信号；

步骤S230、将所述表示命令的数字信号转换为机器语音命令；

步骤S240、将所述机器语音命令进行任务分解，获得任务分解表；

步骤S250、根据所述任务分解表派送任务，所述任务完成后，获得表示反馈结果的机器语音；

步骤S260、将所述表示反馈结果的机器语音转换为表示反馈结果的数字信号；

步骤S270、将所述表示反馈结果的数字信号转换为文字和语音信号由显示器输出反馈结果。

进一步地，所述步骤S210中进一步包括将所述表示命令的数字信号与预存储的至少一个任务数字信号比对，若所述表示命令的数字信号与所述预存储的至少一个任务数字信号之一相对应，则执行相应任务；若所述表示命令的数字信号与所述预存储的至少一个任务数字信号不对应，则提示所述用户将所述表示命令的数字信号与所述预存储的至少一个任务数字信号之一关联。

与现有技术相比，本发明具有以下技术效果：

1、语音和语言有记忆功能，能够识别并记忆不同人的口音，只执行设定过的人的命令，即使他人发布同样的命令，本设备也不会执行；

2、将汽车的有关功能设定成每一个命令，只需执行预先设定的命令即可，因此设备简单，成本很低；

3、设备独立，可以安装在已有的汽车上，无需对汽车改装；

4、本设备能够储存和识别多人的语音和语言，因此即使驾驶员更换，仍然可以对汽车进行语言交互，发布命令；

5、储存的语音和语言可以更新，如果驾驶员更换，可以取消原来驾驶员的设置，更换新司机的设置；

6、区分命令和日常说话，如果日常谈话说出命令相同的语音，设备将不会执行；

7、命令执行反馈功能；

8、语言和文字双重显示，更直观，防止语言误差；

以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明，以充分地了解本发明的目的、特征和效果。

附图说明

图1是本发明的一个较佳实施例的结构示意图。

其中，1-司机；2-语音接收器；3-语音记忆翻译器；4-语音交互控制器；5-命令执行控制器；6-任务执行派送器；7-结果反馈器；8-数字转换器；9-显示器；C1-任务处理器1；C2-任务处理器2；C3-任务处理器3；C_n-任务处理器n。

具体实施方式

以下参考说明书附图介绍本发明的多个优选实施例，使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现，本发明的保护范围并非仅限于文中提到的实施例。

在附图中，结构相同的部件以相同数字标号表示，各处结构或功能相似的组件以相似数字标号表示。附图所示的每一组件的尺寸和厚度是任意示出的，本发明并没有限定每个组件的尺寸和厚度。

如图1所示，语音接收器2把接收到的从司机1发出的语言命令发送给语音记忆翻译器3；

语音记忆翻译器3对首次使用的用户的语言命令进行记忆和确认，判断用户的语言命令是否与可执行的任务相匹配，若匹配则执行相应任务；若不存在匹配的可执行任务，则需要使用的用户进行语音交互设定，将语言命令与可执行任务相关联。每台语音记忆翻译器3可以储存和识别多个人的设定。

语音记忆翻译器3根据记忆把用户的语言命令翻译成表示命令的数字信号，然后发送给语音交互控制器4；

语音交互控制器4把表示命令的数字信号发送到数字转换器8，数字转换器8把表示命令的数字信号转换成机器可以接受的机器语音命令；数字转换器8再把机器语音命令发送给语音交互控制器4；

语音交互控制器4把机器语音命令发送给命令执行控制器5，命令执行控制器5对机器语音命令进行任务分解，获得任务分解表，并将任务分解表发送给任务执行派送器6；

任务执行派送器6根据所接收到的任务分解表将任务派送给汽车上相应的至少一个任务处理器C₁-C_n，由至少一个任务处理器完成任务处理并获得以表示反馈结果的机器语音，并将表示反馈结果的机器语音发送给结果反馈器7；

结果反馈器7将表示反馈结果的机器语音发送给命令执行控制器5，命令执行控制器5再发送给语音交互控制器4，语音交互控制器4再发送给数字转换器8，数字转换器8将表示反馈结果的机器语音转换为表示反馈结果的数字信号，并将表示反馈结果的数字信号发送给语音记忆翻译器3；

语音记忆翻译器3将表示反馈结果的数字信号翻译成文字和语音信号，然后发送给显示器9，由显示器9进行显示反馈结果。

设定语音交互的方法：语音记忆翻译器3对收到的语言命令首先进行确认，把接收到的语言命令进行普通话翻译，再把翻译成普通话的语言命令回放并同时以文字的形式显示在显示器9上，并提示确认，如果表达的是用户的意思，用户说一声“确认”即可。如果与用户表达意思不一样，显示器会提示用户“程序中无此命令，请在显示器修改”，之后用户可以在显示器9上修改文字，再按“确认”键确认，如此语音记忆翻译器3便记忆了这个用户的语音和语言。即使用户说的方言与普通话差距很大，只要这个用户再用同样的话发出命令，语音记忆翻译器3就可以把这句话翻译成之前设定的命令。

实施例1

司机A的地方方言把“打开收音机”说成“嘎开狗恩滴”，司机A若想让语音交互设备执行“打开收音机”的命令，只要在显示器上把“嘎开狗恩滴”改成“打开收音机”并确认，语音记忆翻译器3便会记忆司机A的语音和方言，以后司机A只要说“嘎开狗恩滴”，语音记忆翻译器便会将其翻译成“打开收音机”的命令。以此类推，还可根据语音记忆翻译器的提示对“接听电话”、“打开空调”、“打开暖风”…等命令进行设定。

实施例2

为了区别日常说话和发布命令，用户可以在“打开收音机”前加一个“请”(或根据个人爱好也可以设定别的命令词)，之后同实施例1，司机A只要说“请嘎开狗恩滴”，语音记忆翻译器3便会将其翻译成“打开收音机”的命令，并且不会和日常说话混淆。

以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

Claims

1.一种适合各地方言的驾驶员语音智能交互设备，其特征在于，包括语音接收器、语音翻译器、语音交互控制器、任务执行模块和显示模块，所述任务执行模块包括命令执行控制器、任务执行派送器和至少一个任务处理器，其中，

2.如权利要求1所述的一种适合各地方言的驾驶员语音智能交互设备，其特征在于，所述显示模块还包括语音模块，所述语音翻译器还可将所述任务结果的数字信号转换成语音信号，由所述语音模块输出。

3.如权利要求2所述的一种适合各地方言的驾驶员语音智能交互设备，其特征在于，所述语音模块与汽车的车载音响通过蓝牙连接，所述语音信号由所述车载音响输出。

4.如权利要求1所述的一种适合各地方言的驾驶员语音智能交互设备，其特征在于，所述语音翻译器还包括记忆模块，并被配置为记录和识别用户的语音语调。

5.如权利要求1所述的一种适合各地方言的驾驶员语音智能交互设备，其特征在于，还包括网络收发模块，用于将所述用户的语音语调的记录上传至云端服务器中存储和识别。

6.如权利要求1所述的一种适合各地方言的驾驶员语音智能交互设备，其特征在于，所述显示模块为触摸屏。

7.如权利要求1所述的一种适合各地方言的驾驶员语音智能交互设备，其特征在于，所述语音翻译器将所述数字信号发送给所述语音交互控制器后，所述语音交互控制器将所述数字信号发送给数字转换器，所述数字转换器被配置为将所述数字信号转换为机器语音命令，并且通过所述语音交互控制器将所述机器语音命令发送给所述命令执行控制器；和将来自于所述语音交互控制器的表示任务结果的机器语音转换为所述表示任务结果的数字信号并发回给所述语音交互控制器。

8.如权利要求7所述的一种适合各地方言的驾驶员语音智能交互设备，其特征在于，还包括结果反馈器，并被配置为收集来自所述至少一个任务处理器的所述表示任务结果的机器语音，再将所述表示任务结果的机器语音发送给所述数字转换器。

9.一种适合各地方言的驾驶员语音智能交互方法，其特征在于，包括以下步骤，

步骤S210、接收来自用户的语音命令；

步骤S220、将所述语音命令翻译成表示命令的数字信号；

步骤S230、将所述表示命令的数字信号转换为机器语音命令；

10.如权利要求9所述的一种适合各地方言的驾驶员语音智能交互方法，其特征在于，所述步骤S210中进一步包括将所述表示命令的数字信号与预存储的至少一个任务数字信号比对，若所述表示命令的数字信号与所述预存储的至少一个任务数字信号之一相对应，则执行相应任务；若所述表示命令的数字信号与所述预存储的至少一个任务数字信号不对应，则提示所述用户将所述表示命令的数字信号与所述预存储的至少一个任务数字信号之一关联。