CN109817208A - 一种适合各地方言的驾驶员语音智能交互设备及方法 - Google Patents

一种适合各地方言的驾驶员语音智能交互设备及方法 Download PDF

Info

Publication number
CN109817208A
CN109817208A CN201910037439.4A CN201910037439A CN109817208A CN 109817208 A CN109817208 A CN 109817208A CN 201910037439 A CN201910037439 A CN 201910037439A CN 109817208 A CN109817208 A CN 109817208A
Authority
CN
China
Prior art keywords
task
speech
order
digital signal
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910037439.4A
Other languages
English (en)
Inventor
于钊
林迅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201910037439.4A priority Critical patent/CN109817208A/zh
Publication of CN109817208A publication Critical patent/CN109817208A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Navigation (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种适合各地方言的驾驶员语音智能交互设备,涉及人工智能领域,包括语音接收器、语音记忆翻译器、语音交互控制器、任务执行模块和显示模块,所述任务执行模块包括命令执行控制器、任务执行派送器和至少一个任务处理器。还提供了一种适合各地方言的驾驶员语音智能交互方法,实现了口音和语言的识别功能,只执行设定过的人的命令,即使他人发布同样的命令,本设备也不会执行;还可区分命令和日常说话,如果日常谈话说出命令相同的语音,设备将不会执行。

Description

一种适合各地方言的驾驶员语音智能交互设备及方法
技术领域
本发明涉及人工智能领域,尤其涉及一种适合各地方言的驾驶员语音智能交互设备及方法。
背景技术
城市的道路交通日新月异,路况越来越复杂,人与车之间的交互设计也越来越复杂。如今,随处可用的连接,社会化网络服务的广泛普及和先进的人机交互技术的效用增加,提高了道路上的司机与车交互的效率,使社会信息通过汽车的钢壳没有物理限制。
然而,现有的研究大多集中在汽车内部的人机交互。如谷歌的自动驾驶技术、特斯拉的自动驾驶的司机·助理·智能系统,平视显示器(HUD)等。还有许多相互作用的研究已进行了不少人的驾驶行为,例如比尔盖茨提出的自然用户界面(NUI),互动式设计方法从认知角度和心理角度都提供了参考依据。
而人与车交互的首要任务始终是在道路上完成驾驶任务。目前缺乏对驾驶员之间通信系统的研究。由于驾驶的安全性要求,人机交互界面需要自然直观的操作,更符合人们的认知和期望。有效地降低了驾驶员的认知负荷,保证了行车安全。相关研究包括语音和物理交互界面的探索。
语音交互是人机交互的一种重要技术,但这种技术的在汽车上的应用受到很大的限制,因为我国地域大,各地的方言都有很大的差别,有的方言与普通话的差别还很大,这种技术在汽车上运用就很难实现,因为其无法适应各地方言,无法记忆语音和语言,不能够识别不同人的口音或多个人的命令。而且现有语言交互技术设备都集成在汽车上,无法随需要更换或移动。
因此,本领域的技术人员致力于开发一种适合各地方言的驾驶员语音智能交互设备及方法,为社会车辆交互设计提供一项技术支持,令口音重的司机也可以实现语音操作,使司机的注意力不离开看路和方向盘,这样就大大提高了驾驶安全。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种简易的智能交互设备和方法,能够识别不同方言即口音,并且执行相应命令,打破各地方言的障碍,大大提高任务的完成效率和速度,促进了语音交互系统在汽车上的应用。
为实现上述目的,本发明提供了一种适合各地方言的驾驶员语音智能交互设备,包括语音接收器、语音翻译器、语音交互控制器、任务执行模块和显示模块,所述任务执行模块包括命令执行控制器、任务执行派送器和至少一个任务处理器,其中,
所述语音接收器被配置为将接收到的来自用户的语言命令发送给所述语言翻译器;
所述语音翻译器被配置为将所述语言命令通过文字的形式显示在显示模块上,并将所述语言命令转换为数字信号,将所述数字信号通过所述语音交互控制器发送给所述命令执行控制器;
所述命令执行控制器被配置为对所述数字信号进行任务分解,获得任务分解表,并根据所述任务分解表通过任务执行派送器将任务派送给所述至少一个任务处理器;
所述任务处理器完成所述任务后,将任务结果以数字信号的形式通过所述语音交互控制器反馈给所述语音翻译器,所述语音翻译器将表示任务结果的数字信号转换成文字,输出在所述显示模块上。
进一步地,所述显示模块还包括语音模块,所述语音翻译器还可将所述任务结果的数字信号转换成语音信号,由所述语音模块输出。
进一步地,所述语音模块与汽车的车载音响通过蓝牙连接,所述语音信号由所述车载音响输出。
进一步地,所述语音翻译器还包括记忆模块,并被配置为记录和识别用户的语音语调。
进一步地,还包括网络收发模块,用于将所述用户的语音语调的记录上传至云端服务器中存储和识别。
进一步地,所述显示模块为触摸屏。
进一步地,所述语音翻译器将所述数字信号发送给所述语音交互控制器后,所述语音交互控制器将所述数字信号发送给数字转换器,所述数字转换器被配置为将所述数字信号转换为机器语音命令,并且通过所述语音交互控制器将所述机器语音命令发送给所述命令执行控制器;和将来自于所述语音交互控制器的表示任务结果的机器语音转换为所述表示任务结果的数字信号并发回给所述语音交互控制器。
进一步地,还包括结果反馈器,并被配置为收集来自所述至少一个任务处理器的所述表示任务结果的机器语音,再将所述表示任务结果的机器语音发送给所述数字转换器。
本发明还提供了一种适合各地方言的驾驶员语音智能交互方法,包括以下步骤,
步骤S210、接收来自用户的语音命令;
步骤S220、将所述语音命令翻译成表示命令的数字信号;
步骤S230、将所述表示命令的数字信号转换为机器语音命令;
步骤S240、将所述机器语音命令进行任务分解,获得任务分解表;
步骤S250、根据所述任务分解表派送任务,所述任务完成后,获得表示反馈结果的机器语音;
步骤S260、将所述表示反馈结果的机器语音转换为表示反馈结果的数字信号;
步骤S270、将所述表示反馈结果的数字信号转换为文字和语音信号由显示器输出反馈结果。
进一步地,所述步骤S210中进一步包括将所述表示命令的数字信号与预存储的至少一个任务数字信号比对,若所述表示命令的数字信号与所述预存储的至少一个任务数字信号之一相对应,则执行相应任务;若所述表示命令的数字信号与所述预存储的至少一个任务数字信号不对应,则提示所述用户将所述表示命令的数字信号与所述预存储的至少一个任务数字信号之一关联。
与现有技术相比,本发明具有以下技术效果:
1、语音和语言有记忆功能,能够识别并记忆不同人的口音,只执行设定过的人的命令,即使他人发布同样的命令,本设备也不会执行;
2、将汽车的有关功能设定成每一个命令,只需执行预先设定的命令即可,因此设备简单,成本很低;
3、设备独立,可以安装在已有的汽车上,无需对汽车改装;
4、本设备能够储存和识别多人的语音和语言,因此即使驾驶员更换,仍然可以对汽车进行语言交互,发布命令;
5、储存的语音和语言可以更新,如果驾驶员更换,可以取消原来驾驶员的设置,更换新司机的设置;
6、区分命令和日常说话,如果日常谈话说出命令相同的语音,设备将不会执行;
7、命令执行反馈功能;
8、语言和文字双重显示,更直观,防止语言误差;
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明的一个较佳实施例的结构示意图。
其中,1-司机;2-语音接收器;3-语音记忆翻译器;4-语音交互控制器;5-命令执行控制器;6-任务执行派送器;7-结果反馈器;8-数字转换器;9-显示器;C1-任务处理器1;C2-任务处理器2;C3-任务处理器3;Cn-任务处理器n。
具体实施方式
以下参考说明书附图介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
在附图中,结构相同的部件以相同数字标号表示,各处结构或功能相似的组件以相似数字标号表示。附图所示的每一组件的尺寸和厚度是任意示出的,本发明并没有限定每个组件的尺寸和厚度。
如图1所示,语音接收器2把接收到的从司机1发出的语言命令发送给语音记忆翻译器3;
语音记忆翻译器3对首次使用的用户的语言命令进行记忆和确认,判断用户的语言命令是否与可执行的任务相匹配,若匹配则执行相应任务;若不存在匹配的可执行任务,则需要使用的用户进行语音交互设定,将语言命令与可执行任务相关联。每台语音记忆翻译器3可以储存和识别多个人的设定。
语音记忆翻译器3根据记忆把用户的语言命令翻译成表示命令的数字信号,然后发送给语音交互控制器4;
语音交互控制器4把表示命令的数字信号发送到数字转换器8,数字转换器8把表示命令的数字信号转换成机器可以接受的机器语音命令;数字转换器8再把机器语音命令发送给语音交互控制器4;
语音交互控制器4把机器语音命令发送给命令执行控制器5,命令执行控制器5对机器语音命令进行任务分解,获得任务分解表,并将任务分解表发送给任务执行派送器6;
任务执行派送器6根据所接收到的任务分解表将任务派送给汽车上相应的至少一个任务处理器C1-Cn,由至少一个任务处理器完成任务处理并获得以表示反馈结果的机器语音,并将表示反馈结果的机器语音发送给结果反馈器7;
结果反馈器7将表示反馈结果的机器语音发送给命令执行控制器5,命令执行控制器5再发送给语音交互控制器4,语音交互控制器4再发送给数字转换器8,数字转换器8将表示反馈结果的机器语音转换为表示反馈结果的数字信号,并将表示反馈结果的数字信号发送给语音记忆翻译器3;
语音记忆翻译器3将表示反馈结果的数字信号翻译成文字和语音信号,然后发送给显示器9,由显示器9进行显示反馈结果。
设定语音交互的方法:语音记忆翻译器3对收到的语言命令首先进行确认,把接收到的语言命令进行普通话翻译,再把翻译成普通话的语言命令回放并同时以文字的形式显示在显示器9上,并提示确认,如果表达的是用户的意思,用户说一声“确认”即可。如果与用户表达意思不一样,显示器会提示用户“程序中无此命令,请在显示器修改”,之后用户可以在显示器9上修改文字,再按“确认”键确认,如此语音记忆翻译器3便记忆了这个用户的语音和语言。即使用户说的方言与普通话差距很大,只要这个用户再用同样的话发出命令,语音记忆翻译器3就可以把这句话翻译成之前设定的命令。
实施例1
司机A的地方方言把“打开收音机”说成“嘎开狗恩滴”,司机A若想让语音交互设备执行“打开收音机”的命令,只要在显示器上把“嘎开狗恩滴”改成“打开收音机”并确认,语音记忆翻译器3便会记忆司机A的语音和方言,以后司机A只要说“嘎开狗恩滴”,语音记忆翻译器便会将其翻译成“打开收音机”的命令。以此类推,还可根据语音记忆翻译器的提示对“接听电话”、“打开空调”、“打开暖风”…等命令进行设定。
实施例2
为了区别日常说话和发布命令,用户可以在“打开收音机”前加一个“请”(或根据个人爱好也可以设定别的命令词),之后同实施例1,司机A只要说“请嘎开狗恩滴”,语音记忆翻译器3便会将其翻译成“打开收音机”的命令,并且不会和日常说话混淆。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种适合各地方言的驾驶员语音智能交互设备,其特征在于,包括语音接收器、语音翻译器、语音交互控制器、任务执行模块和显示模块,所述任务执行模块包括命令执行控制器、任务执行派送器和至少一个任务处理器,其中,
所述语音接收器被配置为将接收到的来自用户的语言命令发送给所述语言翻译器;
所述语音翻译器被配置为将所述语言命令通过文字的形式显示在显示模块上,并将所述语言命令转换为数字信号,将所述数字信号通过所述语音交互控制器发送给所述命令执行控制器;
所述命令执行控制器被配置为对所述数字信号进行任务分解,获得任务分解表,并根据所述任务分解表通过任务执行派送器将任务派送给所述至少一个任务处理器;
所述任务处理器完成所述任务后,将任务结果以数字信号的形式通过所述语音交互控制器反馈给所述语音翻译器,所述语音翻译器将表示任务结果的数字信号转换成文字,输出在所述显示模块上。
2.如权利要求1所述的一种适合各地方言的驾驶员语音智能交互设备,其特征在于,所述显示模块还包括语音模块,所述语音翻译器还可将所述任务结果的数字信号转换成语音信号,由所述语音模块输出。
3.如权利要求2所述的一种适合各地方言的驾驶员语音智能交互设备,其特征在于,所述语音模块与汽车的车载音响通过蓝牙连接,所述语音信号由所述车载音响输出。
4.如权利要求1所述的一种适合各地方言的驾驶员语音智能交互设备,其特征在于,所述语音翻译器还包括记忆模块,并被配置为记录和识别用户的语音语调。
5.如权利要求1所述的一种适合各地方言的驾驶员语音智能交互设备,其特征在于,还包括网络收发模块,用于将所述用户的语音语调的记录上传至云端服务器中存储和识别。
6.如权利要求1所述的一种适合各地方言的驾驶员语音智能交互设备,其特征在于,所述显示模块为触摸屏。
7.如权利要求1所述的一种适合各地方言的驾驶员语音智能交互设备,其特征在于,所述语音翻译器将所述数字信号发送给所述语音交互控制器后,所述语音交互控制器将所述数字信号发送给数字转换器,所述数字转换器被配置为将所述数字信号转换为机器语音命令,并且通过所述语音交互控制器将所述机器语音命令发送给所述命令执行控制器;和将来自于所述语音交互控制器的表示任务结果的机器语音转换为所述表示任务结果的数字信号并发回给所述语音交互控制器。
8.如权利要求7所述的一种适合各地方言的驾驶员语音智能交互设备,其特征在于,还包括结果反馈器,并被配置为收集来自所述至少一个任务处理器的所述表示任务结果的机器语音,再将所述表示任务结果的机器语音发送给所述数字转换器。
9.一种适合各地方言的驾驶员语音智能交互方法,其特征在于,包括以下步骤,
步骤S210、接收来自用户的语音命令;
步骤S220、将所述语音命令翻译成表示命令的数字信号;
步骤S230、将所述表示命令的数字信号转换为机器语音命令;
步骤S240、将所述机器语音命令进行任务分解,获得任务分解表;
步骤S250、根据所述任务分解表派送任务,所述任务完成后,获得表示反馈结果的机器语音;
步骤S260、将所述表示反馈结果的机器语音转换为表示反馈结果的数字信号;
步骤S270、将所述表示反馈结果的数字信号转换为文字和语音信号由显示器输出反馈结果。
10.如权利要求9所述的一种适合各地方言的驾驶员语音智能交互方法,其特征在于,所述步骤S210中进一步包括将所述表示命令的数字信号与预存储的至少一个任务数字信号比对,若所述表示命令的数字信号与所述预存储的至少一个任务数字信号之一相对应,则执行相应任务;若所述表示命令的数字信号与所述预存储的至少一个任务数字信号不对应,则提示所述用户将所述表示命令的数字信号与所述预存储的至少一个任务数字信号之一关联。
CN201910037439.4A 2019-01-15 2019-01-15 一种适合各地方言的驾驶员语音智能交互设备及方法 Pending CN109817208A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910037439.4A CN109817208A (zh) 2019-01-15 2019-01-15 一种适合各地方言的驾驶员语音智能交互设备及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910037439.4A CN109817208A (zh) 2019-01-15 2019-01-15 一种适合各地方言的驾驶员语音智能交互设备及方法

Publications (1)

Publication Number Publication Date
CN109817208A true CN109817208A (zh) 2019-05-28

Family

ID=66604216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910037439.4A Pending CN109817208A (zh) 2019-01-15 2019-01-15 一种适合各地方言的驾驶员语音智能交互设备及方法

Country Status (1)

Country Link
CN (1) CN109817208A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114783437A (zh) * 2022-06-15 2022-07-22 湖南正宇软件技术开发有限公司 一种人机语音交互实现方法、系统及电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101729570A (zh) * 2009-12-15 2010-06-09 中兴通讯股份有限公司 一种媒体服务器多语言统一开发和放音的方法及系统
US20130035936A1 (en) * 2011-08-02 2013-02-07 Nexidia Inc. Language transcription
CN103277974A (zh) * 2013-06-19 2013-09-04 江苏华音信息科技有限公司 汉语语音控制智能电冰箱的装置
CN104200806A (zh) * 2014-09-05 2014-12-10 马金保 一种智能家居联动控制方法和系统
CN104376843A (zh) * 2013-08-18 2015-02-25 上海能感物联网有限公司 汉语语音近距或远程控制汽车驾驶的方法
CN104376844A (zh) * 2013-08-16 2015-02-25 上海能感物联网有限公司 汉语语音控制汽车驾驶的方法
CN104916286A (zh) * 2014-10-13 2015-09-16 江苏华音信息科技有限公司 汉语语音全自动遥控驾驶汽车的控制器装置
WO2016084129A1 (ja) * 2014-11-25 2016-06-02 三菱電機株式会社 情報提供システム
CN106663422A (zh) * 2014-07-24 2017-05-10 哈曼国际工业有限公司 利用单一声学模型和自动口音检测实现的基于文本规则的多口音言语识别
CN106847276A (zh) * 2015-12-30 2017-06-13 昶洧新能源汽车发展有限公司 一种带方言识别的话音控制系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101729570A (zh) * 2009-12-15 2010-06-09 中兴通讯股份有限公司 一种媒体服务器多语言统一开发和放音的方法及系统
US20130035936A1 (en) * 2011-08-02 2013-02-07 Nexidia Inc. Language transcription
CN103277974A (zh) * 2013-06-19 2013-09-04 江苏华音信息科技有限公司 汉语语音控制智能电冰箱的装置
CN104376844A (zh) * 2013-08-16 2015-02-25 上海能感物联网有限公司 汉语语音控制汽车驾驶的方法
CN104376843A (zh) * 2013-08-18 2015-02-25 上海能感物联网有限公司 汉语语音近距或远程控制汽车驾驶的方法
CN106663422A (zh) * 2014-07-24 2017-05-10 哈曼国际工业有限公司 利用单一声学模型和自动口音检测实现的基于文本规则的多口音言语识别
CN104200806A (zh) * 2014-09-05 2014-12-10 马金保 一种智能家居联动控制方法和系统
CN104916286A (zh) * 2014-10-13 2015-09-16 江苏华音信息科技有限公司 汉语语音全自动遥控驾驶汽车的控制器装置
WO2016084129A1 (ja) * 2014-11-25 2016-06-02 三菱電機株式会社 情報提供システム
CN106847276A (zh) * 2015-12-30 2017-06-13 昶洧新能源汽车发展有限公司 一种带方言识别的话音控制系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114783437A (zh) * 2022-06-15 2022-07-22 湖南正宇软件技术开发有限公司 一种人机语音交互实现方法、系统及电子设备

Similar Documents

Publication Publication Date Title
US20210358496A1 (en) A voice assistant system for a vehicle cockpit system
US9558745B2 (en) Service oriented speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same
EP1695177B1 (en) Wirelessly delivered owner s manual
KR102388992B1 (ko) 단일 음향 모델 및 자동 악센트 검출로 텍스트 규칙 기반 멀티-악센트 음성 인식
US20180232203A1 (en) Method for user training of information dialogue system
US8909153B2 (en) Vehicle communications using a mobile device
US7873517B2 (en) Motor vehicle with a speech interface
US20120253823A1 (en) Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing
CN102097096B (zh) 在语音识别后处理过程中使用音调来改进识别精度
CN103124318B (zh) 开始免提会议呼叫的方法
US9368107B2 (en) Permitting automated speech command discovery via manual event to command mapping
CN101145341A (zh) 改善语音辨识的方法与装置以及语音辨识系统
CN107819929A (zh) 优选表情符号的识别和生成
CN103095325A (zh) 具有远程服务接口的移动语音平台架构
CN103151037A (zh) 校正难以理解的合成语音
CN103106061A (zh) 语音输入方法和装置
CN111916088A (zh) 一种语音语料的生成方法、设备及计算机可读存储介质
KR20220143683A (ko) 전자 개인 비서 조정
CN109817208A (zh) 一种适合各地方言的驾驶员语音智能交互设备及方法
WO2020023298A1 (en) Device, system and method for causing an output device to provide information for voice command functionality
JP4000828B2 (ja) 情報システム、電子機器、プログラム
CA2839285A1 (en) Hybrid dialog speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same
US11646031B2 (en) Method, device and computer-readable storage medium having instructions for processing a speech input, transportation vehicle, and user terminal with speech processing
CA2737850C (en) Wirelessly delivered owner's manual
US20220301560A1 (en) Speech recognition system and method of controlling the same

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190528

RJ01 Rejection of invention patent application after publication