CN113220265A - 汽车及语音的应答文本的显示方法 - Google Patents

汽车及语音的应答文本的显示方法 Download PDF

Info

Publication number
CN113220265A
CN113220265A CN202110594590.5A CN202110594590A CN113220265A CN 113220265 A CN113220265 A CN 113220265A CN 202110594590 A CN202110594590 A CN 202110594590A CN 113220265 A CN113220265 A CN 113220265A
Authority
CN
China
Prior art keywords
voice
processor
display screen
response text
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110594590.5A
Other languages
English (en)
Inventor
杨鹏
王依林
刘延峰
王天功
陈鹏
刘宏举
王树利
吕文文
姚巧丽
王本强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Group Holding Co Ltd
Original Assignee
Hisense Group Holding Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Group Holding Co Ltd filed Critical Hisense Group Holding Co Ltd
Priority to CN202110594590.5A priority Critical patent/CN113220265A/zh
Publication of CN113220265A publication Critical patent/CN113220265A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R1/00Optical viewing arrangements; Real-time viewing arrangements for drivers or passengers using optical image capturing systems, e.g. cameras or video systems specially adapted for use in or on vehicles
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units

Abstract

本申请提供了一种汽车及语音的应答文本的显示方法,属于汽车领域。其中,该汽车包括通信连接的处理器和目标显示屏。该处理器能够将通过语音采集组件采集到的第一语音对应的应答文本发送至目标显示屏,以供目标显示屏进行显示。因该目标显示屏是区别于中控组件包括的显示屏的仪表盘和/或抬头显示器等显示屏,故相对于中控组件仅能将应答文本通过自身的显示屏进行显示的相关技术而言,本申请提供的汽车显示语音的应答文本的灵活性较高。

Description

汽车及语音的应答文本的显示方法
技术领域
本申请涉及汽车领域,特别涉及一种汽车及语音的应答文本的显示方法。
背景技术
汽车一般包括中控组件,且目前该中控组件已普遍配备语音识别功能。
相关技术中,汽车的中控组件包括处理器和显示屏。其中,处理器在采集到用户发出的语音后,可以生成针对该语音的应答文本(即,应答结果),并可以控制显示屏将该应答文本显示出来。
但是,相关技术的汽车中,针对语音的应答文本的显示灵活性较低。
发明内容
本申请提供了一种汽车及语音的应答文本的显示方法,可以解决相关技术中针对语音的应答文本的显示灵活性较低的问题。所述技术方案如下:
一方面,提供了一种汽车,所述汽车包括:处理器、语音采集组件和目标显示屏,所述处理器分别与所述语音采集组件和所述目标显示屏通信连接;
所述处理器,用于在启动语音交互功能后,通过所述语音采集组件采集第一语音,确定所述第一语音对应的应答文本,并将所述应答文本发送至所述目标显示屏;
所述目标显示屏,用于显示所述应答文本;
其中,所述目标显示屏包括:所述汽车的仪表盘,和/或,所述汽车的抬头显示器HUD。
可选的,所述处理器与所述目标显示屏通过下述方式中的任意一种方式通信连接:
控制器局域网络总线、车载局域网络总线、串行外设接口、串行通信总线、共享内存的方式和套接字的方式。
可选的,所述目标显示屏,还用于在所述应答文本的显示时长达到目标时长后取消显示所述应答文本;
其中,所述目标时长小于时长阈值。
可选的,所述目标显示屏,还用于显示汽车的运行参数,所述应答文本的显示区域与所述运行参数的显示区域不重叠;
其中,所述运行参数包括:车速、转速、水温、电量和油量中的至少一种。
可选的,所述汽车还包括:语音播放组件,所述处理器与所述语音播放组件通信连接;
所述处理器,还用于将所述应答文本转换为第二语音,并将所述第二语音发送至所述语音播放组件;
所述语音播放组件,用于播放所述第二语音。
可选的,所述汽车还包括:多个执行器,所述处理器与所述多个执行器通信连接;
所述处理器,还用于基于所述第一语音的语义,向所述多个执行器中的目标执行器发送操作指令;
所述目标执行器,用于执行所述操作指令指示的操作,并将操作结果发送至所述处理器;
所述处理器,还用于基于所述操作结果确定所述应答文本。
可选的,所述汽车还包括:座椅加热模块,所述目标执行器为所述座椅加热模块。
可选的,所述处理器,还用于基于所述第一语音的语义执行与所述语义对应的操作指令,并基于执行所述操作指令后的操作结果确定应答文本。
另一方面,提供了一种语音的应答文本的显示方法,应用于汽车,所述汽车包括:处理器、语音采集组件和目标显示屏,所述处理器分别与所述语音采集组件和所述目标显示屏通信连接;所述方法包括:
在启动语音交互功能后,通过所述语音采集组件采集第一语音;
确定所述第一语音对应的应答文本;
将所述应答文本发送至所述目标显示屏,以供所述目标显示屏显示所述应答文本;
其中,所述目标显示屏包括:所述汽车的仪表盘,和/或,所述汽车的抬头显示器HUD。
可选的,所述汽车还包括:语音播放组件,所述处理器与所述语音播放组件通信连接;所述方法还包括:
将所述应答文本转换为第二语音;
将所述第二语音发送至所述语音播放组件,以供所述语音播放组件播放所述第二语音。
又一方面,提供了一种中控组件,所述中控组件包括:存储器,处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述方面所述的语音的应答文本的显示方法。
又一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现如上述方面所述的语音的应答文本的显示方法。
再一方面,提供了一种包含指令的计算机程序产品,当所述计算机程序产品在所述计算机上运行时,使得所述计算机执行上述方面所述的语音的应答文本的显示方法。
本申请实施例提供的技术方案带来的有益效果至少可以包括:
本申请实施例提供了一种汽车及语音的应答文本的显示方法。其中,该汽车包括通信连接的处理器和目标显示屏。该处理器能够将通过语音采集组件采集到的第一语音对应的应答文本发送至目标显示屏,以供目标显示屏进行显示。因该目标显示屏是区别于中控组件包括的显示屏的仪表盘和/或抬头显示器等显示屏,故相对于中控组件仅能将应答文本通过自身的显示屏进行显示的相关技术而言,本申请实施例提供的汽车显示语音的应答文本的灵活性较高。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种汽车的结构示意图;
图2是本申请实施例提供的一种汽车及其局部结构的放大图;
图3是本申请实施例提供的一种汽车目标显示屏所显示内容的示意图;
图4是本申请实施例提供的另一种汽车目标显示屏所显示内容的示意图;
图5是本申请实施例提供的又一种汽车目标显示屏所显示内容的示意图;
图6是本申请实施例提供的一种汽车目标显示屏、中控组件的显示屏及其显示内容的示意图;
图7是本申请实施例提供的另一种汽车的结构示意图;
图8是本申请实施例提供的再一种汽车目标显示屏所显示内容的示意图;
图9是本申请实施例提供的再一种汽车目标显示屏所显示内容的示意图;
图10是本申请实施例提供的又一种汽车的结构示意图;
图11是本申请实施例提供的再一种汽车目标显示屏所显示内容的示意图;
图12是本申请实施例提供的一种语音的应答文本的显示方法的流程图;
图13是本申请实施例提供的另一种语音的应答文本的显示方法的流程图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
图1是本申请实施例提供的一种汽车的结构示意图。如图1所示,该汽车00包括:处理器01、语音采集组件02和目标显示屏03。该处理器01分别与语音采集组件02和目标显示屏03通信连接。处理器01与目标显示屏03通信连接可以是指:处理器01和目标显示屏03通过有线或无线的方式建立连接。在建立连接的前提下,处理器01能够向目标显示屏03传输信息。处理器01与其他结构的通信连接同理,在此不再赘述。
其中,该处理器01用于在启动语音交互功能后,通过语音采集组件02采集第一语音,确定该第一语音对应的应答文本,并将该应答文本发送至目标显示屏03。该目标显示屏03用于显示该应答文本。即,该处理器01可以控制目标显示屏03对应答文本进行显示。
图2是本申请实施例提供的一种汽车及其内部结构的局部放大图。参考图2块看出,该汽车00中可以包括仪表盘、抬头显示器(head up display,HUD)和中控组件。本申请实施例记载的目标显示屏03可以为仪表盘和/或HUD。参考图2可以看出,仪表盘、HUD和中控组件的显示屏为设置于不同位置处的三个显示屏。如此,相对于仅能将应答文本显示于中控组件的显示屏而言,本申请实施例提供的应答文本的显示方式较为灵活。
此外,参考图2还可以看出,仪表盘和HUD相对于中控组件的显示屏而言,靠近汽车的驾驶位。因坐落于驾驶位的驾驶员在驾驶汽车的过程中,大部分时间需要注视前方路面,驾驶员的视线移动至如仪表盘和HUD等目标显示屏03,相对于移动至位于其右侧的中控组件的显示屏而言,相对安全一些。故,通过设置目标显示屏为仪表盘和/或HUD,可以便于驾驶员在驾驶汽车的过程中观看应答文本,从而可以提高驾驶安全性。
综上所述,本申请实施例提供了一种汽车,该汽车包括通信连接的处理器和目标显示屏。该处理器能够将通过语音采集组件采集到的第一语音对应的应答文本发送至目标显示屏,以供目标显示屏进行显示。因该目标显示屏是区别于中控组件包括的显示屏的仪表盘和/或抬头显示器等显示屏,故相对于中控组件仅能将应答文本通过自身的显示屏进行显示的相关技术而言,本申请实施例提供的汽车显示语音的应答文本的灵活性较高。
可选的,在本申请实施例中,语音采集组件02可以为麦克风。处理器01在启动语音交互功能后,可以控制麦克风采集第一语音。麦克风在采集到第一语音后,可以将其传输至处理器01。
可选的,语音采集组件02可以包括语音处理电路,该语音处理电路可以对语音采集组件02采集到的第一语音进行滤波降噪处理。语音采集组件02传输至处理器01的第一语音可以为滤波降噪处理后的语音,如此,可以提高处理器01后续确定第一语音对应的应答文本的精度。
可选的,在本申请实施例中,处理器01可以响应于语音交互指令,启动语音交互功能。语音交互功能是基于语音输入的新一代交互模式,用户向终端(此处的终端可以是指处理器01)说话即可得到想要的反馈结果。
例如,该语音交互指令可以为针对语音交互控件的触控指令。即汽车内可以配置有语音交互控件,当用户触控该语音交互控件时,处理器01可以自动启动语音交互功能。其中,该语音交互控件可以为设置于汽车内目标位置处的实体物理按键(button)或虚拟触控按键。该目标位置可以为中控组件上的任一位置,或者,可以为目标显示屏03上的任一位置,或者,也可以为汽车的方向盘上的任一位置。可以理解的是,该目标位置应当是便于用户触控的位置。
又例如,该语音交互指令可以为远场语音唤醒指令。即用户可以通过说出指定文本来触发处理器01启动语音交互功能,该指定文本可以预先存储于处理器01中。如,假设指定文本为“Hi,请启动语音交互”,则当用户说出“Hi,请启动语音交互”的指定文本后,处理器01可以自动启动语音交互功能。
当然,在一些实施例中,处理器01还可以响应于其他指令启动语音交互功能。如,处理器01可以与用户所持终端通信连接,处理器01可以响应于用户在所持终端上的语音交互触发操作,启动语音交互功能。可选的,处理器01可以集成于车机中,车机与终端可以通过账号或标识码或独立应用程序等方式通信连接,在车机与终端建立连接后,处理器01即与终端建立通信连接。
在采集到第一语音后,处理器01可以先确定第一语音的语义,然后再基于该语义直接执行与该语义对应的操作,最后将操作结果确定为应答文本。或者,处理器01可以先确定第一语音的语义,然后向能够执行与该语义对应的操作的执行器发送控制该执行器执行该操作的指令,最后再确定该执行器发送的操作结果,并将操作结果确定为应答文本。在确定出应答文本后,处理器01即可以将该应答文本发送至目标显示屏03,以供目标显示屏03显示该应答文本。
例如,假设处理器01采集到的第一语音为“请播放XX歌曲”,则处理器01在确定出该第一语音的语义后,可以直接向用于播放该歌曲的播放器发送播放指令。然后,处理器01在检测到播放器开始播放该歌曲时,可以将“已开始播放XX歌曲”确定为应答文本”。最后,处理器01可以将该应答文本“已开始播放XX歌曲”发送至目标显示屏03,以供目标显示屏03显示。
可选的,图3以目标显示屏03为仪表盘为例,示出了一种在仪表盘上显示的应答文本“已开始播放XX歌曲”的示意图。图4以目标显示屏03为HUD为例,示出了一种在HUD上显示的应答文本“已开始播放XX歌曲”的示意图。图5以目标显示屏03为仪表盘和HUD为例,示出了一种在HUD和仪表盘上均显示的应答文本“已开始播放XX歌曲”的示意图。
可选的,在本申请实施例中,处理器01还可以用于将应答文本发送至中控组件的显示屏,以供中控组件的显示屏也显示该应答文本。即,处理器01还可以控制中控组件的显示屏显示应答文本。例如,以应答文本为“已开始播放XX歌曲”为例,图6示出了一种在中控组件的显示屏上显示该应答文本的示意图。
因目标显示屏03与中控组件的显示屏位于不同位置,故在控制目标显示屏03显示应答文本的同时,还控制中控组件的显示屏显示,可以便于不同位置处的多个用户均能观看到应答文本,进一步提高了显示应答文本的灵活性。
可选的,处理器01与目标显示屏03可以通过下述方式中的任意一种方式通信连接:控制器局域网络(controller area network,CAN)总线、车载局域网络总线、串行外设接口(serial peripheral interface,SPI)、串行通信总线、共享内存的方式和套接字(socket)的方式。串行通信总线可以用I2C标识。
其中,若处理器01与目标显示屏03分别由两块独立的电路板(可由不同厂商供货)驱动,则该处理器01与目标显示屏03之间可以通过CAN总线或车载局域网络总线建立通信连接。若处理器01与目标显示屏03由位于同一块电路板上的两个相互独立的芯片分别驱动,则该处理器01与目标显示屏03之间可以通过SPI或I2C的方式建立通信连接。若处理器01与目标显示屏03由位于同一块电路板上的同一颗芯片驱动,则基于虚拟化技术和一芯多屏技术可知,该处理器01与目标显示屏03可以通过共享内存或socket的方式建立通信连接。
当然,在一些实施例中,目标显示屏03与处理器01还可以通过高清多媒体接口(high definition multimedia interface,HDMI)或低电压差分信号(low voltagedifferential signaling,LVDS)接口等显示接口建立通信连接。通过显示接口建立连接时,目标显示屏03与处理器01一般是集成设置的,即目标显示屏03属于处理器01的一部分。
图7是本公开实施例提供的再一种汽车的结构示意图。如图7所示,该汽车00还可以包括:语音播放组件04,处理器01还可以与语音播放组件04连接,如可以通过无线或图7所示的有线方式建立通信连接。
其中,该处理器01还可以用于将应答文本转换为第二语音,并将第二语音发送至语音播放组件04。语音播放组件04可以用于播放第二语音。即,该处理器01还可以用于控制语音播放组件04对应答文本进行播放。
例如,假设处理器01确定的应答文本为“已开始播放XX歌曲”,则处理器01可以控制语音播放组件04播放“已开始播放XX歌曲”,以供用户收听。
可选的,处理器01中可以配置有文本转语音(text to speech,TTS)算法,处理器01可以通过TTS算法将确定的应答文本转换为语音,即第二语音。其中,TTS算法包括:文本处理和语音合成两个步骤。文本处理是指把文本转化成音素序列,并标出每个音素的起止时间和频率变化等信息。语音合成可以是指根据音素序列(以及标注好的起止时间和频率变化等信息)生成语音。语音合成包括拼接法、参数法和声道模拟法。
由于汽车运行环境较为复杂,若遇到吵闹且噪音较大的场景,位于汽车内的用户可能无法听清应答文本的语音反馈,或者,受单个显示屏面积的限制,坐落于距显示屏较远的用户无法观看显示的应答文本。故,通过在显示应答文本的同时还播放应答文本,即通过对应答文本进行声音和显示的双重反馈,可以进一步便于不同位置处的用户均获取到该应答文本,确保反馈可靠性。
可选的,语音播放组件04可以为单一的扬声器,或者也可以为音响系统。音响系统可以包括语音处理电路和扬声器,语音处理电路可以对接收到的语音进行滤波或是放大处理,以便扬声器能够将第二语音清晰的播放给用户。
可选的,在本申请实施例中,目标显示屏03还可以用于在应答文本的显示时长达到目标时长后取消显示应答文本,即在目标时长后,该应答文本可以从目标显示屏03上自动消失。其中,该目标时长可以小于时长阈值。即,目标显示屏03可以短时间显示接收到的应答文本。
可选的,该时长阈值可以预先存储于目标显示屏03中。如,假设该时长阈值为10秒(s),应答文本为“已开始播放XX歌曲”,目标显示屏03为仪表盘。则参考图8可以看出,仪表盘在将应答文本“已开始播放XX歌曲”显示约8s后,可以取消显示该应答文本。即在8s后,应答文本“已开始播放XX歌曲”可以从仪表盘上自动消失。
结合图2至图6可以看出,目标显示屏03(尤其是仪表盘)上一般还会显示有影响汽车驾驶安全的运行参数,若应答文本的显示区域与运行参数的显示区域重叠,则会影响驾驶员获知该运行参数。在此基础上,若应答文本长时间显示于目标显示屏03上,即运行参数被长时间遮挡,则会造成驾驶员因无法及时可靠获知当前运行参数而误驾驶的情况发生,进而导致驾驶安全性较差。如此,可以确定,通过将应答文本显示较短的目标时长后取消显示,可以避免上述情况的发生,确保驾驶安全性较好。
其中,汽车的运行参数可以包括:车速、转速、水温、电量和油量中的至少一种。例如,图2至图6示出的运行参数包括车速和转速。转速的单位可以为千转每分钟,即1000r/min;车速的单位可以为公里每小时,即km/h。
当然,在一些实施例中,车速的单位还可以由处理器01基于用户的设置指令灵活配置。如,汽车上可以配置有车速单位设置选项,用户可以通过触发该车速单位设置选项以便处理器01对车速单位进行灵活配置。示例的,假设用户通过触发该车速单位设置选项选择了“英里/小时”的单位,则处理器01可以将车速单位自动配置为“英里/小时”,即对于图6所示结构而言,其显示的汽车参数中车速的单位可以为英里/小时,而不是公里/小时。
可选的,在目标显示屏03还显示汽车的运行参数的场景下,应答文本的显示区域与运行参数的显示区域可以不重叠。即,目标显示屏03可以在不遮挡已显示的运行参数的前提下,显示接收到的应答文本。结合上述分析可知,通过该设置方式,可以使得驾驶员在观看应答文本的同时,还能够可靠获知运行参数,从而进一步确保驾驶安全性较好。
可选的,结合上述实施例记载,目标显示屏03可以在将应答文本显示较短的目标时长的同时,还将应答文本显示于指定显示区域,该指定显示区域与汽车的运行参数的显示区域不重叠。如此,可以进一步有效确保驾驶安全性较好。
例如,假设应答文本为“已开始播放XX歌曲”,则目标显示屏03可以在不遮挡汽车的运行参数的显示区域中,将该应答文本“已开始播放XX歌曲”显示较短的目标时长后,取消显示。
作为一种可选的实现方式,目标显示屏03可以包括多个显示区域,目标显示屏03在接收到应答文本之前,汽车的运行参数可以分别显示于该多个显示区域中。在目标显示屏03在接收到应答文本之后,可以将汽车的运行参数集中显示于部分显示区域,相应的,可以将应答文本显示于未显示运行参数的显示区域。如此,即达到了应答文本的显示区域与运行参数的显示区域不重叠的目的。且在取消显示应答文本之后,目标显示屏03可以恢复至原始显示状态,即恢复至未显示应答文本之前的状态。
例如,以目标显示屏03为仪表盘为例,参考图9,其示出的仪表盘包括第一显示区域A1和第二显示区域A2。仪表盘在接收到应答文本之前,汽车的车速和转速等运行参数显示于第一显示区域A1和第二显示区域A2中。仪表盘在接收到应答文本之后,汽车的车速和转速等运行参数均集中显示于第一显示区域A1中,应答文本显示于第二显示区域A2中,应答文本与运行参数不重叠。且在应答文本取消显示后,汽车的车速和转速等运行参数重新显示于第一显示区域A1和第二显示区域A2中,即恢复至原始显示状态。
作为另一种可选的实现方式,目标显示屏03可以包括多个显示区域,目标显示屏03在接收到应答文本之前,可以提前预留部分显示区域专门用于供应答文本显示。即,可以将汽车的运行参数仅显示于多个显示区域的部分显示区域中,相应的,可以确定多个显示区域中存在一个或多个未显示运行参数的显示区域。如此,在目标显示屏03在接收到应答文本之后,无需调整汽车的运行参数的显示位置,可以直接将应答文本显示于未显示任何信息的显示区域中,以达到应答文本的显示区域与运行参数的显示区域不重叠的目的。
需要说明的是,图9所示为仪表盘的等效简图,仪表盘的具体结构可以参考图2。此外,目标显示屏03除了显示有汽车的运行参数外,还可以显示有一些与汽车的驾驶安全性关系不大的其他信息,如正在播放的歌曲的封面图片。在该场景基础下,应答文本的显示区域与该其他信息的显示区域可以局部或全部重叠。如此,可以使得目标显示屏03上能够显示较多信息。
可选的,在本申请实施例中,汽车还可以包括:多个执行器,处理器01可以与多个执行器通信连接。如,处理器01可以通过CAN总线与执行器建立通信连接。
示例的,图10仅示出处理器01与目标执行器05通信连接。处理器01还可以用于基于第一语音的语义,向多个执行器中的目标执行器05发送操作指令。
可选的,处理器01中还可以包括语音识别模块和语义识别模块。处理器01可以分别与该语音识别模块和语义识别模块建立通信连接,且该语音识别模块与该语义识别模块可以建立通信连接。处理器01可以用于将采集到的第一语音发送至语音识别模块。语音识别模块可以用于对第一语音进行识别,以确定第一语音对应的文本,并将确定的文本发送至语义识别模块。语义识别模块可以用于确定接收到的文本的语义,并将该语义发送至处理器01。
可选的,语音识别模块对语音进行识别的方式可以概括为:先使用声学模型对语音进行解码,之后将音节与词表进行匹配得到词序列,最后再使用语言模型得到语句。且,语音识别模块可以在本地对第一语音进行识别,或者语音识别模块也可以接收云端发送的识别结果。语义识别模块可以通过自然语音处理(natural language processing,NLP)的方式确定语音对应的语义。当然,在一些实施例中,还可以通过其他方式对第一语音和语义进行识别。
需要说明的是,语音识别模块和语义识别模块可以集成设置。语音识别模块和语义识别模块还可以直接集成于处理器01中。
处理器01在确定出语义后,即可以进一步确定能够执行该语义对应功能的执行器(即,确定目标执行器05),并向目标执行器05发送操作指令。该目标执行器05可以用于执行接收到的操作指令指示的操作,并将操作结果发送至处理器01。该处理器01还可以用于基于操作结果确定应答文本。
可选的,若处理器01与目标执行器05通过CAN总线通信连接,则处理器01可以通过CAN总线的通信接口向目标执行器05发送操作指令。通信类型可以为车载以太网。当然,在一些实施例中,目标执行器05还可以集成于处理器01中,此时可以由处理器01直接控制目标执行器05执行语义对应功能,即处理器01无需通过通信接口向目标执行器05发送操作指令。
可选的,该操作指令可以携带有操作参数,如假设操作指令为对座椅的加热指令,则该操作参数即可以为加热档位。相应的,目标执行器05可以基于操作参数对座椅进行灵活加热处理。或者,该操作指令可以不携带操作参数,而是由目标执行器05直接将基于记忆的最近一次的操作参数,或,默认的操作参数,或使用最多的操作参数确定为最终执行操作时所使用的操作参数。
可选的,汽车中还可以包括座椅加热模块,上述实施例记载的目标执行器可以为座椅加热模块。以驾驶员说出的第一语音为“打开副驾驶的座椅加热功能”对本申请实施例记载的应答文本显示流程做以如下说明:
首先,驾驶员可以先触发处理器01启动语音交互功能。在处理器01启动语音交互功能后,驾驶员可以对着麦克风说出“打开副驾驶的座椅加热功能”。此时,处理器01即可以采集到第一语音“打开副驾驶的座椅加热功能”。然后,处理器01可以通过语音识别模块和语义识别模块确定第一语音的语义为:要求打开副驾驶的座椅加热功能。进而,处理器01即能够可靠确定目标执行器05应该为座椅加热模块。然后,处理器01可以向座椅加热模块发送携带有加热档位的操作指令,如“将副驾驶的座椅加热至第一档”。然后,座椅加热模块可以基于该操作指令自动对副驾驶的座椅进行加热,并向处理器01反馈执行的操作结果,如反馈的操作结果可以为“已打开座椅加热功能至第一档”。最后,处理器01基于操作结果确定的应答文本即可以为“已打开座椅加热功能至第一档”。处理器01可以将该应答文本发送至目标显示屏03,以供目标显示屏03进行显示。例如,参考图11,汽车的仪表盘可以作为目标显示屏03显示车速和转速等运行参数,以及显示该应答文本“已打开座椅加热功能至第一档”,如此,可以便于驾驶员观看应答文本和运行参数,提高驾驶安全性。
当然,在一些实施例中,目标执行器05可以不向处理器011处理器01反馈操作结果,而是由处理器01自行检测目标执行器05执行操作后的操作结果。
可选的,如上述实施例记载,处理器01还可以用于基于第一语音的语义自动执行与语义对应的操作指令,并基于执行操作指令后的操作结果确定应答文本。即,多个执行器05可以集成于处理器01设置,属于处理器01的一部分。
可选的,在本申请实施例中,处理器01、语音采集组件02和语音播放组件04可以集成于中控组件中设置。
需要说明的是,因汽车内除驾驶员外还会载有其他乘客,如小孩。麦克风在采集第一语音时一般不会区分具体是谁发出的声音,相应的,处理器01可能会接收到不同音色的声音,如此给语音识别带来一定难度。且,小孩发出的第一语音很可能会对汽车的驾驶带来风险。故,在本申请实施例中,处理器01还可以通过声源定位技术,确定第一语音的位置来源,进而根据第一语言的位置确定发出第一语音的可能对象,并在确定发出第一语音的对象为指定用户后,才进行下一步操作(如,确定应答文本的操作)。和/或,处理器01还可以预先采集一个或多个指定用户的声纹信息,处理器01在采集到第一语音后,可以先将该第一语音的声纹信息与预先存储的声纹信息进行匹配,若匹配成功,则再进行下一步操作。如此,可以进一步确保驾驶安全性较好,且可以降低语音识别的难度。例如,假设处理器01通过声源定位技术确定第一语音的位置为“驾驶位”,则处理器01可以初步判断是由驾驶员发出该第一语音的。然后,处理器01可以进一步将接收到的第一语音的声纹信息与预先存储的声纹信息进行匹配,若匹配成功,则处理器01可以进一步确定应答文本。
还需要说明的是,以上通过声源定位技术确定第一语音的位置来源,和/或,检测第一语音的声纹信息可以是在一些场景下额外增加的可选操作,并不限于一定需要执行上述操作。再者,在本申请实施例中,处理器01还可以基于通过上述技术确定的发出第一语音的对象,执行不同的操作。该发出第一语音的对象和所需执行的操作可以预先存储于处理器01中。
例如,若第一语音为“打开车窗”,且处理器01确定发出该第一语音的对象为乘客,而不是驾驶员,则处理器01可以仅控制靠近该乘客的车窗打开。若第一语音为“打开车窗”,且处理器01确定发出该第一语音的对象为驾驶员,则处理器01可以直接控制汽车内的所有车窗全部打开。若第一语音为“调高座椅温度”,且处理器01确定发出该第一语音的对象为乘客,则处理器01可以先询问乘客是需要调整乘客所坐的座位的温度,还是汽车内所有座椅的温度。若第一语音为“调高座椅温度”,且处理器01确定发出该第一语音的对象为驾驶员,则处理器01可以直接调整汽车内所有座椅的温度。
综上所述,本申请实施例提供了一种汽车,该汽车包括通信连接的处理器和目标显示屏。该处理器能够将通过语音采集组件采集到的第一语音对应的应答文本发送至目标显示屏,以供目标显示屏进行显示。因该目标显示屏是区别于中控组件包括的显示屏的仪表盘和/或抬头显示器等显示屏,故相对于中控组件仅能将应答文本通过自身的显示屏进行显示的相关技术而言,本申请实施例提供的汽车显示语音的应答文本的灵活性较高。
图12是本申请实施例提供的一种语音的应答文本的显示方法的流程图。该方法可以应用于如上述附图所示的汽车中,即该汽车可以包括:处理器01、语音采集组件02和目标显示屏03,处理器01分别与语音采集组件02和目标显示屏03建立通信连接。参考图12,该方法可以包括:
步骤1301、在启动语音交互功能后,通过语音采集组件采集第一语音。
步骤1302、确定第一语音对应的应答文本。
步骤1303、将应答文本发送至目标显示屏,以供目标显示屏显示应答文本。
其中,该目标显示屏可以包括:汽车的仪表盘,和/或,抬头显示器HUD。
综上所述,本申请实施例提供了一种语音的应答文本的显示方法,该方法中,汽车包括的处理器能够将通过语音采集组件采集到的第一语音对应的应答文本发送至目标显示屏,以供目标显示屏进行显示。因该目标显示屏是区别于中控组件包括的显示屏的仪表盘和/或抬头显示器等显示屏,故相对于中控组件仅能将应答文本通过自身的显示屏进行显示的相关技术而言,本申请实施例提供的汽车显示语音的应答文本的灵活性较高。
可选的,在本申请实施例中,处理器01与目标显示屏03可以通过下述方式中的任意一种方式通信连接:控制器局域网络总线、车载局域网络总线、串行外设接口、串行通信总线、共享内存的方式和套接字的方式。
可选的,在本申请实施例中,目标显示屏03在显示应答文本时,可以在应答文本的显示时长达到目标时长后取消显示该应答文本。其中,目标时长可以小于时长阈值。即,目标显示屏03显示应答文本的时长可以较短。如此,结合上述装置侧实施例记载可知,可以进一步提高驾驶安全性。
可选的,在本申请实施例中,目标显示屏03还可以显示汽车的运行参数,且该运行参数的显示区域与应答文本的显示区域可以不重叠。其中,运行参数可以包括:车速、转速、水温、电量和油量中的至少一种。如此,结合上述装置侧实施例记载可知,可以进一步提高驾驶安全性。
可选的,参考图10可以看出,该汽车还可以包括:语音播放组件04,处理器01与语音播放组件04可以连接。该汽车还可以包括:多个执行器,处理器01与多个执行器可以建立连接。相应的,在图10所示基础上,图13示出了另一种语音的应答文本的显示方法的流程图。如图13所示,该方法可以包括:
步骤1301、在启动语音交互功能后,通过语音采集组件采集第一语音。
步骤1302、基于第一语音的语义,向多个执行器中的目标执行器发送操作指令,以供目标执行器执行该操作指令指示的操作。
步骤1303、接收目标执行器发送的操作结果。
步骤1304、基于操作结果确定应答文本。
步骤1305、将应答文本发送至目标显示屏,以供目标显示屏显示应答文本。
步骤1306、将应答文本转换为第二语音。
步骤1307、将第二语音发送至语音播放组件,以供语音播放组件播放第二语音。
当然,在一些实施例中,处理器可以直接基于第一语音的语义自动执行与语义对应的操作指令,并基于执行操作指令后的操作结果确定应答文本。
需要说明的是,方法侧实施例中各个步骤的实现方式可以参考上述装置侧实施例的记载,在此不再赘述。
还需要说明的是,本申请实施例提供的语音的应答文本的显示方法的步骤的先后顺序可以进行适当调整,步骤也可以根据情况进行相应增减。任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化的方法,都应涵盖在本申请的保护范围之内,因此不再赘述。
综上所述,本申请实施例提供了一种语音的应答文本的显示方法,该方法中,汽车包括的处理器能够将通过语音采集组件采集到的第一语音对应的应答文本发送至目标显示屏,以供目标显示屏进行显示。因该目标显示屏是区别于中控组件包括的显示屏的仪表盘和/或抬头显示器等显示屏,故相对于中控组件仅能将应答文本通过自身的显示屏进行显示的相关技术而言,本申请实施例提供的汽车显示语音的应答文本的灵活性较高。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序由处理器加载并执行以上述实施例提供的语音的应答文本的显示方法,例如图12和图13所示的方法。
本申请实施例还提供了一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行以上述实施例提供的语音的应答文本的显示方法,例如图12和图13所示的方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
应当理解的是,本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分,应理解,“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。例如,在不脱离各种所述示例的范围的情况下,第一语音可以被称为第二语音,并且类似地,第二语音可以被称为第一语音。
在本申请中提及的“和/或”,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种汽车,其特征在于,所述汽车包括:处理器、语音采集组件和目标显示屏,所述处理器分别与所述语音采集组件和所述目标显示屏通信连接;
所述处理器,用于在启动语音交互功能后,通过所述语音采集组件采集第一语音,确定所述第一语音对应的应答文本,并将所述应答文本发送至所述目标显示屏;
所述目标显示屏,用于显示所述应答文本;
其中,所述目标显示屏包括:所述汽车的仪表盘,和/或,所述汽车的抬头显示器HUD。
2.根据权利要求1所述的汽车,其特征在于,所述处理器与所述目标显示屏通过下述方式中的任意一种方式通信连接:
控制器局域网络总线、车载局域网络总线、串行外设接口、串行通信总线、共享内存的方式和套接字的方式。
3.根据权利要求1或2所述的汽车,其特征在于,所述目标显示屏,还用于在所述应答文本的显示时长达到目标时长后取消显示所述应答文本;
其中,所述目标时长小于时长阈值。
4.根据权利要求3所述的汽车,其特征在于,所述目标显示屏,还用于显示汽车的运行参数,所述应答文本的显示区域与所述运行参数的显示区域不重叠;
其中,所述运行参数包括:车速、转速、水温、电量和油量中的至少一种。
5.根据权利要求1或2所述的汽车,其特征在于,所述汽车还包括:语音播放组件,所述处理器与所述语音播放组件通信连接;
所述处理器,还用于将所述应答文本转换为第二语音,并将所述第二语音发送至所述语音播放组件;
所述语音播放组件,用于播放所述第二语音。
6.根据权利要求1或2所述的汽车,其特征在于,所述汽车还包括:多个执行器,所述处理器与所述多个执行器通信连接;
所述处理器,还用于基于所述第一语音的语义,向所述多个执行器中的目标执行器发送操作指令;
所述目标执行器,用于执行所述操作指令指示的操作,并将操作结果发送至所述处理器;
所述处理器,还用于基于所述操作结果确定所述应答文本。
7.根据权利要求6所述的汽车,其特征在于,所述汽车还包括:座椅加热模块,所述目标执行器为所述座椅加热模块。
8.根据权利要求1或2所述的汽车,其特征在于,所述处理器,还用于基于所述第一语音的语义执行与所述语义对应的操作指令,并基于执行所述操作指令后的操作结果确定应答文本。
9.一种语音的应答文本的显示方法,其特征在于,应用于汽车,所述汽车包括:处理器、语音采集组件和目标显示屏,所述处理器分别与所述语音采集组件和所述目标显示屏通信连接;所述方法包括:
在启动语音交互功能后,通过所述语音采集组件采集第一语音;
确定所述第一语音对应的应答文本;
将所述应答文本发送至所述目标显示屏,以供所述目标显示屏显示所述应答文本;
其中,所述目标显示屏包括:所述汽车的仪表盘,和/或,所述汽车的抬头显示器HUD。
10.根据权利要求9所述的方法,其特征在于,所述汽车还包括:语音播放组件,所述处理器与所述语音播放组件通信连接;所述方法还包括:
将所述应答文本转换为第二语音;
将所述第二语音发送至所述语音播放组件,以供所述语音播放组件播放所述第二语音。
CN202110594590.5A 2021-05-28 2021-05-28 汽车及语音的应答文本的显示方法 Pending CN113220265A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110594590.5A CN113220265A (zh) 2021-05-28 2021-05-28 汽车及语音的应答文本的显示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110594590.5A CN113220265A (zh) 2021-05-28 2021-05-28 汽车及语音的应答文本的显示方法

Publications (1)

Publication Number Publication Date
CN113220265A true CN113220265A (zh) 2021-08-06

Family

ID=77099412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110594590.5A Pending CN113220265A (zh) 2021-05-28 2021-05-28 汽车及语音的应答文本的显示方法

Country Status (1)

Country Link
CN (1) CN113220265A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114523919A (zh) * 2022-02-14 2022-05-24 海信集团控股股份有限公司 车辆及其控制方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105416208A (zh) * 2015-12-08 2016-03-23 延锋伟世通电子科技(上海)有限公司 车载语音识别电子娱乐控制系统
CN106828102A (zh) * 2016-11-25 2017-06-13 未来汽车科技(深圳)有限公司 汽车仪表盘及控制方法
CN108735211A (zh) * 2018-05-16 2018-11-02 智车优行科技(北京)有限公司 语音处理方法、装置、车辆、电子设备、程序及介质
CN109256133A (zh) * 2018-11-21 2019-01-22 上海玮舟微电子科技有限公司 一种语音交互方法、装置、设备及存储介质
CN111506229A (zh) * 2020-04-03 2020-08-07 广州小鹏汽车科技有限公司 一种交互方法、装置和车辆
CN112147780A (zh) * 2019-06-26 2020-12-29 比亚迪股份有限公司 车载抬头显示装置、控制系统、控制方法、存储介质
CN112820284A (zh) * 2020-12-28 2021-05-18 恒大新能源汽车投资控股集团有限公司 语音交互方法、装置、电子设备及计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105416208A (zh) * 2015-12-08 2016-03-23 延锋伟世通电子科技(上海)有限公司 车载语音识别电子娱乐控制系统
CN106828102A (zh) * 2016-11-25 2017-06-13 未来汽车科技(深圳)有限公司 汽车仪表盘及控制方法
CN108735211A (zh) * 2018-05-16 2018-11-02 智车优行科技(北京)有限公司 语音处理方法、装置、车辆、电子设备、程序及介质
CN109256133A (zh) * 2018-11-21 2019-01-22 上海玮舟微电子科技有限公司 一种语音交互方法、装置、设备及存储介质
CN112147780A (zh) * 2019-06-26 2020-12-29 比亚迪股份有限公司 车载抬头显示装置、控制系统、控制方法、存储介质
CN111506229A (zh) * 2020-04-03 2020-08-07 广州小鹏汽车科技有限公司 一种交互方法、装置和车辆
CN112820284A (zh) * 2020-12-28 2021-05-18 恒大新能源汽车投资控股集团有限公司 语音交互方法、装置、电子设备及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
温朝柱: "《机电商品 归类方法与案例评析》", 30 April 2019 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114523919A (zh) * 2022-02-14 2022-05-24 海信集团控股股份有限公司 车辆及其控制方法
CN114523919B (zh) * 2022-02-14 2024-04-05 海信集团控股股份有限公司 车辆及其控制方法

Similar Documents

Publication Publication Date Title
CN109545219A (zh) 车载语音交互方法、系统、设备及计算机可读存储介质
WO2015128960A1 (ja) 車載制御装置および車載制御方法
JP2017090613A (ja) 音声認識制御システム
CN109515449A (zh) 用于控制车辆与车载设备交互的方法和装置
US20190228767A1 (en) Speech recognition apparatus and method of controlling the same
WO2022062491A1 (zh) 一种基于智能座舱的车载智能硬件管控方法和智能座舱
CN111354359A (zh) 一种车辆语音控制方法、装置、设备、系统及介质
JP2000181500A (ja) 音声認識装置及びエ―ジェント装置
US20200319841A1 (en) Agent apparatus, agent apparatus control method, and storage medium
CN113157080A (zh) 用于车辆的指令输入方法、存储介质、系统及车辆
CN113220265A (zh) 汽车及语音的应答文本的显示方法
US11325605B2 (en) Information providing device, information providing method, and storage medium
JP7266418B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7239359B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
KR20210151089A (ko) 차량 시스템의 음성 제어
JP2020144264A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
US11797261B2 (en) On-vehicle device, method of controlling on-vehicle device, and storage medium
JP2004301875A (ja) 音声認識装置
US20200320997A1 (en) Agent apparatus, agent apparatus control method, and storage medium
CN113879235A (zh) 汽车多屏控制的方法、系统、设备及存储介质
CN217672548U (zh) 一种车辆
JP2020152298A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7297483B2 (ja) エージェントシステム、サーバ装置、エージェントシステムの制御方法、およびプログラム
KR20190071104A (ko) 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법
JP7217209B2 (ja) 音声対話装置、音声対話方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210806