CN114353819A - 车辆的导航方法、装置、设备、存储介质及程序产品 - Google Patents
车辆的导航方法、装置、设备、存储介质及程序产品 Download PDFInfo
- Publication number
- CN114353819A CN114353819A CN202210002229.3A CN202210002229A CN114353819A CN 114353819 A CN114353819 A CN 114353819A CN 202210002229 A CN202210002229 A CN 202210002229A CN 114353819 A CN114353819 A CN 114353819A
- Authority
- CN
- China
- Prior art keywords
- traffic sign
- image
- vehicle
- prompt information
- traffic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本申请提供了一种车辆的导航方法、装置、设备、计算机可读存储介质以及计算机程序产品,可应用于自动驾驶领域、车载领域、地图领域或者交通领域,包括:获取在车辆导航过程中采集的车辆所处行驶道路中的图像;对图像进行交通标志识别,得到识别结果;当识别结果表征图像中包含交通标志时,获取交通标志对应的语音提示信息;将语音提示信息发送至车辆对应的导航终端,以通过导航终端播放交通标志对应的语音提示信息。通过本申请,能够在车辆导航过程中对采集到的图像进行交通标示识别并进行相应的语音提示,从而提升驾驶过程中的安全性。
Description
技术领域
本申请涉及互联网技术,尤其涉及一种车辆的导航方法、装置、设备、计算机可读存储介质以及计算机程序产品。
背景技术
随着人工智能的高速发展,越来越多的人工智能识别装置被运用到汽车行业。比如在自动驾驶、车辆导航等领域,在基于图片识别进行导航时都是通过识别地点图片中的文字确定与地点图片关联的地理位置并进行导航,如此降低了图片导航中的计算量,在确保地理位置识别准确性的同时,提高了导航响应效率。
相关技术中,提前存储导航道路中的交通标志信息,进而在车辆行驶过程中进行相应的提示,然而,这种提前存储交通标志信息的方式,存在信息更新不及时,与实际交通场景不符的情况,使得用户驾驶过程中的安全性较低。
发明内容
本申请提供了一种车辆的导航方法、装置、设备、计算机可读存储介质以及计算机程序产品,能够在车辆导航过程中对采集到的图像进行交通标示识别并进行相应的语音提示,从而提升驾驶过程中的安全性。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种车辆的导航方法,包括:
获取在车辆导航过程中采集的车辆所处行驶道路中的图像;
对所述图像进行交通标志识别,得到识别结果;
当所述识别结果表征所述图像中包含交通标志时,获取所述交通标志对应的语音提示信息;
将所述语音提示信息发送至所述车辆对应的导航终端,以通过所述导航终端播放所述交通标志对应的所述语音提示信息。
本申请实施例提供一种车辆的导航装置,包括:。
采集模块,用于获取在车辆导航过程中采集的车辆所处行驶道路中的图像;
识别模块,用于对所述图像进行交通标志识别,得到识别结果;
获取模块,用于当所述识别结果表征所述图像中包含交通标志时,获取所述交通标志对应的语音提示信息;
发送模块,用于将所述语音提示信息发送至所述车辆对应的导航终端,以通过所述导航终端播放所述交通标志对应的所述语音提示信息。
在上述方案中,所述识别模块还用于,获取至少一个交通标志;将所述图像与各所述交通标志进行匹配,得到至少一个匹配结果;将所述至少一个匹配结果作为所述图像的识别结果。
在上述方案中,所述识别模块还用于,对所述图像进行特征提取,得到所述图像的特征向量,并对各所述交通标志进行特征提取,得到各所述交通标志的标准特征向量;基于所述特征向量与各所述标准特征向量,确定所述图像与各所述交通标志的相似度;将所述相似度作为所述图像与所述交通标志的匹配结果。
在上述方案中,所述识别模块还用于,分别确定所述特征向量与各所述标准特征向量间的欧氏距离;获取所述图像与所述交通标志的相似度与所述欧氏距离间的映射关系;基于特征向量与各所述标准特征向量间的欧氏距离及所述映射关系,确定所述图像与各所述交通标志的相似度。
在上述方案中,所述装置还包括确定模块,所述确定模块用于从所述图像与各所述交通标志的相似度中,选取相似度最大值;将所述相似度最大值与相似度阈值进行比对,得到比对结果;当所述比对结果指示所述相似度最大值达到所述相似度阈值时,确定所述图像中包含交通标志。
在上述方案中,所述获取模块还用于,获取所述交通标志对应的文本提示信息;对所述文本提示信息进行语音转换,得到所述交通标志对应的语音提示信息。
在上述方案中,所述获取模块还用于,对所述文本提示信息进行音素分析,得到所述文本提示信息对应的音素序列;基于所述音素序列,确定所述音素序列中各音素所对应的语音合成参数;基于各所述语音合成参数,合成所述交通标志对应的语音提示信息。
在上述方案中,所述获取模块还用于,获取所述交通标志的标志名称,以及所述车辆的当前行驶状态;结合所述交通标志的标志名称以及所述当前行驶状态,生成所述交通标志对应的语音提示信息。
在上述方案中,所述获取模块还用于,结合所述交通标志的标志名称以及所述当前行驶状态,生成所述交通标志对应的文本提示信息;对所述交通标志对应的文本提示信息进行语音转换,得到交通标志对应的语音提示信息。
在上述方案中,所述装置还包括呈现模块,所述呈现模块用于发送所述交通标志至所述导航终端,以使所述导航终端导航地图上呈现所述交通标志。
在上述方案中,所述装置还包括选取模块,所述选取模块用于当所述识别结果表征所述图像中包含交通标志、且包含的交通标志的数量为至少两个时,分别获取各所述交通标志对所述车辆的行驶状态的影响程度;从所述至少两个交通标志中,选取所述影响程度最大的交通标志作为目标交通标志;所述获取模块还用于,获取所述目标交通标志对应的语音提示信息。
在上述方案中,所述装置还包括检测模块,所述检测模块用于检测所述车辆的驾驶状态;当所述驾驶状态与所述语音提示信息的内容不匹配时,发送状态语音提示信息至所述车辆对应的导航终端;其中,所述状态语音提示信息,用于提示针对所述交通标志进行驾驶状态的转换。
本申请实施例提供一种电子设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的车辆的导航方法。
本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现本申请实施例提供的车辆的导航方法。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行本申请实施例提供的车辆的导航方法。
本申请实施例具有以下有益技术效果:
在车辆导航过程中,通过对实时采集的车辆所处行驶道路中的图像进行交通标志识别,从而在图像中包含交通标志时,获取交通标志对应的语音提示信息,并将语音提示信息通过导航终端进行播放,如此,能够在车辆导航过程中对采集到的图像进行交通标示识别,并在道路存在交通标志的情况下进行相应的语音提示,从而提升驾驶过程中的安全性。
附图说明
图1是本申请实施例提供的车辆的导航系统的一个可选的架构示意图;
图2是本申请实施例提供的电子设备的结构示意图;
图3是本申请实施例提供的车辆的导航方法的流程示意图;
图4是本申请实施例提供的对图像进行交通标志识别得到识别结果的一个可选的流程示意图;
图5是本申请提供的对采集到的图像进行预处理的一个可选的示意图;
图6是本申请实施例提供的通过相似度模型选取相似度最高的交通标志的一个可选的流程示意图;
图7是本申请实施例提供的相似度模型的一个可选的结构示意图;
图8是本申请实施例提供的相似度模型训练方法的一个可选的流程示意图;
图9是本申请实施例提供的车辆的导航方法的一种可选的流程示意图;
图10是本申请实施例提供的车辆的导航装置的组成结构图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。在以下的描述中,所涉及的术语“多个”是指至少两个。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)卷积神经网络(CNN,Convolutional Neural Network):是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层(pooling layer)。
2)文本转语音(TTS,Text to Speech)技术:通过机械的、电子的方法产生人造语音,它能将任意文字信息实时转化为标准流畅的语音朗读出来。
3)马尔可夫过程:具有马尔可夫性的随机过程。马尔科夫性是指过程(或系统)在时刻t0所处的状态为已知的条件下,过程在时刻t>t0所处的状态的条件分布,与过程时刻t0所处的状态无关的特征,即在马尔可夫过程的条件概率仅仅与系统的当前状态相关,而与它的过去历史或未来状态,都是独立、不相关的。
4)隐马尔可夫模型(HMM,Hidden Markov Model):用来描述一个含有隐含未知参数的马尔可夫过程。
5)智能交通系统(Intelligent Traffic System,ITS)又称智能运输系统(Intelligent Transportation System),是将先进的科学技术(信息技术、计算机技术、数据通信技术、传感器技术、电子控制技术、自动控制理论、运筹学、人工智能等)有效地综合运用于交通运输、服务控制和车辆制造,加强车辆、道路、使用者三者之间的联系,从而形成一种保障安全、提高效率、改善环境、节约能源的综合运输系统。
6)智能车路协同系统(Intelligent Vehicle Infrastructure CooperativeSystems,IVICS),简称车路协同系统,是智能交通系统(ITS)的一个发展方向。车路协同系统是采用先进的无线通信和新一代互联网等技术,全方位实施车车、车路动态实时信息交互,并在全时空动态交通信息采集与融合的基础上开展车辆主动安全控制和道路协同管理,充分实现人车路的有效协同,保证交通安全,提高通行效率,从而形成的安全、高效和环保的道路交通系统。
申请人发现,相关技术在基于图片识别进行导航时都是通过接收用户输入的地点图片,对该地点图片进行文字识别,根据识别到的文字得到该地点图片关联的地理位置信息,将该地理位置信息设置为导航目标位置,获取该用户当前位置到该导航目标位置之间的路径,通过该当前位置到该导航目标位置之间的路径对该用户进行导航,通过识别地点图片中的文字确定与地点图片关联的地理位置并进行导航,如此降低了图片导航中的计算量,在确保地理位置识别准确性的同时,提高了导航响应效率。
然而,相关技术中通过用户输入地点图片,对该图片进行文字识别,并根据文字得到该地点图片关联的地理位置信息作为目标位置进行导航的方式是一种离线的采集方式,无法在导航过程中进行实时的图像采集及处理;同时,相关技术中只是对采集的图像进行图像处理来获得图片中的与地点相关的文字信息,然后通过文字信息匹配该地点所在的位置信息。然而,并没有将文字信息转换为语音信号,无法通过语音进行导航。
基于此,本申请实施例提供一种车辆的导航方法、装置、设备、计算机可读存储介质以及计算机程序产品,通过在车内安装摄像头实时采集路面、交通指示牌的交通标志图像回传到云端后台图像处理系统,云端后台图像处理系统对交通标志图像进行处理,提取交通标志图像的图像信息后,再匹配交通标志标准库从而确定交通文本信息,然后将交通文本信息作为输入数据,输入到云端后台系统中的语音处理系统当中,采用文语转换技术将交通文本信息转换为语音信号回传到车机端智能系统中,车机端智能系统获取语音信号后,通过车机端语音合成系统播放交通标志信息。如此,通过现场实时采集交通信号,并且转换为语音的形式进行播放,有助于司机在晚上或者雨天开车时候,存在视力障碍等情况的驾驶,提升了驾车安全,同时也能够根据当前路况进行实时导航,减少了由于路面临时修整、改到等情况而导致地图更新不及时所造成的问题。
参见图1,图1是本申请实施例提供的车辆的导航系统100的一个可选的架构示意图,为实现车辆的导航的应用场景(例如,可应用于自动驾驶场景、车辆导航场景等等。在以上应用场景中,通常需要采集车辆导航过程中采集的车辆所处行驶道路中的图像,其中,车辆所处行驶道路中的图像是反映车辆周围环境的图像,可从车辆所处行驶道路中的图像中准确获得图像中包含的交通标志。例如,在自动驾驶场景中,实时采集车辆所处行驶道路中的图像,通过对图像进行分析,获得图像中包含的交通标志、障碍物的位置等信息,基于这些信息生成车辆导航信息,按照车辆导航信息控制自动驾驶车辆行驶,以保障自动驾驶车辆的安全性。又例如,在车辆导航场景中,实时采集车辆所处行驶道路中的图像,通过对图像进行分析,获得图像中包含的交通标志、道路弯道、道路减速带等信息,基于这些信息生成车辆导航信息,以语音、文字、图像等方式输出车辆导航信息,以指示车辆行驶。比如,“前方道路限速60,当前时速65,请注意减速”),终端(示例性示出了终端400)通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。
终端400用于供用户使用客户端401,在显示界面401-1(示例性示出了显示界面401-1)显示。终端400和服务器200通过有线或者无线网络相互连接。
服务器200用于,获取在车辆导航过程中采集的车辆所处行驶道路中的图像;对图像进行交通标志识别,得到识别结果;当识别结果表征图像中包含交通标志时,获取交通标志对应的语音提示信息;将语音提示信息发送至车辆对应的终端400。
终端400还用于,在导航界面401-1中播放交通标志对应的语音提示信息。
一些实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN,ContentDeliver Network)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端400可以是智能手机、平板电脑、笔记本电脑、台式计算机、机顶盒、智能语音交互设备、智能家电、车载终端、飞行器、以及移动设备(例如,移动电话,便携式音乐播放器,个人数字助理,专用消息设备,便携式游戏设备,智能音箱及智能手表)等,但并不局限于此。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
参见图2,图2是本申请实施例提供的电子设备的结构示意图,在实际应用中,电子设备可以为图1示出的服务器200或终端400,参见图2,图2所示的电子设备包括:至少一个处理器410、存储器450、至少一个网络接口420和用户接口430。终端400中的各个组件通过总线系统440耦合在一起。可理解,总线系统440用于实现这些组件之间的连接通信。总线系统440除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统440。
处理器410可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口430包括使得能够呈现媒体内容的一个或多个输出装置431,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口430还包括一个或多个输入装置432,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器450可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器450可选地包括在物理位置上远离处理器410的一个或多个存储设备。
存储器450包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器450旨在包括任意适合类型的存储器。
在一些实施例中,存储器450能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统451,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块452,用于经由一个或多个(有线或无线)网络接口420到达其他计算设备,示例性的网络接口420包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
呈现模块453,用于经由一个或多个与用户接口430相关联的输出装置431(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块454,用于对一个或多个来自一个或多个输入装置432之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本申请实施例提供的车辆的导航装置可以采用软件方式实现,图2示出了存储在存储器450中的车辆的导航装置455,其可以是程序和插件等形式的软件,包括以下软件模块:采集模块4551、识别模块4552、获取模块4553以及发送模块4554,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。
在另一些实施例中,本申请实施例提供的车辆的导航装置可以采用硬件方式实现,作为示例,本申请实施例提供的车辆的导航装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本申请实施例提供的车辆的导航方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application Specific IntegratedCircuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
在一些实施例中,终端或服务器可以通过运行计算机程序来实现本申请实施例提供的车辆的导航方法。举例来说,计算机程序可以是操作系统中的原生程序或软件模块;可以是本地(Native)应用程序(APP,Application),即需要在操作系统中安装才能运行的程序,如即时通信APP、网页浏览器APP;也可以是小程序,即只需要下载到浏览器环境中就可以运行的程序;还可以是能够嵌入至任意APP中的小程序。总而言之,上述计算机程序可以是任意形式的应用程序、模块或插件。
基于上述对本申请实施例提供的车辆的导航系统及电子设备的说明,下面说明本申请实施例提供的车辆的导航方法。在实际实施时,本申请实施例提供的车辆的导航方法可以由终端或服务器单独实现,或者由终端及服务器协同实现,以由图1中的服务器200单独执行本申请实施例提供的车辆的导航方法为例进行说明。参见图3,图3是本申请实施例提供的车辆的导航方法的流程示意图,将结合图3示出的步骤进行说明。
步骤101,服务器获取在车辆导航过程中采集的车辆所处行驶道路中的图像。
在实际实施时,服务器可通过图像采集装置采集车辆所处行驶道路中的图像。在一些实施例中,图像采集装置可以是摄像头。摄像头可以是单目摄像头、双目摄像头、深度摄像头、三维(3D,3Dimensions)摄像头等。示例性地,调用摄像头开启扫描模式,实时扫描摄像头视野中的目标对象,并按照指定帧率生成图像。
在另一些实施例中,图像采集装置也可以是激光雷达、毫米波雷达等雷达设备。激光雷达是通过发射激光束探测目标对象的位置、速度、姿态、形状等特征数据的雷达设备。毫米波雷达是在毫米波波段探测的雷达设备。雷达设备实时向目标对象发射探测信号,接收目标对象反射回来的回波信号,基于探测信号与回波信号之间的差异,确定目标对象的特征数据。雷达设备采用多个发射器和接收器,由此获取的图像为三维点云图像。
如此,在车辆导航过程中对车辆所处行驶道路中的图像进行是实时采集,从而对实时采集的图像进行处理,提高了车辆在行车过程当中的交通信号处理能力。
步骤102,对图像进行交通标志识别,得到识别结果。
在实际实施时,对图像进行交通标志识别具体是确定图像中是否包含交通标志,这里,交通标志是用文字或符号传递引导、限制、警告或指示信息的道路设施。
在实际实施时,参见图4,图4是本申请实施例提供的对图像进行交通标志识别得到识别结果的一个可选的流程示意图,基于图3,步骤102,还可以通过如下方式执行:
步骤1021,获取至少一个交通标志。
在实际实施时,可以从交通标志标准库中获取至少一个交通标志,需要说明的是,这里的交通标志标准库为相关公信机构所提供的。
步骤1022,将图像与各交通标志进行匹配,得到至少一个匹配结果。
在实际实施时,将图像与各交通标志进行匹配,得到至少一个匹配结果的过程具体为首先对图像进行特征提取,得到图像的特征向量,并对各交通标志进行特征提取,得到各交通标志的标准特征向量,然后基于特征向量与各标准特征向量,确定图像与各交通标志的相似度,最后将相似度作为图像与交通标志的匹配结果。
需要说明的是,特征向量是指将其它形式的数据以数学形式进行表达的结果。比如,将图像表示为数学形式“[00010000000...]”,此时,“[00010000000...]”即为图像的特征向量。可以理解,这里不限定将待识别图像转换为何种表示的向量,只要能够将待识别图像进行数学化表示即可。比如可将待识别图像转换为高维稀疏向量或者低维稠密向量。
需要说明的是,对图像进行特征提取得到的特征向量,以及对各交通标志进行特征提取得到的标准特征向量,均为反映自身图像特性的特征向量。图像特性可以是纹理特性、颜色特性、梯度特性、空间关系特性等。纹理特性描述了图像中各区域的表面性质。颜色特性描述了图像中各区域的颜色。梯度特性描述了图像中各区域的形状和结构。空间关系特性是指图像中分割出来的多个区域之间的相互的空间位置或相对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。
在实际实施时,对图像进行特征提取得到特征向量,以及对各交通标志进行特征提取得到的标准特征向量的过程具体可以是,通过特征提取策略从图像中提取特征向量,以及通过特征提取策略从各交通标志中提取标准特征向量。特征提取策略可以是训练后的特征提取网络或者通用的特征提取算法等。其中,特征提取网络是通过样本学习具备特征向量提取能力的模型结构。特征提取网络的输入端为图像或者各交通标志,输出端为特征向量或者标准特征向量。特征提取网络可包括多层网络结构,不同的网络层对输入其的数据进行不同的处理,并输出处理结果至下一网络层。而对于特征提取算法,由于通用的特征提取算法提取得到的特征向量以及标准特征向量即可满足本申请实施例对特征向量以及标准特征向量的需求,本申请实施例可采用通用的特征提取算法从图像中提取特征向量或者采用通用的特征提取算法从各交通标准图像中提取标准特征向量。
在实际实施时,基于特征向量与各标准特征向量,确定图像与各交通标志的相似度的过程具体可以是,首先分别确定特征向量x与各标准特征向量y间的欧氏距离d,然后获取图像与交通标志的相似度P与欧氏距离d间的映射关系,最后基于特征向量与各标准特征向量间的欧氏距离及映射关系,确定图像与各交通标志的相似度P,即
其中,X表示采集到的图像,B表示交通标志标准库中的交通标志,d(X,B)表示第采集到的图像与交通标志标准库中的交通标志B之间的欧氏距离,这里,xj表示采集到的图像中第j个特征,yj表示交通标志B中的第j个特征,m表示提取到的特征数量,P(X|B)表示采集到的图像与交通标志B的相似度,wi表示采集到的图像与交通标志B之间距离的权重,E表示交通标志标准库。
在实际实施时,在得到图像与各交通标志的相似度P,即将各相似度P作为图像与交通标志的匹配结果。
在一些实施例中,在将图像与各交通标志进行匹配之前,还可以对采集到的图像进行标准化处理即预处理、增量处理、以及一致性处理,比如压缩、灰度化处理、对图像进行拉伸、旋转、缩小、翻转等,参照图5,图5是本申请提供的对采集到的图像进行预处理的一个可选的示意图,具体地,首先对采集到的原始图像进行预处理,示例性地,对采集得到的原始图像进行压缩以及对齐的预处理,得到预处理后的图像;然后对预处理后的图像进行增量处理,示例性地,对预处理后的图像进行增量处理进行拉伸、旋转、缩小、翻转、光亮度随机化、以及对比度随机化的增量处理,得到增量处理后的图像;最后对增量处理后的图像进行一致性处理,示例性地,对增量处理后的图像进行彩色图灰度化、直方图均衡化、图像白化的一致性处理,得到一致性处理后得到的图像,如可以采用Gamma校正法对原始图像进行一致性处理,以调节图像的对比度,降低局部阴影和光照变化所造成的影响,同时抑制噪声干扰。最后得到预处理之后的标准图像,以将标准图像与各交通标志进行匹配。这里,直方图均衡化就是把图像的直方图分布改变成均匀分布直方图,这样可以增加像素灰度值的动态范围,从而达到增强图像整体对比度的效果。例如,可以利用直方图均衡化处理工具如OpenCV来处理;而图片数据白化处理是减少特征之间的相关性,使得图像特征具有相同的方差(如,协方差阵可以为1),白化处理可以采用线性尺度变换,使图片成为零均值和单位标准方差。
如此,通过对采集到的图像进行标准化处理,从而消除自然环境下由于图像采集装置的角度、环境光照、背景等变化的影响,提高识别效果。
需要说明的是,在将图像与各交通标志进行匹配之前,同样还可以对各交通标志进行标准化处理,对各交通标志进行标准化处理的过程与对采集得到的图像进行标准化处理的过程相同,对此不做赘述;而标准化处理过程中的上述预处理、增量处理以及一致性处理并不是本申请实施例的必要步骤,可以择一或者任意组合来适应多样化环境。
步骤1023,将至少一个匹配结果作为图像的识别结果。
在实际实施时,在确定了图像与交通标志的至少一个匹配结果即图像与各交通标志的相似度后,还可以从图像与各交通标志的相似度中,选取相似度最大值,然后将相似度最大值与预先设置的相似度阈值进行比对,得到比对结果,当比对结果指示相似度最大值达到相似度阈值时,确定图像中包含交通标志,当比对结果指示相似度最大值未达到相似度阈值时,确定图像中不包含交通标志。
在实际实施时,当确定图像中包含交通标志时,执行步骤103的操作,当确定图像中不包含交通标志时,返回步骤101,执行步骤101的操作。
步骤103,当识别结果表征图像中包含交通标志时,获取交通标志对应的语音提示信息。
在实际实施时,当识别结果表征图像中包含交通标志时,确定图像中交通标志对应的文本提示信息,然后对文本提示信息进行语音转换,得到交通标志对应的语音提示信息。
需要说明是,在实际实施时,确定图像中交通标志对应的文本提示信息的方式存在两种。接下来,对确定图像中交通标志对应的文本提示信息的两种方式进行说明。
在一些实施例中,在确定图像中包含交通标志后,基于确定的交通标志,直接获取预先存储的交通标志对应的文本提示信息,从而对文本提示信息进行语音转换,得到交通标志对应的语音提示信息。
作为示例,当采集到的图像中包含“前方学校”的交通标志时,直接获取预先存储的与“前方学校”对应的“前方有学校,请缓慢驾驶”的文本提示信息,然后对文本提示信息进行语音转换,得到交通标志对应的语音提示信息。
在另一些实施例中,在确定图像中包含交通标志后,获取交通标志的标志名称,以及车辆的当前行驶状态,然后结合交通标志的标志名称以及当前行驶状态,生成交通标志对应的文本提示信息,从而对文本提示信息进行语音转换,得到交通标志对应的语音提示信息。
作为示例,在确定图像中包含交通标志后,获取交通标志的标志名称“前方学校”,以及车辆的当前行驶状态如高速行驶或缓慢行驶,然后结合交通标志的标志名称以及当前行驶状态,生成交通标志对应的文本提示信息,例如,当车辆当前为高速行驶时,基于“前方学校”以及当前高速行驶状态,生成“前方学校,请将驾驶速度限制为20km/h”的文本提示信息,或者当车辆当前为缓慢行驶时,基于“前方学校”以及当前缓慢行驶状态,生成“前方学校,请继续缓慢驾驶”的文本提示信息,从而对文本提示信息进行语音转换,得到交通标志对应的语音提示信息。需要说明的是,这里对当前驾驶状态的判定可以依据交通标志对应的信息,如交通标志对应的信息为限速20km/h,则将行驶速度大于20km/h的判定为高速行驶,而将行驶速度小于20km/h的判定为缓慢行驶。
在实际实施时,在确定交通标志对应的文本提示信息后,对文本提示信息进行语音转换,得到交通标志对应的语音提示信息具体可以是对文本提示信息进行音素分析,得到文本提示信息对应的音素序列,然后基于音素序列,确定音素序列中各音素所对应的语音合成参数,最后基于各语音合成参数,合成交通标志对应的语音提示信息。其中,语音合成参数至少包括音素序列中各音素的状态持续时长、基音周期和频谱参数。示例性地,首先在确定交通标志对应的文本提示信息后,对文本提示信息进行分词标注处理,然后对经过分词标注处理后的文本提示信息进行字音转换并提取文本提示信息的上下文信息确定各音素的上下文信息,然后基于各音素的上下文信息,确定文本提示信息对应的带有上下文信息的音素序列,再根据音素序列中每个带有上下文信息的音素,得到其相应的状态持续时长、基音周期和频谱参数,最后再将各音素的状态持续时长、基音周期和频谱参数输入至语音合成滤波器,从而得到合成语音。
在一些实施例中,还可以预先设置目标语音,这里的目标语音可以是用户喜欢的明星或者动漫人物的声音,基于目标语音,对文本提示信息进行语音转换,得到交通标志对应的语音提示信息。
需要说明的是,在确定图像对应的交通标志之前,还需要确定图像中包含的交通标志的数量,当图像中仅包含一个交通标志时,直接获取交通标志对应的语音提示信息,而当图像中包含多种交通标志时,则首先从多个交通标志中选取目标交通标志,然后获取目标交通标志对应的语音提示信息。
接下来,对当图像中包含多种交通标志的情况进行说明。
在实际实施时,当识别结果表征图像中包含交通标志、且包含的交通标志的数量为至少两个时,分别获取各交通标志对车辆的行驶状态的影响程度,然后从至少两个交通标志中,选取影响程度最大的交通标志作为目标交通标志,再获取目标交通标志对应的语音提示信息。这里的影响程度为对当前车辆的行驶状态进行调节的程度。示例性地,当图像中包含交通标志为“限速40”以及“前方事故频发地段”时,由于“限速40”的交通标志需要对当前车辆的行驶状态进行调节,而“前方事故频发地段”的交通标志则是仅对当前车辆的行驶状态进行提醒,因此“限速40”的交通标志对车辆的行驶状态的影响程度更大,所以选取“限速40”的交通标志作为目标交通标志,再获取该交通标志对应的语音提示信息。
在一些实施例中,当识别结果表征图像中包含交通标志之后,还可以发送交通标志至导航终端,以使导航终端导航地图上呈现交通标志。如此,在不便生成交通标志对应的语音提示信息时,可以直接在导航终端导航地图上呈现交通标志,满足用户在各种情况下的导航需求,提高用户体验。
步骤104,将语音提示信息发送至车辆对应的导航终端,以通过导航终端播放交通标志对应的语音提示信息。
在实际实施时,在导航终端播放交通标志对应的语音提示信息后,还可以检测车辆的驾驶状态,当驾驶状态与语音提示信息的内容不匹配时,发送状态语音提示信息至车辆对应的导航终端;其中,状态语音提示信息,用于提示针对交通标志进行驾驶状态的转换。
作为示例,当导航终端播放“前方学校,请将驾驶速度限制为20km/h”后,检测车辆的驾驶状态,当驾驶状态与语音提示信息的内容不匹配即驾驶状态并没有限制到20km/h以内时,发送提示针对交通标志进行驾驶状态的转换的状态语音提示信息至车辆对应的导航终端,从而提醒用户进行驾驶状态的及时转换。
如此,通过检测车辆的驾驶状态与语音提示信息的内容是否匹配,当不匹配时发送提醒用户转换驾驶状态的状态语音提示信息,从而提高了车辆驾驶过程中的安全性。
在一些实施例中,上述车辆的导航过程还可以由车辆的导航系统来实现,这里的车辆的导航系统可以是智能交通系统或者智能车路协同系统等,具体包括相似度模型以及语音转换模型,示例性地,相似度模型可以是欧氏多分类相似度模型、余弦相似度模型等,而语音转换模型可以是隐马尔可夫模型等,具体地,首先获取训练完成的相似度模型以及语音转换模型,并将图像采集装置实时采集的图像X以及交通标志标准库中的交通标志B输入至相似度模型,然后通过相似度模型确定图像X与各交通标志B的相似度P,然后选取相似度最高的交通标志B,并确定交通标志B对应的文本提示信息,最后将交通标志B对应的文本提示信息输入至语音转换模型,得到语音提示信息并发送至车辆对应的导航终端,以通过导航终端播放语音提示信息。接下来,分别对通过相似度模型选取相似度最高的交通标志B的过程以及通过语音转换模型合成语音的过程进行说明。
下面对通过相似度模型选取相似度最高的交通标志B的过程进行说明。
在一些实施例中,参见图6,图6是本申请实施例提供的通过相似度模型选取相似度最高的交通标志的一个可选的流程示意图,需要说明的是,相似度模型包括特征提取层、特征处理层、特征匹配层以及输出层,参见图7,图7是本申请实施例提供的相似度模型的一个可选的结构示意图,这里以相似度模型是欧氏多分类相似度模型为例,结合图6以及图7,对示出的各步骤进行说明。
步骤201,终端采集车辆所处行驶道路中的图像X并发送至服务器。
其中,图像X为车辆导航过程中图像采集装置实时采集的车辆所处行驶道路中的图像。
步骤202,服务器获取训练完成的相似度模型以及交通标志标准库,并通过相似度模型的特征提取层对接收的图像X以及交通标志标准库中的各交通标志B进行特征提取,得到图像X的特征向量x与各交通标志B的标准特征向量y。
在实际实施时,获取的交通标志标准库为有关部门提供的存储至少一个交通标志B的标准库,而对通过相似度模型的特征提取层对采集的图像X以及交通标志标准库中的各交通标志B进行特征提取之前,还可以对图像进行步骤1022中的标准化处理,从而对标准化处理后的图像进行特征提取。
步骤203,通过相似度模型的特征处理层分别确定特征向量x与各标准特征向量y间的欧氏距离d。
在实际实施时,确定特征向量x与各标准特征向量y间的欧氏距离d的过程参照上述公式(1)。
步骤204,通过相似度模型的特征匹配层,依据欧氏距离d确定图像X与各交通标志B的相似度P。
在实际实施时,依据欧氏距离d确定图像X与各交通标志B的相似度P的过程参照上述公式(2)。
步骤205,通过相似度模型的输出层,选取与图像X相似度最高的交通标志B并输出。
需要说明的是,在利用相似度模型计算采集到的图像与交通标志之间的相似度之前,还需要对相似度模型进行训练,参见图8,图8是本申请实施例提供的相似度模型训练方法的一个可选的流程示意图,接下来,结合图7与图8对示出的步骤进行说明。
步骤301,服务器获取样本图集、各样本图像对应的交通标志以及交通标志标准库。
步骤302,通过相似度模型的特征提取层对各样本图像以及交通标志标准库中的各交通标志进行特征提取,得到各样本图像的特征向量以及各交通标志的标准特征向量。
步骤303,通过相似度模型的特征处理层,针对各样本图像,分别确定样本图像的特征向量与各标准特征向量间的欧氏距离,得到各样本图像与交通标志标准库中的各交通标志的欧氏距离矩阵。
在实际实施时,通过相似度模型的特征处理层,针对各样本图像i,分别确定样本图像的特征向量与各标准特征向量间的欧氏距离d(Ai,B),然后在得到样本图集中各样本与各交通标志的欧氏距离后,即可确定样本图集与交通标志标准库中的各交通标志的欧氏距离矩阵D,即
其中,公式(3)中的Ai(i=1,2,...,n)表示样本图集中第i张图像,B表示交通标志标准库中的交通标志,d(Ai,B)表示第采集到的第i张图像与交通标志标准库中的交通标志B之间的欧氏距离,这里,xi,j表示第i张图像中第j个特征,yj表示交通标志B中的第j个特征,m表示提取到的特征数量,公式(4)中的M表示交通标志标准库中的交通标志数量,n表示样本图集中的样本图像的数量,dnM=d(An,BM)表示图像n与交通标志M的欧氏距离。
步骤304,通过相似度模型的特征匹配层,依据欧氏距离矩阵,针对各样本图像,确定样本图像与各交通标志的相似度。
在实际实施时,针对样本图集中各样本图像,依据欧氏距离矩阵D,确定样本图像与各交通标志的相似度P,即
其中,公式(5)中的Ai(i=1,2,...,n)表示样本图集中第i张图像,B表示交通标志标准库中的交通标志,d(Ai,B)表示第采集到的第i张图像与交通标志标准库中的交通标志B之间的欧氏距离,P(Ai|B)表示在交通标志B的条件下Ai的概率,wi表示采集到的第i张图像与交通标志B之间距离的权重,m表示提取到的特征数量,△表示样本图集△={A1,A2,...,An},n表示样本图集中的样本图像的数量,E表示交通标志标准库。
步骤305,结合欧氏距离矩阵以及样本图像与各交通标志的相似度,构建相似度模型的损失函数。
在实际实施时,在确定欧氏距离矩阵D以及样本图像与各交通标志的相似度P后,基于欧氏距离矩阵D与相似度P构建相似度模型的损失函数,即
其中,公式(6)中的Ai(i=1,2,...,n)表示样本图集中第i张图像,B表示交通标志标准库中的交通标志,P(Ai|B)表示在交通标志B的条件下Ai的概率,△表示样本图集△={A1,A2,...,An},n表示样本图集中的图像数量,E表示交通标志标准库。
步骤306,基于构建得到的损失函数,更新相似度模型的模型参数,得到目标相似度模型。
在实际实施时,在确定损失函数之后,基于损失函数更新相似度模型的模型参数,具体地,根据梯度下降法进行迭代计算,并通过反向传播来更新包括wi在内的参数,得到目标相似度模型W={wi|i=1,2,...,n}。
在一些实施例中,还可以将获取的样本图集按照预设比例划分为训练图集以及测试图集,具体地,首先获取样本图集△={A1,A2,...,An},n表示样本图像数量,然后按照预设比例对样本图集进行训练图集以及测试图集的划分,这里预设比例可以依据用户需求,如8:2或者7:3;然后再获取各样本图像对应的交通标志,需要说明的是,样本图集中的各样本图像并非都存在对应的交通标志,当样本图像不存在对应的交通标志时,认为样本对应的为空;最后获取有关部门提供的存储至少一个交通标志B的交通标志标准库E。
在实际实施时,依据步骤301至步骤305的过程,计算训练图集与交通标志标准库中的各交通标志的训练数据欧氏距离矩阵Dtrain,并依据训练数据欧氏距离矩阵Dtrain,针对各训练样本图像,确定训练样本图像与各交通标志的相似度P,再结合训练数据欧氏距离矩阵Dtrain以及训练样本图像与各交通标志的相似度P,构建相似度模型的损失函数,最后基于损失函数更新相似度模型的模型参数。这里,在确定更新后的相似度模型后,依据测试图集计算模型的损失,直到模型损失不再下降为止,从而得到目标相似度模型W={wi|i=1,2,...,n}。
需要说明的是,依据测试图集计算模型的损失过程参见上述基于训练图集更新相似度模型的过程,本申请实施例中对此不做赘述。
如此,利用基于欧氏距离及多分类算法模型构建的相似度模型来确定采集到的图像与交通标志之间的相似度,解决由于采集到的图像由于光线、路面湿滑、交通标志有缺失等情况下导致特征提取不清晰,导致相似度计算不准确带来的问题,有效提高了相似度计算的准确度。
下面对通过语音转换模型合成语音的过程进行说明。需要说明的是,在相似度模型输出与图像X相似度最高的交通标志B后,即可根据该交通标志B确定对应的文本提示信息,然后通过语音转换模型对文本提示信息进行语音合成。
在一些实施例中,在获取交通标志B确定对应的文本提示信息后,首先对文本提示信息进行分词标注处理,然后对经过分词标注处理后的文本提示信息进行字音转换并提取文本提示信息的上下文信息确定各音素的上下文信息,再基于各音素的上下文信息,确定文本提示信息对应的带有上下文信息的音素序列,接着根据音素序列中每个带有上下文信息的音素搜索并得到其相应的状态时长HMM、基音周期HMM和频谱的HMM,由状态时长HMM得到音素个状态的持续时长,根据状态的持续时长、基音周期HMM和频谱HMM,进行参数生成,得到每帧的基音周期、对数能量和倒谱参数,将每帧的基音周期、对数能量和倒谱参数送入合成滤波器(如基于MSLA滤波器的合成器),得到合成语音。
需要说明的是,这里的状态时长HMM、基音周期HMM和频谱的HMM为预先通过语音数据库训练得到的,具体地,基于语音库对HMM模型进行训练,得到包括状态时长HMM、基音周期HMM和频谱的HMM的上下文相关HMM模型库。这里,语音数据库为预先存储的包括500或1000句语音数据的语音库。
在实际实施时,带有上下文信息的音素序列由各带有上下文信息的音素构成,而每个带有上下文信息的音素的上下文信息表达式可以为L-C+R/A:a1_a2_a3/B:b1_b2/C_c1_c2_c3/D:d1_d2/E:e,其中,C代表当前音素,L代表前接音素,R代表后接音素,ABCDE几项代表当前音素的上下文相关的一些特征,a1位前接字字调,a2为当前字字调,a3为后街字字调,b为音素所在字在当前停顿段落(短语或短句)中的位置,b1为到段落开始字的距离,b2为到段落结束字的距离,c1为前接词的词性,c2为当前词的词性,c3为后接词的词性,d1为当前字在当前词中的位置,d2为当前词的字数,e为句子的总音节数。例如“他见了人就呲牙吠咬,咬住就不撤嘴”这一句话中“见”字的音素的上下文信息表达式为j-ian4+l/A:1_4_5/B:2_3/C:r_v_u/D:1_1/E:15。
在实际实施时,在通过语音转换模型对文本提示信息进行语音合成后,服务器将合成后的语音提示信息通过云端网络发送至车辆对应的导航终端,以通过导航终端播放交通标志对应的语音提示信息。
应用本申请上述实施例,在车辆导航过程中,通过对实时采集的车辆所处行驶道路中的图像进行交通标志识别,从而在图像中包含交通标志时,获取交通标志对应的语音提示信息,并将语音提示信息通过导航终端进行播放,如此,能够在车辆导航过程中对采集到的图像进行交通标示识别并进行相应的语音提示,从而提升驾驶过程中的安全性。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。
相关技术中在基于图片识别进行导航时都是通过接收用户输入的地点图片,对该地点图片进行文字识别,根据识别到的文字得到该地点图片关联的地理位置信息,将该地理位置信息设置为导航目标位置,获取该用户当前位置到该导航目标位置之间的路径,通过该当前位置到该导航目标位置之间的路径对该用户进行导航,通过识别地点图片中的文字确定与地点图片关联的地理位置并进行导航,降低了图片导航中的计算量,在确保地理位置识别准确性的同时,提高了导航响应效率。可以确定,相关技术都是通过用户输入地点图片,对该图片进行文字识别,并根据文字得到该地点图片关联的地里位置信息作为目标位置进行导航的一种方案,然而这种方案是一种离线的采集方式,并没有进行实时的采集及图像处理,同时,只是对离线采集的图像进行图像处理获得图片中的与地点相关的文字信息,并通过文字信息匹配该地点所在的位置信息,并没有将文字信息转换为语音信号,无法通过语音进行导航。
基于此,本申请提供了一种车辆的导航方法,通过在车内安装摄像头实时采集路面、交通指示牌的交通标志图像回传到云端后台图像处理系统,云端后台图像处理系统对交通标志图像进行处理,提取交通指示标志的图像信息后,再匹配交通标志信息数据库(交通标志标准库)确定交通标志信息文本(文本提示信息);然后将交通标志文本信息文本作为输入数据,输入到云端后台系统中的语音处理系统当中,采用文语转换技术(TTS技术)将交通标记文本信息转换为语音信号回传到车机端智能系统中,车机端智能系统获取语音信号后,通过车机端语音合成系统播放交通标志信息(语音提示信息)。如此,通过现场实时采集交通信号,并且转换为语音的形式进行播放,有助于司机在晚上或者雨天开车时候,存在视力障碍等情况的驾驶,提升了驾车安全,同时也能够根据当前路况进行实时导航,减少了由于路面临时修整、改到等情况而导致地图更新不及时所造成的问题。
本申请提供的车辆的导航方法包含以下六个模块:交通标志采集模块、交通标志图像处理模块、标准交通标志图像数据库模块、交通标志匹配模块、文语转换模块、语音播放导航模块、云端网络模块。其中,对于交通标志采集模块,该模块通过安装在车机端前装系统的摄像头设备,对路面、交通指示牌中的交通标志进行实时图像采集,形成交通标志图像数据,并将图像同步到云端后台系统中;对于交通标志图像处理模块,该模块主要用于接收和存储车机端前装系统采集的交通标志图像数据,然后采用CNN等图像处理算法对交通标志图像进行图像处理,得到标准的交通标志图像;对于标准交通标志图像数据库模块,该模块数据交通标志标准库,由交通部门提供,主要提供各种标准的交通标志图像及对应的文字解析,从而用于后续交通标志匹配得到标准的交通文本信息;对于交通标志匹配模块,该模块主要将经过图像处理后的交通标志图像与标准交通标志图像数据库进行匹配,通过相似度模型计算采集到的交通标志图像与标准库的交通标志图像之间的相似度,得到相似度最高的标准交通标志图像及对应的文字解析信息;对于文语转换模块,该模块在云端后台系统中安装语音合成系统,采用文语转换技术(TTS)将交通标志文字信息转换为语音信号,该模块中,云端后台系统将处理好的交通标志文字信息作为输入,输入到语音合成系统中,语音合成系统通过接口方式调用现有的文语转换技术接口,将输入的交通标志转换为语音信号后,输出到车机端语音播放系统;对于语音播放模块,该模块安装于车机端系统中,通过云端网络对接语言合成系统,主要用于接收语音合成系统中经过转换的交通标志语音信号,并通过播放系统进行播放;对于网络模块,该模块主要将交通标志采集模块、交通标志图像处理模块、标准交通标志图像数据库模块、交通标志匹配模块、文语转换模块、语音播放导航模块,实现各个模块的无线传输功能。
在实际实施时,本申请实施例通过上述六个模块执行包括以下八个阶段的车辆的导航方法,参见图9,图9是本申请实施例提供的车辆的导航方法的一种可选的流程示意图,如图9所示,本申请提供的车辆的导航方法包括如图9中步骤401-步骤409的九个阶段:交通标志图像采集阶段、图像处理阶段、欧氏多分类相似度模型(相似度模型)构建阶段、欧氏距离计算阶段、欧氏多分类相似度模型训练测试阶段、交通标志图像匹配阶段、图像转语音阶段、语音播放导航阶段。
对于交通标志图像采集阶段,该阶段主要涉及交通标志采集模块,通过安装在车机端前装系统的摄像头设备,对路面、交通指示牌中的交通标志进行实时图像采集,形成交通标志图像数据,并通过网络将图像同步到云端后台系统中。
对于图像处理阶段,这个阶段主要涉及交通标志图像处理模块,输入交通标志图像采集阶段采集的图像,通过机器学习算法、深度学习算法,通过CNN算法提取图像特征,并对图像进行拉伸、旋转、缩小、翻转等图像处理,得到标准化交通标志图像。
对于欧氏多分类相似度模型构建阶段,这个阶段涉及交通标志匹配模块,只用于构建如公式(5)所示的欧氏多分类相似度模型,在构建完欧氏多分类相似度模型后,执行下一阶段的操作。
对于欧氏距离计算阶段,这个阶段涉及交通标志匹配模块,输入图像处理阶段中经过处理的标准化交通标志图像以及交通标志标准库至欧氏多分类相似度模型,然后通过卷积神经网络提取采集的交通标志图像的图像特征和交通标志标准库中各交通标志的图像特征;然后参照公式(3)计算采集到的交通标志图像与各交通标志的欧氏距离;从而得到采集到的交通标志图像与交通标志标准库中各交通标志的欧氏距离矩阵,这里具体参照公式(4)所示。
对于欧氏多分类相似度模型训练测试阶段,这个阶段涉及交通标志匹配模块,首先输入采集到的交通标记图像数据集△={A1,A2,...,An},并将该数据集按照a:(1-a)进行划分(通常按照8:2进行划分),分别划分为训练图像集△train和测试图像集△test,然后根据欧氏距离计算阶段的过程,计算训练样本图像集的欧氏距离矩阵Dtrain,接着基于训练样本图像集的欧氏距离矩阵Dtrain以及欧氏多分类相似度模型P(Ai|B)构建如公式(6)所示的损失模型,再梯度下降法迭代计算欧氏多分类相似度模型,并输入测试数据集△test按照上述过程计算欧氏多分类相似度模型的损失,直到欧氏多分类相似度模型的损失不再下降为止,从而得到目标欧氏多分类相似度模型W={wi|i=1,2,...,n}。
对于交通标志图像匹配阶段,这个阶段主要涉及交通标志匹配模块,将通过摄像头采集的实时交通标志图像X,输入至基于欧氏多分类相似度模型训练测试阶段得到的目标欧氏多分类相似度模型W={wi|i=1,2,...,n},从而计算交通标志图像X与交通标志标准库中各交通标志的相似度P(X|B),并在交通标志标准库中选择相似度最高的交通标志及其对应的文本信息。
对于图像转语音阶段,这个阶段涉及文语转换模块,输入交通标志图像匹配阶段中相似度最高的交通标志对应的文本信息,将文本信息经过TTS处理,采用HMM模型(隐马尔可夫模型)转换成语音(主要经过:文本转音素、持续时间预测、基频预测、音频合成)四个步骤,将文本转换成语音信号,并通过云端网络输出到车机端播放系统中。
对于语音播放导航阶段,这个阶段涉及语音播放导航模块,通过输入图像转语音阶段中的语音信号,车机端语音播放系统接收语音信号后进行播放,驾驶员根据语音提示进行导航。
如此,本申请上述实施例通过对实时交通标志的采集与处理,提高了车辆在行车过程当中的交通信号处理能力,同时利用基于欧氏距离及多分类算法模型构建的相似度模型来确定采集到的图像与交通标志之间的相似度,解决由于采集到的图像由于光线、路面湿滑、交通标志有缺失等情况下导致特征提取不清晰,导致相似度计算不准确带来的问题,有效提高了相似度计算的准确度。
应用本申请上述实施例,在车辆导航过程中,通过对实时采集的车辆所处行驶道路中的图像进行交通标志识别,从而在图像中包含交通标志时,获取交通标志对应的语音提示信息,并将语音提示信息通过导航终端进行播放,如此,能够在车辆导航过程中对采集到的图像进行交通标示识别并进行相应的语音提示,从而提升驾驶过程中的安全性。
下面继续说明本申请实施例提供的车辆的导航装置实施为软件模块的示例性结构,在一些实施例中,如图10所示,图10是本申请实施例提供的车辆的导航装置的组成结构图,基于图10,本申请实施例提供的车辆的导航装置中的软件模块可以包括:
采集模块4551,用于获取在车辆导航过程中采集的车辆所处行驶道路中的图像;
识别模块4552,用于对所述图像进行交通标志识别,得到识别结果;
获取模块4553,用于当所述识别结果表征所述图像中包含交通标志时,获取所述交通标志对应的语音提示信息;
发送模块4554,用于将所述语音提示信息发送至所述车辆对应的导航终端,以通过所述导航终端播放所述交通标志对应的所述语音提示信息。
在一些实施例中,所述识别模块4552还用于,获取至少一个交通标志;将所述图像与各所述交通标志进行匹配,得到至少一个匹配结果;将所述至少一个匹配结果作为所述图像的识别结果。
在一些实施例中,所述识别模块4552还用于,对所述图像进行特征提取,得到所述图像的特征向量,并对各所述交通标志进行特征提取,得到各所述交通标志的标准特征向量;基于所述特征向量与各所述标准特征向量,确定所述图像与各所述交通标志的相似度;将所述相似度作为所述图像与所述交通标志的匹配结果。
在一些实施例中,所述识别模块4552还用于,分别确定所述特征向量与各所述标准特征向量间的欧氏距离;获取所述图像与所述交通标志的相似度与所述欧氏距离间的映射关系;基于特征向量与各所述标准特征向量间的欧氏距离及所述映射关系,确定所述图像与各所述交通标志的相似度。
在一些实施例中,所述装置还包括确定模块,所述确定模块用于从所述图像与各所述交通标志的相似度中,选取相似度最大值;将所述相似度最大值与相似度阈值进行比对,得到比对结果;当所述比对结果指示所述相似度最大值达到所述相似度阈值时,确定所述图像中包含交通标志。
在一些实施例中,所述获取模块4553还用于,获取所述交通标志对应的文本提示信息;对所述文本提示信息进行语音转换,得到所述交通标志对应的语音提示信息。
在一些实施例中,所述获取模块4553还用于,对所述文本提示信息进行音素分析,得到所述文本提示信息对应的音素序列;基于所述音素序列,确定所述音素序列中各音素所对应的语音合成参数;基于各所述语音合成参数,合成所述交通标志对应的语音提示信息。
在一些实施例中,所述获取模块4553还用于,获取所述交通标志的标志名称,以及所述车辆的当前行驶状态;结合所述交通标志的标志名称以及所述当前行驶状态,生成所述交通标志对应的语音提示信息。
在一些实施例中,所述获取模块4553还用于,结合所述交通标志的标志名称以及所述当前行驶状态,生成所述交通标志对应的文本提示信息;对所述交通标志对应的文本提示信息进行语音转换,得到交通标志对应的语音提示信息。
在一些实施例中,所述装置还包括呈现模块,所述呈现模块用于发送所述交通标志至所述导航终端,以使所述导航终端导航地图上呈现所述交通标志。
在一些实施例中,所述装置还包括选取模块,所述选取模块用于当所述识别结果表征所述图像中包含交通标志、且包含的交通标志的数量为至少两个时,分别获取各所述交通标志对所述车辆的行驶状态的影响程度;从所述至少两个交通标志中,选取所述影响程度最大的交通标志作为目标交通标志;所述获取模块4553还用于,获取所述目标交通标志对应的语音提示信息。
在一些实施例中,所述装置还包括检测模块,所述检测模块用于检测所述车辆的驾驶状态;当所述驾驶状态与所述语音提示信息的内容不匹配时,发送状态语音提示信息至所述车辆对应的导航终端;其中,所述状态语音提示信息,用于提示针对所述交通标志进行驾驶状态的转换。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例上述的车辆的导航方法。
本申请实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的车辆的导航方法,例如,如图3示出的车辆的导航方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
综上所述,通过本申请实施例能够实现以下技术效果:
(1)通过对实时采集的车辆所处行驶道路中的图像进行交通标志识别,从而在图像中包含交通标志时,获取交通标志对应的语音提示信息,并将语音提示信息通过导航终端进行播放,如此,能够在车辆导航过程中对采集到的图像进行交通标示识别并进行相应的语音提示,从而提升驾驶过程中的安全性。
(2)通过对采集到的图像进行标准化处理,从而消除自然环境下由于图像采集装置的角度、环境光照、背景等变化的影响,提高识别效果
(3)利用基于欧氏距离及多分类算法模型构建的相似度模型来确定采集到的图像与交通标志之间的相似度,解决由于采集到的图像由于光线、路面湿滑、交通标志有缺失等情况下导致特征提取不清晰,导致相似度计算不准确带来的问题,有效提高了相似度计算的准确度。
(4)通过检测车辆的驾驶状态与语音提示信息的内容是否匹配,当不匹配时发送提醒用户转换驾驶状态的状态语音提示信息,从而提高了车辆驾驶过程中的安全性。
(5)通过对实时交通标志的采集与处理,提高了车辆在行车过程当中的交通信号处理能力。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。
Claims (16)
1.一种车辆的导航方法,其特征在于,所述方法包括:
获取在车辆导航过程中采集的车辆所处行驶道路中的图像;
对所述图像进行交通标志识别,得到识别结果;
当所述识别结果表征所述图像中包含交通标志时,获取所述交通标志对应的语音提示信息;
将所述语音提示信息发送至所述车辆对应的导航终端,以通过所述导航终端播放所述交通标志对应的所述语音提示信息。
2.如权利要求1所述的方法,其特征在于,所述对所述图像进行交通标志识别,得到识别结果,包括:
获取至少一个交通标志;
将所述图像与各所述交通标志进行匹配,得到至少一个匹配结果;
将所述至少一个匹配结果作为所述图像的识别结果。
3.如权利要求2所述的方法,其特征在于,所述将所述图像与各所述交通标志进行匹配,得到至少一个匹配结果,包括:
对所述图像进行特征提取,得到所述图像的特征向量,并对各所述交通标志进行特征提取,得到各所述交通标志的标准特征向量;
基于所述特征向量与各所述标准特征向量,确定所述图像与各所述交通标志的相似度;
将所述相似度作为所述图像与所述交通标志的匹配结果。
4.如权利要求3所述的方法,其特征在于,所述基于所述特征向量与各所述标准特征向量,确定所述图像与各所述交通标志的相似度,包括:
分别确定所述特征向量与各所述标准特征向量间的欧氏距离;
获取所述图像与所述交通标志的相似度与所述欧氏距离间的映射关系;
基于特征向量与各所述标准特征向量间的欧氏距离及所述映射关系,确定所述图像与各所述交通标志的相似度。
5.如权利要求3所述的方法,其特征在于,所述方法还包括:
从所述图像与各所述交通标志的相似度中,选取相似度最大值;
将所述相似度最大值与相似度阈值进行比对,得到比对结果;
当所述比对结果指示所述相似度最大值达到所述相似度阈值时,确定所述图像中包含交通标志。
6.如权利要求1所述的方法,其特征在于,所述获取所述交通标志对应的语音提示信息,包括:
获取所述交通标志对应的文本提示信息;
对所述文本提示信息进行语音转换,得到所述交通标志对应的语音提示信息。
7.如权利要求6所述的方法,其特征在于,所述对所述文本提示信息进行语音转换,得到所述交通标志对应的语音提示信息,包括:
对所述文本提示信息进行音素分析,得到所述文本提示信息对应的音素序列;
基于所述音素序列,确定所述音素序列中各音素所对应的语音合成参数;
基于各所述语音合成参数,合成所述交通标志对应的语音提示信息。
8.如权利要求1所述的方法,其特征在于,所述获取所述交通标志对应的语音提示信息,包括:
获取所述交通标志的标志名称,以及所述车辆的当前行驶状态;
结合所述交通标志的标志名称以及所述当前行驶状态,生成所述交通标志对应的语音提示信息。
9.如权利要求8所述的方法,其特征在于,所述结合所述交通标志的标志名称以及所述当前行驶状态,生成所述交通标志对应的语音提示信息,包括:
结合所述交通标志的标志名称以及所述当前行驶状态,生成所述交通标志对应的文本提示信息;
对所述交通标志对应的文本提示信息进行语音转换,得到交通标志对应的语音提示信息。
10.如权利要求1所述的方法,其特征在于,当所述识别结果表征所述图像中包含交通标志时,所述方法还包括:
发送所述交通标志至所述导航终端,以使所述导航终端导航地图上呈现所述交通标志。
11.如权利要求1所述的方法,其特征在于,所述方法还包括:
当所述识别结果表征所述图像中包含交通标志、且包含的交通标志的数量为至少两个时,分别获取各所述交通标志对所述车辆的行驶状态的影响程度;
从所述至少两个交通标志中,选取所述影响程度最大的交通标志作为目标交通标志;
所述获取所述交通标志对应的语音提示信息,包括:
获取所述目标交通标志对应的语音提示信息。
12.如权利要求1所述的方法,其特征在于,所述将所述语音提示信息发送至所述车辆对应的导航终端之后,所述方法还包括:
检测所述车辆的驾驶状态;
当所述驾驶状态与所述语音提示信息的内容不匹配时,发送状态语音提示信息至所述车辆对应的导航终端;
其中,所述状态语音提示信息,用于提示针对所述交通标志进行驾驶状态的转换。
13.一种车辆的导航装置,其特征在于,所述装置包括:
采集模块,用于获取在车辆导航过程中采集的车辆所处行驶道路中的图像;
识别模块,用于对所述图像进行交通标志识别,得到识别结果;
获取模块,用于当所述识别结果表征所述图像中包含交通标志时,获取所述交通标志对应的语音提示信息;
发送模块,用于将所述语音提示信息发送至所述车辆对应的导航终端,以通过所述导航终端播放所述交通标志对应的所述语音提示信息。
14.一种电子设备,其特征在于,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至12任一项所述的车辆的导航方法。
15.一种计算机可读存储介质,其特征在于,存储有可执行指令,用于引起处理器执行时,实现权利要求1-12任一项所述的车辆的导航方法。
16.一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时实现权利要求1至12任一项所述的车辆的导航方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210002229.3A CN114353819A (zh) | 2022-01-04 | 2022-01-04 | 车辆的导航方法、装置、设备、存储介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210002229.3A CN114353819A (zh) | 2022-01-04 | 2022-01-04 | 车辆的导航方法、装置、设备、存储介质及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114353819A true CN114353819A (zh) | 2022-04-15 |
Family
ID=81104537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210002229.3A Pending CN114353819A (zh) | 2022-01-04 | 2022-01-04 | 车辆的导航方法、装置、设备、存储介质及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114353819A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117093811A (zh) * | 2023-07-17 | 2023-11-21 | 上海智能汽车融合创新中心有限公司 | 一种自动驾驶安全能力评价方法、装置及设备 |
CN117493820A (zh) * | 2024-01-03 | 2024-02-02 | 中国电子工程设计院股份有限公司 | 一种数据要素处理方法和装置 |
CN117093811B (zh) * | 2023-07-17 | 2024-05-10 | 上海智能汽车融合创新中心有限公司 | 一种自动驾驶安全能力评价方法、装置及设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102024152A (zh) * | 2010-12-14 | 2011-04-20 | 浙江大学 | 一种基于稀疏表达和字典学习进行交通标志识别的方法 |
CN102867427A (zh) * | 2011-07-07 | 2013-01-09 | 鸿富锦精密工业(深圳)有限公司 | 交通标志提示系统及方法 |
CN103020623A (zh) * | 2011-09-23 | 2013-04-03 | 株式会社理光 | 交通标志检测方法和交通标志检测设备 |
CN104008377A (zh) * | 2014-06-07 | 2014-08-27 | 北京联合大学 | 基于时空关联的地面交通标志实时检测识别方法 |
CN109059945A (zh) * | 2018-06-07 | 2018-12-21 | Oppo(重庆)智能科技有限公司 | 路况信息处理的方法、终端设备及计算机可读存储介质 |
CN111149141A (zh) * | 2017-09-04 | 2020-05-12 | Nng软件开发和商业有限责任公司 | 用于收集并使用来自交通工具的传感器数据的方法和装置 |
CN112712066A (zh) * | 2021-01-19 | 2021-04-27 | 腾讯科技(深圳)有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
-
2022
- 2022-01-04 CN CN202210002229.3A patent/CN114353819A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102024152A (zh) * | 2010-12-14 | 2011-04-20 | 浙江大学 | 一种基于稀疏表达和字典学习进行交通标志识别的方法 |
CN102867427A (zh) * | 2011-07-07 | 2013-01-09 | 鸿富锦精密工业(深圳)有限公司 | 交通标志提示系统及方法 |
CN103020623A (zh) * | 2011-09-23 | 2013-04-03 | 株式会社理光 | 交通标志检测方法和交通标志检测设备 |
CN104008377A (zh) * | 2014-06-07 | 2014-08-27 | 北京联合大学 | 基于时空关联的地面交通标志实时检测识别方法 |
CN111149141A (zh) * | 2017-09-04 | 2020-05-12 | Nng软件开发和商业有限责任公司 | 用于收集并使用来自交通工具的传感器数据的方法和装置 |
CN109059945A (zh) * | 2018-06-07 | 2018-12-21 | Oppo(重庆)智能科技有限公司 | 路况信息处理的方法、终端设备及计算机可读存储介质 |
CN112712066A (zh) * | 2021-01-19 | 2021-04-27 | 腾讯科技(深圳)有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117093811A (zh) * | 2023-07-17 | 2023-11-21 | 上海智能汽车融合创新中心有限公司 | 一种自动驾驶安全能力评价方法、装置及设备 |
CN117093811B (zh) * | 2023-07-17 | 2024-05-10 | 上海智能汽车融合创新中心有限公司 | 一种自动驾驶安全能力评价方法、装置及设备 |
CN117493820A (zh) * | 2024-01-03 | 2024-02-02 | 中国电子工程设计院股份有限公司 | 一种数据要素处理方法和装置 |
CN117493820B (zh) * | 2024-01-03 | 2024-04-02 | 中国电子工程设计院股份有限公司 | 一种数据要素处理方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102266529B1 (ko) | 이미지 기반의 데이터 처리 방법, 장치, 기기 및 판독 가능 저장 매체 | |
US9548048B1 (en) | On-the-fly speech learning and computer model generation using audio-visual synchronization | |
CN111931929B (zh) | 一种多任务模型的训练方法、装置及存储介质 | |
US11200892B1 (en) | Speech-enabled augmented reality user interface | |
US11270694B2 (en) | Artificial intelligence apparatus and method for recognizing speech by correcting misrecognized word | |
KR102281600B1 (ko) | 합성 음성에 대한 보정을 수행하는 인공 지능 장치 및 그 방법 | |
KR20190110072A (ko) | 사용자의 음성을 인식하는 인공 지능 장치 및 그 방법 | |
WO2023020005A1 (zh) | 神经网络模型的训练方法、图像检索方法、设备和介质 | |
US11195528B2 (en) | Artificial intelligence device for performing speech recognition | |
US11508358B2 (en) | Artificial intelligence apparatus and method for recognizing speech in consideration of utterance style | |
CN113421547A (zh) | 一种语音处理方法及相关设备 | |
CN117079299B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN116564338B (zh) | 语音动画生成方法、装置、电子设备和介质 | |
CN116958342A (zh) | 虚拟形象的动作生成方法、动作库的构建方法及装置 | |
CN114353819A (zh) | 车辆的导航方法、装置、设备、存储介质及程序产品 | |
US20220375469A1 (en) | Intelligent voice recognition method and apparatus | |
US20230052442A1 (en) | Analyzing Objects Data to Generate a Textual Content Reporting Events | |
Salam et al. | You Only Look Once (YOLOv3): Object Detection and Recognition for Indoor Environment | |
Temsamani et al. | A multimodal AI approach for intuitively instructable autonomous systems: a case study of an autonomous off-highway vehicle | |
US20240096093A1 (en) | Ai-driven augmented reality mentoring and collaboration | |
CN111971670A (zh) | 在对话中生成响应 | |
CN115565152B (zh) | 融合车载激光点云与全景影像的交通标志牌提取方法 | |
Bhukhya et al. | Virtual Assistant and Navigation for Visually Impaired using Deep Neural Network and Image Processing | |
US20230055477A1 (en) | Speech-enabled augmented reality | |
US20230178071A1 (en) | Method for determining a vehicle domain and a speech recognition system for a vehicle |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40070412 Country of ref document: HK |