CN110908718A - 人脸识别激活语音导航方法、系统、存储介质及设备 - Google Patents

人脸识别激活语音导航方法、系统、存储介质及设备 Download PDF

Info

Publication number
CN110908718A
CN110908718A CN201811075537.9A CN201811075537A CN110908718A CN 110908718 A CN110908718 A CN 110908718A CN 201811075537 A CN201811075537 A CN 201811075537A CN 110908718 A CN110908718 A CN 110908718A
Authority
CN
China
Prior art keywords
face
voice
face recognition
voice navigation
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811075537.9A
Other languages
English (en)
Inventor
沙丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Qinggan Intelligent Technology Co Ltd
Original Assignee
Shanghai Qinggan Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Qinggan Intelligent Technology Co Ltd filed Critical Shanghai Qinggan Intelligent Technology Co Ltd
Priority to CN201811075537.9A priority Critical patent/CN110908718A/zh
Publication of CN110908718A publication Critical patent/CN110908718A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4418Suspend and resume; Hibernate and awake

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computer Security & Cryptography (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种人脸识别激活语音导航方法、系统、存储介质及设备。述人脸识别激活语音导航方法包括:车机的导航设备上至少安装有一个摄像头;所述车机与所述摄像头通信相连;通过摄像头检测判断是否有人脸面对;若是,则激活语音模块;若否,则继续检测是否有人脸面对。本发明解决了在传统车载导航系统中需要用户语音发送指令才能唤醒激活语音模块的问题。并创造性的运用了摄像头辅助的人脸识别系统实现当人脸面对导航系统时自动激活唤醒导航系统的功能。

Description

人脸识别激活语音导航方法、系统、存储介质及设备
技术领域
本发明特别是涉及一种人脸识别激活语音导航方法、系统、存储介质及设备。
背景技术
一般车载导航系统,用户语音发送指令时候,都需要唤醒词(比如:你好,语音助理)来激活语音模块,这样语音模块才知道用户要开始发送语音指令在和自己说话,才会开始工作。
用户每发送一次语音指令,都要说一次唤醒词来激活语音模块,对用户来说非常麻烦,体验很差。但是如果不进行唤醒激活这个步骤,直接让语音系统识别用户语音指令的话,用户的普通谈话也会被误认为语音指令,做出不必要的回应,也会给用户带来困扰。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种完整的发明名称,用于解决现有技术中在传统车载导航系统中需要用户语音发送指令才能唤醒激活语音模块的问题。
为实现上述目的及其他相关目的,本发明提供一种人脸识别激活语音导航方法,所述人脸识别激活语音导航方法包括:车机的导航设备上至少安装有一个摄像头;所述车机与所述摄像头通信相连;通过摄像头检测判断是否有人脸面对;若是,则激活语音模块;若否,则继续检测是否有人脸面对。
于本发明的一实施例中,所述通信相连包括:蓝牙连接,或/和AP热点连接。
于本发明的一实施例中,所述人脸识别激活语音导航方法还包括:接收语音唤醒词;激活语音导航。
于本发明的一实施例中,所述人脸识别激活语音导航方法还包括:当有人脸面对时激活语音模块后继续检测是否有语音指令;若是,则执行语音指令;若否,则关闭、和/或休眠所述语音模块。
于本发明的一实施例中,所述人脸识别激活语音导航方法还包括:检测判断是否为特定车主人脸;若是,则激活唤醒所述语音导航;若否,不唤醒激活、和/或锁定所述语音导航系统。
为实现上述目的及其他相关目的,本发明还提供一种人脸识别激活语音导航系统,所述人脸识别激活语音导航系统包括:摄像模块,用于对人脸进行摄像;处理模块,用于检测判断是否有人脸面对;执行模块,用于控制所述语音导航系统。
于本发明的一实施例中,所述用于检测判断是否有人脸面对并控制所述语音导航系统的一种实现过程包括:当有人脸面对时激活语音模块后继续检测是否有语音指令;若是,则执行语音指令;若否,则关闭、和/或休眠所述语音模块。
于本发明的一实施例中,所述用于检测判断是否有人脸面对并控制所述语音导航系统的一种实现过程包括:检测判断是否为特定车主人脸;若是,则激活唤醒所述语音导航;若否,不唤醒激活、和/或锁定所述语音导航系统。
为实现上述目的及其他相关目的,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行如本发明所述的人脸识别激活语音导航方法。
为实现上述目的及其他相关目的,本发明还提供一种设备,所述设备包括:所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述设备执行如本发明所述人脸识别激活语音导航方法。
如上所述,本发明的人脸识别激活语音导航方法、系统、存储介质及设备,具有以下有益效果:本发明解决了在传统车载导航系统中需要用户语音发送指令才能唤醒激活语音模块的问题。并创造性的运用了摄像头辅助的人脸识别系统实现当人脸面对导航系统时自动激活唤醒导航系统的功能。
附图说明
图1A显示为本发明实施例所述的一种人脸识别激活语音导航方法的一种实现流程示意图。
图1B显示为本发明实施例所述的一种人脸识别激活语音导航方法的一种实现流程示意图。
图2显示为本发明实施例所述的一种人脸识别激活语音模块系统的一种结构示意图。
图3显示为本发明实施例所述的一种设备的一种结构示意图。
元件标号说明
20 人脸识别激活语音导航系统
21 摄像模块
22 处理模块
23 执行模块
30 设备
31 处理器
32 存储器
S201~S203 步骤
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
请参阅图1A和1B所示,本发明提供一种人脸识别激活语音导航方法,所述人脸识别激活语音导航方法包括:
S101、车机的导航设备上至少安装有一个摄像头;所述车机与所述摄像头通信相连;
S102、通过摄像头检测判断是否有人脸面对;
S103、若是,则激活语音模块;
S104、若否,则继续检测是否有人脸面对。
于本发明的一实施例中,所述通信相连包括:蓝牙连接,或/和AP热点连接。具体的,还可以是有线的方式(例如车机和监测设备都接入CAN总线系统,或者直接通过硬线连接也行)。
于本发明的一实施例中,所述人脸识别激活语音导航方法还包括:
接收语音唤醒词;
激活语音导航。
于本发明的一实施例中,所述人脸识别激活语音导航方法还包括:
当有人脸面对时激活语音模块后继续检测是否有语音指令;
若是,则执行语音指令;
若否,则关闭、和/或休眠所述语音模块。
于本发明的一实施例中,所述人脸识别激活语音导航方法还包括:
S201、检测判断是否为特定车主人脸;
S202、若是,则激活唤醒所述语音导航;
S203、若否,不唤醒激活、和/或锁定所述语音导航系统。
更具体的,一般车载导航系统,用户语音发送指令时候,都需要唤醒词(比如:你好,语音助理)来激活语音模块,这样语音模块才知道用户要开始发送语音指令在和自己说话,才会开始工作。也就是用户每发送一次语音指令,都要说一次唤醒词来激活语音模块,对用户来说非常麻烦,体验很差。但是如果不进行唤醒激活这个步骤,直接让语音系统识别用户语音指令的话,用户的普通谈话也会被误认为语音指令,做出不必要的回应,也会给用户带来困扰。在就具体的实现过程中,摄像头检测到有人脸正对摄像头,激活语音模块。此时用户发出的语音,语音模块开始接收,并分析语音做出回应。摄像头检测到无人脸正对摄像头,关闭语音模块。此时用户发出任何声音,语音模块不做任何相应。用户发出唤醒词“比如:你好,语音助理”,此时无需检测摄像头,也激活语音模块。本实施例在硬件增加摄像头,通过摄像头识别人脸,来确定是否接收语音指令,省去了用户不停说同一句唤醒词来激活语音模块。同时对于用户无法对着摄像头的情况,仍然可以用唤醒词唤醒,极大提高了用户体验。本提案,通过在车载系统硬件中,增加前置摄像头,当摄像头检测到人脸时,认为有人对着系统说话(发送指令),则不要识别到唤醒词即可激活语音模块,对用户的语音指令做出反应,省去了用户不停的说同样的唤醒词;当摄像头没有检测到人脸时,仍然需要唤醒词激活语音模块,这样用户不方便对着摄像头的时候,仍可以使用唤醒词激活语音模块。
——语音导航,以语音识别、语音编解码为代表的智能语音技术。应用在车载领域,车内语音声控操作,将改变汽车现有的人机信息交流方式,解放出驾驶者的双手和双眼,使汽车更具备人性化魅力和个性化特色。该技术引起汽车业界的广泛关注,尤其在美国、欧洲、日本等汽车工业发达国家,都在不断加大研究和产业化的力度.在车载环境下,由于屏幕小,安全性等因素给用户操作设备和获取信息带来很大不便。而语音技术的成熟和应用给这个问题带来了答案。如果车载设备应用了语音合成技术,那么在车载环境下,就不必再用眼睛去看汽车里本来就很小的屏幕了,驾驶员只需专心驾驶汽车,就可以享受先进的语音技术带来的方便了。在导航设备中,不用在驾驶的过程中查看导航仪的屏幕,只需要在出发的时候输入目的地,设备就可以在您行进途中实时用语音播报行车路线,另外,还可以在地图上集成一些沿线的餐饮娱乐旅游等信息,在途中进行播放,从而增加了驾车过程的娱乐性,很方便。在调度终端中,如果应用了语音合成技术的话,调度终端就可以实时实时播报调度中心发来的各种信息,如调度信息,各种重要事项提示,交通状况信息等等。也可以在车载电话中集成语音合成技术,当有新的来电时,便可以播报出来电者姓名或者号码,而有新的短消息来到时也可以把短信内容和发信人姓名或号码大声地读给您听。如果车载设备中应用了语音识别技术的话,就可以进一步省去我们进行操作设备时繁琐的按键动作,只需对着设备大声说出我们希望设备做的事情,设备便可以识别我们的命令,并且按照我们的命令进行操作。这样驾驶员的手和大脑都可以解放出来,不用去考虑该怎么按键,而手也可以专注于驾车操作,保证了驾驶员的安全。缺点:由于此项技术语音识别软件语音识别率还不高,市场成品应用率极低;真人秘书服务声控导航;a、蓝牙一键通声控导航,优势:直接利用手机蓝牙和车载导航主机连接,蓝牙首次连接后,后续会自动连接。信号稳定,品质可靠;b、外加通讯盒声控导航;缺点:外加通讯盒,其信号接收模块和几千元的手机信号接收模块是无法比拟的,当信号不好区域,手机有信号而车载导航未必会有信号,造成较多客户投诉。另相对于蓝牙一键通还需加配通讯盒及电话卡。连通真人秘书——告之你要去的目的地——真人秘书帮你设定好并发送到您的车载导航屏幕上;三、传统导航实现方式:打开到导航界面——点击查找——手写输入目的地;四、语音控制的声控导航功能优势:1、声控导航,后台秘书人员为您设定您要到达的目的地;2、一键通酒店、机票查询预订;3、VIP私人电话秘书服务;4、一键通紧急救援;5、一键通违章信息查询;语音声控导航的优势在于告别了手写,完全解放双手,更方便更安全!同时人性化的秘书服务,更能体现出您对爱车生活品位的追求。
——人脸识别,人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。人脸识别系统成功的关键在于是否拥有尖端的核心算法,并使识别结果具有实用化的识别率和识别速度;“人脸识别系统”集成了人工智能、机器识别、机器学习、模型理论、专家系统、视频图像处理等多种专业技术,同时需结合中间值处理的理论与实现,是生物特征识别的最新应用,其核心技术的实现,展现了弱人工智能向强人工智能的转化。传统的人脸识别技术主要是基于可见光图像的人脸识别,这也是人们熟悉的识别方式,已有30多年的研发历史。但这种方式有着难以克服的缺陷,尤其在环境光照发生变化时,识别效果会急剧下降,无法满足实际系统的需要。解决光照问题的方案有三维图像人脸识别,和热成像人脸识别。但这两种技术还远不成熟,识别效果不尽人意。迅速发展起来的一种解决方案是基于主动近红外图像的多光源人脸识别技术。它可以克服光线变化的影响,已经取得了卓越的识别性能,在精度、稳定性和速度方面的整体系统性能超过三维图像人脸识别。这项技术在近两三年发展迅速,使人脸识别技术逐渐走向实用化。人脸与人体的其它生物特征(指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提,与其它类型的生物识别比较人脸识别具有如下特点:非强制性:用户不需要专门配合人脸采集设备,几乎可以在无意识的状态下就可获取人脸图像,这样的取样方式没有“强制性”;非接触性:用户不需要和设备直接接触就能获取人脸图像;并发性:在实际应用场景下可以进行多个人脸的分拣、判断及识别;除此之外,还符合视觉特性:“以貌识人”的特性,以及操作简单、结果直观、隐蔽性好等特点。人脸识别系统主要包括四个组成部分,分别为:人脸图像采集及检测、人脸图像预处理、人脸图像特征提取以及匹配与识别。脸图像采集:不同的人脸图像都能通过摄像镜头采集下来,比如静态图像、动态图像、不同的位置、不同表情等方面都可以得到很好的采集。当用户在采集设备的拍摄范围内时,采集设备会自动搜索并拍摄用户的人脸图像。人脸检测:人脸检测在实际中主要用于人脸识别的预处理,即在图像中准确标定出人脸的位置和大小。人脸图像中包含的模式特征十分丰富,如直方图特征、颜色特征、模板特征、结构特征及Haar特征等。人脸检测就是把这其中有用的信息挑出来,并利用这些特征实现人脸检测。主流的人脸检测方法基于以上特征采用Adaboost学习算法,Adaboost算法是一种用来分类的方法,它把一些比较弱的分类方法合在一起,组合出新的很强的分类方法。人脸检测过程中使用Adaboost算法挑选出一些最能代表人脸的矩形特征(弱分类器),按照加权投票的方式将弱分类器构造为一个强分类器,再将训练得到的若干强分类器串联组成一个级联结构的层叠分类器,有效地提高分类器的检测速度。人脸图像预处理:对于人脸的图像预处理是基于人脸检测结果,对图像进行处理并最终服务于特征提取的过程。系统获取的原始图像由于受到各种条件的限制和随机干扰,往往不能直接使用,必须在图像处理的早期阶段对它进行灰度校正、噪声过滤等图像预处理。对于人脸图像而言,其预处理过程主要包括人脸图像的光线补偿、灰度变换、直方图均衡化、归一化、几何校正、滤波以及锐化等。人脸图像特征提取:人脸识别系统可使用的特征通常分为视觉特征、像素统计特征、人脸图像变换系数特征、人脸图像代数特征等。人脸特征提取就是针对人脸的某些特征进行的。人脸特征提取,也称人脸表征,它是对人脸进行特征建模的过程。人脸特征提取的方法归纳起来分为两大类:一种是基于知识的表征方法;另外一种是基于代数特征或统计学习的表征方法。基于知识的表征方法主要是根据人脸器官的形状描述以及他们之间的距离特性来获得有助于人脸分类的特征数据,其特征分量通常包括特征点间的欧氏距离、曲率和角度等。人脸由眼睛、鼻子、嘴、下巴等局部构成,对这些局部和它们之间结构关系的几何描述,可作为识别人脸的重要特征,这些特征被称为几何特征。基于知识的人脸表征主要包括基于几何特征的方法和模板匹配法。人脸图像匹配与识别:提取的人脸图像的特征数据与数据库中存储的特征模板进行搜索匹配,通过设定一个阈值,当相似度超过这一阈值,则把匹配得到的结果输出。人脸识别就是将待识别的人脸特征与已得到的人脸特征模板进行比较,根据相似程度对人脸的身份信息进行判断。这一过程又分为两类:一类是确认,是一对一进行图像比较的过程,另一类是辨认,是一对多进行图像匹配对比的过程。一般来说,人脸识别系统包括图像摄取、人脸定位、图像预处理、以及人脸识别(身份确认或者身份查找)。系统输入一般是一张或者一系列含有未确定身份的人脸图像,以及人脸数据库中的若干已知身份的人脸图象或者相应的编码,而其输出则是一系列相似度得分,表明待识别的人脸的身份。人脸识别算法分类基于人脸特征点的识别算法(Feature-based recognition algorithms)。基于整幅人脸图像的识别算法(Appearance-based recognition algorithms)。基于模板的识别算法(Template-based recognitionalgorithms)。利用神经网络进行识别的算法(Recognition algorithms using neuralnetwork)。神经网络识别基于光照估计模型理论,提出了基于Gamma灰度矫正的光照预处理方法,并且在光照估计模型的基础上,进行相应的光照补偿和光照平衡策略。优化的形变统计校正理论,基于统计形变的校正理论,优化人脸姿态;强化迭代理论,强化迭代理论是对DLFA人脸检测算法的有效扩展;独创的实时特征识别理论,该理论侧重于人脸实时数据的中间值处理,从而可以在识别速率和识别效能之间,达到最佳的匹配效果人脸识别需要积累采集到的大量人脸图像相关的数据,用来验证算法,不断提高识别准确性,这些数据诸如ANeural Network Face Recognition Assignment(神经网络人脸识别数据)、orl人脸数据库、麻省理工学院生物和计算学习中心人脸识别数据库、埃塞克斯大学计算机与电子工程学院人脸识别数据等。现有的人脸识别系统在用户配合、采集条件比较理想的情况下可以取得令人满意的结果。但是,在用户不配合、采集条件不理想的情况下,现有系统的识别率将陡然下降。比如,人脸比对时,与系统中存储的人脸有出入,例如剃了胡子、换了发型、多了眼镜、变了表情都有可能引起比对失败。人脸识别的优势在于其自然性和不被被测个体察觉的特点。所谓自然性,是指该识别方式同人类(甚至其他生物)进行个体识别时所利用的生物特征相同。例如人脸识别,人类也是通过观察比较人脸区分和确认身份的,另外具有自然性的识别还有虹膜识别,语音识别、体形识别等,而指纹识别、虹膜识别等都不具有自然性,因为人类或者其他生物并不通过此类生物特征区别个体。不被察觉的特点对于一种识别方法也很重要,这会使该识别方法不令人反感,并且因为不容易引起人的注意而不容易被欺骗。人脸识别具有这方面的特点,它完全利用可见光获取人脸图像信息,而不同于指纹识别或者虹膜识别,需要利用电子压力传感器采集指纹,或者利用红外线采集虹膜图像,这些特殊的采集方式很容易被人察觉,从而更有可能被伪装欺骗。人脸识别被认为是生物特征识别领域甚至人工智能领域最困难的研究课题之一。人脸识别的困难主要是人脸作为生物特征的特点所带来的。人脸类似性不同个体之间的区别不大,所有的人脸的结构都相似,甚至人脸器官的结构外形都很相似。这样的特点对于利用人脸进行定位是有利的,但是对于利用人脸区分人类个体是不利的。人脸的外形很不稳定,人可以通过脸部的变化产生很多表情,而在不同观察角度,人脸的视觉图像也相差很大,另外,人脸识别还受光照条件(例如白天和夜晚,室内和室外等)、人脸的很多遮盖物(例如口罩、墨镜、头发、胡须等)、年龄等多方面因素的影响。在人脸识别中,第一类的变化是应该放大而作为区分个体的标准的,而第二类的变化应该消除,因为它们可以代表同一个个体。通常称第一类变化为类间变化(inter-class difference),而称第二类变化为类内变化(intra-class difference)。对于人脸,类内变化往往大于类间变化,从而使在受类内变化干扰的情况下利用类间变化区分个体变得异常困难。人脸识别主要用于身份识别。人脸识别主要用于身份识别。由于视频监控正在快速普及,众多的视频监控应用迫切需要一种远距离、用户非配合状态下的快速身份识别技术,以求远距离快速确认人员身份,实现智能预警。人脸识别技术无疑是最佳的选择,采用快速人脸检测技术可以从监控视频图象中实时查找人脸,并与人脸数据库进行实时比对,从而实现快速身份识别。生物识别技术已广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域。例如,一位储户走进了银行,他既没带银行卡,也没有回忆密码就径直提款,当他在提款机上提款时,一台摄像机对该用户的眼睛扫描,然后迅速而准确地完成了用户身份鉴定,办理完业务。这是美国德克萨斯州联合银行的一个营业部中发生的一个真实的镜头。而该营业部所使用的正是现代生物识别技术中的“虹膜识别系统”。此外,美国“9.11”事件后,反恐怖活动已成为各国政府的共识,加强机场的安全防务十分重要。美国维萨格公司的脸像识别技术在美国的两家机场大显神通,它能在拥挤的人群中挑出某一张面孔,判断他是不是通缉犯。当前社会上频繁出现的入室偷盗、抢劫、伤人等案件的不断发生,鉴于此种原因,防盗门开始走进千家万户,给家庭带来安宁;然而,随着社会的发展,技术的进步,生活节奏的加速,消费水平的提高,人们对于家居的期望也越来越高,对便捷的要求也越来越迫切,基于传统的纯粹机械设计的防盗门,除了坚固耐用外,很难快速满足这些新兴的需求:便捷,开门记录等功能。人脸识别技术已经得到广泛的认同,但其应用门槛仍然很高:技术门槛高(开发周期长),经济门槛高(价格高)。人脸识别产品已广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗及众多企事业单位等领域。随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的领域。1、企业、住宅安全和管理。如人脸识别门禁考勤系统,人脸识别防盗门等。2、电子护照及身份证。中国的电子护照计划公安部一所正在加紧规划和实施。3、公安、司法和刑侦。如利用人脸识别系统和网络,在全国范围内搜捕逃犯。4、自助服务。5、信息安全。如计算机登录、电子政务和电子商务。在电子商务中交易全部在网上完成,电子政务中的很多审批流程也都搬到了网上。而当前,交易或者审批的授权都是靠密码来实现,如果密码被盗,就无法保证安全。但是使用生物特征,就可以做到当事人在网上的数字身份和真实身份统一,从而大大增加电子商务和电子政务系统的可靠性。人脸自动对焦和笑脸快门技术:首先是面部捕捉。它根据人的头部的部位进行判定,首先确定头部,然后判断眼睛和嘴巴等头部特征,通过特征库的比对,确认是人面部,完成面部捕捉。然后以人脸为焦点进行自动对焦,可以大大的提升拍出照片的清晰度。笑脸快门技术就是在人脸识别的基础上,完成了面部捕捉,然后开始判断嘴的上弯程度和眼的下弯程度,来判断是不是笑了。以上所有的捕捉和比较都是在对比特征库的情况下完成的,所以特征库是基础,里面有各种典型的面部和笑脸特征数据。受安全保护的地区可以通过人脸识别辨识试图进入者的身份。人脸识别系统可用于企业、住宅安全和管理。如人脸识别门禁考勤系统,人脸识别防盗门等。人脸识别门禁是基于先进的人脸识别技术,结合成熟的ID卡和指纹识别技术而推出的安全实用的门禁产品。产品采用分体式设计,人脸、指纹和ID卡信息的采集和生物信息识别及门禁控制内外分离,实用性高、安全可靠。系统采用网络信息加密传输,支持远程进行控制和管理,可广泛应用于银行、军队、公检法、智能楼宇等重点区域的门禁安全控制。如电子护照及身份证。这或许是未来规模应用。在国际民航组织已确定,可在机场、体育场、超级市场等公共场所对人群进行监视,例如在机场安装监视系统以防止恐怖分子登机。如银行的自动提款机,用户卡片和密码被盗,就会被他人冒取现金。同时应用人脸识别就会避免这种情况的发生。通过查询目标人像数据寻找数据库中是否存在重点人口基本信息。例如在机场或车站安装系统以抓捕在逃案犯。利用人脸识别辅助信用卡网络支付,以防止非信用卡的拥有者使用信用卡等。如计算机登录、电子政务和电子商务。在电子商务中交易全部在网上完成,电子政务中的很多审批流程也都搬到了网上。而当前,交易或者审批的授权都是靠密码来实现。如果密码被盗,就无法保证安全。如果使用生物特征,就可以做到当事人在网上的数字身份和真实身份统一。从而大大增加电子商务和电子政务系统的可靠性。人脸识别技术广泛地应用于日常生活中,如相机拍摄,图片对比等,尤其近两年来,相亲节目如火如荼,其中浙江电视台的爱情连连看中的最佳夫妻像环节就利用了人脸对比技术来测试男女主人公面相的相似程度。随着移动互联网的崛起,一些人脸识别技术的开发者将该项技术应用到娱乐领域中,如应用开心明星脸等,根据人脸的轮廓,肤色,纹理,质地,色彩,光照等特征来计算照片中主人公与明星的相似度。人脸识别系统,以协助公安部门抓捕在逃案犯,人脸识别产品及系统解决方案的高科技创新型企业。由该领域内的专家组成了核心技术研发团队,专注于以人脸识别技术为核心,覆盖考勤、门禁安防等多领域的产品设计与研发项目。现今人脸识别产品已广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗及众多企事业单位等领域。刷脸支付系统在中国国际金融展上亮相。刷脸支付系统基于天诚盛业自主研发的生物识别云金融平台,将自主知识产权军用级别的人脸识别算法与现有的支付系统进行融合,对接了我们生活中涉及到支付、转账、结算和交易的环节。在支付时人们不再需要银行卡、存折和密码,甚至是手机,只需要对着摄像头点个头、露个笑脸,刷脸支付系统将会在几秒内完成身份确认、账户读取、转账支付、交易确认等一站式支付环节,为用户创建更棒的支付体验。
本发明所述的人脸识别激活语音导航方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本发明的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本发明的保护范围内。
本发明还提供一种人脸识别激活语音导航系统20,所述人脸识别激活语音导航系统20可以实现本发明所述的人脸识别激活语音导航方法,但本发明所述的人脸识别激活语音导航方法的实现装置包括但不限于本实施例列举的人脸识别激活语音导航系统20的结构,凡是根据本发明的原理所做的现有技术的结构变形和替换,都包括在本发明的保护范围内。
请参阅图2所示,为实现上述目的及其他相关目的,本发明还提供一种人脸识别激活语音导航系统20,所述人脸识别激活语音导航系统20包括:
摄像模块21,用于对人脸进行摄像;
处理模块22,用于检测判断是否有人脸面对;
执行模块23,用于控制所述语音导航系统。
于本发明的一实施例中,所述用于检测判断是否有人脸面对并控制所述语音导航系统的一种实现过程包括:
当有人脸面对时激活语音模块后继续检测是否有语音指令;
若是,则执行语音指令;
若否,则关闭、和/或休眠所述语音模块。
于本发明的一实施例中,所述用于检测判断是否有人脸面对并控制所述语音导航系统的一种实现过程包括:
检测判断是否为特定车主人脸;
若是,则激活唤醒所述语音导航;
若否,不唤醒激活、和/或锁定所述语音导航系统。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现,也可以全部以硬件的形式实现,还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如:x模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现。此外,x模块也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上x模块的功能。其它模块的实现与之类似。这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),一个或多个微处理器31(Digital Singnal Processor,简称DSP),一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。这些模块可以集成在一起,以片上系统(System-on-a-chip,简称SOC)的形式实现。
为实现上述目的及其他相关目的,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器31执行如本发明所述的人脸识别激活语音导航方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
请参阅图3所示,为实现上述目的及其他相关目的,本发明还提供一种设备30,所述设备30包括:所述存储器32用于存储计算机程序,所述处理器31用于执行所述存储器32存储的计算机程序,以使所述设备30执行如本发明所述人脸识别激活语音导航方法。
更具体的,本实施例提供的设备,包括:处理器、存储器、收发器、通信接口或/和系统总线;存储器和通信接口通过系统总线与处理器和收发器连接并完成相互间的通信,存储器用于存储计算机程序,通信接口用于和其他设备进行通信,处理器和收发器用于运行计算机程序。上述提到的系统总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
如上所述,本发明的人脸识别激活语音导航方法和系统具有如下有益效果:并创造性的运用了摄像头辅助的人脸识别系统实现当人脸面对导航系统时自动激活唤醒导航系统的功能。
本发明解决了在传统车载导航系统中需要用户语音发送指令才能唤醒激活语音模块的问题,有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (10)

1.一种人脸识别激活语音导航方法,其特征在于,所述人脸识别激活语音导航方法包括:
车机的导航设备上至少安装有一个摄像头;所述车机与所述摄像头通信相连;
通过摄像头检测判断是否有人脸面对;
若是,则激活语音模块;
若否,则继续检测是否有人脸面对。
2.根据权利要求1所述的人脸识别激活语音导航方法,其特征在于,所述通信相连包括:蓝牙连接,或/和AP热点连接。
3.根据权利要求1所述的人脸识别激活语音导航方法,其特征在于,所述人脸识别激活语音导航方法还包括:
接收语音唤醒词;
激活语音导航。
4.根据权利要求1所述的人脸识别激活语音导航方法,其特征在于,所述人脸识别激活语音导航方法还包括:
当有人脸面对时激活语音模块后继续检测是否有语音指令;
若是,则执行语音指令;
若否,则关闭、和/或休眠所述语音模块。
5.根据权利要求1所述的人脸识别激活语音导航方法,其特征在于,所述人脸识别激活语音导航方法还包括:
检测判断是否为特定车主人脸;
若是,则激活唤醒所述语音导航;
若否,不唤醒激活、和/或锁定所述语音导航系统。
6.一种人脸识别激活语音导航系统,其特征在于,所述人脸识别激活语音导航系统包括:
摄像模块,用于对人脸进行摄像;
处理模块,与所述摄像模块耦合连接,用于检测判断是否有人脸面对;
执行模块,与所述处理模块耦合连接,用于控制所述语音导航系统。
7.根据权利要求6所述的人脸识别激活语音导航系统,其特征在于,所述用于检测判断是否有人脸面对并控制所述语音导航系统的一种实现过程包括:
当有人脸面对时激活语音模块后继续检测是否有语音指令;
若是,则执行语音指令;
若否,则关闭、和/或休眠所述语音模块。
8.根据权利要求6所述的人脸识别激活语音导航系统,其特征在于,所述用于检测判断是否有人脸面对并控制所述语音导航系统的一种实现过程包括:
检测判断是否为特定车主人脸;
若是,则激活唤醒所述语音导航;
若否,不唤醒激活、和/或锁定所述语音导航系统。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至5中任一项所述的人脸识别激活语音导航方法。
10.一种设备,其特征在于,所述设备包括:所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述设备执行如权利要求1至5中任一项所述人脸识别激活语音导航方法。
CN201811075537.9A 2018-09-14 2018-09-14 人脸识别激活语音导航方法、系统、存储介质及设备 Pending CN110908718A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811075537.9A CN110908718A (zh) 2018-09-14 2018-09-14 人脸识别激活语音导航方法、系统、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811075537.9A CN110908718A (zh) 2018-09-14 2018-09-14 人脸识别激活语音导航方法、系统、存储介质及设备

Publications (1)

Publication Number Publication Date
CN110908718A true CN110908718A (zh) 2020-03-24

Family

ID=69812522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811075537.9A Pending CN110908718A (zh) 2018-09-14 2018-09-14 人脸识别激活语音导航方法、系统、存储介质及设备

Country Status (1)

Country Link
CN (1) CN110908718A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112164395A (zh) * 2020-09-18 2021-01-01 北京百度网讯科技有限公司 车载语音启动方法、装置、电子设备和存储介质
CN112241329A (zh) * 2020-09-28 2021-01-19 深圳市商汤科技有限公司 识别引擎的监控方法、装置、设备及存储介质
CN116558536A (zh) * 2023-04-27 2023-08-08 中国第一汽车股份有限公司 一种车载导航语音交互方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009132347A (ja) * 2007-12-03 2009-06-18 Suzuki Motor Corp 飲酒運転防止装置
US20100080536A1 (en) * 2008-09-29 2010-04-01 Hitachi, Ltd. Information recording/reproducing apparatus and video camera
CN104834222A (zh) * 2015-04-30 2015-08-12 广东美的制冷设备有限公司 家用电器的控制方法和装置
CN105700363A (zh) * 2016-01-19 2016-06-22 深圳创维-Rgb电子有限公司 一种智能家居设备语音控制装置的唤醒方法及系统
CN106204815A (zh) * 2016-06-23 2016-12-07 江西洪都航空工业集团有限责任公司 一种基于人脸检测和识别的门禁系统
WO2017012511A1 (zh) * 2015-07-17 2017-01-26 中兴通讯股份有限公司 语音控制方法、装置及投影仪设备
CN106409293A (zh) * 2016-08-22 2017-02-15 四川美亚达光电科技有限公司 一种基于Android手机用的GPS导航系统
CN107679506A (zh) * 2017-10-12 2018-02-09 Tcl通力电子(惠州)有限公司 智能产品的唤醒方法、智能产品及计算机可读存储介质
CN108098767A (zh) * 2016-11-25 2018-06-01 北京智能管家科技有限公司 一种机器人唤醒方法及装置
CN108399324A (zh) * 2018-01-18 2018-08-14 新开普电子股份有限公司 人脸识别多媒体终端

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009132347A (ja) * 2007-12-03 2009-06-18 Suzuki Motor Corp 飲酒運転防止装置
US20100080536A1 (en) * 2008-09-29 2010-04-01 Hitachi, Ltd. Information recording/reproducing apparatus and video camera
CN104834222A (zh) * 2015-04-30 2015-08-12 广东美的制冷设备有限公司 家用电器的控制方法和装置
WO2017012511A1 (zh) * 2015-07-17 2017-01-26 中兴通讯股份有限公司 语音控制方法、装置及投影仪设备
CN105700363A (zh) * 2016-01-19 2016-06-22 深圳创维-Rgb电子有限公司 一种智能家居设备语音控制装置的唤醒方法及系统
CN106204815A (zh) * 2016-06-23 2016-12-07 江西洪都航空工业集团有限责任公司 一种基于人脸检测和识别的门禁系统
CN106409293A (zh) * 2016-08-22 2017-02-15 四川美亚达光电科技有限公司 一种基于Android手机用的GPS导航系统
CN108098767A (zh) * 2016-11-25 2018-06-01 北京智能管家科技有限公司 一种机器人唤醒方法及装置
CN107679506A (zh) * 2017-10-12 2018-02-09 Tcl通力电子(惠州)有限公司 智能产品的唤醒方法、智能产品及计算机可读存储介质
CN108399324A (zh) * 2018-01-18 2018-08-14 新开普电子股份有限公司 人脸识别多媒体终端

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TAEWAN KIM ET AL: "Integrated system of face recognition and sound localization for a smart door phone", 《IEEE TRANSACTIONS ON CONSUMER ELECTRONICS ( VOLUME: 59, ISSUE: 3, AUGUST 2013)》 *
高翔等: "智能会议系统中的人脸识别", 《工业控制计算机》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112164395A (zh) * 2020-09-18 2021-01-01 北京百度网讯科技有限公司 车载语音启动方法、装置、电子设备和存储介质
CN112241329A (zh) * 2020-09-28 2021-01-19 深圳市商汤科技有限公司 识别引擎的监控方法、装置、设备及存储介质
CN116558536A (zh) * 2023-04-27 2023-08-08 中国第一汽车股份有限公司 一种车载导航语音交互方法和装置

Similar Documents

Publication Publication Date Title
Oloyede et al. Unimodal and multimodal biometric sensing systems: a review
Bolle et al. Guide to biometrics
Kim et al. Person authentication using face, teeth and voice modalities for mobile device security
Sahoo et al. Multimodal biometric person authentication: A review
WO2021135685A1 (zh) 身份认证的方法以及装置
CN202197300U (zh) 移动人脸识别系统
WO2016084071A1 (en) Systems and methods for recognition of faces e.g. from mobile-device-generated images of faces
US20180307903A1 (en) Sharing Identification Data with Audio/Video Recording and Communication Devices and Local Processing of the Shared Data
CN104200146A (zh) 一种结合视频人脸和数字唇动密码的身份验证方法
CN110908718A (zh) 人脸识别激活语音导航方法、系统、存储介质及设备
CN108446687B (zh) 一种基于移动端和后台互联的自适应人脸视觉认证方法
CN111104852B (zh) 一种基于启发式高斯云变换的人脸识别技术
Mane et al. Review of multimodal biometrics: applications, challenges and research areas
WO2021007857A1 (zh) 一种身份验证方法、终端设备、存储介质
US20240184868A1 (en) Reference image enrollment and evolution for security systems
Jafri et al. Face Recognition using Deep Neural Network with" LivenessNet"
Shen et al. Secure mobile services by face and speech based personal authentication
Soundari et al. Enhanced security feature of atm's through facial recognition
Sun et al. Opportunities and challenges for biometrics
CN110738985A (zh) 基于语音信号的跨模态生物特征识别方法及系统
Park et al. Multimodal priority verification of face and speech using momentum back-propagation neural network
Kuan et al. A new hybrid and dynamic fusion of multiple experts for intelligent porch system
Park et al. Multi-modal human verification using face and speech
Menon Leveraging Facial Recognition Technology in Criminal Identification
Shenai et al. Fast biometric authentication system based on audio-visual fusion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200324