CN116088790A - 车辆的多媒体音量的控制方法、装置、车辆及存储介质 - Google Patents

车辆的多媒体音量的控制方法、装置、车辆及存储介质 Download PDF

Info

Publication number
CN116088790A
CN116088790A CN202310092967.6A CN202310092967A CN116088790A CN 116088790 A CN116088790 A CN 116088790A CN 202310092967 A CN202310092967 A CN 202310092967A CN 116088790 A CN116088790 A CN 116088790A
Authority
CN
China
Prior art keywords
multimedia
vehicle
driver
volume
passenger
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310092967.6A
Other languages
English (en)
Inventor
陈飞凤
郑冲冲
王涛
朱结园
刘宇诚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chery New Energy Automobile Co Ltd
Original Assignee
Chery New Energy Automobile Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chery New Energy Automobile Co Ltd filed Critical Chery New Energy Automobile Co Ltd
Priority to CN202310092967.6A priority Critical patent/CN116088790A/zh
Publication of CN116088790A publication Critical patent/CN116088790A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本申请涉及一种车辆的多媒体音量的控制方法、装置、车辆及存储介质,其中,方法包括:在车辆的多媒体进行播放时,采集车辆的车内视频数据;从视频数据中分别提取驾驶员和乘客的人体姿态特征,并基于人体姿态特征分别判断驾驶员和乘客的当前状态;若乘客的当前状态为移动终端通信状态,则按照预设音量降低策略降低多媒体的音量或者关闭多媒体,并且若驾驶员的当前状态为移动终端通信状态,则控制多媒体播放危险警示。由此,解决了相关技术中,通过采集语音指令或采集关键词的方式控制多媒体的音量,易因多种问题导致相应功能的误触发,而设置快捷键的方法易影响驾驶员驾驶专注力,不利于行车安全的技术问题。

Description

车辆的多媒体音量的控制方法、装置、车辆及存储介质
技术领域
本申请涉及车辆多媒体控制技术领域,特别涉及一种车辆的多媒体音量的控制方法、装置、车辆及存储介质。
背景技术
随着车辆的智能化,车内多媒体功能的丰富,可以在行驶为车内乘客提供多样的娱乐方式,如听音乐、相声、视频等,但当乘客接听电话或打电话时,多媒体的声音往往会影响乘客的通话质量,驾驶员不得不手动调节音量或操作静音,从而影响驾驶员的注意力,影响驾驶安全以及用户体验。
相关技术中,可以通过采集语音指令、采集关键词等方法,判断车内乘客是否在接打电话,从而控制车辆的多媒体进行音量调整;也可以通过在方向盘处设置快捷键等方法,便于驾驶员进行盲操,然而,相关技术通过采集语音指令或采集关键词的方式,可能因说话人的口音、识别错误等原因导致相应功能的误触发,从而影响多媒体的正常使用,设置快捷键的方法仍有影响驾驶员驾驶专注力的可能,不利于行车安全,有待改进。
发明内容
本申请提供一种车辆的多媒体音量的控制方法、装置、车辆及存储介质,以解决相关技术中,通过采集语音指令或采集关键词的方式控制多媒体的音量,易因多种问题导致相应功能的误触发,而设置快捷键的方法易影响驾驶员驾驶专注力,不利于行车安全的技术问题。
本申请第一方面实施例提供一种车辆的多媒体音量的控制方法,包括以下步骤:在车辆的多媒体进行播放时,采集所述车辆的车内视频数据;从所述视频数据中分别提取驾驶员和乘客的人体姿态特征,并基于所述人体姿态特征分别判断所述驾驶员和所述乘客的当前状态;若所述乘客的当前状态为移动终端通信状态,则按照预设音量降低策略降低所述多媒体的音量或者关闭所述多媒体,并且若所述驾驶员的当前状态为所述移动终端通信状态,则控制所述多媒体播放危险警示。
可选地,在本申请的一个实施例中,在按照预设音量降低策略降低所述多媒体的音量或者关闭所述多媒体之后,还包括:每隔第一预设时长识别所述乘客的当前状态;在所述乘客的所述当前状态为移动终端通信结束状态时,将所述多媒体的音量恢复至降低签的音量或者重新开启所述多媒体。
可选地,在本申请的一个实施例中,在控制所述多媒体播放危险警示之后,还包括:每隔第二预设时长识别所述驾驶员的当前状态;如果所述驾驶员的所述当前状态为移动终端通信结束状态时,结束所述危险警示,恢复所述多媒体在播放所述危险警示前的状态;如果所述驾驶员的所述当前状态为保持移动终端通信时,控制所述多媒体持续播放所述危险警示,并以预设紧急驻车策略控制所述车辆靠边停车。
可选地,在本申请的一个实施例中,所述从所述视频数据中分别提取驾驶员和乘客的人体姿态特征,并基于所述人体姿态特征分别判断所述驾驶员和所述乘客的当前状态,包括:以所述人体姿态特征为索引,查询预设数据库,得到对应的人体姿态模型;基于所述对应的人体姿态模型,识别对应的人体动作行为,确定所述当前状态。
本申请第二方面实施例提供一种车辆的多媒体音量的控制装置,包括:采集模块,用于在车辆的多媒体进行播放时,采集所述车辆的车内视频数据;判断模块,用于从所述视频数据中分别提取驾驶员和乘客的人体姿态特征,并基于所述人体姿态特征分别判断所述驾驶员和所述乘客的当前状态;第一控制模块,用于在所述乘客的当前状态为移动终端通信状态时,按照预设音量降低策略降低所述多媒体的音量或者关闭所述多媒体,并且在所述驾驶员的当前状态为所述移动终端通信状态时,控制所述多媒体播放危险警示。
可选地,在本申请的一个实施例中,还包括:第一识别模块,用于每隔第一预设时长识别所述乘客的当前状态;第二控制模块,用于在所述乘客的所述当前状态为移动终端通信结束状态时,将所述多媒体的音量恢复至降低签的音量或者重新开启所述多媒体。
可选地,在本申请的一个实施例中,还包括:第二识别模块,用于每隔第二预设时长识别所述驾驶员的当前状态;第三控制模块,用于在所述驾驶员的所述当前状态为移动终端通信结束状态时,结束所述危险警示,恢复所述多媒体在播放所述危险警示前的状态;第四控制模块,用于在所述驾驶员的所述当前状态为保持移动终端通信时,控制所述多媒体持续播放所述危险警示,并以预设紧急驻车策略控制所述车辆靠边停车。
可选地,在本申请的一个实施例中,所述判断模块包括:查询单元,用于以所述人体姿态特征为索引,查询预设数据库,得到对应的人体姿态模型;识别单元,用于基于所述对应的人体姿态模型,识别对应的人体动作行为,确定所述当前状态。
本申请第三方面实施例提供一种车辆,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的车辆的多媒体音量的控制方法。
本申请第四方面实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,该程序被处理器执行时实现如上的车辆的多媒体音量的控制方法。
本申请实施例可以在车辆的多媒体进行播放时,基于车内视频数据,分别提取驾驶员和乘客的人体姿态特征,分别确定驾驶员和乘客的当前状态,在乘客为移动终端通信状态时,降低多媒体的音量或者关闭多媒体,在驾驶员为移动终端通信状态时,控制多媒体播放危险警示,可以自动控制车内多媒体的音量,有效降低误触发的概率,保证车辆多媒体的正常使用,同时兼顾对驾驶员状态的监控,从而保证车辆的驾驶安全,提高驾驶员和乘客的驾乘体验。由此,解决了相关技术中,通过采集语音指令或采集关键词的方式控制多媒体的音量,易因多种问题导致相应功能的误触发,而设置快捷键的方法易影响驾驶员驾驶专注力,不利于行车安全的技术问题。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请实施例提供的一种车辆的多媒体音量的控制方法的流程图;
图2为根据本申请一个实施例的车辆的多媒体音量的控制方法的流程图;
图3为根据本申请实施例提供的一种车辆的多媒体音量的控制装置的结构示意图;
图4为根据本申请实施例提供的车辆的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的车辆的多媒体音量的控制方法、装置、车辆及存储介质。针对上述背景技术中心提到的相关技术中,通过采集语音指令或采集关键词的方式控制多媒体的音量,易因多种问题导致相应功能的误触发,而设置快捷键的方法易影响驾驶员驾驶专注力,不利于行车安全的技术问题,本申请提供了一种车辆的多媒体音量的控制方法,在该方法中,可以在车辆的多媒体进行播放时,基于车内视频数据,分别提取驾驶员和乘客的人体姿态特征,分别确定驾驶员和乘客的当前状态,在乘客为移动终端通信状态时,降低多媒体的音量或者关闭多媒体,在驾驶员为移动终端通信状态时,控制多媒体播放危险警示,可以自动控制车内多媒体的音量,有效降低误触发的概率,保证车辆多媒体的正常使用,同时兼顾对驾驶员状态的监控,从而保证车辆的驾驶安全,提高驾驶员和乘客的驾乘体验。由此,解决了相关技术中,通过采集语音指令或采集关键词的方式控制多媒体的音量,易因多种问题导致相应功能的误触发,而设置快捷键的方法易影响驾驶员驾驶专注力,不利于行车安全的技术问题。
具体而言,图1为本申请实施例所提供的一种车辆的多媒体音量的控制方法的流程示意图。
如图1所示,该车辆的多媒体音量的控制方法包括以下步骤:
在步骤S101中,在车辆的多媒体进行播放时,采集车辆的车内视频数据。
在实际执行过程中,本申请实施例可以在车辆的多媒体进行播放时,通过车内的采集设备如摄像头,采集车辆的车内视频数据,其中,摄像头可以安装在车内A柱上或挡风玻璃上的内后视镜底座上,并在采集后将视频图像传至图像处理器。
在步骤S102中,从视频数据中分别提取驾驶员和乘客的人体姿态特征,并基于人体姿态特征分别判断驾驶员和乘客的当前状态。
作为一种可能实现的方式,本申请实施例可以利用如图像处理器对视频数据进行处理,并从视频数据中分别提取驾驶员和乘客的人体姿态特征,从而基于人体姿态特征分别判断驾驶员和乘客的当前状态,其中,人体姿态特征可以包括用户的面部特征、人体关键点特征等。
可选地,在本申请的一个实施例中,从视频数据中分别提取驾驶员和乘客的人体姿态特征,并基于人体姿态特征分别判断驾驶员和乘客的当前状态,包括:以人体姿态特征为索引,查询预设数据库,得到对应的人体姿态模型;基于对应的人体姿态模型,识别对应的人体动作行为,确定当前状态。
在一些实施例中,可以在预设数据库中存储多种人体姿态模型,本申请实施例可以基于和人体姿态模型的对比,确定驾驶员和乘客的当前状态。
举例而言,本申请实施例可以在预设数据库中存储与手持移动终端通信相关的人体姿态模型,并从人体姿态模型中提取人体姿态特征存储在预设数据库中,本申请实施例提取的人体姿态特征可以和存储于预设数据可中的相应人体姿态特征一一对比,运用相关算法对采集的视频数据进行综合分析及判断,从而识别对应的人体动作行为,确定当前状态,此视觉识别人体动作识别具有实时性好、识别精度高等特点,由于在视频识别的过程中容易出现异物遮挡、光照等情况,视觉人体动作识别不依赖摄像头的拍摄角度等,主要依靠的是算法,对人体关键点进行预估检测,从而实现人脸的检测和实时跟踪,该技术鲁棒性较强、精度较高、误检率较低,处理速度较快。
需要注意的是,预设数据库可以为云端数据库,也可以为车端本地数据库等,具体可以由本领域技术人员根据实际情况进行相应设置,在此不做具体限制。
在步骤S103中,若乘客的当前状态为移动终端通信状态,则按照预设音量降低策略降低多媒体的音量或者关闭多媒体,并且若驾驶员的当前状态为移动终端通信状态,则控制多媒体播放危险警示。
在实际执行过程中,本申请实施例可以在判断乘客的当前状态为移动终端通信状态时,按照预设音量降低策略降低多媒体的音量或者关闭多媒体,自动控制多媒体降低音量或关闭多媒体,无需驾驶员操控,同时,可以避免语音控制方面口音识别不清、关键词误触发等原因导致功能误触发,从而保证车辆在行驶过程中的安全性和娱乐性,其中,预设音量降低策略可以由本领域技术人员或者驾驶员在实际情况下进行相应设置,在此不做具体限制。
本申请实施例还可以在判断驾驶员的当前状态为移动终端通信状态时,判断驾驶员处于危险驾驶状态,从而控制多媒体播放危险警示,需要注意的是,本申请实施例可以在预设数据库中存储多种人体姿态模型,从而识别驾驶员的多种状态,如玩手机、找东西、回头聊天、吸烟等,本申请实施例可以将上述状态归类为危险驾驶状态,并在判断驾驶员处于危险驾驶状态时,控制多媒体播放危险警示,从而保证车辆的行驶安全。
可选地,在本申请的一个实施例中,在按照预设音量降低策略降低多媒体的音量或者关闭多媒体之后,还包括:每隔第一预设时长识别乘客的当前状态;在乘客的当前状态为移动终端通信结束状态时,将多媒体的音量恢复至降低签的音量或者重新开启多媒体。
作为一种可能实现的方式,本申请实施例可以在判断乘客处于移动终端通信状态,并按照预设音量降低策略降低多媒体的音量或者关闭多媒体之后,每隔第一预设时长重新采集车内视频数据,进而识别乘客的当前状态,当乘客的当前状态仍为移动终端通信状态时,保持车内多媒体的当前状态,当乘客的当前状态为移动终端通信结束状态时,本申请实施例可以恢复多媒体的音量,或者恢复多媒体在关闭前的播放状态。
其中,第一预设时长可以由本领域技术人员根据实际情况进行相应设置,在此不做具体限制。
可选地,在本申请的一个实施例中,在控制多媒体播放危险警示之后,还包括:每隔第二预设时长识别驾驶员的当前状态;如果驾驶员的当前状态为移动终端通信结束状态时,结束危险警示,恢复多媒体在播放危险警示前的状态;如果驾驶员的当前状态为保持移动终端通信时,控制多媒体持续播放危险警示,并以预设紧急驻车策略控制车辆靠边停车。
在一些实施例中,还可以在判断驾驶员处于移动终端通信状态,并在控制多媒体播放危险警示之后,每隔第二预设时长识别驾驶员的当前状态,若驾驶员的当前状态为移动终端通信结束状态,本申请实施例可以控制多媒体结束危险警示,恢复多媒体在播放危险警示前的状态,若驾驶员的当前状态为保持移动终端通信,本申请实施例可以在控制多媒体持续播放危险警示的同时,以预设紧急驻车策略控制车辆靠边停车,从而保证车辆的行驶安全。
结合图2所示,以一个实施例对本申请实施例的车辆的多媒体音量的控制方法的工作原理进行阐述。
如图2所示,本申请实施例可以包括以下步骤:
步骤S201:在车辆的多媒体进行播放时,采集车辆的车内视频数据。在实际执行过程中,本申请实施例可以在车辆的多媒体进行播放时,通过车内的采集设备如摄像头,采集车辆的车内视频数据,其中,摄像头可以安装在车内A柱上或挡风玻璃上的内后视镜底座上,并在采集后将视频图像传至图像处理器。
步骤S202:利用图像处理器分贝识别驾驶员和乘客的当前状态。图像处理器可以从摄像头视野中自动提取人的面部图像和姿态图像,确认检测目标的人体姿态特征。本申请实施例可以在预设数据库中存储与手持移动终端通信相关的人体姿态模型,并从人体姿态模型中提取人体姿态特征存储在预设数据库中,本申请实施例提取的人体姿态特征可以和存储于预设数据可中的相应人体姿态特征一一对比,运用相关算法对采集的视频数据进行综合分析及判断,从而识别对应的人体动作行为,确定当前状态,此视觉识别人体动作识别具有实时性好、识别精度高等特点,由于在视频识别的过程中容易出现异物遮挡、光照等情况,视觉人体动作识别不依赖摄像头的拍摄角度等,主要依靠的是算法,对人体关键点进行预估检测,从而实现人脸的检测和实时跟踪,该技术鲁棒性较强、精度较高、误检率较低,处理速度较快。同时,还可以对驾驶员脸部、眼部、体态等细节特征进行智能分析,帮助准确识别是否存在疲劳驾驶或出现分神不专注的情况,诸如玩手机、找东西、回头聊天、吸烟、接打电话等。
步骤S203:基于驾驶员和乘客的当前状态,控制车内多媒体。其中,多媒体可以用于提供导航系统、音乐和视频流播放、娱乐系统(如游戏、电视)和通话功能,可以是HMI(Human Machine Interface,人机接口)中心,是现代汽车的主要控制中心,通过信息娱乐系统可以让驾驶员享受多种娱乐功能,能够提升驾乘者便捷享受和驾控乐趣。
在实际执行过程中,本申请实施例可以在判断乘客的当前状态为移动终端通信状态时,按照预设音量降低策略降低多媒体的音量或者关闭多媒体,自动控制多媒体降低音量或关闭多媒体,无需驾驶员操控,同时,可以避免语音控制方面口音识别不清、关键词误触发等原因导致功能误触发,从而保证车辆在行驶过程中的安全性和娱乐性,其中,预设音量降低策略可以由本领域技术人员或者驾驶员在实际情况下进行相应设置,在此不做具体限制。
作为一种可能实现的方式,本申请实施例可以在判断乘客处于移动终端通信状态,并按照预设音量降低策略降低多媒体的音量或者关闭多媒体之后,每隔第一预设时长重新采集车内视频数据,进而识别乘客的当前状态,当乘客的当前状态仍为移动终端通信状态时,保持车内多媒体的当前状态,当乘客的当前状态为移动终端通信结束状态时,本申请实施例可以恢复多媒体的音量,或者恢复多媒体在关闭前的播放状态。
其中,第一预设时长可以由本领域技术人员根据实际情况进行相应设置,在此不做具体限制。
本申请实施例还可以在判断驾驶员的当前状态为移动终端通信状态时,判断驾驶员处于危险驾驶状态,从而控制多媒体播放危险警示,需要注意的是,本申请实施例可以在预设数据库中存储多种人体姿态模型,从而识别驾驶员的多种状态,如玩手机、找东西、回头聊天、吸烟等,本申请实施例可以将上述状态归类为危险驾驶状态,并在判断驾驶员处于危险驾驶状态时,控制多媒体播放危险警示,从而保证车辆的行驶安全。
在一些实施例中,还可以在判断驾驶员处于移动终端通信状态,并在控制多媒体播放危险警示之后,每隔第二预设时长识别驾驶员的当前状态,若驾驶员的当前状态为移动终端通信结束状态,本申请实施例可以控制多媒体结束危险警示,恢复多媒体在播放危险警示前的状态,若驾驶员的当前状态为保持移动终端通信,本申请实施例可以在控制多媒体持续播放危险警示的同时,以预设紧急驻车策略控制车辆靠边停车,从而保证车辆的行驶安全。
根据本申请实施例提出的车辆的多媒体音量的控制方法,可以在车辆的多媒体进行播放时,基于车内视频数据,分别提取驾驶员和乘客的人体姿态特征,分别确定驾驶员和乘客的当前状态,在乘客为移动终端通信状态时,降低多媒体的音量或者关闭多媒体,在驾驶员为移动终端通信状态时,控制多媒体播放危险警示,可以自动控制车内多媒体的音量,有效降低误触发的概率,保证车辆多媒体的正常使用,同时兼顾对驾驶员状态的监控,从而保证车辆的驾驶安全,提高驾驶员和乘客的驾乘体验。由此,解决了相关技术中,通过采集语音指令或采集关键词的方式控制多媒体的音量,易因多种问题导致相应功能的误触发,而设置快捷键的方法易影响驾驶员驾驶专注力,不利于行车安全的技术问题。
其次参照附图描述根据本申请实施例提出的车辆的多媒体音量的控制装置。
图3是本申请实施例的车辆的多媒体音量的控制装置的方框示意图。
如图3所示,该车辆的多媒体音量的控制装置10包括:采集模块100、判断模块200和第一控制模块300。
具体地,采集模块100,用于在车辆的多媒体进行播放时,采集车辆的车内视频数据。
判断模块200,用于从视频数据中分别提取驾驶员和乘客的人体姿态特征,并基于人体姿态特征分别判断驾驶员和乘客的当前状态。
第一控制模块300,用于在乘客的当前状态为移动终端通信状态时,按照预设音量降低策略降低多媒体的音量或者关闭多媒体,并且在驾驶员的当前状态为移动终端通信状态时,控制多媒体播放危险警示。
可选地,在本申请的一个实施例中,车辆的多媒体音量的控制装置10还包括:第一识别模块和第二控制模块。
其中,第一识别模块,用于每隔第一预设时长识别乘客的当前状态。
第二控制模块,用于在乘客的当前状态为移动终端通信结束状态时,将多媒体的音量恢复至降低签的音量或者重新开启多媒体。
可选地,在本申请的一个实施例中,车辆的多媒体音量的控制装置10还包括:第二识别模块、第三控制模块和第四控制模块。
其中,第二识别模块,用于每隔第二预设时长识别驾驶员的当前状态。
第三控制模块,用于在驾驶员的当前状态为移动终端通信结束状态时,结束危险警示,恢复多媒体在播放危险警示前的状态。
第四控制模块,用于在驾驶员的当前状态为保持移动终端通信时,控制多媒体持续播放危险警示,并以预设紧急驻车策略控制车辆靠边停车。
可选地,在本申请的一个实施例中,判断模块200包括:查询单元和识别单元。
其中,查询单元,用于以人体姿态特征为索引,查询预设数据库,得到对应的人体姿态模型。
识别单元,用于基于对应的人体姿态模型,识别对应的人体动作行为,确定当前状态。
需要说明的是,前述对车辆的多媒体音量的控制方法实施例的解释说明也适用于该实施例的车辆的多媒体音量的控制装置,此处不再赘述。
根据本申请实施例提出的车辆的多媒体音量的控制装置,可以在车辆的多媒体进行播放时,基于车内视频数据,分别提取驾驶员和乘客的人体姿态特征,分别确定驾驶员和乘客的当前状态,在乘客为移动终端通信状态时,降低多媒体的音量或者关闭多媒体,在驾驶员为移动终端通信状态时,控制多媒体播放危险警示,可以自动控制车内多媒体的音量,有效降低误触发的概率,保证车辆多媒体的正常使用,同时兼顾对驾驶员状态的监控,从而保证车辆的驾驶安全,提高驾驶员和乘客的驾乘体验。由此,解决了相关技术中,通过采集语音指令或采集关键词的方式控制多媒体的音量,易因多种问题导致相应功能的误触发,而设置快捷键的方法易影响驾驶员驾驶专注力,不利于行车安全的技术问题。
图4为本申请实施例提供的车辆的结构示意图。该车辆可以包括:
存储器401、处理器402及存储在存储器401上并可在处理器402上运行的计算机程序。
处理器402执行程序时实现上述实施例中提供的车辆的多媒体音量的控制方法。
进一步地,车辆还包括:
通信接口403,用于存储器401和处理器402之间的通信。
存储器401,用于存放可在处理器402上运行的计算机程序。
存储器401可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器401、处理器402和通信接口403独立实现,则通信接口403、存储器401和处理器402可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(PeripheralComponent,简称为PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选地,在具体实现上,如果存储器401、处理器402及通信接口403,集成在一块芯片上实现,则存储器401、处理器402及通信接口403可以通过内部接口完成相互间的通信。
处理器402可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的车辆的多媒体音量的控制方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或N个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种车辆的多媒体音量的控制方法,其特征在于,包括以下步骤:
在车辆的多媒体进行播放时,采集所述车辆的车内视频数据;
从所述视频数据中分别提取驾驶员和乘客的人体姿态特征,并基于所述人体姿态特征分别判断所述驾驶员和所述乘客的当前状态;
若所述乘客的当前状态为移动终端通信状态,则按照预设音量降低策略降低所述多媒体的音量或者关闭所述多媒体,并且若所述驾驶员的当前状态为所述移动终端通信状态,则控制所述多媒体播放危险警示。
2.根据权利要求1所述的方法,其特征在于,在按照预设音量降低策略降低所述多媒体的音量或者关闭所述多媒体之后,还包括:
每隔第一预设时长识别所述乘客的当前状态;
在所述乘客的所述当前状态为移动终端通信结束状态时,将所述多媒体的音量恢复至降低签的音量或者重新开启所述多媒体。
3.根据权利要求1所述的方法,其特征在于,在控制所述多媒体播放危险警示之后,还包括:
每隔第二预设时长识别所述驾驶员的当前状态;
如果所述驾驶员的所述当前状态为移动终端通信结束状态时,结束所述危险警示,恢复所述多媒体在播放所述危险警示前的状态;
如果所述驾驶员的所述当前状态为保持移动终端通信时,控制所述多媒体持续播放所述危险警示,并以预设紧急驻车策略控制所述车辆靠边停车。
4.根据权利要求1所述的方法,其特征在于,所述从所述视频数据中分别提取驾驶员和乘客的人体姿态特征,并基于所述人体姿态特征分别判断所述驾驶员和所述乘客的当前状态,包括:
以所述人体姿态特征为索引,查询预设数据库,得到对应的人体姿态模型;
基于所述对应的人体姿态模型,识别对应的人体动作行为,确定所述当前状态。
5.一种车辆的多媒体音量的控制装置,其特征在于,包括:
采集模块,用于在车辆的多媒体进行播放时,采集所述车辆的车内视频数据;
判断模块,用于从所述视频数据中分别提取驾驶员和乘客的人体姿态特征,并基于所述人体姿态特征分别判断所述驾驶员和所述乘客的当前状态;
第一控制模块,用于在所述乘客的当前状态为移动终端通信状态时,按照预设音量降低策略降低所述多媒体的音量或者关闭所述多媒体,并且在所述驾驶员的当前状态为所述移动终端通信状态时,控制所述多媒体播放危险警示。
6.根据权利要求5所述的装置,其特征在于,还包括:
第一识别模块,用于每隔第一预设时长识别所述乘客的当前状态;
第二控制模块,用于在所述乘客的所述当前状态为移动终端通信结束状态时,将所述多媒体的音量恢复至降低签的音量或者重新开启所述多媒体。
7.根据权利要求5所述的装置,其特征在于,还包括:
第二识别模块,用于每隔第二预设时长识别所述驾驶员的当前状态;
第三控制模块,用于在所述驾驶员的所述当前状态为移动终端通信结束状态时,结束所述危险警示,恢复所述多媒体在播放所述危险警示前的状态;
第四控制模块,用于在所述驾驶员的所述当前状态为保持移动终端通信时,控制所述多媒体持续播放所述危险警示,并以预设紧急驻车策略控制所述车辆靠边停车。
8.根据权利要求5所述的装置,其特征在于,所述判断模块包括:
查询单元,用于以所述人体姿态特征为索引,查询预设数据库,得到对应的人体姿态模型;
识别单元,用于基于所述对应的人体姿态模型,识别对应的人体动作行为,确定所述当前状态。
9.一种车辆,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-4任一项所述的车辆的多媒体音量的控制方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-4任一项所述的车辆的多媒体音量的控制方法。
CN202310092967.6A 2023-01-18 2023-01-18 车辆的多媒体音量的控制方法、装置、车辆及存储介质 Pending CN116088790A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310092967.6A CN116088790A (zh) 2023-01-18 2023-01-18 车辆的多媒体音量的控制方法、装置、车辆及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310092967.6A CN116088790A (zh) 2023-01-18 2023-01-18 车辆的多媒体音量的控制方法、装置、车辆及存储介质

Publications (1)

Publication Number Publication Date
CN116088790A true CN116088790A (zh) 2023-05-09

Family

ID=86199018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310092967.6A Pending CN116088790A (zh) 2023-01-18 2023-01-18 车辆的多媒体音量的控制方法、装置、车辆及存储介质

Country Status (1)

Country Link
CN (1) CN116088790A (zh)

Similar Documents

Publication Publication Date Title
CN110395260B (zh) 车辆、安全驾驶方法和装置
US20090167516A1 (en) Look-away detecting device, method and program
WO2014083738A1 (ja) テキスト読み上げ装置およびその方法
DE102018127008A1 (de) Aussengeräuschüberwachung für rückfahrhilfe in einem fahrzeug mittels beschleunigungsmesser
CN114872713A (zh) 一种驾驶员异常驾驶状态监测装置和方法
CN115720253A (zh) 视频处理方法、装置、车辆以及存储介质
KR20210065177A (ko) 이미지 수집 기기 가림 상태 검출 방법, 장치, 기기 및 저장 매체
CN112041201A (zh) 用于控制对车辆特征的访问的方法、系统和介质
CN110682915A (zh) 车机、车辆、存储介质、基于驾驶行为的提醒方法及系统
CN112550306A (zh) 车辆驾驶辅助系统、包括其的车辆及相应方法和介质
US10272838B1 (en) Reducing lane departure warning false alarms
CN113619483A (zh) 用于车辆的提醒方法及相应的提醒装置和车辆
CN117727156A (zh) 机动车疲劳驾驶检测方法、装置及计算机可读存储介质
CN116088790A (zh) 车辆的多媒体音量的控制方法、装置、车辆及存储介质
CN110689904A (zh) 语音识别危险驾驶方法、计算机装置及计算机可读存储介质
CN114332913A (zh) 一种电动汽车的行人提示音控制方法、装置及电子设备
CN114379582A (zh) 一种控制车辆各自动驾驶功能的方法、系统及存储介质
CN114390254B (zh) 一种后排驾驶舱监控方法、装置及车辆
CN111204339A (zh) 一种主动语音开启lka功能的方法及装置
CN113997946B (zh) 辅助驾驶智能控制方法、车载终端以及存储介质
CN118749904A (zh) 驾驶员健康状态的监测方法及装置
CN114636568B (zh) 自动紧急制动系统的测试方法、装置、车辆及存储介质
CN117508068A (zh) 车载娱乐设备的控制方法、装置、计算机设备及存储介质
CN114821550A (zh) 疲劳监测方法、系统、计算机及可读存储介质
CN116080672A (zh) 人机交互方法及相关装置、系统和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination