CN107918764A - 信息输出方法和装置 - Google Patents

信息输出方法和装置 Download PDF

Info

Publication number
CN107918764A
CN107918764A CN201711135717.7A CN201711135717A CN107918764A CN 107918764 A CN107918764 A CN 107918764A CN 201711135717 A CN201711135717 A CN 201711135717A CN 107918764 A CN107918764 A CN 107918764A
Authority
CN
China
Prior art keywords
video
sample
driver
driving style
learning model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711135717.7A
Other languages
English (en)
Inventor
贾巍
商兴奇
李宏言
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201711135717.7A priority Critical patent/CN107918764A/zh
Publication of CN107918764A publication Critical patent/CN107918764A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • G06V20/597Recognising the driver's state or behaviour, e.g. attention or drowsiness
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Abstract

本申请实施例公开了信息输出方法和装置。该方法的一具体实施方式包括:获取记录有目标驾驶员的驾车过程的目标视频;将目标视频输入至预先训练的深度学习模型,得到目标驾驶员的预测驾驶类型,其中,深度学习模型用于表征记录有驾驶员的驾车过程的视频与驾驶员的预测驾驶类型之间的对应关系;将目标驾驶员的预测驾驶类型在预设的违规驾驶类型集合中进行匹配;响应于目标驾驶员的预测驾驶类型在违规驾驶类型集合中匹配成功,获取与匹配成功的违规驾驶类型相关联的提示信息;输出提示信息。该实施方式能够确定驾驶员在驾车过程中是否出现违规驾驶的情况,并在出现违规驾驶的情况时输出提示信息,有助于减少因违规驾驶所造成的交通事故。

Description

信息输出方法和装置
技术领域
本申请实施例涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及信息输出方法和装置。
背景技术
驾驶疲劳,是指驾驶员在长时间连续行车后,产生生理机能和心理机能的失调,而在客观上出现驾驶技能下降的现象。驾驶员睡眠质量差或不足,长时间驾驶车辆,容易出现疲劳。驾驶疲劳会影响到驾驶员的注意、感觉、知觉、思维、判断、意志、决定和运动等诸方面。
驾驶员疲劳时判断能力下降、反应迟钝和操作失误增加。驾驶员处于轻微疲劳时,会出现换档不及时、不准确;驾驶员处于中度疲劳时,操作动作呆滞,有时甚至会忘记操作;驾驶员处于重度疲劳时,往往会下意识操作或出现短时间睡眠现象,严重时会失去对车辆的控制能力。驾驶员疲劳时,会出现视线模糊、腰酸背疼、动作呆板、手脚发胀或有精力不集中、反应迟钝、思考不周全、精神涣散、焦虑、急躁等现象。如果仍勉强驾驶车辆,则可能导致交通事故的发生。
发明内容
本申请实施例提出了信息输出方法和装置。
第一方面,本申请实施例提供了一种信息输出方法,该方法包括:获取记录有目标驾驶员的驾车过程的目标视频;将目标视频输入至预先训练的深度学习模型,得到目标驾驶员的预测驾驶类型,其中,深度学习模型用于表征记录有驾驶员的驾车过程的视频与驾驶员的预测驾驶类型之间的对应关系;将目标驾驶员的预测驾驶类型在预设的违规驾驶类型集合中进行匹配;响应于目标驾驶员的预测驾驶类型在违规驾驶类型集合中匹配成功,获取与匹配成功的违规驾驶类型相关联的提示信息;输出提示信息。
在一些实施例中,深度学习模型包括卷积神经网络、循环神经网络和全连接层。
在一些实施例中,将目标视频输入至预先训练的深度学习模型,得到目标驾驶员的预测驾驶类型,包括:将目标视频输入至卷积神经网络,得到目标视频的各帧图像的特征向量,其中,卷积神经网络用于表征视频与视频的各帧图像的特征向量之间的对应关系;将目标视频的各帧图像的特征向量输入至循环神经网络,得到目标视频的特征向量,其中,循环神经网络用于表征视频的各帧图像的特征向量与视频的特征向量之间的对应关系,视频的特征向量用于表征视频的各帧图像的特征向量之间的关联关系;将目标视频的特征向量输入至全连接层,得到目标驾驶员的预测驾驶类型,其中,全连接层用于表征视频的特征向量与驾驶员的预测驾驶类型之间的对应关系。
在一些实施例中,深度学习模型通过如下步骤训练得到:获取多个记录有样本驾驶员的驾车过程的样本视频和多个样本视频中的每个样本视频所对应的样本驾驶员的驾驶类型;将多个样本视频中的每个样本视频作为输入,将多个样本视频中的每个样本视频所对应的样本驾驶员的驾驶类型作为输出,训练得到深度学习模型。
在一些实施例中,将多个样本视频中的每个样本视频作为输入,将多个样本视频中的每个样本视频所对应的样本驾驶员的驾驶类型作为输出,训练得到深度学习模型,包括:执行以下训练步骤:将多个样本视频中的每个样本视频依次输入至初始化深度学习模型,得到多个样本视频中的每个样本视频所对应的样本驾驶员的预测驾驶类型,将多个样本视频中的每个样本视频所对应的样本驾驶员的预测驾驶类型与该样本视频所对应的样本驾驶员的驾驶类型进行比较,得到初始化深度学习模型的预测准确率,确定预测准确率是否大于预设准确率阈值,若大于预设准确率阈值,则将初始化深度学习模型作为训练完成的深度学习模型。
在一些实施例中,将多个样本视频中的每个样本视频作为输入,将多个样本视频中的每个样本视频所对应的样本驾驶员的驾驶类型作为输出,训练得到深度学习模型,还包括:响应于不大于预设准确率阈值,调整初始化深度学习模型的参数,并继续执行训练步骤。
第二方面,本申请实施例提供了一种信息输出装置,该装置包括:目标视频获取单元,配置用于获取记录有目标驾驶员的驾车过程的目标视频;驾驶类型预测单元,配置用于将目标视频输入至预先训练的深度学习模型,得到目标驾驶员的预测驾驶类型,其中,深度学习模型用于表征记录有驾驶员的驾车过程的视频与驾驶员的预测驾驶类型之间的对应关系;驾驶类型匹配单元,配置用于将目标驾驶员的预测驾驶类型在预设的违规驾驶类型集合中进行匹配;提示信息获取单元,配置用于响应于目标驾驶员的预测驾驶类型在违规驾驶类型集合中匹配成功,获取与匹配成功的违规驾驶类型相关联的提示信息;提示信息输出单元,配置用于输出提示信息。
在一些实施例中,深度学习模型包括卷积神经网络、循环神经网络和全连接层。
在一些实施例中,驾驶类型预测单元,包括:图像特征向量获取子单元,配置用于将目标视频输入至卷积神经网络,得到目标视频的各帧图像的特征向量,其中,卷积神经网络用于表征视频与视频的各帧图像的特征向量之间的对应关系;视频特征向量获取子单元,配置用于将目标视频的各帧图像的特征向量输入至循环神经网络,得到目标视频的特征向量,其中,循环神经网络用于表征视频的各帧图像的特征向量与视频的特征向量之间的对应关系,视频的特征向量用于表征视频的各帧图像的特征向量之间的关联关系;驾驶类型预测子单元,配置用于将目标视频的特征向量输入至全连接层,得到目标驾驶员的预测驾驶类型,其中,全连接层用于表征视频的特征向量与驾驶员的预测驾驶类型之间的对应关系。
在一些实施例中,该装置还包括深度学习模型训练单元,深度学习模型训练单元包括:样本获取子单元,配置用于获取多个记录有样本驾驶员的驾车过程的样本视频和多个样本视频中的每个样本视频所对应的样本驾驶员的驾驶类型;深度学习模型训练子单元,配置用于将多个样本视频中的每个样本视频作为输入,将多个样本视频中的每个样本视频所对应的样本驾驶员的驾驶类型作为输出,训练得到深度学习模型。
在一些实施例中,深度学习模型训练子单元,包括:深度学习模型训练模块,配置用于执行以下训练步骤:将多个样本视频中的每个样本视频依次输入至初始化深度学习模型,得到多个样本视频中的每个样本视频所对应的样本驾驶员的预测驾驶类型,将多个样本视频中的每个样本视频所对应的样本驾驶员的预测驾驶类型与该样本视频所对应的样本驾驶员的驾驶类型进行比较,得到初始化深度学习模型的预测准确率,确定预测准确率是否大于预设准确率阈值,若大于预设准确率阈值,则将初始化深度学习模型作为训练完成的深度学习模型。
在一些实施例中,深度学习模型训练子单元,还包括:参数调整模块,配置用于响应于不大于预设准确率阈值,调整初始化深度学习模型的参数,并继续执行训练步骤。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本申请实施例提供的信息输出方法和装置,通过将记录有目标驾驶员的驾车过程的目标视频输入至预先训练的深度学习模型,从而得到目标驾驶员的预测驾驶类型;然后将目标驾驶员的预测驾驶类型在违规驾驶类型集合中进行匹配,以获取与匹配成功的违规驾驶类型相关联的提示信息;最后输出提示信息。从而能够确定驾驶员在驾车过程中是否出现违规驾驶的情况,并在出现违规驾驶的情况时输出提示信息,驾驶员可以根据提示信息采取相应的措施,从而有助于减少因违规驾驶所造成的交通事故。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请实施例可以应用于其中的示例性系统架构图;
图2是根据本申请的信息输出方法的一个实施例的流程图;
图3是根据本申请的信息输出方法的又一个实施例的流程图;
图4是根据本申请的深度学习模型训练方法的一个实施例的流程图;
图5是根据本申请的信息输出装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请实施例的信息输出方法或信息输出装置的示例性系统架构100。
如图1所示,系统架构100可以包括汽车101、网络102和服务器103。网络102用以在汽车101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
汽车101可以通过网络102与服务器103交互,以接收或发送消息等。汽车101可以安装有视频采集装置(例如摄像头、摄像机等),用于采集驾驶员的驾车过程的视频。
服务器103可以是安装在汽车101上的车载服务器,也可以是用于控制汽车101的后台服务器。服务器103可以提供各种服务,例如,服务器103可以对获取到的记录有目标驾驶员的驾车过程的目标视频等数据进行分析等处理,并输出处理结果(例如提示信息)。
需要说明的是,本申请实施例所提供的信息输出方法一般由服务器103执行,相应地,信息输出装置一般设置于服务器103中。
应该理解,图1中的汽车、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的汽车、网络和服务器。
继续参考图2,其示出了根据本申请的信息输出方法的一个实施例的流程200。该信息输出方法,包括以下步骤:
步骤201,获取记录有目标驾驶员的驾车过程的目标视频。
在本实施例中,信息输出方法运行于其上的电子设备(例如图1所示的服务器103)可以通过有线连接方式或无线连接方式从汽车(例如图1所示的汽车101)上安装的视频采集装置获取记录有目标驾驶员的驾车过程的目标视频。其中,视频采集装置可以是摄像头、摄像机等,通常安装在汽车的前方,其镜头正对主驾驶位置,以便于采集驾驶员的驾车过程的视频。目标视频可以是目标驾驶员在历史时间段内的驾车过程的视频,也可以是目标驾驶员在当前时间段内的驾车过程的视频。例如,当要确定一起交通事故是否是由目标驾驶员违规驾驶所造成的时,可以获取目标驾驶员在该交通事故发生的时间段内的驾车过程的视频作为目标视频。当要确定目标驾驶员当前是否出现违规驾驶的情况时,可以获取目标驾驶员在当前时间段内的驾车过程的视频作为目标视频。
步骤202,将目标视频输入至预先训练的深度学习模型,得到目标驾驶员的预测驾驶类型。
在本实施例中,基于步骤201所获取的目标视频,电子设备可以将目标视频输入至预先训练的深度学习模型,从而得到目标驾驶员的预测驾驶类型。其中,驾驶类型可以包括正常驾驶类型和违规驾驶类型(非正常驾驶类型),违规驾驶类型可以包括但不限于疲劳驾驶类型、驾车过程中拨打接听手持电话类型、驾车过程中观看电视类型等,疲劳驾驶可以通过驾驶员在驾驶过程中出现的长时间闭眼、频繁打哈欠、频繁点头、频繁低头、长时间视线偏移等现象来确定。
在本实施例中,深度学习模型可以是人工神经网络,它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。通常由大量的节点(或称神经元)之间相互联接构成,每个节点代表一种特定的输出函数,称为激励函数。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重(又叫做参数),网络的输出则依网络的连接方式、权重值和激励函数的不同而不同。深度学习模型通常包括多个层,每个层包括多个节点,通常,同一层的节点的权重可以相同,不同层的节点的权重可以不同,故深度学习模型的多个层的参数也可以不同。这里,电子设备可以将目标视频从深度学习模型的输入侧输入,依次经过深度学习模型中的各层的参数的处理(例如乘积、卷积等),并从深度学习模型的输出侧输出,输出侧输出的信息即为目标驾驶员的预测驾驶类型。
在本实施例中,深度学习模型可以用于表征记录有驾驶员的驾车过程的视频与驾驶员的预测驾驶类型之间的对应关系,电子设备可以通过多种方式训练出可以表征记录有驾驶员的驾车过程的视频与驾驶员的预测驾驶类型之间的对应关系的深度学习模型。
作为一种示例,电子设备可以基于对大量记录有驾驶员的驾车过程的视频和驾驶员的驾驶类型进行统计而生成存储有多个记录有驾驶员的驾车过程的视频与驾驶员的驾驶类型的对应关系的对应关系表,并将该对应关系表作为深度学习模型。这样,电子设备可以将目标视频与该对应关系表中的多个记录有驾驶员的驾车过程的视频依次进行比较,若该对应关系表中的一个视频与目标视频中的驾车过程相同或相似,则将该对应关系表中的该视频所对应的驾驶员的驾驶类型作为目标驾驶员的预测驾驶类型。
作为另一种示例,电子设备可以首先获取多个记录有样本驾驶员的驾车过程的样本视频和多个样本视频中的每个样本视频所对应的样本驾驶员的驾驶类型;然后将多个样本视频中的每个样本视频作为输入,将多个样本视频中的每个样本视频所对应的样本驾驶员的驾驶类型作为输出,训练得到深度学习模型。这里,可以预先设置样本驾驶员的驾驶类型,然后命令样本驾驶员按预先设置的驾驶类型驾车,以获取记录有样本驾驶员的驾车过程的样本视频。电子设备训练的可以是初始化深度学习模型,初始化深度学习模型可以是未经训练的深度学习模型或未训练完成的深度学习模型,初始化的深度学习模型的各层可以设置有初始参数,参数在深度学习模型的训练过程中可以被不断地调整。初始化深度学习模型可以是各种类型的未经训练或未训练完成的人工神经网络或者对多种未经训练或未训练完成的人工神经网络进行组合所得到的模型,例如,初始化深度学习模型可以是未经训练的卷积神经网络,也可以是未经训练的循环神经网络,还可以是对未经训练的卷积神经网络、未经训练的循环神经网络和未经训练的全连接层进行组合所得到的模型。这样,电子设备可以将目标视频从深度学习模型的输入侧输入,依次经过深度学习模型中的各层的参数的处理,并从深度学习模型的输出侧输出,输出侧输出的信息即为目标驾驶员的预测驾驶类型。
步骤203,将目标驾驶员的预测驾驶类型在预设的违规驾驶类型集合中进行匹配。
在本实施例中,基于步骤202所得到的目标驾驶员的预测驾驶类型,电子设备可以将目标驾驶员的预测驾驶类型在预先设置的违规驾驶类型集合中进行匹配,若违规驾驶类型集合中存在一种与目标驾驶员的预测驾驶类型相同的违规驾驶类型,则匹配成功,且该违规驾驶类型即为匹配成功的违规驾驶类型;若违规驾驶类型集合中不存在与目标驾驶员的预测驾驶类型相同的违规驾驶类型,则匹配不成功。
在本实施例中,电子设备可以预先将疲劳驾驶类型、驾车过程中拨打接听手持电话类型、驾车过程中观看电视类型等非正常驾驶类型全部添加到违规驾驶类型集合。这样,若目标驾驶员的预测驾驶类型在违规驾驶类型集合中匹配成功,则说明目标驾驶员存在违规驾驶行为;若目标驾驶员的预测驾驶类型在违规驾驶类型集合中匹配不成功,则说明目标驾驶员不存在违规驾驶行为。
步骤204,响应于目标驾驶员的预测驾驶类型在违规驾驶类型集合中匹配成功,获取与匹配成功的违规驾驶类型相关联的提示信息。
在本实施例中,在目标驾驶员的预测驾驶类型在违规驾驶类型集合中匹配成功的情况下,电子设备可以获取与匹配成功的违规驾驶类型相关联的提示信息。其中,不同的违规驾驶类型可以对应不同的提示信息。例如,疲劳驾驶类型对应的提示信息可以是包括缓解疲劳驾驶的方式的信息、建议停止驾车的信息、建议启动自动驾驶系统的信息等;驾车过程中拨打接听手持电话类型对应的提示信息可以是建议用户停止拨打接听手持电话的警示信息、驾车过程中观看电视类型对应的提示信息可以是建议用户停止观看电视的警示信息。
步骤205,输出提示信息。
在本实施例中,基于步骤204所获取的与匹配成功的违规驾驶类型相关联的提示信息,电子设备可以输出提示信息。例如,电子设备可以将提示信息发送给汽车上安装的音频播放设备,音频播放设备可以播放提示信息。
本申请实施例提供的信息输出方法,通过将记录有目标驾驶员的驾车过程的目标视频输入至预先训练的深度学习模型,从而得到目标驾驶员的预测驾驶类型;然后将目标驾驶员的预测驾驶类型在违规驾驶类型集合中进行匹配,以获取与匹配成功的违规驾驶类型相关联的提示信息;最后输出提示信息。从而能够确定驾驶员在驾车过程中是否出现违规驾驶的情况,并在出现违规驾驶的情况时输出提示信息,驾驶员可以根据提示信息采取相应的措施,从而有助于减少因违规驾驶所造成的交通事故。
进一步参考图3,其示出了根据本申请的信息输出方法的又一个实施例的流程300。在该实施例中,深度学习模型可以包括卷积神经网络、循环神经网络和全连接层,该信息输出方法的流程300,包括以下步骤:
步骤301,获取记录有目标驾驶员的驾车过程的目标视频。
在本实施例中,信息输出方法运行于其上的电子设备(例如图1所示的服务器103)可以通过有线连接方式或无线连接方式从汽车(例如图1所示的汽车101)上安装的视频采集装置获取记录有目标驾驶员的驾车过程的目标视频。其中,视频采集装置可以是摄像头、摄像机等,通常安装在汽车的前方,其镜头正对主驾驶位置,以便于采集驾驶员的驾车过程的视频。目标视频可以是目标驾驶员在历史时间段内的驾车过程的视频,也可以是目标驾驶员在当前时间段内的驾车过程的视频。
步骤302,将目标视频输入至卷积神经网络,得到目标视频的各帧图像的特征向量。
在本实施例中,基于步骤301所获取的目标视频,电子设备可以将目标视频输入至卷积神经网络,从而得到目标视频的各帧图像的特征向量。其中,视频通常是由多帧图像组成的,目标视频的各帧图像的特征向量可以用于描述各帧图像所具有的特征,如驾驶员的动作特征、驾驶员的表情特征等。
在本实施例中,卷积神经网络可以是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。通常,卷积神经网络的基本结构包括两层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。这里,电子设备可以将目标视频从卷积神经网络的输入侧输入,依次经过卷积神经网络中的各层的参数的处理,并从卷积神经网络的输出侧输出,输出侧输出的信息即为目标视频的各帧图像的特征向量。
在本实施例中,卷积神经网络可以用于表征视频与视频的各帧图像的特征向量之间的对应关系,电子设备可以通过多种方式训练出可以表征视频与视频的各帧图像的特征向量之间的对应关系的卷积神经网络。
作为一种示例,电子设备可以基于对大量视频和视频的各帧图像的特征向量进行统计而生成存储有多个视频与视频的各帧图像的特征向量的对应关系的对应关系表,并将该对应关系表作为卷积神经网络。这样,电子设备可以将目标视频与该对应关系表中的多个视频依次进行比较,若该对应关系表中的一个视频与目标视频相同或相似,则将该对应关系表中的该视频的各帧图像的特征向量作为目标视频的各帧图像的特征向量。
作为另一种示例,电子设备可以首先获取样本视频和样本视频的各帧图像的特征向量;然后将样本视频作为输入,将样本视频的各帧图像的特征向量作为输出,训练得到能够表征视频与视频的各帧图像的特征向量之间的对应关系的卷积神经网络。这样,电子设备可以将目标视频从卷积神经网络的输入侧输入,依次经过卷积神经网络中的各层的参数的处理,并从卷积神经网络的输出侧输出,输出侧输出的信息即为目标视频的各帧图像的特征向量。
步骤303,将目标视频的各帧图像的特征向量输入至循环神经网络,得到目标视频的特征向量。
在本实施例中,基于步骤302所得到的目标视频的各帧图像的特征向量,电子设备可以将目标视频的各帧图像的特征向量输入至循环神经网络,从而得到目标视频的特征向量。其中,视频的特征向量可以用于表征视频的各帧图像的特征向量之间的关联关系。
在本实施例中,循环神经网络是一种节点定向连接成环的人工神经网络。这种网络的本质特征是在处理单元之间既有内部的反馈连接又有前馈连接,其内部状态可以展示动态时序行为。
在本实施例中,循环神经网络可以用于表征视频的各帧图像的特征向量与视频的特征向量之间的对应关系,电子设备可以通过多种方式训练出可以表征视频的各帧图像的特征向量与视频的特征向量之间的对应关系的循环神经网络。
作为一种示例,电子设备可以基于对大量视频的各帧图像的特征向量和视频的特征向量进行统计而生成存储有多个视频的各帧图像的特征向量与视频的特征向量的对应关系的对应关系表,并将该对应关系表作为循环神经网络。这样,电子设备可以计算目标视频的各帧图像的特征向量与该对应关系表中的多个视频的各帧图像的特征向量之间的欧氏距离,若该对应关系表中的一个视频的各帧图像的特征向量与目标视频的各帧图像的特征向量之间的欧氏距离大于预设的距离阈值,则将该对应关系表中的该视频的特征向量作为目标视频的特征向量。
作为另一种示例,电子设备首先可以获取样本视频的各帧图像的特征向量和样本视频的特征向量;然后将样本视频的各帧图像的特征向量作为输入,将样本视频的特征向量作为输出,训练得到能够表征视频的各帧图像的特征向量与视频的特征向量之间的对应关系的循环神经网络。这样,电子设备可以将目标视频的各帧图像的特征向量从循环神经网络的输入侧输入,依次经过循环神经网络中的各层的参数的处理,并从循环神经网络的输出侧输出,输出侧输出的信息即为目标视频的特征向量。
步骤304,将目标视频的特征向量输入至全连接层,得到目标驾驶员的预测驾驶类型,
在本实施例中,基于步骤303所得到的目标视频的特征向量,电子设备可以将目标视频的特征向量输入至全连接层,从而得到目标驾驶员的预测驾驶类型。其中,驾驶类型可以包括正常驾驶类型和违规驾驶类型,违规驾驶类型可以包括但不限于疲劳驾驶类型、驾车过程中拨打接听手持电话类型、驾车过程中观看电视类型等,疲劳驾驶可以通过驾驶员在驾驶过程中出现的长时间闭眼、频繁打哈欠、频繁点头、频繁低头、长时间视线偏移等现象来确定。
在本实施例中,全连接层的每一个节点都与循环神经网络的输出层的所有节点相连,用来把循环神经网络输出层输出的视频的特征向量综合起来。由于其全相连的特性,一般全连接层的参数也是最多的。同时,在利用全连接层的参数对视频的特征向量进行线性变换后,可以加上一个非线性激励函数对线性变换的结果进行转换,从而引入非线性因素,以增强深度学习模型的表达能力。其中,激励函数可以是sigma函数,sigma函数是人工神经网络中常见的一种激励函数,在此不再详细赘述。
在本实施例中,全连接层可以用于表征视频的特征向量与驾驶员的预测驾驶类型之间的对应关系,电子设备可以通过多种方式训练出可以表征视频的特征向量与驾驶员的预测驾驶类型之间的对应关系的全连接层。
作为一种示例,电子设备可以基于对大量视频的特征向量和视频中驾驶员的驾驶类型进行统计而生成存储有多个视频的特征向量与视频中驾驶员的驾驶类型的对应关系的对应关系表,并将该对应关系表作为全连接层。这样,电子设备可以计算目标视频的特征向量与该对应关系表中的多个视频的特征向量之间的欧氏距离,若该对应关系表中的一个视频的特征向量与目标视频的特征向量之间的欧氏距离大于预设的距离阈值,则将该对应关系表中的该视频中驾驶员的驾驶类型作为目标驾驶员的预测驾驶类型。
作为另一种示例,电子设备可以首先获取样本视频的特征向量和样本视频中驾驶员的驾驶类型;然后将样本视频的特征向量作为输入,将样本视频中驾驶员的驾驶类型作为输出,训练得到能够表征视频的特征向量与驾驶员的预测驾驶类型之间的对应关系的全连接层。这样,电子设备可以将目标视频的特征向量从全连接层的输入侧输入,经过全连接层的参数和激励函数的处理,并从全连接层的输出侧输出,输出侧输出的信息即为目标驾驶员的预测驾驶类型。
需要说明的是深度学习模型中的卷积神经网络、循环神经网络和全连接层可以分开训练,也可以作为一个整体同时训练,本实施例对此不进行限定。
步骤305,将目标驾驶员的预测驾驶类型在预设的违规驾驶类型集合中进行匹配。
在本实施例中,基于步骤304所得到的目标驾驶员的预测驾驶类型,电子设备可以将目标驾驶员的预测驾驶类型在预先设置的违规驾驶类型集合中进行匹配,若违规驾驶类型集合中存在一种与目标驾驶员的预测驾驶类型相同的违规驾驶类型,则匹配成功,且该违规驾驶类型即为匹配成功的违规驾驶类型;若违规驾驶类型集合中不存在与目标驾驶员的预测驾驶类型相同的违规驾驶类型,则匹配不成功。
步骤306,响应于目标驾驶员的预测驾驶类型在违规驾驶类型集合中匹配成功,获取与匹配成功的违规驾驶类型相关联的提示信息。
在本实施例中,在目标驾驶员的预测驾驶类型在违规驾驶类型集合中匹配成功的情况下,电子设备可以获取与匹配成功的违规驾驶类型相关联的提示信息。其中,不同的违规驾驶类型可以对应不同的提示信息。
步骤307,输出提示信息。
在本实施例中,基于步骤306所获取的与匹配成功的违规驾驶类型相关联的提示信息,电子设备可以输出提示信息。例如,电子设备可以将提示信息发送给汽车上安装的音频播放设备,音频播放设备可以播放提示信息。
从图3中可以看出,与图2对应的实施例相比,本实施例中的信息输出方法的流程300突出了深度学习模型的结构以及各结构的工作原理。由此,本实施例描述的方案能够提高确定驾驶员在驾车过程中是否出现违规驾驶的情况的准确度,并在出现违规驾驶的情况时输出提示信息,驾驶员可以根据提示信息采取相应的措施,从而有助于更进一步地减少因违规驾驶所造成的交通事故。
进一步参考图4,其示出了根据本申请的深度学习模型训练方法的一个实施例的流程400。该深度学习模型训练方法的流程400,包括以下步骤:
步骤401,获取多个记录有样本驾驶员的驾车过程的样本视频和多个样本视频中的每个样本视频所对应的样本驾驶员的驾驶类型。
在本实施例中,深度学习模型训练方法运行于其上的电子设备(例如图1所示的服务103)可以获取多个记录有样本驾驶员的驾车过程的样本视频和多个样本视频中的每个样本视频所对应的样本驾驶员的驾驶类型。
在本实施例中,可以预先设置样本驾驶员的驾驶类型,然后命令样本驾驶员按预先设置的驾驶类型驾车,以获取记录有样本驾驶员的驾车过程的样本视频。
步骤402,将多个样本视频中的每个样本视频依次输入至初始化深度学习模型,得到多个样本视频中的每个样本视频所对应的样本驾驶员的预测驾驶类型。
在本实施例中,基于步骤401所获取的多个记录有样本驾驶员的驾车过程的样本视频,电子设备可以将多个样本视频中的每个样本视频依次输入至初始化深度学习模型,从而得到多个样本视频中的每个样本视频所对应的样本驾驶员的预测驾驶类型。这里,电子设备可以将每个样本视频从初始化深度学习模型的输入侧输入,依次经过初始化深度学习模型中的各层的参数的处理,并从初始化深度学习模型的输出侧输出,输出侧输出的信息即为该样本视频所对应的样本驾驶员的预测驾驶类型。其中,初始深度学习模型可以是未经训练的深度学习模型或未训练完成的深度学习模型,其各层设置有初始化参数,初始化参数在深度学习模型的训练过程中可以被不断地调整。
步骤403,将多个样本视频中的每个样本视频所对应的样本驾驶员的预测驾驶类型与该样本视频所对应的样本驾驶员的驾驶类型进行比较,得到初始化深度学习模型的预测准确率。
在本实施例中,基于步骤402所得到的多个样本视频中的每个样本视频所对应的样本驾驶员的预测驾驶类型,电子设备可以将多个样本视频中的每个样本视频所对应的样本驾驶员的预测驾驶类型与该样本视频所对应的样本驾驶员的驾驶类型进行比较,从而得到初始化深度学习模型的预测准确率。具体地,若一个样本样本视频所对应的样本驾驶员的预测驾驶类型与该样本视频所对应的样本驾驶员的驾驶类型相同,则初始化深度学习模型预测正确;若一个样本样本视频所对应的样本驾驶员的预测驾驶类型与该样本视频所对应的样本驾驶员的驾驶类型不同,则初始化深度学习模型预测错误。这里,电子设备可以计算预测正确的数目与样本总数的比值,并作为初始化深度学习模型的预测准确率。
步骤404,确定预测准确率是否大于预设准确率阈值。
在本实施例中,基于步骤403所得到的初始化深度学习模型的预测准确率,电子设备可以将初始化深度学习模型的预测准确率与预设准确率阈值进行比较,若大于预设准确度阈值,则执行步骤405;若大于预设准确度阈值,则执行步骤406。
步骤405,将初始化深度学习模型作为训练完成的深度学习模型。
在本实施例中,在初始化深度学习模型的预测准确度大于预设准确度阈值的情况下,说明该深度学习模型训练完成,此时,电子设备可以将初始化深度学习模型作为训练完成的深度学习模型。
步骤406,调整初始化深度学习模型的参数。
在本实施例中,在初始化深度学习模型的预测准确度不大于预设准确度阈值的情况下,电子设备可以调整初始化深度学习模型的参数,并返回执行步骤402,直至训练出能够表征记录有驾驶员的驾车过程的视频和驾驶员的预测驾驶类型之间对应关系的深度学习模型为止。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种信息输出装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的信息输出装置500可以包括:目标视频获取单元501、驾驶类型预测单元502、驾驶类型匹配单元503、提示信息获取单元504和提示信息输出单元505。其中,目标视频获取单元501,配置用于获取记录有目标驾驶员的驾车过程的目标视频;驾驶类型预测单元502,配置用于将目标视频输入至预先训练的深度学习模型,得到目标驾驶员的预测驾驶类型,其中,深度学习模型用于表征记录有驾驶员的驾车过程的视频与驾驶员的预测驾驶类型之间的对应关系;驾驶类型匹配单元503,配置用于将目标驾驶员的预测驾驶类型在预设的违规驾驶类型集合中进行匹配;提示信息获取单元504,配置用于响应于目标驾驶员的预测驾驶类型在违规驾驶类型集合中匹配成功,获取与匹配成功的违规驾驶类型相关联的提示信息;提示信息输出单元505,配置用于输出提示信息。
在本实施例中,信息输出装置500中:目标视频获取单元501、驾驶类型预测单元502、驾驶类型匹配单元503、提示信息获取单元504和提示信息输出单元505的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201、步骤202、步骤203、步骤204和步骤205的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,深度学习模型可以包括卷积神经网络、循环神经网络和全连接层。
在本实施例的一些可选的实现方式中,驾驶类型预测单元502可以包括:图像特征向量获取子单元(图中未示出),配置用于将目标视频输入至卷积神经网络,得到目标视频的各帧图像的特征向量,其中,卷积神经网络用于表征视频与视频的各帧图像的特征向量之间的对应关系;视频特征向量获取子单元(图中未示出),配置用于将目标视频的各帧图像的特征向量输入至循环神经网络,得到目标视频的特征向量,其中,循环神经网络用于表征视频的各帧图像的特征向量与视频的特征向量之间的对应关系,视频的特征向量用于表征视频的各帧图像的特征向量之间的关联关系;驾驶类型预测子单元(图中未示出),配置用于将目标视频的特征向量输入至全连接层,得到目标驾驶员的预测驾驶类型,其中,全连接层用于表征视频的特征向量与驾驶员的预测驾驶类型之间的对应关系。
在本实施例的一些可选的实现方式中,信息输出装置500还可以包括深度学习模型训练单元(图中未示出),深度学习模型训练单元可以包括:样本获取子单元(图中未示出),配置用于获取多个记录有样本驾驶员的驾车过程的样本视频和多个样本视频中的每个样本视频所对应的样本驾驶员的驾驶类型;深度学习模型训练子单元(图中未示出),配置用于将多个样本视频中的每个样本视频作为输入,将多个样本视频中的每个样本视频所对应的样本驾驶员的驾驶类型作为输出,训练得到深度学习模型。
在本实施例的一些可选的实现方式中,深度学习模型训练子单元可以包括:深度学习模型训练模块(图中未示出),配置用于执行以下训练步骤:将多个样本视频中的每个样本视频依次输入至初始化深度学习模型,得到多个样本视频中的每个样本视频所对应的样本驾驶员的预测驾驶类型,将多个样本视频中的每个样本视频所对应的样本驾驶员的预测驾驶类型与该样本视频所对应的样本驾驶员的驾驶类型进行比较,得到初始化深度学习模型的预测准确率,确定预测准确率是否大于预设准确率阈值,若大于预设准确率阈值,则将初始化深度学习模型作为训练完成的深度学习模型。
在本实施例的一些可选的实现方式中,深度学习模型训练子单元还可以包括:参数调整模块(图中未示出),配置用于响应于不大于预设准确率阈值,调整初始化深度学习模型的参数,并继续执行训练步骤。
下面参考图6,其示出了适于用来实现本申请实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括目标视频获取单元、驾驶类型预测单元、驾驶类型匹配单元、提示信息获取单元和提示信息输出单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,目标视频获取单元还可以被描述为“获取记录有目标驾驶员的驾车过程的目标视频的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取记录有目标驾驶员的驾车过程的目标视频;将目标视频输入至预先训练的深度学习模型,得到目标驾驶员的预测驾驶类型,其中,深度学习模型用于表征记录有驾驶员的驾车过程的视频与驾驶员的预测驾驶类型之间的对应关系;将目标驾驶员的预测驾驶类型在预设的违规驾驶类型集合中进行匹配;响应于目标驾驶员的预测驾驶类型在违规驾驶类型集合中匹配成功,获取与匹配成功的违规驾驶类型相关联的提示信息;输出提示信息。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (14)

1.一种信息输出方法,包括:
获取记录有目标驾驶员的驾车过程的目标视频;
将所述目标视频输入至预先训练的深度学习模型,得到所述目标驾驶员的预测驾驶类型,其中,所述深度学习模型用于表征记录有驾驶员的驾车过程的视频与驾驶员的预测驾驶类型之间的对应关系;
将所述目标驾驶员的预测驾驶类型在预设的违规驾驶类型集合中进行匹配;
响应于所述目标驾驶员的预测驾驶类型在所述违规驾驶类型集合中匹配成功,获取与所述匹配成功的违规驾驶类型相关联的提示信息;
输出所述提示信息。
2.根据权利要求1所述的方法,其中,所述深度学习模型包括卷积神经网络、循环神经网络和全连接层。
3.根据权利要求2所述的方法,其中,所述将所述目标视频输入至预先训练的深度学习模型,得到所述目标驾驶员的预测驾驶类型,包括:
将所述目标视频输入至所述卷积神经网络,得到所述目标视频的各帧图像的特征向量,其中,所述卷积神经网络用于表征视频与视频的各帧图像的特征向量之间的对应关系;
将所述目标视频的各帧图像的特征向量输入至所述循环神经网络,得到所述目标视频的特征向量,其中,所述循环神经网络用于表征视频的各帧图像的特征向量与视频的特征向量之间的对应关系,视频的特征向量用于表征视频的各帧图像的特征向量之间的关联关系;
将所述目标视频的特征向量输入至所述全连接层,得到所述目标驾驶员的预测驾驶类型,其中,所述全连接层用于表征视频的特征向量与驾驶员的预测驾驶类型之间的对应关系。
4.根据权利要求1所述的方法,其中,所述深度学习模型通过如下步骤训练得到:
获取多个记录有样本驾驶员的驾车过程的样本视频和所述多个样本视频中的每个样本视频所对应的所述样本驾驶员的驾驶类型;
将所述多个样本视频中的每个样本视频作为输入,将所述多个样本视频中的每个样本视频所对应的所述样本驾驶员的驾驶类型作为输出,训练得到所述深度学习模型。
5.根据权利要求4所述的方法,其中,所述将所述多个样本视频中的每个样本视频作为输入,将所述多个样本视频中的每个样本视频所对应的所述样本驾驶员的驾驶类型作为输出,训练得到所述深度学习模型,包括:
执行以下训练步骤:将所述多个样本视频中的每个样本视频依次输入至初始化深度学习模型,得到所述多个样本视频中的每个样本视频所对应的所述样本驾驶员的预测驾驶类型,将所述多个样本视频中的每个样本视频所对应的所述样本驾驶员的预测驾驶类型与该样本视频所对应的所述样本驾驶员的驾驶类型进行比较,得到所述初始化深度学习模型的预测准确率,确定所述预测准确率是否大于预设准确率阈值,若大于所述预设准确率阈值,则将所述初始化深度学习模型作为训练完成的深度学习模型。
6.根据权利要求5所述的方法,其中,所述将所述多个样本视频中的每个样本视频作为输入,将所述多个样本视频中的每个样本视频所对应的所述样本驾驶员的驾驶类型作为输出,训练得到所述深度学习模型,还包括:
响应于不大于所述预设准确率阈值,调整所述初始化深度学习模型的参数,并继续执行所述训练步骤。
7.一种信息输出装置,包括:
目标视频获取单元,配置用于获取记录有目标驾驶员的驾车过程的目标视频;
驾驶类型预测单元,配置用于将所述目标视频输入至预先训练的深度学习模型,得到所述目标驾驶员的预测驾驶类型,其中,所述深度学习模型用于表征记录有驾驶员的驾车过程的视频与驾驶员的预测驾驶类型之间的对应关系;
驾驶类型匹配单元,配置用于将所述目标驾驶员的预测驾驶类型在预设的违规驾驶类型集合中进行匹配;
提示信息获取单元,配置用于响应于所述目标驾驶员的预测驾驶类型在所述违规驾驶类型集合中匹配成功,获取与所述匹配成功的违规驾驶类型相关联的提示信息;
提示信息输出单元,配置用于输出所述提示信息。
8.根据权利要求7所述的装置,其中,所述深度学习模型包括卷积神经网络、循环神经网络和全连接层。
9.根据权利要求8所述的装置,其中,所述驾驶类型预测单元,包括:
图像特征向量获取子单元,配置用于将所述目标视频输入至所述卷积神经网络,得到所述目标视频的各帧图像的特征向量,其中,所述卷积神经网络用于表征视频与视频的各帧图像的特征向量之间的对应关系;
视频特征向量获取子单元,配置用于将所述目标视频的各帧图像的特征向量输入至所述循环神经网络,得到所述目标视频的特征向量,其中,所述循环神经网络用于表征视频的各帧图像的特征向量与视频的特征向量之间的对应关系,视频的特征向量用于表征视频的各帧图像的特征向量之间的关联关系;
驾驶类型预测子单元,配置用于将所述目标视频的特征向量输入至所述全连接层,得到所述目标驾驶员的预测驾驶类型,其中,所述全连接层用于表征视频的特征向量与驾驶员的预测驾驶类型之间的对应关系。
10.根据权利要求7所述的装置,其中,所述装置还包括深度学习模型训练单元,所述深度学习模型训练单元包括:
样本获取子单元,配置用于获取多个记录有样本驾驶员的驾车过程的样本视频和所述多个样本视频中的每个样本视频所对应的所述样本驾驶员的驾驶类型;
深度学习模型训练子单元,配置用于将所述多个样本视频中的每个样本视频作为输入,将所述多个样本视频中的每个样本视频所对应的所述样本驾驶员的驾驶类型作为输出,训练得到所述深度学习模型。
11.根据权利要求10所述的装置,其中,所述深度学习模型训练子单元,包括:
深度学习模型训练模块,配置用于执行以下训练步骤:将所述多个样本视频中的每个样本视频依次输入至初始化深度学习模型,得到所述多个样本视频中的每个样本视频所对应的所述样本驾驶员的预测驾驶类型,将所述多个样本视频中的每个样本视频所对应的所述样本驾驶员的预测驾驶类型与该样本视频所对应的所述样本驾驶员的驾驶类型进行比较,得到所述初始化深度学习模型的预测准确率,确定所述预测准确率是否大于预设准确率阈值,若大于所述预设准确率阈值,则将所述初始化深度学习模型作为训练完成的深度学习模型。
12.根据权利要求11所述的装置,其中,所述深度学习模型训练子单元,还包括:
参数调整模块,配置用于响应于不大于所述预设准确率阈值,调整所述初始化深度学习模型的参数,并继续执行所述训练步骤。
13.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN201711135717.7A 2017-11-16 2017-11-16 信息输出方法和装置 Pending CN107918764A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711135717.7A CN107918764A (zh) 2017-11-16 2017-11-16 信息输出方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711135717.7A CN107918764A (zh) 2017-11-16 2017-11-16 信息输出方法和装置

Publications (1)

Publication Number Publication Date
CN107918764A true CN107918764A (zh) 2018-04-17

Family

ID=61896379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711135717.7A Pending CN107918764A (zh) 2017-11-16 2017-11-16 信息输出方法和装置

Country Status (1)

Country Link
CN (1) CN107918764A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145784A (zh) * 2018-08-03 2019-01-04 百度在线网络技术(北京)有限公司 用于处理视频的方法和装置
CN109186666A (zh) * 2018-08-27 2019-01-11 日立楼宇技术(广州)有限公司 设备的检测方法、装置、计算机设备和存储介质
CN109269556A (zh) * 2018-09-06 2019-01-25 深圳市中电数通智慧安全科技股份有限公司 一种设备风险预警方法、装置、终端设备及存储介质
CN110163043A (zh) * 2018-05-18 2019-08-23 腾讯科技(深圳)有限公司 面部检测方法、装置、存储介质及电子装置
CN110400189A (zh) * 2018-04-20 2019-11-01 北京京东尚科信息技术有限公司 信息输出方法和装置
CN110816542A (zh) * 2018-07-23 2020-02-21 罗伯特·博世有限公司 提供驾驶员帮助的方法
CN111666810A (zh) * 2020-04-21 2020-09-15 视联动力信息技术股份有限公司 一种违纪识别方法和装置
CN112016459A (zh) * 2020-08-28 2020-12-01 上海大学 一种基于自注意力机制的驾驶员动作识别方法
CN112053610A (zh) * 2020-10-29 2020-12-08 延安大学 一种基于深度学习的vr虚拟驾驶训练及考试方法
CN112861677A (zh) * 2021-01-28 2021-05-28 上海商汤临港智能科技有限公司 轨交驾驶员的动作检测方法及装置、设备、介质及工具
CN113139403A (zh) * 2020-01-17 2021-07-20 顺丰科技有限公司 违规行为识别方法、装置、计算机设备和存储介质
CN115346363A (zh) * 2022-06-27 2022-11-15 西安电子科技大学 基于神经网络的驾驶员违规预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6571310B1 (en) * 2000-04-20 2003-05-27 International Business Machines Corporation Method and apparatus for managing a heterogeneous data storage system
CN102426757A (zh) * 2011-12-02 2012-04-25 上海大学 基于模式识别的安全驾驶监控系统和方法
CN106096568A (zh) * 2016-06-21 2016-11-09 同济大学 一种基于cnn和卷积lstm网络的行人再识别方法
CN106941602A (zh) * 2017-03-07 2017-07-11 中国铁道科学研究院 机车司机行为识别方法、装置及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6571310B1 (en) * 2000-04-20 2003-05-27 International Business Machines Corporation Method and apparatus for managing a heterogeneous data storage system
CN102426757A (zh) * 2011-12-02 2012-04-25 上海大学 基于模式识别的安全驾驶监控系统和方法
CN106096568A (zh) * 2016-06-21 2016-11-09 同济大学 一种基于cnn和卷积lstm网络的行人再识别方法
CN106941602A (zh) * 2017-03-07 2017-07-11 中国铁道科学研究院 机车司机行为识别方法、装置及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JEFF DONAHUE等: "Long-term Recurrent Convolutional Networks for Visual Recognition and Description", 《COMPUTER VISION AND PATTERN RECOGNITION》 *
JIAJUN SUN等: "Video Understanding: From Video Classification to Captioning", 《HTTP://CS231N.STANFORD.EDU/REPORTS/2017/PDFS/709.PDF》 *
YUE-HEI NG等: "Beyond short snippets: Deep networks for video classification", 《IN PROCEEDINGS OF THE IEEE CONFERENCE ON COMPUTER VISION AND PATTERN》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110400189A (zh) * 2018-04-20 2019-11-01 北京京东尚科信息技术有限公司 信息输出方法和装置
CN110163043A (zh) * 2018-05-18 2019-08-23 腾讯科技(深圳)有限公司 面部检测方法、装置、存储介质及电子装置
CN110163043B (zh) * 2018-05-18 2023-09-26 腾讯科技(深圳)有限公司 面部检测方法、装置、存储介质及电子装置
CN110816542A (zh) * 2018-07-23 2020-02-21 罗伯特·博世有限公司 提供驾驶员帮助的方法
CN109145784A (zh) * 2018-08-03 2019-01-04 百度在线网络技术(北京)有限公司 用于处理视频的方法和装置
CN109145784B (zh) * 2018-08-03 2022-06-03 百度在线网络技术(北京)有限公司 用于处理视频的方法和装置
CN109186666A (zh) * 2018-08-27 2019-01-11 日立楼宇技术(广州)有限公司 设备的检测方法、装置、计算机设备和存储介质
CN109269556A (zh) * 2018-09-06 2019-01-25 深圳市中电数通智慧安全科技股份有限公司 一种设备风险预警方法、装置、终端设备及存储介质
CN113139403A (zh) * 2020-01-17 2021-07-20 顺丰科技有限公司 违规行为识别方法、装置、计算机设备和存储介质
CN111666810A (zh) * 2020-04-21 2020-09-15 视联动力信息技术股份有限公司 一种违纪识别方法和装置
CN112016459A (zh) * 2020-08-28 2020-12-01 上海大学 一种基于自注意力机制的驾驶员动作识别方法
CN112016459B (zh) * 2020-08-28 2024-01-16 上海大学 一种基于自注意力机制的驾驶员动作识别方法
CN112053610A (zh) * 2020-10-29 2020-12-08 延安大学 一种基于深度学习的vr虚拟驾驶训练及考试方法
CN112861677A (zh) * 2021-01-28 2021-05-28 上海商汤临港智能科技有限公司 轨交驾驶员的动作检测方法及装置、设备、介质及工具
CN115346363A (zh) * 2022-06-27 2022-11-15 西安电子科技大学 基于神经网络的驾驶员违规预测方法

Similar Documents

Publication Publication Date Title
CN107918764A (zh) 信息输出方法和装置
CN107909037A (zh) 信息输出方法和装置
US20230005265A1 (en) Systems and methods for generating media content
CN109145781A (zh) 用于处理图像的方法和装置
CN109858445A (zh) 用于生成模型的方法和装置
CN107590482A (zh) 信息生成方法和装置
CN109919079A (zh) 用于检测学习状态的方法和装置
CN107578017A (zh) 用于生成图像的方法和装置
CN109389068A (zh) 用于识别驾驶行为的方法和装置
CN108052920A (zh) 用于输出信息的方法和装置
CN109545192A (zh) 用于生成模型的方法和装置
CN110021052A (zh) 用于生成眼底图像生成模型的方法和装置
CN110288682A (zh) 用于控制三维虚拟人像口型变化的方法和装置
CN107392189A (zh) 用于确定无人车的驾驶行为的方法和装置
CN107910060A (zh) 用于生成信息的方法和装置
CN109829432A (zh) 用于生成信息的方法和装置
CN108415653A (zh) 用于终端设备的锁屏方法和装置
CN109859144A (zh) 图像处理方法及装置、电子设备和存储介质
CN109345379A (zh) 一种智能授信方法和装置
CN109242043A (zh) 用于生成信息预测模型的方法和装置
CN108491808A (zh) 用于获取信息的方法及装置
CN109934191A (zh) 信息处理方法和装置
CN109637525A (zh) 用于生成车载声学模型的方法和装置
CN109145783A (zh) 用于生成信息的方法和装置
CN109389492A (zh) 基于微表情计算欺诈概率的方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180417