CN114861626A - 一种交通警情处理方法、装置、电子设备及存储介质 - Google Patents
一种交通警情处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114861626A CN114861626A CN202210249040.4A CN202210249040A CN114861626A CN 114861626 A CN114861626 A CN 114861626A CN 202210249040 A CN202210249040 A CN 202210249040A CN 114861626 A CN114861626 A CN 114861626A
- Authority
- CN
- China
- Prior art keywords
- traffic
- data
- submodel
- model
- warning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种交通警情处理方法、装置、电子设备及存储介质。所述方法包括:获取待处理的交通警情数据;将交通警情数据输入至文本预训练模型中,获取文本预训练模型输出的与交通警情数据对应的增强语义向量;其中,文本预训练模型为BERT模型;文本预训练模型将增强语义向量同时输入至多任务处理模型的各个子模型中;其中,多任务处理模型的各个子模型包括关键信息抽取子模型、文本分类子模型及语义识别子模型;关键信息抽取子模型、文本分类子模型及语义识别子模型,对增强语义向量进行分析,分别确定交通警情数据中的警情信息、警情类型及警情严重程度。通过本发明实施例提供的技术方案,可快速、准确地实现对交通警情数据自动处理。
Description
技术领域
本发明涉及交通安全技术领域,尤其涉及一种交通警情处理方法、装 置、电子设备及存储介质。
背景技术
现有的自然语言模型在处理交通警情数据时存在两方面的不足:一方 面,语言模型的可移植性不高、泛化能力较差,这些模型训练过程中需要 大规模的手动标注数据,模型的性能和标注数据数量成正比。当训练数据 匮乏的领域标注数据过少时(例如目前还没有大量的中文交通语料标注 集),模型无法充分学习文本中的隐藏特征导致预测性能大大降低。同时, 提取交通警情中的关键信息依赖于语言模型的设计和规则的制定,当应用 场景和数据发生变化时(例如不同城市的报警内容和格式存在差异),需 要花费大量时间和精力重新修订和完善规则。另一方面,现有的语言模型 侧重于解决单一问题,针对文本中的特定任务开展单独训练。例如,交通 事故关键信息提取、重特大交通事故成因、道路安全风险源辨识。单任务 学习的语言模型目标往往更关注文本中局部信息,而交通警情数据需要面 向完整文本内容处理多项任务(如警情关键信息、警情分类、警情语义识 别),单任务学习显然无法满足警情数据处理的实际需求。
发明内容
本发明提供了一种交通警情处理方法、装置、电子设备及存储介质, 可快速、准确地实现对交通警情数据自动处理。
根据本发明的一方面,提供了一种交通警情处理方法,包括:
获取待处理的交通警情数据;
将所述交通警情数据输入至文本预训练模型中,获取所述文本预训练 模型输出的与所述交通警情数据对应的增强语义向量;其中,所述文本预 训练模型为BERT模型;
所述文本预训练模型将所述增强语义向量同时输入至多任务处理模 型的各个子模型中;其中,所述多任务处理模型的各个子模型包括关键信 息抽取子模型、文本分类子模型及语义识别子模型;
所述关键信息抽取子模型、所述文本分类子模型及所述语义识别子模 型,对所述增强语义向量进行分析,分别确定所述交通警情数据中的警情 信息、警情类型及警情严重程度。
根据本发明的另一方面,提供了一种交通警情处理装置,包括:
警情数据获取模块,用于获取待处理的交通警情数据;
增强语义向量获取模块,用于将所述交通警情数据输入至文本预训练 模型中,获取所述文本预训练模型输出的与所述交通警情数据对应的增强 语义向量;其中,所述文本预训练模型为BERT模型;
增强语义向量输入模块,用于所述文本预训练模型将所述增强语义向 量同时输入至多任务处理模型的各个子模型中;其中,所述多任务处理模 型的各个子模型包括关键信息抽取子模型、文本分类子模型及语义识别子 模型;
警情数据处理模块,用于所述关键信息抽取子模型、所述文本分类子 模型及所述语义识别子模型,对所述增强语义向量进行分析,分别确定所 述交通警情数据中的警情信息、警情类型及警情严重程度。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述 计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执 行本发明任一实施例所述的交通警情处理方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算 机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时 实现本发明任一实施例所述的交通警情处理方法。
本发明实施例的交通警情处理方案,获取待处理的交通警情数据;将 所述交通警情数据输入至文本预训练模型中,获取所述文本预训练模型输 出的与所述交通警情数据对应的增强语义向量;其中,所述文本预训练模 型为BERT模型;所述文本预训练模型将所述增强语义向量同时输入至多 任务处理模型的各个子模型中;其中,所述多任务处理模型的各个子模型 包括关键信息抽取子模型、文本分类子模型及语义识别子模型;所述关键信息抽取子模型、所述文本分类子模型及所述语义识别子模型,对所述增 强语义向量进行分析,分别确定所述交通警情数据中的警情信息、警情类 型及警情严重程度。通过本发明实施例提供的技术方案,利用BERT文本 预训练模型作为上游共享参数层,多任务并行学习方法作为下游自动处理 层,不仅实现了对交通警情数据中的关键警情信息、警情类型和警情严重 程度的自动处理,而且通过采用参数共享机制减少不同的子模型训练参数, 使用更少的先验知识学习更多的内容,从而提高模型的泛化能力和识别准 确率。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键 或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下 的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述 中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅 是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性 劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种交通警情处理方法的流程图;
图2为本发明实施例提供的一种BERT模型词向量组成示意图;
图3为本发明实施例提供的一种交通警情处理过程示意图;
图4为本发明实施例提供的一种警情信息确定过程示意图;
图5为本发明实施例提供的一种警情严重程度确定过程示意图;
图6是根据本发明实施例二提供的一种交通警情处理装置的结构示意 图;
图7是实现本发明实施例的交通警情处理方法的电子设备的结构示意 图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明 实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述, 显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施 例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动 前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语 “第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺 序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这 里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺 序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于 覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、 产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚 地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供了一种交通警情处理方法的流程图,本实 施例可适用于对交通警情数据进行处理的情况,该方法可以由交通警情处 理装置来执行,该交通警情处理装置可以采用硬件和/或软件的形式实现, 该交通警情处理装置可配置于电子设备中。如图1所示,该方法包括:
S110、获取待处理的交通警情数据。
其中,待处理的交通警情数据可以为一条,也可以为多条。在本发明 实施例中,可以从交通指挥中心获取待处理的交通警情数据,也可以将用 户通过电话或短信的形式上报的数据作为待处理的交通警情数据。需要说 明的是,本发明实施例对交通警情数据的获取方式不做限定。
在本发明实施例中,一条交通警情数据可以包含事件时间信息、地址 信息、车牌信息、警情类型以及警情严重程度。示例性的,交通警情数据 “松陵油车路与松陵大道交叉口,下午1点多学校老师在油车路被车撞了, 车牌是苏E2***,当时未报警伤者现在在第一人民医院抢救,报警人现在 松陵北门小学”中,地址信息为“松陵油车路与松陵大道交叉口”,时间 信息为“下午1点多”,车牌信息为“苏E2***”,警情类型为“被车撞 了”,警情严重程度为“在第一人民医院抢救”。
可选的,可以对待处理的交通警情数据进行预处理操作。其中,警情 数据中存在一些报警人口述过程中使用的具有地方特色的专有名词,比如 道路名称、建筑名称和一些代指名词等。例如,报警人通常用机动车的品 牌来代替车名。因此,在预处理阶段可以建立专有名词语料库,通过下载 电子地图、网络搜索、同义词查找等手段,建立研究区域内道路名称语料 库、车辆品牌名称语料库、机动车类型语料库、非机动车类型语料库、行 人指代名词语料库、时间类型语料库(如昨天、前几天、星期等)、地理 位置语料库(如门口,路口,河边,桥下等)、车牌信息类型语料库(如 苏E、苏U)。此外,由于一些无关的特殊标点字符、空白字符和语气助 词本身并无实际含义,因此,可在数据预处理阶段删除这些字符。
S120、将所述交通警情数据输入至文本预训练模型中,获取所述文本 预训练模型输出的与所述交通警情数据对应的增强语义向量;其中,所述 文本预训练模型为BERT模型。
其中,BERT(Bidirectional Encoder Representations from Transformers,基于变换器的双向编码器表示技术)模型是一种动态自然 语言处理预训练技术。在本发明实施例中,将BERT模型作为文本预训练 模型,将待处理的交通警情数据输入至文本预训练模型中,使文本预训练 模型对交通警情数据进行分析,输出与交通警情数据对应的增强语义向量。
具体的,BERT模型包括向量转化层及至少一个Transformer编码器。 假设交通警情数据序列为X={x1,x2,...,xN},N为交通警情数据的字数。BERT 模型的向量转化层将输入的交通警情数据转换为三个向量的和作为输入, 三个向量分别为词向量嵌入、分句嵌入、位置嵌入,在交通警情数据序列 输入过程中,[CLS]为序列开头、[SEP]为分隔符号。图2为本发明实施例 提供的一种BERT模型词向量组成示意图。
输入的交通警情数据序列经过向量转化后,将向量传入Transformer 编码器中抽取向量特征,特征抽取的计算公式如下:
Rl=Transformerl(Rl-1) (1)
式中,l表示Transformer编码器对应的层数(也即Transformer编 码器的数量),Rl为每层数据向量的特征。每一个Transformer编码器由 多个自注意力机制组成的多头自注意力模块,自注意力机制将输入的数据 序列通过线性变换得到三组向量序列,见公式(2):
式中,Q表示输出向量序列,K表示键向量序列,V表示输入向量序列。 WQ,WK,WV分别表示可学习的超参数矩阵。使用Softmax函数对权重矩阵 进行归一化处理,得到自注意力机制的特征函数如下:
Hi=Attention(Q,K,V) (4)
Muti-Hi=concat[H1,H2,...,Hh]WO (5)
式中,h为注意力头的个数,WO为可学习的超参数矩阵。多头自注意 力模块输出包含上下文语义的增强语义向量;经过残差连接、层归一化、 前馈神经网络等步骤,最终获得一个与原始字向量相同的增强语义向量, 并作为下一层编码器的输入;重复多次相同的Transformer编码器后得到 与交通警情数据长度相同输出向量,也即增强语义向量。
S130、所述文本预训练模型将所述增强语义向量同时输入至多任务处 理模型的各个子模型中;其中,所述多任务处理模型的各个子模型包括关 键信息抽取子模型、文本分类子模型及语义识别子模型。
在本发明实施例中,将文本预训练模型输出的增强语义向量通过参数 共享机制应用于多任务处理模型的各个子模型中,以减少不同的子模型训 练参数,使用更少的先验知识学习更多的内容,从而提高子模型的泛化能 力。具体的,多任务处理模型包括关键信息抽取子模型、文本分类子模型 及语义识别子模型,文本预训练模型通过参数共享机制将增强语义向量同 时输入至多任务处理模型中的关键信息抽取子模型、文本分类子模型及语 义识别子模型,以使多任务处理模型中的关键信息抽取子模型、文本分类 子模型及语义识别子模型对增强语义向量进行并行处理,以实现对交通警 情数据的自动处理。
图3为本发明实施例提供的一种交通警情处理过程示意图。
S140、所述关键信息抽取子模型、所述文本分类子模型及所述语义识 别子模型,对所述增强语义向量进行分析,分别确定所述交通警情数据中 的警情信息、警情类型及警情严重程度。
其中,关键信息抽取子模型通过对增强语义向量进行分析,以从交通 警情数据中确定警情信息。其中,警情信息可以包括时间信息、地址信息 及车牌信息。本发明实施例对关键信息抽取子模型的类型不做限定。
文本分类子模型通过对增强语义向量进行分析,以确定交通警情数据 中的警情类型。其中,文本分类子模型可以为BERT预训练模型中内置的 线性分类模型,也可以为快速文本分类模型FastText,还可以为卷积网络 文本分类模型TextCNN,当然,也可以为循环神经网络模型TextRNN或深 度金字塔卷积神经网络模型DPCNN。需要说明的是,本发明实施例对文本 分类子模型的类型不做限定。在本发明实施例中,根据警情致因不同,警 情类型可以包括机动车和机动车事故、机动车和非机动车事故、机动车和 行人事故、非机动车和非机动车事故、非机动车与行人事故及单方事故。 在本发明实施例中,对交通警情数据中警情类型的准确确定,对于交警采 取快速、有效的事故处理方法和后续事故致因分析都具有重要的意义。表 1为本发明实施例提供的六类交通警情数据样例:
表1六类交通警情数据样例
在本发明实施例中,语义识别子模型通过对增强语义向量进行分析, 以确定交通警情数据中的警情严重程度。其中,警情严重程度可以理解为 交通事故的严重程度,用于决定是否需要救援,如对于发生伤亡的事故, 及时派遣医疗或消防救援力量到达事故现场,可以最大程度地减少人员伤 亡和健康危害,因此,准确确定警情严重程度至关重要。在本发明实施例 中,对语义识别子模型的类型不做限定。
本发明实施例的交通警情处理方法,获取待处理的交通警情数据;将 所述交通警情数据输入至文本预训练模型中,获取所述文本预训练模型输 出的与所述交通警情数据对应的增强语义向量;其中,所述文本预训练模 型为BERT模型;所述文本预训练模型将所述增强语义向量同时输入至多 任务处理模型的各个子模型中;其中,所述多任务处理模型的各个子模型 包括关键信息抽取子模型、文本分类子模型及语义识别子模型;所述关键信息抽取子模型、所述文本分类子模型及所述语义识别子模型,对所述增 强语义向量进行分析,分别确定所述交通警情数据中的警情信息、警情类 型及警情严重程度。通过本发明实施例提供的技术方案,利用BERT文本 预训练模型作为上游共享参数层,多任务并行学习方法作为下游自动处理 层,不仅实现了对交通警情数据中的关键警情信息、警情类型和警情严重 程度的自动处理,而且通过采用参数共享机制减少不同的子模型训练参数, 使用更少的先验知识学习更多的内容,从而提高模型的泛化能力和识别准 确率。
在一些实施例中,所述关键信息抽取子模型包括条件随机场模型;在 所述关键信息抽取子模型对所述增强语义向量进行分析,确定所述交通警 情数据中的警情信息之前,还包括:所述文本预训练模型对所述交通警情 数据进行序列标注,根据标注结果确定与所述交通警情数据对应的状态序 列;所述文本预训练模型将所述状态序列输入至所述关键信息抽取子模型 中;所述关键信息抽取子模型对所述增强语义向量进行分析,确定所述交通警情数据中的警情信息,包括:所述条件随机场模型对所述增强语义向 量及所述状态序列进行分析,确定所述交通警情数据中的警情信息。这样 设置的好处在于,通过文本预训练模型输出的增强语义向量结合条件随机 场模型CRF实现对交通警情数据的序列标注,从而准确确定交通警情数据 中的警情信息。
具体的,文本预训练模型对交通警情数据进行序列标注,根据标注结 果确定与交通警情数据对应的状态序列。可以理解的是,序列标注的过程 就是文本预训练模型把增强语义向量作为待观察序列,对每个语义向量设 置一个状态,通过训练集最大化观察序列和状态序列的权重,找到满足条 件的概率值并完成序列标注过程。然后文本预训练模型将状态序列及增强 语义向量同时输入至条件随机场模型(也即关键信息抽取子模型)中,在 条件随机场模型中,将增强语义向量作为观察序列,假设观察序列 p=(p1,p2,...,pn)和状态序列q=(q1,q2,...,qn),设P(q|p)为线性链条随机场,条件 随机场模型计算公式为:
其中Z(p)为归一化项,计算公式为:
式中,tk和sl表示特征函数,λk和μl表示对应的权重。需要说明的 是,在进行序列标注时可以采用BIO标注法,其中“B”表示词标注开始 位置,“I”表示词标注内部位置,“O”表示不属于词标注外部位置。通 过关键信息抽取子模型可以获得每个词向量的序列标注概率。在本发明实 施例中,可以结合交通警情数据特征和实际需求,提取交通警情数据中的 时间信息(Time),地点信息(Address)和车牌信息(Plate)。图4为 本发明实施例提供的一种警情信息确定过程示意图。
可选的,所述警情信息包括时间信息;在确定所述交通警情数据中的 警情信息之后,还包括:提取所述交通警情数据中的时间信息;确定所述 时间信息的类型;其中,所述时间信息的类型包括当前发生时间和历史发 生时间。可以理解的是,获取交通警情数据中的时间信息对于确定警情发 生时间、警力快速调配十分重要。警情中的时间信息可以分为当前发生时 间和历史发生时间,当前发生时间一般采用拨打报警电话的时间,部分警 情中包含的一些显性时间可以进一步细化警情的发生时间,例如“5分钟 前”,“大约10分钟”;历史发生时间通常用于区分警情信息中的“过 去发生但不需要立即出警”的历史警情,例如“昨天”、“上周五”。这 一类历史时间也可以称作相对时间,可以以当前报警时刻作为参照点向前 计算警情事件发生的时间。通过提取交通警情数据中的时间信息,然后对 时间信息的类型进行判断,可以减少交通警察的误出警次数。
示例性的,表2为本发明实施例提供的交通警情时间信息抽取结果:
表2交通警情时间信息抽取结果
在本发明实施例中,地址信息是警情数据中描述警情发生位置的关键 信息,根据地址位置的粒度可以分为四个级别:城市级、县区级、街道级、 局部地方级。其中,局部地方级是指警情发生的详细地理位置。需要说明 的是,在抽取局部地方级信息的过程中存在大量地址实体嵌套现象,例如 “中山路新天地门口”中存在地名(中山路)和机构名(新天地)两个实 体嵌套,传统地址信息抽取方法一般只能获得“中山路”地址信息,但该 信息地理范围模糊不利于交通警察快速到达警情发生现场。在本发明实施 例中,可以通过观察警情中的数据格式,选择将地址标注“B-Address” 作为起始位置,[SEP]符号作为终点位置,依次按照城市级、县区级、街 道级分配地址信息,同时将剩余字符归属于局部地方级,以准确确定交通 警情数据中的地址信息。
示例性的,表3为本发明实施例提供的交通警情地址信息抽取结果:
表3交通警情地址信息抽取结果
在本发明实施例中,车牌信息也是警情数据中的关键信息,尤其是针 对逃逸车辆,获取车牌信息有利于交通警察缉查布控、快速抓获肇事车辆。 通常车牌信息格式较为规范,一般由7位字符组成。因此,可根据车牌信 息的数据结构,重点提取车牌的起始位置(如“苏”)和内部位置(如“E”), 继续提取至数字或字母字符结束。
在一些实施例中,所述交通警情数据为至少两条;所述语义识别子模 型包括相似度计算层、Bi-GRU单元层及注意力机制层;所述语义识别子模 型,对所述增强语义向量进行分析,确定所述交通警情数据中的警情严重 程度,包括:所述语义识别子模型中的相似度计算层分别计算所述至少两 条交通警情数据对应的增强语义向量间的相似度,确定相似度大于预设相 似度阈值的目标增强语义向量;所述相似度计算层将所述目标增强语义向 量输入至所述Bi-GRU单元层,所述Bi-GRU单元层确定与所述目标增强语 义向量对应的局部特征增强向量,并将所述局部特征增强向量输入至所述 注意力机制层;所述注意力机制层对所述局部特征增强向量进行分析,分 别确定与所述目标增强语义向量对应的交通警情数据中的警情严重程度。 这样设置的好处在于,可以准确确定交通警情数据中的警情严重程度。
在本发明实施例中,从一条交通警情数据中判断是否需要救援存在两 个难点:一方面,警情中出现的救援相关的词向量存在一词多义现象,例 如警情中的“救护车”可能是指事故类型(“轿车和救护车相撞”),也 可能是指事故救援请求(“需要救护车到达现场”)。另一方面,判断是 否需要救援的句向量相似度较高,例如“有人受伤,通知救护车”、“有 人受伤,已通知救护车”、“有人受伤,不需要救护车”,以上三条警情 数据中只有第一条才需要通知救援车辆。因此,本发明实施例中,可基于 局部特征增强的交通警情语义分析方法,准确确定交通警情数据中的警情 严重程度。
具体的,语义识别子模型包括相似度计算层、Bi-GRU单元层及注意力 机制层,当待处理的交通警情数据为至少两条时,文本预训练模型将每条 交通警情数据对应的增强语义向量分别输入至语义识别子模型中的相似 度计算层,相似度计算层分别计算至少两条交通警情数据对应的增强语义 向量间的相似度,确定相似度大于预设相似度阈值的目标增强语义向量。 然后相似度计算层将目标增强语义向量输入至Bi-GRU单元层,Bi-GRU单元层用于提取目标增强向量对应的局部特征增强向量,也即确定相似语义 中局部深层次特征,并将局部特征增强向量输入至注意力机制层(也即 Attention机制层),Attention机制层中使用Softmax函数进行归一化 处理,最终得到交通警情的警情严重程度标签,从而确定出交通警情数据 中的警情严重程度。
示例性的,图5为本发明实施例提供的一种警情严重程度确定过程示 意图。如图5所示,交通警情数据序列经过BERT预训练处理后将得到增 强语义向量序列V={v1,v2,...,vN},N表示交通警情数据序列长度,然后将增强 语义向量输入到Bi-GRU隐层中,隐层的状态由t时刻输入vt、t-1时刻向 前的隐层状态输出和反向的隐层状态的输出三部分共同决定。 Bi-GRU模型可以认为是两个单向GRU加权求和,见公式(8-10):
式中,GRU(·)函数表示对输入的词向量进行非线性变换,把词向量编 码成对应的GRU隐层状态,ωt和μt分别为t时刻双向GRU对应的前向隐层 状态和反向隐层状态对应的权重,bt表示t时刻隐层所对应的偏置。为进 一步强化具有重要词性的词特征,降低非重要词性的词特征,将Bi-GRU 模型的全连接输入到Attention机制层中,计算输入各隐层状态与权重系 数乘积的累加和公式为:
其中,
ei=μitanh(ωihi+bi) (13)
式中,ei表示第i时刻隐层状态向量hi所能决定的能量值;μi和ωi表 示第i时刻的权重系数矩阵;bi表示第i时刻相应的偏移量。通过公式(11) 可以得到包含局部关键特征句向量。在此基础上,使用Softmax分类器获 取警情语义的警情严重程度标签,并采用反向传播机制根据误差不断调整 并更新权重和偏置,直到达到迭代次数或小于固定精度为止。
实施例二
图6为本发明实施例二提供的一种交通警情处理装置的结构示意图。 如图6所示,该装置包括:
警情数据获取模块610,用于获取待处理的交通警情数据;
增强语义向量获取模块620,用于将所述交通警情数据输入至文本预 训练模型中,获取所述文本预训练模型输出的与所述交通警情数据对应的 增强语义向量;其中,所述文本预训练模型为BERT模型;
增强语义向量输入模块630,用于所述文本预训练模型将所述增强语 义向量同时输入至多任务处理模型的各个子模型中;其中,所述多任务处 理模型的各个子模型包括关键信息抽取子模型、文本分类子模型及语义识 别子模型;
警情数据处理模块640,用于所述关键信息抽取子模型、所述文本分 类子模型及所述语义识别子模型,对所述增强语义向量进行分析,分别确 定所述交通警情数据中的警情信息、警情类型及警情严重程度。
可选的,所述关键信息抽取子模型包括条件随机场模型;
所述装置还包括:
状态序列确定模块,用于在所述关键信息抽取子模型对所述增强语义 向量进行分析,确定所述交通警情数据中的警情信息之前所述文本预训练 模型对所述交通警情数据进行序列标注,根据标注结果确定与所述交通警 情数据对应的状态序列;
状态序列输入模块,用于所述文本预训练模型将所述状态序列输入至 所述关键信息抽取子模型中;
所述警情数据处理模块,用于:
所述条件随机场模型对所述增强语义向量及所述状态序列进行分析, 确定所述交通警情数据中的警情信息。
可选的,所述交通警情数据为至少两条;
所述语义识别子模型包括相似度计算层、Bi-GRU单元层及注意力机制 层;
所述警情数据处理模块,用于:
所述语义识别子模型中的相似度计算层分别计算所述至少两条交通 警情数据对应的增强语义向量间的相似度,确定相似度大于预设相似度阈 值的目标增强语义向量;
所述相似度计算层将所述目标增强语义向量输入至所述Bi-GRU单元 层,所述Bi-GRU单元层确定与所述目标增强语义向量对应的局部特征增 强向量,并将所述局部特征增强向量输入至所述注意力机制层;
所述注意力机制层对所述局部特征增强向量进行分析,分别确定与所 述目标增强语义向量对应的交通警情数据中的警情严重程度。
可选的,所述警情信息包括时间信息、地址信息及车牌信息。
可选的,所述警情信息包括时间信息;
所述装置还包括:
时间信息提取模块,用于在确定所述交通警情数据中的警情信息之后, 提取所述交通警情数据中的时间信息;
时间类型确定模块,用于确定所述时间信息的类型;其中,所述时间 信息的类型包括当前发生时间和历史发生时间。
可选的,所述文本分类子模型包括循环神经网络模型。
可选的,所述警情类型包括机动车和机动车事故、机动车和非机动车 事故、机动车和行人事故、非机动车和非机动车事故、非机动车与行人事 故及单方事故。
本发明实施例所提供的交通警情处理装置可执行本发明任意实施例 所提供的交通警情处理方法,具备执行方法相应的功能模块和有益效果。
实施例三
图7示出了可以用来实施本发明的实施例的电子设备10的结构示意 图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台 式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、 和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如, 个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表 等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及 它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的 本发明的实现。
如图7所示,电子设备10包括至少一个处理器11,以及与至少一个 处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器 (RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程 序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者 从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的 各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。 输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16, 例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存 储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调 器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的 计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。 处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元 (GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型 算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制 器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如交通警情处理方法。
在一些实施例中,交通警情处理方法可被实现为计算机程序,其被有 形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计 算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/ 或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执 行时,可以执行上文描述的交通警情处理方法的一个或多个步骤。备选地, 在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助 于固件)而被配置为执行交通警情处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路 系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、 专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设 备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些 各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者 多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/ 或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储 系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将 数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出 装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言 的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机 或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时 使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在 机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行 且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可 以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装 置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限 于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设 备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是 机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多 个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只 读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光 纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、 或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技 术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴 极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例 如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供 给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供 给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、 或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触 觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如, 作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、 或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器 的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处 描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部 件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络 的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并 且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有 客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器 可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的 一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大, 业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或 删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执 行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果, 本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术 人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、 子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和 改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种交通警情处理方法,其特征在于,包括:
获取待处理的交通警情数据;
将所述交通警情数据输入至文本预训练模型中,获取所述文本预训练模型输出的与所述交通警情数据对应的增强语义向量;其中,所述文本预训练模型为BERT模型;
所述文本预训练模型将所述增强语义向量同时输入至多任务处理模型的各个子模型中;其中,所述多任务处理模型的各个子模型包括关键信息抽取子模型、文本分类子模型及语义识别子模型;
所述关键信息抽取子模型、所述文本分类子模型及所述语义识别子模型,对所述增强语义向量进行分析,分别确定所述交通警情数据中的警情信息、警情类型及警情严重程度。
2.根据权利要求1所述的方法,其特征在,所述关键信息抽取子模型包括条件随机场模型;
在所述关键信息抽取子模型对所述增强语义向量进行分析,确定所述交通警情数据中的警情信息之前,还包括:
所述文本预训练模型对所述交通警情数据进行序列标注,根据标注结果确定与所述交通警情数据对应的状态序列;
所述文本预训练模型将所述状态序列输入至所述关键信息抽取子模型中;
所述关键信息抽取子模型对所述增强语义向量进行分析,确定所述交通警情数据中的警情信息,包括:
所述条件随机场模型对所述增强语义向量及所述状态序列进行分析,确定所述交通警情数据中的警情信息。
3.根据权利要求1所述的方法,其特征在,所述交通警情数据为至少两条;
所述语义识别子模型包括相似度计算层、Bi-GRU单元层及注意力机制层;
所述语义识别子模型,对所述增强语义向量进行分析,确定所述交通警情数据中的警情严重程度,包括:
所述语义识别子模型中的相似度计算层分别计算所述至少两条交通警情数据对应的增强语义向量间的相似度,确定相似度大于预设相似度阈值的目标增强语义向量;
所述相似度计算层将所述目标增强语义向量输入至所述Bi-GRU单元层,所述Bi-GRU单元层确定与所述目标增强语义向量对应的局部特征增强向量,并将所述局部特征增强向量输入至所述注意力机制层;
所述注意力机制层对所述局部特征增强向量进行分析,分别确定与所述目标增强语义向量对应的交通警情数据中的警情严重程度。
4.根据权利要求1-3任一所述的方法,其特征在于,所述警情信息包括时间信息、地址信息及车牌信息。
5.根据权利要求4所述的方法,其特征在,所述警情信息包括时间信息;
在确定所述交通警情数据中的警情信息之后,还包括:
提取所述交通警情数据中的时间信息;
确定所述时间信息的类型;其中,所述时间信息的类型包括当前发生时间和历史发生时间。
6.根据权利要求1所述的方法,其特征在于,所述文本分类子模型包括循环神经网络模型。
7.根据权利要求1所述的方法,其特征在于,所述警情类型包括机动车和机动车事故、机动车和非机动车事故、机动车和行人事故、非机动车和非机动车事故、非机动车与行人事故及单方事故。
8.一种交通警情处理装置,其特征在于,包括:
警情数据获取模块,用于获取待处理的交通警情数据;
增强语义向量获取模块,用于将所述交通警情数据输入至文本预训练模型中,获取所述文本预训练模型输出的与所述交通警情数据对应的增强语义向量;其中,所述文本预训练模型为BERT模型;
增强语义向量输入模块,用于所述文本预训练模型将所述增强语义向量同时输入至多任务处理模型的各个子模型中;其中,所述多任务处理模型的各个子模型包括关键信息抽取子模型、文本分类子模型及语义识别子模型;
警情数据处理模块,用于所述关键信息抽取子模型、所述文本分类子模型及所述语义识别子模型,对所述增强语义向量进行分析,分别确定所述交通警情数据中的警情信息、警情类型及警情严重程度。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的交通警情处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的交通警情处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210249040.4A CN114861626A (zh) | 2022-03-14 | 2022-03-14 | 一种交通警情处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210249040.4A CN114861626A (zh) | 2022-03-14 | 2022-03-14 | 一种交通警情处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114861626A true CN114861626A (zh) | 2022-08-05 |
Family
ID=82627784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210249040.4A Pending CN114861626A (zh) | 2022-03-14 | 2022-03-14 | 一种交通警情处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114861626A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115391450A (zh) * | 2022-08-26 | 2022-11-25 | 百度在线网络技术(北京)有限公司 | 推理信息生成方法、装置、设备、可读存储介质及产品 |
-
2022
- 2022-03-14 CN CN202210249040.4A patent/CN114861626A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115391450A (zh) * | 2022-08-26 | 2022-11-25 | 百度在线网络技术(北京)有限公司 | 推理信息生成方法、装置、设备、可读存储介质及产品 |
CN115391450B (zh) * | 2022-08-26 | 2024-01-09 | 百度在线网络技术(北京)有限公司 | 推理信息生成方法、装置、设备、可读存储介质及产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112560496A (zh) | 语义分析模型的训练方法、装置、电子设备及存储介质 | |
CN111191450B (zh) | 语料清洗方法、语料录入设备及计算机可读存储介质 | |
EP4113357A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
CN111538809B (zh) | 一种语音服务质量检测方法、模型训练方法及装置 | |
CN111695354A (zh) | 基于命名实体的文本问答方法、装置及可读存储介质 | |
CN113553412B (zh) | 问答处理方法、装置、电子设备和存储介质 | |
CN113505200B (zh) | 一种结合文档关键信息的句子级中文事件检测的方法 | |
CN114648676B (zh) | 点云处理模型的训练和点云实例分割方法及装置 | |
CN112559885A (zh) | 地图兴趣点的训练模型确定方法、装置及电子设备 | |
CN115358243A (zh) | 多轮对话识别模型的训练方法、装置、设备及存储介质 | |
CN114519613B (zh) | 价格数据的处理方法和装置、电子设备、存储介质 | |
CN114861626A (zh) | 一种交通警情处理方法、装置、电子设备及存储介质 | |
CN114861758A (zh) | 多模态数据处理方法、装置、电子设备及可读存储介质 | |
CN111241843A (zh) | 基于复合神经网络的语义关系推断系统和方法 | |
CN110888944A (zh) | 基于多卷积窗尺寸注意力卷积神经网络实体关系抽取方法 | |
CN116956816A (zh) | 文本处理方法、模型训练方法、装置及电子设备 | |
CN116432705A (zh) | 文本生成模型构建、文本生成方法和装置、设备及介质 | |
CN115577705A (zh) | 一种文本处理模型的生成方法、装置、设备及存储介质 | |
CN115761839A (zh) | 人脸活体检测模型的训练方法、人脸活体检测方法及装置 | |
CN115545030A (zh) | 实体抽取模型的训练方法、实体关系抽取方法及装置 | |
CN114417891A (zh) | 基于粗糙语义的回复语句确定方法、装置及电子设备 | |
CN114416941A (zh) | 融合知识图谱的对话知识点确定模型的生成方法及装置 | |
CN114970666A (zh) | 一种口语处理方法、装置、电子设备及存储介质 | |
CN113051926A (zh) | 文本抽取方法、设备和存储介质 | |
CN114372458B (zh) | 一种基于政务工单的突发事件检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |