CN112948603B

CN112948603B - 一种基于迁移学习的运输投送知识问答方法

Info

Publication number: CN112948603B
Application number: CN202110249336.1A
Authority: CN
Inventors: 孙玉洁; 张昊; 齐和平
Original assignee: NORTH AUTOMATIC CONTROL TECHNOLOGY INSTITUTE
Current assignee: Zhongbing Intelligent Innovation Research Institute Co ltd
Priority date: 2021-03-08
Filing date: 2021-03-08
Publication date: 2023-05-05
Anticipated expiration: 2041-03-08
Also published as: CN112948603A

Abstract

本发明涉及一种基于迁移学习的运输投送知识问答方法，获取运输投送相关知识。将运输投送过程中接收到的结构化数据、半结构化数据、非结构化数据、图像、话音、视频等分类处理为实体、属性、关系；构建关系抽取网络，抽取实体间的关系，生成RDF三元组，针对自动生成的三元组进行人工处理，实体对齐、消歧后分类存储；使用迁移学习框架对无标注的运输投送数据进行学习，支撑运输投送系统的知识问答。本发明构建基于问答模式的运输投送系统知识图谱，通过迁移学习在仅有小样本标注数据的情况下，自学习不同承运、不同投送方式的问答序列，从而对相关用户提问快速提供运输投送方案，在运输投送领域具备普适性和泛化能力。

Description

一种基于迁移学习的运输投送知识问答方法

技术领域

本发明涉及机器学习技术领域，更具体地说，涉及一种基于迁移学习的运输投送知识问答方法。

背景技术

运输投送系统逐渐成为物流配送、跨国投送，甚至军用机动控制的核心系统，该系统不仅包含常规的立体投送规划功能，还包含装卸载方案规划、换乘换装方案规划功能，随着大数据、机器学习、知识图谱各类相关技术的兴起，运输投送系统不断转型升级，运输投送系统的智能知识问答功能应运而生。本专利提出一种基于迁移学习的运输投送知识问答方法，该方法针对不同规模、不同规格的被承运物(人)如何智能计算装卸载方案、换乘换装方案，以及在不同投送方式、不同规划目标下如何智能规划混合投送路径的问题，构建基于问答模式的运输投送系统知识图谱，通过迁移学习在仅有小样本标注数据的情况下，自学习不同承运、不同投送方式的问答序列，从而对相关用户提问快速提供运输投送方案。

知识问答的核心在于信息检索，然而，以关键字为基础的索引、匹配算法尽管简单易行，但毕竟停留在语言的表层，没有触及语义，因此效果很难进一步提高。随着5G网络及智能话音设备的飞速发展，运输投送系统需要高效、准确、垂直领域的交互问答服务，传统基于结构化数据的问答、基于自由文本的问答、基于问题答案对的问答，需要依赖源数据结构化表示、大规模人工标注、对轮模式等基于规则的大量样本数据，现有的知识问答系统在运输投送领域不具备普适性和泛化能力，而针对运输投送这一垂直领域，属于专业性较强的垂直领域，无法使用Curated KBs知识库、Extracted KBs知识库等常用知识库。

发明内容

本发明解决上述技术问题所采用的技术方案是：构造一种基于迁移学习的运输投送知识问答方法，包括：

获取运输投送知识并进行分类；运输投送知识分类步骤中，将运输投送知识分为文本、图像、视频；

基于分类后的运输投送知识，进行知识空间构建、分词及实体识别，标注出运输投送知识中的实体及实体属性；

基于Word2vec模型训练，得到运输投送知识所有实体的词向量，同时标注各实体之间的关系，以构建运输投送知识的语料库；

构建关系抽取网络，将通过Word2vec模型训练得到的词向量输入关系抽取网络，输出运输投送知识中实体间的实体关系匹配概率；

将得到的实体关系进行人工核查，按照运输投送经验及知识进行正确的实体、关系、实体三元组匹配，生成符合标准的RDF三元组；

将RDF三元组中的实体进行对齐或消歧，实现运输投送知识融合，构建运输投送分类树，采用图数据库按分类树架构进行分类存储，构建静态规划环境域；

将静态规划环境域作为迁移学习模型的源域，将静态规划环境域模型计算的约束参数迁移到动态规划环境域中，作为迁移学习模型的目标域；

挖掘源域和目标域的相似性，微调静态方案规划环境域的参数并确定发生变化的数据相应的参数，通过人在回路的方式微调动态规划环境域的网络参数；

将调整完成的迁移学习模型的源域和目标域作为运输投送知识问答系统，解析实时的问题，提取问题中的关键字并输入运输投送知识问答系统，输出的实体作为问题答案的关键字，组成系统回复。

其中，在获取运输投送知识的步骤中，运输投送知识包括立体投送知识和装卸载、换装换乘知识；

其中，立体投送知识是立体投送路径规划，分为陆地路径规划、空中航迹规划和海上航线规划。

其中，在对分类后的运输投送知识，进行知识空间构建、分词及实体识别，标注出运输投送知识中的实体及实体属性的步骤中，

文本知识空间构建：将获取的文本，按结构化数据、半结构化数据和非结构化数据的类型分类；其中，简短的指令通过文档标题直接归类，文书通过标题或将长篇文书分段归类；将文本知识输入jieba分词器，进行细粒度运输投送词汇的切分，利用人工标注实体及实体属性；

图像知识空间构建：将获取的图像知识进行目标识别，将识别的目标进行图像配准，将分析计算后的目标属性转为格式化数据；将图像转化的格式化数据利用人工标注实体及实体属性；

视频知识空间构建：将获取的视频知识进行帧处理，提取集中出现某实体的数帧图像，进行目标识别与图像配准，将分析计算后的目标属性转为格式化数据；将视频转化的格式化数据，利用人工标注实体及实体属性。

其中，在基于Word2vec模型训练，得到运输投送知识所有实体的词向量，同时标注各实体之间的关系，以构建运输投送知识的语料库的步骤中，包括步骤：

使用Skip-gram模型，将标注的实体作为中心词W(t)进行预测；模型输入值中心词的one-hot编码形式，输出为softmax转换后的概率；

Word2vec模型训练后得到运输投送知识的所有实体的词向量，同时人工标注各实体间的关系，作为运输投送知识标注后的语料库。

其中，在构建关系抽取网络，将通过Word2vec模型训练得到的词向量输入关系抽取网络，输出运输投送知识中实体间的实体关系匹配概率的步骤中，

关系抽取网络包含embedding层、transform层、cov1D层、maxPooling1D层、dropout层、liner层和softmax输出层；

运输投送知识的词向量按Batch块输入embedding层，得到Batch*length*Embed大小的多维向量，通过transform层转置多维向量为一条句子一个向量块输入cov1D层，通过一个CNN结构对句子向量进行特征提取，通过maxPooling1D层最大池化得到降维后的向量块，加入一层dropout层防止过拟合后输入liner层，学习句子关系与目标关系的线性相关性，最后输入softmax层得到实体关系匹配概率。

其中，将RDF三元组中的实体进行对齐或消歧，实现运输投送知识融合，构建运输投送分类树，采用图数据库按分类树架构进行分类存储，构建静态规划环境域的步骤中，包括步骤：

将来自路径规划知识库、装卸载换车换乘知识库的不同来源的实体进行对齐或消歧，将等价实例、等价类/子类、等价属性/子属性三类融合；

将运输投送知识分类为输送路线搜索、纵梯队自动划分、输送装卸载三类知识库；

将各类知识按照语义空间划分为不同子类，将对齐后的实体、关系、属性分类收集、更新，构建运输投送分类树；

将对齐融合后的运输投送RDF三元组，采用图数据库(neo4j)按照分类树架构进行分类存储。

其中，在挖掘源域和目标域的相似性的步骤中，挖掘方式包括：

在动态规划环境域中，当地表地形环境/空中规划环境/海上规划环境不随时间的推荐发生变化时，动态规划场景退化为静态规划场景；

在动态规划环境域中，气象数据发生的变化不足以影响装备机动参数时，动态规划场景沿用静态规划场景学习的知识数据；

在动态规划环境域中，当装备运输区域与发生变化的地表地形空间距离较远时，装备周围的自由空间在动态和静态场景下基本保持一致；

基于DDPG的规划方法，输入是每一帧的图像，输出是方案规划结果，所以静态规划和动态规划在每一帧的处理算法上本质是相同的，动态规划场景可以理解为静态场景和动态目标的叠加。

区别于现有技术，本发明基于迁移学习的运输投送知识问答方法，获取运输投送相关知识。将运输投送过程中接收到的结构化数据、半结构化数据、非结构化数据、图像、话音、视频等分类处理为实体、属性、关系；构建关系抽取网络，抽取实体间的关系，生成RDF三元组，针对自动生成的三元组进行人工处理，实体对齐、消歧后分类存储；使用迁移学习框架对无标注的运输投送数据进行学习，支撑运输投送系统的知识问答。本发明构建基于问答模式的运输投送系统知识图谱，通过迁移学习在仅有小样本标注数据的情况下，自学习不同承运、不同投送方式的问答序列，从而对相关用户提问快速提供运输投送方案，在运输投送领域具备普适性和泛化能力。

附图说明

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1是本发明提供的一种基于迁移学习的运输投送知识问答方法的流程示意图。

具体实施方式

为了对本发明的技术特征、目的和效果有更加清楚的理解，现对照附图详细说明本发明的具体实施方式。

参阅图1，本发明提供了一种基于迁移学习的运输投送知识问答方法，包括：

路径规划公共知识，包括投送区域、出发点、必经点、目的地、禁止点、禁止区域、威胁区域、气象、水文、潮汐等实体。区域实体属性包括区域边界、区域空间位置等知识；关键点实体属性包括经度、纬度、途径时间、途径速度等知识；气象实体包括风向风速等级、雨等级、雪等级、雾等级等知识；

陆地路径规划指公路+铁路+野外混合规划。公路规划场景中，不同等级公路(高速公路、省道、县道、乡道等)定义为不同实体，此类实体属性包括宽度、最大承重、最大机动速度等知识；桥梁、涵洞、隧道定义为不同实体，此类实体属性包括最大通过宽度、最大通过高度、最大承重等知识；铁路规划场景中，不同等级列车(高铁、特快等)定义为不同实体，此类实体包括平车、客车、棚车的列车计长、最大机动速度等属性知识；野外规划场景中，不同类型车辆(轻型越野车、大型集装箱车等)定义为不同实体，此类实体属性包括车长、车宽、车高、最大离地间隙、接近角、离去角、最大转弯半径、最大越障高度等知识；

空中航迹规划知识中，无人机实体的属性包括机长、机宽、走廊高度、转弯半径、自动进入航程点最小距离、180度转向最小距离、90度转向最小距离、拍摄时间间隔等知识；航迹条件实体包括航向重叠度、旁向重叠度、有效拍摄范围、有效拍摄高度、地面能见度、云底高等知识；

海上航线规划知识中，船舶实体类型包括干散货船、液体散货船、集装箱船、杂货船等；船舶实体属性包括船籍港、船舶全长、两柱间长、型宽、型深、总吨(位)、净吨(位)、排水量、机舱长、机舱宽、满载载重量、载重线种类、净空高度、干舷、剩余浮力、吃水、浮心、漂心、船舶重心、货物重心、静稳性高度、空船压载、货舱数、货舱长、货舱宽、货舱高、卸载设备类型、卸载设备数量、主机功率、主机功率、发电机功率等知识；

装卸载、换装换乘知识中，铁路输送为机动输送的主要运输方式，分为安全警戒场景、渡板调整场景、清扫画线场景、指挥引导场景、捆绑加固场景等。其中，安全警戒场景实体包括装载地域制高点、派出观察哨、安全警戒哨和巡逻哨等知识；渡板调整场景实体包体包括渡板安装时间、渡板拆除时间等知识；清扫画线场景包括平车中心线位置、平车端板、撬棍、铁锤等知识；指挥引导场景实体包括逐车引导、定点接力等知识；捆绑加固场景实体包括指挥车加固、特种车加固、运输车加固、止轮器、紧固器、钢丝绳等知识。

运输投送知识的获取方式分为文本、图像、视频等媒介，文本主要包括上级下发的装载指令、卸载指令、换车指令、换乘指令、机动指令以及相应的装载计划文书、卸载计划文书、换车换乘计划文书、机动投送文书等文本文档，或上级语音转换成的文本；图像主要包括各场景实物实体拍摄图像以及装载序列图、卸载序列图、换车换乘示意图、机动投送示意图等图像，或上级口述标图后的图像；视频主要包括各场景实物的实体拍摄视频。

文本知识空间构建：将获取的文本，按结构化数据((XML或json文件)、半结构化数据(前端页面或表格)和非结构化数据(计划或文书)的类型分类；其中，简短的指令通过文档标题直接归类，文书通过标题或将长篇文书分段归类；将文本知识输入jieba分词器，进行细粒度运输投送词汇的切分，利用人工标注实体及实体属性；

图像知识空间构建：将获取的图像知识进行目标识别，将识别的目标(车辆、无人机、船舶等)进行图像配准，将分析计算后的目标属性转为格式化数据；将图像转化的格式化数据利用人工标注实体及实体属性，如装备的类型、长、宽、高等数据；

视频知识空间构建：将获取的视频知识进行帧处理，提取集中出现某实体的数帧图像，进行目标识别与图像配准，将分析计算后的目标属性转为格式化数据；将视频转化的格式化数据，利用人工标注实体及实体属性，如装备的类型、长、宽、高等数据。

将得到的实体关系进行人工核查，按照运输投送经验及知识进行正确的(实体，关系，实体)三元组匹配，生成符合标准的RDF三元组。

运输投送知识融合，也称为本体对齐、本体匹配、Record Linkage、EntityResolution，将RDF三元组中的实体进行对齐或消歧，实现运输投送知识融合，构建运输投送分类树，采用图数据库按分类树架构进行分类存储，构建静态规划环境域的步骤中，包括步骤：

将来自路径规划知识库、装卸载换车换乘知识库的不同来源的实体进行对齐或消歧，将等价实例、等价类/子类、等价属性/子属性三类融合；等价实例如机动起点和路线起点视为同一实体；等价类/子类如装载地是出发点的子类SubClassOf；等价属性/子属性如出生于和出生日期是等价属性SubPropertyOf。

将对齐融合后的运输投送RDF三元组，采用图数据库(neo4j)按照分类树架构进行分类存储。一个RDF三元组可能因为时间的推移发生属性内容的动态更新，如(轨迹起点，衔接轨迹，轨迹终点)在不同时刻动态变化。

迁移学习框架构建过程中：

构建静态规划环境域。静态规划环境域属于本发明迁移学习的源域，构造迁移模型的目的即将静态方案规划环境中模型计算的约束参数迁移到动态方案规划环境中，动态方案规划环境称为迁移模型的目标域。

本发明的迁移模型只考虑一个源域和一个目标域的简单情况，其中，源域(静态规划环境域)的数据表示为D_S＝{(x_S1，y_S1)，(x_S2，y_S2)，…，(x_SnS，y_SnS)}，其中x_Si∈X_S是方案规划模型的数据实例，y_Si∈Y_S是相应的类标签。静态规划环境域对应的学习任务即从地图A点经过B点、C点……到终点F点搜寻一条以方案规划目标为代价指标的最小耗费路径。

获取动态规划环境的变化数据。迁移模型的前提是判断哪些参数需要更改，即静态规划环境中的哪些数据可以保持不变，如装备的基础数据、行驶数据等，哪些数据会随战中态势变化而发生改变。本发明通过接收的情报数据作为动态规划环境域的输入，如战场中的弹坑会改变地形，弹坑的大小及深度即战中环境的变化数据。

构建动态方案规划环境域。基于静态规划环境域的数据及数据标签，同样使用D_T＝{(x_T1，y_T1)，(x_T2，y_T2)，…，(x_TnT，y_TnT)}作为数据表示，其中输入x_Ti∈X_T，y_Ti∈Y_T是相应的输出。在大多数情况下，0<n_T《n_S。由于战中环境发生变化，即使学习任务为从地图A点经过B点、C点……到终点F点搜寻一条以规划目标为代价指标的最小耗费路径，因为地形环境、装备车辆通行难度的变化，D_S≠D_T，或者T_S≠T_T，即静态与动态方案规划环境域的数据发生变化，其学习任务同样发生变化。

注入的无标注知识即为迁移学习的目标域数据。在挖掘源域和目标域的相似性的步骤中，挖掘方式包括：

依据上述挖掘算法，微调静态规划环境域的网络参数。遍历静态规划环境域的神经网络，确定发生变化的数据相应的参数，通过人在回路的方式微调动态规划环境域的网络参数。为辅助指挥员网络调参，各参数依据相应数据变化范围迭代递增或递减。

运输投送知识补全的步骤中，将训练好的网络参数作为迁移学习模型的输入，通过实时获取战中的禁止区域、威胁区域、气象、水文、潮汐等数据，不停调整规划策略，通过不同战中动态投送环境可得到不同战场环境的规划方案，将方案及其对应的网络训练参数作为历史样本，可作为静态规划环境下网络训练的测试数据，从而提高战场环境下运输投送方案生成的速率，降低对人在回路的依赖。

构建运输投送知识问答系统，基于构建的知识图谱回答诸如“从驻地A到集结地B的最快机动路线是什么”、“以X旅建制为编组、最少调整的纵梯队划分是什么”、“按当前列车及承货量、最小空间浪费的装载方式是什么”几类问题，支持指挥员快速、精准得到系统回复。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本发明的保护之内。

Claims

1.一种基于迁移学习的运输投送知识问答方法，其特征在于，包括：

2.根据权利要求1所述的基于迁移学习的运输投送知识问答方法，其特征在于，在获取运输投送知识的步骤中，运输投送知识包括立体投送知识和装卸载、换装换乘知识；

3.根据权利要求1所述的基于迁移学习的运输投送知识问答方法，其特征在于，在对分类后的运输投送知识，进行知识空间构建、分词及实体识别，标注出运输投送知识中的实体及实体属性的步骤中，

4.根据权利要求3所述的基于迁移学习的运输投送知识问答方法，其特征在于，在基于Word2vec模型训练，得到运输投送知识所有实体的词向量，同时标注各实体之间的关系，以构建运输投送知识的语料库的步骤中，包括步骤：

使用Skip-gram模型，将标注的实体作为中心词W(t) 进行预测；模型输入值中心词的one-hot编码形式，输出为softmax转换后的概率；

5.根据权利要求4所述的基于迁移学习的运输投送知识问答方法，其特征在于，在构建关系抽取网络，将通过Word2vec模型训练得到的词向量输入关系抽取网络，输出运输投送知识中实体间的实体关系匹配概率的步骤中，

6.根据权利要求1所述的基于迁移学习的运输投送知识问答方法，其特征在于，将RDF三元组中的实体进行对齐或消歧，实现运输投送知识融合，构建运输投送分类树，采用图数据库按分类树架构进行分类存储，构建静态规划环境域的步骤中，包括步骤：

将对齐融合后的运输投送RDF三元组，采用图数据库neo4j按照分类树架构进行分类存储。

7.根据权利要求1所述的基于迁移学习的运输投送知识问答方法，其特征在于，在挖掘源域和目标域的相似性的步骤中，挖掘方式包括：

在动态规划环境域中，当装备运输区域与发生变化的地表地形空间距离较远时，装备周围的自由空间在动态和静态场景下保持一致；

基于DDPG 的规划方法，输入是每一帧的图像，输出是方案规划结果，所以静态规划和动态规划在每一帧的处理算法上本质是相同的，动态规划场景可以理解为静态场景和动态目标的叠加。