CN112948603B - 一种基于迁移学习的运输投送知识问答方法 - Google Patents
一种基于迁移学习的运输投送知识问答方法 Download PDFInfo
- Publication number
- CN112948603B CN112948603B CN202110249336.1A CN202110249336A CN112948603B CN 112948603 B CN112948603 B CN 112948603B CN 202110249336 A CN202110249336 A CN 202110249336A CN 112948603 B CN112948603 B CN 112948603B
- Authority
- CN
- China
- Prior art keywords
- knowledge
- delivery
- transportation
- entities
- planning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012384 transportation and delivery Methods 0.000 title claims abstract description 130
- 238000013526 transfer learning Methods 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000000605 extraction Methods 0.000 claims abstract description 17
- 238000002372 labelling Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 8
- 230000003068 static effect Effects 0.000 claims description 41
- 239000013598 vector Substances 0.000 claims description 39
- 238000012549 training Methods 0.000 claims description 17
- 230000008859 change Effects 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 14
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000012546 transfer Methods 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 7
- 238000005065 mining Methods 0.000 claims description 7
- 238000012876 topography Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 239000000969 carrier Substances 0.000 abstract description 5
- 230000008569 process Effects 0.000 abstract description 3
- 239000010410 layer Substances 0.000 description 28
- 230000006870 function Effects 0.000 description 4
- 230000002787 reinforcement Effects 0.000 description 4
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/45—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Human Resources & Organizations (AREA)
- Human Computer Interaction (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Quality & Reliability (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于迁移学习的运输投送知识问答方法,获取运输投送相关知识。将运输投送过程中接收到的结构化数据、半结构化数据、非结构化数据、图像、话音、视频等分类处理为实体、属性、关系;构建关系抽取网络,抽取实体间的关系,生成RDF三元组,针对自动生成的三元组进行人工处理,实体对齐、消歧后分类存储;使用迁移学习框架对无标注的运输投送数据进行学习,支撑运输投送系统的知识问答。本发明构建基于问答模式的运输投送系统知识图谱,通过迁移学习在仅有小样本标注数据的情况下,自学习不同承运、不同投送方式的问答序列,从而对相关用户提问快速提供运输投送方案,在运输投送领域具备普适性和泛化能力。
Description
技术领域
本发明涉及机器学习技术领域,更具体地说,涉及一种基于迁移学习的运输投送知识问答方法。
背景技术
运输投送系统逐渐成为物流配送、跨国投送,甚至军用机动控制的核心系统,该系统不仅包含常规的立体投送规划功能,还包含装卸载方案规划、换乘换装方案规划功能,随着大数据、机器学习、知识图谱各类相关技术的兴起,运输投送系统不断转型升级,运输投送系统的智能知识问答功能应运而生。本专利提出一种基于迁移学习的运输投送知识问答方法,该方法针对不同规模、不同规格的被承运物(人)如何智能计算装卸载方案、换乘换装方案,以及在不同投送方式、不同规划目标下如何智能规划混合投送路径的问题,构建基于问答模式的运输投送系统知识图谱,通过迁移学习在仅有小样本标注数据的情况下,自学习不同承运、不同投送方式的问答序列,从而对相关用户提问快速提供运输投送方案。
知识问答的核心在于信息检索,然而,以关键字为基础的索引、匹配算法尽管简单易行,但毕竟停留在语言的表层,没有触及语义,因此效果很难进一步提高。随着5G网络及智能话音设备的飞速发展,运输投送系统需要高效、准确、垂直领域的交互问答服务,传统基于结构化数据的问答、基于自由文本的问答、基于问题答案对的问答,需要依赖源数据结构化表示、大规模人工标注、对轮模式等基于规则的大量样本数据,现有的知识问答系统在运输投送领域不具备普适性和泛化能力,而针对运输投送这一垂直领域,属于专业性较强的垂直领域,无法使用Curated KBs知识库、Extracted KBs知识库等常用知识库。
发明内容
本发明解决上述技术问题所采用的技术方案是:构造一种基于迁移学习的运输投送知识问答方法,包括:
获取运输投送知识并进行分类;运输投送知识分类步骤中,将运输投送知识分为文本、图像、视频;
基于分类后的运输投送知识,进行知识空间构建、分词及实体识别,标注出运输投送知识中的实体及实体属性;
基于Word2vec模型训练,得到运输投送知识所有实体的词向量,同时标注各实体之间的关系,以构建运输投送知识的语料库;
构建关系抽取网络,将通过Word2vec模型训练得到的词向量输入关系抽取网络,输出运输投送知识中实体间的实体关系匹配概率;
将得到的实体关系进行人工核查,按照运输投送经验及知识进行正确的实体、关系、实体三元组匹配,生成符合标准的RDF三元组;
将RDF三元组中的实体进行对齐或消歧,实现运输投送知识融合,构建运输投送分类树,采用图数据库按分类树架构进行分类存储,构建静态规划环境域;
将静态规划环境域作为迁移学习模型的源域,将静态规划环境域模型计算的约束参数迁移到动态规划环境域中,作为迁移学习模型的目标域;
挖掘源域和目标域的相似性,微调静态方案规划环境域的参数并确定发生变化的数据相应的参数,通过人在回路的方式微调动态规划环境域的网络参数;
将调整完成的迁移学习模型的源域和目标域作为运输投送知识问答系统,解析实时的问题,提取问题中的关键字并输入运输投送知识问答系统,输出的实体作为问题答案的关键字,组成系统回复。
其中,在获取运输投送知识的步骤中,运输投送知识包括立体投送知识和装卸载、换装换乘知识;
其中,立体投送知识是立体投送路径规划,分为陆地路径规划、空中航迹规划和海上航线规划。
其中,在对分类后的运输投送知识,进行知识空间构建、分词及实体识别,标注出运输投送知识中的实体及实体属性的步骤中,
文本知识空间构建:将获取的文本,按结构化数据、半结构化数据和非结构化数据的类型分类;其中,简短的指令通过文档标题直接归类,文书通过标题或将长篇文书分段归类;将文本知识输入jieba分词器,进行细粒度运输投送词汇的切分,利用人工标注实体及实体属性;
图像知识空间构建:将获取的图像知识进行目标识别,将识别的目标进行图像配准,将分析计算后的目标属性转为格式化数据;将图像转化的格式化数据利用人工标注实体及实体属性;
视频知识空间构建:将获取的视频知识进行帧处理,提取集中出现某实体的数帧图像,进行目标识别与图像配准,将分析计算后的目标属性转为格式化数据;将视频转化的格式化数据,利用人工标注实体及实体属性。
其中,在基于Word2vec模型训练,得到运输投送知识所有实体的词向量,同时标注各实体之间的关系,以构建运输投送知识的语料库的步骤中,包括步骤:
使用Skip-gram模型,将标注的实体作为中心词W(t)进行预测;模型输入值中心词的one-hot编码形式,输出为softmax转换后的概率;
Word2vec模型训练后得到运输投送知识的所有实体的词向量,同时人工标注各实体间的关系,作为运输投送知识标注后的语料库。
其中,在构建关系抽取网络,将通过Word2vec模型训练得到的词向量输入关系抽取网络,输出运输投送知识中实体间的实体关系匹配概率的步骤中,
关系抽取网络包含embedding层、transform层、cov1D层、maxPooling1D层、dropout层、liner层和softmax输出层;
运输投送知识的词向量按Batch块输入embedding层,得到Batch*length*Embed大小的多维向量,通过transform层转置多维向量为一条句子一个向量块输入cov1D层,通过一个CNN结构对句子向量进行特征提取,通过maxPooling1D层最大池化得到降维后的向量块,加入一层dropout层防止过拟合后输入liner层,学习句子关系与目标关系的线性相关性,最后输入softmax层得到实体关系匹配概率。
其中,将RDF三元组中的实体进行对齐或消歧,实现运输投送知识融合,构建运输投送分类树,采用图数据库按分类树架构进行分类存储,构建静态规划环境域的步骤中,包括步骤:
将来自路径规划知识库、装卸载换车换乘知识库的不同来源的实体进行对齐或消歧,将等价实例、等价类/子类、等价属性/子属性三类融合;
将运输投送知识分类为输送路线搜索、纵梯队自动划分、输送装卸载三类知识库;
将各类知识按照语义空间划分为不同子类,将对齐后的实体、关系、属性分类收集、更新,构建运输投送分类树;
将对齐融合后的运输投送RDF三元组,采用图数据库(neo4j)按照分类树架构进行分类存储。
其中,在挖掘源域和目标域的相似性的步骤中,挖掘方式包括:
在动态规划环境域中,当地表地形环境/空中规划环境/海上规划环境不随时间的推荐发生变化时,动态规划场景退化为静态规划场景;
在动态规划环境域中,气象数据发生的变化不足以影响装备机动参数时,动态规划场景沿用静态规划场景学习的知识数据;
在动态规划环境域中,当装备运输区域与发生变化的地表地形空间距离较远时,装备周围的自由空间在动态和静态场景下基本保持一致;
基于DDPG的规划方法,输入是每一帧的图像,输出是方案规划结果,所以静态规划和动态规划在每一帧的处理算法上本质是相同的,动态规划场景可以理解为静态场景和动态目标的叠加。
区别于现有技术,本发明基于迁移学习的运输投送知识问答方法,获取运输投送相关知识。将运输投送过程中接收到的结构化数据、半结构化数据、非结构化数据、图像、话音、视频等分类处理为实体、属性、关系;构建关系抽取网络,抽取实体间的关系,生成RDF三元组,针对自动生成的三元组进行人工处理,实体对齐、消歧后分类存储;使用迁移学习框架对无标注的运输投送数据进行学习,支撑运输投送系统的知识问答。本发明构建基于问答模式的运输投送系统知识图谱,通过迁移学习在仅有小样本标注数据的情况下,自学习不同承运、不同投送方式的问答序列,从而对相关用户提问快速提供运输投送方案,在运输投送领域具备普适性和泛化能力。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明提供的一种基于迁移学习的运输投送知识问答方法的流程示意图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
参阅图1,本发明提供了一种基于迁移学习的运输投送知识问答方法,包括:
获取运输投送知识并进行分类;运输投送知识分类步骤中,将运输投送知识分为文本、图像、视频;
基于分类后的运输投送知识,进行知识空间构建、分词及实体识别,标注出运输投送知识中的实体及实体属性;
基于Word2vec模型训练,得到运输投送知识所有实体的词向量,同时标注各实体之间的关系,以构建运输投送知识的语料库;
构建关系抽取网络,将通过Word2vec模型训练得到的词向量输入关系抽取网络,输出运输投送知识中实体间的实体关系匹配概率;
将得到的实体关系进行人工核查,按照运输投送经验及知识进行正确的实体、关系、实体三元组匹配,生成符合标准的RDF三元组;
将RDF三元组中的实体进行对齐或消歧,实现运输投送知识融合,构建运输投送分类树,采用图数据库按分类树架构进行分类存储,构建静态规划环境域;
将静态规划环境域作为迁移学习模型的源域,将静态规划环境域模型计算的约束参数迁移到动态规划环境域中,作为迁移学习模型的目标域;
挖掘源域和目标域的相似性,微调静态方案规划环境域的参数并确定发生变化的数据相应的参数,通过人在回路的方式微调动态规划环境域的网络参数;
将调整完成的迁移学习模型的源域和目标域作为运输投送知识问答系统,解析实时的问题,提取问题中的关键字并输入运输投送知识问答系统,输出的实体作为问题答案的关键字,组成系统回复。
其中,在获取运输投送知识的步骤中,运输投送知识包括立体投送知识和装卸载、换装换乘知识;
其中,立体投送知识是立体投送路径规划,分为陆地路径规划、空中航迹规划和海上航线规划。
路径规划公共知识,包括投送区域、出发点、必经点、目的地、禁止点、禁止区域、威胁区域、气象、水文、潮汐等实体。区域实体属性包括区域边界、区域空间位置等知识;关键点实体属性包括经度、纬度、途径时间、途径速度等知识;气象实体包括风向风速等级、雨等级、雪等级、雾等级等知识;
陆地路径规划指公路+铁路+野外混合规划。公路规划场景中,不同等级公路(高速公路、省道、县道、乡道等)定义为不同实体,此类实体属性包括宽度、最大承重、最大机动速度等知识;桥梁、涵洞、隧道定义为不同实体,此类实体属性包括最大通过宽度、最大通过高度、最大承重等知识;铁路规划场景中,不同等级列车(高铁、特快等)定义为不同实体,此类实体包括平车、客车、棚车的列车计长、最大机动速度等属性知识;野外规划场景中,不同类型车辆(轻型越野车、大型集装箱车等)定义为不同实体,此类实体属性包括车长、车宽、车高、最大离地间隙、接近角、离去角、最大转弯半径、最大越障高度等知识;
空中航迹规划知识中,无人机实体的属性包括机长、机宽、走廊高度、转弯半径、自动进入航程点最小距离、180度转向最小距离、90度转向最小距离、拍摄时间间隔等知识;航迹条件实体包括航向重叠度、旁向重叠度、有效拍摄范围、有效拍摄高度、地面能见度、云底高等知识;
海上航线规划知识中,船舶实体类型包括干散货船、液体散货船、集装箱船、杂货船等;船舶实体属性包括船籍港、船舶全长、两柱间长、型宽、型深、总吨(位)、净吨(位)、排水量、机舱长、机舱宽、满载载重量、载重线种类、净空高度、干舷、剩余浮力、吃水、浮心、漂心、船舶重心、货物重心、静稳性高度、空船压载、货舱数、货舱长、货舱宽、货舱高、卸载设备类型、卸载设备数量、主机功率、主机功率、发电机功率等知识;
装卸载、换装换乘知识中,铁路输送为机动输送的主要运输方式,分为安全警戒场景、渡板调整场景、清扫画线场景、指挥引导场景、捆绑加固场景等。其中,安全警戒场景实体包括装载地域制高点、派出观察哨、安全警戒哨和巡逻哨等知识;渡板调整场景实体包体包括渡板安装时间、渡板拆除时间等知识;清扫画线场景包括平车中心线位置、平车端板、撬棍、铁锤等知识;指挥引导场景实体包括逐车引导、定点接力等知识;捆绑加固场景实体包括指挥车加固、特种车加固、运输车加固、止轮器、紧固器、钢丝绳等知识。
运输投送知识的获取方式分为文本、图像、视频等媒介,文本主要包括上级下发的装载指令、卸载指令、换车指令、换乘指令、机动指令以及相应的装载计划文书、卸载计划文书、换车换乘计划文书、机动投送文书等文本文档,或上级语音转换成的文本;图像主要包括各场景实物实体拍摄图像以及装载序列图、卸载序列图、换车换乘示意图、机动投送示意图等图像,或上级口述标图后的图像;视频主要包括各场景实物的实体拍摄视频。
其中,在对分类后的运输投送知识,进行知识空间构建、分词及实体识别,标注出运输投送知识中的实体及实体属性的步骤中,
文本知识空间构建:将获取的文本,按结构化数据((XML或json文件)、半结构化数据(前端页面或表格)和非结构化数据(计划或文书)的类型分类;其中,简短的指令通过文档标题直接归类,文书通过标题或将长篇文书分段归类;将文本知识输入jieba分词器,进行细粒度运输投送词汇的切分,利用人工标注实体及实体属性;
图像知识空间构建:将获取的图像知识进行目标识别,将识别的目标(车辆、无人机、船舶等)进行图像配准,将分析计算后的目标属性转为格式化数据;将图像转化的格式化数据利用人工标注实体及实体属性,如装备的类型、长、宽、高等数据;
视频知识空间构建:将获取的视频知识进行帧处理,提取集中出现某实体的数帧图像,进行目标识别与图像配准,将分析计算后的目标属性转为格式化数据;将视频转化的格式化数据,利用人工标注实体及实体属性,如装备的类型、长、宽、高等数据。
其中,在基于Word2vec模型训练,得到运输投送知识所有实体的词向量,同时标注各实体之间的关系,以构建运输投送知识的语料库的步骤中,包括步骤:
使用Skip-gram模型,将标注的实体作为中心词W(t)进行预测;模型输入值中心词的one-hot编码形式,输出为softmax转换后的概率;
Word2vec模型训练后得到运输投送知识的所有实体的词向量,同时人工标注各实体间的关系,作为运输投送知识标注后的语料库。
其中,在构建关系抽取网络,将通过Word2vec模型训练得到的词向量输入关系抽取网络,输出运输投送知识中实体间的实体关系匹配概率的步骤中,
关系抽取网络包含embedding层、transform层、cov1D层、maxPooling1D层、dropout层、liner层和softmax输出层;
运输投送知识的词向量按Batch块输入embedding层,得到Batch*length*Embed大小的多维向量,通过transform层转置多维向量为一条句子一个向量块输入cov1D层,通过一个CNN结构对句子向量进行特征提取,通过maxPooling1D层最大池化得到降维后的向量块,加入一层dropout层防止过拟合后输入liner层,学习句子关系与目标关系的线性相关性,最后输入softmax层得到实体关系匹配概率。
将得到的实体关系进行人工核查,按照运输投送经验及知识进行正确的(实体,关系,实体)三元组匹配,生成符合标准的RDF三元组。
运输投送知识融合,也称为本体对齐、本体匹配、Record Linkage、EntityResolution,将RDF三元组中的实体进行对齐或消歧,实现运输投送知识融合,构建运输投送分类树,采用图数据库按分类树架构进行分类存储,构建静态规划环境域的步骤中,包括步骤:
将来自路径规划知识库、装卸载换车换乘知识库的不同来源的实体进行对齐或消歧,将等价实例、等价类/子类、等价属性/子属性三类融合;等价实例如机动起点和路线起点视为同一实体;等价类/子类如装载地是出发点的子类SubClassOf;等价属性/子属性如出生于和出生日期是等价属性SubPropertyOf。
将运输投送知识分类为输送路线搜索、纵梯队自动划分、输送装卸载三类知识库;
将各类知识按照语义空间划分为不同子类,将对齐后的实体、关系、属性分类收集、更新,构建运输投送分类树;
将对齐融合后的运输投送RDF三元组,采用图数据库(neo4j)按照分类树架构进行分类存储。一个RDF三元组可能因为时间的推移发生属性内容的动态更新,如(轨迹起点,衔接轨迹,轨迹终点)在不同时刻动态变化。
迁移学习框架构建过程中:
构建静态规划环境域。静态规划环境域属于本发明迁移学习的源域,构造迁移模型的目的即将静态方案规划环境中模型计算的约束参数迁移到动态方案规划环境中,动态方案规划环境称为迁移模型的目标域。
本发明的迁移模型只考虑一个源域和一个目标域的简单情况,其中,源域(静态规划环境域)的数据表示为DS={(xS1,yS1),(xS2,yS2),…,(xSnS,ySnS)},其中xSi∈XS是方案规划模型的数据实例,ySi∈YS是相应的类标签。静态规划环境域对应的学习任务即从地图A点经过B点、C点……到终点F点搜寻一条以方案规划目标为代价指标的最小耗费路径。
获取动态规划环境的变化数据。迁移模型的前提是判断哪些参数需要更改,即静态规划环境中的哪些数据可以保持不变,如装备的基础数据、行驶数据等,哪些数据会随战中态势变化而发生改变。本发明通过接收的情报数据作为动态规划环境域的输入,如战场中的弹坑会改变地形,弹坑的大小及深度即战中环境的变化数据。
构建动态方案规划环境域。基于静态规划环境域的数据及数据标签,同样使用DT={(xT1,yT1),(xT2,yT2),…,(xTnT,yTnT)}作为数据表示,其中输入xTi∈XT,yTi∈YT是相应的输出。在大多数情况下,0<nT《nS。由于战中环境发生变化,即使学习任务为从地图A点经过B点、C点……到终点F点搜寻一条以规划目标为代价指标的最小耗费路径,因为地形环境、装备车辆通行难度的变化,DS≠DT,或者TS≠TT,即静态与动态方案规划环境域的数据发生变化,其学习任务同样发生变化。
注入的无标注知识即为迁移学习的目标域数据。在挖掘源域和目标域的相似性的步骤中,挖掘方式包括:
在动态规划环境域中,当地表地形环境/空中规划环境/海上规划环境不随时间的推荐发生变化时,动态规划场景退化为静态规划场景;
在动态规划环境域中,气象数据发生的变化不足以影响装备机动参数时,动态规划场景沿用静态规划场景学习的知识数据;
在动态规划环境域中,当装备运输区域与发生变化的地表地形空间距离较远时,装备周围的自由空间在动态和静态场景下基本保持一致;
基于DDPG的规划方法,输入是每一帧的图像,输出是方案规划结果,所以静态规划和动态规划在每一帧的处理算法上本质是相同的,动态规划场景可以理解为静态场景和动态目标的叠加。
依据上述挖掘算法,微调静态规划环境域的网络参数。遍历静态规划环境域的神经网络,确定发生变化的数据相应的参数,通过人在回路的方式微调动态规划环境域的网络参数。为辅助指挥员网络调参,各参数依据相应数据变化范围迭代递增或递减。
运输投送知识补全的步骤中,将训练好的网络参数作为迁移学习模型的输入,通过实时获取战中的禁止区域、威胁区域、气象、水文、潮汐等数据,不停调整规划策略,通过不同战中动态投送环境可得到不同战场环境的规划方案,将方案及其对应的网络训练参数作为历史样本,可作为静态规划环境下网络训练的测试数据,从而提高战场环境下运输投送方案生成的速率,降低对人在回路的依赖。
构建运输投送知识问答系统,基于构建的知识图谱回答诸如“从驻地A到集结地B的最快机动路线是什么”、“以X旅建制为编组、最少调整的纵梯队划分是什么”、“按当前列车及承货量、最小空间浪费的装载方式是什么”几类问题,支持指挥员快速、精准得到系统回复。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (7)
1.一种基于迁移学习的运输投送知识问答方法,其特征在于,包括:
获取运输投送知识并进行分类;运输投送知识分类步骤中,将运输投送知识分为文本、图像、视频;
基于分类后的运输投送知识,进行知识空间构建、分词及实体识别,标注出运输投送知识中的实体及实体属性;
基于Word2vec模型训练,得到运输投送知识所有实体的词向量,同时标注各实体之间的关系,以构建运输投送知识的语料库;
构建关系抽取网络,将通过Word2vec模型训练得到的词向量输入关系抽取网络,输出运输投送知识中实体间的实体关系匹配概率;
将得到的实体关系进行人工核查,按照运输投送经验及知识进行正确的实体、关系、实体三元组匹配,生成符合标准的RDF三元组;
将RDF三元组中的实体进行对齐或消歧,实现运输投送知识融合,构建运输投送分类树,采用图数据库按分类树架构进行分类存储,构建静态规划环境域;
将静态规划环境域作为迁移学习模型的源域,将静态规划环境域模型计算的约束参数迁移到动态规划环境域中,作为迁移学习模型的目标域;
挖掘源域和目标域的相似性,微调静态方案规划环境域的参数并确定发生变化的数据相应的参数,通过人在回路的方式微调动态规划环境域的网络参数;
将调整完成的迁移学习模型的源域和目标域作为运输投送知识问答系统,解析实时的问题,提取问题中的关键字并输入运输投送知识问答系统,输出的实体作为问题答案的关键字,组成系统回复。
2.根据权利要求1所述的基于迁移学习的运输投送知识问答方法,其特征在于,在获取运输投送知识的步骤中,运输投送知识包括立体投送知识和装卸载、换装换乘知识;
其中,立体投送知识是立体投送路径规划,分为陆地路径规划、空中航迹规划和海上航线规划。
3.根据权利要求1所述的基于迁移学习的运输投送知识问答方法,其特征在于,在对分类后的运输投送知识,进行知识空间构建、分词及实体识别,标注出运输投送知识中的实体及实体属性的步骤中,
文本知识空间构建:将获取的文本,按结构化数据、半结构化数据和非结构化数据的类型分类;其中,简短的指令通过文档标题直接归类,文书通过标题或将长篇文书分段归类;将文本知识输入jieba分词器,进行细粒度运输投送词汇的切分,利用人工标注实体及实体属性;
图像知识空间构建:将获取的图像知识进行目标识别,将识别的目标进行图像配准,将分析计算后的目标属性转为格式化数据;将图像转化的格式化数据利用人工标注实体及实体属性;
视频知识空间构建:将获取的视频知识进行帧处理,提取集中出现某实体的数帧图像,进行目标识别与图像配准,将分析计算后的目标属性转为格式化数据;将视频转化的格式化数据,利用人工标注实体及实体属性。
4.根据权利要求3所述的基于迁移学习的运输投送知识问答方法,其特征在于,在基于Word2vec模型训练,得到运输投送知识所有实体的词向量,同时标注各实体之间的关系,以构建运输投送知识的语料库的步骤中,包括步骤:
使用Skip-gram模型,将标注的实体作为中心词W(t) 进行预测;模型输入值中心词的one-hot编码形式,输出为softmax转换后的概率;
Word2vec模型训练后得到运输投送知识的所有实体的词向量,同时人工标注各实体间的关系,作为运输投送知识标注后的语料库。
5.根据权利要求4所述的基于迁移学习的运输投送知识问答方法,其特征在于,在构建关系抽取网络,将通过Word2vec模型训练得到的词向量输入关系抽取网络,输出运输投送知识中实体间的实体关系匹配概率的步骤中,
关系抽取网络包含embedding层、transform层、cov1D层、maxPooling1D层、dropout层、liner层和softmax输出层;
运输投送知识的词向量按Batch块输入embedding层,得到Batch*length*Embed大小的多维向量,通过transform层转置多维向量为一条句子一个向量块输入cov1D层,通过一个CNN结构对句子向量进行特征提取,通过maxPooling1D层最大池化得到降维后的向量块,加入一层dropout层防止过拟合后输入liner层,学习句子关系与目标关系的线性相关性,最后输入softmax层得到实体关系匹配概率。
6.根据权利要求1所述的基于迁移学习的运输投送知识问答方法,其特征在于,将RDF三元组中的实体进行对齐或消歧,实现运输投送知识融合,构建运输投送分类树,采用图数据库按分类树架构进行分类存储,构建静态规划环境域的步骤中,包括步骤:
将来自路径规划知识库、装卸载换车换乘知识库的不同来源的实体进行对齐或消歧,将等价实例、等价类/子类、等价属性/子属性三类融合;
将运输投送知识分类为输送路线搜索、纵梯队自动划分、输送装卸载三类知识库;
将各类知识按照语义空间划分为不同子类,将对齐后的实体、关系、属性分类收集、更新,构建运输投送分类树;
将对齐融合后的运输投送RDF三元组,采用图数据库neo4j按照分类树架构进行分类存储。
7.根据权利要求1所述的基于迁移学习的运输投送知识问答方法,其特征在于,在挖掘源域和目标域的相似性的步骤中,挖掘方式包括:
在动态规划环境域中,当地表地形环境/空中规划环境/海上规划环境不随时间的推荐发生变化时,动态规划场景退化为静态规划场景;
在动态规划环境域中,气象数据发生的变化不足以影响装备机动参数时,动态规划场景沿用静态规划场景学习的知识数据;
在动态规划环境域中,当装备运输区域与发生变化的地表地形空间距离较远时,装备周围的自由空间在动态和静态场景下保持一致;
基于DDPG 的规划方法,输入是每一帧的图像,输出是方案规划结果,所以静态规划和动态规划在每一帧的处理算法上本质是相同的,动态规划场景可以理解为静态场景和动态目标的叠加。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110249336.1A CN112948603B (zh) | 2021-03-08 | 2021-03-08 | 一种基于迁移学习的运输投送知识问答方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110249336.1A CN112948603B (zh) | 2021-03-08 | 2021-03-08 | 一种基于迁移学习的运输投送知识问答方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112948603A CN112948603A (zh) | 2021-06-11 |
CN112948603B true CN112948603B (zh) | 2023-05-05 |
Family
ID=76229991
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110249336.1A Active CN112948603B (zh) | 2021-03-08 | 2021-03-08 | 一种基于迁移学习的运输投送知识问答方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112948603B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113705921B (zh) * | 2021-09-03 | 2024-02-27 | 厦门闽江智慧科技有限公司 | 一种混合充电策略的电动汽车动态路径规划优化方法 |
CN114610896A (zh) * | 2022-02-23 | 2022-06-10 | 中国人民解放军国防科技大学 | 一种联合运输知识图谱展示及关联分析方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102135905A (zh) * | 2011-03-17 | 2011-07-27 | 清华大学 | 基于用户定制的本体匹配系统及方法 |
CN104484379A (zh) * | 2014-12-09 | 2015-04-01 | 百度在线网络技术(北京)有限公司 | 确定音乐实体关系的方法和装置及查询处理方法和装置 |
CN106649786A (zh) * | 2016-12-28 | 2017-05-10 | 北京百度网讯科技有限公司 | 基于深度问答的答案检索方法及装置 |
CN107451276A (zh) * | 2017-08-05 | 2017-12-08 | 龙飞 | 一种基于深度学习的智能自助导游系统及其方法 |
CN108509519A (zh) * | 2018-03-09 | 2018-09-07 | 北京邮电大学 | 基于深度学习的通用知识图谱增强问答交互系统及方法 |
EP3550464A1 (en) * | 2018-04-05 | 2019-10-09 | Accenture Global Solutions Limited | Data security and protection system using distributed ledgers to store validated data in a knowledge graph |
CN110631596A (zh) * | 2019-04-23 | 2019-12-31 | 太原理工大学 | 一种基于迁移学习的装备车辆路径规划方法 |
CN111209384A (zh) * | 2020-01-08 | 2020-05-29 | 腾讯科技(深圳)有限公司 | 基于人工智能的问答数据处理方法、装置及电子设备 |
CN111950540A (zh) * | 2020-07-24 | 2020-11-17 | 浙江师范大学 | 一种基于深度学习的知识点提取方法、系统、装置及介质 |
CN112052674A (zh) * | 2020-08-06 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 一种实体定义抽取方法、系统及存储介质和服务器 |
CN112149400A (zh) * | 2020-09-23 | 2020-12-29 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN112199511A (zh) * | 2020-09-28 | 2021-01-08 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 跨语言多来源垂直领域知识图谱构建方法 |
CN112215004A (zh) * | 2020-09-04 | 2021-01-12 | 中国电子科技集团公司第二十八研究所 | 一种基于迁移学习在军事装备文本实体抽取中的应用方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8805861B2 (en) * | 2008-12-09 | 2014-08-12 | Google Inc. | Methods and systems to train models to extract and integrate information from data sources |
-
2021
- 2021-03-08 CN CN202110249336.1A patent/CN112948603B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102135905A (zh) * | 2011-03-17 | 2011-07-27 | 清华大学 | 基于用户定制的本体匹配系统及方法 |
CN104484379A (zh) * | 2014-12-09 | 2015-04-01 | 百度在线网络技术(北京)有限公司 | 确定音乐实体关系的方法和装置及查询处理方法和装置 |
CN106649786A (zh) * | 2016-12-28 | 2017-05-10 | 北京百度网讯科技有限公司 | 基于深度问答的答案检索方法及装置 |
CN107451276A (zh) * | 2017-08-05 | 2017-12-08 | 龙飞 | 一种基于深度学习的智能自助导游系统及其方法 |
CN108509519A (zh) * | 2018-03-09 | 2018-09-07 | 北京邮电大学 | 基于深度学习的通用知识图谱增强问答交互系统及方法 |
EP3550464A1 (en) * | 2018-04-05 | 2019-10-09 | Accenture Global Solutions Limited | Data security and protection system using distributed ledgers to store validated data in a knowledge graph |
CN110631596A (zh) * | 2019-04-23 | 2019-12-31 | 太原理工大学 | 一种基于迁移学习的装备车辆路径规划方法 |
CN111209384A (zh) * | 2020-01-08 | 2020-05-29 | 腾讯科技(深圳)有限公司 | 基于人工智能的问答数据处理方法、装置及电子设备 |
CN111950540A (zh) * | 2020-07-24 | 2020-11-17 | 浙江师范大学 | 一种基于深度学习的知识点提取方法、系统、装置及介质 |
CN112052674A (zh) * | 2020-08-06 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 一种实体定义抽取方法、系统及存储介质和服务器 |
CN112215004A (zh) * | 2020-09-04 | 2021-01-12 | 中国电子科技集团公司第二十八研究所 | 一种基于迁移学习在军事装备文本实体抽取中的应用方法 |
CN112149400A (zh) * | 2020-09-23 | 2020-12-29 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN112199511A (zh) * | 2020-09-28 | 2021-01-08 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 跨语言多来源垂直领域知识图谱构建方法 |
Non-Patent Citations (3)
Title |
---|
一种动态环境下空间机器人的快速路径规划方法;胡晓东等;《空间控制技术与应用》;20181015;14-21 * |
基于知识图谱的联合作战态势知识表示方法;王保魁等;《系统仿真学报》;20190923;2228-2237 * |
融合权重机制和改进SDIM的偏标记分类算法;张慧婷等;《计算机工程与应用》;20201124;195-202 * |
Also Published As
Publication number | Publication date |
---|---|
CN112948603A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112948603B (zh) | 一种基于迁移学习的运输投送知识问答方法 | |
CN113392986B (zh) | 一种基于大数据的公路桥梁信息抽取方法及管理养护系统 | |
US11884310B2 (en) | Systems and methods for detecting tanks in railway environments | |
van Dijke et al. | Citymobil, advanced transport for the urban environment: Update | |
CN114964272A (zh) | 一种融合车载图像语义的车辆轨迹地图匹配方法 | |
CN116663742A (zh) | 基于多因素和模型融合的区域运力预测方法 | |
CN115790635A (zh) | 基于区块链的无人驾驶运输车行驶路线规划方法及装置 | |
CN114037750A (zh) | 一种轨道虚拟应答器的实现方法 | |
Lawrie | Transport equity considerations of a ‘trackless tram-entrepreneur rail model’ | |
Pospelov et al. | Optimization of Parking Space Based on Video Analysis of Traffic Flow Characteristics | |
Ahmad et al. | Deep journalism and DeepJournal V1. 0: a data-driven deep learning approach to discover parameters for transportation (as a case study) | |
Gao et al. | Research on the applicability of automated driving vehicle on the expressway system | |
Márcio de Almeida | Transportation, Energy Use and Environmental Impacts | |
Huang et al. | Research on Water Transportation Intelligent Information Service System Based on Big Data and Its key Technologies | |
Garrison | Using technology to improve transportation services | |
CN116029624B (zh) | 一种融合货车轨迹和poi数据的货源地识别方法 | |
CN115423841B (zh) | 一种面向大宗物流的运输终点校准方法及系统 | |
CN116128113B (zh) | 一种面向跨境运输模块化箱体的行程时间预测方法 | |
US20240035834A1 (en) | Method and apparatus for determining road debris indicators | |
Chernyshova et al. | Logging roads in a transportation network of a forest industrial enterprise | |
Kang | Quantifying and Predicting Waterway Traffic Conditions: A Case Study of Houston Ship Channel | |
Wanniarachchi et al. | Novel deep learning and GIS-based approach for road inventory survey | |
Dwyer | Artificial Intelligence Application in Agile Transport Project Management | |
Liashenko et al. | Multidimensional Geoinformation Modeling of Public Transport in Bila Tserkva | |
Cao et al. | Fusion and integration framework study on road network and dynamic traffic data in vehicle navigation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230616 Address after: No. 21, Zone A, Floor 1, No. 7, Kexing Road, Fengtai District, Beijing, 100070 Patentee after: Zhongbing intelligent Innovation Research Institute Co.,Ltd. Address before: 030006 No. 351, sports road, Shanxi, Taiyuan Patentee before: NORTH AUTOMATIC CONTROL TECHNOLOGY INSTITUTE |
|
TR01 | Transfer of patent right |