CN113569931B - 动态数据融合方法、装置、设备和介质 - Google Patents
动态数据融合方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN113569931B CN113569931B CN202110808710.7A CN202110808710A CN113569931B CN 113569931 B CN113569931 B CN 113569931B CN 202110808710 A CN202110808710 A CN 202110808710A CN 113569931 B CN113569931 B CN 113569931B
- Authority
- CN
- China
- Prior art keywords
- data
- information
- space
- main
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007500 overflow downdraw method Methods 0.000 title claims abstract description 31
- 230000004927 fusion Effects 0.000 claims abstract description 57
- 238000000034 method Methods 0.000 claims abstract description 48
- 230000008569 process Effects 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 9
- 230000004044 response Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Train Traffic Observation, Control, And Security (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种动态数据融合方法、装置、设备和介质,其中,该方法包括:根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集;根据时空数据和主数据确定核心要素,时空数据包括列车运行过程中的时间信息和空间信息,主数据包括列车运行的线路信息和经过的车站信息;根据数据集和核心要素构建知识图谱,根据知识图谱得到符合目标业务主线的数据融合结果集。本发明可以将大量且多元的数据融合使用,实现快速、实时的响应业务需求。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种动态数据融合方法、装置、设备和介质。
背景技术
铁路行业非常重视数据资源的开发利用和集成整合,强调铁路应依托既有数据资源优势,统筹开展大数据专项应用,开展数据融合研究,深挖数据价值,提高铁路信息化应用水平。如何充分利用数据,解决“数据混乱”、“信息孤岛”问题,实现数据的共享和深度融合,发挥数据资产的最大价值,以更好的服务运输生产,成为铁路部门亟待解决的问题。
铁路数据服务平台是铁路核心的大数据平台,各业务系统的数据也正在积极向铁路数据服务平台汇集。大量复杂、多源的数据在集中后面临着如何进行数据融合,如何重复挖掘铁路数据价值,以及如何利用大数据平台使各专业数据形成合力、产生新的业务增长点等问题。
具体表现为:
1、目前的数据融合应用大部分只针对某个铁路业务领域内部某系统的传感器,尚无跨系统的数据融合方法和应用;
2、数据融合的要素是提前设定的,融合结果单一,无法快速响应业务需求。
发明内容
本发明提供一种动态数据融合方法、装置、设备和介质,可以将大量且多元的数据融合使用,实现快速、实时的响应业务需求,实现跨系统的数据之间的动态融合。
第一方面,本发明提供了一种动态数据融合方法,包括:根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集;根据时空数据和主数据确定核心要素,所述时空数据包括列车运行过程中的时间信息和空间信息,所述主数据包括列车运行的线路信息和经过的车站信息;根据所述数据集和所述核心要素构建知识图谱,根据所述知识图谱得到符合所述目标业务主线的数据融合结果集。
根据本发明提供的一种动态数据融合方法,所述根据时空数据和主数据确定核心要素之前,还包括:根据所述文本信息确定所述时空数据和所述主数据,所述文本信息包括所述至少一个信息系统反馈的报告。
根据本发明提供的一种动态数据融合方法,所述根据所述文本信息确定所述时空数据和所述主数据,包括:通过预设信息抽取模型对所述文本信息进行信息抽取处理,得到所述时空数据和所述主数据;对所述时空数据和所述主数据进行标准化处理,得到所述核心要素。
根据本发明提供的一种动态数据融合方法,所述根据时空数据和主数据确定核心要素之前,还包括:查询数据库得到所述时空数据和主数据。
根据本发明提供的一种动态数据融合方法,所述根据时空数据和主数据确定核心要素,包括:将所述时空数据和主数据进行匹配,得到所述核心要素。
根据本发明提供的一种动态数据融合方法,所述根据所述知识图谱得到符合所述目标业务主线的数据融合结果集,包括:对所述知识图谱进行差异节点识别和相似节点匹配,得到符合所述目标业务主线的数据融合结果集。
第二方面,本发明还提供了一种动态数据融合装置,包括:第一处理模块,用于根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集;第二处理模块,用于根据时空数据和主数据确定核心要素,所述时空数据包括列车运行过程中的时间信息和空间信息,所述主数据包括列车运行的线路信息和经过的车站信息;融合模块,用于根据所述数据集和所述核心要素构建知识图谱,根据所述知识图谱得到符合所述目标业务主线的数据融合结果集。
第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述动态数据融合方法的步骤。
第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述动态数据融合方法的步骤。
本发明提供的一种动态数据融合方法、装置、设备和介质,通过根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集;根据时空数据和主数据确定核心要素,时空数据包括列车运行过程中的时间信息和空间信息,主数据包括列车运行的线路信息和经过的车站信息;根据数据集和核心要素构建知识图谱,根据知识图谱得到符合目标业务主线的数据融合结果集。可以看出,上述方法利用业务主线构建大量且多元的数据集,根据列车运行轨迹的时空数据和主数据,对数据集中的数据进行融合使用,可以形成动态可变的融合结果,实现快速、实时的响应业务需求,实现跨系统的数据之间的动态融合,具有较高的灵活性和可扩展性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的动态数据融合方法的一些实施例的流程示意图;
图2是本发明根据旅客服务业务主线确定信息系统的一个应用场景的示意图;
图3是本发明根据数据集和核心要素构建的知识图谱的一个应用场景的示意图;
图4是本发明提供的动态数据融合方法的另一些实施例的流程示意图;
图5是本发明提供的确定核心要素的流程示意图;
图6是本发明提供的动态数据融合装置的一些实施例的结构示意图;
图7是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
需要注意,本发明中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本发明中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本发明实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
下面将参考附图并结合实施例来详细说明本发明。
请参阅图1,图1是本发明提供的动态数据融合方法的一些实施例的流程示意图。如图1所示,该动态数据融合方法,包括以下步骤:
步骤101,根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集。
在一些实施例中,列车运行过程中所能够融合的业务众多,因此,需要先确定目标业务主线,作为融合的目的。目标业务主线可以是旅客服务、行车安全分析等,目标业务主线可以根据具体情况确定,本发明实施例对目标业务主线的类型不作限定。作为示例,如图2所示,可以将旅客服务业务作为目标业务主线,融合的目的则是为旅客提供服务。在目标业务主线确定后,就可以明确参与融合的信息系统和及其数据范围。仍以图2为例,当以旅客服务业务作为目标业务主线时,确定的信息系统可以包括旅客、客票、客站、客车、安全、增值服务等系统,其中,旅客系统的数据范围可以包括购票信息、销售渠道、销售策略等数据,客票系统的数据范围可以是12306、行包、售票点等数据,客站、客车、安全、增值服务等系统的数据范围可以参考图2所示,故此出不再复述。在根据目标业务主线确定信息系统的数据范围后,可以将所确定的信息系统的数据范围构成数据集。仍以图2为例,当以旅客服务业务作为目标业务主线,在确定旅客、客票、客站、客车、安全、增值服务等系统及其数据范围后,可以将旅客、客票、客站、客车、安全、增值服务等系统的数据范围构成数据集,即数据集可以包括购票信息、销售渠道、销售策略、12306、行包、售票点等数据、以及图2中客站、客车、安全、增值服务等系统的数据。
通过确定至少一个信息系统和每一个信息系统的数据范围,可以实现铁路行业跨专业、跨系统数据融合,充分挖掘铁路大数据价值。
步骤102,根据时空数据和主数据确定核心要素,时空数据包括列车运行过程中的时间信息和空间信息,主数据包括列车运行的线路信息和经过的车站信息。
在一些实施例中,时空数据和主数据均是根据列车运行轨迹确定,通过列车运行轨迹可以将铁路各业务系统的数据有机串联起来形成链条。其中,时空数据是动态的。例如,时空数据可以是列车A在早上8点时,会驶过某个隧道B,其中,时间信息为早上8点,空间信息为隧道B所在的地理位置。主数据一般是相对稳定的结构化数据,其可以作为数据库中的字段名称。例如,主数据可以包括列车A的线路信息:途径北京、天津、石家庄,早上7点在北京出发,上午10点到达天津,下午3点到达石家庄;主数据也可以包括列车A途径的车站信息:北京的地理位置为北纬39"26'至41"03',东经115"25'至117"30'等。本发明实施例对时空数据和主数据的类型和形式不作限定。
通过将时空数据、主数据确定为融合的核心要素,可以形成可通用的动态数据融合方法,可以为后续大规模开展铁路大数据分析提供有力支撑。
步骤103,根据数据集和核心要素构建知识图谱,根据知识图谱得到符合目标业务主线的数据融合结果集。
在一些实施例中,知识图谱可以通过人工构建,或者也可以通过人工智能的方法构建,例如神经网络的方法、图计算的方法等,本发明实施例对知识图谱的构建方法式不做限定。在根据数据集和核心要素构建知识图谱后,可以通过对知识图谱进行信息挖掘、提取等处理得到符合目标业务主线的数据融合结果集。仍以目标业务主线为旅客服务业务为例,如图3所示,在以旅客服务业务为目标业务主线构建的知识图谱中,数据集可以包括客票数据、出行数据、景点数据等,核心要素可以包括车站主数据、线路主数据、车辆到达时间等,从图中可以看出数据集和核心要素之间相互协作构成知识图谱。作为示例,通过核心要素,将出行数据与景点数据结合,例如,可以通过车站主数据将附近的景点数据与出行数据中的出行方式,即公交、地铁、共享单车等结合,从而可以根据出行方式推荐最近的景点。
由于知识图谱的构建往往会产生大规模的数据,所以可以利用云或大规模并行处理环境完成数据融合。
本发明一些实施例公开的动态数据融合方法,通过根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集;根据时空数据和主数据确定核心要素,时空数据包括列车运行过程中的时间信息和空间信息,主数据包括列车运行的线路信息和经过的车站信息;根据数据集和核心要素构建知识图谱,根据知识图谱得到符合目标业务主线的数据融合结果集。可以看出,上述方法利用业务主线构建大量且多元的数据集,根据列车运行轨迹的时空数据和主数据,对数据集中的数据进行融合使用,可以形成动态可变的融合结果,实现快速、实时的响应业务需求,实现跨系统的数据之间的动态融合,具有较高的灵活性和可扩展性。
请参阅图4,图4是本发明提供的动态数据融合方法的另一些实施例的流程示意图。如图4所示,该动态数据融合方法,包括以下步骤:
步骤401,根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集。
在一些实施例中,步骤401的具体实现及其所带来的技术效果,可以参考图1对应的实施例中关于步骤101的说明,在此不再赘述。
步骤402,根据时空数据和主数据确定核心要素,时空数据包括列车运行过程中的时间信息和空间信息,主数据包括列车运行的线路信息和经过的车站信息。
在一些实施例的可选实现方式中,根据时空数据和主数据确定核心要素之前,还包括:根据文本信息确定时空数据和主数据,文本信息包括至少一个信息系统反馈的报告。
在一些实施例的可选实现方式中,根据文本信息确定时空数据和主数据,包括:通过预设信息抽取模型对文本信息进行信息抽取处理,得到时空数据和主数据;对时空数据和主数据进行标准化处理,得到核心要素。其中,预设信息抽取模型可以是隐马尔科夫模型、最大熵马尔科夫模型、条件随机场、表决感知机模型等中的至少一种。本发明实施例对文本信息进行信息抽取预设信息抽取模型的形式不作限定。
由于不同类型的数据常常具有不同的单位和不同的表达形式等,因此需要对直接从文本信息中抽取到的数据,即时空数据和主数据,进行标准化处理,将数据的表达形式和单位等统一,以有利于数据的整合和后续使用。
在一些实施例的可选实现方式中,根据时空数据和主数据确定核心要素之前,还包括:查询数据库得到时空数据和主数据。在一些实施例的可选实现方式中,根据时空数据和主数据确定核心要素,包括:将时空数据和主数据进行匹配,得到核心要素。
如图5所示,在该实施例中,核心要素可以通过以下两种方式,即文本信息和数据库获取。例如,文本信息可以是安检系统数据库中更新的关于铁路路段C的检查报告,即某年某月某日上午11点,铁路路段C可能发生泥石流的文本信息,可以将文本信息输入信息抽取模型,得到时间信息、地理实体、空间关系,其中,时间信息:某年某月某日上午11点,地理实体:铁路路段C,空间关系:经纬度为D,再将时间信息、地理实体、空间关系规范化得到核心要素。本发明实施例对数据进行标准化处理的实现方式不作限定。在该实施例中,数据库可以与地理信息系统(Geographic Information System或Geo-Information system,简称GIS)相关联、数据库中可以存储主数据、元数据以及从GIS获取的数据。主数据可以是结构化数据,也可以作为数据库中的字段名称,例如车次、车站、到站时间等数据。元数据可以是可变的动态数据,例如列车运行过程中实时的地理位置数据。另外,当从文本信息获取的某些核心要素相对稳定时,也可以转化为数据库中的数据,长期保存。
步骤403,对知识图谱进行差异节点识别和相似节点匹配,得到符合目标业务主线的数据融合结果集。
在一些实施例中,仍以目标业务主线为旅客服务业务为例,如图3所示,食宿数据与客站数据可以是相似节点,客站数据与客票数据可以是相似节点,食宿数据与客票数据可以是差异节点,根据差异节点识别和相似节点匹配技术得到的结果集,可以以客站数据为基础,建立食宿数据与客票数据之间的关系。由于客票数据包括旅客信息,因此在建立食宿数据与客票数据之间的关系后,可以将食宿信息推荐给需要的旅客。结合其他节点或数据得到的结果集,也可以为旅客提供诸如公交接驳服务、站内导航、旅游目的地推荐等等一系列服务,或者结合旅客信息、客站信息进行站内客流疏导、交通综合调度等服务。
另外,由于构建知识图谱的核心要素是动态可变的,因此推荐给旅客的食宿信息也会随着列车行驶的时间和空间而变化。不同系统的数据随着列车的运行轨迹加入与离场,所形成的一系列融合结果也随之不断变化,从而产生更多值得深挖的融合结果,更容易发现产生新的业务增长点。
从图4中可以看出,与图1对应的一些实施例的描述相比,图4对应的一些实施例中的动态数据融合方法体现了如何利用知识图谱完成数据融合,具体通过差异节点识别和相似节点匹配,将数据关联和利用,完成数据融合。
请参阅图6,图6是本发明提供的动态数据融合装置的一些实施例的结构示意图,作为对上述各图所示方法的实现,本发明还提供了一种动态数据融合装置的一些实施例,这些装置实施例与图1所示的一些方法的实施例相对应,且该装置可以应用于各种电子设备中。
如图6所示,一些实施例的动态数据融合装置600包括第一处理模块601、第二处理模块602、融合模块603:第一处理模块601,用于根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集;第二处理模块602,用于根据时空数据和主数据确定核心要素,时空数据包括列车运行过程中的时间信息和空间信息,主数据包括列车运行的线路信息和经过的车站信息;融合模块603,用于根据数据集和核心要素构建知识图谱,根据知识图谱得到符合目标业务主线的数据融合结果集。
在一些实施例的可选实现方式中,装置还包括:确定单元,用于根据文本信息确定时空数据和主数据,文本信息包括至少一个信息系统反馈的报告。
在一些实施例的可选实现方式中,第二处理模块602还用于:通过预设信息抽取模型对文本信息进行信息抽取处理,得到时空数据和主数据;对时空数据和主数据进行标准化处理,得到核心要素。
在一些实施例的可选实现方式中,装置还包括:查询单元,用于查询数据库得到时空数据和主数据。
在一些实施例的可选实现方式中,第二处理模块602还用于:将时空数据和主数据进行匹配,得到核心要素。
在一些实施例的可选实现方式中,融合模块603还用于:基对知识图谱进行差异节点识别和相似节点匹配,得到符合目标业务主线的数据融合结果集。
可以理解的是,该装置600中记载的各模块与参考图1描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置600及其中包含的模块、单元,在此不再赘述。
图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行动态数据融合方法,该方法包括:根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集;根据时空数据和主数据确定核心要素,时空数据包括列车运行过程中的时间信息和空间信息,主数据包括列车运行的线路信息和经过的车站信息;根据数据集和核心要素构建知识图谱,根据知识图谱得到符合目标业务主线的数据融合结果集。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,上述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,上述计算机程序包括程序指令,当上述程序指令被计算机执行时,计算机能够执行上述各方法所提供的动态数据融合方法,该方法包括:根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集;根据时空数据和主数据确定核心要素,时空数据包括列车运行过程中的时间信息和空间信息,主数据包括列车运行的线路信息和经过的车站信息;根据数据集和核心要素构建知识图谱,根据知识图谱得到符合目标业务主线的数据融合结果集。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的动态数据融合方法,该方法包括:根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集;根据时空数据和主数据确定核心要素,时空数据包括列车运行过程中的时间信息和空间信息,主数据包括列车运行的线路信息和经过的车站信息;根据数据集和核心要素构建知识图谱,根据知识图谱得到符合目标业务主线的数据融合结果集。
以上所描述的装置实施例仅仅是示意性的,其中上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分上述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种动态数据融合方法,其特征在于,包括:
根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集;
根据时空数据和主数据确定核心要素,所述时空数据包括列车运行过程中的时间信息和空间信息,所述主数据包括列车运行的线路信息和经过的车站信息;
根据所述数据集和所述核心要素构建知识图谱,根据所述知识图谱得到符合所述目标业务主线的数据融合结果集;
所述根据时空数据和主数据确定核心要素,包括:
通过预设信息抽取模型对文本信息进行信息抽取处理,得到所述时空数据和所述主数据;所述文本信息包括所述至少一个信息系统反馈的报告;
对所述时空数据和所述主数据进行标准化处理,得到所述核心要素。
2.根据权利要求1所述的动态数据融合方法,其特征在于,所述根据时空数据和主数据确定核心要素之前,还包括:
查询数据库得到所述时空数据和主数据。
3.根据权利要求2所述的动态数据融合方法,其特征在于,所述根据时空数据和主数据确定核心要素,包括:
将所述时空数据和主数据进行匹配,得到所述核心要素。
4.根据权利要求1所述的动态数据融合方法,其特征在于,所述根据所述知识图谱得到符合所述目标业务主线的数据融合结果集,包括:
对所述知识图谱进行差异节点识别和相似节点匹配,得到符合所述目标业务主线的数据融合结果集。
5.一种动态数据融合装置,其特征在于,包括:
第一处理模块,用于根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集;
第二处理模块,用于根据时空数据和主数据确定核心要素,所述时空数据包括列车运行过程中的时间信息和空间信息,所述主数据包括列车运行的线路信息和经过的车站信息;
融合模块,用于根据所述数据集和所述核心要素构建知识图谱,根据所述知识图谱得到符合所述目标业务主线的数据融合结果集;
所述第二处理模块,还用于通过预设信息抽取模型对文本信息进行信息抽取处理,得到所述时空数据和所述主数据;所述文本信息包括所述至少一个信息系统反馈的报告;对所述时空数据和所述主数据进行标准化处理,得到所述核心要素。
6.根据权利要求5所述的动态数据融合装置,其特征在于,所述融合模块,还用于对所述知识图谱进行差异节点识别和相似节点匹配,得到符合所述目标业务主线的数据融合结果集。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述的动态数据融合方法的步骤。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的动态数据融合方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110808710.7A CN113569931B (zh) | 2021-07-16 | 2021-07-16 | 动态数据融合方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110808710.7A CN113569931B (zh) | 2021-07-16 | 2021-07-16 | 动态数据融合方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113569931A CN113569931A (zh) | 2021-10-29 |
CN113569931B true CN113569931B (zh) | 2024-04-05 |
Family
ID=78165266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110808710.7A Active CN113569931B (zh) | 2021-07-16 | 2021-07-16 | 动态数据融合方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113569931B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8874616B1 (en) * | 2011-07-11 | 2014-10-28 | 21Ct, Inc. | Method and apparatus for fusion of multi-modal interaction data |
CN109064318A (zh) * | 2018-08-24 | 2018-12-21 | 苏宁消费金融有限公司 | 一种基于知识图谱的互联网金融风险监测系统 |
CN111177400A (zh) * | 2019-12-05 | 2020-05-19 | 国网能源研究院有限公司 | 基于知识图谱的设备、业务及数据的关联显示方法和装置 |
CN111428048A (zh) * | 2020-03-20 | 2020-07-17 | 厦门渊亭信息科技有限公司 | 一种基于人工智能的跨领域知识图谱构建方法及装置 |
CN111711614A (zh) * | 2020-05-27 | 2020-09-25 | 平安科技(深圳)有限公司 | 基于知识图谱的可疑用户验证方法、装置及计算机设备 |
WO2021004333A1 (zh) * | 2019-07-08 | 2021-01-14 | 平安科技(深圳)有限公司 | 基于知识图谱的事件处理方法、装置、设备和存储介质 |
CN112732939A (zh) * | 2021-01-15 | 2021-04-30 | 中国科学院空天信息创新研究院 | 基于GraphDB的时空知识图谱构建方法、装置、介质及设备 |
WO2021103492A1 (zh) * | 2019-11-28 | 2021-06-03 | 福建亿榕信息技术有限公司 | 一种企业经营风险预测方法和系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG10201403292WA (en) * | 2014-06-16 | 2016-01-28 | Ats Group Ip Holdings Ltd | Fusion of data from heterogeneous sources |
-
2021
- 2021-07-16 CN CN202110808710.7A patent/CN113569931B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8874616B1 (en) * | 2011-07-11 | 2014-10-28 | 21Ct, Inc. | Method and apparatus for fusion of multi-modal interaction data |
CN109064318A (zh) * | 2018-08-24 | 2018-12-21 | 苏宁消费金融有限公司 | 一种基于知识图谱的互联网金融风险监测系统 |
WO2021004333A1 (zh) * | 2019-07-08 | 2021-01-14 | 平安科技(深圳)有限公司 | 基于知识图谱的事件处理方法、装置、设备和存储介质 |
WO2021103492A1 (zh) * | 2019-11-28 | 2021-06-03 | 福建亿榕信息技术有限公司 | 一种企业经营风险预测方法和系统 |
CN111177400A (zh) * | 2019-12-05 | 2020-05-19 | 国网能源研究院有限公司 | 基于知识图谱的设备、业务及数据的关联显示方法和装置 |
CN111428048A (zh) * | 2020-03-20 | 2020-07-17 | 厦门渊亭信息科技有限公司 | 一种基于人工智能的跨领域知识图谱构建方法及装置 |
CN111711614A (zh) * | 2020-05-27 | 2020-09-25 | 平安科技(深圳)有限公司 | 基于知识图谱的可疑用户验证方法、装置及计算机设备 |
CN112732939A (zh) * | 2021-01-15 | 2021-04-30 | 中国科学院空天信息创新研究院 | 基于GraphDB的时空知识图谱构建方法、装置、介质及设备 |
Non-Patent Citations (4)
Title |
---|
Graph2Seq: Fusion Embedding Learning for Knowledge Graph Completion;WEIDONG LI el al.;IEEE Access;全文 * |
基于知识图谱的企业知识服务模型构建研究;张肃;许慧;;情报科学(08);全文 * |
基于铁路数据服务平台的多源数据融合架构研究;邹丹 等;铁路计算机应用;第30卷(第4期);全文 * |
日志驱动的跨域数据融合与可视化方法;陶冶;郭帅童;王晓东;侯瑞春;初佃辉;;制造业自动化(09);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113569931A (zh) | 2021-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gurumurthy et al. | Analyzing the dynamic ride-sharing potential for shared autonomous vehicle fleets using cellphone data from Orlando, Florida | |
Arooj et al. | Big data processing and analysis in internet of vehicles: architecture, taxonomy, and open research challenges | |
Maheo et al. | Benders decomposition for the design of a hub and shuttle public transit system | |
Felemban et al. | Digital revolution for Hajj crowd management: A technology survey | |
CN104884900A (zh) | 行程时间信息提供设备和行程时间信息提供方法 | |
CN113763700B (zh) | 信息处理方法、装置、计算机设备及存储介质 | |
Chen et al. | Every second counts: integrating edge computing and service oriented architecture for automatic emergency management | |
Widanapathiranage et al. | Modelling the BRT station capacity and queuing for all stopping busway operation | |
Cvijovic et al. | Conditional transit signal priority for connected transit vehicles | |
Xu et al. | Vehicular content delivery: A big data perspective | |
US20230169805A1 (en) | Fleet data collection using a unified model to collect data from heterogenous vehicles | |
Zhang et al. | Optimized Skip‐Stop Metro Line Operation Using Smart Card Data | |
Ahmad et al. | Context-aware services based on spatio-temporal zoning and crowdsourcing | |
JP6999519B2 (ja) | 輸送力調整装置、輸送力調整システムおよび輸送力調整方法 | |
Singh et al. | Internet of vehicles: Proposed architecture, network models, open issues and challenges | |
CN113569931B (zh) | 动态数据融合方法、装置、设备和介质 | |
Khan et al. | Scalable system for smart urban transport management | |
Gui et al. | Vehicle Movement Analyses Considering Altitude Based on Modified Digital Elevation Model and Spherical Bilinear Interpolation Model: Evidence from GPS‐Equipped Taxi Data in Sanya, Zhengzhou, and Liaoyang | |
Zelinka et al. | Transport Telematics-Systemic View | |
Cirillo et al. | Atomic Services: sustainable ecosystem of smart city services through pan-European collaboration | |
CN112883195A (zh) | 个体出行的交通知识图谱构建方法及系统 | |
Artem et al. | Detection and recognition of moving biological objects for autonomous vehicles using intelligent edge computing/LoRaWAN mesh system | |
Curzel et al. | Temporal performance analysis of bus transportation using link streams | |
Khan et al. | Intelligent integration framework for smart transport system | |
Gade | Disruptive Technologies for Efficient and Sustainable Smart Cities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |