CN112948508B - 基于多层关联知识图谱的信息预测方法、装置、设备及介质 - Google Patents
基于多层关联知识图谱的信息预测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN112948508B CN112948508B CN202110406359.9A CN202110406359A CN112948508B CN 112948508 B CN112948508 B CN 112948508B CN 202110406359 A CN202110406359 A CN 202110406359A CN 112948508 B CN112948508 B CN 112948508B
- Authority
- CN
- China
- Prior art keywords
- data
- information
- knowledge graph
- layer
- historical data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000000605 extraction Methods 0.000 claims description 48
- 238000004364 calculation method Methods 0.000 claims description 33
- 230000002776 aggregation Effects 0.000 claims description 27
- 238000004220 aggregation Methods 0.000 claims description 27
- 230000004931 aggregating effect Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 238000004090 dissolution Methods 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 abstract description 5
- 206010028980 Neoplasm Diseases 0.000 description 7
- 201000011510 cancer Diseases 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000007726 management method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 206010030113 Oedema Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Library & Information Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于多层关联知识图谱的信息预测方法、装置、设备及介质,方法包括:对历史数据信息进行聚合得到多个数据点,提取每一数据点对应的特征信息并对数据点进行分层得到多个数据层,根据历史数据之间的连接关系及每一数据层中数据点的特征信息生成对应的多层关联知识图谱,获取与新增数据信息对应的新增特征数据信息,若多层关联知识图谱包含与新增数据信息相匹配的数据节点,获取数据节点对应的索引连接信息作为预测结果。本发明属于知识图谱技术且还涉及区块链技术,基于历史数据信息构建得到包含多个数据层及多个数据节点的多层关联知识图谱,并基于多层关联知识图谱获取与新增数据信息对应的预测结果,可准确地对信息进行趋势预测。
Description
技术领域
本发明涉及知识图谱技术领域,属于智慧城市中基于多层关联知识图谱进行信息智能预测的应用场景,尤其涉及一种基于多层关联知识图谱的信息预测方法、装置及设备。
背景技术
随着信息技术的快速发展,基于信息之间的关联关系对海量信息进行处理的技术得到了越来越多的应用,可基于海量信息构建得到知识图谱,并基于知识图谱获取与相应信息相匹配的关联信息。然而现有的知识图谱仅能适用于对信息进行存储及关联匹配,而无法基于信息之间的联系对之后的趋势进行准确预测。因此,现有技术中的知识图谱存在无法对信息进行趋势预测的问题。
发明内容
本发明实施例提供了一种基于多层关联知识图谱的信息预测方法、装置、设备及介质,旨在解决现有技术中的知识图谱所存在的无法对信息进行趋势预测的问题。
第一方面,本发明实施例提供了一种基于多层关联知识图谱的信息预测方法,其中,所述方法包括:
根据预置的聚合规则对预存的历史数据信息中包含的历史数据进行聚合得到对应的多个数据点;
根据预置的特征提取模型及每一所述数据点对应的历史数据,从每一所述数据点中提取得到对应的特征信息;
根据每一所述数据点的特征信息对所述数据点进行分层得到多个数据层;
根据所述历史数据之间的连接关系及每一所述数据层中数据点的特征信息生成多层关联知识图谱;
若接收到用户输入的新增数据信息,根据所述特征提取模型获取与所述新增数据信息对应的新增数据特征信息;
根据预置的判断条件及所述新增数据特征信息对所述多层关联知识图谱中是否包含与所述新增数据信息相匹配的数据节点进行判断;
若所述多层关联知识图谱中包含与所述新增数据信息相匹配的数据节点,获取所述多层关联知识图谱中与所述数据节点相匹配的索引连接信息作为对应的预测结果。
第二方面,本发明实施例提供了一种基于多层关联知识图谱的信息预测装置,其中,所述基于多层关联知识图谱的信息预测装置,包括:
历史数据聚合单元,用于根据预置的聚合规则对预存的历史数据信息中包含的历史数据进行聚合得到对应的多个数据点;
特征信息提取单元,用于根据预置的特征提取模型及每一所述数据点对应的历史数据,从每一所述数据点中提取得到对应的特征信息;
数据层获取单元,用于根据每一所述数据点的特征信息对所述数据点进行分层得到多个数据层;
知识图谱生成单元,用于根据所述历史数据之间的连接关系及每一所述数据层中数据点的特征信息生成多层关联知识图谱;
新增数据特征信息获取单元,用于若接收到用户输入的新增数据信息,根据所述特征提取模型获取与所述新增数据信息对应的新增数据特征信息;
判断单元,用于根据预置的判断条件及所述新增数据特征信息对所述多层关联知识图谱中是否包含与所述新增数据信息相匹配的数据节点进行判断;
预测结果获取单元,用于若所述多层关联知识图谱中包含与所述新增数据信息相匹配的数据节点,获取所述多层关联知识图谱中与所述数据节点相匹配的索引连接信息作为对应的预测结果。
第三方面,本发明实施例又提供了一种计算机设备,其中,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序以实现上述第一方面所述的基于多层关联知识图谱的信息预测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时实现上述第一方面所述的基于多层关联知识图谱的信息预测方法。
本发明实施例提供了一种基于多层关联知识图谱的信息预测方法、装置、设备及介质。对历史数据信息进行聚合得到多个数据点,提取每一数据点对应的特征信息并对数据点进行分层得到多个数据层,根据历史数据之间的连接关系及每一数据层中数据点的特征信息生成对应的多层关联知识图谱,获取与新增数据信息对应的新增特征数据信息,若多层关联知识图谱包含与新增数据信息相匹配的数据节点,获取数据节点对应的索引连接信息作为预测结果。通过上述方法,基于历史数据信息构建得到包含多个数据层及多个数据节点的多层关联知识图谱,并基于多层关联知识图谱获取与新增数据信息对应的预测结果,可准确地对信息进行趋势预测。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于多层关联知识图谱的信息预测方法的流程示意图;
图2为本发明实施例提供的基于多层关联知识图谱的信息预测方法的效果示意图;
图3为本发明实施例提供的基于多层关联知识图谱的信息预测方法的子流程示意图;
图4为本发明实施例提供的基于多层关联知识图谱的信息预测方法的另一子流程示意图;
图5为本发明实施例提供的基于多层关联知识图谱的信息预测方法的另一子流程示意图;
图6为本发明实施例提供的基于多层关联知识图谱的信息预测方法的另一子流程示意图;
图7为本发明实施例提供的基于多层关联知识图谱的信息预测方法的另一子流程示意图;
图8为本发明实施例提供的基于多层关联知识图谱的信息预测方法的另一子流程示意图;
图9为本发明实施例提供的基于多层关联知识图谱的信息预测装置的示意性框图;
图10为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本发明实施例提供的基于多层关联知识图谱的信息预测方法的流程示意图;该基于多层关联知识图谱的信息预测方法应用于用户终端或管理服务器中,该基于多层关联知识图谱的信息预测方法通过安装于用户终端或管理服务器中的应用软件进行执行,用户终端即是对用户输入的新增数据信息进行智能预测的终端设备,例如台式电脑、笔记本电脑、平板电脑、手机等,管理服务器即是接收用户所输入的新增数据信息进行智能预测的服务器端,如企业或政府部门内构建的服务器。如图1所示,该方法包括步骤S110~S170。
S110、根据预置的聚合规则对预存的历史数据信息中包含的历史数据进行聚合得到对应的多个数据点。
根据预置的聚合规则对预存的历史数据信息中包含的历史数据进行聚合得到对应的多个数据点。历史数据信息可由多条历史数据组成,每一条历史数据可以是文本信息或图像信息,历史数据信息中包含多个同类型且相互独立的事件,每一事件可对应包含多条历史数据,同一事件包含的多条历史数据相互串联并指向一个最终结论,这也即是历史数据之间的连接关系,历史数据信息中的一个事件可仅包含文本信息,也可以仅包含图像信息,还可以同时包含文本信息及图像信息。
历史数据可以是气象资料的历史数据或癌症复发检测的历史数据等。例如,事件可以是下雨事件,则最终结论即为下雨或不下雨,在一个下雨事件的最终结论出现之前不同时间点所采集得到的信息即构成该事件的历史数据,如对下雨事件之前每隔一段时间记录得到的空气温度、湿度等信息即构成该事件的文字信息,对下雨事件之前每隔一段时间获取到的卫星云图即构成该事件的图像信息,则可根据时间顺序对采集得到的文字信息及图像信息进行串联连接,并指向下雨或不下雨的最终结论。
在构建知识图谱之前,需要对历史数据信息中包含的历史数据进行聚合整理,具体的,可通过聚合规则对历史数据进行聚合处理。其中,所述聚合规则包括关键词集合、相似度计算公式及相似度阈值。
在一实施例中,如图3所示,步骤S110包括子步骤S111、S112、S113、S114和S115。
S111、对每一所述历史数据是否为文本信息进行判断。
可首先判断历史数据是否为文本信息,若为文本信息即对均为文本信息的历史数据进行聚合处理,若不为文本信息,即可对均为图像信息的历史数据进行聚合处理。
S112、若所述历史数据为文本信息,从所述关键词集合中获取与历史数据相匹配的多个关键词。
关键词集合即包含与历史数据信息类型相同的多个关键词,可根据关联词集合获取与文本信息的历史数据相匹配的多个关键词。
例如,若历史数据信息类型为癌症复发检测,则对应的历史数据为一段病情描述信息,与该类型对应的关键词集合可包含关键词:积液、病灶、病变、水肿、白细胞偏高等。
可根据历史数据包含的文本内容,从关键词集合中获取与该文本内容相匹配的多个关键词,可从关键词集合中获取与每一历史数据相匹配的三个关键词,若与历史数据相匹配的关键词数量大于三个,则根据每一关键词在该历史数据中的出现频次,获取出现频次最高的三个关键词作为与该历史数据相匹配的三个关键词。
S113、对包含相同关键词的多条所述历史数据进行聚合,得到对应的一个数据点。
若两条历史数据或多条历史数据均包含相同关键词,则表明两条历史数据或多条历史数据均表达相同内容,可对两条或多条历史数据进行聚合得到一个数据点,则所得到的每一个数据点至少对应一条历史数据。
S114、若所述历史数据不为文本信息,根据所述相似度计算公式对所述历史数据之间的相似度进行计算。
若历史数据不为文本信息,则历史数据为历史图像,历史图像的图像尺寸均相等,历史图像可以是彩色图像。例如,历史数据信息类型为癌症复发检测,则对应的历史数据可以是一张疾病部位的检测图像。
可通过相似度计算公式对两张历史图像之间的相似度进行计算,具体的,首先分别对两张历史图像进行灰度处理得到两张灰度图像,灰度值采用非负整数进行表示,像素对应灰度值的取值范围为[0,255],灰度值为0则表示该像素点为黑色,灰度值为255则表示该像素点为白色,灰度值为其他数值则表明该像素点为介于白色与黑色之间的一个具体灰度。可以采用公式(1)计算得到每一灰度图像的图像方差值:
任意一张灰度图像的图像方差值可表示为其中,/>为灰度图像第m行的方差值,Am为灰度图像第m行所有像素点的灰度平均值,B为灰度图像所有像素点的灰度平均值,N为所述灰度图像所包含的总行数;例如,/>为灰度图像F第m行的方差值,则图像方差值中包含灰度图像F逐行的方差值,Am为灰度图像F第m行所有像素点的灰度平均值,B为灰度图像F所有像素点的灰度平均值,N为灰度图像F所包含的总行数。其中,N也可以为灰度图像F所包含的总列数。
相似度计算公式可采用公式(2)进行表示:
根据两张灰度图像的图像方差值,计算得到两张灰度图像之间的相似度Wσ,其中,为第一张灰度图像第m行的方差值,/>为第二张灰度图像第m行的方差值。
S115、对互相之间相似度大于所述相似度阈值的多条所述历史数据进行聚合,得到对应的一个数据点。
对两张灰度图像之间的相似度是否大于相似度阈值进行判断,若大于,也即表明与两张灰度图像对应的两条历史数据之间的相似度大于相似度阈值;若不大于,则表明对应的两条历史数据之间相似度不大于相似度阈值。可根据计算得到的相似度,对互相之间相似度大于相似度阈值的多条历史数据进行聚合,得到对应的一个数据点,则此时每一个数据点至少对应一条历史数据。
例如,若得到历史数据FA与历史数据FB之间相似度大于相似度阈值,则对两条历史数据进行聚合处理;若得到历史数据FA与历史数据FB之间相似度大于相似度阈值,且历史数据FB与历史数据FC之间相似度也大于相似度阈值,则对三条历史数据FA、FB及FC进行聚合处理。
S120、根据预置的特征提取模型及每一所述数据点对应的历史数据,从每一所述数据点中提取得到对应的特征信息。
根据预置的特征提取模型及每一所述数据点对应的历史数据,从每一所述数据点中提取得到对应的特征信息。特征提取模型即为对数据点的特征信息进行提取的具体模型,其中,所述特征提取模型包括文本编码词典、特征提取神经网络及图像特征提取规则,数据点的特征信息可采用特征向量的形式进行表示。
在一实施例中,如图4所示,步骤S120包括子步骤S121、S122、S123和S124。
S121、对所述数据点对应的历史数据是否均为文本信息进行判断;
任意一个数据点所对应的历史数据要么均为文本信息,要么均为图像信息,则可相对数据点对应的历史数据的类型进行判断,并根据判断结果对每一数据点的历史数据进行相应处理。
S122、若所述数据点对应的历史数据均为文本信息,根据所述文本编码词典对每一所述数据点对应的多个关键词进行转换,得到每一所述数据点的编码信息。
若某一数据点对应的历史数据均为文本信息,则该数据点对应的历史数据中均包含相同的多个关键词,则根据文本编码词典对该数据点对应的多个关键词进行转换,得到该数据点的编码信息。具体的,每一字符均可在文本编码词典中匹配到对应的一个特征编码,则可根据文本编码词典对每一数据点对应的多个关键词中的字符进行转换,将转换得到的多个特征编码进行顺序组合得到对应数据点的编码信息,转换得到的编码信息可采用大小为(1,R)的特征向量进行表示,则编码信息为一个1行R列的特征向量,R为预先设定的一个长度值,例如,可将R设定为12,则获取每一数据点对应的多个特征编码组合得到编码信息,若特征编码数据不足12,则最后几位数值采用“0”进行补齐。
S123、将所述编码信息输入所述特征提取神经网络进行计算,得到每一所述数据点的特征信息。
可将所得到的每一数据点的编码信息输入特征提取神经网络进行计算,得到每一数据点的特征信息。具体的,特征提取神经网络即为基于人工智能构建得到的神经网络,特征提取神经网络由一个输入层、多个中间层及一个输出层组成,输入层与中间层之间、中间层与其他中间层之间、中间层与输出层之间均通过关联公式进行关联,例如某一关联公式可表示为y=c1×x+c2,c1和c2即为该关联公式中的参数值。输入层中包含的输入节点的数量与编码信息中向量维度数量相等,则编码信息中每一维度的向量值均与一个输入节点相对应。将一个数据点的编码信息输入特征提取神经网络进行计算,即可从特征提取神经网络的输出层获取相应的特征信息,特征信息可采用一个特征数组(R,T)进行表示,特征数组的大小为R行T列,且特征数组中每一数值均属于[0,1]这一取值范围。
S124、若所述数据点对应的历史数据不均为文本信息,根据所述图像特征提取规则从所述数据点对应的历史数据中提取得到与所述数据点对应的特征信息。
若某一数据点对应的历史数据均为图像信息,则可从该数据点对应的多张图像信息中提取得到对应的特征信息,其中,图像特征提取规则即为从多张图像信息中提取对应特征信息的具体规则,所述图像特征提取规则包括对比度计算公式及溶解比例值。
在一实施例中,如图5所示,步骤S124包括子步骤S1241、S1242、S1243和S1244。
S1241、对每一所述数据点对应的历史数据进行叠加得到每一数据点对应的叠加图像。
数据点对应的每一历史数据均为图像信息,且图像信息的尺寸均相同,则可对同一数据点对应的多张图像信息进行叠加,具体的,对多张图像信息每一像素点位置对应的像素值进行平均计算,也即是计算每一像素点的RGB值的平均值,RGB值中包含红、绿、蓝三个颜色通道分别对应的色度值,则需要分别计算红、绿、蓝三个通道分别对应的像素值的平均值,得到每一像素点的像素平均值,同一数据点包含的图像信息中每一像素点的像素平均值即组合成为一张叠加图像。
S1242、根据所述对比度计算公式计算得到每一所述叠加图像的像素对比度信息。
具体的,获取一张叠加图像并确定其中的一个像素点为目标像素点,可获取目标像素点外围第一层的八个像素点及外围第二层的十六个像素点作为该目标像素点的关联像素点,获取目标像素点的RGB值,GRB值包括目标像素点在红、绿、蓝三个颜色通道分别对应的像素值,以及外围的关联像素点的RGB值,根据对比度计算公式计算外围第一层的八个像素点的RGB值与目标像素点之间的第一差值,以及外围第二层的十六个像素点的RGB值与目标像素点之间的第二差值,并对第一差值及第二差值进行加权相加得到该目标像素点的对比度。根据对比度计算公式及上述计算方法获取某一张叠加图像中每一像素点的对比度作为该叠加图像的像素对比度信息,则可根据上述方法依次获取得到每一张叠加图像的像素对比度信息。
例如,对比度计算公式可采用以下公式(3)进行表示:
其中,j1为第一差值的加权值,j2为第二差值的加权值,Ru为外围第一层中的第u个像素点的RGB值,Rv为外围第二层中的第v个像素点的RGB值,R0为目标像素点的RGB值。
S1243、根据每一所述叠加图像的像素对比度信息及所述溶解比例值对每一所述叠加图像进行像素溶解得到图像轮廓信息。
叠加图像中像素点的对比度越大,也即表明该像素点与周边像素点之间的差异度越大,获取某一叠加图像的像素对比度信息,根据像素对比度信息对每一像素点的对比度进行排序,获取排序结果中与像素溶解比例值相匹配且排序靠前的多个像素点作为该叠加图像的溶解像素点,根据溶解像素点对该客户图像进行像素溶解,将该叠加图像中非溶解像素点从图像中删除,得到该叠加图像的图像轮廓信息。
S1244、从每一所述叠加图像的图像轮廓信息中提取得到对应的轮廓尺寸信息及轮廓像素信息作为所述特征信息。
从图像轮廓信息中提取得到轮廓尺寸信息及轮廓像素信息,作为每一叠加图像的特征信息,轮廓尺寸信息即为轮廓外形尺寸的具体信息,轮廓像素信息即为图像轮廓信息的像素值信息。具体的,轮廓尺寸信息可以包括轮廓长度、轮廓宽度及轮廓面积等信息,轮廓像素信息可以包括图像轮廓信息的色度平均值、色度方差值等信息。具体的,色度平均值即为对图像轮廓信息包含的像素点的RGB值进行平均计算所得到的一个RGB平均值,色度方差值为图像轮廓信息中包含的像素点在RGB色度上的方差分布值。
S130、根据每一所述数据点的特征信息对所述数据点进行分层得到多个数据层。
根据每一所述数据点的特征信息对所述数据点进行分层得到多个数据层。根据数据点的特征信息可将数据点进行分层得到对应的多个数据层,则得到的每一数据层中均包含多个数据点。
在一实施例中,如图6所示,步骤S130包括子步骤S131和S132。
S131、根据所述历史数据的类型及每一所述数据点对应的历史数据对每一所述数据点进行分类得到多个数据点集。
首先可根据历史数据的类型,确定每一数据点对应的多个历史数据的类型,并根据每一数据点的类型对数据点进行分类得到多个数据集集。例如,历史数据的类型包括文本及图像,则文本类型的数据点分类至一个数据点集,图像类型的数据点分类至一个数据点集。
S132、根据预置的聚类规则及所述数据点的特征信息,对每一所述数据点集包含的数据点进行聚类得到对应的多个数据层。
可根据聚类规则及数据点的特征信息对每一数据点集包含的数据点进行聚类,则聚类后所得到的一个小类即构成一个数据层,聚类规则可以是K-means聚类规则、均值漂移聚类规则、基于高斯混合模型的最大期望聚类规则或凝聚层次聚类规则等。则每一数据点集包含的数据点均可聚类得到对应的多个数据层。此外,最终结论可单独作为一个数据层。
S140、根据所述历史数据之间的连接关系及每一所述数据层中数据点的特征信息生成多层关联知识图谱。
根据所述历史数据之间的连接关系及每一所述数据层中数据点的特征信息生成多层关联知识图谱。历史数据信息中包含历史数据之间的连接关系,可根据历史数据的连接关系及所得得到的多个数据层生成对应的多层关联知识图谱。
在一实施例中,如图7所示,步骤S140包括子步骤S141、S142和S143。
S141、生成与每一所述数据点对应的数据节点;S142、分别对每一所述数据层及每一所述数据层包含的数据节点进行编码得到数据编码信息。
一个数据点对应生成一个数据节点,并对每一数据层及数据层内包含的数据节点进行编码,得到数据编码信息,则数据编码信息中包括数据层及数据节点对应的编码值,数据层的编码值互不重复,数据节点的编码值也互不重复。
S143、根据所述历史数据的连接关系对所述数据节点及所述数据层进行倒排索引连接,得到对应的多层关联知识图谱。
可根据历史数据的连接关系对数据节点进行倒排索引连接,具体的,以最终结论作为倒排索引的起点,根据历史数据信息中每一事件包含的多条历史数据相互串联以及每一事件指向一个最终结论,对数据节点进行倒排索引连接。
图2为本发明实施例提供的基于多层关联知识图谱的信息预测方法的效果示意图,图2即为所构建的多层关联知识图谱的局部图,数据层B1及数据层B2均为基础层,数据层L1.1为数据层B1的上一层数据层,A、B、C及D均为数据层B1包含的数据节点,图2中对数据层及数据节点进行编码的编码值仅为一种编码方式的示例;对数据节点进行倒排索引连接的效果如图2所示。
S150、若接收到用户输入的新增数据信息,根据所述特征提取模型获取与所述新增数据信息对应的新增数据特征信息。
若接收到用户输入的新增数据信息,根据所述特征提取模型获取与所述新增数据信息对应的新增数据特征信息。用户可输入新增数据信息,则可基于构建的多层关联知识图谱获取与新增数据信息对应的预测结果,具体的,用户可输入一条新增数据信息或输入多条新增数据信息,用户输入的新增数据信息可以均为文本信息,或者均为图像信息,还可以即包含文本信息也包含图像信息,任意一条新增数据信息可以是图像信息或文本信息。
可先对用户输入的每一条新增数据信息是否为文本信息依次进行判断,若新增数据信息为文本信息,则可根据特征提取模型中的文本编码词典及特征提取神经网络对该新增数据信息进行特征提取,得到与该新增数据信息对应的新增数据特征信息;若新增数据信息为图像信息,则可根据特征提取模型中的图像特征提取规则对该新增数据信息进行特征提取,得到与该新增数据信息对应的新增数据特征信息,获取新增数据特征信息的具体方式与获取数据点的特征信息的具体方式相同,在此不作赘述。
S160、根据预置的判断条件及所述新增数据特征信息对所述多层关联知识图谱中是否包含与所述新增数据信息相匹配的数据节点进行判断。
根据预置的判断条件及所述新增数据特征信息对所述多层关联知识图谱中是否包含与所述新增数据信息相匹配的数据节点进行判断。可基于所得到的新增数据特征信息,获取多层关联知识图谱中特征信息满足判断条件的数据节点作为与新增数据信息相匹配的数据节点,判断条件即为对数据节点的特征信息是否与新增数据特征信息之间是否相匹配进行判断的具体条件,其中,所述判断条件包括匹配度计算公式及匹配度阈值。
在一实施例中,如图8所示,步骤S160包括子步骤S161和S162。
S161、根据所述匹配度计算公式对所述新增数据特征信息与每一所述数据节点的特征信息之间的匹配度进行计算。
根据每一条新增数据信息的类型,确定多层关联知识图谱与每一条新增数据特征信息的类型相匹配多个数据节点,具体的,若新增数据信息为文本信息,则确定知识图谱中类型为文本的数据节点为与新增数据信息相匹配的数据节点;若新增数据信息为图像信息,则确定知识图谱中类型为图像的数据节点为与新增数据信息相匹配的数据节点。根据匹配度计算公式对新增数据特征信息与相应类型的每一数据节点特征信息之间的匹配度进行计算,具体的,匹配度计算公式可采用公式(4)进行表示:
其中,Ui为新增数据特征信息中第i个维度的维度值,Vi为相应类型的某一数据节点对应特征信息中第i个维度的维度值,n为新增数据特征信息所包含的维度总数,新增数据特征信息的维度数与相应类型的数据节点对应特征信息的维度数相等,计算得到的匹配度的取值范围为[0,1]。
S162、判断匹配度大于所述匹配度阈值的数据节点的数量是否大于零,以得到所述多层关联知识图谱中是否包含与所述新增数据信息相匹配的数据节点的判断结果。
可根据计算得到的匹配度,判断多层关联知识图谱中与新增数据信息之间匹配度大于匹配度阈值的数据节点的数量是否大于零,若新增数据信息之间匹配度大于匹配度阈值的数据节点的数量大于零,则得到的判断结果为多层关联知识图谱中包含与新增数据信息相匹配的数据节点;否则,得到的判断结果为多层关联知识图谱中不包含与新增数据信息相匹配的数据节点。
S170、若所述多层关联知识图谱中包含与所述新增数据信息相匹配的数据节点,获取所述多层关联知识图谱中与所述数据节点相匹配的索引连接信息作为对应的预测结果。
若判断结果为多层关联知识图谱中包含与新增数据信息相匹配的数据节点,则获取知识图谱中与相应数据节点相匹配的索引连接信息作为对应预测结果,预测结果即可对新增数据信息之后的发展趋势进行预测,预测结果中索引连接信息指向的最终结论即为新增数据信息对应的预测结论。具体的,若用户仅输入一条新增数据信息,则对应获取与该新增数据信息相匹配的数据节点的索引连接信息作为预测结果;若用户输入多条新增数据信息,可获取与每一新增数据信息相匹配的数据节点的索引连接信息,并对索引连接信息进行去重处理得到最终预测结果。
例如,用户输入的某一条新增数据信息为一段病情描述信息,则该新增数据信息为文本信息,获取与该新增数据信息对应的新增数据特征信息,并判断得到多层关联知识图谱中的数据节点X与新增数据特征信息相匹配,数据节点X的下游连接数据节点Y且数据节点Y指向“癌症复发”这一最终结论,获取数据节点X的索引连接信息作为预测结果,则索引连接信息即为数据节点X与数据节点Y的连接关系以及数据节点Y最终指向的“癌症复发”这一最终结论的连接信息,预测结果也即是预测用户当前输入的病情描述信息会沿着知识图谱中“数据节点X->数据节点Y->癌症复发”的这一可能的连接路径进行发展。若用户同时输入两条新增数据信息,其中一条新增数据信息为一段病情描述信息,另一条新增数据信息为一张疾病部位的检测图像,则可根据上述方法对应获取病情描述信息的新增数据特征信息及检测图像的新增数据特征信息,并判断得到多层关联知识图谱中的数据节点P与病情描述信息的新增数据特征信息相匹配、多层关联知识图谱中的数据节点Q与检测图像的新增数据特征信息相匹,数据节点P的下游及数据节点Q的下游均连接数据节点O,数据节点O指向“癌症不复发”这一最终结论,则分别获取数据节点P及数据节点Q的索引连接信息,对两个数据节点的索引连接信息进行去重后作为对应的预测结果。
若所述多层关联知识图谱中不包含与所述新增数据信息相匹配的数据节点,则根据每一所述数据层中数据节点的特征信息,从每一所述数据层中提取得到对应的分层特征信息;根据所述判断条件及所述新增数据特征信息对所述多层关联知识图谱中是否包含与所述新增数据信息相匹配的数据层进行判断;若所述多层关联知识图谱中包含与所述新增数据信息相匹配的数据层,根据所述新增数据信息生成对应的数据节点并添加至与所述新增数据信息相匹配的数据层中;若所述多层关联知识图谱中不包含与所述新增数据信息相匹配的数据层,根据所述新增数据信息生成对应的独立数据节点并添加至所述多层关联知识图谱中。若多个独立数据节点之间满足相应聚合条件,则可对多个独立数据节点进行聚合,以生成新的数据层容纳对应的多个独立数据节点,并将新生成的数据层添加至多层关联知识图谱中。
其中,分层特征信息可以是数据层中数据节点的特征信息对应平均值,若多层关联知识图谱中包含与新增数据信息相匹配的数据层,则将生成与新增数据信息对应的数据节点并添加至该数据层中,新生成的数据节点即为数据层中独立的数据节点,独立的数据节点如图2中数据节点K及数据节点H所示。当再次输入相应新增数据信息,则按上述方式获取与新增数据信息相匹配的数据节点或生成与新增数据信息对应的数据节点添加至多层关联知识图谱中,并根据新增数据信息与上次输入的新增数据信息之间的连接关系,将新生成的数据节点与上次生成的数据节点进行倒排索引连接。
在一实施例中,步骤S170之后还包括:将所述预测结果上传至区块链进行存储。
将所述预测结果上传至区块链进行存储,基于预测结果得到对应的摘要信息,具体来说,摘要信息由预测结果进行散列处理得到,比如利用sha256算法处理得到。将摘要信息上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得该摘要信息,以便查证预测结果是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请中的技术方法可应用于智慧政务/智慧城管/智慧社区/智慧安防/智慧物流/智慧医疗/智慧教育/智慧环保/智慧交通等包含基于多层关联知识图谱进行信息智能预测的应用场景中,从而推动智慧城市的建设。
在本发明实施例所提供的基于多层关联知识图谱的信息预测方法中,对历史数据信息进行聚合得到多个数据点,提取每一数据点对应的特征信息并对数据点进行分层得到多个数据层,根据历史数据之间的连接关系及每一数据层中数据点的特征信息生成对应的多层关联知识图谱,获取与新增数据信息对应的新增特征数据信息,若多层关联知识图谱包含与新增数据信息相匹配的数据节点,获取数据节点对应的索引连接信息作为预测结果。通过上述方法,基于历史数据信息构建得到包含多个数据层及多个数据节点的多层关联知识图谱,并基于多层关联知识图谱获取与新增数据信息对应的预测结果,可准确地对信息进行趋势预测。
本发明实施例还提供一种基于多层关联知识图谱的信息预测装置100,该基于多层关联知识图谱的信息预测装置可配置于用户终端或管理服务器中,该基于多层关联知识图谱的信息预测装置用于执行前述的基于多层关联知识图谱的信息预测方法的任一实施例。具体地,请参阅图9,图9为本发明实施例提供的基于多层关联知识图谱的信息预测装置的示意性框图。
如图9所示,该基于多层关联知识图谱的信息预测装置100包括历史数据聚合单元110、特征信息提取单元120、数据层获取单元130、知识图谱生成单元140、新增数据特征信息获取单元150、判断单元160和预测结果获取单元170。
历史数据聚合单元110,用于根据预置的聚合规则对预存的历史数据信息中包含的历史数据进行聚合得到对应的多个数据点。
在一实施例中,所述历史数据聚合单元110包括子单元:历史数据判断单元,用于对每一所述历史数据是否为文本信息进行判断;关键词匹配单元,用于若所述历史数据为文本信息,从所述关键词集合中获取与历史数据相匹配的多个关键词;第一聚合单元,用于对包含相同关键词的多条所述历史数据进行聚合,得到对应的一个数据点;相似度计算单元,用于若所述历史数据不为文本信息,根据所述相似度计算公式对所述历史数据之间的相似度进行计算;第二聚合单元,用于对互相之间相似度大于所述相似度阈值的多条所述历史数据进行聚合,得到对应的一个数据点。
特征信息提取单元120,用于根据预置的特征提取模型及每一所述数据点对应的历史数据,从每一所述数据点中提取得到对应的特征信息。
在一实施例中,所述特征信息提取单元120包括子单元:数据点判断单元,用于对所述数据点对应的历史数据是否均为文本信息进行判断;编码信息获取单元,用于若所述数据点对应的历史数据均为文本信息,根据所述文本编码词典对每一所述数据点对应的多个关键词进行转换,得到每一所述数据点的编码信息;特征信息获取单元,用于将所述编码信息输入所述特征提取神经网络进行计算,得到每一所述数据点的特征信息;图像特征提取单元,用于若所述数据点对应的历史数据不均为文本信息,根据所述图像特征提取规则从所述数据点对应的历史数据中提取得到与所述数据点对应的特征信息。
在一实施例中,所述图像特征提取单元包括子单元:叠加图像获取单元,用于对每一所述数据点对应的历史数据进行叠加得到每一数据点对应的叠加图像;像素对比度信息获取单元,用于根据所述对比度计算公式计算得到每一所述叠加图像的像素对比度信息;图像轮廓信息获取单元,用于根据每一所述叠加图像的像素对比度信息及所述溶解比例值对每一所述叠加图像进行像素溶解得到图像轮廓信息;轮廓特征信息获取单元,用于从每一所述叠加图像的图像轮廓信息中提取得到对应的轮廓尺寸信息及轮廓像素信息作为所述特征信息。
数据层获取单元130,用于根据每一所述数据点的特征信息对所述数据点进行分层得到多个数据层。
在一实施例中,所述数据层获取单元130包括子单元:数据点分类单元,用于根据所述历史数据的类型及每一所述数据点对应的历史数据对每一所述数据点进行分类得到多个数据点集;数据点聚类单元,用于根据预置的聚类规则及所述数据点的特征信息,对每一所述数据点集包含的数据点进行聚类得到对应的多个数据层。
知识图谱生成单元140,用于根据所述历史数据之间的连接关系及每一所述数据层中数据点的特征信息生成多层关联知识图谱。
在一实施例中,所述知识图谱生成单元140包括子单元:数据节点生成单元,用于生成与每一所述数据点对应的数据节点;数据编码信息获取单元,用于分别对每一所述数据层及每一所述数据层包含的数据节点进行编码得到数据编码信息;倒排索引连接单元,用于根据所述历史数据的连接关系对所述数据节点及所述数据层进行倒排索引连接,得到对应的多层关联知识图谱。
新增数据特征信息获取单元150,用于若接收到用户输入的新增数据信息,根据所述特征提取模型获取与所述新增数据信息对应的新增数据特征信息。
判断单元160,用于根据预置的判断条件及所述新增数据特征信息对所述多层关联知识图谱中是否包含与所述新增数据信息相匹配的数据节点进行判断。
在一实施例中,所述判断单元160包括子单元:匹配度计算单元,用于根据所述匹配度计算公式对所述新增数据特征信息与每一所述数据节点的特征信息之间的匹配度进行计算;判断结果获取单元,用于判断匹配度大于所述匹配度阈值的数据节点的数量是否大于零,以得到所述多层关联知识图谱中是否包含与所述新增数据信息相匹配的数据节点的判断结果。
预测结果获取单元170,用于若所述多层关联知识图谱中包含与所述新增数据信息相匹配的数据节点,获取所述多层关联知识图谱中与所述数据节点相匹配的索引连接信息作为对应的预测结果。
在本发明实施例所提供的基于多层关联知识图谱的信息预测装置应用上述基于多层关联知识图谱的信息预测方法,对历史数据信息进行聚合得到多个数据点,提取每一数据点对应的特征信息并对数据点进行分层得到多个数据层,根据历史数据之间的连接关系及每一数据层中数据点的特征信息生成对应的多层关联知识图谱,获取与新增数据信息对应的新增特征数据信息,若多层关联知识图谱包含与新增数据信息相匹配的数据节点,获取数据节点对应的索引连接信息作为预测结果。通过上述方法,基于历史数据信息构建得到包含多个数据层及多个数据节点的多层关联知识图谱,并基于多层关联知识图谱获取与新增数据信息对应的预测结果,可准确地对信息进行趋势预测。
上述基于多层关联知识图谱的信息预测方法可以实现为计算机程序的形式,该计算机程序可以在如图10所示的计算机设备上运行。
请参阅图10,图10是本发明实施例提供的计算机设备的示意性框图。该计算机设备可以是用于执行基于多层关联知识图谱的信息预测方法以基于多层关联知识图谱进行信息智能预测的用户终端或管理服务器。
参阅图10,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括存储介质503和内存储器504。
该存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于多层关联知识图谱的信息预测方法,其中,存储介质503可以为易失性的存储介质或非易失性的存储介质。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于多层关联知识图谱的信息预测方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图10中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现上述的基于多层关联知识图谱的信息预测方法中对应的功能。
本领域技术人员可以理解,图10中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图10所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为易失性或非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时实现上述的基于多层关联知识图谱的信息预测方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种基于多层关联知识图谱的信息预测方法,其特征在于,所述方法包括:
根据预置的聚合规则对预存的历史数据信息中包含的历史数据进行聚合得到对应的多个数据点;
根据预置的特征提取模型及每一所述数据点对应的历史数据,从每一所述数据点中提取得到对应的特征信息;
根据每一所述数据点的特征信息对所述数据点进行分层得到多个数据层;
根据所述历史数据之间的连接关系及每一所述数据层中数据点的特征信息生成多层关联知识图谱;
若接收到用户输入的新增数据信息,根据所述特征提取模型获取与所述新增数据信息对应的新增数据特征信息;
根据预置的判断条件及所述新增数据特征信息对所述多层关联知识图谱中是否包含与所述新增数据信息相匹配的数据节点进行判断;
若所述多层关联知识图谱中包含与所述新增数据信息相匹配的数据节点,获取所述多层关联知识图谱中与所述数据节点相匹配的索引连接信息作为对应的预测结果;
所述聚合规则包括关键词集合、相似度计算公式及相似度阈值,所述根据预置的聚合规则对预存的历史数据信息中包含的历史数据进行聚合得到对应的多个数据点,包括:
对每一所述历史数据是否为文本信息进行判断;
若所述历史数据为文本信息,从所述关键词集合中获取与历史数据相匹配的多个关键词;
对包含相同关键词的多条所述历史数据进行聚合,得到对应的一个数据点;
若所述历史数据不为文本信息,根据所述相似度计算公式对所述历史数据之间的相似度进行计算;
对互相之间相似度大于所述相似度阈值的多条所述历史数据进行聚合,得到对应的一个数据点;
所述根据所述相似度计算公式对所述历史数据之间的相似度进行计算,包括:对两组历史数据对应的两张历史图像进行灰度处理得到两张灰度图像;计算两张灰度图像分别对应的图像方差值;根据两张灰度图像分别对应的图像方差值计算得到相似度。
2.根据权利要求1所述的基于多层关联知识图谱的信息预测方法,其特征在于,所述特征提取模型包括文本编码词典、特征提取神经网络及图像特征提取规则,所述根据预置的特征提取模型及每一所述数据点对应的历史数据,从每一所述数据点中提取得到对应的特征信息,包括:
对所述数据点对应的历史数据是否均为文本信息进行判断;
若所述数据点对应的历史数据均为文本信息,根据所述文本编码词典对每一所述数据点对应的多个关键词进行转换,得到每一所述数据点的编码信息;
将所述编码信息输入所述特征提取神经网络进行计算,得到每一所述数据点的特征信息;
若所述数据点对应的历史数据不均为文本信息,根据所述图像特征提取规则从所述数据点对应的历史数据中提取得到与所述数据点对应的特征信息。
3.根据权利要求2所述的基于多层关联知识图谱的信息预测方法,其特征在于,所述图像特征提取规则包括对比度计算公式及溶解比例值,所述根据所述图像特征提取规则从所述数据点对应的历史数据中提取得到与所述数据点对应的特征信息,包括:
对每一所述数据点对应的历史数据进行叠加得到每一数据点对应的叠加图像;
根据所述对比度计算公式计算得到每一所述叠加图像的像素对比度信息;
根据每一所述叠加图像的像素对比度信息及所述溶解比例值对每一所述叠加图像进行像素溶解得到图像轮廓信息;
从每一所述叠加图像的图像轮廓信息中提取得到对应的轮廓尺寸信息及轮廓像素信息作为所述特征信息。
4.根据权利要求1所述的基于多层关联知识图谱的信息预测方法,其特征在于,所述根据每一所述数据点的特征信息对所述数据点进行分层得到多个数据层,包括:
根据所述历史数据的类型及每一所述数据点对应的历史数据对每一所述数据点进行分类得到多个数据点集;
根据预置的聚类规则及所述数据点的特征信息,对每一所述数据点集包含的数据点进行聚类得到对应的多个数据层。
5.根据权利要求1所述的基于多层关联知识图谱的信息预测方法,其特征在于,所述根据所述历史数据之间的连接关系及每一所述数据层包含的历史数据的特征信息生成多层关联知识图谱,包括:
生成与每一所述数据点对应的数据节点;
分别对每一所述数据层及每一所述数据层包含的数据节点进行编码得到数据编码信息;
根据所述历史数据的连接关系对所述数据节点及所述数据层进行倒排索引连接,得到对应的多层关联知识图谱。
6.根据权利要求5所述的基于多层关联知识图谱的信息预测方法,其特征在于,所述判断条件包括匹配度计算公式及匹配度阈值,所述根据预置的判断条件及所述新增数据特征信息对所述多层关联知识图谱中是否包含与所述新增数据信息相匹配的数据节点进行判断,包括:
根据所述匹配度计算公式对所述新增数据特征信息与每一所述数据节点的特征信息之间的匹配度进行计算;
判断匹配度大于所述匹配度阈值的数据节点的数量是否大于零,以得到所述多层关联知识图谱中是否包含与所述新增数据信息相匹配的数据节点的判断结果。
7.一种基于多层关联知识图谱的信息预测装置,其特征在于,所述基于多层关联知识图谱的信息预测装置,包括:
历史数据聚合单元,用于根据预置的聚合规则对预存的历史数据信息中包含的历史数据进行聚合得到对应的多个数据点;
特征信息提取单元,用于根据预置的特征提取模型及每一所述数据点对应的历史数据,从每一所述数据点中提取得到对应的特征信息;
数据层获取单元,用于根据每一所述数据点的特征信息对所述数据点进行分层得到多个数据层;
知识图谱生成单元,用于根据所述历史数据之间的连接关系及每一所述数据层中数据点的特征信息生成多层关联知识图谱;
新增数据特征信息获取单元,用于若接收到用户输入的新增数据信息,根据所述特征提取模型获取与所述新增数据信息对应的新增数据特征信息;
判断单元,用于根据预置的判断条件及所述新增数据特征信息对所述多层关联知识图谱中是否包含与所述新增数据信息相匹配的数据节点进行判断;
预测结果获取单元,用于若所述多层关联知识图谱中包含与所述新增数据信息相匹配的数据节点,获取所述多层关联知识图谱中与所述数据节点相匹配的索引连接信息作为对应的预测结果;
所述聚合规则包括关键词集合、相似度计算公式及相似度阈值;所述历史数据聚合单元包括子单元:历史数据判断单元,用于对每一所述历史数据是否为文本信息进行判断;关键词匹配单元,用于若所述历史数据为文本信息,从所述关键词集合中获取与历史数据相匹配的多个关键词;第一聚合单元,用于对包含相同关键词的多条所述历史数据进行聚合,得到对应的一个数据点;相似度计算单元,用于若所述历史数据不为文本信息,根据所述相似度计算公式对所述历史数据之间的相似度进行计算;第二聚合单元,用于对互相之间相似度大于所述相似度阈值的多条所述历史数据进行聚合,得到对应的一个数据点;
所述根据所述相似度计算公式对所述历史数据之间的相似度进行计算,包括:对两组历史数据对应的两张历史图像进行灰度处理得到两张灰度图像;计算两张灰度图像分别对应的图像方差值;根据两张灰度图像分别对应的图像方差值计算得到相似度。
8.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序以实现如权利要求1至6中任一项所述的基于多层关联知识图谱的信息预测方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的基于多层关联知识图谱的信息预测方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110406359.9A CN112948508B (zh) | 2021-04-15 | 2021-04-15 | 基于多层关联知识图谱的信息预测方法、装置、设备及介质 |
PCT/CN2021/097105 WO2022217711A1 (zh) | 2021-04-15 | 2021-05-31 | 基于多层关联知识图谱的信息预测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110406359.9A CN112948508B (zh) | 2021-04-15 | 2021-04-15 | 基于多层关联知识图谱的信息预测方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112948508A CN112948508A (zh) | 2021-06-11 |
CN112948508B true CN112948508B (zh) | 2024-04-30 |
Family
ID=76232627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110406359.9A Active CN112948508B (zh) | 2021-04-15 | 2021-04-15 | 基于多层关联知识图谱的信息预测方法、装置、设备及介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112948508B (zh) |
WO (1) | WO2022217711A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114780864B (zh) * | 2022-03-24 | 2023-01-31 | 天津大学 | 一种基于知识图谱的人-物-空间交互模型构建方法 |
CN115860179B (zh) * | 2022-11-01 | 2024-07-16 | 清华大学 | 轨迹预测方法、装置、设备、存储介质及程序产品 |
CN117671979B (zh) * | 2023-12-25 | 2024-07-23 | 中傲智能科技(苏州)有限公司 | 一种基于知识图谱的智慧城市数据管理系统与方法 |
CN118293927B (zh) * | 2024-06-06 | 2024-08-20 | 青岛理工大学 | 一种知识图谱增强的视觉-语音导航方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679110A (zh) * | 2017-09-15 | 2018-02-09 | 广州唯品会研究院有限公司 | 结合文本分类与图片属性提取完善知识图谱的方法及装置 |
CN109697233A (zh) * | 2018-12-03 | 2019-04-30 | 中电科大数据研究院有限公司 | 一种知识图谱体系搭建方法 |
CN111259149A (zh) * | 2020-01-19 | 2020-06-09 | 清华大学 | 化学品事故分类方法、装置、计算机设备和存储介质 |
CN111694966A (zh) * | 2020-06-10 | 2020-09-22 | 齐鲁工业大学 | 面向化工领域的多层次知识图谱构建方法及系统 |
CN111797222A (zh) * | 2020-06-29 | 2020-10-20 | 平安国际智慧城市科技股份有限公司 | 课程知识图谱构建方法、装置、终端及存储介质 |
CN111831911A (zh) * | 2020-07-16 | 2020-10-27 | 北京奇艺世纪科技有限公司 | 查询信息的处理方法、装置、存储介质和电子装置 |
CN111930774A (zh) * | 2020-08-06 | 2020-11-13 | 全球能源互联网研究院有限公司 | 一种电力知识图谱本体自动构建方法及系统 |
CN112200317A (zh) * | 2020-09-28 | 2021-01-08 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 多模态知识图谱构建方法 |
CN112328741A (zh) * | 2020-11-03 | 2021-02-05 | 平安科技(深圳)有限公司 | 基于人工智能的智能关联答复方法、装置、计算机设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8265778B2 (en) * | 2010-06-17 | 2012-09-11 | Microsoft Corporation | Event prediction using hierarchical event features |
CN110321482B (zh) * | 2019-06-11 | 2023-04-18 | 创新先进技术有限公司 | 一种信息的推荐方法、装置及设备 |
EP3994589A1 (en) * | 2019-07-04 | 2022-05-11 | Siemens Aktiengesellschaft | System, apparatus and method of managing knowledge generated from technical data |
CN112100369B (zh) * | 2020-07-29 | 2022-06-10 | 浙江大学 | 结合语义的网络故障关联规则生成方法和网络故障检测方法 |
CN112163099A (zh) * | 2020-09-24 | 2021-01-01 | 平安直通咨询有限公司上海分公司 | 基于知识图谱的文本识别方法、装置、存储介质和服务器 |
-
2021
- 2021-04-15 CN CN202110406359.9A patent/CN112948508B/zh active Active
- 2021-05-31 WO PCT/CN2021/097105 patent/WO2022217711A1/zh active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679110A (zh) * | 2017-09-15 | 2018-02-09 | 广州唯品会研究院有限公司 | 结合文本分类与图片属性提取完善知识图谱的方法及装置 |
CN109697233A (zh) * | 2018-12-03 | 2019-04-30 | 中电科大数据研究院有限公司 | 一种知识图谱体系搭建方法 |
CN111259149A (zh) * | 2020-01-19 | 2020-06-09 | 清华大学 | 化学品事故分类方法、装置、计算机设备和存储介质 |
CN111694966A (zh) * | 2020-06-10 | 2020-09-22 | 齐鲁工业大学 | 面向化工领域的多层次知识图谱构建方法及系统 |
CN111797222A (zh) * | 2020-06-29 | 2020-10-20 | 平安国际智慧城市科技股份有限公司 | 课程知识图谱构建方法、装置、终端及存储介质 |
CN111831911A (zh) * | 2020-07-16 | 2020-10-27 | 北京奇艺世纪科技有限公司 | 查询信息的处理方法、装置、存储介质和电子装置 |
CN111930774A (zh) * | 2020-08-06 | 2020-11-13 | 全球能源互联网研究院有限公司 | 一种电力知识图谱本体自动构建方法及系统 |
CN112200317A (zh) * | 2020-09-28 | 2021-01-08 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 多模态知识图谱构建方法 |
CN112328741A (zh) * | 2020-11-03 | 2021-02-05 | 平安科技(深圳)有限公司 | 基于人工智能的智能关联答复方法、装置、计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112948508A (zh) | 2021-06-11 |
WO2022217711A1 (zh) | 2022-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112948508B (zh) | 基于多层关联知识图谱的信息预测方法、装置、设备及介质 | |
Shabbir et al. | Satellite and scene image classification based on transfer learning and fine tuning of ResNet50 | |
Matthé et al. | Comparison of photo‐matching algorithms commonly used for photographic capture–recapture studies | |
Jiang et al. | Focal-test-based spatial decision tree learning | |
Dogan et al. | Automated accurate fire detection system using ensemble pretrained residual network | |
Hanmandlu et al. | Content-based image retrieval by information theoretic measure | |
Kadam et al. | [Retracted] Efficient Approach towards Detection and Identification of Copy Move and Image Splicing Forgeries Using Mask R‐CNN with MobileNet V1 | |
CN113283446B (zh) | 图像中目标物识别方法、装置、电子设备及存储介质 | |
US20210004648A1 (en) | Computer Vision Systems and Methods for Blind Localization of Image Forgery | |
Meng et al. | Tongue images classification based on constrained high dispersal network | |
CN113449725B (zh) | 对象分类方法、装置、设备及存储介质 | |
US7773800B2 (en) | Attrasoft image retrieval | |
CN112529429B (zh) | 客户信息校验方法、装置、计算机设备及存储介质 | |
CN112163637B (zh) | 基于非平衡数据的图像分类模型训练方法、装置 | |
CN110825968A (zh) | 信息推送方法、装置、存储介质和计算机设备 | |
CN110969143A (zh) | 基于图像识别的取证方法、系统、计算机设备及存储介质 | |
Li et al. | Example-based image colorization via automatic feature selection and fusion | |
Silvestre et al. | Feature selection for clustering categorical data with an embedded modelling approach | |
Siddalingappa et al. | Anomaly detection on medical images using autoencoder and convolutional neural network | |
CN112016617A (zh) | 细粒度分类方法、装置及计算机可读存储介质 | |
Mitrakis et al. | Burned area mapping in Mediterranean environment using medium-resolution multi-spectral data and a neuro-fuzzy classifier | |
Sun et al. | Deep perceptual hash based on hash center for image copyright protection | |
Mariappan et al. | Adaptive partitioning‐based copy‐move image forgery detection using optimal enabled deep neuro‐fuzzy network | |
CN110135428A (zh) | 图像分割处理方法和装置 | |
EP4174738B1 (en) | Systems and methods for protecting trainable model validation datasets |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |