CN114169466B - 图数据处理、文章分类、流量预测方法、装置、设备及存储介质 - Google Patents

图数据处理、文章分类、流量预测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114169466B
CN114169466B CN202111599277.7A CN202111599277A CN114169466B CN 114169466 B CN114169466 B CN 114169466B CN 202111599277 A CN202111599277 A CN 202111599277A CN 114169466 B CN114169466 B CN 114169466B
Authority
CN
China
Prior art keywords
node
nodes
topological graph
value
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111599277.7A
Other languages
English (en)
Other versions
CN114169466A (zh
Inventor
赵宏宇
赵国庆
蒋宁
王洪斌
吴海英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mashang Xiaofei Finance Co Ltd
Original Assignee
Mashang Xiaofei Finance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mashang Xiaofei Finance Co Ltd filed Critical Mashang Xiaofei Finance Co Ltd
Priority to CN202111599277.7A priority Critical patent/CN114169466B/zh
Publication of CN114169466A publication Critical patent/CN114169466A/zh
Application granted granted Critical
Publication of CN114169466B publication Critical patent/CN114169466B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种图数据处理、文章分类、流量预测方法、装置、设备及存储介质,图数据处理方法包括:获取拓扑图,所述拓扑图中至少一个节点的类型未知,所述拓扑图中部分节点的类型已知;确定所述拓扑图中各节点的特征值,所述特征值基于相应节点的自身特征确定;确定所述拓扑图中各节点的结构值,所述结构值基于相应节点与其它节点的引用关系确定;根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述至少一个节点的属性。基于节点的自身特征以及结构特征计算出的节点的得分,能够对节点属性进行更加精准的表征,从而计算出的各节点之间的相似度,即权重也能够更加精准,进而精准确认未知类型的节点的属性。

Description

图数据处理、文章分类、流量预测方法、装置、设备及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种图数据处理、文章分类、流量预测方法、装置、设备及存储介质。
背景技术
在深度学习中,对于图数据处理,图神经网络效果显著。图神经网络当前主要有三个经典模型,分别是:图卷积网络(Graph Convolution Network,GCN)、GraphSage算法和图注意力网络(Graph Attention Networks,GAT)。而GAT是三个模型中对于图数据的处理效果是最好的。
在实际应用中,通过GAT能够实现对文章分类或者车流量预测等。然而,经过大量实践发现,其精准程度并不高。
发明内容
本申请实施例的目的是提供一种图数据处理、文章分类、流量预测方法、装置、设备及存储介质,能够精准确认未知类型的节点的属性。
为解决上述技术问题,本申请实施例提供如下技术方案:
本申请第一方面提供一种图数据处理方法,所述方法包括:获取拓扑图,所述拓扑图中至少一个节点的类型未知,所述拓扑图中部分节点的类型已知;确定所述拓扑图中各节点的特征值,所述特征值基于相应节点的自身特征确定;确定所述拓扑图中各节点的结构值,所述结构值基于相应节点与其它节点的引用关系确定;根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述至少一个节点的属性。
本申请第二方面提供一种文章分类方法,所述方法包括:获取拓扑图,所述拓扑图中的节点指示文章,所述拓扑图中的边指示各文章之间的关系,所述拓扑图中至少一个节点的文章类型未知;确定所述拓扑图中各节点的特征值,所述特征值基于相应节点中文章所包含的词语集合确定;确定所述拓扑图中各节点的结构值,所述结构值基于相应节点与其它节点的引用关系确定;根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述类型未知的节点的文章类型。
本申请第三方面提供一种车流量预测方法,所述方法包括:获取拓扑图,所述拓扑图中的节点指示交通网络中的道路,所述拓扑图中的边指示交通网络中各道路之间的连接关系,所述拓扑图中至少一个节点对应的车流量未知;确定所述拓扑图中各节点的特征值,所述特征值基于相应节点对应的车流量大小确定;确定所述拓扑图中各节点的结构值,所述结构值基于相应节点对应的道路类型确定;根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述车流量未知的节点的车流量。
本申请第四方面提供一种图数据处理装置,所述装置包括:获取模块,用于获取拓扑图,所述拓扑图中至少一个节点的类型未知,所述拓扑图中部分节点的类型已知;特征确定模块,用于确定所述拓扑图中各节点的特征值,所述特征值基于相应节点的自身特征确定;结构确定模块,用于确定所述拓扑图中各节点的结构值,所述结构值基于相应节点与其它节点的引用关系确定;预测模块,用于根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述至少一个节点的类型。
本申请第五方面提供一种文章分类装置,所述装置包括:获取模块,用于获取拓扑图,所述拓扑图中的节点指示文章,所述拓扑图中的边指示各文章之间的关系,所述拓扑图中至少一个节点的文章类型未知,所述拓扑图中部分节点的文章类型已知;特征确定模块,用于确定所述拓扑图中各节点的特征值,所述特征值基于相应节点中文章所包含的词语集合确定;结构确定模块,用于确定所述拓扑图中各节点的结构值,所述结构值基于相应节点与其它节点的引用关系确定;预测模块,用于根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述类型未知的节点的文章类型。
本申请第六方面提供一种车流量预测装置,所述装置包括:获取模块,用于获取拓扑图,所述拓扑图中的节点指示交通网络中的道路,所述拓扑图中的边指示交通网络中各道路之间的连接关系,所述拓扑图中至少一个节点对应的车流量未知;特征确定模块,用于确定所述拓扑图中各节点的特征值,所述特征值基于相应节点对应的车流量大小确定;结构确定模块,用于确定所述拓扑图中各节点的结构值,所述结构值基于相应节点对应的道路类型确定;预测模块,用于根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述车流量未知的节点的车流量。
本申请第七方面提供一种电子设备,包括:处理器、存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行第一方面,第二方面,或者第三方面中的方法。
本申请第八方面提供一种计算机可读存储介质,包括:存储的程序;其中,在所述程序运行时控制所述存储介质所在设备执行第一方面,第二方面,或者第三方面中的方法。
相较于现有技术,本申请第一方面提供的图数据处理方法,在获取拓扑图后,基于相应节点的自身特征确定拓扑图中各节点的特征值,以及基于相应节点与其它节点的引用关系确定拓扑图中各节点的结构值,然后根据各节点的特征值、各节点的结构值以及拓扑图确定至节点的属性。这样,在确定某一节点的属性时,除了基于各节点的自身特征之外,还结合了各节点之间的结构特征。基于节点的自身特征以及结构特征计算出的节点的得分,能够对节点属性进行更加精准的表征,从而计算出的各节点之间的相似度,即权重也能够更加精准,进而精准确认未知类型的节点的属性。
相较于现有技术,本申请第二方面提供的文章分类方法,在获取到文章的拓扑图后,基于相应节点中文章所包含的词语集合确定拓扑图中各节点的特征值,以及基于相应节点与其它节点的引用关系确定拓扑图中各节点的结构值,然后根据各节点的特征值、各节点的结构值以及拓扑图确定类型未知的节点的文章类型。这样,在确定某一文章节点的类型时,除了基于各文章节点的自身特征之外,还结合了各文章节点之间的结构特征。基于文章的自身特征以及结构特征计算出的文章节点的得分,能够对文章节点进行更加精准的表征,从而计算出的各文章节点之间的相似度,即权重也能够更加精准,进而实现对文章的精准分类。
相较于现有技术,本申请第三方面提供的车流量预测方法,在获取到交通网络中各道路的拓扑图后,基于相应节点对应的车流量大小确定拓扑图中各节点的特征值,以及基于相应节点对应的道路类型确定拓扑图中各节点的结构值,然后根据各节点的特征值、各节点的结构值以及拓扑图确定车流量未知的节点的车流量。这样,在确定某一道路节点的车流量时,除了基于各道路节点的自身特征之外,还结合了各道路节点之间的结构特征。基于道路节点的自身特征以及结构特征计算出的道路节点的得分,能够对道路节点进行更加精准的表征,从而计算出的各道路节点之间的相似度,即权重也能够更加精准,进而实现对道路车流量的精准预测。
本申请第四方面提供的图数据处理装置、第五方面提供的文章分类装置、第六方面提供的车流量预测装置、第七方面提供的电子设备、第八方面提供的计算机可读存储介质,与第一方面提供的图数据处理装置、第二方面提供的文章分类方法、第三方面提供的车流量预测方法具有相同或相似的有益效果。
附图说明
通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本申请的若干实施方式,相同或对应的标号表示相同或对应的部分,其中:
图1为本申请实施例中图数据处理方法的架构示意图;
图2为本申请实施例中图数据处理方法的流程示意图一;
图3为本申请实施例中各节点聚合的过程示意图一;
图4为本申请实施例中各节点聚合的过程示意图二;
图5为本申请实施例中图数据处理方法的流程示意图二;
图6为本申请实施例中拓扑图的示意图一;
图7为本申请实施例中拓扑图的示意图二;
图8为本申请实施例中文章分类方法的流程示意图;
图9为本申请实施例中车流量预测方法的流程示意图;
图10为本申请实施例中拓扑图的示意图三;
图11为本申请实施例中拓扑图的示意图四;
图12为本申请实施例中图数据处理装置的结构示意图;
图13为本申请实施例中文章分类装置的结构示意图;
图14为本申请实施例中车流量预测装置的结构示意图;
图15为本申请实施例中电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施方式。虽然附图中显示了本申请的示例性实施方式,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本申请所属领域技术人员所理解的通常意义。
目前,采用图注意力网络GAT模型确定未知节点的属性,其精准程度仍然不高的问题。
发明人经过研究发现,采用GAT模型确定未知节点的属性精准度不高的原因在于:GAT模型是通过注意力(Attention)机制,基于各节点的权重,来对邻居节点做聚合操作,从而确定未知类型的节点属性。而在各节点权重的计算上,依赖于节点的自身特征,而忽略了各节点之间的结构特征。这样,仅基于各节点的自身特征确定各节点之间的相似度,进而计算出的各节点的权重就不够精准。
有鉴于此,本申请实施例提供了一种图数据处理方法,在确定某一节点的属性时,除了基于各节点的自身特征之外,还结合了各节点之间的结构特征。这样,基于节点的自身特征以及结构特征计算出的节点的得分,能够对节点属性进行更加精准的表征,从而计算出的各节点之间的相似度,即权重也能够更加精准,进而精准确认未知类型的节点的属性。
图1为本申请实施例中图数据处理方法的架构示意图,参见图1所示。
在实际应用中,拓扑图中的节点可以是指文章,那么,最终判断的可以是拓扑图中某一类型未知的文章的具体类型。拓扑图中的节点也可以是指路段,那么,最终判断的可以是拓扑图中某一车流量未知的路段的具体车流量。当然,拓扑图中的节点还可以是其它具体的事物。此处不做限定。
在拓扑图中,至少可以包括:节点A、节点B和节点C。其中,节点A为中心节点,节点B和节点C分别为节点A的相邻节点。节点A对应的属性未知,节点B和节点C对应的属性已知。此时,需要将节点B和节点C聚合到节点A上(也就是特征聚合,即卷积计算)。从而将聚合后的节点A输入到分类器中,以确定节点A对应的属性。
在将节点B和节点C聚合到节点A的过程中,需要基于节点B与节点A的相似度b,以及节点C与节点A的相似度c,确定节点B的权重b,以及节点C的权重c。进而使得节点B结合权重b,以及节点C结合权重c,聚合于节点A上。
在确定节点B与节点A的相似度b,以及节点C与节点A的相似度c的过程中,就需要采用本申请实施例提供的图数据处理方法,即不仅考虑节点A、B、C的自身特征,即特征重要性分数za、zb、zc,还考虑节点A、B、C之间的结构特征,即结构重要性分数sa、sb、sc。进而结合各节点的自身特征和结构特征分别对各节点进行打分。这样,基于各节点的打分得到的各节点的权重才能够更加精准地表征各节点之间的相关程度,再基于各节点的权重进行各节点的聚合,从而将聚合后的节点通过分类器进行分类,能够更加精准地对未知属性的进行分类,提高了节点属性预测的精准度。
接下来,详细对本申请实施例提供的图数据处理方法进行说明。
图2为本申请实施例中图数据处理方法的流程示意图一,参见图2所示,该方法可以包括:
S201:获取拓扑图,所述拓扑图中至少一个节点的属性未知。
所谓拓扑图,即拓扑结构图,是指由网络节点设备和通信介质构成的网络结构图。在该拓扑图中,至少存在一个节点,该至少一个节点对应的属性未知。
一般来说,在拓扑图中都会存在一个中心节点。而中心节点会与拓扑图中的一些节点(也称之为相邻节点)存在连接关系。并且都是从相邻节点指向中心节点的。
这样,将属性已知的各相邻节点都聚合到属性未知的中心节点,进行将聚合后的中心节点代入到分类器,通过分类器就能够获知该中心节点的属性了。也就是说,依据各相邻节点的属性及其所占的权重,确定中心节点的属性。
S202:确定所述拓扑图中各节点的特征值,所述特征值基于相应节点的自身特征确定。
在获取到拓扑图后,针对拓扑图中的每个节点,都需要确定该节点对应的特征值。在得到每个节点的特征值后,将这些特征值组合在一起,就得到了拓扑图中各节点的特征重要性分数向量,即[Fi、Fj、……、Fz]。其中,F表示节点的特征重要性分数,i、j、……、z表示各节点的编号。
在确定每一个节点的特征值的过程中,都是根据节点对应的自身特征得到的,即得到一个特征值。
S203:确定所述拓扑图中各节点的结构值,所述结构值基于相应节点与其它节点的引用关系确定。
在获取到拓扑图后,针对拓扑图中的每个节点,都需要确定该节点对应的结构值。所谓结构值,是基于该节点与其它节点之间的连接关系得到的一个数值。
在得到每个节点的结构值后,将这些结构值组合在一起,就得到了拓扑图中各节点的结构重要性分数向量,即[Si、Sj、……、Sz]。其中,S表示节点的特征重要性分数,i、j、……、z表示各节点的编号。
S204:根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述至少一个节点的属性。
在确定了拓扑图中各节点的特征值和结构值后,对于每一个节点,综合考虑其特征值和结构值,进而与相邻的节点进行相似度对比,就能够得到该节点的权重。每个节点依此操作,就能够得到拓扑图中各节点的权重。从而再结合拓扑图中各节点的自身特征,就能够对拓扑图中的节点进行聚合。最终通过分类器对聚合后的节点进行处理,就能够得到未知的节点的属性。
图3为本申请实施例中各节点聚合的过程示意图一,参见图3所示,在获得拓扑图后,从三个方面对拓扑图进行处理。第一方面,根据拓扑图中各节点的自身特征,确定各节点的特征值,即节点的特征重要性分数向量。第二方面,根据拓扑图中各节点的连接关系,确定各节点的结构值,即节点的结构重要性分数向量。然后,结合第一方面中得到的节点的特征重要性分数向量,得到各节点的权重。第三方面,从拓扑图中获取各节点的特征。最后,结合各节点的权重和各节点的特征,进行节点的聚合。进而通过分类器对聚合后的节点进行处理,获得未知属性的节点对应的属性。
在对拓扑图中各节点进行聚合的过程中,在将相邻的属性已知的节点聚合到中心的属性未知的节点上时,不仅考虑相邻的属性已知的节点与中心的属性未知的节点之间相似程度,还考虑中心的属性未知的节点与自身的相似程度。
图4为本申请实施例中各节点聚合的过程示意图二,参见图4所示,对于中心的属性未知的节点h1,通过其与自身的相似程度确定节点h1的权重为a11。对于相邻的属性已知的节点h2,通过其与节点h1的相似程度确定节点h2的权重为a12。以此类推,对于相邻的属性已知的节点h6,通过其与节点h1的相似程度确定节点h6的权重为a16。进而,通过节点乘以相应的权重,就实现了各节点的聚合,即得到了节点h′1。h5
由上述内容可知,本申请实施例提供的图数据处理方法,在获取拓扑图后,基于相应节点的自身特征确定拓扑图中各节点的特征值,以及基于相应节点与其它节点的引用关系确定拓扑图中各节点的结构值,然后根据各节点的特征值、各节点的结构值以及拓扑图确定至节点的属性。这样,在确定某一节点的属性时,除了基于各节点的自身特征之外,还结合了各节点之间的结构特征。基于节点的自身特征以及结构特征计算出的节点的得分,能够对节点属性进行更加精准的表征,从而计算出的各节点之间的相似度,即权重也能够更加精准,进而精准确认未知类型的节点的属性。
进一步地,作为对图2所示方法的细化和扩展,本申请实施例还提供了一种图数据处理方法。图5为本申请实施例中图数据处理方法的流程示意图二,参见图5所示,该方法可以包括:
S501:获取拓扑图。
步骤S501与上述步骤S201的具体实施方式相同,此处不再赘述。
S502:对各节点对应的内容进行降维处理,得到降维后的各节点。
由于每个节点中包含的内容可能较多,而在这些大量的内容中,有一些内容由于存在重复或者出现频率不高,对于节点自身特征的确定的用处并不大,若将这些大量的内容都作为确定节点特征值的判断依据,无形之中就会加大节点特征值的计算量,进而降低图数据处理的效率。
因此,在基于各节点的内容确定相应的特征值之前,先对节点进行降维处理,得到降维后的各节点。降维后的节点中的内容所有减少。这样,通过少量的内容就能够计算出拓扑图中各节点分别对应的特征值,提高了节点特征值的获取效率,进而提高了图数据的处理效率。
在对拓扑图中各节点进行降维的过程中,可以通过以下公式(1)进行:
H(l)=X(l)W0 (l) 公式(1)
其中,
Figure BDA0003431235470000071
X(l)表示拓扑图中各节点。W0 (l)∈RC×F,表示训练参数。H(l)表示降维后的各节点,为节点的隐状态。V表示节点的数量,C表示输入的节点的特征维度,F表示输出的节点的特征维度,R表示元素,l表示层数。实质上,公式(1)就是对输入的数据进行了线性变换。
S503:确定降维后的各节点在第一方向上的第一特征值以及在第二方向上的第二特征值。
也就是说,确定第i个节点在第一方向上的第一特征值和在第二方向上的第二特征值。其中,i∈N,N表示拓扑图中所有节点的数量。
所谓第一方向,是指拓扑图的邻接矩阵的原始方向。所谓第二方向,是指拓扑图的邻接矩阵的转置方向。
在确定各节点的特征值时,也需要使用到训练参数。由于训练参数的不稳定性,若只基于训练参数得出一个特征值,则会降低节点自身特征确定的准确性。因此,需要基于训练参数从第一方向和第二方向上分别确定出能够表征节点自身特征的两个特征值,即第一特征值和第二特征值。这样的特征值才能够更加准确地对节点的自身特征进行表征,进而提高图数据处理的准确性。
这里的第一方向和第二方向,实际上指的就是基于训练参数从两个不同的方向上分别获取节点的特征值,即第一特征值和第二特征值。一般来说,第一特征值和第二特征值都是相等的,但是也存在第一特征值和第二特征值不等的情况。这需要根据实际的计算结果确定。
在计算节点的第一特征值和第二特征值的过程中,可以通过以下公式(2)、(3)进行:
F1 (l)=H(l)W1 (l) 公式(2)
F2 (l)=H(l)W2 (l) 公式(3)
其中,F1 (l)∈RV×1,表示节点的第一特征值,即节点特征重要性分数向量。F2 (l)∈RV ×1,表示节点的第二特征值,也即节点特征重要性分数向量。H(l)表示降维后的各节点,为节点的隐状态。W1 (l)∈RF×1、W2 (l)∈RF×1,均表示训练参数。l表示层数,V表示节点的数量,F表示输出的节点的特征维度,R表示元素。
以节点表示文章为例,图6为本申请实施例中拓扑图的示意图一,参见图6所示,在拓扑图中,包含有三个文章节点D1、D2、D3。各文章节点经过降维处理后,文章节点D1包括词语:实体识别、CNN、多层网络、激活函数。文章节点D2包括词语:三元组、实体识别、实体抽取、关系抽取。文章节点D3包括词语:激活函数、全连接网络、CNN、多层网络。
通过整理,文章节点D1、D2、D3可以采用下表1表示:
表1
Figure BDA0003431235470000081
这样,文章节点D1就可以通过[1,1,1,1,0,0,0,0,0]表示,文章节点D2就可以通过[0,0,0,0,0,1,1,1,1]表示,文章节点D3就可以通过[0,1,1,1,1,0,0,0,0]表示。进而基于文章节点D1的表示[1,1,1,1,0,0,0,0,0]计算出文章节点D1在第一方向的第一特征值a1以及在第二方向的第二特征值b1,基于文章节点D2的表示[0,0,0,0,0,1,1,1,1]计算出文章节点D2在第一方向的第一特征值a2以及在第二方向的第二特征值b2,基于文章节点D3的表示[0,1,1,1,1,0,0,0,0]计算出文章节点D3在第一方向的第一特征值a3以及在第二方向的第二特征值b3。这样,经过整合后,就得到了文章节点D1、D2、D3在第一方向的第一特征值[a1、a2、a3],以及在第二方向的第二特征值[b1、b2、b3]。
S504:确定降维后的各节点在第一方向上的第一结构值以及在第二方向上的第二结构值。
也就是说,确定第i个节点在第一方向上的第一结构值和在第二方向上的第二结构值。其中,i∈N,N表示拓扑图中所有节点的数量。
在确定各节点的结构值时,也需要使用到训练参数。由于训练参数的不稳定性,若只基于训练参数得出一个结构值,则会降低节点自身结构确定的准确性。因此,需要基于训练参数从第一方向和第二方向上分别确定出能够表征节点自身结构的两个结构值,即第一结构值和第二结构值。这样的结构值才能够更加准确地对节点的自身结构进行表征,进而提高图数据处理的准确性。并且,在对节点进行聚合时,充分考虑了节点之间的结构信息,提高了各节点聚合的准确性,进而提高图数据处理的准确性。
这里的第一方向和第二方向,实际上指的就是基于训练参数从两个不同的方向上分别获取节点的结构值,即第一结构值和第二结构值。一般来说,第一结构值和第二结构值都是相等的,但是也存在第一结构值和第二结构值不等的情况。这需要根据实际的计算结果确定。
在计算节点的第一结构值和第二结构值的过程中,可以通过以下公式(4)、(5)进行:
S1 (l)=exp(softmax(tanh(AW3 (l)))) 公式(4)
S2 (l)=exp(softmax(tanh(AW4 (l)))) 公式(5)
其中,S1 (l)∈RV×1,表示节点的第一结构值,即节点结构重要性分数向量。S2 (l)∈RV ×1,表示节点的第二结构值,也即节点结构重要性分数向量。W3 (l)∈RV×1、W4 (l)∈RV×1,均表示训练参数。A表示拓扑图的邻接矩阵,也就是各节点之间的连接/引用关系。l表示层数,V表示文章节点的数量,R表示元素。exp表示以e为底的指数函数,softmax表示归一化指数函数,tanh表示双曲正切函数。
以节点表示文章为例,图7为本申请实施例中拓扑图的示意图二,参见图7所示,在拓扑图中,包含有三个文章节点D1、D2、D3。文章节点D1的类型为期刊论文(此时类型未知),其引用了3篇文章。文章节点D2的类型为毕业论文(此时类型已知),其引用了5篇文章。文章节点D3的类型为期刊论文(此时类型已知),其引用了3篇文章。
这样,文章节点D1的引用数量为3,文章节点D2的引用数量为5,文章节点D3的引用数量为3。进而可以根据文章节点的引用数量,得到文章节点D1、D2、D3在第一方向的第一结构值[c1、c2、c3],以及在第二方向的第二结构值[d1、d2、d3]。
当然,还可以通过除公式(4)、(5)外的其它方式获取节点的结构值,例如:直接将节点的引用数量作为其结构值。对于确定节点结构值的具体方式,此处不做限定。
S505:根据第i个节点的第一特征值和第一结构值确定第i个节点在第一方向上的第一得分,以及,根据第i个节点的第二特征值和第二结构值确定第i个节点在第二方向上的第二得分。
其中,i∈N,N表示拓扑图中所有节点的数量。
在获得了拓扑图中所有节点的第一特征值、第二特征值、第一结构值,第二结构值后,为了得到各节点的数字表征,需要对各节点进行打分。进而基于各节点打分后的得分确定各节点之间的相似程度,进而确定各节点相对于相邻节点的权重,进而对各节点进行聚合,以确定某一节点的属性。
由于在第一方向和第二方向上都获得了特征值和结构值,因此,需要分别在第一方向和第二方向上分别计算出各文章节点的得分。
具体的,可以将第i个节点的第一特征值与第一结构值相乘,这样就得到了第i个节点在第一方向上的第一得分。依次类推,就能够得到所有节点在第一方向上的第一得分,以及所有节点在第二方向上的第二得分。
也就是说,所有节点的第一特征值就构成了第一特征向量,所有节点第二特征值就构成了第二特征向量,所有节点的第一结构值就构成了第一结构向量,所有节点第二结构值就构成了第二结构向量。进而,将第一特征向量与第一结构向量进行元素相乘,就得到了所有节点分别对应的第一得分。以及,将第二特征向量与第二结构向量进行元素相乘,就得到了所有节点分别对应的第二得分。
具体的,可以通过以下公式(6)、(7)进行:
Figure BDA0003431235470000101
Figure BDA0003431235470000102
其中,
Figure BDA0003431235470000103
表示节点的第一得分,/>
Figure BDA0003431235470000104
表示节点的第二得分,F1 (l)表示节点的第一特征值,F2 (l),表示节点的第二特征值,/>
Figure BDA0003431235470000111
表示节点的第一结构值,/>
Figure BDA0003431235470000112
表示节点的第二结构值,l表示层数,/>
Figure BDA0003431235470000113
表示元素相乘。
举例来说,假设节点D1、D2、D3在第一方向的第一特征值为[a1、a2、a3],以及在第二方向的第二特征值为[b1、b2、b3]。节点D1、D2、D3在第一方向的第一结构值为[c1、c2、c3],以及在第二方向的第二结构值为[d1、d2、d3]。那么,节点D1、D2、D3在第一方向的第一得分为[a1×c1、a2×c2、a3×c3],以及在第二方向的第二得分为[b1×d1、b2×d2、b3×d3]。
当然,还可以通过除公式(6)、(7)外的其它方式合并节点的特征值和结构值,例如:将节点的特征值与结构值相加。对于合并节点的特征值和结构值的具体方式,此处不做限定。
S506:将各节点的第一得分和第二得分赋值到拓扑图的邻接矩阵中。
由于在确定拓扑图中某一属性未知的节点的属性的过程中,需要将拓扑图中所有的节点按照引用关系逐渐进行聚合,而在节点的聚合过程中,需要根据拓扑图中各节点的得分以及各节点之间的引用关系,因此,需要将各节点的第一得分和第二得分赋值到拓扑图的邻接矩阵中,以便基于赋值后的邻接矩阵计算节点之间的相似程度,进而基于聚合后的节点确定属性未知的节点的具体属性。
具体来说,步骤S506可以包括:
步骤A1:从拓扑图中获取邻接矩阵;
步骤A2:将所有节点的第一得分与邻接矩阵的每一行中的元素对应相乘,得到所有节点分别对应的第一评分;
步骤A3:将所有节点的第二得分与邻接矩阵的每一列中的元素对应相乘,得到所有节点分别对应的第二评分。
步骤A4:将所有节点分别对应的第一得分和第二得分赋值到拓扑图的邻接矩阵中。
其中,步骤A2与步骤A3的执行顺序不分先后。
具体的,为邻接矩阵赋值时,可以通过以下公式(8)、(9)进行:
Figure BDA0003431235470000114
Figure BDA0003431235470000115
其中,
Figure BDA0003431235470000116
表示赋值第一得分后的邻接矩阵,/>
Figure BDA0003431235470000117
表示赋值第二得分后的邻接矩阵,
Figure BDA0003431235470000121
表示节点的第一得分,/>
Figure BDA0003431235470000122
表示节点的第二得分,l表示层数。A表示拓扑图的邻接矩阵,即表示拓扑图中各节点的连接关系。在通常情况下,A为非对称矩阵。
举例来说,仍参见图7所示,该拓扑图对应的邻接矩阵可以是
Figure BDA0003431235470000123
在这里,邻接矩阵的每一行依次对应文章节点D1、D2、D3,邻接矩阵的每一列依次对应文章节点D1、D2、D3。由于文章节点D2与D3之间并无引用关系,所以邻接矩阵中相应的元素为0。
此时,将文章节点的第一得分[a1×c1、a2×c2、a3×c3]赋值到上述邻接矩阵中,就能够得到
Figure BDA0003431235470000124
将文章节点的第二得分[b1×d1、b2×d2、b3×d3]赋值到上述邻接矩阵中,就能够得到/>
Figure BDA0003431235470000125
这里需要注意的是,将文章节点的第二得分[b1×d1、b2×d2、b3×d3]赋值到上述邻接矩阵中时,文章节点的第二得分[b1×d1、b2×d2、b3×d3]是转置后的,即
Figure BDA0003431235470000126
也就是说,将各文章节点分别对应的第一得分与邻接矩阵的每一行中的元素对应相乘,得到各文章节点分别对应的第一评分;将各文章节点分别对应的第二得分与邻接矩阵的每一列中的元素对应相乘,得到各文章节点分别对应的第二评分。
当然,还可以通过除公式(8)、(9)外的其它方式将节点的第一得分和第二得分赋值到邻接矩阵中,例如:直接将节点的第一得分与第二得分相加后,将相加后的得分赋值到邻接矩阵对应的元素上。对于为邻接矩阵赋值的具体方式,此处不做限定。
S507:对于每个节点,将其对应的第一评分和第二评分对应相加,得到各节点分别对应的总评分。
也就是说,在得到基于第一得分赋值后的邻接矩阵,以及基于第二得分赋值后的邻接后,就可以将这两个邻接矩阵中的元素分别对应相加。这样,相加后的邻接矩阵中的每一个元素都能够表征其对应的两个节点之间的相似程度。
继续上述举例,将基于第一得分得到的邻接矩阵
Figure BDA0003431235470000131
与基于第二得分得到的邻接矩阵/>
Figure BDA0003431235470000132
中对应的元素相加,就得到了
Figure BDA0003431235470000133
即各文章节点分别对应的总评分。
具体的,为邻接矩阵赋值时,可以通过以下公式(10)进行:
Figure BDA0003431235470000134
其中,E(l)表示各节点之间的相似程度,
Figure BDA0003431235470000135
表示赋值第一得分后的邻接矩阵,/>
Figure BDA0003431235470000136
表示赋值第二得分后的邻接矩阵,l表示层数,LeakyReLU表示激活函数。
当然,还可以将两个邻接矩阵中的相应元素分别相乘,得到各节点分别对应的总评分。对于获得各节点分别对应的总评分的具体方式,此处不做限定。
S508:根据各节点分别对应的总评分以及拓扑图确定属性未知的节点的属性。
在得到了能够表征各节点之间的相似程度的邻接矩阵后,就能够获得各节点之间的相似程度。进而就能够获得某一节点相对于其相邻的节点的权重,从而基于各节点的权重进行节点的聚合,进而基于聚合后的节点以及节点中已知的属性,通过分类器,就能够确定未知属性的节点的具体属性。
假设
Figure BDA0003431235470000137
表示节点i与节点j的相似程度。而节点i的自身特征和结构与节点j越相似,那么,/>
Figure BDA0003431235470000138
的值就越大。
接着,对
Figure BDA0003431235470000139
进行归一化,就能够得到节点i相对于节点j,或者节点j相对于节点i的权重。即以下公式(11):
Figure BDA0003431235470000141
其中,
Figure BDA0003431235470000142
表示节点i相对于节点j,或者节点j相对于节点i的权重。/>
Figure BDA0003431235470000143
表示节点i与节点j的相似程度。l表示层数,k表示拓扑图中所有的节点,exp表示以e为底的指数函数。
通过归一化后得到的权重,权重值不会过大,一般位于0-1或者0-10之间,这样便于节点聚合的计算,进而能够提高图数据处理的效率。
再接着,就可以基于各节点的权重,对各相邻的节点进行聚合,从而更新中心的节点。即以下公式(12):
Figure BDA0003431235470000144
其中,
Figure BDA0003431235470000145
表示更新后的节点i,即l+1层的节点i的特征。l表示层数。/>
Figure BDA0003431235470000146
表示节点i相对于节点j,或者节点j相对于节点i的权重。/>
Figure BDA0003431235470000147
表示更新前的节点j。N(i)表示节点i的邻域节点集合。σ表示激活函数,一般默认为ELU函数。实质上,公式(12)就是对中心节点的所有相邻节点进行加权求和。
最终,将属性已知的节点就都聚合到属性未知的中心节点上了,进而将最终聚合完成的节点通过分类器,根据分类器的输出结果,就能够确定属性未知的节点对应的具体属性了。
最后,通过一组对比实验,说明本申请实施例提供的图数据处理方法在确定拓扑图中节点属性精确度上的优势。
通过经典公开数据集Cora、Citeseer、Pubmed验证申请实施例中图数据处理方法的高精准度。该公开数据集是经典的文章引用网络数据集,其目标是根据引用关系预测文章的类别。具体的实验结果如下:每个方法运行100次。评价指标为准确度。实验中采用的是GAT,其使用稀疏矩阵的源码版本(https://github.com/PetarV-/GAT)。本申请实施例在实验中也使用了基于稀疏矩阵的实现方式。下表2为各种图数据处理方法通过实验后的各项指标。
表2
Figure BDA0003431235470000148
Figure BDA0003431235470000151
实验表明,本申请实施例提供的图数据处理方法方法能够在一定程度上提高拓扑图中节点属性的精准度。
基于同一发明构思,本申请实施例还提供了一种文章分类方法,图8为本申请实施例中文章分类方法的流程示意图,参见图8所示,该方法可以包括:
S801:获取拓扑图。
在该拓扑图中,每一个节点表示一篇文章。这里的文章为包括各种文体的著作、作品。例如:诗歌、戏剧、小说、科学论文、记叙文、议论文、说明文、应用文等等。边表示文章之间的引用关系。
S802:确定拓扑图中各节点的特征值,特征值基于相应节点中文章所包含的词语集合确定。
针对拓扑图中的每个文章节点,都需要确定该文章节点对应的特征值,即基于文章的内容得到的一个数值。
在确定每一个文章节点的特征值的过程中,都是根据节点中文章所包含的词语集合对该节点进行打分的,即得到一个特征值。具体的,可以根据文章中词汇的丰富程度、文章中同一词汇的出现频率等确定对应文章节点的特征值。当然,还可以根据文章中的其它维度的特征确定对应文章节点的特征值。对于确定特征值时所依据的文章的具体内容,此处不做限定。
S803:确定拓扑图中各节点的结构值,结构值基于相应节点与其它节点的引用关系确定。
针对拓扑图中的每个文章节点,都需要确定该文章节点对应的结构值,即基于文章的引用关系得到的一个数值,可以是该文章引用了多少篇文章或者被多少篇文章引用,换句话说,就是该文章节点与多少个其它文章节点相连。
S804:根据各节点的特征值、各节点的结构值以及拓扑图确定类型未知的节点的文章类型。
在确定了拓扑图中各文章节点的特征值和结构值后,对于每一个文章节点,综合考虑其特征值和结构值,进而与相邻的文章节点进行相似度对比,就能够得到该文章节点的权重。每个文章节点依此操作,就能够得到拓扑图中各文章节点的权重。从而再结合拓扑图中各文章节点的自身特征,就能够对拓扑图中的文章节点进行聚合。最终通过分类器对聚合后的文章节点进行处理,就能够得到未知类型的文章节点对应的文章类型了。
由上述内容可知,本申请实施例提供的文章分类方法,在获取到文章的拓扑图后,基于相应节点中文章所包含的词语集合确定拓扑图中各节点的特征值,以及基于相应节点与其它节点的引用关系确定拓扑图中各节点的结构值,然后根据各节点的特征值、各节点的结构值以及拓扑图确定类型未知的节点的文章类型。这样,在确定某一文章节点的类型时,除了基于各文章节点的自身特征之外,还结合了各文章节点之间的结构特征。基于文章的自身特征以及结构特征计算出的文章节点的得分,能够对文章节点进行更加精准的表征,从而计算出的各文章节点之间的相似度,即权重也能够更加精准,进而实现对文章的精准分类。
进一步地,作为对图8所示方法的细化和扩展,本申请实施例还提供了一种文章分类方法,该方法可以包括:
步骤B1:获取拓扑图。
步骤B2:将各节点对应的文章中出现频率小于预设频率的词语删除,并对相同的词语进行去重,得到降维后的各节点。
由于一篇文章中可能会包含有大量的词语,而在这些大量的词语中,出现次数较少的一些词语对于文章自身特征的确定的用处并不大,若将大量的词语都作为确定文章节点特征值的判断依据,无形之中就会加大文章节点特征值的计算量,进而降低文章分类的效率。
因此,在基于各文章节点的文章内容确定相应的特征值之前,先将文章节点对应的文章中出现频率小于预设频率的词语删除,并对相同的词语进行去重,得到降维后的各文章节点。降维后的文章节点中文章的词语数量所有减少。这样,通过少量的词语就能够计算出拓扑图中各文章节点分别对应的特征值,提高了文章节点特征值的获取效率,进而提高了文章的分类效率。
在具体实施过程中,预设频率可以根据实际情况确定。当对文章分类的效率要求较高时,可以将预设频率设置的大一些。当对文章分类的效率要求较低时,可以将预设频率设置的小一些。当然,还可以基于其它条件对预设频率进行设置。对于预设频率的具体数值,此处不做限定。
步骤B3:确定降维后的各文章节点在第一方向上的第一特征值以及在第二方向上的第二特征值。
步骤B4:确定降维后的各文章节点在第一方向上的第一结构值以及在第二方向上的第二结构值。
仍参见图8所示,在拓扑图中,包含有三个文章节点D1、D2、D3。文章节点D1的类型为期刊论文(此时类型未知),其引用了3篇文章。文章节点D2的类型为毕业论文(此时类型已知),其引用了5篇文章。文章节点D3的类型为期刊论文(此时类型已知),其引用了3篇文章。
这样,文章节点D1的引用数量为3,文章节点D2的引用数量为5,文章节点D3的引用数量为3。进而可以根据文章节点的引用数量,得到文章节点D1、D2、D3在第一方向的第一结构值[c1、c2、c3],以及在第二方向的第二结构值[d1、d2、d3]。
一般来说,期刊论文的文章引用数量大致在10-20篇,而毕业论文的文章引用数量大致在100-200篇,可见,两种类型的文章的结构是存在一定的差异的。因此,在确定文章类型时,充分考虑文章的结构,能够提高文章类型确定的准确性。
步骤B5:根据第i个节点的第一特征值和第一结构值确定第i个节点在第一方向上的第一得分,以及,根据第i个节点的第二特征值和第二结构值确定第i个节点在第二方向上的第二得分。
其中,i∈N,N表示拓扑图中所有节点的数量。
步骤B6:将各文章节点的第一得分和第二得分赋值到拓扑图的邻接矩阵中。
具体来说,步骤步骤B6可以包括:
步骤C1:从拓扑图中获取邻接矩阵;
步骤C2:将所有节点的第一得分与邻接矩阵的每一行中的元素对应相乘,得到所有节点分别对应的第一评分;
步骤C3:将所有节点的第二得分与邻接矩阵的每一列中的元素对应相乘,得到所有节点分别对应的第二评分。
步骤C4:将所有节点分别对应的第一得分和第二得分赋值到拓扑图的邻接矩阵中。
其中,步骤C2与步骤C3的执行顺序不分先后。
步骤B7:对于每个节点,将其对应的第一评分和第二评分对应相加,得到各节点分别对应的总评分。
步骤B8:根据各节点分别对应的总评分以及拓扑图确定类型未知的节点的文章类型。
最终,将类型已知的文章节点就都聚合到类型未知的中心文章节点上了,进而将最终聚合完成的文章节点通过分类器,根据分类器的输出结果,就能够确定类型未知的文章节点对应的文章类型了。
这里需要指出的是,以上文章分类方法实施例的描述,与上述图数据处理方法实施例的描述是类似的,具有同图数据处理方法实施例相似的有益效果。对于本申请文章分类方法实施例中未披露的技术细节,请参照本申请图数据处理方法实施例的描述而理解。
基于同一发明构思,本申请实施例还提供一种车流量预测方法,图9为本申请实施例中车流量预测方法的流程示意图,参见图9所示,该方法可以包括:
S901:获取拓扑图。
在该拓扑图中,每一个节点表示交通网络中每一条道路。边表示交通网络中各道路之间的连接关系。
这里需要说明的是,这里的节点可以是指交通网络中某一道路上某个观测点,也可以是指交通网络中某一整条道路。这需要根据最终需要预测的具体内容确定。当需要预测的是交通网络中某一道路上某一观测点的车流量时,节点就是指交通网络中某一道路上某个观测点。而当预测的是交通网络中某一道路上的平均车流量时,节点就是指交通网络中某一整条道路。
S902:确定拓扑图中各节点的特征值,特征值基于相应节点对应的车流量大小确定。
针对拓扑图中的每个节点,都需要确定该节点对应的特征值,即基于该节点对应的道路的车流量大小得到的一个数值。
在确定每一个节点的特征值的过程中,都是根据节点对应的道路的车流量大小得到的,即得到一个特征值。具体的,可以直接将道路中车流量的实际大小值作为特征值,也可以将道路中车流量的实际大小值缩减或升高一定的倍数后作为特征值。对于最终确定的特征值的具体大小,此处不做限定。
S903:确定拓扑图中各节点的结构值,结构值基于相应节点所在道路的类型确定。
针对拓扑图中的每个节点,都需要确定该节点对应的结构值,即基于节点对应的道路类型得到的一个数值。例如:当节点对应的道路类型为主干路时,节点对应的结构值可以大一些。当节点对应的道路类型为支路时,节点对应的结构值就小一些。当然,还会存在有其它的道路类型,对于道路类型的具体内容,此处不做限定。相应的,基于道路类型得到的具体数值,即结构值,此处也不做具体限定。
S904:根据各节点的特征值、各节点的结构值以及拓扑图确定车流量未知的节点的车流量。
在确定了拓扑图中各节点的特征值和结构值后,对于每一个节点,综合考虑其特征值和结构值,进而与相邻的节点进行相似度对比,就能够得到该节点的权重。每个节点依此操作,就能够得到拓扑图中各节点的权重。从而再结合拓扑图中各节点的自身特征,就能够对拓扑图中的节点进行聚合。最终通过分类器对聚合后的节点进行处理,就能够得到车流量未知的节点的车流量了。
由上述内容可知,本申请实施例提供的车流量预测方法,在获取到交通网络中各道路的拓扑图后,基于相应节点对应的车流量大小确定拓扑图中各节点的特征值,以及基于相应节点对应的道路类型确定拓扑图中各节点的结构值,然后根据各节点的特征值、各节点的结构值以及拓扑图确定车流量未知的节点的车流量。这样,在确定某一道路节点的车流量时,除了基于各道路节点的自身特征之外,还结合了各道路节点之间的结构特征。基于道路节点的自身特征以及结构特征计算出的道路节点的得分,能够对道路节点进行更加精准的表征,从而计算出的各道路节点之间的相似度,即权重也能够更加精准,进而实现对道路车流量的精准预测。
进一步地,作为对图9所示方法的细化和扩展,本申请实施例还提供了一种车流量预测方法,该方法可以包括:
步骤D1:获取拓扑图。
步骤D2:将各节点对应的多个车流量中预设测量时间之外的车流量删除,得到降维后的各节点。
由于车流量一般都是通过仪器在不同的时间段内测量的,而有些时间段内测量的车流量并不重要,或者并不是实际中需要的,例如:已经有凌晨2点至3点的车流量了,就不再需要凌晨3点至4点的车流量了,因为这两个时间段内的车流量的意义相差不大。若节点中存在大量的不同时间段测量的车流量,无形之中就会加大道路节点特征值的计算量,进而降低车流量预测的效率。
因此,在基于车流量确定道路节点的特征值之前,先将道路节点中一部分的车流量删除,得到降维后的各道路节点。这里需要注意的是,各节点中删除的车流量应该是同一时间段测得的车流量。降维后的道路节点中车流量的数量所有减少。这样,通过少量的车流量数据就能够计算出拓扑图中各道路节点分别对应的特征值,提高了道路节点特征值的获取效率,进而提高了车流量预测的效率。
在具体实施过程中,预设频率可以根据实际情况确定。当对车流量预测的效率要求较高时,可以将各道路节点中对应的车流量删除的多一些。当对车流量预测的效率要求较低时,可以将各道路节点中对应的车流量删除的少一些。当然,还可以基于其它条件确定各道路节点中对应的车流量的删除数量。对于删除数量的具体数值,此处不做限定。
步骤D3:确定降维后的各道路节点在第一方向上的第一特征值以及在第二方向上的第二特征值。
步骤D4:确定降维后的各道路节点在第一方向上的第一结构值以及在第二方向上的第二结构值。
举例来说,图10为本申请实施例中拓扑图的示意图三,参见图10所示,在拓扑图中,中心存在有四个道路节点A1、A2、B1、B2。道路节点A1的道路类型为主干路,道路节点A2的道路类型为主干路,道路节点B1的道路类型为支路,道路节点B2的道路类型为支路。而拓扑图中两侧的六个道路节点C1、C2、C3、C4、C5、C6,仅仅是为了说明道路节点A1、A2为主干路,其连接了多条路。这样,就可以根据道路节点的道路类型,确定道路节点A1、A2、B1、B2在第一方向的第一结构值[c1、c2、c3、c4],以及在第二方向的第二结构值[d1、d2、d3、d4]。
在确定各道路节点对应的第一结构值和第二结构值时,可以先根据道路节点连接的道路数量确定该道路节点的道路类型。例如:当道路节点连接的道路数量较多时,可以确定该道路节点对应的道路类型为主干路。当道路节点连接的道路数量较少时,可以确定该道路节点对应的道路类型为支路。然后,基于道路节点的道路类型确定道路节点的第一结构值和第二结构值。当然,还可以直接基于道路节点连接的道路数量,确定道路节点的第一结构值和第二结构值。例如:当道路节点连接的道路数量为3时,确定该道路节点对应的第一结构值和第二结构值均为3。
图11为本申请实施例中拓扑图的示意图四,参见图11所示,经过图10的简化处理,图11中道路节点A1与道路节点A2通过实线表示两道路节点均对应主干路,而道路节点B1与道路节点B2通过虚线表示两道路节点均对应支路。并且,道路节点A1与道路节点A2还另外连接有3条道路,可见道路节点A1与道路节点A2确实为主干路。
步骤D5:根据第i个节点的第一特征值和第一结构值确定第i个节点在第一方向上的第一得分,以及,根据第i个节点的第二特征值和第二结构值确定第i个节点在第二方向上的第二得分。
其中,i∈N,N表示拓扑图中所有节点的数量。
步骤D6:将各道路节点的第一得分和第二得分赋值到拓扑图的邻接矩阵中。
具体来说,步骤步骤D6可以包括:
步骤E1:从拓扑图中获取邻接矩阵;
步骤E2:将所有节点的第一得分与邻接矩阵的每一行中的元素对应相乘,得到所有节点分别对应的第一评分;
步骤E3:将所有节点的第二得分与邻接矩阵的每一列中的元素对应相乘,得到所有节点分别对应的第二评分。
步骤E4:将所有节点分别对应的第一得分和第二得分赋值到拓扑图的邻接矩阵中。
其中,步骤E2与步骤E3的执行顺序不分先后。
步骤D7:对于每个节点,将其对应的第一评分和第二评分对应相加,得到各节点分别对应的总评分。
步骤D8:根据各节点分别对应的总评分以及拓扑图确定车流量未知的节点的车流量。
最终,将车流量已知的道路节点就都聚合到车流量未知的中心道路节点上了,进而将最终聚合完成的道路节点通过分类器,根据分类器的输出结果,就能够确定车流量未知的道路节点对应的车流量了。
这里需要指出的是,以上车流量预测方法实施例的描述,与上述图数据处理方法实施例的描述是类似的,具有同图数据处理方法实施例相似的有益效果。对于本申请车流量预测方法实施例中未披露的技术细节,请参照本申请图数据处理方法实施例的描述而理解。
基于同一发明构思,作为对上述图数据处理方法的实现,本申请实施例还提供了一种图数据处理装置。图12为本申请实施例中图数据处理装置的结构示意图,参见图12所示,该装置可以包括:
获取模块1201,用于获取拓扑图,所述拓扑图中至少一个节点的属性未知,所述拓扑图中部分节点的属性已知;
特征确定模块1202,用于确定所述拓扑图中各节点的特征值,所述特征值基于相应节点的自身特征确定;
结构确定模块1203,用于确定所述拓扑图中各节点的结构值,所述结构值基于相应节点与其它节点的引用关系确定;
预测模块1204,用于根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述至少一个节点的属性。
进一步地,在本申请其它实施例中,所述特征值包括第一方向的第一特征值和第二方向的第二特征值,所述结构值包括第一方向的第一结构值和第二方向的第二结构值;所述预测模块,具体用于:
根据第i个节点的第一特征值和第一结构值确定所述第i个节点在第一方向上的第一得分,i∈N,N表示拓扑图中所有节点的数量;
根据第i个节点的第二特征值和第二结构值确定所述第i个节点在第二方向上的第二得分;
根据所有节点分别对应的第一得分和第二得分以及所述拓扑图确定所述至少一个节点的属性。
进一步地,在本申请其它实施例中,所述预测模块,具体用于:
将第i个节点的第一特征值与第一结构值相乘,得到所述第i个节点在第一方向上的第一得分。
进一步地,在本申请其它实施例中,所述预测模块,具体用于:
从所述拓扑图中获取邻接矩阵;
将所有节点的第一得分与所述邻接矩阵的每一行中的元素对应相乘,得到所有节点分别对应的第一评分;
将所有节点的第二得分与所述邻接矩阵的每一列中的元素对应相乘,得到所有节点分别对应的第二评分;
根据所有节点分别对应的第一评分和第二评分以及所述拓扑图确定所述至少一个节点的属性。
进一步地,在本申请其它实施例中,所述预测模块,具体用于:
对于每个节点,将其对应的第一评分和第二评分对应相加,得到各节点分别对应的总评分;
根据各节点分别对应的总评分以及所述拓扑图确定所述至少一个节点的属性。
进一步地,在本申请其它实施例中,所述结构确定模块,具体用于:
对所述拓扑图依次采用双曲正切函数、归一化指数函数、以e为底的指数函数进行处理,得到各节点分别对应的结构值。
进一步地,在本申请其它实施例中,所述装置还包括:降维模块,用于:
将各节点对应的内容中出现频率小于预设频率的元素删除,并对相同的元素进行去重,得到降维后的各节点。
这里需要指出的是,以上图数据处理装置实施例的描述,与上述图数据处理方法实施例的描述是类似的,具有同图数据处理方法实施例相似的有益效果。对于本申请图数据处理装置实施例中未披露的技术细节,请参照本申请图数据处理方法实施例的描述而理解。
基于同一发明构思,作为对上述文章分类方法的实现,本申请实施例还提供了一种文章分类装置。图13为本申请实施例中文章分类装置的结构示意图,参见图13所示,该装置可以包括:
获取模块1301,用于获取拓扑图,所述拓扑图中的节点指示文章,所述拓扑图中的边指示各文章之间的关系,所述拓扑图中至少一个节点的文章类型未知,所述拓扑图中部分节点的文章类型已知;
特征确定模块1302,用于确定所述拓扑图中各节点的特征值,所述特征值基于相应节点中文章所包含的词语集合确定;
结构确定模块1303,用于确定所述拓扑图中各节点的结构值,所述结构值基于相应节点与其它节点的引用关系确定;
预测模块1304,用于根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述类型未知的节点的文章类型。
进一步地,在本申请其它实施例中,所述特征值包括第一方向的第一特征值和第二方向的第二特征值,所述结构值包括第一方向的第一结构值和第二方向的第二结构值;所述分类模块,具体用于:
根据第i个节点的第一特征值和第一结构值确定所述第i个节点在第一方向上的第一得分,i∈N,N表示拓扑图中所有节点的数量;
根据第i个节点的第二特征值和第二结构值确定所述第i个节点在第二方向上的第二得分;
根据所有节点分别对应的第一得分和第二得分以及所述拓扑图确定所述类型未知的节点的文章类型。
进一步地,在本申请其它实施例中,所述分类模块,具体用于:
将第i个节点的第一特征值与第一结构值相乘,得到所述第i个节点在第一方向上的第一得分。
进一步地,在本申请其它实施例中,所述分类模块,具体用于:
从所述拓扑图中获取邻接矩阵;
将所有节点的第一得分与所述邻接矩阵的每一行中的元素对应相乘,得到所有节点分别对应的第一评分;
将所有节点的第二得分与所述邻接矩阵的每一列中的元素对应相乘,得到所有节点分别对应的第二评分;
根据所有节点分别对应的第一评分和第二评分以及所述拓扑图确定所述类型未知的节点的文章类型。
进一步地,在本申请其它实施例中,所述分类模块,具体用于:
对于每个节点,将其对应的第一评分和第二评分对应相加,得到各节点分别对应的总评分;
根据各节点分别对应的总评分以及所述拓扑图确定所述类型未知的节点的文章类型。
进一步地,在本申请其它实施例中,所述结构确定模块,具体用于:
对所述拓扑图依次采用双曲正切函数、归一化指数函数、以e为底的指数函数进行处理,得到各节点分别对应的结构值。
进一步地,在本申请其它实施例中,所述装置还包括:降维模块,用于:
将各节点对应的文章中出现频率小于预设频率的词语删除,并对相同的词语进行去重,得到降维后的各节点。
这里需要指出的是,以上文章分类装置实施例的描述,与上述文章分类方法实施例的描述是类似的,具有同文章分类方法实施例相似的有益效果。对于本申请文章分类装置实施例中未披露的技术细节,请参照本申请文章分类方法实施例的描述而理解。
基于同一发明构思,作为对上述车流量预测方法的实现,本申请实施例还提供了一种车流量预测装置。图14为本申请实施例中车流量预测装置的结构示意图,参见图14所示,该装置可以包括:
获取模块1401,用于获取拓扑图,所述拓扑图中的节点指示交通网络中的道路,所述拓扑图中的边指示交通网络中各道路之间的连接关系,所述拓扑图中至少一个节点对应的车流量未知;
特征确定模块1402,用于确定所述拓扑图中各节点的特征值,所述特征值基于相应节点对应的车流量大小确定;
结构确定模块1403,用于确定所述拓扑图中各节点的结构值,所述结构值基于相应节点对应的道路类型确定;
预测模块1404,用于根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述车流量未知的节点的车流量。
进一步地,在本申请其它实施例中,所述特征值包括第一方向的第一特征值和第二方向的第二特征值,所述结构值包括第一方向的第一结构值和第二方向的第二结构值,所述第一方向为所述拓扑图的邻接矩阵的原始方向,所述第二方向为所述拓扑图的邻接矩阵的转置方向;所述预测模块,具体用于:
根据第i个节点的第一特征值和第一结构值确定所述第i个节点在第一方向上的第一得分,i∈N,N表示拓扑图中所有节点的数量;
根据第i个节点的第二特征值和第二结构值确定所述第i个节点在第二方向上的第二得分;
根据所有节点分别对应的第一得分和第二得分以及所述拓扑图确定所述车流量未知的节点的车流量。
进一步地,在本申请其它实施例中,所述预测模块,具体用于:
将第i个节点的第一特征值与第一结构值相乘,得到所述第i个节点在第一方向上的第一得分。
进一步地,在本申请其它实施例中,所述预测模块,具体用于:
从所述拓扑图中获取邻接矩阵;
将所有节点的第一得分与所述邻接矩阵的每一行中的元素对应相乘,得到所有节点分别对应的第一评分;
将所有节点的第二得分与所述邻接矩阵的每一列中的元素对应相乘,得到所有节点分别对应的第二评分;
根据所有节点分别对应的第一评分和第二评分以及所述拓扑图确定所述车流量未知的节点的车流量。
进一步地,在本申请其它实施例中,所述预测模块,具体用于:
对于每个节点,将其对应的第一评分和第二评分对应相加,得到各节点分别对应的总评分;
根据各节点分别对应的总评分以及所述拓扑图确定所述车流量未知的节点的车流量。
进一步地,在本申请其它实施例中,所述结构确定模块,具体用于:
对所述拓扑图依次采用双曲正切函数、归一化指数函数、以e为底的指数函数进行处理,得到各节点分别对应的结构值。
进一步地,在本申请其它实施例中,所述装置还包括:降维模块,用于:
将各节点对应的多个车流量中预设测量时间之外的车流量删除,得到降维后的各节点。
这里需要指出的是,以上车流量预测装置实施例的描述,与上述车流量预测方法实施例的描述是类似的,具有同车流量预测方法实施例相似的有益效果。对于本申请车流量预测装置实施例中未披露的技术细节,请参照本申请车流量预测方法实施例的描述而理解。
基于同一发明构思,本申请实施例还提供了一种电子设备。图15为本申请实施例中电子设备的结构示意图,参见图15所示,该电子设备可以包括:处理器1501、存储器1502、总线1503;其中,处理器1501、存储器1502通过总线1503完成相互间的通信;处理器1501用于调用存储器1502中的程序指令,以执行上述图数据处理方法、文章分类方法或者车流量预测方法。
这里需要指出的是,以上电子设备实施例的描述,与上述各方法实施例的描述是类似的,具有同各方法实施例相似的有益效果。对于本申请电子设备实施例中未披露的技术细节,请参照本申请各方法实施例的描述而理解。
基于同一发明构思,本申请实施例还提供了一种计算机可读存储介质,该存储介质可以包括:存储的程序;其中,在程序运行时控制存储介质所在设备执行上述图数据处理方法、文章分类方法或者车流量预测方法。
这里需要指出的是,以上存储介质实施例的描述,与上述各方法实施例的描述是类似的,具有同各方法实施例相似的有益效果。对于本申请存储介质实施例中未披露的技术细节,请参照本申请各方法实施例的描述而理解。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (11)

1.一种图数据处理方法,其特征在于,所述方法包括:
获取拓扑图,所述拓扑图中包括多个节点,每个节点用于表示文章或者道路,所述拓扑图中至少一个节点的类型未知;
确定所述拓扑图中各节点的特征值,所述特征值基于相应节点的自身特征确定;其中,若所述每个节点用于表示文章,则一个节点的自身特征是指节点所表示的文章中所包含的词语集合;若所述每个节点用于表示道路,则一个节点的自身特征是节点所表示的道路中车流量的大小;
确定所述拓扑图中各节点的结构值,所述结构值基于相应节点与其它节点的引用关系确定;
根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述至少一个节点的属性;
所述特征值包括第一方向的第一特征值和第二方向的第二特征值,所述结构值包括第一方向的第一结构值和第二方向的第二结构值,所述第一方向为所述拓扑图的邻接矩阵的原始方向,所述第二方向为所述拓扑图的邻接矩阵的转置方向;所述根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述类型未知的节点的属性,包括:
将第i个节点的第一特征值和第一结构值相乘,得到所述第i个节点在第一方向上的第一得分,i∈N,N表示拓扑图中所有节点的数量;将第i个节点的第二特征值和第二结构值相乘,得到所述第i个节点在第二方向上的第二得分;
从所述拓扑图中获取邻接矩阵;
将所有节点的第一得分与所述邻接矩阵的每一行中的元素对应相乘,得到所有节点分别对应的第一评分;将所有节点的第二得分与所述邻接矩阵的每一列中的元素对应相乘,得到所有节点分别对应的第二评分;
根据所有节点分别对应的第一评分和第二评分以及所述拓扑图确定所述类型未知的节点的属性。
2.根据权利要求1所述的方法,其特征在于,所述根据所有节点分别对应的第一评分和第二评分以及所述拓扑图确定所述类型未知的节点的属性,包括:
对于每个节点,将其对应的第一评分和第二评分对应相加,得到各节点分别对应的总评分;
根据各节点分别对应的总评分以及所述拓扑图确定所述类型未知的节点的属性。
3.根据权利要求1所述的方法,其特征在于,所述确定所述拓扑图中各节点的结构值,包括:
对所述拓扑图依次采用双曲正切函数、归一化指数函数、以e为底的指数函数进行处理,得到各节点分别对应的结构值。
4.根据权利要求1所述的方法,其特征在于,在所述确定所述拓扑图中各节点的特征值之前,所述方法还包括:
对各节点对应的内容进行降维处理,得到降维后的各节点。
5.一种文章分类方法,所述方法应用权利要求1-4中任一项所述的方法进行文章分类,其特征在于,所述方法包括:
获取拓扑图,所述拓扑图中的节点指示文章,所述拓扑图中的边指示各文章之间的关系,所述拓扑图中至少一个节点的文章类型未知;
确定所述拓扑图中各节点的特征值,所述特征值基于相应节点中文章所包含的词语集合确定;
确定所述拓扑图中各节点的结构值,所述结构值基于相应节点与其它节点的引用关系确定;
根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述至少一个节点的文章类型。
6.一种车流量预测方法,所述方法应用权利要求1-4中任一项所述的方法进行车流量预测,其特征在于,所述方法包括:
获取拓扑图,所述拓扑图中的节点指示交通网络中的道路,所述拓扑图中的边指示交通网络中各道路之间的连接关系,所述拓扑图中至少一个节点对应的车流量未知;
确定所述拓扑图中各节点的特征值,所述特征值基于相应节点对应的车流量大小确定;
确定所述拓扑图中各节点的结构值,所述结构值基于相应节点对应的道路类型确定;
根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述车流量未知的节点的车流量。
7.一种图数据处理装置,其特征在于,所述装置包括:
获取模块,用于获取拓扑图,所述拓扑图中包括多个节点,每个节点用于表示文章或者道路,所述拓扑图中至少一个节点的类型未知,所述拓扑图中部分节点的类型已知;
特征确定模块,用于确定所述拓扑图中各节点的特征值,所述特征值基于相应节点的自身特征确定;其中,若所述每个节点用于表示文章,则一个节点的自身特征是指节点所表示的文章中所包含的词语集合,若所述每个节点用于表示道路,则一个节点的自身特征是节点所表示的道路中车流量的大小;
结构确定模块,用于确定所述拓扑图中各节点的结构值,所述结构值基于相应节点与其它节点的引用关系确定;
预测模块,用于根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述至少一个节点的类型;
所述特征值包括第一方向的第一特征值和第二方向的第二特征值,所述结构值包括第一方向的第一结构值和第二方向的第二结构值,所述第一方向为所述拓扑图的邻接矩阵的原始方向,所述第二方向为所述拓扑图的邻接矩阵的转置方向;
所述预测模块,具体用于:
将第i个节点的第一特征值和第一结构值相乘,得到所述第i个节点在第一方向上的第一得分,i∈N,N表示拓扑图中所有节点的数量;将第i个节点的第二特征值和第二结构值相乘,得到所述第i个节点在第二方向上的第二得分;
从所述拓扑图中获取邻接矩阵;
将所有节点的第一得分与所述邻接矩阵的每一行中的元素对应相乘,得到所有节点分别对应的第一评分;将所有节点的第二得分与所述邻接矩阵的每一列中的元素对应相乘,得到所有节点分别对应的第二评分;
根据所有节点分别对应的第一评分和第二评分以及所述拓扑图确定所述类型未知的节点的属性。
8.一种文章分类装置,其特征在于,所述装置包括:
获取模块,用于获取拓扑图,所述拓扑图中的节点指示文章,所述拓扑图中的边指示各文章之间的关系,所述拓扑图中至少一个节点的文章类型未知,所述拓扑图中部分节点的文章类型已知;
特征确定模块,用于确定所述拓扑图中各节点的特征值,所述特征值基于相应节点中文章所包含的词语集合确定;
结构确定模块,用于确定所述拓扑图中各节点的结构值,所述结构值基于相应节点与其它节点的引用关系确定;
预测模块,用于根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述类型未知的节点的文章类型;
所述特征值包括第一方向的第一特征值和第二方向的第二特征值,所述结构值包括第一方向的第一结构值和第二方向的第二结构值,所述第一方向为所述拓扑图的邻接矩阵的原始方向,所述第二方向为所述拓扑图的邻接矩阵的转置方向;
所述预测模块,具体用于:
将第i个节点的第一特征值和第一结构值相乘,得到所述第i个节点在第一方向上的第一得分,i∈N,N表示拓扑图中所有节点的数量;将第i个节点的第二特征值和第二结构值相乘,得到所述第i个节点在第二方向上的第二得分;
从所述拓扑图中获取邻接矩阵;
将所有节点的第一得分与所述邻接矩阵的每一行中的元素对应相乘,得到所有节点分别对应的第一评分;
将所有节点的第二得分与所述邻接矩阵的每一列中的元素对应相乘,得到所有节点分别对应的第二评分;
根据所有节点分别对应的第一评分和第二评分以及所述拓扑图确定所述类型未知的节点的文章类型。
9.一种车流量预测装置,其特征在于,所述装置包括:
获取模块,用于获取拓扑图,所述拓扑图中的节点指示交通网络中的道路,所述拓扑图中的边指示交通网络中各道路之间的连接关系,所述拓扑图中至少一个节点对应的车流量未知;
特征确定模块,用于确定所述拓扑图中各节点的特征值,所述特征值基于相应节点对应的车流量大小确定;
结构确定模块,用于确定所述拓扑图中各节点的结构值,所述结构值基于相应节点对应的道路类型确定;
预测模块,用于根据所述各节点的特征值、所述各节点的结构值以及所述拓扑图确定所述车流量未知的节点的车流量;
所述特征值包括第一方向的第一特征值和第二方向的第二特征值,所述结构值包括第一方向的第一结构值和第二方向的第二结构值,所述第一方向为所述拓扑图的邻接矩阵的原始方向,所述第二方向为所述拓扑图的邻接矩阵的转置方向;所述预测模块,具体用于:
将第i个节点的第一特征值和第一结构值相乘,得到所述第i个节点在第一方向上的第一得分,i∈N,N表示拓扑图中所有节点的数量;将第i个节点的第二特征值和第二结构值相乘,得到所述第i个节点在第二方向上的第二得分;
从所述拓扑图中获取邻接矩阵;
将所有节点的第一得分与所述邻接矩阵的每一行中的元素对应相乘,得到所有节点分别对应的第一评分;将所有节点的第二得分与所述邻接矩阵的每一列中的元素对应相乘,得到所有节点分别对应的第二评分;
根据所有节点分别对应的第一评分和第二评分以及所述拓扑图确定所述车流量未知的节点的车流量。
10.一种电子设备,其特征在于,所述电子设备包括:处理器、存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如权利要求1至6中任一项所述的方法。
11.一种计算机可读存储介质,其特征在于,所述存储介质包括:存储的程序;其中,在所述程序运行时控制所述存储介质所在设备执行如权利要求1至6中任一项所述的方法。
CN202111599277.7A 2021-12-24 2021-12-24 图数据处理、文章分类、流量预测方法、装置、设备及存储介质 Active CN114169466B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111599277.7A CN114169466B (zh) 2021-12-24 2021-12-24 图数据处理、文章分类、流量预测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111599277.7A CN114169466B (zh) 2021-12-24 2021-12-24 图数据处理、文章分类、流量预测方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN114169466A CN114169466A (zh) 2022-03-11
CN114169466B true CN114169466B (zh) 2023-07-07

Family

ID=80488142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111599277.7A Active CN114169466B (zh) 2021-12-24 2021-12-24 图数据处理、文章分类、流量预测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114169466B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822453A (zh) * 2020-06-15 2021-12-21 中国移动通信集团浙江有限公司 5g切片的多用户投诉共性确定方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018085859A1 (en) * 2016-11-07 2018-05-11 Ayasdi, Inc. Dimension grouping and reduction for model generation, testing, and documentation
CN108521141B (zh) * 2018-03-30 2020-04-03 河海大学 一种计及风电场电压分布特性的短路电流计算方法
CN111951543B (zh) * 2019-05-15 2022-04-26 杭州海康威视数字技术股份有限公司 流量预测方法及装置
CN111079780B (zh) * 2019-11-06 2023-06-23 中国科学院深圳先进技术研究院 空间图卷积网络的训练方法、电子设备及存储介质
CN112529069B (zh) * 2020-12-08 2023-10-13 广州大学华软软件学院 一种半监督节点分类方法、系统、计算机设备和存储介质
CN113222265A (zh) * 2021-05-21 2021-08-06 内蒙古大学 物联网中移动多传感器空时数据预测方法及其系统
CN113378913B (zh) * 2021-06-08 2023-10-31 电子科技大学 一种基于自监督学习的半监督节点分类方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822453A (zh) * 2020-06-15 2021-12-21 中国移动通信集团浙江有限公司 5g切片的多用户投诉共性确定方法及装置

Also Published As

Publication number Publication date
CN114169466A (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
TWI769754B (zh) 基於隱私保護確定目標業務模型的方法及裝置
TWI444844B (zh) 模擬參數校正技術
CN110941734B (zh) 基于稀疏图结构的深度无监督图像检索方法
CN114048331A (zh) 一种基于改进型kgat模型的知识图谱推荐方法及系统
CN111914253B (zh) 一种入侵检测的方法、系统、设备及可读存储介质
US20110238606A1 (en) Kernel regression system, method, and program
CN111143547B (zh) 一种基于知识图谱的大数据显示方法
CN110442618B (zh) 融合专家信息关联关系的卷积神经网络评审专家推荐方法
JP2018185771A (ja) 文ペア分類装置、文ペア分類学習装置、方法、及びプログラム
CN113409892B (zh) 基于图神经网络的miRNA-疾病关联关系预测方法
CN114677548B (zh) 基于阻变存储器的神经网络图像分类系统及方法
CN109002794A (zh) 一种非线性非负矩阵分解人脸识别构建方法、系统及存储介质
CN112580733A (zh) 分类模型的训练方法、装置、设备以及存储介质
CN111339724A (zh) 用于生成数据处理模型和版图的方法、设备和存储介质
CN115659985A (zh) 电力知识图谱实体对齐方法、装置和计算机设备
CN114169466B (zh) 图数据处理、文章分类、流量预测方法、装置、设备及存储介质
CN112446739B (zh) 一种基于分解机和图神经网络的点击率预测方法及系统
CN116431816B (zh) 一种文献分类方法、装置、设备和计算机可读存储介质
CN116992334A (zh) 面向学术网络节点分类方法和装置
WO2023132029A1 (ja) 情報処理装置、情報処理方法及びプログラム
CN105760442A (zh) 基于数据库邻域关系的图像特征增强方法
CN114595787A (zh) 推荐模型的训练方法、推荐方法、装置、介质及设备
CN115344698A (zh) 标签处理方法、装置、计算机设备、存储介质和程序产品
CN113378866A (zh) 图像分类方法、系统、存储介质及电子设备
WO2012029152A2 (ja) データ集合間距離算出装置および方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant