CN116108143B - 基于区块链技术的数字经济监测方法及其系统 - Google Patents

基于区块链技术的数字经济监测方法及其系统 Download PDF

Info

Publication number
CN116108143B
CN116108143B CN202310370651.9A CN202310370651A CN116108143B CN 116108143 B CN116108143 B CN 116108143B CN 202310370651 A CN202310370651 A CN 202310370651A CN 116108143 B CN116108143 B CN 116108143B
Authority
CN
China
Prior art keywords
training
data item
vectors
feature vector
semantic understanding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310370651.9A
Other languages
English (en)
Other versions
CN116108143A (zh
Inventor
敬然
高伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changchun University Of Finance And Economics
Original Assignee
Changchun University Of Finance And Economics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changchun University Of Finance And Economics filed Critical Changchun University Of Finance And Economics
Priority to CN202310370651.9A priority Critical patent/CN116108143B/zh
Publication of CN116108143A publication Critical patent/CN116108143A/zh
Application granted granted Critical
Publication of CN116108143B publication Critical patent/CN116108143B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Document Processing Apparatus (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于区块链技术的数字经济监测方法及其系统,涉及智能化监测技术领域,其从区块链结构提取待评估区域的经济运行数字信息;基于区块链技术,结合人工智能技术对数字经济领域中待评估区域的经济运行状态进行评估,并判断是否存在异常情况,以加强对数字经济领域中的信息安全和稳定运行的保障。

Description

基于区块链技术的数字经济监测方法及其系统
技术领域
本申请涉及智能化监测技术领域,并且更具体地,涉及一种基于区块链技术的数字经济监测方法及其系统。
背景技术
区块链(Blockchain)是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。通俗来说,区块链就是一个又一个区块组成的链条,每一个区块中保存了一定的信息,它们按照各自产生的时间顺序连接成链条。由于区块链具有去中心化、信息不可篡改、自治性等特性,区块链越来越受到重视。
数字经济,作为一个内涵比较宽泛的概念,凡是直接或间接利用数据来引导资源发挥作用,推动生产力发展的经济形态都可以纳入其范畴。在今天,数字经济正处于蓬勃发展阶段,与实体经济的融合程度日益加深,对实体经济的支撑作用愈加显现。
现有技术中,政府部门、公共数据平台和网络平台已存在采用区块链技术进行数字经济运行情况信息的存储以防止信息被篡改。虽然通过区块链技术能否防止信息被篡改,但现有的技术通常只能进行数据的简单统计与展示,并不能对经济运行状态进行评估。
因此,期待一种基于区块链技术的数字经济监测方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请提供了一种基于区块链技术的数字经济监测方法及其系统,其从区块链结构提取待评估区域的经济运行数字信息;基于区块链技术,结合人工智能技术对数字经济领域中待评估区域的经济运行状态进行评估,并判断是否存在异常情况,以加强对数字经济领域中的信息安全和稳定运行的保障。
第一方面,提供了一种基于区块链技术的数字经济监测方法,其包括:
从区块链结构提取待评估区域的经济运行数字信息;
对所述待评估区域的经济运行数字信息进行预处理以得到预处理后经济运行数字信息;
提取所述预处理后经济运行数字信息中的各个数据项的属性文本描述和所述各个数据项的数值;
将所述各个数据项的属性文本描述通过词嵌入层以得到多个数据项属性词嵌入向量,并将所述各个数据项的数值添加到所述各个数据项属性词嵌入向量的末尾以得到多个数据项词嵌入向量;
将所述多个数据项词嵌入向量通过基于转换器的上下文编码器以得到全局语义理解特征向量;
将所述全局语义理解特征向量通过分类器以得到分类结果,分类结果用于表示所述待评估区域的经济运行状态是否存在异常。
在上述基于区块链技术的数字经济监测方法中,将所述各个数据项的属性文本描述通过词嵌入层以得到多个数据项属性词嵌入向量,并将所述各个数据项的数值添加到所述各个数据项属性词嵌入向量的末尾以得到多个数据项词嵌入向量,包括:对所述各个数据项的属性文本描述进行分词处理以将所述各个数据项的属性文本描述转化为由多个词组成的词序列;将所述词序列中的各个词分别排列为一维输入向量以得到多个一维输入向量;以及,使用所述词嵌入层对所述多个一维输入向量中各个一维输入向量进行全连接编码以得到所述多个数据项属性词嵌入向量。
在上述基于区块链技术的数字经济监测方法中,将所述多个数据项词嵌入向量基于转换器的上下文编码器以得到全局语义理解特征向量,包括:使用所述基于转换器的上下文编码器对所述多个数据项词嵌入向量进行基于全局的上下文语义编码以得到多个数据项全局特征向量;以及,将所述多个数据项全局特征向量进行级联以得到所述全局语义理解特征向量。
在上述基于区块链技术的数字经济监测方法中,将所述全局语义理解特征向量通过分类器以得到分类结果,分类结果用于表示所述待评估区域的经济运行状态是否存在异常,包括:使用所述分类器的多个全连接层对所述全局语义理解特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
在上述基于区块链技术的数字经济监测方法中,还包括训练步骤:对所述基于转换器的上下文编码器和所述分类器进行训练;其中,所述训练步骤,包括:获取训练数据,所述训练数据包括:从区块链结构提取待评估区域的训练经济运行数字信息,以及,所述待评估区域的经济运行状态是否存在异常的真实值;对所述待评估区域的训练经济运行数字信息进行预处理以得到训练预处理后经济运行数字信息;提取所述训练预处理后经济运行数字信息中的各个数据项的训练属性文本描述和所述各个数据项的训练数值;将所述各个数据项的训练属性文本描述通过所述词嵌入层以得到多个训练数据项属性词嵌入向量,并将所述各个数据项的训练数值添加到所述各个训练数据项属性词嵌入向量的末尾以得到多个训练数据项词嵌入向量;将所述多个训练数据项词嵌入向量通过所述基于转换器的上下文编码器以得到训练全局语义理解特征向量;对所述训练全局语义理解特征向量进行耿贝尔正态周期性重参数化以得到优化全局语义理解特征向量;将所述优化全局语义理解特征向量通过分类器以得到分类损失函数值;以及,基于所述分类损失函数值和所述待评估区域的经济运行状态是否存在异常的真实值并通过梯度下降的方向传播来对所述基于转换器的上下文编码器和所述分类器进行训练。
在上述基于区块链技术的数字经济监测方法中,对所述训练全局语义理解特征向量进行耿贝尔正态周期性重参数化以得到优化全局语义理解特征向量,包括:以如下优化公式对所述训练全局语义理解特征向量进行耿贝尔正态周期性重参数化以得到优化全局语义理解特征向量;其中,所述优化公式为:
Figure SMS_1
其中,
Figure SMS_2
表示所述训练全局语义理解特征向量的各个位置的特征值,/>
Figure SMS_3
和/>
Figure SMS_4
分别是所述训练全局语义理解特征向量的各个位置的特征值集合的均值和方差,/>
Figure SMS_5
表示以2为底的对数函数,/>
Figure SMS_6
表示反正弦函数,/>
Figure SMS_7
表示反余弦函数,/>
Figure SMS_8
表示所述优化全局语义理解特征向量的各个位置的特征值。
第二方面,提供了一种基于区块链技术的数字经济监测系统,其包括:
信息获取模块,用于从区块链结构提取待评估区域的经济运行数字信息;
预处理模块,用于对所述待评估区域的经济运行数字信息进行预处理以得到预处理后经济运行数字信息;
数据提取模块,用于提取所述预处理后经济运行数字信息中的各个数据项的属性文本描述和所述各个数据项的数值;
词嵌入模块,用于将所述各个数据项的属性文本描述通过词嵌入层以得到多个数据项属性词嵌入向量,并将所述各个数据项的数值添加到所述各个数据项属性词嵌入向量的末尾以得到多个数据项词嵌入向量;
上下文编码模块,用于将所述多个数据项词嵌入向量通过基于转换器的上下文编码器以得到全局语义理解特征向量;
经济运行状态结果生成模块,用于将所述全局语义理解特征向量通过分类器以得到分类结果,分类结果用于表示所述待评估区域的经济运行状态是否存在异常。
在上述基于区块链技术的数字经济监测系统中,所述词嵌入模块,包括:分词处理单元,用于对所述各个数据项的属性文本描述进行分词处理以将所述各个数据项的属性文本描述转化为由多个词组成的词序列;向量展开单元,用于将所述词序列中的各个词分别排列为一维输入向量以得到多个一维输入向量;以及,编码单元,用于使用所述词嵌入层对所述多个一维输入向量中各个一维输入向量进行全连接编码以得到所述多个数据项属性词嵌入向量。
在上述基于区块链技术的数字经济监测系统中,所述上下文编码模块,包括:上下文语义编码单元,用于使用所述基于转换器的上下文编码器对所述多个数据项词嵌入向量进行基于全局的上下文语义编码以得到多个数据项全局特征向量;以及,级联单元,用于将所述多个数据项全局特征向量进行级联以得到所述全局语义理解特征向量。
在上述基于区块链技术的数字经济监测系统中,所述经济运行状态结果生成模块,包括:全连接编码单元,用于使用所述分类器的多个全连接层对所述全局语义理解特征向量进行全连接编码以得到编码分类特征向量;以及,分类结果单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
与现有技术相比,本申请提供的基于区块链技术的数字经济监测方法及其系统,其从区块链结构提取待评估区域的经济运行数字信息;基于区块链技术,结合人工智能技术对数字经济领域中待评估区域的经济运行状态进行评估,并判断是否存在异常情况,以加强对数字经济领域中的信息安全和稳定运行的保障。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本申请实施例的基于区块链技术的数字经济监测方法的场景示意图。
图2为根据本申请实施例的基于区块链技术的数字经济监测方法的流程图。
图3为根据本申请实施例的基于区块链技术的数字经济监测方法的架构示意图。
图4为根据本申请实施例的基于区块链技术的数字经济监测方法中步骤140的子步骤的流程图。
图5为根据本申请实施例的基于区块链技术的数字经济监测方法中步骤150的子步骤的流程图。
图6为根据本申请实施例的基于区块链技术的数字经济监测方法中步骤160的子步骤的流程图。
图7为根据本申请实施例的基于区块链技术的数字经济监测方法中步骤170的子步骤的流程图。
图8为根据本申请实施例的基于区块链技术的数字经济监测系统的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有说明,本申请实施例所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本申请的范围。
在本申请实施例记载中,需要说明的是,除非另有说明和限定,术语“连接”应做广义理解,例如,可以是电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
需要说明的是,本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本申请的实施例可以除了在这里图示或描述的那些以外的顺序实施。
针对上述技术问题,本申请的技术构思为:基于区块链技术,结合人工智能技术对数字经济领域中待评估区域的经济运行状态进行评估,并判断是否存在异常情况,以加强对数字经济领域中的信息安全和稳定运行的保障。
具体地,在本申请的技术方案中,首先,从区块链结构提取待评估区域的经济运行数字信息。由于区块链具有去中心化和信息不可篡改等特点,在数字经济领域,政府部门、公共数据平台和网络平台已经开始采用区块链技术进行数字经济运行情况信息的存储,以保证信息不被篡改。因此,通过从区块链结构中提取经济运行数字信息,可以保证数据的真实性和准确性,为后续经济运行状态的评估提供了可靠的数据源。同时,区块链的分布式特点也可以避免单一节点或中心化机构对数据的控制和操纵,提高了数据的安全性和透明度。
在实际应用中,原始数据往往存在着多种问题,例如存在缺失值、异常值、重复值等,这些问题可能会影响到后续数据分析的结果。另外,对于不同类型的数据,在进行评估分析之前,还需要根据其特点进行适当的转换和标准化。例如,对于连续型数据,可以进行归一化或标准化处理,使其在数值上更具可比性;对于分类型数据,可以进行编码或向量化处理,方便后续算法的处理和分析。对此,在本申请的技术方案中,对所述待评估区域的经济运行数字信息进行预处理以使得数据更加干净、可靠、规范化,从而得到预处理后经济运行数字信息,利于提高后续评估分析的准确性和可信度。
接着,提取所述预处理后经济运行数字信息中的各个数据项的属性文本描述和所述各个数据项的数值。这里,提取属性文本描述可以帮助我们更好地理解数据含义和特点,而提取各个数据项的数值也非常重要,因为它们是算法中必要的输入,只有将数值转换为计算机程序可识别的格式,才能进一步进行数学计算和分析操作。
为了将文本信息和数值信息融合起来,形成更加丰富和有意义的特征表示,在本申请的技术方案中,将所述各个数据项的属性文本描述通过词嵌入层以得到多个数据项属性词嵌入向量,并将所述各个数据项的数值添加到所述各个数据项属性词嵌入向量的末尾以得到多个数据项词嵌入向量。也就是说,在数字经济领域中,经济运行数字信息往往包含着丰富的信息和知识,例如某一指标的名称、含义、单位、变化趋势等。这些信息虽然很重要,但是它们通常是以自然语言的方式出现的,难以直接应用于算法分析。通过利用词嵌入技术将属性文本描述转换为连续向量表示,可以将文字信息转换为计算机可以处理的数值形式,方便进一步的算法处理和分析。同时,将各个数据项的数值分别添加到所述多个数据项属性词嵌入向量的末尾,能够充分利用数值信息对特征表示进行补充和丰富,从而形成更加全面和准确的特征表示。
在数字经济领域中,待评估区域的经济运行状态往往涉及到多个因素和指标,这些因素和指标之间具有复杂的相互关系和影响。为了挖掘其中所蕴含的关联关系,在本申请的技术方案中,将所述多个数据项词嵌入向量基于转换器的上下文编码器以得到全局语义理解特征向量。这里,将所述多个数据项词嵌入向量输入到转换器的上下文编码器中,可以捕捉各个数据项之间的相互依存关系,从而形成更加全面和准确的特征表示。同时,通过上下文编码器学习到的全局语义理解特征向量,能够提取出数据项之间的潜在语义关系,去除噪声和冗余信息,提高特征的表达能力和判别性。
在得到所述全局语义理解特征向量后,将其通过分类器以得到分类结果,分类结果用于表示所述待评估区域的经济运行状态是否存在异常。分类结果能够有效地反映出待评估区域当前的经济运行状态,例如正常或异常。如果分类结果表示经济运行状态存在异常,就需要及时采取措施进行调整和修复,以确保数字经济系统的稳定性和安全性。
在本申请的技术方案中,对于所述全局语义理解特征向量来说,由于其是将所述多个数据项词嵌入向量通过基于转换器的上下文编码器得到的多个上下文数据项词嵌入向量直接级联得到的,尽管基于转换器的上下文编码器对所述多个数据项词嵌入向量进行了上下文语义编码,但是得到的所述多个上下文数据项词嵌入向量直接仍然存在特征分布的显式差异。这样,所述全局语义理解特征向量就会在所述多个上下文数据项词嵌入向量的级联位置存在分布间隙(distribution gap),导致所述全局语义理解特征向量的整体特征分布的连续性差,影响模型训练时的训练效果,例如训练速度和收敛准确性。
基于此,本申请的申请人对所述全局语义理解特征向量,例如记为
Figure SMS_9
进行耿贝尔(Gumbel)正态周期性重参数化,以获得优化后的全局语义理解特征向量,例如记为/>
Figure SMS_10
,具体表示为:/>
Figure SMS_11
Figure SMS_12
和/>
Figure SMS_13
分别是特征值集合/>
Figure SMS_14
的均值和方差,且/>
Figure SMS_15
这里,所述耿贝尔正态周期性重参数化通过将所述全局语义理解特征向量
Figure SMS_16
的各个位置的特征值/>
Figure SMS_17
转换为其概率分布的角特征表达,来基于耿贝尔(Gumbel)分布的随机性周期操作方式在特征值集合的正态分布中引入随机性的周期式分布,以获得原特征分布的具有随机性的周期式连续可微近似,从而通过特征的周期性重参数化来提高优化后的全局语义理解特征向量/>
Figure SMS_18
在训练时损失函数的梯度在模型中反向传播的动态连续波动能力,以提高卷积核在训练过程中的动态应用性,从而补偿所述全局语义理解特征向量的特征分布的不连续对训练效果的影响。
图1为根据本申请实施例的基于区块链技术的数字经济监测方法的场景示意图。如图1所示,在该应用场景中,首先,从区块链结构提取待评估区域的经济运行数字信息(例如,如图1中所示意的C);然后,将获取的经济运行数字信息输入至部署有基于区块链技术的数字经济监测算法的服务器(例如,如图1中所示意的S)中,其中所述服务器能够基于区块链技术的数字经济监测算法对所述经济运行数字信息进行处理,以生成用于表示所述待评估区域的经济运行状态是否存在异常的分类结果。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
在本申请的一个实施例中,图2为根据本申请实施例的基于区块链技术的数字经济监测方法的流程图。如图2所示,根据本申请实施例的基于区块链技术的数字经济监测方法100,包括:110,从区块链结构提取待评估区域的经济运行数字信息;120,对所述待评估区域的经济运行数字信息进行预处理以得到预处理后经济运行数字信息;130,提取所述预处理后经济运行数字信息中的各个数据项的属性文本描述和所述各个数据项的数值;140,将所述各个数据项的属性文本描述通过词嵌入层以得到多个数据项属性词嵌入向量,并将所述各个数据项的数值添加到所述各个数据项属性词嵌入向量的末尾以得到多个数据项词嵌入向量;150,将所述多个数据项词嵌入向量通过基于转换器的上下文编码器以得到全局语义理解特征向量;以及,160,将所述全局语义理解特征向量通过分类器以得到分类结果,分类结果用于表示所述待评估区域的经济运行状态是否存在异常。
图3为根据本申请实施例的基于区块链技术的数字经济监测方法的架构示意图。如图3所示,在该网络架构中,首先,从区块链结构提取待评估区域的经济运行数字信息;然后,对所述待评估区域的经济运行数字信息进行预处理以得到预处理后经济运行数字信息;接着,提取所述预处理后经济运行数字信息中的各个数据项的属性文本描述和所述各个数据项的数值;然后,将所述各个数据项的属性文本描述通过词嵌入层以得到多个数据项属性词嵌入向量,并将所述各个数据项的数值添加到所述各个数据项属性词嵌入向量的末尾以得到多个数据项词嵌入向量;接着,将所述多个数据项词嵌入向量通过基于转换器的上下文编码器以得到全局语义理解特征向量;以及,最后,将所述全局语义理解特征向量通过分类器以得到分类结果,分类结果用于表示所述待评估区域的经济运行状态是否存在异常。
具体地,在步骤110中,从区块链结构提取待评估区域的经济运行数字信息。针对上述技术问题,本申请的技术构思为:基于区块链技术,结合人工智能技术对数字经济领域中待评估区域的经济运行状态进行评估,并判断是否存在异常情况,以加强对数字经济领域中的信息安全和稳定运行的保障。
具体地,在本申请的技术方案中,首先,从区块链结构提取待评估区域的经济运行数字信息。由于区块链具有去中心化和信息不可篡改等特点,在数字经济领域,政府部门、公共数据平台和网络平台已经开始采用区块链技术进行数字经济运行情况信息的存储,以保证信息不被篡改。因此,通过从区块链结构中提取经济运行数字信息,可以保证数据的真实性和准确性,为后续经济运行状态的评估提供了可靠的数据源。同时,区块链的分布式特点也可以避免单一节点或中心化机构对数据的控制和操纵,提高了数据的安全性和透明度。
具体地,在步骤120中,对所述待评估区域的经济运行数字信息进行预处理以得到预处理后经济运行数字信息。在实际应用中,原始数据往往存在着多种问题,例如存在缺失值、异常值、重复值等,这些问题可能会影响到后续数据分析的结果。另外,对于不同类型的数据,在进行评估分析之前,还需要根据其特点进行适当的转换和标准化。
例如,对于连续型数据,可以进行归一化或标准化处理,使其在数值上更具可比性;对于分类型数据,可以进行编码或向量化处理,方便后续算法的处理和分析。对此,在本申请的技术方案中,对所述待评估区域的经济运行数字信息进行预处理以使得数据更加干净、可靠、规范化,从而得到预处理后经济运行数字信息,利于提高后续评估分析的准确性和可信度。
具体地,在步骤130中,提取所述预处理后经济运行数字信息中的各个数据项的属性文本描述和所述各个数据项的数值。接着,提取所述预处理后经济运行数字信息中的各个数据项的属性文本描述和所述各个数据项的数值。这里,提取属性文本描述可以帮助我们更好地理解数据含义和特点,而提取各个数据项的数值也非常重要,因为它们是算法中必要的输入,只有将数值转换为计算机程序可识别的格式,才能进一步进行数学计算和分析操作。
具体地,在步骤140中,将所述各个数据项的属性文本描述通过词嵌入层以得到多个数据项属性词嵌入向量,并将所述各个数据项的数值添加到所述各个数据项属性词嵌入向量的末尾以得到多个数据项词嵌入向量。为了将文本信息和数值信息融合起来,形成更加丰富和有意义的特征表示,在本申请的技术方案中,将所述各个数据项的属性文本描述通过词嵌入层以得到多个数据项属性词嵌入向量,并将所述各个数据项的数值添加到所述各个数据项属性词嵌入向量的末尾以得到多个数据项词嵌入向量。
也就是说,在数字经济领域中,经济运行数字信息往往包含着丰富的信息和知识,例如某一指标的名称、含义、单位、变化趋势等。这些信息虽然很重要,但是它们通常是以自然语言的方式出现的,难以直接应用于算法分析。通过利用词嵌入技术将属性文本描述转换为连续向量表示,可以将文字信息转换为计算机可以处理的数值形式,方便进一步的算法处理和分析。同时,将各个数据项的数值分别添加到所述多个数据项属性词嵌入向量的末尾,能够充分利用数值信息对特征表示进行补充和丰富,从而形成更加全面和准确的特征表示。
图4为根据本申请实施例的基于区块链技术的数字经济监测方法中步骤140的子步骤的流程图,如图4所示,将所述各个数据项的属性文本描述通过词嵌入层以得到多个数据项属性词嵌入向量,并将所述各个数据项的数值添加到所述各个数据项属性词嵌入向量的末尾以得到多个数据项词嵌入向量,包括:141,对所述各个数据项的属性文本描述进行分词处理以将所述各个数据项的属性文本描述转化为由多个词组成的词序列;142,将所述词序列中的各个词分别排列为一维输入向量以得到多个一维输入向量;以及,143,使用所述词嵌入层对所述多个一维输入向量中各个一维输入向量进行全连接编码以得到所述多个数据项属性词嵌入向量。
应可以理解,词嵌入是自然语言处理(NLP)中语言模型与表征学习技术的统称。概念上而言,它是指把一个维数为所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中,每个单词或词组被映射为实数域上的向量。也就是说,词嵌入是使用密集向量表示来表示单词和文档的一类方法。这是对传统的袋型(bag-of-word)模型编码方案的改进,其中使用大的稀疏向量来表示每个单词或向量中的每个单词进行数字分配以表示整个词汇表。这些表示是稀疏的,因为词汇是广泛的,这样一个给定的单词或文档将由一个主要由零值组成的向量几何表示。相反,在词嵌入中,词由密集向量表示,其中矢量表示单词投射到连续向量空间中,一个单词在向量空间中的位置是从文本中学习的,并且基于使用该文本时的单词,在学习向量空间中的单词的位置称为嵌入位置。词嵌入的方法包括人工神经网络、对词语同现矩阵降维、概率模型以及单词所在上下文的显式表示等。
具体地,在步骤150中,将所述多个数据项词嵌入向量通过基于转换器的上下文编码器以得到全局语义理解特征向量。在数字经济领域中,待评估区域的经济运行状态往往涉及到多个因素和指标,这些因素和指标之间具有复杂的相互关系和影响。为了挖掘其中所蕴含的关联关系,在本申请的技术方案中,将所述多个数据项词嵌入向量基于转换器的上下文编码器以得到全局语义理解特征向量。
这里,将所述多个数据项词嵌入向量输入到转换器的上下文编码器中,可以捕捉各个数据项之间的相互依存关系,从而形成更加全面和准确的特征表示。同时,通过上下文编码器学习到的全局语义理解特征向量,能够提取出数据项之间的潜在语义关系,去除噪声和冗余信息,提高特征的表达能力和判别性。
图5为根据本申请实施例的基于区块链技术的数字经济监测方法中步骤150的子步骤的流程图,如图5所示,将所述多个数据项词嵌入向量基于转换器的上下文编码器以得到全局语义理解特征向量,包括:151,使用所述基于转换器的上下文编码器对所述多个数据项词嵌入向量进行基于全局的上下文语义编码以得到多个数据项全局特征向量;以及,152,将所述多个数据项全局特征向量进行级联以得到所述全局语义理解特征向量。
上下文编码器旨在挖掘得到词序列中上下文之间的隐藏模式,可选地,编码器包括:CNN(Convolutional Neural Network,卷积神经网络)、Recursive NN(RecursiveNeural Network,递归神经网络)、语言模型(Language Model)等。基于CNN的方法对于局部特征有比较好的提取效果,但其对于句子中的长程依赖(Long-termDependency)问题效果欠佳,因此基于Bi-LSTM(Long Short- Term Memory,长短期记忆网络)的编码器被广泛使用。Recursive NN把句子当作树状结构而非序列进行处理,从理论上而言具有更强的表示能力,但其存在样本标注难度大、深层易梯度消失、难以并行计算等弱点,因此在实际应用中使用 较少。Transformer是应用广泛的网络结构了,同时具有CNN和RNN的特性,对于全局特征有较好的提取效果,同时相较于RNN(RecurrentNeural Network,循环神经网络)在并行计算上具有一定优势。
具体地,在步骤160中,将所述全局语义理解特征向量通过分类器以得到分类结果,分类结果用于表示所述待评估区域的经济运行状态是否存在异常。在得到所述全局语义理解特征向量后,将其通过分类器以得到分类结果,分类结果用于表示所述待评估区域的经济运行状态是否存在异常。分类结果能够有效地反映出待评估区域当前的经济运行状态,例如正常或异常。如果分类结果表示经济运行状态存在异常,就需要及时采取措施进行调整和修复,以确保数字经济系统的稳定性和安全性。
图6为根据本申请实施例的基于区块链技术的数字经济监测方法中步骤160的子步骤的流程图,如图6所示,将所述全局语义理解特征向量通过分类器以得到分类结果,分类结果用于表示所述待评估区域的经济运行状态是否存在异常,包括:161,使用所述分类器的多个全连接层对所述全局语义理解特征向量进行全连接编码以得到编码分类特征向量;以及,162,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
在本申请一具体示例中,使用所述分类器以如下公式对所述全局语义理解特征向量进行处理以获得分类结果;其中,所述公式为:
Figure SMS_19
;其中,
Figure SMS_20
到/>
Figure SMS_21
为权重矩阵,/>
Figure SMS_22
到/>
Figure SMS_23
为偏置向量,/>
Figure SMS_24
为所述全局语义理解特征向量。
进一步地,所述基于区块链技术的数字经济监测方法,还包括训练步骤:对所述基于转换器的上下文编码器和所述分类器进行训练;图7为根据本申请实施例的基于区块链技术的数字经济监测方法中步骤170的子步骤的流程图,如图7所示,所述训练步骤170,包括:171,获取训练数据,所述训练数据包括:从区块链结构提取待评估区域的训练经济运行数字信息,以及,所述待评估区域的经济运行状态是否存在异常的真实值;172,对所述待评估区域的训练经济运行数字信息进行预处理以得到训练预处理后经济运行数字信息;173,提取所述训练预处理后经济运行数字信息中的各个数据项的训练属性文本描述和所述各个数据项的训练数值;174,将所述各个数据项的训练属性文本描述通过所述词嵌入层以得到多个训练数据项属性词嵌入向量,并将所述各个数据项的训练数值添加到所述各个训练数据项属性词嵌入向量的末尾以得到多个训练数据项词嵌入向量;175,将所述多个训练数据项词嵌入向量通过所述基于转换器的上下文编码器以得到训练全局语义理解特征向量;176,对所述训练全局语义理解特征向量进行耿贝尔正态周期性重参数化以得到优化全局语义理解特征向量;177,将所述优化全局语义理解特征向量通过分类器以得到分类损失函数值;以及,178,基于所述分类损失函数值和所述待评估区域的经济运行状态是否存在异常的真实值并通过梯度下降的方向传播来对所述基于转换器的上下文编码器和所述分类器进行训练。
在本申请的技术方案中,对于所述全局语义理解特征向量来说,由于其是将所述多个数据项词嵌入向量通过基于转换器的上下文编码器得到的多个上下文数据项词嵌入向量直接级联得到的,尽管基于转换器的上下文编码器对所述多个数据项词嵌入向量进行了上下文语义编码,但是得到的所述多个上下文数据项词嵌入向量直接仍然存在特征分布的显式差异。这样,所述全局语义理解特征向量就会在所述多个上下文数据项词嵌入向量的级联位置存在分布间隙(distribution gap),导致所述全局语义理解特征向量的整体特征分布的连续性差,影响模型训练时的训练效果,例如训练速度和收敛准确性。
基于此,本申请的申请人对所述全局语义理解特征向量,例如记为
Figure SMS_26
进行耿贝尔(Gumbel)正态周期性重参数化,以获得优化后的全局语义理解特征向量,例如记为/>
Figure SMS_30
, 具体表示为:以如下优化公式对所述训练全局语义理解特征向量进行耿贝尔正态周期性重参数化以得到优化全局语义理解特征向量;其中,所述优化公式为:
Figure SMS_33
;其中,/>
Figure SMS_27
表示所述训练全局语义理解特征向量的各个位置的特征值,/>
Figure SMS_28
和/>
Figure SMS_31
分别是所述训练全局语义理解特征向量的各个位置的特征值集合的均值和方差,/>
Figure SMS_34
表示以2为底的对数函数,/>
Figure SMS_25
表示反正弦函数,/>
Figure SMS_29
表示反余弦函数,/>
Figure SMS_32
表示所述优化全局语义理解特征向量的各个位置的特征值。
这里,所述耿贝尔正态周期性重参数化通过将所述全局语义理解特征向量
Figure SMS_35
的各个位置的特征值/>
Figure SMS_36
转换为其概率分布的角特征表达,来基于耿贝尔(Gumbel)分布的随机性周期操作方式在特征值集合的正态分布中引入随机性的周期式分布,以获得原特征分布的具有随机性的周期式连续可微近似,从而通过特征的周期性重参数化来提高优化后的全局语义理解特征向量/>
Figure SMS_37
在训练时损失函数的梯度在模型中反向传播的动态连续波动能力,以提高卷积核在训练过程中的动态应用性,从而补偿所述全局语义理解特征向量的特征分布的不连续对训练效果的影响。
综上,基于本申请实施例的基于区块链技术的数字经济监测方法100被阐明,其从区块链结构提取待评估区域的经济运行数字信息;基于区块链技术,结合人工智能技术对数字经济领域中待评估区域的经济运行状态进行评估,并判断是否存在异常情况,以加强对数字经济领域中的信息安全和稳定运行的保障。
在本申请的一个实施例中,图8为根据本申请实施例的基于区块链技术的数字经济监测系统的框图。如图8所示,根据本申请实施例的基于区块链技术的数字经济监测系统200,包括:信息获取模块210,用于从区块链结构提取待评估区域的经济运行数字信息;预处理模块220,用于对所述待评估区域的经济运行数字信息进行预处理以得到预处理后经济运行数字信息;数据提取模块230,用于提取所述预处理后经济运行数字信息中的各个数据项的属性文本描述和所述各个数据项的数值;词嵌入模块240,用于将所述各个数据项的属性文本描述通过词嵌入层以得到多个数据项属性词嵌入向量,并将所述各个数据项的数值添加到所述各个数据项属性词嵌入向量的末尾以得到多个数据项词嵌入向量;上下文编码模块250,用于将所述多个数据项词嵌入向量通过基于转换器的上下文编码器以得到全局语义理解特征向量;以及,经济运行状态结果生成模块260,用于将所述全局语义理解特征向量通过分类器以得到分类结果,分类结果用于表示所述待评估区域的经济运行状态是否存在异常。
在一个具体示例中,在上述基于区块链技术的数字经济监测系统中,所述词嵌入模块,包括:分词处理单元,用于对所述各个数据项的属性文本描述进行分词处理以将所述各个数据项的属性文本描述转化为由多个词组成的词序列;向量展开单元,用于将所述词序列中的各个词分别排列为一维输入向量以得到多个一维输入向量;以及,编码单元,用于使用所述词嵌入层对所述多个一维输入向量中各个一维输入向量进行全连接编码以得到所述多个数据项属性词嵌入向量。
在一个具体示例中,在上述基于区块链技术的数字经济监测系统中,所述上下文编码模块,包括:上下文语义编码单元,用于使用所述基于转换器的上下文编码器对所述多个数据项词嵌入向量进行基于全局的上下文语义编码以得到多个数据项全局特征向量;以及,级联单元,用于将所述多个数据项全局特征向量进行级联以得到所述全局语义理解特征向量。
在一个具体示例中,在上述基于区块链技术的数字经济监测系统中,所述经济运行状态结果生成模块,包括:全连接编码单元,用于使用所述分类器的多个全连接层对所述全局语义理解特征向量进行全连接编码以得到编码分类特征向量;以及,分类结果单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
在一个具体示例中,在上述基于区块链技术的数字经济监测系统中,还包括对所述基于转换器的上下文编码器和所述分类器进行训练的训练模块;其中,所述训练模块,包括:训练信息获取单元,用于获取训练数据,所述训练数据包括:从区块链结构提取待评估区域的训练经济运行数字信息,以及,所述待评估区域的经济运行状态是否存在异常的真实值;训练预处理单元,用于对所述待评估区域的训练经济运行数字信息进行预处理以得到训练预处理后经济运行数字信息;训练数据提取单元,用于提取所述训练预处理后经济运行数字信息中的各个数据项的训练属性文本描述和所述各个数据项的训练数值;训练词嵌入单元,用于将所述各个数据项的训练属性文本描述通过所述词嵌入层以得到多个训练数据项属性词嵌入向量,并将所述各个数据项的训练数值添加到所述各个训练数据项属性词嵌入向量的末尾以得到多个训练数据项词嵌入向量;训练上下文编码单元,用于将所述多个训练数据项词嵌入向量通过所述基于转换器的上下文编码器以得到训练全局语义理解特征向量;训练优化单元,用于对所述训练全局语义理解特征向量进行耿贝尔正态周期性重参数化以得到优化全局语义理解特征向量;分类损失函数值计算单元,用于将所述优化全局语义理解特征向量通过分类器以得到分类损失函数值;以及,训练单元,用于基于所述分类损失函数值和所述待评估区域的经济运行状态是否存在异常的真实值并通过梯度下降的方向传播来对所述基于转换器的上下文编码器和所述分类器进行训练。
在一个具体示例中,在上述基于区块链技术的数字经济监测系统中,所述训练优化单元,用于:以如下优化公式对所述训练全局语义理解特征向量进行耿贝尔正态周期性重参数化以得到优化全局语义理解特征向量;其中,所述优化公式为:
Figure SMS_40
;其中,/>
Figure SMS_42
表示所述训练全局语义理解特征向量的各个位置的特征值,/>
Figure SMS_44
和/>
Figure SMS_39
分别是所述训练全局语义理解特征向量的各个位置的特征值集合的均值和方差,/>
Figure SMS_41
表示以2为底的对数函数,/>
Figure SMS_43
表示反正弦函数,/>
Figure SMS_45
表示反余弦函数,/>
Figure SMS_38
表示所述优化全局语义理解特征向量的各个位置的特征值。/>
这里,本领域技术人员可以理解,上述基于区块链技术的数字经济监测系统中的各个单元和模块的具体功能和操作已经在上面参考图1到图7的基于区块链技术的数字经济监测方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的基于区块链技术的数字经济监测系统200可以实现在各种终端设备中,例如用于基于区块链技术的数字经济监测的服务器等。在一个示例中,根据本申请实施例的基于区块链技术的数字经济监测系统200可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于区块链技术的数字经济监测系统200可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于区块链技术的数字经济监测系统200同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于区块链技术的数字经济监测系统200与该终端设备也可以是分立的设备,并且基于区块链技术的数字经济监测系统200可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
本申请还提供了一种计算机程序产品,所述计算机程序产品包括指令,当所述指令被执行时,以使得装置执行对应于上述方法中的操作。
在本申请的一个实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述所述方法的计算机程序。
应可以理解,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等) 上实施的计算机程序产品的形式。
本申请实施例的方法、系统、和计算机程序产品的流程图和/或框图来描述的。应理解可由计算机程序指令实现流程图和/或框图中的每一流程和/或方框、以及流程图和/或框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的步骤。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (8)

1.一种基于区块链技术的数字经济监测方法,其特征在于,包括:
从区块链结构提取待评估区域的经济运行数字信息;
对所述待评估区域的经济运行数字信息进行预处理以得到预处理后经济运行数字信息;
提取所述预处理后经济运行数字信息中的各个数据项的属性文本描述和所述各个数据项的数值;
将所述各个数据项的属性文本描述通过词嵌入层以得到多个数据项属性词嵌入向量,并将所述各个数据项的数值添加到所述各个数据项属性词嵌入向量的末尾以得到多个数据项词嵌入向量;
将所述多个数据项词嵌入向量通过基于转换器的上下文编码器以得到全局语义理解特征向量;
以及将所述全局语义理解特征向量通过分类器以得到分类结果,分类结果用于表示所述待评估区域的经济运行状态是否存在异常;
所述基于区块链技术的数字经济监测方法还包括训练步骤:对所述基于转换器的上下文编码器和所述分类器进行训练;
其中,所述训练步骤,包括:
获取训练数据,所述训练数据包括:从区块链结构提取待评估区域的训练经济运行数字信息,以及,所述待评估区域的经济运行状态是否存在异常的真实值;
对所述待评估区域的训练经济运行数字信息进行预处理以得到训练预处理后经济运行数字信息;
提取所述训练预处理后经济运行数字信息中的各个数据项的训练属性文本描述和所述各个数据项的训练数值;
将所述各个数据项的训练属性文本描述通过所述词嵌入层以得到多个训练数据项属性词嵌入向量,并将所述各个数据项的训练数值添加到所述各个训练数据项属性词嵌入向量的末尾以得到多个训练数据项词嵌入向量;
将所述多个训练数据项词嵌入向量通过所述基于转换器的上下文编码器以得到训练全局语义理解特征向量;
对所述训练全局语义理解特征向量进行耿贝尔正态周期性重参数化以得到优化全局语义理解特征向量;
将所述优化全局语义理解特征向量通过分类器以得到分类损失函数值;以及
基于所述分类损失函数值和所述待评估区域的经济运行状态是否存在异常的真实值并通过梯度下降的方向传播来对所述基于转换器的上下文编码器和所述分类器进行训练;
其中,对所述训练全局语义理解特征向量进行耿贝尔正态周期性重参数化以得到优化全局语义理解特征向量,包括:以如下优化公式对所述训练全局语义理解特征向量进行耿贝尔正态周期性重参数化以得到优化全局语义理解特征向量;
其中,所述优化公式为:
Figure QLYQS_2
其中,/>
Figure QLYQS_4
表示所述训练全局语义理解特征向量的各个位置的特征值,/>
Figure QLYQS_6
和/>
Figure QLYQS_3
分别是所述训练全局语义理解特征向量的各个位置的特征值集合的均值和方差,/>
Figure QLYQS_5
表示以2为底的对数函数,/>
Figure QLYQS_7
表示反正弦函数,
Figure QLYQS_8
表示反余弦函数,/>
Figure QLYQS_1
表示所述优化全局语义理解特征向量的各个位置的特征值。
2.根据权利要求1所述的基于区块链技术的数字经济监测方法,其特征在于,将所述各个数据项的属性文本描述通过词嵌入层以得到多个数据项属性词嵌入向量,并将所述各个数据项的数值添加到所述各个数据项属性词嵌入向量的末尾以得到多个数据项词嵌入向量,包括:
对所述各个数据项的属性文本描述进行分词处理以将所述各个数据项的属性文本描述转化为由多个词组成的词序列;
将所述词序列中的各个词分别排列为一维输入向量以得到多个一维输入向量;
以及使用所述词嵌入层对所述多个一维输入向量中各个一维输入向量进行全连接编码以得到所述多个数据项属性词嵌入向量。
3.根据权利要求2所述的基于区块链技术的数字经济监测方法,其特征在于,将所述多个数据项词嵌入向量基于转换器的上下文编码器以得到全局语义理解特征向量,包括:
使用所述基于转换器的上下文编码器对所述多个数据项词嵌入向量进行基于全局的上下文语义编码以得到多个数据项全局特征向量;
以及将所述多个数据项全局特征向量进行级联以得到所述全局语义理解特征向量。
4.根据权利要求3所述的基于区块链技术的数字经济监测方法,其特征在于,将所述全局语义理解特征向量通过分类器以得到分类结果,分类结果用于表示所述待评估区域的经济运行状态是否存在异常,包括:
使用所述分类器的多个全连接层对所述全局语义理解特征向量进行全连接编码以得到编码分类特征向量;
以及将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
5.一种基于区块链技术的数字经济监测系统,其特征在于,包括:
信息获取模块,用于从区块链结构提取待评估区域的经济运行数字信息;
预处理模块,用于对所述待评估区域的经济运行数字信息进行预处理以得到预处理后经济运行数字信息;
数据提取模块,用于提取所述预处理后经济运行数字信息中的各个数据项的属性文本描述和所述各个数据项的数值;
词嵌入模块,用于将所述各个数据项的属性文本描述通过词嵌入层以得到多个数据项属性词嵌入向量,并将所述各个数据项的数值添加到所述各个数据项属性词嵌入向量的末尾以得到多个数据项词嵌入向量;
上下文编码模块,用于将所述多个数据项词嵌入向量通过基于转换器的上下文编码器以得到全局语义理解特征向量;
以及经济运行状态结果生成模块,用于将所述全局语义理解特征向量通过分类器以得到分类结果,分类结果用于表示所述待评估区域的经济运行状态是否存在异常;
所述基于区块链技术的数字经济监测系统还包括对所述基于转换器的上下文编码器和所述分类器进行训练的训练模块;其中,所述训练模块,包括:训练信息获取单元,用于获取训练数据,所述训练数据包括:从区块链结构提取待评估区域的训练经济运行数字信息,以及,所述待评估区域的经济运行状态是否存在异常的真实值;训练预处理单元,用于对所述待评估区域的训练经济运行数字信息进行预处理以得到训练预处理后经济运行数字信息;训练数据提取单元,用于提取所述训练预处理后经济运行数字信息中的各个数据项的训练属性文本描述和所述各个数据项的训练数值;训练词嵌入单元,用于将所述各个数据项的训练属性文本描述通过所述词嵌入层以得到多个训练数据项属性词嵌入向量,并将所述各个数据项的训练数值添加到所述各个训练数据项属性词嵌入向量的末尾以得到多个训练数据项词嵌入向量;训练上下文编码单元,用于将所述多个训练数据项词嵌入向量通过所述基于转换器的上下文编码器以得到训练全局语义理解特征向量;训练优化单元,用于对所述训练全局语义理解特征向量进行耿贝尔正态周期性重参数化以得到优化全局语义理解特征向量;分类损失函数值计算单元,用于将所述优化全局语义理解特征向量通过分类器以得到分类损失函数值;以及,训练单元,用于基于所述分类损失函数值和所述待评估区域的经济运行状态是否存在异常的真实值并通过梯度下降的方向传播来对所述基于转换器的上下文编码器和所述分类器进行训练;
其中,所述训练优化单元,用于:以如下优化公式对所述训练全局语义理解特征向量进行耿贝尔正态周期性重参数化以得到优化全局语义理解特征向量;其中,所述优化公式为:
Figure QLYQS_10
其中,/>
Figure QLYQS_12
表示所述训练全局语义理解特征向量的各个位置的特征值,/>
Figure QLYQS_14
和/>
Figure QLYQS_11
分别是所述训练全局语义理解特征向量的各个位置的特征值集合的均值和方差,/>
Figure QLYQS_13
表示以2为底的对数函数,/>
Figure QLYQS_15
表示反正弦函数,/>
Figure QLYQS_16
表示反余弦函数,/>
Figure QLYQS_9
表示所述优化全局语义理解特征向量的各个位置的特征值。
6.根据权利要求5所述的基于区块链技术的数字经济监测系统,其特征在于,所述词嵌入模块,包括:
分词处理单元,用于对所述各个数据项的属性文本描述进行分词处理以将所述各个数据项的属性文本描述转化为由多个词组成的词序列;
向量展开单元,用于将所述词序列中的各个词分别排列为一维输入向量以得到多个一维输入向量;
以及编码单元,用于使用所述词嵌入层对所述多个一维输入向量中各个一维输入向量进行全连接编码以得到所述多个数据项属性词嵌入向量。
7.根据权利要求6所述的基于区块链技术的数字经济监测系统,其特征在于,所述上下文编码模块,包括:
上下文语义编码单元,用于使用所述基于转换器的上下文编码器对所述多个数据项词嵌入向量进行基于全局的上下文语义编码以得到多个数据项全局特征向量;以及
级联单元,用于将所述多个数据项全局特征向量进行级联以得到所述全局语义理解特征向量。
8.根据权利要求7所述的基于区块链技术的数字经济监测系统,其特征在于,所述经济运行状态结果生成模块,包括:
全连接编码单元,用于使用所述分类器的多个全连接层对所述全局语义理解特征向量进行全连接编码以得到编码分类特征向量;
以及分类结果单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
CN202310370651.9A 2023-04-10 2023-04-10 基于区块链技术的数字经济监测方法及其系统 Active CN116108143B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310370651.9A CN116108143B (zh) 2023-04-10 2023-04-10 基于区块链技术的数字经济监测方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310370651.9A CN116108143B (zh) 2023-04-10 2023-04-10 基于区块链技术的数字经济监测方法及其系统

Publications (2)

Publication Number Publication Date
CN116108143A CN116108143A (zh) 2023-05-12
CN116108143B true CN116108143B (zh) 2023-07-04

Family

ID=86256426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310370651.9A Active CN116108143B (zh) 2023-04-10 2023-04-10 基于区块链技术的数字经济监测方法及其系统

Country Status (1)

Country Link
CN (1) CN116108143B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116405326B (zh) * 2023-06-07 2023-10-20 厦门瞳景智能科技有限公司 基于区块链的信息安全管理方法及其系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114926150A (zh) * 2022-06-18 2022-08-19 国网辽宁省电力有限公司电力科学研究院 一种变压器技术符合性评估数字化智能审核方法与装置
CN115295159A (zh) * 2022-08-11 2022-11-04 联众智慧科技股份有限公司 基于区域数据挖掘的区域人口健康信息管理系统
CN115293910A (zh) * 2022-08-04 2022-11-04 杭州衡泰技术股份有限公司 基于金融大数据的企业现金流智能评级系统
CN115409018A (zh) * 2022-09-20 2022-11-29 浙江书香荷马文化有限公司 基于大数据的公司舆情监测系统及其方法
CN115456789A (zh) * 2022-11-10 2022-12-09 杭州衡泰技术股份有限公司 基于交易模式识别的异常交易检测方法及其系统
CN115830718A (zh) * 2023-02-14 2023-03-21 福建中医药大学 基于步态识别预测康复训练效果的数据处理系统
CN115827939A (zh) * 2022-11-28 2023-03-21 华东冶金地质勘查局八一五地质队 数字化档案管理系统
CN115861983A (zh) * 2022-12-29 2023-03-28 陕西省君凯电子科技有限公司 用于机械设备的智能化管理系统及其方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114926150A (zh) * 2022-06-18 2022-08-19 国网辽宁省电力有限公司电力科学研究院 一种变压器技术符合性评估数字化智能审核方法与装置
CN115293910A (zh) * 2022-08-04 2022-11-04 杭州衡泰技术股份有限公司 基于金融大数据的企业现金流智能评级系统
CN115295159A (zh) * 2022-08-11 2022-11-04 联众智慧科技股份有限公司 基于区域数据挖掘的区域人口健康信息管理系统
CN115409018A (zh) * 2022-09-20 2022-11-29 浙江书香荷马文化有限公司 基于大数据的公司舆情监测系统及其方法
CN115456789A (zh) * 2022-11-10 2022-12-09 杭州衡泰技术股份有限公司 基于交易模式识别的异常交易检测方法及其系统
CN115827939A (zh) * 2022-11-28 2023-03-21 华东冶金地质勘查局八一五地质队 数字化档案管理系统
CN115861983A (zh) * 2022-12-29 2023-03-28 陕西省君凯电子科技有限公司 用于机械设备的智能化管理系统及其方法
CN115830718A (zh) * 2023-02-14 2023-03-21 福建中医药大学 基于步态识别预测康复训练效果的数据处理系统

Also Published As

Publication number Publication date
CN116108143A (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
Devlin et al. Robustfill: Neural program learning under noisy i/o
CN113420296B (zh) 一种基于Bert模型与BiLSTM的C源代码漏洞检测方法
CN116108143B (zh) 基于区块链技术的数字经济监测方法及其系统
CN113378547B (zh) 一种基于gcn的汉语复句隐式关系分析方法及装置
CN111930952A (zh) 一种长文本级联分类方法、系统、设备及存储介质
CN116661805B (zh) 代码表示的生成方法和装置、存储介质及电子设备
CN117609882A (zh) 基于多模态前缀和跨模态注意力的情感分析方法及系统
Latif et al. Can large language models aid in annotating speech emotional data? uncovering new frontiers
CN117350378A (zh) 一种基于语义匹配和知识图谱的自然语言理解算法
CN117113937A (zh) 一种基于大规模语言模型的电力领域阅读理解方法和系统
CN116757773A (zh) 服装电子商务销售管理系统及其方法
CN116595189A (zh) 基于两阶段的零样本关系三元组抽取方法及系统
CN112818688B (zh) 文本处理方法、装置、设备及存储介质
CN114896415A (zh) 基于轻量级自注意力机制的实体关系联合抽取方法及装置
CN111368026A (zh) 基于词语义关系与动态卷积神经网络的文本蕴含分析方法
Zhang et al. BERT Based Fake News Detection Model
Tambadou et al. Defect detection methods for smart contracts based on multimodality
Garkal et al. HMER-Image to LaTeX: A Variational Dropout Approach
CN112528667B (zh) 一种语义解析上的领域迁移方法和装置
Li et al. RoBERTa Word Embedding Based Power Grid Dispatching Entity Recognition
Liu et al. A Machine Reading Comprehension Framework for REST API Information Extraction
CN111832309B (zh) 文本生成方法、装置和计算机可读存储介质
Duo et al. Transition based neural network dependency parsing of Tibetan
CN117113094A (zh) 一种基于语义递进融合的长文本相似度计算方法及装置
Lv et al. A Code Completion Approach Based on Abstract Syntax Tree Splitting and Tree-LSTM

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant