CN116542252B - 一种金融文本核查方法及系统 - Google Patents
一种金融文本核查方法及系统 Download PDFInfo
- Publication number
- CN116542252B CN116542252B CN202310830451.7A CN202310830451A CN116542252B CN 116542252 B CN116542252 B CN 116542252B CN 202310830451 A CN202310830451 A CN 202310830451A CN 116542252 B CN116542252 B CN 116542252B
- Authority
- CN
- China
- Prior art keywords
- node
- target node
- checked
- calculating
- evidence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000006870 function Effects 0.000 claims description 48
- 238000012795 verification Methods 0.000 claims description 21
- 230000004913 activation Effects 0.000 claims description 16
- 230000009466 transformation Effects 0.000 claims description 15
- 230000003993 interaction Effects 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000007246 mechanism Effects 0.000 claims description 8
- 230000010354 integration Effects 0.000 claims description 5
- 210000002569 neuron Anatomy 0.000 description 10
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种金融文本核查方法及系统,属于文本核查技术领域,方法包括:获取待核查金融文本;检索待核查金融文本的多条相关证据;将待核查金融文本和每个相关证据进行拼接,构造关于待核查金融文本的推理图;计算目标节点中的词语对相邻节点的词语的第一注意力权重,获取相邻节点的细粒度信息;计算目标节点对相邻节点的第二注意力权重;利用第二注意力权重对目标节点进行更新,得到多证据节点;计算目标节点为真实标签的第一概率;计算目标节点在推理图中被选择的第二概率;整合第一概率和相应的第二概率,计算待核查金融文本为真实标签的目标概率。降低人工核查参与度,提升核查客观性的同时,提升核查效率和核查结果的可信度。
Description
技术领域
本发明属于文本核查技术领域,具体涉及一种金融文本核查方法及系统。
背景技术
在金融领域,文本核查是指对金融相关的文件、报告、公告等进行审核和验证的过程。为了确保信息的准确性和可信度,金融机构和专业人士会采用各种方法来核实文本中的信息。这些方法可能包括使用自动化工具和算法来检测错误或异常、进行数据分析和比对、查阅权威资料和数据库、与相关方沟通确认等等。通过应用适当的文本核查方法,可以帮助金融从业者更好地了解和评估金融文本所传递的信息,以支持决策和风险管理。
现有技术中,所有的金融文本核查都依赖于人工进行文本可信度判断,工作量大,主观性强,而且由于核查人员的知识局限性,给出的判断结果准确率低。
发明内容
为了解决现有技术存在的所有的金融文本核查都依赖于人工进行文本可信度判断,工作量大,主观性强,而且由于核查人员的知识局限性,给出的判断结果准确率低的技术问题,本发明提供一种金融文本核查方法及系统。
第一方面
本发明提供了一种金融文本核查方法,包括:
S101:获取待核查金融文本;
S102:检索待核查金融文本的多条相关证据;
S103:将待核查金融文本和每个相关证据进行拼接,将每个拼接结果均作为节点进行全连接,构造关于待核查金融文本的推理图;
S104:结合基于核函数的注意力机制,计算目标节点中的词语对相邻节点的词语的第一注意力权重,获取相邻节点的细粒度信息,其中,目标节点为推理图中的任意一个节点;
S105:根据细粒度信息,计算目标节点对相邻节点的第二注意力权重;
S106:利用第二注意力权重对目标节点进行更新,得到多证据节点;
S107:结合多证据节点,计算目标节点为真实标签的第一概率;
S108:计算目标节点中的待核查金融文本和相关证据的匹配特征信息;
S109:根据匹配特征信息,计算目标节点在推理图中被选择的第二概率;
S110:整合所有的目标节点的第一概率和相应的第二概率,计算待核查金融文本为真实标签的目标概率。
第二方面
本发明提供了一种金融文本核查系统,用于执行第一方面中的金融文本核查方法。
与现有技术相比,本发明至少具有以下有益技术效果:
在本发明中,通过获取待核查金融文本的多条相关证据,并构建推理图,引入基于核函数的注意力机制抓取各节点之间的语义相似度,获取目标节点和相邻节点中相对应词语的细粒度信息,进而在词语级别上控制相邻节点到目标节点的证据传播,之后计算并利用目标节点对各相邻节点的第二注意力权重对目标节点进行更新,融合检索得到的多条相关证据进行联合推理得到多证据节点,并根据多证据节点计算目标节点为真的第一概率,预测准确率高。之后计算目标节点中的待核查金融文本和相关证据的匹配特征信息,进而计算得到目标节点为真第二概率,之后根据第一概率和第二概率进行整合,推理出目标节点中的待核查金融文本为真的目标概率,进一步提升预测准确性,避免单一证据推理和人工推理导致的结果局限性,在降低人工核查参与度,提升核查客观性的同时,减轻核查人员的工作负担,提升核查效率和核查结果的可信度。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对本发明的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明提供的一种金融文本核查方法的流程示意图;
图2是本发明提供的一种金融文本核查系统的结构示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
在本文中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
另外,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1
在一个实施例中,参考说明书附图1,示出了本发明提供的金融文本核查方法的流程示意图。
本发明提供的一种金融文本核查方法,包括:
S101:获取待核查金融文本。
其中,待核查金融文本的格式可以是.txt、.docx、.pdf、.md、.html等,对于不能直接自动识别的文本来源可以通过格式转换,转成相应的可读取格式进行文本识别。
需要说明的是,待核查金融文本可以是词语、句子或者一篇文章,这些内容均可作为一个单位进行自动核查。
S102:检索待核查金融文本的多条相关证据。
需要说明的是,检索方式可以通过百度、谷歌、必应或者维基百科等搜索引擎进行检索,也可以查询金融领域相关的数据库,如金融新闻数据库、学术论文数据库、金融报告数据库等,而且也可以直接访问一些可信度较高的软件API,获取金融相关信息,获取到多条相关证据。在检索的过程中,为了提高最终的预测准确性,可以分词、分句、分段的进行检索。对于概括性或者主旨性较强的文章可以直接按主题进行检索,提升检索效率。
S103:将待核查金融文本和每个相关证据进行拼接,将每个拼接结果均作为节点进行全连接,构造关于待核查金融文本的推理图。
其中,全连接是指神经网络中的一种连接方式,也被称为密集连接或全连接层。在全连接层中,每个神经元与前一层的所有神经元相连接。
具体而言,全连接层是指网络中的一层神经元,其中每个神经元与前一层的所有神经元都有连接。每个连接都有一个权重,用于调整传递的信号。全连接层中的每个神经元接收来自前一层所有神经元的输入,并通过对输入进行加权求和和激活函数处理,产生输出。全连接层的主要特点是每个神经元与前一层的所有神经元都有连接,这意味着它能够捕捉到前一层中所有神经元的信息。全连接层在神经网络中通常用于提取高级特征。在深度学习中,全连接层通常位于神经网络的最后一层,用于将高级特征映射到输出类别或进行回归预测。将全连接得到的连接图作为待核查金融文本的推理图,用于表示待核查文本和相关证据之间的关联关系。这样的推理图可以用于后续的分析、推理或预测任务,便于提取节点之间的特征信息,并进行联合推理,避免单一证据推理得到的结果不准确的情况。
S104:结合基于核函数的注意力机制,计算目标节点中的词语对相邻节点的词语的第一注意力权重,获取相邻节点的细粒度信息。
其中,核函数是一种用于度量两个数据样本之间相似性的函数。它将输入数据映射到一个高维特征空间,并计算在该特征空间中的相似度。
其中,细粒度信息是控制相邻节点向目标节点的证据传播的信息特征,通过获取到的相邻节点的细粒度信息,可以在词语级别上得到更加准确的向目标节点传播的能力,避免直接整段或者整篇文章进行推理导致的结果偏差较大的情况。
其中,目标节点为推理图中的任意一个节点。
在一种可能的实施方式中,S104具体包括:
S1041:利用余弦相似度,计算目标节点的词语对相邻节点的词语的相似度值:
其中,分别表示目标节点中的第i个词语隐状态和相邻节点中的第j个词语隐状态。
其中,隐状态表示是一种通过建模语言的潜在结构或潜在变量来捕捉上下文信息的结构,它是基于神经网络模型构建的,通过在模型中引入隐状态,可以将上下文的语义信息编码到词语表示中。
具体而言,隐状态表示是一种根据上下文动态调整词语表示的方法。它考虑了词语周围的语境和上下文,使得词语的表示能够更好地反映词语在不同上下文中的语义变化。通过引入隐状态表示,可以增强模型对句子或文本的语义理解和表达能力。通过捕捉每个词语的信息,并将其融入到词语的表示中,以提高对上下文语义的建模和理解能力,以便更好的为联合推理做铺垫。
S1042:基于相似度值建立目标节点和相邻节点的交互矩阵。
其中,交互矩阵的每个元素都是目标节点和相邻节点的余弦相似度值。
S1043:结合交互矩阵,计算目标节点的词语对相邻节点的词语的语义匹配特征值:
其中,和/>分别表示第k个核函数的均值和方差,q表示相邻节点,p表示目标节点。
S1044:利用Linear线性变换函数和softmax激活函数,计算目标节点中的词语对相邻节点的词语的第一注意力权重:
。
其中, Linear线性变换函数表示对输入参数进行线性变换,包括矩阵乘法、加权和等操作,以产生新的表示。线性变换的目的是通过学习适当的权重和偏置,将匹配特征映射到一个新的空间,以更好地表示目标节点的相关信,softmax函数是一种常用的激活函数,可以将输入转化为概率分布。将线性变换后的结果归一化为概率分布。
S1045:利用第一注意力权重,整合目标节点的词语,得到相邻节点的细粒度信息,以控制相邻节点向目标节点的证据传播:
其中,m表示待核查金融文本的词语数量,n表示相关证据的词语数量。
S105:根据细粒度信息,计算目标节点对相邻节点的第二注意力权重。
在一种可能的实施方式中,S105具体为:
S1051:引入多层感知机,结合softmax激活函数,计算目标节点对相邻节点的第二注意力权重:
其中,“”表示拼接操作,/>表示目标节点的初始化表示,即隐状态。
需要说明的是,通过计算第二注意力权重,可以进一步确定目标节点对相邻节点的重要程度,从而更好地捕捉推理图中节点之间的关系和依赖。这有助于提供更准确的节点表示和更有效的信息传递,进而为预测待验证文本的事实验证标签提供更准确的依据。
S106:利用第二注意力权重对目标节点进行更新,得到多证据节点。
在一种可能的实施方式中,S106具体为:
S1061:通过第二注意力权重对细粒度信息进行加权求和,对目标节点进行更新,得到目标节点的多证据节点:
其中,表示与相关证据相对应的节点总数量。
需要说明的是,通过将待核查金融文本和检索到的相关证据,通过细粒度处理,从词语级别获取到相邻节点到目标节点的证据传播能力,而不是直接采用整篇文正进行模糊处理,这样增加了各个相关证据之间的传播准确性,提升最终的金融文本核查可信度。
S107:结合多证据节点,计算目标节点为真实标签的第一概率。
在一种可能的实施方式中,S107具体为:
S1071:利用Linear线性变换函数和softmax激活函数,计算目标节点为真实标签的第一概率:
其中,G表示推理图,表示目标节点。
需要说明的是,每个目标节点相对应的多证据节点是通过汇总推理图中与之相邻的节点的推理信息,使用这个多证据节点对目标节点进行更新的,因此,每个目标节点的真实概率取决于与其相关联的相邻节点所提供的推理信息,这样融合多个节点推理得到的目标节点的真实性就得到了保障,避免单一因素影响。
S108:计算目标节点中的待核查金融文本和相关证据的匹配特征信息。
需要说明的是,在最开始每个节点的建立过程是直接将待核查金融文本分别与相关证据连接,并未考虑节点与相关证据的关联性,在这一步,通过计算目标节点中的待核查金融文本和相关证据的匹配特征信息,提取每个节点内部待核查金融文本和相关证据的相似度特征,将该因素加入到目标节点的真实性概率的计算过程,根据相似度特征确定每个节点的相应权重,降低可信度低证据的权重,最大程度的增加可信证据的权重,提升最终预测准确率。
在一种可能的实施方式中,S108具体包括:
S1081:建立目标节点中的待核查金融文本和相关证据的交互矩阵。
S1082:利用核函数计算目标节点中的待核查金融文本和相关证据的匹配特征信息;
其中,c表示待验证文本,表示相关证据。
S109:根据匹配特征信息,计算目标节点在推理图中被选择的第二概率。
在一种可能的实施方式中,S109具体为:
S1091:利用Linear线性变换函数和softmax激活函数,计算目标节点为真实标签的第二概率:
。
可以理解的是,在S108中通过计算每个节点内待核查金融文本和相关证据的相似性程度,基于此,在整个推理图中,为了区分每个节点的重要性程度,将每个节点的相似性程度作为度量标准,将相似性低的节点权重降低,相似性高的节点权重提高,这样通过最终的联合推理结果既避免了单一证据导致的推理偏差,也保证了推理结果的可靠性。
S110:整合所有的目标节点的第一概率和相应的第二概率,计算待核查金融文本为真实标签的目标概率。
需要说明的是,对于推理图中的每个节点都具有一个预测结果也就是第一概率,不论预测结果高低,结合S108中的节点内匹配特征信息对每个节点的预测结果进行权重分配,这个分配的过程也就是第二概率的计算过程,每个节点的第一概率和第二概率的乘积代表了该节点为真实标签的概率,通过将权重不同也就是与待核查金融文本相似度不同的各个节点的权重进行累加,得到最终的待核查金融文本为真实标签的目标概率。得到的目标概率融合了联合推理的优点,降低无关证据和低相关证据对待核查金融文本的可信度判定的影响,提高了预测准确性。
在一种可能的实施方式中,S110具体为:
S1101:将所有的目标节点的第一概率和相应的第二概率进行加权整合,计算待核查金融文本为真实标签的目标概率:
。
与现有技术相比,本发明至少具有以下有益技术效果:
在本发明中,通过获取待核查金融文本的多条相关证据,并构建推理图,引入基于核函数的注意力机制抓取各节点之间的语义相似度,获取目标节点和相邻节点中相对应词语的细粒度信息,进而在词语级别上控制相邻节点到目标节点的证据传播,之后计算并利用目标节点对各相邻节点的第二注意力权重对目标节点进行更新,融合检索得到的多条相关证据进行联合推理得到多证据节点,并根据多证据节点计算目标节点为真的第一概率,预测准确率高。之后计算目标节点中的待核查金融文本和相关证据的匹配特征信息,进而计算得到目标节点为真第二概率,之后根据第一概率和第二概率进行整合,推理出目标节点中的待核查金融文本为真的目标概率,进一步提升预测准确性,避免单一证据推理和人工推理导致的结果局限性,在降低人工核查参与度,提升核查客观性的同时,减轻核查人员的工作负担,提升核查效率和核查结果的可信度。
实施例2
参考说明书附图2,示出了本发明提供的一种金融文本核查系统的结构示意图。
在一个实施例中,本发明提供的一种金融文本核查系统20,用于执行实施例1中的金融文本核查方法,金融文本核查系统20包括:
获取模块201,用于获取待核查金融文本;
检索模块202,用于检索待核查金融文本的多条相关证据;
拼接模块203,用于将待核查金融文本和每个相关证据进行拼接,将每个拼接结果均作为节点进行全连接,构造关于待核查金融文本的推理图;
第一计算模块204,用于结合基于核函数的注意力机制,计算目标节点中的词语对相邻节点的词语的第一注意力权重,获取相邻节点的细粒度信息,其中,目标节点为推理图中的任意一个节点;
第二计算模块205,用于根据细粒度信息,计算目标节点对相邻节点的第二注意力权重;
更新模块206,用于利用第二注意力权重对目标节点进行更新,得到多证据节点;
第三计算模块207,用于结合多证据节点,计算目标节点为真实标签的第一概率;
第四计算模块208,用于计算目标节点中的待核查金融文本和相关证据的匹配特征信息;
第五计算模块209,用于根据匹配特征信息,计算目标节点在推理图中被选择的第二概率;
整合模块210,用于整合所有的目标节点的第一概率和相应的第二概率,计算待核查金融文本为真实标签的目标概率。
在一种可能的实施方式中,第一计算模块204具体包括:
第一计算子模块,用于利用余弦相似度,计算目标节点的词语对相邻节点的词语的相似度值:
其中,分别表示目标节点中的第i个词语隐状态和相邻节点中的第j个词语隐状态;
建立子模块,用于基于相似度值建立目标节点和相邻节点的交互矩阵;
第二计算子模块,用于结合交互矩阵,计算目标节点的词语对相邻节点的词语的语义匹配特征值:
其中,和/>分别表示第k个核函数的均值和方差,q表示相邻节点,p表示目标节点;
第三计算子模块,用于利用Linear线性变换函数和softmax激活函数,计算目标节点中的词语对相邻节点的词语的第一注意力权重:
;
整合子模块,用于利用第一注意力权重,整合目标节点的词语,得到相邻节点的细粒度信息,以控制相邻节点向目标节点的证据传播:
其中,m表示待核查金融文本的词语数量,n表示相关证据的词语数量。
在一种可能的实施方式中,第二计算模块205具体包括:
第四计算子模块,用于引入多层感知机,结合softmax激活函数,计算目标节点对相邻节点的第二注意力权重:
其中,“”表示拼接操作,/>表示目标节点的初始化表示,即隐状态。
在一种可能的实施方式中,更新模块206具体包括:
更新子模块,用于通过第二注意力权重对细粒度信息进行加权求和,对目标节点进行更新,得到目标节点的多证据节点:
其中,l表示与相关证据相对应的节点总数量。
在一种可能的实施方式中,第三计算模块207具体包括:
第五计算子模块,用于利用Linear线性变换函数和softmax激活函数,计算目标节点为真实标签的第一概率:
其中,G表示推理图,表示目标节点。
在一种可能的实施方式中,第四计算模块208具体包括:
建立子模块,用于建立目标节点中的待核查金融文本和相关证据的交互矩阵;
第六计算子模块,用于利用核函数计算目标节点中的待核查金融文本和相关证据的匹配特征信息;
其中,c表示待验证文本,表示相关证据。
在一种可能的实施方式中,第五计算模块209具体包括:
第七计算子模块,用于利用Linear线性变换函数和softmax激活函数,计算目标节点为真实标签的第二概率:
。
在一种可能的实施方式中,整合模块210具体包括:
第八计算子模块,用于将所有的目标节点的第一概率和相应的第二概率进行加权整合,计算待核查金融文本为真实标签的目标概率:
。
本发明提供的一种金融文本核查系统20可以实现上述实施例1中的金融文本核查方法的步骤和效果,为避免重复,本发明不再赘述。
与现有技术相比,本发明至少具有以下有益技术效果:
在本发明中,通过获取待核查金融文本的多条相关证据,并构建推理图,引入基于核函数的注意力机制抓取各节点之间的语义相似度,获取目标节点和相邻节点中相对应词语的细粒度信息,进而在词语级别上控制相邻节点到目标节点的证据传播,之后计算并利用目标节点对各相邻节点的第二注意力权重对目标节点进行更新,融合检索得到的多条相关证据进行联合推理得到多证据节点,并根据多证据节点计算目标节点为真的第一概率,预测准确率高。之后计算目标节点中的待核查金融文本和相关证据的匹配特征信息,进而计算得到目标节点为真第二概率,之后根据第一概率和第二概率进行整合,推理出目标节点中的待核查金融文本为真的目标概率,进一步提升预测准确性,避免单一证据推理和人工推理导致的结果局限性,在降低人工核查参与度,提升核查客观性的同时,减轻核查人员的工作负担,提升核查效率和核查结果的可信度。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种金融文本核查方法,其特征在于,包括:
S101:获取待核查金融文本;
S102:检索所述待核查金融文本的多条相关证据;
S103:将所述待核查金融文本和每个所述相关证据进行拼接,将每个拼接结果均作为节点进行全连接,构造关于所述待核查金融文本的推理图;
S104:结合基于核函数的注意力机制,计算目标节点中的词语对相邻节点的词语的第一注意力权重,获取所述相邻节点的细粒度信息,其具体步骤包括:
S1041:利用余弦相似度,计算所述目标节点的词语对所述相邻节点的词语的相似度值:
;
其中,分别表示所述目标节点中的第i个词语隐状态和所述相邻节点中的第j个词语隐状态,所述目标节点为所述推理图中的任意一个节点;
S1042:基于所述相似度值建立所述目标节点和所述相邻节点的交互矩阵;
S1043:结合所述交互矩阵,计算所述目标节点的词语对所述相邻节点的词语的语义匹配特征值:
;
其中,和/>分别表示第k个核函数的均值和方差,q表示所述相邻节点,p表示所述目标节点;
S1044:利用Linear线性变换函数和softmax激活函数,计算所述目标节点中的词语对相邻节点的词语的第一注意力权重:
;
S1045:利用所述第一注意力权重,整合所述目标节点的词语,得到所述相邻节点的细粒度信息,以控制所述相邻节点向所述目标节点的证据传播:
;
其中,m表示所述待核查金融文本的词语数量,n表示所述相关证据的词语数量;
S105:根据所述细粒度信息,计算所述目标节点对所述相邻节点的第二注意力权重;
S106:利用所述第二注意力权重对所述目标节点进行更新,得到多证据节点;
S107:结合所述多证据节点,计算所述目标节点为真实标签的第一概率;
S108:计算所述目标节点中的待核查金融文本和相关证据的匹配特征信息;
S109:根据所述匹配特征信息,计算所述目标节点在所述推理图中被选择的第二概率;
S110:整合所有的所述目标节点的第一概率和相应的第二概率,计算所述待核查金融文本为真实标签的目标概率。
2.根据权利要求1所述的金融文本核查方法,其特征在于,所述S105具体为:
S1051:引入多层感知机,结合softmax激活函数,计算所述目标节点对所述相邻节点的第二注意力权重:
;
其中,“”表示拼接操作,/>表示所述目标节点的初始化表示,即隐状态。
3.根据权利要求1所述的金融文本核查方法,其特征在于,所述S106具体为:
S1061:通过所述第二注意力权重对所述细粒度信息进行加权求和,对所述目标节点进行更新,得到所述目标节点的多证据节点:
;
其中,l表示与所述相关证据相对应的节点总数量。
4.根据权利要求1所述的金融文本核查方法,其特征在于,所述S107具体为:
S1071:利用Linear线性变换函数和softmax激活函数,计算所述目标节点为真实标签的第一概率:
;
其中,G表示所述推理图,表示所述目标节点。
5.根据权利要求1所述的金融文本核查方法,其特征在于,所述S108具体包括:
S1081:建立所述目标节点中的待核查金融文本和相关证据的交互矩阵;
S1082:利用核函数计算所述目标节点中的待核查金融文本和相关证据的匹配特征信息;
;
其中,c表示所述待核查金融文本,表示所述相关证据。
6.根据权利要求1所述的金融文本核查方法,其特征在于,所述S109具体为:
S1091:利用Linear线性变换函数和softmax激活函数,计算所述目标节点为真实标签的第二概率:
。
7.根据权利要求1所述的金融文本核查方法,其特征在于,所述S110具体为:
S1101:将所有的所述目标节点的第一概率和相应的第二概率进行加权整合,计算所述待核查金融文本为真实标签的目标概率:/>。
8.一种金融文本核查系统,其特征在于,包括:
获取模块,用于获取待核查金融文本;
检索模块,用于检索所述待核查金融文本的多条相关证据;
拼接模块,用于将所述待核查金融文本和每个所述相关证据进行拼接,将每个拼接结果均作为节点进行全连接,构造关于所述待核查金融文本的推理图;
第一计算模块,用于结合基于核函数的注意力机制,计算目标节点中的词语对相邻节点的词语的第一注意力权重,获取所述相邻节点的细粒度信息,其中,所述目标节点为所述推理图中的任意一个节点,其具体步骤包括:
S1041:利用余弦相似度,计算所述目标节点的词语对所述相邻节点的词语的相似度值:
;
其中,分别表示所述目标节点中的第i个词语隐状态和所述相邻节点中的第j个词语隐状态,所述目标节点为所述推理图中的任意一个节点;
S1042:基于所述相似度值建立所述目标节点和所述相邻节点的交互矩阵;
S1043:结合所述交互矩阵,计算所述目标节点的词语对所述相邻节点的词语的语义匹配特征值:
;
其中,和/>分别表示第k个核函数的均值和方差,q表示所述相邻节点,p表示所述目标节点;
S1044:利用Linear线性变换函数和softmax激活函数,计算所述目标节点中的词语对相邻节点的词语的第一注意力权重:
;
S1045:利用所述第一注意力权重,整合所述目标节点的词语,得到所述相邻节点的细粒度信息,以控制所述相邻节点向所述目标节点的证据传播:
;
其中,m表示所述待核查金融文本的词语数量,n表示所述相关证据的词语数量;
第二计算模块,用于根据所述细粒度信息,计算所述目标节点对所述相邻节点的第二注意力权重;
更新模块,用于利用所述第二注意力权重对所述目标节点进行更新,得到多证据节点;
第三计算模块,用于结合所述多证据节点,计算所述目标节点为真实标签的第一概率;
第四计算模块,用于计算所述目标节点中的待核查金融文本和相关证据的匹配特征信息;
第五计算模块,用于根据所述匹配特征信息,计算所述目标节点在所述推理图中被选择的第二概率;
整合模块,用于整合所有的所述目标节点的第一概率和相应的第二概率,计算所述待核查金融文本为真实标签的目标概率。
9.根据权利要求8所述的金融文本核查系统,其特征在于,所述第一计算模块具体包括:
第一计算子模块,用于利用余弦相似度,计算所述目标节点的词语对所述相邻节点的词语的相似度值:
;
其中,分别表示所述目标节点中的第i个词语隐状态和所述相邻节点中的第j个词语隐状态;
建立子模块,用于基于所述相似度值建立所述目标节点和所述相邻节点的交互矩阵;
第二计算子模块,用于结合所述交互矩阵,计算所述目标节点的词语对所述相邻节点的词语的语义匹配特征值:/>;
其中,和/>分别表示第k个核函数的均值和方差,q表示所述相邻节点,p表示所述目标节点;
第三计算子模块,用于利用Linear线性变换函数和softmax激活函数,计算所述目标节点中的词语对相邻节点的词语的第一注意力权重:
;
整合子模块,用于利用所述第一注意力权重,整合所述目标节点的词语,得到所述相邻节点的细粒度信息,以控制所述相邻节点向所述目标节点的证据传播:
;
其中,m表示所述待核查金融文本的词语数量,n表示所述相关证据的词语数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310830451.7A CN116542252B (zh) | 2023-07-07 | 2023-07-07 | 一种金融文本核查方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310830451.7A CN116542252B (zh) | 2023-07-07 | 2023-07-07 | 一种金融文本核查方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116542252A CN116542252A (zh) | 2023-08-04 |
CN116542252B true CN116542252B (zh) | 2023-09-29 |
Family
ID=87443977
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310830451.7A Active CN116542252B (zh) | 2023-07-07 | 2023-07-07 | 一种金融文本核查方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116542252B (zh) |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491414A (zh) * | 2018-02-05 | 2018-09-04 | 中国科学院信息工程研究所 | 一种融合话题特征的新闻内容在线抽取方法及系统 |
CN109117479A (zh) * | 2018-08-13 | 2019-01-01 | 数据地平线(广州)科技有限公司 | 一种金融文档智能核查方法、装置及存储介质 |
CN110083836A (zh) * | 2019-04-24 | 2019-08-02 | 哈尔滨工业大学 | 一种文本预测结果的关键证据抽取方法 |
CN110210037A (zh) * | 2019-06-12 | 2019-09-06 | 四川大学 | 面向循证医学领域的类别检测方法 |
CN111581980A (zh) * | 2020-05-06 | 2020-08-25 | 西安交通大学 | 基于决策树与共同注意力协作的假新闻检测系统及方法 |
CN112000818A (zh) * | 2020-07-10 | 2020-11-27 | 中国科学院信息工程研究所 | 一种面向文本和图像的跨媒体检索方法及电子装置 |
CN112528036A (zh) * | 2020-11-30 | 2021-03-19 | 大连理工大学 | 一种面向证据关联分析的知识图谱自动构建方法 |
CN112732903A (zh) * | 2020-09-19 | 2021-04-30 | 中国人民解放军战略支援部队信息工程大学 | 即时通信信息取证过程中证据分类方法及系统 |
CN113157886A (zh) * | 2021-04-19 | 2021-07-23 | 西安交通大学深圳研究院 | 一种自动问答生成方法、系统、终端及可读存储介质 |
WO2021184311A1 (zh) * | 2020-03-19 | 2021-09-23 | 中山大学 | 一种自动生成可推理问答的方法和装置 |
CN113641789A (zh) * | 2021-08-11 | 2021-11-12 | 福州大学 | 基于分层融合多头注意力网络和卷积网络的观点检索方法及系统 |
CN114756681A (zh) * | 2022-04-28 | 2022-07-15 | 西安交通大学 | 一种基于多注意力融合的评教文本细粒度建议挖掘方法 |
CN114896388A (zh) * | 2022-03-07 | 2022-08-12 | 武汉理工大学 | 一种基于混合注意力的层级多标签文本分类方法 |
CN114896517A (zh) * | 2022-05-26 | 2022-08-12 | 西安建筑科技大学 | 一种商品推荐方法、系统、设备及存储介质 |
CN115203406A (zh) * | 2022-06-23 | 2022-10-18 | 浙江大学 | 一种基于RoBERTa模型的长文本信息立场检测方法 |
CN115269786A (zh) * | 2022-09-28 | 2022-11-01 | 吉林大学 | 可解释的虚假文本检测方法、装置、存储介质以及终端 |
CN115408190A (zh) * | 2022-08-31 | 2022-11-29 | 北京理工大学 | 故障诊断方法和装置 |
CN115759119A (zh) * | 2023-01-10 | 2023-03-07 | 暨南大学 | 一种金融文本情感分析方法、系统、介质和设备 |
CN116304748A (zh) * | 2023-05-17 | 2023-06-23 | 成都工业学院 | 一种文本相似度计算方法、系统、设备及介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190079916A1 (en) * | 2017-09-11 | 2019-03-14 | International Business Machines Corporation | Using syntactic analysis for inferring mental health and mental states |
US11562591B2 (en) * | 2019-12-23 | 2023-01-24 | Insurance Services Office, Inc. | Computer vision systems and methods for information extraction from text images using evidence grounding techniques |
-
2023
- 2023-07-07 CN CN202310830451.7A patent/CN116542252B/zh active Active
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491414A (zh) * | 2018-02-05 | 2018-09-04 | 中国科学院信息工程研究所 | 一种融合话题特征的新闻内容在线抽取方法及系统 |
CN109117479A (zh) * | 2018-08-13 | 2019-01-01 | 数据地平线(广州)科技有限公司 | 一种金融文档智能核查方法、装置及存储介质 |
CN110083836A (zh) * | 2019-04-24 | 2019-08-02 | 哈尔滨工业大学 | 一种文本预测结果的关键证据抽取方法 |
CN110210037A (zh) * | 2019-06-12 | 2019-09-06 | 四川大学 | 面向循证医学领域的类别检测方法 |
WO2021184311A1 (zh) * | 2020-03-19 | 2021-09-23 | 中山大学 | 一种自动生成可推理问答的方法和装置 |
CN111581980A (zh) * | 2020-05-06 | 2020-08-25 | 西安交通大学 | 基于决策树与共同注意力协作的假新闻检测系统及方法 |
CN112000818A (zh) * | 2020-07-10 | 2020-11-27 | 中国科学院信息工程研究所 | 一种面向文本和图像的跨媒体检索方法及电子装置 |
CN112732903A (zh) * | 2020-09-19 | 2021-04-30 | 中国人民解放军战略支援部队信息工程大学 | 即时通信信息取证过程中证据分类方法及系统 |
CN112528036A (zh) * | 2020-11-30 | 2021-03-19 | 大连理工大学 | 一种面向证据关联分析的知识图谱自动构建方法 |
CN113157886A (zh) * | 2021-04-19 | 2021-07-23 | 西安交通大学深圳研究院 | 一种自动问答生成方法、系统、终端及可读存储介质 |
CN113641789A (zh) * | 2021-08-11 | 2021-11-12 | 福州大学 | 基于分层融合多头注意力网络和卷积网络的观点检索方法及系统 |
CN114896388A (zh) * | 2022-03-07 | 2022-08-12 | 武汉理工大学 | 一种基于混合注意力的层级多标签文本分类方法 |
CN114756681A (zh) * | 2022-04-28 | 2022-07-15 | 西安交通大学 | 一种基于多注意力融合的评教文本细粒度建议挖掘方法 |
CN114896517A (zh) * | 2022-05-26 | 2022-08-12 | 西安建筑科技大学 | 一种商品推荐方法、系统、设备及存储介质 |
CN115203406A (zh) * | 2022-06-23 | 2022-10-18 | 浙江大学 | 一种基于RoBERTa模型的长文本信息立场检测方法 |
CN115408190A (zh) * | 2022-08-31 | 2022-11-29 | 北京理工大学 | 故障诊断方法和装置 |
CN115269786A (zh) * | 2022-09-28 | 2022-11-01 | 吉林大学 | 可解释的虚假文本检测方法、装置、存储介质以及终端 |
CN115759119A (zh) * | 2023-01-10 | 2023-03-07 | 暨南大学 | 一种金融文本情感分析方法、系统、介质和设备 |
CN116304748A (zh) * | 2023-05-17 | 2023-06-23 | 成都工业学院 | 一种文本相似度计算方法、系统、设备及介质 |
Non-Patent Citations (1)
Title |
---|
黄周捷等.基于实体图神经网络的事实核实方法. 指挥信息系统与技术.全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN116542252A (zh) | 2023-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021103492A1 (zh) | 一种企业经营风险预测方法和系统 | |
Lauren et al. | Generating word embeddings from an extreme learning machine for sentiment analysis and sequence labeling tasks | |
CN111552855B (zh) | 一种基于深度学习的网络威胁情报自动抽取方法 | |
US11531824B2 (en) | Cross-lingual information retrieval and information extraction | |
US20200334249A1 (en) | Automatic transformation of complex tables in documents into computer understandable structured format and providing schema-less query support data extraction | |
CN110532398B (zh) | 基于多任务联合神经网络模型的家族图谱自动构建方法 | |
CN113312480B (zh) | 基于图卷积网络的科技论文层级多标签分类方法及设备 | |
CN112380344B (zh) | 文本分类的方法、话题生成的方法、装置、设备及介质 | |
Lu et al. | Research on classification and similarity of patent citation based on deep learning | |
CN115547466B (zh) | 基于大数据的医疗机构登记评审系统及其方法 | |
ul Hassan et al. | Computer-assisted separation of design-build contract requirements to support subcontract drafting | |
CN113449204B (zh) | 基于局部聚合图注意力网络的社会事件分类方法、装置 | |
CN113761208A (zh) | 一种基于知识图谱的科技创新资讯分类方法和存储设备 | |
Bakhti et al. | Citation function classification based on ontologies and convolutional neural networks | |
Sahnoun et al. | Event detection based on open information extraction and ontology | |
Sarkhel et al. | Improving information extraction from visually rich documents using visual span representations | |
CN114298314A (zh) | 一种基于电子病历的多粒度因果关系推理方法 | |
Jeon et al. | Measuring the novelty of scientific publications: A fastText and local outlier factor approach | |
Pham et al. | Natural language processing with multitask classification for semantic prediction of risk-handling actions in construction contracts | |
CN116542252B (zh) | 一种金融文本核查方法及系统 | |
Qalaja et al. | Inclusive study of fake news detection for COVID-19 with new dataset using supervised learning algorithms | |
CN116484025A (zh) | 漏洞知识图谱构建方法、评估方法、设备及存储介质 | |
Yin et al. | A deep natural language processing‐based method for ontology learning of project‐specific properties from building information models | |
Saravanan et al. | Realizing social-media-based analytics for smart agriculture | |
CN113516094B (zh) | 一种用于为文档匹配评议专家的系统以及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |