CN114626455A - 金融信息处理方法、装置、设备、存储介质及产品 - Google Patents
金融信息处理方法、装置、设备、存储介质及产品 Download PDFInfo
- Publication number
- CN114626455A CN114626455A CN202210242946.3A CN202210242946A CN114626455A CN 114626455 A CN114626455 A CN 114626455A CN 202210242946 A CN202210242946 A CN 202210242946A CN 114626455 A CN114626455 A CN 114626455A
- Authority
- CN
- China
- Prior art keywords
- financial
- features
- file
- image
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 31
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 230000004927 fusion Effects 0.000 claims abstract description 39
- 239000011159 matrix material Substances 0.000 claims description 88
- 238000004364 calculation method Methods 0.000 claims description 78
- 238000000034 method Methods 0.000 claims description 44
- 238000005070 sampling Methods 0.000 claims description 38
- 239000013598 vector Substances 0.000 claims description 31
- 230000007246 mechanism Effects 0.000 claims description 30
- 238000000605 extraction Methods 0.000 claims description 26
- 238000004458 analytical method Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 17
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000013135 deep learning Methods 0.000 abstract description 3
- 238000013461 design Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 229940050561 matrix product Drugs 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000010606 normalization Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Character Discrimination (AREA)
Abstract
本公开提供了一种金融信息处理方法、装置、设备、存储介质及产品,涉及人工智能领域,尤其涉及深度学习领域。具体实现方案为:获取第一用户对应的待分析文件;将待分析文件按照文件类型划分为文字文件以及图像文件;提取所述文字文件的金融文字特征以及提取所述图像文件的金融图像特征;根据所述金融文字特征与所述金融图像特征之间的特征关联信息,将所述金融文字特征与所述金融图像特征进行特征融合,获得所述待分析文件的目标金融特征;根据所述待分析文件的目标金融特征,识别所述待分析文件的目标金融信息。本公开的技术方案提高了金融信息识别准确性。
Description
技术领域
本公开涉及人工智能领域中的深度学习领域,尤其涉及一种金融信息处理方法、装置、设备、存储介质及产品。
背景技术
金融领域中,银行的风险控制、贷款前后的审核等线上处理内容越来越多。在金融领域中的线上处理时,可以利用用户的金融特征对用户进行实体识别,例如对用户进行线上审核,金融问答等实体处理。金融特征可以为表征用户的金融状况的相关内容。通常,金融特征可以为从征信报告、收入证明、银行流水、贷款信息等文件中抽取获得。因此,如何准确获取金融特征是目前亟待解决的技术问题。
发明内容
本公开提供了一种用于金融领域中金融信息处理方法、装置、设备、存储介质及产品。
根据本公开的第一方面,提供了一种金融信息处理方法,包括:
获取第一用户对应的待分析文件;
将待分析文件按照文件类型划分为文字文件以及图像文件;
提取所述文字文件的金融文字特征以及提取所述图像文件的金融图像特征;
根据所述金融文字特征与所述金融图像特征之间的特征关联信息,将所述金融文字特征与所述金融图像特征进行特征融合,获得所述待分析文件的目标金融特征;
根据所述待分析文件的目标金融特征,识别所述待分析文件的目标金融信息。
根据本公开的第二方面,提供了一种金融信息处理装置,包括:
文件获取单元,用于获取第一用户对应的待分析文件;
类型划分单元,用于将待分析文件按照文件类型划分为文字文件以及图像文件;
特征提取单元,用于提取所述文字文件的金融文字特征以及提取所述图像文件的金融图像特征;
特征关联单元,用于根据所述金融文字特征与所述金融图像特征之间的特征关联信息,将所述金融文字特征与所述金融图像特征进行特征融合,获得所述待分析文件的目标金融特征;
特征识别单元,用于根据所述待分析文件的目标金融特征,识别所述待分析文件的目标金融信息。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面所述的方法。
根据本公开的第五方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
根据本公开的技术解决了金融特征提取准确度不高的问题,将待分析文件按照文件类型划分为文字文件以及图像文件,以提取文字文件的金融文字特征以及图像文件的金融图像特征。根据金融文字特征与金融图像特征之间的特征关联信息,可以将金融文字特征与金融图像特征进行特征融合,获得待分析文件的目标金融特征。根据待分析文件的目标金融特征,识别待分析文件的目标金融信息。利用金融文字特征与金融图像特征之间的特征关联信息,可以对金融文字特征以及金融图像特征进行特征融合获得的目标金融特征更好地融合两种特征,目标金融特征中包含更全面的信息,使用目标金融特征进行信息识别,识别准确度更高,获得更准确的目标金融信息,提高了金融信息提取的准确度。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例提供的一种金融信息处理方法的一个场景示意图;
图2是根据本公开实施例提供的一种金融信息处理方法的一个实施例的流程图;
图3是根据本公开实施例提供的一种金融信息处理方法的又一个实施例的流程图;
图4是根据本公开实施例提供的一种特征计算示例图;
图5是根据本公开实施例提供的又一种特征计算示例图;
图6是根据本公开实施例提供的一种金融信息处理方法的又一个实施例的流程图;
图7是根据本公开实施例提供的一种金融信息处理装置的一个实施例的结构示意图;
图8是用来实现本公开实施例的金融信息处理的方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开实施例的技术方案可以应用于金融信息的提取场景中,通过采用对文字以及图像进行分类,并根据特征关联关系对特征进行融合,获得待分析文件准确的目标金融特征,进而利用准确的目标金融特征,实现对待分析文件的目标金融信息的准确识别。
相关技术中,对于文字文件以及图像文件等不同类型的文件进行金融信息的识别时,通常采用自然语言处理(全称:Natural Language Processing,简称:NLP)技术对文字文件进行金融文字特征的识别,采用CV(Computer Vision,计算机视觉)技术对图像文件进行金融图像特征的识别,这两种方式通常是单一使用,也即单独获得金融文字特征或者金融图像特征。在一些场景中,可以直接将金融文字特征与金融图像特征进行拼接,导致特征维度过高,计算量巨大,导致识别准确度以及速度不高。
为了解决上述技术问题,本公开考虑采用注意力机制模型对金融图像特征以及文件特征进行融合,降低特征维度,提高特征准确度,进而促进目标金融信息的识别。
本公开提供一种金融信息处理方法、装置、设备、存储介质及产品,应用于人工智能领域中的深度学习领域,以达到对金融特征的准确提取,进而对金融特征进行准确分析,达到提高金融信息的分析准确度的目的。
本公开实施例中,获取到第一用户的待分析文件时,可以将待分析文件按照文件类型划分为文字文件以及图像文件,以提取文字文件的金融文字特征以及图像文件的金融图像特征。根据金融文字特征与金融图像特征之间的特征关联信息,可以将金融文字特征与金融图像特征进行特征融合,获得待分析文件的目标金融特征。根据待分析文件的目标金融特征,识别待分析文件的目标金融信息。利用金融文字特征与金融图像特征之间的特征关联信息,可以对金融文字特征以及金融图像特征进行特征融合获得的目标金融特征更好地融合两种特征,目标金融特征中包含更全面的信息,使用目标金融特征进行信息识别,识别准确度更高,获得更准确的目标金融信息。
下面将结合附图对本公开的技术方案进行详细介绍。
为了便于理解,图1为本公开实施例提供的一种金融信息处理方法的一个场景示意图。在金融信息处理方法的应用场景中,可以包含第一用户设备1、服务器2以及第二用户设备3。其中,第一用户设备1可以与服务器2通过有线或者无线建立通信连接。第二用户设备3可以与服务器2通过有线或者无线建立通信连接。
其中,第一用户设备1可以面向第一用户,采集第一用户设备的待分析文件,将待分析文件发送至服务器2。服务器2可以接收第一用户设备1发送的待分析文件。对待分析文件中的图像文件进行金融图像特征的提取以及文字文件进行金融文字特征的提取。利用金融图像特征以及金融文字特征之间的特征关联信息可以对这两个特征进行更准确的特征融合,获得目标金融特征。目标金融特征可以包含更全面的特征,可以实现目标金融信息的准确识别,获得准确的目标金融信息。服务器2识别获得目标金融信息之后,可以将目标金融信息发送至第二用户设备3,第二用户设备3可以为目标金融信息输出。
如图2所示,为本公开实施例提供的一种金融信息处理方法的一个实施例的流程图,该方法可以配置为金融信息处理装置,该金融信息处理装置可以位于电子设备。该金融信息处理方法可以包括以下几个步骤:
201:获取第一用户对应的待分析文件。
其中,第一用户对应的待分析文件可以从第一用户的银行账户信息中采集获得。待分析文件具体可以为金融材料文件,可以包括征信报告、收入证明、银行流水、其它材料等。待分析文件可以为与第一用户的金融状况相关的账户信息。
待分析文件可以由第一用户上传至电子设备。也可以由电子设备根据第一用户的账户信息,从第三方金融系统中采集获得。其中,第三方金融系统可以包括各个银行系统、征信系统等。
202:将待分析文件按照文件类型划分为文字文件以及图像文件。
待分析文件可以包括多个。可以将多个待分析文件按照文件类型划分为至少一个文字文件以及至少一个图像文件。至少一个文字文件可以作为金融文字特征的提取对象,从至少一个文字文件中提取用户的金融文字特征。同样,至少一个图像文件可以作为金融图像特征的提取对象,从至少一个图像文件中提取用户的金融图像特征。
203:提取文字文件的金融文字特征以及提取图像文件的金融图像特征。
可选地,提取文字文件的金融文字特征可以包括:提取文字文件的全部文字,从全部文字中提取包含目标关键词的句子。对提取的句子进行词向量转化,获得金融文字特征。
可选地,提取图像文件的金融图像特征可以包括:对金融图像进行特征计算,例如,采用图像卷积核对金融图像进行卷积计算,获得金融图像特征。
204:根据金融文字特征与金融图像特征之间的特征关联信息,将金融文字特征与金融图像特征进行特征融合,获得待分析文件的目标金融特征。
特征关联关系可以为金融文字特征与金融图像特征之间的关注程度或者相似程度。特征关联越高,金融文字特征与金融图像特征之间的关注程度越高。特征关联关系可以用于对金融文字特征以及金融图像特征的融合,可以提高金融文字特征以及金融图像特征的关注程度之间的计算,实现对金融文字特征以及金融图像特征的关联融合,相比于直接将金融文字特征与金融图像特征进行特征融合,融合内容更全面,获得的目标金融特征更准确。
205:根据待分析文件的目标金融特征,识别待分析文件的目标金融信息。
根据待分析文件的目标金融特征,识别待分析文件的目标金融信息可以包括:根据待分析文件的目标金融特征,确定待分析文件的目标内容信息。确定第一用户的分析目标,根据内容信息对分析目标进行分析,获得的分析结果即为目标金融信息。
本公开实施例中,获取到第一用户的待分析文件时,可以将待分析文件按照文件类型划分为文字文件以及图像文件,以提取文字文件的金融文字特征以及图像文件的金融图像特征。根据金融文字特征与金融图像特征之间的特征关联信息,可以将金融文字特征与金融图像特征进行特征融合,获得待分析文件的目标金融特征。根据待分析文件的目标金融特征,识别待分析文件的目标金融信息。利用金融文字特征与金融图像特征之间的特征关联信息,可以对金融文字特征以及金融图像特征进行特征融合获得的目标金融特征更好地融合两种特征,目标金融特征中包含更全面的信息,使用目标金融特征进行信息识别,识别准确度更高,获得更准确的目标金融信息。
作为一个实施例,根据金融文字特征与金融图像特征之间的特征关联信息,将金融文字特征与金融图像特征进行特征融合,获得待分析文件的目标金融特征之前,还包括:
将金融文字特征与金融图像特征输入注意力机制模型,获得金融文字特征与金融图像特征之间的特征关联信息。
可选地,注意力机制模型(英文全称:Attention Mechanism Model),具体可以用于对金融文字特征以及金融图像特征之间的关注度或者相似度进行计算的数学模型,可以筛选出金融文字特征与金融图像特征之间的有效信息,过滤掉二者无关的信息,可以解决信息过载问题。
本公开实施例中,可以采用将金融文字特征与金融图像特征输入到注意力机制模型,获得金融文字特征与金融图像特征之间的特征关联关系。通过注意力机制模型,可以对特征关联信息进行准确而有效的提取。
在一种可能的设计中,特征关联信息可以包括第一影响权重以及第二影响权重。在将金融文字特征与金融图像特征输入注意力机制模型,获得金融文字特征与金融图像特征之间的特征关联信息之后,可以利用特征关联信息对目标金融特征进行有效提取。
如图3所示,为本公开实施例提供的一种金融信息处理方法的又一个实施例的流程图,该方法可以包括以下几个步骤:
301:获取第一用户对应的待分析文件。
本公开实施例中部分步骤与前述实施例中部分步骤相同,为了描述的简洁性考虑,在此不再赘述。
302:将待分析文件按照文件类型划分为文字文件以及图像文件。
303:提取文字文件的金融文字特征以及提取图像文件的金融图像特征。
304:将金融文字特征与金融图像特征输入注意力机制模型,获得金融文字特征与金融图像特征之间的第一影响权重以及第二影响权重。
第一影响权重以及第二影响权重可以为注意力机制模型对金融文字特征以及金融图像特征进行关注度或者相似度计算获得的,对金融文字特征以及金融图像特征的关注度进行有效提取。
第一影响权重可以表示金融图像特征对金融文字特征的影响程度。第二影响权重可以表示金融文字特征对金融图像特征的影响程度。
305:根据第一影响权重,对金融文字特征以及金融图像特征进行融合计算,获得第一关联特征。
第一关联特征可以为利用第一影响权重对金融文字特征以及金融图像特征进行特征融合计算获得。
306:根据第二影响权重,对金融文字特征以及金融图像特征进行融合计算,获得第二关联特征。
第二关联特征可以为利用第二影响权重对金融文字特征以及金融图像特征进行特征融合计算获得。
307:将第一关联特征以及第二关联特征进行特征拼接,获得待分析文件的目标金融特征。
308:根据待分析文件的目标金融特征,识别待分析文件的目标金融信息。
本公开实施例中,将金融文字特征以及金融图像特征输入到注意力机制模型之后,可以获得金融文字特征与金融图像特征之间的第一影响权重以及第二影响权重。可以根据第一影响权重,对金融文字特征以及金融图像特征进行融合计算,获得第一关联特征。根据第二影响权重对金融文字特征以及金融图像特征进行融合计算,获得第二关联特征。第一关联特征以及第二关联特征包含了文字以及图像两种特征,并对文字以及图像两种特征的关联关系进行了准确计算,获得的目标金融特征更准确。从而可以根据待分析文件的目标金融特征,识别待分析文件的目标金融信息,提高目标金融信息的分析效率。
在一种可能的设计中,将金融文字特征与金融图像特征输入注意力机制模型,获得金融文字特征与金融图像特征之间的特征关联信息,包括:
将金融文字特征与金融图像特征输入注意力机制模型,获得金融文字特征对应的文字内容子特征、金融图像特征对应的图像内容子特征、第一影响权重及第二影响权重构成的特征关联信息。
根据第一影响权重,对金融文字特征以及金融图像特征进行融合计算,获得第一关联特征,包括:
根据第一影响权重,对文字内容子特征以及图像内容子特征进行加权求和,获得第一关联特征;
根据第二影响权重,对金融文字特征以及金融图像特征进行融合计算,获得第二关联特征,包括:
根据第二影响权重,对文字内容子特征以及图像内容子特征进行加权求和,获得第二关联特征。
其中,第一影响权重W1可以包括第一子权重w1以及第二子权重w2。第二影响权重W2可以包括第三子权重w1’以及第四子权重w2’。假设图像内容子特征使用z1表示,文字内容子特征z2表示。
可选地,根据第一影响权重,对文字内容子特征以及图像内容子特征进行加权求和,获得第一关联特征,可以包括:计算第一子权重w1与图像内容子特征z1的矩阵乘积,获得第一子特征z1’1;计算第二子权重w2与文字内容子特征z2的矩阵乘积,获得第二子特征z2’1;将第一子特征z1’1与第二子特征z2’1相加,获得第一关联特征V1。
可选地,根据第二影响权重,对文字内容子特征以及图像内容子特征进行加权求和,获得第二关联特征,可以包括:计算第三子权重w1’与图像内容子特征z1的矩阵乘积,获得第三子特征z1’2;计算第四子特征w2’与文字内容子特征z2的矩阵乘积,获得第四子特征z2’2;将第三子特征z1’2与第四子特征z2’2相加,获得第二关联特征V2。
在一种可能的设计中,根据第一影响权重对文字内容子特征以及图像内容子特征进行加权求和,获得第一关联特征之前,还包括:对第一影响权重中的第一子权重w1以及第二子权重w2进行权重归一化处理,获得归一化后的第一子权重w1以及第二子权重w2。利用归一化后的第一子权重w1以及第二子权重w2对文字内容子特征z2以及图像内容子特征z1进行加权求和,获得第一关联特征。参与子特征计算的w1和w2可以为归一化后的w1和w2。
根据第二影响权重,对文字内容子特征以及图像内容子特征进行加权求和,获得第二关联特征之前,还包括:对第二影响权重中的第三子权重w1’以及第四子权重w2’进行权重归一化处理,获得归一化后的第三子权重w1’以及第四子权重w2’。利用归一化后的第三子权重w1’以及第四子权重w2’对文字内容子特征以及图像内容子特征进行加权求和,获得第二关联特征。参与子特征计算的w1’和w2’可以为归一化后的w1’和w2’。
第一关联特征中使用第一影响权重对文字内容子特征以及图像内容子特征进行特征融合计算,获得的第一关联特征中综合包含了文字以及图像两个方面的内容,使得文字对应的第一关联特征更准确,特征有效性更高。同样,第二关联特征中使用第二影响权重对文字内容子特征以及图像内容子特征进行特征融合计算,获得的第二关联特征中同样综合包含了文字以及图像两个方面的内容,使得图像对应的第二关联特征更准确,特征有效性更高。
本公开实施例中,利用注意力机制计算金融文字特征与金融图像特征之间的关联关系时,可以将金融文字特征与金融图像特征输入注意力机制模型,获得金融文字特征对应的文字内容子特征、金融图像特征对应的图像内容子特征以及第一影响权重以及第二影响权重构成的特征关联信息。通过注意力机制模型对金融文字特征以及金融图像特征的计算,可以实现对文字内容子特征以及图像内容子特征,以及特征关联关系的准确获取。通过第一影响权重,可以对金融文字特征以及金融图像特征进行加权求和,实现对第一关联特征的准确计算。通过第二影响权重,可以对金融文字特征以及金融图像特征进行加权求和,实现对第二关联特征的准确计算。通过第一影响权重以及第二影响权重可以对文字内容子特征以及图形内容子特征进行准确计算,实现对第一关联特征以及第二关联特征快速而有效的提取。
在一种可能的设计中,注意力机制模型包括:查询矩阵,被查询矩阵以及内容矩阵;
将金融文字特征与金融图像特征输入注意力机制模型,获得金融文字特征对应的文字内容子特征、金融图像特征对应的图像内容子特征、第一影响权重及第二影响权重构成的特征关联信息,包括:
将金融图像特征分别与查询矩阵以及被查询矩阵进行矩阵计算,获得金融图像特征对应的第一查询特征以及第一被查询特征;
将金融文字特征分别与查询矩阵以及被查询矩阵进行矩阵计算,获得金融文字特征对应的第二查询特征以及第二被查询特征;
将第一查询特征分别与第一被查询特征以及第二被查询特征进行特征计算,获得第一影响权重;第一影响权重为金融图像特征对金融文字特征的影响程度;
将第二查询特征分别与第一被查询特征以及第二被查询特征进行特征计算,获得第二影响权重;第二影响权重为金融文字特征对金融图像特征的影响程度;
根据金融图像特征与内容矩阵,计算获得图像内容子特征。
根据金融文字特征与内容矩阵,计算获得文字内容子特征。
确定第一影响权重及第二影响权重构成的特征关联信息。
可选地,查询矩阵可以代表文字或者图像中其自身期望查找的标准。被查询矩阵可以代表文字或者图像中供对方查找的标准,也即对方所期望查找的标准。而内容矩阵即可以代表文字或者图像中被表达出来的实际存在的内容。通过查询矩阵可以对金融图像特征或者金融文字特征中自身被期望查找的特征进行计算。通过被查询矩阵可以对金融图像特征或者金融文字特征中对方期望被查找的内容。
为了便于理解,参考图4所示的特征计算示例图,金融文字特征以image(图像)向量401,金融文字特征以text(文字)向量402表示。注意力机制模型中的查询矩阵X以矩阵403,被查询矩阵Y以矩阵404以及内容矩阵Z以矩阵405表示。
金融图像特征,也即image向量401与403查询矩阵X矩阵计算获得第一查询特征x1也即406;image向量401与404被查询矩阵Y矩阵计算,获得第一被查询特征y1也即407。image向量401与405内容矩阵Z矩阵计算,获得图像内容子特征z1,也即408。
金融文字特征,也即text向量402与403查询矩阵X矩阵计算获得第一查询特征x2也即409;text向量402与404被查询矩阵X矩阵计算,获得第二被查询特征y2也即410。text向量402与405内容矩阵Z矩阵计算,获得文字内容子特征z2,也即411。
其中,将金融图像特征与查询矩阵进行矩阵计算,可以获得金融图像特征对自身的关注程度,获得第一查询特征x1。将金融图像特征与被查询矩阵进行矩阵计算,获得金融图像特征被文字的关注程度,获得第一被查询特征y1。
将金融文字特征与查询矩阵计算,可以获得金融文字特征对自身的关注程度,获得第二查询特征x2。将金融文字特征与被查询矩阵进行矩阵计算,获得金融文字特征被图像的关注程度,获得第二被查询特征y2。
其中,通过第一查询特征x1与第一被查询特征y1进行矩阵点乘计算,获得第一子权重w1以及通过第一查询特征x1与第二被查询特征y2进行矩阵点乘计算,获得第二子权重w2。确定第一子权重w1和第二子权重w2构成的第一影响权重。
通过第二查询特征x2与第一被查询特征y1进行矩阵点乘计算,获得第三子权重w1’,以及通过第二查询特征x2与第二被查询特征y2进行矩阵点乘计算,获得第四子权重w2’。确定第三子权重w1’和第四子权重w2’构成的第二影响权重。
文字内容子特征z2可以为金融文字特征与内容矩阵z的矩阵乘积。图像内容子特征z1可以为金融图像特征与内容矩阵z的矩阵乘积。
为了便于理解,在图4中x1、x2、y1、y2、z1、z2的基础上,可以进行待分析文件的目标金融特征的综合提取。
参考图5所示的特征计算示例图,第一影响权重可以包括:第一子权重501:w1=x1·y1和第二子权重502:w2=x1·y2。可以对第一影响权重中的第一子权重w1和第二子权重w2进行权重归一化处理,获得归一化后的第一子权重503和归一化后的第二子权重504。利用归一化后的w1计算与图像内容子特征z1的矩阵乘积,获得第一子特征505,公式为z1’1=w1*z1。计算归一化后的w2与文字内容子特征z2的矩阵乘积,获得第二子特征506,公式为z2’1=w2*z2;将第一子特征z1’1与第二子特征z2’1相加获得507第一关联特征V1。
第二影响权重可以包括:第三子权重508:w1’=x2·y1和第四子权重509:w2’=x2·y2。还可以对第二影响权重中的第三子权重w1’和第四子权重w2’进行权重归一化处理,获得归一化后的第三子权重510和第四子权重511。计算归一化后的w1’与图像内容子特征z1的矩阵乘积,获得第三子特征512,公式为z1’2=w1’*z1。计算归一化后的w2’与文字内容子特征z2的矩阵乘积,获得第四子特征513,公式为z2’2=w1’*z2。将第三子特征z1’2与第四子特征z2’2相加,获得514第二关联特征V2。
将第一关联特征507以及第二关联特征514进行特征拼接,获得待分析文件的目标金融特征515。根据待分析文件的目标金融特征515,识别待分析文件的目标金融信息516。
在一种可能的设计中,注意力机制模型的查询矩阵x,被查询矩阵y以及内容矩阵z可以通过训练获得。关于注意力机制模型的训练过程与本公开实施例中的输入对象,金融图像特征以及金融文字特征相同,此外,在整个模型的训练过程中还可以包含金融图像特征的提取模型、金融文字特征的提取模型、获得的目标金融特征的识别模型。训练数据可以包含多个训练用户的训练文件,以及训练文件对应的标签数据。模型训练过程中,关于文件处理、特征提取、信息识别等模型的输入与输出、数据的处理过程与本公开的金融信息处理方法相同。
本公开实施例中,将金融图像特征分别与查询矩阵与以及被查询矩阵进行矩阵计算,可以获得金融图像特征对应的第一查询特征以及第一被查询特征。将金融文字特征分别与查询矩阵以及被查询矩阵进行矩阵计算,可以获得金融文字特征对应的第二查询特征以及第二被查询特征。第一查询特征以及第二查询特征与特征的查询内容相关联。第一被查询特征以及第二被查询特征可以对金融图像特征以及金融文字特征之间的关注程度进行计算,获得的第一影响权重以及第二影响权重可以反映金融图像特征与金融文字特征之间的关注程度,获得的第一影响权重以及第二影响权重可以对金融图像特征以及金融文字特征之间的关联程度进行更准确分析,获得准确的特征关联。
作为一个实施例,将待分析文件按照文件类型划分为文字文件以及图像文件,包括:
确定待分析文件的文件格式;
根据待分析文件的文件格式中确定文字格式对应的文字文件以及图像格式对应的图像文件,以完成文字文件以及图像文件的划分。
可选地,待分析文件的文件格式可以包括:pdf(Portable Document Format,可携带文档格式)、word(Microsoft Word,微软文档)、jpg(Joint Photographic ExpertsGroup,联合图像专家组)、png(Portable Network Graphics,便携式网络图像)等格式。其中,pdf、word等格式属于非图像格式,可以被确定为文字格式。Jpg、png等格式为图像的格式,可以确定为图像格式。
待分析文件可以包括多个,可以确定多个待分析文件分别对应的文件格式,从多个待分析文件分别对应的文件格式中,确定文字格式对应的文字文件以及确定图像格式对应的图像文件。
本公开实施例中,对待分析文件进行文件划分时,可以按照待分析文件的文件格式进行文件类型的划分,文件格式可以从文件属性中快速获得,通过文件格式将文件进行划分,可以对文件划分效率以及文件划分准确度快速确定。
为了获得准确的文字特征,在一种可能的设计中,在获得,文字文件包括至少一个,提取文字文件的金融文字特征,包括:
将至少一个文字文件分别输入对应的词向量提取模型,获得至少一个文字文件分别对应的文字词向量。
将至少一个文字文件分别对应的文字词向量进行融合,获得金融文字特征。
可选地,词向量提取模型可以包括嵌入(Embedding)模型,本公开实施例中对词向量提取模型的具体类型并不做出过多限定。
本公开实施例中,通过词向量提取模型可以实现文字文件的文字词向量的准确提取。通过将至少一个文字文件分别对应的文字词向量进行融合,获得的金融文字特征中包含更全面的文字文件的文字词向量,金融文字特征更准确,特征表达度更高。
在一种可能的设计中,提取图像文件的金融图像特征,包括:
采用自底向上的下采样方式,基于卷积核对图像文件进行至少一次下采样,获得至少一个卷积特征;
将至少一个卷积特征按照尺寸从小到大的顺序排序;
采用自顶向下的上采样方式,从第二个卷积特征开始,对卷积特征进行上采样,获得至少一个卷积特征分别对应的采样特征。
将至少一个卷积特征分别对应的采样特征进行特征拼接,获得图像特征。
采用自底向上的下采样方式,基于卷积核对图像文件进行至少一次下采样,获得至少一个卷积特征可以包括:将图像文件与卷积核进行卷积计算,获得第一个卷积特征,对于后续的任一次下采样步骤:将前一次采样获得的卷积特征继续与卷积核进行卷积计算,获得新的卷积特征,直至采样次数达到目标卷积次数,获得至少一次下采样分别获得的卷积特征。
采用自顶向下的上采样方式,从第二个卷积特征开始,对卷积特征进行上采样,获得至少一个卷积特征分别对应的采样特征可以包括:采用自顶向下的上采样方式,确定第一个卷积特征为采样特征;从第二个卷积特征开始,对于任一个卷积特征的上采样步骤:确定当前卷积特征以及当前卷积核的上一个卷积特征;对上一个卷积特征按照当前卷积特征的尺寸进行上采样,获得中间特征;将中间特征与当前卷卷积特征相加,获得当前采样特征。直至最后一个卷积特征上采样结束,获得至少一个卷积特征分别对应的采样特征;
可选地,卷积核可以为图像特征的映射模型或者提取模型的模型参数。
卷积核的尺寸可以为2*2。可以将2*2的尺寸的卷积核与每次输入的卷积特征进行卷积计算,获得新的卷积特征。使用2*2的卷积核进行卷积时,新获得的卷积特征的尺寸为输入的卷积特征的尺寸的二分之一。例如,图像尺寸为224*224时,其与2*2的卷积核进行卷积计算之后,获得的新的卷积特征的尺寸为112*112,位于其之后的卷积特征大小为56*56,同样地,位于56*56的卷积特征之后的新的卷积特征的尺寸可以依次为:28*28,14*14,7*7以及3*3。在一种可能的设计中,卷积核可以包括多个,卷积核的尺寸可以不变,可以为2*2,当然,卷积核的尺寸可以根据实际的使用需求设置,本公开实施例中的2*2仅仅是示意性的,并不应构成对本公开的技术方案的限制。
为了便于理解,在上采样时,假设当前卷积特征尺寸为7*7,该卷积特征的前一个卷特特征的尺寸为3*3,可以将前一个卷积特征3*3按照7*7的尺寸进行上采样,获得7*7的中间特征,将7*7的中间特征与当前7*7的卷积特征相加获得7*7的采样特征。其中,将中间特征与当前卷积特征相加具体可以指将同一坐标的特征值相加,获得该坐标在采样特征中的特征值,所有坐标的特征值相加结束获得采样特征。
在一种可能的设计中,将至少一个卷积特征分别对应的采样特征进行特征拼接,获得图像特征可以包括:将卷积特征转化为卷积向量,获得至少一个卷积特征分别对应的卷积向量,将至少一个卷积特征分别对应的卷积向量进行向量拼接,获得图像特征。图像特征中包含了不同尺寸的采样特征,特征涵盖度更高,获得的图像特征更全面,准确度更高。
本公开实施例中,对图像文件中的金融图像特征进行提取时,可以采用多个尺度的卷积核,采用自底向上的下采样方式进行卷积计算,再采用自顶向下的方式进行上采样。在采样过程中,对不同尺寸的特征均能较为高效的采集。在获得多个卷积核分别对应的采样特征,可以将多个卷积核分别对应的采样特征进行拼接,获得金融图像特征。金融图像特征中包含了不同尺寸的特征,获得的金融图像特征更全面更准确。
如图6所示,为本公开实施例提供的一种金融信息处理方法的又一个实施例的流程图,该方法可以包括以下几个步骤:
601:获取第一用户对应的待分析文件。
需要说明的是,本公开实施例中部分步骤与前述实施例中部分步骤相同,为了描述的简洁性考虑在此不再赘述。
602:将待分析文件按照文件类型划分为文字文件以及图像文件;
提取文字文件的金融文字特征以及提取图像文件的金融图像特征。
603:根据金融文字特征与金融图像特征之间的特征关联信息,将金融文字特征与金融图像特征进行特征融合,获得待分析文件的目标金融特征。
604:将待分析文件对应的目标金融特征输入到语言识别模型,获得目标金融特征对应的目标内容信息。
605:根据第二用户提供的金融分析请求,对目标内容信息进行分析处理,获得目标金融信息。
第二用户可以通过第二用户设备向电子设备发送金融分析请求。金融分析请求可以包括第一用户的用户信息,以及第一用户的分析内容。分析内容例如可以包括:贷款审批、金融问答、资格审查等内容。目标内容信息例如可以包括:第一用户未发生过逾期、第一用户资产状况、第一用户的已贷款信息等。目标金融信息可以利用目标内容信息对金融分析请求进行分析获得的分析结果。
606:为第二用户输出目标金融信息。
为第二用户输出目标金融信息可以包括:将目标金融信息发送至第二用户的第二用户设备。第二用户设备可以将接收到的目标金融信息输出。
本公开实施例中,获得待分析文件的目标金融特征,可以将目标金融特征输入到语言识别模型,获得目标金融特征对应的目标内容信息。根据第二用户提供的金融分析请求,可以对目标内容信息进行分析处理,获得目标金融信息,目标金融信息即为在目标金融特征对应目标内容信息的基础上,获得的对目标内容信息的准确分析结果。通过为第二用户输出目标金融信息,可以实现对第二用户的准确使用。提高第二用户的使用效率。
如图7所示,为本公开实施例提供的一种金融信息处理装置的一个实施例的结构示意图,该金融信息处理装置700可以包括以下几个单元:
文件获取单元701:用于获取第一用户对应的待分析文件;
类型划分单元702:用于将待分析文件按照文件类型划分为文字文件以及图像文件;
特征提取单元703:用于提取文字文件的金融文字特征以及提取图像文件的金融图像特征;
特征关联单元704:用于根据金融文字特征与金融图像特征之间的特征关联信息,将金融文字特征与金融图像特征进行特征融合,获得待分析文件的目标金融特征;
特征识别单元705:用于根据待分析文件的目标金融特征,识别待分析文件的目标金融信息。
本公开实施例中,获取到第一用户的待分析文件时,可以将待分析文件按照文件类型划分为文字文件以及图像文件,以提取文字文件的金融文字特征以及图像文件的金融图像特征。根据金融文字特征与金融图像特征之间的特征关联信息,可以将金融文字特征与金融图像特征进行特征融合,获得待分析文件的目标金融特征。根据待分析文件的目标金融特征,识别待分析文件的目标金融信息。利用金融文字特征与金融图像特征之间的特征关联信息,可以对金融文字特征以及金融图像特征进行特征融合获得的目标金融特征更好地融合两种特征,目标金融特征中包含更全面的信息,使用目标金融特征进行信息识别,识别准确度更高,获得更准确的目标金融信息。
作为一个实施例,还包括:
关联计算单元,用于将金融文字特征与金融图像特征输入注意力机制模型,获得金融文字特征与金融图像特征之间的特征关联信息。
在一种可能的设计中,特征关联信息包括:第一影响权重以及第二影响权重;特征关联单元,包括:
第一计算模块,用于根据第一影响权重,对金融文字特征以及金融图像特征进行融合计算,获得第一关联特征;
第二计算模块,用于根据第二影响权重,对金融文字特征以及金融图像特征进行融合计算,获得第二关联特征;
特征拼接模块,用于将第一关联特征以及第二关联特征进行特征拼接,获得待分析文件的目标金融特征。
在某些实施例中,关联计算单元,包括:
特征输入模块,用于将金融文字特征与金融图像特征输入注意力机制模型,获得金融文字特征对应的文字内容子特征、金融图像特征对应的图像内容子特征、第一影响权重及第二影响权重构成的特征关联信息;
第一计算模块,包括:
第一计算子模块,用于根据第一影响权重,对文字内容子特征以及图像内容子特征进行加权,获得第一关联特征;
第二计算模块,包括:
第二计算子模块,用于根据第二影响权重,对文字内容子特征以及图像内容子特征进行加权,获得第二关联特征。
作为一种可能的实现方式,注意力机制模型包括:查询矩阵,被查询矩阵以及内容矩阵;
特征输入模块,包括:
第一计算子模块,用于将金融图像特征分别与查询矩阵以及被查询矩阵进行矩阵计算,获得金融图像特征对应的第一查询特征以及第一被查询特征;
第二计算子模块,用于将金融文字特征分别与查询矩阵以及被查询矩阵进行矩阵计算,获得金融文字特征对应的第二查询特征以及第二被查询特征;
第三计算子模块,用于将第一查询特征分别与第一被查询特征以及第二被查询特征进行特征计算,获得第一影响权重;第一影响权重为金融图像特征对金融文字特征的影响程度;
第四计算子模块,用于将第二查询特征分别与第一被查询特征以及第二被查询特征进行特征计算,获得第二影响权重;第二影响权重为金融文字特征对金融图像特征的影响程度;
第一特征子模块,用于根据金融图像特征与内容矩阵,计算获得图像内容子特征;
第二特征子模块,用于根据金融文字特征与内容矩阵,计算获得文字内容子特征;
关联确定子模块,用于确定第一影响权重及第二影响权重构成的特征关联信息。
作为又一个实施例,类型划分单元,包括:
格式确定模块,用于确定待分析文件的文件格式;
格式划分模块,用于根据待分析文件的文件格式中确定文字格式对应的文字文件以及图像格式对应的图像文件。
在一种可能的设计中,文字格式包括至少一个,特征提取单元,包括:
第一提取模块,用于将至少一个文字文件分别输入对应的词向量提取模型,获得至少一个文字文件分别对应的文字词向量。
第二提取模块,用于将至少一个文字文件分别对应的文字词向量进行融合,获得金融文字特征。
在某些实施例中,特征提取单元,包括:
第一卷积模块,用于采用自底向上的下采样方式,基于卷积核对图像文件进行至少一次下采样,获得至少一个卷积特征;
特征排序模块,用于将至少一个卷积特征按照尺寸从小到大的顺序排序,获得排序后的至少一个卷积特征;
第二卷积模块,用于采用自顶向下的上采样方式,从第二个卷积特征开始,对排序后的卷积特征进行上采样,获得至少一个卷积特征分别对应的采样特征;
特征拼接模块,用于将至少一个卷积特征分别对应的采样特征进行特征拼接,获得图像特征。
在某些实施例中,特征识别单元,包括:
内容识别模块,用于将待分析文件对应的目标金融特征输入到语言识别模型,获得目标金融特征对应的目标内容信息;
金融分析模块,用于根据第二用户提供的金融分析请求,对目标内容信息进行分析处理,获得目标金融信息;
装置还包括:
信息输出单元,用于为第二用户输出目标金融信息。
本公开实施例提供的金融信息处理装置可以执行上述实施例中金融信息处理方法,关于各个单元、模块、子模块所执行的具体内容可以参考上述实施例中关于方法的实施例的描述,在此不再赘述。
需要说明的是,本实施例中待分析文件并不是针对某一特定用户的待分析文件,并不能反映出某一特定用户的个人信息。需要说明的是,本实施例中的待分析文件来自于公开数据集。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
根据本公开的实施例,本公开还提供了一种计算机程序产品,计算机程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如金融信息处理方法。例如,在一些实施例中,金融信息处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的金融信息处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行金融信息处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (21)
1.一种金融信息处理方法,包括:
获取第一用户对应的待分析文件;
将待分析文件按照文件类型划分为文字文件以及图像文件;
提取所述文字文件的金融文字特征以及提取所述图像文件的金融图像特征;
根据所述金融文字特征与所述金融图像特征之间的特征关联信息,将所述金融文字特征与所述金融图像特征进行特征融合,获得所述待分析文件的目标金融特征;
根据所述待分析文件的目标金融特征,识别所述待分析文件的目标金融信息。
2.根据权利要求1所述的方法,所述根据所述金融文字特征与所述金融图像特征之间的特征关联信息,将所述金融文字特征与所述金融图像特征进行特征融合,获得所述待分析文件的目标金融特征之前,还包括:
将所述金融文字特征与所述金融图像特征输入注意力机制模型,获得所述金融文字特征与所述金融图像特征之间的特征关联信息。
3.根据权利要求2所述的方法,其中,所述特征关联信息包括:第一影响权重以及第二影响权重;
所述根据所述金融文字特征与所述金融图像特征之间的特征关联信息,将所述金融文字特征与所述金融图像特征进行特征融合,获得所述待分析文件的目标金融特征,包括:
根据所述第一影响权重,对所述金融文字特征以及所述金融图像特征进行融合计算,获得第一关联特征;
根据所述第二影响权重,对所述金融文字特征以及所述金融图像特征进行融合计算,获得第二关联特征;
将所述第一关联特征以及所述第二关联特征进行特征拼接,获得所述待分析文件的目标金融特征。
4.根据权利要求3所述的方法,其中,所述将所述金融文字特征与所述金融图像特征输入注意力机制模型,获得所述金融文字特征与所述金融图像特征之间的特征关联信息,包括:
将所述金融文字特征与所述金融图像特征输入所述注意力机制模型,获得所述金融文字特征对应的文字内容子特征、所述金融图像特征对应的图像内容子特征、所述第一影响权重及所述第二影响权重构成的特征关联信息;
所述根据所述第一影响权重,对所述金融文字特征以及所述金融图像特征进行融合计算,获得第一关联特征,包括:
根据所述第一影响权重,对所述文字内容子特征以及所述图像内容子特征进行加权求和,获得所述第一关联特征;
所述根据所述第二影响权重,对所述金融文字特征以及所述金融图像特征进行融合计算,获得第二关联特征,包括:
根据所述第二影响权重,对所述文字内容子特征以及所述图像内容子特征进行加权求和,获得所述第二关联特征。
5.根据权利要求4所述的方法,其中,所述注意力机制模型包括:查询矩阵,被查询矩阵以及内容矩阵;
所述将所述金融文字特征与所述金融图像特征输入所述注意力机制模型,获得所述金融文字特征对应的文字内容子特征、所述金融图像特征对应的图像内容子特征、所述第一影响权重及所述第二影响权重构成的特征关联信息,包括:
将所述金融图像特征分别与所述查询矩阵以及所述被查询矩阵进行矩阵计算,获得所述金融图像特征对应的第一查询特征以及第一被查询特征;
将所述金融文字特征分别与所述查询矩阵以及所述被查询矩阵进行矩阵计算,获得所述金融文字特征对应的第二查询特征以及第二被查询特征;
将所述第一查询特征分别与所述第一被查询特征以及所述第二被查询特征进行特征计算,获得所述第一影响权重;所述第一影响权重为所述金融图像特征对所述金融文字特征的影响程度;
将所述第二查询特征分别与所述第一被查询特征以及所述第二被查询特征进行特征计算,获得所述第二影响权重;所述第二影响权重为所述金融文字特征对所述金融图像特征的影响程度;
根据所述金融图像特征与所述内容矩阵,计算获得所述图像内容子特征;
根据所述金融文字特征与所述内容矩阵,计算获得所述文字内容子特征;
确定所述第一影响权重及所述第二影响权重构成的特征关联信息。
6.根据权利要求1-5任一项所述的方法,其中,所述将待分析文件按照文件类型划分为文字文件以及图像文件,包括:
确定所述待分析文件的文件格式;
根据所述待分析文件的文件格式中确定文字格式对应的文字文件以及图像格式对应的图像文件,以完成文字文件以及图像文件的划分。
7.根据权利要求1-6任一项所述的方法,其中,所述文字格式包括至少一个,所述提取所述文字文件的金融文字特征,包括:
将至少一个文字文件分别输入对应的词向量提取模型,获得至少一个所述文字文件分别对应的文字词向量;
将至少一个文字文件分别对应的文字词向量进行融合,获得所述金融文字特征。
8.根据权利要求1-7任一项所述的方法,其中,所述提取所述图像文件的金融图像特征,包括:
确定多个卷积核;多个所述卷积核按照各自的尺寸从小到大排列;
按照多个所述卷积核从小到大的顺序,从尺寸最大的卷积核开始,采用自底向上的下采样方式,将图像文件作为输入与最大尺寸的卷积核进行卷积计算,获得卷积特征,获得的卷积特征作为下一个卷积核的输入,直至所有卷积核卷积结束,获得至少一个卷积核分别对应的卷积特征;
按照多个所述卷积核从小到大的顺序,从尺寸最小的卷积核开始,采用自顶向下的上采样方式,确定当前卷积核以及所述当前卷积核的上一个卷积核;对所述上一个卷积核的采样特征按照所述当前卷积核的尺寸进行上采样,获得中间特征;将所述中间特征与所述当前卷积核对应的卷积特征相加,获得所述当前卷积核的采样特征,直至最后一个卷积核采样结束,获得多个所述卷积核分别对应的采样特征;
将多个卷积核分别对应的采样特征进行拼接,获得的金融图像特征。
9.根据权利要求1-8任一项所述的方法,其中,所述根据所述待分析文件的目标金融特征,识别所述待分析文件的目标金融信息,包括:
将所述待分析文件对应的目标金融特征输入到语言识别模型,获得所述目标金融特征对应的目标内容信息;
根据第二用户提供的金融分析请求,对所述目标内容信息进行分析处理,获得所述目标金融信息;
所述方法还包括:
为所述第二用户输出所述目标金融信息。
10.一种金融信息处理装置,包括:
文件获取单元,用于获取第一用户对应的待分析文件;
类型划分单元,用于将待分析文件按照文件类型划分为文字文件以及图像文件;
特征提取单元,用于提取所述文字文件的金融文字特征以及提取所述图像文件的金融图像特征;
特征关联单元,用于根据所述金融文字特征与所述金融图像特征之间的特征关联信息,将所述金融文字特征与所述金融图像特征进行特征融合,获得所述待分析文件的目标金融特征;
特征识别单元,用于根据所述待分析文件的目标金融特征,识别所述待分析文件的目标金融信息。
11.根据权利要求10所述的装置,还包括:
关联计算单元,用于将所述金融文字特征与所述金融图像特征输入注意力机制模型,获得所述金融文字特征与所述金融图像特征之间的特征关联信息。
12.根据权利要求11所述的装置,其中,所述特征关联信息包括:第一影响权重以及第二影响权重;所述特征关联单元,包括:
第一计算模块,用于根据所述第一影响权重,对所述金融文字特征以及所述金融图像特征进行融合计算,获得第一关联特征;
第二计算模块,用于根据所述第二影响权重,对所述金融文字特征以及所述金融图像特征进行融合计算,获得第二关联特征;
特征拼接模块,用于将所述第一关联特征以及所述第二关联特征进行特征拼接,获得所述待分析文件的目标金融特征。
13.根据权利要求12所述的装置,其中,所述关联计算单元,包括:
特征输入模块,用于将所述金融文字特征与所述金融图像特征输入所述注意力机制模型,获得所述金融文字特征对应的文字内容子特征、所述金融图像特征对应的图像内容子特征、所述第一影响权重及所述第二影响权重构成的特征关联信息;
所述第一计算模块,包括:
第一计算子模块,用于根据所述第一影响权重,对所述文字内容子特征以及所述图像内容子特征进行加权,获得所述第一关联特征;
所述第二计算模块,包括:
第二计算子模块,用于根据所述第二影响权重,对所述文字内容子特征以及所述图像内容子特征进行加权,获得所述第二关联特征。
14.根据权利要求13所述的装置,其中,所述注意力机制模型包括:查询矩阵,被查询矩阵以及内容矩阵;
所述特征输入模块,包括:
第一计算子模块,用于将所述金融图像特征分别与所述查询矩阵以及所述被查询矩阵进行矩阵计算,获得所述金融图像特征对应的第一查询特征以及第一被查询特征;
第二计算子模块,用于将所述金融文字特征分别与所述查询矩阵以及所述被查询矩阵进行矩阵计算,获得所述金融文字特征对应的第二查询特征以及第二被查询特征;
第三计算子模块,用于将所述第一查询特征分别与所述第一被查询特征以及所述第二被查询特征进行特征计算,获得所述第一影响权重;所述第一影响权重为所述金融图像特征对所述金融文字特征的影响程度;
第四计算子模块,用于将所述第二查询特征分别与所述第一被查询特征以及所述第二被查询特征进行特征计算,获得所述第二影响权重;所述第二影响权重为所述金融文字特征对所述金融图像特征的影响程度;
第一特征子模块,用于根据所述金融图像特征与所述内容矩阵,计算获得所述图像内容子特征;
第二特征子模块,用于根据所述金融文字特征与所述内容矩阵,计算获得所述文字内容子特征;
关联确定子模块,用于确定所述第一影响权重及所述第二影响权重构成的特征关联信息。
15.根据权利要求10-14任一项所述的装置,其中,所述类型划分单元,包括:
格式确定模块,用于确定所述待分析文件的文件格式;
格式划分模块,用于根据所述待分析文件的文件格式中确定文字格式对应的文字文件以及图像格式对应的图像文件。
16.根据权利要求10-15任一项所述的装置,其中,所述文字格式包括至少一个,所述特征提取单元,包括:
第一提取模块,用于将至少一个文字文件分别输入对应的词向量提取模型,获得至少一个所述文字文件分别对应的文字词向量;
第二提取模块,用于将至少一个文字文件分别对应的文字词向量进行融合,获得所述金融文字特征。
17.根据权利要求10-16任一项所述的装置,其中,所述特征提取单元,包括:
第一卷积模块,用于采用自底向上的下采样方式,基于卷积核对图像文件进行至少一次下采样,获得至少一个卷积特征;
特征排序模块,用于将至少一个所述卷积特征按照尺寸从小到大的顺序排序,获得排序后的至少一个卷积特征;
第二卷积模块,用于采用自顶向下的上采样方式,从第二个卷积特征开始,对排序后的卷积特征进行上采样,获得至少一个所述卷积特征分别对应的采样特征;
特征拼接模块,用于将至少一个所述卷积特征分别对应的采样特征进行特征拼接,获得所述图像特征。
18.根据权利要求10-17任一项所述的方法,其中,所述特征识别单元,包括:
内容识别模块,用于将所述待分析文件对应的目标金融特征输入到语言识别模型,获得所述目标金融特征对应的目标内容信息;
金融分析模块,用于根据所述第二用户提供的金融分析请求,对所述目标内容信息进行分析处理,获得所述目标金融信息;
所述装置还包括:
信息输出单元,用于为所述第二用户输出所述目标金融信息。
19.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。
21.一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-8中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210242946.3A CN114626455A (zh) | 2022-03-11 | 2022-03-11 | 金融信息处理方法、装置、设备、存储介质及产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210242946.3A CN114626455A (zh) | 2022-03-11 | 2022-03-11 | 金融信息处理方法、装置、设备、存储介质及产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114626455A true CN114626455A (zh) | 2022-06-14 |
Family
ID=81902921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210242946.3A Pending CN114626455A (zh) | 2022-03-11 | 2022-03-11 | 金融信息处理方法、装置、设备、存储介质及产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114626455A (zh) |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858555A (zh) * | 2019-02-12 | 2019-06-07 | 北京百度网讯科技有限公司 | 基于图像的数据处理方法、装置、设备及可读存储介质 |
CN111563551A (zh) * | 2020-04-30 | 2020-08-21 | 支付宝(杭州)信息技术有限公司 | 一种多模态信息融合方法、装置及电子设备 |
CN112149653A (zh) * | 2020-09-16 | 2020-12-29 | 北京达佳互联信息技术有限公司 | 信息处理方法、装置、电子设备及存储介质 |
CN112508077A (zh) * | 2020-12-02 | 2021-03-16 | 齐鲁工业大学 | 一种基于多模态特征融合的社交媒体情感分析方法及系统 |
CN112992317A (zh) * | 2021-05-10 | 2021-06-18 | 明品云(北京)数据科技有限公司 | 一种医学数据处理方法、系统、设备及介质 |
CN113158656A (zh) * | 2020-12-25 | 2021-07-23 | 北京中科闻歌科技股份有限公司 | 讽刺内容识别方法、装置、电子设备以及存储介质 |
CN113204615A (zh) * | 2021-04-29 | 2021-08-03 | 北京百度网讯科技有限公司 | 实体抽取方法、装置、设备和存储介质 |
US20210264190A1 (en) * | 2020-06-29 | 2021-08-26 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Image questioning and answering method, apparatus, device and storage medium |
CN113361247A (zh) * | 2021-06-23 | 2021-09-07 | 北京百度网讯科技有限公司 | 文档版面分析方法、模型训练方法、装置和设备 |
CN113377958A (zh) * | 2021-07-07 | 2021-09-10 | 北京百度网讯科技有限公司 | 一种文档分类方法、装置、电子设备以及存储介质 |
CN113378989A (zh) * | 2021-07-06 | 2021-09-10 | 武汉大学 | 基于复式协同结构特征重组网络的多模态数据融合方法 |
CN113591864A (zh) * | 2021-07-28 | 2021-11-02 | 北京百度网讯科技有限公司 | 文本识别模型框架的训练方法、装置及系统 |
WO2021232589A1 (zh) * | 2020-05-21 | 2021-11-25 | 平安国际智慧城市科技股份有限公司 | 基于注意力机制的意图识别方法、装置、设备及存储介质 |
CN113742483A (zh) * | 2021-08-27 | 2021-12-03 | 北京百度网讯科技有限公司 | 文档分类的方法、装置、电子设备和存储介质 |
CN113837102A (zh) * | 2021-09-26 | 2021-12-24 | 广州华多网络科技有限公司 | 图文融合分类方法及其装置、设备、介质、产品 |
CN113850201A (zh) * | 2021-09-28 | 2021-12-28 | 广州华多网络科技有限公司 | 跨模态商品分类方法及其装置、设备、介质、产品 |
CN113971750A (zh) * | 2021-10-19 | 2022-01-25 | 浙江诺诺网络科技有限公司 | 银行回单的关键信息提取方法、装置、设备及存储介质 |
CN114037003A (zh) * | 2021-10-21 | 2022-02-11 | 北京百度网讯科技有限公司 | 问答模型的训练方法、装置及电子设备 |
CN114140673A (zh) * | 2022-02-07 | 2022-03-04 | 人民中科(济南)智能技术有限公司 | 一种违规图像识别方法、系统及设备 |
-
2022
- 2022-03-11 CN CN202210242946.3A patent/CN114626455A/zh active Pending
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200257922A1 (en) * | 2019-02-12 | 2020-08-13 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, apparatus, device and readable storage medium for image-based data processing |
CN109858555A (zh) * | 2019-02-12 | 2019-06-07 | 北京百度网讯科技有限公司 | 基于图像的数据处理方法、装置、设备及可读存储介质 |
CN111563551A (zh) * | 2020-04-30 | 2020-08-21 | 支付宝(杭州)信息技术有限公司 | 一种多模态信息融合方法、装置及电子设备 |
WO2021232589A1 (zh) * | 2020-05-21 | 2021-11-25 | 平安国际智慧城市科技股份有限公司 | 基于注意力机制的意图识别方法、装置、设备及存储介质 |
US20210264190A1 (en) * | 2020-06-29 | 2021-08-26 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Image questioning and answering method, apparatus, device and storage medium |
CN112149653A (zh) * | 2020-09-16 | 2020-12-29 | 北京达佳互联信息技术有限公司 | 信息处理方法、装置、电子设备及存储介质 |
CN112508077A (zh) * | 2020-12-02 | 2021-03-16 | 齐鲁工业大学 | 一种基于多模态特征融合的社交媒体情感分析方法及系统 |
CN113158656A (zh) * | 2020-12-25 | 2021-07-23 | 北京中科闻歌科技股份有限公司 | 讽刺内容识别方法、装置、电子设备以及存储介质 |
CN113204615A (zh) * | 2021-04-29 | 2021-08-03 | 北京百度网讯科技有限公司 | 实体抽取方法、装置、设备和存储介质 |
CN112992317A (zh) * | 2021-05-10 | 2021-06-18 | 明品云(北京)数据科技有限公司 | 一种医学数据处理方法、系统、设备及介质 |
CN113361247A (zh) * | 2021-06-23 | 2021-09-07 | 北京百度网讯科技有限公司 | 文档版面分析方法、模型训练方法、装置和设备 |
CN113378989A (zh) * | 2021-07-06 | 2021-09-10 | 武汉大学 | 基于复式协同结构特征重组网络的多模态数据融合方法 |
CN113377958A (zh) * | 2021-07-07 | 2021-09-10 | 北京百度网讯科技有限公司 | 一种文档分类方法、装置、电子设备以及存储介质 |
CN113591864A (zh) * | 2021-07-28 | 2021-11-02 | 北京百度网讯科技有限公司 | 文本识别模型框架的训练方法、装置及系统 |
CN113742483A (zh) * | 2021-08-27 | 2021-12-03 | 北京百度网讯科技有限公司 | 文档分类的方法、装置、电子设备和存储介质 |
CN113837102A (zh) * | 2021-09-26 | 2021-12-24 | 广州华多网络科技有限公司 | 图文融合分类方法及其装置、设备、介质、产品 |
CN113850201A (zh) * | 2021-09-28 | 2021-12-28 | 广州华多网络科技有限公司 | 跨模态商品分类方法及其装置、设备、介质、产品 |
CN113971750A (zh) * | 2021-10-19 | 2022-01-25 | 浙江诺诺网络科技有限公司 | 银行回单的关键信息提取方法、装置、设备及存储介质 |
CN114037003A (zh) * | 2021-10-21 | 2022-02-11 | 北京百度网讯科技有限公司 | 问答模型的训练方法、装置及电子设备 |
CN114140673A (zh) * | 2022-02-07 | 2022-03-04 | 人民中科(济南)智能技术有限公司 | 一种违规图像识别方法、系统及设备 |
Non-Patent Citations (2)
Title |
---|
KHALED BAYOUDH 等: "A survey on deep multimodal learning for computer vision: advances, trends, applications, and datasets", 《THE VISUAL COMPUTER 》, 10 June 2021 (2021-06-10), pages 2939, XP037906638, DOI: 10.1007/s00371-021-02166-7 * |
秦淑婧;杨关;: "增强视觉特征的视觉问答任务研究", 中原工学院学报, no. 01, 25 February 2020 (2020-02-25), pages 59 - 64 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113326764B (zh) | 训练图像识别模型和图像识别的方法和装置 | |
EP4040401A1 (en) | Image processing method and apparatus, device and storage medium | |
CN110941951B (zh) | 文本相似度计算方法、装置、介质及电子设备 | |
CN113377958B (zh) | 一种文档分类方法、装置、电子设备以及存储介质 | |
CN113239807B (zh) | 训练票据识别模型和票据识别的方法和装置 | |
CN115063875A (zh) | 模型训练方法、图像处理方法、装置和电子设备 | |
US20230052906A1 (en) | Entity Recognition Method and Apparatus, and Computer Program Product | |
CN114490998B (zh) | 文本信息的抽取方法、装置、电子设备和存储介质 | |
CN114612743A (zh) | 深度学习模型的训练方法、目标对象识别方法和装置 | |
CN113378855A (zh) | 用于处理多任务的方法、相关装置及计算机程序产品 | |
CN114092948B (zh) | 一种票据识别方法、装置、设备以及存储介质 | |
CN114970540A (zh) | 训练文本审核模型的方法和装置 | |
CN112906368B (zh) | 行业文本增量方法、相关装置及计算机程序产品 | |
CN114078274A (zh) | 人脸图像检测方法、装置、电子设备以及存储介质 | |
CN110929499B (zh) | 文本相似度获取方法、装置、介质及电子设备 | |
EP4116860A2 (en) | Method for acquiring information, electronic device and storage medium | |
CN116383382A (zh) | 敏感信息的识别方法、装置、电子设备及存储介质 | |
CN113360672B (zh) | 用于生成知识图谱的方法、装置、设备、介质和产品 | |
CN114863450A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN114626455A (zh) | 金融信息处理方法、装置、设备、存储介质及产品 | |
CN114724144A (zh) | 文本识别方法、模型的训练方法、装置、设备及介质 | |
CN114329206A (zh) | 标题生成方法和装置、电子设备、计算机可读介质 | |
CN114792423B (zh) | 文档图像的处理方法、装置和存储介质 | |
CN113032540B (zh) | 人机交互方法、装置、设备和存储介质 | |
CN115497112B (zh) | 表单识别方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |