发明内容
为了解决上述问题,本发明提供了一种供应链金融智能查重方法、装置、电子设备以及存储介质,可以提高供应链金融查重效率。
第一方面,本发明提供了一种供应链金融智能查重方法,包括:
获取查重账户,识别所述查重账户的查重方法,根据所述查重方法,查询所述查重账户的查重数据;
解析所述查重数据的明文数据,从所述解析数据中提取查重文本,对所述查重文本进行标准化处理,得到标准文本;
从所述标准文本中抽取头实体,构造所述头实体与所述标准文本的实体类型,对所述实体类型进行向量转换,得到初始向量;
计算所述初始向量的边界状态,根据所述边界状态,确定所述标记向量中的头实体向量与文本向量,并对所述头实体向量与所述文本向量进行数字标记,得到标记头实体与标记文本;
计算所述标记文本中尾实体的起始位置与终止位置,根据所述起始位置与终止位置,确定所述标记文本中的标记尾实体,构造所述标记头实体与所述标记尾实体的实体关系三元组;
确定所述实体关系三元组的关键信息,根据所述关键信息,对待查重数据进行查重,得到查重结果。
在第一方面的一种可能实现方式中,所述识别所述查重账户的查重方法,包括:
提取所述查重账户的账户内容;
根据所述账户内容,识别所述查重账户的账户类型;
根据所述账户类型,确定所述查重账户的查重方法。
在第一方面的一种可能实现方式中,所述从所述解析数据中提取查重文本,包括:
预先配置所述解析数据的查重项目;
根据所述查重项目,识别所述解析数据中的目标数据;
根据所述目标数据,提取所述查重文本。
在第一方面的一种可能实现方式中,所述构造所述头实体与所述标准文本的实体类型,包括:
识别所述头实体与所述标准文本的数据类型;
构造所述数据类型的表现方式;
根据所述表现方式,确定所述头实体与所述标准文本的实体类型。
在第一方面的一种可能实现方式中,所述计算所述初始向量的边界状态:
计算所述初始向量的边界概率;
在所述边界概率大于预设阈值时,确定所述初始向量的边界状态;
其中,利用下述公式计算所述初始向量的边界概率:
其中,
表示边界为起始边界的边界概率,
表示边界为终止边界的边界概率,σ表示激活函数,b
start表示模型偏差,b
end与b
start类似, W
start与W
end类似,都表示NLP算法模型中编码层的权重系数,X
i表示所述初始向量的第i个向量。
在第一方面的一种可能实现方式中,所述根据所述边界状态,确定所述初始向量中的头实体向量与文本向量,包括:
根据所述边界状态,划分所述初始向量中的头实体区间;
根据所述头实体区间,确定所述头实体向量;
将不属于所述头实体区间的向量作为所述文本向量。
在第一方面的一种可能实现方式中,所述计算所述标记文本中尾实体的起始位置与终止位置,包括:
计算所述标记文本的起始概率与终止概率;
在所述起始概率与所述终止概率均大于所述预设阈值时,确定所述标记文本中尾实体的起始位置与终止位置;
其中,利用下述公式计算所述标记文本的起始概率与终止概率:
其中,
表示起始概率,
表示终止概率,σ表示激活函数, b′
start表示计算尾实体时的模型偏差,b′
start与b′
end类似,W′
start与W′
end类似,都表示NLP算法模型中计算尾实体时的编码层的权重系数,Y
N表示所述标记文本的第i个文本,
表示所述标记头实体中的第k个标记头实体。
第二方面,本发明提供了一种供应链金融智能查重装置,所述装置包括:
查重数据查询模块,用于获取查重账户,识别所述查重账户的查重方法,根据所述查重方法,查询所述查重账户的查重数据;
文本标准处理模块,用于解析所述查重数据的明文数据,从所述解析数据中提取查重文本,对所述查重文本进行标准化处理,得到标准文本;
实体向量转换模块,用于从所述标准文本中抽取头实体,构造所述头实体与所述标准文本的实体类型,对所述实体类型进行向量转换,得到初始向量;
向量数字标记模块,用于计算所述初始向量的边界状态,根据所述边界状态,确定所述标记向量中的头实体向量与文本向量,并对所述头实体向量与所述文本向量进行数字标记,得到标记头实体与标记文本;
实体关系构造模块,用于计算所述标记文本中尾实体的起始位置与终止位置,根据所述起始位置与终止位置,确定所述标记文本中的标记尾实体,构造所述标记头实体与所述标记尾实体的实体关系三元组;
查重数据查重模块,用于确定所述实体关系三元组的关键信息,根据所述关键信息,对待查重数据进行查重,得到查重结果。
第三方面,本发明提供一种电子设备,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,以使所述至少一个处理器能够执行如上述第一方面中任意一项所述的供应链金融智能查重方法。
第四方面,本发明提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任意一项所述的供应链金融智能查重方法。
与现有技术相比,本方案的技术原理及有益效果在于:
本发明实施例首先通过获取查重账户,以用于利用所述查重账户中包含的私人信息实现对账户对应的信息资料的下载,其次,本发明实施例通过识别所述查重账户的查重方法,以用于利用所述查重方法对账户信息进行查询,进一步地,本发明实施例通过根据所述查重方法,查询所述查重账户的查重数据,以用于对于不同的数据利用不同的方式进行查询,提升查询数据的效率,进一步地,本发明实施例通过解析所述查重数据的明文数据,以用于获取不同格式状态下包含的不同的数据,进一步地,本发明实施例通过从所述解析数据中提取查重文本,以用于从数据文件中提取到有用的数据,进一步地,本发明实施例通过对所述查重文本进行标准化处理,得到标准文本,以用于将所述查重文本转换为统一的格式数据,便于后续实体关系信息抽取,进一步地,本发明实施例通过从所述标准文本中抽取头实体,以用于将所述标准文本分割为多个主体,进一步地,本发明实施例通过构造所述头实体与所述标准文本的实体类型,以用于将所述头实体与所述标准文本进行合并,进一步地,本发明实施例通过对所述实体类型进行向量转换,以用于将抽象的数据转换为可以体现数据方向信息、特征信息等的向量数据,进一步地,本发明实施例通过计算所述初始向量的边界状态,以用于利用边界范围区分向量类型,进一步地,本发明实施例通过根据所述边界状态,确定所述初始向量中的头实体向量与文本向量,以用于将所述标记向量中的两种类型的向量进行区分,进一步地,本发明实施例通过对所述头实体向量与所述文本向量进行数字标记,以用于将所述头实体向量与所述文本向量转换为数字形式,便于后续识别头尾关系,进一步地,本发明实施例通过计算所述标记文本中尾实体的起始位置与终止位置,以用于在所述标记文本中查询上述头实体对应的尾实体,保障后续确定二者之间的实体关系,进一步地,本发明实施例通过根据所述起始位置与终止位置,确定所述标记文本中的标记尾实体,以用于确定所述头实体与所述尾实体之间的实体关系,进一步地,本发明实施例通过构造所述标记头实体与所述标记尾实体的实体关系三元组,以用于通过所述实体关系三元组表示实体关系,提升数据的简洁度,本发明实施例通过确定所述实体关系三元组的关键信息,以用于后续检验所述关键信息是否一致,进一步地,本发明实施例通过根据所述关键信息,对待查重数据进行查重,得到查重结果,以用于检验所述待查重数据是否出现重复情况。因此,本发明实施例提出的一种供应链金融智能查重方法、装置、电子设备以及存储介质,可以提高供应链金融的查重效率。
具体实施方式
应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提供一种供应链金融智能查重方法,所述供应链金融智能查重方法的执行主体包括但不限于服务端、终端等能够被配置为执行本发明实施例提供的该方法的电子设备中的至少一种。换言之,所述供应链金融智能查重方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参阅图1所示,是本发明一实施例提供的供应链金融智能查重方法的流程示意图。其中,图1中描述的供应链金融智能查重方法包括:
S1、获取查重账户,识别所述查重账户的查重方法,根据所述查重方法,查询所述查重账户的查重数据。
本发明实施例通过获取查重账户,以用于利用所述查重账户中包含的私人信息实现对账户对应的信息资料的下载。其中,所述查重账户是指用户的登录账户,包括用户名、密码、图片验证码、手机验证码、用户名称等信息。
进一步地,本发明实施例通过识别所述查重账户的查重方法,以用于利用所述查重方法对账户信息进行查询。其中,所述查重方法包括接口与 RPA下载等方法。
本发明的一实施例中,参阅图2所示,所述识别所述查重账户的查重方法,包括:
S201、提取所述查重账户的账户内容;
S202、根据所述账户内容,识别所述查重账户的账户类型;
S203、根据所述账户类型,确定所述查重账户的查重方法。
示例性地,提取所述查重账户的账户内容分别为“登录中登网时输入的用户名、密码、图片验证码、手机验证码等信息”与“供应商名称、曾用名”,则对所述账户内容的账户类型匹配对应的查重方法:1、RPA及接口下载文件的输入参数为供应商名称,包括其曾用名(中登网是以一个公司名称为关键词获取保理、质押等业务记录,公司若更名则输入的关键词也要更改,因此加入曾用名的搜索,保证数据获取的完整性);2、RPA模拟人工登录下载方式,登录中登网时需要输入用户名、密码、图片验证码、手机验证码等信息,本实施例中利用OCR技术自动识别的图片验证码,对接了手机系统自动获取验证码;3、登录到中登网后点按担保人查询,输入公司名称参数即可下载文件及附件;4、接口先由按主体查询接口获取登记证明编号,再输入登记证明编号获得登记证明文件及附件。
进一步地,本发明实施例通过根据所述查重方法,查询所述查重账户的查重数据,以用于对于不同的数据利用不同的方式进行查询,提升查询数据的效率。其中,所述查重数据是指从存储历史数据的官网后台数据库中获取的数据。
本发明的一实施例中,所述根据所述查重方法,查询所述查重账户的查重数据,通过利用所述查重账户对应的查重方法实现。
S2、解析所述查重数据的明文数据,从所述解析数据中提取查重文本,对所述查重文本进行标准化处理,得到标准文本。
本发明实施例通过解析所述查重数据的明文数据,以用于获取不同格式状态下包含的不同的数据。其中,所述明文数据是指存储数据的文件,包括pdf、xls、png、jpg及word等文件数据。
本发明的一实施例中,所述解析所述查重数据的明文数据,通过利用不同的查询方式对所述查重数据进行查询实现。
示例性地,对于png文件数据,利用图片工具进行查询,对于word 文件数据,利用word文档进行查询。
进一步地,本发明实施例通过从所述解析数据中提取查重文本,以用于从数据文件中提取到有用的数据。其中,所述查重文本是指所述明文数据下的数据,例如从jpg文件中识别到“转让财产描述”的字样,获取其对应的内容信息,包括合同、发票、金额等的信息描述。
本发明的一实施例中,参阅图3所示,所述从所述解析数据中提取查重文本,包括:
S301、预先配置所述解析数据的查重项目;
S302、根据所述查重项目,识别所述解析数据中的目标数据;
S303、根据所述目标数据,提取所述查重文本。
示例性地,预先配置所述解析数据的查重项目,例如查重项目“转让财产描述”,根据所述查重项目,对所述解析数据进行数据提取,例如,获取“转让财产描述”下字段内容,通常字段中包含合同、发票、金额等的信息描述,但无固定格式,属于人工自由填写的备注内容,并且可能记录了多个交易记录的信息,确定所述“转让财产描述”项目的明文数据为:“武汉华盛电子有限责任公司同意将与招商蛇口十堰置业有限公司签订的编号032.zslxgsy45cxm.一期-sg-0031的招商兰溪谷(45厂项目)22号地块消防工程合同项下因施工产生的人民币壹佰伍拾叁万柒仟肆佰捌拾叁元整的应收账款(税票号码:22193216-22193217)转让给招商银行股份有限公司十堰分行,并授权招商银行股份有限公司十堰分行办理应收账款转让登记”。
进一步地,本发明实施例通过对所述查重文本进行标准化处理,得到标准文本,以用于将所述查重文本转换为统一的格式数据,便于后续实体关系信息抽取。
本发明的一实施例中,所述对所述查重文本进行标准化处理,得到标准文本,包括:配置所述查重文本的标准规则;识别所述查重文本的文本类型;根据所述文本类型,利用所述标准规则对所述查重文本进行标准化处理,得到标准文本。
示例性地,配置所述查重文本的标准规则为所有类型的数据都应使用 0-9范围内的数字表示,如10000001-1000004的文本类型,将其转换为 10000001、10000002、10000003、10000004的发票号码。
S3、从所述标准文本中抽取头实体,构造所述头实体与所述标准文本的实体类型,对所述实体类型进行向量转换,得到初始向量。
本发明实施例通过从所述标准文本中抽取头实体,以用于将所述标准文本分割为多个主体。其中,所述头实体是指某类事物的集合,例如集合 A{1,2,3,4},A中的数据为所述头实体。
本发明的一实施例中,所述从所述标准文本中抽取头实体,通过利用命名实体识别实现。
其中,所述命名实体识别(Named Entity Recognition)是自然语言处理中的一项基础任务,应用范围非常广泛,所述命名实体一般指的是文本中具有特定意义或者指代性强的实体,通常包括人名、地名、组织机构名、日期时间、专有名词等。NER系统就是从非结构化的输入文本中抽取出上述实体,并且可以按照业务需求识别出更多类别的实体,比如产品名称、型号、价格等。在学术上NER所涉及的命名实体一般包括3大类(实体类,时间类,数字类)和7小类(人名、地名、组织机构名、时间、日期、货币、百分比)。同时NER也是关系抽取、事件抽取、知识图谱、机器翻译、问答系统等诸多NLP任务的基础。
进一步地,本发明实施例通过构造所述头实体与所述标准文本的实体类型,以用于将所述头实体与所述标准文本进行合并。其中,所述实体类型是指数据的类型,例如一串数字的类型是合同编号。
本发明的一实施例中,所述构造所述头实体与所述标准文本的实体类型,包括:识别所述头实体与所述标准文本的数据类型;构造所述数据类型的表现方式;根据所述表现方式,确定所述头实体与所述标准文本的实体类型。
示例性地,数据类型为公司、合同、发票、金额等,构造所述数据类型的表现方式为集合的方式,则确定所述头实体与所述标准文本的实体类型为xsubject=[[CLS],t,[SEP],s1,s2,……,sN,[SEP]],其中,[CLS],t,[SEP]中的t表示所述头实体,s1,s2,……,sN表示所述标准文本。
进一步地,本发明实施例通过对所述实体类型进行向量转换,以用于将抽象的数据转换为可以体现数据方向信息、特征信息等的向量数据。
本发明的一实施例中,所述对所述实体类型进行向量转换,得到初始向量,通过BERT+Bilstm特征编码层实现。
其中,所述BERT+Bilstm特征编码层是指BERT与Bilstm组成的编码层,所述BiLSTM是Bi-directional Long Short-Term Memory的缩写,是由前向LSTM与后向LSTM组合而成,例如对于输入数据“我爱中国”,前向的LSTML依次输入“我”“爱”“中国”,得到三个向量{hL0,hL1,hL2}, 后向的LSTMR依次输入“中国”“爱”“我”,得到三个向量{hR0,hR1,hR2},最后将两者合并得到最后的结果为{[hL0,hR2],[hL1,hR1],[hL2,hR0]},所述BERT 由多个transformer结构组成,是双向的结构,信息不但可以向后传递,也可以向前传递,它是由transformer中的Encoder组成的,里面包含完整的多头自注意和前向传播和残差连接以及层归一化等。
S4、计算所述初始向量的边界状态,根据所述边界状态,确定所述初始向量中的头实体向量与文本向量,并对所述头实体向量与所述文本向量进行数字标记,得到标记头实体与标记文本。
本发明实施例通过计算所述初始向量的边界状态,以用于利用边界范围区分向量类型。其中,所述边界状态是指处于边界的向量包括起始边界与终止边界,例如一串数字的最后一个数字与第一个数字。
本发明的一实施例中,所述计算所述初始向量的边界状态:计算所述初始向量的边界概率;在所述边界概率大于预设阈值时,确定所述初始向量的边界状态;其中,利用下述公式计算所述初始向量的边界概率:
其中,
表示边界为起始边界的边界概率,
表示边界为终止边界的边界概率,σ表示激活函数,b
start表示模型偏差,b
end与b
start类似,W
start与W
end类似,都表示NLP算法模型中编码层的权重系数,X
i表示所述初始向量的第i个向量。
其中,所述预设阈值可以设置为0.9,也可以根据实际情况进行设置。
进一步地,本发明实施例通过根据所述边界状态,确定所述初始向量中的头实体向量与文本向量,以用于将所述标记向量中的两种类型的向量进行区分。
本发明的一实施例中,所述根据所述边界状态,确定所述初始向量中的头实体向量与文本向量,包括:根据所述边界状态,划分所述初始向量中的头实体区间;根据所述头实体区间,确定所述头实体向量;将不属于所述头实体区间的向量作为所述文本向量。
示例性地,将属于所述边界状态范围之内的向量作为所述初始向量中的头实体向量,其余的作为所述文本向量。
进一步地,本发明实施例通过对所述头实体向量与所述文本向量进行数字标记,以用于将所述头实体向量与所述文本向量转换为数字形式,便于后续识别头尾关系。
本发明的一实施例中,所述对所述头实体向量与所述文本向量进行数字标记,得到标记头实体与标记文本,通过数学符号实现。
示例性地,头实体的开始和结束都用1表示,不是边界的字符用0表示。对于多个头实体检测,采用邻近原则,某个开始位置为1的字符到其后最近的结束位置为1的字符之间的词就是一个头实体,剩余的则是所述文本向量,利用其他随机数字标记。
S5、计算所述标记文本中尾实体的起始位置与终止位置,根据所述起始位置与终止位置,确定所述标记文本中的标记尾实体,构造所述标记头实体与所述标记尾实体的实体关系三元组。
本发明实施例通过计算所述标记文本中尾实体的起始位置与终止位置,以用于在所述标记文本中查询上述头实体对应的尾实体,保障后续确定二者之间的实体关系。其中,所述起始位置与所述终止位置是指用1标记的数字的位置,在所述起始位置与所述终止位置之间是用0标记的数字,与所述头实体的边界状态的原理类似。
本发明的一实施例中,所述计算所述标记文本中尾实体的起始位置与终止位置,包括:计算所述标记文本的起始概率与终止概率;在所述起始概率与所述终止概率均大于所述预设阈值时,确定所述标记文本中尾实体的起始位置与终止位置;其中,利用下述公式计算所述标记文本的起始概率与终止概率:
其中,
表示起始概率,
表示终止概率,σ表示激活函数, b′
start表示计算尾实体时的模型偏差,b′
start与b′
end类似,W′
start与W′
end类似,都表示NLP算法模型中计算尾实体时的编码层的权重系数,Y
N表示所述标记文本的第i个文本,
表示所述标记头实体中的第k个标记头实体。
进一步地,本发明实施例通过根据所述起始位置与终止位置,确定所述标记文本中的标记尾实体,以用于确定所述头实体与所述尾实体之间的实体关系。其中,所述尾实体与所述头实体相关联,通过利用头实体指向尾实体,表示关系数组,例如二维数组中,横轴为所述头实体,纵轴为所述尾实体,则表示横轴指向纵轴的方向。
本发明的一实施例中,所述根据所述起始位置与终止位置,确定所述标记文本中的标记尾实体的步骤与上述根据所述边界状态,确定所述标记文本中的标记头实体的原理类似,在此不做进一步地赘述。
进一步地,本发明实施例通过构造所述标记头实体与所述标记尾实体的实体关系三元组,以用于通过所述实体关系三元组表示实体关系,提升数据的简洁度。其中,所述实体关系三元组是指(实体1,关系,实体2),例如(老师,师生,学生)。
本发明的一实施例中,所述构造所述标记头实体与所述标记尾实体的实体关系三元组,通过识别所述标记头实体与所述标记尾实体之间的实体关系实现。
示例性地,上述计算完标记头实体之后,利用所述标记头实体计算其对应的标记尾实体,可以得到两者对应,属于同一个实体关系三元组,之后识别二者之间的关系,将三者共同组合为所述实体关系三元组,例如,在所述标记头实体与所述标记尾实体分别为合同与编号时,可以识别二者之间的关系为后者为前者的编号即合同的编号的关系。
S6、确定所述实体关系三元组的关键信息,根据所述关键信息,对待查重数据进行查重,得到查重结果。
本发明实施例通过确定所述实体关系三元组的关键信息,以用于后续检验所述关键信息是否一致。其中,所述关键信息是指用查重比对的信息,例如发票号码、合同编号、合同名称、转让公司、转让金额等。
本发明的一实施例中,所述确定所述实体关系三元组的关键信息,通过所述实体关系三元组中的实体关系实现。
示例性地,在所述实体关系三元组为(合同,名称,入职合同)时,可以确定关键信息为合同的内容即名称为入职合同的内容。
进一步地,本发明实施例通过根据所述关键信息,对待查重数据进行查重,得到查重结果,以用于检验所述待查重数据是否出现重复情况。
本发明的一实施例中,所述根据所述关键信息,对待查重数据进行查重,得到查重结果,包括:将所述待查重数据与所述关键信息进行一致性校验;若一致性校验成功的次数不小于预设次数时,则所述待查重数据的查重结果不合格;若所述若一致性校验失败的次数小于预设次数时,则表示所述待查重数据的查重结果合格。
示例性地,对所述发票号码、合同编号、合同名称、转让公司、转让金额等5项数据进行一致性校验时,若全部都校验成功,表示查重结果不合格;若校验成功的次数为大于等于1,表示查重结果不合格;若小于1次,则表示查重合格。
可以看出,本发明实施例首先通过获取查重账户,以用于利用所述查重账户中包含的私人信息实现对账户对应的信息资料的下载,其次,本发明实施例通过识别所述查重账户的查重方法,以用于利用所述查重方法对账户信息进行查询,进一步地,本发明实施例通过根据所述查重方法,查询所述查重账户的查重数据,以用于对于不同的数据利用不同的方式进行查询,提升查询数据的效率,进一步地,本发明实施例通过解析所述查重数据的明文数据,以用于获取不同格式状态下包含的不同的数据,进一步地,本发明实施例通过从所述解析数据中提取查重文本,以用于从数据文件中提取到有用的数据,进一步地,本发明实施例通过对所述查重文本进行标准化处理,得到标准文本,以用于将所述查重文本转换为统一的格式数据,便于后续实体关系信息抽取,进一步地,本发明实施例通过从所述标准文本中抽取头实体,以用于将所述标准文本分割为多个主体,进一步地,本发明实施例通过构造所述头实体与所述标准文本的实体类型,以用于将所述头实体与所述标准文本进行合并,进一步地,本发明实施例通过对所述实体类型进行向量转换,以用于将抽象的数据转换为可以体现数据方向信息、特征信息等的向量数据,进一步地,本发明实施例通过计算所述初始向量的边界状态,以用于利用边界范围区分向量类型,进一步地,本发明实施例通过根据所述边界状态,确定所述初始向量中的头实体向量与文本向量,以用于将所述标记向量中的两种类型的向量进行区分,进一步地,本发明实施例通过对所述头实体向量与所述文本向量进行数字标记,以用于将所述头实体向量与所述文本向量转换为数字形式,便于后续识别头尾关系,进一步地,本发明实施例通过计算所述标记文本中尾实体的起始位置与终止位置,以用于在所述标记文本中查询上述头实体对应的尾实体,保障后续确定二者之间的实体关系,进一步地,本发明实施例通过根据所述起始位置与终止位置,确定所述标记文本中的标记尾实体,以用于确定所述头实体与所述尾实体之间的实体关系,进一步地,本发明实施例通过构造所述标记头实体与所述标记尾实体的实体关系三元组,以用于通过所述实体关系三元组表示实体关系,提升数据的简洁度,本发明实施例通过确定所述实体关系三元组的关键信息,以用于后续检验所述关键信息是否一致,进一步地,本发明实施例通过根据所述关键信息,对待查重数据进行查重,得到查重结果,以用于检验所述待查重数据是否出现重复情况。因此,本发明实施例提出的一种供应链金融智能查重方法可以提高供应链金融的查重效率。
如图4所示,是本发明供应链金融智能查重装置功能模块图。
本发明所述供应链金融智能查重装置400可以安装于电子设备中。根据实现的功能,所述供应链金融智能查重装置可以包括查重数据查询模块 401、文本标准处理模块402、实体向量转换模块403、向量数字标记模块 404、实体关系构造模块405以及查重数据查重模块406。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本发明实施例中,关于各模块/单元的功能如下:
所述查重数据查询模块401,用于获取查重账户,识别所述查重账户的查重方法,根据所述查重方法,查询所述查重账户的查重数据;
所述文本标准处理模块402,用于解析所述查重数据的明文数据,从所述解析数据中提取查重文本,对所述查重文本进行标准化处理,得到标准文本;
所述实体向量转换模块403,用于从所述标准文本中抽取头实体,构造所述头实体与所述标准文本的实体类型,对所述实体类型进行向量转换,得到初始向量;
所述向量数字标记模块404,用于计算所述初始向量的边界状态,根据所述边界状态,确定所述标记向量中的头实体向量与文本向量,并对所述头实体向量与所述文本向量进行数字标记,得到标记头实体与标记文本;
所述实体关系构造模块405,用于计算所述标记文本中尾实体的起始位置与终止位置,根据所述起始位置与终止位置,确定所述标记文本中的标记尾实体,构造所述标记头实体与所述标记尾实体的实体关系三元组;
所述查重数据查重模块406,用于确定所述实体关系三元组的关键信息,根据所述关键信息,对待查重数据进行查重,得到查重结果。
详细地,本发明实施例中所述供应链金融智能查重装置400中的所述各模块在使用时采用与上述的图1至图3中所述的供应链金融智能查重方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
如图5所示,是本发明实现供应链金融智能查重方法的电子设备的结构示意图。
所述电子设备可以包括处理器50、存储器51、通信总线52以及通信接口53,还可以包括存储在所述存储器51中并可在所述处理器50上运行的计算机程序,如供应链金融智能查重程序。
其中,所述处理器50在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit, CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器50是所述电子设备的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器 51内的程序或者模块(例如执行供应链金融智能查重程序等),以及调用存储在所述存储器51内的数据,以执行电子设备的各种功能和处理数据。
所述存储器51至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器51在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器51在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器51 不仅可以用于存储安装于电子设备的应用软件及各类数据,例如数据库配置化连接程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述通信总线52可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器51以及至少一个处理器50 等之间的连接通信。
所述通信接口53用于上述电子设备5与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元 (比如键盘(Keyboard)),可选地,所述用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
图5仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图5示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源 (比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器50逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利发明范围上并不受此结构的限制。
所述电子设备中的所述存储器51存储的数据库配置化连接程序是多个计算机程序的组合,在所述处理器50中运行时,可以实现:
获取查重账户,识别所述查重账户的查重方法,根据所述查重方法,查询所述查重账户的查重数据;
解析所述查重数据的明文数据,从所述解析数据中提取查重文本,对所述查重文本进行标准化处理,得到标准文本;
从所述标准文本中抽取头实体,构造所述头实体与所述标准文本的实体类型,对所述实体类型进行向量转换,得到初始向量;
计算所述初始向量的边界状态,根据所述边界状态,确定所述标记向量中的头实体向量与文本向量,并对所述头实体向量与所述文本向量进行数字标记,得到标记头实体与标记文本;
计算所述标记文本中尾实体的起始位置与终止位置,根据所述起始位置与终止位置,确定所述标记文本中的标记尾实体,构造所述标记头实体与所述标记尾实体的实体关系三元组;
确定所述实体关系三元组的关键信息,根据所述关键信息,对待查重数据进行查重,得到查重结果。
具体地,所述处理器50对上述计算机程序的具体实现方法可参考图1 对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个非易失性计算机可读取存储介质中。所述存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取查重账户,识别所述查重账户的查重方法,根据所述查重方法,查询所述查重账户的查重数据;
解析所述查重数据的明文数据,从所述解析数据中提取查重文本,对所述查重文本进行标准化处理,得到标准文本;
从所述标准文本中抽取头实体,构造所述头实体与所述标准文本的实体类型,对所述实体类型进行向量转换,得到初始向量;
计算所述初始向量的边界状态,根据所述边界状态,确定所述标记向量中的头实体向量与文本向量,并对所述头实体向量与所述文本向量进行数字标记,得到标记头实体与标记文本;
计算所述标记文本中尾实体的起始位置与终止位置,根据所述起始位置与终止位置,确定所述标记文本中的标记尾实体,构造所述标记头实体与所述标记尾实体的实体关系三元组;
确定所述实体关系三元组的关键信息,根据所述关键信息,对待查重数据进行查重,得到查重结果。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。