CN113592568B - 一种商机挖掘方法、装置、计算机设备及存储介质 - Google Patents
一种商机挖掘方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN113592568B CN113592568B CN202111164579.1A CN202111164579A CN113592568B CN 113592568 B CN113592568 B CN 113592568B CN 202111164579 A CN202111164579 A CN 202111164579A CN 113592568 B CN113592568 B CN 113592568B
- Authority
- CN
- China
- Prior art keywords
- data
- vector
- entity
- transaction type
- supply chain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种商机挖掘方法、装置、计算机设备及存储介质,该方法包括:获取交易型数据,并依据所述交易型数据构建供应链图谱,以及根据所述供应链图谱建立“买方‑买卖关系‑卖方”的三元组数据;基于所述供应链图谱,对交易类型设置对应专属映射矩阵,并结合所述专属映射矩阵和GAT模型对所述供应链图谱进行编码处理;结合所述专属映射矩阵和ConvKB模型对经过编码处理的所述三元组数据进行解码处理,得到所述三元组数据对应的第一浮点数;基于所述第一浮点数,选取浮点数最高的三元组数据作为目标三元组数据,并将所述目标三元组数据对应的买方和卖方作为商机挖掘结果。本发明可以为用户挖掘准确可靠的潜在商机。
Description
技术领域
本发明涉及计算机软件技术领域,特别涉及一种商机挖掘方法、装置、计算机设备及存储介质。
背景技术
供应链金融背景下行业分类复杂,交易类型多样,不同行业不同类型的企业在经营上往往存在不同的需求痛点,即不同行业、地域的企业的业务模式、数据形式大不相同,对数据进行清洗统一往往需要消耗行业专家大量的精力。
目前市面上的并不存在完整的商机挖掘产品,其中最为相似的是各大招投标平台及供应采购平台如明源云等。对应这类平台,他们的优点在于能够专精于某一行业,能够不断为行业内提供客户或供应商,在做大做强的过程中,平台也能拥有更为准确及全面的企业信息,实现与企业的双赢。
另一部分相似的产品是市面上一些知识图谱类的产品,这类产品往往针对企业间的股权关系、架构关系等构建的企业图谱如企查查、天眼查等。主要应用点在于对全行业的企业提供及时的风险监控,同时为客户提供全方位的企业画像,便于客户了解现有行业动态。
但是上述平台或者产品均存在一定的缺陷,例如现有招投标平台往往局限于某一行业或某一地域,应用面较窄,并且往往需要公司本身提交招投标需求,属于平台类型,平台自身无法主动挖掘潜在商机;现有知识图谱类产品主要关注企业之间的关联关系,包括股权,高管,分支机构等。主要刻画了企业图谱下各公司的风险表现,并未提供商机发现的相关功能。
发明内容
本发明实施例提供了一种商机挖掘方法、装置、计算机设备及存储介质,旨在为用户挖掘准确可靠的潜在商机。
第一方面,本发明实施例提供了一种商机挖掘方法,包括:
获取交易型数据,并依据所述交易型数据构建供应链图谱,以及根据所述供应链图谱建立“买方-买卖关系-卖方”的三元组数据;
基于所述供应链图谱,对交易类型设置对应专属映射矩阵,并结合所述专属映射矩阵和GAT模型对所述供应链图谱进行编码处理;
结合所述专属映射矩阵和ConvKB模型对经过编码处理的所述三元组数据进行解码处理,得到所述三元组数据对应的第一浮点数;
基于所述第一浮点数,选取浮点数最高的三元组数据作为目标三元组数据,并将所述目标三元组数据对应的买方和卖方作为商机挖掘结果。
第二方面,本发明实施例提供了一种商机挖掘装置,包括:
图谱构建单元,用于获取交易型数据,并依据所述交易型数据构建供应链图谱,以及根据所述供应链图谱建立“买方-买卖关系-卖方”的三元组数据;
编码单元,用于基于所述供应链图谱,对交易类型设置对应专属映射矩阵,并结合所述专属映射矩阵和GAT模型对所述供应链图谱进行编码处理;
解码单元,用于结合所述专属映射矩阵和ConvKB模型对经过编码处理的所述三元组数据进行解码处理,得到所述三元组数据对应的第一浮点数;
数据选取单元,用于基于所述第一浮点数,选取浮点数最高的三元组数据作为目标三元组数据,并将所述目标三元组数据对应的买方和卖方作为商机挖掘结果。
第三方面,本发明实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的商机挖掘方法。
第一方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的商机挖掘方法。
本发明实施例提供了一种商机挖掘方法、装置、计算机设备及存储介质,该方法包括:获取交易型数据,并依据所述交易型数据构建供应链图谱,以及根据所述供应链图谱建立“买方-买卖关系-卖方”的三元组数据;基于所述供应链图谱,对交易类型设置对应专属映射矩阵,并结合所述专属映射矩阵和GAT模型对所述供应链图谱进行编码处理;结合所述专属映射矩阵和ConvKB模型对经过编码处理的所述三元组数据进行解码处理,得到所述三元组数据对应的第一浮点数;基于所述第一浮点数,选取浮点数最高的三元组数据作为目标三元组数据,并将所述目标三元组数据对应的买方和卖方作为商机挖掘结果。本发明实施例通过建立三元组数据,并通过专属映射矩阵、GAT模型和ConvKB模型等对三元组数据进行编解码处理,可以为用户挖掘准确可靠的潜在商机。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种商机挖掘方法的流程示意图;
图2为本发明实施例提供的一种商机挖掘方法的子流程示意图;
图3为本发明实施例提供的一种商机挖掘方法的另一子流程示意图;
图4为本发明实施例提供的一种商机挖掘方法的网络结构示意图;
图5为本发明实施例提供的一种商机挖掘装置的示意性框图;
图6为本发明实施例提供的一种商机挖掘装置的子示意性框图;
图7为本发明实施例提供的一种商机挖掘装置的另一子示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和 “包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
下面请参见图1,图1为本发明实施例提供的一种商机挖掘方法的流程示意图,具体包括:步骤S101~S104。
S101、获取交易型数据,并依据所述交易型数据构建供应链图谱,以及根据所述供应链图谱建立“买方-买卖关系-卖方”的三元组数据;
S102、基于所述供应链图谱,对交易类型设置对应专属映射矩阵,并结合所述专属映射矩阵和GAT模型对所述供应链图谱进行编码处理;
S103、结合所述专属映射矩阵和ConvKB模型对经过编码处理的所述三元组数据进行解码处理,得到所述三元组数据对应的第一浮点数;
S104、基于所述第一浮点数,选取浮点数最高的三元组数据作为目标三元组数据,并将所述目标三元组数据对应的买方和卖方作为商机挖掘结果。
本实施例中,将底层数据库中的交易型数据构建为供应链图谱,供应链图谱主要包含买方个体和卖方个体,只要买方个体和卖方个体存在交易关系即可作为供应链图谱的交易型数据,交易关系包括但不限于货物买卖、服务买卖等。交易型数据的来源包括但不限于公开的招投标信息、票据信息、财报数据、新闻报道等。最终将交易型数据解析为关联型的“买方-买卖关系-卖方”的三元组数据。根据所述供应链图谱为不同的交易类型。在具体实施例中,交易类型包括10种,故对应添加10个专属映射矩阵,交易类型具体包括货物采购、工程承包、电子服务、创意设计、软件开发、场地租用、物业管理、保洁清理、保险服务、维修翻新。然后结合专属映射矩阵和GAT模型对三元组数据进行编码处理,以及结合专属映射矩阵和ConvKB模型对三元组数据进行解码处理,从而得到用于对三元组数据进行评分的第一浮点数。根据所述第一浮点数即可选取评分最高的三元组数据作为商机挖掘结果,该三元组数据中的买方和卖方即为商机挖掘对象。
本实施例提供的商机挖掘方法的具有主动发现商机的能力,所述商机挖掘方法不仅可以应用于某一行业或产业,还可以跨行业或产业进行商机挖掘。并结合深度学习的相关技术,大大节省了数据清理和人工规则设定的工作量。同时本实施例采用GAT模型和ConvKB模型,更为契合相应的业务场景,并且可以具备较快的挖掘速度,从而加快服务的响应速度。
在一实施例中,所述步骤S101包括:
基于AI识别技术为所述三元组数据中的买方对应的头实体和尾实体添加属性特征,以及为所述三元组数据中的买卖关系添加关系特征;
通过全连接网络对所述属性特征和关系特征进行前馈计算,得到维度统一的第一向量。
本实施例中,通过AI识别技术为三元组数据中的头实体“买方”和尾实体“买方”添加属性特征,同时为三元组数据中的关系“买卖关系”添加关系特征。在具体应用场景中,属性特征和关系特征主要由命名实体识别、表格识别、手写体识别中的任意一种或多种AI识别技术识别添加。
例如属性特征可以通过命名实体识别、表格识别和/或手写体识别从公开的营业执照、公司财报、新闻报道等非结构化文本中等进行抽取。属性特征分为工商信息、经营信息、融资信息、舆情信息、法律文书信息五大类共48种特征,其中工商信息包括注册资本、公司人数、注册机构、注册时间等;经营信息包括经营状态、经营范围、所属行业、产业标签等;融资信息包括融资频率、融资次数、融资金融机构等,舆情信息主要包括正面舆情数量、负面舆情数量、报道最多媒体等;法律文书信息包括主要法律文书类型、涉诉占比、胜诉占比、涉及金额总数等。
关系特征对应的“买卖关系”往往指某一次交易,其中会包含大量细节,如采购类交易行为中,往往会有采购数量、物品型号、验收方式等。因此可以对交易行为中可能出现的重要信息进行总结汇总,并具体分为以下12中特征:交易类型、买方、卖方、交易时间、交易货物、交易金额、交易货物型号、交易地点、付款方式、付款时间、售后服务、保障时长。这12种特征主要通过命名实体识别对合同、财报、公司公告等公开的非结构化数据进行信息抽取。
对添加的属性特征和关系特征进行向量化表示,具体方法是分别为节点特征头实体和尾实体的属性特征以及关系特征添加全连接网络,经过前馈计算得到节点和关系的向量维度统一的向量化表示,例如向量维度为统一的200。
在一实施例中,如图2所示,所述步骤S102包括:步骤S201~S204。
S201、利用所述专属映射矩阵对所述第一向量进行映射矩阵计算,得到所述三元组数据对应的映射向量;
S202、对于同一头实体对应的不同尾实体,通过所述映射向量计算头实体和尾实体之间的相似度,并将所述相似度作为对应头实体和尾实体的权重;
S203、将各所述三元组数据中的头实体、尾实体和交易类型进行拼接并输入至全连接层,并输出得到维度相同的第二向量;
S204、对所述权重与所述第二向量进行加权叠加,并将加权叠加结果作为信息更新向量,然后利用所述信息更新向量对所述三元组数据进行信息更新。
本实施例中,由于每个三元组数据只有一个关系,即交易类型,专属映射矩阵是指为每一种交易类型都添加一组特定的矩阵参数,头实体和尾实体会使用该特定的矩阵参数进行矩阵运算,得到映射后的表示,即所述映射向量。不同的三元组由于关系(即交易类型)的不同,计算得到的映射向量也不相同。如此可以使公司实体(即头实体和尾实体)的映射向量经过不同的交易类型映射后具有更为准确的表示。例如A公司既给B提供创意设计,也给C提供电子服务,则A在三元组数据(A,创意设计,B)中的向量表示和在三元组数据(A,电子服务,C)中的映射向量并不一致。然后对同一个头实体公司的不同尾实体公司,使用映射后的映射向量计算头实体和尾实体的相似度,并将其作为权重。将每个三元组数据中的头实体公司、交易类型、尾实体公司进行拼接,经过全连接层可以得到与实体维度相同长度的向量化表示,即所述第二向量。随后将第二向量与所述权重进行加权叠加,作为所述信息更新向量叠加在在原头实体公司上,完成一次信息更新步骤。
在一实施例中,所述步骤S103包括:
基于所述映射向量对各所述三元组数据中的的头实体、尾实体和交易类型进行拼接;
通过ConvKB模型对拼接结果提取目标特征,并将所述目标特征依次输入至全连接层和激活函数,然后输出得到所述第一浮点数。
本实施例中,在三元组数据经过编码处理后,其中的头实体公司和尾实体公司已经包含了大量的结构信息,能够对特定关系下的特征有更多的感知。例如三元组数据(A,创意设计,B)和三元组数据(A,电子服务,C),头实体公司A在创意设计关系的限制下,能够获得尾实体B和C更多创意设计业务上的信息。虽然在三元组数据中尾实体C只提供了电子服务,但不能确定尾实体C是否为其他公司提供创意设计业务,但是经过编码处理后便可以捕捉这类隐藏信息。而在对三元组数据进行解码处理时,输入的节点特征同样需要专属映射矩阵进行矩阵计算,再经过ConvKB进行节点特征的卷积处理。具体的为了让头实体能够更好地获得对应关系的语义信息,对三元组数据中的头实体公司和尾实体公司和交易关系的向量化表示进行拼接,并添加卷积核进行特征抽取,再经过全连接层和激活函数得到一个(-1,1)的浮点数(即所述第一浮点数)作为三元组数据,并将所述第一浮点数作为所述三元组数据的评分。
在一实施例中,所述商机挖掘方法还包括:
基于TransE模型思想,将所述三元组数据的映射向量中的头实体向量与交易关系向量相加,并利用相加结果与尾实体向量进行作差处理,得到所述三元组数据对应的目标向量;
对所述目标向量进行求1范数计算,得到第二浮点数。
本实施例中,将头实体向量加上交易关系向量,再减去尾实体向量,即得到该三元组数据的向量表示(即所述目标向量),对所述目标向量求1范数得到一个浮点数作为输出表示。本实施例的计算逻辑应用了TransE模型的思想,TransE模型主要认为三元组数据中的头实体、交易关系、尾实体存在于同一个向量空间,并且可以通过线性叠加的方式对外输出一个向量作为三元组数据的向量化表示。最后求向量的1范数主要是对向量进行数学转化,得到(-1,1)的第二浮点数。
在一实施例中,如图3所示,所述商机挖掘方法还包括:步骤S301~S304。
S301、获取具备真实交易关系的正样本数据和不具备真实交易关系的负样本数据;
S302、将所述正样本数据和负样本数据分别构造为正样本序列和负样本序列;
S303、将所述正样本序列和负样本序列之间的距离作为GAT模型的训练目标,以对所述GAT模型进行训练;
S304、结合所述第二浮点数构造损失函数,并利用所述损失函数对所述GAT模型进行优化。
本实施例中,由于GAT模型需要具备识别三元组数据是否存在交易关系的能力,因此本实施例通过输入真实交易关系的数据作为正样本,输入不存在真实交易关系的数据作为负样本,以此增加GAT模型的区分能力。本实施例将所有确定的三元组数据定义为正样本,将所有不存在交易关系的买卖公司构成的三元组数据定义为负样本,所有正样本和负样本的表示分别构成一个长序列,即正样本序列和负样本序列,同时将损失函数设计为距离函数。因此GAT模型的训练目标即为训练正样本序列和负样本序列之间的距离,保证该距离足够大。而前述步骤得到的第二浮点数则可以为本实施例中的损失函数提供数学支持,具体来说,损失函数主要描述正样本序列和负样本序列的相似度。而正样本序列和负样本序列中元素的个数就是样本数量,每个样本都是一个三元组数据。那如果要计算正样本序列和负样本序列的相似度,就必须要求正样本序列和负样本序列里每个元素都是一个数(浮点数或者整数),但是应用TransE模型思想后得到的每个三元组数据表达都是一个向量,并不是一个数,所以结合所述第二浮点数将向量转换成一个数。同时1范式计算在数学中应用较多,能够将一个向量计算得到1范数,从而支持后续的损失函数求解。
结合图4,在一具体实施例中,三元组数据中的头实体公司和尾实体公司,以及买卖关系进行预处理,其中头实体公司的节点信息包括工商信息、经营信息、融资信息、舆情信息和法律文书信息,关系信息交易包括交易类型、交易时间、交易货物和交易金额等,将上述信息输入至全连接层,得到节点的200维向量和关系的200维向量。然后经映射矩阵映射表示后,输入至GAT层(即图4中Graph Attention Layer),并由GAT层输出头实体向量、候选尾实体向量和关系向量。再次利用映射矩阵对头实体向量和候选尾实体向量进行映射表示,并结合关系向量得到候选尾实体的预测得分,从而选择得分最高的公司作为可能存在的交易公司。
图5为本发明实施例提供的一种商机挖掘装置500的示意性框图,该装置500包括:
图谱构建单元501,用于获取交易型数据,并依据所述交易型数据构建供应链图谱,以及根据所述供应链图谱建立“买方-买卖关系-卖方”的三元组数据;
编码单元502,用于基于所述供应链图谱,对交易类型设置对应专属映射矩阵,并结合所述专属映射矩阵和GAT模型对所述供应链图谱进行编码处理;
解码单元503,用于结合所述专属映射矩阵和ConvKB模型对经过编码处理的所述三元组数据进行解码处理,得到所述三元组数据对应的第一浮点数;
数据选取单元504,用于基于所述第一浮点数,选取浮点数最高的三元组数据作为目标三元组数据,并将所述目标三元组数据对应的买方和卖方作为商机挖掘结果。
在一实施例中,所述图谱构建单元501包括:
特征添加单元,用于基于AI识别技术为所述三元组数据中的买方对应的头实体和尾实体添加属性特征,以及为所述三元组数据中的买卖关系添加关系特征;
前馈计算单元,用于通过全连接网络对所述属性特征和关系特征进行前馈计算,得到维度统一的第一向量。
在一实施例中,如图6所示,所述编码单元502包括:
映射单元601,用于利用所述专属映射矩阵对所述第一向量进行映射矩阵计算,得到所述三元组数据对应的映射向量;
相似度计算单元602,用于对于同一头实体对应的不同尾实体,通过所述映射向量计算头实体和尾实体之间的相似度,并将所述相似度作为对应头实体和尾实体的权重;
拼接输出单元603,用于将各所述三元组数据中的头实体、尾实体和交易类型进行拼接并输入至全连接层,并输出得到维度相同的第二向量;
加权叠加单元604,用于对所述权重与所述第二向量进行加权叠加,并将加权叠加结果作为信息更新向量,然后利用所述信息更新向量对所述三元组数据进行信息更新。
在一实施例中,所述解码单元503包括:
数据拼接单元,用于基于所述映射向量对各所述三元组数据中的的头实体、尾实体和交易类型进行拼接;
特征提取单元,用于通过ConvKB模型对拼接结果提取目标特征,并将所述目标特征依次输入至全连接层和激活函数,然后输出得到所述第一浮点数。
在一实施例中,所述商机挖掘装置500还包括:
向量获取单元,用于基于TransE模型思想,将所述三元组数据的映射向量中的头实体向量与交易关系向量相加,并利用相加结果与尾实体向量进行作差处理,得到所述三元组数据对应的目标向量;
范数计算单元,用于对所述目标向量进行求1范数计算,得到第二浮点数。
在一实施例中,如图7所示,所述商机挖掘装置500还包括:
数据获取单元701,用于获取具备真实交易关系的正样本数据和不具备真实交易关系的负样本数据;
序列构造单元702,用于将所述正样本数据和负样本数据分别构造为正样本序列和负样本序列;
模型训练单元703,用于将所述正样本序列和负样本序列之间的距离作为GAT模型的训练目标,以对所述GAT模型进行训练;
模型优化单元704,用于结合所述第二浮点数构造损失函数,并利用所述损失函数对所述GAT模型进行优化。
在一实施例中,所述AI识别技术为命名实体识别、表格识别和手写体识别中的任意一种或者多种。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本发明实施例还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供了一种计算机设备,可以包括存储器和处理器,存储器中存有计算机程序,处理器调用存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然计算机设备还可以包括各种网络接口,电源等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (7)
1.一种商机挖掘方法,其特征在于,包括:
获取交易型数据,并依据所述交易型数据构建供应链图谱,以及根据所述供应链图谱建立“买方-买卖关系-卖方”的三元组数据;
所述获取交易型数据,并依据所述交易型数据构建供应链图谱,以及根据所述供应链图谱建立“买方-买卖关系-卖方”的三元组数据,包括:
基于AI识别技术为所述三元组数据中的买方对应的头实体和尾实体添加属性特征,以及为所述三元组数据中的买卖关系添加关系特征;
通过全连接网络对所述属性特征和关系特征进行前馈计算,得到维度统一的第一向量;
基于所述供应链图谱,对交易类型设置对应专属映射矩阵,并结合所述专属映射矩阵和GAT模型对所述供应链图谱进行编码处理;所述专属映射矩阵是指为每一种交易类型都添加一组特定的矩阵参数,头实体和尾实体会使用所述特定的矩阵参数进行矩阵运算,得到映射后的表示;
所述基于所述供应链图谱对交易类型设置对应专属映射矩阵,并结合所述专属映射矩阵和GAT模型对所述供应链图谱进行编码处理,包括:
利用所述专属映射矩阵对所述第一向量进行映射矩阵计算,得到所述三元组数据对应的映射向量;
对于同一头实体对应的不同尾实体,通过所述映射向量计算头实体和尾实体之间的相似度,并将所述相似度作为对应头实体和尾实体的权重;
将各所述三元组数据中的头实体、尾实体和交易类型进行拼接并输入至全连接层,并输出得到维度相同的第二向量;
对所述权重与所述第二向量进行加权叠加,并将加权叠加结果作为信息更新向量,然后利用所述信息更新向量对所述三元组数据进行信息更新;
结合所述专属映射矩阵和ConvKB模型对经过编码处理的所述三元组数据进行解码处理,得到所述三元组数据对应的第一浮点数;
所述结合所述专属映射矩阵和ConvKB模型对经过编码处理的所述三元组数据进行解码处理,得到所述三元组数据对应的第一浮点数,包括:
基于所述映射向量对各所述三元组数据中的头实体、尾实体和交易类型进行拼接;
通过ConvKB模型对拼接结果提取目标特征,并将所述目标特征依次输入至全连接层和激活函数,然后输出得到所述第一浮点数;
基于所述第一浮点数,选取浮点数最高的三元组数据作为目标三元组数据,并将所述目标三元组数据对应的买方和卖方作为商机挖掘结果。
2.根据权利要求1所述的商机挖掘方法,其特征在于,还包括:
基于TransE模型思想,将所述三元组数据的映射向量中的头实体向量与交易关系向量相加,并利用相加结果与尾实体向量进行作差处理,得到所述三元组数据对应的目标向量;
对所述目标向量进行求1范数计算,得到第二浮点数。
3.根据权利要求2所述的商机挖掘方法,其特征在于,还包括:
获取具备真实交易关系的正样本数据和不具备真实交易关系的负样本数据;
将所述正样本数据和负样本数据分别构造为正样本序列和负样本序列;
将所述正样本序列和负样本序列之间的距离作为GAT模型的训练目标,以对所述GAT模型进行训练;
结合所述第二浮点数构造损失函数,并利用所述损失函数对所述GAT模型进行优化。
4.根据权利要求3所述的商机挖掘方法,其特征在于,所述AI识别技术为命名实体识别、表格识别和手写体识别中的任意一种或者多种。
5.一种商机挖掘装置,其特征在于,包括:
图谱构建单元,用于获取交易型数据,并依据所述交易型数据构建供应链图谱,以及根据所述供应链图谱建立“买方-买卖关系-卖方”的三元组数据;
所述图谱构建单元包括:
特征添加单元,用于基于AI识别技术为所述三元组数据中的买方对应的头实体和尾实体添加属性特征,以及为所述三元组数据中的买卖关系添加关系特征;
前馈计算单元,用于通过全连接网络对所述属性特征和关系特征进行前馈计算,得到维度统一的第一向量;
编码单元,用于基于所述供应链图谱,对交易类型设置对应专属映射矩阵,并结合所述专属映射矩阵和GAT模型对所述供应链图谱进行编码处理;所述专属映射矩阵是指为每一种交易类型都添加一组特定的矩阵参数,头实体和尾实体会使用所述特定的矩阵参数进行矩阵运算,得到映射后的表示;
所述编码单元包括:
映射单元,用于利用所述专属映射矩阵对所述第一向量进行映射矩阵计算,得到所述三元组数据对应的映射向量;
相似度计算单元,用于对于同一头实体对应的不同尾实体,通过所述映射向量计算头实体和尾实体之间的相似度,并将所述相似度作为对应头实体和尾实体的权重;
拼接输出单元,用于将各所述三元组数据中的头实体、尾实体和交易类型进行拼接并输入至全连接层,并输出得到维度相同的第二向量;
加权叠加单元,用于对所述权重与所述第二向量进行加权叠加,并将加权叠加结果作为信息更新向量,然后利用所述信息更新向量对所述三元组数据进行信息更新;
解码单元,用于结合所述专属映射矩阵和ConvKB模型对经过编码处理的所述三元组数据进行解码处理,得到所述三元组数据对应的第一浮点数;
所述解码单元包括:
数据拼接单元,用于基于所述映射向量对各所述三元组数据中的头实体、尾实体和交易类型进行拼接;
特征提取单元,用于通过ConvKB模型对拼接结果提取目标特征,并将所述目标特征依次输入至全连接层和激活函数,然后输出得到所述第一浮点数;
数据选取单元,用于基于所述第一浮点数,选取浮点数最高的三元组数据作为目标三元组数据,并将所述目标三元组数据对应的买方和卖方作为商机挖掘结果。
6.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的商机挖掘方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的商机挖掘方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111164579.1A CN113592568B (zh) | 2021-09-30 | 2021-09-30 | 一种商机挖掘方法、装置、计算机设备及存储介质 |
PCT/CN2021/124683 WO2023050491A1 (zh) | 2021-09-30 | 2021-10-19 | 一种商机挖掘方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111164579.1A CN113592568B (zh) | 2021-09-30 | 2021-09-30 | 一种商机挖掘方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113592568A CN113592568A (zh) | 2021-11-02 |
CN113592568B true CN113592568B (zh) | 2022-01-11 |
Family
ID=78242819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111164579.1A Active CN113592568B (zh) | 2021-09-30 | 2021-09-30 | 一种商机挖掘方法、装置、计算机设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113592568B (zh) |
WO (1) | WO2023050491A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116932766B (zh) * | 2023-09-15 | 2023-12-29 | 腾讯科技(深圳)有限公司 | 对象分类方法、装置、设备、存储介质及程序产品 |
CN117114739B (zh) * | 2023-09-27 | 2024-05-03 | 数据空间研究院 | 一种企业供应链信息挖掘方法、挖掘系统及存储介质 |
CN117271800B (zh) * | 2023-09-27 | 2024-05-03 | 数据空间研究院 | 一种专利的产业信息挖掘方法、挖掘系统及存储介质 |
CN117097442B (zh) * | 2023-10-19 | 2024-01-16 | 深圳大普微电子股份有限公司 | 一种数据解码方法、系统、设备及计算机可读存储介质 |
CN117808597B (zh) * | 2024-02-26 | 2024-07-30 | 支付宝(杭州)信息技术有限公司 | 一种生成风险规则的方法及装置 |
CN118332139B (zh) * | 2024-06-17 | 2024-09-06 | 国网山东省电力公司电力科学研究院 | 一种基于知识图谱和大模型的电力大数据分析系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909881A (zh) * | 2019-11-01 | 2020-03-24 | 中电科大数据研究院有限公司 | 一种面向跨媒体知识推理任务的知识表示方法 |
CN111797243A (zh) * | 2020-07-03 | 2020-10-20 | 中国烟草总公司湖南省公司 | 知识图谱数据系统构建方法、系统、终端及可读存储介质 |
CN113051409A (zh) * | 2021-04-09 | 2021-06-29 | 北京基智科技有限公司 | 基于多维度信息计算的知产行业商机推荐系统及存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180232443A1 (en) * | 2017-02-16 | 2018-08-16 | Globality, Inc. | Intelligent matching system with ontology-aided relation extraction |
US20190122111A1 (en) * | 2017-10-24 | 2019-04-25 | Nec Laboratories America, Inc. | Adaptive Convolutional Neural Knowledge Graph Learning System Leveraging Entity Descriptions |
CN110148043A (zh) * | 2019-03-01 | 2019-08-20 | 安徽省优质采科技发展有限责任公司 | 基于知识图谱的招标采购信息推荐系统及推荐方法 |
CN110910243B (zh) * | 2019-09-26 | 2020-07-10 | 山东佳联电子商务有限公司 | 一种基于可重构大数据知识图谱技术的产权交易方法 |
CN111694968B (zh) * | 2020-06-15 | 2024-02-09 | 北京工商大学 | 基于半结构化数据的生鲜食品供应链知识图谱构建方法 |
CN112231350B (zh) * | 2020-10-13 | 2022-04-12 | 汉唐信通(北京)科技有限公司 | 一种基于知识图谱的企业商机挖掘方法和装置 |
CN112199513A (zh) * | 2020-10-19 | 2021-01-08 | 支付宝(杭州)信息技术有限公司 | 企业供求关系的确定方法、装置和电子设备 |
CN112765287B (zh) * | 2021-02-05 | 2022-04-19 | 中国人民解放军国防科技大学 | 基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质 |
CN113342904B (zh) * | 2021-04-01 | 2021-12-24 | 山东省人工智能研究院 | 一种基于企业特征传播的企业服务推荐方法 |
-
2021
- 2021-09-30 CN CN202111164579.1A patent/CN113592568B/zh active Active
- 2021-10-19 WO PCT/CN2021/124683 patent/WO2023050491A1/zh unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909881A (zh) * | 2019-11-01 | 2020-03-24 | 中电科大数据研究院有限公司 | 一种面向跨媒体知识推理任务的知识表示方法 |
CN111797243A (zh) * | 2020-07-03 | 2020-10-20 | 中国烟草总公司湖南省公司 | 知识图谱数据系统构建方法、系统、终端及可读存储介质 |
CN113051409A (zh) * | 2021-04-09 | 2021-06-29 | 北京基智科技有限公司 | 基于多维度信息计算的知产行业商机推荐系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2023050491A1 (zh) | 2023-04-06 |
CN113592568A (zh) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113592568B (zh) | 一种商机挖掘方法、装置、计算机设备及存储介质 | |
Halteh et al. | Financial distress prediction of Islamic banks using tree-based stochastic techniques | |
Yu et al. | Forecasting credit ratings of decarbonized firms: Comparative assessment of machine learning models | |
Gangwar et al. | Review on IT adoption: insights from recent technologies | |
Falcone et al. | Supply chain technologies, interorganizational network and firm performance: A case study of Alibaba Group and Cainiao | |
CN112256762B (zh) | 基于产业地图的企业画像方法、系统、设备及介质 | |
US20140019295A1 (en) | Automated Technique For Generating Recommendations Of Potential Supplier Candidates | |
CN111062803A (zh) | 一种金融业务查询查复方法及系统 | |
Snihovyi et al. | Implementation of robo-advisor services for different risk attitude investment decisions using machine learning techniques | |
Manoharan et al. | Artificial Intelligence at the Helm: Steering the Modern Business Landscape Toward Progress | |
Tekouabou et al. | AI-based on machine learning methods for urban real estate prediction: a systematic survey | |
Byrum | AI in financial portfolio management: Practical considerations and use cases | |
Gupta et al. | House prices prediction using machine learning regression models | |
Antad et al. | Stock Price Prediction Website Using Linear Regression-A Machine Learning Algorithm | |
Liu et al. | The dynamic relationship between macroeconomy and stock market in China: evidence from Bayesian network | |
KR102519878B1 (ko) | 금융기관 신용공여 사업에서의 인공지능 기반 리스크 관리 솔루션을 제공하기 위한 장치, 방법 및 명령을 기록한 기록 매체 | |
CN115982391A (zh) | 信息处理方法及装置 | |
US20230186070A1 (en) | Artificial intelligence based data processing in enterprise application | |
KR102365308B1 (ko) | 인공 신경망을 이용하여 기업 내부 문서의 리스크를 예측하는 방법 및 장치 | |
Aliyev et al. | Activity characteristics and perspective development directions of electronic trade platforms in Azerbaijan | |
Adeyinka | Digital transformation and firm efficiency in the Nigerian manufacturing sector | |
Makki | Application of artificial intelligence technology in digital marketing systems | |
Gautam | Applications of AI and Machine Learning in Banking Solutions. | |
Castrillón López et al. | Dirección de Impuestos y Aduanas Nacionales’s challenges of cross-border e-commerce in 2020’s year | |
Fatima et al. | THE IMPACT OF E-COMMERCE ON SMALL BUSINESS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |