CN117291722A - 对象管理方法、相关设备及计算机可读介质 - Google Patents
对象管理方法、相关设备及计算机可读介质 Download PDFInfo
- Publication number
- CN117291722A CN117291722A CN202311189891.5A CN202311189891A CN117291722A CN 117291722 A CN117291722 A CN 117291722A CN 202311189891 A CN202311189891 A CN 202311189891A CN 117291722 A CN117291722 A CN 117291722A
- Authority
- CN
- China
- Prior art keywords
- object entity
- feature vector
- entity
- virtual resource
- neighbor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title claims abstract description 52
- 239000013598 vector Substances 0.000 claims abstract description 329
- 238000012546 transfer Methods 0.000 claims abstract description 106
- 238000000034 method Methods 0.000 claims abstract description 57
- 238000004590 computer program Methods 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims description 50
- 238000010276 construction Methods 0.000 claims description 14
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 238000007499 fusion processing Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 74
- 238000004422 calculation algorithm Methods 0.000 description 32
- 238000010586 diagram Methods 0.000 description 24
- 230000008520 organization Effects 0.000 description 24
- 230000008569 process Effects 0.000 description 16
- 230000006870 function Effects 0.000 description 11
- 238000013473 artificial intelligence Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 230000009286 beneficial effect Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 230000003542 behavioural effect Effects 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000012550 audit Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000007500 overflow downdraw method Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请的实施例公开了对象管理方法、装置、电子设备、计算机可读介质及计算机程序产品,该方法包括:获取知识图谱中每个对象实体的交易数据,交易数据中包含虚拟资源转移记录以及虚拟资源转移记录对应的备注信息;基于虚拟资源转移记录和备注信息分别构建每个对象实体的行为特征向量和文本特征向量,并拼接得到每个对象实体的拼接特征向量;最后,基于知识图谱中指定对象实体的拼接特征向量,以及指定对象实体的邻居对象实体的拼接特征向量,从邻居对象实体中预测与指定对象实体属于同一实体类型的目标对象实体。本申请实施例的技术方案可以提高同类型对象的推荐准确性。
Description
技术领域
本申请涉及计算机及通信技术领域,具体而言,涉及对象管理方法、数据处理装置、电子设备、计算机可读介质及计算机程序产品。
背景技术
随着互联网金融的发展,通过互联网实施的不法金融行为也越来越多,许多不法金融行为都会以组织或团体的形式进行实施。如果能够分析和挖掘出与某个对象属于同一组织或团体的其他对象(也可以称作某个对象的同类型对象);那么,对不法金融行为的监管和预防会更加有效和完整。在相关技术中,主要是通过专家总结的规则去筛选出某个对象的同类型对象,并进行推荐。上述方法依赖金融方面的专家经验所设定的规则,具有一定局限性,故而准确性并不高。因此,如何提高同类型对象的推荐准确性,是目前亟需解决的问题。
发明内容
本申请的实施例提供了对象管理方法、对象管理装置、电子设备、计算机可读介质及计算机程序产品,可以提高同类型对象的推荐准确性。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
第一方面本申请实施例提供了一种对象管理方法,包括:
获取知识图谱中每个对象实体的交易数据;其中,所述交易数据包括虚拟资源转移记录,以及所述虚拟资源转移记录对应的备注信息,所述备注信息用于对虚拟资源的转移进行解释说明;
基于所述虚拟资源转移记录构建所述每个对象实体的行为特征向量,以及基于所述备注信息构建所述每个对象实体的文本特征向量;
将所述行为特征向量和所述文本特征向量进行拼接,得到所述每个对象实体的拼接特征向量;
基于所述知识图谱中指定对象实体的拼接特征向量,以及所述指定对象实体的邻居对象实体的拼接特征向量,从所述邻居对象实体中预测与所述指定对象实体属于同一实体类型的目标对象实体。
第二方面,本申请实施例提供了一种对象管理装置,所述装置包括获取单元、构建单元和处理单元,其中:
所述获取单元,用于获取知识图谱中每个对象实体的交易数据;其中,所述交易数据包括虚拟资源转移记录,以及所述虚拟资源转移记录对应的备注信息,所述备注信息用于对虚拟资源的转移进行解释说明;
所述构建单元,用于基于所述虚拟资源转移记录构建所述每个对象实体的行为特征向量,以及基于所述备注信息构建所述每个对象实体的文本特征向量;
所述处理单元,用于将所述行为特征向量和所述文本特征向量进行拼接,得到所述每个对象实体的拼接特征向量;
所述处理单元,还用于基于所述知识图谱中指定对象实体的拼接特征向量,以及所述指定对象实体的邻居对象实体的拼接特征向量,从所述邻居对象实体中预测与所述指定对象实体属于同一实体类型的目标对象实体。
第三方面,本申请实施例提供了一种电子设备,包括一个或多个处理器;存储装置,用于存储一个或多个计算机程序,当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述电子设备实现如上所述对象管理方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,当所述计算机程序被电子设备的处理器执行时,使电子设备执行如上所述的对象管理方法。
第五方面,本申请实施例提供了一种计算机程序产品,包括计算机程序,所述计算机程序存储在计算机可读存储介质中,电子设备的处理器从所述计算机可读存储介质读取并执行所述计算机程序,使得所述电子设备执行如上所述的对象管理方法。
在本申请的实施例所提供的技术方案中,通过虚拟资源转移记录和备注信息分别构建相应对象实体的行为特征向量和文本特征向量的方式,使得后续所构建的每个对象实体的拼接特征向量能够表征每个对象实体对虚拟资源的转移行为和备注文本。同时,本申请实施例会从指定对象实体的邻居对象实体中进行预测,相当于初步筛选出了最有可能与指定对象实体属于同一实体类型的对象实体,有利于提高处理效率的同时也能缩小对象范围,从而有利于后续精准预测目标对象实体。最后,本申请实施例基于指定对象实体及其邻居对象实体的拼接特征向量,可以从虚拟资源的转移行为和备注文本等维度对对象实体进行多维度的充分比较,有利于从相邻的对象实体准确预测出与指定对象实体属于同一实体类型的目标对象实体,从而提高同类型对象的推荐准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。在附图中:
图1是本申请实施例提供的一种对象管理系统的结构示意图;
图2是本申请实施例提供的一种对象管理方法的流程示意图;
图3是本申请实施例提供的一种知识图谱的示意图;
图4是本申请实施例提供的一种行为特征向量的构建过程示意图;
图5是本申请实施例提供的一种文本特征向量的构建过程示意图;
图6是本申请实施例提供的一种入账特征向量的计算过程示意图;
图7是本申请实施例提供的另一种对象管理方法的流程示意图;
图8是本申请实施例提供的一种交易属性类型的示意图;
图9是本申请实施例提供的一种模型输入输出的对比示意图;
图10是本申请实施例提供的一种算法效果的对比示意图;
图11是本申请实施例提供的对象管理装置的结构框图;
图12示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/,也不是必须按所描述的顺序执行。例如,有的操作/还可以分解,而有的操作/可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
还需要说明的是:在本申请中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
人工智能技术(Artificial Intelligence,AI)是指利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术;其主要通过了解智能的实质,生产出一种新的能以人类智能相似的方式做出反应的智能机器,使得智能机器具有感知、推理与决策等多种功能。相应的,AI技术是一门综合学科,其主要包括计算机视觉技术(Computer Vision,CV)、语音技术、自然语言处理技术(NatureLanguage processing,NLP)以及机器学习/深度学习等几大方向。
所谓的自然语言处理技术是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱(Knowledge Graph)等技术。
其中,知识图谱指的是以图谱结构的形式构建知识资源之间的相关联系。知识图谱的节点主要包括实体、概念和属性三种类型。实体指的是具有可区别性且独立存在的某种事物。如单独的一个人、具体的一件商品,等等。实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。概念指的是具有同种特性的实体构成的集合,如国家、籍贯、书籍,等等。而属性用于区分概念,可以描述两个节点之间的关系。
为了分析和挖掘出与某个对象属于同一组织或团体的其他对象,在相关技术中,主要可以通过设定一些规则或策略的方式,去筛选出与某个对象属于同一组织或团体的对象。上述方式依赖金融方面的专家经验所设定的规则或策略,具有一定局限性,故而准确性并不高。
基于此,本申请实施例提供了一种对象管理方案,该方案在已经构建好知识图谱之后,还会进一步获取知识图谱中每个对象实体的交易数据,以通过每个对象实体的交易数据中包含的虚拟资源转移记录和备注信息,去分别构建每个对象实体的行为特征向量和文本特征向量。然后,通过拼接每个对象实体的行为特征向量和文本特征向量的方式,可以得到知识图谱中每个对象实体的拼接特征向量,以借助每个对象实体的拼接特征向量去预测与知识图谱中的某个对象实体属于同一实体类型的对象实体。
其中,知识图谱的节点具体可以包括多个对象实体,对象可以是具备支配虚拟资源的能力的人或物,实体则是知识图谱中节点的一种类型。而虚拟资源可以是能够充当一般等价物的资源数据,也可以是通过支付软件以电子形式进行支付的能够充当一般等价物的物品,在此不限定。
同时,虚拟资源转移记录具体可以包含虚拟资源的数量、虚拟资源的转移时间,转入资源账户、转出资源账户等一种或多种信息。备注信息则是用于对虚拟资源的转移进行解释说明。
另外,知识图谱中不同对象实体所属的实体类型可能相同也可能不同。具体实现中,实体类型可以以组织、团体、群组等方式去进行分类;比如,若两个对象实体属于同一组织,则可以认为这两个对象实体所属的实体类型相同。
此外,预测与某个对象实体属于同一实体类型的对象实体的方式具体可以包括:先确定知识图谱中与某个对象实体所相邻的对象实体;然后,基于某个对象实体的拼接特征向量,以及所相邻的对象实体的拼接特征向量,从所相邻的对象实体中预测出与某个对象实体属于同一实体类型的对象实体。
由于同一组织或团体的对象不可避免地会有一些往来,从而产生关联,因此,有关联的对象更有可能属于同一个组织或团体。本方案通过知识图谱内对象实体之间的连接关系,可以找到知识图谱中与某个对象实体所相邻的对象实体,即与某个对象实体具有关联的对象实体,从而初步筛选出最有可能与某个对象实体属于同一实体类型的对象实体。因此,本方案通过确定与某个对象实体所相邻的对象实体的方式,一方面可以减少后续所需处理的数据量,提高处理效率;另一方面还可以缩小对象范围,有利于后续精准预测出与某个对象实体属于同一实体类型的对象实体。
同时,金融行为往往伴随着虚拟资源的转移,而同一组织或团体的对象在转移虚拟资源时的行为具有一定的规律性和相似性,且同一组织或团体的对象在转移虚拟资源时可能会添加相似的备注或者约定的暗号。因此,本方案会先基于虚拟资源转移记录和备注信息分别构建相应对象实体的行为特征向量和文本特征向量,从而拼接得到相应对象实体的拼接特征向量;然后,本方案通过基于某个对象实体及其所相邻的对象实体的拼接特征向量,预测与某个对象实体属于同一实体类型的对象实体的方式,使得某个对象实体及其所相邻的对象实体可以从虚拟资源的转移行为以及转移备注这两个维度进行充分比较,有利于从相邻的对象实体准确预测出与某个对象实体属于同一实体类型的对象实体,从而提高同类型对象的推荐准确性。
基于上述对象管理方案,本申请实施例提供了一种对象管理系统,可参见图1,图1所示的对象管理系统可以包括多个终端设备101和多个服务器102。其中,任一终端设备和任一服务器之间均建立有通信连接。举例来说,终端设备101可以包括智能手机、平板电脑、笔记本电脑、台式计算机、车载终端以及智能可穿戴设备中的任意一种或多种。终端设备101内可以运行多媒体播放客户端、社交客户端、浏览器客户端、信息流客户端、教育客户端等。服务器102可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的服务器。任一终端设备101以及任一服务器102之间可以通过有线或无线通信方式进行直接或间接地通信连接,本申请在此不做限制。
在一些实施例中,上述对象管理方法可以仅由图1所示对象管理系统中的服务器102执行,具体执行过程为:服务器102可以获取知识图谱中每个对象实体的交易数据。然后,服务器102可以基于每个对象实体的交易数据中包含的虚拟资源转移记录和备注信息,去分别构建每个对象实体的行为特征向量和文本特征向量。之后,服务器102可以拼接每个对象实体的行为特征向量和文本特征向量,从而得到每个对象实体的拼接特征向量。最后,服务器102可以根据任一对象实体的拼接特征向量,以及与任一对象实体所相邻的对象实体的拼接特征向量,从与其相邻的对象实体中预测出与任一对象实体属于同一实体类型的对象实体。
可选的,服务器102将得到的与任一对象实体属于同一实体类型的对象实体的目标对象标识发送至终端设备101,由终端设备101输出对象标识。可选的,服务器102还可以生成包含目标对象标识的提示信息,其中,提示信息用于提示目标对象标识所指示的对象存在风险。
可选的,上述对象管理方法也可以仅由图1所示的对象管理系统中的终端设备101执行,其具体执行过程可参见服务器102的具体执行过程,在此不再赘述。
在另一些实施例中,上述对象管理方法可以运行在对象管理系统中,对象管理系统可以包括终端设备和服务器。具体来说,上述对象管理方法可由图1所示的对象管理系统中所包含的多个终端设备101和服务器102来共同完成,不同对象实体使用不同的终端设备,其具体执行过程为:各个终端设备101可以将相应对象实体的交易数据上传至服务器102;然后,服务器102可以基于每个对象实体的交易数据中包含的虚拟资源转移记录和备注信息,去分别构建每个对象实体的行为特征向量和文本特征向量。之后,服务器102可以拼接每个对象实体的行为特征向量和文本特征向量,从而得到每个对象实体的拼接特征向量。最后,服务器102可以根据任一对象实体的拼接特征向量,以及与任一对象实体所相邻的对象实体的拼接特征向量,从与其相邻的对象实体中预测出与任一对象实体属于同一实体类型的对象实体。
需要说明的是,本申请实施例可以用于预测与任何对象属于同一实体类型的对象,可应用于各种场景,包括但不限于云技术、AI(Artificial Intelligence,人工智能)、智慧金融、智慧警务等各种场景,也可以用于购物应用、支付应用、金融交易应用等能够转移和交换虚拟资源的应用,对此不作限定。
具体地,可以将本申请实施例的技术方案应用在智慧警务场景中,服务器可以是警务服务器,管理人员可以通过管理客户端与警务服务器进行交互。警务服务器可以先获取知识图谱中每个对象实体的交易数据,然后基于每个对象实体的交易数据中包含的虚拟资源转移记录和备注信息,去分别构建每个对象实体的行为特征向量和文本特征向量。之后,警务服务器可以拼接每个对象实体的行为特征向量和文本特征向量,从而得到每个对象实体的拼接特征向量。
管理人员在确定出确实实施了不法金融行为的不法对象之后,可以通过管理客户端将不法对象的对象标识上传至警务服务器,由警务服务器确定接收到的对象标识在知识图谱中所对应的对象实体;然后,警务服务器可以基于确定的对象实体的拼接特征向量,以及与该对象实体所相邻的对象实体的拼接特征向量,从与其相邻的对象实体中预测出与该对象实体属于同一实体类型的对象实体。
可选的,警务服务器可以将预测出的对象实体对应的对象标识发送至管理客户端,由管理客户端输出相应对象标识,以便管理人员对接收到的对象标识所指示的对象进行监管。
进一步的,管理人员通过接收到的对象标识,可以明确警务服务器所推荐的与不法对象属于同一组织或团体的对象;而明确的对象越丰富,管理人员能够获取到的不法对象所在组织或团体的相关信息越多,对相应组织或团体的可疑金融行为或者不法金融行为的分析也就更完整,有利于管理人员对可疑金融行为或者不法金融行为的监管和预防,避免漏网之鱼。
又例如将本申请实施例的技术方案应用于支付应用中,服务器可以是为支付应用提供数据处理服务器的应用服务器。应用服务器可以先获取知识图谱中每个对象实体的交易数据;然后,应用服务器可以基于每个对象实体的交易数据中包含的虚拟资源转移记录和备注信息,去分别构建每个对象实体的行为特征向量和文本特征向量;之后,应用服务器可以拼接每个对象实体的行为特征向量和文本特征向量,从而得到每个对象实体的拼接特征向量。
若支付应用检测到使用支付应用的支付对象存在异常支付操作,则支付应用可以将该支付对象的对象标识上传至应用服务器,由应用服务器确定接收到的对象标识在知识图谱中所对应的对象实体。其中,异常支付操作可能是资源账户内短时间内频繁转出或转入大量的虚拟资源,或者资源账户将自身资源账户内的虚拟资源转入被投诉或禁止使用的其他资源账户,等等。
然后,应用服务器可以基于确定的对象实体的拼接特征向量,以及与该对象实体所相邻的对象实体的拼接特征向量,从与其相邻的对象实体中预测出与该对象实体属于同一实体类型的对象实体。
可选的,应用服务器可以将预测出的对象实体对应的对象标识发送至应用后台,由应用后台输出相应对象标识,以便后台管理人员对接收到的对象标识所指示的对象进行监管。
需要说明的是,在本申请的具体实施方式中,若交易数据、虚拟资源转移记录、备注信息等相关数据或信息涉及到对象相关,当本申请实施例运用到具体产品或技术中时,需要获得对象许可或者同意,且相关数据或信息的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
以下对本申请实施例的技术方案的各种实现细节进行详细阐述:
如图2所示,图2是本申请的一个实施例示出的对象管理方法的流程示意图,该方法可以应用于图1所示的对象管理系统,该方法可以由终端设备或服务器执行,也可以由终端设备和服务器共同执行,在本申请实施例中,以该方法由服务器执行为例进行说明,其中,对象管理方法可以包括S201至S204,详细介绍如下:
S201、获取知识图谱中每个对象实体的交易数据。
在本申请实施例中,每个对象实体的交易数据可以包括每个对象实体的虚拟资源转移记录,以及每个对象实体的虚拟资源转移记录对应的备注信息;其中,备注信息用于对相应虚拟资源的转移进行解释说明。
同时,所获取的每个对象实体的交易数据可以是每个对象实体在近期产生的交易数据,如最近P天内产生的交易数据,P为正整数;也可以是每个对象实体在产生交易数据以来的所有交易数据,在此不作限定。
此外,任一对象实体的交易数据还可以包括任一对象实体在通过虚拟资源进行交换时产生的各种数据。具体来说,交易数据可以包括交易时间、交易的虚拟资源的数量、交易方式、交易对手等各方面的数据。
另外,知识图谱可以包括多个对象实体。知识图谱中属于任一对象实体的节点包括父节点和至少一层子节点。其中,父节点用于指示相应对象实体,每个子节点用于指示相应对象实体的实体描述单元信息,而至少一层子节点指示的实体描述单元信息组成相应对象实体的实体描述信息。
举例来说,对象实体A所指示的对象的性别为“女”,开户银行包括“D银行”,以及最近1周内转出的金额为“1325”;那么,在知识图谱中属于对象实体A的节点可以包括四个。其中,一个父节点用于指示对象实体A;还有一层子节点,该层子节点包括3个子节点,这3个字节点对应的实体描述单元信息分别包括“女”、“D银行”以及“1325”。
在一个实施例中,由于不法金融组织或团体内的对象主要是在金融交易方面产生关联;因此,为了更加明确属于同一不法金融组织或团体的对象之间的关联,从而提高后续的预测准确性,可以针对性地建立金融方面的知识图谱。
那么,金融方面的知识图谱可以是基于多个对象实体的交易数据所构建的,也可以是基于多个对象实体的交易数据和对象属性数据所构建的。其中,对象属性数据可以包括任何关于对象的性质的数据,具体可以包括对象的姓名、年龄、性别、国籍、网络地址、邮箱等。
可选的,知识图谱中每两个对象实体之间可以通过每两个对象实体之间的虚拟资源关系进行连接。虚拟资源关系可以包括对象实体之间的虚拟资源转移关系。举例来说,若一个对象实体在最近三天内向另一个对象实体转账了5000元,则说明这两个对象实体之间具有虚拟资源关系,且该虚拟资源关系指示两个对象实体转账了5000元。若一个对象实体在最近一周内向另一个对象实体转移了10次虚拟资源,则可以确定这两个对象实体之间具有虚拟资源关系,且该虚拟资源关系指示两个对象实体的虚拟资源转移笔数为10次。
进一步的,知识图谱中每两个对象实体之间还可以通过每两个对象实体之间的属性关系进行连接。也就是说,如果某两个对象实体之间具有相同属性,则可以在知识图谱中建立这两个对象实体之间的连接。举例来说,如果对象实体A和对象实体B的网络地址相同,则可以在知识图谱中建立对象实体A和对象实体B之间的连接。
示例性地,请参见附图3,示出了一种知识图谱的示意图。如图3所示,知识图谱中的对象实体301和对象实体302分别指示对象001和对象002。其中,属于对象001的子节点共包括两层子节点,第一层节点包括节点303和节点304,分别用于描述对象001的国籍为M国,工作是基金经理;第二层子节点包括节点305和节点306,分别描述对象001作为基金经理所的擅长领域包括医疗和科技。
属于对象002的子节点共包括一层子节点,节点307、节点308和节点309分别用于描述对象002的银行账号为12345678、工作是大学教授以及国籍为A国。此外,由于对象002向对象001所管理的基金一共转账了10万元,超过预设金额5万元,因此对象002和对象001之间建立有边310。
S202、基于虚拟资源转移记录构建每个对象实体的行为特征向量,以及基于备注信息构建每个对象实体的文本特征向量。
在本申请实施例中,可以通过卷积神经网络、双向长短期记忆网络、基于注意力机制的神经网络、循环神经网络、N元语法模型(N-gram)、doc2vec(是一种无监督算法,能从句子、段落或文档等变长的文本中学习得到固定长度的特征表示)等文本特征提取算法中的一种或多种,去构建每个对象实体的行为特征向量和文本特征向量,在此不作限定。
在一个实施例中,每个对象实体的虚拟资源转移记录的数量可以包括多条,而不同虚拟资源转移记录的产生时间也会不同。由于虚拟资源之间的转移的先后顺序,能够在一定程度上反映相应对象实体的交易规律和偏好。
那么,构建任一对象实体的行为特征向量的具体方式可以包括:对任一对象实体的每条虚拟资源转移记录进行符号化处理,得到每条虚拟资源转移记录的行为记录表示字段;按照每条虚拟资源转移记录的产生时间,将每条虚拟资源转移记录的行为记录表示字段进行拼接,得到行为序列文本;对行为序列文本进行文本特征提取处理,得到任一对象实体的行为特征向量。
其中,符号化处理指的是将每条虚拟资源转移记录中的文本处理成简短的字段;通过符号化处理的方式,可以在能够清楚表达每条虚拟资源转移记录的内容时,也能在一定程度上减少数据处理量,从而提高处理效率。此外,可以采用上述文本特征提取算法去进行文本特征提取处理,在此不作赘述。
具体实现中,请参见附图4,示出了一种行为特征向量的构建过程示意图。如图4所示,可以先获取对象实体的虚拟资源转移记录,如表格401所示,一共包括6条虚拟资源转移记录,每条虚拟资源转移记录的产生时间不同。
然后,再对虚拟资源转移记录进行符号化处理。如表格402所示,对虚拟资源转移记录进行符号化处理之后,可以得到每条虚拟资源转移记录相应的行为记录表示字段。如表格401中第一条虚拟资源转移记录所对应的行为记录表示字段为“红包_出_50_100”。
其中,由于同一组织或团体内的对象可以会通过变换金额尾数等方式去分批次转移虚拟资源;但每次需要转移的虚拟资源的金额或数量都是在一定的范围内的。因此,可以通过划分范围的方式对虚拟资源转移记录中的具体数值进行表示,有利于增大同一组织或团体内的对象对应的行为特征向量的相似性,从而有利于后续提高同类型对象的推荐准确性。图4的示例中就通过金额范围(即50_100)对具体金额(即99)进行了表示。
然后,如图4所示,可以将每条虚拟资源转移记录对应的行为记录表示字段进行序列化,也就是按照每条虚拟资源转移记录的产生时间拼接相应行为记录表示字段,从而得到行为序列文本403。
在通过doc2vec算法进行特征提取之前,还需要通过选定不同中心词的方式将行为序列文本403拆分为多个序列,即序列N-gram化。如表格404所示,行为序列文本403可以被拆分为4个序列。
最后,如图4所示,通过doc2vec算法对4个序列进行处理之后,就可以输出相应对象实体的行为特征向量,即输出特征向量。
在一个实施例中,构建任一对象实体的文本特征向量的具体方式可以包括:对任一对象实体的备注信息进行分词处理,得到多个备注字段以及每个备注字段的权重;对每个备注字段进行向量映射处理,得到每个备注字段的初始词向量;基于每个备注字段的初始词向量和权重,得到每个备注字段的目标词向量;根据多个备注字段的目标词向量,得到任一对象实体的文本特征向量。
其中,可以采用分词器(即tokenizer)等各种分词工具进行分词处理。可选的,由于备注信息属于短文本,口语化和黒词化(黑词即组织或团体内部约定使用的词语)比较普遍,而有些分词工具由于对口语化的词语或者黑词不熟悉,使得其分词并不准确。因此,为了提高分词的准确性,可以直接调用N-gram模型对备注信息进行拆分,这样备注信息会转换成由多个序列组成的集合,而每个序列中的字段都会有重复的,从而有利于避免分词错误的情况。
此外,每个备注字段的权重可以是终端设备或服务器基于每个备注字段在备注信息中的字段位置和/或每个备注字段的字段长度设定的。其中,权重与字段长度可以呈正比或呈反比;备注信息中位置越靠前的备注字段的权重可以越大,备注信息中位置越靠后的备注字段的权重可以越大,或者备注信息中位置越靠中间的备注字段的权重可以越大。可选的,还可以通过其他方式设定每个备注字段的权重,在此不作限定。
同时,具体可以采用哈希函数对每个备注字段进行向量映射处理。可选的,还可以采用其他方式进行向量映射处理,在此不作限定。
另外,具体可以将每个备注字段的初始词向量和权重相乘,从而得到每个备注字段的目标词向量。以及,可以将多个备注字段的目标词向量进行特征融合,从而得到相应对象实体的文本特征向量。
具体来说,特征融合的方式可以包括将多个备注字段的目标词向量相加,也可以将多个备注字段的目标词向量进行拼接,还可以是将多个备注字段的目标词向量在特征通道层面上的融合,在此不作限定。后续也不再对特征融合的方式进行赘述。
可选的,在对任一对象实体的备注信息进行分词处理之前,还可以若从备注信息中识别出预设字段,则可以删除备注信息中的预设字段,得到处理后的备注信息,以通过处理后的备注信息构建任一对象实体的文本特征向量。
具体实现中,预设字段可以包括特殊字符、表情符号、停用词,节日祝福等对于交易目的、交易偏好或交易内容无实际意义的字段。
在一个实施例中,任一对象实体的备注信息可以包括入账信息和出账信息。其中,入账信息对应的虚拟资源转移记录用于表征相应虚拟资源从其他对象实体的资源账户转入至任一对象实体的资源账户;其中,入账信息可以是其他对象实体在将虚拟资源转入至任一对象实体的资源账户时备注的,也可以是任一对象实体在接收其他对象实体转入的虚拟资源时备注的,在此不作限定。
同时,入账信息对应的虚拟资源转移记录用于表征相应虚拟资源从任一对象实体的资源账户转出至其他对象实体的资源账户。出账信息可以是任一对象实体在将虚拟资源转出至其他对象实体的资源账户时备注的。
由于同一组织或团体内的对象可能会针对虚拟资源的出账和入账有着不同的备注规律和特点;因此,构建任一对象实体的文本特征向量的具体方式可以包括:基于入账信息构建任一对象实体的入账特征向量,以及基于出账信息构建任一对象实体的出账特征向量;根据任一对象实体的入账特征向量和出账特征向量,得到任一对象实体的文本特征向量。
其中,可以将任一对象实体的入账特征向量和出账特征向量进行拼接,从而得到任一对象实体的文本特征向量,通过特征拼接的方式可以最大程度地保留入账特征向量和出账特征向量所表征的相应对象实体在入账和出账时的特点,有利于实现后续在预测时能从入账备注和出账备注的维度对对象实体进行比较。
此外,基于入账信息或出账信息构建相应入账特征向量或出账特征向量的具体实施方式可以参见上述构建文本特征向量的具体实施方式,在此不作赘述。
具体实现中,请参见附图5,示出了一种文本特征向量的构建过程示意图。如图5所示,在获取到一个对象实体的备注信息之后,可以先确定出备注信息中的入账信息和出账信息;然后,对入账信息和出账信息分别进行预处理、N-gram分词以及计算相应的入账特征向量和出账特征向量。其中,预处理可以包括纠正错别字、删除预设字段,等等。
实际应用中,请参见附图6,示出了一种入账特征向量的计算过程示意图。如图6所示,在获取到入账信息之后,可以对入账信息进行分词处理,从而得到图6示出的多个字段以及每个字段的权重。
然后,如图6所示,可以调用哈希函数,对每个字段进行向量映射处理,从而得到每个字段的初始词向量。如图6中入账信息的第一个字段的初始词向量为“100110”。之后,如图6所示,可以将每个字段的初始词向量与每个字段的权重相乘,从而得到每个词向量的目标词向量。如上述“100110”对应的目标词向量为“w1-w1-w1w1w1-w1”。
在得到每个字段的目标词向量之后,如图6所示,可以将每个字段的目标词向量累计相加,从而得到相加后的特征向量“13,108,-22,-5,-32,-55”。最后,可以将相加后的特征向量中对应元素值大于0的元素的元素值设定为1,对应元素值小于或等于0的元素的元素值设定为0,从而得到入账特征向量“110001”。出账特征向量的计算过程可以参见入账特征向量的计算过程,在此不作限定。
S203、将行为特征向量和文本特征向量进行拼接,得到每个对象实体的拼接特征向量。
在本申请实施例中,可以将行为特征向量拼接在文本特征向量之后,也可以将文本特征向量拼接在行为特征向量之后,在此不对特征向量的拼接顺序作限定。
可选的,如果行为特征向量和文本特征向量的向量维度不同,则可以先将行为特征向量和文本特征向量映射到相同的向量维度,然后再将行为特征向量和文本特征向量拼接。
S204、基于知识图谱中指定对象实体的拼接特征向量,以及指定对象实体的邻居对象实体的拼接特征向量,从邻居对象实体中预测与指定对象实体属于同一实体类型的目标对象实体。
在本申请实施例中,指定对象实体可以是终端设备、服务器或者管理人员等所选定的对象实体。具体实现中,指定对象实体所对应的对象可以是在对象审核时被认定为实施了不法金融行为的对象。其中,对象审核的执行者可以是通过法律认证的监管机构,也可以是用于管理对象的公司或机构,在此不作限定。
同时,指定对象实体的邻居对象实体可以包括知识图谱中与指定对象实体直接或间接连接的对象实体,在此不作限定。邻居对象实体的数量可以包括一个或多个。
具体来说,指定对象实体的邻居对象实体可以包括N度,N为正整数;其中,第1度邻居对象实体包括知识图谱中与指定对象实体直接连接的对象实体,第2度邻居对象实体包括知识图谱中与上述第1度邻居对象实体直接连接的对象实体,第2度邻居对象实体包括知识图谱中与上述第2度邻居对象实体直接连接的对象实体,以此类推,直至确定出第N度邻居对象实体。
此外,可以采用单点法(pointwise,仅考虑单个查询字段和描述字段之间的关系,会把将问题转化为多分类或回归问题)、配对法(pairwise,是对每一个数据样本做一个比较关系,当一个文档比另一个文档相关排序更靠前的话,就是正例,否则便是负例)、列表法(listwise,会对同一个列表里的样本数据进行比较和排序)等一种或多种排序算法训练出相应的排序模型,然后调用排序模型,基于指定对象实体的拼接特征向量,以及邻居对象实体的拼接特征向量,从邻居对象实体中预测出目标对象实体。
在一个实施例中,邻居对象实体的数量可以包括多个;那么,预测目标对象实体的具体方式可以包括:对指定对象实体的拼接特征向量和每个邻居对象实体的拼接特征向量分别进行特征融合处理,得到多个目标特征向量;对每个目标特征向量进行分类预测处理,得到指定对象实体与相应邻居对象实体的对象关联度;基于每个邻居对象实体对应的对象关联度,从邻居对象实体中预测与指定对象实体属于同一实体类型的目标对象实体。
其中,目标对象实体对应的对象关联度大于其他邻居对象实体对应的对象关联度。可以通过逻辑回归模型、卷积神经网络模型、树模型、梯度提升决策树(GradientBoosting Decision Tree,GBDT)、支持向量机、随机森林模型等一种或多种模型去完成分类预测处理,在此不作赘述。
可选的,基于每个邻居对象实体对应的对象关联度,从邻居对象实体中预测出目标对象实体的具体方式可以包括:按照从大到小的顺序,对每个邻居对象实体对应的对象关联度进行排序处理,得到排序后的多个邻居对象实体;选取排序后的多个邻居对象实体中序号小于或等于预设序号的邻居对象实体作为目标对象实体。其中,预设序号可以是人为设定的,也可以是上述对象管理系统中的服务器或者终端设备设定的,在此不作限定。
举例来说,可以设定预设序号为3,那么就可以选择排序后的多个邻居对象实体中排前3的邻居对象实体作为目标对象实体。
可选的,也可以按照从小到大的顺序进行排序,之后则可以选取排序后的多个邻居对象实体中排序靠后的邻居对象实体作为目标对象实体。
在本申请实施例中,通过基于虚拟资源转移记录和备注信息分别构建相应对象实体的行为特征向量和文本特征向量,从而拼接得到相应对象实体的拼接特征向量的方式,使得拼接特征向量可以表征对象实体在虚拟资源的转移行为和备注文本这两个维度的特点,有利于后续从这两个维度对对象实体进行比较。
同时,本申请实施例通过基于某个对象实体及其邻居对象实体的拼接特征向量,预测与某个对象实体属于同一实体类型的对象实体的方式,使得某个对象实体及其所相邻的对象实体可以从虚拟资源的转移行为以及转移备注这两个维度进行充分比较;而同一组织或团体的对象在转移虚拟资源时的行为具有一定的规律性和相似性,且同一组织或团体的对象在转移虚拟资源时可能会添加相似的备注或者约定的暗号。因此,本申请实施例中的方案有利于从相邻的对象实体准确预测出与某个对象实体属于同一实体类型的对象实体,从而提高同类型对象的推荐准确性。
此外,本申请实施例是从指定对象实体的邻居对象实体中预测出目标对象实体,相当于初步筛选出了最有可能与指定对象实体属于同一实体类型的对象实体之后,再进行下一步预测。这种方式一方面可以减少后续所需处理的数据量,提高处理效率;另一方面还可以缩小对象范围,有利于后续精准预测出与指定对象实体属于同一实体类型的目标对象实体。
在本申请的一个实施例中,提供了另一种对象管理方法,该对象管理方法可以应用于图1示的对象管理系统,该方法可以由终端设备或服务器执行,也可以由终端设备和服务器共同执行,在本申请实施例中,以该方法由服务器执行为例进行说明,如图7所示,示出了另一种对象管理方法的流程示意图,该对象管理方法在图2中所示的方法的基础上进行了扩展。
其中,S701至S707详细介绍如下:
S701、获取知识图谱中每个对象实体的交易数据。
在本申请实施例中,步骤S701的具体实施方式可以参见上述实施例中步骤S201的具体实施方式,在此不赘述。
可选的,不同的不法金融组织或团体中的对象之间的虚拟资源关系都呈现普遍的规律和特点,比如,对象之间转移的虚拟资源的金额比较大、转移虚拟资源的次数比较多、转移的虚拟资源的频率比较高,等等。
因此,可以通过设定一些条件,去过滤掉知识图谱中的一些不太可能属于不法金融组织或团体的对象实体,使得知识图谱中的对象实体所对应的对象都是有可能实施不法金融行为的,有利于减小数据处理量,以及缩小对象范围,从而有利于提高后续对与指定对象实体属于同一实体类型的目标对象实体的预测准确性,进而提高对同类型对象的推荐准确性。
那么,在获取知识图谱中每个对象实体的交易数据之前,还可以获取待处理的知识图谱,其中,待处理的知识图谱包含的对象实体数量大于知识图谱;若连接待处理的知识图谱中任一对象实体的边所表征的虚拟资源关系均未达到预设关系条件,则对待处理的知识图谱中的任一对象实体进行实体去除处理,得到知识图谱。
其中,预设关系条件可以是根据多个不法金融组织或团体内对象之间的虚拟资源关系所呈现的规律和特点设定的。具体来说,可以设定预设关系条件为两个对象实体之间转移的虚拟资源的金额大于或等于指定金额,其中,指定金额可以是人为设定的,也可以是上述对象管理系统中终端设备或服务器设定的,在此不作限定。
举例来说,可以设定指定金额为3000元,如果连接某个对象实体的边所表征的虚拟资源关系指示某个对象实体与另一个对象实体之间转移的虚拟资源的金额为2100元,那么则可以确定这条边所表征的虚拟资源关系未达到预设关系条件。
S702、基于每个对象实体的虚拟资源转移记录构建每个对象实体的行为特征向量,以及基于每个对象实体的备注信息构建每个对象实体的文本特征向量。
在本申请实施例中,步骤S702的具体实施方式可以参见上述实施例中步骤S202的具体实施方式,在此不赘述。
S703、将每个对象实体的行为特征向量和文本特征向量进行拼接,得到每个对象实体的拼接特征向量。
在本申请实施例中,步骤S703的具体实施方式可以参见上述实施例中步骤S203的具体实施方式,在此不赘述。
在一种可能的实现方式中,除了转移虚拟资源时的备注和行为,同一组织或团体内的对象在交易虚拟资源时也会呈现相同或相似的交易规律和交易特点;因此,还可以进一步基于每个对象实体的交易数据,统计每个对象实体对应的多个属性值;其中,多个属性值分别对应不同交易属性类型;根据每个对象实体对应的多个属性值,构建每个对象实体的交易统计特征向量。
具体来说,交易属性类型可以从交易时间、交易方向、交易金额、交易发生地、交易场景、交易对手等一种或多种方面去设定。
那么,还可以将每个对象实体的交易统计特征向量,以及每个对象实体的行为特征向量和文本特征向量进行拼接,从而得到每个对象实体的拼接特征向量。
具体实现中,请参见附图8,示出了一种交易属性类型的示意图。如图8所示,交易属性类型可以分为交易时间、交易方向、交易金额、交易发生地、交易场景和交易对手这六个方面的交易属性类型。其中,交易时间这个方面可以包括白天交易天数、白天交易笔数、白天交易金额、夜间交易天数、夜间交易笔数、夜间交易金额、非工作日交易天数、非工作日交易笔数、非工作日交易金额等多个交易属性类型。其中,图中的省略号“……”表示还可以根据具体应用场景下对象之间的交易规律和交易特点设定不同的交易属性类型,在此不作限定,后续也不再赘述。
交易方向包括虚拟资源的转入和转出这两个方向,如图8所示,交易方向这个方面可以包括入账交易天数、入账交易笔数、入账交易金额、出账交易天数、出账交易笔数、出账交易金额、交易只进不出等交易属性类型。其中,交易只进不出指的是对象的资源账户只转入虚拟资源,不转出虚拟资源;同理,交易方向方面的交易属性类型还可以包括交易只出不进。
交易金额这个方面可以包括泛整百交易天数、泛整百交易笔数、泛整百交易金额、泛整十交易天数、泛整十交易笔数、泛整十交易金额、特殊尾数交易天数、特殊尾数交易笔数、特殊尾数交易金额等交易属性类型。其中,泛整百指的是交易金额尾数为100或者接近100,如泛整百可以包括交易金额尾数在96至104这个范围内的数字。泛整十同理,在此不赘述。特殊尾数可以是根据不法金融组织或团体的转账习惯设定的,如特殊尾数可以是5、6、4等。
交易发生地这个方面可以包括高风险地区交易天数、高风险地区交易笔数、高风险地区交易金额、交易省份聚集、交易发生地分散等交易属性类型。其中,高风险地区可以包括经常实施不法金融行为的地区,交易省份聚集指的是对象经常发生交易的省份,交易发生地分散指的是对象偶尔发生交易的地区。
交易场景这个方面可以包括快进快出、集中转入分散转出、小额高频等交易属性类型。其中,快进快出指的是虚拟资源转入资源账户之后,该资源账户又在短时间内转出虚拟资源;集中转入分散转出指的是多批虚拟资源集中转入资源账户之后,由资源账户间隔一定时间分批次分别转出;小额高频指的是资源账户短时间内多次转出或转入数量较少或金额较小的虚拟资源。
交易对手指的是金融交易的另一方。交易对手这个方面可以包括女性对手人数(即向某个对象转入或转出虚拟资源的对象为女性的数量);男性对手人数(即向某个对象转入或转出虚拟资源的对象为男性的数量)、老年对手人数(即向某个对象转入或转出虚拟资源的对象为老年人的数量)等交易属性类型。
在一种可能的实现方式中,除了通过直接连接对象实体之间的边来表征知识图谱中对象实体之间的关联之外,由于对象实体是知识图谱中的节点;因此,还可以通过知识图谱中每个对象实体的节点特征向量,去表征每个对象实体在知识图谱中的位置,以及每个对象实体去其他对象实体之间的关联。
那么,还可以针对知识图谱中的任一对象实体,将任一对象实体作为出发节点在知识图谱中进行节点跳转,得到多个节点序列;其中,任一节点序列包含相应节点序列的出发节点,以及每一次节点跳转所跳转到的节点;基于多个节点序列,对知识图谱中的每个节点进行特征编码处理,得到每个对象实体对应的节点特征向量。
具体实现中,可以采用node2vec算法(一种综合考虑深度优先搜索邻域和宽度优先搜索邻域的图向量方法)基于多个节点序列,对知识图谱中的每个节点进行特征编码处理,从而得到每个对象实体对应的节点特征向量。
因此,还可以将每个对象实体的节点特征向量,以及每个对象实体的行为特征向量和文本特征向量进行拼接,从而得到每个对象实体的拼接特征向量。
进一步的,还可以将每个对象实体的交易统计特征向量、节点特征向量、行为特征向量和文本特征向量进行拼接,从而得到每个对象实体的拼接特征向量。
S704、获取指定对象实体的对象属性数据,以及指定对象实体的邻居对象实体的对象属性数据。
在本申请实施例中,任一对象实体的对象属性数据包括多个对象属性类型分别对应的属性值。举例来说,对象属性类型可以包括姓氏、籍贯省份、籍贯城市、联系方式、设备标识、绑定银行卡,等等。如果某个对象实体所对应对象的姓氏为“王”,那么该对象实体在姓氏这个对象属性类型下的属性值为“王”。
S705、将指定对象实体和邻居对象实体分别对应的相同对象属性类型的属性值进行匹配,得到指定对象实体与邻居对象实体的多个匹配结果。
在本申请实施例中,匹配结果用于指示指定对象实体与邻居对象实体是否匹配。
其中,属性值的具体匹配方式可以包括:比较指定对象实体和邻居对象实体分别对应的相同对象属性类型的属性值是否相同,若相同,则生成指定对象实体与邻居对象实体匹配的匹配结果;若不相同,则生成指定对象实体与邻居对象实体不匹配的匹配结果。
可选的,属性值的具体匹配方式还可以包括:获取指定对象实体和邻居对象实体分别对应的相同对象属性类型的属性值之间的相似度;若获取到的相似度大于或等于预设相似度,则生成指定对象实体与邻居对象实体匹配的匹配结果;若获取到的相似度小于预设相似度,则生成指定对象实体与邻居对象实体不匹配的匹配结果。
其中,属性值是文本,而文本相似度的获取方式为本领域技术人员所公知,故而在此不作赘述。
需要说明的是,当邻居对象实体的数量包括多个时,将指定对象实体和邻居对象实体分别对应的相同对象属性类型的属性值进行匹配,得到指定对象实体与邻居对象实体的多个匹配结果,包括:将指定对象实体和每个邻居对象实体分别对应的相同对象属性类型的属性值进行匹配,得到指定对象实体与每个邻居对象实体的多个匹配结果。
S706、基于指定对象实体与邻居对象实体的多个匹配结果,得到指定对象实体与邻居对象实体的关联属性特征向量。
在本申请实施例中,可以先获取预设特征向量,其中,预设特征向量中元素的数量与对象属性类型的数量(即指定对象实体与每个邻居对象实体的匹配结果的数量)相同,预设特征向量中元素与对象属性类型呈对应关系,而匹配结果也与对象属性类型呈对应关系,因此预设特征向量中的元素与对象属性类型呈匹配结果呈对应关系。
若指定对象实体与邻居对象实体的任一匹配结果指示指定对象实体与邻居对象实体匹配,则将预设特征向量中的相应元素的元素值更新为第一预设值;若指定对象实体与邻居对象实体的任一匹配结果指示指定对象实体与邻居对象实体不匹配,则将预设特征向量中的相应元素的元素值更新为第二预设值。
其中,第一预设值和第二预设值可以是人为设定的,也可以是上述对象管理系统中的服务器或终端设备设定的,在此不作限定。举例来说,可以设定第一预设值为1,第二预设值为0;若两个对象实体的姓氏不匹配、籍贯省份匹配、籍贯城市匹配、联系方式不匹配、设备标识匹配,那么这两个对象实体的关联属性特征向量可以为[0,1,1,0,1]。
需要说明的是,当邻居对象实体的数量包括多个时,可以基于指定对象实体与任一邻居对象实体的多个匹配结果,得到指定对象实体与任一邻居对象实体的关联属性特征向量。
S707、基于指定对象实体的拼接特征向量,邻居对象实体的拼接特征向量,以及指定对象实体与邻居对象实体的关联属性特征向量,从邻居对象实体中预测目标对象实体。
在本申请实施例中,可以先将指定对象实体的拼接特征向量,以及指定对象实体与邻居对象实体的关联属性特征向量进行拼接,得到指定对象实体的目标特征向量;然后,再基于指定对象实体的目标特征向量,以及邻居对象实体的拼接特征向量,从邻居对象实体中预测目标对象实体。
具体实现中,当邻居对象实体的数量包括多个时,可以将指定对象实体的拼接特征向量,以及指定对象实体与每个邻居对象实体的关联属性特征向量进行拼接,得到指定对象实体针对每个邻居对象实体的目标特征向量;然后,基于指定对象实体针对每个邻居对象实体的目标特征向量,以及相应邻居对象实体的拼接特征向量,确定每个邻居对象实体是否与指定对象实体属于同一实体类型。
实际应用中,步骤S204中提及可以采用pointwise、pairwise以及listwise这三种算法训练相应排序模型。具体实现中,请参见附图9,示出了一种模型输入输出的对比示意图。
如图9所示,1)通过pointwise算法所训练的排序模型的模型输入为:将指定对象实体的目标特征向量与邻居对象实体的拼接特征向量进行拼接后所得到的特征向量。其中,针对不同的邻居对象实体,指定对象实体的目标特征向量不同。
模型输出包括预测结果Y,其中,预测结果Y=1时,用于表示指定对象实体和邻居对象实体属于同一实体类型;预测结果Y=0时,用于表示指定对象实体和邻居对象实体不属于同一实体类型。
2)通过pairwise算法所训练的排序模型的模型输入为:将指定对象实体针对邻居对象实体1的目标特征向量,和邻居对象实体1的拼接特征向量进行拼接后所得到的特征向量;以及将指定对象实体针对邻居对象实体2的目标特征向量,和邻居对象实体1的拼接特征向量进行拼接后所得到的特征向量。
模型输出包括预测结果Y,其中,预测结果Y=1时,用于表示指定对象实体和邻居对象实体1更可能属于同一实体类型;预测结果Y=-1时,用于表示指定对象实体和邻居对象实体2更可能属于同一实体类型。
3)设定一个批次的邻居对象实体包括邻居对象实体1、2、3、4;可以将指定对象实体针对邻居对象实体1、2、3、4的目标特征向量,分别和邻居对象实体1、2、3、4的拼接特征向量进行拼接,从而得到相应的4个特征向量。
那么,通过listwise算法所训练的排序模型的模型输入为上述得到的4个特征向量。模型输出包括预测结果Y,其中,预测结果Y=1时,用于表示邻居对象实体在多个邻居对象实体中与指定对象实体属于同一实体类型的可能性排第1;预测结果Y=2时,用于表示邻居对象实体在多个邻居对象实体中与指定对象实体属于同一实体类型的可能性排第2;预测结果Y=3时,用于表示邻居对象实体在多个邻居对象实体中与指定对象实体属于同一实体类型的可能性排第3;预测结果Y=4时,用于表示邻居对象实体在多个邻居对象实体中与指定对象实体属于同一实体类型的可能性排第4。
实际应用中,请参见附图10,示出了一种算法效果的对比示意图。如图10所示,柱状图1001表示五种算法选取出的Top 5目标对象实体的准确率(即选取出的最有可能与指定对象实体属于同一实体类型的5名目标对象实体实际与指定对象实体属于同一实体类型的概率)。
其中,柱状图1001中从左到右的第一根柱表示的是专家规则算法的Top5准确率;第二根柱表示的是融合了交易备注和网络结构相似度的专家规则算法的Top 5准确率;第三根柱表示的是融合了基于GBDT的pointwise算法的Top 5准确率;第四根柱表示的是基于RankNet(排序网络,从概率的角度来解决排序问题)的pairwise算法的Top 5准确率;第五根柱表示的是基于LambdaMART(梯度多重加法回归树)的listwise算法的Top 5准确率。
根据柱状图1001可知,加入了备注信息以及网络结构之后,专家规则算法的Top 5准确率有了小幅提升;由此可见,备注信息和网络结构的加入,能提升同类型对象的推荐准确率。
而在上述指定对象实体的目标特征向量以及邻居对象实体的拼接特征向量的基础上所使用的三种排序算法的Top 5准确率,相较于专家规则算法有了大幅提升。其中,基于GBDT的pointwise算法的效果最好,准确率达到了0.883。
同时,如图10所示,柱状图1002表示五种算法选取出的Top 5目标对象实体的召回率(即正确预测为正的占全部实际为正的比例)。
其中,柱状图1002中从左到右的第一根柱表示的是专家规则算法的Top5召回率;第二根柱表示的是融合了交易备注和网络结构相似度的专家规则算法的Top 5召回率;第三根柱表示的是融合了基于GBDT的pointwise算法的Top 5召回率;第四根柱表示的是基于RankNe的pairwise算法的Top 5召回率;第五根柱表示的是基于LambdaMART的listwise算法的Top 5召回率。
根据柱状图1002可知,加入了备注信息以及网络结构之后,专家规则算法的Top 5召回率有了小幅提升;由此可见,备注信息和网络结构的加入,能提升同类型对象的推荐准确率。
而在上述指定对象实体的目标特征向量以及邻居对象实体的拼接特征向量的基础上所使用的三种排序算法的Top 5召回率,相较于专家规则算法有了大幅提升。其中,基于GBDT的pointwise算法的效果最好,召回率达到了0.861。
在本申请实施例中,通过构建指定对象实体与邻居对象实体的关联属性特征向量的方式,可以通过关联属性特征向量直接表征指定对象实体与邻居对象实体在对象属性维度的匹配情况,使得后续可以从虚拟资源的转移行为、备注文本以及对象属性等维度进行多维度全方面的比较,有利于从相邻的对象实体准确预测出与某个对象实体属于同一实体类型的对象实体,进一步提高同类型对象的推荐准确性。
此外,本申请实施例中还可以通过构建对象实体的节点特征向量以及交易统计特征向量的方式,使得后续可以从虚拟资源的转移行为、备注文本对象属性、对象实体在知识图谱中的位置关系、对象实体的交易规律等维度进行更多维度的比较,有利于从相邻的对象实体准确预测出与某个对象实体属于同一实体类型的对象实体,从而大幅提高同类型对象的推荐准确性。
在此介绍本申请的装置实施例,可以用于执行本申请上述实施例中的对象管理方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的对象管理方法的实施例。
本申请实施例提供了一种对象管理装置,如图11所示,装置包括获取单元1101、构建单元1102和处理单元1103,其中:
获取单元1101,用于获取知识图谱中每个对象实体的交易数据;其中,交易数据包括虚拟资源转移记录,以及虚拟资源转移记录对应的备注信息,备注信息用于对虚拟资源的转移进行解释说明;
构建单元1102,用于基于虚拟资源转移记录构建每个对象实体的行为特征向量,以及基于备注信息构建每个对象实体的文本特征向量;
处理单元1103,用于将行为特征向量和文本特征向量进行拼接,得到每个对象实体的拼接特征向量;
处理单元1103,还用于基于知识图谱中指定对象实体的拼接特征向量,以及指定对象实体的邻居对象实体的拼接特征向量,从邻居对象实体中预测与指定对象实体属于同一实体类型的目标对象实体。
在本申请的一个实施例中,每个对象实体的虚拟资源转移记录的数量包括多条,不同虚拟资源转移记录的产生时间不同;基于前述方案,构建单元1102在基于虚拟资源转移记录构建每个对象实体的行为特征向量时,具体可以用于:对任一对象实体的每条虚拟资源转移记录进行符号化处理,得到每条虚拟资源转移记录的行为记录表示字段;按照每条虚拟资源转移记录的产生时间,将每条虚拟资源转移记录的行为记录表示字段进行拼接,得到行为序列文本;对行为序列文本进行文本特征提取处理,得到任一对象实体的行为特征向量。
在本申请的一个实施例中,基于前述方案,构建单元1102在基于备注信息构建每个对象实体的文本特征向量时,具体可以用于:对任一对象实体的备注信息进行分词处理,得到多个备注字段以及每个备注字段的权重;对每个备注字段进行向量映射处理,得到每个备注字段的初始词向量;基于每个备注字段的初始词向量和权重,得到每个备注字段的目标词向量;根据多个备注字段的目标词向量,得到任一对象实体的文本特征向量。
在本申请的一个实施例中,任一对象实体的备注信息包括入账信息和出账信息,入账信息对应的虚拟资源转移记录用于表征相应虚拟资源从其他对象实体的资源账户转入至任一对象实体的资源账户,入账信息对应的虚拟资源转移记录用于表征相应虚拟资源从任一对象实体的资源账户转出至其他对象实体的资源账户;基于前述方案,构建单元1102在基于备注信息构建每个对象实体的文本特征向量时,具体可以用于:基于入账信息构建任一对象实体的入账特征向量,以及基于出账信息构建任一对象实体的出账特征向量;根据任一对象实体的入账特征向量和出账特征向量,得到任一对象实体的文本特征向量。
在本申请的一个实施例中,基于前述方案,获取单元1101还可以用于获取指定对象实体的对象属性数据,以及邻居对象实体的对象属性数据;其中,任一对象实体的对象属性数据包括多个对象属性类型分别对应的属性值;构建单元1102还可以用于将指定对象实体和邻居对象实体分别对应的相同对象属性类型的属性值进行匹配,得到指定对象实体与邻居对象实体的多个匹配结果;基于指定对象实体与邻居对象实体的多个匹配结果,得到指定对象实体与邻居对象实体的关联属性特征向量。
那么,处理单元1103在基于知识图谱中指定对象实体的拼接特征向量,以及指定对象实体的邻居对象实体的拼接特征向量,从邻居对象实体中预测与指定对象实体属于同一实体类型的目标对象实体时,具体可以用于:基于指定对象实体的拼接特征向量,邻居对象实体的拼接特征向量,以及指定对象实体与邻居对象实体的关联属性特征向量,从邻居对象实体中预测目标对象实体。
在本申请的一个实施例中,基于前述方案,构建单元1102还可以用于基于每个对象实体的交易数据,统计每个对象实体对应的多个属性值;其中,多个属性值分别对应不同交易属性类型;根据每个对象实体对应的多个属性值,构建每个对象实体的交易统计特征向量;处理单元1103在将行为特征向量和文本特征向量进行拼接,得到每个对象实体的拼接特征向量时,具体可以用于:将每个对象实体的交易统计特征向量、行为特征向量和文本特征向量进行拼接,得到每个对象实体的拼接特征向量。
在本申请的一个实施例中,基于前述方案,构建单元1102还可以用于:针对知识图谱中的任一对象实体,将任一对象实体作为出发节点在知识图谱中进行节点跳转,得到多个节点序列;其中,任一节点序列包含相应节点序列的出发节点,以及每一次节点跳转所跳转到的节点;基于多个节点序列,对知识图谱中的每个节点进行特征编码处理,得到每个对象实体对应的节点特征向量。处理单元1103在将行为特征向量和文本特征向量进行拼接,得到每个对象实体的拼接特征向量时,具体可以用于:将每个对象实体的节点特征向量、行为特征向量和文本特征向量进行拼接,得到每个对象实体的拼接特征向量。
在本申请的一个实施例中,知识图谱中的两个对象实体之间通过两个对象实体之间的虚拟资源关系建立连接;基于前述方案,获取单元1101还可以用于:获取待处理的知识图谱,待处理的知识图谱包含的对象实体数量大于知识图谱;若连接待处理的知识图谱中任一对象实体的边所表征的虚拟资源关系均未达到预设关系条件,则对待处理的知识图谱中的任一对象实体进行实体去除处理,得到知识图谱。
在本申请的一个实施例中,邻居对象实体的数量包括多个;基于前述方案,处理单元1103在基于知识图谱中指定对象实体的拼接特征向量,以及指定对象实体的邻居对象实体的拼接特征向量,从邻居对象实体中预测与指定对象实体属于同一实体类型的目标对象实体时,具体可以用于:对指定对象实体的拼接特征向量和每个邻居对象实体的拼接特征向量分别进行特征融合处理,得到多个目标特征向量;对每个目标特征向量进行分类预测处理,得到指定对象实体与相应邻居对象实体的对象关联度;基于每个邻居对象实体对应的对象关联度,从邻居对象实体中预测与指定对象实体属于同一实体类型的目标对象实体;其中,目标对象实体对应的对象关联度大于其他邻居对象实体对应的对象关联度。
需要说明的是,上述实施例所提供的装置与上述实施例所提供的方法属于同一构思,其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
上述实施例所提供的装置可以设于终端设备内,也可以设于服务器内,通过本申请实施例提供的装置可以通过虚拟资源转移记录和备注信息分别构建相应对象实体的行为特征向量和文本特征向量的方式,使得后续所构建的每个对象实体的拼接特征向量能够表征每个对象实体对虚拟资源的转移行为和备注文本。由于同一组织或团体的对象在转移虚拟资源时的行为具有一定的规律性和相似性,且同一组织或团体的对象在转移虚拟资源时可能会添加相似的备注或者约定的暗号;因此,本申请实施例基于指定对象实体及其邻居对象实体的拼接特征向量,可以从虚拟资源的转移行为和备注文本等维度对对象实体进行多维度的充分比较,有利于从相邻的对象实体准确预测出与指定对象实体属于同一实体类型的目标对象实体,从而提高同类型对象的推荐准确性。
本申请的实施例还提供了一种电子设备,包括一个或多个处理器,以及存储装置,其中,存储装置,用于存储一个或多个计算机程序,当一个或多个计算机程序被一个或多个处理器执行时,使得电子设备实现如上的对象管理方法。
图12示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图12示出的电子设备的计算机系统1200仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图12所示,计算机系统1200包括处理器(Central Processing Unit,CPU)1201,其可以根据存储在只读存储器(Read-Only Memory,ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(Random Access Memory,RAM)1203中的程序而执行各种适当的动作和处理,例如执行上述实施例中的方法。在RAM 1203中,还存储有系统操作所需的各种程序和数据。CPU 1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(Input/Output,I/O)接口1205也连接至总线1204。
在一些实施例中,以下部件连接至I/O接口1205:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid CrystalDisplay,LCD)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被处理器(CPU)1201执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机程序的组合来实现。
描述于本申请实施例中所涉及到的单元或者模块可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元或者模块也可以设置在处理器中。其中,这些单元或者模块的名称在某种情况下并不构成对该单元或者模块本身的限定。
本申请的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前的对象管理方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
本申请的另一方面还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该电子设备执行上述各个实施例中提供如前所述的对象管理方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
本领域技术者在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
上述内容,仅为本申请的较佳示例性实施例,并非用于限制本申请的实施方案,本领域普通技术者根据本申请的主要构思和精神,可以十分方便地进行相应的变通或修改,故本申请的保护范围应以权利要求书所要求的保护范围为准。
Claims (12)
1.一种对象管理方法,其特征在于,包括:
获取知识图谱中每个对象实体的交易数据;其中,所述交易数据包括虚拟资源转移记录,以及所述虚拟资源转移记录对应的备注信息,所述备注信息用于对虚拟资源的转移进行解释说明;
基于所述虚拟资源转移记录构建所述每个对象实体的行为特征向量,以及基于所述备注信息构建所述每个对象实体的文本特征向量;
将所述行为特征向量和所述文本特征向量进行拼接,得到所述每个对象实体的拼接特征向量;
基于所述知识图谱中指定对象实体的拼接特征向量,以及所述指定对象实体的邻居对象实体的拼接特征向量,从所述邻居对象实体中预测与所述指定对象实体属于同一实体类型的目标对象实体。
2.根据权利要求1所述的方法,其特征在于,所述每个对象实体的虚拟资源转移记录的数量包括多条,不同虚拟资源转移记录的产生时间不同;所述基于所述虚拟资源转移记录构建所述每个对象实体的行为特征向量,包括:
对任一对象实体的每条虚拟资源转移记录进行符号化处理,得到所述每条虚拟资源转移记录的行为记录表示字段;
按照所述每条虚拟资源转移记录的产生时间,将所述每条虚拟资源转移记录的行为记录表示字段进行拼接,得到行为序列文本;
对所述行为序列文本进行文本特征提取处理,得到所述任一对象实体的行为特征向量。
3.根据权利要求1所述的方法,其特征在于,所述基于所述备注信息构建所述每个对象实体的文本特征向量,包括:
对任一对象实体的备注信息进行分词处理,得到多个备注字段以及每个备注字段的权重;
对所述每个备注字段进行向量映射处理,得到所述每个备注字段的初始词向量;
基于所述每个备注字段的初始词向量和权重,得到所述每个备注字段的目标词向量;
根据多个备注字段的目标词向量,得到所述任一对象实体的文本特征向量。
4.根据权利要求1所述的方法,其特征在于,任一对象实体的备注信息包括入账信息和出账信息,所述入账信息对应的虚拟资源转移记录用于表征相应虚拟资源从其他对象实体的资源账户转入至所述任一对象实体的资源账户,所述入账信息对应的虚拟资源转移记录用于表征相应虚拟资源从所述任一对象实体的资源账户转出至其他对象实体的资源账户;
所述基于所述备注信息构建所述每个对象实体的文本特征向量,包括:
基于所述入账信息构建所述任一对象实体的入账特征向量,以及基于所述出账信息构建所述任一对象实体的出账特征向量;
根据所述任一对象实体的入账特征向量和出账特征向量,得到所述任一对象实体的文本特征向量。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述指定对象实体的对象属性数据,以及所述邻居对象实体的对象属性数据;其中,任一对象实体的对象属性数据包括多个对象属性类型分别对应的属性值;
将所述指定对象实体和所述邻居对象实体分别对应的相同对象属性类型的属性值进行匹配,得到所述指定对象实体与所述邻居对象实体的多个匹配结果;
基于所述指定对象实体与所述邻居对象实体的多个匹配结果,得到所述指定对象实体与所述邻居对象实体的关联属性特征向量;
所述基于所述知识图谱中指定对象实体的拼接特征向量,以及所述指定对象实体的邻居对象实体的拼接特征向量,从所述邻居对象实体中预测与所述指定对象实体属于同一实体类型的目标对象实体,包括:
基于所述指定对象实体的拼接特征向量,所述邻居对象实体的拼接特征向量,以及所述指定对象实体与所述邻居对象实体的关联属性特征向量,从所述邻居对象实体中预测所述目标对象实体。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述每个对象实体的交易数据,统计所述每个对象实体对应的多个属性值;其中,所述多个属性值分别对应不同交易属性类型;
根据所述每个对象实体对应的多个属性值,构建所述每个对象实体的交易统计特征向量;
所述将所述行为特征向量和所述文本特征向量进行拼接,得到所述每个对象实体的拼接特征向量,包括:
将所述每个对象实体的交易统计特征向量、行为特征向量和文本特征向量进行拼接,得到所述每个对象实体的拼接特征向量。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对所述知识图谱中的任一对象实体,将所述任一对象实体作为出发节点在所述知识图谱中进行节点跳转,得到多个节点序列;其中,任一节点序列包含相应节点序列的出发节点,以及每一次节点跳转所跳转到的节点;
基于所述多个节点序列,对所述知识图谱中的每个节点进行特征编码处理,得到所述每个对象实体对应的节点特征向量;
所述将所述行为特征向量和所述文本特征向量进行拼接,得到所述每个对象实体的拼接特征向量,包括:
将所述每个对象实体的节点特征向量、行为特征向量和文本特征向量进行拼接,得到所述每个对象实体的拼接特征向量。
8.根据权利要求1至7任一项所述的方法,其特征在于,所述知识图谱中的两个对象实体之间通过所述两个对象实体之间的虚拟资源关系建立连接;所述方法还包括:
获取待处理的知识图谱,所述待处理的知识图谱包含的对象实体数量大于所述知识图谱;
若连接所述待处理的知识图谱中任一对象实体的边所表征的虚拟资源关系均未达到预设关系条件,则对所述待处理的知识图谱中的任一对象实体进行实体去除处理,得到所述知识图谱。
9.根据权利要求1至7任一项所述的方法,其特征在于,所述邻居对象实体的数量包括多个;所述基于所述知识图谱中指定对象实体的拼接特征向量,以及所述指定对象实体的邻居对象实体的拼接特征向量,从所述邻居对象实体中预测与所述指定对象实体属于同一实体类型的目标对象实体,包括:
对所述指定对象实体的拼接特征向量和每个邻居对象实体的拼接特征向量分别进行特征融合处理,得到多个目标特征向量;
对每个目标特征向量进行分类预测处理,得到所述指定对象实体与相应邻居对象实体的对象关联度;
基于所述每个邻居对象实体对应的对象关联度,从所述邻居对象实体中预测与所述指定对象实体属于同一实体类型的所述目标对象实体;其中,所述目标对象实体对应的对象关联度大于其他邻居对象实体对应的对象关联度。
10.一种对象管理装置,其特征在于,包括获取单元、构建单元和处理单元,其中:
所述获取单元,用于获取知识图谱中每个对象实体的交易数据;其中,所述交易数据包括虚拟资源转移记录,以及所述虚拟资源转移记录对应的备注信息,所述备注信息用于对虚拟资源的转移进行解释说明;
所述构建单元,用于基于所述虚拟资源转移记录构建所述每个对象实体的行为特征向量,以及基于所述备注信息构建所述每个对象实体的文本特征向量;
所述处理单元,用于将所述行为特征向量和所述文本特征向量进行拼接,得到所述每个对象实体的拼接特征向量;
所述处理单元,还用于基于所述知识图谱中指定对象实体的拼接特征向量,以及所述指定对象实体的邻居对象实体的拼接特征向量,从所述邻居对象实体中预测与所述指定对象实体属于同一实体类型的目标对象实体。
11.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至9中任一项所述的对象管理方法。
12.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至9中任一项所述的对象管理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311189891.5A CN117291722A (zh) | 2023-09-14 | 2023-09-14 | 对象管理方法、相关设备及计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311189891.5A CN117291722A (zh) | 2023-09-14 | 2023-09-14 | 对象管理方法、相关设备及计算机可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117291722A true CN117291722A (zh) | 2023-12-26 |
Family
ID=89250999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311189891.5A Pending CN117291722A (zh) | 2023-09-14 | 2023-09-14 | 对象管理方法、相关设备及计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117291722A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117852553A (zh) * | 2024-03-07 | 2024-04-09 | 深圳华强电子网集团股份有限公司 | 基于聊天记录提取元器件交易场景信息的语言处理系统 |
-
2023
- 2023-09-14 CN CN202311189891.5A patent/CN117291722A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117852553A (zh) * | 2024-03-07 | 2024-04-09 | 深圳华强电子网集团股份有限公司 | 基于聊天记录提取元器件交易场景信息的语言处理系统 |
CN117852553B (zh) * | 2024-03-07 | 2024-05-10 | 深圳华强电子网集团股份有限公司 | 基于聊天记录提取元器件交易场景信息的语言处理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190205993A1 (en) | Transaction data categorizer system and method | |
CN111737546B (zh) | 确定实体业务属性的方法及装置 | |
US11270375B1 (en) | Method and system for aggregating personal financial data to predict consumer financial health | |
CN109255586B (zh) | 一种面向电子政务办事的在线个性化推荐方法 | |
US11681817B2 (en) | System and method for implementing attribute classification for PII data | |
CN110795568A (zh) | 基于用户信息知识图谱的风险评估方法、装置和电子设备 | |
CN110532480B (zh) | 一种用于人读威胁情报推荐的知识图谱构建方法及威胁情报推荐方法 | |
CN112989059A (zh) | 潜在客户识别方法及装置、设备及可读计算机存储介质 | |
CN111538794A (zh) | 一种数据融合方法、装置及设备 | |
CN110569350A (zh) | 法条推荐方法、设备和存储介质 | |
Aralikatte et al. | Fault in your stars: an analysis of android app reviews | |
CN117291722A (zh) | 对象管理方法、相关设备及计算机可读介质 | |
CN112257959A (zh) | 用户风险预测方法、装置、电子设备及存储介质 | |
CN116975267A (zh) | 一种信息处理方法、装置及计算机设备、介质、产品 | |
CN116823410B (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
JP2023517518A (ja) | ヌル値又は同等の値を有するリレーショナル・テーブルのためのベクトル埋込モデル | |
CN112434126B (zh) | 一种信息处理方法、装置、设备和存储介质 | |
CN111832661A (zh) | 分类模型构建方法、装置、计算机设备及可读存储介质 | |
CN111209403A (zh) | 数据处理方法、装置、介质及电子设备 | |
CN111177653A (zh) | 一种信用评估方法和装置 | |
CN110210884A (zh) | 确定用户特征数据的方法、装置、计算机设备及存储介质 | |
Zhao et al. | Detecting fake reviews via dynamic multimode network | |
CN113988878A (zh) | 一种基于图数据库技术的反欺诈方法及系统 | |
CN114357180A (zh) | 知识图谱的更新方法及电子设备 | |
CN113095078A (zh) | 关联资产确定方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |