CN110110093A - 一种基于知识图谱的识别方法、装置、电子设备及存储介质 - Google Patents

一种基于知识图谱的识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110110093A
CN110110093A CN201910277819.5A CN201910277819A CN110110093A CN 110110093 A CN110110093 A CN 110110093A CN 201910277819 A CN201910277819 A CN 201910277819A CN 110110093 A CN110110093 A CN 110110093A
Authority
CN
China
Prior art keywords
information
group
knowledge
graph
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910277819.5A
Other languages
English (en)
Inventor
邓大权
刘臣
汪振兴
和会荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jianlian Technology Guangdong Co ltd
Original Assignee
Shenzhen Zhongyi Weirong Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhongyi Weirong Technology Co Ltd filed Critical Shenzhen Zhongyi Weirong Technology Co Ltd
Priority to CN201910277819.5A priority Critical patent/CN110110093A/zh
Publication of CN110110093A publication Critical patent/CN110110093A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开实施例公开了一种基于知识图谱的识别方法、装置、电子设备及存储介质。其中,该方法包括:智能处理从多个异构数据源获取多个目标及其行为相关的第一信息,建立以所述目标为节点、以目标间的联系为边的知识图谱,所述节点和所述边带有至少一个属性;根据所述至少一个属性中的风险程度处理所述知识图谱,自动识别至少一个潜在的低可信度群体;通过至少一个通信通道自动向所述潜在的低可信度群体的相关节点发出信息搜集消息;接收对所述信息搜集消息反馈的第二信息并智能处理,更新所述知识图谱,确认并标记核实的低可信度群体。

Description

一种基于知识图谱的识别方法、装置、电子设备及存储介质
技术领域
本公开涉及大数据挖掘领域,具体涉及一种基于知识图谱的识别方法、装置、电子设备及存储介质。
背景技术
互联网和通信技术的飞速发展给整个社会的生产和生活带来了难以想象的便利,但同时也由于互联网的开放与自由,使得生活中的各种不良现象在互联网中也得到了放大,对日常生活造成了很多负面影响。典型地,原本在日常社交中较少能接触到的营销或诈骗等行为,通过互联网和电信技术被无限放大和推广,已对大多数人的正常生活造成了严重影响。
现有技术中,通常通过信息共同标记的方式来帮助识别不良行为,比如通过受害者或知情人员对电话、账户、姓名等的标记来识别和发现欺诈人及其联系方式,或是通过对关键词的标记来识别和发现涉及欺诈的信息等。但标记的方法一方面依赖于足够多的受害者或知情人,另一方面只能对已知的欺诈人或手段进行识别,识别和防范未知风险的能力较差。因此现有技术中进一步出现了通过人工智能利用知识图谱进行金融反欺诈的方案,利用知识图谱可以帮助自动识别一些不可靠人员,比如通过标签传播算法来识别潜在的欺诈人,或者通过社群发现来识别欺诈团伙等,目前现有技术对这些应用方式已有了一定的研究。
在当前现有技术的实践中,知识图谱提供了一定的关联计算的手段,比如通过标签传递算法计算两个实体之间的相似度以用于判断某一实体的欺诈概率,或是通过社群发现算法来计算人员关联程度以发现社群、进一步计算社群内部成员的欺诈概率或一致性来判断是否存在欺诈团伙等。现有技术的知识图谱算法在一定程度上可帮助自动识别并预防欺诈人员。
然而,发明人在实现本公开实施例相关技术方案的过程中发现,现有技术至少存在以下问题:现有技术中构建知识图谱的数据来自于不同的异构数据源,因此其数据的完整性是随机的,很多时候一些关键信息并没有可靠来源能补完或核实;此外,现有方式均依赖于已知的数据和固定的算法,对判断已知的情况较有帮助,却很难预测或发现一些潜在的、未被确认的风险。亦即现有技术对未知情况仅能进行有限预测,仍然有较高的误判率,当知识图谱向用户反馈一个潜在的、未经核实的风险信息时,用户没有其他有效手段可以做出进一步判断,很有可能只能等到潜在风险点变成事实后才能确认。
发明内容
针对现有技术中的上述技术问题,本公开实施例提出了一种基于知识图谱的识别方法、装置、电子设备及计算机可读存储介质,以解决知识图谱难以核实潜在风险信息的问题。
本公开实施例的第一方面提供了一种基于知识图谱的识别方法,包括:
智能处理从多个异构数据源获取多个目标及其行为相关的第一信息,建立以所述目标为节点、以目标间的联系为边的知识图谱,所述节点和所述边带有至少一个属性;
根据所述至少一个属性中的风险程度处理所述知识图谱,自动识别至少一个潜在的低可信度群体;
通过至少一个通信通道自动向所述潜在的低可信度群体的相关节点发出信息搜集消息;
接收对所述信息搜集消息反馈的第二信息并智能处理,更新所述知识图谱,确认并标记核实的低可信度群体。
在一些实施例中,所述方法中,通过社团发现算法处理所述知识图谱,识别和筛选所述知识图谱中的群体。
在一些实施例中,所述接收对所述信息搜集消息反馈的第二信息并智能处理包括:
使用所述第二信息通过社团发现算法对所述知识图谱进行再处理;或者,
将所述第二信息输入一个预先训练过的机器学习模型中,获取该机器学习模型对群体可信度的识别结果;其中,该机器学习模型独立于知识图谱。
在一些实施例中,所述机器学习模型使用在先确认过的高风险低可信度群体数据进行训练,得到对群体高风险行为的识别模式。
在一些实施例中,所述信息搜集消息按照预设的规则产生并发出,或者随机生成主动接触式联系消息并随机发出。
本公开实施例的第二方面提供了一种基于知识图谱的识别装置,包括:
图谱生成模块,用于智能处理从多个异构数据源获取多个目标及其行为相关的第一信息,建立以所述目标为节点、以目标间的联系为边的知识图谱,所述节点和所述边带有至少一个属性;
群体识别模块,用于根据所述至少一个属性中的风险程度处理所述知识图谱,自动识别至少一个潜在的低可信度群体;
信息搜集模块,用于通过至少一个通信通道自动向所述潜在的低可信度群体的相关节点发出信息搜集消息;
群体核实模块,用于接收对所述信息搜集消息反馈的第二信息并智能处理,更新所述知识图谱,确认并标记核实的低可信度群体。
在一些实施例中,所述群体识别模块包括:
算法处理模块,用于通过社团发现算法处理所述知识图谱,识别和筛选所述知识图谱中的群体。
在一些实施例中,所述群体核实模块包括:
在处理模块,用于使用所述第二信息通过社团发现算法对所述知识图谱进行再处理;或者,
模型处理模块,用于将所述第二信息输入一个预先训练过的机器学习模型中,获取该机器学习模型对群体可信度的识别结果;其中,该机器学习模型独立于知识图谱。
在一些实施例中,所述模型处理模块包括:
模型训练模块,用于使用在先确认过的高风险低可信度群体数据对所述机器学习模型进行训练,得到对群体高风险行为的识别模式。
在一些实施例中,所述信息搜集模块包括:
消息产生模块,用于按照预设的规则产生并发出所述信息搜集消息,或者随机生成主动接触式联系消息并随机发出。
本公开实施例的第三方面提供了一种电子设备,包括:
存储器以及一个或多个处理器;
其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现如前述各实施例所述的方法。
本公开实施例的第四方面提供了一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现如前述各实施例所述的方法。
本公开实施例的第五方面提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,可用来实现如前述各实施例所述的方法。
本公开实施例在初步识别出潜在的低可信度群体后,可自动并主动进行信息搜集和确认,可以大幅降低现有知识图谱的误判率,准确对各类高风险群体进行识别、核实与标记,从而可在不良行为发生前进行有效预防,大大增强了系统的安全性和可靠性,提升了用户体验。
附图说明
通过参考附图会更加清楚的理解本公开的特征和优点,附图是示意性的而不应理解为对本公开进行任何限制,在附图中:
图1是根据本公开的一些实施例所示的一种知识图谱示意图;
图2是根据本公开的一些实施例所示的一种基于知识图谱的识别方法的流程示意图;
图3是根据本公开的一些实施例所示的识别并标记图谱中群体的示意图;
图4是根据本公开的一些实施例所示的一种基于知识图谱的识别装置的结构框图;
图5是根据本公开的一些实施例所示的实现其功能的一种电子设备的结构示意图。
具体实施方式
在下面的详细描述中,通过示例阐述了本公开的许多具体细节,以便提供对相关披露的透彻理解。然而,对于本领域的普通技术人员来讲,本公开显而易见的可以在没有这些细节的情况下实施。应当理解的是,本公开中使用“系统”、“装置”、“单元”和/或“模块”术语,是用于区分在顺序排列中不同级别的不同部件、元件、部分或组件的一种方法。然而,如果其他表达式可以实现相同的目的,这些术语可以被其他表达式替换。
应当理解的是,当设备、单元或模块被称为“在……上”、“连接到”或“耦合到”另一设备、单元或模块时,其可以直接在另一设备、单元或模块上,连接或耦合到或与其他设备、单元或模块通信,或者可以存在中间设备、单元或模块,除非上下文明确提示例外情形。例如,本公开所使用的术语“和/或”包括一个或多个相关所列条目的任何一个和所有组合。
本公开所用术语仅为了描述特定实施例,而非限制本公开范围。如本公开说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的特征、整体、步骤、操作、元素和/或组件,而该类表述并不构成一个排它性的罗列,其他特征、整体、步骤、操作、元素和/或组件也可以包含在内。
参看下面的说明以及附图,本公开的这些或其他特征和特点、操作方法、结构的相关元素的功能、部分的结合以及制造的经济性可以被更好地理解,其中说明和附图形成了说明书的一部分。然而,可以清楚地理解,附图仅用作说明和描述的目的,并不意在限定本公开的保护范围。可以理解的是,附图并非按比例绘制。
本公开中使用了多种结构图用来说明根据本公开的实施例的各种变形。应当理解的是,前面或下面的结构并不是用来限定本公开。本公开的保护范围以权利要求为准。
现有技术中通过知识图谱可以在一定程度上帮助发现曾做出过不良行为的人员和/或团伙,从而帮助规避欺诈风险。但是现有技术受限于数据来源和固定算法,只能根据已发生的情况进行判断和核实,却很难明确地预测一些潜在的、未被确认的信息;同时如果仅根据预测来禁止某些用户的行为,对于被误判的用户来说显然非常不公平,也会严重影响服务提供方的信誉和用户体验。因此,现有技术中往往只能等待不良行为发生后才能做出决断,而无法对潜在问题进行有效核实和处理。在本公开的实施例中,首先通过知识图谱帮助发现潜在风险点,进一步通过主动搜集反馈的方式来核实确认,从而可自动证实或修正预测信息,实现了对不确定风险的主动防范,在不影响用户体验的情况下增强了服务的安全性与可靠性。
首先,在本公开的一个实施例中,利用知识图谱进行互联网风险识别优选针对高风险或对用户伤害较大的领域;当然,本领域相关技术人员可以理解,本公开实施例的技术方案显然也可适用于对日常骚扰或虚假信息等轻微风险进行识别,故此处不对本公开实施例的应用领域做更为具体的限制。其中,知识图谱是当前大数据的一个应用方向,基于人的知识图谱的优势在于能够建立以人为中心的关系型数据。通常一个知识图谱中包含节点、边以及相关的属性,将知识图谱应用于社会生活中时,通过以人为中心进行关系拓展,从而建立不同的节点和边以及对应的属性,可以得到一个天然的关系型图谱,这使得其非常适用于对依赖人际关系的应用进行分析和处理。
具体地,如图1所示,比如在金融反欺诈领域使用知识图谱时,计算机系统通过异构数据源,通过批量下载、动态查询、爬虫、APP埋点等方式获得以人为核心的数据,例如电话号码联系人、贷款进项、征信数据等信息,再按照一定的算法(例如通过开源项目NEO4j)建立知识图谱。在图1中,一个知识图谱中包括多个节点,每个节点包括多个属性(图1中以均包括属性1、属性2和属性3三个属性为例进行说明),通过节点属性的一些关联属性对节点进行扩展,得到新节点或建立节点间的联系,而两节点之间的关联就构成带有方向的边及其属性。例如,在一个互联网金融系统中,以贷款申请人作为节点,其传统的风控变量包括单位、月薪、固定资产等可用来作为节点属性,也可进一步利用与欺诈相关的信息(比如违约次数、违约金额、个人信用等)作为节点属性;再通过贷款申请人的社交关系或行为进行扩展,比如通过联系方式、通信记录等发现新节点或发现节点之间的关联;传统方式得到的知识图谱通常供信审人员基于传统的风控变量来人工进行评审。在本公开的实施例中,通过人工智能的方式深入挖掘节点之间的关联,并主动进行信息核实与反馈,从而可实现潜在欺诈风险点的自动识别与证实。
如图2所示,在本公开的一个实施例中,一种基于知识图谱的识别方法包括步骤:
S201,智能处理从多个异构数据源获取多个目标及其行为相关的第一信息,建立以所述目标为节点、以目标间的联系为边的知识图谱,所述节点和所述边带有至少一个属性。
其中,在一些实施例中,多个异构数据源包括整个互联网和电信系统,以及任何可以采集目标人有效信息的手段,第一信息也包括任何与目标人直接或间接相关的有效信息,比如贷款申请人在申请贷款时所填写的各种信息、网络访问记录、公开发布的消息、或是可以确定来源的数据等。而知识图谱是一种基于图的数据结构,由节点、边及各自的属性组成;知识图谱是实体间关系的最有效表示方式,其构建方式现有技术已有较为充分的研究,关于知识抽取、三元组表达和关系关联等步骤均较为成熟,在此不再一一展开描述。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络,如前所述,本公开实施例中知识图谱的节点为目标实体(人或组织)、目标实体之间的联系构成边,节点和边均带有各自的属性。
S202,根据所述至少一个属性中的风险程度处理所述知识图谱,自动识别至少一个潜在的低可信度群体。
其中,在本公开的实施例中,低可信度群体又可理解为高风险群体,即最有可能实施不良行为的群体,比如金融欺诈中的欺诈团伙。低可信度群体显然是全体目标实体的一个子集,本公开实施例的一个直接目的显然就是发现并核实这个子集的全部成员。通过情报处理得到知识图谱后,还需要对其中的目标实体进行识别和筛选,比如进一步地通过社团发现(Community Detection)算法,在知识图谱中识别潜在的社团,典型地可通过GN、SLPA、Newman等社团发现算法识别目标实体间的潜在联系,划分出各个潜在的社团。进而通过读取数据库或机器学习模型(例如LPA算法),得到节点的属性的风险程度(比如欺诈概率),并结合社团发现算法的结果,识别潜在欺诈团伙。在系统收到进项申请时,如果申请人在欺诈团伙之内,系统则进入警报状态,此时系统认为进项可能存在团伙欺诈。比如图3所示,知识图谱的网络中左侧的社团聚集稀疏较高,并且节点欺诈概率较高,会被识别为一个潜在的欺诈团伙。
S203,通过至少一个通信通道自动向所述潜在的低可信度群体的相关节点发出信息搜集消息。
一般而言,现有技术在识别出潜在的低可信度群体后并没有更好的办法予以核实,通常系统只能转入进行人工审核,比如虽然认为某个贷款进项存在欺诈团伙的可能,也只能通过人工的传统方式对该进项进行审核,最后决定是否接受申请。由于当前所有算法的可解释性较弱,信审人员即使在图形化界面下得到欺诈团伙的相关信息,也无法更好的进一步做出判断,而能够依赖的仍然是传统的审核方式,例如通过电话访问。但现有技术的一些情况中并不能避免由于数据的随机性导致非欺诈团伙也被识别成欺诈团伙;再加上很多时候识别结果精度不够,多次的误报也会导致信审人员对系统提醒无视,现有知识图谱对风险防范的能力有限。
而本公开的实施例中通过对目标行为进行分析发现,由于欺诈团伙的作案为一种异常申请行为,其数据本身一定存在较高的特征,例如信息存在较高的时间、空间、关系的相关性,而这种特征在正常的社交关系中则只会偶然存在。此外,除了知识图谱中已获得的信息,真实的欺诈团伙的其他维度信息也必然存在其独特的特征,这是由其欺诈的本质决定的。例如,协同作案的人员之间信息必定是封闭和共享的,因此所有维度的信息均可能存在相关性;再例如使用大量收购的假身份证进行诈骗的团伙注定只有身份信息和捏造的相关信息而无法实际控制一个对应的联系人随时填写真实信息。因此,在本公开的实施例中,系统将自动生成至少一个用于搜集信息的消息,并通过至少一个通信通道发送给对应的节点人员。该消息可以通过各种形式,各种通信通道送达对应的人员。例如,发送的消息可以是一个短信,短信内包含一个需要在网站上填写的验证码;再例如,发送的消息可以是APP的一个个人信息采集页面,采集的信息项可以通过系统自动生成,采集的信息项目可以为预定义或随机生成;又例如,发送的消息可以是一个自动的语音或视频通话。
S204,接收对所述信息搜集消息反馈的第二信息并智能处理,更新所述知识图谱,确认并标记核实的低可信度群体。
在消息发出后,系统实时搜集相关人员的反馈数据。反馈数据可以是用户按照上述数据采集项反馈的数据,也可以是用户的行为识别,例如是否点击短信内附带的连接等。进一步,系统将通过反馈的信息,对欺诈团伙的识别结果进行再确认。一种实施方式为,基于规则的形式对反馈结果进行处理,并得到欺诈团伙识别结果的再确认。例如,系统通过团伙内部的联系电话,同时启动手机呼叫业务,系统根据接通率进行判断该组人员是否为潜在的欺诈团伙。再例如,如果欺诈团伙的识别结果中包含一致性异常,例如团伙内部申请IP地址存在高聚集系数,此时发送的消息为邀请对方实时分享地理位置,并根据反馈的地理位置进行再确认,如果反馈结果仍然为高聚集的地理位置,此时系统对该团伙为欺诈团伙的概率判断将提高。
优选地,在本公开的一种实施方式中,可以再次通过社团发现算法对知识图谱进行再处理,以通过接收到的反馈信息来确认并标记核实的低可信度群体。在另外一种实施方式中,还可借助人工智能技术提高识别的准确度,增强信息处理的可信度,比如使用一个机器学习模型对反馈的信息进行判断。该机器学习模型通过在先确认过的欺诈团伙数据进行训练,得到对团伙欺诈行为的识别模式。然后以系统搜集的反馈信息为训练后的机器学习模型的输入,得到模型识别后的置信度信息。例如,系统可以预设不同的信息发送、采集和处理方法,并根据欺诈团伙的特征选择一个或多个信息发送、采集和处理方法,还可以通过不同的通信通道模拟随机的方式向申请人发送新增紧急联系人采集;随后利用机器学习模型对新增的联系人的欺诈概率、相似度、聚集度进行计算,并根据计算输出结果对首次的欺诈团伙识别结果进行调整。无论使用基于规则的方式,还是基于模型的方式,系统通过对反馈数据的处理,对首次识别的欺诈团伙的置信度进行调整确认;或者是通过反馈的数据处理,对欺诈团伙潜在的成员进行调整修正;又或者是对对欺诈团伙的欺诈概率进行再计算。
以上是本公开提供的一种基于知识图谱的识别方法的具体实施方式。通过上述实施方式,在初步识别出潜在的低可信度群体后,本公开的实施例可自动并主动进行信息搜集和确认,可以大幅降低现有知识图谱的误判率,准确对各类高风险群体进行识别、核实与标记,从而可在不良行为发生前进行有效预防,大大增强了系统的安全性和可靠性,提升了用户体验。
图4是根据本公开的一些实施例所示的一种基于知识图谱的识别装置400,包括:图谱生成模块410、群体识别模块420、信息搜集模块430和群体核实模块440;其中,
图谱生成模块410,用于智能处理从多个异构数据源获取多个目标及其行为相关的第一信息,建立以所述目标为节点、以目标间的联系为边的知识图谱,所述节点和所述边带有至少一个属性;
群体识别模块420,用于根据所述至少一个属性中的风险程度处理所述知识图谱,自动识别至少一个潜在的低可信度群体;
信息搜集模块430,用于通过至少一个通信通道自动向所述潜在的低可信度群体的相关节点发出信息搜集消息;
群体核实模块440,用于接收对所述信息搜集消息反馈的第二信息并智能处理,更新所述知识图谱,确认并标记核实的低可信度群体。
在一些实施例中,所述群体识别模块包括:
算法处理模块,用于通过社团发现算法处理所述知识图谱,识别和筛选所述知识图谱中的群体。
在一些实施例中,所述群体核实模块包括:
在处理模块,用于使用所述第二信息通过社团发现算法对所述知识图谱进行再处理;或者,
模型处理模块,用于将所述第二信息输入一个预先训练过的机器学习模型中,获取该机器学习模型对群体可信度的识别结果;其中,该机器学习模型独立于知识图谱。
在一些实施例中,所述模型处理模块包括:
模型训练模块,用于使用在先确认过的高风险低可信度群体数据对所述机器学习模型进行训练,得到对群体高风险行为的识别模式。
在一些实施例中,所述信息搜集模块包括:
消息产生模块,用于按照预设的规则产生并发出所述信息搜集消息,或者随机生成主动接触式联系消息并随机发出。
参考附图5,为本申请一个实施例提供的电子设备示意图。如图5所示,该电子设备500包括:
存储器530以及一个或多个处理器510;
其中,所述存储器530与所述一个或多个处理器510通信连接,所述存储器530中存储有可被所述一个或多个处理器执行的程序指令532,所述程序指令532被所述一个或多个处理器510执行,以使所述一个或多个处理器501执行上述方法实施例中的各个步骤。进一步地,该电子设备500还可通过通信接口520与外部设备进行交互。
本申请的一个实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被执行后执行上述方法实施例中的各个步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法和/或装置实施例中的对应描述,在此不再赘述。
尽管此处所述的主题是在结合操作系统和应用程序在计算机系统上的执行而执行的一般上下文中提供的,但本领域技术人员可以认识到,还可结合其他类型的程序模块来执行其他实现。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。本领域技术人员可以理解,此处所述的本主题可以使用其他计算机系统配置来实践,包括手持式设备、多处理器系统、基于微处理器或可编程消费电子产品、小型计算机、大型计算机等,也可使用在其中任务由通过通信网络连接的远程处理设备执行的分布式计算环境中。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备的两者中。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对原有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的计算机可读取存储介质包括以存储如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方式或技术来实现的物理易失性和非易失性、可移动和不可因东介质。计算机可读取存储介质具体包括,但不限于,U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、可擦除可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM)、闪存或其他固态存储器技术、CD-ROM、数字多功能盘(DVD)、HD-DVD、蓝光(Blue-Ray)或其他光存储设备、磁带、磁盘存储或其他磁性存储设备、或能用于存储所需信息且可以由计算机访问的任何其他介质。
综上所述,本公开提出了一种基于知识图谱的识别方法、装置、电子设备及其计算机可读存储介质。本公开实施例在初步识别出潜在的低可信度群体后,可自动并主动进行信息搜集和确认,可以大幅降低现有知识图谱的误判率,准确对各类高风险群体进行识别、核实与标记,从而可在不良行为发生前进行有效预防,大大增强了系统的安全性和可靠性,提升了用户体验。
应当理解的是,本公开的上述具体实施方式仅仅用于示例性说明或解释本公开的原理,而不构成对本公开的限制。因此,在不偏离本公开的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。此外,本公开所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (12)

1.一种基于知识图谱的识别方法,其特征在于,包括:
智能处理从多个异构数据源获取多个目标及其行为相关的第一信息,建立以所述目标为节点、以目标间的联系为边的知识图谱,所述节点和所述边带有至少一个属性;
根据所述至少一个属性中的风险程度处理所述知识图谱,自动识别至少一个潜在的低可信度群体;
通过至少一个通信通道自动向所述潜在的低可信度群体的相关节点发出信息搜集消息;
接收对所述信息搜集消息反馈的第二信息并智能处理,更新所述知识图谱,确认并标记核实的低可信度群体。
2.根据权利要求1所述的方法,其特征在于,所述方法中,通过社团发现算法处理所述知识图谱,识别和筛选所述知识图谱中的群体。
3.根据权利要求1或2所述的方法,其特征在于,所述接收对所述信息搜集消息反馈的第二信息并智能处理包括:
使用所述第二信息通过社团发现算法对所述知识图谱进行再处理;或者,
将所述第二信息输入一个预先训练过的机器学习模型中,获取该机器学习模型对群体可信度的识别结果;其中,该机器学习模型独立于知识图谱。
4.根据权利要求3所述的方法,其特征在于,所述机器学习模型使用在先确认过的高风险低可信度群体数据进行训练,得到对群体高风险行为的识别模式。
5.根据权利要求1所述的方法,其特征在于,所述信息搜集消息按照预设的规则产生并发出,或者随机生成主动接触式联系消息并随机发出。
6.一种基于知识图谱的识别装置,其特征在于,包括:
图谱生成模块,用于智能处理从多个异构数据源获取多个目标及其行为相关的第一信息,建立以所述目标为节点、以目标间的联系为边的知识图谱,所述节点和所述边带有至少一个属性;
群体识别模块,用于根据所述至少一个属性中的风险程度处理所述知识图谱,自动识别至少一个潜在的低可信度群体;
信息搜集模块,用于通过至少一个通信通道自动向所述潜在的低可信度群体的相关节点发出信息搜集消息;
群体核实模块,用于接收对所述信息搜集消息反馈的第二信息并智能处理,更新所述知识图谱,确认并标记核实的低可信度群体。
7.根据权利要求6所述的装置,其特征在于,所述群体识别模块包括:
算法处理模块,用于通过社团发现算法处理所述知识图谱,识别和筛选所述知识图谱中的群体。
8.根据权利要求6或7所述的装置,其特征在于,所述群体核实模块包括:
在处理模块,用于使用所述第二信息通过社团发现算法对所述知识图谱进行再处理;或者,
模型处理模块,用于将所述第二信息输入一个预先训练过的机器学习模型中,获取该机器学习模型对群体可信度的识别结果;其中,该机器学习模型独立于知识图谱。
9.根据权利要求8所述的装置,其特征在于,所述模型处理模块包括:
模型训练模块,用于使用在先确认过的高风险低可信度群体数据对所述机器学习模型进行训练,得到对群体高风险行为的识别模式。
10.根据权利要求6所述的装置,其特征在于,所述信息搜集模块包括:
消息产生模块,用于按照预设的规则产生并发出所述信息搜集消息,或者随机生成主动接触式联系消息并随机发出。
11.一种电子设备,其特征在于,包括:
存储器以及一个或多个处理器;
其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现如权利要求1-5任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现如权利要求1-5任一项所述的方法。
CN201910277819.5A 2019-04-08 2019-04-08 一种基于知识图谱的识别方法、装置、电子设备及存储介质 Pending CN110110093A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910277819.5A CN110110093A (zh) 2019-04-08 2019-04-08 一种基于知识图谱的识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910277819.5A CN110110093A (zh) 2019-04-08 2019-04-08 一种基于知识图谱的识别方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN110110093A true CN110110093A (zh) 2019-08-09

Family

ID=67483763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910277819.5A Pending CN110110093A (zh) 2019-04-08 2019-04-08 一种基于知识图谱的识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110110093A (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598005A (zh) * 2019-09-06 2019-12-20 中科院合肥技术创新工程院 一种面向公共安全事件的多源异构数据知识图谱构建方法
CN110647522A (zh) * 2019-09-06 2020-01-03 中国建设银行股份有限公司 一种数据挖掘方法、装置及其系统
CN110717823A (zh) * 2019-09-29 2020-01-21 支付宝(杭州)信息技术有限公司 一种信贷逾期风险识别方法和系统
CN110750774A (zh) * 2019-10-21 2020-02-04 深圳众赢维融科技有限公司 身份识别的方法及装置
CN110930242A (zh) * 2019-11-26 2020-03-27 中国建设银行股份有限公司 一种可信度预测方法、装置、设备和存储介质
CN111026882A (zh) * 2019-12-11 2020-04-17 中国建设银行股份有限公司 一种基于知识图谱的违约确定方法、装置、设备及存储介质
CN111259167A (zh) * 2020-02-11 2020-06-09 广州众赢科技有限公司 用户请求风险识别方法及装置
CN111309822A (zh) * 2020-02-11 2020-06-19 深圳众赢维融科技有限公司 用户身份识别方法及装置
CN111538869A (zh) * 2020-04-29 2020-08-14 支付宝(杭州)信息技术有限公司 一种交易异常群组的检测方法、装置及设备
CN112035677A (zh) * 2020-09-03 2020-12-04 中国银行股份有限公司 基于知识图谱的诈骗人员发现方法及装置
CN112214616A (zh) * 2020-10-20 2021-01-12 北京明略软件系统有限公司 知识图谱流畅展示方法、装置
CN112463991A (zh) * 2021-02-02 2021-03-09 浙江口碑网络技术有限公司 历史行为数据的处理方法、装置、计算机设备及存储介质
CN112669053A (zh) * 2020-12-03 2021-04-16 杭州未名信科科技有限公司 基于销售数据的欺诈群体识别方法、装置、设备及介质
CN112699249A (zh) * 2020-12-31 2021-04-23 上海浦东发展银行股份有限公司 基于知识图谱的信息处理方法、装置、设备及存储介质
CN112860714A (zh) * 2019-11-12 2021-05-28 斑马智行网络(香港)有限公司 知识库、数据库、信息更新方法和装置
CN113010896A (zh) * 2021-03-17 2021-06-22 北京百度网讯科技有限公司 确定异常对象的方法、装置、设备、介质和程序产品
CN113727351A (zh) * 2020-05-12 2021-11-30 中国移动通信集团广东有限公司 一种通信欺诈识别方法、装置及电子设备
WO2021237731A1 (zh) * 2020-05-29 2021-12-02 西门子股份公司 一种目标检测方法、装置和计算机可读介质
WO2021254027A1 (zh) * 2020-06-16 2021-12-23 银联商务股份有限公司 一种可疑社团的识别方法、装置、存储介质和计算机设备
CN113868438A (zh) * 2021-11-30 2021-12-31 平安科技(深圳)有限公司 信息可信度的校准方法、装置、计算机设备及存储介质
CN114724078A (zh) * 2022-03-28 2022-07-08 西南交通大学 基于目标检测网络与知识推理的人员行为意图识别方法
CN115269879A (zh) * 2022-09-05 2022-11-01 北京百度网讯科技有限公司 知识结构数据的生成方法、数据搜索方法和风险告警方法
CN116049438A (zh) * 2023-01-10 2023-05-02 昆明理工大学 一种基于知识图谱的群体成员关系分析方法
CN117876103A (zh) * 2024-03-12 2024-04-12 杭银消费金融股份有限公司 一种人行征信用户画像搭建方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2131552A2 (en) * 2008-06-05 2009-12-09 Deutsche Telekom AG A method for creating community of strangers using trust based reputation methods
US20130151543A1 (en) * 2011-12-09 2013-06-13 Wei Fan Identifying inconsistencies in object similarities from multiple information sources
CN107368468A (zh) * 2017-06-06 2017-11-21 广东广业开元科技有限公司 一种运维知识图谱的生成方法及系统
CN107943879A (zh) * 2017-11-14 2018-04-20 上海维信荟智金融科技有限公司 基于社交网络的欺诈团体检测方法及系统
CN108667828A (zh) * 2018-04-25 2018-10-16 咪咕文化科技有限公司 一种风险控制方法、装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2131552A2 (en) * 2008-06-05 2009-12-09 Deutsche Telekom AG A method for creating community of strangers using trust based reputation methods
US20130151543A1 (en) * 2011-12-09 2013-06-13 Wei Fan Identifying inconsistencies in object similarities from multiple information sources
CN107368468A (zh) * 2017-06-06 2017-11-21 广东广业开元科技有限公司 一种运维知识图谱的生成方法及系统
CN107943879A (zh) * 2017-11-14 2018-04-20 上海维信荟智金融科技有限公司 基于社交网络的欺诈团体检测方法及系统
CN108667828A (zh) * 2018-04-25 2018-10-16 咪咕文化科技有限公司 一种风险控制方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李星: "社区结构分析关键技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598005A (zh) * 2019-09-06 2019-12-20 中科院合肥技术创新工程院 一种面向公共安全事件的多源异构数据知识图谱构建方法
CN110647522A (zh) * 2019-09-06 2020-01-03 中国建设银行股份有限公司 一种数据挖掘方法、装置及其系统
CN110647522B (zh) * 2019-09-06 2022-12-27 中国建设银行股份有限公司 一种数据挖掘方法、装置及其系统
CN110598005B (zh) * 2019-09-06 2022-08-16 中科院合肥技术创新工程院 一种面向公共安全事件的多源异构数据知识图谱构建方法
CN110717823A (zh) * 2019-09-29 2020-01-21 支付宝(杭州)信息技术有限公司 一种信贷逾期风险识别方法和系统
CN110717823B (zh) * 2019-09-29 2022-08-02 支付宝(杭州)信息技术有限公司 一种信贷逾期风险识别方法和系统
CN110750774B (zh) * 2019-10-21 2021-12-03 深圳众赢维融科技有限公司 身份识别的方法及装置
CN110750774A (zh) * 2019-10-21 2020-02-04 深圳众赢维融科技有限公司 身份识别的方法及装置
CN112860714A (zh) * 2019-11-12 2021-05-28 斑马智行网络(香港)有限公司 知识库、数据库、信息更新方法和装置
CN110930242B (zh) * 2019-11-26 2024-02-13 中国建设银行股份有限公司 一种可信度预测方法、装置、设备和存储介质
CN110930242A (zh) * 2019-11-26 2020-03-27 中国建设银行股份有限公司 一种可信度预测方法、装置、设备和存储介质
CN111026882A (zh) * 2019-12-11 2020-04-17 中国建设银行股份有限公司 一种基于知识图谱的违约确定方法、装置、设备及存储介质
CN111309822A (zh) * 2020-02-11 2020-06-19 深圳众赢维融科技有限公司 用户身份识别方法及装置
CN111309822B (zh) * 2020-02-11 2023-05-09 简链科技(广东)有限公司 用户身份识别方法及装置
CN111259167A (zh) * 2020-02-11 2020-06-09 广州众赢科技有限公司 用户请求风险识别方法及装置
CN111259167B (zh) * 2020-02-11 2024-03-15 简链科技(广东)有限公司 用户请求风险识别方法及装置
CN111538869B (zh) * 2020-04-29 2023-05-26 支付宝(杭州)信息技术有限公司 一种交易异常群组的检测方法、装置及设备
CN111538869A (zh) * 2020-04-29 2020-08-14 支付宝(杭州)信息技术有限公司 一种交易异常群组的检测方法、装置及设备
CN113727351A (zh) * 2020-05-12 2021-11-30 中国移动通信集团广东有限公司 一种通信欺诈识别方法、装置及电子设备
CN113727351B (zh) * 2020-05-12 2024-03-19 中国移动通信集团广东有限公司 一种通信欺诈识别方法、装置及电子设备
WO2021237731A1 (zh) * 2020-05-29 2021-12-02 西门子股份公司 一种目标检测方法、装置和计算机可读介质
WO2021254027A1 (zh) * 2020-06-16 2021-12-23 银联商务股份有限公司 一种可疑社团的识别方法、装置、存储介质和计算机设备
CN112035677A (zh) * 2020-09-03 2020-12-04 中国银行股份有限公司 基于知识图谱的诈骗人员发现方法及装置
CN112035677B (zh) * 2020-09-03 2023-09-22 中国银行股份有限公司 基于知识图谱的诈骗人员发现方法及装置
CN112214616B (zh) * 2020-10-20 2024-02-23 北京明略软件系统有限公司 知识图谱流畅展示方法、装置
CN112214616A (zh) * 2020-10-20 2021-01-12 北京明略软件系统有限公司 知识图谱流畅展示方法、装置
CN112669053A (zh) * 2020-12-03 2021-04-16 杭州未名信科科技有限公司 基于销售数据的欺诈群体识别方法、装置、设备及介质
CN112699249B (zh) * 2020-12-31 2022-11-15 上海浦东发展银行股份有限公司 基于知识图谱的信息处理方法、装置、设备及存储介质
CN112699249A (zh) * 2020-12-31 2021-04-23 上海浦东发展银行股份有限公司 基于知识图谱的信息处理方法、装置、设备及存储介质
WO2022166635A1 (zh) * 2021-02-02 2022-08-11 浙江口碑网络技术有限公司 历史行为数据的处理方法、装置、计算机设备及存储介质
CN112463991A (zh) * 2021-02-02 2021-03-09 浙江口碑网络技术有限公司 历史行为数据的处理方法、装置、计算机设备及存储介质
CN113010896A (zh) * 2021-03-17 2021-06-22 北京百度网讯科技有限公司 确定异常对象的方法、装置、设备、介质和程序产品
CN113010896B (zh) * 2021-03-17 2023-10-03 北京百度网讯科技有限公司 确定异常对象的方法、装置、设备、介质和程序产品
CN113868438A (zh) * 2021-11-30 2021-12-31 平安科技(深圳)有限公司 信息可信度的校准方法、装置、计算机设备及存储介质
CN114724078A (zh) * 2022-03-28 2022-07-08 西南交通大学 基于目标检测网络与知识推理的人员行为意图识别方法
CN115269879A (zh) * 2022-09-05 2022-11-01 北京百度网讯科技有限公司 知识结构数据的生成方法、数据搜索方法和风险告警方法
CN116049438B (zh) * 2023-01-10 2023-06-02 昆明理工大学 一种基于知识图谱的群体成员关系分析方法
CN116049438A (zh) * 2023-01-10 2023-05-02 昆明理工大学 一种基于知识图谱的群体成员关系分析方法
CN117876103A (zh) * 2024-03-12 2024-04-12 杭银消费金融股份有限公司 一种人行征信用户画像搭建方法及系统

Similar Documents

Publication Publication Date Title
CN110110093A (zh) 一种基于知识图谱的识别方法、装置、电子设备及存储介质
US10853812B2 (en) Blockchain transaction safety
CN109816397B (zh) 一种欺诈判别方法、装置及存储介质
US10432643B2 (en) System and method for validating users using social network information
US20190259033A1 (en) System and method for using a data genome to identify suspicious financial transactions
CN111309822B (zh) 用户身份识别方法及装置
CN111008592A (zh) 分析面部识别数据和社交网络数据以供用户鉴别
US20240048514A1 (en) Method for electronic impersonation detection and remediation
US20220327541A1 (en) Systems and methods of generating risk scores and predictive fraud modeling
US20140358811A1 (en) Illegal Activity Detection through Interpersonal Relationship Resolution
CN110909384B (zh) 确定泄露用户信息的业务方的方法及装置
CN114553456B (zh) 数字身份网络警报
US12056709B2 (en) Automated fraud monitoring and trigger-system for detecting unusual patterns associated with fraudulent activity, and corresponding method thereof
CN112819611A (zh) 欺诈识别方法、装置、电子设备和计算机可读存储介质
CN113553583A (zh) 信息系统资产安全风险评估方法与装置
CN112445870A (zh) 基于手机取证电子数据的知识图谱串并案分析方法
CN111105064A (zh) 确定欺诈事件的嫌疑信息的方法及装置
CN108804501B (zh) 一种检测有效信息的方法及装置
US20210081963A1 (en) Systems and methods for using network attributes to identify fraud
US11508377B2 (en) System and method for detecting fraud rings
Ni et al. A Victim‐Based Framework for Telecom Fraud Analysis: A Bayesian Network Model
CN113518075A (zh) 网络诈骗预警方法、装置、电子设备、及存储介质
CN117252429A (zh) 风险用户的识别方法、装置、存储介质及电子设备
CN115936728A (zh) 反欺诈确定方法、装置、计算机设备及存储介质
US20210357942A1 (en) Method and apparatus for identifying risky vertices

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220610

Address after: 510000 floor 7, building S6, poly Yuzhu port, No. 848, Huangpu Avenue East, Huangpu District, Guangzhou, Guangdong

Applicant after: Jianlian Technology (Guangdong) Co.,Ltd.

Address before: 518000 Room 201, building A, 1 front Bay Road, Shenzhen Qianhai cooperation zone, Shenzhen, Guangdong

Applicant before: SHENZHEN ZHONGYING WEIRONG TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190809

RJ01 Rejection of invention patent application after publication