CN111274408A - 地址信息验证方法及装置 - Google Patents
地址信息验证方法及装置 Download PDFInfo
- Publication number
- CN111274408A CN111274408A CN202010048981.2A CN202010048981A CN111274408A CN 111274408 A CN111274408 A CN 111274408A CN 202010048981 A CN202010048981 A CN 202010048981A CN 111274408 A CN111274408 A CN 111274408A
- Authority
- CN
- China
- Prior art keywords
- address information
- sub
- map
- user
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012795 verification Methods 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000010586 diagram Methods 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 241000272875 Ardeidae Species 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 241001025261 Neoraja caerulea Species 0.000 description 1
- 241001478428 Syngnathus Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例公开了一种地址信息验证方法及装置。其中,该方法包括:接收用户提供的第一地址信息,将所述第一地址信息与从不同渠道获取的所述用户的至少一个第二地址信息进行比对;在所述比对的结果差异超过预设阈值时,从用户关系图谱中分别构建基于所述第一地址信息的第一子图谱和基于所述第二地址信息的第二子图谱;计算所述第一子图谱和所述第二子图谱的相似度,确定所述第一地址信息的真实性。
Description
技术领域
本公开涉及文本信息识别技术领域,具体涉及一种地址信息验证方法、装置、电子设备及存储介质。
背景技术
互联网技术尤其是移动互联网技术的发展为人们的日常生活带来了极大的便利,在电子化生活成为常态的同时,互联网服务提供方也面临着海量电子信息处理的挑战。举例来说,用户个人信息中有大量项目是输入或搜集的电子信息,由于人工输入有极大的随意性,比如经常会采用缩写、省略或合并等一些不规范的表述方式,或是网络搜集信息经常会有错误或缺失,这些都导致了电子系统中的用户个人信息的可信度难以保证,对于某些安全性要求较高的应用来说,必须对用户个人信息进行核实和验证。
其中,对用户个人信息的验证也分几种不同的情况,某些信息只有唯一的正确表述方式,比如个人姓名、身份证号、电话号码或学校名称等,对这类信息进行验证时根据可信系统提供信息严格比对即可,有任何不一致就认为未通过验证。而另有一部分信息通常表达比较随意,除关键字词之外的其他内容经常会被简略表述,比如单位名称、专业领域、项目内容或产品介绍等,对这类信息进行验证时只要保证关键词一致即可,可忽略非关键项的表述。前两类信息的验证相对都比较简单,最后一类地址信息的验证情况比较特殊,理论上说每条地址信息应该是记录了一个确定的位置,但其在表述时方式又相当随意,经常会出现省略内容、增加内容或颠倒顺序等表述方式,亦即对于同一确定位置可以有多种遵循一定规律而又不完全相同的正确的表述方式,这给地址信息验证带来了极大的困扰。此外,由于人口的流动性,用户地址信息发生变动的情况也远远多于其他信息,如何准确验证用户地址信息真实性或判断其与在先记录是否为同一地点是一项有相当难度的挑战。
现有技术中一般通过文本比对来验证地址信息,还有些方案中进一步结合地理位置信息(比如经纬度等)比对来辅助验证。然而,发明人在实现本公开实施例相关技术方案的过程中发现,现有技术的地址信息验证方式至少存在以下问题:现有技术主要通过比对方式来实现验证,比对只能判断信息的相似程度,却无法确定用户本次提供信息的真实性和用户的可靠程度,在用户地址信息确实发生变动时往往会发生误判。另外,现有技术在用户地址信息过于简略时往往无法做出有效比对判断,更无法根据简略信息得到用户精确的地址信息,因而存在较大的局限性。
发明内容
针对现有技术中的上述技术问题,本公开实施例提出了一种地址信息验证方法、装置、电子设备及计算机可读存储介质,以解决现有技术中地址信息验证准确性低、适用范围窄的问题。
本公开实施例的第一方面提供了一种地址信息验证方法,包括:
接收用户提供的第一地址信息,将所述第一地址信息与从不同渠道获取的所述用户的至少一个第二地址信息进行比对;
在所述比对的结果差异超过预设阈值时,从用户关系图谱中分别构建基于所述第一地址信息的第一子图谱和基于所述第二地址信息的第二子图谱;
计算所述第一子图谱和所述第二子图谱的相似度,确定所述第一地址信息的真实性。
在一些实施例中,所述比对包括文本比对和/或地理位置比对。
在一些实施例中,所述不同渠道包括至少一个可信系统和/或在先已经过验证的业务记录。
在一些实施例中,所述从用户关系图谱中分别构建基于所述第一地址信息的第一子图谱和基于所述第二地址信息的第二子图谱包括:
根据所述第一地址信息在用户关系图谱中查询,获得与所述第一地址信息相关联的第一数据集;
对第一数据集进行推理计算,得到所述第一子图谱;
根据所述第二地址信息在用户关系图谱中查询,获得与所述第二地址信息相关联的第二数据集;
对第二数据集进行推理计算,得到所述第二子图谱。
在一些实施例中,所述计算所述第一子图谱和所述第二子图谱的相似度包括:
获取所述第一子图谱和所述第二子图谱中相同的节点及边;
根据所述节点及边的权重计算所述相似度。
本公开实施例的第二方面提供了一种地址信息验证装置,包括:
比对模块,用于接收用户提供的第一地址信息,将所述第一地址信息与从不同渠道获取的所述用户的至少一个第二地址信息进行比对;
子图谱构建模块,用于在所述比对的结果差异超过预设阈值时,从用户关系图谱中分别构建基于所述第一地址信息的第一子图谱和基于所述第二地址信息的第二子图谱;
子图谱相似度计算模块,计算所述第一子图谱和所述第二子图谱的相似度,确定所述第一地址信息的真实性。
在一些实施例中,所述比对模块包括:
文本比对模块,用于将所述第一地址信息与所述第二地址信息进行文本比对;和/或
地理位置比对模块,用于将所述第一地址信息与所述第二地址信息进行地理位置比对。
在一些实施例中,所述不同渠道包括至少一个可信系统和/或在先已经过验证的业务记录。
在一些实施例中,所述子图谱构建模块包括:
查询模块,用于根据所述第一地址信息在用户关系图谱中查询,获得与所述第一地址信息相关联的第一数据集;
第一子图谱构建模块,用于对第一数据集进行推理计算,得到所述第一子图谱;
所述查询模块还用于根据所述第二地址信息在用户关系图谱中查询,获得与所述第二地址信息相关联的第二数据集;
第一子图谱构建模块,用于对第二数据集进行推理计算,得到所述第二子图谱。
在一些实施例中,所述子图谱相似度计算模块还包括:
数据获取模块,用于获取所述第一子图谱和所述第二子图谱中相同的节点及边;
权重计算模块,用于根据所述节点及边的权重计算所述相似度。
本公开实施例的第三方面提供了一种电子设备,包括:
存储器以及一个或多个处理器;
其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现如前述各实施例所述的方法。
本公开实施例的第四方面提供了一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现如前述各实施例所述的方法。
本公开实施例的第五方面提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,可用来实现如前述各实施例所述的方法。
本公开实施例利用知识图谱来辅助验证,通过获取用户的关联信息来帮助推理,从而判断用户提供信息的真实性。
附图说明
通过参考附图会更加清楚的理解本公开的特征和优点,附图是示意性的而不应理解为对本公开进行任何限制,在附图中:
图1是根据本公开的一些实施例所示的一种地址信息验证方法流程示意图;
图2是根据本公开的一些实施例所示的一种地址信息验证装置模块结构示意图;
图3是根据本公开的一些实施例所示的一种电子设备的结构示意图;
图4是根据本公开的一些实施例所示的一种用户关系知识图谱示意图;
图5A~C是根据本公开的一些实施例所示的子图谱处理示意图。
具体实施方式
在下面的详细描述中,通过示例阐述了本公开的许多具体细节,以便提供对相关披露的透彻理解。然而,对于本领域的普通技术人员来讲,本公开显而易见的可以在没有这些细节的情况下实施。应当理解的是,本公开中使用“系统”、“装置”、“单元”和/或“模块”术语,是用于区分在顺序排列中不同级别的不同部件、元件、部分或组件的一种方法。然而,如果其他表达式可以实现相同的目的,这些术语可以被其他表达式替换。
应当理解的是,当设备、单元或模块被称为“在……上”、“连接到”或“耦合到”另一设备、单元或模块时,其可以直接在另一设备、单元或模块上,连接或耦合到或与其他设备、单元或模块通信,或者可以存在中间设备、单元或模块,除非上下文明确提示例外情形。例如,本公开所使用的术语“和/或”包括一个或多个相关所列条目的任何一个和所有组合。
本公开所用术语仅为了描述特定实施例,而非限制本公开范围。如本公开说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的特征、整体、步骤、操作、元素和/或组件,而该类表述并不构成一个排它性的罗列,其他特征、整体、步骤、操作、元素和/或组件也可以包含在内。
参看下面的说明以及附图,本公开的这些或其他特征和特点、操作方法、结构的相关元素的功能、部分的结合以及制造的经济性可以被更好地理解,其中说明和附图形成了说明书的一部分。然而,可以清楚地理解,附图仅用作说明和描述的目的,并不意在限定本公开的保护范围。可以理解的是,附图并非按比例绘制。
本公开中使用了多种结构图用来说明根据本公开的实施例的各种变形。应当理解的是,前面或下面的结构并不是用来限定本公开。本公开的保护范围以权利要求为准。
地址信息属于用户个人信息中比较特殊的一类信息,其使用频率极高但验证存在一定的困难,现有技术主要通过文本比对(有些进一步结合地理位置比对)来验证,但比对方式只能识别相似度,无法进行模糊判断,也无法对用户行为的真实性进行判断,因而存在较大的局限性。
有鉴于此,本公开实施例提供了一种地址信息验证方法,利用知识图谱来辅助验证,通过获取用户的关联信息来帮助推理,从而判断用户提供信息的真实性并尝试对省略或错误信息进行补充或修正。如图1所示,在本公开的一个实施例中,地址信息验证方法包括步骤:
S101,接收用户提供的第一地址信息,将所述第一地址信息与从不同渠道获取的所述用户的至少一个第二地址信息进行比对;
S102,在所述比对的结果差异超过预设阈值时,从用户关系图谱中分别构建基于所述第一地址信息的第一子图谱和基于所述第二地址信息的第二子图谱;
S103,计算所述第一子图谱和所述第二子图谱的相似度,确定所述第一地址信息的真实性。
其中,在本公开的实施例中,主要对用户当前提供的地址信息进行验证,典型的应用场景为用户在线注册或申请某项安全性要求较高的业务时,系统对用户资质进行审核,以确定用户提供的信息是真实的且用户是具备办理相关业务的资格的。现有技术中对于此类问题一般是从可信系统中获取该用户在先提供的地址信息,通过将当前提供的地址信息与可信系统中在先的地址信息进行比对来确定当前信息的真实性。如前所述,现有技术的方式在面对异常情况时有很大的局限性,而异常情况才是用户资格审核时真正需要重点关注的地方。其中,异常情况通常包括事实上两信息不同(又进一步分为用户有意提供虚假信息或确实发生地址变更)和仅仅是表述不同,本公开的实施例的主要目的就是对上述异常情况进行识别。
在本公开的实施例中,当用户当前提供的第一地址信息与从其他渠道(通常是可信系统,比如人行的个人征信系统或在先已经过验证的业务记录等)获取在先的第二地址信息基本相同时,通过现有技术的比对方式即可识别,无需再做进一步处理。其中,比对以文本比对为主,现有技术中存在多种文本相似度识别算法,均可应用于本公开的实施例中,在此不再一一展开描述。优选地,在文本比对之外还可通过地理位置比对来识别,比如将第一地址信息和第二地址信息输入地图数据库分别转换为各自的地理位置信息(包括行政区划、商圈、道路、交通站点或经纬度信息等形式),再比较两地理位置信息的距离来识别。地理位置比对可以帮助识别表述存在差异但实际位置相同或接近的地址信息,也可以识别两不同地址的真实距离(当距离较大时显然可信度较低),能在一定程度上克服文本比对的缺陷;但地理位置比对需要事先构建比较完善的地图数据库,因而仅作为一种优选的实施方式应用于本公开的技术方案中。
在两地址信息比对的结果差异超过预设阈值时,表示比对出现异常,需要进一步判断第一地址信息的真实性。其中,根据比对方式的不同,预设阈值也可以采用不同的设置,比如当采用文本比对方式时,阈值可以是相似度值(例如优选相似度阈值默认0.8);当采用地理位置比对时,阈值可以是地理距离值;多种比对方式结合时,阈值也可以是几种阈值的结合,进一步还可采用不同的权重来控制多种阈值的使用。预设阈值除采用默认设置外,还可根据应用场景或系统需求来动态设置。
在本公开的一个实施例中,借助于知识图谱来对异常情况进行进一步的识别和验证,其中,知识图谱是一种关系数据的表示方式,一般是按现实世界中的实体与关系在图数据库中存储关系数据;不同的实体对应知识图谱中不同的节点,不同的实体间通过关系来完成连接,节点与关系还进一步包括不同的属性,用于定义实体的类型和关系的类型。知识图谱可以帮助识别和理解真实世界中事物之间的关联关系,从而进一步帮助发现某些事物的隐藏特性,典型地,如图4所示,在一个示例性的图数据库实例中,用户关系知识图谱展示了基于个人信息构建的用户关系网络,其中不同的实体构成了图4中不同形状的节点,实体之间的关系构成了节点之间的连线。比如“张明”和“李强”为两个个人实体,每个实体通过例如“工作于”或“拥有电话”等关系与其他的“手机号”或“公司”等实体相连。
当比对认为第一地址信息和第二地址信息存在较明显差异时,在用户关系图谱中分别使用第一地址信息和第二地址信息进行查询,获得与第一地址信息关联的第一数据集和与第二地址信息关联的第二数据集,根据该第一数据集和该第二数据集分别构建第一子图谱和第二子图谱。具体地,在本公开的一个优选实施例中,当一个地址为“中关村海龙”时,该地址在信贷系统的用户关系知识图谱(该知识图谱是用于反欺诈的目的)中得到关联的节点。例如该地址所属的申请人、申请人的单位、申请人的职业、申请人的户口所在地。如下图5A所示,该地址所关联的节点和边展示了对应的信息。此时可见,该知识图谱是数据原有的存储结构。
随后,对所述的点和边进行推理计算,所述推理计算可以基于规则式或统计式的方法,得到第一子图谱,第一子图谱的特征为得到与第一地址直接关联的子图。如图5B所示,该地址关联的属性是隶属于“海淀”,并包含一家“北京海龙奥迪”的公司。例如,在一种规则推理方式中,节点可以通过“所属公司”和“公司注册地”得到地址所在大区,或者类似的,可以通过“配偶”以及“家庭住址”得到配偶家庭住址。在一种统计推理方式中,推理算法可以将不同的节点和边进行数值计算,得到一个包含数值的节点。例如节点的三个推荐人的地址经过平均后,得到一个推荐人地址是“1/3”,另外一个推荐人地址为“2/3”。进一步,规则推理和统计推理可以联合使用。例如通过推荐人的地址,可以基于推荐人一般为同事的方式推测出所在公司的地址为xxx,并且推测概率为2/3。进一步,相关信息可能是通过其他用户输入的图谱数据得到的。例如另外一个用户“李四”的单位地址也是“中关村海龙”,并且其单位是“北京海龙奔驰”,则最终“中关村海龙”可关联的节点将也包括“中关村海龙奔驰”。注意,图5B中所示图谱的边(关系)可以任意多,计算出的结果也可以任意多。
对于第二地址信息也采用相似的方式构建第二子图谱;最后,基于两个子图谱进行相似度计算,例如一个用户输入的第二地址信息是“海淀区海龙大厦”,此时文本相似度结果可能是较差的,但两个子图谱可能高度相似。如图5C所示,尽管“海淀区海龙大厦”对应的图谱里没有“北京海龙奔驰”,但是由于其他节点和属性高度相似,最终相似度的计算结果仍然会很高,模型将判断两个地址是一致的。此外,上述计算的距离信息也可以作为一个节点或参量输入至相似度计算模型。
图2是根据本公开的一些实施例所示的一种地址信息验证装置示意图。如图2所示,地址信息验证装置200包括比对模块201、子图谱构建模块202和子图谱相似度计算模块203;其中,
比对模块201,用于接收用户提供的第一地址信息,将所述第一地址信息与从不同渠道获取的所述用户的至少一个第二地址信息进行比对;
子图谱构建模块202,用于在所述比对的结果差异超过预设阈值时,从用户关系图谱中分别构建基于所述第一地址信息的第一子图谱和基于所述第二地址信息的第二子图谱;
子图谱相似度计算模块203,计算所述第一子图谱和所述第二子图谱的相似度,确定所述第一地址信息的真实性。
在一些实施例中,所述比对模块包括:
文本比对模块,用于将所述第一地址信息与所述第二地址信息进行文本比对;和/或
地理位置比对模块,用于将所述第一地址信息与所述第二地址信息进行地理位置比对。
在一些实施例中,所述不同渠道包括至少一个可信系统和/或在先已经过验证的业务记录。
在一些实施例中,所述子图谱构建模块包括:
查询模块,用于根据所述第一地址信息在用户关系图谱中查询,获得与所述第一地址信息相关联的第一数据集;
第一子图谱构建模块,用于对第一数据集进行推理计算,得到所述第一子图谱;
所述查询模块还用于根据所述第二地址信息在用户关系图谱中查询,获得与所述第二地址信息相关联的第二数据集;
第一子图谱构建模块,用于对第二数据集进行推理计算,得到所述第二子图谱。
在一些实施例中,所述子图谱相似度计算模块还包括:
数据获取模块,用于获取所述第一子图谱和所述第二子图谱中相同的节点及边;
权重计算模块,用于根据所述节点及边的权重计算所述相似度。
参考附图3,为本公开一个实施例提供的电子设备示意图。如图3所示,该电子设备300包括:
存储器330以及一个或多个处理器310;
其中,所述存储器330与所述一个或多个处理器310通信连接,所述存储器330中存储有可被所述一个或多个处理器执行的指令332,所述指令332被所述一个或多个处理器310执行,以使所述一个或多个处理器310执行本公开前述实施例中的方法。
具体地,处理器310和存储器330可以通过总线或者其他方式连接,图3中以通过总线340连接为例。处理器310可以为中央处理器(Central Processing Unit,CPU)。处理器310还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器330作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本公开实施例中的级联渐进网络等。处理器310通过运行存储在存储器330中的非暂态软件程序、指令以及功能模块332,从而执行处理器的各种功能应用以及数据处理。
存储器330可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器310所创建的数据等。此外,存储器330可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器330可选包括相对于处理器310远程设置的存储器,这些远程存储器可以通过网络(比如通过通信接口320)连接至处理器310。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本公开的一个实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被执行后执行本公开前述实施例中的方法。
前述的计算机可读取存储介质包括以存储如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方式或技术来实现的物理易失性和非易失性、可移动和不可移动介质。计算机可读取存储介质具体包括,但不限于,U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、可擦除可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM)、闪存或其他固态存储器技术、CD-ROM、数字多功能盘(DVD)、HD-DVD、蓝光(Blue-Ray)或其他光存储设备、磁带、磁盘存储或其他磁性存储设备、或能用于存储所需信息且可以由计算机访问的任何其他介质。
尽管此处所述的主题是在结合操作系统和应用程序在计算机系统上的执行而执行的一般上下文中提供的,但本领域技术人员可以认识到,还可结合其他类型的程序模块来执行其他实现。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。本领域技术人员可以理解,此处所述的本主题可以使用其他计算机系统配置来实践,包括手持式设备、多处理器系统、基于微处理器或可编程消费电子产品、小型计算机、大型计算机等,也可使用在其中任务由通过通信网络连接的远程处理设备执行的分布式计算环境中。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备的两者中。
本领域普通技术人员可以意识到,结合本文中所本公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对原有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。
综上所述,本公开实施例提出了一种地址信息验证方法、装置、电子设备及其计算机可读存储介质。本公开实施例利用知识图谱来辅助验证,通过获取用户的关联信息来帮助推理,从而判断用户提供信息的真实性。由于金融反欺诈系统多建立在知识图谱的数据之上,因此利用这种现有的知识图谱来实现贷款申请中的地址验证可以利用现有的资源来实现现有技术中无法达到的性能。
应当理解的是,本公开的上述具体实施方式仅仅用于示例性说明或解释本公开的原理,而不构成对本公开的限制。因此,在不偏离本公开的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。此外,本公开所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (10)
1.一种地址信息验证方法,其特征在于,包括:
接收用户提供的第一地址信息,将所述第一地址信息与从不同渠道获取的所述用户的至少一个第二地址信息进行比对;
在所述比对的结果差异超过预设阈值时,从用户关系图谱中分别构建基于所述第一地址信息的第一子图谱和基于所述第二地址信息的第二子图谱;
计算所述第一子图谱和所述第二子图谱的相似度,确定所述第一地址信息的真实性。
2.根据权利要求1所述的方法,其特征在于,所述比对包括文本比对和/或地理位置比对。
3.根据权利要求1所述的方法,其特征在于,所述不同渠道包括至少一个可信系统和/或在先已经过验证的业务记录。
4.根据权利要求1所述的方法,其特征在于,所述从用户关系图谱中分别构建基于所述第一地址信息的第一子图谱和基于所述第二地址信息的第二子图谱包括:
根据所述第一地址信息在用户关系图谱中查询,获得与所述第一地址信息相关联的第一数据集;
对第一数据集进行推理计算,得到所述第一子图谱;
根据所述第二地址信息在用户关系图谱中查询,获得与所述第二地址信息相关联的第二数据集;
对第二数据集进行推理计算,得到所述第二子图谱。
5.根据权利要求1所述的方法,其特征在于,所述计算所述第一子图谱和所述第二子图谱的相似度包括:
获取所述第一子图谱和所述第二子图谱中相同的节点及边;
根据所述节点及边的权重计算所述相似度。
6.一种地址信息验证装置,其特征在于,包括:
比对模块,用于接收用户提供的第一地址信息,将所述第一地址信息与从不同渠道获取的所述用户的至少一个第二地址信息进行比对;
子图谱构建模块,用于在所述比对的结果差异超过预设阈值时,从用户关系图谱中分别构建基于所述第一地址信息的第一子图谱和基于所述第二地址信息的第二子图谱;
子图谱相似度计算模块,计算所述第一子图谱和所述第二子图谱的相似度,确定所述第一地址信息的真实性。
7.根据权利要求6所述的装置,其特征在于,所述比对模块包括:
文本比对模块,用于将所述第一地址信息与所述第二地址信息进行文本比对;和/或
地理位置比对模块,用于将所述第一地址信息与所述第二地址信息进行地理位置比对。
8.根据权利要求6所述的装置,其特征在于,所述不同渠道包括至少一个可信系统和/或在先已经过验证的业务记录。
9.根据权利要求6所述的装置,其特征在于,所述子图谱构建模块包括:
查询模块,用于根据所述第一地址信息在用户关系图谱中查询,获得与所述第一地址信息相关联的第一数据集;
第一子图谱构建模块,用于对第一数据集进行推理计算,得到所述第一子图谱;
所述查询模块还用于根据所述第二地址信息在用户关系图谱中查询,获得与所述第二地址信息相关联的第二数据集;
第一子图谱构建模块,用于对第二数据集进行推理计算,得到所述第二子图谱。
10.根据权利要求6所述的装置,其特征在于,所述子图谱相似度计算模块还包括:
数据获取模块,用于获取所述第一子图谱和所述第二子图谱中相同的节点及边;
权重计算模块,用于根据所述节点及边的权重计算所述相似度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010048981.2A CN111274408B (zh) | 2020-01-16 | 2020-01-16 | 地址信息验证方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010048981.2A CN111274408B (zh) | 2020-01-16 | 2020-01-16 | 地址信息验证方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111274408A true CN111274408A (zh) | 2020-06-12 |
CN111274408B CN111274408B (zh) | 2024-05-14 |
Family
ID=70998881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010048981.2A Active CN111274408B (zh) | 2020-01-16 | 2020-01-16 | 地址信息验证方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111274408B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112149759A (zh) * | 2020-10-26 | 2020-12-29 | 北京明略软件系统有限公司 | 一种事件图谱的匹配方法、装置、电子设备及存储介质 |
CN113032527A (zh) * | 2021-03-25 | 2021-06-25 | 北京轮子科技有限公司 | 用于问答系统的信息生成方法、装置、终端设备 |
CN113157704A (zh) * | 2021-05-06 | 2021-07-23 | 成都卫士通信息产业股份有限公司 | 层级关系分析方法、装置、设备及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2606148A1 (en) * | 2007-10-08 | 2009-04-08 | Baldomero J. Alirez | Method of building a validation database |
US20160065429A1 (en) * | 2014-08-29 | 2016-03-03 | Linkedin Corporation | Surfacing an entity's physical locations via social graph |
CN106156279A (zh) * | 2016-06-24 | 2016-11-23 | 深圳前海征信中心股份有限公司 | 基于经纬度及文本比对的地址相似度识别方法及系统 |
CN109739997A (zh) * | 2019-01-28 | 2019-05-10 | 致诚阿福技术发展(北京)有限公司 | 地址对比方法、装置及系统 |
-
2020
- 2020-01-16 CN CN202010048981.2A patent/CN111274408B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2606148A1 (en) * | 2007-10-08 | 2009-04-08 | Baldomero J. Alirez | Method of building a validation database |
US20160065429A1 (en) * | 2014-08-29 | 2016-03-03 | Linkedin Corporation | Surfacing an entity's physical locations via social graph |
CN106156279A (zh) * | 2016-06-24 | 2016-11-23 | 深圳前海征信中心股份有限公司 | 基于经纬度及文本比对的地址相似度识别方法及系统 |
CN109739997A (zh) * | 2019-01-28 | 2019-05-10 | 致诚阿福技术发展(北京)有限公司 | 地址对比方法、装置及系统 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112149759A (zh) * | 2020-10-26 | 2020-12-29 | 北京明略软件系统有限公司 | 一种事件图谱的匹配方法、装置、电子设备及存储介质 |
CN113032527A (zh) * | 2021-03-25 | 2021-06-25 | 北京轮子科技有限公司 | 用于问答系统的信息生成方法、装置、终端设备 |
CN113032527B (zh) * | 2021-03-25 | 2023-08-22 | 北京轮子科技有限公司 | 用于问答系统的信息生成方法、装置、终端设备 |
CN113157704A (zh) * | 2021-05-06 | 2021-07-23 | 成都卫士通信息产业股份有限公司 | 层级关系分析方法、装置、设备及计算机可读存储介质 |
CN113157704B (zh) * | 2021-05-06 | 2023-07-25 | 成都卫士通信息产业股份有限公司 | 层级关系分析方法、装置、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111274408B (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11546223B2 (en) | Systems and methods for conducting more reliable assessments with connectivity statistics | |
US10997142B2 (en) | Cognitive blockchain automation and management | |
Weidmann et al. | The Internet and political protest in autocracies | |
US10121025B1 (en) | Content validation using blockchain | |
Tao et al. | Spatial cluster detection in spatial flow data | |
CN109241461B (zh) | 一种用户画像构建方法及装置 | |
US10530654B2 (en) | System and method for filtering and creating points-of-interest | |
RU2641246C2 (ru) | Способ и устройство оценки безопасности | |
US10992972B1 (en) | Automatic identification of impermissable account sharing | |
CN110059981B (zh) | 信任度评估方法、装置及终端设备 | |
CN111274408A (zh) | 地址信息验证方法及装置 | |
EP3361704A1 (en) | User data sharing method and device | |
CN112819611A (zh) | 欺诈识别方法、装置、电子设备和计算机可读存储介质 | |
US20240152563A9 (en) | Sytem and method for filtering and creating points-of-interest | |
CN111291234A (zh) | 一种账号风险概率评估方法、装置、系统及存储介质 | |
CN110599278B (zh) | 聚合设备标识符的方法、装置和计算机存储介质 | |
CN111259167A (zh) | 用户请求风险识别方法及装置 | |
US20230283628A1 (en) | Machine-learning techniques for detection of unauthorized access of interactive computing environment functions | |
CN112085588B (zh) | 规则模型的安全性的确定方法、装置和数据处理方法 | |
Case et al. | Determining the accuracy of crowdsourced tweet verification for auroral research | |
Abdelzaher et al. | Analytic challenges in social sensing | |
Almeida et al. | Automatic poi matching using an outlier detection based approach | |
Solana‐Ibáñez et al. | Stakeholder engagement and corporate social reputation: The influence of exogenous factors on efficiency performance (stakeholder engagement and exogenous factors) | |
Lu et al. | A novel method for location privacy protection in LBS applications | |
CN111241277A (zh) | 一种基于稀疏图的用户身份识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |