CN106598965A - 一种基于地址信息的账户映射方法及装置 - Google Patents

一种基于地址信息的账户映射方法及装置 Download PDF

Info

Publication number
CN106598965A
CN106598965A CN201510661892.4A CN201510661892A CN106598965A CN 106598965 A CN106598965 A CN 106598965A CN 201510661892 A CN201510661892 A CN 201510661892A CN 106598965 A CN106598965 A CN 106598965A
Authority
CN
China
Prior art keywords
address information
address
information
arbitrary
substring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510661892.4A
Other languages
English (en)
Other versions
CN106598965B (zh
Inventor
周扬
熊军
何帝君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201510661892.4A priority Critical patent/CN106598965B/zh
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to JP2018519762A priority patent/JP6752475B2/ja
Priority to PCT/CN2016/101639 priority patent/WO2017063531A1/zh
Priority to SG11201803052QA priority patent/SG11201803052QA/en
Priority to EP16854910.3A priority patent/EP3364309B1/en
Priority to KR1020187013633A priority patent/KR102117773B1/ko
Publication of CN106598965A publication Critical patent/CN106598965A/zh
Priority to US15/949,981 priority patent/US10990353B2/en
Priority to US16/720,916 priority patent/US10725737B2/en
Application granted granted Critical
Publication of CN106598965B publication Critical patent/CN106598965B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2291User-Defined Types; Storage management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/06Arrangements for sorting, selecting, merging, or comparing data on individual record carriers
    • G06F7/20Comparing separate sets of record carriers arranged in the same sequence to determine whether at least some of the data in one set is identical with that in the other set or sets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/14Payment architectures specially adapted for billing systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Remote Sensing (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Navigation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请涉及网络技术领域,尤其涉及一种基于地址信息的账户映射方法及装置,用以实现建立不同账户体系之间的关联关系。本申请实施例提供的基于地址信息的账户映射方法包括:从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息;针对提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息;在查找到与该第一地址信息匹配的第二地址信息后,建立该第一地址信息所属的第一账户信息,和查找到的该第二地址信息所属的第二账户信息之间的映射关系。

Description

一种基于地址信息的账户映射方法及装置
技术领域
本申请涉及网络技术领域,尤其涉及一种基于地址信息的账户映射方法及装置。
背景技术
随着互联网信息技术的发展,各个服务方通过互联网为用户提供业务服务变得越来越普遍。比如,用户普遍都需要的生活缴费服务,如缴纳电费、水费等,也已经可以通过互联网来满足用户需求。
目前,用户一般可以通过应用服务方提供的应用软件来进行生活缴费,在缴费过程中,需要输入收费服务方提供的缴费户号,但由于缴费户号不便于用户记忆,导致用户体验较差。
应用服务方通常拥有自己的账户体系,其中包括应用账号及用户地址信息等,以便为用户提供多种不同的业务服务,比如除生活缴费服务外,还可以为用户提供信息推介服务、物品获取服务等。而作为生活缴费的收费服务方也拥有自己的账户体系,其中包括缴费户号和用户地址信息等。可见,如果能建立应用服务方的账户体系和收费服务方的账户体系之间的关联关系,应用服务方就可以直接通过用户注册的应用账号来为用户提供缴费服务。
目前,尚没有相关技术能够实现建立不同账户体系之间的关联关系。
发明内容
本申请实施例提供一种基于地址信息的账户映射方法及装置,用以实现建立不同账户体系之间的关联关系。
本申请实施例提供一种基于地址信息的账户映射方法,包括:
从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息;
针对提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息;
在查找到与该第一地址信息匹配的第二地址信息后,建立该第一地址信息所属的第一账户信息,和查找到的该第二地址信息所属的第二账户信息之间的映射关系。
可选地,从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息之后,还包括:
从提取的各个第一地址信息和第二地址信息中分别提取地址特征信息;
针对提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息,包括:
根据该第一地址信息对应的地址特征信息,以及所述各个第二地址信息分别对应的地址特征信息,确定出与该第一地址信息匹配的第二地址信息候选集合;其中,所述第二地址信息候选集合中的每个第二地址信息与该第一地址信息之间满足预设的地址特征匹配条件;
从确定的所述第二地址信息候选集合中选择一个与该第一地址信息匹配的第二地址信息。
可选地,所述地址特征信息包括经纬度信息、兴趣点POI信息和数字子串信息中的一种或多种;
所述第二地址信息候选集合中的任一第二地址信息与该第一地址信息之间满足的所述预设的地址特征匹配条件包括以下条件中的一种或多种:
该任一第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值;
该任一第二地址信息与该第一地址信息分别对应的POI信息相同;
该任一第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值,其中,每个数字子串对应地址的一个位置范围,同一地址的不同数字子串对应该地址的不同位置范围。
可选地,若所述地址特征信息包括经纬度信息,则通过查询存储有地址信息与经纬度的映射关系的经纬度库,查找到与提取的所述第一地址信息和第二地址信息对应的经纬度信息;
若所述地址特征信息包括POI信息,则根据预设的对应POI信息的关键字信息,从所述第一地址信息和第二地址信息中提取出POI信息;
若所述地址特征信息包括数字子串信息,则根据预设的数字子串匹配模式,从所述第一地址信息和第二地址信息中提取出所述数字子串信息。
可选地,根据以下步骤确定所述任一第二地址信息与第一地址信息分别对应的POI信息相同:
当确定所述任一第二地址信息与第一地址信息中存在POI信息后,将所述所述任一第二地址信息与第一地址信息中的POI信息映射为所述门址库中的标准化POI信息;
当该任一第二地址信息映射的所述门址库中的标准化POI信息与该第一地址信息映射的所述门址库中的标准化POI信息相同时,确定所述任一第二地址信息与第一地址信息分别对应的POI信息相同。
可选地,从提取的各个第一地址信息和第二地址信息中分别提取地址特征信息,包括:
从提取的各个第一地址信息和第二地址信息中分别提取经纬度信息、兴趣点POI信息和数字子串信息;
根据该第一地址信息对应的地址特征信息,以及所述各个第二地址信息分别对应的地址特征信息,确定出与该第一地址信息匹配的第二地址信息候选集合,包括:
针对每个第二地址信息,判断该第二地址信息与该第一地址信息分别对应的POI信息是否相同;
当确定该第二地址信息与第一地址信息分别对应的POI信息相同后,基于该第二地址信息与第一地址信息各自的经纬度信息,确定该第二地址信息与该第一地址信息分别对应的经纬度之间的距离,以及基于该第二地址信息与第一地址信息各自的数字子串信息,确定该第二地址信息与该第一地址信息之间连续相同的数字子串个数的最大值;
当该第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值、且该第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值时,将该第二地址信息归入与该第一地址信息匹配的第二地址信息候选集合中。
可选地,所述从确定的所述第二地址信息候选集合中选择一个与该第一地址信息匹配的第二地址信息,包括:
针对确定出的第二地址信息候选集合中的任一第二地址信息,根据该任一第二地址信息与该第一地址信息之间的经纬度匹配分值和经纬度匹配重要度、以及该任一第二地址信息与该第一地址信息之间的数字子串匹配分值和数字子串匹配重要度,确定该任一第二地址信息与该第一地址信息之间的匹配分值;
选取对应的匹配分值最高的第二地址信息作为与该第一地址信息匹配的第二地址信息。
可选地,根据以下公式确定所述任一第二地址信息与第一地址信息之间的经纬度匹配分值S1:
S1=ke-d(c1,c2)
其中,d(c1,c2)表示该任一第二地址信息对应的经纬度c1和该第一地址信息对应的经纬度c2之间的距离,k为常数。
可选地,根据以下公式确定所述任一第二地址信息与第一地址信息之间的数字子串匹配分值S2:
S2=pN
其中,N为将该任一第二地址信息和该第一地址信息之间连续相同的最大数字子串个数,p为常数。
本申请实施例提供一种基于地址信息的账户映射装置,包括:
提取模块,用于从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息;
查找模块,用于针对所述提取模块提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息;
映射模块,用于在所述查找模块查找到与该第一地址信息匹配的第二地址信息后,建立该第一地址信息所属的第一账户信息,和所述查找模块查找到的第二地址信息所属的第二账户信息之间的映射关系。
可见,本申请实施例通过账户信息中包含的地址信息来建立不同账户体系的账户信息之间的映射关系,通过该映射关系,可以基于用户在第一服务方处注册的账户信息定位到用户在第二服务方处的账户信息,从而可以通过第一服务方提供的窗口来完成与第二服务方相关的业务处理。
附图说明
图1为本申请实施例一提供的基于地址信息的账户映射方法流程图;
图2为本申请实施例二提供的基于地址信息的账户映射方法流程图;
图3为经纬度散点图;
图4为确定第二地址信息候选集合的示意图;
图5为本申请实施例三提供的基于地址信息的账户映射方法流程图;
图6为与图5对应的地址匹配框架示意图;
图7为本申请实施例提供的基于地址信息的账户映射装置结构示意图。
具体实施方式
本申请实施例中,从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息;针对提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息;在查找到与该第一地址信息匹配的第二地址信息后,建立该第一地址信息所属的第一账户信息,和查找到的该第二地址信息所属的第二账户信息之间的映射关系。可见,本申请实施例通过账户信息中包含的地址信息来建立不同账户体系的账户信息之间的映射关系,通过该映射关系,可以基于用户在第一服务方处注册的账户信息定位到用户在第二服务方处的账户信息,从而可以通过第一服务方提供的窗口来完成与第二服务方相关的业务处理。比如,当第一服务方为应用服务方,第二服务方为生活缴费(水费、电费、煤气费等)的收费服务方时,可以通过第一服务方提供的应用软件来为第二服务方提供的收费项目进行缴费。
下面结合说明书附图对本申请实施例作进一步详细描述。
实施例一
如图1所示,为本申请实施例一提供的基于地址信息的账户映射方法流程图,包括以下步骤:
S101:从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息。
本申请实施例的执行主体可以是第一服务方的服务器。第一服务方可以是为用户提供应用服务的服务方,第一服务方的第一账户信息中可以包含用户注册的账号、及用户注册或使用应用服务时填写的第一地址信息,比如收货地址等。
在具体实施中,第二服务方可以将各个用户的第二账户信息提供给第一服务方。这里的第二账户信息中包括用户的账号(比如缴费户号)和第二地址信息等。
S102:针对提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息。
该步骤中,为各个第一账户信息中的第一地址信息,查找匹配的第二地址信息。这里,第一地址信息与第二地址信息匹配是指第一地址信息和第二地址信息所指向的地址是一致的。第一地址信息和第二地址信息所指向的地址一致可以包括第一地址信息和第二地址信息相同的情况,也可以包括二者虽然表现形式不同,但所指向的地址实质为同一地址的情况,基于第二种情况存在的可能性较大,本申请实施例二中给出了具体如何查找与第一地址信息匹配的第二地址信息的实施方式,详见后续实施例二的描述。
S103:在查找到与该第一地址信息匹配的第二地址信息后,建立该第一地址信息所属的第一账户信息,和查找到的该第二地址信息所属的第二账户信息之间的映射关系。
这里,通过查找到的与每个第一地址信息匹配的第二地址信息后,就可以通过地址信息建立起两个账户体系之间的映射关系了。也即,在本申请实施例中,认为地址信息一致的两个账户属于同一用户。
对上述方法的应用:
当接收到用户触发的与第二账户信息相关的业务处理请求后(比如这里的业务处理请求为生活缴费请求,相应地,第二账户信息为生活缴费账户信息,不过这里假设用户并没有提供第二账户信息,只是触发了生活缴费请求),根据建立的映射关系及该用户的第一账户信息,确定与该第一账户信息对应的第二账户信息,并针对查找到的第二账户信息执行所述业务处理请求。
实施例二
由于在不同账户体系中,对同一地址进行描述的方式、内容可能不同、描述的详细程度也可能不同等,在进行地址匹配时,若只有当第一地址信息和第二地址信息完全相同时,才认为二者匹配,那么将会导致地址信息的匹配成功率非常低,基于此,本申请实施例二给出了进行地址匹配的优选实施方式。
如图2所示,为本申请实施例二提供的基于地址信息的账户映射方法流程图,包括以下步骤:
S201:从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息,并针对提取的每个第一地址信息,执行下述S202~S204。
S202:根据该第一地址信息对应的地址特征信息,以及所述各个第二地址信息分别对应的地址特征信息,确定出与该第一地址信息匹配的第二地址信息候选集合;其中,所述第二地址信息候选集合中的每个第二地址信息与该第一地址信息之间满足预设的地址特征匹配条件。
在具体实施过程中,由于地址信息很可能是由用户自己手工输入的,不同的用户的输入习惯不同,对全角拼音、字符、繁体字、和特殊符号等的使用习惯不同给地址匹配带来了很大困难,因此在进行地址匹配之前,可以先将这些干扰去除,也即对地址信息进行格式上的预处理。比如,如下表一所示,为列举的几种预处理类型。
预处理类型 示例
全角转半角 “【”转为“[”
中文数字转阿拉伯数字 “一号楼”转为“1号楼”
繁体转简体 “一號樓”转为“一号楼”
英文大写转小写 “A区”转为“a区”
特殊符号替换 “III号”转为“3号”
表一
在对各个第一地址信息和第二地址信息进行预处理之后,对各个第一地址信息和第二地址信息进行解析,得到各个第一地址信息和第二地址信息分别对应的地址特征信息。这里的地址特征信息可以包括经纬度信息、兴趣点POI信息和数字子串信息(比如说路号、楼号、楼层和房号等被看作是数字子串信息)中的一种或多种,每个第一地址信息或第二地址信息可能具有一个或多个数字子串,每个数字子串对应地址的一个位置范围,同一地址的不同数字子串对应该地址的不同位置范围,比如路号、楼号对应不同的位置范围。
在具体实施中,可以通过查询存储有地址信息与经纬度的映射关系的经纬度库,查找到所述第一地址信息和第二地址信息对应的经纬度信息。可以根据预设的对应POI信息的关键字信息(比如基于关键字“路”,提取出POI信息:天目山路256号、万塘路18号),从所述第一地址信息和第二地址信息中提取出POI信息。另外,根据预设的数字子串匹配模式(比如依次匹配出路号、楼号、楼层、房号),提取出所述数字子串信息。
以第一地址信息为“浙江省杭州市天目山路256号MM大楼2楼”,第二地址信息为“浙江省杭州市万塘路18号MM大楼2楼”为例;对第一地址信息进行解析,得到POI信息为天目山路256号,经纬度为(30.122、102.589),采用模糊匹配抽取出路号:256号、楼号:无、楼层:2楼、房号:无,该第一地址信息的数字子串信息即为:256*2*,其中“*”表示其标识的位置范围没有对应的数字子串;对第二地址信息进行解析,得到POI信息为万塘路18号,经纬度为(30.121、102.583),采用模糊匹配抽取出路号:18号、楼号:无、楼层:2楼、房号:无,该第二地址信息的数字子串信息即为256*2*。
在从各个第一地址信息和第二地址信息中解析得到上述地址特征信息后,针对每个第一地址信息,可以根据预设的地址特征匹配条件,查找与该第一地址信息之间满足预设的地址特征匹配条件的至少一个第二地址信息,组成第二地址信息候选集合。第二地址信息候选集合中的任一第二地址信息与该第一地址信息之间满足的所述预设的地址特征匹配条件包括以下三个条件中的一种或多种:
条件一:该任一第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值;
条件二:该任一第二地址信息与该第一地址信息分别对应的POI信息相同;
条件三:该任一第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值。
针对上述条件一,分别对第一地址信息解析得到第一地址信息对应的经纬度,对第二地址信息解析得到第二地址信息对应的经纬度,这里,通过地址信息得到经纬度可以是基于已有的地图应用来实现的。
在具体实施过程中,为了提高查找效率,可以采用k-d树的方式来进行查找,由于本申请实施例需要基于经纬度点来进行查找,因此可以采用2维k-d树(即2-d树)。如图3所示,为经纬度散点图,每一个圆点表示一个地址信息对应的经纬度点。如果采用遍历的方式,依次计算提取的每一个第二地址信息对应的经纬度和待匹配的第一地址信息对应的经纬度之间的距离,就会浪费很多计算资源,采用2-d树搜索方式,可以做到只选择与该第一地址信息对应的经纬度距离较近的第二地址信息的经纬度(对应虚线框中的点)进行计算,这样可以节省大量的计算资源。
针对上述条件二,可以从第一地址信息和第二地址信息中分别提取出POI信息,若分别提取的POI信息相同,则认为该任一第二地址信息与该第一地址信息分别对应的POI信息相同;但是,由于同一地址通常存在多种不同的描述方式,当两个账户体系对同一地址采用不同的描述方式进行描述时,从对应同一地址的第一地址信息和第二地址信息中提取出的POI信息就可能存在不同。
基于此,在S201之后,可以通过查询存储的门址库,将提取的各个第一地址信息和各个第二地址信息中的POI信息映射为所述门址库中的标准化POI信息;
然后,在S202中,根据以下步骤确定所述任一第二地址信息与第一地址信息分别对应的POI信息相同:
当该任一第二地址信息映射的所述门址库中的标准化POI信息与该第一地址信息映射的所述门址库中的标准化POI信息相同时,确定所述任一第二地址信息与第一地址信息分别对应的POI信息相同。
在该方式下,对各个第一地址信息和第二地址信息统一采用门址库中规定的描述方式进行描述,在统一描述方式后,再判断属于不同账户体系中的第一地址信息和第二地址信息的POI信息是否一致,这样可以提高对POI信息的匹配成功率。比如,在上述举例中,对第一地址信息进行解析得到的POI信息为天目山路256号,对第二地址信息进行解析得到的POI信息为万塘路18号,通过查询门址库,确认天目山路256号标准化后为黄龙时代广场,万塘路18号标准化后也为黄龙时代广场,因此可以认为该第一地址信息和第二地址信息分别对应的POI信息相同。
针对上述条件三,可以利用正则表达式从预处理后的各个第一地址信息和第二地址信息中模糊匹配出路号、楼号、楼层和房号这些数字子串,当第一地址信息和第二地址信息在路号、楼号、楼层和房号这些数字子串中的至少N个按照顺序相等时,认为满足条件三,N即为所述设定个数阈值。
在具体实施过程中,可以基于上述任一条件来确定第二地址信息候选集合,也可以将上述条件一~三中的两个或三个进行组合来确定第二地址信息候选集合。
例如:将上述条件一和条件三进行组合:对于第一地址信息“四川省内江市东兴区汉安大道169号2幢2单元2号”,可以通过正则表达式模糊匹配出4个数字子串:169、2、2、2(这里,每个数字子串的定义可以是预先设置的,比如在这里,数字子串定义按照地理范围由大到小的顺序依次为路号、楼号、单元号、房号),同时,该第一地址信息对应的经纬度为(29.602631、105.071571)。假设设置的设定距离阈值为3公里,则可以以经纬度(29.602631、105.071571)对应的点为中心,以半径为3公里寻找归入第二地址信息候选集合中的第二地址信息,发现只有3个,如图4所示,它们的数字子串分别为:168、2;169、2、2;168、3,其中数字子串169、2、2和169、2、2、2的相同数字子串(即公共数字串)个数为3,大于设定个数阈值2,因此只有数字子串169、2、2对应的第二地址信息才是可以归入第二地址信息候选集合中的第二地址信息。如果再结合条件二来确定第二地址信息候选集合,则归入第二地址信息候选集合中的第二地址信息还满足:其对应的门址库中的标准化POI信息与第一地址信息对应的门址库中的标准化POI信息相同,比如这里归入第二地址信息候选集合中的第二地址信息对应的门址库中的标准化POI信息为“四川省内江市东兴区汉安大道169号”,与第一地址信息对应的门址库中的标准化POI信息相同。
S203:从确定的所述第二地址信息候选集合中选择一个与该第一地址信息匹配的第二地址信息。
在具体实施过程中,当所述第二地址信息候选集合中只有一个第二地址信息时,可以将该第二地址信息作为最终选择的第二地址信息;若所述第二地址信息候选集合中存在多个第二地址信息,一种选择方式是:可以将确定的第二地址信息候选集合呈现给用户,由用户从第二地址信息候选集合中选择一个最匹配的第二地址信息。另一种选择方式是:计算第二地址信息候选集合中的各个第二地址信息分别与第一地址信息之间的匹配分值,基于计算得到的匹配分值,选择匹配程度最高的第二地址信息,详见实施例三的描述。
S204:基于选择的与该第一地址信息匹配的第二地址信息,建立该第一地址信息所属的第一账户信息,和选择的该第二地址信息所属的第二账户信息之间的映射关系。
实施例三
如图5所示,为本申请实施例三提供的映射关系建立方法流程图,图6为与之对应的地址匹配框架示意图,包括以下步骤:
S501:从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息。
在该步骤之后,可以首先基于预设的预处理类型,对提取的所述第一地址信息及第二地址信息进行格式上的预处理,在消除地址匹配时的干扰后再执行下述步骤,比如全角转半角、中文数字转阿拉伯数字、繁体转简体、英文大写转小写等。
S502:从各个第一地址信息和第二地址信息中分别提取经纬度信息、兴趣点POI信息和数字子串信息,并针对提取的每个第一地址信息,执行下述S503~S508。
S503:针对每个第二地址信息,判断该第二地址信息与该第一地址信息分别对应的POI信息是否相同,若相同,则进入S504,若不同,则确定该第二地址信息不属于所述与该第一地址信息匹配的第二地址信息候选集合。
在执行该步骤时,可以首先将第一地址信息及第二地址信息中的POI信息通过门址库进行标准化,然后判断标准化后的PIO信息是否一致。
S504:当确定该第二地址信息与第一地址信息分别对应的POI信息相同后,基于该第二地址信息与第一地址信息各自的经纬度信息,确定该第二地址信息与该第一地址信息分别对应的经纬度之间的距离,以及基于该第二地址信息与第一地址信息各自的数字子串,确定该第二地址信息与该第一地址信息之间连续相同的数字子串个数的最大值。
S505:当该第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值、且该第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值时,将该第二地址信息归入与该第一地址信息匹配的第二地址信息候选集合中。
S506:根据该第一地址信息对应的地址特征信息,以及确定出的第二地址信息候选集合中的每个第二地址信息的地址特征信息,确定所述第二地址信息候选集合中的每个第二地址信息与该第一地址信息之间的匹配分值。
在具体实施过程中,针对所述第二地址信息候选集合中的每个第二地址信息,可以分别确定该第二地址信息与第一地址信息之间在每种地址特征下的匹配分值,然后将该第二地址信息与第一地址信息之间在不同种地址特征下的匹配分值相加,作为该第二地址信息与该第一地址信息之间的匹配分值。
比如,可以针对确定出的第二地址信息候选集合中的任一第二地址信息,根据该任一第二地址信息与该第一地址信息之间的经纬度匹配分值和经纬度匹配重要度、以及该任一第二地址信息与该第一地址信息之间的数字子串匹配分值和数字子串匹配重要度,确定该任一第二地址信息与该第一地址信息之间的匹配分值。
这里,可以根据公式S=β1S1+β2S2,来确定该任一第二地址信息与该第一地址信息之间的匹配分值S,这里,β1、β2分别为经纬度匹配重要度和数字子串匹配重要度,S1为经纬度匹配分值,S2为数字子串匹配分值。在实际实施中,可以根据经验设置β1、β2的取值,比如β1可以取值为0.3,β2可以取值为0.7。
可选地,可以根据以下公式确定所述任一第二地址信息与第一地址信息之间的经纬度匹配分值S1:
S1=ke-d(c1,c2)
其中,d(c1,c2)表示该任一第二地址信息对应的经纬度c1和该第一地址信息对应的经纬度c2之间的距离,k为常数。
可以根据以下公式确定所述任一第二地址信息与第一地址信息之间的数字子串匹配分值S2:
S2=pN
其中,N为将该任一第二地址信息和该第一地址信息之间连续相同的最大数字子串个数,p为常数。
S507:选取对应的匹配分值最高的第二地址信息作为与该第一地址信息匹配的第二地址信息。
S508:建立该第一地址信息所属的第一账户信息,和与该第一地址信息匹配的第二地址信息所属的第二账户信息之间的映射关系。
基于同一发明构思,本申请实施例中还提供了一种与映射关系建立方法对应的映射关系建立装置,由于该装置解决问题的原理与本申请实施例的映射关系建立方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。
如图7所示,为本申请实施例提供的基于地址信息的账户映射装置结构示意图,包括:
提取模块71,用于从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息;
查找模块72,用于针对所述提取模块71提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息;
映射模块73,用于在所述查找模块72查找到与该第一地址信息匹配的第二地址信息后,建立该第一地址信息所属的第一账户信息,和所述查找模块查找到的第二地址信息所属的第二账户信息之间的映射关系。
可选地,所述查找模块72具体用于:
根据该第一地址信息对应的地址特征信息,以及所述各个第二地址信息分别对应的地址特征信息,确定出与该第一地址信息匹配的第二地址信息候选集合;其中,所述第二地址信息候选集合中的每个第二地址信息与该第一地址信息之间满足预设的地址特征匹配条件;从确定的所述第二地址信息候选集合中选择一个与该第一地址信息匹配的第二地址信息。
可选地,所述地址特征信息包括经纬度信息、兴趣点POI信息和数字子串信息中的一种或多种;
所述第二地址信息候选集合中的任一第二地址信息与该第一地址信息之间满足的所述预设的地址特征匹配条件包括以下条件中的一种或多种:
该任一第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值;
该任一第二地址信息与该第一地址信息分别对应的POI信息相同;
该任一第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值,其中,每个数字子串对应地址的一个位置范围,同一地址的不同数字子串对应该地址的不同位置范围。
可选地,所述查找模块72具体用于:
若所述地址特征信息包括经纬度信息,则通过查询存储有地址信息与经纬度的映射关系的经纬度库,查找到与提取的所述第一地址信息和第二地址信息对应的经纬度信息;
若所述地址特征信息包括POI信息,则根据预设的对应POI信息的关键字信息,从所述第一地址信息和第二地址信息中提取出POI信息;
若所述地址特征信息包括数字子串信息,则根据预设的数字子串匹配模式,从所述第一地址信息和第二地址信息中提取出所述数字子串信息。
可选地,所述查找模块72还用于:
当确定所述任一第二地址信息与第一地址信息中存在POI信息后,将所述所述任一第二地址信息与第一地址信息中的POI信息映射为所述门址库中的标准化POI信息;
当该任一第二地址信息映射的所述门址库中的标准化POI信息与该第一地址信息映射的所述门址库中的标准化POI信息相同时,确定所述任一第二地址信息与第一地址信息分别对应的POI信息相同。
可选地,所述提取模块71具体用于:
从提取的各个第一地址信息和第二地址信息中分别提取经纬度信息、兴趣点POI信息和数字子串信息;
所述查找模块72具体用于:
针对每个第二地址信息,判断该第二地址信息与该第一地址信息分别对应的POI信息是否相同;当确定该第二地址信息与第一地址信息分别对应的POI信息相同后,基于该第二地址信息与第一地址信息各自的经纬度信息,确定该第二地址信息与该第一地址信息分别对应的经纬度之间的距离,以及基于该第二地址信息与第一地址信息各自的数字子串信息,确定该第二地址信息与该第一地址信息之间连续相同的数字子串个数的最大值;当该第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值、且该第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值时,将该第二地址信息归入与该第一地址信息匹配的第二地址信息候选集合中。
可选地,所述查找模块72具体用于:
针对确定出的第二地址信息候选集合中的任一第二地址信息,根据该任一第二地址信息与该第一地址信息之间的经纬度匹配分值和经纬度匹配重要度、以及该任一第二地址信息与该第一地址信息之间的数字子串匹配分值和数字子串匹配重要度,确定该任一第二地址信息与该第一地址信息之间的匹配分值;选取对应的匹配分值最高的第二地址信息作为与该第一地址信息匹配的第二地址信息。
可选地,所述查找模块72具体用于根据以下公式确定所述任一第二地址信息与第一地址信息之间的经纬度匹配分值S1:
S1=ke-d(c1,c2)
其中,d(c1,c2)表示该任一第二地址信息对应的经纬度c1和该第一地址信息对应的经纬度c2之间的距离,k为常数。
可选地,所述查找模块72具体用于根据以下公式确定所述任一第二地址信息与第一地址信息之间的数字子串匹配分值S2:
S2=pN
其中,N为将该任一第二地址信息和该第一地址信息之间连续相同的最大数字子串个数,p为常数。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (18)

1.一种基于地址信息的账户映射方法,其特征在于,该方法包括:
从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息;
针对提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息;
在查找到与该第一地址信息匹配的第二地址信息后,建立该第一地址信息所属的第一账户信息,和查找到的该第二地址信息所属的第二账户信息之间的映射关系。
2.如权利要求1所述的方法,其特征在于,从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息之后,还包括:
从提取的各个第一地址信息和第二地址信息中分别提取地址特征信息;
针对提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息,包括:
根据该第一地址信息对应的地址特征信息,以及所述各个第二地址信息分别对应的地址特征信息,确定出与该第一地址信息匹配的第二地址信息候选集合;其中,所述第二地址信息候选集合中的每个第二地址信息与该第一地址信息之间满足预设的地址特征匹配条件;
从确定的所述第二地址信息候选集合中选择一个与该第一地址信息匹配的第二地址信息。
3.如权利要求2所述的方法,其特征在于,所述地址特征信息包括经纬度信息、兴趣点POI信息和数字子串信息中的一种或多种;
所述第二地址信息候选集合中的任一第二地址信息与该第一地址信息之间满足的所述预设的地址特征匹配条件包括以下条件中的一种或多种:
该任一第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值;
该任一第二地址信息与该第一地址信息分别对应的POI信息相同;
该任一第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值,其中,每个数字子串对应地址的一个位置范围,同一地址的不同数字子串对应该地址的不同位置范围。
4.如权利要求3所述的方法,其特征在于,根据以下步骤确定所述任一第二地址信息与第一地址信息分别对应的POI信息相同:
当确定所述任一第二地址信息与第一地址信息中存在POI信息后,将所述所述任一第二地址信息与第一地址信息中的POI信息映射为所述门址库中的标准化POI信息;
当该任一第二地址信息映射的所述门址库中的标准化POI信息与该第一地址信息映射的所述门址库中的标准化POI信息相同时,确定所述任一第二地址信息与第一地址信息分别对应的POI信息相同。
5.如权利要求2~4任一所述的方法,其特征在于,从提取的各个第一地址信息和第二地址信息中分别提取地址特征信息,包括:
从提取的各个第一地址信息和第二地址信息中分别提取经纬度信息、兴趣点POI信息和数字子串信息;
根据该第一地址信息对应的地址特征信息,以及所述各个第二地址信息分别对应的地址特征信息,确定出与该第一地址信息匹配的第二地址信息候选集合,包括:
针对每个第二地址信息,判断该第二地址信息与该第一地址信息分别对应的POI信息是否相同;
当确定该第二地址信息与第一地址信息分别对应的POI信息相同后,基于该第二地址信息与第一地址信息各自的经纬度信息,确定该第二地址信息与该第一地址信息分别对应的经纬度之间的距离,以及基于该第二地址信息与第一地址信息各自的数字子串信息,确定该第二地址信息与该第一地址信息之间连续相同的数字子串个数的最大值;
当该第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值、且该第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值时,将该第二地址信息归入与该第一地址信息匹配的第二地址信息候选集合中。
6.如权利要求5所述的方法,其特征在于,所述从确定的所述第二地址信息候选集合中选择一个与该第一地址信息匹配的第二地址信息,包括:
针对确定出的第二地址信息候选集合中的任一第二地址信息,根据该任一第二地址信息与该第一地址信息之间的经纬度匹配分值和经纬度匹配重要度、以及该任一第二地址信息与该第一地址信息之间的数字子串匹配分值和数字子串匹配重要度,确定该任一第二地址信息与该第一地址信息之间的匹配分值;
选取对应的匹配分值最高的第二地址信息作为与该第一地址信息匹配的第二地址信息。
7.如权利要求6所述的方法,其特征在于,根据以下公式确定所述任一第二地址信息与第一地址信息之间的经纬度匹配分值S1:
S1=ke-d(c1,c2)
其中,d(c1,c2)表示该任一第二地址信息对应的经纬度c1和该第一地址信息对应的经纬度c2之间的距离,k为常数。
8.如权利要求6所述的方法,其特征在于,根据以下公式确定所述任一第二地址信息与第一地址信息之间的数字子串匹配分值S2:
S2=pN
其中,N为将该任一第二地址信息和该第一地址信息之间连续相同的最大数字子串个数,p为常数。
9.如权利要求1所述的方法,其特征在于,针对提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息,包括:
采用k-d树的方式,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息。
10.如权利要求1所述的方法,其特征在于,提取所述第一地址信息及第二地址信息之后,查找与该第一地址信息匹配的第二地址信息之前,还包括:
根据预设的预处理类型,对提取的所述第一地址信息及第二地址信息进行格式上的预处理。
11.一种基于地址信息的账户映射装置,其特征在于,该装置包括:
提取模块,用于从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息;
查找模块,用于针对所述提取模块提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息;
映射模块,用于在所述查找模块查找到与该第一地址信息匹配的第二地址信息后,建立该第一地址信息所属的第一账户信息,和所述查找模块查找到的第二地址信息所属的第二账户信息之间的映射关系。
12.如权利要求11所述的装置,其特征在于,所述提取模块还用于:
从提取的各个第一地址信息和第二地址信息中分别提取地址特征信息;
所述查找模块具体用于:
根据该第一地址信息对应的地址特征信息,以及所述各个第二地址信息分别对应的地址特征信息,确定出与该第一地址信息匹配的第二地址信息候选集合;其中,所述第二地址信息候选集合中的每个第二地址信息与该第一地址信息之间满足预设的地址特征匹配条件;从确定的所述第二地址信息候选集合中选择一个与该第一地址信息匹配的第二地址信息。
13.如权利要求12所述的装置,其特征在于,所述地址特征信息包括经纬度信息、兴趣点POI信息和数字子串信息中的一种或多种;
所述第二地址信息候选集合中的任一第二地址信息与该第一地址信息之间满足的所述预设的地址特征匹配条件包括以下条件中的一种或多种:
该任一第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值;
该任一第二地址信息与该第一地址信息分别对应的POI信息相同;
该任一第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值,其中,每个数字子串对应地址的一个位置范围,同一地址的不同数字子串对应该地址的不同位置范围。
14.如权利要求13所述的装置,其特征在于,所述查找模块还用于:
当确定所述任一第二地址信息与第一地址信息中存在POI信息后,将所述所述任一第二地址信息与第一地址信息中的POI信息映射为所述门址库中的标准化POI信息;
当该任一第二地址信息映射的所述门址库中的标准化POI信息与该第一地址信息映射的所述门址库中的标准化POI信息相同时,确定所述任一第二地址信息与第一地址信息分别对应的POI信息相同。
15.如权利要求12~14任一所述的装置,其特征在于,所述提取模块具体用于:
从提取的各个第一地址信息和第二地址信息中分别提取经纬度信息、兴趣点POI信息和数字子串信息;
所述查找模块具体用于:
针对每个第二地址信息,判断该第二地址信息与该第一地址信息分别对应的POI信息是否相同;当确定该第二地址信息与第一地址信息分别对应的POI信息相同后,基于该第二地址信息与第一地址信息各自的经纬度信息,确定该第二地址信息与该第一地址信息分别对应的经纬度之间的距离,以及基于该第二地址信息与第一地址信息各自的数字子串信息,确定该第二地址信息与该第一地址信息之间连续相同的数字子串个数的最大值;当该第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值、且该第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值时,将该第二地址信息归入与该第一地址信息匹配的第二地址信息候选集合中。
16.如权利要求12所述的装置,其特征在于,所述查找模块具体用于:
针对确定出的第二地址信息候选集合中的任一第二地址信息,根据该任一第二地址信息与该第一地址信息之间的经纬度匹配分值和经纬度匹配重要度、以及该任一第二地址信息与该第一地址信息之间的数字子串匹配分值和数字子串匹配重要度,确定该任一第二地址信息与该第一地址信息之间的匹配分值;选取对应的匹配分值最高的第二地址信息作为与该第一地址信息匹配的第二地址信息。
17.如权利要求16所述的装置,其特征在于,所述查找模块具体用于根据以下公式确定所述任一第二地址信息与第一地址信息之间的经纬度匹配分值S1:
S1=ke-d(c1,c2)
其中,d(c1,c2)表示该任一第二地址信息对应的经纬度c1和该第一地址信息对应的经纬度c2之间的距离,k为常数。
18.如权利要求16所述的装置,其特征在于,所述查找模块具体用于根据以下公式确定所述任一第二地址信息与第一地址信息之间的数字子串匹配分值S2:
S2=pN
其中,N为将该任一第二地址信息和该第一地址信息之间连续相同的最大数字子串个数,p为常数。
CN201510661892.4A 2015-10-14 2015-10-14 一种基于地址信息的账户映射方法及装置 Active CN106598965B (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN201510661892.4A CN106598965B (zh) 2015-10-14 2015-10-14 一种基于地址信息的账户映射方法及装置
PCT/CN2016/101639 WO2017063531A1 (zh) 2015-10-14 2016-10-10 一种基于地址信息的账户映射方法及装置
SG11201803052QA SG11201803052QA (en) 2015-10-14 2016-10-10 Account mapping method and apparatus based on address information
EP16854910.3A EP3364309B1 (en) 2015-10-14 2016-10-10 Account mapping method and device based on address information
JP2018519762A JP6752475B2 (ja) 2015-10-14 2016-10-10 アドレス情報に基づいたアカウントマッピングの方法及び装置
KR1020187013633A KR102117773B1 (ko) 2015-10-14 2016-10-10 어드레스 정보에 기초한 어카운트 맵핑 방법 및 장치
US15/949,981 US10990353B2 (en) 2015-10-14 2018-04-10 Address information-based account mapping method and apparatus
US16/720,916 US10725737B2 (en) 2015-10-14 2019-12-19 Address information-based account mapping method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510661892.4A CN106598965B (zh) 2015-10-14 2015-10-14 一种基于地址信息的账户映射方法及装置

Publications (2)

Publication Number Publication Date
CN106598965A true CN106598965A (zh) 2017-04-26
CN106598965B CN106598965B (zh) 2020-03-20

Family

ID=58517080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510661892.4A Active CN106598965B (zh) 2015-10-14 2015-10-14 一种基于地址信息的账户映射方法及装置

Country Status (7)

Country Link
US (2) US10990353B2 (zh)
EP (1) EP3364309B1 (zh)
JP (1) JP6752475B2 (zh)
KR (1) KR102117773B1 (zh)
CN (1) CN106598965B (zh)
SG (1) SG11201803052QA (zh)
WO (1) WO2017063531A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108090221A (zh) * 2018-01-02 2018-05-29 北京市燃气集团有限责任公司 一种燃气卡数据与用户管理数据的关联方法
CN109741227A (zh) * 2019-01-07 2019-05-10 巩志远 一种基于最近邻算法预测人房一致性处理方法及系统
CN112150305A (zh) * 2020-09-14 2020-12-29 深圳供电局有限公司 企业电力用户信息核验方法及其系统、计算机设备、介质

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106598965B (zh) 2015-10-14 2020-03-20 阿里巴巴集团控股有限公司 一种基于地址信息的账户映射方法及装置
CN109491994B (zh) * 2018-11-28 2020-12-18 中国科学院空天信息创新研究院 Landsat-8卫星精选遥感数据集最简化筛选方法
CN111984748A (zh) * 2019-05-22 2020-11-24 深圳中兴飞贷金融科技有限公司 地址信息处理方法和装置、存储介质及电子设备
CN110851661B (zh) * 2019-10-25 2023-04-21 北京深演智能科技股份有限公司 用户id映射关系的确定方法及装置、电子设备
CN112507223B (zh) * 2020-12-10 2023-06-23 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及可读存储介质
US11409660B1 (en) * 2021-11-19 2022-08-09 SafeGraph, Inc. Systems and methods for translating address strings to standardized addresses

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100024019A1 (en) * 2006-05-03 2010-01-28 Emillion Oy Authentication
US20110173268A1 (en) * 2010-01-08 2011-07-14 Yigang Cai Telecommunication messaging through a social networking service
CN102932414A (zh) * 2012-09-26 2013-02-13 中国科学院计算技术研究所 一种通讯录与社交网络的融合方法及其系统
CN104778606A (zh) * 2015-04-10 2015-07-15 北京京东尚科信息技术有限公司 账户结构数据的处理方法和装置
CN104899202A (zh) * 2014-03-04 2015-09-09 华为技术有限公司 一种信息处理方法及系统

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100684445B1 (ko) * 1999-12-31 2007-02-16 주식회사 케이티 이종 데이터베이스 간의 연동을 위한 연동 시스템 및 그방법
US10684350B2 (en) 2000-06-02 2020-06-16 Tracbeam Llc Services and applications for a communications network
US7738878B2 (en) 2000-12-13 2010-06-15 Trimble Navigation Limited Method for obtaining location information of a mobile unit using a wireline telephone number
WO2004074778A1 (en) * 2003-02-14 2004-09-02 Networks In Motion, Inc. Method and system for saving and retrieving spatial related information
JP2005011049A (ja) * 2003-06-19 2005-01-13 Nec Soft Ltd データベース統合装置
KR101042361B1 (ko) * 2004-01-30 2011-06-17 주식회사 케이티 이종 업종간 정보시스템 통합이 가능한 메타 정보 시스템및 그 통합 방법
US20060271281A1 (en) * 2005-05-20 2006-11-30 Myron Ahn Geographic information knowledge systems
US9064288B2 (en) * 2006-03-17 2015-06-23 Fatdoor, Inc. Government structures and neighborhood leads in a geo-spatial environment
US8732091B1 (en) 2006-03-17 2014-05-20 Raj Abhyanker Security in a geo-spatial environment
US20070233658A1 (en) 2006-03-31 2007-10-04 Aol Llc Identifying a result responsive to location data for multiple users
US20140123247A1 (en) 2006-11-22 2014-05-01 Raj Abhyanker Nextdoor neighbor connect
CN101911090B (zh) * 2007-12-28 2014-01-15 皇家飞利浦电子股份有限公司 信息交换系统及设备
JP5113108B2 (ja) * 2008-06-18 2013-01-09 ヤフー株式会社 注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラム
EP2486521A1 (en) * 2009-10-06 2012-08-15 Koninklijke Philips Electronics N.V. Autonomous linkage of patient information records stored at different entities
EP2569871B1 (en) 2010-05-13 2015-04-08 Northwestern University Geographic location system and method
CN101882163A (zh) * 2010-06-30 2010-11-10 中国科学院地理科学与资源研究所 一种基于匹配规则的模糊中文地址地理赋值方法
JP2012174074A (ja) * 2011-02-23 2012-09-10 Esri Japan Co Ltd データベース統合装置
JP5802143B2 (ja) * 2012-02-07 2015-10-28 株式会社コナミデジタルエンタテインメント サーバ、制御方法およびプログラム
US9842120B1 (en) 2013-02-15 2017-12-12 United Parcel Service Of America, Inc. Standardization of addresses and location information
US10311435B2 (en) * 2013-03-28 2019-06-04 Morphotrust Usa Llc System and method for transaction authentication
EP3020180B1 (en) * 2013-07-12 2020-09-02 Skyhook Wireless, Inc. Associating attributes with network addresses
CN104767672A (zh) * 2014-01-08 2015-07-08 北大方正集团有限公司 一种账户关系建立方法及设备
WO2015123604A1 (en) 2014-02-17 2015-08-20 Tourmaline Labs, Inc. Systems and methods for estimating movements of a vehicle using a mobile device
CN104954322B (zh) * 2014-03-25 2019-10-22 腾讯科技(深圳)有限公司 一种账号的绑定处理方法、装置及系统
CN104573057B (zh) * 2015-01-22 2017-10-27 电子科技大学 一种用于跨ugc网站平台的帐户关联方法
CN106161372B (zh) * 2015-04-09 2019-05-31 阿里巴巴集团控股有限公司 一种基于地址匹配的风险识别方法及装置
CN106598965B (zh) 2015-10-14 2020-03-20 阿里巴巴集团控股有限公司 一种基于地址信息的账户映射方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100024019A1 (en) * 2006-05-03 2010-01-28 Emillion Oy Authentication
US20110173268A1 (en) * 2010-01-08 2011-07-14 Yigang Cai Telecommunication messaging through a social networking service
CN102932414A (zh) * 2012-09-26 2013-02-13 中国科学院计算技术研究所 一种通讯录与社交网络的融合方法及其系统
CN104899202A (zh) * 2014-03-04 2015-09-09 华为技术有限公司 一种信息处理方法及系统
CN104778606A (zh) * 2015-04-10 2015-07-15 北京京东尚科信息技术有限公司 账户结构数据的处理方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108090221A (zh) * 2018-01-02 2018-05-29 北京市燃气集团有限责任公司 一种燃气卡数据与用户管理数据的关联方法
CN108090221B (zh) * 2018-01-02 2019-05-10 北京市燃气集团有限责任公司 一种燃气卡数据与用户管理数据的关联方法
CN109741227A (zh) * 2019-01-07 2019-05-10 巩志远 一种基于最近邻算法预测人房一致性处理方法及系统
CN109741227B (zh) * 2019-01-07 2020-12-08 巩志远 一种基于最近邻算法预测人房一致性处理方法及系统
CN112150305A (zh) * 2020-09-14 2020-12-29 深圳供电局有限公司 企业电力用户信息核验方法及其系统、计算机设备、介质

Also Published As

Publication number Publication date
US10725737B2 (en) 2020-07-28
US10990353B2 (en) 2021-04-27
KR102117773B1 (ko) 2020-06-02
US20200125327A1 (en) 2020-04-23
JP2018537760A (ja) 2018-12-20
EP3364309A4 (en) 2018-08-22
KR20180069869A (ko) 2018-06-25
WO2017063531A1 (zh) 2017-04-20
US20180232206A1 (en) 2018-08-16
SG11201803052QA (en) 2018-05-30
CN106598965B (zh) 2020-03-20
EP3364309A1 (en) 2018-08-22
JP6752475B2 (ja) 2020-09-09
EP3364309B1 (en) 2021-06-30

Similar Documents

Publication Publication Date Title
CN106598965A (zh) 一种基于地址信息的账户映射方法及装置
CN105528372B (zh) 一种地址搜索方法和设备
CN108628811B (zh) 地址文本的匹配方法和装置
US20150356072A1 (en) Method and Apparatus of Matching Text Information and Pushing a Business Object
KR20120042307A (ko) 지역기반의 검색어를 추천하는 시스템 및 그 방법
CN106484764A (zh) 基于人群画像技术的用户相似度计算方法
CN104077324B (zh) 一种地图搜索方法及系统
Yamaguchi et al. Landmark-based user location inference in social media
US9159030B1 (en) Refining location detection from a query stream
CN103324745A (zh) 基于贝叶斯模型的文本垃圾识别方法和系统
US9330135B2 (en) Method, apparatus and computer readable recording medium for a search using extension keywords
TW201933879A (zh) 內容推薦方法及裝置
CN104268230A (zh) 一种基于异质图随机游走的中文微博客观点探测方法
CN113412608A (zh) 内容推送方法、装置、服务端及存储介质
CN110869706B (zh) 数字助理应用和导航应用之间的接合
CN116414823A (zh) 一种基于分词模型的地址定位方法和装置
CN114372133A (zh) 查询信息问答方法、相关装置及计算机程序产品
KR101929649B1 (ko) 채팅로그 키워드 추출을 통한 관심사 관련 오픈 채팅방 추천 시스템 및 방법
CN113326450B (zh) 一种兴趣点召回方法、装置、电子设备和存储介质
CN107066112A (zh) 一种地址信息的拼音输入法及装置
CN103853437A (zh) 一种获取候选项的方法及装置
US20150169628A1 (en) Location detection from queries using evidence for location alternatives
CN105320647B (zh) 一种基于文字交互行为的用户特征建模方法
CN114792091A (zh) 基于词汇增强的中文地址要素解析方法、设备及存储介质
CN112528156A (zh) 建立排序模型的方法、查询自动补全的方法及对应装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200921

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200921

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Advanced innovation technology Co.,Ltd.

Address before: Cayman Islands Grand Cayman capital building, a four storey No. 847 mailbox

Patentee before: Alibaba Group Holding Ltd.

TR01 Transfer of patent right