一种基于地址信息的账户映射方法及装置
技术领域
本申请涉及网络技术领域,尤其涉及一种基于地址信息的账户映射方法及装置。
背景技术
随着互联网信息技术的发展,各个服务方通过互联网为用户提供业务服务变得越来越普遍。比如,用户普遍都需要的生活缴费服务,如缴纳电费、水费等,也已经可以通过互联网来满足用户需求。
目前,用户一般可以通过应用服务方提供的应用软件来进行生活缴费,在缴费过程中,需要输入收费服务方提供的缴费户号,但由于缴费户号不便于用户记忆,导致用户体验较差。
应用服务方通常拥有自己的账户体系,其中包括应用账号及用户地址信息等,以便为用户提供多种不同的业务服务,比如除生活缴费服务外,还可以为用户提供信息推介服务、物品获取服务等。而作为生活缴费的收费服务方也拥有自己的账户体系,其中包括缴费户号和用户地址信息等。可见,如果能建立应用服务方的账户体系和收费服务方的账户体系之间的关联关系,应用服务方就可以直接通过用户注册的应用账号来为用户提供缴费服务。
目前,尚没有相关技术能够实现建立不同账户体系之间的关联关系。
发明内容
本申请实施例提供一种基于地址信息的账户映射方法及装置,用以实现建立不同账户体系之间的关联关系。
本申请实施例提供一种基于地址信息的账户映射方法,包括:
从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息;
针对提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息;
在查找到与该第一地址信息匹配的第二地址信息后,建立该第一地址信息所属的第一账户信息,和查找到的该第二地址信息所属的第二账户信息之间的映射关系。
可选地,从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息之后,还包括:
从提取的各个第一地址信息和第二地址信息中分别提取地址特征信息;
针对提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息,包括:
根据该第一地址信息对应的地址特征信息,以及所述各个第二地址信息分别对应的地址特征信息,确定出与该第一地址信息匹配的第二地址信息候选集合;其中,所述第二地址信息候选集合中的每个第二地址信息与该第一地址信息之间满足预设的地址特征匹配条件;
从确定的所述第二地址信息候选集合中选择一个与该第一地址信息匹配的第二地址信息。
可选地,所述地址特征信息包括经纬度信息、兴趣点POI信息和数字子串信息中的一种或多种;
所述第二地址信息候选集合中的任一第二地址信息与该第一地址信息之间满足的所述预设的地址特征匹配条件包括以下条件中的一种或多种:
该任一第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值;
该任一第二地址信息与该第一地址信息分别对应的POI信息相同;
该任一第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值,其中,每个数字子串对应地址的一个位置范围,同一地址的不同数字子串对应该地址的不同位置范围。
可选地,若所述地址特征信息包括经纬度信息,则通过查询存储有地址信息与经纬度的映射关系的经纬度库,查找到与提取的所述第一地址信息和第二地址信息对应的经纬度信息;
若所述地址特征信息包括POI信息,则根据预设的对应POI信息的关键字信息,从所述第一地址信息和第二地址信息中提取出POI信息;
若所述地址特征信息包括数字子串信息,则根据预设的数字子串匹配模式,从所述第一地址信息和第二地址信息中提取出所述数字子串信息。
可选地,根据以下步骤确定所述任一第二地址信息与第一地址信息分别对应的POI信息相同:
当确定所述任一第二地址信息与第一地址信息中存在POI信息后,将所述所述任一第二地址信息与第一地址信息中的POI信息映射为所述门址库中的标准化POI信息;
当该任一第二地址信息映射的所述门址库中的标准化POI信息与该第一地址信息映射的所述门址库中的标准化POI信息相同时,确定所述任一第二地址信息与第一地址信息分别对应的POI信息相同。
可选地,从提取的各个第一地址信息和第二地址信息中分别提取地址特征信息,包括:
从提取的各个第一地址信息和第二地址信息中分别提取经纬度信息、兴趣点POI信息和数字子串信息;
根据该第一地址信息对应的地址特征信息,以及所述各个第二地址信息分别对应的地址特征信息,确定出与该第一地址信息匹配的第二地址信息候选集合,包括:
针对每个第二地址信息,判断该第二地址信息与该第一地址信息分别对应的POI信息是否相同;
当确定该第二地址信息与第一地址信息分别对应的POI信息相同后,基于该第二地址信息与第一地址信息各自的经纬度信息,确定该第二地址信息与该第一地址信息分别对应的经纬度之间的距离,以及基于该第二地址信息与第一地址信息各自的数字子串信息,确定该第二地址信息与该第一地址信息之间连续相同的数字子串个数的最大值;
当该第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值、且该第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值时,将该第二地址信息归入与该第一地址信息匹配的第二地址信息候选集合中。
可选地,所述从确定的所述第二地址信息候选集合中选择一个与该第一地址信息匹配的第二地址信息,包括:
针对确定出的第二地址信息候选集合中的任一第二地址信息,根据该任一第二地址信息与该第一地址信息之间的经纬度匹配分值和经纬度匹配重要度、以及该任一第二地址信息与该第一地址信息之间的数字子串匹配分值和数字子串匹配重要度,确定该任一第二地址信息与该第一地址信息之间的匹配分值;
选取对应的匹配分值最高的第二地址信息作为与该第一地址信息匹配的第二地址信息。
可选地,根据以下公式确定所述任一第二地址信息与第一地址信息之间的经纬度匹配分值S1:
S1=ke-d(c1,c2)
其中,d(c1,c2)表示该任一第二地址信息对应的经纬度c1和该第一地址信息对应的经纬度c2之间的距离,k为常数。
可选地,根据以下公式确定所述任一第二地址信息与第一地址信息之间的数字子串匹配分值S2:
S2=pN
其中,N为将该任一第二地址信息和该第一地址信息之间连续相同的最大数字子串个数,p为常数。
本申请实施例提供一种基于地址信息的账户映射装置,包括:
提取模块,用于从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息;
查找模块,用于针对所述提取模块提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息;
映射模块,用于在所述查找模块查找到与该第一地址信息匹配的第二地址信息后,建立该第一地址信息所属的第一账户信息,和所述查找模块查找到的第二地址信息所属的第二账户信息之间的映射关系。
可见,本申请实施例通过账户信息中包含的地址信息来建立不同账户体系的账户信息之间的映射关系,通过该映射关系,可以基于用户在第一服务方处注册的账户信息定位到用户在第二服务方处的账户信息,从而可以通过第一服务方提供的窗口来完成与第二服务方相关的业务处理。
附图说明
图1为本申请实施例一提供的基于地址信息的账户映射方法流程图;
图2为本申请实施例二提供的基于地址信息的账户映射方法流程图;
图3为经纬度散点图;
图4为确定第二地址信息候选集合的示意图;
图5为本申请实施例三提供的基于地址信息的账户映射方法流程图;
图6为与图5对应的地址匹配框架示意图;
图7为本申请实施例提供的基于地址信息的账户映射装置结构示意图。
具体实施方式
本申请实施例中,从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息;针对提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息;在查找到与该第一地址信息匹配的第二地址信息后,建立该第一地址信息所属的第一账户信息,和查找到的该第二地址信息所属的第二账户信息之间的映射关系。可见,本申请实施例通过账户信息中包含的地址信息来建立不同账户体系的账户信息之间的映射关系,通过该映射关系,可以基于用户在第一服务方处注册的账户信息定位到用户在第二服务方处的账户信息,从而可以通过第一服务方提供的窗口来完成与第二服务方相关的业务处理。比如,当第一服务方为应用服务方,第二服务方为生活缴费(水费、电费、煤气费等)的收费服务方时,可以通过第一服务方提供的应用软件来为第二服务方提供的收费项目进行缴费。
下面结合说明书附图对本申请实施例作进一步详细描述。
实施例一
如图1所示,为本申请实施例一提供的基于地址信息的账户映射方法流程图,包括以下步骤:
S101:从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息。
本申请实施例的执行主体可以是第一服务方的服务器。第一服务方可以是为用户提供应用服务的服务方,第一服务方的第一账户信息中可以包含用户注册的账号、及用户注册或使用应用服务时填写的第一地址信息,比如收货地址等。
在具体实施中,第二服务方可以将各个用户的第二账户信息提供给第一服务方。这里的第二账户信息中包括用户的账号(比如缴费户号)和第二地址信息等。
S102:针对提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息。
该步骤中,为各个第一账户信息中的第一地址信息,查找匹配的第二地址信息。这里,第一地址信息与第二地址信息匹配是指第一地址信息和第二地址信息所指向的地址是一致的。第一地址信息和第二地址信息所指向的地址一致可以包括第一地址信息和第二地址信息相同的情况,也可以包括二者虽然表现形式不同,但所指向的地址实质为同一地址的情况,基于第二种情况存在的可能性较大,本申请实施例二中给出了具体如何查找与第一地址信息匹配的第二地址信息的实施方式,详见后续实施例二的描述。
S103:在查找到与该第一地址信息匹配的第二地址信息后,建立该第一地址信息所属的第一账户信息,和查找到的该第二地址信息所属的第二账户信息之间的映射关系。
这里,通过查找到的与每个第一地址信息匹配的第二地址信息后,就可以通过地址信息建立起两个账户体系之间的映射关系了。也即,在本申请实施例中,认为地址信息一致的两个账户属于同一用户。
对上述方法的应用:
当接收到用户触发的与第二账户信息相关的业务处理请求后(比如这里的业务处理请求为生活缴费请求,相应地,第二账户信息为生活缴费账户信息,不过这里假设用户并没有提供第二账户信息,只是触发了生活缴费请求),根据建立的映射关系及该用户的第一账户信息,确定与该第一账户信息对应的第二账户信息,并针对查找到的第二账户信息执行所述业务处理请求。
实施例二
由于在不同账户体系中,对同一地址进行描述的方式、内容可能不同、描述的详细程度也可能不同等,在进行地址匹配时,若只有当第一地址信息和第二地址信息完全相同时,才认为二者匹配,那么将会导致地址信息的匹配成功率非常低,基于此,本申请实施例二给出了进行地址匹配的优选实施方式。
如图2所示,为本申请实施例二提供的基于地址信息的账户映射方法流程图,包括以下步骤:
S201:从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息,并针对提取的每个第一地址信息,执行下述S202~S204。
S202:根据该第一地址信息对应的地址特征信息,以及所述各个第二地址信息分别对应的地址特征信息,确定出与该第一地址信息匹配的第二地址信息候选集合;其中,所述第二地址信息候选集合中的每个第二地址信息与该第一地址信息之间满足预设的地址特征匹配条件。
在具体实施过程中,由于地址信息很可能是由用户自己手工输入的,不同的用户的输入习惯不同,对全角拼音、字符、繁体字、和特殊符号等的使用习惯不同给地址匹配带来了很大困难,因此在进行地址匹配之前,可以先将这些干扰去除,也即对地址信息进行格式上的预处理。比如,如下表一所示,为列举的几种预处理类型。
预处理类型 |
示例 |
全角转半角 |
“【”转为“[” |
中文数字转阿拉伯数字 |
“一号楼”转为“1号楼” |
繁体转简体 |
“一號樓”转为“一号楼” |
英文大写转小写 |
“A区”转为“a区” |
特殊符号替换 |
“III号”转为“3号” |
表一
在对各个第一地址信息和第二地址信息进行预处理之后,对各个第一地址信息和第二地址信息进行解析,得到各个第一地址信息和第二地址信息分别对应的地址特征信息。这里的地址特征信息可以包括经纬度信息、兴趣点POI信息和数字子串信息(比如说路号、楼号、楼层和房号等被看作是数字子串信息)中的一种或多种,每个第一地址信息或第二地址信息可能具有一个或多个数字子串,每个数字子串对应地址的一个位置范围,同一地址的不同数字子串对应该地址的不同位置范围,比如路号、楼号对应不同的位置范围。
在具体实施中,可以通过查询存储有地址信息与经纬度的映射关系的经纬度库,查找到所述第一地址信息和第二地址信息对应的经纬度信息。可以根据预设的对应POI信息的关键字信息(比如基于关键字“路”,提取出POI信息:天目山路256号、万塘路18号),从所述第一地址信息和第二地址信息中提取出POI信息。另外,根据预设的数字子串匹配模式(比如依次匹配出路号、楼号、楼层、房号),提取出所述数字子串信息。
以第一地址信息为“浙江省杭州市天目山路256号MM大楼2楼”,第二地址信息为“浙江省杭州市万塘路18号MM大楼2楼”为例;对第一地址信息进行解析,得到POI信息为天目山路256号,经纬度为(30.122、102.589),采用模糊匹配抽取出路号:256号、楼号:无、楼层:2楼、房号:无,该第一地址信息的数字子串信息即为:256*2*,其中“*”表示其标识的位置范围没有对应的数字子串;对第二地址信息进行解析,得到POI信息为万塘路18号,经纬度为(30.121、102.583),采用模糊匹配抽取出路号:18号、楼号:无、楼层:2楼、房号:无,该第二地址信息的数字子串信息即为256*2*。
在从各个第一地址信息和第二地址信息中解析得到上述地址特征信息后,针对每个第一地址信息,可以根据预设的地址特征匹配条件,查找与该第一地址信息之间满足预设的地址特征匹配条件的至少一个第二地址信息,组成第二地址信息候选集合。第二地址信息候选集合中的任一第二地址信息与该第一地址信息之间满足的所述预设的地址特征匹配条件包括以下三个条件中的一种或多种:
条件一:该任一第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值;
条件二:该任一第二地址信息与该第一地址信息分别对应的POI信息相同;
条件三:该任一第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值。
针对上述条件一,分别对第一地址信息解析得到第一地址信息对应的经纬度,对第二地址信息解析得到第二地址信息对应的经纬度,这里,通过地址信息得到经纬度可以是基于已有的地图应用来实现的。
在具体实施过程中,为了提高查找效率,可以采用k-d树的方式来进行查找,由于本申请实施例需要基于经纬度点来进行查找,因此可以采用2维k-d树(即2-d树)。如图3所示,为经纬度散点图,每一个圆点表示一个地址信息对应的经纬度点。如果采用遍历的方式,依次计算提取的每一个第二地址信息对应的经纬度和待匹配的第一地址信息对应的经纬度之间的距离,就会浪费很多计算资源,采用2-d树搜索方式,可以做到只选择与该第一地址信息对应的经纬度距离较近的第二地址信息的经纬度(对应虚线框中的点)进行计算,这样可以节省大量的计算资源。
针对上述条件二,可以从第一地址信息和第二地址信息中分别提取出POI信息,若分别提取的POI信息相同,则认为该任一第二地址信息与该第一地址信息分别对应的POI信息相同;但是,由于同一地址通常存在多种不同的描述方式,当两个账户体系对同一地址采用不同的描述方式进行描述时,从对应同一地址的第一地址信息和第二地址信息中提取出的POI信息就可能存在不同。
基于此,在S201之后,可以通过查询存储的门址库,将提取的各个第一地址信息和各个第二地址信息中的POI信息映射为所述门址库中的标准化POI信息;
然后,在S202中,根据以下步骤确定所述任一第二地址信息与第一地址信息分别对应的POI信息相同:
当该任一第二地址信息映射的所述门址库中的标准化POI信息与该第一地址信息映射的所述门址库中的标准化POI信息相同时,确定所述任一第二地址信息与第一地址信息分别对应的POI信息相同。
在该方式下,对各个第一地址信息和第二地址信息统一采用门址库中规定的描述方式进行描述,在统一描述方式后,再判断属于不同账户体系中的第一地址信息和第二地址信息的POI信息是否一致,这样可以提高对POI信息的匹配成功率。比如,在上述举例中,对第一地址信息进行解析得到的POI信息为天目山路256号,对第二地址信息进行解析得到的POI信息为万塘路18号,通过查询门址库,确认天目山路256号标准化后为黄龙时代广场,万塘路18号标准化后也为黄龙时代广场,因此可以认为该第一地址信息和第二地址信息分别对应的POI信息相同。
针对上述条件三,可以利用正则表达式从预处理后的各个第一地址信息和第二地址信息中模糊匹配出路号、楼号、楼层和房号这些数字子串,当第一地址信息和第二地址信息在路号、楼号、楼层和房号这些数字子串中的至少N个按照顺序相等时,认为满足条件三,N即为所述设定个数阈值。
在具体实施过程中,可以基于上述任一条件来确定第二地址信息候选集合,也可以将上述条件一~三中的两个或三个进行组合来确定第二地址信息候选集合。
例如:将上述条件一和条件三进行组合:对于第一地址信息“四川省内江市东兴区汉安大道169号2幢2单元2号”,可以通过正则表达式模糊匹配出4个数字子串:169、2、2、2(这里,每个数字子串的定义可以是预先设置的,比如在这里,数字子串定义按照地理范围由大到小的顺序依次为路号、楼号、单元号、房号),同时,该第一地址信息对应的经纬度为(29.602631、105.071571)。假设设置的设定距离阈值为3公里,则可以以经纬度(29.602631、105.071571)对应的点为中心,以半径为3公里寻找归入第二地址信息候选集合中的第二地址信息,发现只有3个,如图4所示,它们的数字子串分别为:168、2;169、2、2;168、3,其中数字子串169、2、2和169、2、2、2的相同数字子串(即公共数字串)个数为3,大于设定个数阈值2,因此只有数字子串169、2、2对应的第二地址信息才是可以归入第二地址信息候选集合中的第二地址信息。如果再结合条件二来确定第二地址信息候选集合,则归入第二地址信息候选集合中的第二地址信息还满足:其对应的门址库中的标准化POI信息与第一地址信息对应的门址库中的标准化POI信息相同,比如这里归入第二地址信息候选集合中的第二地址信息对应的门址库中的标准化POI信息为“四川省内江市东兴区汉安大道169号”,与第一地址信息对应的门址库中的标准化POI信息相同。
S203:从确定的所述第二地址信息候选集合中选择一个与该第一地址信息匹配的第二地址信息。
在具体实施过程中,当所述第二地址信息候选集合中只有一个第二地址信息时,可以将该第二地址信息作为最终选择的第二地址信息;若所述第二地址信息候选集合中存在多个第二地址信息,一种选择方式是:可以将确定的第二地址信息候选集合呈现给用户,由用户从第二地址信息候选集合中选择一个最匹配的第二地址信息。另一种选择方式是:计算第二地址信息候选集合中的各个第二地址信息分别与第一地址信息之间的匹配分值,基于计算得到的匹配分值,选择匹配程度最高的第二地址信息,详见实施例三的描述。
S204:基于选择的与该第一地址信息匹配的第二地址信息,建立该第一地址信息所属的第一账户信息,和选择的该第二地址信息所属的第二账户信息之间的映射关系。
实施例三
如图5所示,为本申请实施例三提供的映射关系建立方法流程图,图6为与之对应的地址匹配框架示意图,包括以下步骤:
S501:从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息。
在该步骤之后,可以首先基于预设的预处理类型,对提取的所述第一地址信息及第二地址信息进行格式上的预处理,在消除地址匹配时的干扰后再执行下述步骤,比如全角转半角、中文数字转阿拉伯数字、繁体转简体、英文大写转小写等。
S502:从各个第一地址信息和第二地址信息中分别提取经纬度信息、兴趣点POI信息和数字子串信息,并针对提取的每个第一地址信息,执行下述S503~S508。
S503:针对每个第二地址信息,判断该第二地址信息与该第一地址信息分别对应的POI信息是否相同,若相同,则进入S504,若不同,则确定该第二地址信息不属于所述与该第一地址信息匹配的第二地址信息候选集合。
在执行该步骤时,可以首先将第一地址信息及第二地址信息中的POI信息通过门址库进行标准化,然后判断标准化后的PIO信息是否一致。
S504:当确定该第二地址信息与第一地址信息分别对应的POI信息相同后,基于该第二地址信息与第一地址信息各自的经纬度信息,确定该第二地址信息与该第一地址信息分别对应的经纬度之间的距离,以及基于该第二地址信息与第一地址信息各自的数字子串,确定该第二地址信息与该第一地址信息之间连续相同的数字子串个数的最大值。
S505:当该第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值、且该第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值时,将该第二地址信息归入与该第一地址信息匹配的第二地址信息候选集合中。
S506:根据该第一地址信息对应的地址特征信息,以及确定出的第二地址信息候选集合中的每个第二地址信息的地址特征信息,确定所述第二地址信息候选集合中的每个第二地址信息与该第一地址信息之间的匹配分值。
在具体实施过程中,针对所述第二地址信息候选集合中的每个第二地址信息,可以分别确定该第二地址信息与第一地址信息之间在每种地址特征下的匹配分值,然后将该第二地址信息与第一地址信息之间在不同种地址特征下的匹配分值相加,作为该第二地址信息与该第一地址信息之间的匹配分值。
比如,可以针对确定出的第二地址信息候选集合中的任一第二地址信息,根据该任一第二地址信息与该第一地址信息之间的经纬度匹配分值和经纬度匹配重要度、以及该任一第二地址信息与该第一地址信息之间的数字子串匹配分值和数字子串匹配重要度,确定该任一第二地址信息与该第一地址信息之间的匹配分值。
这里,可以根据公式S=β1S1+β2S2,来确定该任一第二地址信息与该第一地址信息之间的匹配分值S,这里,β1、β2分别为经纬度匹配重要度和数字子串匹配重要度,S1为经纬度匹配分值,S2为数字子串匹配分值。在实际实施中,可以根据经验设置β1、β2的取值,比如β1可以取值为0.3,β2可以取值为0.7。
可选地,可以根据以下公式确定所述任一第二地址信息与第一地址信息之间的经纬度匹配分值S1:
S1=ke-d(c1,c2)
其中,d(c1,c2)表示该任一第二地址信息对应的经纬度c1和该第一地址信息对应的经纬度c2之间的距离,k为常数。
可以根据以下公式确定所述任一第二地址信息与第一地址信息之间的数字子串匹配分值S2:
S2=pN
其中,N为将该任一第二地址信息和该第一地址信息之间连续相同的最大数字子串个数,p为常数。
S507:选取对应的匹配分值最高的第二地址信息作为与该第一地址信息匹配的第二地址信息。
S508:建立该第一地址信息所属的第一账户信息,和与该第一地址信息匹配的第二地址信息所属的第二账户信息之间的映射关系。
基于同一发明构思,本申请实施例中还提供了一种与映射关系建立方法对应的映射关系建立装置,由于该装置解决问题的原理与本申请实施例的映射关系建立方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。
如图7所示,为本申请实施例提供的基于地址信息的账户映射装置结构示意图,包括:
提取模块71,用于从第一服务方提供的多个第一账户信息中分别提取第一地址信息,以及从第二服务方提供的多个第二账户信息中分别提取第二地址信息;
查找模块72,用于针对所述提取模块71提取的每个第一地址信息,从提取的各个第二地址信息中,查找与该第一地址信息匹配的第二地址信息;
映射模块73,用于在所述查找模块72查找到与该第一地址信息匹配的第二地址信息后,建立该第一地址信息所属的第一账户信息,和所述查找模块查找到的第二地址信息所属的第二账户信息之间的映射关系。
可选地,所述查找模块72具体用于:
根据该第一地址信息对应的地址特征信息,以及所述各个第二地址信息分别对应的地址特征信息,确定出与该第一地址信息匹配的第二地址信息候选集合;其中,所述第二地址信息候选集合中的每个第二地址信息与该第一地址信息之间满足预设的地址特征匹配条件;从确定的所述第二地址信息候选集合中选择一个与该第一地址信息匹配的第二地址信息。
可选地,所述地址特征信息包括经纬度信息、兴趣点POI信息和数字子串信息中的一种或多种;
所述第二地址信息候选集合中的任一第二地址信息与该第一地址信息之间满足的所述预设的地址特征匹配条件包括以下条件中的一种或多种:
该任一第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值;
该任一第二地址信息与该第一地址信息分别对应的POI信息相同;
该任一第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值,其中,每个数字子串对应地址的一个位置范围,同一地址的不同数字子串对应该地址的不同位置范围。
可选地,所述查找模块72具体用于:
若所述地址特征信息包括经纬度信息,则通过查询存储有地址信息与经纬度的映射关系的经纬度库,查找到与提取的所述第一地址信息和第二地址信息对应的经纬度信息;
若所述地址特征信息包括POI信息,则根据预设的对应POI信息的关键字信息,从所述第一地址信息和第二地址信息中提取出POI信息;
若所述地址特征信息包括数字子串信息,则根据预设的数字子串匹配模式,从所述第一地址信息和第二地址信息中提取出所述数字子串信息。
可选地,所述查找模块72还用于:
当确定所述任一第二地址信息与第一地址信息中存在POI信息后,将所述所述任一第二地址信息与第一地址信息中的POI信息映射为所述门址库中的标准化POI信息;
当该任一第二地址信息映射的所述门址库中的标准化POI信息与该第一地址信息映射的所述门址库中的标准化POI信息相同时,确定所述任一第二地址信息与第一地址信息分别对应的POI信息相同。
可选地,所述提取模块71具体用于:
从提取的各个第一地址信息和第二地址信息中分别提取经纬度信息、兴趣点POI信息和数字子串信息;
所述查找模块72具体用于:
针对每个第二地址信息,判断该第二地址信息与该第一地址信息分别对应的POI信息是否相同;当确定该第二地址信息与第一地址信息分别对应的POI信息相同后,基于该第二地址信息与第一地址信息各自的经纬度信息,确定该第二地址信息与该第一地址信息分别对应的经纬度之间的距离,以及基于该第二地址信息与第一地址信息各自的数字子串信息,确定该第二地址信息与该第一地址信息之间连续相同的数字子串个数的最大值;当该第二地址信息与该第一地址信息分别对应的经纬度之间的距离小于设定距离阈值、且该第二地址信息和该第一地址信息之间连续相同的数字子串个数的最大值大于设定个数阈值时,将该第二地址信息归入与该第一地址信息匹配的第二地址信息候选集合中。
可选地,所述查找模块72具体用于:
针对确定出的第二地址信息候选集合中的任一第二地址信息,根据该任一第二地址信息与该第一地址信息之间的经纬度匹配分值和经纬度匹配重要度、以及该任一第二地址信息与该第一地址信息之间的数字子串匹配分值和数字子串匹配重要度,确定该任一第二地址信息与该第一地址信息之间的匹配分值;选取对应的匹配分值最高的第二地址信息作为与该第一地址信息匹配的第二地址信息。
可选地,所述查找模块72具体用于根据以下公式确定所述任一第二地址信息与第一地址信息之间的经纬度匹配分值S1:
S1=ke-d(c1,c2)
其中,d(c1,c2)表示该任一第二地址信息对应的经纬度c1和该第一地址信息对应的经纬度c2之间的距离,k为常数。
可选地,所述查找模块72具体用于根据以下公式确定所述任一第二地址信息与第一地址信息之间的数字子串匹配分值S2:
S2=pN
其中,N为将该任一第二地址信息和该第一地址信息之间连续相同的最大数字子串个数,p为常数。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。