CN104462059A - 商户地址信息识别方法和装置 - Google Patents

商户地址信息识别方法和装置 Download PDF

Info

Publication number
CN104462059A
CN104462059A CN201410719537.3A CN201410719537A CN104462059A CN 104462059 A CN104462059 A CN 104462059A CN 201410719537 A CN201410719537 A CN 201410719537A CN 104462059 A CN104462059 A CN 104462059A
Authority
CN
China
Prior art keywords
address
trade company
information
word set
weighted value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410719537.3A
Other languages
English (en)
Other versions
CN104462059B (zh
Inventor
王霏
龙凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Information Service (shanghai) Co Ltd
Original Assignee
China Unionpay Information Service (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Information Service (shanghai) Co Ltd filed Critical China Unionpay Information Service (shanghai) Co Ltd
Priority to CN201410719537.3A priority Critical patent/CN104462059B/zh
Publication of CN104462059A publication Critical patent/CN104462059A/zh
Application granted granted Critical
Publication of CN104462059B publication Critical patent/CN104462059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Character Discrimination (AREA)

Abstract

一种商户地址信息识别方法和装置,其中,方法包括:获取商户的商户信息,当所获取的商户信息中包含商户地址时,对商户地址进行切词,得到商户地址的地址词集;将商户地址的地址词集与预设的标准地址信息表中的地址信息进行匹配,并根据地址词集中词汇的完整程度,计算地址词集对应的权重值,标准地址信息表中的地址信息包含完整的行政级别信息以及对应的地名;当地址词集在标准地址信息表中存在至少两条地址信息时,选择商户地址信息为标准地址信息表中对应的权重值最高的地址信息。通过所述方法和装置,可以快速准确实现对商户地址信息的识别。

Description

商户地址信息识别方法和装置
技术领域
本发明涉及信息识别技术领域,尤其涉及一种商户地址信息识别方法和装置。
背景技术
由于具有交易安全以及方便快捷等优点,刷卡消费已经成为越来越多人的消费习惯。着眼于消费者的这种消费心理,越来越多的商户加入到了支持刷卡消费的行列中,从而拓宽了刷卡支付的领域,也进一步促进了刷卡消费。
为了实现支持消费者的刷卡消费,商户需要向相关机构如银行等提出申请,并向相关机构如银行等提供相应的注册信息,例如商户所在地的归属地等信息。但是在实际应用过程中,会存在商户注册虚假归属地或错误归属地的情况。因此需要对这些错误信息进行及时甄别,以有效管理商户信息。
然而目前在收录商户信息后,需要通过人工重复审批的方式进行处理。但是,采用人工审批方式,即使耗费巨大的人力和物力,也难以对所有商户进行有效识别,因此仅能做抽样检查核对,难以及时发现商户归属地信息中的错误。
发明内容
本发明实施例解决的问题是如何快速准确实现对商户地址信息的识别。
为解决上述问题,本发明实施例提供一种商户地址信息识别方法,包括:获取商户的商户信息,当所获取的商户信息中包含商户地址时,对所述商户地址进行切词,得到所述商户地址的地址词集;将所述商户地址的地址词集与预设的标准地址信息表中的地址信息进行匹配,并根据所述地址词集中词汇的完整程度,计算所述地址词集对应的权重值,所述标准地址信息表中的地址信息包含完整的行政级别信息以及对应的地名;当所述地址词集在所述标准地址信息表中存在至少两条地址信息时,选择所述商户地址信息为所述标准地址信息表中对应的权重值最高的地址信息。
可选的,所述计算所述地址词集的权重值包括:当所述地址词集中的词汇包含地名及对应的行政级别信息且与所述标准地址表完全匹配时,将所述地址词集中的词汇的权重值设为完整权重值;当所述地址词集中的词汇不包含行政级别信息时,所述地址词集中的词汇权重值与所述地址词集在所述标准地址信息表中地址信息的行政级别相关,且低于所述完整权重值。
可选的,当所述地址词集中的词汇不包含行政级别信息时,所述地址词集的权重值随着地址词集在所述标准地址信息表中所处的行政级别的降低而递减。
可选的,当所述地址词集在所述标准地址信息表中存在至少两条地址信息时,通过计算在所述标准信息表中具有相同名称的地址的权重值;其中,所述Si为所述地址词集中第i个词汇的权重值;所述Sum为所述标准地址信息表中与所述第i个词汇具有相同名称的地址的权重值之和。
可选的,所述商户地址信息识别方法还包括:当所述地址词集中包含所述标准地址信息表中未包含的地址信息时,将所述地址信息加入所述标准地址信息表中。
可选的,所述商户地址信息识别方法还包括:根据交易卡的交易记录信息,对商户进行分类,形成商户商圈;当获取到的商户的商户信息中未包含商户地址时,根据所述商户所处的商户商圈,设置所述商户的商户地址为所述商户商圈中占多数的商户地址。
可选的,所述根据交易卡的交易记录信息,对商户进行分类,形成商户商圈,包括:获取在预设时间内在任意两家商户消费过的交易卡的数量并统计所述交易卡的数量占所有交易卡数量的百分比;当所述百分比大于预设值时,将对应的两家商户作为同一类,作为一个商户商圈。
为了解决上述的技术问题,本发明实施例还公开了一种商户地址信息识别装置,包括:切词单元,用于获取商户的商户信息,当所获取的商户信息中包含商户地址时,对所述商户地址进行切词,得到所述商户地址的地址词集;计算单元,用于将所述商户地址的地址词集与预设的标准地址信息表中的地址信息进行匹配,并根据所述地址词集中词汇的完整程度,计算所述地址词集对应的权重值,所述标准地址信息表中的地址信息包含完整的行政级别信息以及对应的地名;选择单元,用于当所述地址词集在所述标准地址信息表中存在至少两条地址信息时,选择所述商户地址信息为所述标准地址信息表中对应的权重值最高的地址信息。
可选的,所述计算单元用于当所述地址词集中的词汇包含地名及对应的行政级别信息且与所述标准地址表完全匹配时,将所述地址词集中的词汇的权重值设为完整权重值;且用于当所述地址词集中的词汇不包含行政级别信息时,将所述地址词集中的词汇权重值与所述地址词集在所述标准地址信息表中地址信息的行政级别相关,且低于所述完整权重值。
可选的,所述计算单元,用于当所述地址词集中的词汇不包含行政级别信息时,将所述地址词集的权重值设置为随着地址词集在所述标准地址信息表中所处的行政级别的降低而递减。
可选的,所述选择单元用于通过计算在所述标准信息表中具有相同名称的地址的权重值;其中,所述Si为所述地址词集中第i个词汇的权重值;所述Sum为所述标准地址信息表中与所述第i个词汇具有相同名称的地址的权重值之和。
可选的,所述商户地址信息识别装置,还包括:分类单元,用于根据交易卡的交易记录信息,对商户进行分类,形成商户商圈;设置单元,用于当获取到的商户的商户信息中未包含商户地址时,根据所述商户所处的商户商圈,设置所述商户的商户地址为所述商户商圈中占多数的商户地址。
可选的,所述分类单元包括:获取子单元,用于获取在预设时间内在任意两家商户消费过的交易卡的数量;统计子单元,用于统计所述交易卡的数量占所有交易卡数量的百分比;归类单元,用于当所述百分比大于预设值时,将对应的两家商户作为同一类,作为一个商户商圈。
与现有技术相比,本发明实施例的技术方案具有以下优点:
通过语义识别对商户信息进行切词操作,得到相应的地址词集。当对比标准地址信息表后检测得到多条地址冲突时,通过计算所述地址词集对应所述标准地址信息表的权重值,并将所述权重值最大的地址作为商户地址,实现了商户地址信息识别的自动化和智能化,通过实现自动化和智能化识别,从而可以提高检测效率,因而可以实现更大的覆盖范围,且可以避免人为错误,因而具有更高的准确率。
附图说明
图1是本发明实施例的一种商户地址信息识别方法的流程图;
图2是本发明实施例的另一种商户地址信息识别方法的流程图;
图3是本发明实施例的对商户进行分类的方法的流程图;
图4是本发明实施例一种商户地址信息识别装置的结构示意图。
具体实施方式
为了实现支持消费者的刷卡消费,商户需要向相关机构如银行等提出申请,并提供相应的注册信息,例如商户所在地的归属地等信息。但是在实际应用过程中,会存在商户注册虚假归属地或错误归属地的情况。因此需要对这些错误信息进行及时甄别,以有效管理商户信息。
然而目前在收录商户信息后,需要通过人工重复审批的方式进行处理。但是,采用人工审批方式,即使耗费巨大的人力和物力,也难以对所有商户进行有效识别,因此仅能做抽样检查核对,难以及时发现商户归属地信息中的错误。
本发明实施例通过语义识别对商户信息进行切词操作,得到相应的地址词集。当对比标准地址信息表后检测得到多条地址冲突时,通过计算所述地址词集对应所述标准地址信息表的权重值,并将所述权重值最大的地址作为商户地址,实现了商户地址信息甄别和更新的自动化和智能化,并且可以保证较高的准确率和商户全覆盖,从而提高了检测效率。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
本发明实施例提供了一种商户地址信息识别方法,参照图1,以下通过具体步骤进行详细说明。
步骤S101,获取商户的商户信息,当所获取的商户信息中包含商户地址时,对所述商户地址进行切词,得到所述商户地址的地址词集。
在具体实施中,可以是通过预设的语言字典,基于自然语义对所述商户地址进行切词操作,从而将商户信息中的商户地址分割成一个或多个地理词汇,形成商户地址的地址词集。
步骤S102,将所述商户地址的地址词集与预设的标准地址信息表中的地址信息进行匹配,并根据所述地址词集中词汇的完整程度,计算所述地址词集对应的权重值。
所述标准地址信息表可以包含完整的行政级别信息,并按照行政级别的顺序对对应的地名进行排序,具体向下可以精确到街道/镇一级,例如,所述标准地址信息表中所包含的一条地址词条信息可以是:安徽省、安庆市、枞阳县、陈瑶湖镇。可理解的是,所述标准地址信息表中的地址词条信息也可以根据应用的需要设置得更为具体,而不局限于街道/镇一级。在具体实施中,所述标准地址信息表可以是基于互联网的数据挖掘得到。
在具体实施中,在具体对地址词集进行计算时,可以根据地址词集中的词汇的信息完整度,计算商户地址的地址词集中词汇的权重值,从而得到所述商户地址的地址词集的权重值。
在上述的具体实施中,当所述地址词集中的词汇包含完整信息且与所述标准地址表完全匹配时,将所述地址词集中的词汇的权重值设为完整权重值。
例如,商户给出的地址信息为“安徽省安庆市枞阳县陈瑶湖镇”,经过步骤S101的切词操作可以得到地址词集<安徽省、安庆市、枞阳县、陈瑶湖镇>。在计算该地址信息的权重值时,将上述地址词集中的地址词汇分别与所述标准地址信息表中的信息一一进行匹配。由于安徽省、安庆市、枞阳县、陈瑶湖镇均为完全信息,且能够在所述标准地址信息表中匹配到相应的内容,因此给予每个地址词汇完整权重值,例如可以是1。由于安徽省、安庆市、枞阳县、陈瑶湖镇在所述标准地址信息表中具有唯一可确定的上下级隶属关系,因此在计算该词集总权重值时,将上级的权重值累加到下级的权重值中,从而得到所述地址词集的总权重值为4。
在具体应用中,还可以根据需要相应设置所述完整权重值进行相应。例如,根据行政级别的顺序不同,设置不同的完整权重值。例如,将省级的完整权重值设为2、市级的完整权重值设置为1。
在上述的具体实施中,当所述地址词集中的词汇不包含行政级别信息时,所述地址词集中的词汇权重值与所述地址词集在所述标准地址信息表中地址信息的行政级别相关。
由于行政级别越低,地名出现重复的可能性会相应越高,例如,在不同省市中,可能出现具有相同地名的镇,因此所述地址词集的权重值可以随着地址词集在所述标准地址信息表中所处的行政级别的降低而递减,且低于所述完整权重值。
例如,商户给出的地址信息为“安徽安庆枞阳陈瑶湖”,经过步骤S101的切词操作可以得到地址词集<安徽、安庆、枞阳、陈瑶湖>。此时,所述地址词集中的词汇仅包含地名信息,不包含行政级别信息。当计算所述地址词集中词汇的权重值时,经过匹配发现所述词汇仅能实现部分匹配,因此将所述词汇的权重值设为部分分支,并且根据所述词汇的匹配位置,设置不同的权重值,例如,安徽的权重值可以是0.5,安庆的权重值可以是0.4,枞阳的权重值可以是0.3,陈瑶湖的权重值可以是0.2,从而得到所述地址词集的总权重值为1.4。
在具体实施中,可能出现经过匹配后,所述地址词集中包含所述标准地址信息表中未包含的地址信息的情况,例如,所述标准地址信息表中预设的最低行政级别是街道或者镇一级,而所述地址词集中的地址信息是该最低行政级别的下一级地址信息,如某大道,某路,即不包括在所述的标准地址信息表中。此时可以根据所述地址词集中地址信息在所述标准地址信息表中的匹配位置,将所述地址信息加入所述标准地址信息表中对应的词条中,例如,商户给出的商户地址是“浦东新区陆家嘴街道”,就可以将陆家嘴街道添加到浦东新区后,实现所述标准地址信息表的自学习扩充,得到新的标准地址信息表。
步骤S103,当所述地址词集在所述标准地址信息表中存在至少两条地址信息时,选择所述商户地址信息为所述标准地址信息表中对应的权重值最高的地址信息。
在具体实施中,当所述地址词集在所述标准地址信息表中,仅存在一条匹配的地址词条时,因此此时词集匹配到该词条的分数最高,选择所述商户地址信息为所述标准地址信息表中对应的权重值最高的地址信息。
在具体实施中,当所述地址词集在所述标准地址信息表中存在至少两条地址信息时,可以通过计算在所述标准信息表中具有相同名称的地址的权重值。
其中,所述Si为所述地址词集中第i个词汇的权重值;所述Sum为所述标准地址信息表中与所述第i个词汇具有相同名称的地址的权重值之和。
例如,商户提供的商户地址信息为“枞阳县陈瑶湖镇”,而在所述标准地址信息表中枞阳县和陈瑶湖镇非隶属关系,且陈瑶湖镇在两个不同的词条中均出现过,因此判定所述地址词集在所述标准地址信息表中存在地址冲突。
通过公式分别对“枞阳县”和“陈瑶湖镇”进行计算,可得枞阳县的权重值为而陈瑶湖镇的权重值为由此可得,枞阳县的权重值大于陈瑶湖镇的权重值,因此将地址词集匹配到所述标准地址信息表中“枞阳县”的地址词条,将该地址词条作为商户地址,从而实现了商户地址信息的识别和更正。
本发明实施例将商户提供的商户地址信息与预设的标准地址信息表进行对比并计算商户地址信息的权重值,通过选择具有最高权重值所对应的标准地址信息表中的地址,能够在保证准确率的基础上,极大提升检测效率,实现了对商户地址信息的全覆盖识别和检测。
为了解决上述的技术问题,本发明实施例还公开了另一种商户地址信息识别方法。与图1所示实施例的商户地址信息识别方法相比,本发明实施例的商户地址信息识别方法可以实现当商户提供的商户信息中未包含商户地址时,对商户地址的识别。具体来说,如图2所示,本发明实施例的商户地址信息识别方法在图1所示实施例的基础上,还可以包括:
步骤S201,根据交易卡的交易记录信息,对商户进行分类,形成商户商圈。
在具体实施中,参照图3,所述步骤201可以包括如下步骤:
步骤S2011,获取在预设时间内在任意两家商户消费过的交易卡的数量。
在具体实施中,可以是通过输入全量交易卡的流水数据,得到每张交易卡消费过的商户,并计算在预设时间,如1小时内,交易卡用户连续消费过的商户。最终经过统计计算,得到在所述预设时间内,在这些商户消费过的交易卡的总数。
步骤S2012,统计所述交易卡的数量占所有交易卡数量的百分比。
步骤S2013,当所述百分比大于预设值时,将对应的两家商户作为同一类,作为一个商户商圈。
当所述百分比大于预设值时,可以认为这两家商户距离较近,属于同一类,可以作为一个商户商圈。
在另一种具体实施中,也可以将所述交易卡的总数与预设数值进行比较。如果大于预设数值,则可认为这两家商户距离较近,属于同一类,可以作为一个商户商圈。
步骤S202,当获取到的商户的商户信息中未包含商户地址时,根据所述商户所处的商户商圈,设置所述商户的商户地址为所述商户商圈中占多数的商户地址。
有可能存在所述商户同一类的商户商圈中不同商户地址数量相同的情况。此时无法实现商户地址的更新,因此在具体实施中,可以跳过该商户的商户地址的识别检测。当完成对其他商户地址的识别检测后,此时商户商圈中不同商户地址各自的数量就会发生变化,即出现占多数的商户地址,从而可以实现对商户信息中商户地址的更新。
本发明实施例通过挖掘交易卡的交易记录信息,可以对商户商圈进行分类,从而实现了对未包含商户地址的商户信息的自动识别更新。
为了解决上述的技术问题,本发明实施例还公开了一种商户地址信息识别装置。如图4所示,所述商户地址信息识别装置40可以包括:
切词单元401,用于获取商户的商户信息,当所获取的商户信息中包含商户地址时,对所述商户地址进行切词,得到所述商户地址的地址词集;
计算单元402,用于将所述商户地址的地址词集与预设的标准地址信息表中的地址信息进行匹配,并根据所述地址词集中词汇的完整程度,计算所述地址词集对应的权重值,所述标准地址信息表中的地址信息包含完整的行政级别信息以及对应的地名;
选择单元403,用于当所述地址词集在所述标准地址信息表中存在至少两条地址信息时,选择所述商户地址信息为所述标准地址信息表中对应的权重值最高的地址信息。
在具体实施中,所述计算单元402用于当所述地址词集中的词汇包含完整信息且与所述标准地址表完全匹配时,将所述地址词集中的词汇的权重值设为完整权重值;以及用于当所述地址词集中的词汇不包含行政级别信息时,将所述地址词集中的词汇权重值设置为与所述地址词集在所述标准地址信息表中地址信息的行政级别相关,且低于所述完整权重值。
在具体实施中,所述计算单元402,还用于当所述地址词集中的词汇不包含行政级别信息时,将所述地址词集的权重值设置为随着地址词集在所述标准地址信息表中所处的行政级别的降低而递减。
在具体实施中,所述选择单元403可以包括:用于通过计算在所述标准信息表中具有相同名称的地址的权重值;
其中,所述Si为所述地址词集中第i个词汇的权重值;所述Sum为所述标准地址信息表中与所述第i个词汇具有相同名称的地址的权重值之和。
在具体实施中,所述商户地址信息识别装置40还可以包括:
分类单元404,用于根据交易卡的交易记录信息,对商户进行分类,形成商户商圈;
设置单元405,用于当获取到的商户的商户信息中未包含商户地址时,根据所述商户所处的商户商圈,设置所述商户的商户地址为所述商户商圈中占多数的商户地址。
在具体实施中,所述分类单元404可以包括:
获取子单元,用于获取在预设时间内在任意两家商户消费过的交易卡的数量;
统计子单元,用于统计所述交易卡的数量占所有交易卡数量的百分比;
归类子单元,用于当所述百分比大于预设值时,将对应的两家商户作为同一类,作为一个商户商圈。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (13)

1.一种商户地址信息识别方法,其特征在于,包括:
获取商户的商户信息,当所获取的商户信息中包含商户地址时,对所述商户地址进行切词,得到所述商户地址的地址词集;
将所述商户地址的地址词集与预设的标准地址信息表中的地址信息进行匹配,并根据所述地址词集中词汇的完整程度,计算所述地址词集对应的权重值,所述标准地址信息表中的地址信息包含完整的行政级别信息以及对应的地名;
当所述地址词集在所述标准地址信息表中存在至少两条地址信息时,选择所述商户地址信息为所述标准地址信息表中对应的权重值最高的地址信息。
2.如权利要求1所述的商户地址信息识别方法,其特征在于,所述计算所述地址词集的权重值包括:
当所述地址词集中的词汇包含地名及对应的行政级别信息且与所述标准地址表完全匹配时,将所述地址词集中的词汇的权重值设为完整权重值;
当所述地址词集中的词汇不包含行政级别信息时,所述地址词集中的词汇权重值与所述地址词集在所述标准地址信息表中地址信息的行政级别相关,且低于所述完整权重值。
3.如权利要求2所述的商户地址信息识别方法,其特征在于,当所述地址词集中的词汇不包含行政级别信息时,所述地址词集的权重值随着地址词集在所述标准地址信息表中所处的行政级别的降低而递减。
4.如权利要求1所述的商户地址信息识别方法,其特征在于,当所述地址词集在所述标准地址信息表中存在至少两条地址信息时,通过计算在所述标准信息表中具有相同名称的地址的权重值;
其中,所述Si为所述地址词集中第i个词汇的权重值;所述Sum为所述标准地址信息表中与所述第i个词汇具有相同名称的地址的权重值之和。
5.如权利要求1所述的商户地址信息识别方法,其特征在于,还包括:当所述地址词集中包含所述标准地址信息表中未包含的地址信息时,将所述地址信息加入所述标准地址信息表中。
6.如权利要求1所述的商户地址信息识别方法,其特征在于,还包括:
根据交易卡的交易记录信息,对商户进行分类,形成商户商圈;
当获取到的商户的商户信息中未包含商户地址时,根据所述商户所处的商户商圈,设置所述商户的商户地址为所述商户商圈中占多数的商户地址。
7.如权利要求6所述的商户地址信息识别方法,其特征在于,所述根据交易卡的交易记录信息,对商户进行分类,形成商户商圈,包括:
获取在预设时间内在任意两家商户消费过的交易卡的数量并统计所述交易卡的数量占所有交易卡数量的百分比;
当所述百分比大于预设值时,将对应的两家商户作为同一类,作为一个商户商圈。
8.一种商户地址信息识别装置,其特征在于,包括:
切词单元,用于获取商户的商户信息,当所获取的商户信息中包含商户地址时,对所述商户地址进行切词,得到所述商户地址的地址词集;
计算单元,用于将所述商户地址的地址词集与预设的标准地址信息表中的地址信息进行匹配,并根据所述地址词集中词汇的完整程度,计算所述地址词集对应的权重值,所述标准地址信息表中的地址信息包含完整的行政级别信息以及对应的地名;
选择单元,用于当所述地址词集在所述标准地址信息表中存在至少两条地址信息时,选择所述商户地址信息为所述标准地址信息表中对应的权重值最高的地址信息。
9.如权利要求8所述的商户地址信息识别装置,其特征在于,所述计算单元用于当所述地址词集中的词汇包含地名及对应的行政级别信息且与所述标准地址表完全匹配时,将所述地址词集中的词汇的权重值设为完整权重值;且用于当所述地址词集中的词汇不包含行政级别信息时,将所述地址词集中的词汇权重值与所述地址词集在所述标准地址信息表中地址信息的行政级别相关,且低于所述完整权重值。
10.如权利要求9所述的商户地址信息识别装置,其特征在于,所述计算单元,用于当所述地址词集中的词汇不包含行政级别信息时,将所述地址词集的权重值设置为随着地址词集在所述标准地址信息表中所处的行政级别的降低而递减。
11.如权利要求8所述的商户地址信息识别装置,其特征在于,所述选择单元用于通过计算在所述标准信息表中具有相同名称的地址的权重值;其中,所述Si为所述地址词集中第i个词汇的权重值;所述Sum为所述标准地址信息表中与所述第i个词汇具有相同名称的地址的权重值之和。
12.如权利要求8所述的商户地址信息识别装置,其特征在于,还包括:分类单元,用于根据交易卡的交易记录信息,对商户进行分类,形成商户商圈;
设置单元,用于当获取到的商户的商户信息中未包含商户地址时,根据所述商户所处的商户商圈,设置所述商户的商户地址为所述商户商圈中占多数的商户地址。
13.如权利要求12所述的商户地址信息识别装置,其特征在于,所述分类单元包括:
获取子单元,用于获取在预设时间内在任意两家商户消费过的交易卡的数量;
统计子单元,用于统计所述交易卡的数量占所有交易卡数量的百分比;归类单元,用于当所述百分比大于预设值时,将对应的两家商户作为同一类,作为一个商户商圈。
CN201410719537.3A 2014-12-01 2014-12-01 商户地址信息识别方法和装置 Active CN104462059B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410719537.3A CN104462059B (zh) 2014-12-01 2014-12-01 商户地址信息识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410719537.3A CN104462059B (zh) 2014-12-01 2014-12-01 商户地址信息识别方法和装置

Publications (2)

Publication Number Publication Date
CN104462059A true CN104462059A (zh) 2015-03-25
CN104462059B CN104462059B (zh) 2017-06-30

Family

ID=52908129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410719537.3A Active CN104462059B (zh) 2014-12-01 2014-12-01 商户地址信息识别方法和装置

Country Status (1)

Country Link
CN (1) CN104462059B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224610A (zh) * 2015-09-08 2016-01-06 方正国际软件有限公司 一种地址比较的方法及设备
CN105468742A (zh) * 2015-11-25 2016-04-06 小米科技有限责任公司 恶意订单识别方法及装置
CN106055635A (zh) * 2016-05-30 2016-10-26 深圳市华傲数据技术有限公司 地址信息查找方法及装置
CN106547770A (zh) * 2015-09-21 2017-03-29 阿里巴巴集团控股有限公司 一种基于用户地址信息的用户分类、用户识别方法及装置
WO2017063532A1 (zh) * 2015-10-14 2017-04-20 阿里巴巴集团控股有限公司 路由器地址类型的识别方法及装置
CN106951415A (zh) * 2017-04-01 2017-07-14 银联智策顾问(上海)有限公司 一种商户名称搜索方法和装置
WO2018040944A1 (zh) * 2016-08-31 2018-03-08 阿里巴巴集团控股有限公司 恶意地址/恶意订单的识别系统、方法及装置
CN109522335A (zh) * 2018-09-19 2019-03-26 北京明略软件系统有限公司 一种信息获取方法、装置及计算机可读存储介质
CN109635807A (zh) * 2018-10-16 2019-04-16 深圳壹账通智能科技有限公司 信息录入方法、装置、设备及计算机可读存储介质
CN109635047A (zh) * 2018-10-25 2019-04-16 口口相传(北京)网络技术有限公司 地理网格的信息处理方法、装置、设备及可读存储介质
TWI672024B (zh) * 2017-01-20 2019-09-11 香港商阿里巴巴集團服務有限公司 路由器地址類型的識別方法及裝置
CN110442617A (zh) * 2019-06-27 2019-11-12 华迪计算机集团有限公司 一种基于行政单元对统计数据进行动态处理的方法及系统
CN110633345A (zh) * 2019-08-16 2019-12-31 阿里巴巴集团控股有限公司 一种企业注册地址的识别方法及系统
CN110765280A (zh) * 2019-10-22 2020-02-07 京东数字科技控股有限公司 地址识别方法和装置
CN111080377A (zh) * 2019-12-31 2020-04-28 苏宁云计算有限公司 一种商圈数据的生成方法、系统及装置
CN111625732A (zh) * 2020-05-25 2020-09-04 鼎富智能科技有限公司 地址匹配方法及装置
CN112488748A (zh) * 2020-11-18 2021-03-12 银联智惠信息服务(上海)有限公司 数据标识匹配方法及装置、存储介质、计算设备
CN112783963A (zh) * 2021-03-17 2021-05-11 上海数喆数据科技有限公司 基于商圈划分的企业线下与线上多源数据整合方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163411A (ja) * 1998-11-27 2000-06-16 Canon Inc 住所地名入力支援装置、住所地名入力支援方法、及び記憶媒体
US6658430B1 (en) * 1999-12-23 2003-12-02 Pitney Bowes Inc. Method and system for reformatting a text file
CA2313496C (en) * 1999-07-09 2005-04-12 Brenda R. Higgins Method of standardizing address data
CN102142003A (zh) * 2010-07-30 2011-08-03 华为软件技术有限公司 兴趣点信息提供方法及装置
CN102169498A (zh) * 2011-04-14 2011-08-31 中国测绘科学研究院 一种地址模型的构建方法,以及地址匹配的方法和系统
CN102955833A (zh) * 2011-08-31 2013-03-06 深圳市华傲数据技术有限公司 一种通讯地址识别、标准化的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163411A (ja) * 1998-11-27 2000-06-16 Canon Inc 住所地名入力支援装置、住所地名入力支援方法、及び記憶媒体
CA2313496C (en) * 1999-07-09 2005-04-12 Brenda R. Higgins Method of standardizing address data
US6658430B1 (en) * 1999-12-23 2003-12-02 Pitney Bowes Inc. Method and system for reformatting a text file
CN102142003A (zh) * 2010-07-30 2011-08-03 华为软件技术有限公司 兴趣点信息提供方法及装置
CN102169498A (zh) * 2011-04-14 2011-08-31 中国测绘科学研究院 一种地址模型的构建方法,以及地址匹配的方法和系统
CN102955833A (zh) * 2011-08-31 2013-03-06 深圳市华傲数据技术有限公司 一种通讯地址识别、标准化的方法

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224610A (zh) * 2015-09-08 2016-01-06 方正国际软件有限公司 一种地址比较的方法及设备
CN106547770A (zh) * 2015-09-21 2017-03-29 阿里巴巴集团控股有限公司 一种基于用户地址信息的用户分类、用户识别方法及装置
WO2017063532A1 (zh) * 2015-10-14 2017-04-20 阿里巴巴集团控股有限公司 路由器地址类型的识别方法及装置
CN106603733A (zh) * 2015-10-14 2017-04-26 阿里巴巴集团控股有限公司 路由器地址类型的识别方法及装置
US10652209B2 (en) 2015-10-14 2020-05-12 Alibaba Group Holding Limited Router address type identification method and apparatus
CN106603733B (zh) * 2015-10-14 2019-12-27 阿里巴巴集团控股有限公司 路由器地址类型的识别方法及装置
CN105468742A (zh) * 2015-11-25 2016-04-06 小米科技有限责任公司 恶意订单识别方法及装置
CN105468742B (zh) * 2015-11-25 2018-11-20 小米科技有限责任公司 恶意订单识别方法及装置
CN106055635B (zh) * 2016-05-30 2019-11-19 深圳市华傲数据技术有限公司 地址信息查找方法及装置
CN106055635A (zh) * 2016-05-30 2016-10-26 深圳市华傲数据技术有限公司 地址信息查找方法及装置
WO2018040944A1 (zh) * 2016-08-31 2018-03-08 阿里巴巴集团控股有限公司 恶意地址/恶意订单的识别系统、方法及装置
CN107798571B (zh) * 2016-08-31 2019-08-30 阿里巴巴集团控股有限公司 恶意地址/恶意订单的识别系统、方法及装置
CN107798571A (zh) * 2016-08-31 2018-03-13 阿里巴巴集团控股有限公司 恶意地址/恶意订单的识别系统、方法及装置
TWI672024B (zh) * 2017-01-20 2019-09-11 香港商阿里巴巴集團服務有限公司 路由器地址類型的識別方法及裝置
CN106951415A (zh) * 2017-04-01 2017-07-14 银联智策顾问(上海)有限公司 一种商户名称搜索方法和装置
CN109522335B (zh) * 2018-09-19 2021-10-22 北京明略软件系统有限公司 一种信息获取方法、装置及计算机可读存储介质
CN109522335A (zh) * 2018-09-19 2019-03-26 北京明略软件系统有限公司 一种信息获取方法、装置及计算机可读存储介质
CN109635807A (zh) * 2018-10-16 2019-04-16 深圳壹账通智能科技有限公司 信息录入方法、装置、设备及计算机可读存储介质
CN109635047A (zh) * 2018-10-25 2019-04-16 口口相传(北京)网络技术有限公司 地理网格的信息处理方法、装置、设备及可读存储介质
CN109635047B (zh) * 2018-10-25 2020-06-02 口口相传(北京)网络技术有限公司 地理网格的信息处理方法、装置、设备及可读存储介质
CN110442617A (zh) * 2019-06-27 2019-11-12 华迪计算机集团有限公司 一种基于行政单元对统计数据进行动态处理的方法及系统
CN110633345A (zh) * 2019-08-16 2019-12-31 阿里巴巴集团控股有限公司 一种企业注册地址的识别方法及系统
CN110633345B (zh) * 2019-08-16 2023-04-11 创新先进技术有限公司 一种企业注册地址的识别方法及系统
CN110765280A (zh) * 2019-10-22 2020-02-07 京东数字科技控股有限公司 地址识别方法和装置
CN111080377A (zh) * 2019-12-31 2020-04-28 苏宁云计算有限公司 一种商圈数据的生成方法、系统及装置
CN111625732A (zh) * 2020-05-25 2020-09-04 鼎富智能科技有限公司 地址匹配方法及装置
CN111625732B (zh) * 2020-05-25 2023-06-23 鼎富智能科技有限公司 地址匹配方法及装置
CN112488748A (zh) * 2020-11-18 2021-03-12 银联智惠信息服务(上海)有限公司 数据标识匹配方法及装置、存储介质、计算设备
CN112488748B (zh) * 2020-11-18 2024-01-05 银联智惠信息服务(上海)有限公司 数据标识匹配方法及装置、存储介质、计算设备
CN112783963A (zh) * 2021-03-17 2021-05-11 上海数喆数据科技有限公司 基于商圈划分的企业线下与线上多源数据整合方法及装置

Also Published As

Publication number Publication date
CN104462059B (zh) 2017-06-30

Similar Documents

Publication Publication Date Title
CN104462059A (zh) 商户地址信息识别方法和装置
Schulz et al. A multi-indicator approach for geolocalization of tweets
Guerrero et al. Complicating neoliberalization and decentralization: The non-linear experience of Colombian water supply, 1909–2012
CN106202028B (zh) 一种地址信息识别方法及装置
Libertun de Duren et al. Growing resources for growing cities: Density and the cost of municipal public services in Latin America
US11966424B2 (en) Method and apparatus for dividing region, storage medium, and electronic device
Oyekale Determinants of households’ involvement in waste separation and collection for recycling in South Africa
PH12013000132B1 (en) System and method for address matching
US20150142780A1 (en) Apparatus and method for analyzing event time-space correlation in social web media
CN107463711A (zh) 一种数据的标签匹配方法及装置
Rosni et al. A review of literature on urban sprawl: Assessment of factors and causes
Hutchings et al. A systematic assessment of the pro-poor reach of development bank investments in urban sanitation
World Bank Doing business 2010: Reforming through difficult times
CN106250502A (zh) 确定相似职位的方法及装置
Scott et al. House arrest: the effects of underwater and low-equity mortgages on small business failure and mobility
Lima et al. Is there long memory in financial time series?
Surminski et al. Policy indexes as tools for decision makers: the case of climate policy
Keçi Public private partnership for infrastructure projects: mapping the key risks
Qin et al. Too non-traditional to fail? Determinants of systemic risk for BRICs banks
Guy Development pressure and retail planning: a study of 20-year change in Cardiff, UK
Cabaleiro Casal et al. Is the tax collection effort an indicator of the financial condition of Spanish municipalities?
McCann et al. Quantifying climate change‐relevant humanitarian programming and spending across five countries with high vulnerability to disaster
Gowela et al. Service quality gap analysis to improve public water service delivery in Lilongwe city: tapping customer’s voice
Van Zyl et al. Statistical characterisation and estimation of non-domestic water demand
CN109872024A (zh) 信用评估指标处理方法以及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant