CN116233754A - 经营地址的识别方法、装置、电子设备及存储介质 - Google Patents
经营地址的识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116233754A CN116233754A CN202211625342.3A CN202211625342A CN116233754A CN 116233754 A CN116233754 A CN 116233754A CN 202211625342 A CN202211625342 A CN 202211625342A CN 116233754 A CN116233754 A CN 116233754A
- Authority
- CN
- China
- Prior art keywords
- address
- base station
- target place
- communication
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Small-Scale Networks (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明实施例提供了一种经营地址的识别方法、装置、电子设备及存储介质,首先获取目标场所的基础地址、地图地址以及通讯基站数据,其中,通讯基站数据包括目标场所关联的所有通讯号码对应的往来通讯数据,接着根据通讯基站数据对目标场所进行基站定位,获得目标场所对应的基站地址,然后根据基础地址、地图地址以及基站地址对目标场所进行地址识别,获得目标场所对应的实际经营地址,从而通过整合包括通信大数据在内的多源地址信息,并通过基站地址实现对于地址的二次验证,从而可以及时有效地识别出目标场所的实际经营地址,且使得最终输出的地址具有更高的可信度以及精准度。
Description
技术领域
本发明涉及大数据分析技术领域,特别是涉及一种经营地址的识别方法、一种经营地址的识别装置、一种电子设备以及一种计算机可读存储介质。
背景技术
众所周知,企业在经营的时候,需在其登记注册的住所地址从事经营相关活动,但实际上许多企业出于多方考虑,其注册地与实际办公地址往往不一致,即大量企业存在注册地址与实际经营地址不符的情况,如企业最初注册在开发区或者工业园区内,但是实际业务并不适合在园区内经营,于是又选择在其他地方从事经营活动,从而导致注册地与实际办公地址不符,再比如,许多小微企业因业务拓展、地址拆迁、就近办公等因素从而使得注册地址与实际经营地址不一致。
目前而言,在对企业地址进行定位识别时,往往基于注册地址开展,从而一旦注册地址有误,则容易造成无法准确定位企业地址,不能及时联系到对应企业的问题,部分企业的注册地址与实际经营地址甚至出现跨区域的现象,同时,企业本身也会因地址不符感到困扰,容易出现无法有效增加企业曝光率、客户无法对企业进行精准定位、企业与客户之间的往来减少等问题。
发明内容
本发明实施例是提供一种经营地址的识别方法、装置、电子设备以及计算机可读存储介质,以解决或部分解决因无法及时有效地识别出目标场所对应的实际经营地址,导致地址识别准确性低下的问题。
本发明实施例公开了一种经营地址的识别方法,所述方法包括:
获取目标场所的基础地址、地图地址以及通讯基站数据,所述通讯基站数据包括所述目标场所关联的所有通讯号码对应的往来通讯数据;
根据所述通讯基站数据对所述目标场所进行基站定位,获得所述目标场所对应的基站地址;
根据所述基础地址、所述地图地址以及所述基站地址对所述目标场所进行地址识别,获得所述目标场所对应的实际经营地址。
可选地,所述获取目标场所的基础地址、地图地址以及通讯基站数据,包括:
获取地址信息数据库,从所述地址信息数据库确定与目标场所对应的基础地址,所述地址信息数据库用于存储各个场所的基础地址;
根据所述目标场所的名称获取对应的地理信息,并对所述地理信息进行地址转化处理,获得对应的地图地址;
获取所述目标场所对应的通讯基站数据。
可选地,所述根据所述目标场所的名称获取对应的地理信息,并对所述地理信息进行地址转化处理,获得对应的地图地址,包括:
根据所述目标场所的名称从预设地图调用接口获取所述目标场所的地理信息;
对所述地理信息进行地址逆编码处理,获得所述目标场所的地图地址。
可选地,所述对所述地理信息进行地址逆编码处理,获得所述目标场所的地图地址,包括:
对所述地理信息进行地址逆编码处理,获得所述目标场所的地图地址集;
根据所述目标场所的经营属性对所述地图地址集进行过滤,获得过滤地图地址,并对所述过滤地图地址进行一致性判别,确定所述目标场所对应的地图地址。
可选地,在所述获取目标场所的基础地址、地图地址以及通讯基站数据之前,所述方法还包括:
获取所述目标场所关联的所有通讯号码,并采集各个所述通讯号码的往来通讯数据以及通讯地址定位;
建立针对所述目标场所的通讯基站,并基于采集的往来通讯数据以及通讯地址定位进行大数据实时分析,获得所述通讯基站对应的通讯基站数据。
可选地,所述通讯基站数据包括所述通讯基站的基站地理信息,所述根据所述通讯基站数据对所述目标场所进行基站定位,获得所述目标场所对应的基站地址,包括:
对所述基站地理信息进行地址转化处理,获得所述目标场所对应的基站地址。
可选地,所述基础地址至少包括装机地址、移机地址以及订单联系地址,所述根据所述基础地址、所述地图地址以及所述基站地址对所述目标场所进行地址识别,获得所述目标场所对应的实际经营地址,包括:
对所述装机地址、所述移机地址、所述订单联系地址、所述地图地址以及所述基站地址进行地址标准化处理,并输入至地址置信度模型进行地址识别,输出所述目标场所的实际经营地址。
可选地,所述对所述装机地址、所述移机地址、所述订单联系地址、所述地图地址以及所述基站地址进行地址标准化处理,并输入至地址置信度模型进行地址识别,输出所述目标场所的实际经营地址,包括:
对所述装机地址、所述移机地址、所述订单联系地址、所述地图地址以及所述基站地址先进行地址纠正处理,接着输入至实体识别模型进行地址标准化处理,分别获得标准装机地址、标准移机地址、标准订单联系地址、标准地图地址以及标准基站地址;
将所述标准装机地址、所述标准移机地址、所述标准订单联系地址、所述标准地图地址、以及所述标准基站地址输入至地址置信度模型进行地址识别,输出所述目标场所的实际经营地址。
可选地,所述将所述标准装机地址、所述标准移机地址、所述标准订单联系地址、所述标准地图地址、以及所述标准基站地址输入至地址置信度模型进行地址识别,输出所述目标场所的实际经营地址,包括:
将所述标准装机地址、所述标准移机地址、所述标准订单联系地址、所述标准地图地址、以及所述标准基站地址输入至地址置信度模型进行地址识别,分别获得装机地址置信度、移机地址置信度、订单联系地址置信度、地图地址置信度以及基站地址置信度;
采用所述装机地址置信度、所述移机地址置信度、所述订单联系地址置信度、所述地图地址置信度以及所述基站地址置信度进行地址置信度加权处理,获得至少一个优化经营地址;
从至少一个所述优化经营地址中选择置信度加权得分最高的一个作为所述目标场所的实际经营地址,并输出所述实际经营地址。
本发明实施例还公开了一种经营地址的识别装置,所述装置包括:
目标场所地址获取模块,用于获取目标场所的基础地址、地图地址以及通讯基站数据,所述通讯基站数据包括所述目标场所关联的所有通讯号码对应的往来通讯数据;
基站地址定位模块,用于根据所述通讯基站数据对所述目标场所进行基站定位,获得所述目标场所对应的基站地址;
实际经营地址确定模块,用于根据所述基础地址、所述地图地址以及所述基站地址对所述目标场所进行地址识别,获得所述目标场所对应的实际经营地址。
可选地,所述目标场所地址获取模块包括:
基础地址获取模块,用于获取地址信息数据库,从所述地址信息数据库确定与目标场所对应的基础地址,所述地址信息数据库用于存储各个场所的基础地址;
地图地址生成模块,用于根据所述目标场所的名称获取对应的地理信息,并对所述地理信息进行地址转化处理,获得对应的地图地址;
通讯基站数据获取模块,用于获取所述目标场所对应的通讯基站数据。
可选地,所述地图地址生成模块包括:
地理信息获取模块,用于根据所述目标场所的名称从预设地图调用接口获取所述目标场所的地理信息;
地址逆编码处理模块,用于对所述地理信息进行地址逆编码处理,获得所述目标场所的地图地址。
可选地,所述地址逆编码处理模块包括:
地图地址集获取模块,用于对所述地理信息进行地址逆编码处理,获得所述目标场所的地图地址集;
一致性判别模块,用于根据所述目标场所的经营属性对所述地图地址集进行过滤,获得过滤地图地址,并对所述过滤地图地址进行一致性判别,确定所述目标场所对应的地图地址。
可选地,所述装置还包括:
往来通讯数据获取模块,用于获取所述目标场所关联的所有通讯号码,并采集各个所述通讯号码的往来通讯数据以及通讯地址定位;
数据分析模块,用于建立针对所述目标场所的通讯基站,并基于采集的往来通讯数据以及通讯地址定位进行大数据实时分析,获得所述通讯基站对应的通讯基站数据。
可选地,所述通讯基站数据包括所述通讯基站的基站地理信息,所述基站地址定位模块具体用于:
对所述基站地理信息进行地址转化处理,获得所述目标场所对应的基站地址。
可选地,所述基础地址至少包括装机地址、移机地址以及订单联系地址,所述实际经营地址确定模块具体用于:
对所述装机地址、所述移机地址、所述订单联系地址、所述地图地址以及所述基站地址进行地址标准化处理,并输入至地址置信度模型进行地址识别,输出所述目标场所的实际经营地址。
可选地,所述实际经营地址确定模块包括:
地址标准化处理模块,用于对所述装机地址、所述移机地址、所述订单联系地址、所述地图地址以及所述基站地址先进行地址纠正处理,接着输入至实体识别模型进行地址标准化处理,分别获得标准装机地址、标准移机地址、标准订单联系地址、标准地图地址以及标准基站地址;
地址识别模块,用于将所述标准装机地址、所述标准移机地址、所述标准订单联系地址、所述标准地图地址、以及所述标准基站地址输入至地址置信度模型进行地址识别,输出所述目标场所的实际经营地址。
可选地,所述地址识别模块包括:
地址置信度生成模块,用于将所述标准装机地址、所述标准移机地址、所述标准订单联系地址、所述标准地图地址、以及所述标准基站地址输入至地址置信度模型进行地址识别,分别获得装机地址置信度、移机地址置信度、订单联系地址置信度、地图地址置信度以及基站地址置信度;
优化经营地址生成模块,用于采用所述装机地址置信度、所述移机地址置信度、所述订单联系地址置信度、所述地图地址置信度以及所述基站地址置信度进行地址置信度加权处理,获得至少一个优化经营地址;
优化经营地址选择模块,用于从至少一个所述优化经营地址中选择置信度加权得分最高的一个作为所述目标场所的实际经营地址,并输出所述实际经营地址。
本发明实施例还公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现如本发明实施例所述的方法。
本发明实施例还公开了一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如本发明实施例所述的方法。
本发明实施例包括以下优点:
在本发明实施例中,提供了一种经营地址的识别方法,首先获取目标场所的基础地址、地图地址以及通讯基站数据,其中,通讯基站数据包括目标场所关联的所有通讯号码对应的往来通讯数据,接着根据通讯基站数据对目标场所进行基站定位,获得目标场所对应的基站地址,然后根据基础地址、地图地址以及基站地址对目标场所进行地址识别,获得目标场所对应的实际经营地址,从而通过整合包括通信大数据在内的多源地址信息,并通过基站地址实现对于地址的二次验证,从而可以及时有效地识别出目标场所的实际经营地址,且使得最终输出的地址具有更高的可信度以及精准度。
附图说明
图1是本发明实施例中提供的一种经营地址的识别方法的步骤流程图;
图2是本发明实施例中提供的一种实际经营地址的识别方法示例图;
图3是本发明实施例中提供的一种数据建模构建流程示意图;
图4是本发明实施例中提供的一种经营地址的识别装置的结构框图;
图5是本发明实施例中提供的一种电子设备的框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
作为一种示例,企业在经营的时候,需在其登记注册的住所地址从事经营相关活动,但实际上许多企业出于多方考虑,其注册地与实际办公地址往往不一致,即大量企业存在注册地址与实际经营地址不符的情况,如企业最初注册在开发区或者工业园区内,但是实际业务并不适合在园区内经营,于是又选择在其他地方从事经营活动,从而导致注册地与实际办公地址不符,再比如,许多小微企业因业务拓展、地址拆迁、就近办公等因素从而使得注册地址与实际经营地址不一致,示例性地,造成注册地址与实际经营地址不一致的情况可能有:(1)企业在最初的注册时,通过不正规渠道获取地址材料,进行注册登记;(2)当企业注册好之后,由于业务拓展,不得不就近办公;(3)由于企业所在地址拆迁,不得不更换办公场所;(4)由于企业资金紧张,不得不更换较为实惠的办公场所;(5)由于企业业务扩张,原有的经营地址不能满足其办公需求,不得不更换更大的办公场所;(6)考虑到企业员工上下班方便,从而更换经营地址,等等,造成注册地址与实际经营地址不一致的因素有很多,上述示例中仅列举了几个较为常见的因素。
目前而言,在对企业地址进行定位识别时,往往基于注册地址开展,从而一旦注册地址有误,则容易造成无法准确定位企业地址,不能及时联系到对应企业的问题,部分企业的注册地址与实际经营地址甚至出现跨区域的现象,同时,企业本身也会因地址不符感到困扰,容易出现无法有效增加企业曝光率、客户无法对企业进行精准定位、企业与客户之间的往来减少等问题。
对此,本发明实施例的核心发明点之一在于:提供一种经营地址的识别方法,首先获取目标场所的基础地址、地图地址以及通讯基站数据,其中,通讯基站数据包括目标场所关联的所有通讯号码对应的往来通讯数据,接着根据通讯基站数据对目标场所进行基站定位,获得目标场所对应的基站地址,然后根据基础地址、地图地址以及基站地址对目标场所进行地址识别,获得目标场所对应的实际经营地址,从而通过整合包括通信大数据在内的多源地址信息,并通过基站地址实现对于地址的二次验证,从而可以及时有效地识别出目标场所的实际经营地址,且使得最终输出的地址具有更高的可信度以及精准度。
参照图1,示出了本发明实施例中提供的一种经营地址的识别方法的步骤流程图,具体可以包括如下步骤:
步骤101,获取目标场所的基础地址、地图地址以及通讯基站数据,所述通讯基站数据包括所述目标场所关联的所有通讯号码对应的往来通讯数据;
在具体的实现中,可以先获取目标场所对应的基础地址、地图地址以及通讯基站数据,其中,通讯基站数据可以包括目标场所关联的所有通讯号码对应的往来通讯数据,从而通过获取目标场所的各个地址信息,便于后续通过分析输出目标场所对应的实际经营地址。
首先,对于基础地址,在对目标场所的地址进行识别时,以企业的经营地址识别为例,对于地址识别而言,运营商数据是识别技术的核心数据,其根本原因在于运营商存有海量且准确的相关数据。对于一个企业来讲,其在进行经营相关活动或者办公时,办公网络宽带、企业光纤、固定电话都是必需品,而作为这些业务承办方的运营商,掌握了该部分的核心数据。而除了上述办公必需品之外,可以通过企业员工的手机基站对企业实际经营地址进行二次验证。因此,在进行地址识别之前,需先整合运营商的海量地址信息,示例性地,运营商的地址信息主要可以包括以下几部分:
首先,企业在进行办公时,会第一时间申请办公网络宽带、企业光纤、固定电话等办公必需品,该地址信息由于需要运营商的工程师上门进行安装调测,因此这部分的地址信息可以说是已经进行了人工验证,可以在一定程度上保证地址的准确性,该地址可以为企业对应的装机地址。
其次,对于上述网络宽带等办公必需品,除了首次安装之外,随着企业实际经营地址的变化,也需要向运营商发起移机申请,且对于运营商而言,其每个相关业务均需进行移机申请,才能确保所有的网络及电话服务正常运行。同样地,在进行移机申请后,运营商也会对每个申请移机业务进行二次验证,具体地,工程师会按照业务产品信息逐一上门进行移机,该地址可以为企业对应的移机地址。
再者,运营商也是一个综合信息服务商,因此在企业使用运营商的基础网络以及固定电话服务时,也会向运营商申请更多的增值服务,包括但不限于针对企业的企业组网、企业彩铃、企业监控、企业存储等等。而不管是基础网络、固定电话、移动电话服务还是各项增值服务,都会在运营商的CRM(Customer Relationship Management,客户关系管理)系统中产生相应的订单,订单包含企业联系人与联系地址,以便运营商及时准确地与企业经办人进行沟通。在企业实际经营过程中,该地址信息来源可以不断与运营商产生链接,因此只要企业正常经营,该部分地址信息会源源不断地进入运营商数据库,该地址可以为企业对应的订单联系地址,也称为订单地址。
以上几类运营商提供的地址会伴随企业的全生命周期,包括企业入网期的基础网络与固定电话服务、成长期的增值服务以及移机服务等,当企业不再经营时也会第一时间向运营商进行拆机申请,因此整合以上几类地址信息至关重要,从而一个企业可以有多条地址信息,可以通过对时间轴以及业务订单信息进行分析,分别输出装机地址、移机地址、订单联系地址,这几类地址可以作为企业的基础地址。
作为一种可选实施例,获取目标场所的基础地址、地图地址以及通讯基站数据,可以为:获取地址信息数据库,从地址信息数据库确定与目标场所对应的基础地址,地址信息数据库用于存储各个场所的基础地址,接着根据目标场所的名称获取对应的地理信息,并对地理信息进行地址转化处理,获得对应的地图地址,然后获取目标场所对应的通讯基站数据。其中,针对各个场所的地址信息整合,可以建立一个地址信息数据库,从运营商的海量相关数据中获取各个场所,如企业、商户、机构等对应的基础地址,并将这些基础地址存入地址信息数据库,方便后续需要用到时可以直接进行调用。
进一步地,根据目标场所的名称获取对应的地理信息,并对地理信息进行地址转化处理,获得对应的地图地址,可以为:根据目标场所的名称从预设地图调用接口获取目标场所的地理信息,接着对地理信息进行地址逆编码处理,获得目标场所的地图地址。
在一种可选实施例中,对地理信息进行地址逆编码处理,获得目标场所的地图地址,具体可以为:对地理信息进行地址逆编码处理,获得目标场所的地图地址集,接着根据目标场所的经营属性对地图地址集进行过滤,获得过滤地图地址,并对过滤地图地址进行一致性判别,确定目标场所对应的地图地址,从而通过对地址进行过滤以及一致性判别手段,使得获得的地图地址更加准确。
示例性地,可以根据企业名称通过当前主流地图的API(Application ProgramInterface,应用程序界面)接口,获取该企业对应的经纬度,并根据经纬度信息通过逆地理编码处理获取相对标准的实际地址信息,即企业对应的地图地址,如根据指定的坐标,返回的地理信息主要为行政编码信息,即指定点对应的省/市/县、指定点所在位置的描述、以及最近的POI(Point of Interest,兴趣点)信息、距离最近或者满足条件的道路信息、道路上距离指定点最近的点经纬度等,需要说明的是,此处“相对标准的实际地址信息”指的是从当前主流地图应用程序所获取的经纬度信息是较为准确的,可信度较高,从而经过逆地理编码处理所获得的地图地址也是较为准确的。
采用上述方式获取地图地址的主要目的为通过HTTP/HTTPS(Hyper TextTransfer Protocol/Hyper Text Transfer Protocol Secure,超文本传输协议/超文本传输安全协议)可以直接访问远程服务的接口,获取结构化地址与经纬度之间相互转化的能力,其中,地理编码指的是将地址或者地名的详细位置描述,转化为经纬度坐标的过程,而地址逆编码则与之相反,指的是将地理坐标转化为地址信息的过程。
具体地,通过分析可知,当前主流地图基本实现了地理信息内容的全量覆盖,因此可以通过融合几个当前主流地图针对性地获取地理信息数据,示例性地,该获取过程主要可以包括以下几步:
首先,获取地图应用程序开发平台的Key值(键值)及确定调用接口,获取Key值后,可以根据需求在开发平台确定对应的调用接口,从而可以确定数据获取内容以及范围。
其中,key值(键值)位于注册表结构链末端,与文件系统的文件类似,包含当前计算机及应用程序执行时使用的实际配置信息以及数据,键值可以包含几种数据类型,以适应不同环境的使用需求。
其次,进行URL(Universal Resource Locators,统一资源定位器)参数的定义及转码,众所周知,通过名称进行搜索可能会得出至少一个同名的地址数据,且可能名称相同,但对应的是不同行业的经营场所,如通过名称可能可以获得两个地址数据,一个对应的是企业,一个对应的是商户,此时可以针对搜索进一步设置限制条件,即在进行URL参数定义的时候可以输入搜索限制条件,如在获取到目标场所的地址数据之后,需根据该地址对应的行业进行划分,如该地址对应的是企业、商户、机构还是其他分类,同时在根据搜索限制条件进行地址数据的进一步划分之后,还需要确该地址数据是否真实,则同时加入可以数据真实性判断条件进行验证,示例性地,可采用PANDAS(Python Data AnalysisLibrary,Python数据分析库)、numPy(Numerical Python,Python的一种开源的科学计算库)、MKL(Math Kernel Library,数学内核库)等数据分析模块通过基本数据分析方法及正则方式进行一致性判别,因本发明采用的一致性判别方式较为常规,此处不作赘述。
示例性地,本发明实施例的部分实现代码如下:
进一步地,当通过上述的过程获取到地址数据后,可以对地址数据进行汇总清洗,并可以通过指定文件路径通过IO(Input Output,输入输出)口写入数据存储文档,以实现数据的下载,同时可以导入地址信息数据库,实现数据资产的本地化管理。
步骤102,根据所述通讯基站数据对所述目标场所进行基站定位,获得所述目标场所对应的基站地址;
可以根据通讯基站数据对目标场所进行基站定位,获得目标场所对应的基站地址,而在获取目标场所的通讯基站数据之前,还可以获取目标场所关联的所有通讯号码,并采集各个通讯号码的往来通讯数据以及通讯地址定位,接着建立针对目标场所的通讯基站,并基于采集的往来通讯数据以及通讯地址定位进行大数据实时分析,从而获得通讯基站对应的通讯基站数据。
在具体的实现中,仍以企业的地址识别处理为例,可以先建立起企业与其员工的关联。目前而言,运营商已经完成了全量客户的实名制登记,因此由企业登记的通讯号码都有对应的使用人,使用人可以涵盖企业的负责人、高管、员工等等。则可以通过员工信息与企业进行关联,接着可以通过对各个通讯号码进行数据采集,主要为采集往来通讯数据,以通过这些数据构建企业员工的工作圈。
具体地,虽然可以通过运营商获取企业对应的员工基础信息,但实际情况中,并非所有员工均会登记在对应的企业名下,则为了尽可能地通过工作圈定位企业经营地址,则需要丰富员工信息,根据工作圈定位,确保企业经营地址的准确性。其中,工作圈指的是将企业与员工作进一步关联,以查找出更多与该企业对应的员工。则可以以员工的通讯号码作为中心点,通过大数据分析该通讯号码基于话单、短信进行往来的通讯号码对应的往来次数以及频次,接着根据在工作时间内进行往来的通讯号码构建该员工的工作圈。示例性地,可以将工作时间设置在自然月内自然工作日的上午9点至下午18点,则可以获取并分析自然月内自然工作日的上午9点至下午18点对应员工的通信来往情况等,从而通过近一个月时间的数据建模分析,可以获得由该员工延伸出的多位员工所形成企业的员工集合,从而完成员工工作圈构建。
接着可以基于基站信息定位企业工作圈地址,具体地,企业员工在采用通讯号码进行通讯的过程中,基站定位是最为准确且及时的,从而可以建立针对基站的通讯基站,并基于采集的往来通讯数据以及通讯地址定位进行大数据实时分析,获得通讯基站对应的通讯基站数据,可以通过分析企业名下员工的工作圈(即并非单独地对某一个员工进行分析),并按照企业员工的工作圈获取基站信息,基站信息是一种实时数据,其中,基站的交互可以包括语音、短信以及流量等多个维度,则可以采用按天并按小时进行分段以采集基站数据,采集信息可以包括基站名称、基站地址、基站经纬度等基本信息。示例性地,该过程中的采集时段可以与工作圈的构建保持一致,即可以采集工作日的上午9点至下午18点工作圈的基站信息,并对采集的基站信息按照员工圈通讯频次进行分析,最终可以输出工作时间中与该企业员工工作圈最为频繁的一个或多个基站。
进一步地,通讯基站数据可以包括通讯基站的基站地理信息,则根据通讯基站数据对目标场所进行基站定位,获得目标场所对应的基站地址,可以为:对基站地理信息进行地址转化处理,获得目标场所对应的基站地址。具体地,可以根据通讯基站的经纬度信息进行地址转化处理,从而输出基于员工工作圈的基站地址。
需要说明的是,不同于之前提到的装机地址、移机地址、地图地址以及注册地址、年报地址,员工工作圈对应的基站地址会随着时间变化而变化,也会随着员工的通讯行为而发生变化,或者随着企业的经营地址变化而发生变化,只要企业能够产生通讯,就能精准定位到企业的实际经营地址,且随着企业实际经营地址发生变化,对应工作圈交互最为频繁的基站也会随之发生变化,从而通过通讯基站采集的基站地址是准确、有效且及时的,而通过结合基站地址,实际上也是对前述运营商地址、地图POI地址以及其他地址进行二次地址验证,使输出的实力经营地址更为准确。
步骤103,根据所述基础地址、所述地图地址以及所述基站地址对所述目标场所进行地址识别,获得所述目标场所对应的实际经营地址。
在具体的实现中,可以根据基础地址、地图地址以及基站地址对目标场所进行地址识别,获得目标场所对应的实际经营地址。
示例性地,参照图2,示出了本发明实施例中提供的一种实际经营地址的识别方法示例图,以企业的地址识别为例,可以将企业对应的地址主要分为三大类,分别为运营商地址、地图POI地址以及其他地址,其中,运营商地址也可以称为基础地址,指的是从运营商处获取的地址信息,可以包括装机地址、移机地址以及订单地址(即订单联系地址),地图POI地址指的是通过调用地图的API接口所获得的地址信息,可以包括企业商户地址(即地图地址),而其他地址可以包括企业的注册地址、年报地址等,本发明所提供的的实施例可以根据前述的几类地址获得企业客户的实际办公地,下面将针对根据运营商地址、地图POI地址以及其他地址如何获得企业客户的实际办公地进行说明。
需要指出的是,上述所列举的地址例子仅作为一种示例,在实际应用中,企业所对应的地址可以包括其他能够通过其他渠道获取的地址,此外,除了采用上述列举的地址对企业进行地址识别之外,本发明同时还采用了企业员工的通讯基站所对应的基站地址进行处理,示例性地,针对地址识别的处理流程,参照图3,示出了本发明实施例中提供的一种数据建模构建流程示意图,在获取到运营商地址(运营商装机地址、移机地址、订单地址等)、地图POI地址(企业商户地址)以及其他地址(注册地址、年报地址)之后,可以对员工基站(即针对企业员工构建的通讯基站)进行数据解析,获得对应的员工工作地(即通讯基站对应的基站地址),接着可以将各个地址输入用于地址标准化处理的模块,对各个地址进行地址标准化处理,接着可以输出的各个对应的标准化地址进行特征加工,接着可以将加工后的各个地址输入LGBM(Light Gradient Boosting Machine,基于决策树算法的分布式梯度提升框架)模型,对各个地址进行评分,获得各个地址对应的置信度,并根据各个置信度计算地址置信度加权得分,以实现对于地址的优化迭代加权处理,最后可以将地址置信度加权得分最高的地址作为实际办公地址,从而通过对源地址信息的一系列处理,可以输出企业对应的最终实际办公地址。
上述内容仅为本发明实施例中所提供的地址识别处理过程中部分步骤的简单说明,下面将对上述内容中的地址识别处理作进一步解释说明。
为了确保最终输出的实际经营地址的高可用性,因此需要将上述所有地址进行地址标准化处理。在实际应用中,由于在地址录入阶段,可能存在地址录入系统不规范、存在错别字或无关信息、地址不够精准,部分数据缺失、地址所在区域的社区/街道/门牌号等进行了更改、地址未经核验等问题,因此上述列举的装机地址、移机地址等大多数都不是标准化地址,甚至是错误的地址,因此在对这些地址进行地址标准化处理前,还需要将这些地址进行地址纠错、地址补全等相关操作。
示例性地,针对无关信息较多以及结构不规范的问题,可以通过用信息抽取,即实体识别的方式进行解决,从而规避采用传统的关键字导致覆盖不全的问题,而对于同一个地址信息的描述方式不同以及同音字、错别字等问题,可以通过实体消歧等智能匹配方式进行解决,从而可以通过实体识别等地址标准化技术手段,将所有来源各异、描述不规范的地址进行地址标准化处理,实现各个业务系统的数据互通。
通过对各个地址进行地址标准化处理,最终输出的地址数据可以是将一整段长地址按照省、市,区、路,街、最终精确到按POI进行结构化分解(甚至可以精准到楼栋号等等)的详细地址,比起未进行地址标准化处理的地址,其精细度更高,从而在对地址进行地址标准化处理的过程中,通过将地址的每个要素剥离出来进行分类归纳,使得地址更为清晰、结构更明确,从而更便于对地址的应用及管理。
作为一种可选实施例,根据基础地址、地图地址以及基站地址对目标场所进行地址识别,获得目标场所对应的实际经营地址,可以为:对装机地址、移机地址、订单联系地址、地图地址以及基站地址进行地址标准化处理,并输入至地址置信度模型进行地址识别,输出目标场所的实际经营地址。
进一步地,对装机地址、移机地址、订单联系地址、地图地址以及基站地址进行地址标准化处理,并输入至地址置信度模型进行地址识别,输出目标场所的实际经营地址,可以为:对装机地址、移机地址、订单联系地址、地图地址以及基站地址先进行地址纠正处理,接着输入至实体识别模型进行地址标准化处理,分别获得标准装机地址、标准移机地址、标准订单联系地址、标准地图地址以及标准基站地址,接着将标准装机地址、标准移机地址、标准订单联系地址、标准地图地址、以及标准基站地址输入至地址置信度模型进行地址识别,输出目标场所的实际经营地址。
作为一种可选实施例,将标准装机地址、标准移机地址、标准订单联系地址、标准地图地址、以及标准基站地址输入至地址置信度模型进行地址识别,输出目标场所的实际经营地址,可以为:将标准装机地址、标准移机地址、标准订单联系地址、标准地图地址、以及标准基站地址输入至地址置信度模型进行地址识别,分别获得装机地址置信度、移机地址置信度、订单联系地址置信度、地图地址置信度以及基站地址置信度,接着采用装机地址置信度、移机地址置信度、订单联系地址置信度、地图地址置信度以及基站地址置信度进行地址置信度加权处理,获得至少一个优化经营地址,最后从至少一个优化经营地址中选择置信度加权得分最高的一个作为目标场所的实际经营地址,并输出实际经营地址,需要说明的是,为作简单示例,因此本发明实施例中仅选取了目标场所的装机地址、移机地址、订单联系地址、地图地址、以及基站地址进行地址识别处理,在实际应用中,本领域技术人员还可以增加其他地址,如注册地址、年报地址等与上述所列举的各个地址一并作为地址识别处理的来源地址,其采用的方法与本发明实施例中所涉及的相同或相似,可以理解的是,本发明对此不作限制。
具体地,在进行地址标准化处理后,可以通过建立模型输出实际经营地址,如本发明实施例中企业对应的实际办公地址,则为了使最终输出的实际办公地址更加精准,需要在获取的多个结构化地址中选取最有可能是实际办公的地址,首先可以确定多个源地址信息(如上述示例中所列举的几类地址)的来源置信度C,接着可以根据各个地址对应的来源置信度分别计算地址置信度加权得分,最后可以通过模型训练,进行优化迭代后输出基于置信度加权得分最高的地址,作为企业对应的实际办公地址,即实际经营地址。
在具体的实现中,对于各个源地址信息的来源置信度计算,可以通过运营商的一线工作人员,如客户经理、装维工程师、销售代表等建立地址反馈机制,如一线工作人员可以将企业正确的实际经营地址通过系统反馈至地址信息数据库,从而得到训练模型的正样本,具体地,可以分别将进行地址标准化处理后的各个信息来源的地址作为训练集获得其置信度,即在仅依赖于单一信息来源地址的情况下分别验证各个地址的准确性,并通过采用贝叶斯调参原理确定每个信息来源对应地址的地址置信度(也称为地址对应的来源置信度)。示例性地,假设注册地址为a,年报地址为b,运营商装机地址为c,移机地址为d,订单地址为e,地图商户地址为f,企业员工对应的基站地址为g,则可以通过模型训练分别可以获取到上述七类地址的置信度,如注册地址置信度Ca,年报地址置信度Cb,装机地址置信度Cc,移机地址置信度Cd,订单地址置信度Ce,地图地址置信度Cf,基站地址置信度Cg。
其中,贝叶斯调参原理指的是给定优化的目标函数(广义的函数,只需指定输入和输出即可,无需知道内部结构以及数学性质),通过不断地添加样本点来更新目标函数的后验分布,如本发明实施例中可以针对地址识别处理预设一个优化的目标函数,并且不断添加正确的实际经营地址作为样本点,不断对目标函数进行更新,以达到模型训练目的,并采用训练后的模型对后续需进行地址识别的地址进行地址置信度计算。
当获得各个地址对应的地址置信度之后,可以根据各个地址置信度进一步计算地址置信度加权得分。在实际情况中,上述七类标准化地址往往仅会输出一至四个不同的地址信息,则根据此前各类地址对应的来源置信度,可以分别计算出这几类不同地址基于地址置信度的加权得分。
示例性地,假设经过地址标准化处理以及地址置信度计算之后,出现了三个不同地址的情况,其中地址一的来源为注册地址a以及年报地址b,地址二的来源为装机地址c以及订单地址e,地址三的来源为移机地址d、地图地址f以及基站地址g,则:地址一的加权得分“S1=Wa×Ca+Wb×Cb”,地址二的加权得分“S2=Wc×Cc+We×Ce”,地址三的加权得分“S3=Wd×Cd+Wf×Cf+Wg×Cg”,其中,W表示地址中各个来源地址所对应的权重,如Wa表示注册地址a对应的权重,如可以为0.6等等,则可以通过地址置信度的加权得分计算,可以进一步获得更为准确的实际经营地址。
在上述处理过程中,可能会出现较为极端情况,如所有来源地址均为同一个地址,则其加权得分可以为各个地址置信度与其权重的乘积之和,如“S4=Wa×Ca+Wb×Cb+Wc×Cc+Wd×Cd+We×Ce+Wf×Cf+Wg×Cg”,也可能出现所有来源地址均不相同的情况,则七个地址的得分可以分别为其置信度与权重的乘积,如注册地址a对应的加权得分为“S5=Wa×Ca”,年报地址b对应的加权得分为“S6=Wb×Cb”,装机地址c对应的加权得分为“S7=Wc×Cc”,移机地址d对应的加权得分为“S8=Wd×Cd”,订单地址e对应的加权得分为“S9=We×Ce”,地图地址f对应的加权得分为“S10=Wf×Cf”,基站地址g对应的加权得分为“S11=Wg×Cg”,等等,需要指出的是,上述示例中所列举的例子仅作为一种示例,在实际应用中,可能会出现其他不一样的情况,本领域技术人员按照本发明实施例所提供的地址置信度加权计算方式进行相应计算即可,本发明对此不作限制。
示例性地,在一种情况中,包含上述七类全部地址信息的企业地址,进行地址标准化处理后获取到对应的一个或多个结构化地址,通过基于置信度模型输出最有可能的实际经营地址一般来源于运营商地址以及地图POI地址;在另一种情况中,部分企业可能未与运营商建立连接,但可以获取到地图POI地址以及其他地址,则将能够获取到的地址代入模型,输出最有可能的实际经营地址一般来源于地图POI地址以及企业最近一次年报地址;还有一种情况,对于个别企业,仅能够获取到对应的其他地址(如注册地址以及年报地址),则在这种情况下模型能够输出最有可能的实际经营地址一般来源于企业最近一次的年报地址,本发明对此不作限制。
接着可以通过获得的结果进行模型训练,在进行优化迭代后输出基于置信度加权得分最高的地址。具体地,不管出现的地址数量为多少,经地址置信度计算,最终都能得到每个地址的加权得分,而上述示例中提到的权重值的集合,可以通过机器算法对其进行不断优化迭代、调整,而为了避免过多的人为干预导致影响权重值,可以选用机器学习算法中LGBM集成算法进行建模,LGBM集成算法为梯度Boosting(提升法)框架,使用基于决策树的学习算法,从而具有训练效果好、不易过拟合、低内存使用、准确率更高等优点。
示例性地,模型训练部分的相关代码可以为:
clf=lgb.LGBMClassifier(boosting_type='gbdt',num_class=3,num_leaves=17,max_depth=6,learning_rate=0.001,n_estimators=100,subsample_for_bin=200000,objective=None,class_weight=None,min_split_gain=0.0,min_child_weight=0.001,min_child_samples=20,subsample=1.0,subsample_freq=0,colsample_bytree=1.0,reg_alpha=0.0,reg_lambda=0.0,random_state=None,n_jobs=-1,silent=True,importance_type='split')
在模型训练过程中,可以采用贝叶斯调参原理进行调整,从而得到最优参数模型,最后可以将多类别推荐概率转为加权得分值,而加权得分值最高的地址信息,即为企业最有可能的实际经营地址,从而通过该模型可以实现精准识别企业对应的实际经营地址。
需要说明的是,本发明实施例包括但不限于上述示例,可以理解的是,本领域技术人员在本发明实施例的思想指导下,还可以根据实际需求进行设置,本发明对此不作限制。
在本发明实施例中,提供了一种经营地址的识别方法,首先获取目标场所的基础地址、地图地址以及通讯基站数据,其中,通讯基站数据包括目标场所关联的所有通讯号码对应的往来通讯数据,接着根据通讯基站数据对目标场所进行基站定位,获得目标场所对应的基站地址,然后根据基础地址、地图地址以及基站地址对目标场所进行地址识别,获得目标场所对应的实际经营地址,从而通过整合包括通信大数据在内的多源地址信息,并通过基站地址实现对于地址的二次验证,从而可以及时有效地识别出目标场所的实际经营地址,且使得最终输出的地址具有更高的可信度以及精准度。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图4,示出了本发明实施例中提供的一种经营地址的识别装置的结构框图,具体可以包括如下模块:
目标场所地址获取模块401,用于获取目标场所的基础地址、地图地址以及通讯基站数据,所述通讯基站数据包括所述目标场所关联的所有通讯号码对应的往来通讯数据;
基站地址定位模块402,用于根据所述通讯基站数据对所述目标场所进行基站定位,获得所述目标场所对应的基站地址;
实际经营地址确定模块403,用于根据所述基础地址、所述地图地址以及所述基站地址对所述目标场所进行地址识别,获得所述目标场所对应的实际经营地址。
在一些可选实施例中,所述目标场所地址获取模块401包括:
基础地址获取模块,用于获取地址信息数据库,从所述地址信息数据库确定与目标场所对应的基础地址,所述地址信息数据库用于存储各个场所的基础地址;
地图地址生成模块,用于根据所述目标场所的名称获取对应的地理信息,并对所述地理信息进行地址转化处理,获得对应的地图地址;
通讯基站数据获取模块,用于获取所述目标场所对应的通讯基站数据。
在一些可选实施例中,所述地图地址生成模块包括:
地理信息获取模块,用于根据所述目标场所的名称从预设地图调用接口获取所述目标场所的地理信息;
地址逆编码处理模块,用于对所述地理信息进行地址逆编码处理,获得所述目标场所的地图地址。
在一些可选实施例中,所述地址逆编码处理模块包括:
地图地址集获取模块,用于对所述地理信息进行地址逆编码处理,获得所述目标场所的地图地址集;
一致性判别模块,用于根据所述目标场所的经营属性对所述地图地址集进行过滤,获得过滤地图地址,并对所述过滤地图地址进行一致性判别,确定所述目标场所对应的地图地址。
在一些可选实施例中,所述装置还包括:
往来通讯数据获取模块,用于获取所述目标场所关联的所有通讯号码,并采集各个所述通讯号码的往来通讯数据以及通讯地址定位;
数据分析模块,用于建立针对所述目标场所的通讯基站,并基于采集的往来通讯数据以及通讯地址定位进行大数据实时分析,获得所述通讯基站对应的通讯基站数据。
在一些可选实施例中,所述通讯基站数据包括所述通讯基站的基站地理信息,所述基站地址定位模块402具体用于:
对所述基站地理信息进行地址转化处理,获得所述目标场所对应的基站地址。
在一些可选实施例中,所述基础地址至少包括装机地址、移机地址以及订单联系地址,所述实际经营地址确定模块403具体用于:
对所述装机地址、所述移机地址、所述订单联系地址、所述地图地址以及所述基站地址进行地址标准化处理,并输入至地址置信度模型进行地址识别,输出所述目标场所的实际经营地址。
在一些可选实施例中,所述实际经营地址确定模块403包括:
地址标准化处理模块,用于对所述装机地址、所述移机地址、所述订单联系地址、所述地图地址以及所述基站地址先进行地址纠正处理,接着输入至实体识别模型进行地址标准化处理,分别获得标准装机地址、标准移机地址、标准订单联系地址、标准地图地址以及标准基站地址;
地址识别模块,用于将所述标准装机地址、所述标准移机地址、所述标准订单联系地址、所述标准地图地址、以及所述标准基站地址输入至地址置信度模型进行地址识别,输出所述目标场所的实际经营地址。
在一些可选实施例中,所述地址识别模块包括:
地址置信度生成模块,用于将所述标准装机地址、所述标准移机地址、所述标准订单联系地址、所述标准地图地址、以及所述标准基站地址输入至地址置信度模型进行地址识别,分别获得装机地址置信度、移机地址置信度、订单联系地址置信度、地图地址置信度以及基站地址置信度;
优化经营地址生成模块,用于采用所述装机地址置信度、所述移机地址置信度、所述订单联系地址置信度、所述地图地址置信度以及所述基站地址置信度进行地址置信度加权处理,获得至少一个优化经营地址;
优化经营地址选择模块,用于从至少一个所述优化经营地址中选择置信度加权得分最高的一个作为所述目标场所的实际经营地址,并输出所述实际经营地址。
在本发明实施例中,提供了一种经营地址的识别装置,该装置可以应用于经营地址的识别方法,首先获取目标场所的基础地址、地图地址以及通讯基站数据,其中,通讯基站数据包括目标场所关联的所有通讯号码对应的往来通讯数据,接着根据通讯基站数据对目标场所进行基站定位,获得目标场所对应的基站地址,然后根据基础地址、地图地址以及基站地址对目标场所进行地址识别,获得目标场所对应的实际经营地址,从而通过整合包括通信大数据在内的多源地址信息,并通过基站地址实现对于地址的二次验证,从而可以及时有效地识别出目标场所的实际经营地址,且使得最终输出的地址具有更高的可信度以及精准度。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
另外,本发明实施例还提供了一种电子设备,包括:处理器,存储器,存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述经营地址的识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述经营地址的识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
图5为实现本发明各个实施例的一种电子设备的硬件结构示意图。
该电子设备500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、处理器510、以及电源511等部件。本领域技术人员可以理解,本发明实施例中所涉及的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
应理解的是,本发明实施例中,射频单元501可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器510处理;另外,将上行的数据发送给基站。通常,射频单元501包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元501还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块502为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元503可以将射频单元501或网络模块502接收的或者在存储器509中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元503还可以提供与电子设备500执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元503包括扬声器、蜂鸣器以及受话器等。
输入单元504用于接收音频或视频信号。输入单元504可以包括图形处理器(Graphics Processing Unit,GPU)5041和麦克风5042,图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元506上。经图形处理器5041处理后的图像帧可以存储在存储器509(或其它存储介质)中或者经由射频单元501或网络模块502进行发送。麦克风5042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元501发送到移动通信基站的格式输出。
电子设备500还包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板5061的亮度,接近传感器可在电子设备500移动到耳边时,关闭显示面板5061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器505还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元506用于显示由用户输入的信息或提供给用户的信息。显示单元506可包括显示面板5061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板5061。
用户输入单元507可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板5071上或在触控面板5071附近的操作)。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器510,接收处理器510发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板5071。除了触控面板5071,用户输入单元507还可以包括其他输入设备5072。具体地,其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板5071可覆盖在显示面板5061上,当触控面板5071检测到在其上或附近的触摸操作后,传送给处理器510以确定触摸事件的类型,随后处理器510根据触摸事件的类型在显示面板5061上提供相应的视觉输出。可以理解的是,在一种实施例中,触控面板5071与显示面板5061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板5071与显示面板5061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元508为外部装置与电子设备500连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元508可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备500内的一个或多个元件或者可以用于在电子设备500和外部装置之间传输数据。
存储器509可用于存储软件程序以及各种数据。存储器509可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器509可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器510是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器509内的软件程序和/或模块,以及调用存储在存储器509内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器510可包括一个或多个处理单元;优选的,处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
电子设备500还可以包括给各个部件供电的电源511(比如电池),优选的,电源511可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备500包括一些未示出的功能模块,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
本领域普通技术人员可以意识到,结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
此外,本发明实施例中可能会涉及到对用户数据的使用,在实际应用中,可以在符合所在国的适用法律法规要求的情况下(例如,用户明确同意,对用户切实通知,等),在适用法律法规允许的范围内在本文描述的方案中使用用户特定的个人数据。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (12)
1.一种经营地址的识别方法,其特征在于,包括:
获取目标场所的基础地址、地图地址以及通讯基站数据,所述通讯基站数据包括所述目标场所关联的所有通讯号码对应的往来通讯数据;
根据所述通讯基站数据对所述目标场所进行基站定位,获得所述目标场所对应的基站地址;
根据所述基础地址、所述地图地址以及所述基站地址对所述目标场所进行地址识别,获得所述目标场所对应的实际经营地址。
2.根据权利要求1所述的方法,其特征在于,所述获取目标场所的基础地址、地图地址以及通讯基站数据,包括:
获取地址信息数据库,从所述地址信息数据库确定与目标场所对应的基础地址,所述地址信息数据库用于存储各个场所的基础地址;
根据所述目标场所的名称获取对应的地理信息,并对所述地理信息进行地址转化处理,获得对应的地图地址;
获取所述目标场所对应的通讯基站数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标场所的名称获取对应的地理信息,并对所述地理信息进行地址转化处理,获得对应的地图地址,包括:
根据所述目标场所的名称从预设地图调用接口获取所述目标场所的地理信息;
对所述地理信息进行地址逆编码处理,获得所述目标场所的地图地址。
4.根据权利要求3所述的方法,其特征在于,所述对所述地理信息进行地址逆编码处理,获得所述目标场所的地图地址,包括:
对所述地理信息进行地址逆编码处理,获得所述目标场所的地图地址集;
根据所述目标场所的经营属性对所述地图地址集进行过滤,获得过滤地图地址,并对所述过滤地图地址进行一致性判别,确定所述目标场所对应的地图地址。
5.根据权利要求1所述的方法,其特征在于,在所述获取目标场所的基础地址、地图地址以及通讯基站数据之前,所述方法还包括:
获取所述目标场所关联的所有通讯号码,并采集各个所述通讯号码的往来通讯数据以及通讯地址定位;
建立针对所述目标场所的通讯基站,并基于采集的往来通讯数据以及通讯地址定位进行大数据实时分析,获得所述通讯基站对应的通讯基站数据。
6.根据权利要求5所述的方法,其特征在于,所述通讯基站数据包括所述通讯基站的基站地理信息,所述根据所述通讯基站数据对所述目标场所进行基站定位,获得所述目标场所对应的基站地址,包括:
对所述基站地理信息进行地址转化处理,获得所述目标场所对应的基站地址。
7.根据权利要求1所述的方法,其特征在于,所述基础地址至少包括装机地址、移机地址以及订单联系地址,所述根据所述基础地址、所述地图地址以及所述基站地址对所述目标场所进行地址识别,获得所述目标场所对应的实际经营地址,包括:
对所述装机地址、所述移机地址、所述订单联系地址、所述地图地址以及所述基站地址进行地址标准化处理,并输入至地址置信度模型进行地址识别,输出所述目标场所的实际经营地址。
8.根据权利要求7所述的方法,其特征在于,所述对所述装机地址、所述移机地址、所述订单联系地址、所述地图地址以及所述基站地址进行地址标准化处理,并输入至地址置信度模型进行地址识别,输出所述目标场所的实际经营地址,包括:
对所述装机地址、所述移机地址、所述订单联系地址、所述地图地址以及所述基站地址先进行地址纠正处理,接着输入至实体识别模型进行地址标准化处理,分别获得标准装机地址、标准移机地址、标准订单联系地址、标准地图地址以及标准基站地址;
将所述标准装机地址、所述标准移机地址、所述标准订单联系地址、所述标准地图地址、以及所述标准基站地址输入至地址置信度模型进行地址识别,输出所述目标场所的实际经营地址。
9.根据权利要求8所述的方法,其特征在于,所述将所述标准装机地址、所述标准移机地址、所述标准订单联系地址、所述标准地图地址、以及所述标准基站地址输入至地址置信度模型进行地址识别,输出所述目标场所的实际经营地址,包括:
将所述标准装机地址、所述标准移机地址、所述标准订单联系地址、所述标准地图地址、以及所述标准基站地址输入至地址置信度模型进行地址识别,分别获得装机地址置信度、移机地址置信度、订单联系地址置信度、地图地址置信度以及基站地址置信度;
采用所述装机地址置信度、所述移机地址置信度、所述订单联系地址置信度、所述地图地址置信度以及所述基站地址置信度进行地址置信度加权处理,获得至少一个优化经营地址;
从至少一个所述优化经营地址中选择置信度加权得分最高的一个作为所述目标场所的实际经营地址,并输出所述实际经营地址。
10.一种经营地址的识别装置,其特征在于,包括:
目标场所地址获取模块,用于获取目标场所的基础地址、地图地址以及通讯基站数据,所述通讯基站数据包括所述目标场所关联的所有通讯号码对应的往来通讯数据;
基站地址定位模块,用于根据所述通讯基站数据对所述目标场所进行基站定位,获得所述目标场所对应的基站地址;
实际经营地址确定模块,用于根据所述基础地址、所述地图地址以及所述基站地址对所述目标场所进行地址识别,获得所述目标场所对应的实际经营地址。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现如权利要求1-9任一项所述的方法。
12.一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如权利要求1-9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211625342.3A CN116233754A (zh) | 2022-12-16 | 2022-12-16 | 经营地址的识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211625342.3A CN116233754A (zh) | 2022-12-16 | 2022-12-16 | 经营地址的识别方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116233754A true CN116233754A (zh) | 2023-06-06 |
Family
ID=86586211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211625342.3A Pending CN116233754A (zh) | 2022-12-16 | 2022-12-16 | 经营地址的识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116233754A (zh) |
-
2022
- 2022-12-16 CN CN202211625342.3A patent/CN116233754A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5951802B2 (ja) | ユーザーのパーソナルコンテキストを識別および分析するためのシステムおよび方法 | |
CN104508739B (zh) | 动态语言模型 | |
US8171237B2 (en) | Automatic association of reference data with primary process data based on time and shared identifier | |
WO2020134790A1 (zh) | 一种数据异常检测方法、装置及终端设备 | |
US9690264B2 (en) | System, and a method for providing a prediction for controlling a system | |
US10346737B1 (en) | Distributed multisensor system to record spatially diverse events | |
CN113868427A (zh) | 一种数据处理方法、装置及电子设备 | |
CN112328911B (zh) | 地点推荐方法、装置、设备及存储介质 | |
CN111125523A (zh) | 搜索方法、装置、终端设备及存储介质 | |
CN111753520B (zh) | 一种风险预测方法、装置、电子设备及存储介质 | |
CN116070114A (zh) | 数据集的构建方法、装置、电子设备及存储介质 | |
CN113124857A (zh) | 一种出入口位置的确定方法、相关装置、设备及存储介质 | |
WO2018080855A1 (en) | Determining geolocation of ip addresses using user transitions over time | |
CN112256748A (zh) | 一种异常检测方法、装置、电子设备及存储介质 | |
CN111080305A (zh) | 一种风险识别方法、装置及电子设备 | |
CN108600356B (zh) | 一种消息推送方法及装置 | |
CN110929171A (zh) | 一种基于场景和社交网络位置的兴趣点推荐方法 | |
CN116233754A (zh) | 经营地址的识别方法、装置、电子设备及存储介质 | |
US10783130B2 (en) | System, a data structure for controlling the system, and a method for updating the data structure | |
CN115062197A (zh) | 考勤数据检测方法、装置及存储介质 | |
CN111901740B (zh) | 一种数据的处理方法、装置及设备 | |
CN114925680A (zh) | 物流兴趣点信息生成方法、装置、设备和计算机可读介质 | |
CN115439141A (zh) | 用户交际圈画像的处理方法、装置、电子设备及存储介质 | |
CN115841181B (zh) | 剩余油分布预测方法、装置、设备及存储介质 | |
Kaur et al. | IFSA: an integrated framework for developing IoT linked mobile applications for specially abled people |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |