CN113159149A - 一种企业办公地址的识别方法及装置 - Google Patents

一种企业办公地址的识别方法及装置 Download PDF

Info

Publication number
CN113159149A
CN113159149A CN202110385974.6A CN202110385974A CN113159149A CN 113159149 A CN113159149 A CN 113159149A CN 202110385974 A CN202110385974 A CN 202110385974A CN 113159149 A CN113159149 A CN 113159149A
Authority
CN
China
Prior art keywords
enterprise
address
identified
classification
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110385974.6A
Other languages
English (en)
Other versions
CN113159149B (zh
Inventor
陈开冉
黎展
雷翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Tungee Technology Co ltd
Original Assignee
Guangzhou Tungee Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Tungee Technology Co ltd filed Critical Guangzhou Tungee Technology Co ltd
Priority to CN202110385974.6A priority Critical patent/CN113159149B/zh
Publication of CN113159149A publication Critical patent/CN113159149A/zh
Application granted granted Critical
Publication of CN113159149B publication Critical patent/CN113159149B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种企业办公地址的识别方法,根据待识别企业地址的关联数据,构建第一特征;其中,第一特征包括与待识别企业地址相关的文字信息以及数值信息;通过多个不同结构的预设分类算法模型,分别对第一特征进行特征提取,以输出多个第一分类概率结果;其中,各预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成;根据多个第一分类概率结果,确定待识别企业地址是否为待识别企业在当前时刻下的办公地址。通过采用本发明实施例,能够准确判断企业的实际办公地址是否与当前待识别的地址一致,解决了人工识别企业实际办公地址准确率不高,效率低的问题。

Description

一种企业办公地址的识别方法及装置
技术领域
本发明涉及企业地址识别领域,尤其涉及一种企业办公地址的识别方法及装置。
背景技术
企业地址一般是指企业在相关部门注册的企业注册地址,该地址为登记在公司营业执照上的地址,同时也表明为企业真实的办公地址。通常情况下,企业为了达到宣传效果,会在互联网上发布公司的所在地信息,以便客户寻访和人员求职等。
实际上,企业在办理企业地址变更、公司注册挂靠、集群注册的时候,企业地址可能由于流程原因未能及时登记变换,企业注册地址与实际的办公地址存在偏差,导致互联网上一个企业的地址往往能被搜索到两个或以上。并且,由于目前主要识别企业的实际办公地址的主要方法,是通过人工对企业官网地址、招聘地址或百度地图等地址的优先级进行客观评价后进行选择。此外,更复杂的情况下,也通过企业名称与对应候选地址联合并进行搜索引擎搜索,根据搜索结果的数量及时间,辅助判断对应候选地址是否进一步可能是办公地址,这导致了业务人员或者有企业调查需求的人员对企业进行寻访时候,无法准确定位寻访公司的地址,造成极大的不便。
因此,为替代人工客观识别企业的真实办公地址的传统方法,需要一种高效、精准的自动识别企业办公地址真实性的方法。
发明内容
本发明实施例提出一种企业办公地址的识别方法及装置,能提高对企业真实办公地址的识别准确性,从而简化寻访人员鉴别企业真实地址的工作流程,提高寻访人员判断地址的准确性,并提高工作效率。
本发明实施例提供一种企业办公地址的识别方法,包括:
根据待识别企业地址的关联数据,构建第一特征;其中,所述第一特征包括与所述待识别企业地址相关的文字信息以及数值信息;
通过多个不同结构的预设分类算法模型,分别对所述第一特征进行特征提取,以输出多个第一分类概率结果;其中,各所述预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成;
根据所述多个第一分类概率结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址。
进一步的,在所述根据待识别企业地址的关联数据,构建第一特征之后,还包括:
对所述第一特征的所述文字信息进行数值编码,以转换为数值特征。
进一步的,所述各所述预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成,具体为:
根据已通过真实性检验的多个企业地址的关联数据,构建第一训练特征;其中,所述第一训练特征包括与所述待识别企业地址相关的文字信息以及数值信息;
对所述第一训练特征的所述文字信息进行数值编码,以转换为数值特征,并将经过转换处理后的所述第一训练特征构成训练集;
获取多个分类算法初始模型,并通过所述训练集,分别对所述多个分类算法初始模型进行训练,获得所述多个不同结构的预设分类算法模型。
进一步的,所述根据所述多个第一分类概率结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址,具体为:
根据预设的权重,对所述多个第一分类概率进行加权平均计算,以输出第二分类概率结果;
根据所述第二分类概率结果与预设的阈值的比较结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址。
进一步的,所述多个不同结构的预设分类算法模型包括:在LightGBM模型、随机森林模型和SVM模型中的任意两种或多种组合。
相应的,本发明实施例还提供一种企业办公地址的识别装置,其特征在于,包括:特征构建模块、特征提取模块、分类判断模块;
其中,所述特征构建模块用于根据待识别企业地址的关联数据,构建第一特征;其中,所述第一特征包括与所述待识别企业地址相关的文字信息以及数值信息;
所述特征提取模块用于通过多个不同结构的预设分类算法模型,分别对所述第一特征进行特征提取,以输出多个第一分类概率结果;其中,各所述预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成;
所述分类判断模块用于根据所述多个第一分类概率结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址。
进一步的,在所述根据待识别企业地址的关联数据,构建第一特征之后,还包括:
对所述第一特征的所述文字信息进行数值编码,以转换为数值特征。
进一步的,其特征在于,所述特征提取模块还包括模型训练模块;
所述模型训练模块用于根据已通过真实性检验的多个企业地址的关联数据,构建第一训练特征;其中,所述第一训练特征包括与所述待识别企业地址相关的文字信息以及数值信息;
对所述第一训练特征的所述文字信息进行数值编码,以转换为数值特征,并将经过转换处理后的所述第一训练特征构成训练集;
获取多个分类算法初始模型,并通过所述训练集,分别对所述多个分类算法初始模型进行训练,获得所述多个不同结构的预设分类算法模型。
进一步的,其特征在于,所述分类判断模块包括阈值判断模块;
所述阈值判断模块用于根据预设的权重,对所述多个第一分类概率进行加权平均计算,以输出第二分类概率结果;
根据所述第二分类概率结果与预设的阈值的比较结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址。
进一步的,其特征在于,所述多个不同结构的预设分类算法模型包括:在LightGBM模型、随机森林模型和SVM模型中的任意两种或多种组合。
实施本发明实施例,具有如下有益效果:
本发明实施例提供的一种企业办公地址的识别方法及装置,通过根据待识别企业地址的关联数据,构建第一特征;其中,第一特征包括与待识别企业地址相关的文字信息以及数值信息;通过多个不同结构的预设分类算法模型,分别对第一特征进行特征提取,以输出多个第一分类概率结果;其中,各预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成;根据多个第一分类概率结果,确定待识别企业地址是否为待识别企业在当前时刻下的办公地址。通过采用本发明实施例,能够准确判断企业的实际办公地址是否与当前待识别的地址一致,解决了人工识别企业实际办公地址准确率不高,效率低的问题。
进一步的,对第一特征的文字信息进行数值编码,以转换为数值特征。通过采用本发明实施例,能将文字信息以合理的数值编码形式转换为符合分类算法模型输入格式的数据,从而进一步的增加模型的数据输入维度,提高地址识别的准确率。
附图说明
图1是本发明提供的企业办公地址的识别方法的一种实施例的流程示意图;
图2是本发明提供的企业办公地址的识别装置的一种实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,图1是本发明提供的企业办公地址的识别方法的一种实施例的流程示意图;如图1所示,企业办公地址的识别方法的具体步骤包括步骤101至步骤103:
步骤101:根据待识别企业地址的关联数据,构建第一特征;其中,第一特征包括与待识别企业地址相关的文字信息以及数值信息。
在本实施例中,将所能够收集到的企业地址进行聚合,相同地点而不同描述的地址标记为同一个地址。聚合的地址包含与企业地址的时间、类型、使用次数、地址来源、地理位置及地址所属企业的企业注册信息相关联的信息特征。
作为本实施例的另一种举例,在根据待识别企业地址的关联数据,构建第一特征之后,还包括:对第一特征的文字信息进行数值编码,以转换为数值特征。
在本实施例中,将“地址来源组合”、“地址所在城市是否与注册地址城市一致”、“地址类型”等类别特征进行one-hot编码,其他数值型特征不做处理。其中,信息特征可优选包括以下信息:地址最新的使用时间,其表示地址最新日期与历史某一固定日期的时间差,相差天数越大说明这个地址的使用日期越新;地址最早使用时间至最新使用时间的时间跨度,其表示最新使用这个地址的日期与最早使用这个地址的日期相差的天数,相差天数越大,说明这个地址对该企业来说越稳定,长时间没有变化;地址使用的次数,其表示在所有收集到的地址中,被标记为同一个地址的地址数量,数量越多,说明这个地址在所属企业中使用的频率越高;地址来源组合,其表示该地址在哪些不同的地方被使用过,对所有来源进行排列组合的结果进行数字编码,每一个数字代表一种来源组合,例如:1表示地址来自工商注册地址和工商年报的通讯地址;对应地址所在城市与该企业的注册地址所在城市是否一致(0表示不一致,1表示一致),通常办公地址虽与注册地址不一致,但是基本是在同一城市;该地址在招聘信息中的使用频率,其表示对于招聘地址,计算在近六个月内,该地址在招聘信息中出现的频率,而使用频率越大,说明该地址对该企业来说,活跃度越高,越可能是该企业的办公地址;在同一家企业的候选地址中,对使用日期最早及最新的地址进行标记,同时计算其他地址与最早、最新地址的时间差作为信息特征之一;获取每个地址的地图POI信息作为信息特征之一,并将POI信息中的地址类型,并且进行数字编码;计算企业名称与POI地址名称的编辑距离,编辑距离越小,说明这个地址的描述与企业名称约相似(比如某些以企业名称命名的大厦);最后还包括企业注册资金,其表示用以区分不同企业之间的地址信息差异。以上信息共同组合形成特征组合。
步骤102:通过多个不同结构的预设分类算法模型,分别对第一特征进行特征提取,以输出多个第一分类概率结果;其中,各预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成。
在本实施例中,用多个不同结构的预训练监督学习算法模型对输入数据进行特征提取,分别输出多个分类概率结果。每一个分类概率结果介于0到1之间,代表着各分类器的判别结果。其中,通过真实性检验的多个企业地址的关联数据是通过人工预先检验的一组真实的地址数据,其用于分别训练各个分类器模型,使其达到最佳分类效果。
作为本实施例的另一种举例,各预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成,具体为:根据已通过真实性检验的多个企业地址的关联数据,构建第一训练特征;其中,第一训练特征包括与待识别企业地址相关的文字信息以及数值信息;对第一训练特征的文字信息进行数值编码,以转换为数值特征,并将经过转换处理后的第一训练特征构成训练集;获取多个分类算法初始模型,并通过训练集,分别对多个分类算法初始模型进行训练,获得多个不同结构的预设分类算法模型。
在本实施例中,已通过真实性检验的多个企业办公地址的关联数据组合形成数据集组合,并对数据进行预处理,以使数据转换为经过人工特征构造后的数值特征,以符合模型的输入条件。数据集组合处理完毕后,形成待训练的数据集。在构建好的训练集上训练不同的分类器,根据分类器效果及每个特征对输出结果的贡献程度进行特征选择,选择对输出结果有正向影响的特征,剔除对输出结果没有影响或有负向影响的特征,根据最终选择的特征确定最终的分类器;进一步的,为使得训练效果最优,选择各分类器训练结束时候,在测试中出现最大的F1值对应的模型作为分类器的模型。
作为本实施例的另一种举例,多个不同结构的预设分类算法模型包括:在LightGBM模型、随机深林模型和SVM模型中的任意两种或多种组合。
在本实施例中,多个分类算法模型可优选为有监督算法类型的LightGBM模型、随机森林模型和SVM模型中的任意两种或多种组合。以上算法模型是可用作分类算法模型的典型模型,也可选用GBDT、DT等算法模型。
步骤103:根据多个第一分类概率结果,确定待识别企业地址是否为待识别企业在当前时刻下的办公地址;
在本实施例中,根据多个第一分类概率结果,确定待识别企业地址是否为待识别企业在当前时刻下的办公地址,具体为:根据预设的权重,对多个第一分类概率进行加权平均计算,以输出第二分类概率结果;根据第二分类概率结果与预设的阈值的比较结果,确定待识别企业地址是否为待识别企业在当前时刻下的办公地址。
在本实施例中,根据各个分类器的表现,可优选为F1值,将每个分类器的结果进行加权平均,得到最终的分类概率结果。根据在整体训练阶段微调完善的阈值与最终分类概率结果的比较,即判断该结果是否在阈值的范围内,确定待识别企业地址是否为待识别企业在当前时刻下的办公地址。
请参见图2,图2是本发明提供的企业办公地址的识别装置的一种实施例的结构示意图;本实施例的具体步骤可以但不限于参见上述实施例的说明;如图2所示,企业办公地址的识别装置包括:包括:特征构建模块201、特征提取模块202、分类判断模块203;
其中,特征构建模块201用于根据待识别企业地址的关联数据,构建第一特征;其中,第一特征包括与待识别企业地址相关的文字信息以及数值信息;
特征提取模块202用于通过多个不同结构的预设分类算法模型,分别对第一特征进行特征提取,以输出多个第一分类概率结果;其中,各预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成;
分类判断模块203用于根据多个第一分类概率结果,确定待识别企业地址是否为待识别企业在当前时刻下的办公地址。
作为本实施例的一种举例,在根据待识别企业地址的关联数据,构建第一特征之后,还包括:
对第一特征的文字信息进行数值编码,以转换为数值特征。
作为本实施例的一种举例,特征提取模块202还包括模型训练模块;
模型训练模块用于根据已通过真实性检验的多个企业地址的关联数据,构建第一训练特征;其中,第一训练特征包括与待识别企业地址相关的文字信息以及数值信息;
对第一训练特征的文字信息进行数值编码,以转换为数值特征,并将经过转换处理后的第一训练特征构成训练集;
获取多个分类算法初始模型,并通过训练集,分别对多个分类算法初始模型进行训练,获得多个不同结构的预设分类算法模型。
作为本实施例的一种举例,分类判断模块203包括阈值判断模块;
阈值判断模块用于根据预设的权重,对多个第一分类概率进行加权平均计算,以输出第二分类概率结果;
根据第二分类概率结果与预设的阈值的比较结果,确定待识别企业地址是否为待识别企业在当前时刻下的办公地址。
作为本实施例的一种举例,多个不同结构的预设分类算法模型包括:在LightGBM模型、随机森林模型和SVM模型中的任意两种或多种组合。
由上可见,本发明实施例提供的一种企业办公地址的识别方法及装置,通过根据待识别企业地址的关联数据,构建第一特征;其中,第一特征包括与待识别企业地址相关的文字信息以及数值信息;通过多个不同结构的预设分类算法模型,分别对第一特征进行特征提取,以输出多个第一分类概率结果;其中,各预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成;根据多个第一分类概率结果,确定待识别企业地址是否为待识别企业在当前时刻下的办公地址。通过采用本发明实施例,能够准确判断企业的实际办公地址是否与当前待识别的地址一致,解决了人工识别企业实际办公地址准确率不高,效率低的问题。
进一步的,对第一特征的文字信息进行数值编码,以转换为数值特征。通过采用本发明实施例,能将文字信息以合理的数值编码形式转换为符合分类算法模型输入格式的数据,从而进一步的增加模型的数据输入维度,提高地址识别的准确率。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (10)

1.一种企业办公地址的识别方法,其特征在于,包括:
根据待识别企业地址的关联数据,构建第一特征;其中,所述第一特征包括与所述待识别企业地址相关的文字信息以及数值信息;
通过多个不同结构的预设分类算法模型,分别对所述第一特征进行特征提取,以输出多个第一分类概率结果;其中,各所述预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成;
根据所述多个第一分类概率结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址。
2.根据权利要求1所述的企业办公地址的识别方法,其特征在于,在所述根据待识别企业地址的关联数据,构建第一特征之后,还包括:
对所述第一特征的所述文字信息进行数值编码,以转换为数值特征。
3.根据权利要求1所述的企业办公地址的识别方法,其特征在于,所述各所述预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成,具体为:
根据已通过真实性检验的多个企业地址的关联数据,构建第一训练特征;其中,所述第一训练特征包括与所述待识别企业地址相关的文字信息以及数值信息;
对所述第一训练特征的所述文字信息进行数值编码,以转换为数值特征,并将经过转换处理后的所述第一训练特征构成训练集;
获取多个分类算法初始模型,并通过所述训练集,分别对所述多个分类算法初始模型进行训练,获得所述多个不同结构的预设分类算法模型。
4.根据权利要求1所述的企业办公地址的识别方法,其特征在于,所述根据所述多个第一分类概率结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址,具体为:
根据预设的权重,对所述多个第一分类概率进行加权平均计算,以输出第二分类概率结果;
根据所述第二分类概率结果与预设的阈值的比较结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址。
5.根据权利要求1所述的企业办公地址的识别方法,其特征在于,所述多个不同结构的预设分类算法模型包括:在LightGBM模型、随机森林模型和SVM模型中的任意两种或多种组合。
6.一种企业办公地址的识别装置,其特征在于,包括:特征构建模块、特征提取模块、分类判断模块;
其中,所述特征构建模块用于根据待识别企业地址的关联数据,构建第一特征;其中,所述第一特征包括与所述待识别企业地址相关的文字信息以及数值信息;
所述特征提取模块用于通过多个不同结构的预设分类算法模型,分别对所述第一特征进行特征提取,以输出多个第一分类概率结果;其中,各所述预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成;
所述分类判断模块用于根据所述多个第一分类概率结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址。
7.根据权利要求6所述的企业办公地址的识别装置,其特征在于,在所述根据待识别企业地址的关联数据,构建第一特征之后,还包括:
对所述第一特征的所述文字信息进行数值编码,以转换为数值特征。
8.根据权利要求6所述的企业办公地址的识别装置,其特征在于,所述特征提取模块还包括模型训练模块;
所述模型训练模块用于根据已通过真实性检验的多个企业地址的关联数据,构建第一训练特征;其中,所述第一训练特征包括与所述待识别企业地址相关的文字信息以及数值信息;
对所述第一训练特征的所述文字信息进行数值编码,以转换为数值特征,并将经过转换处理后的所述第一训练特征构成训练集;
获取多个分类算法初始模型,并通过所述训练集,分别对所述多个分类算法初始模型进行训练,获得所述多个不同结构的预设分类算法模型。
9.根据权利要求6所述的企业办公地址的识别装置,其特征在于,所述分类判断模块包括阈值判断模块;
所述阈值判断模块用于根据预设的权重,对所述多个第一分类概率进行加权平均计算,以输出第二分类概率结果;
根据所述第二分类概率结果与预设的阈值的比较结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址。
10.根据权利要求6所述的企业办公地址的识别装置,其特征在于,所述多个不同结构的预设分类算法模型包括:在LightGBM模型、随机森林模型和SVM模型中的任意两种或多种组合。
CN202110385974.6A 2021-04-09 2021-04-09 一种企业办公地址的识别方法及装置 Active CN113159149B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110385974.6A CN113159149B (zh) 2021-04-09 2021-04-09 一种企业办公地址的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110385974.6A CN113159149B (zh) 2021-04-09 2021-04-09 一种企业办公地址的识别方法及装置

Publications (2)

Publication Number Publication Date
CN113159149A true CN113159149A (zh) 2021-07-23
CN113159149B CN113159149B (zh) 2023-04-07

Family

ID=76889786

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110385974.6A Active CN113159149B (zh) 2021-04-09 2021-04-09 一种企业办公地址的识别方法及装置

Country Status (1)

Country Link
CN (1) CN113159149B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722617A (zh) * 2021-09-30 2021-11-30 京东城市(北京)数字科技有限公司 企业实际办公地址的识别方法、装置及电子设备
CN113837719A (zh) * 2021-09-15 2021-12-24 携程旅游网络技术(上海)有限公司 计算机办公地点的获取方法、系统、电子设备和介质
CN115858712A (zh) * 2023-02-01 2023-03-28 广州探迹科技有限公司 基于改进nlp算法的地址信息映射方法、系统以及介质
CN115858760A (zh) * 2023-03-02 2023-03-28 广州嘉为科技有限公司 一种知识图谱的问答推理方法、装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967332A (zh) * 2017-11-28 2018-04-27 厦门市美亚柏科信息股份有限公司 企业地址识别方法及识别系统
CN110069626A (zh) * 2017-11-09 2019-07-30 菜鸟智能物流控股有限公司 一种目标地址的识别方法、分类模型的训练方法以及设备
CN110633345A (zh) * 2019-08-16 2019-12-31 阿里巴巴集团控股有限公司 一种企业注册地址的识别方法及系统
US20200058042A1 (en) * 2018-08-20 2020-02-20 NTEX Transportation Services Pvt. Ltd. Method and system for smart address classification
CN112329467A (zh) * 2020-11-03 2021-02-05 腾讯科技(深圳)有限公司 地址识别方法、装置、电子设备以及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069626A (zh) * 2017-11-09 2019-07-30 菜鸟智能物流控股有限公司 一种目标地址的识别方法、分类模型的训练方法以及设备
CN107967332A (zh) * 2017-11-28 2018-04-27 厦门市美亚柏科信息股份有限公司 企业地址识别方法及识别系统
US20200058042A1 (en) * 2018-08-20 2020-02-20 NTEX Transportation Services Pvt. Ltd. Method and system for smart address classification
CN110633345A (zh) * 2019-08-16 2019-12-31 阿里巴巴集团控股有限公司 一种企业注册地址的识别方法及系统
CN112329467A (zh) * 2020-11-03 2021-02-05 腾讯科技(深圳)有限公司 地址识别方法、装置、电子设备以及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837719A (zh) * 2021-09-15 2021-12-24 携程旅游网络技术(上海)有限公司 计算机办公地点的获取方法、系统、电子设备和介质
CN113722617A (zh) * 2021-09-30 2021-11-30 京东城市(北京)数字科技有限公司 企业实际办公地址的识别方法、装置及电子设备
CN115858712A (zh) * 2023-02-01 2023-03-28 广州探迹科技有限公司 基于改进nlp算法的地址信息映射方法、系统以及介质
CN115858760A (zh) * 2023-03-02 2023-03-28 广州嘉为科技有限公司 一种知识图谱的问答推理方法、装置及存储介质

Also Published As

Publication number Publication date
CN113159149B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN113159149B (zh) 一种企业办公地址的识别方法及装置
CN107657267B (zh) 产品潜在用户挖掘方法及装置
CN107016042B (zh) 一种基于用户位置日志的地址信息校验系统
CN109583966A (zh) 一种高价值客户识别方法、系统、设备及存储介质
CN110866832A (zh) 一种风险控制方法、系统、存储介质及计算设备
CN112258029B (zh) 地铁站周边共享单车的需求预测方法
CN117112782A (zh) 一种招标公告信息提取方法
CN116089873A (zh) 模型训练方法、数据分类分级方法、装置、设备及介质
CN115759640A (zh) 一种智慧城市的公共服务信息处理系统及方法
CN114912717B (zh) 基于物联网的智慧城市保障住房申请风险评估方法和系统
CN114997169A (zh) 一种实体词识别方法、装置、电子设备及可读存储介质
CN113487241A (zh) 企业环保信用等级的分类方法、装置、设备及存储介质
CN113706291A (zh) 欺诈风险预测方法、装置、设备及存储介质
CN113011961B (zh) 公司关联信息风险监测方法、装置、设备及存储介质
CN112818668B (zh) 气象灾情数据语义识别分析方法和系统
CN113628043B (zh) 基于数据分类的投诉有效性判断方法、装置、设备及介质
CN109617864B (zh) 一种网站识别方法及网站识别系统
CN111260490A (zh) 基于树模型的车险快速理赔方法和系统
CN113569048A (zh) 一种基于企业经营范围自动划分所属行业的方法及系统
CN115713399B (zh) 一种结合第三方数据源的用户信用评估系统
CN113379169B (zh) 信息处理方法、装置、设备及介质
CN115293867A (zh) 财务报销用户画像优化方法、装置、设备及存储介质
CN111652102B (zh) 一种输电通道目标物辨识方法及系统
TWI617998B (zh) System and method for car number identification data filtering
CN114418024B (zh) 学历预测方法、系统、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant