CN110532546A - 一种融合地理位置和文本相似性的警情自动下发方法 - Google Patents

一种融合地理位置和文本相似性的警情自动下发方法 Download PDF

Info

Publication number
CN110532546A
CN110532546A CN201910689245.2A CN201910689245A CN110532546A CN 110532546 A CN110532546 A CN 110532546A CN 201910689245 A CN201910689245 A CN 201910689245A CN 110532546 A CN110532546 A CN 110532546A
Authority
CN
China
Prior art keywords
address
alert
term vector
chinese
chinese address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910689245.2A
Other languages
English (en)
Other versions
CN110532546B (zh
Inventor
宋凯磊
韩志卓
司佳
侯位昭
齐幸辉
张世立
董德华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HEBEI FAREAST COMMUNICATION SYSTEM ENGINEERING CO LTD
CETC 54 Research Institute
Original Assignee
HEBEI FAREAST COMMUNICATION SYSTEM ENGINEERING Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HEBEI FAREAST COMMUNICATION SYSTEM ENGINEERING Co Ltd filed Critical HEBEI FAREAST COMMUNICATION SYSTEM ENGINEERING Co Ltd
Priority to CN201910689245.2A priority Critical patent/CN110532546B/zh
Publication of CN110532546A publication Critical patent/CN110532546A/zh
Application granted granted Critical
Publication of CN110532546B publication Critical patent/CN110532546B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种融合地理位置和文本相似性的警情自动下发方法,属于智慧警务公安技术领域。该方法融合了由FastText得到的地址词向量和根据地址解析服务得到经纬度信息,将二者组成的地址多元要素作为加权KNN模型的输入来训练分类器。同时加权KNN采用sigmoid函数自适应地权衡在不同经纬度解析精度下地址位置坐标与词向量相似性的权重,提高了模型的鲁棒性。以某市历史警情下发数据为依托,结果显示警情下发准确率在91%以上,验证了本发明在某市经纬度不准确、新地址冷启动等警情下发场景中的有效性及高效性。本专利由国家重点研发计划资助项目(2017YFC0820505)资助。

Description

一种融合地理位置和文本相似性的警情自动下发方法
技术领域
本发明属于智慧警务公安技术领域,尤其是指一种融合地理位置和文本相似性的警情自动下发方法。
背景技术
警情的下发效率直接关系到公安民警的出警质量,从而影响公安机关驾驭治安局势的能力和水平。在以往的警情下发中,一般只考虑地址位置的经纬度信息,这就导致在管辖范围界限模糊、经纬度定位不准确时,仍需手动下发警情,容易造成人力、物力的损失以及区域安全指数的降低。
现有技术中,申请号为CN201110405645.X的中国专利公开了一种警情下发方式,其主要是人工确认方式。申请号为CN201210258092.4的中国专利中提出了一种方法,其将接受到的警情信息经过字符识别、自动寻址处理后,群发到各治安卡口、对应发案辖区派出所和流动巡逻警力。但是,有的城市缺乏“派出所管辖范围”的基础数据,同时,某些地区地理信息系统不完善,存在地名不规范、经纬度定位不准确和派出所管辖范围边界不规则、包含离群点等问题。
对于这种情况,在区域划分时,城市功能区划分的聚类算法得到的凸包存在重合交叉的情况,仍需要在凸包功能区的基础上进行人工删除或融合功能区。在中文地址文本处理时,可以利用编辑距离度量中文地名文本相似性,同时借助形近字库解决错别字问题,但是该相似性的度量未考虑语义相似性,同时依赖于分词的准确性,不适用于某市地名不规范的场景;此外,还可以借助词袋模型或向量空间模型,将词向量化,但是词袋模型仅考虑了词频等统计信息,同样不能考虑上下文语义,并且维度过高。
可见,现有技术中的警情自动下发方法缺乏广泛的适用性,尤其是对于某些地理信息不规范、地名不规范的城市,存在管辖区域范围难以自动划分、无法对中文地名进行相似性度量的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种融合地理位置和文本相似性的警情自动下发方法,能够提高警情下发的自动化程度和下发的准确率。
为了实现上述目的,本发明采用的技术方案为:
一种融合地理位置和文本相似性的警情自动下发方法,包括以下步骤:
(1)当新警情到达时,根据警情中的中文地址,调用地图API,获取地址经纬度和地址理解度;
(2)借助jieba分词将中文地址切分为中文地址分词;
(3)根据中文地址分词,查询基于FastText分类器训练出的词向量库,得到中文地址的向量化表示,即中文地址词向量;
(4)根据地址理解度设置基于位置坐标相似性和中文地址文本语义相似性的自适应权重,其中,位置坐标相似性通过计算两个地址经纬度的余弦值得到,中文地址文本语义相似性通过计算两个中文地址词向量的余弦值得到;
(5)将所得到的地址经纬度、中文地址词向量和自适应权重输入给加权K最近邻分类算法,得到分类结果,即派出所id;
(6)根据派出所id将警情下发给对应派出所。
优选的,所述步骤(2)的具体方式为:
(201)利用网络爬虫技术获取国家统计局公布的某地的市、县/区、乡/镇、村/社区的地名信息;
(202)结合警情下发历史数据,利用正则表达式提取该地各小区的专有地名;
(203)构建包含该地的市、县/区、乡/镇、村/社区以及小区专有地名的专有地名字典;
(204)利用该地的专有地名字典,辅助jieba分词将中文地址划分成市、区、街道、街道号、小区、楼房号、单元号、房牌号的形式,形成符合FastText分类器输入的样本数据。
优选的,所述步骤(3)中词向量库的训练方式为:
(301)将警情下发历史数据中的中文地址切分后作为FastText分类器的输入样本;
(302)设置FastText分类器的参数,所述参数包括学习率lr、样本数据被训练的次数echo、词序列窗口大小n-gram,其中,n-gram、lr和echo的值采用5折交叉验证算法选取;
(303)开始FastText分类器训练,并用警情推送场景下的准确率和耗时评估FastText分类器的训练结果,当样本数据训练次数达到echo时,FastText分类器训练结束,得到警情自动下发领域中文地址的词向量库,该词向量库以矩阵形式存储有中文地址切分所得词汇的词向量;
所述步骤(3)中查询基于FastText分类器训练出的词向量库的具体方式为:
(311)根据警情下发历史数据中分词首次出现的顺序,将所述步骤(2)中切分好的各中文地址分词分别映射为索引,对索引进行one-hot编码,得到索引序列矩阵;
(312)将索引序列矩阵与词向量库矩阵相乘,得到各分词的词向量;
(313)对各分词的词向量进行叠加平均,得到中文地址的词向量。
优选的,所述步骤(4)的具体方式为:
(401)根据地址理解度计算非线性权重w:
w=1/(1+e-(θ-90));
其中,θ为地图API返回的地址理解度,其用于度量地址编码解析服务的准确度,e为自然对数的底;
(402)基于非线性权重w,得到所述自适应权重:
AdaSim=w×LSim+(1-w)×TSim;
其中,AdaSim表示自适应权重,LSim表示位置坐标相似性,TSim表示中文地址文本语义相似性。
优选的,所述步骤(5)中,加权K最近邻分类算法的K个最近邻样本中的第i个样本的权值为:
其中,AdaSim表示自适应权重。
优选的,所述地图API为百度地图API。
本发明所取得的有益效果是:
1、本发明创新性地将区域划分问题转化为分类问题,综合考虑经纬度地理编码信息以及中文地名语义信息,提出了融合地址位置和文本相似性的警情自动下发方法,能够解决派出所管辖范围边界不规则、包含离群点的问题。
2、本发明通过融合了由FastText得到的地址词向量和根据地址解析服务得到经纬度信息,将二者组成的地址多元要素作为加权K最近邻分类算法模型(以下将K最近邻分类算法简称为KNN)的输入来训练模型分类器,分类结果更加准确。
3、本发明中的加权KNN采用sigmoid函数自适应地权衡在不同经纬度解析精度下地址位置坐标与词向量相似性的权重,提高了模型的鲁棒性。
4、本发明能够较好地处理离群点,且对新地址具有一定的发现能力,警情下发准确率在91%以上,能够实现警情的精准自动下发。
附图说明
图1为本发明实施例中加权KNN模型的训练流程图;
图2为本发明实施例的测试流程图;
图3为本发明实施例中FastText分类模型的训练流程图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步详述。
一种融合地理位置和文本相似性的警情自动下发方法,包括以下步骤:
(1)当新警情到达时,根据警情中的中文地址,调用地图API,获取地址经纬度和地址理解度;
(2)借助jieba分词将中文地址切分为中文地址分词;
(3)根据中文地址分词,查询基于FastText分类器训练出的词向量库,得到中文地址的向量化表示,即中文地址词向量;
(4)根据地址理解度设置基于位置坐标相似性和中文地址文本语义相似性的自适应权重,其中,位置坐标相似性通过计算两个地址经纬度的余弦值得到,中文地址文本语义相似性通过计算两个中文地址词向量的余弦值得到;
(5)将所得到的地址经纬度、中文地址词向量和自适应权重输入给加权K最近邻分类算法,得到分类结果,即派出所id;
(6)根据派出所id将警情下发给对应派出所。
优选的,所述步骤(2)的具体方式为:
(201)利用网络爬虫技术获取国家统计局公布的某地的市、县/区、乡/镇、村/社区的地名信息;
(202)结合警情下发历史数据,利用正则表达式提取该地各小区的专有地名;
(203)构建包含该地的市、县/区、乡/镇、村/社区以及小区专有地名的专有地名字典;
(204)利用该地的专有地名字典,辅助jieba分词将中文地址划分成市、区、街道、街道号、小区、楼房号、单元号、房牌号的形式,形成符合FastText分类器输入的样本数据。
优选的,所述步骤(3)中词向量库的训练方式为:
(301)将警情下发历史数据中的中文地址切分后作为FastText分类器的输入样本;
(302)设置FastText分类器的参数,所述参数包括学习率lr、样本数据被训练的次数echo、词序列窗口大小n-gram,其中,n-gram、lr和echo的值采用5折交叉验证算法选取;
(303)开始FastText分类器训练,并用警情推送场景下的准确率和耗时评估FastText分类器的训练结果,当样本数据训练次数达到echo时,FastText分类器训练结束,得到警情自动下发领域中文地址的词向量库,该词向量库以矩阵形式存储有中文地址切分所得词汇的词向量;
所述步骤(3)中查询基于FastText分类器训练出的词向量库的具体方式为:
(311)根据警情下发历史数据中分词首次出现的顺序,将所述步骤(2)中切分好的各中文地址分词分别映射为索引,对索引进行one-hot编码,得到索引序列矩阵;
(312)将索引序列矩阵与词向量库矩阵相乘,得到各分词的词向量;
(313)对各分词的词向量进行叠加平均,得到中文地址的词向量。
优选的,所述步骤(4)的具体方式为:
(401)根据地址理解度计算非线性权重w:
w=1/(1+e-(θ-90));
其中,θ为地图API返回的地址理解度,其用于度量地址编码解析服务的准确度,e为自然对数的底;
(402)基于非线性权重w,得到所述自适应权重:
AdaSim=w×LSim+(1-w)×TSim;
其中,AdaSim表示自适应权重,LSim表示位置坐标相似性,TSim表示中文地址文本语义相似性。
优选的,所述步骤(5)中,加权K最近邻分类算法的K个最近邻样本中的第i个样本的权值为:
其中,AdaSim表示自适应权重。
优选的,所述地图API为百度地图API。
以下为一个更具体的例子:
一种融合地理位置和文本相似性的警情自动下发方法,其中,加权KNN模型的训练流程如图1所示,测试流程如图2所示,FastText分类模型的训练流程如图3所示。该方法具体包括以下步骤:
步骤1:构建本市专有地名字典。
利用网络爬虫技术获取国家统计局(http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2017/)公布的某地市、县(区)、乡(镇)、村(社区)地名信息。
例如:河北省石家庄市桥西区红旗街道办事处滨河社区居委会
步骤2:提取补充本市小区专有地名。
基于警情下发历史数据,利用正则表达式提取补充该地小区专有地名。
例如:军城港湾棕榈湾果岭湾
步骤3:构建本市、县(区)、乡(镇)、村(社区)、小区专有地名字典。
将步骤2所得到的本市小区专有地名添加到步骤1所得本市专有地名字典之后,得到本市、县(区)、乡(镇)、村(社区)、小区专有地名字典。
步骤4:构建原始历史警情数据集。
选取某市9万条警情下发历史数据,原始数据属性包括警情地址及下发派出所编号id标签。警情下发历史数据格式如下:
例如:__label__0000000河东市河西区河道南路000号河湖小区0号楼0单元000号
步骤5:在警情下发历史数据划分时,为提高划分精度,用某市专有地名字典辅助jieba分词将警情下发历史数据划分成:某地市、区、街道、街道号、小区、楼房号、单元号、房牌号,并且不同地市级别之间用空格隔开,从而形成一条符合FastText输入的样本数据。
例如:
__label__0000000河东市河西区河道南路000号河湖小区0号楼0单元000号
步骤6:警情下发历史数据的中文地址信息调用百度地图API获取地址经纬度、地址理解度信息;
例如:历史警情数据__label__0000000河东市河西区河道南路000号河湖小区0号楼0单元000号的经度lng为83.4653°(东经为正数,西经为负数),纬度lat为42.8212°(北纬为正数,南纬为负数),地址理解度θ为92。
步骤7:根据地址理解度计算位置坐标相似性与中文地址文本语义相似性的权重。
w=1/(1+e-(92-90))≈0.8808
AdaSim=0.8808×LSim+0.1192×TSim
LSim为位置坐标相似性,TSim为中文地址文本语义相似性。具体来说:
步骤8:对FastText分类器进行训练。
首先选取一组参数值:n-gram=1,epoch=5,lr=0.1,将符合FastText输入的样本数据,如__label__0000000河东市河西区河道南路000号河湖小区0号楼0单元000号输入到FastText分类器,训练结束时记录精度、时间指标(如下表所示)。改变不同的参数值,得到多组FastText分类器的训练结果。
通过多次训练之后,根据5折交叉验证算法选取最有参数为:n-gram=1,epoch=10,lr=1.0,训练结束,得到FastText分类器训练好的模型和训练结果:本市警情自动下发中文地址词向量库。
步骤9:加权KNN的k值的选择。
在本方法中,采用交叉验证算法,选出误差率最小的模型,k=3。
步骤10:对新警情数据x进行测试。
在分类时,KNN把与x最近的归位一类,由k值得到基于x距离最近的3个样本y1,y2,y3。例如,x经纬度(87.5653°,43.8002°),y1经纬度(75.9830°,39.4776°),
此时,x中文地址词向量为111001,y1中文地址词向量为100001,
AdaSim=0.8808*0.99+0.1192*0.71≈0.96
由步骤7和步骤8得到:
AdaSim1=0.96,AdaSim2=0.83,AdaSim3=0.77
基于距离的加权KNN对于近邻得到如下加权:
α1=0.96/(0.96+0.83+0.77)≈0.375
α2=0.83/(0.96+0.83+0.77)≈0.324
α3=0.77/(0.96+0.83+0.77)≈0.301
加权KNN方法准则:
c表示类别个数,j表示样本标签,δ(m,n)为指示函数,当且仅当m=n时值为1。
样本 label
y<sub>1</sub> __label__0000010
y<sub>2</sub> __label__0000010
y<sub>3</sub> __label__0000011
标签j1的加权票数:0.375+0.324=0.699
标签j2的加权票数:0.301
步骤11:对于新警情数据x经过FastText-加权KNN方法后得到准确的警情下发派出所id为__label__0000010。
总之,本发明为一种融合地理位置和文本相似性的警情自动下发方法,该方法融合了由FastText得到的地址词向量和根据地址解析服务得到经纬度信息,将二者组成的地址多元要素作为加权KNN模型的输入来训练分类器。同时加权KNN采用sigmoid函数自适应地权衡在不同经纬度解析精度下地址位置坐标与词向量相似性的权重,提高了模型的鲁棒性。以某市历史警情下发数据为依托,结果显示警情下发准确率在91%以上,验证了本发明在某市经纬度不准确、新地址冷启动等警情下发场景中的有效性及高效性。
本专利由国家重点研发计划资助项目(2017YFC0820505)资助。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

Claims (6)

1.一种融合地理位置和文本相似性的警情自动下发方法,其特征在于,包括以下步骤:
(1)当新警情到达时,根据警情中的中文地址,调用地图API,获取地址经纬度和地址理解度;
(2)借助jieba分词将中文地址切分为中文地址分词;
(3)根据中文地址分词,查询基于FastText分类器训练出的词向量库,得到中文地址的向量化表示,即中文地址词向量;
(4)根据地址理解度设置基于位置坐标相似性和中文地址文本语义相似性的自适应权重,其中,位置坐标相似性通过计算两个地址经纬度的余弦值得到,中文地址文本语义相似性通过计算两个中文地址词向量的余弦值得到;
(5)将所得到的地址经纬度、中文地址词向量和自适应权重输入给加权K最近邻分类算法,得到分类结果,即派出所id;
(6)根据派出所id将警情下发给对应派出所。
2.根据权利要求1所述的一种融合地理位置和文本相似性的警情自动下发方法,其特征在于,所述步骤(2)的具体方式为:
(201)利用网络爬虫技术获取国家统计局公布的某地的市、县/区、乡/镇、村/社区的地名信息;
(202)结合警情下发历史数据,利用正则表达式提取该地各小区的专有地名;
(203)构建包含该地的市、县/区、乡/镇、村/社区以及小区专有地名的专有地名字典;
(204)利用该地的专有地名字典,辅助jieba分词将中文地址划分成市、区、街道、街道号、小区、楼房号、单元号、房牌号的形式,形成符合FastText分类器输入的样本数据。
3.根据权利要求1所述的一种基于融合地理位置和文本相似性的警情自动下发方法,其特征在于,所述步骤(3)中词向量库的训练方式为:
(301)将警情下发历史数据中的中文地址切分后作为FastText分类器的输入样本;
(302)设置FastText分类器的参数,所述参数包括学习率lr、样本数据被训练的次数echo、词序列窗口大小n-gram,其中,n-gram、lr和echo的值采用5折交叉验证算法选取;
(303)开始FastText分类器训练,并用警情推送场景下的准确率和耗时评估FastText分类器的训练结果,当样本数据训练次数达到echo时,FastText分类器训练结束,得到警情自动下发领域中文地址的词向量库,该词向量库以矩阵形式存储有中文地址切分所得词汇的词向量;
所述步骤(3)中查询基于FastText分类器训练出的词向量库的具体方式为:
(311)根据警情下发历史数据中分词首次出现的顺序,将所述步骤(2)中切分好的各中文地址分词分别映射为索引,对索引进行one-hot编码,得到索引序列矩阵;
(312)将索引序列矩阵与词向量库矩阵相乘,得到各分词的词向量;
(313)对各分词的词向量进行叠加平均,得到中文地址的词向量。
4.根据权利要求1所述的一种融合地理位置和文本相似性的警情自动下发方法,其特征在于,所述步骤(4)的具体方式为:
(401)根据地址理解度计算非线性权重w:
w=1/(1+e-(θ-90));
其中,θ为地图API返回的地址理解度,其用于度量地址编码解析服务的准确度,e为自然对数的底;
(402)基于非线性权重w,得到所述自适应权重:
AdaSim=w×LSim+(1-w)×TSim;
其中,AdaSim表示自适应权重,LSim表示位置坐标相似性,TSim表示中文地址文本语义相似性。
5.根据权利要求1所述的一种基于融合地理位置和文本相似性的警情自动下发方法,其特征在于,所述步骤(5)中,加权K最近邻分类算法的K个最近邻样本中的第i个样本的权值为:
其中,AdaSim表示自适应权重。
6.根据权利要求1所述的一种基于融合地理位置和文本相似性的警情自动下发方法,其特征在于,所述地图API为百度地图API。
CN201910689245.2A 2019-07-29 2019-07-29 一种融合地理位置和文本相似性的警情自动下发方法 Active CN110532546B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910689245.2A CN110532546B (zh) 2019-07-29 2019-07-29 一种融合地理位置和文本相似性的警情自动下发方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910689245.2A CN110532546B (zh) 2019-07-29 2019-07-29 一种融合地理位置和文本相似性的警情自动下发方法

Publications (2)

Publication Number Publication Date
CN110532546A true CN110532546A (zh) 2019-12-03
CN110532546B CN110532546B (zh) 2023-03-31

Family

ID=68661019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910689245.2A Active CN110532546B (zh) 2019-07-29 2019-07-29 一种融合地理位置和文本相似性的警情自动下发方法

Country Status (1)

Country Link
CN (1) CN110532546B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112699640A (zh) * 2021-03-23 2021-04-23 城云科技(中国)有限公司 基于PostgreSQL的地理编码方法和系统
CN112988933A (zh) * 2021-03-11 2021-06-18 北京汇钧科技有限公司 地址信息管理的方法和装置
CN113627184A (zh) * 2020-05-08 2021-11-09 北京京东振世信息技术有限公司 数据处理方法和装置
CN113673240A (zh) * 2021-07-30 2021-11-19 中国地质大学(武汉) 综合空间实体关系推断文本地理位置的方法和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050196A (zh) * 2013-03-15 2014-09-17 阿里巴巴集团控股有限公司 一种兴趣点数据冗余检测方法及装置
CN104699763A (zh) * 2015-02-11 2015-06-10 中国科学院新疆理化技术研究所 多特征融合的文本相似性度量系统
CN105005577A (zh) * 2015-05-08 2015-10-28 裴克铭管理咨询(上海)有限公司 一种地址匹配方法
CN105786800A (zh) * 2016-03-23 2016-07-20 苏州数字地图信息科技股份有限公司 一种警用标准地址获取方法及系统
CN106598953A (zh) * 2016-12-28 2017-04-26 上海博辕信息技术服务有限公司 地址解析方法及装置
CN108171529A (zh) * 2017-12-04 2018-06-15 昆明理工大学 一种地址相似度评估方法
CN109145169A (zh) * 2018-07-26 2019-01-04 浙江省测绘科学技术研究院 一种基于统计分词的地址匹配方法
CN109255565A (zh) * 2017-07-14 2019-01-22 菜鸟智能物流控股有限公司 地址的归属识别和物流任务的分发方法及其装置
CN109255564A (zh) * 2017-07-13 2019-01-22 菜鸟智能物流控股有限公司 一种取件点地址推荐方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050196A (zh) * 2013-03-15 2014-09-17 阿里巴巴集团控股有限公司 一种兴趣点数据冗余检测方法及装置
CN104699763A (zh) * 2015-02-11 2015-06-10 中国科学院新疆理化技术研究所 多特征融合的文本相似性度量系统
CN105005577A (zh) * 2015-05-08 2015-10-28 裴克铭管理咨询(上海)有限公司 一种地址匹配方法
CN105786800A (zh) * 2016-03-23 2016-07-20 苏州数字地图信息科技股份有限公司 一种警用标准地址获取方法及系统
CN106598953A (zh) * 2016-12-28 2017-04-26 上海博辕信息技术服务有限公司 地址解析方法及装置
CN109255564A (zh) * 2017-07-13 2019-01-22 菜鸟智能物流控股有限公司 一种取件点地址推荐方法及装置
CN109255565A (zh) * 2017-07-14 2019-01-22 菜鸟智能物流控股有限公司 地址的归属识别和物流任务的分发方法及其装置
CN108171529A (zh) * 2017-12-04 2018-06-15 昆明理工大学 一种地址相似度评估方法
CN109145169A (zh) * 2018-07-26 2019-01-04 浙江省测绘科学技术研究院 一种基于统计分词的地址匹配方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
STEPHEN ROLLER 等: "Supervised Text-based Geolocation Using Language Models on an Adaptive Grid", 《PROCEEDINGS OF THE 2012 JOINT CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING AND COMPUTATIONAL NATURAL LANGUAGE LEARNING》 *
胡涛: "地址匹配及其在城市疾病制图与空间分析中的应用研究", 《中国博士学位论文全文数据库 医药卫生科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627184A (zh) * 2020-05-08 2021-11-09 北京京东振世信息技术有限公司 数据处理方法和装置
CN113627184B (zh) * 2020-05-08 2023-09-26 北京京东振世信息技术有限公司 数据处理方法和装置
CN112988933A (zh) * 2021-03-11 2021-06-18 北京汇钧科技有限公司 地址信息管理的方法和装置
CN112699640A (zh) * 2021-03-23 2021-04-23 城云科技(中国)有限公司 基于PostgreSQL的地理编码方法和系统
CN113673240A (zh) * 2021-07-30 2021-11-19 中国地质大学(武汉) 综合空间实体关系推断文本地理位置的方法和存储介质
CN113673240B (zh) * 2021-07-30 2023-07-04 中国地质大学(武汉) 综合空间实体关系推断文本地理位置的方法和存储介质

Also Published As

Publication number Publication date
CN110532546B (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
CN110532546A (zh) 一种融合地理位置和文本相似性的警情自动下发方法
CN111242493B (zh) 一种街道品质评价方法、装置、系统及存储介质
Goldberg et al. From text to geographic coordinates: the current state of geocoding
Pijanowski et al. Modelling urbanization patterns in two diverse regions of the world
CN112329467A (zh) 地址识别方法、装置、电子设备以及存储介质
CN108288321A (zh) 基于ic卡数据与车辆gps信息的公交站点上下客流量确定方法
CN111698774B (zh) 基于多源信息融合的室内定位方法及装置
CN106845559A (zh) 顾及poi数据空间异质性的地表覆盖验证方法及系统
CN107270922A (zh) 一种基于poi索引的交通事故空间定位方法
CN106713380A (zh) 一种基于位置感知的信息共享、推送与交换系统
CN111401692A (zh) 一种度量城市空间功能紧凑度的方法
CN106021290A (zh) 一种基于多尺度地理信息的社交网络关联挖掘方法
CN105893352A (zh) 一种基于社交网络大数据的空气质量预警和监测分析系统
CN115115244B (zh) 矿业项目投资环境的评价方法、装置及计算机设备
CN111625732B (zh) 地址匹配方法及装置
CN113672788B (zh) 一种基于多源数据和权重系数法的城市建筑功能分类方法
CN110781256A (zh) 基于发送位置数据确定与Wi-Fi相匹配的POI的方法及装置
CN113888867A (zh) 一种基于lstm位置预测的车位推荐方法及系统
CN116384844B (zh) 基于地理信息云平台的决策方法及装置
CN114071366B (zh) 结合知识图谱的人物画像刻画方法、系统和可读存储介质
CN115965282A (zh) 一种乡村发展水平的动态监测与评估的方法及装置
CN115169922A (zh) 一种基于大数据机器学习的充电桩选址方法
CN115129769A (zh) 一种居民出行调查扩样方法、装置及存储介质
CN110311991B (zh) 基于svm分类模型的街道级地标获取方法
CN111126120B (zh) 城市区域分类方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200714

Address after: 050081 No. 589 West Zhongshan Road, Hebei, Shijiazhuang

Applicant after: THE 54TH RESEARCH INSTITUTE OF CHINA ELECTRONICS TECHNOLOGY Group Corp.

Applicant after: HEBEI FAREAST COMMUNICATION SYSTEM ENGINEERING Co.,Ltd.

Address before: 050200 Hebei city of Shijiazhuang province Luquan Economic Development Zone Changsheng Street No. 21

Applicant before: HEBEI FAREAST COMMUNICATION SYSTEM ENGINEERING Co.,Ltd.

GR01 Patent grant
GR01 Patent grant