CN110688439A - 一种基于区域地理编码自动识别企业信息和分析的方法 - Google Patents
一种基于区域地理编码自动识别企业信息和分析的方法 Download PDFInfo
- Publication number
- CN110688439A CN110688439A CN201910918400.3A CN201910918400A CN110688439A CN 110688439 A CN110688439 A CN 110688439A CN 201910918400 A CN201910918400 A CN 201910918400A CN 110688439 A CN110688439 A CN 110688439A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- point
- axis
- enterprises
- polygon
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
本发明公开了一种基于区域地理编码自动识别企业信息和分析的方法,包括以下步骤:(1)通过企业地址信息获取企业地理编码,进而通过企业地理编码确定该企业所在地图的地理位置,并将地理位置数据存入数据库。(2)将地图的地理位置进行区域划分,确定划分好的区域。(3)采用Ray‑crossing算法,遍历划分好的区域,判断该企业的地理位置是否在所述划分好的区域内,若是即该企业在划分好的区域内,否则在划分好的区域外。(4)通过不同维度分析所述划分好的区域内的企业。本发明中采用了自动识别获取区域内的企业信息,再进行多维度企业分析,减少了耗时时长,降低了资源开销的问题。
Description
技术领域
本发明涉及区域企业分析领域,具体涉及一种基于区域地理编码自动识别企业信息和分析的方法。
背景技术
在区域企业分析领域中,一种重要的处理方法是针对一块划分好的区域,通过一定的规则智能获取区域内的企业信息,在基于区域企业信息,进行一系列的经济运行行业、产业热力分析、地域分析等。它可以应用到区域经济分析、区域企业分析、区域规划、区域发展等多种领域。
在划分好区域之后,再通过线下人为识别分配企业到区域内,再通过线下其他工具进行区域内的企业分析,且分析维度过于偏少。因此现有技术中的获取企业信息和分析方法存在耗时时长大、资源开销大的技术问题。尤其是在一些特殊需要对企业分析维度需要复杂计算的场景中,难度更是不可估量的。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于区域地理编码自动识别企业信息和分析的方法。
为了解决上述技术问题,采用如下技术方案:
一种基于区域地理编码自动识别企业信息和分析的方法,其特征在于包括以下步骤:
(1)通过企业地址信息获取企业地理编码,进而通过企业地理编码确定该企业所在地图的地理位置,并将地理位置数据存入数据库。
(2)将地图的地理位置进行区域划分,确定划分好的区域。
(3)采用Ray-crossing算法,遍历划分好的区域,判断该企业的地理位置是否在所述划分好的区域内,若是即该企业在划分好的区域内,否则在划分好的区域外。
(4)通过不同维度分析所述划分好的区域内的企业。
进一步,在所述步骤(2)中,所述区域划分的方法如下:
(a)选择所在的地区,在地图上实现选择地区功能,将选择好的省市区传入给地图;
(b)划区域轮廓,在地图上实现划区域功能,进入编辑地图的界面,根据需求划分区域;
(c)在地图上用鼠标点击,划分需要的范围,双击结束即可,划分出一个不规则的封闭区域;
(d)将划分好的封闭区域地理位置数据存入到所述数据库;
(e)应用通过查询地理位置数据,将轮廓图展示到应用页面。
进一步,在所述步骤(3)中,在进行Ray-crossing算法前,假设划分好的区域为多边形P,多边形P具有n个顶点,n个顶点分别标记为P1、P2、…、Pn,假设点Q为需要验证的企业所在地图的地理位置点,同时保证点Q和多边形P在同一二维平面内,且以Q为原点建立二维直角坐标系。
进一步,在所述步骤(3)中,所述Ray-crossing算法的具体过程如下:
(a)判断Q是否位于是P的顶点或者位于P的边上,如果是,点Q在多边形内部;
(b)在顶点集合P中寻找不在X轴上的顶点Ps,如果找不到,点Q在多边形外部。
(c)设i=1,从点Ps开始通过重复下面步骤直到所有的顶点都被访问到:
1)判断点Ps+i是否位于X轴上,如果在,递增i,如果s+i>n,那么将i设置为-s,从P0开始继续寻找,直到找到一个不位于X轴上的点Ps+i为止。
2)根据步骤1)中的查找过程,采取下面的操作:
i.如果步骤a中找Ps+i时没有skip掉任何顶点,那么判断从Ps到Ps+i的线段是否和X轴的正半轴相交,如相交,交点个数加1;本步骤i做轮询重复判断,所述轮询重复判断的次数n为大于等于2;
ii.如果步骤a中找Ps+i时skip掉至少一个X轴坐标为正的顶点,那么判断从Ps到Ps+i的线段是否和整个X轴相交,如相交,交点个数加1;本步骤ii做轮询重复判断,所述轮询重复判断的次数n为大于等于2;
iii.如果步骤a中找Ps+i时skip掉至少一个X轴坐标为负的顶点,不做任何操作;
3)Ps+i为下一轮迭代的起点;
(d)判断交点个数是奇数还是偶数,如果是奇数,说明点Q位于多边形P内部;如果是偶数,说明点Q位于多边形P外部。
进一步,在所述Ray-crossing算法的具体过程的步骤(b)中,根据步骤(a),Q不在P的顶点或者边上,而找不到不在X轴上的点Ps说明多边形P的点都在X轴上,而Q位于原点,说明Q在P的外部。具体操作步骤如下:以P1、P2、…、Pn展示一个平面,以P1和P4点连线为X轴,如果Q点在连线或边上找不到,则判断是在外部;再以P2和P3点连线为X轴,如果Q点在连线或边上找不到,则判断是在外部。以此类推,轮询判断两点之间连线为X轴,判断Q点是否在连线或边上,如果找不到则判断Q是在外部。
进一步,在所述Ray-crossing算法的具体过程的步骤(c)的iii中,假设同时skip掉位于X轴正半轴和X轴负半轴的点,则说明Q位于多边形的边上,返回步骤(a)。
进一步,所述通过不同维度分析所述划分好的区域内的企业包括如下:
1)通过企业性质对不同划区内的企业进行分析。
2)通过企业规模对不同划区内的企业进行分析。
3)通过上市企业、高新企业、集团企业标签对不同划区内的企业进行分析。
4)不同划区内的企业总数、新增企业、注册企业、办公企业、行业分布进行分析。
由于采用上述技术方案,具有以下有益效果:
本发明为一种基于区域地理编码自动识别企业信息和分析的方法,本发明为通过划分好的区域,自动识别区域内的企业信息,并进行多维度企业分析的方法。具体通过对企业地址信息获取企业地理编码,再通过划分好的区域,自动识别区域内的企业信息,从而进行一系列的经济运行行业、产业热力分析、企业类型、企业规模、经营状态、地域分析等。它可以应用到区域经济分析、区域企业分析、区域规划、区域发展等多种领域。
本发明中采用了自动识别获取区域内的企业信息,再进行多维度企业分析,减少了耗时时长,降低了资源开销的问题。
附图说明
下面结合附图对本发明作进一步说明:
图1为本发明中一种基于区域地理编码自动识别企业信息和分析的方法的流程示意图;
图2为本发明中划分好的区域的结构示意图;
图3为本发明中采用Ray-crossing算法区分企业是否在划分好的区域的结构示意图;
图4为本发明中采用Ray-crossing算法建立二维直角坐标系的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面通过附图及实施例,对本发明进行进一步详细说明。但是应该理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
实施例
如图1所示,一种基于区域地理编码自动识别企业信息和分析的方法,其特征在于包括以下步骤:
(1)通过企业地址信息获取企业地理编码,进而通过企业地理编码确定该企业所在地图的地理位置,并将地理位置数据存入数据库。
地理编码是指将坐标对、地址或地名等位置描述转换为地球表面上某位置的过程。进行地理编码时,您可以每次只输入一个位置描述,也可以表的形式一次提供多个描述。得到的位置将以带属性的地理要素形式输出,可以用于制图或空间分析操作。
(2)参看图2,将地图的地理位置进行区域划分,确定划分好的区域。
(3)采用Ray-crossing算法,遍历划分好的区域,判断该企业的地理位置是否在所述划分好的区域内,若是即该企业在划分好的区域内,否则在划分好的区域外。具体地,参看图3,通过Ray-crossing算法,自动识别企业A、企业B、企业C、企业D在划分好的区域内,企业E在区域外。
(4)通过不同维度分析所述划分好的区域内的企业。
在本实施例中,在所述步骤(2)中,所述区域划分的方法如下:
(a)选择所在的地区,在地图上实现选择地区功能,将选择好的省市区传入给地图;
(b)划区域轮廓,在地图上实现划区域功能,进入编辑地图的界面,根据需求划分区域;
(c)在地图上用鼠标点击,划分需要的范围,双击结束即可,划分出一个不规则的封闭区域;
(d)将划分好的封闭区域地理位置数据存入到所述数据库;
(e)应用通过查询地理位置数据,将轮廓图展示到应用页面。
在本实施例中,参看图4,在所述步骤(3)中,在进行Ray-crossing算法前,假设划分好的区域为多边形P,多边形P具有n个顶点,n个顶点分别标记为P1、P2、…、Pn,假设点Q为需要验证的企业所在地图的地理位置点,同时保证点Q和多边形P在同一二维平面内,可以考虑将Q和P通过坐标平移,使Q平移到坐标原点而其和P的相对位置不变,显然平移不会改变点Q与多边形P的位置关系(在多边形内或外),并建立以Q为原点建立二维直角坐标系。
在本实施例中,参看图4,在所述步骤(3)中,所述Ray-crossing算法的具体过程如下:
(a)判断Q是否位于是P的顶点或者位于P的边上,如果是,点Q在多边形内部;
(b)在顶点集合P中寻找不在X轴上的顶点Ps,如果找不到,点Q在多边形外部。根据步骤(a),Q不在P的顶点或者边上,而找不到不在X轴上的点Ps说明多边形P的点都在X轴上,而Q位于原点,说明Q在P的外部。参看图4,具体操作步骤如下:以P1、P2、…、Pn展示一个平面,以P1和P4点连线为X轴,如果Q点在连线或边上找不到,则判断是在外部;再以P2和P3点连线为X轴,如果Q点在连线或边上找不到,则判断是在外部。以此类推,轮询判断两点之间连线为X轴,判断Q点是否在连线或边上,如果找不到则判断Q是在外部。
(c)设i=1,从点Ps开始通过重复下面步骤直到所有的顶点都被访问到:
1)判断点Ps+i是否位于X轴上,如果在,递增i,如果s+i>n,那么将i设置为-s,从P0开始继续寻找,直到找到一个不位于X轴上的点Ps+i为止。
2)根据步骤1)中的查找过程,采取下面的操作:
i.如果步骤a中找Ps+i时没有skip掉任何顶点,那么判断从Ps到Ps+i的线段是否和X轴的正半轴相交,如相交,交点个数加1;本步骤i做轮询重复判断,所述轮询重复判断的次数n为大于等于2。
ii.如果步骤a中找Ps+i时skip掉至少一个X轴坐标为正的顶点,那么判断从Ps到Ps+i的线段是否和整个X轴相交,如相交,交点个数加1;本步骤ii做轮询重复判断,所述轮询重复判断的次数n为大于等于2;
iii.如果步骤a中找Ps+i时skip掉至少一个X轴坐标为负的顶点,不做任何操作;(假设同时skip掉位于X轴正半轴和X轴负半轴的点,则说明Q位于多边形的边上,返回步骤(a))
3)Ps+i为下一轮迭代的起点;
(d)判断交点个数是奇数还是偶数,如果是奇数,说明点Q位于多边形P内部;如果是偶数,说明点Q位于多边形P外部。
通过不同维度分析所述划分好的区域内的企业。
区域经济分析:通过省、市、县、园区/网格、企业的五级联动,分析划区内的税收、增速、经济密度等指标,对其划区进行排名等。
1)通过企业性质对不同划区内的企业进行分析,如国有、民营、合资、台港澳、外商独资等进行分析。
2)通过企业规模对不同划区内的企业进行分析,如2000万以下、2000万-1亿、1亿-20亿、20亿-50亿、50亿-100亿、100亿以上等进行分析。
3)通过上市企业、高新企业、集团企业标签对不同划区内的企业进行分析。
4)不同划区内的企业总数、新增企业、注册企业、办公企业、行业分布进行分析。
以上仅为本发明的具体实施例,但本发明的技术特征并不局限于此。任何以本发明为基础,为解决基本相同的技术问题,实现基本相同的技术效果,所作出地简单变化、等同替换或者修饰等,皆涵盖于本发明的保护范围之中。
Claims (7)
1.一种基于区域地理编码自动识别企业信息和分析的方法,其特征在于包括以下步骤:
(1)通过企业地址信息获取企业地理编码,进而通过企业地理编码确定该企业所在地图的地理位置,并将地理位置数据存入数据库;
(2)将地图的地理位置进行区域划分,确定划分好的区域;
(3)采用Ray-crossing算法,遍历划分好的区域,判断该企业的地理位置是否在所述划分好的区域内,若是即该企业在划分好的区域内,否则在划分好的区域外;
(4)通过不同维度分析所述划分好的区域内的企业。
2.根据权利要求1所述的一种基于区域地理编码自动识别企业信息和分析的方法,其特征在于:在所述步骤(2)中,所述区域划分的方法如下:
(a)选择所在的地区,在地图上实现选择地区功能,将选择好的省市区传入给地图;
(b)划区域轮廓,在地图上实现划区域功能,进入编辑地图的界面,根据需求划分区域;
(c)在地图上用鼠标点击,划分需要的范围,双击结束即可,划分出一个不规则的封闭区域;
(d)将划分好的封闭区域地理位置数据存入到所述数据库;
(e)应用通过查询地理位置数据,将轮廓图展示到应用页面。
3.根据权利要求1所述的一种基于区域地理编码自动识别企业信息和分析的方法,其特征在于:在所述步骤(3)中,在进行Ray-crossing算法前,假设划分好的区域为多边形P,多边形P具有n个顶点,n个顶点分别标记为P1、P2、…、Pn,假设点Q为需要验证的企业所在地图的地理位置点,同时保证点Q和多边形P在同一二维平面内,且以Q为原点建立二维直角坐标系。
4.根据权利要求3所述的一种基于区域地理编码自动识别企业信息和分析的方法,其特征在于:在所述步骤(3)中,所述Ray-crossing算法的具体过程如下:
(a)判断Q是否位于是P的顶点或者位于P的边上,如果是,点Q在多边形内部;
(b)在顶点集合P中寻找不在X轴上的顶点Ps,如果找不到,点Q在多边形外部;
(c)设i=1,从点Ps开始通过重复下面步骤直到所有的顶点都被访问到:
1)判断点Ps+i是否位于X轴上,如果在,递增i,如果s+i>n,那么将i设置为-s,从P0开始继续寻找,直到找到一个不位于X轴上的点Ps+i为止;
2)根据步骤1)中的查找过程,采取下面的操作:
i.如果步骤a中找Ps+i时没有skip掉任何顶点,那么判断从Ps到Ps+i的线段是否和X轴的正半轴相交,如相交,交点个数加1;本步骤i做轮询重复判断,所述轮询重复判断的次数n为大于等于2;
ii.如果步骤a中找Ps+i时skip掉至少一个X轴坐标为正的顶点,那么判断从Ps到Ps+i的线段是否和整个X轴相交,如相交,交点个数加1;本步骤ii做轮询重复判断,所述轮询重复判断的次数n为大于等于2;
iii.如果步骤a中找Ps+i时skip掉至少一个X轴坐标为负的顶点,不做任何操作;
3)Ps+i为下一轮迭代的起点;
(d)判断交点个数是奇数还是偶数,如果是奇数,说明点Q位于多边形P内部;如果是偶数,说明点Q位于多边形P外部。
5.根据权利要求4所述的一种基于区域地理编码自动识别企业信息和分析的方法,其特征在于:在所述Ray-crossing算法的具体过程的步骤(b)中,根据步骤(a),Q不在P的顶点或者边上,而找不到不在X轴上的点Ps说明多边形P的点都在X轴上,而Q位于原点,说明Q在P的外部;具体操作步骤如下:以P1、P2、…、Pn展示一个平面,以P1和P4点连线为X轴,如果Q点在连线或边上找不到,则判断是在外部;再以P2和P3点连线为X轴,如果Q点在连线或边上找不到,则判断是在外部。以此类推,轮询判断两点之间连线为X轴,判断Q点是否在连线或边上,如果找不到则判断Q是在外部。
6.根据权利要求4所述的一种基于区域地理编码自动识别企业信息和分析的方法,其特征在于:在所述Ray-crossing算法的具体过程的步骤(c)的iii中,假设同时skip掉位于X轴正半轴和X轴负半轴的点,则说明Q位于多边形的边上,返回步骤(a)。
7.根据权利要求1所述的一种基于区域地理编码自动识别企业信息和分析的方法,其特征在于:所述通过不同维度分析所述划分好的区域内的企业包括如下:
1)通过企业性质对不同划区内的企业进行分析。
2)通过企业规模对不同划区内的企业进行分析。
3)通过上市企业、高新企业、集团企业标签对不同划区内的企业进行分析。
4)不同划区内的企业总数、新增企业、注册企业、办公企业、行业分布进行分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910918400.3A CN110688439A (zh) | 2019-09-26 | 2019-09-26 | 一种基于区域地理编码自动识别企业信息和分析的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910918400.3A CN110688439A (zh) | 2019-09-26 | 2019-09-26 | 一种基于区域地理编码自动识别企业信息和分析的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110688439A true CN110688439A (zh) | 2020-01-14 |
Family
ID=69110447
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910918400.3A Pending CN110688439A (zh) | 2019-09-26 | 2019-09-26 | 一种基于区域地理编码自动识别企业信息和分析的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110688439A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112365175A (zh) * | 2020-11-17 | 2021-02-12 | 杭州安恒信息安全技术有限公司 | 基于企业区域的经济分析方法、系统、存储介质及设备 |
CN112488648A (zh) * | 2020-11-26 | 2021-03-12 | 杭州安恒信息技术股份有限公司 | 一种管辖企业统计方法及相关组件 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810194A (zh) * | 2012-11-11 | 2014-05-21 | 刘龙 | 一种地理编码方法、位置查询系统及方法 |
CN108647282A (zh) * | 2018-05-03 | 2018-10-12 | 苏州朗动网络科技有限公司 | 企业信息查询方法、装置、计算机设备及可读存储介质 |
CN109947826A (zh) * | 2019-03-29 | 2019-06-28 | 山东浪潮云信息技术有限公司 | 一种运用大数据技术构建区域画像分析模型的方法 |
-
2019
- 2019-09-26 CN CN201910918400.3A patent/CN110688439A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810194A (zh) * | 2012-11-11 | 2014-05-21 | 刘龙 | 一种地理编码方法、位置查询系统及方法 |
CN108647282A (zh) * | 2018-05-03 | 2018-10-12 | 苏州朗动网络科技有限公司 | 企业信息查询方法、装置、计算机设备及可读存储介质 |
CN109947826A (zh) * | 2019-03-29 | 2019-06-28 | 山东浪潮云信息技术有限公司 | 一种运用大数据技术构建区域画像分析模型的方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112365175A (zh) * | 2020-11-17 | 2021-02-12 | 杭州安恒信息安全技术有限公司 | 基于企业区域的经济分析方法、系统、存储介质及设备 |
CN112488648A (zh) * | 2020-11-26 | 2021-03-12 | 杭州安恒信息技术股份有限公司 | 一种管辖企业统计方法及相关组件 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102800052B (zh) | 非标准地图的半自动数字化方法 | |
CN104572645B (zh) | 兴趣点数据关联方法及装置 | |
US20130339371A1 (en) | Spatio-temporal data management system, spatio-temporal data management method, and program thereof | |
CN109741209B (zh) | 台风灾害下配电网多源数据融合方法、系统及存储介质 | |
CN105701123A (zh) | 人车关系的识别方法及装置 | |
CN107146026B (zh) | 一种空间规划用地差异自动协调方法 | |
CN103714092A (zh) | 一种地理位置的搜索方法和装置 | |
CN104422451A (zh) | 一种道路识别方法及装置 | |
CN112800165B (zh) | 一种基于聚类算法的产业集群定位方法、装置及电子设备 | |
CN103247062A (zh) | 采集农田关键点测绘成图的方法 | |
CN110688439A (zh) | 一种基于区域地理编码自动识别企业信息和分析的方法 | |
CN110780276A (zh) | 一种基于激光雷达的托盘识别方法、系统和电子设备 | |
CN108595613A (zh) | Gis局部地图编辑方法及装置 | |
CN111028119A (zh) | 一种基于gis的不动产数据整合方法 | |
CN110781311A (zh) | 一种企业一致行动人运算系统及方法 | |
CN115544088A (zh) | 地址信息查询方法、装置、电子设备及存储介质 | |
CN114003680A (zh) | 一种适用于空间叠加分析的数据前处理方法 | |
CN114661744A (zh) | 一种基于深度学习的地形数据库更新方法及系统 | |
CN102831169B (zh) | 地理信息系统中的平面图形关系确定方法及系统 | |
CN111090630A (zh) | 基于多源空间点数据的数据融合处理方法 | |
CN108920749B (zh) | 管线二三维数据更新方法、装置与计算机可读存储介质 | |
CN110609874B (zh) | 一种基于密度聚类算法的地址实体共指消解方法 | |
CN110619134B (zh) | 解决路网数据飞点、点密度问题一体化检测及修复方法 | |
CN105260796A (zh) | 一种大规模工业用的超启发式多选址系统 | |
CN111708770A (zh) | 一种多源异构存量不动产地籍数据整理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200114 |
|
WD01 | Invention patent application deemed withdrawn after publication |