CN107193995A - 一种位置分类规则库管理系统及其编码方法 - Google Patents
一种位置分类规则库管理系统及其编码方法 Download PDFInfo
- Publication number
- CN107193995A CN107193995A CN201710427067.7A CN201710427067A CN107193995A CN 107193995 A CN107193995 A CN 107193995A CN 201710427067 A CN201710427067 A CN 201710427067A CN 107193995 A CN107193995 A CN 107193995A
- Authority
- CN
- China
- Prior art keywords
- section
- classifying rules
- zone
- rules storehouse
- districts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/358—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Computational Linguistics (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种位置分类规则库字典编码方法,将位置分类规则库的字典设定为20位的字典编码体系,支持5级位置分类语义标签体系,省+地市+区县+区域+路段,标识一个特定地理位置分类的规则;本发明还公开一种位置分类规则库管理系统,包括:位置分类规则库可视化管理模块、位置语义标签化系统。本发明的有益效果是:能够对用户访问移动互联网的位置经纬度日志进行大规模全视角的语义分析和翻译,进而形成移动互联网用户的全息位置轨迹语义信息知识图谱,为后续的各种位置应用分析及挖掘进行支撑。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种位置分类规则库管理系统及其编码方法。
背景技术
电信运营商通过分光获得了客户上网的原始位置信令数据,位置信令数据中的基站位置ID,经过网元工参表转换为基站GPS经纬度,这样就产生了用户连续时间段的位置轨迹经纬度信息,对于千万级别的用户,每天产生的位置轨迹经纬度信息数据量高达几百亿条。
如何将这些数据异常庞大位置轨迹经纬度信息数值,不含任何内容语义,纷繁复杂的GPS数据翻译并标记为含有深度语义内容的信息,现有技术只对需要分析的位置数据结果提出了要求,但对如何达成需要的位置语义数据结果有如下的缺点:
1.没有将基站离散位置经纬度信息转换为可做大规模数据挖掘的标签化信息的体系化的方法。
2.没有对如何完成这样的数据结果提供完整的解决方案,模型和算法。
3.当前的解决方案,都得事先知道基站经纬度,然后人工标记基站的标签。
4.基站的增加扩容和基站离网服务,对数据结果的分析造成很大影响。
5.只能翻译相对比较浅度的内容,翻译的结果不能复用;
6. 只能对事先知道的基站的样本数据做人工标记;
7. 不能快速发现基站源数据的增减照成的数量改变;
发明内容
本发明的目的是针对现有技术中的不足,提供一种位置分类规则库管理系统及其编码方法,对用户访问移动互联网的位置轨迹日志进行大规模全视角的语义分析和翻译,进而形成移动互联网用户的全息位置轨迹语义信息知识图谱。
为实现上述目的,本发明公开了如下技术方案:
一种位置分类规则库管理系统及其编码方法,将位置分类规则库的字典设定为20位的字典编码体系,支持5级位置标签体系,省+地市+区县+区域+路段,标识一个特定地理位置的规则如下:
省+地市+区县+区域类型+区域名称+路段类型+路段名称
例: 贵州-遵义-桐梓-高速公路-兰海高速(G75)-收费站-松坎
编码56320010000001200001:56-32-00-100-00001-200-001
20位为00000000000000000000代表未知的位置。
省+地市+区县,行政区划编码按照国家行政区划编码6位处理;
区域类型编码,用3 位编码, 第一位为1 ,表示 区域类型;
路段类型编码,用3 位编码, 第一位为2 ,表示路段;
其他的两位,都是00-99, 区域类型就是100-199,如 100:国家高速;
路段类型就是200-299;
区域名称编码,为5位编码,00000-99999,可编9万9区域;
路段名称编码, 为3位编码,000-999,可编1千个路段;
这样,行政区划6位,区域类型3位,区域名称5位,路段类型3位,路段名称3位,可产生14位码和20位码两种状态,14位码到区域定义,20位码到路段定义。
关于区域和路段定义规则的详细说明如下:
区域分为块状区域(方形和多边形,不能继续细分路段)和带状区域(可细分路段,可跨地市和区县设置位置规则);
块状区域,由方形或多边形各凸点的坐标经纬度表示一个闭合区域;
带状区域由一组互相连接的圆(半径1公里)来表述,带状区域细分的路段,可以是方形(两个坐标)或圆形(圆心坐标和半径);
块状区域:省-地市-区县-区域类型-区域名称,14位编码;
带状区域:省-地市-区县-区域类型-区域名称-路段类型-路段名称,20位编码;
一个区域和一个路段,都可以有多条位置规则;
块状区域位置规则样例参考:贵州|520000|黔南522700|龙里|522730|自然风景区|110|龙里大草原|0079 |106.910763|26.373427|矩形|;
带状区域位置规则样例参考:贵州|520000|毕节520500|七星关|520502|省道|120|S20|0002|区间|223|S20区间016|016|105.077645|27.217797|1000 |;
城市网格位置规则:城市网格分为1X1平方公里或0.5x0.5平方公里两类,同一个城市,可定义多个城市网格;
城市网格规则样例参考:贵州|520000|铜仁 520600|01667|01667|108.977941|27.479400000000002|108.987941|27.47042 |;
本发明还公开一种位置分类规则库管理系统,应用如上所述的编码方法,包括:
位置分类规则库可视化管理:用于对位置分类规则库的增、删、查、改,同时提供离线和在线地图工具,从可视化地图中提取并生成位置分类规则库的可视化操作;
位置语义标签化系统:提供将任意经纬度数据按照位置分类规则库标注语义标签供后续位置数据标签大规模分析。
本发明具有以下有益效果:
1. 位置数据解析的粒度比较深入,可以满足不同场景下的面向各种位置业务支撑的需求;
2.将运营商的用户位置日志数据通过翻译成有业务含义和有潜在商业价值的用户位置行为数据;
3.基于位置业务数据的细分,把海量的大数据变为不同局部语义小数据;
4.提供了适用于机器大规模处理数据的模型;
5.解决的是运营商信令位置数据行业应用之前预处理的最后一环;
6.将人工处理的数据转变成能够人机交互处理的数据;
7.经过体系化位置规则处理和编码后的数据,将数值源数据变成了语义文本数据,为后续分析极大的节省了之后的处理费用;
8. 通过位置分类规则库,将原始的基站位置数据与处理系统分离,解决了基站位置数据的安全脱敏问题,也为位置数据的开放数据货币化提供了一种解决方案。
对用户访问移动互联网的位置经纬度日志进行大规模全视角的语义分析和翻译,进而形成移动互联网用户的全息位置轨迹语义信息知识图谱,为后续的各种位置应用分析及挖掘进行支撑。
(四)附图说明
图1是本发明一种框架结构示意图。
(五)具体实施方式
一种位置分类规则库管理系统及其编码方法,将位置分类规则库的字典设定为20位的字典编码体系,支持5级位置标签体系,省+地市+区县+区域+路段,标识一个特定地理位置的规则如下:
省+地市+区县+区域类型+区域名称+路段类型+路段名称
例: 贵州-遵义-桐梓-高速公路-兰海高速(G75)-收费站-松坎
编码56320010000001200001:56-32-00-100-00001-200-001
20位为00000000000000000000代表未知的位置。
省+地市+区县,行政区划编码按照国家行政区划编码6位处理;
区域类型编码,用3 位编码, 第一位为1 ,表示 区域类型;
路段类型编码,用3 位编码, 第一位为2 ,表示路段;
其他的两位,都是00-99, 区域类型就是100-199,如 100:国家高速;
路段类型就是200-299;
区域名称编码,为5位编码,00000-99999,可编9万9区域;
路段名称编码, 为3位编码,000-999,可编1千个路段;
这样,行政区划6位,区域类型3位,区域名称5位,路段类型3位,路段名称3位,可产生14位码和20位码两种状态,14位码到区域定义,20位码到路段定义;
关于区域和路段定义规则的详细说明如下:
区域分为块状区域(方形和多边形,不能继续细分路段)和带状区域(可细分路段,可跨地市和区县设置位置规则);
块状区域,由方形或多边形各凸点的坐标经纬度表示一个闭合区域;
带状区域由一组互相连接的圆(半径1公里)来表述,带状区域细分的路段,可以是方形(两个坐标)或圆形(圆心坐标和半径);
块状区域:省-地市-区县-区域类型-区域名称,14位编码;
带状区域:省-地市-区县-区域类型-区域名称-路段类型-路段名称,20位编码;
一个区域和一个路段,都可以有多条位置规则;
块状区域位置规则样例参考:贵州|520000|黔南 522700|龙里|522730|自然风景区|110|龙里大草原|0079 |106.910763|26.373427|矩形|;
带状区域位置规则样例参考:贵州|520000|毕节520500|七星关|520502|省道|120|S20|0002|区间|223|S20区间016|016|105.077645|27.217797|1000 |;
城市网格位置规则:城市网格分为1X1平方公里或0.5x0.5平方公里两类,同一个城市,可定义多个城市网格;
城市网格规则样例参考:贵州|520000|铜仁 520600|01667|01667|108.977941|27.479400000000002|108.987941|27.47042 |;
本发明还公开一种位置分类规则库管理系统,应用如上所述的编码方法,包括:
位置分类规则库可视化管理:用于对位置分类规则库的增、删、查、改,同时提供离线和在线地图工具,从可视化地图中提取并生成位置分类规则库的可视化操作;
位置语义标签化系统:提供将任意经纬度数据按照位置分类规则库标注语义标签供后续位置数据标签大规模分析。
本发明不局限于上述实施方式,任何人应得知在本发明的启示下做出的与本发明具有相同或相近的技术方案,均落入本发明的保护范围之内。
Claims (3)
1.一种位置分类规则库字典编码方法,其特征在于,将位置分类规则库的字典设定为20位的字典编码体系,支持5级位置分类语义标签体系,省+地市+区县+区域+路段,标识一个特定地理位置分类的规则如下:
省+地市+区县+区域类型+区域名称+路段类型+路段名称
例: 贵州-遵义-桐梓-高速公路-兰海高速(G75)-收费站-松坎
编码56320010000001200001:56-32-00-100-00001-200-001
20位为00000000000000000000代表未知的位置。
省+地市+区县,行政区划编码按照国家行政区划编码6位处理;
区域类型编码,用3 位编码, 第一位为1 ,表示 区域类型;
路段类型编码,用3 位编码, 第一位为2 ,表示路段;
其他的两位,都是00-99, 区域类型就是100-199,如 100:国家高速;
路段类型就是200-299;
区域名称编码,为5位编码,00000-99999,可编9万9区域;
路段名称编码, 为3位编码,000-999,可编1千个路段;
这样,行政区划6位,区域类型3位,区域名称5位,路段类型3位,路段名称3位,可产生14位码和20位码两种状态,14位码到区域定义,20位码到路段定义。
2.一种位置分类规则库可视化管理系统,其特征在于,应用如权利要求1所述的编码方法,包括:
位置分类规则库可视化管理:用于对位置分类规则库的增、删、查、改,同时提供离线和在线地图工具,从可视化地图中提取并生成位置分类规则库的可视化操作;
位置分类语义标签化系统:提供将任意经纬度数据按照位置分类规则库标注语义标签供后续位置数据标签大规模分析。
3.根据权利要求2所述的一种位置分类规则库可视化管理系统,其特征在于,所述位置语义化规则的区域和路段定义规则的详细说明如下:
区域分为块状区域(方形和多边形,不能继续细分路段)和带状区域(可细分路段,可跨地市和区县设置位置规则);
块状区域,由方形或多边形各凸点的坐标经纬度表示一个闭合区域;
带状区域由一组互相连接的圆(半径1公里)来表述,带状区域细分的路段,可以是方形(两个坐标)或圆形(圆心坐标和半径);
块状区域:省-地市-区县-区域类型-区域名称,14位编码;
带状区域:省-地市-区县-区域类型-区域名称-路段类型-路段名称,20位编码;
一个区域和一个路段,都可以有多条位置规则;
块状区域位置规则样例参考:贵州|520000|黔南 522700|龙里|522730|自然风景区|110|龙里大草原|0079 |106.910763|26.373427|矩形|;
带状区域位置规则样例参考:贵州|520000|毕节520500|七星关|520502|省道|120|S20|0002|区间|223|S20区间016|016|105.077645|27.217797|1000 |;
城市网格位置规则:城市网格分为1X1平方公里或0.5x0.5平方公里两类,同一个城市,可定义多个城市网格;
城市网格规则样例参考:贵州|520000|铜仁 520600|01667|01667|108.977941|27.479400000000002|108.987941|27.47042 |。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710427067.7A CN107193995A (zh) | 2017-06-08 | 2017-06-08 | 一种位置分类规则库管理系统及其编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710427067.7A CN107193995A (zh) | 2017-06-08 | 2017-06-08 | 一种位置分类规则库管理系统及其编码方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107193995A true CN107193995A (zh) | 2017-09-22 |
Family
ID=59876537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710427067.7A Pending CN107193995A (zh) | 2017-06-08 | 2017-06-08 | 一种位置分类规则库管理系统及其编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107193995A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109581444A (zh) * | 2018-11-01 | 2019-04-05 | 西北大学 | 一种gps轨迹分段及语义标注方法 |
CN109889617A (zh) * | 2018-12-25 | 2019-06-14 | 中国电子科技集团公司信息科学研究院 | 一种基于地理位置的物联网物体解析方法与系统 |
CN110543951A (zh) * | 2018-05-28 | 2019-12-06 | 中国铁道科学研究院铁道建筑研究所 | 一种铁路桥梁检养修虚拟助理系统 |
CN111447303A (zh) * | 2020-04-03 | 2020-07-24 | 宁波市水利水电规划设计研究院有限公司 | 一种基于gps的物联平台设备动态编码方法 |
CN111741434A (zh) * | 2020-06-17 | 2020-10-02 | 北京鸿蒙网科技有限公司 | 卫星定位和通讯基站云终端寻址校正的定位方法 |
CN113158623A (zh) * | 2020-12-27 | 2021-07-23 | 中国电建集团华东勘测设计研究院有限公司 | 一种编码管理的方法及系统 |
CN114647744A (zh) * | 2022-05-23 | 2022-06-21 | 中国人民解放军国防科技大学 | 一种体系结构建模方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440780A (zh) * | 2013-08-19 | 2013-12-11 | 中国航天系统工程有限公司 | 一种基于定位标签的城市复杂交通环境路径诱导系统和方法 |
CN103838825A (zh) * | 2014-01-23 | 2014-06-04 | 北京东方泰坦科技股份有限公司 | 一种全球地名数据整合与代码编制方法 |
CN104376038A (zh) * | 2014-09-12 | 2015-02-25 | 中国人民解放军信息工程大学 | 一种基于标签云的位置关联文本信息可视化方法 |
CN106599160A (zh) * | 2016-12-08 | 2017-04-26 | 网帅科技(北京)有限公司 | 一种内容规则库管理系统及其编码方法 |
-
2017
- 2017-06-08 CN CN201710427067.7A patent/CN107193995A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440780A (zh) * | 2013-08-19 | 2013-12-11 | 中国航天系统工程有限公司 | 一种基于定位标签的城市复杂交通环境路径诱导系统和方法 |
CN103838825A (zh) * | 2014-01-23 | 2014-06-04 | 北京东方泰坦科技股份有限公司 | 一种全球地名数据整合与代码编制方法 |
CN104376038A (zh) * | 2014-09-12 | 2015-02-25 | 中国人民解放军信息工程大学 | 一种基于标签云的位置关联文本信息可视化方法 |
CN106599160A (zh) * | 2016-12-08 | 2017-04-26 | 网帅科技(北京)有限公司 | 一种内容规则库管理系统及其编码方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110543951A (zh) * | 2018-05-28 | 2019-12-06 | 中国铁道科学研究院铁道建筑研究所 | 一种铁路桥梁检养修虚拟助理系统 |
CN110543951B (zh) * | 2018-05-28 | 2022-05-17 | 中国铁道科学研究院铁道建筑研究所 | 一种铁路桥梁检养修虚拟助理系统 |
CN109581444A (zh) * | 2018-11-01 | 2019-04-05 | 西北大学 | 一种gps轨迹分段及语义标注方法 |
CN109889617A (zh) * | 2018-12-25 | 2019-06-14 | 中国电子科技集团公司信息科学研究院 | 一种基于地理位置的物联网物体解析方法与系统 |
CN111447303A (zh) * | 2020-04-03 | 2020-07-24 | 宁波市水利水电规划设计研究院有限公司 | 一种基于gps的物联平台设备动态编码方法 |
CN111741434A (zh) * | 2020-06-17 | 2020-10-02 | 北京鸿蒙网科技有限公司 | 卫星定位和通讯基站云终端寻址校正的定位方法 |
CN113158623A (zh) * | 2020-12-27 | 2021-07-23 | 中国电建集团华东勘测设计研究院有限公司 | 一种编码管理的方法及系统 |
CN114647744A (zh) * | 2022-05-23 | 2022-06-21 | 中国人民解放军国防科技大学 | 一种体系结构建模方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107193995A (zh) | 一种位置分类规则库管理系统及其编码方法 | |
CN112329467B (zh) | 地址识别方法、装置、电子设备以及存储介质 | |
Krueger et al. | Visual analysis of movement behavior using web data for context enrichment | |
Karalis et al. | Extending the YAGO2 knowledge graph with precise geospatial knowledge | |
Usery et al. | Design and development of linked data from the national map | |
CN103092918A (zh) | 基于位置信息的应急辅助决策系统知识库构建及查询方法 | |
Wan et al. | Online public opinion mining for large cross-regional projects: Case study of the south-to-north water diversion project in China | |
CN111970134B (zh) | 群组确定方法、装置和电子设备 | |
Amirkhanyan et al. | Real-time clustering of massive geodata for online maps to improve visual analysis | |
Pfeffer et al. | Perspectives on the role of geo-technologies for addressing contemporary urban issues: Implications for IDS | |
CN107066112A (zh) | 一种地址信息的拼音输入法及装置 | |
CN101567150A (zh) | 一种数字地图精确定位的方法 | |
Mobasheri | An introduction to open source geospatial science for urban studies | |
Boratinskii et al. | Identification of multifunctional urban activity centers in Tokyo | |
Yan et al. | Development of Zaozhuang tourism information system based on WebGIS | |
Khan et al. | Social media data in transportation | |
Xhafa et al. | Advances in Intelligent Systems and Interactive Applications: Proceedings of the 4th International Conference on Intelligent, Interactive Systems and Applications (IISA2019) | |
CN105447163A (zh) | 一种地理编码方法和系统 | |
Gong et al. | [Retracted] Application of Computer 3D Modeling Technology in Modern Garden Ecological Landscape Simulation Design | |
Nindito et al. | Cultural Tourism Technology Used and Themes: A Literature Review | |
CN103970867A (zh) | 一种基于多源数据矩阵化的社会化报警服务位置的编码方法 | |
CN111723164A (zh) | 地址信息的处理方法和装置 | |
Pertiwi et al. | Development of Web GIS for information of renewable energy in Aceh Province after rehabilitation and reconstruction process | |
Basri et al. | Digital campus | |
Gelera et al. | Crime mapping approach for crime pattern identification: A prototype for the province of cavite |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170922 |
|
WD01 | Invention patent application deemed withdrawn after publication |